データ活用推進の成功要因~必要なデータをすぐに取り出す仕組みの確立(データカタログ)~
RPAやAIの普及に伴い、改めて経営資産としてのデータの重要性が認識され、その活用の仕組みや能力の優劣がビジネス拡大につながっています。求めるデータを正しく効率的に取得するにはどうすればよいか、そのための取組みを紹介します。
RPAやAIの普及に伴いデータの重要性が再認識される中、さらなるビジネス拡大につながるデータ活用の取組みについて紹介します。
RPA(Robotic Process Automation)、AI(Artificial Intelligence)の普及に伴い、改めて経営資産としてのデータの重要性が認識されています。活用の仕組みや能力の優劣が企業の競争力につながるとの考えから、データ活用の高度化に取り組む企業が増えています。また、GAFA(Google、Apple、Facebook、Amazon.com)のような企業が自社のプラットフォーム上で収集したビッグデータを武器に、ビジネス拡大に成功していることから、改めてデータのビジネス上の価値が注目されています。
しかし、いざデータ活用に取り組んでみると、「データがあると思っていたが実際に該当するデータではなかった」、「集まったデータが正しいかどうか確認することができなかった」、「データに誤りや不明点が多く、その修正や調査に時間を要する」といった声をよく聞きます。求めるデータを正しく効率的に取得するにはどうすればよいか、そのための取組みを紹介します。
1. データ活用の進化と課題
(1)データの増加とデータ活用の進化
テクノロジーの進化により、IoT(Internet of Things:モノのインターネット)が普及し、私たちの身の回りのさまざまなものがデータとして収集・蓄積されるようになりました。また、それらのデータを既存の社内データと組み合わせるなどして、新たなビジネスの創造や業務改善、データ分析の高度化が可能になりました。
例えば、金融業界では、オンラインバンキングやモバイルバンキング等、顧客とのチャネルの多様化でさまざまなデータ収集が可能となり、それらを活用することで、行動やライフスタイルを予測した、顧客のセグメント化がより的確に行えます。進学や結婚・出産というライフイベントに応じたこれまでのマーケティングに、正確な顧客セグメントを加味することで、マーケティングの精度向上と効率化につながるのです。
小売業ではどうでしょうか。これまでは自社のPOSデータを用いて顧客の属性と購入商品の分析はできたものの、購入に至るまでのプロセス等の分析は難しい状況でした。しかし、店舗にカメラとセンサーを設置することによって、入店から購入までの顧客の行動を可視化し、どのような人が、どのような時に、どの棚の商品を購入するか、あるいはしないか等の行動をデータとして蓄積することができます。これらのデータと既存のPOSデータを組み合わせて、購入に至るまでのさまざまな要素間の因果関係や相関関係を分析すれば、店舗構造や棚配置の気づきを得ることができます。
(2)データ活用推進上の課題
データ活用により、ビジネス改革や改善が可能になったものの、実際のデータ活用の現場は混沌としています。活用の目的に合致したデータの特定、データの利用許可を得るための部門間調整に時間がかかり、また、活用の目的を満たすために必要なデータ品質を充足していないケースも散見されます。データの内容確認やデータ補正に多くの時間が費やされているのです。
RPAやAIを活用する場合においても、不十分な品質水準のデータに対して行われた処理結果は信用に値しません。特にAIでは、学習対象としたデータに、データ収集者の意識ないし無意識の倫理観が反映されている場合、AIが偏った倫理観に基づく判断を下すリスクが指摘されています。
以下に、データ活用を実践した企業の悩みを挙げています。データ品質の確保が簡単ではないことが示されています。
- 利用に適したデータの特定が困難
欲しいデータが複数のデータベースに存在しているが、どのデータを使用したらよいか把握している者がいない。 - データの内容を示す情報が不足
項目名称等で内容を類推するしかない状態。データの意味が不明のため、本当に欲しいデータかどうかわからない。 - データ項目の来歴が不明確
必要なデータを網羅的に集めているかわからず、どの部署がどのようなプロセスで生成して管理しているかも不明。 - 業務上あり得ないデータの存在
複雑な加工・集計作業によって必須入力のはずの項目が空白になっている、一意性制約を受ける項目で重複データが存在している。
データ活用の推進と高度化のためには、データ品質とデータ特定に起因する問題の解決が必要です。そのための基盤として、データカタログが注目を集めています。
2. データ活用の第一歩 - データカタログの整備と運用
(1)データカタログとは
データカタログとは、予め必要なデータの定義、形式、要素、来歴等が整備、可視化され、データの利用者が、それを検索することで分析するデータを特定できるようになるというものです。データをカタログ化したイメージを図表1に示します。
図表1:データの「カタログ化」
データカタログに含まれる内容は企業によってさまざまですが、一般的には、図表2のようにビジネスの観点(データの使用)、技術の観点(データの生成)及びガバナンスの観点(組織の環境整備)から整理されます。
図表2 データカタログの期待機能及び主な構成要素
データカタログで期待される機能 | データカタログの主な構成要素 | |
---|---|---|
ビジネスの観点 | 利用者がビジネス用語で検索できること | ・データ用語定義 ・データモデル ・業務プロセスフロー ・業務オペレーション処理ルール |
業務横断的に統一されていること |
||
経営管理プロセスや業務プロセス上の取扱いが反映されていること | ||
技術の観点 | データ項目の来歴、所在を確認できること | ・構文/コード体系 ・テーブル名/カラム名/スキーマ ・データシステム/データベース ・データフロー/データリネージュ |
データ項目の属性情報を確認できること | ||
データ命名ルールやタクソノミが全社的に統一されていること | ||
ガバナンスの観点 | データ項目にかかわるオーナー、利用者等の役割を確認できること | ・データにかかわる役割と責任 ・データオーナー、データユーザー ・データ共有ルール |
データの貸与、参照するためのポリシー等を確認できること |
(2)データカタログの整備
データカタログは、どのように整備を進めればよいのでしょうか。はじめに、カタログの作成範囲を決定する必要があります。データカタログはデータ項目単位に作成されるものであるため、一度に社内の全てのデータカタログを作成することは不可能です。データの活用目的からカタログ対象のデータを設定し、さらに上流のデータ項目を調査し、作成範囲を明確にします。次に、データの利用目的やプロセスフロー等の業務的要素の現状、および、データ項目のメタデータやスキーマ等の技術的要素の現状を調査し、データカタログの内容を決定します。その後、ツールやSQLコマンド等を用いて、データ項目の属性情報等を収集し、データカタログに組み入れます。
作成したデータカタログは、パッケージシステム等を用いて、利用者に公開します。データカタログのシステムは、利用者が希望するデータのキーワードで検索すると、紐づけられたデータカタログの各構成要素を返します(図表3参照)。
なお、データカタログ構築は、単一の部門では完結せず、関係部門の協力と認識合わせが必要となります。また、データの状況によっては、非常に複雑かつ膨大な作業になることもあります。
図表3 「データカタログ」イメージ
(3)データカタログの運用
データカタログは、組織にとって重要なすべての情報資産を、誰(Who)が、何(What)をどこ(Where)に置いているか、常に最新の状態で示すものでなければなりません。したがって、データカタログの作成だけでは有効とは言えません。データカタログを維持していく上で、「各構成要素はどのタイミングで誰が更新するか」、「新たなデータ項目やデータ要件を追加する場合、関係者への確認・調整はどのように行うか」、「データカタログに定めたデータ要件は現状の統制で実現できているか」などさまざまな課題が予想されます。これらの課題は、特定の一部門で対応できるものではなく、全社的に統一されたデータ活用方針のもと、部門横断的に対応する必要があります。
つまり、データ活用のためにデータカタログを整備しようとすると、データという経営資産に対するガバナンスの在り方が問われることになります。図表4に、データガバナンスを支える組織と役割の例を挙げています。
- 企業の経営戦略と統合したデータ戦略を策定する「データガバナンスコミッティ」
- 全社レベルのデータ活用と品質にかかわる調整・推進を担当する「データガバナンス統括部署」
- データ活用と品質の維持をはかる各所管部署の「データオーナー」
図表4 データガバナンス組織(例)
3. まとめ
データカタログの構築・運用には、各企業個別の多様な課題が多く存在しており、その解決のためにはさまざまな部門が連携し、試行錯誤しながら進めていく必要があります。企業活動にデータ活用が根付いている企業はすでに、データ活用によるビジネスメリットの追求とともに、全社的なデータガバナンスの構築と実践にも取り組んでいます。
執筆者
KPMGコンサルティング株式会社
ディレクター 津田 圭司
シニアコンサルタント 張 磊