close
Share with your friends

データ分析への期待の変化~(1)企業への影響

データ分析への期待の変化~(1)企業への影響

本稿では、データ分析の意義や企業への影響を振り返るとともに、次稿において、監査実務が企業側で起こっている変化にどのように対応していくのかという点について解説します。

関連するコンテンツ

ビッグデータやデータ分析という言葉を目にしない日はありません。また、「GAFA(ガーファ)」※1という書籍の流行などにより、シリコンバレーのIT企業に対する漠然とした警戒心が意識され始めました。
本稿では、データ分析の意義や企業への影響を振り返るとともに、次稿において前KPMG Global Audit D&A HeadのRoger O'Donnell氏へのインタビューを踏まえ、監査実務が企業側で起こっている変化にどのように対応していくのかという点について解説します。
なお、本文中の意見に関する部分については、筆者の私見であることをあらかじめお断りいたします。また、本稿は一般的なデータ分析の現状を監査への影響の導入として触れていますが、網羅的かつ各論点への詳細な言及は意図したものではありません。

※1 the Fourの翻訳につけられたタイトルで日本のみで使われている。

ポイント

  • ビッグデータと呼ばれるデータの特徴は Volume, Variety, Velocity の3つのVで表現され、データ分析の可能性を大きく変えるともに、将来の予測に関する精度や期待を大きく引き上げている。
  • ビッグデータを活用したデータ分析の一つの特徴として、獲得したデータの一部をサンプルして分析するのではなく、全体を分析することへの発想の転換がある。
  • 特定の領域に知識や経験を持つSME(Subject Matter Expert)がデータ分析を行うことによってこそ、意義のある分析がなされる。但し、近年のAIの進化はその理解すら覆す可能性がある。
  • データの取り扱いに関するリスクの性質はビッグデータにより大きく変化した。
  • 企業がリアルタイムに生まれるデータを分析し、意思決定を行う仕組みへ変わりつつある中で、監査も企業の変化に合わせて変わっていく必要が
    ある。

I. 予測に対する期待の変化

2010年代の前半からデータ革命が叫ばれ、スマートフォンやICカードSNSから大量に生み出されるデータはビジネスに大きな影響を及ぼすものとしてデータ分析の意義を変え始めました。現代においてデータ分析の対象となるデータは次のような特徴をもっており、このことが従来のデータ分析やビジネスそのものに変化をもたらしています。ビッグデータと呼ばれるデータの特徴は3つのVで表現されます。すなわち、Volume, Variety, Velocityです。Volumeの点では大量のデータが日々生み出されています(Googleは1日に24petabite以上のデータを処理し、Facebookには毎時間1,000万件以上の写真が投稿され、毎日30億件以上のいいね、やコメントが投稿される)。また、Varietyという点では、いわゆるRDB(リレーショナルデータベース)で管理される定型的なデータのみならず、テキストメッセージ、写真、ビデオ、ウェブの訪問履歴、IoT機器のセンサ等から生み出されるデータなど非定型なデータまでが分析の対象となっています。Velocityは速度であり、データが生みだされる頻度ですが、センサや電子取引情報などを通じてリアルタイム情報が企業にもたらされる状況が生まれています。
このようなビッグデータの特徴は、データ分析の可能性を大きく変えるともに、将来の予測に関する精度や期待を大きく引き上げています。過去の集約されたデータやサンプルベースの分析に基づく売上の予測は、リアルタイムの顧客情報に基づくデータ全体の分析に基づく予測に比べて精度が劣り、経営判断に十分に貢献出来なくなっています。このため、CRMや販売管理システムといった自前の業務系のシステムで生成されるデータをETLツールでデータウェアハウスに取り込み、このデータをBIツールで分析するといった、従来のBIの仕組み自体を考え直さなければならなくなっています。※2

※2 ETLツールは様々なデータソースを分析しやすい形でデータハウスに格納するためにExtract(抽出)、Transform(変換)Load(格納)するツール。BIツールは、データウェアハウスなどに集積されたデータから経営に資するレポート作成などを支援するツール

II. サンプリングの限界

ビッグデータ時代のデータ分析の一つの特徴として、獲得したデータの一部をサンプルして分析するのではなく、全体を分析することへの発想の転換があります。過去の歴史において、税金を正確に集めることや人口動態を把握するために実施された国勢調査などは、大変な時間とコストが掛かることが大きなネックとなっていました。大きなデータを取り扱うことは常に非効率で非現実的なことでしたが、統計学の進化はこの状況に変化をもたらしました。
すなわち、サンプルによる全体の推定が高度に行えるようになったのです。すなわち、統計学はサンプルの数を増やすことよりも、無作為性を高めることでより正確な推定が行われることをサポートしました。このようなサンプリングテクニックの高度化は、データ収集の在り方だけでなくデータの分析方法を劇的に変えました。
このサンプリングの考え方は社会の様々な分野(選挙における支持率や得票予想など)に大きな影響をもたらしましたが、あくまでも一定の前提の下で推定が行われるにすぎず、無作為にサンプルが取れなければ、母集団全体を推定する際に結果が大きくゆがめられるという欠点があります。また、推定しようとする母集団全体がいくつかの異なる性質を持つサブ母集団で構成されていれば、サンプリングはより難しくなります。とりわけ、データ分析から知見を得ようと考える場合には、個々のデータの特徴についてより詳細な分析が必要となり、サンプリングでは期待した知見や結論が得られないといったことが起こり得ます。一般的な社会科学の世界では95%の信頼性があれば(20回のうち1回は相関関係が実際には存在しない)、相関関係があると説明されてきましたが、現実の世界では残りの5%の部分から重要な影響が発生することがあります。※3
既に技術的には相当なボリュームのデータ全体を分析することが企業や個人のPCレベルでさえ可能となっていますが、現実にはサンプルをベースとしたビジネスや社会システムはまだ大きく変わっていません。一つの要因は、様々な形で整理されずに存在するデータを整理するコストが依然として大きく(特に日本においては紙ベースでの取引書類や社内文書が多く存在する)、結果としてサンプルに頼らざるを得ない状況にあると言えます。※4加えて、より複雑な現実を無理に例外を排除して同質的にとらえようという発想自体がサンプルを前提とした考え方であり、細部にもスポットを当てて全体をバイアスなく捉えるという考え方の転換が必要となるでしょう。

※3 Black Swan(通常の予測範囲には入らず、突然起こったように受け止められる重大な事象で金融危機や自然災害発生時に言及される)やAnomalyの発生。予測できないとされる理由の一つに、outlier(データ分析上の異常値)を予測データにどこまで含めるかという問題がある。

※4 データ分析の成功例は、その前段階のデータ処理についてはあまり触れていないことが多い。”Big Data”(参考文献#1)では、NYでの違法建築の対応についてビッグデータの活用が取り上げられているが、異なる形で存在するデータを徹底的に集めて統合しデータベース化に時間を費やした結果としての成果である。ある程度フォーカスした短期のプロジェクトではこのような対応が可能でも、組織や社会全体に影響を及ぼすような網羅的なデータを標準化してデータベース化することは難しく、データ標準化やその範囲について議論がある

III. SMEの意義と未来

ビッグデータの活用や分析ツールの進展により様々な分野で従来の常識が覆りつつあります。その重要な要素として因果関係(causality)から相関関係(correlation)への分析視点のシフトがあります。人間は本質的に二つの物事やデータに因果を見出そうとしますが、データから知見を得るという点では、因果関係は問題とならないことが多いです。オムツの横にビールを置いたら売れるビールの売れ行きが良くなるとすれば、その原因は分からなくても売上さえ伸びれば良いでしょう。※5
そうすると、データ分析に既存の知識はむしろバイアスを与えるだけで無用という考え方が出てきました。データ分析結果に基づく意思決定が従来の特定領域のプロフェッショナル(Subject Matter Expert, SME)による決定を凌駕する成果を出すという話には、映画マネーボールで統計の専門家がこれまでのスカウトたちによる分析を否定して低予算で強いチームを作るストーリーなどがあります。
しかしながら、実際のビジネスの感覚はむしろSMEの存在を必要としているのでないでしょうか。先のストーリーでは、従来のSMEが単に暗黙知に偏った見方(バイアス)を持ちすぎていただけで、むしろ大量に雇われたデータサイエンティストが意義のある知見をデータ分析から思うように見いだせないとすれば、特定のビジネス領域における専門知識が欠如しているからであると考えられます。また、多くの場合、機械学習は本当に学習しているのでなく、単にインプットされたデータとアウトプットされる結果の確率計算をしているだけで、新たな知見を生み出すような使われ方はしていないのではないでしょうか。KPMGが2018年に行ったグローバルCEO調査でも67%のCEOがデータ分析から得られる知見が自身の経験や理解と矛盾していると受け止めており、国別でも米国の78%からフランスの51%まで開きはあるものの、半分以上のCEOが同様の考えを持っています(図表参照)。

図表 データに基づく示唆よりも自身の経験に基づく直感に従って判断を下したことがあると回答した割合

(国別)

図表 データに基づく示唆よりも自身の経験に基づく直感に従って判断を下したことがあると回答した割合

出典:2018 Global CEO Outlook、KPMGインターナショナル

データ分析を行うデータサイエンティストはその領域に関する知識や経験があってこそ、意義のある分析がなされるという理解は、概ね確立された考えとなっていますが、最近のAIの進化は、この考えを覆すような成果を見せ始めています。Google傘下のDeepMind社が作ったAIはブロック崩しゲーム(Breakoutまたはアルカノイドというゲーム名で知られる) を事前の学習なしに、点数を増やすというゴールだけを与えられて、最終的に驚異的な成果を上げています。このようなAIが生まれてくれば、もはや特定領域の知識や経験すらなくとも成果を生み出すことが可能となるでしょう。※6

※5 ビッグデータが話題となり始めた2010年代によく取り上げられた寓話。米国のある中西部の小売店でオムツの売上(ベビー用品は高粗利なので)を分析したコンサルタントがビールの売上との相関を見出したというもの。

※6 Youtube動画が公開されているが、AIプログラムはこのゲームのコンセプトなどが与えられず点数を大きくするというゴールを与えられてスタートし、最初は全く無駄な動きをしているが2時間後には、かなり上達した様子がうかがえる。そして、4時間が経つと、最も効率的な方法を見つけ出し、最小限の動きで壁を崩すようになる。

IV. 変容するリスク

プライバシーに関するリスクの性質はビッグデータにより大きく変わりました。従来、プライバシーはデータという形で殆ど存在しませんでした。あるいは存在したとしてもプライバシーという形では認識されていなかったものがプライバシーと考えられるようになってきました(例えば、電気の使用状況や好きな映画のジャンルなど)。このような理解が進んだのはEUで施行されたGDPR※7の影響が大きいでしょう。プライバシーに対する意識が高まる前は、積極的に自分の行動や好みなどをGoogleやAmazonに提供することで、よりカスタマイズされたサービスを無料で受け取れるメリット以外に注目が行きませんでしたが、Facebookによる情報流出※8やGDPRの施行により、無料で得られると考えられていたサービスへの対価(コスト)がより意識されるようになりました。また、GDPRの考えの基礎には、プライバシーの保護のみならず個人データの個人への帰属をさせる意義があり、自身のデータを自身が管理(収集されたデータは要求により取り戻せる)し、必要に応じて必要な部分をサービス提供者に開示するという形への変革を後押ししますが、EU以外の国では必ずしも同じ状況にはありません。
また、プライバシーの範囲の拡大やデータ分析技術の進展は、違ったリスクも生み出しています。すなわち、企業活動や個人の行動が過去の結果でなく、予測される将来の行動に基づいて、制限されるというリスクです。今でも保険料の設定やクレジットカードの審査は、将来の予測に基づいて行われていますが、その範囲が一定のラインを超えると倫理的に受け入れることが難しい部分も出てきます。DNAの解析が保険加入時に求められ、DNAに基づく将来の発病可能性に基づいて、個人保険の加入が制限されるとすると現在の法体系や仕組みではその適否が判断できないかもしれません。過去の実績や行動による予測により、融資の審査が決まることも、その理由が説明可能であれば受け入れることは出来ても、個人が意識しない膨大なデータが分析に加えられて特定の企業や個人の権利を制限するような状況になれば、その正当性の判断は容易でありません。“Big Data”で著者はExternal Algorithmistの登場を予測しています※9。その役割は、ビッグデータから生み出された予測のレビューであり、選択されたデータの範囲や適用された分析ツール、アルゴリズム、モデル及び分析結果の解釈を評価することです。そして、新たな専門家の登場を公認会計士が財務諸表を監査するようになった歴史になぞらえています。

※7 GDPR(General Data Protection Regulation、一般データ保護規則)は、2018年5月25日にEU/EAA全域で施行された。ヨーロッパでは歴史的に、また、シリコンバレーに巨大IT企業を抱える米国と違い、プライバシーの捉えた方が異なる。

※8 イギリスの選挙コンサルティング会社のケンブリッジ・アナリティカにより、8,700万人のFacebook上の個人情報が同意なく利用されていた疑惑が問題となった。

※9 Big Data, Viktor Mayer-Schoenberger, Kenneth Cukier pp.180

V. データ分析と監査

データ分析に関する考え方やデータのリスクが変わってくる中で、企業の財務諸表の監査にも大きな影響があります。第一に企業は自らの財務リスクを特定し対処するために新しいシステムへの投資やデータ分析を積極的に行っており、監査もそのようなシステムや分析を前提として行うことがより効率的になっています。また、監査に対する社会的期待は、サンプリングでなく財務データのすべてを対象とするような監査手法(精査的な方法)※10を前提としたより高度な監査に変わってきています。企業にとっては、企業自身が必ずしも分析を行っていないエリアでも監査の過程で監査人が分析したデータから得られた知見を監査人からフィードバックを得られるというメリットが期待されています。
最新のテクノロジーの利用という意味では、監査業界は遅れてきたことは否めません。これは主として監査が労働集約的な業務であり、監査実務特有の判断の仕組み(証票突合やサンプリングといった機械的な作業の繰り返しと作業結果を全体として上位者がレビューし判断するという二層構造)にも原因があると考えられています。※11しかしながら、近年において監査法人のデータ分析のための新技術への投資は目覚ましいものです。
次稿では、監査への新技術の適用及びKPMGにおけるData Analyticsの監査への適用について前KPMG Global Audit D&A HeadのRoger O'Donnellへのインタビューを踏まえて俯瞰します。

※10 現実的にはデータと定義すべきものは無限にあり、精査と言っても、それは一般に会計処理に関連するデータを意味しており、広い意味での外部情報や非財務情報も含めたデータ全てをテストすることにはならず、Back swanやAnomalyの問題への対応は別次元の問題とも考えられる。

※11 Research Ideas for Artificial Intelligence in Auditing: The Formalization of Audit and Workforce Supplementation, Hussein Issa, Ting Sun, and Miklos A. Vasarhelyi, Journal of Emerging Technologies in Accounting: Fall 2016, Vol. 13, No. 2, pp. 1-20.

参考文献

  1. Viktor Mayer-Schoenberger, Kenneth Cukier "Big Data"
  2. Gert H. N. Laursen, Jesper Thorlund, "Business Analytics for Managers: Taking Business Intelligence Beyond Reporting, 2nd Edition"
  3. Scott Galloway "The Four: The Hidden DNA of Amazon, Apple, Facebook, and Google"
  4. Seth Stephens-Davidowitz, "Everybody lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are"
  5. Max Tegmark "Life 3.0: Being Human in the Age of Artificial Intelligence"
  6. 武邑光裕 “さよなら、インターネット - GDPRはネットとデータをどう変えるのか”
  7. Nate Silver "The signal and the noise"
  8. Nabeel Zanoon, Abdullah Al-Haj, Sufian M Khwaldeh "Cloud Computing and Big Data is there a Relation between the Two: A Study", November, 2017
  9. Cavanillas, Jose Maria, Curry, Edward, Wahlster, Wolfgang, "New Horizons for a Data-Driven Economy:A Roadmap for Usage and Exploitation of Big Data in Europe"
  10. KPMG global CEO Survey 2018
  11. Hussein Issa, Ting Sun, and Miklos A. Vasarhelyi
    "Research Ideas for Artificial Intelligence in Auditing: The Formalization of Audit and Workforce Supplementation" Journal of Emerging Technologies in Accounting

執筆者

有限責任 あずさ監査法人
パートナー 北尾 俊樹

© 2020 KPMG AZSA LLC, a limited liability audit corporation incorporated under the Japanese Certified Public Accountants Law and a member firm of the KPMG network of independent member firms affiliated with KPMG International Cooperative (“KPMG International”), a Swiss entity. All rights reserved. © 2020 KPMG Tax Corporation, a tax corporation incorporated under the Japanese CPTA Law and a member firm of the KPMG network of independent member firms affiliated with KPMG International Cooperative (“KPMG International”), a Swiss entity. All rights reserved.