新規事業創出における生成AI活用とデータ整備方法―「次世代ビジネスを牽引するテクノロジー最前線」

KPMG×先進技術をビジネスに取り入れるイノベーション企業との対談/生成AIを活用したビジネストランスフォーメーションについて、ストックマーク株式会社 代表取締役CEO 林達氏をお招きし、お話を伺いました。

生成AIを活用したビジネストランスフォーメーションについて、ストックマーク株式会社 代表取締役CEO 林達氏をお招きし、お話を伺いました。

生成AIを代表とするデジタル技術の急速な進化により、ビジネスを取り巻く環境は劇的な転換期を迎えています。企業の持続的な成長には、AIを含めデジタル技術を活用したビジネストランスフォーメーションが不可避となっています。一方、デジタル技術の活用にあたっては、たとえば生成AIにおけるハルシネーション対策等、活用する技術の特性を正確に理解することが不可欠です。

AIを含めたデジタル技術と企業はどう付き合っていくべきか──生成AIを活用したビジネストランスフォーメーションについて、ストックマーク株式会社 代表取締役CEO 林 達氏をお招きし、KPMGコンサルティングの関 克彦、福島 豊亮、KPMG FASの岡本 准、KPMGアドバイザリーライトハウスの松尾 英胤がお話を伺いました。

対談者

新規事業創出における生成AI活用とデータ整備方法-1

左から:
KPMGジャパン 製造セクター統轄パートナー
株式会社 KPMG FAS 執行役員パートナー 岡本 准

KPMGコンサルティング株式会社
ガバナンス・リスク&コンプラアインス・サービス統轄パートナー 関 克彦

ストックマーク株式会社
代表取締役CEO 林 達氏

KPMGコンサルティング株式会社
コーポレートトランスフォーメーションストラテジー統轄パートナー 福島 豊亮

株式会社 KPMGアドバイザリーライトハウス
ストラテジー&ビジネスオペレーションズ統轄ディレクター 松尾 英胤

お問合せ

AIの活用でビジネストランスフォーメーションが進化する

松尾:御社が提供するデータと生成AIを活用した事業創造支援ソリューションは、企業がビジネストランスフォーメーションを進めるうえで大きなヒントになると考えています。このビジネスで起業しようとお考えになった背景を教えていただけますか。

林氏:前職ではM&A関連の仕事をしていました。主な業務は、大量のレポートからディールを検討するための資料を作成するものでしたが、人間が網羅的に見ることができない量のデータがあることに課題を感じていました。その解決方法について共同創業者の有馬(ストックマーク株式会社 取締役CTO 有馬幸介氏)とよく会話をしていたところ、「AI技術ならば大量のデータをより速く、賢く解析し、人間を正しいインサイトに導くことができる」、「今は難しいが、5年後には可能になるのではないか」という話になり、私自身の体験と有馬の持つテクノロジー技術を掛け合わせてストックマークが誕生しました。

データは構造化データと非構造化データに分けることができます。構造化データとはテーブルデータのような数値データ、非構造化データはテキストや画像のような構造化されていないデータで、世の中のデータの80%は非構造化データです。技術革新によってAIによる構造化データの解析は進んでいますが、非構造化データについてはあまり進んでいません。そこで、非構造化データの解析に挑戦しようと考えました。

他方、ビジネスの現場におけるIT活用はこの20年ほとんど変化がありません。表計算ソフトや文章作成ソフト、プレゼンテーションソフトで資料を作るというのが当たり前で、この行動習慣を続けていても生産性は上がりません。そのため、価値創造のための時間を創出することは難しく、これまでのビジネスプロセスを変えなければならないと思っています。

新規事業創出における生成AI活用とデータ整備方法-2

ストックマーク株式会社 
林 達氏

松尾:御社が展開されているソリューションを支える技術とは、どのようなものなのでしょうか。

林氏:我々の技術は、データ、LLM(大規模言語モデル)、UX(ユーザーエクスペリエンス)の3層構造です。データレイヤーでは、ビジネスで主に使われているテキスト、つまり自然言語処理の領域にフォーカスしています。そのテキストデータはさらにオープンデータと、企業などに蓄積されているクローズドデータに分類されます。我々は、まずオープンデータから解析を開始し、7年にわたり世界中のビジネス情報を収集しました。今では、少しずつ企業内のクローズドデータも収集し始めています。こうして積み上げてきたデータの優位性により、ビジネスに特化したLLMを開発することができました。

UXは、ChatGPTで言えばChat(チャット)に当たる部分のことです。GPTに当たるLLMはOpenAI社以外にも多くの企業が手掛けていますが、数多あるなかでChatGPTが爆発的に広まったのは、チャットというUXが使いやすかったからだと言われています。我々も、データ、LLM、UXの三位一体でお客様に価値を届けています。

松尾:AIへの注目度が高まるなか、企業もAIをどのように活用してビジネストランスフォーメーションを行うのか、悩んでいるのではないかと思います。

福島:クライアントからは、AIやデジタル技術の領域でそもそも何から手を付けたらいいのかというご相談をよくいただきます。たとえば、中期経営計画に「今後3年でデジタル技術を活用して変革する」と書いてあるとします。それを実現するためには、まず同業他社の施策状況、その施策に使われている技術、そしてどのようなトランスフォーメーションをもたらしているか、という情報が必要となります。そうした情報をニュースなどから取得し、自社の立場に当てはめた際の有益性を検討して、自社の施策に反映します。

しかしながら、計画立案時に自社のありたい姿を描かなければいけない。それを描くには、世の中にある技術、あるいは今後現れる技術を知る必要があります。まずは情報を収集すること。そのうえで、オープンデータとクローズドデータを組み合わせながら、自社がどの情報を優先的に扱い、どう活用するのかを一つひとつ見ていく。昨今、そのような対応が求められる相談が増えています。

松尾:ファイナンスアドバイザリーの観点からもAI関連の相談は多いかと思いますが、現場で受ける印象はどうでしょうか。

ChatGPTは、OpenAI OpCo, LLCの登録商標です。

岡本:先日、ベンチャーキャピタルの方との会話で、「ホリゾンタルSaaS(業種を問わず特定の業務に使われるSaaS)は出尽くした感がある、今後はバーティカルSaaS(特定の業種のために特化したSaaS)だ」という話を聞きました。SaaSのように、AIも業界ごとに特化していくのではないかと思っています。実際、ファクトリーオートメーションのAIとビルディングオートメーションのAIを比較すると、同じエネルギーマネジメントであったとしても使われるアルゴリズムは違います。同じように、今後はR&D部門、調達部門というように、バーティカルに対応していくようになるのではないかと考えています。

新規事業創出における生成AI活用とデータ整備方法-3

株式会社 KPMG FAS
岡本 准

AIが人間に追い付くシンギュラリティーが訪れる

松尾:あるPOSメーカーの方から、バーコードに依拠しないPOSシステムが増加しているという話を聞きました。商品を認識する画像認識技術の精度向上が理由のひとつだそうですが、コンピュータの画像処理負荷が高まり、処理速度に課題があるようです。そのため、画像認識精度を落とし、最終的な判断は人に任せているようです。

AIに対する理解が深まるにつれ、目的に応じたAIの最適な実装が求められてくると思います。たとえば、一定以上の精度が担保できれば、あとは人に判断させるなど、すべてAIで処理するのではなく、目的に応じて残す機能と捨てる機能を適切に判断し、エッジコンピューティング・エッジAIの優位性を引き出すことが重要になってくると思います。

林氏:そうですね。AIを突き詰めれば突き詰めるほど、「少ない消費エネルギーで推論し、答えを出せる人間の脳はすごいな」と思います。たとえばパン1個のエネルギーで、人間なら半日くらいは働けますよね。それくらい人間の効率性はものすごく高い。LLMは人間のニューロンを模倣していますが、まだまだ追い付いていません。当分は人間の方が費用対効果が高い時代が続くでしょう。しかしながら、AIの技術革新のターニングポイントは近い将来に来るだろうと思っています。

岡本:その観点から、林さんは人工知能が人間の知能を超える臨界点である「シンギュラリティー」について、どのようにお考えですか?

林氏:人間の知能を超えるといっても、何がどうなればシンギュラリティーに到達したと言えるのかという議論がよくありますよね。解析力でいえば、すでにAIが優っているので、シンギュラリティーは来ていると言えます。しかし汎用性で言えば、まだ人間の方が圧倒的に優っている。たとえるなら、受験科目が1科目ならAIが、7科目なら人間が優れている。そういう感覚だと思います。

新規事業創出における生成AI活用とデータ整備方法-8

岡本:なるほど。私が考えているシンギュラリティーのポイントは、AIが意識を持つかどうかです。今では、人間の意識をコンピュータに移行させるというような研究もあります。その可能性についてどう思われますか。

林氏:神経科学や心理統計学の観点で人間の意識や意思決定は、多くの場合何らかのバイアスに左右されていると言われています。自分は選択していると思っているが、実は選択していないという説があります。つまり、自己選択感を持っているだけであり、その文脈からすると、もしAIが自己選択感を持つようになれば、その時がシンギュラリティーなのかもしれません。

岡本:もし、AIが意識を持つようになった時、人間には何が残ると思いますか?

林氏:残るのは身体、身体性でしょうか。今、AIが持っている機能は、人間で言えば目や口、耳に相当するものです。工場で活用されているAIは運動機能も持っていますが、まだ弱いので。ただ、それもいずれは追い付くと思いますね。

データがつながり合うことで、企業は有益なアウトプットを得られるようになる

松尾:データおよびAIを活用するにあたり、リスクマネジメントの観点から注意すべきポイントには、どんなものがあるでしょうか。

:AIを活用して生産性を上げたいという発想がある一方で、ハルシネーション対策等のガバナンスに関する議論も多くなりました。特に、インプットデータの正確性と、それに対するファクト、もしくはフェイクへの懸念は重要な論点です。この点については一定程度、アルゴリズムやインプットデータを精査すればクリアできると考えています。しかし、自然言語処理等で分析を進めると、同じ文脈や内容でも時系列によって答えが変わってくるような場合もあるのではないかと思います。

林氏:インプットデータについて、我々は世界中から収集したニュース等から、広告などを削除し、クリーンなデータをAIに学習させています。今はまだ、LLMから知識を出させることはしていません。さまざまな外部データと組み合わせるRAG(検索拡張生成)を使用したり、LLMで生成する前の構造化段階でデータを処理したりします。たとえば、「西暦20XX年〜」のテキストが複数あれば、それを抜き出して順番に並べるというような手法があります。弊社の生成AIを活用した事業創造支援ソリューションAstrategyでは、業界に分類してから業界ごとに解析し、時系列に並べ、10年単位で区切る、というようにフレームワークごとにまとめます。

新規事業創出における生成AI活用とデータ整備方法-4

KPMGコンサルティング株式会社 
関 克彦

:構造化段階でのデータ処理により対応するということですね。また、分析を手掛ける対象が世の中のオープンデータから、一企業、グループのクローズドデータにわたるなかで、クローズドデータ内においての生成AIは、オープンデータのAIと比べるとなかなか想定する結果を出さないと思います。御社が進めるオープンデータの取組みと、企業がそれぞれで進めているクローズドデータの生成AIの取組み、この2つはどのように結びついていくと思いますか?

林氏:LLMでいうと、基盤モデルは義務教育が終わったくらいの段階です。人間なら、日本語、英語、ビジネスなどの基礎知識を身に着けたという状態です。しかし、それだけではビジネスでは通用しません。そこで、新人研修で必要な知識を学ぶように、企業に必要なデータを追加する。そうすれば、その企業に特化したアウトプットを生成できるようになります。

追加するデータはどんどん少なくなってきていますから、企業ごとにLLMを作るメリットは徐々に出てきていると思います。たとえば、化学業界では業界横断でコーパス(自然言語の文章を大量に収集して構造化したデータベース)を作るような動きも見られます。

:最終的には、オープンデータもクローズドデータも、一定の処理がなされたうえでつながりあって、大きなコーパスに蓄積された世界になっていくというイメージでしょうか。

林氏:そうですね。日本では、経済産業省主導で、日本国内の基盤モデル開発支援プログラムが立ち上がりました。Generative AI Accelerator Challengeの略で、「GENIAC」プロジェクトと呼ばれています。実は、GENIAC経由である研究機関のデータを使えることになりました。今後は少しずつ公開されていくのではないかと思っています。

使い方の正解がないなかで、試行錯誤を繰り返しながら AIの可能性を拡張していく

松尾:アウトプットの精度を高めるにはインプットデータが重要になるわけですが、データ整備の重要性はより高まっていきそうですね。

林氏:はい。お客様の相談のなかには、アルゴリズムではなく、データ整備が課題であるようなケースもあります。この課題は10年前からあまり変わっていません。ですから生成AIの登場とは関係なく、引き続きデータ整備は課題であるという認識です。

福島:確かに、データクレンジングやルール作りといった課題は、もう30年くらい変わっていないように思います。当時、分析には表計算ソフトを使っていましたが、最初に行うことはやはりデータクレンジングでした。余計なデータを排除し、タグ付けし、きれいにしてから分析する。そうしてやっと意味のある軸を見出すことができる。このプロセスを、今はAIで行っているわけですから、インプットデータはやはりきれいでなくてはいけません。リスクがあるデータを入力してもいけません。

アウトプットに関しても課題があります。どの要素をどの部門の誰が使用できるかというルールは、いまだに定まっていません。この後、何年経ったらこれが解決するのか。果たして「これは意味がある、これは意味がない」という判断を、AIはどこまで手伝ってくれるのか。そういう未来像は、まだ手探り状態かと思います。

:使い方に唯一無二の正解がないなかで、ベースになるルールや倫理的なものは共通化する必要があります。一方、そこから先の効果的な使い方は、それぞれ分野ごとに変わってくる。それを誰がAIに教えて、何が正解になるのかは、おそらく使っていくなかで見えてくると同時に、変化もしていくと思います。

そのため、共通部分については、ルール、倫理、制限などでカバーし、ベースのルールを超えた効果を追求する部分に関しては、継続的に更新や見直しをしてかけていく必要があるのではないかと考えます。

新規事業創出における生成AI活用とデータ整備方法-5

KPMGコンサルティング株式会社 
福島 豊亮

松尾:最後に、目指す将来や展望をお聞かせください。

林氏:我々はワンクリックで新規事業を作ることを目指しています。定型化できるものをどんどん生成AIに任せるようになると、いろいろな業務が効率化されて、人が処理しなくていい領域が増えますよね。そうなると、人がやるべきことは新規領域へのチャレンジです。新しいことに挑戦する際、皆さんの力になるツールを渡したい。

プロセスそのものは従来と変わりません。まずニュースや論文、過去の研究報告書、実験データから新たな市場を見つける。市場にフィットしそうなソフトウェアを自動生成し、プロトタイプを作る。ハードウェアであれば設計図を自動生成し、プロトタイプを作る。試作のうえ、市場性があれば製造ラインに乗せる。営業面でもAIが自動で提案書を作成して販売を自動化し、最後にはお客様の要望も取り入れる。そのようなツールを作りたいと思っています。

たとえば、100人必要なオペレーションがあったとして、生成AIを活用することでそれを1人で処理できれば、100個のアイデアを試せることになります。「千三つの法則」と言いますが、1,000のアイデアのうち3つが大ヒットしたら、日本のGDPも改善するでしょう。我々はそのようなプラットフォームを作りたいと思っています。

新規事業創出における生成AI活用とデータ整備方法-6

株式会社 KPMGアドバイザリーライトハウス
松尾 英胤

新規事業創出における生成AI活用とデータ整備方法-7

参考コンテンツ(外部サイト)

PDF資料は会員限定コンテンツからダウンロードしていただけます。

こちらは「KPMG Japan Insight Plus」会員限定コンテンツです。
会員の方は「ログインして閲覧する」ボタンよりコンテンツをご覧ください。
新規会員登録は「会員登録する」よりお手続きをお願いします。

競合他社の方は、登録をご遠慮させていただいております。