情報科学技術分野における戦略的重要研究開発領域に関する検討会(第1回) 議事録

1.日時

令和6年4月24日(水曜日)16時00分~18時00分

2.場所

文部科学省東館17階 17F1会議室 ※オンライン会議にて開催

3.議題

  1. 主査代理の指名について(非公開)
  2. 議事運営等について
  3. 検討会において重点的に議論すべき領域について
  4. 注目する研究課題等について
  5. その他

4.出席者

委員

辻井主査、相澤委員、荒瀬委員、内元委員、尾形委員、工藤委員、杉山委員、原隆浩委員、原祐子委員、湊委員、村上委員

文部科学省

松浦 大臣官房審議官(研究振興局及び高等教育政策連携担当)、国分 参事官(情報担当)、原田 科学官

オブザーバー

科学技術振興機構 研究開発戦略センター
 フェロー 福島 俊一

 

5.議事録

今回の議事は主査代理の指名があったため、開会から議題1までは非公開。
1.主査代理の指名について(非公開)
科学技術・学術審議会運営規則第2条第8項の規定に基づき、相澤委員が主査代理に指名された。

(傍聴者入室)

【辻井主査】  それでは、ここからが公開の会議となりますので、事務局は準備ができたらお知らせください。
 それでは、改めまして、情報科学技術分野における戦略的重要研究開発領域に関する検討会、第1回目の会合を開催させていただきます。
 それでは、まず僕のほうから、簡単にご挨拶させていただきます。IT分野がここ数年でかなり大きく変わっていますし、変わり方のスピードも加速度的に速くなっているという状態は皆さん感じておられると思います。また、ある意味で我々の技術というのが社会のいろいろな側面に対して影響を与える、その基盤的な技術になりつつある。産業もそうですし、科学技術研究もそうですし、社会生活においてもそう。そういう意味では、非常に幅広い影響を持つ技術になってきているということですね。
 その帰結かもしれませんが、研究というものと社会への展開とか実装というもののループが非常に速くなってきていて、その速さ故、産業界とアカデミア、それから、官との関係が、ほかの分野に比べてかなり密接になってきています。アメリカもそうですし、イギリスとかヨーロッパでも、ある意味でそのための特別なセンターができたり、産学協同も今までとは違って、さらに密な連携というのが行われる状態になってきています。そういう意味では、日本の研究の在り方も含めて変えていかないと、なかなか世界の速度の速い開発についていけないという状態になってきていると思います。
 それから、AI技術というものが情報技術全般にすごく影響を与えていて、AI技術を核にして情報技術の分野が再編成されているというところもあります。そういう意味では、従来から計算科学だとデータ構造とアルゴリズムとか、そういった教育をやっていましたし、数理科学のほうでは数学的定式化というのをやっていました。その2つはかなり融合し出してきて、データ構造というものも、例えば極端な今の基盤モデルだとか、LLMのほうだとポジションエンコーディングのように緩やかな形でデータの構造を付与はするが、その中に見られる構造というものは学習によって復元されていき、「あらかじめ決められたデータ構造があり、それをアルゴリズムで処理する」という形からかなり変わってきています。そういう意味では、今まで我々が考えていた計算機科学とは違った形のものが出てきているということだと思います。
 それからもう一つは、AGIという議論があって、一般的な知能という議論がかなり強く出ています。もう一方のほうで、おのおのの専門分野がそれなりの科学技術の体系を作ってきているわけですよね。だから、全ての問題が一般知能の問題に還元されるわけではなく、シミュレーションや、論理的な推論の能力、そういった分野に特化した知能の在り方というものと一般知能をどういうふうにインテグレートしていくかということも問題になるわけです。そういう意味では、学術界としては産業界と全く同じことをやっていても、特にITジャイアンツの研究方向とはコンピュートできない。
 少し距離を置いて、かつ、彼らの研究に対してもレレバントであるという研究をどうこれから組み立てていくか、という方向性の議論をしておかないといけないのではないかということで、この委員会をやりましょうということを文科省から頼まれまして、私も面白そうな先生の話を聞くのはいいなと思いまして、議論ができると楽しいのではないかと思ったので、主査ををお引受けすることになりました。
 そういう意味では、ブレーンストーミングに近くなるかもしれませんが、自由に自分の分野の考えていることを話をしていただいき、それを軸に皆さんの意見を、方向づけできればいいなと思っております。1つの方向になるということはないと思うのですけれども、幾つかのテーマの方向性が見つけられればいいかと思っています。よろしくお願いいたします。
 それでは、事務局より本日のオブザーバーと事務局側の説明をお願いいたします。
【植田補佐】  ありがとうございます。本日はオブザーバーとしまして、科学技術新興機構研究開発戦略センターの福島フェローに御参加をいただいております。文部科学省からは、大臣官房審議官研究振興局及び高等教育政策連携担当の松浦及び情報担当参事官の国分以下4名で事務局を務めさせていただきます。代表して松浦から一言御挨拶をさせていただきます。
【松浦審議官】  文科省の大臣官房審議官の松浦です。先生方におかれましては、御多忙の中、情報科学技術分野における戦略的重要研究開発領域に関する検討会の委員に御就任を賜り、大変ありがとうございます。昨今、IoTの普及や社会のデジタル化の進展に伴い、様々なデータが大量に収集可能となり、データの適切かつ効率的な収集、管理、共有、活用が科学技術や経済成長の鍵となっています。文科省ではデータ利活用を促進すべく次世代を切り拓く先端的な情報科学技術の研究開発に取り組んでまいりました。
 特に、情報委員会においては、科学技術及び学術の振興を図るために必要な方策について幅広い観点から御審議いただいているところですが、近年の科学技術の状況につきましては、先ほど主査の辻井先生からおっしゃっていただいたように、非常に加速度的に進んでいますし、さらに社会実装に向けては、そのループはさらに加速してどんどんシーズを社会実装していく。そういうループを速く回していかないと、という意味では、文科省は特にシーズを生み出して、その橋渡しをしていくところまでというのがメインのタスクですけれども、そこのその重要性もますます高まっているという中で、我々としても、その弾込めをこの検討会の中でしっかり先生方の御議論をいただいて、いい施策にしていきたいと思っています。
 さきの総理の訪米でも首脳の成果文書の中にもAI for Scienceがしっかり明記されて、先生がおっしゃったようにAIがいろいろサイエンスの中でも中心的な役割を担ってきている。その中でこの情報科学技術分野、どういうところを戦略的に重要な研究開発領域として示していくかというのがここのメインタスクかなと思っていますので、先生方、御多忙とは思いますけれども、熱心な御議論をいただき、そして我々、それをしっかり政策に結びつけていきたいと思っています。よろしくお願いします。
【辻井主査】  確かに二、三か月前に考えていたことがまたプランを変えないと駄目だというような状態になってきていると思います。だから、そこに巻き込まれてしまっていると、方向性をすぐに見失う感じがしていますので、その辺りの議論をきっちりと日本としてやっていかないと駄目だと思っていまして、その手始めということだと思いますので、よろしくお願いいたします。
 それでは、事務局より配付資料の確認と検討会の議事運営等について御説明をお願いします。
【植田補佐】  事務局でございます。議事次第に基づいて配付資料の確認をさせていただきます。現地出席の方はお手元の配付資料、オンライン出席の方はダウンロードいただいている資料を御確認ください。
 まず、資料1としまして1月の情報委員会で決定された「情報委員会における下部組織の設置について」をお配りしております。続いて資料2としまして、「検討会の運営規則(案)」資料3として、「検討会の公開の手続について(案)」。資料4としまして、「検討会名簿」をお配りさせていただいております。資料5につきましては、本日の事務局資料となっており、資料6がCRDS様の御発表資料、資料7が委員の皆様から事前にいただいておりました情報提供の資料となってございます。続いて、資料8が尾形先生の御発表資料、こちらは投影のみと伺っておりますので、タイトルのみお配りしております。資料9が杉山先生の御発表資料、資料10につきましては関係者のみの配付とさせていただいております。
 その他参考資料といたしまして、「科学技術・学術審議会の概要」及び「情報委員会の概要」、また、「情報委員会の運営規則」をお配りさせていただいております。もし現時点で御不明点、過不足等ございましたらお知らせいただければと思いますが、いかがでしょうか。もし何かございましたら、現地出席の方は手を挙げていただき、オンライン出席の方は事務局までお電話にて御連絡をいただければと思います。
 続きまして、本検討会の議事運営について御説明をさせていただければと思います。本検討会は情報委員会運営規則の第2条に基づきまして、1月の委員会において資料1のとおり設置された下部組織でございます。本検討会の運営規則は、検討会の中で定めることとなっておりますので、資料2及び資料3のとおりお諮りをさせていただければと思います。
 主だったところを読み上げさせていただきますと、資料2では、第2条のところで議事について記載をさせていただいておりまして、過半数の出席により会議を開催することや、オンライン開催ができることなどをまとめさせていただいております。第3条につきまして、主査が必要と認める場合に書面調査を可能とする旨、記載させていただいております。第4条及び第5条につきましては、議事及び議事録の公開について記載しており、公開の手続においては資料3にまとめさせていただいております。
 御説明は以上でございます。
【辻井主査】  ありがとうございます。
 今の説明に関しまして御質問やコメント、ございますでしょうか。
【辻井主査】  よろしいですか。それでは、これから検討会において重点的に議論すべき領域について意見交換をした後、「注目すべき研究課題等」について議論できればと考えております。この後、自己紹介を兼ねて御自身が注目している研究について一、二分程度御紹介いただければと思いますが、先に、このあとご予定があるという湊委員からコメントをいただけますでしょうか。
【湊委員】  ありがとうございます。すみません、この後、講義が入っているので、先に失礼させていただきます。私、京都大学情報学研究科の教授を務めております。専門はアルゴリズムの理論から応用まで幅広くやっています。注目している領域といいますと、最近は、深層学習を中心とするAIが非常に盛り上がっていますが、それとは別に古典的なシンボリックなAIというものも昔からありまして、その2つの両輪を高いレベルで統合するようなAIというのが、今後重要になってくるのではないかと思っています。
 それから、今、日本、AI分野はアメリカや中国に圧倒されているという印象がありますが、例えば、プログラミングコンテストの世界大会を見ますと、日本が上位を取っていたり、高校生レベルの情報オリンピックで金メダルを全員獲得していたり、そういったことも結構あるので、中学、高校生レベルではまだまだ十分高い。答えのある問題を短距離走で解くというところはかなり昔から強化されてきていおり、今、そういう人材が答えのない問題を長距離走でマラソン的に頑張って解くというところにいかにつなげていくか、というところが大事かなと思っています。
 ただ、そういう人材の人たちが、モチベーションというか、インセンティブになるものはお金なのか、名誉なのか、環境なのかというところがなかなか難しいところかなと思っています。
 以上になります。ありがとうございます。
【辻井主査】  ありがとうございました。
 それでは、事務局から「本検討会の議論の方向性について」、資料5に基づいて説明をお願いいたします。
【植田補佐】  事務局でございます。はじめに、資料5の一番後ろにつけております参考資料を御覧ください。こちら、1月の委員会において検討会を設置させていただいたときに使わせていただいた説明資料となっております。情報委員会につきましては、科学技術及び学術の振興を図るため、情報科学技術の推進のために必要な方策等について、これまで幅広く調査検討を行っていただいておりましたところ、情報科学技術の急速な技術革新に対応できるように最先端の技術に関する情報収集等を行う体制の構築が急務であるということを受けまして、本検討会を設置させていただいております。こういった動向を踏まえまして、戦略的創造研究推進事業に関わる戦略目標や、その他機動的な取組に資する事項の検討など、情報科学技術分野の推進のために必要な方策等に関する議論を行うということで、この検討会の設置をお願いしたというところでございます。
 本検討会の議論の進め方につきまして、事前に情報委員会の先生方や、辻井主査にお話を伺いまして、事務局のほうで議論の方向性の案としてまとめさせていただいた資料となっております。まず、情報科学技術分野を取り巻く環境や、最先端の技術動向というものを前提とし、主な留意点としまして、社会や経済発展に大きなインパクトを与えるものであるのかということや、多様な知識を組み合わせた新たな研究領域となっているのか、我が国の国際競争力確保に寄与するようなものであるか、という観点で、戦略的に重要な研究開発領域の御議論をいただければと思ってございます。また、そういった動向を踏まえ国が講ずべき取組ですとか、大学等の研究機関や民間企業に期待されることは何かということも、ぜひ御意見を伺えればと思っております。
 検討会で重点的に議論すべき領域案としまして、2つ記載をさせていただいております。1つ目が、現在主流のAIの弱点等を克服するための革新的なAI関連技術等に関する研究領域ということで、特に連合学習、分散学習など高度な分散処理に関する研究領域などが今後注目されるのではないかということを、有識者の方々から御指摘いただいております。2つ目が、AI×ロボティクスやAI for Science等を含むAIと他分野の連携領域も重要であろうということで、この2つを重点的に議論すべき領域案として記載をさせていただいているところでございます。
 本日、4月24日が第1回の検討会としまして、第2回は5月14日に予定してございます。第3回は6月中旬頃にもう一度御審議をいただきまして、その後、親会である情報委員会へ報告というような予定にさせていただいております。
 事務局からは以上です。
【辻井主査】  ありがとうございます。 
 それでは、次に、CRDSの福島フェローより資料6に基づき、御発表をお願いいたします。よろしくお願いいたします。
【福島フェロー】 「重点的に議論すべき領域検討に向けて」ということで、CRDSでの俯瞰的調査と戦略提言からのインプットという形でお話しさせていただきます。
 CRDSでは情報技術分野の研究開発動向の俯瞰的調査を継続的に行っています。その一環として、昨年は生成AIの急速な発展と社会インパクトというところがありますので、次世代AIモデルの研究開発に関する戦略提言を行っています。今回の検討会の趣旨に合わせて、この戦略提言から抜粋するような形でお話しさせていただきます。
 まず、情報技術分野全体の俯瞰から入ります。この分野のトレンドとして、3段重ねになっていますが。デジタル化・コネクテッド化、そして、そこにスマート化・自律化が加わって、さらに社会に広がっていく中で社会的要請、安全性・信頼性とかに応える技術開発が重なってきて、Society5.0を支えるような技術になってきていると見ています。このような流れを踏まえ、CRDSでは7つの区分、研究開発領域としては52設定しているのですが、俯瞰的な調査をしています。この中に人工知能・ビッグデータとありますが、先ほどもお話にあったように、全ての領域に大きく波及しているということで、特に中心的に昨年は議論してきています。
 AI分野の俯瞰では、大きな流れを「2つの潮流+1」という形で捉えています。第1の潮流をここで第4世代AI、次世代AIと捉えていて、基本的にはAIの基本原理の発展という流れになります。2つ目の潮流として、信頼されるAIを掲げていますが、AIが社会に広がるにつれて安全性や信頼性など社会からの要請に応えるような技術開発が必要ということで、この辺りも取り組みが活発化しています。また、「+1」としたのは、AIそのものというより、AIの活用ということで、AI駆動DXと書いていますけれども、AI活用による社会・産業・科学のプロセス革新といったところも急速に進んでいると捉えています。四、五年前からこういう流れで捉えているのですけれども、ここにこの一、二年の間に生成AIの急速な発展が大きなインパクトをもたらしているというような認識をしております。
 次の図は、基盤モデル・生成AIに関わる課題の全体感をまとめたものです。左側3分の2は、基盤モデルの構築・開発や運用、その上で応用を開発していくというようなところで、今盛んに産業界も中心になって進んでいるところです。この辺りは既に活発な取組が国際的な競争の中で進んでいるということで、走りながら考えるというか、走りながら手を打っていくというような位置づけになると思っています。右側の3分の1、ここが次世代AIモデルの創出につながるような基礎研究と位置づけて、昨年度、この部分に関する戦略提案の提案をまとめてきました。今日の議論もこの辺りが中心的になってくるのかなと思って、この内容を簡単に御説明しようと思っています。
 次を目指すということで、ここでは現在の基盤モデル(生成AI)の限界や問題点をどう捉えるかというところを押さえておきたいと思います。下のほうに書いてありますが、資源効率、それから、実世界操作、論理性、信頼性・安全性といった辺りに課題があるというのは、ここにおられる方だと細かく説明しなくても、それらは問題だよねと多分理解されていると思います。現在の基盤モデル・生成AIは、膨大な学習データから帰納的に作った確率モデルに基づく予測ということで、いわば高度なオートコンプリート機能のようなものなので、それに根差すような限界とか問題があると捉えています。
 これらの問題を克服することを目指して、次世代AIモデルに取り組まれることになると思うのですけれども、右側に黄色い色で書いているような3つのアプローチについて、次に御説明していきたいと思います。このうちのどれが本命というわけでもなく、幅広く可能性を探索して、それらの間でシナジーや融合を生み出していくという形で次が見えてくるのではないかと考えています。
 1つ目は、現在の基盤モデルを出発点とした改良・発展という辺りが活発に取り組まれているところと思います。現在の基盤モデルでなぜあれほどの賢い振る舞いをするのかというのは分かっていないと言われています。そのメカニズムをきちんと数理的に解明する研究というのは、より高い性能で、より効率のよいAIモデルを作り出すための基礎研究として非常に重要だと思います。そのため、NIIを中心としたLLM-JPのプロジェクトが代表的な取組として今進んでいると認識しています。また、現在の基盤モデルの苦手な問題に対処するような仕組みを外付けで実現していくことも活発に取り組まれていると思っていまして、もう既に産業化や実用化という形で進んでいて、プラグインとか、RAGと言われるような検索拡張生成とか、あとMixture of Expertsとか、モデルマージとかあるかと思います。
 2つ目が、人間の知能からヒントを得た新原理探求研究です。人間がやっていることからヒントが得られるだろう、ということで、現状、基盤モデルは基本的にはボトムアップな帰納型のAIなので、精度を上げるためには膨大な事前学習が必要ですが、ここに挙げたような二重過程理論や予測符号化理論というものから示唆されるのは、必要な範囲のみを能動的・トップダウンに取りに行ったり推論したりするといった仕組みや、予測と実際の誤差からモデルを修正するような仕組みというものがあれば、資源効率の問題や安全性、論理性といったところも改善につながっていくのではないかという期待があります。
 3つ目は他者や環境との関係性の中で発展する知能というような考え方の研究です。先ほどの2つは、1つのAIシステムがより高度になっていくというような流れかなと思いますが、こちらは今後多数のAIと人間が協働・共存していくようなマルチエージェント社会のようなものをイメージしたときに、こういった関係性という観点も重要になってくるのではないか、ということで注目しています。ただ、この辺り必ずしもまとまった大きな流れになっているわけではないと思いますが、コモングラウンドとか、記号創発とかアフォーダンスとか、関連する観点で取組が少しずつ出ているように見ています。
 次がリスク面の話になります。基盤モデル・生成AIは、それ以前の目的特化型のAIを超えて、高い汎用性とマルチモーダル性を示しています。さらに、人間と区別できないような応答性能を示しているということで、従来から、AIのリスクに関する議論はありましたが、さらに深刻化しているという面があると思います。ハルシネーションとか社会的バイアス、そういった生成AIの出力から生じるような問題もあれば、フェイクとか、なりすましとか、悪用するという問題も出てきています。さらに社会の在り方や文化への影響といったところも懸念されています。また、様々な生成AIがこれから乱立していく中で、良質なAIと粗悪なAIや邪悪なAIをどうすれば見分けられるかといった問題も重要になってくると思っています。
 次世代AIモデルの研究という中では、高い性能・機能を追求するだけではなく、リスクへの対処というものも同時に両輪として取り組む必要があるだろうと考えています。これは制度設計で済むという話ではなくて、やはり新たな技術開発が不可欠な問題だと考えています。開発者が安全なAIシステムを作るという開発フェーズ向け、開発者向けのガイドラインや技術開発は、この5年ぐらいで結構進んできていて、機械学習システムの品質評価にソフトウエア工学的なアプローチで取り組むというのは活発になっていて、開発ガイドラインとかテスト手法とかいろいろ整備されてきているかと思いますが、生成AIが出てきたことで新たな対応が必要になってきているのではないかと思っています。
 また、利用者側から見ると、きちんと見分けられたりとか、検証したりとか、そういった仕組みが欲しいと思っていて、このスライドではリスクに対処が必要になるケースを生成AIの使われ方という観点から5通りに整理しています。それぞれで取組は始まっていると思うのですけれども、まだまだ強化していかなければいけないというような状況かと思っています。
 最後に、時間の関係で簡単に触れるだけにしますが、AIとほかの分野の掛け合わせには非常にいろいろな可能性がありますが、ここではAI×科学と、AI×ロボティクスというところだけ取り上げます。AI×科学では、科学研究サイクルにAIやロボットが導入されることで、仮説空間の探索の精度や効率の向上、科学研究サイクルの精緻化・柔軟化がどんどん進んでいくと思っています。それから、AI×ロボティクスに関しては、言語や画像だけではなく、より多様でより大量のマルチモーダルデータを学習したロボット基盤モデルといったものを用いることで、行動計画からさらに動作生成の辺りを柔軟化・ロバスト化するという動きが進みつつあると思います。この辺りまた尾形先生から御説明があるかと思います。
 最後のページは、参考のためにつけてあるのですが、ビッグサイエンス化などのAI研究開発の形態が変化しているということを受けて、推進策の面でも様々な工夫が必要なのではないかということで、今後の論点になると思い御参考に入れたという形です。
 私からは以上です。
【辻井主査】  どうもありがとうございます。
 今、我々が置かれている状況というものを端的にまとめていただいたと思います。それでは、続けて委員の皆さんより、今、興味を持っていることを少しお話ししていただき、自己紹介に代えたいと思います。
 まずは私、特に今研究アクティブという感じではないので、テーマ的には今の大規模言語モデルが典型的にそうなのですが、一種のブラックマジックになっていて、何が起こっているか分からないという感じになっています。ある意味、新たなシステムを作るときに以前のソフトウエア工学がやっていたような過去の資産をうまく組み合わせて、より大きなシステムを作っていくというようなシステマティックな方法論というのがあまりない状態だと思います。
 だから、まだスキルの段階にとどまっていて、工学としての方法論というのをきっちりと整理していく必要があるのではないか。これは福島フェローの話にもありましたけれども、モデルマージングや、Mixture of Expertsそういう、ある種のモジュールみたいなものがあって、それを組み合わせていくことで、より違った機能を持ったシステムを作っていく。そういうことができないと困るなと思っています。ただ、以前のモジュールのように簡単なAPIで結合していくということではうまくいかないのだと思います。かなりモジュールとしての独立性はありますが、密にインタラクトするみたいなモデルになっていなければ、以前の単なるエキスパートが集合として動いているというだけでは駄目なのではないかと思っています。
 そういう意味では、今の深層学習の時代におけるモジュラリティとは何か、モジュールを組み合わせて、より複雑な仕事をするということはどういうことなのか。情報のモダリティによって別のシステムがあって、それをインテグレートしていくというのも含めてだと思いますが、そういいったことを考えていく必要があると思います。最近、ディープマインドがそういうペーパーを出しているので、個人的には面白いなと思って、技術を整理している段階だと思うんですけれども、興味を持って見ているということです。
 それでは、次に相澤委員、お願いします。
【相澤主査代理】  相澤でございます。私は、辻井主査がおっしゃっていた緩いデータ構造や、福島フェローのお話に出てきたAI×ビッグデータと関係するトピックとして、AIによるデータ活用自体を支援する技術というのが重要だと考えています。データはAIの中核なのですが、現実には今、我々が見ているのは、ごくごく一部のデータに過ぎない一方、残りのポテンシャルのあるデータを利用することに関するコストというのはものすごいものになってきているというのが素直な実感です。
 私自身は、PDF文章の解析というのを長年取り組んできたのですが、それは大変泥臭い下積み作業で、非常に手間がかかる割に全然技術的に見返りがない、論文にならないというような分野です。これが難しいのは、PDF文章を理解するということ自体にものすごく高度な人間の認知処理が働いているからで、難しすぎて自動化する見通しがないために技術としては認められてこなかったということだと考えています。ところが今、生成AIが出てきて、それができるようになってきていることを感じます。実際に文書AIが出てきていて、GPT-4もある程度文書構造を認識しています。ただ、今の深層学習モデルが認識している文書構造というのを、私たちは結構細かい目で見るんですが、まだまだ粗があって、人間レベルにはなっていないというところがデータ活用に向けた1つのモチベーションになると思います。
 データをいかに処理するかということについては、3つの軸を考えることができると思います。1つは実世界のデータをどうやって取り込むかというところで、リアルな移りゆく環境の中で、いかにデータを取り込んでいくかや、実際、取り込んでしまったデータをどうやって忘れるかという忘却、記憶の仕組みなどにも結びつきます。2つ目は、先ほどの文章画像理解にも関係するのですが、LLM、あるいは基盤モデル自体を基盤モデルの生成に使うという枠組みで、LLM as a judgeとか、LLM in the loopとかいろいろな言葉で呼ばれています。すなわちAIが学習のためにデータを使うだけではなくて、そのデータを学習した基盤モデル、AIそのものを学習のソースとして使うというコンセプトです。そういったものを含めて、我々がすごい泥臭い作業をしてきたデータプレパレーションをどうやって効率化していくのかという観点があるのではないかと思っています。
 3番目は、そうやって集まってくるデータは、ものすごくヘテロになり、今までのAIでは恐らく単独ではそれだけのヘテロなデータを扱えないので、いかにモジュール化する形で複数のAIを組み合わせていけるかというアーキテクチャだと思います。
 以上でございます。
【辻井主査】  どうもありがとうございます。
 それでは、荒瀬委員、お願いします。
【荒瀬委員】  4月から東工大におります荒瀬と申します。よろしくお願いいたします。専門分野は辻井主査、相澤委員と同じ言語処理になっていまして、今非常に進展が速くてアップアップしております。個人的に興味を持っているのは、ChatGPTやGPT-4が出てきて、どういう言語現象が取られているとか、どういう能力があるみたいな評価は進んではきていて、今すごい研究が進んでいる分野だと思いますが、一般の方が思うほど賢くない側面が見え隠れしたり、私、意味の類似性の推定の研究をしているのですが、あれだけ賢く見えるのにやはり少し表層、言葉遣いが変わると類似性が分からなくなってしまったり、推論を失敗したりしてしまうというところが見え隠れしていて、そのアンバランスさがどこから来ているのかや、どうやってそれを直していくのかというところに1つ興味を持っています。
 もう一つは、言語モデルがいわゆる評価データセットから一歩踏み出すと、やはり全然うまくいかない、問題が解けない。例えば現実の人間が言ったことや、口語で言ったようなことを理解させようとすると途端にこけてしまうというようなところに興味があり、その言語モデルを現実世界に持ってくるにはどうすればいい、どうやってこの認知しているようなコンテキストを理解させてコミュニケーションをとれるような言語能力をつけさせていくのかというところに興味を持っています。よろしくお願いいたします。
【辻井主査】  内元委員、お願いします。
【内元委員】  NICTユニバーサルコミュニケーション研究所の内元と申します。私のバックグラウンドは、相澤委員、原委員、辻井主査、村上委員と同様に、自然言語処理ですが、最近学会のほうには参加できておらず、我々の研究所では、言語を中心とした研究開発というのを進めてきております。これまでもたくさんのデータを日本語を中心に集めてきて、それに基づいて様々なアプリケーションというのを生み出してきています。今回、この検討会に関しまして2点提案させていただきました。1つは、この議論に流れにありますような、より多くのデータを扱うための高度な分散処理等に関する研究領域に関するものでして、最近、生成AIも含めましてAIの基盤モデル、いろいろなものが出てきております。
 言語だけではなくて、マルチモーダル化しており、その情報もどんどんと進化していっているところだと考えております。それらのモデルを個別の企業や組織が拡張していこうということはなかなか難しい課題がありますが、これをうまく循環的に進化させるような技術というものがこれから重要になってくるのではないかと思います。小さな企業であってもどんどん進化する基盤モデルの恩恵を受けることができる、そういったようなことを可能にする技術というのが重要になってくるのではないかと考えます。それも、安全に使えるようなものというのが重要になってくるかと思います。
 元のデータを共有するのがなかなか難しいという課題があると思いますが、それぞれいろいろなところで作られたモデル、それらをうまく組み合わせることによって全体として大きな使える基盤モデルというものをいかに効率よく作っていくことができるか。その辺りの技術開発として、この連合学習的なところに関係するようなところを中心にしっかり研究開発を進めていくことが重要ではないかと考えております。
 もう一つは、脳との関係だと考えております。今の生成AIを動かそうと思いますと、大量のGPUが必要になって地球にやさしくないということがございます。そういった大量のデータ、エネルギーを消費するような課題を解決するというのは、やはり人の脳というのは低消費電力で動いているわけで、効率よく動いているということでありますので、脳に学ぶような技術開発、AIというのを開発していくというところが1つ重要なポイントかと考えております。それも今、主に進んで、研究開発がどんどん進められている生成AIの基盤となっているのが、トランスフォーマー等の技術ですけれども、そういったものと脳の関係というのも、明らかにはなっていませんので、脳に学ぶことによって、その低消費電力化というのも加速させていくということもできると非常にいいのではないかと考えております。
 以上でございます。
【辻井主査】  それでは、尾形委員、お願いします。
【尾形委員】  ありがとうございます。早稲田大学の尾形です。後でお話をしますので、ここではそんなお話をする必要はないかと思うのですが、発達ロボティクスと言われているものを30年ぐらいやっています。基礎研究だとずっと思っていましたが、この10年全く話が変わって、大変なことになっています。
 AIと言われている技術、僕はニューラルネットワークだとずっと言っていますけれども、ニューラルネットワークをロボットに使っていたのですが、これがディープラーニングで結構使えるようになったということで、最近、アメリカ、中国ですごくたくさんの人型ロボットが作られるようになってきました。
 ただ、ロボットに使えそうだということ以上に、逆にロボットに入れてみると、先ほどChatGPTは、実は大したことはないという話がありましたが、ロボットのほうも、入れてみると、確かに今まではできなかったことがたくさんできるのに、意外とできないこともたくさんあるというのが見つかるはずです。逆にこういうロボットに実際に入れようとするときには何が必要なのだという課題が見えてくるのかなと思っています。後ほどそのような話をしようと思います。
【辻井主査】  それでは、工藤委員、お願いします。
【工藤委員】  工藤です。大阪大学社会技術共創研究センターで特任研究員をしています。専門は法律・法学ですが、既存の法律の細かい解釈というよりも、法はどうあるべきか、人々が法をどう作っているのか、さらに、議会や省庁が作る法だけではなく、企業が自主的に取り組んでいる規律、例えば自主規制にも関心があって研究をしております。その一分野として、新興技術に対して人々がどういうふうに向き合ってルールを作ったり、ルールに従わせられたりしているのかも研究しております。
 私から持ってきました提案は2つございまして、皆さんから既に御示唆があったところでありますが、法学・倫理学・社会学の分野から見ると、まずはAIによる「知的負債」の特定や対応に関する研究をやってほしいなと思っております。
 知的負債は、2018年頃に提唱された、少し新しい概念でございまして、ソフトウエア開発における「技術的負債」という概念を参照したものです。短期的な視野に立ってその場凌ぎの対応を続けていると、長期的に取り返しがつかないひどいことが起きたり、直そうとすると莫大なコストがかかってしまったりすることを、金融上の負債に見立てた表現として技術的負債という言葉がソフトウエア工学にはあります。それにどう対応するかという知見も蓄積されているところです。知的負債は、これをAIなどに拡張した概念でございまして、例えば、データベースやデータセットに透明性がない、アルゴリズムの解釈性がない、あるいは生成AIなどが人間が意図したように動いていない、アラインメントの問題があるといったことが対応されないまま、AIが急速に普及してしまうことや、または、AI同士がつながりあってネットワーク化したときに、システミックリスクが広がってしまい、誰も止められないといったことが起きるのではないかということが、主に想定されています。
 最近はこの知的負債をもっと拡張して使っている方もおられ、生成AIによる偏見や差別の助長、プライバシー侵害、さらに情報の信頼性や民主主義的価値への悪影響などを含める場合もあります。取り返しがつかない、あるいは取り返そうとするとかなりコストがかさむものを早めに見つけて対応しようというところでございます。既に福島フェローから信頼性や安全性のお話もありましたし、先ほど辻井主査からあったブラックボックス問題などもこのテーマの一部として含まれると思います。
 法学側から見ると、学際的検討をしてほしい研究領域です。社会側のニーズや、何に困っている、どういうことが問題だと思っている、ということも聞いてほしいからです。そういう意味で産業側の声だけだと少し厳しいかなと思います。さっき言ったように、短期的視野に立つと最適な対応ではあるのですが、長期的に見るとあまりよくないとか、社会全体から見るとあまりよくない、部分最適化に陥っているといったようなこともあると思います。ですので、そういう視野を持って、基礎研究も含め、研究開発をしていただきたいというのが1点目です。
 2点目は、既に福島フェローから資源効率の話がありましたし、内元委員からも脳に学んで効率化したほうがいいというお話がありましたが、環境性能に関する研究です。
 私から追加で情報提供できることは、EUのAI Act、つまり、AI法とかAI規則と呼ばれているルールの目的規定に、実は途中から環境保護が盛り込まれました。自動車などで起きてきた環境に関する規制が、大規模言語モデルや生成AIに対しても何らかの政策手法で導入されてくると思うので、ここは「遅れ」をとると致命的と言うと語弊があるかもしれませんが、今後、国際潮流として求められる研究分野であるとは思います。
 既に環境性能に関する日本国内の研究開発は勃興して増加しつつあると私は見立てておりますので、産業化の動きも後押ししつつ、もう少し基礎的な研究を振興できるといいと思います。同時に、社会的な観点からすると、性能評価手法を提案したり、いい研究成果が出たものを国際的にアウトリーチしたり、訴求をしたりしていくことが望ましいと思います。
 さらに、可能であれば、これは主に産業側がやってくれると思うのですが、標準規格に関する取り組みです。グローバルスタンダードや格付が提案されていくと思うので、そういうものに対して専門的な知見から貢献をしたり、基礎研究の知見を生かして革新的検討を行ったりしていただけるとありがたいなと思っています。
 以上2点でございました。
【辻井主査】  どうもありがとうございます。
 それでは、杉山委員、お願いします。
【杉山委員】  杉山でございます。理化学研究所と東京大学に所属しています。私は、機械学習の数理的な研究に興味を持ってずっとやってきていますが、思えば子供の頃はプログラミングやゲームが好きで、応用っぽいことをやりたかったはずですが、大学生ぐらいまではまだそう思っていましたが、だんだんと基礎的なことが面白いかなと思い、大学院から数理的な研究に割と没頭するようになりました。辻井主査がおっしゃったように、この分野では、数理的な研究が本当に現実世界に役立ちますので、研究としてはすごく役に立たないことをやっているような気がしますが、実際にいろいろな人と話すと、裏では役に立つ可能性があるということを認識しながら研究できているので、そこは非常にいいところだなと思っています。
 ただ、先ほど福島フェローのお話を聞いていて、完全にレビューしていただけると、もうおなかいっぱいで、しゃべることはないなと感じるのが正直なところです。学生にも、あまり勉強しないほうがいいですよとたまに言っています。研究の意欲がなくなってしまうので、勉強は途中でやめて、周りの情報をシャットアウトして自分で考えましょうという話をしているのですが、今、同じような気持ちを持っています。世の中、これだけ早く動いているので、ニュースや読む論文は幾らでもありますし、一生、それで楽しめる気がしますが、おそらく、我々は、それをやめないといけません。もうみんな勝手に好きなこと、周りの人、やってください。自分たちはボトムアップにこういうことをやります。ほかの人が何と言おうとこれが大事なんですという感じのスタイルでやっていかないと、残念ながら、もう日本の規模で海外と勝負して勝てる分野はないです。
 先ほどのこのレビューの話を聞くと、全分野、あらゆる人がやっていて、今から参加しても、という感じがしますので、やはりここで、今回、こういう委員会に参加させていただいて、皆さんと議論できるといいなと思うのは、やっぱりボトムアップに自分たちができることは何かというのを腹の底から議論して、新しい流れを作るということが最終的なゴールになるといいなと思っていますので、皆さんと議論させていただけるのを非常に楽しみにしています。よろしくお願いいたします。
【辻井主査】  それでは、次、原隆浩委員、お願いします。
【原(隆)委員】  大阪大学の原と申します。私は、今、大阪大学で情報科学研究科長を昨年からしています。併せてJSTのACT-Xの次世代AIの総括も同じタイミングから始めたので、最近、こういうところに呼ばれることが多いんですけれども、どの立場で話していいのかちょっとよく分からなくなってきて混乱しているのですが、今日は私の研究も含めて少しお話ししたいと思います。
 私は昨年度末までCRESTでプライバシー保護を考慮したクロスドメインの行動予測をしていました。もともと私自身はデータベースや、モバイル、あとソーシャルコンピューティングでAI的な研究をしていたんですが、最近では特に企業のサービスデータに近いところで、プライバシーをどう守りながら、サービスをまたがって、例えば全然違うウェブサービスドメインで構築したユーザーモデルをeコマースでの購買予測に使ったり、実空間でのどういう場所に訪れるかという予測に使ったり、そういう研究をしています。
 これは何が面白いかというと、基本的にかなりデータがセンシティブな業界とか、データ自体がeコマースみたいに新しい商品が入ってきて、古い商品が消えるというのは2週間ぐらいで起きるような分野があるので、いわゆる1対1のユーザーと商品の関係性で購買予測をするというのでは、全然、既存のデータでは当たらないみたいなことがよく起きます。そのため、いろいろなサービスから取れるユーザーの割とユニバーサルな特徴をモデル化して、ほかのドメインに使うという感じの研究をここ7年ぐらいしています。
 ただ、その中で今強く思っているのは、やはりプライバシー保護の潮流はすごく、個人情報保護法を守っていても、全然ユーザーに受入れられません。要は、推薦が当たり過ぎたら気持ち悪いとか、全然、本人のデータを使っていないが、本人のデータを使っているんじゃないかと疑われるような精度の高い行動予測をしてしまうというところに気持ち悪さがあるので、技術的にはプライバシーを確実に保護しながら、例えばユーザーのIDや生データをサービス間で全く交換しないような形で、すごくクリーンな形でユーザーの行動予測を、ドメインをまたがってするような仕掛けというのは今後重要になるかなと思っています。
 その中で、何人かの先生からのお話もありましたが、ポイントとしてはいろいろなデータを使っているところが技術的にはあるので、マルチモーダルなデータを使いながら、アンカーになるような情報を使わずにいろいろなサービスの面、またがったような行動予測をするというのは、これからも面白い研究テーマだなと思って、来月はそういう観点で、もう少し詳しくお話しさせていただく予定でおります。
 その一方で、ACT-Xのほうでも次世代AIという形で様々な研究者の研究内容というのを見ているんですけれども、最近特に思うのは、杉山委員も御存じ、深層学習の技術ってすごく発展していて、対象学習や、グラフ畳み込みは、最近一般的に使いますし、ハイパーグラフを使ったり、拡散モデルや確率的モデルを使って、とにかく高度化が進んで精度がどんどん上がっているという状況が実際に起きていて、私たちも実際のモデルでは最新の極めて複雑なモデルというのを使っています。
 ただ、その中では、基本的に出力として生成されるユーザーやアイテムの表現というのは、かなり意味のない、いわゆる人間的には意味が全然分からない、非常に多次元、分散表現、ベクトルになるので、ここの実用的にはこういういろいろな技術が出てきて、どんどん複雑化している中で、一方で生成AIの問題であったりとか、あとAIの結果の説明性を保証するために、そういう研究に取り組んでいる方もいらっしゃいます。これは、湊委員の話に近いのですが、シンボリックなAIや、数理モデルへのフィッティングだったりとか、その辺りをモデルをシンプルにして説明可能にしようという動きがもう一方ですごく流行しているところがあって、私の感覚では、その両者が乖離したままというよりは、どんどんより乖離している、離れていっているという印象があります。
 この辺りの2つの潮流をどうにかして結びつける仕掛けを作れないかなというのが、今、一番技術的なところで注目している分野ではあります。それの1つのアプローチとして、生成AIとか、AIも使って2つのこの乖離したモデルをつなぐための言語化みたいなところを何かできないかなというのは考えています。
 以上です。
【辻井主査】  どうもありがとうございます。
 次は、原祐子委員、お願いします。
【原(祐)委員】  東工大の原です。よろしくお願いします。私は、今、組み込みシステムの設計自動化という分野をやっています。アプリケーションが与えられたときに、それをどのようにリアルタイムに求められる実行時間内に処理し、そしてそれをどのように非常に多いバッテリー駆動の組み込みシステムをローパワーに設計するかとか、そういった設計方法をもともとは研究していました。
 最近、私は、その流れでセキュリティに向けて研究のテーマをシフトしつつありますが、例えば暗号技術を数理的には非常に安全であっても、例えば電力や、サイドチャネルと言われる情報を解析することによって、もともと数理モデルは理想的な環境で処理されることを想定しているので、そういったサイドチャネルによって暗号が破られるということは全然想定していません。
 でも、実際にはそういうことが非常に起こっていて、半導体が増えている今のIoTの時代では、脅威がどんどん増えていくだろうということで、そういったところに着目して研究をしています。昨年、私、サバティカルで――サバティカルと言っても3か月だったのですが、セキュリティや、耐量子暗号などで世界をリードしているグループがベルギーのKUルーベンというところを訪問していました。私は組み込みシステムの設計方法なので、今まで理論のことについては、あまり知らなかったのですが、その中で多くの理論は整っていても、それが実世界に応用できないことが多いという話をよく聞きました。
 というのも、例えば、実例としまして、私の素人目線では、サイバーセキュリティと暗号理論というのは非常に近いところにあると思っていたのですが、実際問題は全然活用できないと聞いています。というのも、例えば理論の中では、どれぐらい計算量だけではなくて通信の負荷が高いかが考えられていないので、それをディプロイできません。それは例えば、通信技術がよくなったら使えます、というふうに待っていては駄目だと思います。
 なので、やはり、そういった実世界にどういう問題があるかということを考えた理論建て、それをどう実現するかを考えていかなければ、なかなかその実現には至りません。特に欧米では最近、サイバーセキュリティのマスターのコースの設立が、頻繁に起こって頑張っているんですが、そういった流れにも遅れてしまうという危機感も感じています。なので、私、サイバーセキュリティは専門ではありませんが、そういうところに着目した研究というのも進めていかないといけないと思っています。
 以上です。
【辻井主査】  どうもありがとうございます。
 それでは、村上委員、お願いできますか。
【村上委員】  ありがとうございます。AISI――AIセーフティ・インスティテュートで所長をしております村上でございます。本日は、AISIの立場で参加しておりますが、もう一つ、民間の企業で損害保険の会社でCDAO、チーフデータオフィサーをしております。今、先生方のお話を聞いていまして、まず民間の立場で申し上げますと、非常に最近AIの活用を、外圧と申しますか、外でAIを活用していかないと戦えないという、AIを使わないことに対するリスクというのが高まっていますが、実際、このAIを利用しようとすると、先ほど相澤委員がおっしゃられたように、社内のデータがPDFであったり、構造化されていないデータで活用できないといった問題にも直面しております。私は、その企業のチーフデータオフィサーとしては、そういったAIを活用するために、AIレディになっているデータの状態を目指すということが1つの使命だとと思っています。
 もう一つあるのが、やはり会社でAIを利用するときは、プライバシーの侵害、いわゆるコンダクトリスクもあります。また、いわゆるAIを利用することによる社会的なインパクト、例えば偏見に満ちた返答をしてしまうであるとか、そういう判断をしてしまうといったようなレピテーションのリスク、法律には引っ掛からないけれども、世の中的には許されないというようなリスクというのが2つ抱えられていると思っています。民間の側から見た、そういったAIに対する課題というのを解決するというのも1つの研究としてやっていただきたいことでもあります。
 もう一つの顔でございますAIセーフティ・インスティテュート、これは御存じない方に少し御説明いたしますと、昨年、G7で行われた広島AIプロセスというプロセスで立ち上がりました、世界的にAIの安全性について議論していこうというムーブメントがございまして、その中でイギリス、アメリカ、日本とAIの安全性に対しての感度を上げていくというところで、しっかり政府としてインスティテュートを立ち上げて対応していこうということで、今年の2月に立ち上がった組織でございます。組織的にはIPA、経産省の下のIPAの下にございまして、AIのセーフティに関すること、これ、インスティテュートという名前には少しこだわりがございまして、自分自身では研究をしません。ラボラトリーではないという。皆さんの国の中でアカデミア、それから、国の研究所というところ、あと民間、それと連携して、しっかりAIの安全性について日本の国として考えていく機関だという使命を持っております。
 その観点で申し上げますと、AIのリスクというのは、、プライバシーからプライバシー侵害もあれば、セキュリティももありますが、今の生成AIの登場によって、今までのAIの安全性というのは説明責任、データに対する責任とAIのロジックに対する説明責任というもので解決できていたものが、どうしてもモデルのオーナーであっても説明ができることが、し尽くせないという状態になってきたときに、どうやってそのリスクというものを回避するのかということがあります。
 一般的に、そういったものを今では外側で、テストベースでリスクの軽減、リスクがあるかどうかというのを、生成AIを使って見ていくようなものというのも多く出ていますが、AIの安全性に絡んだ研究、透明性の研究は引き続きやりますけれども、テストベーストのもの、そしてプライバシーのものといったものに関しても、かなり研究の分野としては期待していくところでございます。
 長くなりましたが、皆さんとは違いまして民間と、それから、AIセーフティ・インスティテュートという2つの顔を持ってございますので、そういったところでぜひ議論できましたら幸いでございます。最初に紹介を忘れましたけれども、もともと研究者でございまして、IBMの基礎研究所で自然言語処理をしておりました。以上でございます。
【辻井主査】  どうもありがとうございます。
 最後になりましたけれども、原田科学官からコメントをお願いいたします。
【原田科学官】  科学官の立場で、委員の立場ではありませんが、どうぞよろしくお願いいたします。私は、もともと知能ロボットのほうをやっていたのですが、知能ロボットをやっていたら、やはり環境認識が大変重要だなということで、コンピュータビジョンや、マルチモーダルといったことをやっていて、最近は知能ロボットのほうに戻ってこようか、といったことを考えております。
 既に福島フェローからのプレゼンでもありましたとおり、生成AIがすごいなということで、既にデータがたくさんあり、それを処理していくということに追いついていくというのは難しいなと思っております。そうではなく、前向きでこのデータを取っていく領域が大変重要だろうと考えている次第です。
 特に、実世界という観点から言うと、データが無限にあります。特に、注目して取ってくるかという方法論や数理といったものは、まだ解けていない。a sort of……という感じになっていますので、そこにチャレンジしていくことが重要だと思いますし、もう一つはデータを取るための時定数です。言語や画像オンリーといったものは、ある程度、力技で取れたりはしますが、例えばロボットのような人の行動のデータといったもの、やはり実時間を超えたレベルで取ることは不可能であるということで、幾ら強いところが頑張ったとしても、なかなかやりづらいという感じだと思います。
 その一方で、そういったデータ、今後取っていくというのは、その時定数がすごく大きいものを取っていこうとしたときに、とはいえ、データを取るというのは重要なので、スケーラビリティをどういうふうに考えていくかというところが大変重要だなと思っており、その問題を解決する1つは、いろいろな先生からも既にコメントが出ていましたが、分散学習であるというところは1つ重要だなと思っており、分散学習においてもデータを集めて、1か所に集めて計算するではなくて、プライバシーの問題や、コンピューティングの進展というものもありますので、データを集めるのではなくて、一材料にあるようなモデル、どんなデータ、よく分からないような、パラメータも違うし、インプットもアウトプットも違うようなモデルがたくさんあり、そういうのを集めて処理するような分散学習というのも重要だと考えています。
 ヘテロジーニアスな環境ですね。ただ単純にモデルをマージするだけではなくて、そのモデルの演算みたいなのも重要だと思っております。例えば、ビジョンのモデルとデータのモデルと足し算、掛け算で一体どういうふうに計算するんだろうみたいな、そんなところの数理まで、深いところまで研究するというのは大変重要であろうと思っています。もう一つは、実際、データを取るのではなくてシミュレーションを使うことで、データは増やすことが可能なので、そのシミュレーションの高度化、精緻化というのも重要だと思います。あとは、ディプロイするときには、それらのモデルとの差というのは絶対に埋めることはできませんので、そこをどうやって埋めていくかというのが重要になるであろうと考えます。
 研究としては、例えば、マルチモーダルモデルを作るにしても、通常の空間ではなくて、そもそも空間、土台を変えたら根本的に違うことができるのではないかや、分散学習であったとしても、そのモデル同士の数理、和や積ってどうやって定義するんだみたいな、一歩深いところまで考えて、より一般化するような方向にやっていくというのが研究の方向性として重要ではないかと個人的には考えております。
 以上です。
【辻井主査】  どうもありがとうございました。
 今のコメントや福島フェローのサーベイまで含めて御意見・御質問があればよろしくお願いします。
【荒瀬委員】  いいですか。工藤委員のおっしゃっていた知的負債というのはすごく面白いなと思います。
何かもう既に始まっている気がしていて、オープンなモデルができて、オープンサイエンスにはすごくよかったんですけれども、問題があるというよりは、いろいろな偏見とかバイアスがあるモデルがどんどんオープンになって、それをモデルミクスチャやマージをして、さらに、新しいものが生まれてもう追跡できないような状況になりつつあるのではないかという気がしています。そういうのをどういうふうに規制するのがいいでしょうか。リーダーボードは勝手に作られた野良モデルがいっぱい席巻していて、何を言い出すか分からないようなのがたくさん生まれている気がします。
【工藤委員】  ありがとうございます。人文社会科学の視点からしますと、人間の手に負えなくなった技術というのは過去にも幾つかありました。遺伝子組み換え技術、原子力技術などです。そこで何が実践されてきたのかというと、もちろん研究者コミュニティの自主規制があり、研究者倫理による規律や、研究活動を監査・検証するための倫理委員会なども挙げられます。
 さらに、法律として規制がされるということももちろんあったので、そういう重ね掛けによってある程度の秩序立った規律を導入することが、先行する新興技術においては実践されてきたので、AIや自然言語処理の分野の皆さんもそちらを参照しつつ進めるというのが、穏当なやり方であると思います。
 しかし、ここで見逃してはならない大切な視点は、現在の生成AIを牽引しているのは私企業であるということです。この企業の皆さんにどういうふうに介入していくのかというのは、政治学・法学からするとかなり難しい課題の1つでもあり、特に日本においては国外の企業がパワーを持っていて、そちらとどうやってやりとりしてもらうのかが今後課題になってくるところだと考えております。
【辻井主査】  何となくリーダーボードみたいなもので特定のテストセットで競争するということが、研究の創造性をサプレスしているという感じがします。似たような研究をしているばっかりになってしまい、それからテストデータがコンタミネートしてしまっていて、本当に精度が上がっているのか、上がっていないのか分からないような状態が起こっている。
 だから、我々の分野では何がいい研究で、というところの評価の手法というのが、間違った方向に行ってしまったのではないかという気がします。原田科学官が言っていたような、創造性のあるような研究をやろうと思っても、その枠組みに少し外れてしまうので、論文が通らないとか、そういう現象が起こっています。特に言語処理の分野です。単なる感想ですが、少し考えないと駄目なのではないかという気がします。
 ほかに何かコメントありますか。
【国分参事官】  事務局からの提案ですが、時間が大分押していますので、もしよろしければ尾形先生と杉山先生から御発表いただいた後にまとめて意見交換という形のほうがよろしいかと思います。
【辻井主査】  そうですね。はい。分かりました。それでは、まず杉山委員から発表をお願いできますか。
【杉山委員】  よろしくお願いします。杉山です。「AIのサイエンス」という名前にしたのですが、原点に立ち返って基礎的なことを考えたい、ということでスライドを準備いたしました。自己紹介は飛ばして、どんなことをやってきたかということを少しだけお話しできればと思います。この5年から10年ぐらい、結構頑張ってやっていたのは、弱教師付き学習という研究です。普通、教師付き学習の問題を解くときには、ラベルが付いた、教師情報の付いたデータをたくさん集めて学習しますが、弱い教師情報だけからでも学習できないか、ということがこの研究の狙いでした。
 本当は少ない教師情報から学習したいですと言いたいんですが、統計的にはそれは無理である一方、弱い情報はたくさんあります。弱い情報はたくさんあって、それがあたかも強い情報と同じぐらいの性能を出しますというようなことを理論的にちゃんと保証しようということでいろいろやってきていました。一応、幾つかの問題設定では本当にうまくいくということが理論的にも証明できまして、例えば、音声の雑音除去に去年使ったのですが、通常、雑音除去器を学習するときには、同じ信号のクリーンなものとノイジーなものを両方用意して、パラレルなデータを用意して雑音除去器を学習することになります。しかし、これは実世界では取れないので、人工的なノイズを足したりとかしてやるとあんまりうまくいかないというのが問題でした。我々は、分類問題で、普通は正と負のデータが要るところを正のデータとラベルなしデータだけからでもちゃんと学習できますというPU学習というのがあるのですが、その理論の研究をずっとやっていました。それをこの問題に使うと、そのままうまく使えるというのが分かりまして、何をやるかというと、正のクラスは雑音だと思うんですね。
 雑音のデータは、適当にマイクを置いておけばただで取れます。ラベルなしデータのほうは、雑音が混ざった音声です。これもどこかにマイクを置いておき、そこでしゃべれば自然に取れますので、特に苦労しなくてもたくさんPとUのデータは集められるのですが、それだけから信号と雑音を分けることができ、非常にうまくいくということで昨年発表しました。
 こういう研究を1つ、それなりにうまくいったものがあります。もう一つ、昔から興味を持っているのですが、転移学習という話題です。訓練データとテストデータの分布が違うときに、どうやってその違いを吸収するかということで、古典的には京大の下平先生が2000年に書かれた論文にて、共変量シフトという問題設定が提案されていました。これが入出力のデータがあるときの入力の分布だけが変化するというような感じで、右側の回帰の絵ですと、左側からトレーニングのデータが出てきていますが、右側の黒いバツのテストデータを当てたいみたいな外挿っぽい問題が共変量シフトに対応するのですが、2006年当時に、NIPSと呼んでいましたが、ワークショップをやったりしまして、名前がなかったのでLearning when Test and Training Inputs Have Different Distributionsという長い名前になっていたのですが、こういうワークショップをやったり、18年前にやったりしていたのですが、その後、このワークショップの本を出しました。
 当時、DATASET SHIFTという名前にしました。この本、あんまり売れていないのですが、なぜか最近、引用数が2,000件くらいに伸びていまして、なぜ売れていないんだろうというのが少し疑問です。どうやってこういう設定で学習するかといいますと、普通に損失を最小化するのではなく、損失に重要度という確率密度の比率を掛けます。いわゆる重点サンプリングをするだけですが、テストとトレーニングのデータの密度の比率を掛けてやるとちゃんと補正できるという話にすごく興味を持っていて、15年ぐらい前、いろいろなアルゴリズムや理論を作ったりして、本を書いたりもしました。
 これが古典的な話だったのですが、この話題が最近、リバイバルでまたブームになってきまして、NeurIPSでこの3年間、ワークショップが開催されています。名前はDistribution Shiftsに変わりました。また5年後、10年後に別の名前で入るのかもしれませんが、我々、当時は何か重要度をどう推定するかということにずっとこだわってやっていました。重要度の重みと予測器を同時に学習しているともっと精度が出るということは昔から分かっていたのですが、そのやり方が2000年頃に分かり、時間とともに分布がどんどん変化していくようなときにオンラインで適応していくような連続分布シフトという研究をしたり、何でもありのXとYの同時分布が変わってしまいますというのも、対応できるアルゴリズムを作ったりしていました。あと一番新しいのが、分布外適応です。本当にトレーニングデータがないところにテストデータが出てくるのは、どうしようもなさそうな気がするのですが、一応、ある設定の下ではちゃんと解けるということを示したりしました。
 ここ三、四年ぐらいでもこの分野は発展しまして、こういった技術を作っていきたいなということで、この流れで、かなり主観的な研究テーマですが、無仮定機械学習というのをやりたいと思っています。
 モチベーションの話をできればと思いますが、これまでは仮定を置いて学習理論を作ったり、アルゴリズムを作ったりということをしてきました。当たり前と言えば当たり前ですが、その仮定の下で予測がすごく当たりますよ、ということを保証していました。その仮定が正しければうまくいくことが証明できますが、正しくないときは保証できないという感じの研究スタイルが多かったかと思います。その状況だと、実際に使うときは、仮定がよく分からないから、とりあえずやってみよう、データはあるからやってみようとやって、うまくいったらラッキーで、駄目だったらまた別の方法を使いましょうという感じで、どうしても理論と現実のギャップができてしまうというのが常に悩みでした。
 もちろん、仮定を緩めていきましょうという研究はずっと進んでいますが、それを一気に減らしていきたいと思っています。できるかできないかというのは、特に議論はしていませんが、なるべく仮定を置かない弱いアルゴリズムを作りたいです。仮定を置かないと強いアルゴリズムを作れないので、大した性能は出なくてもいいので、安全で信頼できるものを作りたいと思っています。その1つの例で今考えているのが、この前出てきた弱教師付き学習と先ほどの同時分布のシフトが連続的に起こるというのを全部混ぜたものを考えると、ほとんど仮定を置かなくてもいいことになります。分布も変わっているかもしれませんし、教師情報もありませんが、しっかり使える方法が、多分、理屈上はできそうという雰囲気になってきています。
 それがすごくうまくいくことを期待しているわけではありませんが、大失敗はしないことが保証できます。そうすると、現場で機械学習のアルゴリズムを使うときは、最初はデータもほとんどなく、社員3人ぐらいでデータを取ってやってみましょうみたいな状況だと思います。そのため、最初のPoCのようなレベルだと、こういう方法を試してみて、最低限動くなということが確認できれば本格的に予算を取って、投資してデータを取ったり、より高度な方法を作るということができるようになっていくかと思います。ほぼどんな場面にも使える非常に緩い方法を作ることが技術の発展とか普及には今後必要になってくると思っていますので、こういうことをまずやってみたいというのが、これまでの研究成果を生かした次のテーマとして考えています。
 もう少し発展させていきたいと思っているのは、今はChatGPTなどがあって、みんなが使っている状況ですが、みんなで同じシステムを使うということは、やや不自然という気がしています。それを個別化したり、タスクごとに特殊化したりということを、今もう既に起こっていますが、みんながやっていたとします。
 そうすると、各自がAIシステムを持っていて、ユーザーとAIシステムがインタラクトすることになりますが、それが時間とともにどんどん発展していくことになりますが、新しいニュースが起こったりすると答えも変わってきますし、システムも変わっていかないといけませんので、時間軸で発展させていくということが必要になります。今度は、人あるいはタスクはたくさんあり、AIもいろいろなバリエーションができてきますので、AI同士でコミュニケーションをとって学習したり、抑制し合ったりというようなこともできるかもしれません。さらに、人もたくさんいますので、人間同士もつながって悪いことを結託する人もいるかもしれませんし、いろいろな可能性があります。人と、ユーザーとAIのインタラクションだけではなく、AI同士やユーザー同士のインタラクションも全て考慮したような大きな系を考え、その社会全体で最適化していくことができれば、いろいろな使い道が見つかるのではないかと思っています。
 そういった観点から、学習の効率性とか信頼性は当然必要になりますし、そのシステムがざっと説明できるようなものであることが理想的です。また、意思決定が公平に行われていて、通信などが安全に行われているという保証も必要かと思いますので、いろいろなこれまでの情報技術の粋を集めてシステムを作っていくことができるのではないかと思っています。
 次に、本当にどんな研究をやるのかというのをいろいろ考えたのがこのページなのですが、あんまり細かいところは言いませんが、基本的にはそんなに新しいことを書いているわけではないのですが、こういったものをしっかり理論保証を持って、可能な限り弱い仮定の下で実現していくということを、全部のピースを埋めていって組み合わせてやれば、すごく強い仕組みができるのではないかという気がしますので、原理解明のこの基礎研究をやっていきたいと思っています。
 最後に、避けては通れない人材の話、研究テーマとは直接関係ありませんが、今、日本の研究の国際的な競争力がすごく限定的だということが言われています。私も周りを見ると、日本人の博士の進学者がほとんどおらず、研究室は留学生ばかりというような状況になっています。博士の支援に関しては、今かなり充実してきていると思います。私の周りのドクターの学生さんはそれなりに給料というか、奨学金をもらっている人が多いので、そんなに悪い状況ではないと思いますが、マインドとしてタイパの悪いことはしたくないんですよね。研究なんかするよりも、あるものを持ってきてパパッと使ったほうがもうかるわけです。なので、ここは支援を改善するところではなく、そのマインドを変える部分が必要だという気がしています。そこに解はないのですが。
 この博士学生の不足がポスドクの研究員がいなくなったり、教員の候補もいなくなったりということが、すでに実際、大学で今起こってきていますので、いよいよ大学教員も、外国の人を採用するという時代になってきています。なので、この先、日本語を使わなくてもいい大学みたいなものが、もしかしたら伸びるかもしれないという気もしています。少子高齢化ですので、日本人の学生がこれから激増するということは考えられないでしょうし、頼みの留学生も少子化がいろいろな国で既に起こってきていますし、経済安保の問題もあったりしますので、10年後はどうかと言われると、少し微妙という気がしています。
 では、社会人の再教育は、ということで、学会でイベントをやったりもしたのですが、これもやはりタイパです。社会人としては、今やっている仕事の延長で博士号だけ取れれば給料が上がるしオーケーみたいな感じで、研究をやりたいわけではない人が多いなという感じです。あるいは肩書が欲しいだけ、みたいなのがあり、ここもマインドが変わらない限りは、大学の先生的な立場から見ると徒労に終わってしまうという気がしています。女子学生の情報系進学をさらに支援しようということは、我々も最近頑張っているのですが、やって満足して終わっているというのが正直なところです。でも、これはもう続ける以外の選択肢はないと思いますので、どんどんやっていく必要があるかと思います。
 実際の論点は、女子学生そのものではなく、親御さんや、小中高の進路指導の先生、あるいは予備校が、理系の女子には医学部に行きなさいと言ったりしますので、そこへの働きかけが重要かなという気がしますので、ここは研究者よりももう少しシステマティックに何かできるといいのかなと思っています。私の分野を見ていると、世界的に目立っている若手の先生や、中堅ぐらいの先生がいると、そこのスターの先生の周りに国際的に優秀な人たちが集まってくる傾向があります。私も理研のセンターをやっていますが、その中でも最近何人か、売れてきた人たちがいるのですが、彼らのところは大人気です。海外からもインターンや、ポスドクの応募が山ほど来るんです。
 そうすると、本当にいい人だけを、上澄みを取れるので、またそういった人たちがどんどん伸びていくというので、ロングテールといいますか、ものすごい差が開いているなと感じてきています。でも、日本としては生き延びる道はそれしかないという気がしますので、スターを育てるしかないと思います。各大学、数人でも構わないので、その分野の世界的なスターを育成して、その周りに優秀な人、その人をコアに集めてくるというような、かなり偏った予算配分とか、人的資源の配分になると思いますが、全分野平等に、全員平等に、では残念ながら竹槍を100本持ってきても、すごい人1人には全然勝てない状況ですので、ちょっと過激な言い方になりますが、誰かいい人を見つけて、その人に集中投資するという施策が必要なのではないかと思っています。
 そのときに日本人が、と言っているわけでは実はなく、海外の人で、日本で働いてくれる人がいれば、その人を日本の組織で雇用して活躍してもらえばいいのではないかと思っています。でも、実際にそれは難しいので、クロアポかなという気がしますが、海外のいいところに所属しているが、日本のおいしい食事と安全な環境は魅力的ですねという人に夏の間、3か月だけどうですかというポジションを大学や国研が出せれば、日本は今、大人気ですので、どんどん来てくれるのではないかなという気がします。これは、制度の改善で何とかなる側面だという気がしますので、こういったところで日本人の数が少なくなり、競争力が減っていっているところを補っていくということで生き延びられればいいかなと思いました。以上で終わります。
【辻井主査】  どうもありがとうございました。
 議論は尾形委員の御発表が終わった後、まとめて行いたいと思います。尾形委員、よろしくお願いします。
【尾形委員】  早稲田大学と、総研でもお世話になっております尾形です。基本的に自分のいろいろなところでお話ししているので、特に研究については、ここにありますけれども、この話はしません。これがバックグラウンドというか、気持ちになるのですけれども、今、生成AIですねと言っていて、昔だったら、僕のことを聞いても答えられなかったものでも、RAGも使っているんでしょう。非常に精度よく、最後に僕のことを褒めてくれたり、すごいことを言っているんですが、さらにマルチモーダル化するというのも自然な流れということです。
 では、これをみんなどう思っているんだろうかといったときに、こういう写真を使っているからみんなに配付しなかったんですけれども、まあ、後で配付してもいいのかもしれませんが、いわゆる、ハサビスさんがこういうことを言っている。触覚が要るんだという話。そういう流れもあるのかないのかということですけれども、いろいろなロボットが作られている話になってきますが、ロボット屋さんから見ると、ディープラーニングというキーワードが出てきた、いわゆる国際トップカンファレンスのキーワードになったのは2017年で、比較的後です。それまでもなかなか、入ってくるにしてもビジョンの範囲が多かった。
 それはハードというのが1つ大きい壁になっていたのだろうなと思っているんですが、それがだんだん学習でいけるのではないかという流れが出てきています。身体を考えるということは、もちろんロボットがよく動かせるようになるということはあるのですけれども、同時にロボットを動かすときに考えなければいけないことはたくさんあるということになり、特に僕が、いわゆる今のラージランゲージモデルがしゃべっていて気になるのは、どうも現実と虚実がよく分からないといういうことです。いろいろ計算させてみて答えを出しても、それは絶対嘘だろうと言い続けると、いつか折れるという、折れちゃいけないところを折れるような気がしていて、どういうところが、いわゆる現実と虚実を分けているんだろうかということを考えたときに、いわゆる心頭滅却すれば火もまた涼しと思ってしまっていいかどうかです。
 人間は、徹底的にやると、それができてしまいます。即身仏というか、座禅を組んだまま死ねちゃうんですが、やはり死んでしまうというのは1つ大きい問題です。今、現実の世界での自分の存在というものが、物理的な身体に支えられているという事実は、いろいろなマルチモーダルというのは何で統合されるべきか。マルチモーダルってもともと統合されているわけですけれども、それは身体を通じているから、もともと統合されるに決まっています。それだけではなく、身体をもって存在するということが絶対視されるような世界観で生きているということが必要です。
 なので、ロボットや自動運転に入れましょうといったときに起きるミスというのは、言葉を間違えるのとちょっと違うよねと思うのは、やはりこの現実というところを意識できるからです。どうやったらいいかは分かりませんが、そういった身体的なものを考えるということが、研究としては、かなり身体の存在によって不可避になるということがこういうところの研究につながっているとか、こんなことになってきたという話になっていると思っています。
 日本のロボットがないというのは、よくニュースで騒がれますが、20年ほど前までは、逆に日本のロボットしかなかったぐらいに人型ロボットというのは、一応、日本のお家芸でした。しかし、二十数年前は、もちろんディープラーニングも何もないです。だから、当時、歩く、走る、転んでも起きるとか、一通りできるようになっていたんですが、物は見れないし、しゃべれないですし、認識もできないので、実際にサービスロボットとして使うには、限定的で「人型ロボット、使えるよね」というイメージは、日本の研究者とロボットの研究者は持っていないところがあります。
 それが逆に今度、アメリカ、中国が作り始めてきているときに、いわゆる経験値は、日本はすごくたくさんあるんです。もちろん今でも作っている産業用ロボットの台数だけで見れば1位ですし、使った経験値というのもたくさんあります。そういう意味では、こういう分野に入りやすく、また、ロボットの知能を考えるというのも、実はいろいろできるのではないかと思っています。データを集めればいいという考え方があるとして、重要なのはもちろんデータですけれども、こういうRT-1、2、Xみたいな考え方があります。それはそうですが、実際、データはどう集めるべきなのだろうかというのは、実は結構難しい話です。例えば、これは確かにすごい大ニュースにはなりましたが、すぐに産業用ロボットに使えるんですか、という話には多分なりません。。
 例えば、いろいろなロボットがあったときに、今、RT-Xとか、RT-1、というものでやっているのは、基本的にエンドエフェクタがどこに、手先がどこに行き、どのようにピックアンドプレーするかや、押す、引っ張るという話なんです。もちろん作業の結構な部分をそれでかけるというのは分からなくはないんですが、物のつかみ方って必ず上からつかむわけでもないですし、双腕協調なんていったら話がいきなり変わります。それから、自分の身体をどういう自由度、つまり、サイズも含めてですけれども、やわらかさとか、そういうのも含めると切りがありません。
 実を言うと、このエンドエフェクタを動かしてピッキングするとすると、今のラージランゲージモデルにいきなりプログラムを書いて、今、あなたのは、こういうロボットです。関節、全部教えてあげて、それで、こういうふうに手を、タスクをしたいと言うと、それをやるプログラムを吐いてくれます。つまり、わざわざロボットにデータを集めなくても、言語で身体のイメージを持っているので、それでできてしまうところも十分あります。でうが、なぜ身体が要ると思っているかというと、言葉にならないところも多くあり、例えば、ひもの結び方と言われると相当難しいです。ビジョンでもなかなか難しく、料理で、いつの間にか何かグツグツ煮込んで、かき混ぜているのでも、かなり無意識にやっていて、難しいところがあります。
 つまり、データを集めること自体には意味がある。最近は、模倣学習のような、人間のスキルをロボットに直接教え込もうというような研究も大分増えてきています。ここで面白いなと思うのは、大体、双腕になっていることです。今までは難しいと思われていたことをやれるようになってきていて、我々、タオル畳みとか昔からいろいろやっているんですけれども、ある程度できます。見てお分かりになると思いますが、今年とか去年です。最近、いきなり増えてきたのですが、それはそれでいろいろできると思っています。
 そのときに、できないこともたくさんあるということです。我々もやってみて分かるんですが、学習させられることは、今まではできるはずないと思っていたひも結びとか、意外とできてしまうのですが、できないことも実は結構あります。それは研究ネタなので言わないですが、できないことがいっぱいあるというときに、何かよくできる振りをしているよく分からないものみたいなことになる。なので、もともと学習をさせるときに、たくさん集めるのはもちろん大変ですから、何をどう集めてくるのだということは考えなければいけません。そのときに僕の基盤に持ってくると、カリキュラム学習と言えばいいんですけれども、発達みたいな考え方が要ります。
 つまり、基盤というけれども、それは複雑なデータを片っ端から集めることではなく、やはり何を学習しておけば次の学習がしやすいかということに対する理解であり、それが忘却なのか、発達なのかというところもまた、一度覚えていたものが消えてまた表れるUG発達なんていうのは有名なプロセスですが、そういったものもちゃんと考えていかなければいけないのではないでしょうか。言語というのを考えるときに、言語モデルを今、積極的に、一方的に使わせてもらっている立場ですが、言語モデルを使うときにも、そのマルチモーダルな情報を積極的に組み合わせるみたいな話があってもいいと思っています。発達ロボティクスというのは非常に特殊な言葉ですが、これは日本発祥でございまして、といっても、今、予算がメインで落ちているのはヨーロッパのほうなんですけれども、こういう研究がありました。
 つまり、我々ロボット屋さんから見ると、1歳になるくらいの赤ちゃんがやることは、大抵のロボットのスキルをもう超えるんです。運動スキルの発達の仕方はものすごいけれど、最初は何もできていなかったはずなのにというところが非常に興味としてあります。まさにこういうプロセスとして、先ほど原田科学官の説明にもありましたけれども、データをどういうふうに、自分が能動的にどうやって動いていくかということが重要だと思っています。
 我々だけが言っているわけではないということです。このHausmanさんは、さっきのRTプロジェクトのGoogleの人です。その人がこう言っている、こういうRTのモデルを書きながら、こんなことをチャットしている。もう知っている方にとっては釈迦に説法かもしれませんが、猫の視覚野の発達において、自分が能動的にビジョンを変更できる猫と一方的にデータだけ与えられている子では、こっちは結局、何も獲得できませんよと言っています。つまり、感覚は与えられるものではなくて、自分の行為で作っていくんだというセンスが、実を言うとその発芽というのも、実は発芽するから生えてくるし、見るというのも、見るから見えるわけであって、見えないものは見えないんです。
 行為と運動との関係というのを積極的に考える。それはロボットではなくてもいいかもしれませんが、そういった方向性が自分の今の興味ですし、学習したモデルを、ただ学習をするというだけではなくて、学習したモデルが推論する。推論というのは、行為も含めて推論するというのを能動的推論というふうに僕らは呼んでいますけれども、そういうようなプロセスというのが必要になるのではないかと思っています。これで終わりにしたいと思います。どうもありがとうございました。
【辻井主査】  どうもありがとうございます。
 何か刺激的なお話を2人からいただいて、質疑応答やコメントがあれば、お願いいたします。
【杉山委員】  尾形委員に質問です。最後の発達の部分が非常に面白かったのですが、日本が国際的にリードしている分野なんですか。
【尾形委員】  コンセプトを最初に出したのは間違いなく日本で、そういう発達プロセスについてのモデリングや、そういうこともいろいろやっていたんですが、基本的に非常に大きい発達ロボティクスや、赤ちゃんのロボットみたいなプロジェクトはヨーロッパで始まりました。
【杉山委員】  アカデミアのプロジェクトですか。
【尾形委員】  そうです。全く役に立たないと思われる赤ちゃんロボットをヨーロッパの人たちはたくさん持っています。それはIIT、イタリア製です。日本にも1、2台あるのですが、そういう意味では、なかなか継続的には、当時、もちろんすぐに役に立つという研究ではなかったので、ただ、ああいう発達の会議とかでやると、やっぱりディープマインドの人とか、空気的ノットとかするんです。だから、怪しいなと思われているというレベルだとは思っているんですけれども、今はまだその段階だと思って、ロボットでいろいろやれるうちにそういうコンセプトをどんどん入れてやりたいと思っています。
【杉山委員】  ここはまだ日本が行けそうな分野の1つですね。
【尾形委員】  と思いたいです。あとは、やはりカリキュラムとか、そういうところを考えていくときに、僕らはやはり理論的なところはまだまだ弱いなと思っています。破滅的忘却って普通に食わせると、あっという間になってしまうのですが、そこが継続的に学習できていかないと、そもそも生物らしくないんです。先生の話もいろいろ入れて、僕、ワールドモデルとか、実を言うと、共分散シフトをうまくごまかすために作っているモデルだと勝手に解釈しているんですが、その辺いろいろまた御相談したいんですが、理論的なバックグラウンドも入れて認知の人たちとの話をくっつけるということがやれたらというか、そうしなきゃいけないフェーズに来たのかなというのを少し思ったりします。
【杉山委員】  ありがとうございました。
【村上委員】  今杉山委員がお話しされていた日本の強いところというのは、私、最近すごく興味を持っていて、自分が今国の仕事をしているというのもありますが、世界的に今すごく進んでいる中で、今から参戦してもという話に若者も含め、みんななっていると思います。どういったところが、勝ち筋と言うとあまりよくないと思うんですけれども、日本の強みになるのかというのはすごく興味があるところです。
 例えば、私は前の会社がアメリカの会社でしたけれども、絶対的に言語処理というのが、英語話者よりも英語じゃない話者のほうが強かったんです。それはなぜかというと、単言語しか深く知らない人と必然的に英語をやらなくてはいけない人と二言語という系統をグラマーという観点で見ている人とやはり強みが違っているという印象があって、そこら辺が多分、日本という国の強みを探すきっかけの1つになるのかなというのが最近考えていることです。
【辻井主査】  人工知能というのを余りにも人間と近づけないで考えたほうがいいという立場と、人間の模倣物を作るという立場があります。ロボティクスの話を聞くと、人間にどんどん近づこうとしているという感じがします。
【尾形委員】  それは多分、僕を呼んじゃったからだと思います。必ずしもそうではない先生もたくさんおられると思います。現実の世界で、人間ができないことをやれる、例えば、すごい精度を出すとか、そういう半導体の表面をきれいに、ウェハーをきれいにするというのは人間にはできないので、日本が実を言うとロボット強いというのは、実はあっちのほうなんです。精度がすごく出る、スピードがある、パワーが出せるという、そういうロボットで、必ずしも人間らしい、生物らしいロボットという指向性で、それはどちらかというと亜流です。
 ただ、我々としては知能といったときに、最終的に我々とコミュニケーションしなければいけないということを考えるならば、その価値観や、その世界に対する認識も僕らに近いほうがいいのではないかと思っているという立場です。そこはいろいろな考え方があっていいのかと。
【辻井主査】  言語をやっていると特に人間から離れられないということで、人間は意識するんですが、もう少しAIというのは、一般的な技術としていろいろなところに使われていく。人間の知能というのをモデルとして考えるのはいいですが、そこから出てきた技術的なコアというのは、組合せ方によっては、ほかのAIのほうに行くようなAIジェネリックな技術が出てくるといいなと思いながらいつも聞くんですが、人間にあんまり近付き過ぎてもどうなのか、擬人化する危険性というのはあるでしょう。
【尾形委員】  辻井主査がおっしゃった、評価基準をどう決めるかというのが難しいという話に結局なっていきます。数字基準にして、そこでパフォーマンスを出してもらうのも大事ですが、まさに倫理を考えないとまずいみたいなことがあるので、ここに行けば行くほど少し人間っぽくなっていく気もします。そこら辺が、バランスがすごく難しいといつも思っています。
【辻井主査】  なるほど。脳型というのもそうだと思うんですが、脳を見て、こうすればエネルギーが少なくてできるという技術に持っていくやり方と、脳にどんどん近づいていきましょうというやり方があります。そういうことがロボティクスのほうにもあって、人間をモデルとして考えているロボティクスが出てきた技術が、積極的に分からない部分のデータを取りながら学習していくような一般的な理論という方向に行く可能性もあります。それは必ずしも人間と同じような形のロボットではないという、そういうAIというのは、もう少し広い技術の領域をカバーしているという感じがしています。
【尾形委員】  さっきの後ろが全部、人型ロボットというのは確かに違和感があります。
【辻井主査】  そうです。
【尾形委員】  確かに、ソリューションが1個じゃないと思います。
【杉山委員】  先ほどの村上委員のお話ですが、日本が強い分野は何かというのは、知ることは重要だと私も思っています。さっき、スターを育てたいというご意見がありましたが、何もないところにスターは出てきませんので、それなりに歴史なり、組織なりが整っているところではないといけないかなという気がします。主観的に見ると、私の周りでは理論計算機科学とか時々すごく尖った人が個人でいたりするので、ああいう分野は国際的にちゃんと注目されるような人が一定数いるのかなと思ったりしますが、これなんかシステマティックにサーベイできないでしょうか。
 例えば情報系だと、国際会議もあって重要ですので、例えばチェアをやっている人や、ベストペーパーをとっている人、プレナリートークをする人でもいいですが、そういう人が日本から何人ぐらいいるかというのをリストアップしてみると、少なくとも、その人は国際的に認知されていて尖った人ではあります。あと、その周りでちょっと調べてみれば何人かいい人が出てくるかもしれませんし、何人かいい人が見つかったら、その分野は、日本は割といけているぞということになります。ということが何かできないでしょうか。
【村上委員】  ぜひ文科省の方に。
【杉山委員】  日本の強い竹槍はどこにあるのかというのをまず、自分たちの戦力を分析して検討すべきではないかと思います。
【辻井主査】  難しい感じがあります。言語処理に関して言うと、日本の経済力が非常に高かったときは、日本語のステータスが結構高かったです。だから、日本の研究は、それなりに注目される状態になっていました。今だとアラブ系の言葉がものすごくやられているし、中国語はまた出てきています。だから、逆に日本の存在感というのが低くなってしまっています。そういう意味では、日本の持っている強さというのは、割合と難しくて、産業の強さというのと絡んでいるという感じもします。だから、学問の世界だけ切り離して日本の強いところというのがなかなか議論しにくいなという感じはしています。
【国分参事官】  JSTのノウハウの中で、アカデミックな観点からの強さみたいなものを量的に導き出すようなノウハウがあったらいいと思いました。
【福島フェロー】  定量的にどうにか、という話は最近よく来ますが、情報分野ではなかなか難しいところがあります。通常のジャーナルで評価しにくいという話もたくさんあるので、今、CRDSやNISTEPでも、そういった議論は出てはいますけれども、方法論としてまだよく定まっておらず、逆に本当にこういう面をきちんと評価して競争力につなげるには、現場の先生方から御意見を聞いて、実態に合った分析をしないと。
【杉山委員】  すごく客観的な評価指数を作りたいわけではなく、いい人をただ見つけたいだけですので、それなりに主観的にではいいのではないでしょうか。
【辻井主査】  かなり主観が入ると思います。そこで客観的な指標を入れちゃうと、また歪んでしまいます。だから、今おっしゃられているみたいに主観でやるしかないかもしれません。
【国分参事官】  ただ、いずれにしろ、この会議そのものがそうやって、どういう分野、領域をターゲットに戦略分野にしていくかということを御議論、フリーディスカッションの中で導き出していくのも目的の1つだと思うので、まさにいろいろな先生の御意見というのをインプットいただきたいとは思っております。
【辻井主査】  それでは、5月1日の17時までに事務局までコメントや質問があるというのを出していただいて、議論を続けていけたらと思っています。口頭の議論そのものは、6月中旬の第3回目の会合でまたやりたいと思います。
【国分参事官】  御意見をいただくのはゴールデンウィーク前の5月1日までで締め切らせていただきます。そのフィードバックは明けた後にいろいろ御議論させていただきたいと思っていますので、その前提でお願いします。
【辻井主査】  はい。分かりました。
 それでは、今日の議論はここまでにしていただきまして、御意見については、メールにて事務局のほうに連絡してください。それでは、事務局から、よろしくお願いします。
【植田補佐】  事務局でございます。本日は貴重な御意見、御議論いただきまして、ありがとうございました。最後、お時間がなくなってしまい、大変申し訳ございませんでした。辻井主査からございましたように、本日、御質問や御意見等ございましたら、5月1日、17時までに事務局までメール等でお送りいただければと思います。本日発表いただいた皆様はもしかしたら質問等あるかもしれませんので、ぜひ御対応のほどどうぞよろしくお願いいたします。
 次回検討会につきましては、既に御案内しておりますとおり、5月14日、火曜日16時から18時を予定してございます。
 事務局からは以上でございます。
【辻井主査】  それでは、これで今日は閉会とさせていただきます。次回もどうぞよろしくお願いします。
 

お問合せ先

研究振興局参事官(情報担当)付

(研究振興局参事官(情報担当)付)