AI for Science推進委員会(第1回) 議事録

1.日時

令和8年2月9日(月曜日)16時00分~18時00分

2.場所

文部科学省東館17階 局1会議室 及び オンラインのハイブリッド形式

3.議題

  1. AI for Science推進委員会の設置について(非公開)
  2. AI for Scienceに関する令和7年度補正予算及び令和8年度当初予算案について
  3. AI for Scienceの推進に向けた基本的な戦略方針の方向性について(一部非公開)
  4. その他

4.出席者

委員

川原主査、相澤委員、合田委員、牛久委員、大上委員、桂委員、北野委員、小長谷委員、泰地委員、高橋委員、丹波委員、津田委員、松岡委員、溝口委員、横山委員

文部科学省

淵上 研究振興局長、坂下 大臣官房審議官、俵 大学研究基盤整備課長、阿部 参事官(情報担当)、轟木 参事官補佐、伊藤 科学技術・学術政策局参事官(研究環境担当)付 参事官補佐

オブザーバー

赤池 科学技術・イノベーション推進事務局参事官(統合戦略担当)、水井 参事官補佐、寺岡 総務省国際戦略局技術政策課長、戸佐 外務省経済局経済外交戦略課主査、中村 外務省経済局経済外交戦略課主査、福田 経済産業省商務情報政策局情報産業課AI産業戦略室企画官、永野 科学技術振興機構研究開発戦略センターフェロー

5.議事録

【轟木補佐】  事務局でございます。ただいまよりAI for Science委員会の議事を公開いたしました。よろしくお願いいたします。
【川原主査】  それでは、議事(2)に移ります。AI for Scienceに関する令和7年度補正予算及び令和8年度当初予算案につきまして、事務局より御説明お願いいたします。
【阿部参事官】  資料2を御覧ください。令和7年度補正予算及び令和8年度当初予算案についてということですが、めくっていただきまして、1ページ目になります。予算全体としましては、4つの柱としておりまして、左上にありますとおり、AI駆動型研究開発の強化というもの、それから右上にあります自動・自律・遠隔化による研究データ創出・活用の効率化というもの、そして左下にありますとおり、AI for Scienceを支える次世代情報基盤の構築というもの、そして右下にありますとおり、世界を先導する戦略的な産学・国際連携という柱にしてございまして、資料、右肩にありますとおり、令和7年度補正予算額としては1,143億円、さらに関連経費を含めますと1,527億円となってございまして、令和8年度予算額、予算案としましては193億円となってございます。
 以下、この項目に基づきまして参考資料を入れておりますけども、それぞれの内容につきましては後ほど御説明します基本的な戦略方針の中で説明したいと思いますので、こちらでは説明を省略させていただきます。
 以上です。
【川原主査】  ありがとうございます。ただいまの御説明を踏まえて、御質問、御意見などありましたら挙手にてお知らせください。
 よろしいですかね。
 それでは、続いて議事(3)に移ります。AI for Scienceについては、各国でも戦略が策定されるなど強力に推進されているところ、文部科学省において今年度中にAI for Scienceの推進に向けた基本的な戦略方針を策定すると聞いております。事務局より説明をいただいた後、委員にて意見交換をしたいと思います。
 それでは、事務局から御説明をよろしくお願いいたします。
【阿部参事官】  資料3を御覧ください。まず、これまでの検討状況を御説明したいと思いますので、一番最後、77ページ目を先にめくっていただければと思います。昨年、令和7年の5月にAI法が成立したところですけども、その後、ここに記載のように、文科省の審議会、学術分科会や情報委員会等々で議論を進めておりまして、文科省事務局のほうでは有識者100人以上の方にもヒアリングをしながら検討を進めてきたという状況でございます。
 そうした状況も踏まえまして、今回、この委員会での議論を深めていただくために、全体の方向性の案という形で、議論に資するような形ということでお出ししている資料になります。
 戻りまして、2ページ目を御覧ください。冒頭から全体の概要のイメージと記載しておりますが、ここでちょっと全体像をまずつかんでいただいた上で、各項目の御説明をしたいと思ってございます。
 資料上にありますとおり、第7期科学技術・イノベーション基本計画が、4月、来年度から開始されるというところでございますが、現状認識という記載の中には、AIと科学の融合による研究開発パラダイムの転換、そして第2章の中では、AI for Scienceによる科学研究の革新というものが掲げられているという状況でございます。
 また昨年12月に閣議決定されましたAI基本計画におきましては、信頼できるAIの追求、世界で最もAIを開発・活用しやすい国を目指すと、こうした大きな方向性が示されています。
 また、海外に目を向けますと、各国におきましては、AI for Scienceを国家的ミッションと位置づけ、研究投資、計算基盤整備、人材育成等々を強化しているという中で、科学とビジネスが近接化しておりまして、勝者総取りの構図が出てきていると認識しております。
 科学的発見のプロセス自体が、学際的、データ駆動型、計算集約型へ大きく変化しているというところが見受けられるところでございます。
 他方、日本のことを考える際には、まず強みというところで、情報基盤、研究基盤、社会基盤の3つがあるのかなと捉えておりまして、まず情報基盤のところは、情報流通基盤、研究データ基盤、計算基盤、これがひとつ世界と比べたときにも強みとして言えるのではないか。
 また、研究基盤におきましては、世界トップレベルの基礎科学力や多様な研究者層、世界最先端の研究装置群であったり、大型研究施設があるということ、さらには信頼性の高い実験観測データの蓄積というものがひとつ言えるのかなと思います。
 それから社会基盤としましては、経済規模もさることながら精密な製造・計測技術・ロボティクス、さらにはすり合わせや暗黙知等の現場知、そしてAIに対する社会的・産業的な需要もあるというところがひとつ言えるのかなと考えております。
 こうしたことを背景としながら、政策的な目的というのを3つ書いてみたものでございます。科学研究の革新と科学的発見の加速・質の変革、2つ目が研究力の抜本的強化と科学の再興、3つ目が、国際的優位性・戦略的自律性の確保としておりますが、これを具体的な取組目標として書いているのがオレンジ色のところでございます。
 科学基盤モデル/エージェントやAI駆動ラボの活用により重要技術領域の先端的成果創出及び研究開発期間を10分の1にというものをひとつ書いてございます。
 さらに今後5年間の目標というところでは、AI for Scienceの推進により日本の科学研究における国際優位性の確保ということが挙げられるのかなというところで記載しています。
 さらにここだけだと具体的なイメージが湧かないというところありますので、具体的なターゲットの例ということを3つ記載しております。
 1つ目が、3年後までに、新素材開発速度10倍の潜在力を有するAI駆動ラボシステムの開発。2つ目が、3年後までに、大規模なデータ取得を通じて、高機能なバイオ製品の高効率設計を実現するバイオ生成基盤モデルの開発。3つ目が、AIエージェント群による最先端大型研究施設・研究装置から大量・高品質データの産出や、仮説検証・実験の自動化・自律化を実現といったことがひとつターゲットの例として考えてみたというところでございます。
 これら具体的に取り組むイメージは、左下にありますとおり、トップを伸ばすという世界最先端の科学研究成果の創出というところで、上を伸ばしていくところと、横を伸ばす、AI for Scienceの普及・振興によって科学研究力の底上げを図っていくということ、これを両輪としてやっていく必要があろうということと、さらにそれを支えるための基盤をしっかりと構築するということが不可欠だろうと捉えておりまして、具体的な取組としては、多分恐らくこの3本柱だろうというところで、1つ目、研究力・人材、そして2つ目、計算資源、3つ目、研究データということで記載をしているというところでございます。
 こちらが概要、全体的なイメージになりますが、以降、次のページにありますような目次に沿って説明をさせていただければと思います。
 まず「はじめに」というところで、簡単に御紹介となりますが、AIの急速な進展によりまして、研究開発の在り方が歴史的な転換期を迎えているだろうということで、AIが科学研究の在り方そのものを変革しつつあり、あらゆる分野の研究活動を根底から変え得るゲームチェンジャーとなっているというところでございます。
 またAIは、多様な社会課題への対応に不可欠な社会インフラになりつつあるということで、AIをいかに開発・活用できるかが、国家の競争力及び持続的成長を左右する重要な要素になっているのではないかと。
 そうしますと、AI研究開発力が科学研究力に直結する状況になってきていると捉えることができ、研究活動におけるAI利活用、AI for Scienceの成否が我が国の国際競争力における優位性確保の鍵となっているのではないかと。そのため、AI for Scienceを国家的、国家戦略と位置づけ、計画的かつ集中的に推進していくことが不可欠ではないかと。
 そうしたことから、この戦略におきましては、第7期科学技術・イノベーション基本計画期間である今後5年間において、我が国の強みを最大限に活用したAI for Scienceの先導的実装を通じて、科学の再興を実現し、国際競争力の確保・強化を図ることを目的にAI for Scienceを国家戦略として体系的に推進するための基本的方針を示すという形で位置づけてはどうかということで記載しております。
 5ページ目から総論の部分になりますが、6ページ目、背景のところを御覧ください。こちらではまず国際情勢というところで、世界各国においてAIを中核とした科学技術戦略の高度化が急速に進展しているという状況の中、研究の高度化・高速化が国家主導で推進されております。AI for Scienceの活用なくして国際競争に伍していくことが困難な状況にあると捉えております。
 国内では、第7期基本計画がこれから始まろうというところ、そして昨年5月にはAI法が成立して、12月にはAI基本計画が制定されているという状況でございます。
 そうした中、下の喫緊の課題というところでございますが、我が国がこの潮流に十分に対応できなければ、将来的な技術的優位性と不可欠性を失うのではないかというところで、スピード感を持って政策を展開していくことが求められているのではないかというところで、AIを活用した科学研究及びAIそのものの研究開発への取組を抜本的に増強するということ、そして産学官連携を通じた科学とビジネスの好循環を創出し、AIイノベーションを持続的に推進していくことが不可欠ではないかということを記載してございます。
 7ページ目が国際動向の御紹介になりますが、各国、今、AIを重要な技術を位置づけて国家戦略を整備しておりまして、昨年、2025年にはアメリカ、EU、イギリス等々でAIに関する様々な計画等が発表され、特に11月には、この吹き出しのところですけども、アメリカにおいてはGENESIS MISSIONというのが出されまして、10年間で米国の科学研究及び技術革新の生産性と影響力を2倍にするという目標が掲げられています。
 また、イギリスも11月にAI for Science Strategyというものを出されておりまして、15の具体的なアクションとともに、最初のミッション、1つ目として、2030年までにAIを活用して試験開始可能な薬物候補を100日以内に創出するといったような目標が掲げられております。
 8ページ目を御覧ください。その他各国のAI戦略に記載されている重点分野を並べたものでございます。御参照いただければと思います。
 9ページ目を御覧ください。日本の強みというところ。冒頭申し上げたとおり、繰り返しになりますので、省略しますが、情報基盤、研究基盤、社会基盤、そういったものがある中で、一方で、少子高齢化・人口減少等が進展する課題先進国であるというところも現状として捉えなければならないところだと認識しております。
 10ページ目を御覧ください。特にデータのところに関しまして、日本が強みを有すると思われるデータセットの例ということを記載しております。データの量だけでなく、中核機関に蓄積されているキュレーション等に係るノウハウや人材といったものの強みだろうということ。それから、AI for Scienceが加速可能なのは、AI向けデータが充実している領域であったり、自動実験等でAI向けデータを戦略的に取得可能な領域ではないかということでここは記載してございます。
 11ページ目を御覧ください。日本の課題というところでまとめております。研究力・人材のところにおきましては、分野・組織の垣根を越えた連携だったり、信頼できる、信頼されるAIの開発ということがあるのではないか。
 それから、計算資源のところにおきましては、AI for Science時代に対応した新たな計算基盤の構築が必要ではないか。
 研究データにおきましては、散在するデータの一元的な把握とアクセスの確保であったり、またデータの秘匿性等を踏まえたオープン・アンド・クローズ戦略を進める必要があるのではないかという点。
 それから、横断的課題・ガバナンスのところでは、継続的な資金投入の確保であったり、研究インテグリティ・セキュリティ、それからリスクへの対応、さらには改革のスピード感、こういったものが重要な課題ではないかと考えております。
 12ページ目を御覧ください。政策的位置づけというところでありますが、第7期の中の位置づけもさることながら、安全・安心で信頼できるAIのエコシステムの構築、こういったことを念頭に利活用と技術革新の好循環を具体化していく、そういった基盤の構築が必要だろうと捉えているところでございます。
 13ページ目を御覧ください。日本の現状を少し資料をまとめているものですが、ランキング等におきましては、日本は10位ぐらいにいるということ、それから計算資源量や投資はここに記載のような状況だというところでございます。
 こういった背景等を踏まえまして、14ページ目に政策としての今後の方向性(目的)というものを少し書いてみたものでございます。方向性としまして、AIを活用して科学研究を根本から革新し、AIによる研究パラダイムの転換と科学技術立国としての戦略的自律を図るというところで、研究環境をAIで革新する、研究システム・プロセスをAIで変革する、研究の在り方そのものをAIで革新していくんだという中で、2030年代には例えば自律性と信頼性を備えた研究国家として確立していくというような方向性がひとつあるのではないかと考えております。
 具体的な政策的な目的は3つ掲げております。科学研究の革新と科学的発見の加速・質の変革。2つ目が、研究力の抜本的強化と科学の再興。3つ目が国際的優位性・戦略的自律性の確保ということで、こちらは冒頭申し上げたとおり、右の三角形の上の部分と裾野を広げる部分、これを両輪としてやっていく必要があろうと捉えております。
 15ページ目を御覧ください。先ほど申し上げました政策的な目的に対して、具体的な目標、そして具体的な手段というものを書いてございます。
 目標としましては、研究力の強化・人材の確保、そして2つ目が、AI for Scienceを支える研究基盤の構築としておりますけれども、手段としては、大きな柱として3つ、研究力・人材、計算資源、研究データ、ここが柱として考えなければならないところだと捉えております。
 16ページ目以降は各論となってございます。17ページ目に基本的な取組の考え方というものを整理してみたものでございます。一番上の段になりますが、日本が取るべき基本的な戦略としては、日本の資産とリソースを最大限に活用し、勝ち筋となり得る分野等の研究力を世界トップ水準に引き上げるということと、3つ目のポツにありますが、日本の勝ち筋となる先導的分野等において、先駆的取組の早期実装を通じ、世界最高水準に引き上げるとともに、次の種や芽を生み出す萌芽的・探索的な研究、これを並行してやる必要があるという点。それから、AIそのものの研究もしっかりやる必要があるという点。そして人材もあらゆる層で育成・確保を加速する必要があるということを記載してございます。
 この辺りをイメージとして書いたのが18ページ目になります。説明上、下のマル3から御説明しますが、国としてしっかりとAI for Scienceを支える次世代情報基盤を構築していくと。そして、その上に、右上になりますが、研究システムの自動・自律・遠隔化による研究データの創出を高効率化していくということで、データをしっかりとつくっていくと。そしてそれを、左上になりますが、各分野でAI駆動型の研究を強化し、そして成果を出していく。これ全体がサイクルが回っていくというような将来像が必要なのではないかと捉えております。
 19ページ目を御覧ください。今申し上げたようなところを項目別に並べましたところ、マル1から5ということで、研究、人材、データ、基盤、体制というところで項目立てをしておりますが、以降のページはこの項目立てに基づいて説明しております。ちょっと資料厚いところありますので、説明は少し省略するところありますが、めくっていただいて、20ページ目を御覧ください。まず研究の部分でございます。
 こちら各国が戦略的にいかにリソースを使っていくかということを考えているところでございますが、当然日本でも、限られるリソースをどう活用して戦略的にやっていくのかということが課題というところでございます。
 こういった中、21ページを御覧ください。このたびの補正予算におきましては、新しいファンディング事業を開始することができたということで、AI for Scienceによる科学研究革新プログラム、こちら370億円が措置されておりまして、ここをこれから強化していこうとしているところでございます。
 この中2つございまして、22ページ、まず1つ目、プロジェクト型、3年間の基金事業がございます。こちら、狙いとしましては、1つ目、野心的ターゲットの達成を目指す取組ということをやっていこうということと、国際トップリーグへの参画を目指す取組をやっていこうということを現在検討しているというところでございます。
 23ページ目を御覧ください。もう一つのプログラムとしてチャレンジ型というところになりますが、人文学・社会科学を含むあらゆる分野でAIを普及・振興させていこうということで、こちらも三角形にありますけども、トップ層よりもう少し下の層、AIに関心があり、今後AI活用に研究加速を考えている層、少しノウハウが足りないけど、これから本格的にやりたいと考えていらっしゃるような、そういった研究者の方々を対象に、1件当たり500万円程度を年に2回公募をすることで、1,000件程度を採択し、迅速的な支援、伴走支援、そして芽を出していくような、そういった支援をここで試みたいと考えているものでございます。
 具体的なイメージは24ページ目にありますが、眺めていただければと思います。
 それから25ページ目、人材のところでございます。文部科学省でございますので、様々なプログラムがございますが、AI関連人材の育成・確保であったり、また、研究者の育成に対してここに記載のようなプログラムが今文科省にはございまして、こういったプログラムと研究開発の取組を一体的に捉えて強化していくことが必要かなと考えているところでございます。
 それから26ページ目を御覧ください。データのところでございます。研究データの取扱いについては非常に重要だということを各方面から御指摘いただいているところですけども、オープンサイエンスの潮流を踏まえ、AIモデルの学習・開発に係るデータセットや開発したAIモデルは原則公開だろうというところではございますけれども、他方で、ここに記載のような輸出管理であったり、個人情報保護等に関連するような、こういった法令、ガイドラインでの取扱い制限があるものであったり、産業活動や安全保障の観点から秘匿管理すべきものといったものもあるということにはよく注意する必要がございまして、オープン/クローズド、この方針をしっかりと事前に調整しながら進める必要があろうということ。
 また、国のほうでは、「公的資金による研究データの管理・利活用に関する基本的な考え方」であったり、「研究セキュリティの確保に関する取組のための手順書」なども策定されており、また内閣府等々でもデータのところについては議論がなされておりますので、そういったところを十分踏まえながら対応していく必要があろうかと考えております。
 27ページ目、こちらデータの基盤というところでございますけれども、28ページ目を御覧ください。補正予算で新たな取組が始まるところでございますが、まずオートメーション/クラウドラボというところでございます。補正予算で42億円措置されておりまして、これから公募が始まっていこうというものでございますが、大規模集積研究システム形成先導プログラムということで、今後、プログラムの審査委員会において詳細を検討し公募を行っていく予定としております。
 本日の議論におきましては、AI for Scienceを全体として推進していく中で、他の事業と相乗効果を発揮する観点から、連携の在り方、留意すべき点等について、この辺りについても御意見いただければと考えております。
 具体的なプログラムの骨子については29ページ目に記載しているようなところでございまして、全体の構築、研究データの創出・活用、そして人材育成、そして運営等について骨子をつくっているところでございます。
 それから31ページ目を御覧ください。先端研究基盤刷新事業、EPOCHと呼んでいる事業でございまして、こちらも補正予算で530億円措置されておりまして、基金事業としてこれから公募が開始されるものでございます。
 今後の公募に向けまして、研究開発基盤部会等で事業の詳細について検討中のところでございますが、研究データの扱いにつきましては、特にAI for Science推進委員会における審議決定内容とも連携して進めていきたいと考えているところでございまして、ここについても幅広く御意見いただければと考えております。
 イメージは32ページ目にありますので、眺めていただければと思います。
 それから少し飛びまして、35ページ目を御覧ください。次、基盤というところで、計算資源のところになります。やはりAIの研究を進めようと思いますと、計算資源、不可欠なものでございまして、各国が今、この強化を強力に進めているという認識でおりまして、日本においても共用計算資源の増強、アカデミア、民間の計算資源の利活用に向けた取組を強化する必要があろうかと考えております。
 36ページにありますとおり、今回補正予算で76億円措置しておりまして、まず特会となるところから、できるところから始めようということで、この公募も今始めたところでございます。
 37ページ目を御覧ください。こちらも基盤のところになりますが、研究データの基盤になります。データ、大量にこれから研究データが創出されてきますので、これをしっかりと保管、保存、管理していくということが必要になりますけども、やはり大量のデータですので、人の手で行っていくのは現実的ではないということで、AI対応可能な形で研究データを保管、管理していく仕組みをしっかりと構築していく必要があろうということで、NIIのRDCという仕組みをAI時代に即した形で今後高度化していこうということを考えてございます。
 こちらにつきましては、39ページ目にありますとおり、こちらも補正予算で、まず先行的なニーズの調査研究であったり、メタデータの不要機能を強化していくといったことの取組を始めていくという段階にございます。
 それから40ページ目を御覧ください。基盤のところで、流通基盤というところになりますが、こちらにつきましては、青字のところですけども、AI for Scienceを支える研究データの管理・利活用と流通の在り方について早期に検討するということで、文科省の情報委員会の下に、41ページにありますとおり、ワーキンググループを今設けまして、議論を開始しているところでございます。
 それから42ページ目を御覧ください。体制というところになります。こちらにつきましては、43ページ目のように、当推進委員会を文科省に設けたところでございますが、文部科学省として、AI for Scienceを推進に向けた基本的な戦略方針を3月末までにつくっていくということを始めているところでございまして、また世界各国を見渡したときに、やはり戦略的な国際連携は非常に重要な点だということで、国際共同研究の推進、こういったことも大きなテーマの1つということで捉えているところでございます。
 それから44ページ目は、第7期基本計画、それから基本的な戦略方針等々の全体的な位置づけを整理したものでございます。
 45ページ目を御覧ください。国際連携・協業の考え方ということでございますけれども、やはり世界トップと、日本の研究力を上げるためには、世界トップレベルの研究機関、研究者と一緒にやっていくというところが非常に重要だということで、国際連携をいかに進めていくかということは大きな課題なんだと捉えているところでございまして、先ほど御紹介しました370億円、320億円の基金事業、こういったものを活用しながら、効果的に国際共同研究、こういったものを進める必要があろうと捉えているところでございます。
 46ページ目、御参考ですけども、アメリカとの間におきましては、2024年の4月に文部科学省とアメリカエネルギー省、DOEとの間で事業取組をしておりまして、既に理化学研究所とアルゴンヌ研究所のほうでMOUが締結されて様々な取組が開始されているということでございます。
 47ページ目を御覧ください。アメリカのGENESIS MISSIONについて記載しております。冒頭御紹介しましたとおり、アメリカのほうでは10年以内にアメリカの研究とイノベーションの生産性・影響力を倍増させるんだというところで、ここに記載のような何日以内にこういったものを出していくんだということが具体的に述べられているところでございまして、20件程度のリストをこれから発表していこうということも記載されていたということでございます。
 これに関連しまして、48ページ目を御覧ください。1月27日に発表したところでございますけれども、文部科学省におきましては、AI for Scienceの推進等を含めまして、アメリカのDOEとの協力を一層強化していこうということで、今回、文科省、DOEの間で協力のための意見表明ということで、SOIを署名し、発表したところでございます。
 49ページ目を御覧ください。イギリスのほうのAI for Science Strategyというのが11月に発表されております。15項目の中から成るアクションが示され、またミッションとして1つ掲げられているというところでございます。
 それから50ページ目を御覧ください。産学連携の考え方というところを記載しております。こちらもサイエンスとビジネスが非常に近接化してきている中で、どういうふうに産学連携をしていくのか。恐らく、今、AIが進む中で、大学やアカデミアに求められる役割等々が変わってきているのではないかというところがありまして、そういった中からデータの戦略も含めてどう産業界と連携していくのかということはひとつ大きな課題としてあるのではないか、検討課題としてあるのではないかということで考え方の整理をしていきたいなというところで記載しているものでございます。
 それから51ページ目を御覧ください。今後の検討事項等、ここにつきましては、この推進委員会等での議論を踏まえまして今後整理していきたいと考えております。
 最後、52ページ目になります。説明長くなって恐縮ですけども、「おわりに」ということで、こちらも現時点で取りあえず書けるところを書いたというところでございますので、今後の検討を踏まえて修正していく部分ではございますけれども、特に下から2つ目のポツのところにございますが、今までの議論、様々なところで検討したことを踏まえますと、ここに書いてある4つ、マル1、研究者の創造性を中核に捉えていくということ、2つ目、研究基盤を共通資産として整備・運用していくということ、3つ目、分野横断及び国際連携を前提としていくということ、4つ目、倫理・信頼性・透明性を確保するということ、この辺りが多分基本的な方針としてしっかりと認識していく必要があろうかなと捉えているというところでございます。
 ここまでが説明少し長くなって恐縮ですが、以上説明になります。以下、参考資料、たくさんついておりますけれども、議論する際に眺めていただければと思います。基本的なAI for Science何ぞやであったりとか、また60ページ目以降は、これまで文科省のほうで幅広く意見交換をしてきた、ヒアリングを行った際の概要を入れておりますので、これまでどんな議論が出ていたのかということに参照いただけるために入れておりますので、眺めていただければと思っております。
 説明は以上になります。よろしくお願いいたします。
【川原主査】  ありがとうございました。AI for Scienceといいますと、現在のAIの進展を見ると、サイエンスにAIが使われないわけがないというような状況だと思っています。今回御参画いただいている委員の皆様も、既にサイエンスに何かしらAIを利用するというので、先駆けて取り組んでおられる方がたくさんいらっしゃいます。また、AI for Scienceのためのインフラであったり、データであったり、これをどう整えるかというのも御経験の皆様がいらっしゃると思います。一般にはまだAI for Science、何にどう取り組んでいいのかというコンセンサスがない状況だとは思いますが、そういった先進的な取組をされている皆様だからこそ気づいているようなこともたくさんあろうかと思いますので、国としての大きな目標に向けて何をすべきか、ぜひ忌憚のない御意見をいただければと思っております。
 まず、公開ということで、50分弱、5時半過ぎ頃までセッションを、公開としての意見交換を行いたいと思います。御発言の際は挙手にてお知らせいただければと思います。どうぞよろしくお願いします。
 いかがでしょうか。
 付け加えて言いますと、50分程度の意見交換の後、非公開でも意見交換を予定しておりますので、適宜、場を区切っていただければと思います。
 北野委員、お願いします。
【北野委員】  
ありがとうございます。AI for Scienceは、勝者総取りになる分野ということで、十分な予算を積極的に確保いただきありがとうございます。
 AI for Scienceという言い方をすると結構幅広いのですが、幾つかのレイヤーがあります。割とよくあるのは、科学者、研究者が使うAIツールをたくさんつくるというものです。これは、AlphaFoldのようなものが出てきますので、もちろん重要です。これによる生産性の向上はサイエンティストのクリエイティビティがボトルネックになりますが、これは、やらないと仕方がありません。
 さらにアグレッシブに行くと、AI as a Scientistがあり、これは、AI自体が科学者になるので、自律的に研究をどんどん進めてくれます。このレベルになると、知識の獲得、Knowledge Graphの生成、仮説生成、実験の自動化、検証まで全てのループが自動的に行われることになり、生産性は10倍、100倍となってきますし、人間ではできないことができます。
 例えば、私が昨年9月にTED Talksに登壇した際に出した図があります。何年か前のデータですが、約4万のヒトゲノムのうちの、1万6,000に関しては論文が出ていません。他にも7,000ぐらいに関しても論文は1本しか出ていません。最近の論文をランダムに100個取ってきても、96%以上はTop10遺伝子で、半分ぐらいは論文が出ていないというのが現実です。なぜ、出ないかというと、みんな成功したいし、貢献したいので、重要と思われる遺伝子や重要と思われるところに行くわけです。重要と思われないところはあんまりやらないことになります。やらないところが重要ではないというと必ずしもそうではなく、実は重要だけど、ヒューマンバイアスで取り上げられにくい場合というものもあります。これは人間にとって命とリソースが有限である以上、重要と思われるところに行くのは当たり前のことで、これを克服するためにAIとロボティクスを使うことは非常に合理的だと思います。
 そうすると、AI、ロボティクスを使うことは、ただ単にサイエンスにAIを導入することではなくて、サイエンスの在り方自体を変えていくということになると思います。私のラボはそういった観点で、全プロセスのAI、ロボティクス化を進めていますが、幾つかのレベルがありますので、その辺の解像度を上げた議論ができれば良いと思います。
 例えば実験の自動化では、様々な実験のプロトコル、種類があるので、どのくらいカバーして、どのマイルストーンでやるのかということを、システマティックにやるのか、それともボトムアップにやるのかということは大きな政策上の意思決定のひとつになってくるのではと思います。
 加えて、データの共有をどのくらいするのか、もしくはしないのかも、各研究者の成果としてどのタイミングで出したいか等の意向もあるので、これもまた次の大きな意思決定になると思います。できれば実験装置から得られたデータは全て自動でクラウドに上がると良いですが、実際にはUSBなどに記録して、その中から後で選んでクラウドに上げているということが現実だと思うので、これをどのように実現・運用するかもまた非常に大きなことです。
 AIの学習にはチャンピオンデータだけでなく、ネガティブデータも必要です。そのため、全てのデータをメタデータと一緒にクラウドに上げ、機械学習ができるようにしたいです。そうすると捏造もできなくなりますので、非常にポジティブですが、やり方が大きく変わるので、皆さんが安心してそれができるようにしていくことが非常に重要なポイントになってくると思います。
 加えて、適用領域をどこにするかが1つのポイントになると思います。AIには世界中で、ものすごい資金が流れ込んでくるので、同じ領域で10倍の資金を使っているところに対抗しても、恐らく勝てないと思います。そうしたときに、日本がパワープレーできるところはどの領域になるかです。また、創薬やマテリアルなど、パワープレーできないが、やらないわけにもいかない領域をどういう作戦でやっていくかも考えていかないといけません。例えば、海洋生物学といったところは、恐らくパワープレーができると思います。他、食もパワープレーができると思います。そういったところをやったときに、一見すぐにハイインパクトな応用がなさそうに見える場合にどうやって理解を得ながら、つなげていくかということは恐らく作戦を考えなければいけないと思いますし、政策的に意思決定をしないといけない重要なポイントはたくさんあると思います。
 もう一つは、実行体制の仕組みが意思決定と関係がない構造ならば意思決定しても効果が見込めません。それは分かっている人が自分のお金でやれば良いという話になってきます。国の政策として決まり、そういう意思決定が要らない、または、影響がないのであれば、そこに時間を使う必要は恐らくなく、皆さん、各々やったほうが良いという話になります。その辺の全体像を確認することを早い段階でできれば良いと思いました。ありがとうございます。
【川原主査】  ありがとうございます。では、お願いいたします。
【合田委員】  ありがとうございます。今北野委員おっしゃいましたデータの扱い、私も痛感しておりまして、私自身、研究データ基盤の整備に関わっておりますけど、多くの研究者はデータを出すモチベーションを持てていないと思います。特によい成果につながるデータを出したいんだと思うんですけれども、そうでもないデータは出すモチベーションが少ないですね。これは1つは技術的に強制的に実験装置から吸い上げるというような方法もあるんですけども、それだけでは駄目で、やはり研究者が自分のデータを出す、共有させることが自分の研究実績につながるような世界をつくらないと駄目で、分かりやすい言い方をすると、データを出したらいい論文書いたのと同じぐらいの実績として認められるというところも併せて考えていかないと、なかなか技術的な解だけでは難しいなと考えております。以上です。
【川原主査】  差し支えなければ、成功例とか、簡単に紹介していただけますか。
【合田委員】  成功例……。恐らく分野によっては、例えばゲノムの世界では、論文出すときにデータ上げないと査読してもらえないとかあると思うんですけれども、それはまだまだ少なくて、ほとんどの研究者はデータを取るなりつくったら、それを自分のサーバーに置いたところでとまっちゃうんですね。理由は2つあって、1つは、データを実験装置から、それこそUSBを使うこともあるんですが、持ってきて、そこに置いて、論文を書くまでというパターンもあれば、そこに来て力尽きてしまう。言い方悪いんですが、力尽きてしまって、そこから先それをさらに共通の基盤に持っていって共有しようというところまでなかなか考えがいかないというところがあるかと思います。
【川原主査】  DXなどで改善できる余地があるかですね。
【合田委員】  DXとともに研究者のマインドを変えるというところが重要だと思います。
【北野委員】  その問題は以前からあり、そういうデータをパブリッシュしたら、マイクロインパクトファクターのようなメカニズムで一定の成果として評価しようという話はありました。あるヨーロッパの大きなパブリッシングカンパニーがトライするような議論はありましたが、残念ながら全く機能しませんでした。メジャーなペーパーに出るところだけが評価されるため、マイクロインパクトファクターは、トライしたけれど、機能しなかったので、もしかしたら強制的にデータをクラウドに上げるしかないかもしれません。ここは非常に難しいポイントだと思います。
【川原主査】  牛久委員、お願いします。
【牛久委員】  今のは非常に重要なお話だと思っていて、そういうふうなデータセットも込みで、多分今後パブリケーションの性質が変わってくるのだと思っています。例えばマシンラーニング分野ですと、ソフトウエアとしてその動作が再現できるものが公開されるかどうかって非常に重要になっていて、いい精度が出ていますよという研究よりも、簡単にそれが再現できますよという研究のほうが何だったら重視されるぐらい、そこのゲームが変わってきていると思います。
 ということを考えるに、例えばAIやロボットを駆使して再現できる研究であると。そのデータが公開されているということが、論文として人間が読み書きできるメディアであることと同等以上の価値を持ち始めるのじゃないかと考えていて、ただ問題としては、さっきのお話にまさにあったように、じゃあ何を評価しますかと。産業としてはまだいろいろなことを企業として考える余地があるんですけど、アカデミアとして考えたときに、それが結局論文誌、ジャーナルに出した本数ですよってなってしまうと、結局そこのところで皆さんジャーナルにどれだけ出すか、インパクトファクター幾つかということに結局拘泥せざるを得ないというところで、ここは国としてこういった委員会を組織してやる以上、そういったような人事評価の在り方にまで踏み込んだような話をできないと意味がないのかなと思っている。これがアカデミアの側面として思うことです。
 もう一つ、インダストリーとして思うことがあって、今回の資料3の中でAIロボット協会を取り上げていただいていて大変ありがたいなと思って、10ページのところで。私はそちらの理事も末席を汚しているので、一言だけちょっと申し上げたいなと思うんですけど、これ、何もただで公開しているわけじゃないんですよね。会員の企業というのが、会員の団体、法人か、法人というのがいて、そこから会員費を頂きながら、そして、そのデータであるとか、それ以外のリソースを頂きながら、一緒にデータ集めて、そこの中でAIロボットの基盤モデルを開発して、会員の企業には、まずそちらを優先的にお配りします。それ以外にも、公的な営みとして公開させていただく基盤モデルだったりデータだったりがありますということで、インセンティブ設計をさせていただいています。
 さらに、AIロボット協会のほうですと、かなり年会費として、企業が参画いただくときには高額の年会費を頂いているということが、実際のデータをいただきますとか、そういうところ以外にも発生をしていますし、一方でデータをいただくときには、ちゃんとそれに対する対価をお支払いするということをエコシステムとして回しています。
 ですので、やはりそういったようなエコシステム、産学連携してという話、いろんなところに文言として出ておりますけど、本当にデータセットをこうやって共有していくところを増やすのであれば、そういう制度設計込みでないと、やっぱり基礎研究、研究のための予算だけでやるというのはなかなか持続性が難しいんじゃないかなと思っております。
 以上です。
【北野委員】  成功例の1つとして、臨床治験が挙げられるのでは。全データが出ますので。
【川原主査】  先に手を挙げておられた横山委員、お願いいたします。
【横山委員】  ありがとうございます。ちょっと今の話の続きでコメントと、あと新しい点を少しお話しできればと思うんですが、今のお話の続きで言いますと、やはりデータを共有するようなリポジトリを国としてきちんと御用意いただくというのは非常に重要だと思います。人社の分野でも、どこにアップすればいいのかというのがやっぱり大きな問題になっていまして、今ですと、EUのオープンリポジトリなどが候補に上がってくるような状況で、日本国内でそれをシェアできるような環境が十分に整ってないというのがひとつ問題だと思います。
 あと、先ほどからの話で、データをシェアするメリットが研究者側にないというお話なんですが、例えば私の研究所、物理と数学の研究所に人社の私がいるんですけれども、天文学の領域ですと、1年がたつと全てシェアをするという、そういうルールが、同じ望遠鏡という装置を使っているということが基盤にあるという状況ですが、一般化されていまして、後から再解析をしていい成果を上げるようなグループもたくさんありますので、そうした分野、違う分野ではそういう成功例もあるんだということをちょっとシェアしておきたいと思いました。
 あと新たな論点としては、私も生成AIが出てきてから論文の書き方というのがどういうふうに変わってきたのかというのに興味を持ってずっと見ているんですけれども、23年から24年に関して大きな変化が出てきていまして、23年頃は、非常に皆さん、ライティングをするということに使うことについては非常に消極的に慎重だったんですが、24年、25年と非常に多くの人がそれを受け入れ始めているという状況がございます。多くのジャーナルが、生成自体は禁止だけど、リライトはいいよと言っている状況なんですが、この辺をある程度、国として、研究公正の観点からも統一的な見解を出しておくとよろしいかと思った次第です。
 併せて、やはり教育の現場でどれくらい自分で手を動かしてできるのか、あるいは生成AIを使っていいのかというところも、大学ごとのそれぞれの状況によって異なる状況ですので、この辺も分野ごとに概観ができるようになると大変助かるのではないかと思った次第です。
 以上です。
【川原主査】  ありがとうございました。それでは、津田委員、お願いいたします。
【津田委員】  これから多分新しいソフトウエアをつくったり、新しいデータベースをつくったら、AIエージェントとして発表することになると思います。AIエージェントをどこかポスティングしているサイトとかに上げると、LLMがあって、そのLLMが勝手に検索して、必要な知識を自分で集めてきて使うという形になるんじゃないかなと思っているし、今でもそういうことはできなくはないんですね。その結果、いろんな他分野の知識を使うということが非常に簡単になるので、新たな分野がどんどんできてくるみたいな、そういう展開が予測されるかなと思います。
 そこで問題なのは、日本で今、エージェントがホストするところがないんですね。例えば日本企業が何かしようと思ったら、海外にデータを投げたりしないといけない状況なので、ちょっとこれは問題かなと思っています。そこを整備するというのは非常に大事なことかなと思います。
 以上です。
【川原主査】  ありがとうございます。泰地委員、お願いいたします。
【泰地委員】  まずデータの件なんですけれども、僕もAI for Scienceのプロジェクトを始めたときにいろいろ議論して、いろいろみんなが取ってくるデータを集めてきてやるというのももちろん大事は大事なんだけれども、結局、特定の目的に沿って取られたデータというのは結構バイアスがあるし、それで、我々のほうは、そういうところやめて、とにかくAIのためにデータを取るということをしようということに考えてやっています。やっぱり今後の数年ですかね、取りあえずここ数年のことを考えると、AIのためにどういうデータを取ってこれるかというのを押さえるほうが結構大事で、データを集めてくるというのもやればいいんですけれども、ちょっとそれは少しむしろプライオリティーは落ちるんじゃないかなと考えています。
 モデルのホスティングについてはもちろん同感で、我々のほうで、今、AI for Scienceスーパーコンピューターの仕組みを準備していますけれども、なるべくそういうところに対応できるように検討していきたいと考えておるところです。
【川原主査】  AIのためにデータを取るというのは、分野にもよる部分があると思うんですが、具体的にはどういうところでそういう話が進んでおられるんですか。
【泰地委員】  例えば我々のところは、ライフサイエンスのほうだったらば、例えばトランスクリプトームのデータをかなり網羅的に刺激を与えて取ろうとか、あとは、マウスを、何かよく分からないけど、生まれてから死ぬまでずっと見とこうとか、あんまり物すごく特定の目的に沿って取るというよりは、そういう感じでなるべく網羅的なデータを取ろうというふうなことを進めています。
【川原主査】  ありがとうございます。先に手が挙がっておりました相澤委員、お願いします。
【相澤委員】  相澤です。2点、まず研究データについてですけれども、AI-readyなデータの重要性はもちろん言うまでもないと思いますけれども、AIを使っていかにデータを利活用するかという観点から見て、例えば私たちが言語モデルをつくっている経験からすると、圧倒的に文脈に当たるものが足りていない点が課題になると思います。これはオープン/クローズド戦略とも関係しますが、具体的には例えば装置の設計書ですとか、装置のマニュアルといったものは、ほぼクローズドな領域にあって上がっていないなどです。AIのためにデータを取るということは、単にデータベースの中にメタデータつきの研究データが入っていますということを超えて、どういう装置からどういう条件で取られてきたのかというもっと広い意味でのメタデータの取り方というのが求められているということも感じています。
 確かにオントロジーという形で様々な装置や実験プロセスに関する記述をそろえていきましょうという動きもありますけれども、実際問題としてそういうデータはあまり公開されていないので、AIにとって使うことが非常に難しくて、単にデータだけでなく、実験環境についても、どこまで公開して、どこまでクローズドで、さらにクローズドにされたものも活用していくという観点で議論を深めていく必要があるところではないかと感じています。
 もう一つ、先ほどお話がありました、研究者のAI利用に関するところですけれども、査読におけるAIの利用を含めて、論文執筆におけるAIの利用、あるいは評価におけるAIの利用についてウオッチをしていますと、やはり利用の仕方というのはもはやAIを使った、使わないというふうなやり方で簡単に分けられるものではなくて、あらゆるサイクルで細かくAIを使っていくので、そのプロセス自体をどうやって検証していくのかという非常に難しい問題となっているのを感じます。最近は、私の近い分野である言語処理ですとか、深層学習のトップの会議では、サイテーションの誤りですとか、細かな記述の誤りが調べてみると最近増えているという、そういう報告がこの12月、1月あたりに幾つか出て注目を浴びています。そうしたところにAIの影響は出ていると指摘されていますし、あるいは研究を発表したときに論文をエージェント化しますとなったときに、いかにそのエージェントが正しくふるまうかを検証するデータセットをつくるかとか、なども課題です。そういったところも含めて、最先端の技術を集結して、研究そのものの信頼性ですとか、在り方の変革を見据えていくということも重要ではないかと考えております。
【川原主査】  ありがとうございます。桂委員、お願いいたします。
【桂委員】  ありがとうございます。私は10年間ただ日本の科学にもっとどうやったらAIが普及していくかという、そのためのロールモデルの研究はどうあるべきかと思って研究を進めてきたんですけれども、特に材料科学はデータが、実験データがないってすごく言われていたので、どうやって実験データを集めるかというところからスタートしておりました。
 資料の14ページにすごく大事なことが書いてあると思ったんですけれども、AIが2030年代になったら研究の自然な一部として活用される環境とか、日本の研究者はみんなAIをよく使っている、それが当たり前という文化を根づかせるにはどうしたらいいかが重要だと私もすごく思います。その左側に研究の在り方をAIで革新するとか、研究環境を刷新するとか、AIを導入する準備プロセスがあるんですけれども、これを日本の研究者の人口の大部分に行わないと2030年代の目標が達成できないと思うんですね。
 そうすると、最先端のデータ研究を行う人だけではどうしても人口がカバーし切れない。それぞれの人はそれぞれ自分の分野に誇りを持って自分のやり方で研究をやっている。なので、その人たちの研究をみんなデータ化するという最初の耕す作業が必要になると思っています。
 データのオープン/クローズド戦略というのがあったんですけれども、クローズドのデータを無理やり出させるというのはどうしても研究者にとってストレスの大きいものです。これを公開して上司に怒られたらどうしようとか、会社に怒られたらどうしようとか、やっぱりそういう不安の中で無理なことをやらせるのは苦痛になってしまいます。だから私はまずは最初のデータは公知データでやるべきだと考えて、分野ごとに論文でデータベースをつくる。ただし、その論文のデータベースは、自分たちが集めている実験データと同じものを中心的に集めると。そうすると公知データで学習したプログラムができて、それがいいAIになったとしたら、ほかには見せない自分たちの大事なデータで同じものを突っ込んで、自分たちしか得られない結果を得ると。それがほかとの差別化になるし、何十年も会社とか研究室で積み重ねた情報資産を自分たちのために生かすということにもなるし、過去の人たちがやってきた仕事をリスペクトすることだと思っています。
 なので、私として何とか支援していただきたいのは、最初のデータセットをつくるという研究者への支援です。それが例えば予算配分とかでできればいいんですけれども、データセットをつくって、みんなに使ってもらえる形にする。そのための形を考えた。そういう研究者がAIの研究の初期段階ですごく評価されるべきだと思っています。それをやるというのが各分野で当たり前になると、いつしか、若手かもしれないんですけれども、その分野のリーダーがそれを行った研究者になっていって、その人が率いる形でデータの研究がそれぞれ育っていくという形になるので、まだデータ化の仕方が分かっていない分野でもデータ化をしていくという人材を支援してほしいなと思います。
【川原主査】  ありがとうございます。それでは、高橋委員、お願いいたします。オンラインの高橋委員、お願いします。
【高橋委員】  ありがとうございます。いろいろデータのお話がありましたけれども、常日頃から思っている、日本が強みになれるところはどこがあるんだろうと、データのことで、考えていることについて少しお話し申し上げたいなと思いました。
 10ページに先ほどお示しいただいた、私は地球観測とか、地球環境とか、それから災害とかというところにおります関係上、DIASとか、BISMaLとかある、前職はJAMSTECにおりましたので、こういうものをつくってまいりましたけれども、やはり日本が、日本のトップクラスのデータというものは何なのかと考えますと、ここに書いてある例えばd4PDFなんていうのは非常に先駆的なデータでございまして、今、やっと10年ぐらいたってから非常に世界的にも評価されているデータベースでもございます。
 これはどういうことかと申しますと、極めてトップレベルの科学がトップレベルのデータを大量に出すことができたということに尽きるのではないかと思います。それがデータとしてのかなりの強みになるし、データとしての価値が非常に高いものになるのではないかと思います。
 つまり、どういうことかと申しますと、ちょっとこれ、クローズドなデータが対象になってしまうかもしれませんけれども、クローズドをどういうふうにオープン化するかということは確かにあるんですけれども、極めて高い、科学的に高い価値があるようなデータを出すためには、今までにないような観測と、それから例えばシミュレーション、計算かもしれませんけれども、そういうものを掛け合わせるような形、もしかしたら医療ですと、ロボットと、それから観測、データみたいな、そういった人体観測かもしれませんけれども、そういったものを掛け合わせて、誰でもそうかもしれません、実験と観測ということで、そういうものを掛け合わせることによって、大量の質のよいデータを世界に先駆けて出すと。データセットとして出せるか、出せないかというところが恐らくデータの価値というものを決定づけるのではないかと思います。
 ですので、ぜひ、全部が全部というわけにはいかないかもしれませんけれども、極めて先駆的な観測をしている、あるいは実験をしているところと、それからそれを大量に精度よく出すという、その知見が得られるような、そういった組合せの研究方法、科学のデータ、科学データを蓄積する方法というのをぜひこのプロジェクトの中に入れていただいて、そういう若手だったり、異分野融合というふうなことは簡単でございますけれども、そういう人を探し当てるというところに1つのポイントがあるのではないかなと常日頃に思ってございますので、ぜひそういうところも含めて、オープン/クローズとか、いろいろとどんなふうに皆さんに使っていただくとかということはあるかもしれませんけれども、データセットの非常に価値が高い強みというところがそこにあると思いますので、それができさえすれば、日本は必ずAIを使うということに関しても、非常に新しい、あるいは、ほかの国に負けないようなことが割合まとまった期間内に実現できるんじゃないかなと思いました。
 以上でございます。
【川原主査】  ありがとうございます。牛久委員はこれ補足か何か。
【牛久委員】  ここで押しておいたほうがいいのかなと思って、押してみましたというだけです。お任せします、順番は。
【川原主査】  直近のコメントに対するあれでしたら、今ぜひお願いします。
【牛久委員】  ありがとうございます。すいません、データの話と、あと、表裏一体で恐らく人間の研究者がどういうふうにAIで研究をするシステムと関わるのか、インタラクションするのかというお話になっているかなと思いまして、2点申し上げたいと思います。
 データの強みというときに、1つは、そのデータを生み出すときに、例えば、すごく大きな加速器使わなきゃいけないとか、すごく巨大な計算基盤を一定時間動かさないといけないとか、そういったようなファシリテーションに起因する強みというのがあると思いまして、そういう意味ですと、今、AI for Scienceのための基盤整備というところが予算化されようとしていますが、1つのインセンティブとしてそういった基盤を使うときに、当然ながら、お金を少し取りますよということが基盤として事業化されることが想定されるんですけど、データを公開してもいいよとか、あとは、そのデータに対してメタデータを研究者が付与してもいいよというときには、お安く使えますよみたいな、インセンティブ設計が一つあり得ると思っています。
 もう一つは、もうちょっと、私自身、重要だと思っている話として、いかにここのデータセットをつくるところがAI駆動になるかということが極めて重要だと思っています。今、科学、研究開発そのものを支援系AI for Scienceとか、自律系AI for Scienceで進めると言っている、その手前のところで頑張って人力で努力と根性でデータセットをつくりましょうというのは、少し、もうちょっとそこからAI駆動にしていくような観点が必要なんじゃないかなと思っていまして、例えば、機器を利用して実験データが得られましたというときに、全部それを手動でメタデータとか付与する必要があるかというと、例えばそこの中でのディスカッションであるとか、どういう機器を使っているのというデータ自身はAI側からも頑張れば取得可能なので、そういったところを全部人間から全部埋めていってデータベースとして完成させるというパラダイムではない考え方が必要になるかなと。いかに人力で研究者自身がかけなきゃいけないコストを減らせるかというところは極めて重要だと思っています。
 以上です。
【川原主査】  ありがとうございます。ちょっとデータに関するインセンティブづくり、ルールづくり、あるいは、どうしたらいいかというのはかなり中心的なテーマになりつつも、皆さん苦労されてきたところなので、また、ちょっと非公開の部分でもうちょっと突っ込んだ話をしてもいいのかなと思いました。
 一通り、まず、トピック限らず、委員の発言、一通りお伺いしたいと思います。
 では、大上委員、お願いします。
【大上委員】  大上です。今、ちょっとビジネスとの関わりの話もあったんですけども、バイオインフォマティクス分野、皆さんもAlphaFoldで多分有名な話だと思うんですけど、あれ、私も少しショック、少しじゃないですね、大分ショックを受けていた話なんですが、民間企業から出てきたというのがすごい衝撃だったんですよね。それはNLPの分野とかだったらもはや当たり前だった話だと思うんですけども、バイオインフォマティクスのたんぱく質立体構造予測がDeepMindから出てきたというのがすごい衝撃的だったという話があります。
 その後も実はバイオインフォマティクスの主要なAI系のアプリの大部分、大部分は言い過ぎかな、結構な量で、民間企業、例えばバイドゥですとか、やっぱり中国ですけど、バイトダンスですとか、あとはMetaですとかというところから出きているというのがなかなかショッキングなことで、なかなかビジネスというか、民間のプレーヤーを巻き込めていなかったんだなって、日本の研究をやっている立場としては思いました。
 少なくともプレーヤーが足りないので、民間企業の力は絶対必要だと思っていて、一緒に開発しないと何も立ち行かなくなるとは思っているんですけど、そのときにビジネス側、民間側が、本当に勝者総取りになれるのか、くたびれもうけになってしまうのか、他者を利する活動にただで働かされるみたいな話になってしまわないようにするにはどうしたらいいかという設計の仕方がすごく難しいなと思っています。
 実際に例えばAlphaFoldも、あれ公開してくれたので我々使えていますけども、秘密にされたら、多分DeepMindが独りで楽しく使っていたという話、もうけていたという話になっちゃう可能性があるので、たまたま公開してくれたからよかったんですけど、例えばその後のバージョンではノンコマーシャルになっていたりするとかで、使えない部分とかもあって困っちゃうということもあると思うので、民間企業の利益と全体の利益をどう設計するかみたいなところはすごく議論が必要なところかなと思いました。
【川原主査】  この点、民間企業の投資をどうインセンティブづけできるか、北野委員、丹波委員、何か。
【丹波委員】  お話を伺っていて、大分私たちと様相が違うなと思って聞いていました。私たちも基盤をつくって、ある分野に絞って、AI for Scienceを進めてきていますけれども、パートナーはやっぱり民間企業です。なぜなら、民間企業はビジネスを最大化することはお互いのインセンティブとなるので、テーマを選ぶのも、ビジネスが最大化できるのはどこだろうかと。私たちもAI for Scienceに取り組んでいるというのも、実は自分達がAI for Scienceをやっているわけではなく、AI for Scienceに使うシステムを構築して提供しているので、それはそれでビジネスだと考えています。なので、お客さん側が経済最大化できるものをつくらない限りは、私たちも大きくならないと考えています。
 先ほど、分野を選定されるときの指標として、例えば論文の数だとかということを言われていましたけれども、僕らはどうしてもビジネスになるかを見ているので、創薬なんかは一番の分野と捉えています。あそこが一番期待できるから、医療が次にあるかとか、マテリアルか、となるので、その辺りは、やっぱりインセンティブをどう設計するかが非常に重要だと思っています。なぜそうなるかというと、神経のシステムをつくって、バーチャルの世界でシミュレーションやっているので、これは今の段階でAI for Scienceでやっていると言えるんですけれども、これが自律系のシステムになって、フィジカルを扱うようになったとなると、色んなデータを集めてこない限りはそれができない。一方で、今度はデータを持ち寄るインセンティブが産業界にあるかというと、中々難しい。業界にまたがってのデータのシェアはハードルが高く、企業ごとのデータの共有というのも今の時点では難しいので、どうやってAI for Scienceの中に、大きな枠組みで、企業に閉じない状態で、データを持ち寄って、そのシステムをつくるかというインセンティブづくりは併せて必要と考えています。アカデミアの世界だけじゃなしに、民間企業側にこれは必要だと思っている次第です。
【北野委員】  企業の例として、私が代表を務めるシステム・バイオロジー研究機構(SBI)及びその事業会社であるSBXの話をしたいと思います。SBXは会社ですから、事業をしており、ほとんどは製薬会社が顧客です。ディスカバリーからデプロイした後の適用拡大、インディケーションの拡大など、ほぼ全工程に携わっています。いろいろな製薬会社と一緒に取り組んでいますが、基本的に重要なことは、AIのツールというのも確かにそうですし、プロセスを回すということもありますが、ドメインナレッジが重要です。その領域のことをよく理解していないと、AIのツールなどの開発で質の高いものを作ることができません。研究の計画から一緒にデザインするようなことをやっており、それによって信頼を得て長い間事業を拡大してきていますが、そういうことをどのように実行するかは、ドメインスペシフィックであり、意外とスケールすることは大変です。ボトルネックは優秀な研究者をどれだけ確保できるかどうかなので、それをAIサイエンティストにしていかなければなりません。これは現実的な問題で、この分野でアメリカやヨーロッパで大きな時価総額になっている会社は過去に存在しましたが、もう残っていないか、事業モデルを1個だけのパイプラインで勝負している状況に今なっています。全体の産業のTAM(市場規模)は、アクセシブルマーケットのサイズに比べると実は非常に小さいです。例えば創薬の場合、デベロップメントは大きいですが、R&Dは大きくありません。デベロップメントから見て、TAMが大きいと思ってバリュエーションを上げますが、実際の受託研究をやろうとすると、R&Dは大きくありません。加えて、何社もやるとターゲット顧客(TA)が重複することになります。要するに、領域がかぶるので、利益相反や、情報管理の問題が生じる可能性があります。さらに、事業規模のスケール可能な上限の問題もあります。
 それを考えると、控えめなビジネスモデルでやらないといけなくなってきます。それから大きくするためにはどうするかというのは、もう一度考えないといけません。この分野で、我々が20年間、活動が続けられている理由は、それを適切にマネージしているからです。スタートアップで大規模になってうまくいっていないのは、それをマネージしなくて、夢を見てしまいますが、実際流れてくるお金はそんなに大きくないです。この現実をきちんと見ながらやっていかないといけません。
 実際にAI for Scienceは、R&Dのコストで見れば、そのサイズは実はそれほど大きいわけではないです。それを産業的な影響力の拡大とシンクするスピードで上げていかないと、資金がフィードしてきません。これが経営上の現実だと思います。このところは時間がかかりますので、この時間軸を適切にマネージするプロジェクトにしていかないと恐らくうまくいきません。恐らく、丹波さんなどは実感として持っていると思います。エクスペクテーションと時間軸のマネジメントがこのプロジェクトは非常に重要なポイントになると思います。
【泰地委員】  やっぱり本当のAI for Scienceからしっかりしたプロフィットという観点から言うとそういう話になってくると思うんだけど、最近のビッグテックの動向とか見ると、最近はOpenAIまでAI for Scienceって言い始めていて、これはなぜかなというのを見ると、やっぱり彼らのところは、AI開発というのを非常に中心に据えていて、そうすると、AI for Scienceというのは、次のAIを賢くする上で一番のキーだと彼らは思っているということだと思うんですよね。実際そうで、LLMのほうはかなり飽和しているので、そうすると、今のLLMのベンチマークは、数学の問題を解かしてLLMのベンチマークとしていると。数学ってやっぱりかなりテキストのところにとどまっているから、この先はもうちょっといろいろマルチモーダルな複雑な問題を解かなきゃいけないと。
 もう一つは、フィジカルなところがありますけれども、やっぱりそこでのインテリジェンスというと、サイエンスの課題というのは非常に重要だとみんな思っていると思うんですよね。やっぱりAIを賢くするために、AI for Scienceが重要だというので、かなり大きな投資がなされていると思っています。
 じゃあ、我々のほうは、日本でそういう投資をしてくれる会社があるかどうかとか、そういうところを見ながら、我々のほうのどういうふうにここに投資していくかということを決めなきゃいけない。国としての投資をどうするかということを考えていかなきゃいけないということになるのかなと思ってはいます。
【北野委員】  
泰地さんが話されたポイントは、非常に重要です。AI for Scienceでサイエンスの比較的ストレートなエリアだと、さきほどの話になりますが、今泰地さんがおっしゃっていたポイントは、例えばAGIのようなものも含めて、そこの能力を上げるためにはサイエンスの知識がその中に入っていないときちんとしたワールドモデルができない、きちんとした推論ができてこないということだと思います。それがないと産業上のもっと大きく広範なインパクトが出ないということになると、これは全然違うゲームになり得ます。
 サイエンスのためにAIを使うとなると、サイエンスのところに入ってくる資金でキャップされて、それは実は意外と大きくなかったりしますが、これが全産業領域にインパクトを与えるAIをつくるために、サイエンスができるAIが基盤にならないと駄目だとなると、何桁か違う話になります。だから、ここでの議論は実はすごく重要で、どこにホライズンを見るか、というように戦略をピボットしていくかどうかになります。今、AI for Scienceでは割とサイエンスにアプライすることになっていますが、サイエンスができるAIは全産業領域に影響がある、というようなピボットをすると、桁が違う話になってくるというのは非常に重要なポイントで、そこを今、泰地さんが御指摘されたと思います。
【川原主査】  そういう意味で、AI自身のプラットフォームをつくっている企業は、スタートアップでチャレンジしているところ、大企業もありますけれども、多くない、絶対数として多くない中でどう位置づけていけばいいんでしょうかね。やると決めるのか?
【北野委員】  やると決めることです。これは自由競争であることと、あとはベースプラットフォームだと思います。例えばDeepMindの創業者デミス・ハサビスはこれをやりたくて会社をつくっています。サイエンスをAIで解くためにつくったのがDeepMindという会社で、これにグーグルが支援しているということだと思います。それ以外のところも、OpenAIやマイクロソフトなど多くの企業にAI for Scienceのチームがあるのは、そこにオポチュニティがあるのと、今のLLMの推論など何かをどんなにやってもリジッドなワールドモデルがないので、推論が粗く、結構間違いが多いです。おそらくそれは解決できないと思います。ヤン・ルカンなどは、自分の会社つくるようです。その辺は割とリジッドなワールドモデルをそこからつくってくる構造にしないといけないと思います。
 それをやるとすると、AI for Scienceは、次の世代の非常にハイパフォーマンスなAIシステムをつくるためには、中にサイエンスができるリジッドな能力があるものをつくらざるを得ないという結論に達するのだろうと思います。恐らくビッグテックはその点に気がついていると思います。
【泰地委員】  米国のGENESISも明らかにそういう方向だから、GENESISのカウンターパートになると決めたら、我々もそこにベットするということになるんだろうと思うんですけどね。
【北野委員】  そう思います。
【川原主査】  ちょっと松岡委員をお待たせしているので、先に松岡委員にお伺いしてから相澤委員お願いいたします。
【松岡委員】  すいません。今の議論に比べると小さい話かもしれないんですけども、弊社はAIを開発しているわけじゃなくて、むしろAI for Scienceを利用する側として思っているところとちょっと今の議論とくっつけて考えると、結構やっぱり科学とビジネスの近接みたいなところがあらゆる産業で起こっていると思っています。分かりやすいところで言うと、弊社、量子コンピューターのビジネスをしている中で、やっぱりビジネスが、科学そのものがビジネスになっているというところで、そうすると、トップの科学者のためのAIというより、トップの科学者がやっていることをちゃんと同じようにミドル層、ボトム層ができるような、そういう形でのAI for Scienceという利活用をすごく重要視したいというか、それでどう活用していけるかというところを考えたいなとなりますし、弊社、結構マテリアルの業界、産業と関わっているんですけど、そこでいうと、本当の新素材開発って企業ではやってないんです。やっているところもちろんありますけど。そんなにやってない中で、重要なのって、それをどうつくるか。MOFとかもそうですけど、やっぱりいいものを発見するという話、どうつくるかというのの、日本が産業として強いのってどうつくるかのほうだと思っていまして、そこって全然まだサイエンスされてないと思っています。そういうところをサイエンスしていくためのAI for Scienceみたいな、それがさっきの話でいう、全産業に影響を及ぼすAIというところよりは少し小さい話になりますけれども、そういう間のサイエンスできてないところにちゃんとサイエンスをもたらすAIみたいな、そういうところが、ふだん産業と関わっていて、結構重要性が高いのかなと思っていたところです。
【川原主査】  ありがとうございます。溝口委員、まだでしたので、ぜひお願いします。
【溝口委員】  少し話題変えちゃいますけど、よろしいですか。データに関してとか、インセンティブはそれで皆さんの御議論のとおりだと思うんですけど、一方で今回のプログラム、チャレンジ型ですとか、いろんなプログラムがある中で、これは本当にすごくおっしゃるとおりで、この三角形を拡張するというのはすごくおっしゃるとおりで、恐らくここにいらっしゃる方は恐らく三角形のトップ層の方々で、非常に危機感があって、上に伸ばそうという御意見があると思うんですね。
 私自身、いろんな大学で講義をさせていただくんですけども、今の若者たちは、AIに関するノウハウはないんですけども、その危機感はものすごく持っていて、私、マテリアルなんですが、マテリアルインフォマティクスの話をすると非常に興味を持っていただいて、ぜひやりたいという危機感がすごくあって、一方でそれに関わる大学の研究室でそういったことをやっている研究室があるのかというと、かなり少ない。なので、23ページ目かな、のマル4番、AIに関するノウハウがない層というのが実はかなり2つぐらいあって、若者たちは恐らくノウハウがないんですけど、ものすごいやる気があって、ぜひやりたいと思っている。一方で大学の先生たちというのは、ノウハウもないんですけども、日頃の業務に追われてなかなかできないという、この2つの層があるんじゃないかなというような考えを持っています。
 なので、その辺はちょっとうまく拾うようなことをしていただきたいなと思います。
【川原主査】  津田委員、お願いします。
【津田委員】  人材育成で少し。これまでの統計的機械学習の基礎は数学で、だから、我々も線形代数とか、確率論とか、そういうのばっかり教えていたんですけど、今、LLMの時代になってくると、それってそんなに大事じゃないなという感じになってきて、必要なのは、AIを前提とした知識、工学であって、どうやって知識をあらわして、知識をマニピュレーションして、どうやって自分の思うとおりに使っていくのか、AIを使ってというところをちゃんと極めていかないといけないんだなと思っています。
 ただ、それのためのカリキュラムだったりとか、実際問題、取りあえずLLMを学習してもらうとかはともかくも、どういうことが結局現在の環境で必要なのかというのはまだまだ議論が必要だと思っています。
【川原主査】  ありがとうございました。そろそろ公開を終える時間になってきましたが、先ほど相澤委員さん、お手を挙げていらっしゃった。よろしいですか。
【相澤委員】  後ほどでも大丈夫です。
【川原主査】  では、ちょうど最後の溝口委員と津田委員で欠けていた人材の話も少し頭出しはできたかなと思いますので、各基本的な取組の5つの論点等ありますが、おおむねカバーするための最初の問題共有ですかね、そのぐらいはできたかなと思っております。この後、今後、引き続き非公開の部分で深めたり整理したりする部分をしていこうかなと思います。
 それでは、公開の議論はここまでということにさせていただいてよろしいですか。最後にこれだけは残しておきたいというのがもしあればですが、よろしいですか。
 では、以上をもちまして、以降は非公開にて意見交換を行いたいと思います。事務局にて非公開の準備をお願いいたします。
 
------------------------------
以降は、AI for Science推進委員会運営要綱第2条に基づき非公開とした。

―― 了 ――

お問合せ先

研究振興局参事官(情報担当)付

(研究振興局参事官(情報担当)付)