令和8年1月14日(水曜日)16時00分~18時00分
文部科学省東館17階 17F1会議室 及び オンラインのハイブリッド形式
相澤主査、尾上委員、湊委員、青木委員、天野委員、石田委員、川添委員、川原委員、小林委員、佐古委員、大武委員、中野委員、引原委員、星野委員、宮田委員、若目田委員
淵上 研究振興局長、坂下 大臣官房審議官(研究振興局及び高等教育政策連携担当)、阿部 参事官(情報担当)、栗原 計算科学技術推進室長、土井 学術基盤整備室長、
原田 科学官、込山学術調査官、松林学術調査官
国立研究開発法人科学技術振興機構研究開発戦略センター(CRDS)永野 智己 フェロー
【相澤主査】 それでは、定刻になりましたので、科学技術・学術審議会情報委員会の第45回会合を開催いたします。
委員の皆様におかれましては、お忙しいところお集まりいただきまして誠にありがとうございます。
本日も、現地出席とオンライン出席のハイブリッドでの開催となっております。また、報道関係者を含め、傍聴者の方はオンラインで御参加いただいております。
まず、出席者の御紹介、配付資料の確認と、ハイブリッド開催に当たっての注意事項について、事務局よりお願いいたします。
【轟木参事官補佐】 事務局でございます。まず、本日の出席状況につきまして御案内いたします。
盛合委員が御欠席、大武委員、佐古委員、川添委員が遅れての参加と御連絡をいただいてございます。また、JST/CRDSより永野フェローにオブザーバーとして参加いただいてございます。
続きまして、陪席いたします科学官・学術調査官の御紹介をさせていただきます。
科学官の原田でございます。
学術調査官の込山でございます。
学術調査官の松林でございます。
文部科学省からは、淵上局長、坂下審議官にも御出席をいただいてございます。
続きまして、議事次第に基づき、配付資料を確認させていただきます。現地出席の方はお手元の配布資料を、オンライン出席の方はダウンロードいただいている資料を御確認ください。
配付資料は、議事次第の紙にも記載しておりますとおり、本体資料としては7つ、参考資料がそれに加えて6つ、委員の皆様におかれましては、机上配付資料をそれに加えて1つ配付させていただいてございます。御確認をよろしくお願いいたします。もし現時点でお困り事や不具合等がございましたら、お知らせいただければと思います。よろしかったでしょうか。
続きまして、ハイブリッド開催に当たっての注意事項を申し上げます。先ほども少し触れさせていただきましたが、本日はWebexの調子が少し悪いようですので、万が一接続が切れてしまったりなどがございましたら、事務局までお問合せをいただければと思います。事務局でも状況を注視したいと思います。
注意事項でございます。御発言時を除き、マイクは常にミュートとしていただけますと幸いです。
ビデオは常時オン、通信状況が悪化した場合は、ビデオの停止もしていただければと思います。
運営の都合上、現地出席の方も含めて、御発言いただく際は「手を挙げる」ボタンを押して御連絡ください。
御発言される際は、お名前をおっしゃってから御発言いただけますと幸いです。
また、マイクの数が限られているため、現地出席の方が発言される場合は、少し大きめの声で御発言いただくようお願いいたします。
傍聴希望をいただいた方には、Zoomにて御参加いただいてございます。
不具合等が発生した場合は、現地出席の方は手を挙げていただき、オンライン出席の方はチャット機能や電話等で事務局まで御連絡ください。
事務局からの御案内は以上でございます。
【相澤主査】 ありがとうございました。
本日は、5つ議事がございます。令和8年度当初予算案・令和7年度補正予算(情報科学技術関連)について、AI for Scienceを支える研究データの管理・利活用と流通の在り方ワーキンググループについて、AI for Scienceの推進に向けた基本的な戦略方針の方向性について、情報分野研究開発プランの変更について、AI for Scienceによる科学研究革新プログラムの事前評価についてです。
議題5の事前評価につきましては、科学技術・学術審議会情報委員会運営規則第5条第3項に基づき、非公開とさせていただきます。
また、本日、AI for Scienceの推進に向けた戦略方針について、皆様の御意見をいただく時間を約30分ほど取っております。なるべく多くの委員の先生方の御意見をいただければと思いますので、質問等につきまして、お考えいただきながら聞いていただければと思います。
それではまず、議事1の情報科学技術関連予算について、事務局から御説明をよろしくお願いいたします。
【阿部参事官】 事務局、情報担当参事官の阿部でございます。
資料1を御覧ください。まず、予算関係の御説明になります。
1枚めくっていただきまして、全体像になります。大きく分けて、我々の方で対応している予算事業に関係しましては2つございまして、左が先端的な情報科学技術の研究開発ということになります。もう一方が、その研究開発を支える情報基盤ということになりますが、研究開発の部分につきましては、ここに並んでいるような事業をやってございます。ここの見方としましては、数字の一番左が令和8年度予算案、括弧の中が令和7年度の当初予算、それから最後の3つ目、右のところにあります四角で囲っているものが令和7年度の補正予算の額になります。
時間の都合もありますので、一つ一つについて詳しく説明することは避けますけれども、幾つかトピックス的なところとして、めくっていただきまして、1つ目が、生成AIモデルの透明性・信頼性の確保に向けた研究開発拠点形成ということになります。当初予算と補正予算を合わせて全体を見ていただければと思いますが、マルチモーダル化が進んでいる中で、そういったものへの新たな対応を図っていくことであったり、モデル等の高度化等を図ることに対して予算を措置されているということでございます。
それから、6ページ目になりますけれども、理研のAIPセンターの取組になりますが、こちらは記載のような金額の中で引き続き取組を強化していくというところでございます。
それから、7ページ目は、AI for Scienceの関係で新しく立ち上がりましたファンディング事業の関係でございます。ここは議題3で詳しく御説明したいと考えております。
それから、8ページ目が、Society 5.0実現化研究拠点支援事業ということで、こちらも最終的な事業の仕上がりに向けて引き続きしっかりと対応していこうということで、予算を措置されているというところでございます。
それから、1枚飛びまして10ページ目、情報通信科学・イノベーション基盤創出、CRONOSという事業を進めておりますが、こちらにつきましては、新規の公募を増やすべく、予算としても増額ということになってございます。
続きまして、11ページ目以降は基盤のところになります。1つ目、12ページ目、AI等の活用を推進する研究データエコシステム構築事業ということで、こちらにつきましても新しい課題と今後の課題をしっかりと調査しながら進めていこうということで、新たに先行事例やニーズの調査研究等を進めながら、またAIによるメタデータ付与機能の開発にも着手していこうということで、予算を措置されているところでございます。
それから、14ページ目はSINETになります。
それから、15ページ目以降、スーパーコンピュータの関係ですが、現在稼働しています「富岳」、それからHPCI、革新的ハイパフォーマンス・コンピューティング・インフラにつきまして必要な予算の措置。
16ページ目には、運用継続に向けた対策についても補正予算が措置されているということ。
それから、17ページ目にありますとおり、今回の補正予算で、AI for Scienceに不可欠な計算基盤を強化する必要があろうということで、76億円が措置されておりまして、これから公募をしながら、幾つかの拠点のところで、GPU資源等をしっかりと増強しようという取組もこれから進めていこうという状況でございます。
18ページ目は、「富岳」の次世代となる新たなフラッグシップシステムということで、「富岳」NEXTと通称呼んでおりますが、ここに対する開発に必要な経費について、18ページ目、19ページ目にあるとおりでございます。
それから最後のページ、23ページ目を御覧ください。AI for Science全体の予算パッケージになってございます。少し資料が見にくいですが、右肩のところに予算規模を書いてございますが、そこに小さく米印のところ、補正予算に関係しましては、関連経費を含めますと総額1,527億円を計上しているところでございます。ここにありますとおり、全体を四つの柱ということで、研究部分、データ部分、そしてそれらを支える次世代情報基盤、さらには産学連携や国際連携を進めていくということでパッケージ化しているというものでございます。
全体の予算の説明は以上になります。
【相澤主査】 ありがとうございました。
では、ただいまの御説明を踏まえまして、御質問、御意見等がありましたら挙手にてお知らせください。
よろしいでしょうか。
そうしましたら続きまして、議事2に移ります。前回の情報委員会において皆様に御審議いただき、設置が承認されましたAI for Scienceを支える研究データの管理・利活用と流通の在り方ワーキンググループにつきまして、昨年12月末に第1回会合が開催されたとのことで、その開催概要を事務局から御報告いただきます。
【土井学術基盤整備室長】 それでは、資料2に基づきまして説明をさせていただきたいと思います。画面共有ができていないのですが、すみません、説明だけさせていただきます。
AI for Scienceを支える研究データの管理・利活用と流通の在り方ワーキンググループにつきましては、前回の委員会で設置をお認めいただきました後、2ページ目にありますように、委員を構成させていただきまして、尾上委員に主査をお務めいただいているというところでございます。そのほか、本情報委員会からは石田委員、宮田委員、若目田委員にも御協力いただいております。また、主査代理につきましては、福島国際研究教育機構の理事であります江村先生にお願いしております。昨年の12月24日に第1回目を開催させていただいております。
資料3ページ目でございますけれども、この第1回目のワーキングでは、流通基盤と研究データ基盤の現在地ということで、NIIから発表していただきつつ、また今後の方向性についても御説明いただいて、それを基に活発な議論をしていただいたところでございます。今後、次期SINETの在り方とか、研究データ基盤の方向性等々につきまして議論を深めてまいりまして、翌年度の6月までにはワーキンググループの報告書を取りまとめるといったスケジュール感で考えてございます。
説明は以上でございます。
【相澤主査】 ありがとうございます。
主査の尾上先生から何かコメント等がございましたら。
【尾上主査代理】 ありがとうございます。今、土井室長から御説明いただいたとおりなんですけれども、12月24日、クリスマスイブだったんですが、開催させていただきまして、合田副所長のほうから御紹介いただいて、特に学術研究プラットフォームの将来像という形で考えていただいているような図も示していただいた、それに対して皆様から活発な御意見がございました。
【相澤主査】 ありがとうございます。
AI for Scienceを支える研究データの管理・利活用と流通の在り方ワーキンググループということで、12月に第1回目が開催されて、引き続き議論を行うということが報告されました。もし質問等がございましたら、挙手でお知らせください。
よろしいでしょうか。
では続きまして、議事3に移ります。AI for Scienceについては、前回10月の情報委員会でも議論いただいたところですが、今年度中にAI for Scienceの推進に向けた基本的な戦略方針を策定すると聞いております。
まず、CRDSから最新のAI for Scienceの動向に関する調査報告書について御説明をいただいた後、文科省阿部参事官より現在の検討状況を御説明いただきます。
それでは永野フェロー、よろしくお願いいたします。
【永野先生】 JST研究開発戦略センターの永野でございます。資料3-1を用いて御説明いたします。報告書に関するものでして、その報告書の本文を資料3-2としておつけしてございます。本報告書は、現時点で未定稿の段階ですが、来月にCRDSより発行予定の原稿になりますので、そのような取扱いとして御了承いただければと存じます。
本報告書は、「AI for Scienceの動向2026」といますが、2025年12月末までの国内外の動向を分析、取りまとめたものになります。報告書全体の構成としては、前半の1章、2章では定性的、定量的なAI for Scienceの全体像を捉えたもの、そして3章では、AIが各研究開発分野でどのような活用の方向性が検討されているのか、また4章は、今度は逆に各分野の研究開発の結果がさらに次のAIにどう生かされていくのか、このような観点で構成しており、最後の5章では今後の展望や政策の検討に関する論点等を掲げています。
尚、前回の本委員会でもこれらのエッセンスについてはすでに御紹介させていただいておりますので、重複する内容はある程度説明を省略させていただきます。現在、AIトランスフォーメーションとして、様々な分野がAIによって変革を遂げていく、その対象の一つとして科学研究もあります。これを「第5のパラダイム」などと呼ぶ場合もあります。
この3か月余りだけでも、世界各国から様々な関連の政策や戦略文書が発表されております。例えばEUでは10月、に「AI in Science」の戦略が公表されております。そこでは、AI for Scienceとほぼ同じ扱いですが、サイエンスにおけるAIということで、AI in Scienceとの表現が用いられています。またそこではScience for AIも含めたかたちの、包括的な概念としてEU域内でAI in Scienceを進めていくことが掲げられています。
また、CRDSはこれまでも様々な関連レポートを出してきておりますが、そういった検討も含めて今回改めて全貌を取りまとめております。
まず、定量的な部分を御紹介します。論文に関する統計データ解析ですが、これは「AI関連論文」を検索しております。すなわち、AIに関わる主要なキーワードを含む論文がどのようなボリュームになっているかというものを全論文数として、さらに被引用度数のトップ10%、トップ1%のそれぞれで解析したものになります。トップ1%のほうの論文動向を見ますと、ここ数年で米国(ブルーのところ)が若干水平気味になってきているような傾向が見えたりします。
また、各分野におけるAI関連論文の割合を見ていこうとすると、すべての研究論文の中でAI関連論文がどれぐらいあるのか、すなわちAIを用いたり研究の対象とするような、いわばAI度合いの高い論文がどれくらいかのようなデータですけれども、日本は今、そのボリュームは世界で10位という位置づけになっております。今後、研究におけるAI度合いをどう上げていくのかが、一つの論点としてあり得るのかなということをご議論いただいているものと認識しています。
また、各分野で見た場合には、コンピューターサイエンス分野そのものを除く形で分析することが一般的となっておりますので、同様の形を取り、幾つか赤で示しておりますように、エネルギー分野や地球惑星科学といったところでは、AI関連の論文が非常に増えている状況が見てとれます。
各国の政策動向については、特徴的なものとしては、昨年11月にアメリカにおいて「ジェネシス・ミッション」という大統領令が発出されたところです。DOEが中心となり、特に計算資源の確保とアクセス、そしてデータの獲得と活用、そういったものを科学研究のインフラとして強化していくということが示されております。またDOEのダリオ・ギル次官から公開書簡が出されており、そこでは、ジェネシス・ミッションすなわちAI for Scienceは、米国における過去のマンハッタン計画やアポロ計画に匹敵するような国家プロジェクトとして位置づけられるものだとしています。
また、各国それぞれにAI for Scienceに類する国策、戦略等々を発行しておりますので、その詳細については発行予定の報告書本文を御覧いただければと存じます。
前回の委員会でお示しした図を少しシンプルにしていますが、科学研究のいわゆるサイクルのところだけ取り出してよりわかりやすく表現しています。科学研究における仮説の推論・設定から具体的な実験等の研究アクション、そして論文等による成果の公表、科学コミュニケーションなども含めた形での全てのプロセスにおいて、AIを活用していく、あるいはAIによってその行動を駆動していくような、科学技術研究のプロセス全てが対象に考えるものだとしています。この中でも、いわゆる「支援系のAI for Science」の観点と、そしてよりAIが主体として関わってくるような、「自律系のAI for Science」のそれぞれが進化を遂げていくのではないか。また、研究開発工程におけるバーチャルな度合いとフィジカルな度合いは、分野ごとに異なり、多様性がありますので、その違いも理解した上で、それぞれに見合った最適な形というものを模索していく必要があるだろうということを掲げさせていただいております。将来的には、超知能のようなところを大きく考えたときに、そこに行くには現時点では高いハードルが存在するだろうとしえて破線を書いていますが、研究開発における自動化・自律化のレベルが進展していく段階において、そして横軸に表現している、より非平衡・開放系、複雑性の高いところへと対象を広げていく、そういうものがそれぞれの領域・分野に応じた形で、それぞれのルートを辿っていきながら進展していくのだろうと見ています。ただし、そのステップ・バイ・ステップのところには、数多くのブレークスルーが必要になるとも考えられますので、この辺りは一概に全てこうだというものではありません。
また、研究基盤に関するところが非常に重要になりますが、ここでは欧州の動向を一つだけ御紹介したいと思います。欧州では、オープンサイエンスクラウドというものを欧州全域で構築しているところです。データをFAIR原則に則ったかたちで集め、オープンサイエンスを適切に進めるための研究基盤です。各国あるいは分野ごとのコンソーシアムやプロジェクト単位で研究データの「ノード」を構成し、そこにデータを登録し、データを第三者活用できるような仕組みへとつなげていく。その全体をオープンサイエンスクラウドという形で、Horizon Europeがサポートするような体制で今進めているところだと聞いています。
日本国内の動向に関しては、先ほど御紹介にありました研究データ管理ワーキンググループで御議論いただいていると思いますので、省略させていただきたいと思いますが、全体的なところをNIIのイニシアティブで取りまとめていただいております。また、例えば分野単位では、マテリアル分野では、マテリエル先端リサーチインフラ事業(ARIM)と物質・材料研究機構のデータ中核拠点により、ARIMの共用装置から生まれてくるデータをNIMSのデータ中核拠点に集めていき、それを様々な産学の研究者に、データを活用した研究をしていただけるような形で、データ共用のサービスを昨年9月より本格的に開始しているところです。
また、産業界のほうでもIPAにおけるデータスペースを活用するといったことが検討されておりますけれども、各産業ドメインごとにかなり違ったニーズがあるなかでどう応えていくか、様々な課題が存在すると聞いております
基盤モデルに関してですが、この下のグラフを御覧いただきたいんですけれども、分野ごとに使用される様々な基盤モデルがございます。いわゆるジェネラルな言語モデルのみならず、例えばたんぱく質に特化した基盤モデルであったり、あるいは画像に特化したもの、音声に特化したもの、様々なモダリティによる基盤モデルが分野ごとに開発され、適用されていくということが進んでいます。ジェネラルな基盤モデルとともに、分野、ドメインごとのよりスペシフィックな科学基盤モデルが組み合わさって、それらがAIエージェントによってオーケストレートされながら活用されていくということが進み始めていると認識しています。
また、日本でも、ムーンショットプログラムにおいて、AI科学者システムあるいは自律実験システムの研究開発を進めていただいています。
また、少し観点を変えまして、これからの科学がどう変容していくのかということも国際的に非常に重要な議論になってきています。その一つのキーワードが「メタサイエンス」ですが、EUのAI in Science戦略のエビデンスレポートの中でも、研究における責任あるAIの活用推進と、それを支える新たな研究倫理規範の整備が論点として示されています。また、こういったものそのものを研究するためのファンドとして、英国のUKRIはMetascience Research Grantsを開始しています。AI for Scienceの課題を包含するメタサイエンスに関しては、日本も国際的な議論に積極的に参加しながら、科学研究におけるAI活用あるいはAI進展の在り方を一緒に構想していくようなことが必要なのではないかと認識しております。
例えば最近の話題として、AIを使った大量の生成論文によって、プレプリントサーバーがダウンしてしまうような現象が起きたり、あるいは、人間による科学的理解というものを、AIを使ったことによっていわばショートカットしてしまっているのではないか、こんなことも様々なところで論じられています。まさに、人間が科学をするという本質的な営みを、AIが存在する中で進めていくときの最適な在り方をどう模索し構築していくのか、その形や変化のそのものが、研究の対象でもあるということです。
さらに、産学連携活動の場面でAIによるマッチングを使っていくなどといったことも、民間のスタートアップによるサービス等から様々に生まれてきています。こういったものは、産学連携の橋渡しあるいは知的財産の活用の方法であったり、その方向性を見いだすためにAIを活用するなどということで、様々なサービスが提供され始めています。その効果は効率化のみならず、AIを介在させることによって従来はなかったような異分野間の融合が促進されていくといった点にあります。
分野ごとの特徴の違いというものをここにざっと並べております。各分野において注視すべき、あるいは特徴を踏まえた研究開発の在り方がありますので、これは、十把一からげにまとめてしまうよりは、その分野の今後の方向性や論点を適切に同定した上での取組が重要になってくるものとして、幾つかの事例とともに御紹介しています。
例えば、ライフサイエンスやマテリアルサイエンスにおけるデータの特徴というものを一覧表にして示していますけれども、どれぐらいオープン性のあるものなのか、あるいはクローズド性の高いものなのか、またデータの体系として、どのような構造で捉えられるものなのかという点も重要です。ライフサイエンス分野のような、中には個人情報に関わる情報を含むデータの取扱いであったり、遺伝資源等々の取扱い、そういったものは非常に多階層で多種類の大量データが創出されてまいりますので、適切に構造化したうえで管理し、利活用環境をつくっていくことが求められますが、非常に工数のかかる大きな仕事になるものでもあります。
また一方、マテリアル分野に関しては、近年、自動・自律実験との連動が進んでいくといったことを耳にされるかと思います。従来は文献からのデータを中心にNIMSが膨大なデータを整備してきました。しかし、実際の研究課程での生データ、実験データあるいはプロセスデータなど、いわゆるワーキングデータは、整った状態のものは存在しません。そこで日本が始めたオリジナルの取り組みとして、先ほどのマテリアル先端リサーチインフラがそこにチャレンジをしています。共用装置から創出されたリアルデータを構造化し、データ共用サービスとしてデータ利用者へ提供していくことが、目下進められているところです。また、環境エネルギー分野では、非常に大規模なシステムの実運用からのデータが重要になってまいりますので、そういったものを収集しながら、実社会の運用と研究開発とがリアルタイムに近い形で相互にフィードバックループを回しながら同時並行的に進められていく、そのような特性を持っています。
後半ですが、各分野がどうやってこれからのAIの開発を支えたり貢献をしていくのかも重要な観点です。コンピューティング、通信、ロボティクス、セキュリティそれぞれの研究開発の中で行われていることが、次なるAIの進歩・発展に対しても非常に大きな寄与をしていくであろうし、また逆に影響していくということもあります。また、その前提として数学・数理科学の分野の進歩・発展が非常に重要になってきます。数学・数理科学の世界で培われてきたことが活用され、これからの社会にとってより望ましいAIの発展に寄与していくということを検討していくことが重要であろうと認識しています。
最後ですけれども、人工知能基本計画を掲げていただいて、これからこの後AI for Scienceに関わる戦略を御議論いただくということでございますが、科学研究プロセスとAI研究基盤とは、相補的な関係性を強化して共進化させる必要があるのではないかということを一つ掲げさせていただきたいと思います。また、米・中に代表される国家やビッグテックによる大規模投資の中で、日本の特徴、例えば非常に信頼性の高い実データを取得する能力がある、あるいはフィジカルAIの基盤技術が非常に蓄積されてきている、こういったものをしっかり生かす戦略が重要になるのではないか。また、科学の在り方や方向性を問う国際的な議論に積極的に参加し、わが国の存在感を発揮していくことも非常に重要ではないかということを考えております。以上のことを、資料3-2の報告書原稿に詳述し、来月、JST-CRDSより公表予定でございますので、御参考いただければありがたいです。
以上でございます。
【相澤主査】 どうもありがとうございました。大変力強いレポートを御紹介いただきました。
ただいまの御説明について、御質問、御意見を承る時間を取ってありますので、皆様、どうぞよろしくお願いいたします。
川添委員、よろしくお願いいたします。
【川添委員】 御説明ありがとうございました。 1点、質問させていただきます。データの話とかモデルの話は盛り込まれていたのですが、例えば今、AIの中で言えば、アルゴリズムあるいはアーキテクチャーと言っていいんですけれども、これは個別のサービスごとの開発が非常に重要だということも言われていると思うんです。例えばゲノム言語モデルで言えば、スタンフォード・ユニバーシティーが開発したHyenaというアーキテクチャーを使ってEvo2というモデルをつくり出したりしているということなので、このアーキテクチャーとアルゴリズムは非常に重要な、これまでのサイエンスの知見を生かしてやるべきことかなとも思っています。その辺りが何となく盛り込まれていないような気がするんですが、いかがでしょうか。
【永野先生】 大変重要な御指摘をありがとうございます。今日の御説明ではほとんど触れられませんでしたが、大変重要でして、報告書中では幾つか触れさせていただいます。各基盤モデルにおけるアーキテクチャー、アルゴリズム、それから各分野において、AI科学者システムのような言葉で使わせていただいていますが、それぞれの研究に適応するようなソフトウェアであったり、モデルであったりというもの、あるいはロボティクスを兼ね備えたものであったりというものも、最低限触れております。論点としては、国内の研究機関においてどれぐらいこういうものをやっていくのかと、国際的な協調の中で一緒に作成・使用していく、あるいは、あるものについては使わせていただきながら、自分たちで改良や追加を加えていく部分の扱い、ベースから作成するのかなど、その辺りのすみ分けが重要になってくると認識しております。【川添委員】 ありがとうございます。ちょっと心配しているのが、例えば日本では、遺伝研さんなどがゲノムの分析をするに当たって、先ほど言ったような既存の出来上がったアーキテクチャーやアルゴリズムを利用するような形で進められていると思いますが、これだと結局、今のラージランゲージモデルで、例えばトランスフォーマーみたいなアルゴリズムがあって、それを基に単に基盤モデルとして新しいモデルをつくっているにすぎません。個別のサービスごとの開発に着手しないといけないと思うんです。その辺をぜひ強調していただけたらいいなと思います。よろしくお願いします。
【相澤主査】 ありがとうございました。
それでは続きまして、中野委員、よろしくお願いいたします。
【中野委員】 大変貴重な御報告、ありがとうございます。個人情報とか、倫理とデータといったところが私はとても気になっていて、ヨーロッパなどは一時期、GDPR等で、かなり厳しくレギュレーションをかけるということを言っていたと思うんですけれども、ヨーロッパは少しもう意識を変えてきたのか。では日本はどうするのか。少しレギュレーションを緩めるのか、あるいはそこは国がきちんと安全な保管場所を提供するという形で、少し個人情報に踏み込んだようなデータまで扱おうとしているのか。何かそれは国として方針を出していかないと、要するに研究者はどの程度のデータを集められるのか、手に入れられるのかというところが分からないまま方向性を決めにくいかなと思ったんですが、その辺りの議論はどのようになっていますでしょうか。
【永野先生】 これも大変重要なところです。大きく2つの観点があり、一つは、オープンサイエンスのコンテクストの中で語られるものです。先ほど御紹介したヨーロッパのオープンサイエンスクラウドみたいなものは、オープンサイエンスの文脈の中でどうやって研究データを共通の資産として活用していくかから始まってはいます。一方で、先ほど御指摘いただいた個人情報、あるいはセキュリティに関わるようなものなどもそうですが、ある種の特定の管理が必要になってくるようなもの、こういうものについては、それぞれ別の法体系や規則を各国々で用意していたりするわけです。オープンといいながらも、実際は分けて取り扱いをしなければならないことが、認識されています。
そういったものを国際的にどうやって活用・関与していくかは一つ大事な論点であり、国境を越えたデータ移転の在り方、それを国際的なルール形成としてどう取り扱うのか、また各国法との関係でどこまで取り扱えるのか。各国では、そういったものをある特定のやり方で匿名化して研究に活用していくことはもちろんのこと、ある階層以降には制限を設けて、ここから先は特定のコミュニティや組織の中だけで活用する環境をとるなど、様々です。また、データのそれ自体は一般的に無体物であって所有権の対象ではありません。データの利活用権設定をどのように当事者間で取り決めるかが重要になっています。
【中野委員】 ありがとうございます。国際協調も必要ですし、かといって乗り遅れていってもいけないと思うので、その辺りを情報収集しつつ迅速にどんどん対応していくことが必要かなと思います。今後ともよろしくお願いいたします。
【相澤主査】 ありがとうございます。
では、尾上委員、よろしくお願いいたします。
【尾上主査代理】 ありがとうございます。このAI for Scienceの動向を俯瞰的かつ明快にまとめていただいて、ありがとうございます。20ページに図で、AI研究基盤が汎用基盤と科学用基盤の2層構造で書いていただいていて、この本文を見ると、汎用基盤は全体に共通というところだと思うんですけれども、科学用基盤は、例えば先ほど35ページ以降に、各分野に特徴的な、ここはデータを中心に整理いただいていますけれども、データであるとか、そういう処理に応じた基盤が科学用基盤という扱いになると思ってよろしいですか。
【永野先生】 ありがとうございます。分野によって、必ずしも処理だけに特化していくものではありませんが、ここで大きく汎用と科学用と2層で表限しているものは、実際には多層でマルチなレイヤー構造をつくるということもあり得ると考えています。それが何のデータに基づくものかによって、いわゆる言語か、それ以外のモダリティなのか、また、フィジカルも含めどう組み合わせるかとの話です。分かりやすさのためにあえて2層で表現しておりますが、各分野・各研究目的によって、実現したいものの組合せの在り方がどういう構造になるのかとの考え方ではないかと認識しております。
【尾上主査代理】 ありがとうございます。データの属性と、あとはされる処理というところに応じてということで構成されると、分かりました。ありがとうございました。
【相澤主査】 ありがとうございます。
では、引原委員、よろしくお願いいたします。
【引原委員】 ありがとうございます。すごい大量の分野についておまとめいただいて、ありがとうございます。
その中で、最近ちょっと学内でも議論しているんですが、ライフサイエンス系のところに非常に難しいものがあるのではないかということなんです。それは、38ページの図ですと、データの品質という言葉で語られているんですが、品質というのは、既に何か正しいものがあるという意味合いですよね。ところが、ライフ系だと、例えば種自身が本当に同じものかどうかも分からないとか、その間のプロセスも本当に同じかどうか分からない。けれども、結果は同じというときに、何を信じるかという話があります。だから、その来歴的なところのデータをどのようにここで担保するのかという観点がどうしてもライフ系は要るんではないかと思うんですけれども、いかがでしょうか。
【永野先生】 全くおっしゃるとおりと思っていまして、ライフ系の場合は、そもそも扱う対象である生体・システムの階層が多階層である上に、組織・細胞を一つ取っても個々の細胞の個性とその来歴が異なるなどがありますから、そういったもののデータを同じテーブルで扱えるようにするには、どのようにデータを構造化して整えればよいかは、大変重要な課題です。
そのときに結局、まさに来歴とおっしゃった、その対象サンプルから得られたデータが、どういう経緯によって存在しているデータなのかということの、メタデータ付与の仕方のルールであるとか、あるいはどういう装置条件のものによって得られたデータなのかを、ある程度共通的に比較可能な形で表現してあげない限りは、一緒に取り扱えません。そもそもそれが、生命現象として見ようとしているものを本当に表現したものなのかどうかの信頼性もございますので、そこをどこまでやるのかというのは、ある種のコスト概念との関係で非常に難しい論点の一つであろうと認識しております。
【引原委員】 AIという観点から言えば、データが出た後から話をすればいいとは思うんですが、ライフサイエンスという意味で考えて研究をやっていく場合には、それはちょっと逆ではないかなという部分があると思います。そろった結果として元に戻れるかという話はあると思うんでが、だから、あまりそこを規定し過ぎると、何か本末転倒になるのではないかという危惧があるということだけ申し上げたいと思います。
【永野先生】 ご指摘の観点は他分野からも様々な御意見をいただいておりまして、一概に何でもかんでも集めるということは違うだろうと。その集め方や解釈の仕方によっても、誤った結果を導いてしまう恐れがあります。そのようなことを起こさないための、ある種のデータ取得と蓄積・利活用にかかる合意形成や、取り扱い方の一定の線引きみたいなものをつくっていくことが大事だろうと考えております。
【引原委員】 ありがとうございます。
【相澤主査】 ありがとうございます。
では、小林委員、よろしくお願いいたします。
【小林委員】 詳細な説明ありがとうございました。一つお聞きしたいのは、このAI基盤をつくる上で、オープンソースソフトウェアへの関わり方というのはどういう動きがあるんでしょうか。エコシステムの構築に向けての取組など、ありましたら教えていただければと思いますが。
【永野先生】 ありがとうございます。オープンソースによる研究基盤・ソフトウェアはすでに非常に多い状況になってきていると認識しいます。オープンソースのものに対してどういう形でさらに手を加えるか、あるいはデータを加える形でやっていくのかが、例えばGitHubなど通じて様々に提供されているものの使い方においても重要になってきます。とはいえ、非常に大規模な汎用的な基盤・ソフトに関しては、いわゆるスケーリング則にのっとった大規模な投資によってしか実現できないものが現状ありますので、そこは海外のプラットフォーマー企業が提供しているものを使いながら、様々なオープンソースソフトを組み合わせて使用していくような考え方なってくるものと見ております。
【小林委員】 なるほど。ありがとうございます。
【相澤主査】 ありがとうございます。
では、石田委員、よろしくお願いします。
【石田委員】 石田です。御報告いただきましてありがとうございました。今回の御報告の主眼ではないということは承知しているんですけれども、もし学会等、大きな学会等で結構なんですけれども、そこでのAIに対するガイドラインもしくは方針みたいなものをもし御存じでしたら教えていただきたいなと思って、質問いたします。
【永野先生】 ありがとうございます。研究用途ということでございましょうか。それとも、一般的な社会全体のAIということでございましょうか。
【石田委員】 研究用途ということで。
【永野先生】 研究用途ということに関しては、論文誌側によるルールなどはありますが、それこそ研究実施視点でのガイドラインをつくるまでの動きを見せているところはまだ存在しないかと思います。私どもが見ている中で非常に特徴的な活動をしているのは、メタサイエンスの国際カンファレンスというものがございまして、その中では、まさに科学研究にAIが入っていく、科学研究において常に存在するAIとの世界観の中で、どうやってこれからの科学を進めていくのが適切なのだろうかということを、まさにそれ自体を研究テーマとしてファンディングするということが始まっています。そうした動きの中から、国際的なガイドラインに相当するような話も当然出てくるのではないかと考えられます。
【石田委員】 ありがとうございます。
【相澤主査】 ありがとうございます。
では、川原委員、よろしくお願いします。
【川原委員】 AIの進展には産業界の貢献というのは欠かせないと思いますので、AI for Scienceになって、これらはこれまでは情報系の企業だと思っていたところが、いろいろなドメインのサイエンティストと手を組んでAI for Scienceを進めているというのを見ております。
今後、誰がどういうお金のもうけ方をして、そこで得た莫大な利益がどこにまた次に投資されるようになるのか、そういうインフラかもしれないですし、タレントかもしれないですし、それをマネタイズする方法、知財化のポイントあるいはライセンスの取り方のポイントかもしれないですし、どう産業界を巻き込んで発展していくかという展望などについて、もしありましたら教えてください。
【永野先生】 ありがとうございます。具体的な展望を持っているわけではございませんが、海外の企業等の動きを見ておりますと、そうした投資と利益創出と、先ほどのガイドラインなどルールや倫理面の動向を、実は非常に気にしながらやっているというところが伺えます。例えばプラットフォーマー企業がAIで科学研究に革新を起こすとして、新たなモデルを発表したり、そのための膨大なデータを集め始めていますが、そういう企業ほど、いかに研究界や社会の信任を得るかということに注力している部分もあります。どのドメインの産業とどのように組んで次なる潮流を起こすか、そこから生まれてくる価値と投資の関係、そして人の関与の仕方の構造自体をつくるプロセスに参画しようとしていると見受けられます。
だから、戦略的にどういうものがわが国にとっていいのかとは難しい議論にはなりますが、組み方や社会的コンセンサス形成に対しては、注意を払いながらやっていると見ています。
【川原委員】 分かりました。ありがとうございました。
【相澤主査】 ありがとうございます。
では、青木委員、お願いいたします。
【青木主査代理】 1点、今回、特にオープンサイエンス等の議論を聞かせていただいて、特にヨーロッパのことですが、なるほどと思ったんですけれども、もう1点、今回いろいろな国がほぼ押しなべて戦略として打ち出していて、国策であると。例えば米国の「ジェネシス・ミッション」ですと、10年以内に米国の科学技術の生産性とこのインパクトを2倍にすると。10年以内で、すごいですね。2倍にするということは、明らかに競争なんですよね。
国家間の競争という格好でほぼいろいろなものが語られ、きれいに書くところはあると思うんですけれども、そうなってくると、国策とか国力のようなものの国家間の競争の中で言われていて、オープンサイエンスという我々のコミュニティだと非常になじみのある部分と、それから例えばデータ試験とか、あるいは国家戦略とか、そういった部分がかなり重要になってきているんだと、今、川原先生がおっしゃったようなイノベーションの部分とか、さっき言ったオープン・クローズドモデルとか、そこら辺のギラリ感を伝わるように言っていただいたほうがいいかななんて思ったんですが、いかがですか、ずばり言って。
【永野先生】 そこはある種のせめぎ合いでもあり、兼ね合いでもあるところです。先ほどの川原先生の御指摘とも関係しますが、主要各国に共通するのは、研究インフラとしてのAIです。そこには計算資源であり、データ資源であり、そしてそれをプラットフォーマーが今は提供する形をつくっているわけですが、さらにその処理を担うメガデータセンターの周辺でしっかり電力を確保するために発電所を造っていくということを始めています。
そうした研究インフラ部分を、物理的なハードとともに押さえないといけないという点と、一方で、わが国を含めそういったものを自国で全て用意できない国が多数であるなか、どれぐらいそこに頼っていいのか、ある種のソブリンモデルみたいなものをどう用意するのかとのこの関係を作っていくことが重要になります。高度な国際関係論にもなってくる点ですので、適切な国際協力の在り方のわが国としても形成していくことが重要であろうと考えます。
【青木主査代理】 アカデミア向けということで、非常に分かりやすいんですけれども、ちょっとモードが何か違ってきているなという気はします。
以上です。
【相澤主査】 ありがとうございます。
では、湊委員、若目田委員の順番で、一旦ここで。では、湊委員、よろしくお願いいたします。
【湊委員】 すみません。35ページのところで、情報科学分野というのが右下にあって、そこで「生成AIが論文執筆と査読の両側で使用増加しており、査読システムが崩壊しつつある」という記述がありますけれども、これは別に情報科学に限らず、ほかの分野でもすごくそうなってきているんではないかという気がするんですけれども、それでもう何か最近、TOP10%ジャーナルだとか、国際会議の格付のコアランクだとか、そういうのも本当にこのままで大丈夫なんだろうか、信用できるんだろうかという気もちょっとしてきているんですけれども、今回の調査に当たって、その辺りの肌感覚といいますか、その辺はいかがでしょうか。
【永野先生】 ありがとうございます。まさにどの分野でもこれは起き得る、起きつつあるかもしれないですが、情報科学分野において先行して生じています。やはり、コンピューター・計算で完結するような研究開発領域に関しては、よりこういった傾向が強いものと見ております。
【湊委員】 ありがとうございます。
【相澤主査】 ありがとうございます。
では、若目田委員、よろしくお願いします。
【若目田委員】 若目田でございます。今日は説明ありがとうございました。私の専門とモチベーションはデータ利活用のほうになるので、データ戦略について伺いたいと思うんですけども、これは民間もそうなんですけれども、データを共有してみんなで使っていくと言われるのは簡単なんですけれども、これは本当に進んでいない国だと思っています。
今、国全体の中でも、AIに対してデータ政策が両輪だということで、利活用に向けた制度改定がされようとしていると思っています。特に個人データに関しても、AIのモデル開発等々に関して言うと、同意によらずに集約できる、そのような戦略が打ち出されるであろうとなっているわけでして、そういう意味では国家戦略に相当するものもしくは科学技術の構造を転換するレベルということであれば、データをどうやって集めるかというよりも、研究機関に必要な、例えば全ての金融機関のデータとか、全ての国民の移動履歴とか、そういうレベルで必要であれば、それをどうやって獲得するのかということを戦略的に、そういう制度改善も含めて議論する時期ではないかなと思っています。
あと、もともと学術に関して言えば、その研究・学術利用というものは適用除外ということで、我々民間以上に優先的に使えるはずなんですけれども、そういった部分が果たして十分に生かされてきているのかというところの見直しも含めて、そのデータ、要はAIの今回の戦略に必要なデータというものを徹底的に集める。研究者一人一人ではなく、もうアカデミア全体としてどうやって集約するかというぐらいに考えるタイミングではないかと思っていまして、幾つか、そういう意味では「ジェネシス・ミッション」の中にデータセットの整備ということが書かれていましたので、その辺の動向を何か参考になる部分があればまた教えていただきたいというのと、もう一つは、オープンということと相反するんですけれども、恐らく民間と産学の連携といったときに、民間から見ると、データの秘匿の問題というのは非常に重要ではないかなと思っています。
もしくは研究における安全保障の問題とかということで、むしろオープンということと並行して秘匿されて、でも研究成果を得るという、この関係が重要だと思いますので、そういうコンフィデンシャルコンピューティングとか、PETsのような動向とか、もしこのレポートの中で何かあるのであれば教えていただきたいなという2点でございます。
【永野先生】 ありがとうございます。主要各国の動きを見ておりますと、国として特定の分野を指定するということがポイントになってきています。国として機微な産業であり、領域でありということを指定する。そこを選んでデータの取扱いや範囲に関する取り組みをより注力していくということが一つの考え方だと思います。
また、秘匿計算などを組み合わせてやっていくというときにも、一方で計算パワーとの関係でなかなか思ったとおりの使い方をすることは簡単ではないといった状況がまだあるものと認識しておりますので、こういった技術的な側の発展とともに、データの取扱いに関する戦略や線引きをつくっていくことが大事なのではないかと、各国の動きからはそのように見ております。
【若目田委員】 ありがとうございます。
【相澤主査】 ありがとうございました。
【相澤主査】 では、大武委員、お願いいたします。
【大武委員】 最後に少しだけ。AIというキーワードで今回報告書をまとめられています。昨年、データ共有に関する国際会議という、International Data Weekというのがあって参加して参りました。オープンデータというキーワードもありますが、最近はオープンと言わずに、FAIRという言葉でも言い換えています。Findable, Accessible, Interoperable and Reusableというキーワードに言い換えることで、全部がオープンできるわけではなくて、戦略的にオープンしたりクローズしたりすることを指すとワーディングされています。この報告書にFAIRというキーワードが出てこないので、データ研究の文脈だともう使い古されていますが、AIといったときに、まだ割とふわっとしていて、ワーディングがあまり確立していないように思われます。要は科学データの利活用の文脈で何十年も議論している人たちがいて、それでそういうワーディングがされている状況もあるので、その文脈の言葉を用語として使うと、課題が整理できるのかなと思いました。
あとは、AIでとにかくどんどん、もともと散らかっているものがさらに散らかるというか、信じられるものと非常に不審なものが混ざった状態になっています。まず科学研究の進め方として、例えば、これは信頼ができるとか、これは自分でやったとか、これはAIに聞きましたとか、何かやりながらみんなが片づけられる基盤、日本としてはデータや知識、AIを片づけますと、そういうプロトコルなり、置き場所を決める、ラボレベル、個人レベルでも置き場所を決める、それが組織レベル、国レベル、できればその置き方をみんなに共有していけるとよいです。AIモデルも本当に怪しいモデルから信頼できるモデルまであります。あと信頼できてもすぐまた古くなります。今のバージョン管理のような計算科学のやり方もあると思います。そういう、どれを使ってどのバージョンで何をしてどうなったと手続きを記述する透明性が重要です。プロセスを含めて、やっている人自身も理解して、それが周りの人も分かるという状態をつくり出すのが、特に過渡期なので必要です。多分これで完成ということはあり得ないとすると、後で変わるけれども、このときこれでこうやりました、その得られた知見はこうです、でも10年後は変わるかもしれませんといったことが、分かるように科学研究を進める仕組みがすごく重要なのではないかと考えます。自分自身も研究を推進して、データを集めて、、片づけないといけないという危機感があります。データやAIモデルが氾濫する世の中になってきたので、ますますみんなで意識して片づける必要があります。多分大なり小なり、片付いていない状態になっていると思いますので、整理しながら研究を進める仕組みづくりを戦略的にやる必要があると思っております。
【相澤主査】 ありがとうございます。AI収集データなども課題になるかと思います。ありがとうございました。
続きまして、阿部参事官より、文部科学省における検討状況について御説明をいただきます。では、どうぞよろしくお願いします。
【阿部参事官】 資料3-3を御覧ください。全体としましては2部構成になっていまして、前半がこれまでの議論の整理と現状の御報告、後半に戦略方針の方向性について御議論用の資料を入れているという構成になっています。
まず、3ページ目のところになりますが、これは前回の会議でも出させていただいている資料ですので、読み上げることは省略しますが、こういった基本的な取組の考え方なども示しながら議論を進めてきたという状況で、文科省では100人以上の有識者の方にヒアリングをしながらいろいろ検討を深めてきたという中で、4ページにあるような今後の方向性と課題等ということを一回整理し、丸1から丸6のような項目立てで整理を図ってみたというのが前回までの議論でした。
この丸1、まず研究の部分につきましては、5ページ目にあるような形で、各国はリソースを戦略的に使っているという中で、日本としても研究をどう強化していくのかということが課題という中で、一つ、予算のところでも御報告しましたけれども、6ページ目にありますとおり、今回新たなファンディング事業を立ち上げたというところでございます。こちらにつきましては、勝ち筋となる重点分野、世界と戦うような、そういった大きなプロジェクト型の研究を進めるというものに対して、320億円、3年間の基金事業というものが立ち上がったというところ。それからもう一つが、あらゆる分野でAI for Scienceを発展・普及させていくということで、そういったチャレンジをするための枠組みとして、50億円の枠組みが設立されたという状況でございます。
今日は、特にチャレンジ型について、問合せも多いところ、少し御説明の資料を入れております。7ページ目を御覧ください。人文・社会科学系を含めましてあらゆる分野の研究者がAIを活用して科学研究の高度化・加速化を図っていくということが必要だろうということで、意欲のある研究者による次の芽や種となるような新しいアイデアに挑戦する枠組みを今回設けたいというところで考えているものでございます。
イメージとしましては、この三角形の上のトップ層はもう既にやっていらっしゃるというところになりますので、もう少し下のところです。ここでは丸3と書いてありますが、AIに関心があり、今後のAI活用により研究加速を考えているとか、まだ少しノウハウが足りていないかなという層に対して、是非こういった枠組みを活用しながらさらなる研究の加速が図られたらと考えているものでございます。
具体的には、左下にあるとおり、予算規模として1件当たり大体500万円程度、それを年2回の公募によりまして迅速な支援を確立したいということで、採択件数として大体1,000件程度を取れたらということを今考えて制度をつくっている状況でございます。
次のページに、具体的な研究テーマとしてどんなことが考えられるのかということのイメージが何となくあったほうがいいかなということでつくっているものですけれども、絵はアメリカのNAIRR pilotのプロジェクトでこんな事業がされていますという紹介ですが、あらゆる分野ですので、個別具体的なテーマについてはなかなか申し上げにくいんですけれども、例えば分類のイメージとしては、丸1から丸8、丸9のようなものが恐らく提案として様々出てくるのではないかということをイメージしているものでございます。
続きまして、丸2として、データ周りの話になります。こちらについても、より多くの研究者がAIを活用した研究環境をちゃんと構築する必要があるというところで、海外のような大規模なオートメーション/クラウドラボが必要ではないかということであったり、また研究大学等にあります最先端の研究設備・機器といったものを刷新して共用を図り、AI-Readyなデータをどんどん流していく必要があろうということをお示ししていたところです。
これにつきましても、補正予算で、まず10ページ目、大規模オートメーション/クラウドラボに関して42億円、それから先端研究基盤刷新事業ということで、11ページ目にありますけれども、通称EPOCHと呼んでいる事業になりますが、これも基金事業として530億円措置されたということで、これからこういった動きが強化されていくという状況にございます。
続いて12ページ目、計算資源の部分でございます。AIの研究をしようとしますと、膨大な計算資源が必要だということで、日本ではまだまだ足りないところがありますので、戦略的な計算資源の増強を図りつつ効率的な分配を考えなければならないというところでございます。
これにつきましては、13ページ目にありますとおり、補正予算が76億円措置されていまして、まずは第一弾というところかと思いますけれども、現在、アカデミア中心に使っておりますHPCIの共用計算資源を増強していく取組をまず一歩進めていこうということで考えているものでございます。
それから、そういったところから出てくるデータになりますが、研究データ基盤として、現在NIIにRDCが既にありますけれども、ここをAI対応可能な形に高度化していく必要があるところでございます。
それにつきましては、16ページ目にありますとおり、まず事前の先行事例やニーズの調査をしつつ、メタデータ付与機能を先行して開発するという取組に着手するということを始めていこうとしている状況でございます。
それから、データの流通基盤のところが17ページ目になります。SINETです。ここにつきましては、今日ほかのところで御紹介がありましたとおり、これから検討していくということで、令和10年に高度化の期限がちょうど来ますので、そこに向けて議論を加速していきたいと考えているものです。
それから、人材のところが18ページ目になります。様々な人材プログラムが文科省にはありますけれども、ここにつきましても新しい動きが出てきている中で、研究の取組と一体となってこの人材育成をさらに強化していく必要があろうかと捉えているところでございます。
それから、国際連携の関係でございます。今日も御議論があるところだと思っておりますが、世界のトップとの互恵的な連携・協働を積極的に進めることが国際競争力を向上していくためには重要な点ではないかということで、国・地域別の強みであったり、また研究動向を適時把握しながら、国・地域別の対話を進めていくことが必要ではないかということで、戦略的な取組といったものをどうしていこうかというのが非常に大きな課題の一つかなと捉えているところでございます。
これにつきましては、アメリカとの関係で言いますと、2024年に日米間でAI for Scienceの連携の枠組みができている中で、理化学研究所がアメリカのアルゴンヌ国立研究所との研究等を始めているところにありますけれども、各国でいろいろな動きがありますので、この国際協力をどういう形で日本として何をやっていくのかというのが大きな課題の一つだと認識しております。
それから、研究投資のところにつきましては、22ページ目を御覧ください。これはAI for Scienceだけではなくて、AI全体の政府全体の予算になりますが、補正予算全体としましては4,000億円強の予算が措置されております。その中で、文科省AI for Science関連経費としては1,500億円ほどが今回措置されているという中で、引き続きしっかりと予算を確保しながら取組を強化していく必要があろうかと考えているところです。
それから、丸6として、推進体制の構築というところになります。こちらは24ページ目を御覧ください。新しい資料になりますけれども、AI for Scienceを戦略的に推進していく必要があるということで、AI for Scienceの推進に向けた基本的な戦略方針を年度内につくる方向性に今なってございます。それに向けまして、文科省にAI for Science推進委員会を新たに設置して、議論を加速したいと考えている状況でございます。こういった取組を強化していきながら、またこの戦略的な国際連携であったり、今日御議論がありますとおり、データの扱いなどについても、しっかりと議論しながら検討を深めていくということができればと考えているところです。
これにつきましては、25ページ目にありますとおり、第7期科学技術・イノベーション基本計画が来年度から開始されるというところでございます。また、AI基本計画が策定されたという中で、そういったことを踏まえながら基本的な戦略方針をつくり、また320億円の基金事業が立ち上がるところでございますので、そのための基本方針をつくっていくということが必要な状況でございます。
それから、工程表、ここは資料がまだ更新されておりませんので、省略いたします。
27ページ目以降が、基本的な戦略方針の方向性ということでまとめているものでございます。まず28ページ目、「はじめに」ということで背景等々が書いてありますが、ここにつきましては、これまでの委員会での議論等を踏まえまして、その頃書いていた文章を少しまとめ直したところですので、改めて読み上げることはしませんけれども、世界動向、それから国内でも法律等々もできている状況の中で、日本としてどういったことをやっていかなければいけないのかというところが大きな喫緊の課題としてあり、スピード感を持って取り組むことが不可欠だというところを書いてございます。
では、海外はどうかということで、こちらもこれまで御紹介しているところでありますので、繰り返しの説明は避けますけれども、2025年、各国でAIに関する戦略が出ている。さらには、30ページ目にありますとおり、アメリカでは「ジェネシス・ミッション」が発表されたということ。
さらに、31ページ目にありますとおり、イギリスにおいても昨年の11月、AI for Science Strategyということで、具体的な15項目のアクションが書かれたこういったペーパーも発表されているという状況でございます。
また、32ページ目にありますとおり、各国がどういうところを重点分野としているのかを一覧にまとめたものがこちらになります。各国の詳細につきましては、後ろの参考資料に落とし込んでおりますので、ご参照いただければと思いますけれども、重点分野、各国の事情、状況、戦略に応じまして、どこを重点にしようとしているのかというものがそれぞれの国の状況に応じて違うというところでございます。
こういったことを頭に置きながら、33ページ目、日本の強みというところ、これも前回までの議論でいろいろ御指摘いただいているところを少し文章を膨らませておりますけれども、情報基盤があるとか、観測データ、実験データ、そういった信頼性高いデータがあるということであったり、基礎科学があるとか、そういったことを記載しているところです。これらを踏まえますと、例えばということで下に記載してありますとおり、先端装置や研究現場、そしてAIを有機的に結合させて、計算資源の規模やスピードのみの競争として争っていくのではなくて、研究の再現性や信頼性、深度といったものを重視しながら、それらをAIによって拡張する、こういった構造優位をつくっていくということ、また国際エコシステムにおいて不可欠なパートナーとなっていくということ、こういったことを意識する必要があるのではないかということ、そして、AI for Scienceを通じまして、世界の科学研究にとって不可欠なデータとか、研究基盤であったり、研究プロセス、こういったものを提供していくような立場というものが一つあるのではないかと。これによりまして国際競争と国際協力といったものを両立させていくということが、戦略的自立性という観点でも必要ではないかということを問題提起として書かせていただいております。
34ページ目は、日本の現状等ということで、こちらも先ほども御紹介があったとおり、日本の今のランキングの状況であったり、また計算資源、GPU資源がどの程度あるかとか、予算投資の状況を記載、まとめているものでございます。
これらの背景をもう一度改めてまとめ直したのが35ページ目になりますが、基本計画があり、その中では、科学技術推進システムを刷新して科学技術政策の大転換を図るんだというのが第7期の方針として出されておりまして、レイヤー構造とか分野・組織を超えた連携とか、データ基盤整備というものが出されております。一方、AI基本計画においては、世界で最もAIを開発・活用しやすい国を目指すという方針が出されている。その中で、日本の強み、日本の現状、課題というものを端的にまとめますと、ここに記載のようなところかなということがありまして、また海外の動向があるということを意識しながら、次のページから、全体の方向性のところを少し書き下してみたものがございます。
全体の方向性のところにつきましては、上のほうに書いてありますけれども、研究環境をAIで刷新するとか、研究システム・プロセスをAIで変革するとか、研究の在り方そのものをAIで革新していくとか、そしてAI for Science時代の組織として変革していくということが大きな方向性なのかと思います。
その上で、この政策的な目的というものを書いてみたものでございます。3つ掲げておりますが、1つ目は、科学研究の革新と科学的発見の加速・質の変革、2つ目は、研究力の抜本的強化と科学の再興、そして3つ目は、国際的優位性・戦略的自立性の確保というところにまとめられるのではないかということで書いてみたものでございます。
この目的に対しまして、具体的な目標と手段を37ページ目に記載しております。目標は、大きく2つに分けてございますが、AI研究力の強化・人材の確保という点、2つ目が、AI for Scienceを支える研究基盤の構築ということでまとめております。ここの目標は、細かいところを読み上げると時間もあれなので、眺めていただければと思いますけれども、AI利活用の促進、研究プロセスの変革であったり、AI技術そのものをどう確保・発展させていくのかということ、特に研究の観点で言えば、AIの専門家と分野の専門家が協業していく体制をいかに構築していくのかというのが大きな課題の一つかと思いますし、また次世代のAI人材の育成と若手研究者の活躍の促進というのが非常に重要な目標になってくるのではないかという点。さらには、計算資源、データ、そして流通基盤、これらを統合した研究プラットフォーム化が必要ではないかということとか、計算資源に機動的にアクセスできるような一体的な集約・分散システムの確立とか、また高品質なデータを継続的に創出・利活用するシステムといったものをつくっていく必要があるのではないかということで目標に記載してございます。
これらの目標に対して具体的な手段ということで書いているのが下のところになります。ここは3つの柱立てになっています。AI研究力向上・人材育成の推進という点、計算資源の戦略的増強・利便性の向上という点、そして高品質データの創出と一元化ということで記載しております。
この3つに加えて、下に少し米書きしておりますけれども、この研究成果を迅速に社会還流、産業競争力の強化につなげていくという点であったり、またKPI等に基づきまして進捗管理をしながら柔軟な戦略の見直しということも図っていく必要があろうかなと考えているところでございます。
次のページに、こういったものを進めていくときの障壁、課題であったり、今後さらに検討を深めていかなければならないことがあるだろうということで、今後の課題等ということでまとめているのが38ページ目になります。AI研究力・人材の項目と、計算資源の関係と、研究データの話、そして4つ目として横断的課題とガバナンスの観点でまとめているものになります。
まず上のところ、研究力や人材については、意識改革と行動変容をしていかなければならないという点であったり、分野・組織の垣根を越えた連携やコミュニティの形成、そして専門家同士をつなぐようなマッチングも必要だろうということ。それから、人件費の話、給与水準の話とか、処遇の話もありますし、評価制度の話もいろいろありますので、そういった制度絡みの改革も必要だろうという点。それから、AIの関係、これまでもコメントをいただいていますけれども、透明性、信頼性、安全性、さらにこの説明可能性の確保ということが必要だろうということで、膨大な科学データの活用等を進めるに当たりまして、信頼できる、信頼されるAIの開発ということをしっかり考えなければならないのかなというのが課題としてあるのかと思います。
計算資源につきましても、オールジャパン体制で国全体として統合的な計算資源をどう整備・活用していくのかというのも課題だと思いますし、民間企業のデータ、それから海外機関との相互利用、協力体制といったことの構築。さらには、AI for Science時代に対応した計算基盤をどう構築していくのかということも考えなければいけないところもあろうかと考えております。
それから研究データにつきましては、現在、日本においては、データはあるところにはあるんですけれども、それが散在しているという状況かと思いますので、この一元的な把握とアクセスの確保をどう考えていくのかとか、またこの安全かつ効率的な保管・利活用を支えるようなインフラをどう構築していくのかということ。また、今日もこれまでもコメントをいただいているところですけれども、オープンサイエンスの観点とデータの秘匿性等を踏まえたオープン・アンド・クローズ戦略の両立をどう考えていくのかというところもあろうかと思います。
それから、下に移りますけれども、AI for Scienceを前提とした研究環境・プロセスの再構築、AIトランスフォーメーション、ここをしっかりと進めていくということ。また、大胆な投資であったり、その継続的な資金投入をどう確保していくかという話。さらに、研究インテグリティやセキュリティの観点、そしてリスクへどう対応していくのかということ。そして、国際競争は非常に激化しておりますので、改革のスピードが非常に重要な点かなと考えているところです。こういった課題に、さらに議論を深めながら、全体としての戦略を考えていく必要があろうかということで今日の資料としてまとめているところです。
以下、参考資料を入れておりますけれども、これまでも使った資料でございますので、ここでの説明は省略させていただきます。
以上になります。
【相澤主査】 ありがとうございました。
第7期の科学技術・イノベーション基本計画の5年間でAI for Scienceをどのように推進していくか、方策、方針を議論して、それを詳細化していくという非常に重要な時期にいるということになります。ここで、ただいま御紹介いただいた内容を踏まえまして、さらに推進に向けた方策等について御意見をいただければと思います。また、先ほどの永野フェローへの御発言に関する追加の御意見も承りますので、挙手にて、よろしくお願いいたします。
では、天野委員、よろしくお願いします。
【天野委員】 ありがとうございました。やはり僕は計算基盤の整備というところに興味はあるんですけれども、今のお話だと、HPCI、今の枠組みを単純に増強していくみたいな感じで捉えることができたんですけれども、今までのハイパフォーマンスコンピューティングのための計算基盤整備とAI用の計算基盤整備というのは性質がかなり違うのかなと思うんですが、その辺はいかがでしょうか。
【阿部参事官】 これは個々に返していったほうがよろしいですか。時間の都合もあるので、一通り先生方からお話しいただいたほうがよろしいかなと思います。
【相澤主査】 分かりました。では、引き続き、御意見がありましたら順番にお伺いしたいと思いますので、挙手にて、よろしくお願いいたします。
小林委員、よろしくお願いいたします。
【小林委員】 私も今の天野先生の御意見と近いところでして、せっかく新たなAI基盤をつくるというのであれば、これまでのHPCIの単なる拡張ではなくて、利用環境の整備をかなり高度化して、例えば電力事業ですと、発電とサービスが分離しておりますけれども、その運用主体とあるいはサービスの部分を切り分けるなどとして、統一的な利用環境をつくるといった、少し大胆な整備を期待したいところです。
以上です。
【相澤主査】 ありがとうございます。
では、大武委員、よろしくお願いいたします。
【大武委員】 今、非常に競争が激しくなっていて、改革のスピードというところが一番重要だと思います。これを実現するために一番大事なことは、いかに内部摩擦を減らすかというところです。大きなプロジェクトがあると、必ず説明するための資料をたくさん作っていて、それは国際的に発信されるわけでもなく、中だけで閉じている。そんなことをやっている暇があったら、それこそAIが分かる説明文書を作るとか、そういう本当に科学が進むことに役に立つことに、一分でも一秒でも時間を使うことが一番大事です。
ですから、いかに研究が進むかということ以外の作業を、予算を動かしながら、一番後世に残るデータなり文書なりを作ることに力が使える仕組みをつくるのが恐らく一番重要です。運営する側も実施する側も、これは内部摩擦だと分かったら、これはもうやめましょうとか、報告書もなるべく薄くしましょうとか、計画書もできればなるべく薄くして、その代わり、それを実現するところの作業にどれだけ時間をかけられるかと。そこが今までも言われてきていることではあるのですけれども、これだけスピードが求められる時代になって、ますますそれが戦略的に重要になるのです。
例えば私も、最近報告書を書くシーズンで、例えば研究員を評価しますというときに、研究員はいっぱい報告を書くんですけれども、私も結構前はいっぱい評価コメントを書いていたんです。これからは、報告事項はたくさんあるけれども、要約するとこれが一番重要な成果であると私は書くことにしようと決めました。そうすると読む時間も書く時間もセーブできる。そこに時間を使うのではなくて、もっと違う、前に進めることに時間が使えます。研究者自身も評価者自身も、今は急がないといけないので、余計なことをやっている時間はないという認識と危機感を、みんなが持つことが大変重要ではないかと考えています。
こういう大きな予算がつくと、必ず説明責任が出てくると思います。その説明をどうやるか、どう合理的に責任を果たすかと。何も言わないわけにはいかないので、何か書かないといけないし、説明も要ると思います。そのやり方を誤り、説明するために多くの時間を使うと、本末転倒になることをふまえ、ぜひ効率的に説明責任を果たす仕組みも一緒に考えていけたら、スピードが実現できると思います。
【相澤主査】 ありがとうございます。
それでは、川添委員、中野委員の順番で行きます。川添委員、よろしくお願いいたします。
【川添委員】 ありがとうございます。コメントという形で話をしたいと思うんですけれども、今御説明していただいた資料の中にも、いわゆる説明可能性の確保というキーワードがありますが、これはいろいろ今議論があると思うんですけれども、今やもうAIが人間を超えるような知見を生み出しているというところを踏まえて考えると、必ずしも人間が理解してそれを説明できるということは、かなり難しい領域に入ってきているというものですよね。その場合、ではどうするかと考えれば、結局どのように導いたかというプロセスをちゃんと説明できるということになると思うんです。
その際に、まさにAIの利用という中で、先ほども言ったコメントにかなり近くなってしまうんですけれども、既存のアーキテクチャー、アルゴリズム、それに基づくモデルを単に利用するだけだと、そこの部分はブラックボックスになったり、あるいは自分自身がつくったものではないということになりますから、そこの部分をいかにつくっていくことが、まさにそのAIの競争力を高める上でも非常に重要だと思うんです。この部分を日本としては、ずっと米国などでつくられてきたトランスフォーマーをはじめとするああいうアーキテクチャーの利用者であり続けるということはやはりよくないと思いますので、その辺をぜひ強化してほしいなと思います。
私は、AI for ScienceとScience for AIは表裏一体だと思うんですよね。だから、資料の中にありましたように、AI自体を今までのサイエンスの知見を利用してつくっていくこと、41ページにあるAIそのものの研究開発というところについても、それをどのようにやるかというやり方も含めて、今後議論していく必要があるんではないかなと思います。
以上です。ありがとうございました。
【相澤主査】 ありがとうございます。
では、中野委員、よろしくお願いします。
【中野委員】 すみません。この37ページにある目標と手段というのは、すごく納得できるというか、まさにこれをやらないといけないなと思ってお聞きしていたんですけれども、ただ私から見ると、手段はまだ目標に近いように見えてしまっていて、手段というのはもう少し具体化したロードマップみたいなものがあるといいのかなと。要するに、この手段に書かれていること、手段とはこうすればできるってことですよね。でも、ここには、例えば、AIそのものの研究の強化と書いてあって、強化はもちろん大事なんだけれども、ではどうするかというところが、まだ少し見えていないというか、具体化されていないのかなと私には見えてしまったんですけれども。
では、それを実現するために、国としてどういうプロジェクトを推進するのかということで、例えば前半のところの6ページとか7ページ、これは補正予算の部分だと思うんですけれども、革新プログラム、プロジェクト型とかチャレンジ型とかと書いてあるんですが、例えばこういうプロジェクトの中で、その目標、手段と言われているようなものがどのように実装されていくのかという、そこの連続性が見えてくると、この革新プログラムなりなんなりを、どういうところにより焦点を当てて研究を募集していくかというところも、目標に向かって、目標を見ながら前進していけるように思ったんです。
質問としては、今日お話しいただいた目標とか手段と、例えばこのチャレンジ型とかプロジェクト型というプロジェクトの立案というかコンセプトというのが具体的にどのようにリンクしているのか、教えていただけますでしょうか。
【相澤主査】 ありがとうございます。御質問は書き留めておいていただきまして、最後のところでまとめて御返答という形にしたいと思います。中野先生、ありがとうございました。
では、若目田委員、よろしくお願いします。
【若目田委員】 2点ございます。1点は、先ほどもコメントがありましたけれども、報告の時間の問題とかというのは結構重要ではないかと私、個人的に思っております。今回その人材育成の話があったと思うんですけれども、どういう人を育成するかということに加えて、もう一つは人材のモチベーション、研究者を動かす仕組み、インセンティブ、こういったことも併せて考えることの必要性というのと、あと研究の基盤の構築に加えて、いわゆる研究という仕事を、そのプロセスもよく分析した上で、当然、合理化ではないといえども、プロセスの合理化ということも含めて、多分基盤というものがこういう点もあると思いますので、その4つです。
研究基盤の充実性に加えて研究プロセスの最適化、人材育成に加えてその人材のモチベーション、そういったもの全部をモニタリングする仕組み、多分そういったものをセットで人材育成とか、この施策の実効性を出していくべきではないかなとちょっと思いました。どこかのところに行動変容とか研究者の意識改革とあったと思いますけれども、多分その行動変容と意識改革は、それが全てそろって初めてできることではないかな。いい基盤があっても、多分行動変容とか意識改革までは進まないと思います。
もう一つは、非常にいいなという部分、そのコメントをいただきたい事項のところにもありましたけれども、今回、データ戦略に関して、その品質に関して注目していくという強みを生かすという部分と、もう一つは、オープンということだけではなく、多分クローズにすることによってむしろ推進されることは結構あるかと思いますので、データに関して、クローズもしくは秘匿であったり、品質という個人データにおける扱い、こういったものが、もう研究者が悩まなくともクリアになっている部分というのはとても重要じゃないかなと思いましたので、データ戦略にクローズの部分というのが書かれたのは非常に評価できるかなと思います。
以上です。
【相澤主査】 ありがとうございます。
では、引原委員、尾上委員、星野委員、湊委員、石田委員と5名挙手いただいておりますが、本日は時間も厳しくなってまいりましたので、この5名ということで順番にお願いしたいと思います。よろしくお願いします。
【引原委員】 引原です。よろしくお願いします。今、若目田先生がおっしゃったようなデータ戦略というのは明確にはなってきているんですが、データを大切にすると言いながら、年貢のようにデータを出せという状況がどうも見えてしまうんです。
それで、問題は、データに対する所有権と利用権というのが明確になっていない、日本では特に明確になっていないと思います。それで、その許諾を誰がするのか、あるいは認証を誰がするのかということが曖昧なままデータ戦略は打たれていると思います。これを明確にしないと、モデルの中に組み込まれたから、そのデータは関係ないですということで逃げられてしまう。それは、モデル自身はもう知財なわけです。だから、根本の部分を守るということが不正競争防止法では無理だと思います。そこのところを抜きにして、データ戦略をこれでAI for Scienceとやったときに、結局は釣りモデルで持っていかれてしまうということになりかねないということをコメントさせていただきます。
【相澤主査】 ありがとうございました。
では、尾上委員、よろしくお願いいたします。
【尾上主査代理】 38ページの今後の課題のところで「激化する国際競争に対する改革のスピード」と書いていただいていますが、これはすごく重要だと思っていまして、例えば科学研究革新プログラムのチャレンジ型、これは1,000件、500件ずつ出すとした場合に、それらの成果が主に日本国内の研究者コミュニティの中にいかに早くフィードバックされるかというのはすごく重要だと思っていますので、これは一般的なプロジェクトとかの成果が目に見えてきたというタイミングでないタイミングでうまく共有できるように、件数が多いので大変だと思いますけれども、何か工夫とか仕組みをぜひつくっていただければと思います。
【相澤主査】 ありがとうございます。
では、星野委員、よろしくお願いいたします。
【星野委員】 ありがとうございます。2点ございまして、まず7ページのチャレンジ型プログラムはすばらしいと思っておりまして、1,000件、薄く500万というのは、かえってこれはなかなか非常にすばらしいと思っておりまして、ここまでやれば結構かなり独自なものが出てくるチャンスはあるんではないかと思っております。ですので、我が国を代表するような、例えばライフサイエンスとか素材とかというのは、もちろんそこを重点化とやることは必要かと思いますが、多分いろいろアイデアがあって、ここで何かとがったアイデアが結構出てきたときに、次、例えば3,000万とか5,000万とかでそこを育成するようなことができると、そのような懐の深さがあると、次にまた新しいネタが出てくると思いまして、そういったものを御用意いただけないかというのは私としては非常に思っております。
あともう1点は、また38ページ辺りに課題の話がございます。これは先ほどの若目田委員もおっしゃったと思いまして、私も前回ぐらいに申し上げたと思いますけれども、データとかノウハウを出すためとか、あとAI研究者とフィジカルな分野の研究者が共同研究をするためのインセンティブ設計を頑張っていただきたいというところがございます。
関連して、これもオープン・アンド・クローズ、先ほど若目田先生がおっしゃいましたけれども、前から申し上げているかもしれませんけれども、論文の根拠データというのは、つまり論文になって成功したデータなわけですよね。この実験パラメータでうまくいったと。でも、結構失敗したところを皆さんは当然出さないわけなので、それが実はある意味のノウハウなわけなので、そこら辺を何か、それこそクローズドで、国内の研究者とか海外の一定の研究機関だけでは共有した形で、失敗データを出させるような仕組み、つまり次に無駄なことをさせないような形のこのものというのは非常に大事ではないかと。
これは御存じかもしれませんけれども、メタ分析とかでありますけれども、出版バイアスみたいな話とも結局共通するようなところで、なかなか、うまくいったところだけしか普通は出さないというところが、かえって逆に様々なネガティブな問題を引き起こすので、ここでちゃんとしたデータを全て取ったものを全部出すということに対してうまくインセンティブを出すようなことができるとよいかなと思っております。
ありがとうございました。
【相澤主査】 ありがとうございます。
では、湊委員、よろしくお願いいたします。
【湊委員】 先ほどの37ページの目標と手段のところなんですけれども、手段の話はもういろいろあると思うんですけれども、この目標のところも、AI研究力の強化というのが、何ができたら強化できたことになるのかというのが、私も自分でもよく分からないところがありまして、さっきも言いましたけれども、論文の投稿数とかも、国際会議で1,000件だったのが1万件台になったりとか、たくさん論文が出ればいいのかというとそういうわけでもないでしょうし、ではノーベル賞が出ればいいのかというのも、その結果としてノーベル賞にはなると思うんですけれども、何ができたら研究力が強化できたことになるのかというのもちょっと疑問に思っています。
例えば食料とか化石燃料とかを輸入しなければいけないので、その外貨を稼げるような研究ができたらいいのかとか、ムーンショットとかでいろいろ大きな目標みたいな研究テーマとかはありますけれども、結局この研究力の強化というのが、最終的に何をもって強化できたかどうかというところがちょっと疑問に思いましたので、その辺を質問したいと思います。
【相澤主査】 ありがとうございます。
では、先に石田委員から、よろしくお願いいたします。
【石田委員】 石田です。私は、先ほどほかの委員もおっしゃっていましたけれども、チャレンジ型プログラムというのは非常にいいアイデアだなと思っております。と言いますのも、多分これは、AIの裾野を広げるというか、AIを活用した研究をする人の裾野を広げるという意味で役に立つのではないかなと思うんです。
まだあまりAIに詳しくない人たちというのは、AIで何ができて、どういったツールがあるのかというところをまだ迷っていらっしゃる方もいるんではないかなと思いますので、もう一つの目標として挙げていた人材育成の部分ではぜひ、コンサルと言うとちょっと言い過ぎなのかもしれませんけれども、研究にAIを導入するための支援をする人であるとか、もちろんそこにはデータも使うということになるので、そういったことを支援する方も人材育成の一つとして入れていただくといいのではないかなと思いました。
あと、ツールがたくさんあるので、ぜひそこに国産のものが早く使えるようになるとよいなと思っております。
以上です。
【相澤主査】 ありがとうございました。
では、多数の御意見、御質問をいただいたところで、限られた時間とはなりますが、参事官から簡単にフィードバックをお願いいたします。
【阿部参事官】 いろいろとコメントをいただき、ありがとうございました。時間が限られますので、全部について御回答できるかどうかは少しありますけれども、計算資源については、後ほど室長の栗原から少し発言いただきたいと思います。
まずチャレンジ型は、いろいろとコメントをいただいてありがとうございます。これは、36ページ目のところに三角形を入れておりますけれども、このトップを引き伸ばして世界を先導する科学研究成果を創出していくというのは、プロジェクト型のほうでやっていくということ。この下のところ、AI for Scienceの波及・振興によって科学研究力の底上げ、裾野、横を広げていくというところのイメージが、チャレンジ型というところで御理解いただければと思います。当然ながら、中でいろいろなチャレンジをしますので、いろいろな成果も期待されるところでありますけれども、全体のイメージとしてはそういうことで今回制度を設計しているところでございます。
また、具体的な目標に近いロードマップが必要ではないかといったコメント、それから手段としてもう少し具体的にというコメントをいただいたかと思います。御指摘のとおりでして、今日は目的と目標と手段というところまでを書き下したものを提示させていただきましたが、ここにさらにそれを具体的にどうしていくのかというアクションが必要だと認識しておりまして、今日の資料にイギリスのアクション、こういうものが発表されていますという御紹介をしておりますけれども、ああいった形で何かしら、いつまでに誰が何をやるか、どれぐらいどうしていくのかというアクションを今後つくっていくことができればと考えているところでございます。
その関係で、ついでですけれども、最後のほうで、失敗データを生かす仕組みというものの重要性についてコメントをいただいたかと思います。これは何ページ目でしたか、イギリスのアクション5のところに、ダークデータを活用していくんだというものが紹介されております。これは、非常にユニークというか、ほかの国であまり見ないなと思ったところでありますけれども、こういうものも少し注目しながら、いただいたコメントを踏まえながら何かしら考えることが必要ではないかということを感じたところでございます。
それと、人材のところの関係は、御指摘のとおりでございまして、まだまだこの部分は議論できていない部分もありますし、研究開発の観点だけでない観点がありますので、また幅広い観点での議論が必要かと認識しております。
それから、AI for ScienceとScience for AIは表裏一体、そのとおりだと思っておりまして、これはよく指摘を私も受けるんですけれども、キーワードとしてAI for Scienceと掲げておりますけれども、意味合いとしましては、AIそのものの研究も必要でしょうし、Science for AIという観点、これらが包含された形でやっていく、取り組んでいくということが絶対的に必要だと思っておりますので、そういったことが分かるように、しっかりとアクションのほうも書けるようにしていきたいなと思っております。
それと、あとは幅広くコメントをいただいたところにつきましては、コメントを踏まえてさらなる議論ができるように、引き続き検討していきたいと思っております。全体に回答できているかどうかは怪しいですけれども、一旦ここまでとさせていただきたいと思います。
【栗原計算科学推進室長】 では、計算資源の部分に関して、計算科学推進室長、栗原でございます。天野委員、小林委員から主に御指摘をいただきましたけれども、計算資源に関して御指摘ありがとうございます。特にこれまでのHPCIではなくという御指摘をいただきました。科学プロセス全体を駆動するAI for Scienceの基盤としての要素としての計算資源の位置づけというところで、今までにないものをということ、まさに御指摘は本質だと考えています。
小林委員は発電や送電の発送電分離等に例えられましたけれども、まさにこれまでの計算力を、特にシミュレーションのための以前はベクトルマシン、またメニーコアのスカラーのマシン、そういった計算資源を無償で幅広く、日本の様々な学術の研究者を主体にして、産業界の一部の利用も含めて提供するHPCIの国があったんですけれども、それは単なる拡張ではなくというのはまさに本質でございまして、技術進化の速度がこれだけ大きく、またOSSのお話もございました、オープンソースソフトウェアのエコシステムも拡大していく中で、特にAIの利用がデータ利用と融合して、大きな形態の変化が伴ってきております。
今現在、HPCIでは、オープンオンデマンドでのウェブアクセスを使えるようにしたり、従来のバッチ処理でのシミュレーションのHPCの利用ではない形のドッカーコンテナとかシンギュラリティーコンテナの利用もできるようになっていますし、また申請や審査の制度も含めてHPCI計画推進委員会でも議論がなされているところです。
ポイントは、瑣末な細かな制度の改革を進めていくこと自体ではなくて、科学を加速するためのAI for Scienceのための利用形態の新たな変革を先導しなければいけないというところで、本日御説明の中でも、13ページに示したHPCIの共用計算資源の利用促進を図るための利用申請システムの抜本的な改修であるとか、またHPCI加盟機関等を交付先として想定した、2から3件程度、最大50億円程度での計算資源の整備というのは実はまさにそのためのものでございまして、運用ルールとか利用制度も変えていきますし、また見えない負担となっていたような申請に関する種々の障壁であったり、また申請のタイムラグもAIの時代にはそぐわないものになっています。またフロップスよりも、メモリ性能とか、ノード間通信とか、トークン支配的な能力の提供の点もございます。
これらの点も含めて、まさに御指摘の点も含めて、川添委員から御指摘があったような新しいプロセスをつくっていくような、そういった点も含めて、使いやすいユーザーインターフェースも変えていくということがこの資料にもございますけれども、HPCIの改革を進めてまいりたいと思っております。
ありがとうございます。
【相澤主査】 ありがとうございました。
では、ただいまいただいた御意見も踏まえましてさらに検討を進めてまいりますので、どうぞ引き続きよろしくお願いいたします。
では続きまして、議事4の情報分野研究開発プランの変更について、事務局から御説明をよろしくお願いいたします。なお、本議事への御質問は議事5の後に併せて承ります。
【轟木参事官補佐】 事務局、文部科学省情報参事官付補佐をしています轟木と申します。本日はよろしくお願いいたします。資料4に基づきまして、情報分野研究開発プランの変更について御説明させていただきたいと思います。
旧来、情報委員会においては、今回の資料でも参考資料4につけさせていただいておりますけれども、「第13期研究計画・評価分科会における研究開発課題の評価について」というところで、情報分野の研究開発プランを情報委員会において決定して、その情報分野研究開発プランに基づいて各事業について評価をしていただくということになってございます。このたび、令和7年度補正予算とか令和8年度当初予算において少しこの研究開発プランを変更したいと考えてございまして、それに関して御説明させていただければと思います。
資料4を改めて御覧ください。オレンジ色の部分がこれまでの研究開発プランからの変更点となってございます。今御説明もありましたとおり、2-6のところで、令和7年度補正予算において措置をされましたAI for Scienceによる科学研究革新プラン、これが令和7年度補正予算において措置をされてございますので、この情報分野研究開発プランに位置づけをしまして、この後議題5で議論をするところですけれども、事前評価をしていただきたいと思ってございます。
次、3ページ目を御覧いただきまして、ここで大きく修正点が3つございます。今御説明をしたとおり、プログラム(6)のところに、令和7年度補正予算において措置をされましたAI for Scienceプログラムについて記載するということ、これが表でいうところの右下の部分でございます。令和7年度、この後に事前評価をしていただいて、3年後、令和10年度を目途に中間評価、その後事後評価をしていただくというスケジュールを組んでございます。
続きまして2点目でございます。表でいうところの一番上の右上の辺りでございます、プログラム(1)と書かれているところでございまして、AIPプロジェクトにつきまして、これまで本委員会で事前評価、中間評価などなどを実施していただいていたところでございます。一方で、令和8年度当初予算におきまして、本事業については全額運営費交付金に移管することとなりました。これに伴いまして、本委員会での事後評価は実施しないこととしまして、理研の法人評価において、まさにこのAIPプロジェクトも含めて今後実施されることとなりますので、そこで事後評価を実施するということとしたく、この事後評価のところを消させていただいているという変更をしてございます。
最後は3点目でございます。ここでいうところのプログラム(4)でございます。HPCI(革新的ハイパフォーマンス・コンピューティング・インフラ)の運営というところですけれども、これは実は令和7年度、今年度、中間評価の実施を予定していたところですが、HPCI利用制度全体の議論等も踏まえまして、HPCI計画推進委員会で評価をしていただいた後、情報委員会で議論をしていただきたいということで、中間評価の時期を来年度に後ろ倒しさせていただいてございます。
計3点、研究開発プランの変更について御説明をさせていただきました。本日は少し時間の関係で御説明のみとさせていただいて、今後、本研究開発プランの意見がございましたら、書面審査という形を実施したいと思いますので、そこで御意見をいただければと思ってございます。
事務局からの説明は以上でございます。
【相澤主査】 ありがとうございました。
それでは、最後の議題に移ります。本議題は非公開議題とさせていただきますので、事務局にて御準備をお願いいたします。
------------------------------
科学技術・学術審議会情報委員会運営規則第5条に基づき、議題5は非公開とした。
議題5. AI for Science による科学研究革新プログラムの事前評価について
------------------------------
【相澤主査】 では、その他、事務局より事務連絡がありましたらよろしくお願いいたします。
【轟木参事官補佐】 事務局でございます。今後の開催予定については、現時点では未定となってございますけれども、今後、別途日程調整等の御連絡をさせていただきますので、どうぞよろしくお願いいたします。
また、先ほど相澤主査からございましたように、本日の議論について追加で御意見をいただけるようでございましたら、議題4、議題5にかかわらず、来週1月20日水曜日18時までに事務局までにお送りいただけますと幸いでございます。
その後、議題4、議題5につきましては、1月26日月曜日に開催予定の科学技術・学術審議会研究計画・評価分科会にてお諮りする予定でございます。どうぞよろしくお願いいたします。
事務局からは以上でございます。
【相澤主査】 では、御意見、御審議、どうもありがとうございました。これで閉会とさせていただきます。次回もよろしくお願いいたします。ありがとうございました。
―― 了 ――
研究振興局参事官(情報担当)付