令和6年7月24日(水曜日)16時00分~18時00分
文部科学省東館16階 16F2会議室 ※オンライン会議にて開催
相澤主査、青木委員、天野委員、尾上委員、川添委員、小林委員、佐古委員、長谷山委員、引原委員、星野委員、湊委員、美濃委員、盛合委員、若目田委員
塩見 研究振興局長、松浦 大臣官房審議官(研究振興局及び高等教育政策連携担当)、国分 参事官(情報担当)、栗原 計算科学技術推進室長、土井 学術基盤整備室長、原田 科学官、込山 学術調査官、松林 学術調査官
国立研究開発法人 産業技術総合研究所
フェロー 辻井 潤一
【相澤主査】 それでは、定刻になりましたので、科学技術・学術審議会情報委員会の第39回会合を開催いたします。
本日も、現地出席とオンライン出席のハイブリッドでの開催としております。報道関係者も含め、傍聴者の方にはオンラインで参加いただいております。また、通信状態等に不具合が生じるなど続行できなかった場合、委員会を中断する可能性がありますので、あらかじめ御承知おきください。
本日は石田委員が欠席と御連絡をいただいております。
また、議題1に関連し、情報科学技術分野における戦略的重要開発領域に関する検討会の主査であられる国立研究開発法人産業技術総合研究所、辻井フェローに御出席をいただいております。
それでは、事務局より配付資料の確認とハイブリッド開催に当たっての注意事項について説明をお願いいたします。
【植田参事官補佐】 事務局でございます。それでは、議事次第に基づきまして配付資料の確認をさせていただきます。現地出席の方はお手元の配付資料、オンライン出席の方はダウンロードいただいている資料を御確認いただければと思います。本日、資料9点と参考資料2点お配りしております。資料1が情報科学技術分野における戦略的重要研究開発領域に関する検討会の審議のまとめとなっております。資料2-1から2-4として、次世代計算基盤に関する報告書の最終取りまとめ関連資料を4点お配りしております。資料3-1から3-4につきましては、委員等限りの資料となっておりまして、令和7年度の概算要求等に関する資料を4点お配りさせていただいております。
その他参考資料といたしまして、「情報委員会における下部組織の設置について」と「情報科学技術分野における戦略的重要研究開発領域に関する検討会名簿」をつけさせていただいております。
もし現時点でお困り事や不具合等ございましたらお知らせいただければと思いますが、いかがでしょうか。
何かございましたら、現地出席の方は手を挙げていただき、オンライン出席の方は事務局までお電話で御連絡をいただければと思います。
続きまして、ハイブリッド開催に当たっての注意事項を申し上げます。御発言時を除き、マイクは常にミュートとしていただけますと幸いです。ビデオは常時オンとしていただき、通信状況が悪化した場合にはビデオを停止していただければと思います。
また、運営の都合上、現地出席の方も含めまして、御発言いただく際は「手を挙げる」ボタンを押して御発言をいただければと思います。
相澤主査におかれましては、参加者一覧を常に開いていただきまして、手のアイコンが表示されている委員を順に御指名いただければと思います。
議事録作成のため速記の方に来ていただいております。御発言いただく際はお名前をおっしゃってから御発言いただけますと幸いです。
また恐れ入りますが、マイクの数が限られておりますので、現地出席の方は少し大きめの声で御発言をいただけますと幸いです。
傍聴希望をいただいている方につきましては、ZOOMにて御参加をいただいております。
その他、トラブルが発生した場合には現地出席の方は手を挙げていただき、オンライン参加の皆様は電話にて事務局まで御連絡をいただければと思います。
事務局からの御案内は以上でございます。
【相澤主査】 ありがとうございます。
では、お手元の議事次第にありますとおり、本日は3件の議題を予定しております。
まず、早速ですが、第1の議題から入ってまいりたいと思います。1月に本委員会で設置された情報科学技術分野における戦略的重要研究開発領域に関する検討会について、7月19日に審議のまとめを行ったとのことですので、検討会主査の辻井先生より御報告をいただきます。
それでは、辻井先生、よろしくお願いいたします。
【辻井先生】 資料1のまとめを出した検討会の主査をしていた、辻井と申します。よろしくお願いします。
この検討会は、今御紹介にありましたように、1月にこの情報委員会で設置するということになりました。今年の4月から3回ほど、委員としては11名の委員と私を含めて12名、それ以外に8名のオブザーバーの先生にも参加いただきまして議論を重ねてまいりました。情報委員会からも、相澤主査、湊委員に御参加いただきました。この場を借りてお礼申し上げます。
実際、人工知能や生成AI、ChatGPTというAIがこの2年から3年でかなり急速に進歩してきたという印象があります。そのAIが、情報科学の技術全般の進展とうまく歩調を合わせて、情報科学・処理の分野全体を大きく変えていくような動きとなっている、さらに、情報分野のみならず学際的な広がりもかなり広くなっていまして、情報分野以外の科学や工学の研究開発にも強い影響を及ぼすようになってきています。
そういった背景を踏まえ、この分野で、あるいは関連分野でどういうことが起こっていて、どういう研究が進んでいるかという鳥瞰図を作って、我が国としてどういう戦略を取るかということの基礎資料をまずはまとめようということで議論を行いました。
実際には、20名ほどの先生に3回、かなり活発な御議論をしていただきまして、事務局の尽力もあり、今回の報告書が出せたと思います。
おのおののテーマのタイムラインや、テーマ間の相互関係については、もう少し議論を深めるべきだと思うところもありますが、現在とりあえず一通りまとめができたので、御報告申し上げます。御意見や御批判をいただければありがたいと思います。
現在進行中で進展の激しい分野ですので、一旦まとめましたが、この報告書はまた随時内容を見直す必要があると思っています。
この報告書が何らかの形で文部科学省における、今後の方向についてある程度役に立つものになってもらえればいいなと思っています。
報告書の詳細については事務局から御説明いたします。よろしくお願いします。
【植田参事官補佐】 ありがとうございます。事務局からは資料1に基づきまして簡単に御説明をさせていただければと思います。
本資料は全部で3章の構成となっておりまして、第1章では検討会設置の背景等について記載をさせていただいております。本検討会は、Society5.0の実現や科学研究の発展に向けまして情報科学技術がますます重要となる中、進展の著しい情報科学技術に関して、適時に情報収集・検討を行う組織として1月の委員会で設置をお認めいただいたものでございます。
本年4月より戦略的に重要な研究開発領域等について御議論いただきまして、こちらの資料のとおり、とりまとめをいただいたところでございます。
先ほど辻井先生からも御紹介いただきましたけれども、この分野、進展が速いために、内容は今後も随時見直すことが適当であるということが第1章の一番最後の文章に記載されております。
第2章では検討会において審議された主な内容について幾つかのカテゴリーに分けて記載をされております。冒頭、情報科学技術分野を大きく7つに区分した図がございます。こちら、各円が重なっていることからも分かるとおり、これらは相互に連携しながら多様な課題解決に資するものであると考えられます。
この中でも特に左上の人工知能、AI技術につきましては、近年加速度的に発展しており、社会インフラや産業などにも大きな影響を与えている一方で、幾つかの課題も挙げられていると承知しております。
こうした状況を踏まえまして、本検討会においては、AI技術を中心に注目すべき動向について御意見をいただいておりまして、その中で挙げられた研究動向について3ページ以降に整理をされております。
こちらの3ページの一番上のパラグラフのところでは、研究開発は必ずしも各分野に閉じて進められるものではなく、融合的な取組も重要であることですとか、記載された動向の中には既に取組が進められているものもございますので、政策判断に当たっては、周辺状況も踏まえながら検討することが適当であるという旨が記載されております。
その次からが具体的な動向について記載されており、大きく3つの中分類に整理して記載をいただいております。
1つ目が、aの「生成AI等に対して指摘されている様々な技術的課題に関する研究開発」ということで、この中でも(1)から(5)の5つの小分類に分けて記載いただいております。
(1)が「環境認識、身体性の欠如を埋めるための研究開発」と題しまして、実世界に適応するためには、データの能動的取得や自律的な学習技術、不完全な情報からの行動決定などが求められる旨が記載されております。
また、環境を認識するためのコンピュータービジョンやマルチモーダル情報処理技術、認知発達の観点からのアプローチなどもこちらで言及されています。
(2)の「変化する環境への適応に関する研究開発」では、順次変化する環境に対応できるモデルの構築技術や、少ない仮定の下、システムを効率よく適応させる学習理論、実世界のシミュレーション技術の高度化等について記載されております。
(3)の「メカニズムを理論的に解明し工学的に実現するための研究開発」につきましては、基盤モデルの内部構造を理論的に理解する取組や、理論と現実の乖離を埋めるような融合研究のアプローチが重要である旨記載されております。
(4)の「資源効率向上・環境負荷軽減に関する研究開発」では、計算量の増大に伴う消費電力、環境負荷の増大に対し、計算の効率化や量子化などモデル軽量化技術、使用するデータ量を低減させる技術、脳や認知科学の知見の活用等について言及されております。
また、最後の(5)につきましては、様々進められている学習精度の向上に向けた取組の加速とモデル拡張、システム更新の仕組みなどについて記載されております。
中分類の2つ目は、「b. 社会の中に混在・共生する、様々な機能を持ったAIの管理・連携」ということで、こちらは2つの小分類に分けて記載がされています。
(1)は、「モデルの統合と循環進化を実現する研究開発」とされ、企業等が保有されているデータを安全かつ効率的に活用するための連合学習、分散学習技術や、複数のドメインデータをパフォーマンスを維持したまま融合させる技術などについて記載がされております。
あわせて、エッジ側のモデルの差分を上位モデルに集約して全体最適化や進化を繰り返す循環学習技術の開発や、それに伴う品質保証技術、個別化された多数のAIとユーザー同士が相互作用しながら時間発展する社会を想定した研究などについても言及されております。
(2)の「意味を理解し、人間との協働が可能なAI」におきましては、多数のAI、人間、ロボットなどが協働する社会を見据え、アライメントの観点からも人のパートナーとして望ましいAIを検討するとともに、価値観や世界観を人と共有し、共進化するAI技術を実現することが重要である旨記載されております。
特に現在の大規模言語モデルにおきましては、文脈や倫理感の理解にまだ課題があるとされており、意味を理解・推論する技術や、世界の知識を実世界から取り込む方法などが求められているのではないかという点、及び社会的・集合的な影響についてもこちらでは言及されています。
中分類最後につきましては、このページの下のほうに記載されておりますけれども、cの「様々な研究開発分野を変革するためのAI技術」とされておりまして、AI for Scienceを含め、5つの小分類に分けて記載がされております。
(1)ではAI for Scienceの取組が様々進められる中、現状のAIにおいては、専門性の高い領域や、新たな知識の獲得に課題があるということ、また、現状、AIが保有する知識や推論過程を管理できていないことから、AIの立てた仮説を人間が理解できるような形で検証する方法が必要ではないかといった御意見が記載されております。
その下の(2)から(4)につきましては、検討会で個別に言及されておりましたロボティクスや通信、半導体分野との連携についてそれぞれ記載がされております。
最後の(5)「その他」につきましては、データサイエンスや高性能計算など、AIを支える周辺技術についても今投資するタイミングが来ているということや、誰もがAIを活用できる環境の構築が重要である旨記載がされております。
最後の第3章、「情報科学技術分野において戦略的に重要な研究開発領域等について」と題され、検討会で審議された内容を踏まえ重要と思われる領域についてまとめていただいております。
導入部においては、一部繰り返しになりますけれども、情報科学技術分野がSociety5.0を実現するための鍵となる重要な技術であり、長期的視野を持って必要な研究開発を基礎研究から進める必要があることや、特にAI分野は様々な課題を抱えつつも近年加速度的に発展・波及しており、戦略的に取り組むべき重要な分野であること、また、研究に当たっては日本発の領域や伝統的に強みを有する領域について伸ばすことが重要であることなどが記載されており、こういった背景も踏まえまして、重要な取り組むべき領域として大きく2つの提言をいただいております。
1つ目が、「実世界環境に効率よく適応するための研究開発」と題されております。生成AIが高い汎用性や応答性を有する一方で、実世界への対応についてはまだ少し課題があるとされていることから、変化する実世界に対応できるようなAI技術の実現は世界的にも注目されているところ、理論的な研究と実践的な研究を融合したような研究を推進していくことなどが重要である旨指摘されております。
例えば、変化する実世界環境に効率よく適応するためのモデル構築技術やその周辺技術、限られた情報から答えを導き出すためにAI自身が能動的・自律的に学習するデータを選別・取得する技術や、不完全な情報からも効率よく学習する技術などが必要であるほか、身体性や人の脳・認知発達を考慮したアプローチも重要である旨記載されております。
2つ目が、「多様なAIと人が共生・協働する社会に向けた研究開発」と題され、多様なAIが人やAIと相互作用する社会が到来することを見据えた研究開発、インタラクションを通じて説明可能性や公平な意思決定を担保しつつ、学習したり抑制し合ったりするような技術や、その品質保証技術、また、AIと人間の協調プロセスの研究開発などが重要であるとされております。
あわせまして、インタラクションを通じて人とAIがともに成長し、価値観や世界観を共有してパートナーとなるなど、人と協働できるAIの実現に向けては、マルチモーダルなデータの意味を理解し推論する技術や、AIアライメントの研究開発が重要である旨指摘されております。
また、こういった研究開発を進めるにあたり、AI関連リスクへの対応や、研究開発環境、研究人材の確保など、AIを支える周辺環境にも配慮する必要がある旨、併せて指摘されております。
AI関連リスクへの対応につきましては、AIの悪用やバイアスなどの問題に加えまして、ハルシネーションやブラックボックス問題などが深刻化している中、説明性・可制御性とバランスの取れた性能向上など、開発時から利用時までを含めた総合的な取組が必要である旨御指摘をいただいております。
さらに言語的、文化的な背景の違いも意識し、社会受容性の観点からの研究・対策が求められている旨も併せて記載されております。
研究開発環境につきましては、基礎研究を幅広く支援し、トライアンドエラーを繰り返しながらステップアップを目指すとともに、分野を超えた多様な知見を融合した取組の促進や、社会実装を視野に入れた取組においては、企業等との有機的な連携が望ましい旨、言及されております。
また人材育成に当たっては、ほかの政策とも連携しながら進めるべきであることや、国際的に活躍されている研究者の存在が海外研究人材の呼び込みに有効である旨、御指摘をいただいております。
最後に、日本の高校生・大学生が正解のある問題を素早く解く能力について国際的に競争力を有している一方で、そういった方々を正解が決まっていない問題に取り組む高度研究人材に育てるための仕組みの強化についても言及されております。
文部科学省といたしましては、本日の御議論も含めまして、こちらでいただいている御提言を今後の政策等に生かしていきたいと考えております。どうぞよろしくお願いいたします。
【相澤主査】 ありがとうございます。非常に内容の濃い資料の御紹介でございましたが、戦略的に重要な研究開発領域について、2つの柱に加えて、AI関連リスクへの対応、研究開発環境、人材育成についても言及されているということでございます。
ただいまの御説明につきまして、御意見、御質問等がございましたら挙手にてお知らせください。よろしくお願いします。
天野委員、よろしくお願いします。
【天野委員】 これ、端的に最初の図が変だと思います。「コンピューティングアーキテクチャー」というものが用語としてこなれてないのと、アーキテクチャーのレイヤーというものはコンピューターの中では割と限られたものですので、この用語は何かちょっとおかしいと思います。
例えば、量子コンピューティングなんかをごっそり入れてしまうようなものとなるとちょっと違和感があります。あと、「チャー」って伸ばしていますでしょう。「アーキテクチャー」は、ほか、この文章内では「チャ」と止めておりますので、一般的には「チャ」と止めますので、その辺統一なさったほうがいいのかなと思います。
以上です。
【相澤主査】 ありがとうございます。
川添委員、よろしくお願いします。
【川添委員】 取りまとめありがとうございます。全体的な内容の理解を深めたいため、御質問させていただきます。今までのAIには、人間がその意味を理解できる、つまり、人間の分かる範囲の中で動かなければいけないというようなことを求められているところがありました。その一方で、今の生成AIは、ラージランゲージと言っているぐらいですので、人間がクリエイトした情報を基に学習して、人間が今まで導くことはできなかった、あるいは、時間がかかっていたような答えを効率よく出すという側面はあると思うものの、人間の理解を超えるところに真理・真実が存在するのであれば、それを導き出すAIであってほしいとも思います。
例えば、1つの例として、コロナウイルスがどうしてあのように変異していたかというメカニズムを解きたいときに、必ずしもその答えは人類の中にはなく、地球上とか宇宙に存在するデータを基にそれが導き出せるかもしれません。このような場合、人間の理解を超えたところに答えがあるわけですから、それをも包含して将来カバーできるようなAIであってもいいと思います。
そのようなAIを考えたときに、後半のところで言及があった実世界環境を効率よく適用するという場面が該当するのかと思いますが、人間が理解できなければいけない領域に対して何を条件づけるのでしょうか。AIのさらなる発展を考える際に、何をAIに求めるのかというところが、うまくステップアップしていくように分かりやすくまとめていくことが非常に重要かなと思いました。その辺いかがでしょうか。
【辻井先生】 そうですね。AIに対する見方というのは、極端に言うと2つあると思います。1つは、人間が処理し切れないような大きなデータやテキストの集合を基にしてある種の判断を行う機構なので、ある意味で人間の知能を超えた存在が出てきたと考える立場です。この立場の発展形としては、シンギュラリティーだとか、超知能という議論にもつながっていきます。
一方で、今のAIを見ると、基本的には価値観や、倫理観といったものはありません。人間の場合には2つ3つ違った仮説があったときは、どちらが正しいかというのをまた別のデータで吟味しながら真理性というのを自覚的に検証するわけですが、こういう真理性や倫理にもとづく自覚的な処理はできない、不完全な知能とみる立場です。
今のAIは、自覚的な真理性の判断や、倫理的な基準に従った判断とかというのは明らかにできていません。だから、そういう意味では、人間の知能とはまたかなり違った異質なもので、足りない部分も大きいということで、このことは研究者の間ではかなり認識されていると思います。実際の今のAIの開発を見ると、AIが自覚的に何かをしているというより、人間が大量のデータをうまく準備してあげるわけですが、その人間の用意するデータの質によってAIの質も変化してしまったり、あるいは出てきた結果を人間がフィルターし、いいものを選ばなければならない、となっていると思います。
そういう意味では、今のAIに関して2つ違った見方、つまり、人間を超える超知能ではないかという面と、あるいはかなり欠ける部分のある知能であって、人間がそれなりの関与をしないとまずいという2つの見方があると思います。
結局、これからどういうAIをつくっていくかを考えると、AIも人間もかなり欠陥は持っている知能なわけです。先ほどおっしゃられたように、人間の場合には、明らかに膨大な情報を処理し切れないため、かなり制限された情報の範囲で判断してしまいます。制限された情報から、自分の都合のいい情報だけを集めてしまったり(確証バイアス)、あるいは、なにも不都合なことは起こっておらず正常であるということを前提に思考するるために、おかしなことが起こっても気がつかないとか(正常性バイアス)、人間の知能も明らかにある種のバイアスを持っています。
そういう意味では、今の人工知能と人間は、おのおのが違った欠陥をもつ、異質の知能になっていて、それぞれがお互いに補い合うということが基本的には必要だと思います。だから、この報告書でも多数のAIとか多数の人間が協力し合うような社会というのが基本的には求められるという立場での記載をしております。
1つのAIとか1つの人間ではなく、複数の知能が補い合いながらより大きな問題を解いていくことで、単独の知能では分からなかった問題を解いていくという世界を考えています。
特に、AI for Scienceになると、膨大なデータを処理するということで、人間が気がつかなかったようなことにAIが見つけるということは可能性としてはあると思います。ただ、その発見が科学の世界に入っていくには、科学者のある種の納得、理解が必要だと思います。ある結果が出てきたということだけではなく、その結果が今までの科学理論とどういう形で絡み合うのか、その新たな発見を基にして次の発見を求めるとしたらどういう科学の形があるのかということを議論するためには、人間の科学者の理解が必要になると思います。
そういう意味では、完全な説明可能性というのは必要ないと思いますが、ある程度人間の側の理解とAIの発見とが結びつかないと、科学としての有機的発展はできていかないだろうと思っています。
人間と人工知能という2つの異質な知能の協働の可能性をもとめていく必要があるでしょう。だから、AIが出てきたことで科学の在り方、方法論が変わることは確かだと思いますが、それをどういうふうに人間の側の科学的な理解の体系に取り込んでいくかというのはこれからの話になってくると思います。
次の科学の在り方についてはまだよく分かってないところがたくさんあるのだと思いますが、AIは万能でもないし、人間知能も万能でもないというのがこの報告書をまとめたときのスタンスになっていると思います。
【川添委員】 ありがとうございます。そのとおりだと思いますが、論点を整理させてください。例えば、先ほど言及しましたコロナウイルスの変異メカニズムの解明において、新しく進化したAIがメカニズムを発見できたとしますと、それは非常に人類にとって役に立つものになっていると思います。ただし、そのメカニズムに対して人間は理解できない領域であり、そこには理論もないという中で、理論がないから利用しないのかというとそうではないと思います。たとえ人間が理解できなくても、それがもし真理、真実、事実であれば、それを利用していくことが、我々にとっていいものだと思いますから、それをあえて条件化することはよい側面ばかりではないかと思っており、人間が理解できないと利用できないということはないと思っています。
【辻井先生】 それはそうですね。科学は、理論的にはよくわかっていないことでも経験的に正しいということが実証されていることを使うというのは当然あるわけです。
ただ、もう一つの科学の在り方として、経験的に分かっていることを合理的な理論の体系に組み込んで理解し、演繹性の高い、より強力な体系を作っていくという方向もありえると思います。
そういう経験的に正しいことがわかっていれば、その背後にあるメカニズムはよくわかっていなくても使っていけばいいという立場と、経験的に分かっていることの背後にある機構的ななものの理解をへて、より演繹性の高い科学に至ること、その過程で説明可能性の議論が出てくるんだと思います。この過程を経ることで、経験的な事実をより普遍的なものに広げていく方向で、科学的な理解が出来上がっていく。経験的な事実とその背後にあるものの理解という2つの兼ね合いをうまくとっていくことなのではないかと思っています。
【川添委員】 言いたかったのは、条件化するというのはよくないという点です。
【辻井先生】 そうですね。
【川添委員】 そうじゃないといけない、理解できないといけないということではないんじゃないか、と考えております。
【辻井先生】 確かに、この報告書を書いているときにもそういった議論がありました。1つは、文化的背景で、今のAIセーフティーや、AI規制というものがヨーロッパ文明のコンテクストで進んでいることは確かで、そのときに説明可能性ということが非常に強く主張され、機構がわかっていないものは使いたくないという規制の考えが強く出てきていると思います。
日本は、どちらかというと、もう少し緩やかで、必ずしも背後の機構が人間には分からなくても役に立つ経験的な結論はある、それを規制するよりもメリットの部分が大きければ、それを使っていけばよいという立場もあると思います。
AIセーフティーという議論の中でも、ヨーロッパ的スタンスとアメリカ的スタンス、それに対する日本的スタンスといったものが少しずつずれ始めていて、我々としては、規制ばかりをいうのはあまり健全じゃないんじゃないかということ、そういうことは、この報告書では明示的には報告書に入れていませんが、そういった議論も今後やっていく必要があるかと思います。
【川添委員】 ありがとうございます。
【相澤主査】 重要な御指摘ありがとうございます。また、大変参考になる議論だと思います。情報委員会で出た御意見あるいは辻井先生の御意見として、説明可能性も重要だけれども、説明可能性を訴えることによってAIの展開を阻害するようなことがあってはならないということでまとめさせていただきます。
まだ1件ぐらいお時間があるので、挙手いただいている、引原先生と若目田先生、尾上先生、3名お願いいたします。
【引原委員】 どうもありがとうございます。最近学内でいろんな実験系のユーザーの方々とお話ししていて、今まで人が仮説を立ててそれに対して実験で検証するというプロセスがありましたが、そこに生成AIが入ってくることによって、仮説生成の部分がAIだけで回るのかどうかという話がありました。そこにデジタルツイン的な補助システムがあってという全体像が少しまだ見えないということをおっしゃっており、かなりじゅうたん爆撃的にモデルをやって当てはまるものを探していると言われていました。そういうやり方だと結局は実験と同じになってしまうので、制限の中でしかできないということになります。
だから、制限を超えたところのモデルというものが入らないから、それは仮説実験にはならないんじゃないかという問いかけをされているんですが、辻井先生はどう思われますか。
【辻井先生】 確かにそういう面はあります。サイエンスの自動化で、ドイツのグループや日本のグループが仮説の構築、その検証のためのデータ取得、仮説改変といったループを回すという主張をしていますが、仮説構築の枠組みの設定自身は人間の科学者が行っています。いわば、人間の設定した範囲の仮説空間を考えて、その空間の中でのパラメータ最適化はできる。しかし、その枠組み自体を超えるような創造的な仮説を作り出すといったところまではいってないと思います。
もともと科学の中でデータを取るときに、科学的な仮説の枠組みが先行してあって、その枠組みに従ってデータを取っています。だから、こういうデータを取るべきだという段階ですでに科学者の創造的な思考があるわけで、この枠組みを人工知能が自律的に作り出して、取るべきデータ自体を人工知能が考え出すことができるかという話に結局はつながります。そこは、私の個人的な考えですが、この部分は現在の人工知能でできない、かなり難しい問題になっているなあという感じはしています。
【引原委員】 そこはまだ課題ということでしょうか。
【辻井先生】 そうですね。試行錯誤により、少しずつ何が今の科学の限界を破って、人工知能があることで、我々人間の科学者が想定していなかったような仮説空間を人工知能が見つけてくれるというのは、かなり長期の課題になっているのではないかという気がしています。
【引原委員】 ありがとうございます。
【相澤主査】 ありがとうございます。次に若目田先生、お願いします。
【若目田委員】 御説明ありがとうございました。2ページ目の課題認識に関しまして、データの適切かつ効率的な収集・活用等が鍵であるという指摘は全く賛同するところでございます。前回情報委員会でも、AIの重点項目みたいなところで、データに関する宿題が解決しない限りはここでやりたいことというのは進みにくいというような部分のお話がありました。
各種、いろいろな政策でも、AI戦略そのものから割とデータ戦略の重要性というものも指摘をされているところだと思います。そのため、情報科学技術分野におけるといったときに、データの収集・取得、まさに先ほど言った自律的に取得するようなアルゴリズムというのもなるほどなと思いましたけども、やはりちょっとそこをもう少し強く打ち出して、課題認識だけじゃなく、そこに対する研究開発というのは、ある種1項目ぐらいあげてでも記載すべき、重要な点ではないかなと思います。
特に、世界デジタル競争力ランキングというIMDの調査のところで日本が非常に低いとはよく言われていたんですけど、その中で、データ活用がついに最下位だったようです。64か国中64位という状況でして、これはいろんな要因があるかとは思いますが、AIの成長戦略のためには、データにかなりフォーカスした、効率性だけではなく、ここに書いてあるような信頼性を持って収集するような、このようなテクノロジーの担保も必要だと思いますので、その辺はもっとクローズアップしても、機会があるごとに言ってもいいのではないかと思いました。
以上です。
【辻井先生】 分かりました。データの重要性というのは確かに仰るとおりです。
【国分参事官】 当然、研究基盤ですから、今回の資料は研究領域を見極めていくということにフォーカスしているんですけれども、そもそもの研究を進めていくに当たっての基盤としてのハードとしての計算資源であったり、もしくはおっしゃる御指摘のようなデータであって、これはきちんと政策側としても、重要性を認識しています。例えばNII中心にやっているデータの収集事業や、もしくは理研を中心にやっているような計算資源の提供など、こういったものはきちんと引き続き我々としてもやっていこうと思っています。
【相澤主査】 ありがとうございます。つづいて尾上先生お願いします。
【尾上主査代理】 ありがとうございます。情報科学技術分野の研究開発だけでなくて、それが実装されて、社会に溶け込んでいく。社会や産業界も含む社会というものもかなり意識して審議まとめていただいているということで、これはすごく有益だと思っています。
そういう観点で、この分野で日本が本当にリーダーシップを取れるとするならば、スピード感がすごく重要だと思っています。研究開発をやって、それを社会で使っていくというシリーズモデルではなく、コンカレントモデルで研究開発あるいは社会実装を行っていく必要があると思います。
そういう観点で、これは事務局へのお願いなんですが、せっかくこういう形でまとめていただいたので、文科省に閉じることなく、他省庁とも連携していただき、今後施策に落とすときに、常に社会で使われていく、というところまで意識して施策を組んでいただけると非常にありがたいかなと思いました。
【国分参事官】 ありがとうございます。貴重な御意見、きちんと承ってやっていこうと思います。よろしくお願いします。
【辻井先生】 AIの分野というのはほかの学術分野よりももっと直接的に産業界と密着しているため、この報告書をまとめるときも、産業界との連携はかなり意識してまとめたつもりです。
【相澤主査】 貴重な御意見多数いただきまして、ありがとうございました。この報告書については、御報告ということでございますので、最初に御指摘のありました図の中の修正については、少し御検討いただければと思います。
【国分参事官】 既に出版されているものからの引用なので、編集は難しいです。申し訳ございません。
【相澤主査】 引用でございますね。
【長谷山委員】 その点について発言してよろしいでしょうか。資料1は、きれいにまとめていただき、あるべき姿を分析していただいたと思っております。ただ、資料のこの位置にCRDSの分類図を載せてしまうと、読者に誤解される可能性があるように思います。CRDSの視点は、システム・情報科学技術分野で、それも2023年に出版されていることから、検討対象はそれより過去のものです。加えて、図中の領域の配置について根拠が明確に示されていないように思います。資料1で、審議内容を示す最初の2.にこの分類図が示されると、行われた議論の根拠がなんであったのか不明瞭になると思います。
せっかくの議論が、この分類に集約されたかのように誤解されないよう、記載の順序等、検討頂くのがよろしいかと思います。
【国分参事官】 ありがとうございます。この報告書、冒頭御説明差し上げたようにアップデートをこれからしていきますので、その際にきちんと反映していきたいと思います。
【長谷山委員】 ぜひ検討してください。
【国分参事官】 はい。
【相澤主査】 よろしくお願いいたします。その他いただいた御意見については、本会議の議事録として発信していくということで、ありがとうございました。
辻井先生におかれましては、本日、御予定のため御退席と伺っております。どうもありがとうございました。
では、続きまして、議題2に移ります。議題2において、前回当委員会で議論したHPCI計画推進委員会の次世代計算基盤に関する報告書に関し、6月に最終取りまとめがなされたとのことですので、御報告をいただきたいと思います。
それでは、資料2-1から2-4に基づき、まず事務局より御説明をお願いします。
【栗原計算科学技術推進室長】 資料の2-1につきまして御説明させていただきます。計算科学推進室長の栗原でございます。
5月22日、前回第38回情報委員会におきまして中間取りまとめを御説明させていただきました。こちらは、文部科学省研究振興局長の諮問機関として設置されておりますHPCI計画推進委員会におきまして、昨年の5月31日から本年に入って2月、3月、4月と議論し、さらに6月5日の第59回HPCI計画推進委員会というところで取りまとまった最終取りまとめが、こちらの資料2-1になります。
1ページ目の1点目にこの資料の位置づけ書いております。令和3年に情報委員会の検討部会におきまして別紙1という資料2-2の中間取りまとめが報告をされまして、その後の検討をHPCI計画推進委員会が引き継いで行っていただいていたものでございます。
1ページ目の下部、2ポツで近年の情勢の変化に触れております。1ページ目一番下のところから次の2ページ目に参りましては、必要となる計算資源量の急拡大・多様化が進んでいること、また、今も御説明あったような生成AI、トランスフォーマー、LLM、ファンデーションモデル、基盤モデル等が台頭していることについて記載してあります。また、2ページ目の1つ目の丸に書いていますが、「こうした状況を踏まえ」というところで、ちょうど5月のISC、ドイツのハンブルクであった会議でもトップ500ランキングが更新されまして、2代目のエクサスケールコンピューターとして米国アルゴンヌ研究所のAuroraも出てまいりました。オークリッジ国立研究所のFrontierが今世界一でございますが、こういったエクサスケールコンピューターの開発・高度化が加速しております。
また、ここに「加速部(アクセラレータ)」と書いてありますが、計算の一部を加速部で処理することで最適化を図るアーキテクチャが主流になっている現状がございます。
その下にはまた2つ目の丸としまして、半導体の微細化の限界、ムーアの法則の限界についても触れております。メモリ容量、速度、実装の点での課題、それを解決するための技術としての3次元集積回路実装にも触れております。
その下3つ目の丸でございますが、量子コンピューターの方式、超電導、イオントラップ、量子イジングマシン等ありますけれども、様々な方式が検討されて、今後発展への期待は非常に高まっていますが、それをより明確にする趣旨で、古典計算と量子計算のハイブリッドに関しまして、その利活用の検討・実証ということを書いております。
また、その下にも、半導体産業、デジタル産業への経済安全保障、産業振興の観点からの取組についても記載がございます。
次のページの3ページ目にかけまして、AI技術のさらなる活用、ソフトウエア面でのユーザビリティーの向上、シームレス化、人材の観点を記載しています。
こうした情勢の変化を踏まえて、3ポツでは、次のフラッグシップシステムの役割を記載していますが、ここでは科学技術分野においてのAIの活用、新たな時代を先導して、国際的に卓越した成果の創出、特に先ほど議題1の最後にも若目田先生と辻井先生の御議論がありましたが、サイエンスの仮説生成とか検証にもAIを用いるような、ここではAI for Scienceということで1つ目の矢羽根に書いています。科学技術分野においてAIを活用するAI for Scienceの取組を通じてとの表現にしておりますが、研究サイクルの飛躍的加速や研究探索空間の拡大、また、その下の矢羽根にはLINPACKの密行列演算を、その連立1次方程式対象としたトップ500をなどとして挙げていますが、そういった単一尺度のみの性能ではなくて、AI性能をはじめとして世界最高水準を目指すということです。
多様化・拡大を続ける需要の変化への対応について、また一番下には、自国の技術、能力の確保、人材育成、産業競争力の維持・発展について書いております。
続いて4ページ目に参りまして、利用拡大と要素技術の普及によって産業競争力や経済安全保障の強化に資することとしています。
4ページ目の5行目、「具体的には」ということで、求められる性能・機能として、4ページ目の中ほどには、2つ目の丸の上から2行目、「遅くとも2030年頃の運転開始を目指し」ということで、既存のユーザーに対して5~10倍、AI性能については実効性能として少なくとも50エクサフロップス以上としております。今の「富岳」が、倍精度浮動小数点でおよそ400ペタフロップスということですので、AI性能に関しては実効性能について少なくとも50エクサフロップス以上ということで取りまとめております。
そして、CPUの開発、システムインテグレーション、メモリ実装技術とともに、5ページ目の頭のところには、加速部を導入するべきということで、その下の段落にも、運用開始後も継続してシステムソフトウエアの改善を図るべきとしています。
産業競争力の強化、社会的課題の解決、成果として採用され広く普及ということを記載しています。
5ページ目の中ほど、開発・整備の手法としまして、端境期を生じさせない、適時柔軟に拡張可能、進化するシステム、中長期的な視点からの評価・開発の継続、また、6ページ目に入ったところで、半導体の成熟状況を見極めつつ、構成要素の調達を進めることが求められる、としております。
6ページ目、「利用拡大に向けた取組」という段では、様々な科学技術分野、様々な産業分野の研究開発、これまでのアプリケーションの安定継続利用とともに、生成AIの利用も含めた新たな領域への対応、そして人材育成を目的とした情報提供とプログラム、また、一番下の部分、ソフトウエア環境の水平展開、また、国内外での活用ということも書いております。
7ページ目には、開発主体候補として、4月にヒアリングをしまして、その結果も、後ろの資料についておりますが、「開発主体について」という項目はここで追加をされ記載をしています。
これまでの内容を踏まえて、「京」や「富岳」の開発・整備・運用した実績を有する理化学研究所を開発主体候補としてヒアリングを行い、理化学研究所からは説明があり、別紙2として後ろにつけております。いずれも求められる性能・機能、開発・整備の手法・体制などを満たすため妥当であるため、理化学研究所を開発主体とし、フラッグシップシステムの開発・整備に向けて引き続き検討を進めることが適切であると考えております。
なお検討に当たっては、ということで留意事項も書いております。費用対効果、過度な増大を避けること、基本設計終了後等の節目に評価を適時受けること等もしております。
7ページ目の4ポツですが、もう少し幅広い事項の関係の事項として、HPCI革新的ハイパフォーマンスコンピューティングインフラの各大学等の計算機に接続される戦略的な整備、また一体的な運用体制の整備の検討、AI、データサイエンス、シミュレーションの融合等のためのデータ基盤をこちらに書いております。
次のページに参りまして、8ページ目が、セキュリティー、プライバシーの保護、量子、HPCIとの接続環境の検討、関係国との連携、特に米国との協力関係の強化、そして最後も非常に重要な点ですが、人材の育成を支援する取組についても記載をしています。
9ページに議論の過程について、11ページには委員の名簿もお示ししています。小林広明先生もこちらの検討に御参画いただいておりました。
また、資料の2-4としまして、ポイントとしてまとめた資料の1枚の紙もおつけをしております。
以上、HPCI計画推進委員会として取りまとめられたものについて事務局から御説明させていただきました。
【相澤主査】 ありがとうございました。では、ただいまの御説明に対して御意見、御質問等がございましたら挙手にてお知らせください。
【川添委員】 御説明ありがとうございます。私がお尋ねしたいのは、次世代計算基盤の目標として、確かに性能面、フロップスという形で評価されていると思います一方で、例えば、別紙2の松岡センター長の資料の11ページにも書かれておりますが、今やコンピューターも含めて計算機がいかにエネルギーを効率よく使っているか、という点も重要な指標だと考えています。例えば、今の生成AIでも1回の学習で原発1基1時間分のエネルギーを必要とするというようなことがありますから、いかに必要なエネルギーを削減できるかという技術面、単に性能としてのフロップスだけではなくて、エネルギー消費量等の評価尺度が含まれていくべきかと思うのですが、その辺はいかがでしょうか。
【栗原計算科学技術推進室長】 御指摘ありがとうございます。おっしゃるとおりです。4ページ目の2つ目の丸のところに「したがって、今後」ということで、2行目のところ、「遅くとも2030年頃の運転開始を目指し」とありますが、そこに一応電力性能の大幅向上によりこういった性能を目指すという書き方はしております。もちろん議論の過程では省電力性能に関して様々御意見が交わされました。特に今アルゴンヌ研究所のAuroraなどにおいても消費電力が多くなっていているという指摘も聞きます。
今、約30メガワットの「富岳」に関しましても、様々な運転上の工夫によって非常に省電力性能を高める運転をしておりますけれども、特に、最近の半導体においては、メモリ通信部分で相当の消費電力があるということもございますし、電力性能の大幅向上ということが重要な点であろうと考えます。
HPCI計画推進委員会のときにも、それをちゃんと強調しましょうということも言われました。資料2-4の絵の1枚にまとめたものがありますが、そのところにも求められる性能・機能のところに電力性能の大幅向上というところに下線を引いて入れるべしという御指摘をいただいて、少しは目立つように入れたというところです。でも、御指摘のことは全くごもっともだと思います。
5~10倍の実効性能、倍精度浮動小数点等を意識したシミュレーションに関するもの、また、半精度や単精度の浮動小数点演算性能等をイメージした2030年代に想定される最先端の基盤モデルを数か月程度で学習可能な実効性能としての50エクサフロップスと書いていますが、これらは電力性能の大幅向上によって実現可能なスケールで実施するという趣旨でございます。御指摘ありがとうございます。
【川添委員】 ありがとうございます。了解しました。
【相澤主査】 ありがとうございます。青木先生、よろしくお願いいたします。
【青木委員】 私も川添さんの御意見に同意します。2030年ぐらいには、当然今、各国でいろいろ考えていると思うんですが、HPCの業界で分からないのは、例えば今御説明があったように、古典的・伝統的なHPCのパフォーマンスメトリックとAIは違います。それから、アーキテクチャを考えたときに全く違うというか、相当違うものになるんですが、そういったものを日本はフラッグシップの中に両方求めていくというのが戦略ということで、よろしいんですかね。大きいところなんですけども、両方、例えば片方、ダブルでしっかり計算を考えようというのと、今お話があったような半精度で、フローティングポイントも使わない場合も30年ぐらいになるとあり、そういう違うものがやっぱりあるフラッグシップマシンに混在してくるんだと思います。
そうすると、そういうことを国としては目指していくということで、各国そうなのかというのはすこし気になっているところでございます。HPCに特化したマシンと違うものに特化したものというので、国として考えていくような流れはないのか、あるいはやはり今回のように同時に実現していくというのがいいのかというのが、ここが一番気になるのが1点目です。それから、2030年ぐらいになったときに、昔は半導体の競争のときも周波数で競っていた時代があって、日本はひたすら周波数でやっていたんですけども、あるときからそういうものじゃなくてエネルギー効率とか並列性とかで全然違うもの、尺度になった時代があって、それで日本は相当勘違いのような、全く世界の最先端の潮流に追いついてないような状況になったことがありますが、そういう意味でいったら、エネルギーの尺度というのは結構重要なのではないかな。新しいものが出てきたときに、そういうものをしっかり見ていくという姿勢も大事なのかなと思って今の御意見聞いておりました。その2点です。
【栗原計算科学技術推進室長】 御指摘ありがとうございます。特にHPCで大きくアーキテクチャの変革期にあるのは全くそのとおりでありまして、こちらの検討する上でも大きな議論になりました。特に冒頭の部分、2ページ目等にも書いておりますが、加速部を有して、さらにCPUとGPUを密結合するようなアーキテクチャというのが世界の中で順次主流になっているところで、旧来のシミュレーションのユーザーにおいても非常にアーキテクチャ変わっております。また、新しい生成AIをはじめとした高度な計算、大容量のデータと、また大きな計算資源を必要とするような領域が新たに出現をしております。
先生御指摘のとおり、FP16でもなく、指数部を増やしたBFP16で、また、CFP8を使うものも多いですし、さらには行き着くところはワンビットでAIを動かすというような研究もございます。整数でやるというのもありますし非常にアーキテクチャの多様性は、ムーアの法則が減速していく中で、様々な限界から出てくるものだと思います。
なかなかその中でどこを目指すのかというところで、こちらのHPCI計画推進委員会の有識者の皆様で議論していただいた結論としては、こちらにありますような、あらゆる分野で世界最高水準の計算能力を提供という表現になってはおります。計算速度のみの追求ではなく、AI性能をはじめとしたあらゆる分野で世界最高水準の計算能力を提供するということです。
今の御指摘の御趣旨は、AIのためのマシンにするのか、それとも旧来の既存のシミュレーションの性能向上を目指すのか、どちらを主流にするのか、両方を目指すのかという御趣旨の御指摘かと思います。その点では、もちろんCPUの性能向上も目指し、コア技術としても追求する。また、特にメモリ実装技術のメモリの部分に関しては、非常に省電力性能にも効いてきますし、また両者、CPUとしての計算能力にも寄与することにもなる点も書いております。
そういった帯域幅やメモリの容量の律速も今後の拡大する計算資源需要に対して対応するようにし、一方で、AI性能も併せて追求する。難しいところです。こちらはそういう点では次のフラッグシップシステム、我が国として求められるフラッグシステムは、求められる機能や、新しいアーキテクチャが多様化して変化する中で、時代の要請に応えて対応できるようにしよう、ということも併せてこの方針には書いています。
ですので、継続的な開発の必要性と、開発の整備に関しては拡張や進化ということが書いてあります。具体的には5ページ目の開発・整備の手法の(2)のところ、最新の技術動向に対応するために適時柔軟な拡張や進化という点がございます。なかなか技術動向も見え難い。生成AIも2年前からこれだけ一気にこういった技術が出てくるというところも予想以上の進展を示しています。また、新たな技術が出てきた際にそこに必要となる計算資源も大きく変わり得ることが想定されるだろうという議論がHPCI計画推進委員会も交わされ、そこでこういった表現になっているという御説明でございます。
すいません。お答えになっているでしょうか。よろしくお願いいたします。
【青木委員】 分かりました。今回はスタート点として、やはりハイブリッドでいこうと、AIとHPCのハイブリッドで追おうということですが、当然2030になったときに全然異なるメトリックになっている可能性もありますので、そういったところはできれば柔軟に対応できるというような余地を残しておけば私はいいと思います。
以上です。
【栗原計算科学技術推進室長】 ありがとうございます。
【相澤主査】 では、美濃委員、御質問いただいた後、せっかくですので、小林委員にコメントいただいて質疑の時間を終わりたいと思います。では、美濃委員、よろしくお願いします。
【美濃委員】 すいません、美濃です。計算機そのものの発展としてはそれでいいのですが、ここにネットワークの要素は入ってこないのでしょうか。大きなアーキテクチャを考えるときにもCPUのネットワークを考えていますよね。それと1台のマシンが溶け出してもっと全体のCPUをつないで、というような発想をしていくと、ネットワークの要素が避けられないのではないでしょうか。つまり、SINETとこの話が分けられているというのはすごく違和感が出てくるのですけど、その辺り、将来的にはうまくいくような話や議論はなされたか、その辺りだけちょっと聞かせていただけたらと思います。
【栗原計算科学技術推進室長】 お答えさせていただきます。特に7ページ目の次世代計算基盤全体に係る検討状況という4ポツがまさにHPCIに接続される計算機という、ネットワークSINETで接続される計算機のことを指していますが、そういった全体の戦略的な整備だったり一体的な運用ということを書いていて、さらにその下にも、データ基盤、計算基盤の効率的な利用とデータ基盤の在り方ということを書いているのがまさにその箇所になります。
今おっしゃったような点は、クラウドの利用も進んでいますし、先ほど議論があった松岡センター長の理研の説明資料の中にもありましたが、電力の記載等がある少し後ろのところに、バーチャル富岳というネットワーク上での「富岳」と同等の計算資源の利用の記載もございます。
そういった様々なソフトウエア環境が変わってきて、商用クラウドの発展もあり、HPCIシステム群と非常に連携をした運用がポスト富岳では必要となるという議論がされています。資料の2-3という資料、別紙2というものですが、資料の2-3というパワーポイントの資料のうちの11ページですね、こちらはエネルギーコストの削減のところの下の部分、商用クラウド及びHPCIシステム群等との連携というところで、「富岳」のクラウド的利用やHPCIの共用ストレージ運用の知見を活用して、ネットワークを超えた、SINETで結合した資源との連携を強化するということで、今「富岳」ではオープンオンデマンドの利用であったり、バーチャル富岳、これはAWSのグラビトンチップを利用した商用クラウド上での同等な環境を提供してソフトウエアのコミュニティーを広げる取組で、右にサテライト富岳の図がございますが、そういったバーチャル富岳の取組も進んでいます。まさにこういうポスト「富岳」2030年という時代を見据えたときには、大きくネットワークと計算機の関係も変わってきて、先ほど申し上げたような新しい潮流への対応、最新の技術動向に対する拡張可能な進化するシステムという点はこういった趣旨も含んでおります。
そのために7ページのところにも、こういったHPCI接続計算機の戦略・整備、一体運用、また、データ基盤ということも記載している次第です。そういった議論がまさにあった結果として、また、富岳においても理研においても既に一部取り組みつつあり、将来を見据えた先導的な運用の取組を進めていただいています。
【美濃委員】 ありがとうございます。もう少しネットワーク側と議論しながら進めていくということが必要かなと感じていますので、もし必要があればそういうこともやっていただいたらと思います。
以上でございます。
【栗原計算科学技術推進室長】 ありがとうございます。ぜひそのようにしたいと思います。
また、この後の議論でも、評価の点がございますけれども、そこでもその趣旨がございますので、次の議題のときに御説明します。
【相澤主査】 ありがとうございます。では、小林先生。
【小林委員】 私もHPCI計画推進委員会とか、あるいはフィージビリティースタディーを通じて開発の動向を見てきているところですが、先ほど室長がおっしゃったように、システム構成としては、汎用部のCPUとアクセラレータの組合せというハイブリッドです。そういった仕組み、アーキテクチャの中で、あらゆる先端分野において世界最高水準の計算能力を提供と書いておりますが、結局どこをとがらせるかというと、やっぱりアクセラレータの部分でとがらせるという部分、ということがありますので、ソフトウエア自身もそちら側に進化していく必要があります。
これまでの「富岳」で蓄積したアプリケーションをそのまま早くできれば一番いいんですが、やはりアクセラレータの部分に対して、ソフトウエアの開発側も、最高水準の計算能力を引き出す努力が必要だという部分があらゆる先端分野というところに入っているのかなとは思っております。
ですので、単に提供だけではなかなかうまくはいかないというのが、今後、5年10年先を見たときのスパコンシステムの在り方かなということだと思います。
【相澤主査】 どうもありがとうございました。
では、以上をもちまして議題2を終了いたします。
議題3以降は本日非公開で行いますので、傍聴の方にはここで御退席をお願いいたします。
【以下、非公開】
研究振興局参事官(情報担当)付