HPCI計画推進委員会(第60回) 議事要旨

1.日時

令和6年8月23日(金曜日)15時00分~17時00分

2.場所

文部科学省 17階 研究振興局会議室(傍聴はオンライン会議にて参加)

3.出席者

委員

HPCI計画推進委員会委員:
合田委員、伊藤宏幸委員、上田委員、梅谷委員、小林主査代理、田浦委員、館山委員、中川委員、藤井孝蔵主査、朴委員、棟朝委員

「次世代計算基盤に係る調査研究」評価委員会委員(括弧書きはHPCI計画推進委員会委員と兼任):
相澤委員、(上田委員)、奥野委員、後藤委員、高野委員、常行委員、(中川委員)、中野委員、藤井啓祐委員、(藤井孝蔵主査代理)

文部科学省

塩見局長、国分参事官、栗原室長、福野参事官補佐、森専門職

オブザーバー

(理化学研究所 計算科学研究センター(R-CCS))松岡センター長、庄司部門長、近藤チームリーダー、佐野チームリーダー、佐藤(賢)チームリーダー、原室長、嶋田室長代理、西田高度研究支援専門職、三浦ユニットリーダー
(東京大学 情報基盤センター)塙教授
(国立情報学研究所)佐賀特任研究員

4.議事要旨

会議開始にあたり、議題1および5については議事運営第4条一および二により非公開とすることが確認された。


議題1:「富岳」政策対応枠の新規採択課題について
資料1について事務局から説明があった。


議題2:今後のHPCIの運営に向けて
資料2-1について東京大学 塙教授から、資料2-2についてR-CCS 庄司部門長からそれぞれ説明があった。
 
【藤井主査】 ありがとうございました。ただいまの2件の御発表のどちらについてでも構いません、御意見、御質問等よろしくお願いします。私もいろいろありますが、いかがでしょう。
【田浦委員】 まず、一番賛同したいのは、庄司さんの資料の6ページの課題選定あたりの考え方で、「富岳」というかフラッグシップシステムは非常に貴重な資源なのですが、でもユーザーにとっては、実際に使ってみないとどうなるか分からない。言葉を選ばずに、誤解を恐れずに言うと、所詮は計算機なわけですよね。
 それで、実際に使ってみて「これは使えん」となる人だっているわけで、だからこそ、そこのエントリーのところをもっと簡単にして、言葉を選ばずに言うと、途中でもうやめたとなった人がいたら、別にそれはそれでよくて、その中から有望でマッチした人をどんどん育てていくという考え方が、私もいいと思っています。
 できれば、育てていくのが1年の中で起きればいいと思うんですよね。そういう意味では、もう向こう1年分のリソースをこれだけですと言ってスタートする必要がなくて、最初は少なめで、年度の途中ででもどんどん、有望な人、あるいはもっと使いたいと思った人に動的に割り当てられていくような、何かそういう仕組みをつくっていけば、ぜひいいんじゃないかと私も思います。
 恐らく、エントリー用の仕組み、ファーストタッチとか、それはそれでつくっているとは思うんですけど、でも、それをやるとどんどん入り口が増えていって訳が分からないということになっちゃうので、いちいち申込みからやり直さなくても、普通の入り口から入って、徐々にたくさん使えるようになっていくみたいな、そういう仕組みを考えるのがいいんじゃないかと私も思います。
【藤井主査】 今の場合、計算資源には総量があるわけですよね。途中から増えるような話になってしまうと思うのですが、割当ては大丈夫ですか。
【田浦委員】 要するに、絶対これだけ使えますという量をカチっと決めて、その和が総量ですというリジッドな計算をやめて、恐らく実際には使われない部分があるので、それをどんどん年度の途中で結果的に取っていけるよ、という仕組みにすれば回っていくんじゃないかと思いますけど。
【藤井主査】 わかりました。庄司部門長、経験的にいかがでしょう。大丈夫なんでしょうか。
【庄司部門長】 資源配分のコントロールはすごく難しくて。1つは、過去の計算資源は使えなくなっちゃうわけですよね。だから、使える人に使ってもらうというのはとても大事な観点だと思っていて、途中で増やすという話も、余っていればやればいいと思います。余っていなかったらできないわけで、そのバランスの範囲の中で、十分できるんじゃないかなと思います。
【藤井主査】 わかりました。途中から口を挟んでしまって申し訳ありません。今の議論に関連する意見、ありますでしょうか。基本的に皆さん、ポジティブということでよろしいですか。ユーザー側の方もいらっしゃると思いますが。
 これについての検討を行う場はどこがよろしいでしょうか。例えば、RISTの選定委員会でしょうか?
【栗原室長】 RISTの中にはRISTの選定委員会があるわけですけれども、HPCIの仕組み自体は、このHPCI計画推進委員会の設置要綱を見ても分かるとおり、こちらのHPCI計画推進委員会で御議論いただくことが適切であると考えます。
 また、登録機関としての業務は、もちろん登録機関の中での有識者の御議論もあるかと思いますが、全体の大きな国としての枠組みは、まさにこちらのHPCI計画推進委員会で御議論いただければ幸いです。
【藤井主査】 部分的には選定委員会で議論でき、そこですぐ改善が図れるものもこの資料の中に入っているかもしれませんね。
【合田委員】 私もコメントなんですけど、塙教授も庄司部門長もおっしゃっていた運用の改善について、まさに賛同するところで、私はHPCI開始当初から運用の仕事に携わらせていただいておりまして、当初、12年前なので、当時に比べると、当時は最新の解をつくってきたというのはもちろん考えているんですけども、12年経って新しいAIみたいなアプリも出てきましたし、計算だけじゃなくてデータもしっかり管理しましょうというのも出てきている中で、今はまさに大きな転換期を迎えていると思っています。その意味では、これまでの12年の知見も生かしつつ、運用の改善をスピーディーにアップしてできるようにするというのは非常に重要だと思っています。
 私も昔を振り返ると、結構、運用の現場では、ここをこうしたほうがいいんじゃないかという意見が出てきていたんですけども、それが全体に反映されるパスがないという。それはパスをつくらなかった自分も悪いと思うんですけども、それを感じていて、ボトムアップだけでは限界があるので、そういった運用改善の声がすぐに反映されるようなものを体制としてつくるというのは非常に重要だと思いますので、その点、強く賛成するところです。
【藤井主査】 塙先生の資料の3ページに、HPCI全体として議論する、リードする場が必要という記載がありますが、この辺りのところに該当するでしょうか。それと庄司さんの話も含めて、そういう場が必要だということでよろしいでしょうか。
【合田委員】 はい。それをスピーディーに。
【藤井主査】 その辺りは皆さん賛同されるかなという気はいたします。皆さんうなずいていらっしゃいますので。
 ここは文科省に少し検討いただいて、例えばHPCI計画推進委員会の下にワーキンググループをつくるとか、少なくともそれを議論する場を考えましょう。ポスト「富岳」の話も出てきていますし、そこに向けて少なくとも早めに始めるということが必要かなと思います。
【相澤委員】 塙教授の資料の3ページに書いてある、将来の整備計画という部分も、極めて重要な話です。最初にどんと設備をつくったはいいものの、それが最終的にお金の切れ目でもって、徐々に崩壊していくというのはものすごく残念な話なので、定常的に、少しずつでも変わっていくような、将来の整備計画につながるような計画の持ち方というのは重要だと思います。
【栗原室長】 ありがとうございます。3ページの将来の整備計画ということですけれども、全体として共用ストレージとか、このHPCIの運営に関して、委託事業の5年間という当然の事業の枠、事業としての事業実施枠はありますけれども、もちろん、その下の赤字で書いてある部分もございますが、全体として今、主査からもワーキンググループ等でということもありましたが、そういった全体の司令塔となるような、そういう議論ができまして、安定的な国としての体制がどうあるべきかという議論が必要だという御指摘はごもっともかと思います。ぜひ、また御相談させていただいて、取組を進められればと思います。
【棟朝委員】 今の継続性の観点なのですが、もうちょっと広い話で考えると、大学における情報基盤というものをどう考えるかというところで、例えるのが適切かどうか分からないですけど、例えば建物とかキャンパスの設備に関しては、国全体である程度計画があって、大学でもマスタープランがあって、計画的に整備し、それで完全に継続性というのは、建物ですから例えば50年たったら大体建て替えると、そういうものがあるんですけれども、ITインフラもだんだんその世界に近くなって、不可欠なものになってきますので、ナショナルインフラとして、もちろんHPCIも含めた全体の話ですけれども、そこは強く主張しておきたいなと思います。
【藤井主査】 この委員会の答申内容を越えるものもあり難しいところもあるとは思いますが、御意見はもっともだと思います。
【中川委員】 どの方にお聞きしていいか、よく分からないですが、今のHPCI及び「富岳」の運用に対していろいろな課題があるという、非常に細かい運用側からの指摘があって、なるほどと思ってお聞きしていたのですが、HPCI全体に言えると思うんですけれども、計算資源そのものは予算の関係もあってそんなに大きくは伸びていないのかもしれないのですが、確実に電気代とかTCO(トータルコストオーナーシップ)でみたときに、大学の情報基盤センタ等も含めて、電気代とかエネルギーコストの占める割合がどんどん増えて、その分、ユーザーが使える分が減るとか、若干しわ寄せが行っているんじゃないかなと。長期的な視野で見るとですね。
 一方で、カーボンニュートラルに向けての目標というのももう出ていますし、そういう意味でいうと、先ほどの庄司部門長の資料の2ページ目に全体の体制について記載があったと思うんですけれども、フラッグシッププラスHPCI全体で、エネルギー効率的に一番効率のいい運営になっているのかといったところを調整するような、そういう視点での責任部署というのは現在はないと思うんですけれども、その辺りってどういう観点で、全体のエネルギーコストを抑えるかとか、カーボンニュートラルを実現していくところに関与するかとか、そういうのは何かあるんでしょうか。
【栗原室長】 この庄司部門長の資料の2ページは、あくまでHPCIとしての共用法に基づく「富岳」の設置者と登録機関、また「富岳」以外の、「第2階層」という表現がされますけれども、HPCI全体としての運営の体制や、また外部組織としての一般社団法人HPCIコンソーシアムによる提言等の構造を示しているもので、それぞれの各情報基盤センターや大学・研究機関等のHPCIを構成する計算資源の運用体制を示したものではございません。
 それに関しては各国立大学法人、大学ごとであったり、また、研究機関の中のそれぞれ個別の国立大学法人であったり、研究開発法人としての運営がされております。
 全体としてのエネルギーコスト、TCOをどうするかというのは、当然、文部科学省の関連機関、産総研もございますが、そういった国立大学法人や研発法人でございますので、全体としては見ていますが、トータルの日本のスーパーコンピューターシステム全体のエネルギー効率を計算して計画してという構造にはなっていない。各組織別に意思決定がされて、それぞれの基盤が導入されているというのが現状でございます。
【中川委員】 それは、現状そうだというのは理解するんですけど、先ほど塙先生の資料でも、こういうHPCI全体でジョブの実行がどこでもできるようにという、それが将来の理想ですというお話だったかと思うんですけれども、その時にエネルギーコストの低いところで実行するような、ユーザーに対するガイダンスとかそういうのが出せると、本来は全体で、各個別の機関ではなくて全体として、トータルのミニマムな方向に持っていけるんじゃないかなと。
 そういう取組が今後、2030年ぐらいというとまだかなり先ですけれども、体制とか、データを交換する仕掛けとか、そういうところはよく練っていかないといけないのかなと思ったものでコメントさせていただきました。
【塙教授】 ありがとうございます。そういう意味では、運用FSを提案したこと自体が、まさにそういったことを進められないかというのが内容の1つで、そういったところも提言として出していければというふうに考えております。
【藤井主査】 それについて、第2階層と「富岳」、もしくはポスト「富岳」と一緒にできますか。
【塙教授】 それはいろいろ理研さんとも協力しながらということで、大学ごとの考え方等もいろいろあるので、できる部分、できない部分はあるかとは思いますが、進めていけるとは思います。
【藤井主査】 そうですね。新しい視点で大事なところですね。
【庄司部門長】 運用技術の観点からいうと、いろんな省電力技術は各センターにあるわけです。その先端的な技術を早く共有するという意味では、塙先生も言われているし、私の資料の最後のところでも言っているんですけど、運用する組織をある程度集約するというか、あまりがちっとやると、みんなまた反発が起きるんですが、ゆるく最初はやりつつ、その技術の共有がより早くできるような体制づくりは重要かなと思います。
【中川委員】 よろしく御検討お願いいたします。
【藤井主査】 新しい視点ですので、考えていけばいいかなと思います。
【館山委員】 庄司部門長の資料の10ページのところに、具体的な質問をさせていただきたいですけども、私も今、海外とかで応用計算を行っていますと、ヨーロッパはかなりすごい勢いがついている印象がありまして、このEuroHPC JUというのは、確かに最近から聞いている組織ではあるのですが、ここ、聞き逃したかもしれないですが、内容としては多分、日本だと国がやっているようなところと、RISTがやっているようなところが入っているかと思うんですけども、例えばこれを具体的にこの参考にとなった場合というのは、どういうイメージをしたらよろしいんでしょうか。こういう提言はあるんですけども、もう少しこれを具体に近づけていくためにはどういう形のものが必要かというところを、もう少し情報をいただけたらと思いまして、お願いいたします。
【庄司部門長】 ありがとうございます。それが最後のページに盛り込んだつもりで、強化されたHPCIが持つべき機能ということで書かせていただきました。
【館山委員】 でも、先ほども私、述べたのですが、一部はもともと国がやっているような事業と、多分RISTがやっている事業が中には入っていると思うんですけども、これはそういう組織をつくったほうがいいということなのでしょうか。
【庄司部門長】 実装については、まだ正直イメージし切れていない部分があるんですけども、とにかく、こういう機能をどこかの組織を持たないといけないだろうと。今、実現できていないところもあるし、明確になっていないところもあると思うんです。ですのでこういう観点で、なおかつ今の組織からどうエンハンスするかということを考えると、こういう観点での強化が必要なんじゃないかなというところまでです。
【館山委員】 いえ、とんでもないです。ですが、スピード感が遅いというのは非常に私も感じるところですので、このタイミングで何かしら考えるのは確かに重要かと思います。ありがとうございます。
【藤井主査】 もしよろしければ、庄司部門長の資料の9ページの問題点それぞれについて、何で進まなかったのかといったことを付記したものを情報共有していただけるとありがたいのですが。
【庄司部門長】 はい、分かりました。ありがとうございます。
【藤井主査】 HPCI計画推進委員会に責任があるものもあるかもしれませんので、その辺りも含めてお願いします。
【庄司部門長】 どうでしょうか。この2つに関してはそうでもないと思います。
【藤井主査】 あと5ページのところで、例えば、利便性を図ろうとして課題の種類が増えてきているだけのことですので、応募する側の立場に立ってウェブサイトの作り方を考えれば大分違ってくると思います。
 その辺りはRISTの選定委員会や利用研究課題審査委員会で十分議論できることですので、そういったものはどんどん議論を進めていただき、大きな仕組みのところは、皆さんがおっしゃっているようにHPCI計画推進委員会の下にワーキンググループを作るなり、別の形なりで議論させていただくというのがいいかなと思います。


議題3:理化学研究所における次期フラッグシップシステムの検討状況について
資料3についてR-CCS 松岡センター長から説明があった。
 
【藤井主査】 ありがとうございました。
 ただいまの御発表について、御意見、御質問等あったらよろしくお願いします。公開情報に限っていますので、なかなか議論も難しいところかもしれませんが、いかがでしょうか。
【相澤委員】 AI for Scienceというところに視点を定めたというのは、高めに目標を置いて大変結構だと思います。ただ、実際に何がそこで行われるかという図が、15ページ辺りから出てきているのだと思うんですが、確かにLLMなど大きなモデルを学習しようとすると、膨大にGPUが必要となって、それを長い時間かけて計算するということで、重い部分がものすごくあるので、ある部分は効率よくなったり、電力が小さくなったりといったことで、新しいスーパーコンピュータでやることの意義というのはあるのだと思いますが、ここに書いてある「推論も」というのは違うかなというふうに思えてしまいます。
 推論の部分は、出来上がったモデルというのは、様々な人が使えるように、通常はもっと少ない、数台あるいは1台のGPUの上で動くようなモデルではないでしょうか。「富岳」がないと推論の部分がやっていけないようなモデルがつくられているのでしょうか。
 「富岳」の場合だと、年間100件ぐらいしか課題が流れないという状況の中で、推論がその規模になってしまうのでしょうか。
【松岡センター長】 まず、いろんな分析はされているんですけど、全体のマーケットとしては、学習か推論かといったら推論が圧倒的に大きくなるというのが、マーケットとしては出ています。今後10倍ぐらいになるとか、既に10倍になっているとか、そういうようなことがあります。
 そして、我々もかなり綿密に研究していますけれども、推論というのは実は決して軽いことではありません。特に我々が目しているようなものは、例えば1兆パラメータに目するような非常に大きなモデルなわけです。1兆パラメータというのは今のGPUでは入らないので、そうすると1つの推論を動かすだけでも、最低限でもどんなクアンタイゼーションをしても大体8GPUということで、しかもハイエンドで8,000万ぐらいするようなマシンを1台、それが1つの推論のストリームをするだけで必要になるわけです。  
 さらに、我々が見ているのは、サロゲートのような状況で推論を使うというのを考えておりまして、いろんな考え方があるんですけども、例えばビジュアルトランスフォーマーで、このAI for Scienceのワークフローであった場合に、今だと例えばGeminiだと、例えば100万トークンだとか、インプットトークンが100万とか言っていますけれども、100万なんか全然足りないわけですよ。
 実は我々、ビジュアルトランスフォーマーで、例えば1次元化するか2次元化するかという話があるんですけど、それを例えば1次元でリニアライズしようとすると、10万掛ける10万の2次元のイメージをやったりすると、1,000万とか1億トークンを扱わなきゃいけない。
 1億トークンをビジュアルトランスフォーマーでやるなんていうのは、普通の言語の感覚では全く違う世界になって、いろんなリンクトランスフォーマーとかそういうことを使わなきゃいけない。そうすると、それはもう何十、何百のGPUを使わないと推論はできないんですよ。
 ですので、AI for Scienceの推論というのは、普通のコンシューマーフェイシングのAIと全く違うハイエンドな世界なので、したがって、トレーニングだけじゃなくて、推論のほうも非常に重いワークロードになるということが見込まれます。
【相澤委員】 GPTクラスのものは……。
【松岡センター長】 いえ、GPTなんかは全然軽いですので、全く比較にならないです。AI for Scienceでの、実際のサイエンスデータを扱うような推論というのは、何百GPUとか使わないとできない推論なんですよ。
【相澤委員】 でもそうすると、適用できる課題というのはものすごく少なく、民主化されて多くのところで利用されると様々なサイエンスの部分部分の局面に入っていくというわけではなく、ものすごく絞り込んでサイエンスを扱うみたいな形になるわけですか。
【松岡センター長】 今でも、シミュレーションの世界でもそういう階層があるわけですよね。「富岳」も幾ら大きいといってもたかだか10何万ノードしかないので。
 ですから、そこでは先ほどの、まさにHPCIの議論がありましたけど、まさに「富岳」というのは富士山ですけど、ユーザーにだんだん登っていってもらうようなイメージになるかと思います。もちろん、理想的には無限に大きいマシンをつくって、みんなが無限のリソースを使えればいいですけど、そうはいかないわけですよね。
 ですから、だんだん登っていってもらうわけですけども、その中で、今、既にサイエンスのプロセスとして、スローエンドからハイエンドというところで選別していくプロセスが、どんなサイエンスの過程でもあるわけです。それは別にスパコンに限らず、放射光の実験施設もそうですし、望遠鏡もそうですし。ただ、それを公的資金でやるというのは、お金が仮になくても、自分が研究成果でそういうことを登っていけるという制度があるから重要なわけであって。ですので「富岳」でももちろん、スパコンでも同じような制度づくりが必要なんです。
 ただ、そういうときに、コンシューマーの世界というのはそこである程度やって、それで1億人に対して普及させるという発想になりますけど、サイエンスの世界はそうではなくて、ハイエンドのピークというのは圧倒的に高いので、それに応じた資産と、きちんとしたプラットフォームづくりをしなきゃいけないという点も、大きな違いなんです。
 決して、いろんな人を排除しようということではなくて、トップの人しか何もしない、ケータリングしないというわけではないですけど、裾野が広いけれども焦点が高いという、まさに「富岳」みたいなものをつくらなきゃいけなくて、「富岳NEXT」も当然それに応じたものになるわけです。
【相澤委員】 パラメータ数的な規模の感じが資料に書かれていると、もう少し最初からよく分かった気がします。私はダイナミックレンジの低いほうにいましたので。
【松岡センター長】 ただ、我々のつくる技術というのは、最近のICMLの論文にも出て有名になりましたけれども、これから普通のAIの学習データの枯渇が非常に問題視されています。2026年から2028年ぐらいに枯渇するんじゃないかとか出ていて。
 かつ、セルフディフレクションとかありますけども、そうは言ってもAIが生成したデータを自己学習しても、ある程度行くのだけれど、結局すぐスコアが飽和してしまう。
 なぜ飽和するかというと、考えてみれば当たり前で、人類だって何もしないで伝聞しかやっていなかったら全然進化しなくて、科学とか芸術なんかを含んで、一生懸命いろんなディスカバリーをしてきたからこれだけ進歩したわけであって、そのためにはどんどん新しい、サイエンスをやっていかないとAIの進化はしないというのが、AI for Scienceの信念的なところでありまして。
 なので、今後は単なるLLM、今のコンシューマーフェイシングの技術というのは早々に飽和してしまって、今後、難しいAI for Scienceの技術というのにチャレンジしていかないと、多分駄目だと。恐らく、Googleとかはその辺りを分かっていて、DeepMindにMicrosoftが科学のことをやらせているのは、そういうことがあるからなわけです。
【藤井主査】 その辺りはいろんな意見もあると思いますので、また、場を変えて行わせていただければと思います。


議題4:理化学研究所における次期フラッグシップシステムの検討状況について(非公開)
理化学研究所における次期フラッグシップシステムの検討状況についてR-CCS 近藤チームリーダーから説明があった後、質疑応答が行われた。
 
 
議題5:次期フラッグシップシステムの開発・整備に係る事前評価について(非公開)
次期フラッグシップシステムの開発・整備に係る事前評価について事務局から説明があった後、質疑応答が行われた。


事務局より事務連絡を行い、藤井主査により閉会。
 

お問合せ先

研究振興局参事官(情報担当)付計算科学技術推進室

電話番号:03-6734-4275
メールアドレス:hpci-con@mext.go.jp

(研究振興局参事官(情報担当)付計算科学技術推進室)