「次世代計算基盤に係る調査研究」評価委員会(第3回)

1.日時

令和4年12月1日(木曜日)15時30分~17時30分

2.場所

オンライン会議

3.議題

  1. 「次世代計算基盤に係る調査研究」の今後の進め方について
  2. 次世代計算基盤の在り方や「次世代計算基盤に係る調査研究」の方向性について
  3. 各調査研究チームの進捗状況やこれまでの成果の報告
  4. 全体意見交換などその他

4.出席者

委員

安浦主査、藤井孝蔵主査代理、相澤委員、井上委員、上田委員、奥野委員、後藤委員、高野委員、中川委員、中野委員、藤井啓祐委員

(PD)
小林PD、田浦PD、朴PD

(説明者・質疑対応者)
近藤 理化学研究所計算科学研究センターチームリーダー
牧野 神戸大学理学研究科教授
天野 慶應義塾大学理工学部教授
塙 東京大学情報基盤センター教授

文部科学省

工藤参事官(情報担当)、河原計算科学技術推進室長

オブザーバー

小川 経済産業省ソフトウェア・情報サービス戦略室企画官
橋本 経済産業省産業技術環境局研究開発課専門職
薬師寺 経済産業省産業技術環境局研究開発課調査官
豊田 気象庁数値予報課プログラム班長
村上 気象庁数値予報課技術専門官
雁津 気象庁数値予報課予報モデル基盤技術開発室予報官
小川 気象庁数値予報課予報モデル基盤技術開発室企画官

5.議事要旨

本委員会は、非公開情報を使用する可能性があることから、会議資料は非公開とし、議事要旨は以下のとおり。

議題1:「次世代計算基盤に係る調査研究」の今後の進め方について
文部科学省事務局より、直近のスパコンランキングの結果概要及び「次世代計算基盤に係る調査研究」の今後の進め方等について説明した。

議題2:次世代計算基盤の在り方や「次世代計算基盤に係る調査研究」の方向性について
次世代計算基盤の在り方や「次世代計算基盤に係る調査研究」の方向性について、小林PD、田浦PD、朴PDからそれぞれ説明を行った。委員から主な質疑や意見は下記の通り。
・小林PDの説明は、アークテクチャの観点から興味深い。日本独自の技術として残すべきものは何なのか、朴PD、田浦PDから説明のあったアプリケーションとの関係で、どのように調和させることができるか見識を伺いたい。
回答:「富岳」の開発を通じて得られたノウハウは蓄積されているので、良かった点は伸ばすあるいは尖らせる、悪かった点は直していくということはできると期待している。 ベクトル処理やアニーリングなどは、日本独自の技術を開発しているところでもあるので、そのような分野を育てていければと期待している。 システムソフトウェア的な観点の技術開発も必要であるが、そのベースとなるアーキテクチャの技術の育成に期待している。
・田浦PDと朴PDの説明に関して、アーキテクチャの汎用性と専用性をどうバランスをとるかの議論に尽きると思う。田浦PDが指摘したのは、利用面を考えたときの汎用性と専用性のバランスをどうするかという観点で、朴PDが指摘したのは、アプリケーションという観点からシステムをどこまで汎用性を持たせるか、専用性を持たせるかということだと理解した。
回答:利用面と説明したのは、いわゆるソフトウェア環境の話で、プロセッサーより上位の話である。そこはプロセッサーと当然関連しており、例えば新たに計算性能で特化したプロセッサーを検討すると一から作り直す必要があり、現状のものを置き去りにした形で検討が進められる危険性があるので、そうではなくて現状のシステムと関連させながら検討してほしいという指摘をした。
回答:専用、汎用という言葉と、アクセラレーターと汎用CPUはかなり誤解されている。汎用とはどのような処理も自由にできると思われており、汎用CPUとはそのようなプロセッサーで使いやすいと誤解されている。CPUで性能を出すのは非常に大変であり、例えばCPU内のキャッシュのデータが処理中に消えないようにするなど、複雑なことをしている。アクセラレーターを支えるためのソフトウェア環境が鍵と考えており、なるべく汎用的な環境をアクセラレーターユーザーに提供することが、専用と汎用の区別をなくすものではないか。下地となるハードウェアが十分性能の良いものである必要はあるが、それだけではなくアプリケーションの工夫も必要。
・朴PDは次世代計算基盤の検討範囲を、「富岳」ネクスト、つまり次期フラグシップシステムのことを、田浦PDは、HPCI全体で2030年頃の計算ニーズをどのように支えていくかというソフトウェア環境も含めている。ユーザーの立場、特に企業のユーザーからするとフラッグシップシステムばかりを利用するわけではないので、HPCI全体として、もちろん尖ったものがあってもいいが、システムソフトウェアとしてうまくどのシステムにもアプリケーションのポータビリティーがある程度保証される全体の枠組みの検討を特に運用技術チームにはしていただきたい。また、ターゲットとするKPIは重要だが必ずしも「富岳」ネクストというフラッグシップマシンだけではないということもぜひ周知していただきたい。
回答:事業名が「次世代計算基盤」とされており、「富岳」ネクストやフラッグシップにだけ注目しているつもりは採択チームにはないと思う。ただし、アジェンダ設定などをするときには、どうしてもフラッグシップシステムに偏ってしまうので、運用上そうなってしまわないように注意することが必要。

議題3:各調査研究チームの進捗状況やこれまでの成果の報告 各調査研究チームの進捗状況やこれまでの成果の報告について、理化学研究所、神戸大学、慶應義塾大学、東京大学からそれぞれ報告を行った。委員から主な質疑や意見は下記の通り。
・理化学研究所の報告について、プロセッサーだけでなく、ソフトウェアに関しても世界に通用するものをというやりとりが前の議題であった中で、システムソフトウェア、ライブラリーに関して、今後日本として取り組まなければならないものの仕分けの方針をどのように整理していくか、現状の進捗状況についてご教示いただきたい。
回答:現在各ベンダーへソフトウェアについて調査していると同時に、どこが開発コストで、例えばフリーソフトやコミュニティーのあるソフトウェアなどをベースにしたときに、そこに投資したときに日本としてどういうリターン、実利があるか考えていく必要があると思っている。また、ソフトウェア、コンパイラーについては、フリーのものを使うとしても、ある程度の最適化は必ず必要になってくる。ただ、その中でどこに注力すると、アプリケーションが皆さんに使い勝手が良く、システムとして有効性が高まるかということを見極める必要がある。
・コンパイラーなど例として挙げられていたものは、今の取組の延長線のようにも見えたので、なぜその技術が必要なのかというところを、もう一段、深掘りして議論を進めていただきたい。
回答:コンパイラーが必要と言っているわけではなく、最低限の最適化はそのようなところでも必要だという意見と、どこに力を入れるかということは別と考えている。例えばフレームワーク化したソフトウェアや、フレームワーク化するためのシステムソフトウェアなどを検討するのがひとつの鍵ではないか。
・慶應義塾大学チームの報告について、量子コンピュータはシミュレーションが中心で、計算自体はスパコンに期待しているということだが、量子コンピュータによるシミュレーションとそれをスパコンに連動することは、きっぱり離れている方がいいと考えているのか。米国の方が量子コンピュータについては進んでいるとは思うが、米国での量子向けのシミュレーション事情など、ご教示いただきたい。
回答:シミュレーションの調査と、量子コンピュータ自体をスパコンにつなぐということの調査は分けて考えるべき。現状で、例えばスパコンを使って、状態ベクトル方式だと、どうしても40キュービット程度、頑張っても50キュービット以上にならないと思う。しかし、テンソルネットワークというモデルを使った計算は、より多くの計算ができることもあり非常に評判になっている。 これは古典コンピューティングが量子超越に対して対抗しうることを示しており、中国ではスパコンで実装されて評判になっており、そのあたりを調べなければならない。
・神戸大学チームの報告について、「富岳」でもすでにAIフレームワークはあるが、ポスト「富岳」ではどう差別化するかご教示いただきたい。
回答:AIフレームワークに関しては、基本的にJAXやPyTorchなどの汎用フレームワークをベースに考えており、それらに対して実際に使った性能がより高いものを出せるようなアーキテクチャを作っていこうというのが我々の考え方になる。
・つまり、AIとは深層学習と捉えているか。
回答:その意味では、ここでフレームワークと言っているもの自体が深層学習のフレームワーク、ニューラルネットを表現するものを今のところ想定している。
・最近だとフィジックス・インフォームド・ニューラルネットワーク(PINN)と言われ、偏微分方程式を対象としたものが注目されている。従来のニューラルネットワークの深層学習は、エンド・ツー・エンドで画像や音声を入れて学習させるものだが、今後の発展があまりないと思っている。 2019年にPINNが登場し、もう数千件以上引用されており、物理学者が圧倒的に多い。観測データがない状況で観測データから学習するのが今のいわゆる入力型の機械学習だが、HPCを今後発展させるのは偏微分方程式を土台とする創薬や生物化学などのサイエンス領域だと思う。それを連続的に解くのがPINNの特徴である。実際にインテルなどはPINNにかなり注目しているので、そのようなところにも調査が及んでほしい。
・東京大学チームの報告について、運用技術の面で、電力も含め運用していくときの全体のコストをどう考えればよいのか、また、その運用するための機能を維持するためのリソースはどれが必要なのかというところの調査状況をご教示いただきたい。特に既にある「富岳」の状況などの元データがベースになると思うが、それに対する見込みをどの程度作れるものなのかお伺いしたい。
回答:フラッグシップをはじめ、各基盤センターのシステムは、各基盤センター独自の予算に基づいて導入、運用をしており、構成機関全てについて、どのぐらいの電力でランニングコストがかかっているかということを調査しようとしている。それを受けて、今後どのようなところをスリム化していくかなど、全体で理想的なモデルを作ってみるなどの検討に進めればと思っているが、規模によっても差が出てくるところもあり、特にフラッグシップシステムとその他のシステムでは10倍以上の差があるため難しいところもある。今後検討していく。
・量子の専門家として慶應義塾大学の報告は非常に肌感覚に一致する内容であった。特に実際に使っている量子ビット数が2~6キュービットしか使えていないという現状の指摘は非常に重要。これはどのようなタイムスケールで量子コンピュータを計算資源として捉えていく必要があるのかという点で非常に重要な報告。
アニーラに関する報告の箇所で、ベンダーに関するものがあったが、富士通のプロセッサーがGPUとなっていたが、それでよいか。東芝、日立、富士通はCMOSベースでオリジナルのアーキテクチャを作られていると思うが。
回答:オリジナルのアークテクチャの方は、基本的にジムキーが主体であって、エネルギー効率やアニーラでは優れている。ただ、スパコンにつなぐことを考えると、どうしてもGPUを使いアルゴリズムを進歩させた方がメジャーな方法となっており、そちらを調査対象とした。
・調査結果は、イジングという問題に特化して専用アーキテクチャを作っているが、ある程度汎用性があるGPUのソフトウェアを実装した方が計算が速いということか。
回答:エッジ側でエネルギー効率を重視して計算するのであれば、専用マシンの方がメリットがある。ただ、現在GPUの発達が目覚ましく、そのようなGPUを多く使い計算する場合は、単体のエッジ用の専用マシンでは歯が立たない。
・「富岳」のプロジェクトの振り返りから始めて、そしてポスト「富岳」の開発意義についてということで緻密に検討されてきているのではないかと思うが、今後このようなプロジェクトが徐々に大きく発展していくためには、何が技術的に継承され、何が大きく変更されるのかが明瞭になっていくと良い。
・一つ前の議題の朴PDの発表のところで、アプリケーションをしっかりと考えた上での設計が非常に重要であるとの指摘だったと思うが、持論として例えば今の「富岳」の1万倍の性能になると確実にSociety 5.0は実現されると考える。自身の専門である創薬計算の化合物探索だと、1万倍というのは大きな基準の目標である。そのようなときに、「富岳」ネクストが「富岳」の性能の何倍になるかが、それぞれのアプリケーション側の基準がずれているとベンチマークの統合化が結局できないことになる。それぞれのアプリケーションにおいて、最終的に必要な目標値などの情報が集まり次第、他のチームに共有するなどが必要ではないか。
回答:今まさにアプリケーションの分野の方たちに、将来どういう性能のものが必要かということをヒアリング、アンケートを取っている状況である。ただし、そこでの性能とは、単に浮動小数点の演算が1万倍なのか、あるいはそのときに、実行性能を1万倍にするためにはレイテンシーが大事なのか、あるいはスループットが大事なのかを見極めないといけない。もちろん、アプリの部分はぜひ全員の知見に生かすべきなので、調査研究チーム間では共有していきたい。

お問合せ先

研究振興局参事官(情報担当)付計算科学技術推進室

Get ADOBE READER

PDF形式のファイルを御覧いただく場合には、Adobe Acrobat Readerが必要な場合があります。
Adobe Acrobat Readerは開発元のWebページにて、無償でダウンロード可能です。

(文部科学省研究振興局参事官(情報担当)付計算科学技術推進室)