次世代計算基盤検討部会(第6回)議事要旨

1.日時

令和3年5月27日(木曜日)17時00分-19時00分

2.場所

オンライン会議

3.出席者

委員

安浦主査、小林主査代理、相澤委員、合田委員、荒瀬委員、井上委員、上田委員、後藤委員、小紫委員、田浦委員、常行委員、中野委員、根本委員、肥山委員、藤井委員、三好委員、山本委員

文部科学省

杉野研究振興局長、塩崎審議官、橋爪参事官、宅間計算科学技術推進室長、西川参事官補佐、太田専門職

オブザーバー

慶應義塾大学近藤教授、科学技術振興機構研究開発戦略センター木村上席フェロー、青木フェロー、理化学研究所計算科学研究センター松岡センター長

4.議事要旨

議題1:次世代計算基盤について
【安浦主査】 最初の御講演ですが、この4月から慶應義塾大学に移られました近藤先生から、NGACIにおける検討状況等について御説明いただきます。NGACIは、コンピュータアーキテクチャに関する若手の研究者の集まりというふうにお聞きしております。講演時間は15分を厳守していただきたいと思いますので、近藤先生、よろしくお願い申し上げます。
【近藤オブザーバ】 御紹介ありがとうございます。慶應大学及び理研の近藤と申します。本日は、このような機会をいただきまして誠にありがとうございます。NGACI、次世代先端的計算基盤の開発に向けたコミュニティ活動に関して御紹介をさせていただきたいと思います。
まず初めに、このNGACIの活動がどういうものかと申しますと、コミュニティベースで活動させていただいておりまして、将来の高性能計算環境として、また共用計算機資源としてどのような技術課題があって、このコミュニティとしてどのような研究を進めていけばいいのかということを議論し、また、それをホワイトペーパーとしてまとめることを目的としている活動でございます。
これまで100人以上の方に御参加いただきまして、活発に御議論いただきつつ、現在、ホワイトペーパーとして第1版を公開しております。実際に執筆に携わっていただいた方をここに掲載しておりますけれども、詳細は省略させていただきます。また、ホワイトペーパーの章構成ですけれども、御覧いただいているようになっておりまして、今回主に関係するところとしては、3章のアプリケーションの要求性能分析、及び4章の次世代システムの検討、また関連して、技術課題ですとか研究開発ロードマップの部分が主として関連するかと思いますので、その部分を中心的に御紹介させていただきます。
実際に、第4章の、2028年頃に実現可能な次世代システムの予測というところから御説明いたしますけれども、このホワイトペーパーでは、次世代システムのアーキテクチャ候補として幾つかのタイプを検討しておりまして、特に、大きく汎用システム型と専用システム混載型というふうに分けて検討しております。汎用システム型の中には、「富岳」の延長として考えられるようなメニーコアCPU型のシステム及び、現在多くのシステムでも採用されておりますけれども、GPUを混載したようなシステムを主に検討しておりまして、そのほかにベクトルプロセッサに関しても言及をしております。こちらは比較的、現状のトレンド、あるいは文献等々から将来的な予測が立ちやすいので、定量的な見積りをしております。
一方で、専用システム混載型に関しましては、定量的な評価というのはなかなか難しく、ボランティアベースで活動している皆様ということもありまして、また、アプリケーションの方と一緒に、密に連携しないと、実際の性能等は見積もれないということもありまして、今回のホワイトペーパーでは、例えば、どういう混載型が考えられるのか、あるいはどういうタイプのアーキテクチャを考えるべきかと、そういうところを定性的に述べているにとどまっておりますけれども、それらの議論をまとめてここに書かせていただいております。
まず、先ほどの汎用システム型のほうから少し紹介させていただきます。
汎用システム型の性能予測を主に行っております。どのように予測したかと申しますと、主には、ここに挙げられているようなコンポーネントごとにそれぞれロードマップがありまして、その文献等、予測するとともに、またGPUに関しては、現状の製品をベースに、その製品の仕様を外挿することで将来的な性能を予測すると、そのような手法を取っております。詳細に関しては割愛させていただきますけれども、この文献から取ってきたというということでございます。また、いくらでもハードウエアを投入すれば性能等は上がるということから、何かしらの制約を仮定しないと意味のある見積りができないことから、今回は最も重要な制約となり得るであろうシステム全体の電力バジェットというものを制約として考えておりまして、特に30メガワット、40メガワット、50メガワットの3種類にパラメータを振って検討するとともに、そのうちの何割がCPUあるいはGPU、あるいは計算資源ということですけれども、それに投入できるかと、その比率を60%から80%というように振って、比較、評価をしております。
実際にこれが見積り結果になります。この表は上のほうに、システムの電力制約、30メガワットから50メガワットの仮定がありまして、その中で特にCPUの電力バジェットとして60から80%に振っていると、そういう表になっておりまして、そのときのハードウエアのパラメータ等がここに一覧として書かれています。参考までに、「富岳」の諸元をここに示させていただいておりますけれども、最も注目すべきところとして、やはりピーク性能が考えられますけれども、それがこの行に相当します。
実際に、最もアグレッシブな50メガワットの電力バジェットで80%の電力をCPUに投入できるとした場合に、ピーク性能が最大1.8エクサフプロップスというふうに見積もられております。これは「富岳」の性能の3.37倍に相当しまして、実際この値を見ると少しがっかりする数字と思われるかと思いますけれども、今回、基にしたロードマップの数字が、データセンターのサーバ向け、すなわちインテジャー型をリッチにしたり、あるいはL3キャッシュをリッチにしたりというような、HPCとは少しパラメータ、構成が違うようなシステムをベースにしているということもあって、このような数字になっている面が大きいかと思います。
次に、GPU混載型システムの予測でございますけれども、これは保守的な場合と積極的に見積もった場合の2種類を検討しておりまして、今回は積極的な場合のみ説明させていただきますけれども、こちらはCPUとGPUの現在の性能比のトレンドを外挿したということで評価をしております。先ほどと同じように、最もアグレッシブな場合のみ言及させていただきますけれども、50メガワットで80%がGPUに投入できる、電力が投入できるとした場合の性能として、最大18エクサフロップスという見積りが出ています。こちらは「富岳」の性能の33.5倍に相当しまして、実際にこれぐらい到達できれば非常によいかなと思うんですけれども、仮定としてアグレッシブな想定をしていますので、ここまで行くのも非常に大変かとは思います。実際には、先ほどの1.8エクサフロップスから、この18エクサフロップスという間ぐらいの数字に、通常の技術ロードマップを基にしたアーキテクチャ構成であれば入るのではないかというふうに考えることができるかと存じます。
一方で、アクセラレータを混載するという構成方式に関しては、先ほども言いましたように、定量的な評価はまだ行えていませんので、例えばこのように、どのような構成を考えるべきかということを述べているにとどまっているんですけれども、例えば専用アクセラレータとして、特定の計算問題のみを高速に処理可能な構成方式ですとか、もう少しプログラムアビリティーを持たせて、ある程度広い計算問題を高速に処理できるような準専用アクセラレータですとか、あるいは再構成可能デバイス上にアプリケーションをマッピングすることによって、幅広いアプリケーションで高性能が得られるような汎用アクセラレータ方式ですとか、そのようなことを議論しております。
これらの詳細については、時間の関係上、ここでは紹介するにとどめるんですけれども、やはり一番重要な観点として、先ほどの汎用的なアーキテクチャで構成されたシステムなのか、演算加速機構、アクセラレータを統合したようなシステムを検討すべきかというところが最も重要な議論になるかと存じます。やはりHPCでは、ターゲットアプリケーションが複数あること、あるいは新規の応用分野もこれから出てくると想定されること、またさらに、各アプリケーションでもアルゴリズムが日々改良されているということもありまして、ホワイトペーパーで言及されている重要な点としては、やはり特定ドメインで優位性を発揮できる一方で、様々な処理を実行可能な広義のアクセラレータを前提として考えるべきであろうということが述べられています。やはりここでは、どれだけのバジェットをハードウエアとして演算加速機構に投入して、どれだけのリターンがあるかと、それらコストとのトレードオフを十分考慮する必要がありまして、また、プログラミングの生産性が非常に重要な、キーポイントになるというふうに述べられているとともに、やはり組み込みシステムのような、特定ドメイン向けの専用システム開発とは異なるアプローチ、すなわちコデザインによって、幅広いアプリケーションで有効なアクセラレータ、あるいはそれを汎用システムに搭載するべきか、そういうことを検討していくことが重要になるだろうというふうに思われます。ほかにも、メモリ階層を含めていろいろな技術課題がありますけれども、これは省略させていただきます。
次に、アプリケーションの要求性能分析、3章に相当する部分に関して、簡単に御紹介させていただきますけれども、この章では、計算科学ロードマップですとか、アプリケーション分野の方々のアンケートに基づいて、37個のアプリケーションの要求性能を分析いたしました。2028年頃に要求される性能に対して、それが満たせるのかどうかというところを重点的に検討したわけなんですけれども、その際の仮定として、先ほどのメニーコアとGPU型の構成においての、最もアグレッシブな構成を前提に評価しております。
その結果だけをお見せしているんですけれども、この表はメニーコア型システムにおいて、いろいろなアプリケーションの際に、それぞれノード数ですとかCPUの性能、あるいはメモリバンド幅、あるいはネットワークのバンド幅ですとかストレージ、それらを全部含めて、トータルとして要求性能が満たせるかというところを、丸とバツの表で表しております。これを見ていただけると分かりますように、丸のところも多いんですけど、特にメモリの性能のところで要求を満たせていないというものも散見されます。また、この前提として、非常にアグレッシブなシステムの活用をしていることですとか、あるいはシステム全系を使ったときに満たせる性能を仮定しているということから、必要なノード数以上のノード数を使った場合にメモリバンド幅がトータルで満たせているかと、そういう視点で評価をしているということもあって、純粋に、これだけ丸があるからオーケーということにはならないことに御注意いただければと存じます。実際に、最終的にはトータルとして、半分ぐらいは満たせている可能性があるんですけれども、半分ぐらいは満たせていないものもあると、そういう結論に至っています。
こちらはGPU型の場合で、CPU型に比べて少しバツが多くなっているというようなことが見てとれます。
次に、ほかにも次世代型運用への要求ですとか、あるいは技術課題と研究開発ロードマップという点で、幾つか抜粋してここに書かせていただいております。特に研究開発ロードマップ分野に関しては、やはりアーキテクチャ分野、ハードウエア分野では、電力効率をいかに改善できるかという点ですとか、アクセラレータアーキテクチャの検討、またメモリが重要になるということから、3次元積層化も含めて、バンド幅の広帯域化とメモリ容量の大容量化などが課題、それを研究していくべきですとか、あるいはシステムソフトウエア、ライブラリ、アルゴリズムに関しても、このような今後の技術課題及び研究開発ロードマップの点が述べられております。ここに書かせていただいている部分以外にも、多くのことが述べられております。
最後に、これまで何回かホワイトペーパーに関して発表の場をいただきまして、その中で議論をさせていただいた点、また少し私見も入るかもしれないんですけれども、それを踏まえて、次世代の計算基盤開発で重要と思われる点を述べさせていただければと思います。
次世代の計算基盤の役割として、当然ながら、計算とデータによる科学の発展、進化、振興と、それによる社会貢献というのが最も重要な点だと思っています。一方で、それだけでなくて、この先端的な計算基盤の開発を通して、新時代のコンピューティング開発と、それに向けた人材育成も非常に重要視されているということを、いろいろ議論させていただく中で感じているところでございます。
そのために、どのような開発あるいは体制がよいのかというのは、非常に難しいのですけれども、それに資する1つの方向性として、コデザインの強化、アプリケーションとの協調設計をより強化して行っていくこと、また新応用分野を開拓するということ、そしてオープンイノベーションプラットフォームの構築というものを意識して開発していくことが挙げられるかと思っております。新応用分野の開拓に関しましては、例えばデジタルツインによって、Society 5.0向けに、人の行動心理や感情も含めたシミュレーションによって社会を最適化するということも考えられますし、また、10年後だけでなくて、20年後、またそれ以降の先を見据えて、量子計算と古典計算のハイブリッド計算環境構築に向けたテストベッドにも資するようなシステムを構築するべきというようなことも考えられると思います。
これによって、将来的なグランドチャレンジ自体が、またこの基盤から生まれていくような、そういうシステムになるべきだということも思いますし、また、オープンイノベーションに関しましては、やはり、先ほどのアクセラレータの部分でも述べましたけれども、今後新しいアーキテクチャの検討が重要になるにつれて、1つの懸念点として、開発したものがガラパゴス化してしまうという懸念もございます。そうすると、開発が単発で途切れてしまう、また、そうすると人材あるいはノウハウの継承というものもできなくなってしまうということも危惧されますので、やはり最初にエコシステム構築というものを強く意識して、また長期的な人材育成というものを意識したプラットフォームであるべきというふうに考えています。そのためには、いろいろなコミュニティ間、あるいはベンダー間、そしてまた国際的にも連携するということが今まで以上に重要になるというふうに思っています。ですから場合によっては、海外のアプリケーションも含めてコデザインをするですとか、そのように最初から国際的な連携を含めて開発していくことも重要かもしれませんし、IPや部分的な開発について海外の技術を積極的に取り入れることも、オープンに議論されてよいのではないかと思っています。そのようなことを開発の前段階、あるいは設計の段階から考えていくことが今後重要になるのではないかというふうに思っております。
最後に、計算基盤の可能性と期待ですけれども、現在、もちろん科学のためにコンピューティングやデータが重要な役割を果たしておりますけれども、もちろんこれまでにも計算科学ということで、サイエンス掛けるコンピューティングという分野でスーパーコンピューティングが発展してまいりましたし、今ではコンピューティングとデータということでAIが発展し、またサイエンスとデータということで、データ同化などの新しい応用の発展も期待されるかと思います。それだけではなくて、サイエンス掛けるサイエンス、多様な科学の融合ですとか、コンピューティング掛けるコンピューティングで将来の計算の探求とか、データ掛けるデータということでデータ融合による価値創造ということにもつながるようなシステム開発が、この次世代計算基盤でできればいいと思っておりまして、これらについてもコミュニティで議論を続けていきたいと思っています。
最後に、これまでにもいろいろな御意見をいただいております。今後これを踏まえて、このコミュニティ活動を継続していきたいと思っております。最後にメッセージとして、やはりアプリケーション、システムの協調設計が重要になると、コデザインによるハードウエア、ソフトウエアのアーキテクチャの検討というものが非常に重要、特に日本でやるべき重要な点だと思いまして、それをどう実装していくかというのは、今後オープンに検討させていただければと思っています。
以上です。ありがとうございました。
【安浦主査】 近藤先生、分かりやすく御説明いただきまして、どうもありがとうございます。議論は後半の総合討論のところで行いたいと思いますので、今この時点で、今の御発表の中で、ちょっと言葉が分かりにくかったとか、簡単に聞いておきたいことがございましたら、委員の先生方、手を挙げていただければ、近藤先生にお答えいただきたいと思います。議論になる部分は後ほどの後半で行いたいと思います。どなたかございますか。よろしいでしょうか。
私のほうから1点だけ、ちょっとお聞きしたいのですが、今回のこのホワイトペーパーで、実際にそのマシンをつくるために、ハードウエア、ソフトウエア、いろんな技術が必要になってくるのですけど、それを、国内国外両方含めて商用のものを転用する話と、新たに一から自分たちで作っていく話というのは、分けて議論はされたのでしょうか。
【近藤オブザーバ】 どのように開発体制を組むかという点まで踏み込んで議論はできておりませんで、あくまでも技術的な可能性ですとか、性能やパラメータについての議論、あるいはその技術動向に関する議論が主になっております。
【安浦主査】 分かりました。どうもありがとうございます。
ほかに御質問ございませんでしょうか。肥山先生どうぞ。
【肥山委員】 簡単な質問で申し訳ございません。12ページのアプリケーションの要求性能との比較のところを見たときに、私、素核宇宙というか、素粒子・原子核なんですけど、Name of Applicationのところがほとんどunknownなのはどういうことか、聞いてもいいでしょうか。ほかは名前があるのですが、これはどういうことだと思えばよろしいのでしょうか。独自の、自前のアプリケーションを使っていると、そういうことですか。
【近藤オブザーバ】 これは計算科学ロードマップを基にしているのですが、そのときにアプリケーション名が明示的に書かれていないということで、unknownという言葉が適切か分からないんですけれども、アプリケーション名が分からないと、そういうことでございます。
【肥山委員】 そういうことですか。どうもありがとうございます。
【安浦主査】 よろしいでしょうか。ほかに、簡単な御質問ございますか。
それでは後で、またございましたら、議論のときにも御質問いただければと思います。近藤先生、どうもありがとうございました。
【近藤オブザーバ】 ありがとうございました。
【安浦主査】 それでは、2番目でございます。科学技術振興機構(JST)の研究開発戦略センターの木村上席フェローより、国際動向を含めました、半導体技術も含めた産業の視点も踏まえた、この周りの動向について御講演いただきたいと思います。木村上席フェローは富士通の御出身で、以前は、こういう国プロのスパコンの開発ですとか、あるいはアメリカでの御滞在も長くて、シリコンバレーにおける半導体産業の流れとか、そういうことにもお詳しい方でございます。
それでは、木村さん、よろしくお願いいたします。
【木村オブザーバ】 JST、CRDSの木村でございます。今日はこのような機会をいただきまして、本当にありがとうございます。今、安浦先生からありましたように、今、私はJSTにいまして、調査研究のほうが主体なんですけど、以前は産業界でスパコン等々やっておりましたので、その経験も含めて少しお話しさせていただきたいと思います。今日の話は、スパコンに関してはトレンドとアーキテクチャの話と、それから、安浦先生から、半導体についても少し話をしろと言われていまして、難しい質問をいただいているのですが、そこについて私の私見を少ししゃべってみたいと思います。
まずスパコンですが、私たちが一番感じているのは、やはりスパコンというのは、従来の、単なる数値計算というよりは、だんだん利活用の分野が拡大してきているなというのを非常に強く思っています。新しい科学、これからちょっと説明させていただきますが、実社会データを使ったスパコンを活用していくという話、それからHPC as a Serviceみたいな話等々が今のトレンドではないかなというふうに思っています。
もう一方で、では、どうその要求に応えていくかということで、HPCと、それからデータをどううまく使い合わせるか、これは先ほど申し上げた実社会データをどう組み込んでいくか、インテグレートするかというところが、データ基盤、もとよりそういうところも課題になってくると思うし、そうなると、要求に応えるためにはクラウド、ヘテロなクラウド、ハイブリッドなクラウドになるのではなかろうかというふうに私は考えております。これを、裾野を広げるという意味では、使いやすいユーザインターフェース、専門家でなくても使えるようなものに仕立て上げていく必要があるだろうなというふうに考えております。
ちょっと今、私、考えてみたんですけど、先ほどの応用分野の広がりという意味で、横軸を、従来の数値計算的なシミュレーションから、マシンラーニングを含めたシミュレーション、それからそれにもう一つ、もう一歩先のものを加えたものと、横軸にそういう時代の流れを仮定しまして、縦軸はアカデミックからインダストリー、ソサエティー、社会問題までを考えてみると、こんな書き方ができるんじゃないかなと。ここにはいろいろな、トピック的なもの、あるいは学問的な領域、あるいは今々の技術的にも必要なものというのを書き出してみると、左上からだんだん右下に、いろんなものが出てきているなというふうに思います。この中に書いてあるのは、その粒度もいろいろなものがごっちゃになっていて、あまり正しい表現ではないかもしれませんけれども、こういう傾向にあって、少なくともスパコン、HPCの利用分野が非常に広がってきていると、あるいは期待も大きくなっているというふうに言えるのではなかろうかと私は考えております。
まず、その一番右上にあります第5の科学という、御存じの方も多いかと思いますけれども、第1、第2、第3、第4と来て、第5でAIの活用が成熟してきて、そうなると、従来は、例えば、この下半分にありますけれども、いろいろな自然現象、社会現象を、線形関数で近似していたものが、この出力データというものと、入力の関係をうまく考えれば、ひょっとすると、それそのものを非線形、高次元の関数で近似できるのではなかろうかと。そこまで厳密に書かなくても、自然、社会現象が近似できて、それによって、より高い性能、予測、制御が可能になる可能性があるのではないかというようなことを少し考えています。つまり、人間の認知限界、あるいは我々が意識しているもの以上のものが見えてくる可能性があるのではないかというふうに考えています。膨大な計算が必要であることは言うまでもありません。
2つ目が、我々、Beyond Disciplinesというので、いろいろ調査研究をやっているのですが、右上のような、例えば先進の設計とか製造基盤の技術を、いわゆるよく言われるデジタルツインを使ってモデル化して、フィードバックして最適化を求めましょうというような話が1つあります。右下は医療の話ですけれども、AIによってビッグデータ分析、解析をすることによって、新しい知見が得られる、あるいは新しい製薬も含めてですけれども、そういうものが出てくる可能性があるというふうに期待されています。ただ、ここでは、マシンラーニングとかディープラーニングが、何か過大な期待をもって捉えられていて、本当にこれが有効に使えるかどうかというのは、少しまだ検討が必要であろうというふうに思っています。
次のページ、左側の上はエッジコンピューティングと言われている分野に相当すると思いますけれども、膨大なリアルワールドのデータが上がってきたときに、それをどううまく計算、処理していくかというところが、クラウド、あるいはエッジコンピューティングのところで必要になってくるだろうと思われます。それから上の右ですけど、これはいわゆるマテリアルズ・インフォマティクスの話で、ここもAIを使っていろんな材料の、新材の候補を見つけるというような話です。これももう具体的に、いろいろな企業でもやられているかもしれません。
それから3つ目が、もうちょっと幅広く考えて、最近は人文社会科学的な知識をもっと取り込むべきだという話が、第6期の科学技術基本計画といいますか、イノベーション計画に入ってきましたけれども、この観点で、社会シミュレーションというところにも、こういう計算、HPC的なものが活躍する場があるのではなかろうかというふうに考えています。ここでも膨大なシミュレーション、これはマルチエージェント的なシミュレーションなのかもしれませんけれども、こういうものを使って複数のシミュレーション結果を出して、それを社会の合意形成等々の場に使っていくというふうな話があると思います。これは先ほどの近藤先生の話にも、少し出ておりました。
それから、話がちょっと変わりますけれども、トップ500の中でHPCがどういうふうに見られているかというのを少し書き出してみました。これで見ると、日本、アメリカ、欧州、中国と見ますと、産業利用の割合に特徴的なものが見られると。日本では、トップ500の中のスパコンのうち、ほとんどがアカデミックあるいはリサーチなんですけれども、米国や欧州では4割方のスパコンが産業界で使われている、中国ではもう産業界が圧倒的に多いというふうになります。もう1点、特徴的なのは、トップ100を見ると、中国はトップ100には2台しか入っていなくて、ほとんどはそれ以下のもので、要するに、国策だろうと思いますけれども、トップを取るために巨大なシステムを1台か2台つくっているというのが中国の特徴であろうというふうに思っています。日本で産業界が少ないというのは、こういうトップ500に産業界がエントリーしていないという面もあるかと思いますけれども、トップ500を見る限り、こういう特徴的なものがあると言えると思います。
もう1点、欧州の取組例を少し調べてみたんですけれども、欧州ではETP4HPCという、ドキュメントが出ておりまして、ここでも、今、私が説明したようなこと、同じようなことを言っております。すなわち、右上ですけれども、これはいわゆる通常のデータと、それからリアルタイムのデータをマージすることによって、意味のある計算をしましょうということと、右下はオープンクラウド、いわゆるクラウドシステムのバックエンドに位置付けているんだと思いますけれども、HPCを使って、巨大な計算はHPCを使うと、ユーザはこのクラウドを通してHPCを使うというような、そういうシステムを仮定して、いろいろな検討を進めております。
このETP4HPCなんですけど、これはファンディング機関でありまして、産業界主導のシンクタンクというふうに位置付けられているそうです。右下にメンバーが出ていますけれども、日本の企業だと、左の真ん中あたりに富士通さんと、それから、真ん中の一番下あたりにNECさんが入っています。ここのファンディング機構が、今はこういうふうに、2021年にいろいろな、EU域内にスパコンを設置しようとしていて、具体的にこういうふうな計画が進んでいるそうです。この辺の話は御存じの方も多いかと思います。ただ、このレベルでは、まだ、このスパコンそれぞれをネットワークでつないで協調的に使うという話には、どうもなっていないというふうに聞いております。
ここで取り扱うユースケースなんですけれども、我々が考えているのと似たようなことを言っておりまして、自然災害予測、自動運転、AIのオートメーション、品質予測、それから地震、噴火等々、こういう社会問題的なところにも随分と視点を置いているというのが特徴ではなかろうかと思います。
じゃあ、こういうのをどうやってつくっていくんですか、対応していくんですかということを考えていて、今回、過去のこの検討部会の議事録を見させていただきましたけれども、同じようなことを既に多くの方が言われているし、今日、近藤先生も同じようなことを言われたと思うんですけれども、こういうデータ基盤だけではなくて、計算基盤も有する次世代学術研究プラットフォームというのを使って、今述べたような社会問題等々を解決していくというふうに行くんだろうなと、計算分野と、それからデータのところですね、データ統合の辺りが今後かなりキーになっていくのではないかなと私は考えております。
これはヨーロッパの例ですけど、これももう御存じかと思ったんですが、CERNです。実験施設で取ったデータをTier-0で、そこから全世界に送って計算をするということをしているそうです。これは日本にも1か所、星がついていて、どこか担当している部分がTier-2としてやっているように見えますけれども、処理を担当している。ディバイド・アンド・コンカー的な処理、あるいはmapcar的な処理だと思うんですけれども、こういう処理を全世界でやっているというふうに聞いております。
じゃあ、これをやるためにどういった技術的な課題があるんですかということで、やはり基礎基盤から応用・運用まで、バランスの取れたシステム設計が必要であるというふうに考えます。具体的に、ハードウエア関係では、計算機部分もそうですけれども、やはりインターコネクト、広域インターコネクトをきちんとつくる必要があるだろうなと。ソフトウエア関連では、異種混合のクラウドで性能を出す計算手法とか、それから計算機が、必ずしもアーキテクチャが全部そろっているわけではないので、その違いを隠蔽するシステム化技術、仮想化、ユーザインターフェース等々が必要になってくるだろうと思います。先ほどありましたように、皆さんに使っていただくとなるとセキュリティを考える必要があって、あるいはデータ管理をきちんとする必要があります。こういうところに関しては我々、今年、戦略プロポーザルを書かせていただいて、ちょうど今年から、CREST、さきがけとして、これに関連する国プロが走り始めているということです。それから、運用関係、非常にこれは重要で、運用形態や予算措置等々も考えていかなければいけない、エコシステムをつくっていく必要があるだろうというふうに考えております。
ここは、それに必要な個別技術を少し書かせていただきました。左上がapproximate computing、つまりビット数を減らすなり、計算をサボることによって実行時間を早くするのと、それから消費電力を削減しましょうと。真ん中の段は、いわゆる秘匿計算、あるいは部分計算というんですかね、マルチ・パーティー・カリキュレーションをするというような、そういう技術が必要になってくるでしょう。企業さんのデータを使うときなんかには、こういう、中身は分からないけど計算はできるというような仕組みがやはりどこかで必要で、こういうことも考えていく必要があると思っています。それから、左下はNTTのIOWNから持ってきたんですけれども、光というのも実用になりつつあるというふうに聞いておりますので、積極的に考えていく必要があるだろうなと。ハードウエア的にはこういうのが必要。加えて、低消費電力化という観点も必要かなというふうに考えております。
ここからが少し半導体の話に行かせていただきたいんですけれども、半導体の技術動向ということで、3つほど書かせていただきました。ロジック用デバイス、ムーアの法則の限界が近づいているという話もありますので、2次元から次元を少し上げるような工夫とか、不揮発のメモリをきちんと使いましょうとか、微細化ロードマップも、最近ではTSMCが5ナノプロセスを量産するとか、かなりアグレッシブなことを言い始めています。つい最近ですかね、IBMが2ナノのテストチップを作ったとか、そういう技術的な限界に挑戦するという話が進んでいるというふうに聞いております。
それで、ビジネスに関して少し、これは本当に私見になるんですけれども、米国なんかですと、バイデン政権になって、雇用を創出するというのがアメリカの大統領の1つの大きな仕事だと思いますので、それも含めて、製造業にもう1回、回帰しようという話が大きく出ています。右にパット・ゲルシンガーの写真を載せましたけれども、彼はVMwareに行っていたんですけど、またインテルに戻ってきて、やっぱり自社できちんとCPUをつくるぞというふうに言っているそうです。こういうのも少しサポートになるのではないかなと思っています。台湾のTSMCも、これもアメリカから要求されたのかどうか分かりませんけれども、アリゾナに新工場を造ると、120億ドル使うと言っているんですね。ここには書かなかったですけど、日本のつくばのTIAにも後工程の工場を造るというような話を聞いていまして、これは個人的な感想ですけど、地政学的なリスクを回避しようとしているのかなというふうに、私には見えています。欧州はエクサスケールのスパコン、先ほど言いましたように、やると言っていまして、これは多分、ゼロからつくるのではなくて、ある種調達ベースなのかなというふうにも思っています。先ほど述べましたように欧州は、どちらかというとハードよりは、問題解決のためのソフトウエア技術をつくろうというのに重点があるようで、利活用に結構重きを置いているように見えます。中国は、半導体関連技術に5兆円を超える、1次、2次と、2つあったように思いますけれども、こういう何とか基金を使って、大きなお金を投資しています。これはよく知られているように、国家の威信をかけて半導体強国をつくる、半導体だけではないですけど、何とか強国をつくるというふうに言っているように私には見えます。
もう1個、一番大きい、最近新聞等々で言われているのは、米中関係、コロナ禍を契機に半導体不足が顕在化してきていて、サプライチェーンが課題になっているというふうになっています。でも、というんですかね、こういうところは非常に判断が難しいと思っていまして、例えばTSMCが120億ドルを使う、1兆円規模のお金を投資しなければ新工場を造れないというような、莫大な投資が必要であるということと、それからもう一方では、シリコンサイクルと言われますけれども、投資に対して、それを回収する時期がかなり遅れてしまうということが半導体ビジネスの特徴だと思っていまして、それも非常に景気に左右されるとか、かなり予想が難しいというのが宿命としてありますので、単に競争するというよりは、何というんですか、志を同じにする国同士なり地域なりが協調して一緒にやっていこうというようなことを、昨日もちょっとニュースでそういう話がアメリカから出ているような話も聞きましたけれども、そういうフェーズにそろそろ来ているんじゃないかなと、私は考えております。
半導体の研究開発について少し思いを述べさせていただくと、日本の強みを一言で言うと、実社会データとサイバーとの連携。GAFAはサイバーを中心に今は技術をやっていると思います。IoTデータに関しては、非定型、リアルタイムデータなど、属性の幅が非常に大きくて、アプリ側からの要求仕様も非常に多様になってくるということなので、これに対応するように、しかも開発期間を短縮して、例えば1年、2年ではなくて、半年、1年で作るようなものにしないといけない。それは多品種少量生産になるだろうし、低消費電力にしないと使っていただけないというふうになると思います。なので、そういうところで、IoTチップとサイバーとの連携で日本の特徴を出すというのがやはり1つの方向ではないかなというふうに、私は個人的に考えております。
そのためには、やはり小回りの利く開発部隊というのをつくるのが必要だろうなと。ユーザの要求を設計に反映して、それをアジャイル的に早く作って出していく、インターフェースを共通化するためにはオープンコミュニティの資産を活用するということも重要なのではないかなと思っております。チップの開発は、ODM、OEMとか、ミニマルファブ等を活用して、ある種の水平分業的な仕組みを取るのも1つの手かなというふうに私は考えております。ファブが水平分業で、例えばTSMCは、いろいろな会社から発注を受けて、ラインの稼働率を上げることによってビジネスを成功させたわけですけれども、その一段上の設計のところも、ある種水平分業化、マルチクライアント化することが、1つの生きていく道なのかなというふうに思っていて、この分野で強い専門家集団を育成して、環境変化、いろんなことがこれからも起きると思いますので、その変化に柔軟に対応していくというのがあるのかなと。ちょっと理想主義的にすぎますけれども、そういうふうに思っています。
それをちょっと絵に描いてみたんですけれども、真ん中にスパコンのシステムがあって、それを国研、大学が使って研究開発をして、論文を書いて、その技術なり人材なりが、先ほど申し上げたみたいに非常に問題意識を持って、社会課題の解決をするようなアイデアを出していくと。彼らは必ずしも半導体等々に詳しいわけではありませんので、それをOEM、ODMというか、設計会社等がそれをやる、早く回していく、それをファブとして、別に台湾、米国に限らず、日本でもいいと思うんですけれども、ファブにそれを出して製造委託をして、早く作り上げていくというような形にするのは1つの手かなというふうに思っております。その社会解決した結果を、またグローバルに展開して貢献していくというような形に持っていくのが、1つの在り方ではなかろうかなというふうに思っています。
最後にちょっと宣伝をさせてほしいんですけれども、私どもCRDSも非常にこの辺の分野に対しては問題意識を持っておりまして、コンピューティングアーキテクチャ分野の動向と今後の展望ということで、来週の月曜日に、もうショートノーティスですけれども、こういうワークショップをやります。ですので、もし今日御参加の先生方で、この分野に興味おありの方は、あるいはぜひ、自分も発言したい、あるいは聞きたいという方がいらっしゃいましたら、参加していただければ幸いです。このワークショップはクローズド形式にしていますので、かなり自由にいろんなことをしゃべっていただけるのではないかなというふうに思っております。
私の発表は以上です。どうもありがとうございました。
【安浦主査】 木村先生、ありがとうございました。それでは、今の御講演に対しまして何か御質問ございましたら、お願いします。
藤井先生、どうぞ。
【藤井委員】 大阪大学の藤井です。大変興味深いお話、ありがとうございます。トップ500、トップ100のスパコンの利用分野、研究用途とかインダストリーという、これで中国は圧倒的にインダストリーが多いというのがかなり印象に残ったんですけど、これはどういった用途に使っているとかいった情報はありますでしょうか。もしくは、例えば計算資源としては、AWSとかMicrosoft Azureとか、そういったクラウドサービスもあるかと思うんですけど、そういうのが使えないとか、そういう関係で中国がこういったHPCを、このトップ500マシンで、インダストリーサイドで使っているとかいう事情があったりするんでしょうか。
【木村オブザーバ】 御質問ありがとうございます。申し訳ないですけど、この表はトップ500のデータをエクセル表から拾って出したものですので、その背景までは現状ではちょっと分かりかねます。分かる範囲で調べて……。
【藤井委員】 つまりこのインダストリーというのは、企業が所有しているスパコンという。
【木村オブザーバ】 そうだと思います。
【松岡オブザーバ】 私がそういう情報を持っていますので、説明してよろしいでしょうか。
【安浦主査】 松岡先生、お願いします。
【松岡オブザーバ】 この正体を見ると、ほとんどGPUマシンなんですね、このインダストリー。これはNVIDIA中国。これが、中国でいろんなAIスタートアップだとかAIクラウド、例えばBaiduとか、それからAIのクラウドだとか、あとSenseTimeみたいなやつの、AIをなりわいとするところが、非常に巨大なマシン、それなりに巨大なんですね、GPUクラスで。それをことごとくトップ500に載っけるということをNVIDIA中国はやったんです。なので、こういうふうに台数が多いと。だからトップのほうでも、非常に中国というのは、あまり汎用性のないマシンを造っていて、何というか、汎用性があったらほかに売れているわけですけど、全く売れていないですよね。一方、アメリカ製の、特にGPUを使ったマシンは売れているんだけれども、それはほとんどAI用、学習用なわけですよね、AIのために。でもそれを、国力を見せるためにトップ500にことごとく載っけているということをやっているわけです。ですので、答えとしては、このインダストリーというのは、ほとんどAI用です。
【藤井委員】 ありがとうございます。よく分かりました。
【安浦主査】 木村先生、松岡先生、トップ500はあくまでもエントリーベースで出てくるもので、実際に持っていてもエントリーしなければカウントされないという、そういう認識でよろしいんですか。
【木村オブザーバ】 はい。多分日本は、実際にはもっと使われていると思っているんですけど、多分ここにはエントリーされていないんじゃないかなと、私は個人的には思っております。
【安浦主査】 松岡先生はどうですか。
【松岡オブザーバ】 もちろん中国は、AIスタートアップでも、例えばABCIとか、基盤センターにおける、例えばTSUBAMEのようなGPUマシンの規模を持っているところは、やはりまだまだ少ないわけですね。ですので、やはりトップ500のほうに載っけるのはなかなか難しいですけど、増えてはきていて、ただ、そういうところがやっぱり、なかなか載っける文化がないというのは確かにあります。ですから、少ないけれども、もっと台数が増える可能性はあるけれども、中国みたいに組織的に載っけているわけではないので、どうしても小さく見えてしまうというのが現状だと思います。
【安浦主査】 藤井先生、よろしいでしょうか。
【藤井委員】 はい、了解しました。ありがとうございます。
【安浦主査】 ほかに御質問ございますでしょうか。どうぞ、相澤先生。
【相澤委員】 今のこの表で、日本のインダストリーの4台というのは、これなんかはもうカウントできる数なわけですけど、これはどこが、何がこの4台に入っているか御存じですか。
【木村オブザーバ】 今ちょっとすぐは。青木さん、分かるかな。
【青木オブザーバ】 PFNとかが入っていたと思いますけれども。Preferred NetworksというAIチップをつくっている会社とかだと思います。
【安浦主査】 海野委員が今日は御欠席なので、確認できませんけど。
【相澤委員】 結構です。
【安浦主査】 ほかに何かございますでしょうか。小林先生、どうぞ。
【小林主査代理】 東北大の小林です。木村さんにお聞きしたいんですけど、18ページの半導体研究開発における日本の強みということで書いてありますけど、そうしますと、日本が半導体のエコシステムなり、あるいはその製造チェーンの中に入ろうとしたときに、やっぱりこのシステムレベルで強みを生かすということになるんですか。もうちょっとベーシックなところではなかなか難しいという御見解でしょうか。
【木村オブザーバ】 御質問ありがとうございます。私はどちらかというと、そうですね、小林先生が今まさにおっしゃったように、システムレベルで強みを発揮したほうがいいかなと思っています。ただ、そのためには、やはりチップというんですかね、一番基本のところというのを、きちんと強いものを持たなければいけないというのは、私もそう思っていて、ただインターフェースとしては、割と上位のレベルに設定をして、製品の、世代の管理も含めて、あるいは横展開も含めて、そういう上位で設計をして、でも下はきちんと速いものを作っていくという。その速いものを作るときに、何か専門家集団みたいのがいて、速く、くるくると作るという、そこもいろいろなところから要求をもらって速く回しながら、速くやっていくという仕組みがつくれるといいのかなというふうに私は、妄想レベルかもしれませんけど、思っていて、こういう話をさせていただきました。
【小林主査代理】 そうですね、期待としては3次元積層技術やシリコンフォトニクスとか、そのような技術にも期待したいところなんですけど、分かりました。ありがとうございます。
【木村オブザーバ】 そういう基礎技術もきちんとやっていかなければいけないのはもちろんだと、私は思っています。
【安浦主査】 それではあと、中野先生から手が挙がっていますので、中野先生を最後にしたいと思います。中野先生、お願いします。
【中野委員】 津田塾大学の中野です。面白い話、どうもありがとうございました。ちょうど今、小林先生から同じスライドのところで質問があったので、私も質問させていただきたいと思います。実社会データとサイバーとの連携ということで、GAFAはサイバー中心、確かにすごく大きな計算機リソースを持っているんですが、一方、彼らはスマートスピーカー等、ある意味IoTに成り代わるようなものを既にいろんなところに放り込んでいたり、アマゾンでは無人スーパーをつくったりとか、家の中にIoTチップを壁にぺたっと貼って、注文で押してもらおうとか、結構具体的にデータを集めるところも力を入れているような気がいたします。日本ではここら辺、実社会データというところでなかなか縛りが大きい中で、どの辺りが狙いどころになるのか、あるいは半導体研究開発を押せるようなIoTチップとか、何か面白いものを感じられているか、御存じでしたら教えていただきたいと思います。
【木村オブザーバ】 難しい質問をいただきました。確かにGAFAもそういういろんなところで、だんだんと彼らもサイバーだけではと思っていて、そういうインターフェースのところにだんだん下りてきているんだなと。彼らも最後はやっぱり垂直統合的なビジネスをやりたがるんだろうなと思っています。対して日本は、これは半導体研究と書いてあるんですけど、センサーとか、そういうところに対していろいろな、フレキシブルなセンサーだとか、センサーを小さくするとか省電力にするというのは、多分日本が一番強いところだと私は信じていまして、そこを生かして、そこから取れていくデータを、いわゆるアグリゲーションをしてサイバーに上げていって、そこで差別化をして意味のあるデータにするというところが1つのエコシステム的なものに、もしなれれば、すごくいいかなと思っています。
今、中野先生の御質問の最後のところで、じゃあ具体的にどういうのがあるんだというのは、今すぐお答えできないんですけれども、私はいろいろなところで、別のプロジェクトにも絡んでおりまして、このCPS、IoTも含めたCPSというのをやっておりまして、ちょっとバイアスがかかっているんですけれども、そういうところで、先ほど先生おっしゃったみたいにヘルスケアとか、そういうところで何かうまくできるところがあるんじゃないかなと。あるいは食品加工ですね、お弁当を作るとか、実際に実証検証が既に始まっておりますので、そういうところで何か生かせる場所があるんじゃないかなというふうに、私は思っています。
以上です。
【中野委員】 どうもありがとうございます。
【安浦主査】 まだあるかもしれませんが、一応、木村先生の御講演に対する質疑は一旦打ち切りまして、後でまた総合討論の中で御議論いただきたいと思います。木村先生、どうもありがとうございました。
【木村オブザーバ】 どうもありがとうございました。

議題2:中間取りまとめ(骨子案)について
【安浦主査】 それでは、議題の2に移りたいと思います。中間取りまとめの骨子案についてということで、前期から通算してこれまでに3回、今日を入れて4回、審議を行って、科学技術・学術情報基盤としての次世代計算基盤の在り方について、いろいろなお立場からお話をいただいて、ヒアリングを行ってまいりました。
これは何のためにやっているのかといいますと、1つは、きちんと予算をつけて、この先を進めていかないといけないので、そのロジックを文科省的にはつくりたいということがございまして、この夏に取りまとめ予定の中間報告というのは、そういう意味合いを持っております。この中間報告は、文部科学省がこれから来年度の概算要求を財務省に行っていくときの方向性に大いに関係するものとなりますので、まず事務局から、今後の予定、さらには中間取りまとめの骨子案、今、事務局側で想定している骨子案について説明いただきまして、それを踏まえて、先ほどの近藤先生、木村先生のお話も含めて、委員の皆様方で、今後この次世代の計算基盤というのに対してどういう予算をつけて、どういう研究開発を国として行っていくべきかという御議論をいただきたいと思います。

参考資料3-2、資料3-1、資料3-2、資料3-3に基づいて事務局から説明。

【安浦主査】 ここからは総合的な討論に移りたいと思います。最終的には、この中間取りまとめを次回以降議論します。今回、これは骨子案で、骨格しかありませんけど、次回にそれの中身をある程度埋めたものを原案として出して、ここで御審議いただきたいんですが、今からの議論というのは、このポイントだけは外さないでおいてほしいというような、そういう御意見をぜひいただきたいと思います。既にこれまでの4回の議論の中でいろいろな御意見が出ておりまして、それが資料3-1のほうに出ております。そこと重なってももちろん構いません。あるいは、そこで抜けていて、非常に重要なポイントだけど抜けているというようなことがあれば、ぜひここで言っていただければと思っております。それから、本日、近藤先生と木村先生からこれまでになかった角度からの御講演をいただきましたので、その御講演内容からインスパイアされるような議論等がございましたら、そういう御意見もぜひいただきたいというふうに思っております。
それでは、ここから自由討議に入りたいと思います。御意見のある方は挙手をお願いしたいと思います。
まず合田先生と後藤先生が手をお挙げになっていますので、合田先生からお願いします。
【合田委員】 ありがとうございます。もしかしたら後藤先生と同じ質問かもしれないんですけれども、意見の前に、この今回の取りまとめの位置付けを確認させていただきたくて、昨年のこの部会の第2回ですかね、その委員会で、次世代学術情報ネットワーク・データ基盤整備作業部会がまとめた「次世代学術情報ネットワーク・データ基盤整備の在り方について」という取りまとめ、提言を既に出しているんですけど、そこで、その文書と今回の文書の関係について教えていただきたいんですね。
というのは、今回の中間取りまとめというのは、先ほどの情報ネットワークの在り方のドキュメントとは違うものなのか、またはそれを包含するものなのかというのを教えていただきたいんですが、いかがでしょうか。
【安浦主査】 宅間さん、いかがですか。
【宅間室長】 事務局でございます。こちらのこれからまとめるものに関しては、情報基盤の全体像を俯瞰しつつも、計算基盤に特化した考え方をまとめるものでございまして、先ほど御指摘いただいたこのネットワークのほうの報告書と連携しつつ、並列に存在するものと思っております。こちらがこちらを包含するという関係ではないというふうに考えております。
【合田委員】 分かりました。どうもありがとうございます。
【安浦主査】 次世代の情報基盤をどうするかという議論も本部会の最初のほうでやらせていただきましたけれども、今回のとりまとめは、その中の計算基盤を中心に議論するもので、基本的に、大きく分けて、計算基盤とデータ基盤と、それから通信基盤と、その3つに対して、情報委員会として、上部機関としては責任持っていろいろ議論をしていきたいと思っております。この部会の今回の議論はあくまでも次世代の計算基盤、特にHPCIで「富岳」の後継をもしやるとしたら、「京」のときの経験からいいますと、もうフィージビリティースタディに入るタイミングであるということで、そのための予算取りを想定する必要があるなら手を打つ必要があるということで、この中間まとめをつくっていきたいと思います。もちろん皆さんの総意で、そんなことをまだやるのは早過ぎるということであれば、そこは書き方が変わってくると思いますけれども、とにかく7年先、8年先に次世代の計算基盤を動かそうと思うならば、もう今から着手しないと間に合わないと、そういうストーリーになります。よろしいでしょうか。
それでは、後藤先生、よろしくお願いします。
【後藤委員】 今、合田先生の御質問も、最初にお聞きしようと思ったところですが、そういう並列の関係ということを前提にした場合、先ほど文科省のお話でも、いわゆるHPCIは将来のデジタル時代の社会インフラであるという言い方がございました。非常に大事な言葉だと思います。HPCIを持っているかどうかが、社会の競争力のインフラになるのだということだと思っています。それをやはり前面に出すことが大事だと思います。私はセキュリティとかトラストの立場からここに参加しておりますけど、HPCIのシステムとしてのセキュリティをいかに担保するか。特にソフトウエアですね。今、世の中ではソフトウエアのサプライチェーンのセキュリティが大きな課題になっております。特に基盤ソフトウエアに相当するところ、情報共有のソフトウエアのところ、こういうものがシステム全体の社会的な信頼を支えていると。
よく普通の産業界では、ソフトウエアの品質管理、セキュリティの品質管理という言い方がございますけど、ではHPCI、今の「富岳」がどうなっているか、「富岳」のシステムソフトウエア、周辺を支えているような情報共有環境、連携環境、それはSINETにつながるのかもしれませんけど、そういうものがどのような形で、セキュリティ的な意味でのソフトウエア品質を保っているのかは非常に大事だと思います。
こういうところに関しましては、後付けというのはなかなか大変で、やはり設計段階から組み入れるというのが大事ですので、ぜひそれを考えていただきたいと思っています。特に昨今、オープンソースに関しましては、米国では、IoT系が主対象ですが、software bill of materials、つまりソフトウエアがどういう経緯で、誰がつくったソフトウエアがどうビルドされて、どう組み合わされているのかというのをちゃんと履歴に残して信頼の土台にする取組が始まっております。例えばそういうものに関しましても、このHPCIでも考えていくべきなのではないかと。さっきの最後の骨子案の中にそういう項目が全くなかったので、そこはぜひ入れるべきなのではないかというのが意見でございます。
以上でございます。
【安浦主査】 後藤先生、どうもありがとうございます。非常に重要なポイントだと思います。先生のおっしゃっているセキュリティは、かなり広い意味のセキュリティと考えてよろしいでしょうか。いわゆる単なる攻撃に対する防御的な意味合いだけではなくて。
【後藤委員】 広い、HPCI環境全体を支えるためのセキュリティはどう考えておくべきなのか、そのための土台づくりをどう今からつくっておくかという観点で申し上げました。
【安浦主査】 ありがとうございます。
それでは次に、田浦委員から手が挙がっております。田浦先生、どうぞ。
【田浦委員】 このまとめに対する云々かんぬんというよりも、どっちかというと、自由討論の時間があると思っていたので、そういう感じなんですけれども、近藤先生の発表に半分リアクションする形で、ちょっと常々思っていることということで、ぜひ近藤先生にも御意見いただきたいんですけど、コデザインというのが重要だというふうに強調されていて、もちろん私、全く否定する気はないんですけど、でもコデザインって、何というか、反対のしようのない言葉で、要はアプリケーションのことをちゃんと見てデザインしなさいということだから、非常に美しい言葉で、反対のしようのない言葉なんですけど、でもどういうふうにそれをやるかというので、結果的に、何を対象にコデザインするかでどういうものができるかが決まるわけで、どうやるかが大事だと思うんですね、それでどういうものを対象にやるかと。
それで、これまでもちろんHPC系のアプリケーションを対象にコデザインしてきて、だから「富岳」が4部門で1位ということになっているわけですけど、でも、じゃあ売れるマシンができたというふうに思えるかというと、かなりそっちのワークロードに特化し過ぎているというところも否定はできなくて、日本で、例えばこれからITの産業とかクラウドベンダーとか、木村さんがおっしゃっていたような方向でエコシステムみたいなところになかなかつながっていかないんじゃないかというのもあると思うんですね。だから、これからやっぱりコデザイン重要ですので、またコデザインやりますというときの、これまでと違うやり方とか、どういうふうにやっていったらよろしいでしょうかねというようなところで、もし御意見ありましたらお願いします。
【安浦主査】 近藤先生、お願いします。
【近藤オブザーバ】 ありがとうございます。まさにおっしゃるとおりでして、どういうアプリケーションを対象にするかということでシステムをつくる、目標も決まってくるというところがありまして、それで「富岳」は成功したという面もあると思いますので、もちろん重要性は御認識のとおりだと思います。今後、ですからどういうアプリケーションを対象にしていくかというのは、我々NGACIの立場だけではなくて、広く、例えば学会の皆様からも御意見をいただきつつやっていく必要がありますし、やはりデータの重要性というのはますます高まっていきますので、そこをいかに担保したようなデザインをしていくかというのが1つ大きな課題になるのではないかと思います。そのためのシステムが必要といいますか、そういうことも含めてやるためにです。ですから、私の資料の中でもオープンなプラットフォームにというのは、そういう意図も含めて少し書かせていただいたところもあるんですけれども、まさにおっしゃるとおり、そこを今後検討していく、ぜひ皆様と一緒にやらせていただければというふうに考えています。
【田浦委員】 ありがとうございます。
【安浦主査】 近藤先生、ありがとうございます。
近藤先生のこのホワイトペーパーは、特に「富岳」で対象になった9つの分野とか、そういったものに縛られずに議論をされたというふうに考えてよろしいですか。表はあれを使っておられましたけど。
【近藤オブザーバ】 実際には対象分野に縛られていないんですけれども、結局リファーしたものは今のアプリケーションの方々のロードマップと、あと、今回アンケートを取らせていただいたのも、どちらかというとHPCI関連の研究者の皆様ということもありますので、そこはもう少し幅を広げて今後、調査をしたり、アンケートを取らせていただくということをしなければいけないという御意見、御指摘は既にいただいておりますので、今後ぜひやっていきたいと思っています。
【安浦主査】 田浦先生、よろしいでしょうか。
【田浦委員】 はい、大丈夫です。また議論させてください。取りまとめ、ありがとうございました。
【安浦主査】 それでは、井上委員が手を挙げておられますので、お願いします。
【井上委員】 近藤先生、木村さん、御講演ありがとうございました。2つほどありまして、まず1つ目はコメントです。先ほどの田浦さんの御質問に関連するのですが、コデザインというキーワードが大事なのは間違いないと思います。きちんと考えないといけないのは、コデザインはもともと組み込みの世界で盛んに行われており、組み込みのコデザインとHPCのコデザインは、本質的にどこが違うかということを考える必要があると思います。これは私なりの考えですが、組み込みシステムではアプリケーションありきで固定が基本だと思います。一方、計算機アーキテクチャの観点から考えると、HPCではソフトウエアの多様性と言いますか、ソフトウエアの発展を止めるようなハードウエアをつくっては絶対駄目だと思っておりまして、とあるアプリケーションにがちがちに固定した専用マシンをつくるというのは、私は反対です。今回の「富岳」で、汎用性をきちんと重視した上で、この性能を達成しているというのが非常に重要な本質だと思っています。
そう考えたときに、今後のHPCのコデザインというのは、前回のご講演の津波シミュレーションにおいて、波の生データが到着するまでのセンサー部分はシステムの中に入ってないという、松岡先生もコメントされていたと思うのですが、このような部分も踏まえた上で、将来スパコンをどう使うかを前提にしたコデザインが必要だと思います。その中でソフトウエアの多様性を担保する汎用性を保ちつつ、どこまで専用性を使って性能を上げるかという部分の見極めがHPCでのコデザインの重要な点になると考えています。
もう1点、これは、木村さんと、安浦先生にも御質問してもよろしいでしょうか。
【安浦主査】 どうぞ。
【井上委員】 半導体の話についてです。日本では様々な企業が半導体部門を外に出してしまう状況になっていると思うのですが、この10年を振り返って、安浦先生、木村さん、アカデミア、企業の立場からどう分析されているか、よろしければお聞かせ下さい。
【安浦主査】 ありがとうございます。木村さん、どうでしょうか。
【木村オブザーバ】 非常に難しい質問で、ちょっとお答えに窮する面もあるんですけれども、産業界にいた人間としては、やはり先ほど申し上げたように、半導体ってすごく投資額が大きいんですよね。それはある程度予測するんですけど、やっぱり回収する時期がかなり後になってしまっていて、その間に経済状況もどんどん変わってしまうし、競合他社との関係も出てくるし、非常に予測が難しい面があって、そこがちょっと難しかったのかなというのが1つあります。
それと、今日も最後でちょっと変な絵を描きましたけど、やっぱりこれからは、どういうニーズがあるからどういうものだというのを、先ほどのコデザインも関係すると思うんですけど、やはり早く立ち回って、簡単にとは言いませんけれども、そういう関係をやっていくんじゃないかなと。井上先生がまさにおっしゃったように、日本の大企業は半導体部門をどんどん切り離していって、小さくなっていったんですけれども、実はその小さく――小さくというのは、独立した会社が、今私が最後に述べたようなデザイン専門のファブレスのカンパニーになってくるとか、あるいは、一部はファブも持っているけれども、デザインを中心にビジネスモデルを立ち上げるとか、そういう傾向に既に実はなっていると思うんですよね。アメリカ、中国の会社でもそういうところを、ビジネスとしてやってきている会社が実は幾つかありますので、そういう意味では今、逆にやりやすくなってきているのかなという感覚を持っているんですね。
ただ、先生おっしゃったみたいに、やっぱりインターフェースはかなり上のほうに持っていかなければ、汎用性がなければ、多分がちがちの専用マシン造ったって、じゃあ次の世代どうするんですかという話になってしまいます。多分インターフェースをどうやって切るかというのはすごく難しい話で、そこはやっぱり何度か回してみて、どの辺なんだなと、それを時代に応じて少しずつ変えていくというふうにやらざるを得ないのかなというのを、何か解になってないんですけど、やっぱりそういうところがあるんじゃないかなと私は理解しています。答えになってないかもしれませんけど、そういう感覚を持っています。
【井上委員】 ありがとうございます。
【安浦主査】 安浦のほうにも質問ということですので、主査としてではなくて、半導体に絡んでいた研究者として少し、簡単にお答えさせていただきますけど、今、半導体は大きな3つの分野があると思います。1つはCPUを中心としたロジック、それから、メモリがDRAMではなくて、もうNANDフラッシュ、これはストレージとしてのNANDフラッシュに変わってきていると。実は、ロジックは日本は完全に負けちゃったんですけど、NANDフラッシュは、発明したのは日本で、東芝で、結構いいところまで行ったのに、ビジネス的に失敗して、ちょっと今、どこの国の会社か分からなくなっている面があるということですけど、技術はまだ日本にあるわけですね。それからセンサーは、CMOSのイメージセンサーは、これは圧倒的に世界の半分が九州でつくられているという、そういう実態があるわけですから、ある意味そこは勝っている面もある。ただ、CPU、ハイパフォーマンスコンピューティングという立場から見たときには、圧倒的に複雑なロジックのところで、本当に設計でも製造でも、どちらでもいいから勝てるかという問題に対しては、これは井上先生のさきがけが頑張ってくれるしか手はないんだというふうに思います。
あんまり私がしゃべってもしようがないので、よろしいですか。
【井上委員】 ありがとうございます。逆に言うと、そういった日本の強みを踏まえた上で、将来のアプリケーションを見つつ、コデザインをどう回すかというのがやはり重要になってくると考えます。
【安浦主査】 木村さん、どうぞ。
【木村オブザーバ】 すみません。ちょっと今、安浦先生の話に関連するんですけど、多分日本は技術で負けたのではないんですよね、多分戦略で負けていると思うんですよ。出口戦略で負けていると思うので、そこをどうつなぐかというのが多分キーなんじゃないかなと私は思っていますけれども。
【井上委員】 なるほど。
【安浦主査】 これまで、この委員会での議論で、その半導体のところはあんまり議論していなかったんですけど、産総研とか、経産省系の次世代コンピューティングと名のつく委員会に出ると、実は半導体の話とか、それの製造装置の話ばっかりしてあって、日本全体として一体何考えているのかというのはやはりきちっと整理した上で財務省に持っていかないと、文科省はHPCが大事だと言ってくる、経産は製造装置が大事だと言ってくると、こんな話だと、財務省もなかなか難しいと思いますので、ここでもそこは蓋をせずに議論だけはしておく必要があると思います。ただ、中間まとめにどこまでどういうふうに書くかは、これは別の問題だと思いますけれども、あくまでも文科省は学術基盤、計算基盤としてどういうものが必要かという形にならざるを得ないわけですけど、足元が揺らいではいけないと思ったので、ちょっと木村さんには無理をお願いして、今日、私見をあえて述べていただいたという、そういう筋書でございます。
【井上委員】 ありがとうございます。
【安浦主査】 それでは、常行先生、どうぞ。
【常行委員】 今のと話題、変えてよろしいでしょうか。
【安浦主査】 はい。どうぞ。
【常行委員】 骨子案の3ポツの次世代計算基盤整備の必要性というところなんですが、これがもちろん必要であることは多分、誰も反対しないと思うんですけれども、そもそも論として、次世代計算基盤を開発すべきであるという論調でまとめるのであるとすれば、重要なのは、政策として国がこの開発をサポートしなければならないのはなぜか、産業界の自発的な活動だけに頼れないのはなぜか。もうちょっと言うと、政策としてこういうことを実施する場合に、期待すべきアウトプットは何で、国はどこまでコミットすべきか、逆に産業界の自発的活動に任せるべきことは何かと、その辺を少し書き込めると説得力が増すのではないかというふうに思いました。
以上です。
【安浦主査】 常行先生、どうも貴重な御意見ありがとうございました。文科省的な発想だけで攻めると、当然でしょというふうに言ってしまいがちなところですけれども、財務省などから見ると必ずしも当然ではないわけで、そこの、先生のおっしゃったポイントというのは非常に重要なポイントかと思います。
常行先生の御意見としては、あらゆる学術の基盤として必要だということだけでは不十分とお考えでしょうか。
【常行委員】 はい、私自身は不十分だと思っています。学術の基盤として、私は計算科学の、使う側の人間ですので、その立場から言うと、学術の基盤としては、買ってくるのでも別に、ある程度いけるわけですね。もちろん最先端の一番大きなものは手に入らないかもしれませんが、ユーザレベルで見ると、それなりに買ってくるものでも役に立つので、それだけでは十分な説得力、これだけの巨額の国費をかけるのには、説得力にやや欠けるのではないかというふうに危惧しています。
【安浦主査】 ありがとうございました。非常に重要なポイントかと思います。
小林先生、お願いします。
【小林主査代理】 小林です。近藤先生の御発表に関して少し、コメントというか、お聞きしたかったのは、あれだけ広い分野の技術者、研究者をお集めになられて、大変御苦労されたと思いますし、内容もすばらしいんですが、やっぱりそれらの技術について、どこが日本は強みであるとか、どこが弱いかとか、あるいは、弱いけど、ここを強化すれば日本は勝てるか可能性があるとか、そういった議論にまで発展させて、国際連携も含めて今後考えていく情報になる、ソースになるのかなというふうに聞いておりまして、ぜひここで止まることなく、それぞれの分野の若手のリーダーの方がいらっしゃるわけですから、こうしたい、ああしたいということも含めて、日本の強みをどう外に見せて、技術として発展させていけるのかというところまで踏み込んでいただけるといいと思いますし、そこら辺もこちらの取りまとめに何かやっぱり書き込まないと、今後日本の技術をどう生かして、この次世代のHPCをつくり上げるべきかということにならないんじゃないかなというふうに思いました。
以上です。
【安浦主査】 ありがとうございます。近藤先生、今、一言で、ここが強みだと言えるところ、何かありますか。
【近藤オブザーバ】 最後に述べさせていただいたように、やはりコデザインによって本当に今回、「富岳」の場合は富士通さんがつくられたわけなんですけれども、アーキテクチャにまで立ち入って開発できたというのは非常に強みだと思っていまして、聞いたところによると、やっぱり米国でもそこまで各ベンダーに対して踏み込んだ意見は出ていないと聞いていますので、その強みは非常にあったと思います。今後NGACIのコミュニティでも、そういったことも議論させていただければと思います。ありがとうございます。
【安浦主査】 どうもありがとうございます。
それでは、根本先生、お願いいたします。
【根本委員】 ちょっと中間取りまとめについてコメントなんですけれども、この「はじめに」のところで、先ほどもちょっと説得力に欠けるのではないかというお話があったんですけれども、何となく、次世代の情報基盤及びスーパーコンピュータ等の計算基盤ということの位置付けということと、「富岳」の次であるという位置付けというのが非常に混同していて、先ほどの木村さんのお話にあったことを踏まえると、スコープとしてはもっと広いんだろうと思うんですね。なのにもかかわらず、どうしてもここに下りてくると、そういう全体としてのスコープということから次世代ということが語られていないのではないかなというような印象を受けました。ですので、これはまだ中間取りまとめで、決定事項は含みませんということなので、その辺りも考えていただければというふうに思います。
【安浦主査】 どうもありがとうございます。そこが一番、この部会の悩ましいポイントでもあるわけで、もう1回「富岳」と同じようなナショナルプロジェクトとして、先ほど常行先生がおっしゃったように、買ってくればいいようなものを、あえて巨額の投資をして1つの大きなものをつくるのか、あるいは、朴先生なんかが少し、直接的には言われませんでしたけど、もう少し予算を分割して、1つ高い山をつくるのではなくて、ヘテロジーニアスな、八ヶ岳的な感じで国全体のシステムを組むほうがいいのではないかという、その辺のチョイスは、あくまでもこの部会の報告の中で出していくべきものだと思っております。今日の木村先生のエッジの部分まで下がって広く考えるかという、そこの選択肢も完全には否定はしておりませんが、それは次回以降のここの場で、議論させていただきたいと思っております。
根本先生、こういう考え方でいかがでしょうか。
【根本委員】 ありがとうございます。最初の部分についてはよく御議論いただくことが非常に重要かと思いますので、よろしくお願いいたします。
【安浦主査】 それでは、三好先生が手が挙がっていますので、三好先生、お願いいたします。
【三好委員】 どうもありがとうございます。近藤先生の資料の中に、2028年での予測性能の資料を拝見しまして、私、不勉強で、こういう予測性能を見たのが今日実は初めてで、非常にショックを受けて、これをどう考えるべきかと、ちょっと混乱しているところでもあるので、うまく言語化できなかったら申し訳ないんですけれども、今「富岳」は大体30メガワットだと考えて、同じ、これ以上電力を増やさずにというふうに仮に考えたとすると、30メガワットでメニーコア型だと「富岳」の倍ぐらい、よく見積もって倍ぐらいかなというふうに見えるのです、ペタフロップスの単位で見て。GPU混載型にすると、それでもそんなに大きくはならない、かなり桁違いに大きくはなりますけれども、「富岳」を考えていたとき、今から8年前とかだと思うんですけれども、そのとき、「京」の100倍の計算ができたら、私、データ同化の研究をしておりますので、ユーザです。アプリケーションで、もし「京」の100倍の計算ができたら、こんなことができるという夢を描くことができたんですね。
フィージビリティースタディをするときも、こんなにサイエンスが変わるとか、根本的に変わり得るというのは、やっぱり100倍というような、桁違いの計算ができるので、そういうことを想像することに意義があったわけですけれども、アプリケーション側から見て、それがフラッグシップの価値なんだと思うんですが、もし、今から8年後に、7年後ですかね、今よりも倍の性能しか出ませんと、以前からムーアの法則が終わるということが言われていて、そういうことは聞いてはいたけれども、それを数字にするとこういうことなのかと、今愕然としていて、これをもし、私も含めですけれども、アプリケーションのサイエンティストに見せて、じゃあ何か世界変えられますかと言われると、倍の計算だとかなりつらいというか、根本的に違うことは恐らくできないんだと思うんですね。
それで、今までの議論にあったとおりで、フラッグシップは何のために造るのかというのを、「富岳」を考えていたときとは全く違う考え方をしないと、フィージビリティースタディをするにしてもロードマップが書けないと思うんですよ。要するにサイエンスとして根本的に違うステージに行けますということを、倍の計算資源では書けないと思います。ですので、やっぱりそういうところを。
ちょっと私、混乱していて、うまく言えていないと思うんですけど、そういうところをやっぱりちゃんと議論して、先ほどの、八ヶ岳がいいのか。要するに、トータルの計算資源を増やすことが恐らくアプリケーションにとってはいいのかもしれないし、あるいは、ある特定のアプリケーションにとっては、特定のアーキテクチャのものが非常に有効である。例えば、MD計算にはそれに特化したプロセッサをつくったほうがいい、でもそれはMD計算しか使えない、でないと性能がよく出ないみたいなものがあるとすると、そういうふうなヘテロな計算基盤の在り方というのがもしかすると次世代の計算基盤なのかもしれないというふうにも思えてくるので、ちょっと今まで「富岳」を考えてきたときのような議論では、次は考えられないのではないかなというふうに思いました。
ちょっと感想というか、コメントです。
【安浦主査】 どうもありがとうございます。今の三好先生からの御指摘というのは非常に本質的な部分で、近藤先生の、たかだか3倍、GPU入れても30倍という、一番よく見積もってですけど、この話というのは結構、「京」を議論されたときとは様相を異にするポイントだと思います。じゃあどこで質的な変化を生み出すかという、そこの知恵の出し方というのが今我々に問われている非常に重要なポイントだというふうに認識しておりますけれども、近藤先生、これを掛ける3とか掛ける5とか、できる可能性というのは何かあるんでしょうか。
【近藤オブザーバ】 御指摘ありがとうございます。おっしゃるとおり、やはりがっかりされた数字に見えるかと思うんですけれども、発表でも一言申し上げましたように、基としているロードマップが非常に有名な、IEEEで考えられているロードマップを基にしておりまして、私、独自にいろいろ試算をしてみると、やはりインテル系のXeonみたいなサーバをベースにしたときとして、2028年ぐらいで70コアという予測が立っています。それを基にしているので、ああいう数字になっている面がありまして、独自に、例えば「富岳」ベースのようなコアを並べたときには、並べようと思えば200コアぐらいはいけるはずだというふうに試算できました。ですが、200コア並べて、例えばメモリのバンド幅、byte per flopの値が「富岳」の10分の1とかになってしまっては、きっとアプリの方たちは意味がないというふうに思われると思うんですよね。ですから、そこはちゃんと本当にアプリの方の要求を聞いて、意味のある数字に落とし込んでいくというのが次にやらなければいけない作業になってくると思います。そうすれば、そこまでがっかりしている数字にはならないと思っています。
ですが、やはり100倍というのは非常に大変でして、あくまでもやはりピーク性能を議論するのは、このムーアの法則が終わっていく時代にとってはなかなか厳しいのかなと、そういう意味でデータのバンド幅とか、あるいはアプリの方にも協力いただいて、64ビットではなくて、もう少し単精度とか、もう少し半精度とかも含めて使っていただきつつ、実効的な性能を100倍にするという、そういうことをアプリの皆様とCS側の人たちが協力して考えていく、そういう時代に入っていくというふうに考えています。ですから、そういう意味でやはり、そこでもコデザインが重要になっていくと思われますし、我々の希望としては、100倍欲しいから何とかしてくれという意見をいただいたほうがやりがいはあります。そこは、もうぜひいただければと思います。
【安浦主査】 どうもありがとうございます。非常に綿密に予測はしていただいているということでございますので、ここから、どこを絞って本当にサイエンスの発展に貢献できるような計算基盤をつくるかというような挑戦が、今回の次のプロジェクトがもし始まるとしたら一番大きなポイントになってくるのではないかと思います。どうもありがとうございました。
それでは、上田先生と相澤先生がお手を挙げておられますので、上田先生からお願いいたします。
【上田委員】 上田です。私自身は機械学習の研究者で、HPCの専門家ではないので、少し的外れなことを言っているかもしれません。今後の計算基盤ということで、スパコンが広く研究者に行き渡るといいますか、そういう状況になったときに、やはり恐らく当面はAIという領域での広がりだと思います。「富岳」もPyTorchだとか、そういう深層学習のフレームワークがきちんと装備されていますが、やはりそういうフレームワーク、ソフトウエアが重要です。この開発は日本がもっと積極的にやらなくていいのかなと思います。日本もChainerがありましたが、結局諸々理由があって、PFN自身もPyTorchに転換していますけれども、研究者から見たら、このフレームワークが極めて重要なんですね。これがソフトウエアの効率を、深層学習とかAIの研究の効率を極めて上げている。グーグルはそこに目をつけて、最初にTensorFlowをつくって、ユーザを一気にグーグルに引きつけたという経緯があったと思います。富岳ではハードウエアだけではなく、コデザインでソフトウエア設計もありますが、深層学習フレームワークのようなインターフェースのソフトウエア設計というのも何か力を入れていく必要があるのではないかと思います。ユーザ目線ですけれども、そのような印象を持っています。
以上です。
【安浦主査】 どうもありがとうございました。上田先生のところの理研の研究グループのほうは、何かそういうことをお考えになっているのでしょうか。
【上田委員】 RAIDENを保有しています。富士通さんで設計していただいて、深層学習のインターフェースはそれなりに充実はしております。もちろん「富岳」ほどのパワーがあるわけではないですけれども。今でも、「富岳」は使えると思いますが、もっと高性能なソフトウェアフレームワークができるとそれなりにインパクトがあるし、日本の優位性みたいなものを主張できないのかなという、そんな意見です。
【安浦主査】 AIP側から、例えば今度、次世代のアーキテクチャ、FSのアーキテクチャをつくるところに一緒になってつくっていくという、そういう可能性というのはあるんでしょうか。
【上田委員】 AIPは10年プロジェクトでいろいろ目標を掲げていますので、そのミッションは入っておりませんので、さすがに今からは厳しいかと思います。将来的にはそういう目標があるのかもしれません。
【安浦主査】 だから純粋に学問的に見て、そういう技術というのが非常に重要であるという御指摘というふうに受け止めさせていただきます。
【上田委員】 はい。
【安浦主査】 どうもありがとうございます。
それでは、相澤先生、お願いいたします。
【相澤委員】 相澤です。私も上田先生と同じように、HPCそのものに関して携わっている者ではないので、ユーザ目線ということでの意見になるんですけれども、直近を考えてみて、自分自身がこの一研究者、研究者として基盤として用意されている計算資源を使うようになったというのは、昔の大型コンピュータを使っていたときを除いてはごく最近で、産総研のABCIを使ったり、あと名大で用意されている計算資源を使ったりと。それは何がきっかけだったかというと、もともとアマゾンのAWSなんかに比べて、産総研のABCIが10分の1ぐらいの値段で使えると、さらにそれの3分の1ぐらいの値段で名大の仕掛けを使えたというようなところがあって、それは大変ありがたく、もう計算量も莫大に増えているので、自分たちの研究室の中の、サーバを何台か持っているものの中ではもう使い切れない部分を外に出て使っているという意味では、この計算基盤として、今ネットワーク的に国内にできているHPCI自体は物すごく大きなインパクトを、私みたいな末端の研究者に対して持っていると思うんですね。
この計算基盤がどれぐらいの範囲のユーザに恩恵を与えるのかということを十分に考慮しながら進めていただければいいなというふうに思っている次第です。ピークのやつをつくる、科学をどれだけ進めることができるかと、それも重要で、ピークのこと自体を否定するわけではないんですけれども、ピークのことはもちろん重要だと思っているわけですけど、多くのユーザに便益を提供するというような観点での影響力ということで言うと、ネットワーク型に基盤がつながっているという今の仕掛けを強化していくというような方向は、とても重要な部分ではないかというふうに思っている次第でもあります。
ちょっと感想に近い部分ではありますけれども、一言申し上げさせていただきました。
【安浦主査】 相澤先生、どうもありがとうございました。その裾野の広げ方というのも非常に重要で、そこの工夫によって、先ほど三好先生が御提示になった御質問の、科学を本質的に変えるという、変え方も違ってくると思うわけでございますけれども、その辺は当然、議論していきたいと思います。どうも貴重な御意見ありがとうございました。
それでは、ほかに御質問、御意見ございませんでしょうか。
なければ、オブザーバで御参加いただいています松岡先生のほうから、今の話をお聞きになって、簡単に御感想をいただければと思います。お願いします。
【松岡オブザーバ】 3点ほどあります。実は何点もあるんですけど、短くまとめますと、先ほど常行先生が言われて、実はこれは三好さんが言われたことに関連するんですが、例えば「京」の、「富岳」のコデザインにおいても、最初のFS、一代前の白書の段階では、実は性能は足りないということになっているわけです。コデザインによってそれを引き上げるというのが、実はナショプロの理由付けだったわけです、「富岳」のときの。ですので実は、だから近藤さんの今回の新しいやつで、足りないというのは、それは既存のものを買ってきては足りないというふうに読むべきで、したがって、それはやっぱりちゃんとやらないと、一企業に任せて、ないしは市場に任せておけないと考えるべきなんですね。
それはまさに常行先生がおっしゃったことで、「富岳」が実際そうなって、私もこれ、確かにcomparableなインテルのCPU、2倍から3倍ぐらい速いわけですね、そのHPC、かつ省電力であると。逆に、それがないと、つくれなかったんですね、「富岳」の性能。ですからこれを否定的に捉えるということは非常に道を誤る可能性があって、むしろこれは、それによってやはり本当に我が国がつくっていかなければいけないんだということの理由づけになるというふうに捉えたほうがいいと思います。というのが第1点です。
ただ第2点で、やはりそこで重要なのは、「富岳」で、「京」である程度――木村さんがいますけど、「京」である程度やったけど、かなりやり切れなくて、「富岳」でもそれなりにやったけど、やり切れなかったということは、そのところでやはり大事なのはエコシステムですね。今回、田浦さんの発言のところにありましたけれども、及び今回の近藤さんの発表とか木村さんの発表にありましたけど、やはりエコシステム、もうITにおいてはエコシステムが命です。これはソフトウエアもハードウエアもそうです。ですので、やはり今回開発するとなると、それがインパクトがある、つまりエコシステムに寄与するものをちゃんと最初からつくらなければいけない、後付けではいけないということです。そこが今、書いていないんですね。ここはもう本当に書かないと、エコシステムのプレーヤーとして開発するんだということがちゃんと担保されないと、再び同じ過ちを繰り返す。
だから、「富岳」はそれなりに、例えばArmを採用するとか、そういうことがあったんですが、じゃあ「富岳」のCPUがクラウドベンダー入っているかというと、入っていないですね。そこはなぜかというと、やっぱりそういうところをいまいちやり切れなかったから。でもソフトウエアのほうのエコシステムには寄与できたので、今後そういうところにはいろいろ発展性が、アプリケーションを含めて発展性があるというのはよかったんですけど、ハードウエアは逆に、ピュアなハードウエアの部分はエコシステムで乗り切れなかった。ディテールはちょっと今日は割愛しますけれども、そういうところがあったので、最初からもうエコシステムを考えるのというのは物すごく大事になっていまして、それはもう本当にここに書くべきであり、これは経産での話でもあるべきだと思います。
3点目としては、そのアプリケーション、すごくやはりナショナルスパコンだとか基盤が担う道というのを、やっぱりミッションとして、これは先日も申し上げて、やはり情報技術を発展させるというプラットフォームになるべきなんですね。別にそれをアプリケーションで使って、例えばコロナとかグリーンエネルギーだとか、そういうところにアウトプットを求めるのも物すごく大事なんですけど、でも同時に、やっぱり情報としてのアウトプット。これは1つは、例えば藤井先生がやられているような量子計算機を今後つくっていくための新しい情報の在り方を模索するために、やはりフラッグシップマシンを使って、実際我々は、理研の中では今回、量子センターができて、藤井先生も関わっていますけれども、我々と量子センター、かなりタイトカップリングして、量子コンピュータのシミュレータとかを開発していくわけです。非常に大規模なシミュレータを開発したりします。
そのように、ニューロモーフィックだとか、その手のもの、新しい計算もそうですし、また一般のITに関しましても、やっぱりフラッグシップマシンというのはITの先端を、我が国がまさにITで先端を走るための開発、次世代のITを開発するための下地になるべきだと、それは非常に大きなアプリケーションだという視点が必要で、それが今回の文科省の文書には欠けているというふうに思います。それがないとやっぱり、何のためにつくるのという、先ほどのところに帰着してしまうと思うんですね。やはりITで先端を走るためには、フラッグシップマシン自身がITの、そのための1つの道具、それはシミュレーションでもあり、トライアルでもあり、テストベッドでもあり、田浦さんが言っていましたソフトウエア開発含めてテストベッドになるべきだというところが非常に大事な視点だと思います。
じゃあどうするのと、でも具体的にどうするのという、三好さんの、混載どうするのというところでありますけれども、これは私個人の意見ですけど、私は八ヶ岳式のインフラとかはつくってはいけないと思っています。それは別に理研だからというのではなくて、純粋に、一研究者として、やはりそういうのは作るべきではないというふうに思っています。と申しますのは、これは木村さんの話、ムーアの終えんだとか、それから木村さんの講演でちらっと出てきたんですけれども、実はそこは非常に大事で、近藤さんのホワイトペーパーがなぜ、要するにフロップスが上がらないのかというところで悲観してはいけないのか――それは悲観してはいけないんですが――というと、それはALUの、計算部分のパワーがもうこれ以上コンスタントになるかということになるんですね。リソグラフィーがどんどんシュリンクしたとしても、あんまりシュリンクしないし、シュリンクしたとしても、それからトランジスタはあまり小さくならないので、フロップスのゲインというのが本質的に大きくならないんです。なので、じゃあどこで性能が、100倍という性能を稼げるかというと、データ移動のエネルギーを減らす、そこが今でかいので、そこのエネルギーを減らすしか、もう道はないわけです。
そうなると、じゃあどういうふうなコデザインにつながるかというと、今、右は富士通がつくった資料で、いろんなオーダーのアルゴリズムがいろんな領域であるんですが、これはもう前にもちらっと申しましたけど、我々の研究所でもやっていることは、少しでもこれをオーダーnのアルゴリズムにして、ないしはオーダーnlognのアルゴリズムに転換していく、これがまさにコデザインだと思うわけですけど、ここに実は、広い意味でのapproximate computing、そういうのが入る。つまりデータ、あれもデータの移動をなるべく少なくするというのもあるんですね。ただ、どうしてもNP困難とかになると、これはどうしようもないので、これはもう量子コンピュータに期待するしかない。
すなわち今後、ただ、いろいろな領域では、ローオーダー、組合せ最適化なんかを含めて、どんどんそのオーダーを低くする、つまり、今はn3乗とかn4乗のHartree-Fockみたいなものでも、例えばこれをオーダーnのQMに変換していけば、これは帯域バンドになりますから、帯域バンドなものとしてつくっていくことができます。ですので、ただ、そういうところに、本当にエッジのところで、量子コンピュータとのエッジのところで、例えばニューロモーフィックだとか、そういうのがもしかすると役立つかもしれないという可能性はもちろんあるので、そういうところはきちんとした環境をする必要はもちろんあると思いますが、全般的に言うと、ローオーダーのアルゴリズムか、ないしはもう組合せか、要するにNPハードで、それで量子アルゴリズムに依存するしかないと、そういうふうなアルゴリズムの世界に転換していく、アプリケーションもそうなっていく、そのようなコデザインをしていくのが知見では正しいと思っています。
もう1個、最後に申し上げますと、じゃあ何でそれで八ヶ岳は駄目かというと、今までアクセラレータで成功したというのはGPUしかないわけですね。なぜGPUが成功するか、ほかは全部駄目だったかと申しますと、それはアムダールの法則とグスタフソンの法則を理解すれば非常に簡単に申し上げることができます。アクセラレータを幾ら増やしても、例えばCPUとアクセラレータを同時に使うようなアプリケーションを組んでしまうと、アムダールの法則によって、幾らアクセラレータを速くしても、CPU部分は残ってしまうので、せいぜい二、三倍しか早くならないわけですね。なので、今まで成功したというのは、ほとんどGPU、あるいはアクセラレータでほとんど全部動くようなものしか速くならないわけです。だからGPUで成功したというのは、このプログラムというのはほとんどGPUだけで動く、ないしはCPUだけで動く、そのような世界です。例えばTSUBAMEがそうなんです、パーティションによってGPUだけ、CPUだけにしたわけですね。そこで速くするのはウイーク・スケーリングしかなくて、この並列処理しかなくて、それはグスタフソンの法則なわけです。だからウイーク・スケーリングして、そういうふうに個別のものは、例えばGPUならGPUだけで動かす、ないしはCPUならCPUだけで動かして、それをウイーク・スケーリングしていけば、それは高速化できるから、これはグスタフソンです。それは今のここのスキームにも当てはまるわけです。
じゃあそうなったときに、先ほどのエコシステムと突き合わせると、やはり汎用で、いろんな分野で速く動くものしかつくれないわけですね。そうなるとGPUの、ジェネラリティーを持ったものしかできなくて、そうすると、それをウイーク・スケーリングすると、それはhomogeneousをつくるしかないわけです。つまり、GPU、CPUで何万ノードあるとか、そういうマシンしか意味がないわけです。現に世の中で今トップマシン、今後出てくる、例えばFrontierとかEl CapitanだとかAuroraとか、そういうマシンは全て同じ、ウイーク・スケーリングマシン。すなわちGPUがあってCPUがあって、それがいっぱい、homogeneousなウイーク・スケーリングマシンになっています。TSUBAMEもそうですし、ABCIもそうです。
ですので、八ヶ岳みたいなマシン、小さい規模で、一部のアプリケーションを満たすために小規模でつくる、ないしは中規模ぐらいでつくるのはいいんですけれども、フラッグシップマシンを八ヶ岳にするというのは、以上の理由で、実に技術的に適さないというふうに思っております。
以上です。
【安浦主査】 松岡先生、貴重な御意見ありがとうございました。
もう時間になっておりますので、今日の議論はこの辺りにしたいと思いますが、まだまだ御意見等がおありかと思います。次回、この中間取りまとめの骨子案を、もう少し中身を詰めて議論をしていきたいと思いますので、それをつくる過程で、それぞれの委員の先生方に、また事務局のほうから御意見を伺うことがあるかと思いますが、そのときはぜひ御協力をお願いしたいと思います。また、本日の議論で足りない部分や、もっと資料を見たらこういう質問もあるというようなことがございましたら、メールベースで事務局にお伝えいただければと思います。
それでは、司会を事務局のほうにお返ししたいと思います。
【太田専門職】 御審議いただきありがとうございました。ただいま主査からもございましたように、本日の議事について議論が足りない点や御意見等ございましたら、メールにて事務局まで御連絡をお願いいたします。
また、次回につきましては6月21日の17時から、次々回につきましては7月29日の15時半からの開催となりますので、よろしくお願いいたします。
以上でございます。
【安浦主査】 皆様、お忙しいところお集まりいただき、ちょっと時間もオーバーしてしまいまして申し訳ございません。ただ、非常に重要なデシジョンをするタイミングに来ておりますので、ぜひ忌憚のない御意見をいただいて、次回以降、それを基に議論を深めさせていただいて、中間まとめをまとめていきたいと思いますので、御協力のほどよろしくお願い申し上げます。
これをもちまして、第6回の次世代計算基盤検討部会を終了したいと思います。本日はどうもありがとうございました。