ポスト「京」の利活用促進・成果創出加速に関するワーキンググループ(第1回) 議事要旨

1.日時

平成30年11月8日(木曜日)16時00分~18時00分

2.場所

霞が関コモンゲートナレッジスクエア

3.出席者

委員

(ポスト「京」の利活用促進・成果創出加速に関するワーキンググループ)
合田委員,伊藤委員,宇川委員,臼井委員,梅谷委員,加藤委員,白井委員,住委員,辻井委員,藤井委員,安浦主査

(オブザーバー)
(理化学研究所)松岡センター長

(説明者)
(高度情報科学技術研究機構)高津センター長

文部科学省

千原審議官,原参事官,坂下室長,荒井専門職

4.議事要旨

議題1 ポスト「京」の利活用促進・成果創出加速に関するワーキンググループの開催について

事務局より資料1-1及び資料1-2について説明し了承された。
主査代理として合田委員が指名された

議題2

事務局より資料2-1、資料2-2について説明。
宇川委員より資料2-3について説明。
質疑応答は以下の通り。

【安浦主査】私の方から1点、宇川先生に伺いたいんですけど、「京」のところで、政策的にやった話と、HPCIコンソーシアムのようなボトムアップの仕掛けができてきた。これは意図的に作ったものなのか。それとも、ある面、偶然とか自然発生的な側面もあったのか。完全に設計されたものであったのかどうかちょっと伺いたいところなんですけど。
【宇川委員】事業仕分けの時点で、随分大変なことがあったということは、もう皆さん御存じだと思うんです。事業仕分けを受けて、「京」プロジェクトをどう考え直すかというところで、その頃よく言われたことは、開発者視点から利用者視点への転換ということが言われたわけですね。
 それで、それを受けて、文科省の委員会が立ち上がりました。私の資料で言うと、8ページです。事業仕分けがあって、HPCI検討ワーキンググループというのが、たしか5月から7月ぐらいまで行われました。その席で、コミュニティの意図に基づく「京」プロジェクトの再構成を考えるとするならば、どう考えるべきかということを議論しろという場があって、そこでは、文科省の方々とも密接な意見交換をしながら作っていった。
 その結果、もともとの「京」プロジェクトについて、開発者視点のプロジェクトではないかとよく言われたものが、現在のこういうマルチの要素を持ったものに切り換わった。私自身は非常によかったと思っているのは、マシンというものが与えられるものではなくて、みずから考えて開発をし、それから利用するべきものだという意識を研究者側が強く持って、それでこういったものを作ってきたというのが非常によかったのではないかというふうに私は思っています。
【安浦主査】どうもありがとうございました。そういう意味では、このワーキングの議論というのは結構そこの時点でのいろんな知見も生かしながら、今度のポスト「京」をどういうふうにしていくか。そこの上で、何を生み出していくかという問題として議論をしていただければと思います。
 何かほかに御質問とか御意見ございますか。どうぞ、白井先生。
【白井委員】製薬会社の所属なので日頃から医療費の破綻や、それ以前にそもそも国家財政がどんどん厳しくなってきて、年金もどんどん遅れている事情などを念頭に置いています。このような中、この成果創出フェーズというのがある段階で終わりますよね。5年先とか6年先という。その終わった段階で、この成果創出がよかったとか悪かったとかいう、そういうこの成果創出フェーズというのが終わった段階で、成功したというイメージというのは、要は、前回の「京」コンピュータの成果創出のときよりも、より厳しく、その社会的な価値と言うんでしょうかね。国家的価値というのがより、もう本当に徹底的に厳しく問われるような気がするんですね。
 ですから、それをちょっと見越した上で、先ほどの、例えば坂下さんがおっしゃったものの点で見たときに、本当にどういう優先順位付けでやるのか。それから、そもそも抜本的なことは考えなくていいとおっしゃったんですけど、本当にそれで大丈夫なのかとかですね。そこは最初に論点にした方がいいかなと思うんですけど、いかがでしょうか。
【安浦主査】ありがとうございます。今のポイントは、そのポスト「京」の後のプロジェクトがどうなるかということにも関係してきますので、国として、今後こういう大型の計算科学あるいは今度はデータサイエンスなんかも入ってきますから、そういう中での国としての投資というのがどういうふうにあるべきかという問題として捉えるべき御指摘だと思いますので、これは今後のこのワーキングの中での非常に重要な視点として、皆さんで議論をさせていただきたいと思います。どうもありがとうございました。
 ほか。はい、どうぞ。
【加藤委員】今の白井委員の話とも関連するんですが、このタイミングで、ポスト「京」があと2年かそこらで動き出す。どうやって使ったら早く成果が出るか。それは確かに早く議論しないといけなくて、予算要求的にも結構忙しい。ただ、これをやると、またしばらくこういう議論をしなくなってしまって、そうすると、ポストポスト「京」とか、ポストムーアとか、HPCIをそもそもこれからどういうふうに開発、運用あるいは運営していくのかという議論がどうしてもいつもそこが何か手薄になるというか、議論されないまま、次の何年かたって、焦ってまた委員会を立ち上げるということが今までずっと見ていると起こりがちなんですよね。それで、このワーキンググループのミッションであるとは必ずしも限らないと思うんですが、是非その計画推進委員会の方で、そういうことも含めて御議論いただいて、そこともやりとりをしながら、このワーキングの議論を進めるのがいいんじゃないかなと思います。
【安浦主査】ありがとうございます。今の加藤委員からの御指摘も是非このワーキングは、わりとフリーに議論をしたい。ここで答えを出す必要はなくて、上の委員会の方に上げるために、問題点はやはりたくさん投げ掛けておく必要があると思いますし、国家財政も、こういう状況でございますので、どういうふうに今後流れが変わっていくか分かりません。国民に分かりやすい説明も含めて、こういうことをきちっとやっていかないと問題点がクリアにならないよという、そういうことは是非御意見としてこのワーキングを通じて、出していただければと思います。ありがとうございます。
 辻井先生、どうぞ。
【辻井委員】私自身は、そこはHPCのコミュニティがどういう形で発展してきたかというのは、余りよく知らない立場で、AIの方からの立場から議論を聞いているという立場なんですけど、結局、AIの立場からすると、計算科学と言われると、どうしてもシミュレーションに偏った感じが強いわけですよね。先ほどの先生の御発表にあったように、科学というのをもう少し幅広に捉えて、シミュレーション的なテクニックと、データから来るいろんなエンピリカルなものとの検証まで含めて、かなり広く取って科学研究を進めていくと。そのときに計算だけではなくて、データの部分をどういうふうに考えるかというのがこれから大きくなってくると思うんですよね。
 シミュレーションでやった場合に、データから出てくるある種の現象というのがシミュレーションでどれぐらいうまく説明できているとか、データシミュレーションの議論もあると思うんですが、逆に今度はデータからモデルを作ってくる、例えば機械学習のテクニックがあって、その内部をホワイトボックス化することで、一種のデータ解析を行うことで、シミュレーションモデルの方をもっと積極的に変えていくみたいな手法が出だしていると思うんですね。
 そうすると、データの取り扱いをどうするか。データというのがスタティックに集まって、それをこちら側に移してきて研究をやればよろしいという立場を取るのか。データというのは、何かオブザベーションとものすごく重なっていますから、かなり分散する可能性があるわけですよね。それをまた一々、こちら側に持ってきてやるというのは大変になってくる可能性はあって、ある種のネットワーク的なものをかなり積極的に議論の中に取り込んでこないと難しくなってくるんじゃないかなという気はしているんですけど。
 ただ、そういう意味で、何かポスト「京」の、先ほどのどういうことをやるかという部分を読んだときに、かなりシミュレーションに偏っている問題設定が少なくともされていて、それをもう一度、今の時点でデータからのアプローチとどうかみ合わせるかという議論を少しやらないと、次のステップに行きにくくなるんじゃないかというのが一つと、それから、いっぱいユーザーを入れるといったときに、科学のコミュニティのかなり変わったコミュニティが入ってくる可能性があるわけですよね。
 ただ、それを全て取り込むというのは大変だと思うので、一般ユーザーの中のどういうセグメントを取り入れていくのかというのもきちんと議論しておかないと大変になるなという気がします。だから、HPCIのコンソーシアムがどういう構成で、「京」を一つのノードとして、ほかのプレーヤーをどう組み込んでいくのかという議論も少しやっていただけるといいなという気がしましたけど。
【安浦主査】どうもありがとうございました。2つ御指摘頂きましたけど、後半の部分はこのワーキングでは是非どこかに最終的には答えを出さないといけない部分だと思っております。前半の部分に関しましては、これはかなり大きな話で、我が国の学術基盤としてのコンピテーションと通信とストレージ、これを全部どういうふうに整えていって、我が国のサイエンスをどういうふうに支えるのかという、かなりこのワーキングの上部委員会ですら超えたレベルの話になってくると思いますけど、やはりこういうワーキングで、下からそういう声がきちっと上がっていくことによって、全体の政策決定の中に意見として反映させていければと思います。また今、辻井先生のおっしゃったような立場で研究されている方を御紹介いただければ、ここでそういう研究を実際に紹介してもらいまして、そして、その方の御意見を聞きながら、AI分野の新規課題というのはやはり1つか2つはやはり入れざるを得ないと思いますので、そういうものを取り込んでいくというトライアルをこのワーキングとしては考えていければと思っております。よろしくお願いいたします。
 住先生、どうぞ。
【住委員】こういう議論をすると、ともすると計算科学とかそういうシミュレーション全般に話が広がって、なかなか絞りにくいと僕は思うので、やっぱりよく考えた方がいいと思うんですけど、いわゆる商用マシンというのがございますよね。みんなが欲しがっているのは、計算機能力が欲しいので、例えば、「京」、ポスト「京」でもいいんですけど、トップクラスの計算機じゃなくても、自分が使えるリソースが欲しいんだと。それを使って計算科学シミュレーションを推進しているんだと立つか、それとも、フラッグシップマシンというのはどうかというのをやっぱり事業見直しのときからそれは議論されていて、それがある程度フラッグシップとHPCIという、組織化になったのは非常にいいと僕は思うので、そうすると、ポスト「京」といったときは、やっぱりフラッグシップをどう使うかだと思うんですね。
 そうすると、やっぱりそれは大きな計算センターではないので、ある意味では、大規模なシミュレーションがそこのフラッグシップのタスクだろうと思っています。その代替としては、HPCIみたいな、そういう次のレベルのものを相当手厚くしているので、そこを考えた方がいいなと思うのと、それから、特に地球の分野ですと、観測ということが非常に進んでいるんですけど、文科省でいっても、DIASみたいなそういう大きなデータベースもありますし、その辺も含めて、やっぱりそれはどういうふうに具体的にやるかというところは、これは全体で考えていかないと、やっぱりここだけでやることでは僕はないような気がしますので、その辺を考えたらいいと思います。
【安浦主査】どうもありがとうございます。もちろんコデザインをやってきていますので、今からアーキテクチャが変わるわけでもないわけですけども、ただ、この後、松岡先生の方から少し御紹介いただきますけど、その中でもやはり時代の流れを反映して、そのAIとかを見越したアーキテクチャの部分も入れてきておりますので、そこは今までのシミュレーションだけにこだわるのではなくて、少しフラッグシップであるからこそできる新しい計算科学とデータ科学みたいなものの融合というのはあり得ると思います。そこはいろんな立場の御意見があっていいと思いますので、是非このワーキングを通じて、自由な御意見頂ければと思います。
【加藤委員】すみません。先ほどコンソーシアムに対する言及があったので、一言だけ申し上げておきますと、御存じかもしれないんですが、コンソーシアムの方でもボトムアップ的な立場から、今後、ポスト「京」なり、HPCIをどうしていくかという議論は既に始まっています。それはこれまで2回、ワーキングを開催していて、今のデータサイエンスをどうするかということも含めて、議論をしていて、多分ここでも1回、ヒアリング等は行えると。そういう中でキャッチボールをしながら議論をまとめていくということになると思います。
【安浦主査】コンソーシアム側からも是非情報提供も、このワーキングの中でお願いしたいと思いますので、よろしくお願いいたします。


議題3 ポスト「京」システムの概要について
議題4 「京」及びHPCIの利用実績について


資料3についてR-CCS松岡センター長より説明。
資料4についてRIST神戸センター高津センター長より説明。
質疑応答は以下の通り。

【合田委員】松岡先生に御質問させていただきたくて、実はポスト「京」そのものではなくて、その運用に関する考え方についてお聞きしたいんですけど、ポスト「京」が動いた後も、今のHPCIと同様に基盤センターですとか、あと共用ストレージなどと連携して、HPCIの形で動くと思っているんですけど、そのときにポスト「京」を運用する立場から見て、そのHPCIに対しての見解というか、どう思っているかをお聞きしたくてですね。
 というのは、今のHPCIというのは2010年に設計しましたので、ポスト「京」が動くときはもう10年前の設計なわけですよね。そのままでいいのかという議論もありますし、特に気になっているのは、Society5.0のアプリケーションを想定した場合に、今のスパコンは割と入力データを全部ユーザーが直接ストレージで置くなりして、計算して、取ってくるというものですけれども、Society5.0はいろんな方面からデータが来るときは、そのモデルが成り立つかというのは私自身分からないところがあって、恐らくHPCIの外のストレージなり、アーカイブからデータを取ってくるとか、そういったもっと広い連携が必要になってくるのではないかと個人的には思っているんですけど、その辺りに関して御見解をお聞きできればと思います。
【松岡RCC-Sセンター長】大変よい質問をありがとうございます。シミュレーションにおいても、当然ながらデータ科学やAIにおいても、データを内外からどういう形態で、どういう形で取ってきて、どう保存するのか。いわゆるデータプロブナンスというのは今以上にはるかに大事になってくると思っております。
 ポスト「京」においては、まず内部のアーキテクチャはデータに関しても高速化の機能がいろいろあって、例えばノードに、前回「京」というのは、ローカルストレージは全然なかったんですけれども、今回は16チップ当たり1個、高速なNVMeを付けて、これは16分の1になるんじゃないかと思われるかもしれませんが、例えばDGX-1みたいなAIマシンでも、あれは8GPUに1個なので、そんなに変わらないですね。
 なので、そのローカルなIOを高速化する機構。データ科学、AI及び、もちろんシミュレーションの一時保存などのためにも加速機構というのはいっぱい付けています。かつ、ストレージもそれなりに潤沢に付けるんですが、ところが、一つのディシジョンとしては、今のところ設計では、いわゆるターシャリ、つまり、三次記憶は持たないことになっています。
 ですので、その三次記憶をどこに置くか。それはHPCIに置くのか、クラウドに置くのかというのは、それは分野層によると思いますけれども、今の「京」以上に、まず外部のターシャリなストレージ。それはほかのスパコンと運用する。どこかに長期保存する。全世界からデータを集めてくるなり、そういうところというのは外部のストレージに頼るので、それに耐えるようなバンド幅、それはただ単に物理的なバンド幅だけじゃなくて、例えばちゃんとファイアウォールされた形でのバンド幅だとか、今のSINET5から付きましたけれども、例えばVPN、要するに、VPN系のサービスだとかそういうのがまず必要になります。
 さらに、次世代のアプリケーションで、例えばスマートシティなんかは、いわばリアルタイムのシミュレーションと、アナリティクスとデータセンシングというのが非常に融合するような、そういうアプリケーションがまさにグランドチャレンジとして期待されるわけですが、そういう場合は、やっぱり非常に大量のインカムストリームということに対して対応する必要があります。
 それに関して、もちろんポスト「京」に多少対応して、例えばバックエンドの方はクラウド的な運用をできるようにしてやってコンテナとかがサポートされるようになっていて、そこでそういう、そちら系のソフトウェアスタックというのを入れられるような設計にしていますし、実際、コンテナ運用なんかも今、検討しています。
 ただ、そのストリーミングデータに対して、それだけ大量のストリーミングデータがやってくるときに、それをどういうふうにクラウドでまず前処理をして、SINETを通ってきてやってくるというところのアーキテクチャの設計というのは、実はSINET側と本当はもっと協議をしなきゃいけないなというふうに思っていて、そういう研究のニーズに対して、今までは比較的大きいセグメントに対するものが多かったんですけど、今後そういう小さいストリームの、かつ、段階的な処理を行うような、例えばエッジインパレスとか、これからエッジラーニングまであるようなものに対して、どうやっていくかというのは、今はまだポスト「京」の設計には入っていないという現状ですので、それは是非相談する必要があります。

議題5 今後のワーキンググループの進め方について

【安浦主査】先ほど特に御意見を頂いていない委員の方々から、簡単に御意見あれば伺いたいと思いますけれども、伊藤委員、何かありますか。
【伊藤委員】宇川先生のところに、産業利用の話についても飛行機の話が書いてございましたし、これはせっかく、先ほどのRISTの高津さんのお話にもありましたように、「京」では順調に産業利用が伸びてきた感じなんですが、いきなりポスト「京」の場合は、もう産業も重要なファクターとして一翼を担えるような形で進めていきたい。それは成果の在り方の問題でして、やっぱり産業界の場合も同じように成果を出していきたいなと思っておりますので、よろしくお願いいたします。
【安浦主査】臼井委員。
【臼井委員】私は、クラウド事業者の立場から、松岡先生がさっきおっしゃっていただいていたことなんですけれども、ポスト「京」がどういうアーキテクチャ、あるいはどういう方針で、何をやっていくかというのに産業界は付いていくものだと思っています。その部分では、いい選択をし、かつ、それをメッセージとして強く出していって、世の中に周知させていくこと、浸透させていくことというのをすごく期待しています。
【安浦主査】梅谷委員。
【梅谷委員】やはりポスト「京」の利活用を考える上で重要なのは、「京」の利活用の課題出しだと。何が問題で、そのポスト「京」の利活用で何を直さなきゃいけないのかというのが非常に重要だと思っていて、第1回では、いい点ばかりがやっぱり出たんですけれども、本来やっぱり「京」の利活用で何が問題だったかというのをもう少し議論してもいいんじゃないかというふうに少し感じました。
【安浦主査】ありがとうございます。藤井先生、どうぞ。
【藤井委員】一つは、ポスト「京」に対して新しいタイプのもの若しくは、ポスト「京」の次を狙うようなものを入れようとしたときに、最初から性能を目いっぱい使えるようなものでは多分ないと思います。そういう性能を十分活かせていないが、重要なものをどうやって利用の中に入れ込んでいくのかというのは結構議論しないといけないのではないかなと思います。
 それから、ポスト「京」が生まれて例えば2年後に、世界中の計算機の7割を同じアーキテクチャが占めればいいのですけど、残念ながらそういう状況にならないというのが現実起こり得ることでしょう。そうだとすると、アプリについてなかなかそのアーキテクチャに特化したアプリになってしまって本当によいのかというところも少し考えないといけないかなと思います。以上です。
【安浦主査】今後3月までに、あと4回ぐらい開くペースでやっていきます。その中で今日出ましたようないろいろなお立場での考え方があると思いますので、それを整理していくために具体的に新しい課題とか、実際に今、重点課題でやられている話とかそういうことをお聞きしながら、議論を深めていって、まとめていきたいと思います。そういう方向でよろしゅうございますでしょうか。
 それでは、非常に、ある意味で大きな共有資産をどういうふうに使うかという、そういう問題。それから、今後の計算科学を中心に、AIやデータ科学も含めたサイエンスのベースとしてのコンピュテーション、あるいは通信を含めた日本の基盤をどうするかという大きな問題も考えながら、このワーキングを進めていきたいと思いますので、是非自由な視点でいろいろな御意見を頂ければと思います。よろしくお願い申し上げます。

安浦主査より閉会

お問合せ先

研究振興局参事官(情報担当)付計算科学技術推進室

電話番号:03-6734-4275
メールアドレス:hpci-con@mext.go.jp

(研究振興局参事官(情報担当)付計算科学技術推進室)