次世代計算基盤検討部会(第2回)議事要旨

1.日時

令和2年7月28日(火曜日)

2.場所

オンライン会議

3.出席者

委員

安浦主査、相澤委員、合田委員、荒瀬委員、伊藤委員、井上委員、上田委員、海野委員、喜連川委員、後藤委員、田浦委員、高橋委員、常行委員、中野委員、藤井委員、山本委員

文部科学省

増子審議官、橋爪参事官、宅間室長、三宅室長、根津参事官補佐、出口参事官補佐、土井参事官補佐

4.議事要旨

安浦主査により開会を宣言。

冒頭、文部科学省増子審議官より挨拶の後、各委員の自己紹介があり、定足数を満たし検討部会が成立していることを安浦主査が宣言。

事務局からオンライン開催の注意事項について説明があった。

議題1 前回の議事概要の確認
資料1に基づいて事務局より報告を行った。質疑は特になかった。

議題2 スーパーコンピュータ「富岳」の整備進捗状況について
議題3 新型コロナウイルス対策に関する情報科学関係の取り組み
それぞれ資料2、資料3に基づいて事務局より報告を行った。質疑応答は以下の通り。
【安浦主査】 「富岳」のほうはまだ整備が完全に100%終わっているわけではないけれども、これだけの性能が出たと、そういう認識でよろしいでしょうか。
【宅間室長】 はい、まだ調整中でございます。まだ100%の能力でない段階で今回のランキングにも参加しておりますけれども、こうした成果を残すことができたということでございます。
【安浦主査】 大体何割ぐらいの能力でこれ、トップになったのですか。
【宅間室長】 ランキングの種類によっても使ったラックの数は少し変わりますが、大体、おおむね8割から9割の能力で結果を登録しております。また、コロナにつきましては、一方でまだ6分の1程度のラックを使用して研究を行っているという状況です。
【安浦主査】 ありがとうございました。
ほかに何か、どういうことでも結構ですので、御質問ございますか。
【宅間室長】 山本委員から挙手をいただきました。
【安浦主査】 はい、どうぞ。
【山本委員】 AIPセンター様のほうの今、12テーマの登録になっておられるCOVID-19の対策の中で、HPCをどのようにお使いになられるのかというところは今お伝えいただけたりしますか。
【安浦主査】 いかがでしょうか。
【橋爪参事官】 ありがとうございます。理研AIPセンターのほうでは、自身でも計算資源を整備しておりまして、まずはその計算資源を使って行うという状況でございます。一方で、これはコロナウイルスへの対応ということではございませんけれども、「富岳」との連携についても取り組むということでございまして、気象とか防災の関係について様々AIとシミュレーションの連携ということを検討しているところでございます。
【山本委員】 ありがとうございました。
【安浦主査】 確認しておきますと、資料3の5ページのAIPセンターにおける新型コロナウイルス感染対策の研究は、これは「富岳」の上で行っているものではないという、そういう認識でよろしいわけですよね。
【山本委員】 今の御回答はそういうことかと思います。御自身でお持ちの計算機のほうをお使いと。
【橋爪参事官】 今のものについては、基本的には理研AIPセンターのほうで整備している計算資源を活用していくということでございます。それ以外のことに関しまして、「富岳」との連携ということは取り組むことを検討していくというような状況でございます。
【安浦主査】 ありがとうございます。ほかに何か御質問ございますでしょうか。
【宅間室長】 井上委員から挙手をいただいております。
【安浦主査】 はい、どうぞ。
【井上委員】 井上ですけれども、よろしいでしょうか。2つ質問があります。1つは、先ほどの質問の御回答で、今、コロナ関係に関しては「富岳」は6割程度のノードしか使っていないということだったと思いますが、ここは何か特別な事情か何かがあるのでしょうかというのが1つ目の質問です。どんどんもっと使ってもいいのではないかなと思いますというのが1つ目です。
2つ目ですけれども、第2階層でのコロナに対する活動というのは非常に重要だと思っておりまして、ここをもっと「富岳」を中心として第2階層でもどれだけスパコンが使われているかというのを見える化するというのが必要になってくるかなと考えています。その意味で、どれぐらい広がっているのかというのがもし分かれば、そういうデータがあれば教えていただければ幸いです。
以上です。
【安浦主査】 ありがとうございます。御回答お願いします。
【宅間室長】 事務局でございます。コロナに関しましては、6分の1のラックを使っております。これは整備が完了して研究に使えるような状況になったところから使っているというところでございまして、そういった状況で今まだ6分の1程度しか使えていないという状況ですけれども、今後整備が進みましたら、可能な範囲で増やしていければとは考えてございます。今現時点では、平均して約6分の1程度を使っているというふうに御理解いただければと思います。
それから、2つ目の御質問でございますけれども、第2階層につきましても、コロナの研究を行うための緊急の公募を同時に行っております。今現在、最新で15課題か16課題か既にもう採択をされていると思っております。そちらのほうは、RISTのホームページで課題を公開させていただいていまして、本日の資料には、入れておりませんけれども、第2階層のほうでも「富岳」のみならず、コロナの研究のために計算資源を緊急的に拠出して研究を進めていただいている状況でございます。
御回答になりましたでしょうか。
【井上委員】 はい、ありがとうございます。
【田浦委員】 よろしいでしょうか、田浦です。
【安浦主査】 はい、田浦先生、お願いします。
【田浦委員】 すみません、私のソフトの関係で手挙げ機能が見当たらずに、声で割り込ませていただきます。
HPCIの第2階層の課題ですけれども、こちらも新型コロナウイルス感染症対応HPCI臨時課題募集ということで検索していただければ、今、宅間さんがおっしゃった、13課題だと思いますけれども、13課題が挙げられています。それで、こちらで今、「富岳」での成果例ということでよく出てきているような新型コロナウイルス表面の治療薬候補同定とか、あと、飛沫のシミュレーションといったようなものは、同じ課題、同じ研究者の方が第2階層のほうもお使いになられていますので、13課題、御覧いただければ分かると思いますけれども、「富岳」のほうの課題とかなり重なっておりまして、第2階層のほうも非常に貢献しているのではないかと思っておりますので、その辺、多少宣伝の仕方の違いというところもあるのではないかと思っています。
【井上委員】 すみません、井上です。よろしいでしょうか。
【安浦主査】 はい。
【井上委員】 ありがとうございます。すごくいいニュースといいますか、いい状況だなと思いました。もし可能であればなんですけれども、恐らく今後こういういろいろな複数のスパコンを使ったりとか、複数機関で連携するということが増えてくると思いますので、せっかくなので、例えばどういう性質のテーマがどういう性質のスパコンとどういう性質のスパコンを一緒に使ったらどういう成果が出たといったような、そういったところまでもう少し見える化してくると、今後の新しいアプリケーションの実装を考えるときにも参考になるかなと思いました。
コメントです。以上です。
【安浦主査】 井上先生、ありがとうございました。田浦先生、詳しい御説明ありがとうございます。
ほかに何かございますか。
【宅間室長】 事務局でございます。高橋先生、相澤先生に挙手をいただいております。
【安浦主査】 それでは、高橋先生からお願いします。
【高橋委員】 高橋でございます。コロナに関しての文科省の取組ということを御紹介いただきました。その中ではまだ御紹介なかったかもしれませんけれども、ある意味ではコロナの関連の研究というのは、文科省だけではなくて、他省との協力が非常に大事になると思います。他省との協力という意味でどのような工夫があるのか教えていただければと思います。
【安浦主査】 いかがでしょうか。
【宅間室長】 事務局でございます。まず「富岳」の研究成果を例に申し上げますと、例えば内閣官房のコロナ対策を行っているような担当部署とか、また、厚生労働省、あと、電車の関係の飛沫のシミュレーションなども行っております関係で国土交通省とか、そういった関係省庁に情報を共有させていただいております、情報をなるべく関係省庁にも幅広く共有するようなことで連携をさせていただいております。
御回答になりましたでしょうか。
【高橋委員】 短時間でやるというよりはじっくりと進めなくてはならない根本的な問題があると思います。そういった意味でも厚生労働省等と、それから、総務省もあるかもしれません、そういったテーマ設定も含めた御検討をいただけると、より一層深みのある研究開発に発展すると思われますので、ぜひよろしくお願いしたいと思います。
以上です。
【安浦主査】 ありがとうございます。HPCIの委員会のほうでも「富岳」の計算資源をどういうふうに割り振るかということで、政策対応枠ということで緊急的な政策に対応する話と、それから、一般利用枠の中で各省庁と連携して大学あるいは国研などがじっくりと取り組む研究をされる場合に応募する、そういう枠もございますので、そういうものを活用して使っていただくことになると思っております。一応、制度的には、高橋先生がおっしゃったようなことに対応できる制度はつくってあるという認識をしております。
【高橋委員】 ありがとうございます。ぜひ富岳を有効に使うことはもちろんとして、学術の根本的な、根源的な問題に関わるデータと、テーマの設定を期待したいと思います。どうぞよろしくお願いいたします。
【安浦主査】 ありがとうございます。それでは、相澤先生、お願いいたします。
【相澤委員】 相澤です。「富岳」が6割の能力、6割の使い方でトップをたくさん取られたというのは大変すばらしいことだと思います。スパコンランキングのベンチマーキングに対しての表についての質問ですけれども、5課題並んでいて、一番右の人工知能に関する計算性能というベンチマーキングだけ2つしかエントリーがないようにも見えるのですけれども、これは2つだけのエントリーだったのかということと、あと、これ、何かしら参加しにくい課題なのかという、その1点だけの質問です。
【安浦主査】 ありがとうございます。使われた量は八、九割ということでしたですよね、宅間さん。
【相澤委員】 八、九割ですか、6割じゃなくて。すみません。
【安浦主査】 それで、今の御質問は、人工知能に関する性能評価というのは2つしか候補がなかったのか、応募がなかったのかという御質問ですけれども、いかがでしょうか。
【根津参事官補佐】 文科省でございます。このHPL-AIといいますのは、今年の6月まさに新設をされたランキングと聞いております。人工知能に関する計算性能と書いてございますが、正確には、半精度と倍精度を混合してLINPACKを、速さを競うというふうなランキングだと伺っております。新設だということで、我々も結果を聞いてびっくりしたのですけれども、結果的に2つのマシンしかエントリーしなかったと聞いております。事務局のほうも何か考えたいみたいなことは実際、発表の中でおっしゃっていたのですが、結果的に2つしかエントリーしなかったと聞いております。その原因までは、我々もあまり細かく聞いていないのでそういったところの御回答になってしまいますが、よろしゅうございましょうか。
【相澤委員】 それで十分です。ありがとうございました。
【安浦主査】 ほかに何かございますか。喜連川先生が入られたみたいですけれども、先ほどSINETとNIIで喜連川先生中心にやられておりますサイバーシンポジウムの話が出たのですけれども、何か追加等ございますでしょうか。
【喜連川委員】 遅れて大変失礼いたしました。サイバーシンポジウムを御紹介いただいたということでどうもありがとうございます。微力ですけれども、安浦先生等にも、田浦先生をはじめ、ここに御参加いただいている多くの先生に御支援をいただきながら進めており、決してNIIが頑張ったということではございません。
そんな中で見えてきたことのやはり大きな課題というのは、少しエンカレッジすることで大学は90%以上が遠隔授業にシフトすることができたと。しかしながら、小学校、中学校、高校は、文科省さんの御調査によると10%未満にしかなっていないと。要するに、著しく難しい状況になっている。これはいろいろ調べてみますと、やはりシステムといいますか、教育委員会を中心とする初中の教育のシステムというのがいまひとつこなれていないのかなという気がいたします、現場の先生方等聞きますと。
大学は、基盤センターのようなところ、あるいは情報処理センターのようなところがあって、そこが支援をするということで遠隔授業がうまくいってきたという経緯があるわけですけれども、小学校、中学校というのはそういう部隊が一切ないわけですね。ですから、何かをしようと思っても、それをやる確たるボディが存在しないということじゃないかということが分かってきました。そうすると、今度、今、田浦先生とか基盤センターの先生と御相談していますのは、こういうコロナの時点においては、要するに、大学が小中高に支援を貸してあげるということをやればいい。基盤センターのリソースみたいなものをちょっとそちらに融通するというようなことをやってあげればいいと思っています。
といいますのは、調達の仕方も分からない。調達ができたとしても、今度、置く場所がどうすればいい、メンテナンスどうすればいいと。そんなこともうやってられないわけですね。かといって、クラウドを利用するかというと、そこまでのコストを負担することもできない。というところで、本質的、抜本的にこの世の中の初中の教育空間を見直す必要があるのではないかなという感じがします。
これは九州大学さんがすごく先駆的なお取組をされてきたわけですけれども、やはり教育がデジタライズしてデータを捕捉できるようになったと、そういう時代におけるルール改正みたいなものも必要だということで、ありとあらゆるものがどんどん今、見えなかった世界が見えるようになってきていると思いますので、引き続きこの辺を、振興局と言わず、教育のところ、初中局、高等局と連携しながら進めることが必要じゃないかなと思った次第です。これが1点であります。
それから、先ほど「富岳」の点でお伺いしていて感じたことを少しだけ申し上げさせていただきたいと思いますのは、これも安浦先生が委員長をお務めになられている推進委員会で確認したことの一番大きなポイントが、要するに、ランキングには一切こだわらないということを合意したことだと。表層的な性能で戦うことはもう全部やめましょうと。そのゲームに乗ってしまったら、もう中国に勝てるわけがないわけですね。ですから、そうではなくてアウトカムでやりましょうということを言ったというのがあの委員会の最大の結論だったと思いますので、ここで何番目がどうのこうのというようなせせこましい議論はやっぱりやるべきではないと個人的には思います。
それから、先ほどお伺いしていますと、コロナにもっと全面的に使いましょうみたいな議論がありますけれども、それは大きな間違いで、病院でもコロナ患者だけにするわけにはいかなくて、今まで通常の疾病を抱えている方をどうやってバランスするかということが一番重要なのと同じように、今現存の学問を全て犠牲にするというのは100%あり得ないのですね。やっぱりそれがコロナを解決する底辺になる学問です。ですから、たくさん使うということではなくて、ここで御議論いただくことの極めて重要なポイントは、どういうバランスを取るのかという難しいところだと思います。一方的にコロナシフトをするというのはちょっと早計な考えになってしまうのではないかなというのが個人的な心配です。
以上です。
【安浦主査】 喜連川先生、どうも貴重な御意見ありがとうございます。今、喜連川先生がおっしゃいましたように、スーパーコンピュータ、ハイパフォーマンスコンピューティングに関しては、ランキングというのは必ずしも全てを表しているものではなくて、やはりどう使ってどう生かして何ぼのものであるという、そのアウトカムで議論するような形でやっていくということの重要性というのは非常に大きいと思いますし、限られた計算資源を国全体のもろもろの問題点にどう使うかという、そういう視点でこの委員会はぜひいろいろな視点から御意見をいただければと思っておりますので、よろしくお願い申し上げます。
それから、制度上の問題というのは、文科省ですら、振興局、研究畑と教育畑の間にかなりのギャップがあるということでございますが、橋爪参事官におかれましてはこのシンポジウムに全て御参加いただいて、しかも高等教育局とか初等中等教育局の方にも声をかけていただいてシンポジウムに出ていただく、こういう努力をしていただいております。今回のこの活動がかなりそういう制度上の壁を少し下げる役割も果たしているのではないかと私も個人的には思っております。喜連川先生、どうもありがとうございました。
ほかに何か御意見ございますでしょうか。伊藤先生、どうぞ。
【伊藤委員】 今の喜連川先生のコメントを受けて、同じような発言をしたいのですけれども、私もHPCI計画推進委員会の一員として申し上げてきたことは、とにかく科学技術、特に科学の発展に役に立つHPCIをつくるべきだということであって、実際に「富岳」にお金がそれなりについたのも、人文科学を含めた科学の発展に資するということで、それでそれだけのお金がついたので、あれだけのお金がついたおかげで結果として1位が取れたわけですし、しかも富士通がちょうど7ナノメートルという新しいテクノロジーノードを採用できるタイミングを上手につかんで、日本がデザインしたチップでそれだけのスパコンを作り上げたということはすばらしいことだと私も思っています。Summitとかは実際に自分たちではそれ専用のチップをデザインしていませんので、あらゆる意味で日本の力がある意味結集できたものができた。
しかも使いやすかったおかげで、Co-designという形でハードウェアとソフトウェアが使いやすい環境が整ったおかげで、今回、正式運用が始まる前からCOVID-19の計算もいろいろできるようになったということで、あらゆる意味で今回のこの「富岳」というのは、今後の科学の発展に対する結果が楽しみだと思っています。
もう一つ、喜連川委員がおっしゃった、遠隔医療、研究を支えるSINETということで、この委員会は、今後どうやって基盤を支えていくか、基盤をつくっていくかということを議論されると理解しています。遠隔教育、研究といったときにやっぱりこれから大切になっていくのは、クラウドベースのプログラミング技術だと私は何となく考えています。全て自分のところでプログラミングを行うというよりは、様々なものがクラウドでつながるということを前提としたプログラミング、システム設計をしていくといったときに、海外のGAFAも含めて強い企業がどんどん進めていくのですが、そこには多くのベンチャー企業が果敢に挑戦していくと思います。そこをベンチャー企業で国の振興をするということを鮮明に押し出すことが必要あるかどうかは置いておいても、そういうクラウドベースでプログラミングができていくというゲームチェンジングを、ルールが変わっていくというようなことに携わっていくようなことができる人を育てていくということと、そういうシステムをやっぱり国として基盤としてつくっていかなければいけないのかなというのを何となく私としては感じています。
以上です。
【安浦主査】 伊藤先生、貴重な御意見ありがとうございます。またこの後の議題3とも絡んでくると思いますので、またそちらのほうでも御意見をいただければと思います。

議題4 次世代学術情報ネットワーク・データ基盤整備作業部会の検討結果について
事務局から資料4-1,4-2,4-3,4-4、参考資料2を用いて報告を行った。質疑応答等は以下の通り。
【安浦主査】 ありがとうございました。後藤先生、何か補足とかございますでしょうか。
【後藤委員】 後藤でございます。まず、説明ありがとうございます。今回はNIIの合田先生、漆谷先生、山地先生に、ボリュームのある資料をまとめていただきまして、それに対して、基盤の専門家の先生、基盤を利用する立場の専門の先生方から忌憚のない意見を出していただくという形で進めてまいりました。
また、先ほどの説明にありましたように、コロナ問題のように昨今起こった事例を事務局の方にもフットワーク良く織り込んでもらいまして、実質2か月間程度だったのでございますが、幅広い議論ができたと思います。特にセキュリティの問題、それから、幅広く基盤を支える人材育成まで、基盤の周辺まで含めて議論できたことは良かったと思っております。
以上でございます。
【安浦主査】 後藤先生、どうもありがとうございました。異常な非常時の下で短期間に3回分会議を遠隔で行われたのだと思いますがやっていただきまして、こういうしっかりしたレポートをまとめていただきましたことを心から御礼申し上げます。どうもありがとうございました。
それでは、皆様方から御意見や御質問をいただきたいと思います。何かございますでしょうか。
田浦先生は何かありますか。
【田浦委員】 ありがとうございます。この作業部会の議論にも参加させていただきましたし、あとは、このNIIが進めている次世代研究プラットフォームについては、いろいろな場所で議論に参加させていただいて、東大だけではなくて全国の情報基盤センター群として大いに連携してやっていこうという、そういう話になっております。それをちょっとだけお伝えしたいかなと思っています。
この絵の中には描かれてはいないですけれども、この研究データ基盤というのが目指すところは、研究者にとって、公正管理とかそういう話もあるのですけれども、やはり利活用を進めると、そういうところが非常にポイントであります。NIIさんが作られようとしているGakuNin RDMというのでデータが簡単に検索できてというところまで、それで使えるというところまでお作りいただくという計画になっていますけれども、やはりその後の利用について非常に大きな計算資源が必要になるという話と、あとは、NIIさんのほうでもストレージを多く用意して、研究データを実際に蓄積できるようにはされていくと伺っていますが、全てのデータが1か所に集約するというのは現実的ではないので、また、もともとこのGakuNin RDMというのが分散したストレージを多く連携できると、そういうふうにデザインされていると聞いていますので、その辺のストレージ、全国の情報基盤センターがストレージを提供して、かつ見つかったデータをすぐに処理できる計算環境を提供すると、そういう形で日本全体が1つのクラウド環境、データ共有のためのクラウド環境にできる、かつ、それを処理できる高性能な計算機を持っていると、そういうビジョンに向かって一緒に連携させていただこうとしております。
それで、その第1弾としまして、今年度末にmdxというデータ活用のための特別な基盤が整備されようとしています。それはスーパーコンピュータにハードウェアとしては似ているのですけれども、環境はこれまでのものと大きく違っておりまして、クラウドベースになっています。それで、このGakuNin RDMと連携した計算基盤ということでその第1弾として使えるようにしていこうと思っております。
それでプログラミング環境も、これまでのスパコンではなくて、クラウドベースの、例えばデータのプラットフォームを分野ごとに作りたいといった、そういった用途にも使えて、使うときにも、まず最初にはデータが見つかったものをクラウドベースのウェブインターフェースみたいな感じで処理できるという、そういうところから始められるというようなことを目指しておりまして、先ほどちょっと伊藤先生がおっしゃっていただいたようなクラウドベースのプログラミングに移行していくと、そういうようなこともこのmdxという計画でGakuNin RDMと連携しながら第一歩が切れればなと思っているところです。そこをちょっと御紹介させていただきたかったので、発言させていただきました。
【安浦主査】 田浦先生、どうもありがとうございます。ほかに何か御質問とかございますか。
【宅間室長】 喜連川先生が挙手いただいているようです。
【安浦主査】 よろしくお願いします。
【喜連川委員】 多分、今、田浦先生が御紹介いただいたみたいに、もうデータの世界に入る、つまり、データ駆動型の科学になり、データ駆動型の産業になり、データ駆動型の社会科学になるという非常に新しいウエーブの中で、日本の情報処理の研究者がみんな連携しながらそういうものをどうやって作っていくのかということを考えていくことが非常に重要じゃないかなと思っております。ここはもうゼロから始まる世界ですので。
コンピュータは、御案内のように3つしかコンポーネントがないのですね。3つというのは、計算をするというところと、今ここで言っているデータのように覚えるところと、それから、つなぐネットワークのところ、3つしかない。計算するスパコンというのは、新しいように見えるのですけれども、私が若き学生の頃からスパコンはある。安浦先生がもっと若い頃もスパコンがある。だから、このゲームは固定しています。ネットワークも1984年にTCP/IPがUNIXバンドリングされたという意味でいうと、それはそれなりに古いですね。ところが、記憶装置はあるとは言いながら、これほどデータが主役に躍り出てくるというのは新しい動きなものですから、ここをみんなで頑張ってつくっていくということが非常に重要だと思います。
そのときに、ぜひこれ文科省さんにお願いしたいのは、田浦先生が、NIIがたくさんストレージを持つと申されたのですけれども、それは今のところよく分からないのですけれども、要するに、ストレージの調達の仕方を工夫する必要があるということがとても重要です。東大の基盤センターが買うストレージも、名古屋大学も阪大も東北大学も、あるいは理研もNIMSも、そういうストレージの、つまり、GakuNin RDMの配下に入るようなストレージというのは、1本の調達でやるべきですね。お金はそれぞれの機関が持っていていい。
しかし、調達の交渉力は圧倒的にでかいものにすると、値段的には半分以下にはなると思います。これをやっているのがグーグルのYouTubeのODMみたいなものです。それをやらなかったのが何なのかというと、実はジャーナル問題です。各大学が一個一個Elsevierと契約するから、だから、ばかみたいに高くなっている。ナショナルライセンスに持っていけなかった。この轍を二度と踏まないようにしないといけないです。
これは非常に大きなゲームを賭けることになりますから、この委員会で御賛同はいただく必要があるわけですけれども、動かし方はちょっと、研究者の先生方の中ではなかなかしんどいかもしれないですけれども、ここが肝になるというところを皆さんと共有できればと思いながら発言させていただきました。
以上です。
【安浦主査】 喜連川先生、どうもありがとうございました。資料4-3の裏側に図がございますけれども、その図の一番上に矢印が、SINET5と書いて、その次がSINET6とは書いていないわけですね。次世代学術研究プラットフォームと書いてあるのは極めて大きな意味があります。下の日本地図が、左側は日本地図が大きくて、上に小さいデータ基盤というのがのっていますけれども、右側は、地図よりもその上にのっかっているデータ基盤というほうが大きいと。これが本質的に今回の話はネットワークを、SINET5を次のネットワークにする話ではないという点が今、喜連川先生も御指摘いただいた一番のポイントかと思います。
それで、私のほうから後藤先生あるいは田浦先生に質問させていただきたいのですけれども、今の喜連川先生の御意見にもありましたように、国全体として、今当面の概算要求でやろうとしていることと、各大学あるいはオープンサイエンスという意味では図書館もある程度の役割を果たさざるを得ないというふうに捉えている大学図書館も多いと思いますけれども、各大学の図書館や大学自身がやるべき部分、そこのインターフェースというのは、この作業部会ではどういうふうに議論されて将来像として描かれたのかということをお伺いしたいのですけれども。
【後藤委員】 後藤でございます。今、安浦先生がおっしゃったポイントは、非常に大事なポイントとして作業部会でも議論になりました。実際、各大学の立場の固有の状況もございますし、そういうものと全体のものをどうすり合わせていくかというところに関しては重要性を確認しました。
ただ、まだその中身をどうすり合わせていくかの具体的なところは今後の課題という認識でおります。特にデータ基盤の活用に関しましては相当盛り上がって議論されまして、その中ではいわゆるキュレーター、図書館の方など、いわゆる情報の扱い方を支援してくださる人材の必要性に関して各大学からも意見が出ましたし、NIIの山地先生からも御提案があって、これについて重点的に今後考えていく必要があるというところで提言をまとめさせていただいている状況でございます。
田浦先生、何かあったら補足お願いいたします。
【田浦委員】 大丈夫です。
【安浦主査】 どうもありがとうございます。今、後藤先生のお話にありましたように、オープンサイエンス、最初に言われたときには、データを保存するのは研究者の責任であり、その基盤を用意するのは大学等の研究機関の役割であり、そして、それを閲覧できるようにするのは図書館の役割であるというような、そういう文書も出ておりましたけれども、そういう視点で見たときに、それぞれの大学で個々の議論をし始めると、先ほどの喜連川先生おっしゃったようにジャーナルの問題と同じような話になってしまいかねないので、そこをどうするかというのはかなり真剣にやらないと、もう一回日本の大学は疲弊する種をここで背負ってしまうことになりかねないので、ぜひそうならないような方向を御提案、御議論頂きたい。この委員会でもいろいろ意見を言っていただいて、最終的にはいろいろな、もっと上のレベルあるいは政治的なレベルでの解決が必要なのかもしれませんけれども、少なくとも科学技術を支えるためのベースとしてはこうあるべしというところをこの委員会では出したいと私も思っておるところでございます。
何かほかの先生方、今の問題以外でも結構ですので、御質問、御意見ございますでしょうか。では、後藤先生。
【後藤委員】 後藤でございます。今の件について1つ追加でございます。作業部会のほうでは、より効果的なデータの扱い方をサポートする、そういう仕組みを広く大学間でも共有していく必要があると同時に、データの安全性、いわゆるセキュリティ面でも、単独の大学でセキュリティに取り組むだけでは大学間でデータが共有される環境においては価値が出ませんので、幅広く日本全体としてデータの安全性・確実性、それをどう担保していくのかというところも大事だという議論が出ました。
社会的な価値が高まれば高まるほど、残念ながら必ずサイバー攻撃者は狙ってくるというのが世の中の常でございますので、次世代基盤の価値を高めていくときには、並行してセキュリティに関して、特にデータの安全な扱いに関しても、広く共通で考えていかなければいけない重要な課題だと思っております。
以上でございます。
【安浦主査】 ありがとうございます。そのほか何か御質問あるいは御意見ございますでしょうか。では、喜連川先生。
【喜連川委員】 今の後藤先生のおっしゃるところはかなり深刻でございまして、セキュリティに関しましては、あまりここで申し上げると文科省さんから怒られてしまう可能性があるのですが、NIIでは、国立大学を中心にセキュリティの運用を御支援するというのを一応つつがなく行うことができております。それを見て、私立大学さんもとか、あるいは他省の研究所さんもというのでお申込み、文科省外の研究所も守ってくれというようなことを随分御依頼をいただいているところですが、やはり予算が極めてタイトな中でなかなかそこまで行っていないところが大変もどかしく感じております。
このたびアメリカのポンペオさんがファーウェイ問題をはっきり明言されて、エリック・シュミットもそれに呼応した発言をしているのを皆さんもお聞きになったと思いますけれども、相当強固なブロッケージをどうやってつくるのかというのは1つの研究ではもはやいかないような状況になっておりますので、サイバーセキュリティの人材育成をNIIは随分頑張ろうとして今までここまではやってきているのですけれども、後藤先生おっしゃるように、もっともっと加速しないと間に合わないですね、正直言いまして。
この点に関しては、この委員会で取り上げるのが妥当なのかどうか判りかねますが、ただ、デジタルというのはだんだん自然に話題が広がってしまうのでややこしいところがあり、先ほどおっしゃられた、データをどううまく使うかというような側面、使うための法整備をどうすればいいかという側面、そして、使おうと思っても、盗まれてしまっていることがもう前提になるようなことが絶対ないようにするためにはどうすればいいか。結構データを真ん中に置きますといろいろな課題が出てきまして、こういうものに対してちょっとホリスティックに俯瞰しながら議論するようなオポチュニティというか場がやっぱり相当喫緊重要になるのではないのかなというのが、私どもNIIとしての印象、喜連川としての印象でございます。
以上です。
【安浦主査】 どうもありがとうございました。喜連川先生のほうで今おっしゃったような話は、学術会議とかいわゆるもう少し純粋な研究ソサエティのほうで議論をされる場はお持ちになっているのでしょうか。
【喜連川委員】 だから、ちょっとばらばらなんですね。部分的にはございまして、私どももたしか6月3日に、先生にもシンポジウムには御講演を賜ったということで御記憶いただいているかと思いますけれども、学術会議としましては1つの提言を、十分かどうかと言われても、20ページという限られたページ数ではありますが、発出をさせていただきました。
その中で、一番重要なことはガバナンスであるというようなところまでは言えていると思うのですけれども、今、後藤先生がおっしゃられたようなことというのが、EDRも含めて最近すごく深刻になってきているセキュリティ問題について、中心に議論する場というのは、これは後藤先生にやってもらわないといけないのですけれども、他人に押しつけるといけないのですが、やっぱりデータを中心にそういうものも俯瞰的に議論する場があるかという観点でいうと、今のところ、そこまでの場はないのではというのが私の印象です。先ほど言いましたように、データ駆動でこれから進むとなると、そういうものも含めた全体の意識を正確に把握する場といいますか、不具合が出てこないような議論の場が必要だと思います。
【安浦主査】 どうもありがとうございます。今喜連川先生がおっしゃった提言というのは、日本学術会議のほうから出ていますオープンサイエンスに関する提言です。喜連川先生が中心におまとめいただいたものでございますけれども、こちらも今日の議論と非常に深く関わっておりますので、ぜひ皆さんも一度、学術会議のホームページから取れますし、できたら事務局のほうから皆さんにURLを送っていただければ助かりますけれども、ちょっと目を通していただいておいたほうがいいのではないかと思います。
データをお使いになっている委員の先生方、膨大なデータを実際に扱っておられる委員の先生おられると思いますけれども、何か御意見等ございますでしょうか。
では、中野先生、お願いします。
【中野委員】 中野です。データを使うという立場で見ると、実はデータというのは、ある時点においては1つの固まったものですけれども、時間的な収集を行うと、図書館の本と同じようにどんどん変化をしていくのですね。変化したときのセキュリティと変化ってすごく微妙な世界ですけれども、ぜひキュレーターというのですかね、データを管理するときにパーシステントなデータの集め方とは一体何なのか、時間による変化は一体どういうものなのかということについて、やはり今度の次世代研究基盤で御検討いただくと、COVIDで分かったように、過去のデータを集めていて使える場合もあれば、急に変わってしまうときもあると。そのとき、データのトラスティ、セキュリティの安心・安全の上にまだ信頼という別のトラスティという観点があると考えておりまして、ぜひ次世代の研究基盤ではその辺りの、つまり、人間の社会が変化するのを多分公文書とかの記録館ではずっと捉えていると思うのですけれども、やっぱりデータドリブンの社会においてデータの変化はどうやって捉えるのかということに関しては何か御検討をしていただき、喜連川先生が何か、データ中心にされたときにはやはりその見方を変えなくてはいけないというところに対して、何か次の一歩を考えていただければと思います。
以上です。
【安浦主査】 ありがとうございます。キュレーターとか、データを扱う人、また、その人たちがプロフェッショナルとして仕事として成り立つ環境をどうつくっていくかという、そういう問題まで含めた、これ、結構大きな問題だと思います。
ほかに。藤井先生、何かございますか。
【藤井委員】 今のと関連しますと、やっぱり研究のほうでもデータをクラウドで共有して使うというような、大量のデータを共有して研究を進めるというようなこともあると思うのですけれども、どうしてもその分野に関する専門知識がないので、片手間でそういうところを勉強してやるというのが今現段階かなと思われるので、やっぱりそういったデータを活用する人の人材の確保であったり、教育であったり、そういったところを併せてやっていく必要があるかなと思います。
【安浦主査】 ありがとうございます。あと、産業界の委員の方、海野委員、山本委員、何かございますでしょうか。
【山本委員】 それでは、山本でございます。
【安浦主査】 山本委員、お願いいたします。
【山本委員】 挙手していなくてすみません。弊社で申し上げると、実は産業界自身があまりデータは持っていませんで、キュレーターも含めてですけれども、こういったデータをお持ちのユーザー側、本当に事業をやっている皆様方からデータをどう引き出していくか、それをどううまく流通させていくかというところが非常に重たい問題でして、今回こういった基盤を御検討いただく中で、そういった研究のデータ以外の様々、産業界側もあるデータもうまくこういった基盤の上にのっかって、社会的に役に立つ形にするにはどうしたらいいかといったあたりも議論の対象にしていただけると、とても前に進むのではないかなと思いました。
以上です。
【安浦主査】 どうもありがとうございます。世の中全体がデジタルのサイバー社会の上で動いておりまして、日々の我々の行動・活動、それ自身がある種のデータになって、いろいろな形で残されているということです。ただ、それがばらばらとあるだけでは意味をなさないのですけれども、ある意思を持って集めれば、何らかの意味を持ってくるという、そういう話から、自然界で気象のデータとか、地震のデータとか、膨大なデータが時々刻々集まっている。そういったデータまで非常に幅広い話がこの中には含まれているのではないかと思います。
この辺の議論を今後また整理いたしまして、この委員会で検討して、やはり次世代の我が国が持つべき学術研究を支える基盤としてどういうシステムを作るか。一方であまり時間がない話で、とにかく来年度予算には手を挙げないといけない制約もあります。ただ、それは今回後藤先生が中心にまとめていただいたものをベースに作文をして出すことになると思うのですけれども、その先にどういうものをこの国家として作っていくかという、そういう議論をぜひこの委員会では今後も続けたいと思いますので、ぜひいろいろなお立場から今後も御意見等いただければありがたいと思います。
ほかに御発言ございますでしょうか。海野委員、どうぞ。
【海野委員】 海野です。産業のほうからお話しさせていただきますと、例えばデータをためたりとかといったところに興味がある産業界の方ってやっぱりいらっしゃるのですけれども、どのようにためたらいいかとか、どのぐらいのデータをためたらいいのかというのがあまりよく分からないというような御相談をよく受けるのですね。
例えば全てのデータを全部ためてくださいと、こちらから、解析する側からいうと、あればあるほど、減らすのは後からできるので、ためてほしいのですけれども、どのような効果があるのか、メリットがあるのか分からない状態でためないといけないので、結局そんなにためていませんでしたとなってしまうと。鶏と卵みたいなところが結構あって、何に活用するのかが最初から分かっているのであれば、ある程度のデザインができるのですけれども、ためないと何ができるかも分からないし、でも、何も分からない状態で物すごい投資をして、例えばインフラをたくさんさせて、投資して取りあえずためるというのはやりづらいというような声もあるので、何かうまく低コストでうまくデータをためておくような、そこの通信路じゃないですけれども、そこのチャネルみたいなところも整備されるといいのかなというのはちょっと感じております。
【安浦主査】 どうもありがとうございます。ほかの手を挙げておられる方。相澤先生、どうぞ。
【相澤委員】 実際にデータを処理して、何がしかの研究をするという観点から見てみると、ネットワークがきちんとあり、データを入れる基盤があるということに加えて、やっぱりコンピュテーション、データを処理するところがどれだけ使いやすく提供されているかということもぜひ重視していただきたいと思っています。田浦先生の冒頭の話で、情報基盤センターがコンピュテーションの部分を提供するというような話も出ておりました。しかし、「ネットワーク・データ基盤整備」というタイトルとなると、コンピュテーションが抜けている部分がどうしても感じてしまうので、データとともに計算するという部分が必要かなと思います。
実際にクラウドで処理する場合も、データをためるのは安くて、計算のほうがはるかにコストがかかるというような状況でもあります。研究室あるいは幾つもの複合的な研究室チームで研究プロセスも含めてこの中で動かしていくというような、データを公開する以上に踏み込んだ形のプラットフォームにしていくためには、データを処理する人が使いやすいような仕掛けをぜひ重視してほしいと思っています。
あと、グローバルな相互運用ということもうたわれておりまして、それも重要なポイントと思っています。最終的に出来上がったデータがコミュニティで共有するときにどこに置くかということは、研究者側にとっては重要なポイントになります。外からもきちんとアクセスできる、国内だけの基盤にとどまらないというところは気を配っていただけたらと思います。
以上です。
【安浦主査】 ありがとうございました。インターオペラビリティあるいはデータを使いやすくするためのコンピュテーションの部分、この辺も考えるべきだという御意見かと思います。
ほかに手を挙げておられる方はいらっしゃいますか。合田先生、どうぞ。
【合田委員】 合田でございます。先ほどキュレーターの人材育成の話が出ましたので、我々のほうで検討しています話を簡単に御紹介させていただきたいと思います。
キュレーター、その人材不足というのは欧米でも言われているところで、我々としてもここについては、各組織がばらばらにやるのではなくて、連携する必要性を感じています。実はキュレーターに必要な技術というのは、扱うデータの分野によっても変わってきますので、そういったことを考えますと、分野ごとに組織間でキュレーターの人材ネットワークをうまく形成して、スキルやノウハウを共有できるような仕組みが出来ないかということを考えています。
また、我々のほうで既に研究データ管理のためのオンラインのコンテンツの作成を始めておりますので、そういった部分も強化しながら、日本全体で情報を共有しながら、キュレーターの人材のネットワークをつくっていければというような検討をしているところです。
以上です。
【安浦主査】 合田先生、どうもありがとうございました。ちょっともう予定の時間が来てしまいましたので、今日の議論はこれで打ち切りたいとは思いますが、ぜひ今日の議論の中でまだ言い足りなかったこととか、そういう御意見や御質問等がございましたら、メールで事務局のほうに御連絡いただきますと、皆様に共有させていただきたいと思っておりますので、よろしくお願いいたします。
概算要求のスケジュールというのは、これは決められていて、9月には正式に文科省の案が出来るわけでございますけれども、その中に反映できるものは反映させていただきたいと思いますし、この委員会としましては、来年度予算の先に一体日本の科学技術を支えるための次世代の、計算基盤とこの部会の名前はなっていますけれども、情報基盤を作るかを議論したいと思います。最初にも申し上げましたように、計算だけではなくて、通信とデータの蓄積及び活用をする場、これをバランスを取った形で、しかも全ての研究分野に使いやすい形で提供でき、かつ日本の国家予算にあまり負担をかけないで、電子ジャーナルのようにびっくりするようなお金を国外に払わないといけないというようなことをいかに避けるかという、結構重たい問題を今後も議論させていただきたいと思いますので、ぜひ御協力のほどよろしくお願い申し上げます。

最後に事務局より以下の事項について説明があった。
・本日の議論等で足りない部分があれば事務局までご連絡いただきたいこと。
・次回開催は10月ごろを想定、別途日程調整を行う予定であること。

安浦主査により閉会。