当サイトではJavaScriptを使用しております。ご利用のブラウザ環境によっては、機能が一部限定される場合があります。
ブラウザの設定でJavaScriptを有効にしていただくことにより、より快適にご利用いただけます。

次世代学術情報ネットワーク・データ基盤整備作業部会（第2回）議事録

1．日時

令和2年6月9日（火曜日）10時00分～12時00分

2．場所

オンライン会議にて開催

3．議題

次世代の学術情報ネットワークとデータ基盤整備のあり方について
その他

4．出席者

委員

（委員、臨時委員、専門委員）
後藤主査、田浦主査代理、辻委員、高橋委員、合田委員、漆谷委員、下條委員、棟朝委員、山口委員、山地委員、湯浅委員
（学術調査官）
黒橋科学官、竹房調査官、池内調査官

文部科学省

三宅学術基盤整備室長、土井参事官補佐

5．議事録

【後藤主査】おはようございます。時間になりましたので、ただいまから第2回次世代学術情報ネットワーク・データ基盤整備作業部会を開催いたします。
本日も第1回と同じくコロナウイルス感染防止のため、オンラインでの開催でございます。通信状態等において不具合が生じるなど続行が難しくなった場合には中断する可能性がございますので、あらかじめ御了承ください。
それでは最初に、議題1、次世代の学術情報ネットワークとデータ基盤整備の在り方について、まず事務局から説明をお願いいたします。
【土井参事官補佐】事務局でございます。前回第1回の作業部会では、国立情報学研究所（以下、NII）の合田委員及び漆谷委員から、次世代の学術情報ネットワークとデータ基盤整備の在り方について、全体構想とネットワーク基盤について御発表いただいて、その後、意見交換をいただいたところでございます。
本日第2回は、研究データ基盤について、NIIの山地委員から御発表いただく予定で御準備いただいております。
以上でございます。
【後藤主査】ありがとうございました。それでは、研究データ基盤について、NIIの山地先生、よろしくお願いいたします。山地先生、御準備はよろしいですか。
【山地委員】はい。画面が見えておりますでしょうか。
【後藤主査】はい、今見えました。大丈夫です。
それでは、山地の方から、次世代学術研究プラットフォームのデータ基盤の部分について御説明いたします。
30分の発表時間の中で、前半で背景の部分を説明します。スライド的にちょっと分量が多くなっているんですけれども、かいつまんで説明して、最後の今後の方向性について一番重点的に説明をいたします。
まず、データ基盤の位置付けについてです。去年G7がフランスで開催されまして、その配下にOpen Science Working Groupが設置されています。このワーキンググループは、ECと日本がチェアをしておりまして、ここでもresearch data infrastructureというのが取り上げられて議論されております。
国内においては、統合イノベーション戦略2019の中で、研究データ基盤の構築が重要であると同時に、それをムーンショットのような大型プロジェクトにも活用していくということが取り上げられています。
この研究データ基盤というのが一番下に書いております、管理、公開、検索という機能から成っております。
それをより具体的に示しましたのが、6ページ目のスライドです。我々は、この基盤をNII Research Data Cloudと呼んでおります。この右側の丸い絵は、研究データのライフサイクルを表しております。このライフサイクルに合わせて、管理と公開と検索の3つの基盤を今作っております。検索と公開に関しましては、今までNIIで構築してきた検索サービスであるCiNiiと、JAIRO Cloudという機関リポジトリクラウドサービスを、研究データにも使えるように機能拡張を進めております。今までNIIでは、公開されたコンテンツを扱うというサービスをメインにしてきたんですけれども、今回新しくチャレンジしているのがこの管理基盤です。これは研究データがまだ公開されていない、非公開の状態の情報を扱う新しい基盤です。
GakuNin RDMと呼んでいるんですけれども、管理基盤は、研究データを研究プロジェクトなどの単位で管理して、共同研究者と共有するという機能を軸に研究開発を進めております。我々NIIは、このアプリケーションを開発して運用します。このアプリケーションに最低限のストレージ領域は用意するんですけれども、各大学にお願いしているのは、組織としてのストレージを用意して、それをつないで使っていただくという役割分担を考えております。
研究開発を進めながら実証実験をここのところ実施してきました。現在19の大学につないでいただいて、実際使った上でのフィードバックを頂いて、それを研究開発、機能開発に回していくという作業を進めているところです。この3つの基盤ともですけれども、2020年の後半に運用に入る予定になっております。
この公開、検索、管理基盤、3つの基盤ともに、我々独自に開発しているのではなくて、国際協力の下で開発を進めています。公開基盤に関しましては、デジタルリポジトリの開発も有名なCERNと連携して共同開発をしております。検索基盤に関しましては、Horizon2020配下のプロジェクトでOpenAIREという検索システムを開発しているプロジェクトがあるんですけれども、そこと協力しています。新しいサービスとなる管理基盤に関しましては、アメリカのCenter for Open Scienceというところと協力しながら、機能の開発や連携を進めているところです。
それ以外の海外との連携なんですけれども、我々が作った管理基盤と公開基盤に関しましては、オープンソースソフトウェアとして提供しておりますので、アジア各国やアフリカ各国の方々に使ってもらえるような連携も同時に進めているところです。
日本では、NIIがResearch Data Cloudの開発を進めているのが現状ですが、海外でも国単位で、オープンサイエンスのための基盤の開発が進んでいます。典型的なのが、欧州のEuropean Open Science Cloudというものです。これは、これまで作ってきた個々のインフラ、FP7の頃から作ってきたものもあるのですが、それをうまく統合しながらオープンサイエンスのための広域なヨーロッパでのインフラを構築しようとするプロジェクトです。分野別のデータベースだけではなくて、ネットワークからHPCのレイヤー、また、それをつなぐための認証基盤とか、共有のプラットフォームの上に分野別のサービスを乗せて、先ほど紹介したOpenAIRE、ディスカバリーサービスはここにあるんですけれども、全体をパッケージとしてオープンサイエンスで活用するための基盤の開発が進んでおります。
こういった動きは、欧州のEuropean Open Science Cloudだけではなくて、オーストラリアやカナダ、韓国、最近ではマレーシアやアフリカでも、地域や国レベルでオープンサイエンスやデータ駆動型研究を推進する基盤が構築されてきております。
それぞれの地域や国で基盤が作られていますが、大枠のところではよく似た構造をしております。先ほど触れましたEuropean Open Science Cloudが採用しているように、ネットワークや認証フェデレーション、また、研究プロジェクトのグループを定義する、VOという仮想組織を作るプラットフォームに、クラウドの基盤や共通サービス、一番トップレイヤーとしては共通のディスカバリーサービスを備えるという全体構造がデファクトスタンダードとしてのアーキテクチャーとして言えると思います。
我々NIIではそれぞれに該当する基盤を持っておりますので、これらをうまく組み合わせながら、次世代のプラットフォームを作っていくというのが、今回の構想の一番大きなところになっております。
こうした背景の下で、先日学術会議でオープンサイエンスに関する提言が出されました。6月3日に学術フォーラムが開催されまして、そのフォーラムに合わせてこの提言が公開されました。これは提言の目次ですが、国内外の動向の後に、各学術分野におけるデータ駆動型研究あるいはオープンサイエンスの現状をまとめた後に、それらを更に推進していくためにはどういった基盤が必要かという構造になっております。
各研究分野からこの提言の中で基盤に求められるニーズをこのスライドではまとめています。全体を4つにまとめたのですが、ここで言われていることがどういうことかといいますと、既存のNII Research Data Cloudをできるだけ多くの大学や、あるいは学術分野に使ってもらえるような普及をする。それがそれぞれニーズにつながっていくんですが、普及をしつつ、それに加えて先進的な機能の開発をしていく必要があるという内容になっております。
その先進的な機能の開発はどういったものかというのを具体的に受けているのが、この国際動向のところでまとめられています。続くスライドは、学術会議の提言をまとめるために調査した結果を詳しくまとめたものです。
簡単に言いますと、これは欧州の大学でこういったことが起こっているという例なんですけれども、図書館や基盤センターが連携して、この円形の部分は私が冒頭でNII Research Data Cloudの紹介で使いました研究データのライフサイクルを表しているのですが、このライフサイクルに沿って、図書館と基盤センターが連携して、サービスあるいは支援業務を提供するということが既に進んでおります。
それを実現するための基盤センターのサービスとしても、単なるデータを共有するための領域提供だけではなくて、そのデータをデータ駆動型研究にうまく使っていくための、例えば電子ラボノートのサービスの提供とか、データを解析するための基盤環境の提供とか、ワークフローエンジンの提供というのが先進大学では既に進んでいます。
こうした例がほかの大学でも同様に見られるのですが、システムの提供とともに、彼らが取り組んでいるのは、データセントリックサイエンスを進める上でのデータリテラシー向上のためのトレーニングの教材開発とか、その仕組みの提供です。
いま紹介したのは欧州の例なのですが、オーストラリアではちょっと違った観点からシステムの開発が進んでおりまして、それについても簡単に紹介したいと思います。DMPというのは、最近日本の研究費の助成機関でも要請されるようになったので皆さんお聞きになったことがあると思うんですけれども、研究データの管理計画、データマネジメントプランを表す言葉です。AMEDやNEDOやJSTだけではなくて、最近ではJSPSでも一部のプログラムで、このDMPの提出が求められるようになってきました。海外はもっと進んでいて、これを出すというのが必須の要件になりつつあります。
その研究データ管理の計画書を、研究公募の申請書を提出したり、研究を始めるとき作るだけではなくて、これを研究中にも随時改編しながら研究を進めていくための基盤の開発が大学レベルで進んでおります。
そういった基盤をうまく使うためのトレーニングコースとかリテラシー教育も進んでいます。別の大学の例では、例えば研究プロジェクトを始めるために、自分がプロジェクトでどういうデータを使うかを格付けした上でウェブインターフェースでの操作を進んでいくと、その研究に適切なストレージがあてがわれる。さらに、必要な情報を入力することによって、研究に必要な環境が簡単に構築されて、研究がスタートアップできるというような、システムが構築されております。これは私が見たところ、欧州や北米よりかは進んでいて、その機能がオーストラリアでは実際に利用されています。
ほかの大学でも同じようなシステムが構築されて、それと同時に、最近データ駆動型研究を進めるために、海外の大学で、Hacky Hourというのを設けて、そこで、統計学にたけた人とか、あるいはコンピュテーショナル何とかサイエンスをやっている人たちが学生やほかの研究者にデータ駆動型の研究を教えるというような、あるいはみんなで一緒にデータの扱い方を学ぶという時間を作るというのがはやっているんですけれども、こういった時間を提供するための組織も構築されていっております。
こういった海外の動向を見ますと、あるいは各分野で日本の中で要求されているリクエストやニーズを見ますと、まずは、ラボやプロジェクトで研究データを適切に共有できるような環境を提供してほしい。これは今作っておりますGakuNin RDMでも最低限できる機能提供になっております。これに加えまして、更に研究を支援するための高度な機能、あるいは研究校正やコンプライアンスに対応するための環境提供を、それを機械的にサポートするためのサービス、また、データ駆動型研究あるいはデータリテラシーを向上していくために必要な人材育成というのが、これがセットでなされることによって、新しい基盤の構築ができていくんだということを学術会議の提言にまとめております。提言はこの3つに分かれているんですけれども、この2つ目のところが基盤に関する内容です。
では、これを具体的にどのように次世代のプラットフォームで実現していくかというところを私なりに今後の方向性のところでまとめてみました。この図は新しく作る基盤の全体像を表しています。左のこの丸は、今作っているNII Research Data Cloudです。この基盤を次世代型にするために、管理基盤の機能をより促進していくというのを模式的に表したものです。
その具体的な方向性なんですけれども、A、B、Cの3つの柱から成っております。B、Cに関しましては、更にサブカテゴリーを分けて、どういったものを作っていく計画をしているかというのを説明したいと思います。
まずはAのところです。ここでは今作っているNII Research Data Cloudをうまく展開していくために、この研究者ID、IDというのはORCIDみたいなIDではなくて、認証連携のIDの意味なんですけれども、これを強化するとともに、認証方式の高度化をしながら、できるだけ多くの大学で我々の基盤を安心安全に使っていただくためのミドルウェアレイヤーの強化をしていきたいと思っております。これは学術だけではなくて、国際との連携、あるいは産業との連携というところにも注力しながら、どういった基盤ができるかというのを今構想しているところです。産業界でもID連携の仕組みをテスト的に学術と連携するという部分が作れそうですので、そういったところを強化しながら、できるだけ裾野の広い人々、研究者に我々の基盤を作っていこうと思っております。
実際にNII Research Data Cloudの利用促進に向けては、各組織におけるストレージの整備をしていきながら、それを我々のアプリケーションにつないでいただいてデプロイしていきます。これはある意味ボトムアップ的なアプローチになるんですけれども、それと同時に、少しセミトップダウン的なアプローチとして、ムーンショットのような大型プロジェクトで積極的に使っていただく。また、今後は各研究助成でDMPを提出するということが更に普及されてくることになると思われますが、そういった視点からも、NII Research Data Cloudを使って研究データ管理をするという必要性を問い掛けながら、基盤の大学や研究機関への利用促進につなげていきたいと思っています。
これは利用促進をしていくという話なのですが、Bの研究データ基盤の高度化、これは機能を開発していく必要があります。1つ目の研究公正に関しましては、現状のGakuNin RDMでもこういうデータがこの時点にあったという存在証明ができる最低限の機能は整えておりますので、それをうまく使いながら、研究者が何かあったときにも自分を守っていけるような、そういった使い方を普及できると思っております。
2以降に関しましては新しい機能になります。まずデータ駆動型研究を促進するための内容について説明したいと思います。これに関しましては、データをうまく公開してオープンサイエンスにつなげていくという機能とともに、その次の部分が高度化に関係してくるんですが、データの解析に必要なリソースをうまく提供できるような機能連携をしていくことを考えております。
冒頭でも研究データのライフサイクルに沿って、公開領域のコンテンツをカバーする公開基盤やCiNii、それらの先行研究を管理基盤に取り込んで再利用していくというのをイメージしながら基盤を構築している説明をしましたが、まだまだ再利用のところは現状の基盤だけではうまくできるものになっておりません。特に論文やデータ、プログラムというのが個別に提供されて、それを別の研究者が公開したものを取り込んだとしても、例えばプログラムや実行環境を作っていくのが大きな障壁になっていると思います。
こういったコンピュテーショナル何とかサイエンスとか、モデリングとか、ソースコードの再利用をうまく進めていくために考えている基盤の概略を表すのがこのスライドになっております。現在では、コンテナという非常に便利な技術がありますので、研究を進めている段階から研究公開のことも想定しながらプログラムや実行環境というのを1つまとめて管理する。それを公開するときには、ソースコードや環境構築情報やデータセットをパッケージにして公開基盤から公開する。それを後続の研究者が利用するときには、半自動的に環境が構築されて自分の研究に再利用できるような、そういった環境の構築を考えております。
この基盤を解析基盤と呼んでいるんですけれども、広い意味では研究成果の再現性を高めるための基盤でもあります。データ駆動型の研究にたけている分野だけではなくて、より裾野の広い研究分野にも使っていただけるようなそういった普及をNII Research Data Cloudを通して進めていくことによって、オープンサイエンスやデータ駆動型の促進につなげていきたいと考えております。
研究成果のパッケージというのは、データ駆動型の研究の促進と同時に、次に説明しますコンプライアンス対応にもうまく使える仕組みになります。それはどういうことかと申しますと、先ほども少し触れましたが、これから研究者が研究を進めるに当たっては、DMP、研究データ管理計画を作っていくというのが研究者としてやらなければならない1つの作業になってくると思われます。ただ、これを計画だけにとどめるのはもったいなくて、研究の進捗と同時にこのDMPをうまく活用しながら、研究の進捗状況とか、どういうふうに進めたかという情報を、うまく参照したり、随時見直したりしながら更新していくシステムの開発をしたいと思っています。ここではその機能をProgressive DMPと書いてあります。
DMPを随時見直しながら、あるいは必要であれば、基盤と連携しながら研究を支援するための情報にも使いながら、最後、研究成果を公開するときには、こういったパッケージとして公開したいというのは先ほど解析基盤で紹介した1つの例です。そういった情報もDMPの中に保存して、その研究がどういうふうに進められたかという、研究のマニフェストファイルを作るような、そういった基盤を構築するのがこのコンプライアンス対応のために必要ではないかと考えております。
研究の進捗と同時に、DMPの内容を更新すると同時に、これはオーストラリアの例のところでも紹介しましたように、研究を始めるときにもこのDMPを活用しながら、例えば必要なストレージが確保されているとか、必要な計算環境が半自動的にセットアップされるような、新しいコンプライアンス対応のための基盤が必要だと言えます。これは研究を促進するという側面でも意味があるのですが、例えばこのストレージというのは、個人情報を管理するときにはこういったストレージを使いましょうというコンプライアンス対応という意味でも利用価値があると考えております。
この研究パッケージの定義付けをDMPに関連付けるとか、あるいはデータの管理環境のセットアップとか、実際に解析環境をセットアップして、それをうまく使っていけるような、そういった基盤をコンプライアンス対応のために作っていくのはどうかと考えております。これはもう、DMPという計画の範囲を超えて、研究データの管理を進めていく上での情報を随時蓄積するという意味でDMR、Data Management Record-storeというふうに我々内部では呼んでいるですが、そういった基盤が必要ではないかと考えております。
最後、研究支援のところなのですが、ここでもコンプライアンス対応のところで説明しましたDMR基盤をうまく使うことによって、この4つ目の課題が克服できるというのを説明したいと思います。
まず海外の例なのですが、オーストラリアにおける研究データ管理基盤の中では、DMPをうまくプログレッシブに保存していくという例を紹介しました。オーストラリアでは、このDMPを研究者が使うだけではなくて、大学執行部も使っています。これはどういうことをしているかというと、例えば大学として、学部あるいは外部と共同研究がされているかとか、あるいは学部ごとでストレージはどのぐらい使われているかという費用対効果を計算したり、あるいはこういった研究をやっているんだったら、こういった共同研究をやればいいんじゃないかとアシストをリサーチオフィスがするような、そういった研究IRにも活用するというのが進んでおります。
右側は、ディスカバリーサービスでの例です。OpenAIREというのはHorizon2020配下のサービスなのですが、検索サービス自体は研究者に提供するサービスです。その裏のデータベースには、例えば研究の成果や人や組織や研究プロジェクトというのが密にリンクされた、Knowledge Baseと呼んでいるんですけれども、知識ベースが保存されています。これをうまく使いながら、エビデンスベースドなディシジョンメーキングができるような情報を例えば研究費の助成機関や大学の経営層に情報をフィードバックするサービスが始まっております。我々のディスカバリーサービスも単に検索の機能だけを提供するのではなくて、こういったエビデンスを大学にフィードバックすることによって、より意義のあるサービスになるのではないかと考えております。
それをまとめたスライドなんですけれども、例えばDMR基盤が集約するプロジェクトの情報とか、あるいはCiNii Researchがバックエンドに持つKnowledge Baseの情報をうまく使いながら、各研究組織が経営戦略を立てられるような、そういった基盤が今後は、海外の動向を見ておりましても、必要になってくるのではないかと考えております。
最後、Cの研究データの管理・公開支援者、これをどう育成していくかですけれども、データキュレーションというのが重要になってきます。データを取得して、研究を進めていく上で共有して公開していく過程のそれぞれで、データキュレーションを専門の人あるいは研究者自身が現在やっているのですが、これをうまくやらなければ、研究データ管理が進んでいきません。しかし、特に公開のところのデータキュレーション、公開して他人に使っていただくためにどういった情報を付加するかというのは、今まで研究者が経験しなかった新たな作業になります。
これをうまくサポートするための基盤と、こういった人材の確保が必要なのですが、公開のためのデータキュレーションの仕組みがアメリカでは既に構築されていて、オランダやカナダでも試行されています。このキュレーションのための仕組みなんですけれども、それぞれの大学でそれぞれの研究分野に必要なキュレーターを用意するのは難しいので、それを相互互恵的にネットワーク化して、公開のために必要なデータキュレーションやアノテーションをやったり、メタデータの高度化をサポートする仕組みを作っていくのはどうかというのが、このスライドにまとめているJapan Data Curation Networkというふうに呼んでいるんですけれども、仕組みです。
これは人的ネットワークや、あるいはキュレーションのためのワークフローを表した模式図なんですけれども、これを実現していく上では、ここに挙げたような5つの機能が必要になってきます。こういった機能をNIIとしては提供しながら、大学間あるいは共同利用機関なども含んだネットワークを作って、オープンサイエンスで使えるデータを公開していくためのキュレーションネットワークを作っていくというのは意義があるのではないかと考えております。
最後、そうしたキュレーターを育成するためにも、あるいは研究データ管理のためのリテラシーを向上していくためには、教材と教育環境が必要なんですけれども、これまでNIIでは、「オープンサイエンス時代の研究データ管理」というのと、左のここにあります、「研究データ管理サービスの設計と実践」という教材を作って、MOOCサイトとかNIIの学習管理システムから提供しています。まだ初歩的な内容なんですけれども、今後研究者向けの教材や、我々が作っている基盤をうまく使いながら研究データ管理をしていくという実務的な教材を作っていくことを計画しております。
それらを1つのコースとして提供するのではなくて、マイクロコンテンツ化して、必要な人に必要なコンピテンシーに合わせて教材を提供するような、そういった教育基盤を作っていくことを目指しています。セキュリティのラーニングでも、初めから終わりまで全部長い講義を聞かなきゃいけないという非常に苦痛を感じている方もいらっしゃると思うんですけれども、そういったアディショナルな教育に掛かる時間をできるだけスキルレベルに合わせて省力化あるいは短時間化するという基盤の構築が必要ではないかと思っております。
以上が学術会議の提言に合わせて、これを実現していく上でのどういった基盤が必要かというのを私なりにまとめたもので、このまとめのスライドの重点項目というところに書いています。皆さんに御議論いただきながら、こういったものが次世代プラットフォームに必要じゃないかというところの検討を進めていければと思っております。以上です。【後藤主査】ありがとうございました。それでは、これより山地先生から発表いただいた内容について、議論に入りたいと思います。恐れ入りますが、手を挙げる機能でまず意思表示をお願いしたいと思います。よろしいでしょうか。
きょうも先頭バッターは、下條先生、お願いいたします。
【下條委員】すみません。ありがとうございます。いつもしっかりやっていただいていて、こういう機能もやはりSINETと同時に欲しいとは思うんですけれども、特に研究環境基盤ですかね、39ページのB－2とか言われた辺り、解析基盤がというのは、実は我々基盤センターの仕事ともすごく関係があります。例えば東大の田浦先生がやられているデータ基盤だとか、それから、僕らはSociety5.0で少しそういう基盤も作りつつあるので、うまく我が国としてそういうものが取りまとめられると非常にいいのと、あと、国際的には、僕の知っているところだと、サンディエゴから始まったパシフィックリサーチプラットフォームだとか、ヨーロッパの連中も、要するに、元グリッドの人たちが結構その辺をやっているので、更に国際的な基盤にも発展させられるというので、そういうのもこういう学術基盤の中にちゃんと入れておいた方がいいんじゃないかと思います。
それからもう一つは、産学連携とか、やっぱりこの手の話って、あるいは研究評価だとか、そういうところにもつなげたいので、API連携を是非入れていただきたいと。つまり、ERPだとかその辺のシステムっていろいろなものがあるので、少なくともAPIがちゃんと出ていれば、うまく連携できるんじゃないかと思いました。
以上です。
【後藤主査】ありがとうございます。今の点、山地先生、何かありますか。
【山地委員】前回の会議のときに下條先生から、集中ではなく分散の投資も必要だというコメントを頂いていたんですけれども、先ほどのコメントもそれに関連するなと思いながら聞いていました。我々もNIIがコンピューティングリソースを提供するのではなくて、うまく大学や共同機関のリソースにユーザーを、ブローカリングすると言ったらちょっと言葉を悪く取られると嫌なんですけれども、リソースを使っていただけるような、そういったアプリケーションレイヤーのサービスを作っていくというのを主眼に置いております。
2つ目のAPI連携なんですけれども、現状では、これが十分できていないところもあります。例えば公開基盤、機関リポジトリも、大学の業績管理システムともっと密に連携するとか、我々がやらなければならない課題も残っております。そういったところから進めながら、NIIの基盤だけで全てが何かできるという考えは持っておりませんので、大学が独自に開発するものとか、あるいは調達しているものとのデータ連携がうまくできるような仕組みも考えていきたいと思っています。【後藤主査】ありがとうございます。
【下條委員】 1個だけちょっと。ユーザーと言われたときに、これはSINETも同じなんですけれども、要は、非常に多数のユーザーという一般的な人と、それから、例えば我々のスパコンだとか高エネだとか非常に大規模なデータだとかを扱いたがる大きなユーザーと2種類あって、ここのハンドリングはすごい難しいと思うんですけれども、やっぱりうまくやっていただきたいなと思います。
【山地委員】ありがとうございます。
【後藤主査】そのとおりですね。
次、いかがでございましょう。それでは、辻委員、お願いいたします。
【辻委員】辻でございます。どうも説明ありがとうございました。1点お聞かせ願いたいんですけれども、オーストラリアでDMPが非常に進んでいるという御説明があったわけなんですけれども、何でオーストラリアで先んじてDMPがうまくいっているのか、そこのところの主な要因や、参考にできるような施策とか、あるいは何か制度とか、そういったものがもしあるのであれば、何かこれからの日本の中でも進めていくいい参考になるのではないかなと思いまして、お聞かせいただければと思います。よろしくお願いします。
【後藤主査】山地先生、いかがでしょうか。
【山地委員】オーストラリアの例なんですけれども、オーストラリアでは、研究費の助成機関から求められるDMPの要件というのはそんなに細かいものではありません。なのですが、政府から、研究データをきちんと管理しなさいというお達しが各高等教育機関とか研究機関になされていて、そこがベースになって、各大学で独自に大学間連携しながらこういったシステムを、それが大学評価にもつながるということで作っていっているという背景があると聞いております。
トップダウンがいいのかというのはまたそれは難しいところではあるんですけれども、オープンサイエンスのための基盤として、研究者が研究を促進するためにいいものを作っていくというのを、我々は常に第一義的な目的としてやっていきたいんですけれども、例えばオープンアクセスの議論でもそうなんですが、それは研究促進のためにいいと分かっていてもなかなか研究者の理解が及ぶには時間が掛かることもありますので、トップダウンとボトムアップをうまく混ぜ合わせながら基盤の普及が進んで、最後には、それが研究者にとって意義があるものというふうに思ってもらえるようなサービスになってくるといいなという思いはあります。
【後藤主査】どうでしょう。
【辻委員】どうもありがとうございます。できるだけ広く、やっぱりある程度広まらないと、実際のところ、双方のメリットを見いだしていけないという側面もあろうかと思いますので、是非うまくトップダウンとボトムアップ両面から攻めていっていただければと思いました。ありがとうございました。
【後藤主査】今の件、追加で私もお聞きしたいんですが、オーストラリアの例の場合、何年ぐらい掛けてこのシステムが普及してきたというか、育ってきたという、そういう時間軸の情報はございますか。DMPを始めて成果が見えてくるまでの掛かった期間とか、山地先生、いかがでしょうか。
【山地委員】オーストラリアはこのシステム自体が具体的に開発されてきたのはここ3、4年なんですけれども、これは各国、オーストラリアだけじゃなくてほかの国でも言えることなんですが、Eサイエンスと呼ばれ始めた時代、2010年から14年ぐらいにかけてからEサイエンスとかデータセントリックサイエンスという言葉がより普及してきたんですけれども、その時点からやっぱり大学執行部としてデータサイエンスとか、あるいはリサーチデータマネジメント、研究データを管理するということ自体が、大学のブランディングに直結していくんだということをいち早く察知して、そこに大学内での投資も始まっているというのが、もうそこで何となく日本はいつも10年ビハインドになるんですけれども、そういったところからフィロソフィーが伝わると同時に基盤の準備が最近より加速化してきたという現状があるんじゃないかなと思います。
【後藤主査】一朝一夕にはいかないという感じでしょうか。分かりました。
それでは次、棟朝先生、お願いします。
【棟朝委員】棟朝です。研究データマネジメントの件、重要な取組ということで今後推進していただければと思います。
私から1点ですけれども、ちょっと気になっておりますのは、実際の実験機器等からデータをどういうふうにこの基盤に取得するのかというところで、特に最近、コロナウイルスの関係でなかなか実験がしにくくなっていて、機器の遠隔化とか自動化といったことで今、公募等も走っているというふうには聞いております。
そのような場合に、例えば北大の場合は、北大のクラウドといわゆる北大のグローバルファシリティセンターという実験機器の共用センターとの間で連携して、クラウドで実験機器の予約をして、データを取得して、そのデータをクラウド上に上げるというところを進めたいなというところで、予約ぐらいまでは出来ているんです。データが実験機器から上がってきますというときに、自動的に例えば管理基盤の方にアップロードをするとか、遠隔で操作する、完全な自動化が難しい場合でも、例えばグローバルファシリティセンターに研究支援者がおりますので、研究支援者の人がデータを取得して、セキュアに研究者に渡すといったようなデータのセキュアな流れと自動化・遠隔化ということが非常に重要になってくるかと思いますけれども、このようなことについて、今後対応の予定といいますか、どういうふうに対応していけばいいのかというところでお伺いしたいと思います。よろしくお願いいたします。
【後藤主査】今の件、山地先生、いかがでしょうか。
【山地委員】棟朝先生は御存じだと思うんですけれども、まだそこのところがうまく準備できていなくて、我々も例えばGlobusみたいなグリッドのところで培われた技術なんかをうまく使いながら、我々の管理基盤は、今、フロントチャネルというか、ウェブユーザーインターフェースだけなんですけれども、バックチャネルからデータを呼び込んでいくという機能は必要だよねという議論は常にしております。
その機能提供がまだ出来ていないんですけれども、ただ、そうこうしているうちに、面白い取組は、先ほど棟朝先生から紹介があった、組織でオンプレのストレージを用意する意義がそこにあるんじゃないかと考えております。我々はまだ実証実験の段階なんですけれども、研究データ管理基盤を幾つかのプロジェクトでも使っていただいていて、北大のストレージをこの管理基盤につないでいただいている。それが北大の先生が関係する、生理研の先生にも見えるようになっていて、そこでデータをやり取りしながら、ストレージが北大のストレージなので、その北大の先生は、データ、実験装置の話ではないんですけれども、そのストレージがつながっているコンピューティングリソースとも簡便にデータをやり取りして、他のサービスとの連携ができているという例があります。
今のはコンピューティングリソースとデータをつなげる、そのデータを管理基盤とつなげるというところのイグザンプルなんですけれども、同じような流れで、大学で用意したストレージ、それが大学の中の人が使っている実験装置とうまくつながっている。そこで自動的にバックチャネルからデータが入ってくる。それを場合によっては我々の管理基盤からマネジメントするという利用の仕方が1つあるのではないかなと。それを促進するために、各大学で共通して使っていけるようなミドルウェアというのは、先進的に取り入れられている大学の方々と今一緒に連携しながら作っていく。それを提供して1つのグッドプラクティスにしていくというのはありじゃないかなと考えました。
以上です。
【棟朝委員】どうもありがとうございました。まずは管理基盤やクラウドのストレージにデータを上げていただくというのが非常に重要だと思いますので、引き続きよろしくお願いいたします。どうもありがとうございます。
【後藤主査】それでは、田浦先生、お願いします。
【田浦委員】ありがとうございます。非常に夢のあるビジョンで、是非こうなったらいいと思うんですけれども、でも、本当に起こるかどうかがきっと問題だと思うんですね。いろいろな研究データとかコードが全てこの基盤のシステムの上にアベイラブルになって、新しいデータのディスカバリーが起きてみたいな、それはビジョンはすごくいいんですけれども、本当にそれが研究者に浸透するかどうかというところがキーだと思うんです。
そうなってほしいが故にあえて聞きたいんですけれども、やっぱりこの手のものは、研究者の生産性を落とさないようにやるというか、もうちょっと卑近な言葉で言うと、これまでやってきた、生産性が高いとそれぞれ信じているやり方を、何かとにかく無理やり、あしたからはこれを使うんだと言って全員にやらせても、なかなか実現しないというか採用されないというところで、不正防止のために必ずやらなきゃいけない部分というのはあると思うんですけれども、でも、それは絶対やらなきゃいけないから仕方なくやるかというレベルで終わってしまうのか、それとも、研究者の本当の日常、研究の手法にこれが広く浸透していって、自然に次のディスカバリーとか新しい連携が起きるようにするかって、その差はすごく大きいと思うんですね。
なので、後者みたいなことが起こるために、どう言っていいか分からないんですけれども、研究者になるべく侵襲的でないというか、全部やり方変えなさいと言うんじゃなくて、自然にアダプトしていってもらえるような、何かそういう作戦とか、あるいは実は既に諸外国ではこんな感じで進んでいますみたいな、何かそういう話があったら是非教えていただきたいんです。
【山地委員】非常に難しい質問なんですけれども、我々が今まで経験してきたことは、ちょっとレイヤーが違う話なんですけれども、やっぱりこういう新しいサービスを提供するときって属人的なんですね。その属人的なる、NIIに代わってこのサービスをうまく活用して逆に普及につなげていってくれる人を、ケーススタディーを作っていくというのが今までやってきたことですので、それは大型プロジェクトなどを通して進めていきたいと思っております。そういったキラーパーソンがでてくると、影響力のある方がどんどん他の研究者にも広めていってくれるとか、NIIに代わって宣伝してくれるというわけじゃないんですけれども、そういった経験がありますので、同じようにこの管理基盤に関しましても、泥臭い話なんですけれども、NIIとして一つ一つケーススタディーを作っていくというやり方で進めていこうと思っています。
海外を見たときにこういった大学での基盤をうまく普及させる1つの肝なんですが、やっぱり教育に絡めて若い人に使っていただく機会をできるだけ作っていくというのはあるんじゃないかなと思います。データサイエンスの授業というのはいろいろなところで今立ち上げられておりますので、そういった授業で使っていただきながら、フリーミアムなサービスを利用するというところに流れるのではなくて、大学としてオーソライズしたサービスというのを使っていく。それはデータリテラシーとか情報リテラシー、両方の側面からなんですけれども、そういったところを若い人に便利に使ってというところの働き掛けもやっていこうと思います。
ただ、それをするためには、グーグルより便利なものが作れるのかという指摘をされるとなかなかそれにリターンするのは難しいところもあるんですけれども、セキュリティをうまく確保しながら使っていく、大学の資源を使っていくというところもアピールしながら、若い人に使っていただく機会を作っていきたいと思います。
以上です。
【田浦委員】ありがとうございます。
【後藤主査】アーリーアダプターの発掘が重要ということだと思います。
それでは、順番にですが、高橋委員、お願いいたします。
【高橋委員】高橋でございます。今、先生方からも御指摘がありましたけれども、やはりどういう方がこのシステムを使っていくかというのは非常に大事になるのではないかと私も思います。
41ページの自動再構築のためのシステムを、パッケージとして、つまり、ソースコードやデータセット、システムの環境情報も含めたパッケージとして提供するという考え方が重要になるのではないでしょうか。今のところ、ソースコードなどに対しては著作権の問題もあって、研究者自身が各々に管理をしています。また、進行中のプロジェクトでは、終了後はどう考えるのかということの検討を何度も繰り返さなくちゃならないし、そういうところに時間を費やしてもいる。このようなことが、公開や共有の前段階としてあると思いますので、それらのプロセスも踏まえて、今お話があったように大型プロジェクトの方々をユーザー対象とするというお話でしたから、それらの方々が御提案のシステムのユーザーとして具体的に想定して、開発し、広めていくかということが、かなり戦略的に重要であると思います。
是非、片手間でユーザーを見付けるというのではなくて、かなり力を入れてユーザーを引き付けながら、このシステム開発の流れを作っていただき、使う方の意見を十分取り入れるような形でシステムを構築していただきたい。よくありがちな、システムは出来上がったものの使う人がいない、ということになってしまわないように、お願いしたいと思います。そういうところに力を入れるのは非常に大変だというのはよくわかるのですが、かなり意識していただきたいという印象を持ちました。以上です。
【後藤主査】ありがとうございます。今の点、何か山地先生、ありますか。
【山地委員】ありがとうございます。大型プロジェクトというのはムーンショットプロジェクトのお話と関連していると思うんですけれども、やっぱりこういった、先生がおっしゃったような、何を公開して何を秘匿化するかという条件の設定だったりとか、このサービスをそのプロジェクトの中でうまく使っていただくためのコーディネーターというのを、研究開発と並行して用意するというのは、なかなかNIIでは今までやってこなかったところです。
私のオープンサイエンス基盤研究センターでは、広報・普及のための人間を1人雇用しています。それでもNIIの研究センターではこれまでなかったことなんですけれども、管理基盤のデプロイというのを大学と相談しながらしようとしているところなんですが、これは文科省の方々にも相談なんですけれども、人件費を開発費だけじゃなくてマネージングのためのお金とか、あるいはこれをうまくデプロイしていくために、ポリシーメーキングのところも含めてなんですけれども、そういったところに人件費をうまく割けるように、このプロジェクトを進めていきたいと考えております。ありがとうございます。
【高橋委員】いいでしょうか、1点付け加えさせていただいて。
【後藤主査】どうぞ。
【高橋委員】ムーンショットもよいのですけど、既に走っている、例えばSIPとか、それからCOIとか大きなプロジェクトは、実はプロジェクトが終わってからどこにプロジェクトで獲得されたデータをどこに置いて、管理運用するのか、ということはおそらく決まっていません。その課題をどうにかしなければならないという問題意識はあるのですが、具体的な解決策がないと聞き及んでいます。ほかのプロジェクトもそのような同様の状況があると思います。既に問題が顕在化しているところもあるようなので、是非前倒しをして、既に走っている大型プロジェクトを推進している方々の意見等々を吸い上げていただけると、更に早く、次につながるのではないかと思います。以上です。
【山地委員】ありがとうございます。
【後藤主査】ありがとうございます。
それでは、次、黒橋先生お願いします。
【黒橋科学官】京大の黒橋と申します。今回から文部科学官として参加させていただきます。ちょっと初めてで、まだ十分理解できていないところもあるかもしれませんが、よろしくお願いいたします。
先ほどの田浦先生のコメントに一番関係するかと思うんですけれども、私もどれぐらいユーザーがというか研究者がこういうことを利用していくかということが非常に重要かと思います。私は自然言語の分野で、比較的こういうデータを使って公開してという文科はあるんですけれども、一方で最近のニューラルで、本当に大規模なものを作らないと意味がないというところで、英語を中心としたリソースというのがあるんですけれども、ローカリティーがありますので、日本語のリソースを作るというのはなかなか難しいと。そういう中で、こういうデータをきちっと作って提供していくということをうまく評価していくということが本当に大事だと思うわけですが、お金の問題にやっぱりなるとは思うんですけれども、ユーザーというか研究者のインセンティブとして、例えばこういう形できちっとデータを提供した場合に、計算機サーバーの利用の割引みたいなものがつくとか、何かそういうインセンティブがあるといいんじゃないかなという気はするんですけれども、そういうあたりはこれまで御議論がありましたでしょうか。
計算機科学でも、こういうことをやってデータが使えるようになって、皆さんがどんどん使うということが目的でもあるとは思うんですが、そうなっていったときに、データを使うだけの人と頑張って作る人が出てきて、その作る人をしっかり評価して、かつこれをデータアップデートしていく。何かそういうサイクルが回るためには、やっぱりインセンティブが要るのかなと。将来的にはそれが非常に評価されるときが来るとは思うんですけれども、最初は少しそれを工夫する枠組みもあったらいいのかなと思って、ちょっとお伺いしました。よろしくお願いします。
【後藤主査】データのエコシステムだと思いますが、山地先生、いかがでしょうか。
【山地委員】我々はNIIとしては、基盤を作っていくと同時に、それをうまく使っていただくための環境整備についても考えていかなければいけないんですけれども、黒橋先生がおっしゃった、研究者がそれを使ったりとか、基盤を使うというよりもデータを公開して再利用のサイクルに乗せていくというところに対して、リワードを提供するかというのは、内閣府とか文科省の会議でも繰り返し議論はされているんですけれども、それに対して具体的な何かがまとめられるには至っていないというのが現状だと思います。
我々基盤屋ができることとしては、先ほどこのスライドで紹介したんですけれども、やっぱり研究者の評価指標として、単に論文の数だけではなくて、データを公開しても、そのデータがどのように使われたかとか、そのデータが次の論文にどう引用されたかという、ある意味スタティックな情報だけじゃなくて、新しいメトリックスとしてそれがどのぐらいの頻度でアクセスされたかとか、どういった社会的なインパクトをもたらしたかというのをCiNiiみたいな検索エンジンが持つナレッジベースというか、情報をうまく使いながら大学にフィードバックして、大学の人事とか評価に役立てていただくというのは、1つ考えられることじゃないかなと思いました。
そういったポリシーそのものを作っていくということは、NIIだけではなくて、ほかのもう少し大きな枠組みでやっていく必要があるんですけれども、何か研究者が積極的にデータを公開するというインセンティブを与える仕組みが必要だというのは、先生と同様に感じております。以上です。
【黒橋科学官】ありがとうございます。そういうふうに評価のサイクルがなっていくのは大変すばらしいと思うんですけれども、時間がかかると思いますので、本当ジャストアイデアですけれども、計算機サーバークーポン券みたいなのがあれば、最初は玉石混合でも、みんなが使い出せば何か始まるんじゃないかなという気もいたしまして。よろしくお願いいたします。
【後藤主査】ありがとうございます。
それでは、次、池内先生お願いします。
【池内学術調査官】
池内と申します。黒橋先生と同じく今年度から着任しましたので、どうぞよろしくお願いいたします。
ちょっと違う場所になるんですけれども、3つ目のデータ管理とか公開の支援者育成についてお伺いします。53ページあたりでしょうか。データ公開のキュレーションを担当する人材のプールとかの話があって、専門性を身に付けたキュレーターの方が全国の大学とか研究機関に来てくれるという構想だと思うんですけれども、それぞれの機関でそういった人を新たに育成するよりも、とても効率的で心強いというふうに考えられます。こういった人材の、例えばキャリアパスであったりとか、具体的な人材像、人物像みたいなものを検討していく必要があるかと思うんですけれども、何か海外の事例とか、山地先生の方でアイデアとかがあれば教えていただけないでしょうか。
【後藤主査】山地先生、いかがでしょうか。
【山地委員】この人材育成、今、特に大きなデータを扱うところはキュレーターというのを研究者が担ったりとか、支援者を持つというところもあるんですけれども、今、ほとんど日本にはない仕組みというか人材で、これをどうしていくかというのは、なかなか先が見えない部分であるというのは、皆さん思われているところなんじゃないかなと思います。
海外なんですけれども、海外はやっぱりリエゾンライブラリアンとか、あるいはサブジェクトライブラリアン、データライブラリアンという職種の方がいて、そういった方が、先ほども申したんですが、データ駆動型の研究というのが始まる中で、図書館の予算が2014年ぐらい、3年ぐらいから削られていたので、どういうふうに図書館がうまく立ち回っていくかということを議論して、これからはデータというところに図書館の業務を振らなければ、組織の中での維持が問われるんじゃないかというので、そういったところでキュレーター機能というのを各大学の図書館が持つようになってきているというのが現状です。
専門性を持つ図書館員というのは日本にはなくて、ジェネラリストとしての図書館員しかいないというのは皆さん御存じのとおりで、そこは大きなギャップです。これをどうしていくかというのは、具体的には解は現状ではないんですけれども、これは内閣府の議論の中であったんですが、当然図書館員の中でそういった専門性を持った人というのを、図書館員がオリジナルなのか、あるいはPh.D.を持った人がそういうキャリアパスを持つという仕組みを作っていくかというのもあるんですが、シニアな人材をうまくキュレーターとして活躍していただくというのも1つの見方としてあるんじゃないかという議論がありました。一番その分野でやっていることというのを包括的に理解している方々に、うまくキュレーションというところでの役割を演じてもらうというのは、1つの方法としてあるんじゃないかなというふうに思います。以上です。
【後藤主査】よろしいでしょうか。
【池内学術調査官】はい、ありがとうございました。私が実は専門が図書館情報学で、大学の司書課程などで、図書館員をエキスパートのキュレーターとして育成するということは、自分自身の課題としても考えております。シニアの方にそういった役割を担っていただくというアイデア、よく分かりました。ありがとうございました。
【後藤主査】では、続きまして、湯浅先生お願いします。
【湯浅委員】高エネルギー加速器研究機構の湯浅です。今もお話が出ているんですけれども、データをキュレートするキュレーターについての質問をしたいと思っておりました。
実はキュレーターをするのに専門性というのが大事で、研究者の中でキュレーターの役割をする人というのをどういうふうに育てる、維持する、これは持続性がないといけないと思います。研究の時間を少し割いて、キュレーターとして活動する人に対する、その人の持続性はどうするんだろうというふうに素朴に思いました。それについていろいろな皆様の御質疑の中で答えが何となく出ているなと思いまして、特にシニアな方を考えているというふうなお答えがありましたので、それについては非常にすばらしいと思いました。
ともすると、「計算機が分かっている。だから君、若いからやってよ。」というふうに、若い研究者の方に、今までの研究活動に加えてキュレーションの作業が追加されるというようなことがある。あるいは、キュレーターを行っていると、研究者としてのキャリアパスが少し遅くなるというようなことがあると、人がこれを喜ばないということになって、持続性に問題が生じると感じておりました。そしてキュレーターの技術は、多様性を持つデータを扱える人と専門的な分野及び狭い分野での尖ったデータをキュレートする人と、2つ方向があると思います。その人材育成について長いスパンで予算を用意していただいて、その成果が出てきたら、このシステムが非常に生きてくる環境になると考えました。ですので、今回のSINETの中、あるいはNIIの活動の中で閉じることなく、次の6年、更に次の数年というような計画になっていけるように、政府の方に希望を出し続けることがいいかと思いました。
もう既にお答えは頂いておりますので、コメントというふうにさせていただければと思います。
【後藤主査】ありがとうございます。やっぱり人材が一番時間とお金がかかるということで、10年計画でやるべきという御意見と解釈しました。
山地先生、何かございますか。よろしいですか。
【山地委員】先ほど1つ言い忘れたことがあるんですけれども、海外の研究プロジェクトでは、こういったキュレーターというのをプロジェクトの中で用意するということが1つのマンデートというか、義務ではないんですけれども、そういったプロジェクトの立て方というのが推奨されるという研究費の分配の仕方もあります。それは基盤屋ができることではないんですけれども、こういった情報もインプットしながら、包括的にキュレーター、支援人材の育成ということにつながればいいなと思います。
あと、更に大きくなっていくんですが、日本ではPh.D.持ちが論文書かなきゃPh.D.持ちでしかないという認識が強いんですけれども、海外はそうではなくて、Ph.D.持っていてもテクニシャンとして自分の、それはキャリアパスがあるからという背景もあるんですけれども、いろいろな生き方があって、Ph.D.持ちのダイバーシティというか、生き方としての多様性というのも必要になってくるんじゃないかなというふうに感じております。以上です。
【後藤主査】ありがとうございます。今、キュレーターに関して大分議論が盛り上がりましたけれども、私も51ページの図で御意見をお伺いしたいです。先ほど山地先生は、共有から公開へという、公開の仕方のところが結構ノウハウが必要で重要だと、重点を置いていらっしゃったんですが、その前に共有に持っていくところ、こちらのキュレーションの難しさをどう見ていらっしゃるのかなと。私は企業の経験が長かったのですが、産業界ではそう簡単に公開しないので、共有のレベルのデータ管理が企業では一番悩みでした。このあたりが難しいところであって、ID管理でも、ロールモデル等で非常に議論が盛んでありながら、なかなか発展しない、難しい、苦労しているところです。こういう研究者間で共有するときの共有の仕方、限定だけど共有というところについての力の入れ具合はいかがでございましょうか。
【山地委員】これはちょっと説明で抜けたところもあるんですけれども、取得から共有にいく部分という、より研究に近く深いところなので、より難しさが際立つ部分ではないかと思います。それは多分、後藤先生の感じていらっしゃることと同じじゃないかと思います。
基盤としてもうちょっと浅いレイヤーの話になるんですけれども、よく似たことは、企業の中だけではなくて、例えばラボの中でも、卒業するときに自分がやってきたことをうまく引き継ぐデータの受渡しとか、ラボの中での伝承というのは課題になっているとは思います。それに関しましては、管理基盤の中でDMPの機能ですね、これをうまく使いながら、どういった研究がその人によってどういうふうになされて、どういうふうにデータが保存されているかという、これはキュレーターというよりも、もうちょっとデータ管理の本質そのものなんですけれども、そういったところの情報を取りまとめながら、ほかの研究者とうまく共有していくような仕組みが作れるんじゃないかと思います。
我々としては、オープンサイエンスという流れの中で、管理基盤の紹介とかをするんですけれども、そこには企業の方々からも問合せを頂くことが幾つかあります。特に研究部門をしっかり持っていない中小の企業といっても、僕らから見ると大企業なんですけれども、そういったところでも研究データ管理というのは非常に課題になっているようでして、そこでこの基盤を直接的に我々のサービスを使っていただくということにはならないかもしれないんですけれども、基本的なノウハウとか、企業内でも間接的に我々はオープンソースでこのサービスを提供しておりますので、使っていただけるような、そういったコラボレーションができるかなと思っております。以上です。
【後藤主査】ありがとうございます。
ほかにいかがでございましょうか。じゃあ手が挙がらないので私からお伺いしたいんですが、先ほどからいわゆる先行的にこのシステムをリードしていただけるような、そういうプロジェクトとか、そういうチーム、人材が大事だということだと思うんですが、例えば分野の差による、違いにおける使い方の近いといいますか、私、セキュリティに関係しているもので、セキュリティはコンピューターサイエンスの人もいれば、法律の人もいれば、企業のリスクマネジメントの人もいて、文化が全く違う中で、データの共有とか情報の共有というところのコンセプトというか、リテラシーが違うので、全体で違う人同士でやるのが非常に苦労しております。このあたり、まずはよく分かっているコンピューターの人からやっていくんだ、いや、今の生命関係大事だし、コロナもあるから薬剤系でやっていくんだと、何か分野においての先行、アーリーアダプター候補の考え方ってございますか。
【山地委員】本当に尖った研究者というのはそれぞれ独自の環境を既にお持ちで、そういった方々からのノウハウを共有していくというのは非常に重要なんですけれども、それよりも少しミドルに落ちたところでのデプロイというのを、新しいサービスを始めるに当たってやっていくことで、1つの説得力のあるユースケースが作れるんじゃないかと思っています。
今、既にある程度説得力があるというのは、大型のプロジェクトだったりとか、ライフサイエンス系であったりを指しているんですけれども、それと同時に、人文学や社会科学の方々にも使っていただけるというのも並行して進めておりまして、NIIでサービスをするときに、やはりどのぐらいサービスを使っていただける方々を増やすと、これがうまくサービスが回っていくかというか、ビジネスモデルの構築までいけるかというのは想像しながらサービス設計していくんですが、ミドルの方だけではやっぱりスケールし切れないので、ITやコンピューターサイエンスから距離がある方々にも使っていただけるというのは並行して進めております。
ちょっとはっきりしない回答なんですけれども、僕の気持ちとしては、ミドルと、ちょっとロングテールに寄ったところを1つのカバーとしてケーススタディーを作っていければなと思っております。以上でございます。
【後藤主査】ありがとうございます。最初は専門家がいるコンピューターリテラシーの高い方がチームに入っているビッグプロジェクトから広げていくんだという印象を受けました。ありがとうございます。
それでは、田浦先生から手が挙がっていますので、田浦先生、お願いします。
【田浦委員】このシステムといろいろな大学のストレージがつながるというお話をしていただいたんですけれども、ちょうど我々も、山地先生も御存じとは思いますが、8大学とNIIと産総研で協力したmdxというシステムで、データのストレージと、それを処理するコンピューターリソースも併せて提供するという話を進めていますので、このGakuNin RDMとつなぐという話にはすごくぴったりはまるだろうなと思って楽しみにしています。
それでmdxの方は黒橋先生が途中でおっしゃっていたような、ストレージを提供するのに、やっぱりデータの中身に価値を見いだすというような課金モデルというか、すぐには課金はそもそもしないと思っていますけれども、将来的に今のスパコンの課金モデルと違うものは考えるというのは必須だなというふうに思っています。今、スパコンだとそもそもストレージはちょっと脇役ですけれども、でもいっぱいストレージはあるので、でもそこの課金モデルは基本的にこれだけ使ったらこれだけくださいというものなので、そこに置かれるデータの中身はほとんど関知していないというもので、この山地先生が描いていただいているような世界では、それはやっぱりナンセンスなので、ほかの研究者に使えるデータを提供してくださる方に対する、そういう利用料的な意味でのインセンティブも是非作っていこうと思っています。
あともう一つは、やっぱりこの基盤が人々を寄せつけてインパクトをもたらすために、データの連携が必要で、データがディスカバリーできて、かつそれが連携できるという。その基本ってやっぱり検索だと思うんですけど、データの本体がいろいろ分散しているというモデルの中で、検索って何がどこまでできるのか、する予定なのかというのをちょっとイメージが湧くように教えていただけると有り難いです。
【後藤主査】山地先生、よろしいですか。検索サービスですね。
【山地委員】検索のところなんですが、単純にはこの現状のCiNiiと同じように、キーワードを入力することによって、それにひも付いた研究成果が上がってくるというのが、安直なユーザーインターフェースなんですけれども、結果の提示の仕方が、ここはちょっと漠とした表現になるんですけれども、これまでのようにメタデータとしてキーワードにマッチしたものを出すだけではなくて、研究アクティビティーそのものが表現されるようなユーザーインターフェースというのを作っていきたいと思っています。
それを実現するためには、どういったエンティティー、論文とか研究データがどういうふうにリンクしているかとか、あるいはそれに関わる人がどういったコンテンツを生成していっているかというところも同時に表現して、安直に言うとそれをグラフ形式で表示するということになっちゃうんですけれども、そこは我々もまだ最終的なイメージが出来上がってないんですけれども、単純にグラフ表示をするのではなくて、シンプルな形で研究アクティビティーというのが表現される、そういった検索結果が提示できるような検索サービスというのを作っていこうと思っています。すみません、きちんと答えられなくて。
【田浦委員】すみません、文献の場合は、全部基本的にテキストなので、全文検索みたいなことはイメージしやすいんですけれども、データだと具体的にキーワードで引っかかる対象は何になるんですか。研究者が明示的に書いたメタデータの記述みたいなものに対する全文検索ということですか。
【山地委員】基本的には、安直にはそうです。安直にはそうなんですけれども、こういったジェネラルな検索基盤の中でも画像解析するというような、そういった取り組みは海外では進んでおりますので、OpenAIREでもそういった取組を裏で始めているようですので、そういった技術はちょっと連携していただきながら、効率的に時間かかる開発になると思いますので、効率的な機能の拡充というのをやっていこうと思っています。
【田浦委員】ありがとうございました。
【後藤主査】ありがとうございます。研究要素の非常に多い課題と認識しました。
ほか、まだ御発言なさっていない先生方、いかがでございましょうか。
では、私からお聞きしたいのですが。今の山地先生の御説明、研究テーマ的には面白いものが山ほどあり、その意味では、この取組自体がすばらしい研究プロジェクトになるなと思いました。逆に言うと途中でインセンティブとかの議論がございましたけれども、何かビジネス的に成り立つものを作って、産業界にアウトソースしてしまうとか、そんなような発想というのは、全体としてあるのでしょうか。途中のID管理のところで、「IDaaSを活用」とあったので、これは外部のものを使うのかなと思いながらお聞きしていました。何かビジネスでの取組があった場合に、それを活用しようという発想はあるのでしょうか。
【山地委員】それが最終的に大学にとってアフォーダブルなものになるのであれば、積極的にやっていきたいと思います。当然我々、情報学の人間として研究開発というところは非常に面白いので、そこを進めながらDevOpsしていくというのはやっていきたいところではあるんですけれども、外部にあるものはできるだけ使っていく。それは無料のものだけではなくて有料なものも、APIを介して全体連携するという仕組みは作っていこうと思います。SaaSを使うという場合もあると思うんですけれども、下條先生からの御指摘にもありましたように、既にいろいろな有償サービスというのを大学で使っている場合もありますので、そういったものをうまく連携しながらというのはスコープに入れております。
例えば、このGakuNin RDMでも、幾つかの大学ではオンプレでストレージを入れるんじゃなくて、ストレージサービスを、クラウドサービスを買って大学に提供しているというところもあります。そのサービスでもファイル共有はできますが、それにこのGakuNin RDMをあえてユーザーインターフェースにつなげることによって、デスクトップ連携もしながら、研究データ管理に関する特化した機能が更に使えるんじゃないかということで、そういった商用サービスとの連携を進めておりますので、このミドルレイヤーでPaaSを買ったりSaaSを買ったりということだけでなくて、アプリケーションレイヤーでも外部のサービス、商用サービスも含めてうまくつなげていくというのは忘れないように、常に意識に置いてやっていきたいと思っております。以上です。
【後藤主査】ありがとうございます。大体よろしいでしょうか。たくさん御意見、アイデアも出ましたし、山地先生も丁寧に回答いただきましてありがとうございます。
それでは、議題1については以上とさせていただきまして、大体時間ちょうどいいところでございますので、議題2の新規のまとめ骨子案についてに移りたいと思います。
まずは事務局から御説明をお願いいたします。
【土井参事官補佐】事務局でございます。ただいま、画面で資料2を共有させていただいておりますけれども、前回、今回のNII各委員からの御発表と、あとはその御発表に対して各委員からの頂いた御意見、これを次回に審議まとめという形で御提示をさせていただきたいと思っております。今回お示しさせていただいているのは、これまでのところで事務局の方で作成しました骨子案ですが、これについて御意見を頂ければと思っております。
内容を説明させていただきますと、まず「はじめに」で、冒頭何かしら記述をさせていただいた後に、2ポツとしまして、次世代の学術情報ネットワークとデータ基盤整備の必要性、（1）背景として、昨今、データ駆動型社会を迎えつつあること、ネットワーク基盤の超高速化とオープンサイエンスの実現に向けての本格基盤構築が世界的に加速化しているということ、あとは昨今の新型コロナウイルスの影響を受けまして、勤務体系や教育の関係でもいろいろな形で情報技術が非常に重要になってきていることから、学術情報ネットワーク、データ基盤がますます重要になっているということを書かせていただいてはどうかと考えております。
その後、（2）としましては、これまでこのネットワーク等々に係る政策提言についての内容を記載し、（3）で今、運用されているSINET5の現状と課題を記載することを考えております。
その次、3ポツ目としまして、海外の学術情報ネットワーク整備の状況ということで、次のページに移りますけれども、各国の主要な国内ネットワークについて、100Gbps回線から400Gbps以上の回線へ増速するような計画も進められている状況や主要なNRENの動向を記載したいと思っております。
その後、関連する技術動向についてということで、ネットワーク技術や研究データ基盤整備の世界的な動向。
また5ポツ目は、利用者からの要望ということで、ネットワーク基盤については、このトラフィックの急激な伸びに対応するため、どういうニーズがあるのか、SINETのデータセンターをどのように確保するか、5G技術の取組などへのニーズを書かせていただきたいと思っております。また、ここは研究データ基盤についても同様に、ニーズを書かせていただきたいと思っております。
次に6ポツ目としまして、やはり新型コロナウイルスの影響でもって、これまでと違った形での学術情報ネットワーク、または研究データ基盤の必要性というのは、新たな側面から出てきていると思っております。こちらについては、次回またNIIの先生方からのプレゼンをお願いしますとともに、何かしら記載ができればと思っております。
7ポツ目としまして、今後の次世代学術情報ネットワーク・データ基盤整備の方向性についてをまとめさせていただくというような形で、この作業部会の審議まとめを、次回提案させていただければと思っております。
説明は以上でございます。
【後藤主査】ありがとうございました。
それでは、本骨子案についての質疑に移りたいと思います。今、骨子案の御説明をいただいたところにありましたが、やはり新型コロナウイルス感染症問題といいますか、これで緊急事態が全面的に今は解除されておりますけれども、今後いつぶり返すか分からない。こういうことはいつあってもびっくりしない、そういう社会にならざるを得ないと思っておりまして、そういう意味でも学術情報ネットワークのデータ基盤の在り方についても、今後これを見据えたものであるべきだというところだと思っています。
また改めてNIIの方から発表いただく予定でございますが、そこへの期待も含めまして、御意見等、これは御自由に頂ければと思いますが、いかがでございましょうか。棟朝先生、お願いします。
【棟朝委員】北大の棟朝です。今後の期待ということで、特にコロナウイルスの関係で、例えば教育用で、前回も少しお話ししましたけれども、各大学のラーニングマネジメントシステム等が過負荷で非常に動きが悪くなったといったようなものがあったりとか、大規模な大学であれば、そういうようなものも対応できますけれども、中小規模の場合には、例えばMoodleとかのホスティングラインのサービスがあるとよいと。規模の経済で、マルチテナントでできればいいというようなことがありますし、前回のプレゼンの中にもあったかと思いますけれども、クラウドの活用基盤の方についてどのように進めていくかということで、少し御検討をお願いしたいと。
先ほど御説明いただいた、例えば研究のデータマネジメントでも、非常に裾野を広くするということを考えた場合には、現場レベルの研究室ですと、例えば共有のストレージがあって、研究成果の公開は、例えば研究室のホームページとか、研究プロジェクトのホームページを作っているといった場合に、例えば大規模な大学であれば、大学の方で、例えば北大の場合も共有ウェブの集約化のウェブサーバーがあったりとか、オンラインストレージがありますけれども、中小規模の大学や個別の細かな研究プロジェクトですと、まずホスティングのサービスから共有であるといいといったような、そういったようなものから、もちろん先ほどのマネジメントの枠でも一応できるのかもしれませんけれども、そのあたりの裾野を非常に広げるという意味で、クラウド基盤系の検討と、どこまで上のレイヤーまでサービスで対応するのかということについて御検討いただいて、議論させていただければと思います。よろしくお願いいたします。
【後藤主査】ありがとうございます。
それでは、下條先生、いかがでしょうか。
【下條委員】すみません、下條です。前回も今回も共通しているのは、やっぱりこれまでのハード一辺倒ではなくて、ソフトと人材に完全にシフトしていると思います。コロナの対応にしても、結局レジリエンスを達成するのはやっぱり人とソフトウェアなので、そういう意味では、例えば海外で結構頑張っていてみたいな話がきらびやかに見えるんですけれども、それができているのは、実はやっぱり人材がちゃんといて、それを支えているし、ソフトの開発もしているということをちゃんと捉えないと、やっぱり我が国はどうしてもハード一辺倒の投資が結構多くて、それで結局ソフトどうするんだという話になっちゃうので、是非人材という言葉を入れていただきたいなとは思います。
【後藤主査】ありがとうございます。
ほか、いかがでございましょうか。確かによくこれも産業界でBCPなんて言い方がありますよね。ビジネス・コンティニュイティー・プラン。これからはエデュケーショナル・コンティニュイティー・プラン、リサーチ・コンティニュイティー・プランだと思いますが。そういうときに、ハードの二重化だけでは何も意味なくて、チームや人材、マネジメント体制の二重化というのが重要になっているわけで、そういう発想をこういう中でどう取り入れていくのかというのは非常に大事なポイントだと思います。
ほかにいかがでございましょうか。ちょうど今、山口先生のお顔が見えたんですが、山口さん、まだ御発言なさっていないと思いますが、いかがですか。
【山口委員】東京大学の山口でございます。今年度からお世話になります。どうぞよろしくお願いします。
先ほどの質問に関しましては、ほとんど私が言いたいことはほかの先生方からコメントとして出てしまったので、ちょっと発言をためらってしまったんですけれども。皆さんから出たとおり、私もどのように利用率を上げていくかとか、より広範に皆さんに使っていただくためにはどうしたらいいのかという議論を、今後やはりもうちょっと中心的に議論をした方が、それを中心に議論をした方がいいのだと思います。
人材のことで1つ言わせていただくと、サービスのための人材みたいなものも、実は必要なのではないかと。困ったときにサポートする人材ですよね。もちろんソフトウェアの開発とか教育とかそういったことも大事なんですけれども、それ以上に、つまずいたときとか、いろんなことがあるはずで、そういったときに今、どこまで親切にこのシステムがやっているかというと、実はそこまでじゃない。私もいろいろな機会でSINETを使う機会はあるんですけれども、そのたびごとに割と親切とまでは言わないですけれども、ああ、聞きたいなと思ったときに手軽に聞ける仕組みが余りないということで、サポートに関しても少し考えた方がいいのではないかなと思いました。特にセキュリティ関連でされているサービスは、割とサポートが今後より広範にいろいろな形で必要なんじゃないかなと思っております。以上でございます。
【後藤主査】ありがとうございます。確かにサポートは大事なんですが、企業なんかで最初にコストを削減されるのはコールセンター、ヘルプデスクでございまして、こういうところを大学なんかでいかに維持していくのか、そこにちゃんと予算を割り当てるのかというのが非常に大きなポイントかと思いました。
それでは、池内先生、お願いいたします。
【池内学術調査官】山口先生の御発言とかなり被るんですけれども、やはり今日の山地先生の御発表でも、単なるデータの管理とか公開ではなくて、再利用をいかにするかということで、具体的にパッケージ化の話とかが出ていて、そこが非常に重要だと思いました。人材ですね、サポート人材の面で、やはり再利用の部分のところにも人材が、あるいは教材になるかもしれないんですけれども、そこまで公開する側が、これはこうやって使ってねというところまで整備するというのは、やはりちょっと手に余るというか、そこまではできないかなと思うので、何かうまく共通の教材なんかが作れるとよいなと思いました。
実際に、公開データを再利用してみて、研究者としては、「新しいこんなデータを使ったら自分の研究がこんなに進んだ」とか、「新しい知見が得られた」となると、「じゃあ自分も公開しようか」という、よい健全なサイクルができると思うので、その部分は非常に重要だと思っています。
私は、NISTEPというところで産官学の研究者の方に2年おきにアンケートをしているんですけれども、2016年にアンケートをした際に、今自分が論文に使っている分野、自分以外の分野で参考にする論文と、これから新しく使ってみたいデータの分野を聞いてみたところ、1,400名くらいの回答でアンケートレベルではあるんですけれども、やっぱり論文以上にいろいろな分野のデータに関心をお持ちでした。それは研究者としても分かるというか、多様な分野のデータがもし簡単に使えるならば使ってみたいというニーズはあると思います。だからこそ使いやすさというところにフォーカスして議論ができればと思っています。以上です。
【後藤主査】ありがとうございます。再利用できる、そういうノウハウを持った人に、高い評価というか、インセンティブが出るような仕組みが欲しいと思いました。
それでは、湯浅先生、お願いいたします。
【湯浅委員】高エネルギー加速器研究機構の湯浅です。今の資料2の5に、セキュリティ強化のためにという3行の文章が入っているかと思います。前回の議論で、セキュリティについてはちょっと別なところで議論するというようなお話を受けたかと思いますけれども、こちらにこれが入っているということ、まずそれでよろしいんでしょうか。もしそれでよろしければ、セキュリティについてはもう少し議論をしたい点もあるんですけれども、まず前提の、入ってよろしいのかどうかについてお教えいただけますでしょうか。
【後藤主査】これについては文科省さんですかね、今の段階でコメントいただきたいんですが。
【土井参事官補佐】セキュリティの関係ですけれども、まず資料2で書かせていただいたのは、前回頂いた御意見を基本的には書かせていただいたという整理でございます。セキュリティについてさらなる議論が必要であれば、次回、議論を深めさせていただいた上で、この審議まとめの方に、項目とかも検討させていただきながらまとめさせていただこうと思います。
【後藤主査】現状としては、これまで出た関連のコメントという意味で書いてあると。改めてやる場合ということ、これも大事は大事だと思うんですが、これはこの会議の中でやりますか。それともまた別に設けてやりますか。
【土井参事官補佐】この作業部会の中で、まずは御議論いただいた方がよろしいのかと思っております。
【後藤主査】次回、ちょっと時間が限られるかもしれませんけれども、是非案件として取り上げるということでよろしいでしょうか。
【湯浅委員】ありがとうございます。
【後藤主査】では次回、先ほどの新型コロナ対応の話と、このセキュリティの話を少し取り上げて、あと全体のまとめの議論をするということになるかと思うんですが、文科省さんもこれでよろしいですか。
【土井参事官補佐】はい。そのような方向で、調整をさせていただきたいと思います。
【後藤主査】はい、分かりました。湯浅先生、ありがとうございました。
ほか、いかがでございましょうか。既に大分次回に向けて宿題が出ておりますが。よろしいでしょうか。
それでは、大体取りまとめの骨子案についてのコメントも頂けたと思いますので、本日頂きました御意見については、事務局の方で整理させていただくという方向にしたいと思います。また次回、先ほどの骨子案の方については、これに加えて新型コロナ問題で明確になった課題への取組と言った方がいいかもしれませんね。それとあと、セキュリティの課題について、次回時間をとらせていただいて議論させていただくという形でいきたいと思います。
本日の議題は以上となりますが、事務局から連絡事項等あればお願いいたします。
【土井参事官補佐】次回第3回は、7月1日水曜日の10時から12時を予定してございます。場所は未定ということで、オンラインでの開催になるかどうかも含めて、改めて御連絡を差し上げたいと思っております。
また、本日の議事録については、事務局で案を作成しまして、委員の皆様に御確認をいただいた後、ホームページにて公開をさせていただきたいと思っておりますので、引き続き御協力をよろしくお願いいたします。以上でございます。
【後藤主査】ありがとうございました。まだ5分ぐらいありますが、大体議論も尽くしたと思いますので、これにて閉会とさせていただきたいと思います。本日はどうもありがとうございました。

お問合せ先

研究振興局参事官（情報担当）付学術基盤整備室

（研究振興局参事官（情報担当）付学術基盤整備室）