第9期学術情報委員会(第7回) 議事録

1.日時

平成30年2月1日(木曜日)14時00分~16時00分

2.場所

文部科学省3F1特別会議室

3.議題

  1. 電子化の進展を踏まえた学術情報流通基盤の整備と大学図書館機能の強化等について
  2. その他

4.出席者

委員

喜連川主査、引原主査代理、赤木委員、安藤委員、家委員、逸村委員、北森委員、五味委員、竹内委員、辻委員、永原委員、美馬委員

文部科学省

(事務局)磯谷研究振興局長、板倉大臣官房審議官(研究振興局担当)
原参事官(情報担当)、丸山学術基盤整備室長、玉井学術基盤整備室参事官補佐

オブザーバー

安達国立情報学研究所副所長、林科学技術・学術政策研究所上席研究官

5.議事録

【喜連川主査】    時間になりましたので、ただいまから、第7回学術情報委員会を開催いたしたいと思います。本日の委員会は、ペーパーレスにて行うこととしております。
  前回は、農業・食品産業技術総合研究機構(農研機構)の大澤先生に御講演を頂きまして、オープンサイエンスの推進のためのインセンティブについて、かなり具体的な議論ができたのではないかと思います。
  今回も、引き続きましてオープンサイエンス、特に基盤整備の観点から御議論をしていただければと思っております。現在、国立情報学研究所 (NII) の山地教授が取り組んでおられます、「オープンサイエンス推進のための研究データ基盤」の研究開発について御紹介を頂いた後、意見交換をお願いしたいと思います。山地先生、後ほど、よろしくお願いいたします。
  なお、本日も引き続きまして、科学技術・学術政策研究所の林上席研究官、国立情報学研究所の安達副所長に、オブザーバーとして御出席を頂いております。
  続きまして、事務局からお願いいたします。
【玉井学術基盤整備室参事官補佐】    引き続き、事務局の方から、資料の確認ということで、御連絡させていただきます。冒頭に主査から御発言がありましたけれども、本日の委員会はペーパーレスでの開催としております。お席に資料閲覧用の端末を御用意しておりますので、こちらで資料の御確認をお願いいたします。本日は、資料が1から5の5種類、それと参考資料を一つ、お付けしております。また、この端末ですけれども、電源をオフにしますと端末内のファイルが消去されてしまいますので、点灯のままでお使いいただきますよう、お願いします。操作については、お手元の操作方法の御案内をごらんください。端末の不具合がございましたら、交換いたしますので、お声掛けください。
  以上です。
【喜連川主査】    引き続きまして、事務局から、傍聴者の状況について、御報告をお願いいたします。
【玉井学術基盤整備室参事官補佐】    本日、37名の登録を頂いております。傍聴の方々に対してですけれども、傍聴席には資料の配布及び閲覧用端末の貸出しはございませんので、御自身で御用意頂きました端末の御準備をお願いいたします。
  以上です。
【喜連川主査】    どうもありがとうございます。
  それでは、審議に入る前に、御用意頂いた資料について、事務局から御紹介をお願いいたします。
【丸山学術基盤整備室長】    それでは、資料の御説明を申し上げます。
  まず、画面の資料1をごらんいただきたいと思いますが、この資料1は、学術情報委員会における主な意見ということで、前回は、冒頭、主査から御発言ありましたとおり、農研機構の大澤先生から「オープンサイエンス推進から得られるインセンティブを考える」と題した発表を頂いた後に、意見交換を行わせていただきました。ポイントは、資料の方にまとめてございますけれども、例えば、四つ目にありますように、研究データ自体をデータペーパーで発表して、それをオープン化することも可能となっていると。こういったデータペーパーはピアレビューの論文として扱われ、検索も可能で、データが引用されればサイテーションがカウントされるため、研究者にとって非常に分かりやすい成果になる、といったようなお話。あるいは、二つ下の、様々なデータがオープン化されると、今まで行えなかったような新しい研究が可能になると。今後、データ利活用環境の整備が進めば、このような研究手法が拡大して、論文生産性の向上も見込まれるのではないか、というような御意見がございました。
  それから、2ページ目に行かせていただきまして、上から四つ目でございますけれども、既存の研究コミュニティや研究者の考え方を尊重しつつ、なじみやすい政策がトップダウン的に推進されると、オープンサイエンスはより広がるのではないかというようなことで、このような御発表を頂いた後に、意見交換の中では、意見交換とある中の一つ目でございますけれども、データのマネジメントや稼動等のコストは無視できないということで、データマネジメントを主に行う専門職が必要ではないかと。ライブラリアンがデータマネジメントも担うことができれば理想的である、といったような御意見がございました。
  それから、最終的にまとめというわけではないのですが、3ページ目の三つ目の丸ですけれども、オープンデータ推進のための方策に係るメリットの一般化は難しいのだけれども、データジャーナルの活用は、その規模が大きければ多くの人の目に触れるため、研究者個人としてはメリットがあると。他方で、横断検索可能なデータリポジトリが存在し、日本語で検索できるものがあれば、国内で多くの目に触れると。また、国益等の観点から見れば、データジャーナル類を国内に置いておく方が、メリットが大きいのではないかということで、こういったような意見交換が行われました。
  それから、その下に2ポツとして、これまでの主な意見ということで整理しましたけれども、これは、従来御用意しておりました「研究成果及びデータを共有するプラットフォームの整備」の関係から抽出してございますので、説明は省略をさせていただきます。
  続きまして、資料2でございます。資料2の部分をごらんいただきたいと思います。内閣府においてオープンサイエンスを主題とした検討が幾つか始まっておりますので、その動向を御紹介したいと思います。
  まず初めは、国際的動向を踏まえたオープンサイエンスの推進に関する検討会、こういったものが設置をされ、検討が始まっている件、それからもう一つは、総合科学技術・イノベーション会議におきまして、政策討議と言われるもので1月25日に「オープンサイエンス」をテーマに議論がなされておりますので、そのあたりの御紹介をしたいと思います。
  一つめくっていただきますと、1ページ目でございますけれども、平成27年3月に検討会の報告を取りまとめました国際的動向を踏まえたオープンサイエンスの推進に関する検討会、これが再び設置され、動き出しております。趣旨としては、1ポツにございますとおり、国際動向を踏まえたオープンサイエンス推進のための方策等について検討をするということで、国際プレゼンスの向上、あるいは国内施策の充実等を図るというところが目的になってございます。構成は、総合科学技術・イノベーション会議委員と外部有識者によって構成するということで、下段の方に構成員の名前が挙がっております。当委員会からも幾人かの先生方が御参画頂いているという状況でございます。12月27日に第1回の会議がございました。基本的には、方向性の確認等がされたというふうに、承知しております。また、詳細な議論の状況がございましたら、この委員会で御報告をさせていただきたいと思います。
  それから、その次のページが政策討議なるもので、1月25日に「オープンサイエンス」をテーマにして行われた際の資料の一部でございます。まず、付いております資料でございますけれども、2ページ目の資料は、政策討議の目的は、Society 5.0の実現に向けて、科学技術・イノベーションを一層強化する観点、それから、これからテーマごとに現状と課題を分析・評価して、具体的な施策を、強化策等を検討する場として設けられておりまして、そのアウトプットについては、細かく御説明申し上げませんが、本日、参考資料として用意しております、「科学技術イノベーション総合戦略2017」の来年度版であります「総合戦略2018」、こういった場や、政府全体のイノベーション政策の構築に生かされるということで、承知しております。内閣府の方からの問題意識としては、重要な知的資源である公的資金による研究成果、こういったものをオープン・アンド・クローズ戦略に基づいて適切な管理をして、国益等を確保しながら国際的対応をする必要があるとした上で、「公的資金による研究成果の管理方針の策定の推進、研究成果の利活用のための基盤整備等により、研究成果の効果的な活用を図る必要がある」としております。
  その上での論点ですけれども、一番下の方に3点挙がっておりますが、研究データ利活用方針の策定、それから競争的資金等におけるデータ管理の要請、さらに、研究データ利活用のための基盤の整備が挙がっております。
  それから、この場では文部科学省からも御説明申し上げておりますが、少し資料を飛ばしていただきまして、下へどんどん送っていただきますと、9ページから文部科学省の資料がございます。その場では、文部科学省として、科学技術・学術審議会の学術情報委員会等において、研究のエビデンスとしての研究データを保存・公開することの意義、あるいはそのための具体的方策等について検討中であるとした上で、10ページでございますが、オープンサイエンス推進の観点・方向性として、ここで議論されている内容を少し紹介させていただいております。すなわち、オープンサイエンス推進の方向性は世界的に検討が進んでいる状況であり、この世界的な潮流から取り残されないということが非常に重要であると。ジャーナルのみならず、データの世界においても、再び海外にリードを許してしまうおそれがあり、全体的な枠組みの中で具体的にどうしていくのかが課題になっていると。一方で、分野ごとの研究スタイルの違い等から、どの段階でどこまでのデータをどう出していくのかということは大変デリケートな問題で、研究活動を阻害しないよう、各分野の特色等を踏まえて検討していくことが必要と指摘されているということを説明しております。主な観点としては、先ほど内閣府の資料にもありました3点に加えて、人材の育成・確保という観点から論を展開しております。
  次ページ以降で、現状・課題、あるいは今後の方向性ということで、示してございます。御参考にごらんいただければというふうに思います。
  それから、この政策討議、オープンサイエンスの回でございますけれども、本日、オブザーバーで御出席いただいております科学技術・学術政策研究所の林先生からも御発表頂いておりまして、14ページになりますけれども、「オープンサイエンスがもたらす社会変容と研究データポリシー-新たな知の開放と研究データ資源戦略-」と題して、御発表が行われております。
  これが、内閣府におけるオープンサイエンス検討の動向の御報告でございます。
  それから、もう1枚だけ、資料3のところをごらんいただきたいと思いますが、資料3は、「提言・報告書等において示されたインフラ整備の方向性」ということで、前回、A3版の横表として用意させていただきました資料から、インフラ整備の部分だけを抜き出したものでございます。詳細の説明は省略させていただきますけれども、キーワードのみ申し上げますと、例えば、オンラインインフラ等の整備、あるいは、データの品質管理、メタデータの標準化、データポリシーの策定といったようなこと、さらには、人材の確保といったところが、各提言・報告書等で示されている方向性のキーワードといったようなことかなというふうに思われます。
  事務局が用意した資料は、以上でございます。
【喜連川主査】    ありがとうございます。
  それでは、山地教授から、御説明をお願いしたいと思います。どうぞよろしくお願いいたします。
【山地国立情報学研究所教授】    国立情報学研究所の山地です。よろしくお願いいたします。表紙のスライドに書くのを忘れたのですが、国立情報学研究所に4月からオープンサイエンス基盤研究センターが設置されまして、そこのセンター長をしております。本日は、オープンサイエンスについて特に基盤という観点から、情報提供をさせていただきます。
  1時間弱、時間を頂いていますが、話の流れとしましては、まず、海外における研究データ、当然これはオープンサイエンスというところにも絡んだ上での研究データの管理のための基盤ですが、この基盤の整備状況を、イギリスやヨーロッパ、オーストラリア、アメリカの例を見ながら、世界でどのような感じでインフラの整備が進んでいるかを紹介しつつ、その中で、デファクトとして世界的にどのような形のものが作られてきているかをお示ししたいと思います。その後、我々が今取り組んでおります研究データの基盤の整備状況、これは三つのコンポーネントから成っておりまして、後ほど詳しく紹介いたしますが、研究データを管理するための基盤をGakuNin RDMと呼んでおります。そして、リポジトリの基盤としてJAIRO Cloudというクラウドサービスをしており、その裏にWEKOというリポジトリのソフトウエアが乗っているのですが、そのWEKOの開発状況、そして、そこで集められたコンテンツを串刺し検索できるCiNii、CiNiiは新しくCiNii Researchというものを開発中ですが、それらの開発状況について紹介しつつ、我々の活動状況と世界の流れを対比しながら、今後、足りているところと、まだ足りてないところがあるのではないかというところについて、まとめをしたいと思います。
  まずはイギリスの例です。イギリスでは、各研究所や大学でも研究データ管理に関する整備は進められているのですが、大枠でそれを取りまとめている、Jiscと呼ばれている機関があります。JiscはNIIと科学技術振興機構(JST)の機能を部分的に集めたような機関ですが、そこが最近、幾つかの研究データ管理に関するプロジェクトを進めております。上の三つが2014年ぐらいから始めているプロジェクトで、それらを踏襲する形でResearch data shared serviceというものが現在走っております。
  まず、一番上のResearch at riskというプロジェクト、これは2014年から2016年まで行われていましたが、これは基盤の整備というよりもむしろ、その周辺のことも含め、研究データ管理に関するポリシー、人材、基盤やインセンティブなど、インセンティブに関しては研究データ管理の基盤を使う研究者のインセンティブやそれをサポートする人たちのインセンティブを含めてなのですが、どういったことが重要な点として挙げられるかをまとめた、最終アウトプットとしては報告書ができるようなプロジェクトでした。
  それと並行してResearch data springというものが行われていました。これは、よりサービスやインフラに近いプロジェクトでして、研究データ管理に関するワークフローのサポートツールや、解析ツール、研究データを登録する仕組みを簡単にするようなサービスなど、これはJiscで初めての取組だったのですが、初めに30ぐらいのプロジェクトを採択し、その中で、3か月、6か月というところで期間を区切って、サービスに関わるような大学の人や関係者を集めて投票して、だんだんエクセレントなプロジェクトだけを残していくという、コンペ形式のプロジェクトを行っておりました。
  3番目はメトリックスな話で、研究データを管理したり、公開したり、これはインセンティブにもつながるのですが、そういったことを行っていくものです。イギリスでは、REF(Research Excellence Framework)と言って、各大学の研究IRの指標を政府に集めて大学を評価するという動きが活発で、最近ではREF2020という枠組みが走っていますが、そういったところにも研究データを公開するメリットといいますか、それがどういうふうに使われたかをフィードバックする目的で、usage statisticsの情報などを取りまとめていくための標準を決めるようなプロジェクトです。
  これらが走った上で、総合的に踏襲してshared serviceというふうに言ったのですが、これはそれらのいいところをうまく組み込みながら最後のプロジェクトが走ったというよりは、何か別物が走ってきた感じの雰囲気があるものです。
  最後のResearch data shared serviceについて、それの全体的なアーキテクチャーが小さくて申し訳ないのですが、これはResearch data shared serviceのプロジェクトの概要といいますか、それぞれやっていることがどこで活用されるかということを示したものです。研究データのワークフローに沿って、Data Repository、Preservation、最後のところはReportingと書いています。それぞれどういうサービスが必要かを、大学ごとに違ったサービスを組み合わせて利用して、ベストプラクティスあるいはグッドプラクティスを作っていくプロジェクトです。
  これまでのJiscのプロジェクトと大きく違ってきたと外から見ていて思うのは、ここで持ってくるサービスについてで、昔はオープンソースのソフトウエアを使ったり、大学で独自にシステムを開発したりというパターンが多かったのですが、今回持ってきているサービスのほとんどは商用のサービスで、今進んでいるプロジェクトでのJiscの方向性やかじ取りが変わってきたことが見えるところです。
  そのJiscのプロジェクトの進め方の変革について、どういうふうにプロジェクトを進めているかを簡単にまとめたスライドです。まず、テーマを決めて、それに沿って公募をして、採択します。1~2年ぐらいのプロジェクトがメインで、大学や研究機関だけではなく、小さなシステム開発、アカデミック周りにいる小さなベンダーも、その公募に応募することはできます。そうしてプロジェクトを進めていくのですが、プロジェクトマネジメントはJiscの担当が行い、従来は、採択したプロジェクトを計画どおりに2年間行って、中間報告書を書いて、最後に報告書を書くというパターンでしたが、最近では先ほども紹介したように、コンペ形式で徐々にふるいにかけながら、大学の意見をうまく反映できるプロジェクトに集中してお金を投資するという進め方をしております。ただ、プロジェクトが終わった後にどういうふうにサービスを提供するかというところに持続性が余りよくない部分があって、Jiscが作ってきたサービスで、オープンアクセスの分野でよく使われている、例えば出版社のポリシー状況をデータベース化し、リポジトリに登録するときにどの版の著者稿が登録できるかを調べるデータベースがあり、世界中で使われています。あるいは世界中のリポジトリのソフトウエアやコンテンツの登録状況を全部集めて俯瞰(ふかん)的に眺めることができるようなサービスがあるのですが、これらはなかなか持続的なサービスの運用というのがうまくいっていないという状況にあります。恐らくそういうこともあって今回のプロジェクトは大きく商用のプロダクトに振っているのではないかと思うのですが、この方向転換には賛否両論ありまして、商用プロダクトを使うことによって、長期的な運用という意味では一つの指針にはなるかもしれないのですが、アカデミックの意見をうまく反映し、大学や研究機関が必要とする機能が盛り込まれたサービスになっているかというと、そうではないところもあるのかもしれません。これが、現在のイギリスの特徴です。
  次はヨーロッパです。ヨーロッパについてはHorizon2020の下で進められているEuropean Open Science Cloudの状況を少し詳しく紹介したいと思います。これまではEuropean Open Science Cloud、これをEOSCと言いますが、EOSCを実現するためのコンポーネントの準備というものがHorizon2020の中で、明示的になるのかならないか、今までよく分からない状態で進んできましたが、2018年からINFRAEOSCという柱が立ち、それに対して公募がかけられています。総予算は270ミリオン、つまり360、70億ぐらいです。これは、European Open Science Cloudを作っていくためのEインフラの経費です。HPC(High Performance Computing)の経費などはこの中には含まれておらず、別のINFRASUPという枠に含まれます。INFRAEOSCの用途としては、例えば、後ほど紹介するEuropean Open Science Cloudとしてのポータルサイトの作成や、既存のデータベースをつないでいくための改修の費用、新たなサービスを作るということもありますが、そういったところにかなり大きなお金が投じられようとしているのが欧州の状況です。
  このEuropean Open Science Cloudですが、これまでは、先ほども言いましたEGIとはHPCのプロジェクトですが、こういったものに投資されます。あるいはEUDATというのは研究データを管理したり、共有したり、あるいはそれらを公開したりするための研究データ管理や、オープンサイエンスのためのツールのSUITEを提供するプロジェクトですが、こういうものが個別に立っていました。リサーチャーはそれぞれにアクセスしていたのですが、European Open Science Cloudという一つの大きな傘をかぶせて、欧州全体で個々に現在動いているインフラをオープンサイエンス的に構築し、使っていくための仕組みを作っていこうというのが、この取組です。
  これらのプロジェクトについて、方向性は分かっていても、具体的に何をやっているのか今まで余り見えてこなかったのですが、恐らく予算が明示化されたということもあって、具体的な活動が徐々に見えつつあります。その一つがEOSC-hubというもので、欧州にある、これまでFP7(第7次欧州研究開発フレームワーク計画)やHorizon2020で作られてきた研究データのデータベースや、それらを検索するためのサービスなどがたくさんあるのですが、それらに加えて例えば、コンピューティングリソースやストレージ、欧州の中のそれぞれの国に分散されているいわゆるEインフラ、研究のためのEインフラをつないで、このポータルサイトから使いやすくしようというサービスを作ろうとしています。単なるポータルサイトだけではなく、もし有償のサービスがあればそれをパーチェースできるような仕組みや、人材育成、トレーニングコースの開発や実施ということも、このEOSC-hubの中に含まれているようです。
  ヨーロッパのEOSCの状況は、それまでよく判然としなかったものが徐々に分かりつつあります。先ほどのEOSC-hubも、3年で30ミリオンユーロなので40億弱のお金が投じられるようですし、それぞれのデータベースのコンテンツ、メタデータレベルですが、それらを集めて横断検索するOpenAIREというディスカバリサービスがこれまでFP7の頃からサポートされてきましたが、それをOpenAIRE Advanceと新しく名前を付けて、これも3年間で10ミリオンユーロの予算が付けられています。この二つのサービスを軸に、現在、ヨーロッパにあるそれぞれのインフラを上のレイヤでつなぎつつ、下のレイヤでもデータベースそれぞれを横でデータ連携する必要もあると思うのですが、それは恐らく長期戦になるのではないかと思われます。ただ、全体のアーキテクチャーとして、ちょっと小さいのですが、ヨーロッパにはGEANTというネットワークがあります。日本で言うとSINETなのですが、GEANTのネットワークの上にコンピューティングリソースやストレージを提供するEGIとかPRACEというプロジェクトが乗っかってきます。それらをうまく使うための認証連携の仕組みがあり、その上に共通コンポーネントがあったり、あるいは、テーマごとの取組、データベースが乗って、ここに書いてあるのですけれども、最後のアッパーレイヤとしてそれを横断検索するようなディスカバリサービスを作ったりしていくという、全体的なアーキテクチャーとしてそういうものを作ろうとしているのが見えます。
  次はオーストラリアについてです。これは2015年9月に出された「Research Infrastructure Review」という報告書で、その前の年に国家の監査委員による、オーストラリアはそれぞれデータセンターや研究組織がEインフラに関して良いサービスを作っていますが、総じて全体を見ると重複投資があるなど、もっと効率的にインフラの投資ができるのではないかという指摘を受けて、世界においてもオーストラリアの研究力をより高めていくためにはこのようなEインフラの準備をしていかなければいけないのではないかということがまとめられた報告書です。これは報告書のプリンシプルを部分的に持ってきたのですが、研究費が上がるのならば、当然インフラに対するインベストも増やしていかなければオーストラリアにおけるリサーチ・エクセレンスは担保できない、あるいは、リサーチ・インフラというのは全てのインフラ、つまりハードウエアや研究の装置の部分も含まれますが、その中でEインフラというのは非常に重要な位置を占めており、特にロングテールをサポートしていく上では重要であるということがこのプリンシプルに書かれています。ただ、全体としての予算は当然限られているので、オーストラリアの場合はNCRIS(National Collaborative Research Infrastructure Strategy)という機関がEインフラをかなりサポートしているのですが、例えば、日本で言うと省庁別に投資されている研究のEインフラに係る予算を全てANRIFというところに集約し、そこで戦略性を持って優先順位を決めて再分配するという仕組みを作る必要があるのではないかということが、このレポートの中でまとめられています。これは政府ないしは関係省庁に対する提言のレポートなので、これを実施していくことがこれからのオーストラリアのやることなのですが、そんなに簡単にいくわけではないと思うのですが、こういったレポートが2015年段階で出されました。
  恐らくこのようなレポートを受けてのことと思われますが、これは2017年~2018年のビジネスプランで、ANDSというオーストラリアの中での研究データを集めてディスカバリサービスなどを提供している組織と、Nectarというクラウドサービスやクラウド基盤を提供している組織、またRDSというストレージサービスを提供している組織が、これまでは主にそれぞれ独自にやってきたのが、共同でビジネスプランを作りつつ、こういった具体的な連携プログラムをやっていこうという試みが始まっております。この三つは代表的なものを挙げましたが、一番上のResearch Domain Programというのは、それぞれこれまでANDSとNectarとRDSがカバレッジを持った研究分野を、重複する部分はありますがサポートしてきたものを三つ連携して、自分たちのサポートした研究分野のビジビリティーが上がるよう、より戦略的に研究分野や研究コミュニティをサポートしていこうということが、この一つ目のプログラムの概要と思われます。二つ目のプログラムは、その上で、それぞれ得意分野が違いますので、連携しながら全体の活力を上げていくものです。三つ目は、単純にインフラのサポートだけではなくその周辺にあるポリシーや、国際連携、人材育成に関しても連携しながら進めていくことが、三つの組織が一緒になってやろうとしていることです。
  そこで作ろうとしているのが、Australian Research Data Cloud(ARDC)というものです。このARDCが初めに明言されたのは2016年のNational Research Infrastructure Roadmapの中でした。行おうとしていることは先ほどのEOSCのオーストラリア版で、これは全体を示している図を報告書の中から引用してきたものですが、オーストラリアにはAARNetというネットワークがあります。AARNetでコネクトしながら、AAF(Australian Access Federation)というのは認証フェデレーションなのですが、このフェデレーションとさっきの三つのストレージとディスカバリとクラウドの組織、また、よりHPCに特化した組織もありますが、こういったところを含めたベースのインフラを作り、それを各研究分野なりプロジェクトなりに充てていくもののオーストラリア版を作ろうとしているのが現状です。
  アメリカについて、アメリカをまとめる上でかなり調べたところ悩みました。なぜなら、アメリカは一つ一つの組織は非常にクオリティーの高いサービスを提供しているのですが、国全体やコミュニティ全体として一緒にサービスを動かそうという動きが、恐らく個々のパワーや予算措置が非常に高いためにそうなっていないように思われるのですが、国全体としてインフラ整備として一緒になって取り組もうということではなく、個々がいいサービスを作るということに取り組んでいる状況だと思われます。その中で二つサンプルを持ってきました。National Data Service(NDS)という組織は、現在、Labs Workbenchというものを作っています。これはサービスインしていますが、研究データの管理というよりも解析の方により近いもので、研究データ解析のためのクラウドのPaaS環境をたくさん用意して、研究者が必要に応じてクラウド環境を作り、研究が終わったらその環境は捨てるというようなインターフェースと環境を用意しています。それに加えて現在作られているのがNDS Shareというもので、これはラストリゾートとしてのデータリポジトリです。この二つが、現在見えている、NDSからの研究データ管理・オープンサイエンスに近いサービスです。
  もう一つは、Center for Open Scienceです。COSと言って、バージニア大学の近くにあるNPOで、バージニア大学の教授がファンダーとして作った組織です。このCenter for Open ScienceのメインのサービスはOpen Science Framework、OSFと呼ばれており、研究プロジェクトの中で共同研究者間でデータを共有したり、また、それをプロジェクトごとに公開したりするシステムです。後ほど紹介しますが、日本でNIIが用意する研究データ管理のためのサービスはこのOSFをベースにしております。このOSFの周辺サービスで彼らが現在かなり力を入れてやっているのがプレプリントのサービスです。初めは一つか二つぐらいのサービスが挙がっていただけなのですが、今はこんなにたくさんのプレプリントサーバが挙がっています。昔はプレプリントサーバというとコーネルのarXivだけでしたが、現在はCOSがプレプリントの分野においてかなり投資しながらサービスを行っています。NPOと言いましたがメインのインカムは財団で、年間10億ぐらいの資金をアメリカから集めてきて、このようなサービスを展開しています。加えて、インフラのサービスだけでなくトレーニングコースもやっております。OSFを使うためのトレーニングコースだけではなく、オープンサイエンスそのものや、研究データ管理の基礎的な部分に係るような普及啓蒙(けいもう)も、彼らのミッションにおいて進めております。以上がアメリカの状況です。
  これらの四つの国、アメリカはちょっと違うのですが、全体的に見えてくるのは、先にEOSCのところでも少し話したように、現在インフラとして既にあるものをうまく組み合わせながら、全体としてオープンサイエンスに向けた基盤を作っていこうとしていることです。コンポーネントとしましては、ネットワークがあって、その上に認証のフェデレーションがあります。このVOというのは仮想組織(Virtual Organization)のことなのですが、認証フェデレーションで賄えるのは組織の中の人の認証だけなので、組織を超えた研究グループを作っていくためのプラットフォームです。この一番下のレイヤのプラットフォームの上で、例えばクラウドやHPCのコンピューティングリソースなどを提供したり、共通サービスを提供したり、あるいはこの分野別サービスには非常にたくさんのデータベースがありますが、それらが乗っていて最後にそれらを串刺しするようなディスカバリがあるという、全体的なアーキテクチャーとして世界的にそのようなものを作っていっているのではないかということが見えてきます。当然のことながらこれらを行っていくためには、それぞれのコンポーネントが別組織で運用されているということもありますので、サービスレイヤ間、あるいは分野間の連携を行っていかなくてはなりません。それをうまく実現するために、例えばオーストラリアの例やヨーロッパのINFRAEOSCのHorizon2020の予算措置もこれに含まれると思われますが、政府レベルでこのようなインフラをつなげて、積極的に利便性を高めたり費用対効果を上げたりしていこうということが、オープンサイエンス周りにある研究データ管理のサービスを作っていく世界的な動向として見えます。
  こういった世界の動向に対比しながら我々の状況を今から紹介したいと思います。内閣府の議論の後に学術会議や文部科学省での議論を経て、現在我々がNIIで構築しようとしている研究データ基盤のラフスケッチを表したものがこちらです。三つのコンポーネントから構成されておりまして、一つはデータを管理するための基盤。これは共同研究者間でクローズドにデータを安心・安全に保全していくデータを管理するための基盤です。それを研究成果が出たときに公開するための基盤、これは俗に言うリポジトリのシステムです。恐らくこの中の議論でも既に紹介があったと思われますが、我々はJAIRO Cloudという機関リポジトリのクラウドサービスを運営しているのですが、それを研究データも扱えるように拡張開発を現在やっております。最後に残った研究検索基盤ですが、我々はCiNiiという論文検索サービスを持っておりますが、これを研究データも扱えるように機能拡張するということで、この三つのコンポーネントを現在構築しております。その状況について、今から紹介いたします。
  その前に、研究データの基盤の開発ですが、我々はこれまで、先ほどのCiNiiにしても、機関リポジトリのシステムやJAIRO Cloudのサービスにしても、主に扱ってきたのはオープンアクセスという分野での取組でした。コンテンツとしては論文のリポジトリや論文の検索サービスを提供しており、これは長い歴史の中でこういったサービスを作ってきたというところもあるのですが、ただ、論文というのはエンティティがある程度しっかりしており、既知のフォーマットと想定可能な利用方法の中でより利便性を高めていくというふうにCiNiiやリポジトリのシステムの拡張開発を行ってきました。しかしオープンサイエンス――これはオープンサイエンスの中の、研究データを扱う部分のことです。この場合、オープンアクセスで論文を扱うときとは全く異なり、研究データを対象とするときには、当然ながら研究データそのものも多様でありますし、扱い方も多種多様です。その扱い方や研究データの種類、あるいはデータ量に関しても、研究データの発展とともに扱われ方が日々変わってきます。それに対応したシステムを作らなければならないということが、我々の課題として存在します。また、これまで提供していたのは研究成果が出た後のコンテンツを保存するリポジトリや検索サービスだったのですが、研究データを扱うサービスを構築していくためには、より研究者に近いサービス、日々の研究で使われるような、特に、後ほど紹介する管理基盤というものを作ろうとしています。これは日々の研究で使われるものなので、止まると皆さんにとんでもなく怒られてしまうサービスになります。今までとは質の違うサービスを提供しなければならないという課題があります。
  まとめますと、データを扱う意味で、構築していくシステムには、当然、柔軟性と拡張性を持たせなければなりません。となると、なかなか仕様が決まらないということがあります。どのようなサービスを構築していかなければならないかということを初めに決めることが難しく、どんどん要求が変わっていく中でサービスを良くしていかなければならないという課題があります。また、論文に関しても、これまでの主に紀要を扱ってきた機関リポジトリと異なり、これからは、例えば論文のオープンアクセスに対してファンダーからマンデートがかかってきたり、機関におけるオープンアクセスのポリシーの普及が進めばコンテンツ数がオープンアクセスに関してもどんどん増えていったり、データを扱うとなるとそのデータの種類や量も変わってきたりします。かつ、止まってはいけないサービスとなります。当然ながらこれまでよりも可用性も信頼性も保守性も高いサービスを構築していかなければならないため、現在、開発の方法も大きく変わろうとしております。
  ちょっとシステム的な表現になりますが、これまでは、アプリケーションがあってデータベースがあってというものを一つのセットとしたシステム開発をやっていて、モノリシックなコンポートネントのサービスとよく言われました。これからはそうではなく、柔軟性や拡張性に対応させるために、アプリケーションの中を小さなサービスに分割し、それぞれが干渉しない単位のマイクロサービスに分割して、それぞれのサービスが拡張できるようなシステム構成を持たせなければなりません。そのマイクロサービス化されたコンポーネントに対し、常に機能を拡張しながら品質保証をして、それを本番環境に短期間でデリバーするという、システムの運用体制も作らなければなりません。従来の事業とは全く異なる形のサービス開発と提供を現在行おうとしているところです。
  その一例で、これもシステム的な話になりますが、これは現在作ろうとしているリポジトリの内部を絵的に描いたものです。それぞれ異なる機能を一つのサービスとして構成しながら、外部からのアクセスに対しては全てタスク管理というところでメッセンジャーが管理し、それぞれのサービスに対して仕事を割り振ります。そして戻ってきたタスクから、それをエンドユーザーに返すという仕組みにしています。それぞれのサービスが負荷に応じてどんどんスケールアウトしていくようなアーキテクチャーを持った公開基盤を構築しようとしております。
  加えて、それを実際に運用するときには、これは継続的なインテグレーションとかデリバーというふうに言いますが、開発者が新しい機能を開発すると、それがコードリポジトリに入り、単体テスト・総合テストが自動的に行われ、サービスを構成するコンテナというものができ、これはまだ実験環境ですが、それがデプロイされ更に本番環境にデプロイされていくことがほぼ自動的にできるような運用環境というものも、同時に作ろうとしております。アプリケーションの組み方も旧来とは全く異なっておりまして、まず絶対守らなければならないテストコードというものを書いた後に、実際に機能のアプリケーションを書いていくという、全く逆の方向のシステム開発をやらなくてはいけません。実際にデプロイした後も、負荷に応じて各コンポーネントが生き物のようにクラウドのリソースが大小するような、そういった運用に耐えるような基盤の整備を現在行っているところです。
  それぞれ三つの基盤の開発の進捗について、まずは検索基盤ですが、検索基盤に関しましては、公開基盤――リポジトリですね。リポジトリから入ってくるものだけでなく外部のデータベースのコンテンツも集めながら、それぞれを同時に検索できるような検索サービスを作っていかなければなりません。そのときに、従来は研究の成果物として論文、あるいはエンティティとしては研究者だけでしたが、それらに加えて研究のプロジェクトや実験データ、また所属機関や助成機関の情報も全てID化した上で、雰囲気としましては、これまではエグザクトに論文を検索する、論文に書かれているメタデータの項目を入力して、それにマッチするものを検索するということで、これからも多分インターフェースとしてはそうなりますが、その裏で検索する人たちがどういった研究活動を検索しようとしているのかというところもうまくアシストできるような検索基盤を、現在新しいCiNiiとして構築しようとしております。
  そのために必要なコンポーネントですが、全てのエンティティをきちんとID化してナレッジグラフ化するというところを現在進めております。これまでCiNiiは、CiNiiファミリーとしてArticles、Books、Dissertationsがありましたが、バックエンドは全部分断されていたというのが恥ずかしながら現在の状況です。それを一つにまとめて大きな知識ベースを作った上で、エンドユーザーの検索、何を検索しようとしているかに対して答えを返していくシステムを現在構築しております。本年度は、対象となるデータの収集やAPIの設計というのを終え、初期のUIを作ったところです。ベースとなるところができてきておりますので、来年度、2018年度はそこにデータを流し込んでナレッジグラフを構築した上で、UIを改善します。同時に運用基盤を構築していきます。国際的にはHorizon2020のEOSCの配下で進められているOpenAIREと連携しながら行っています。これまでもOpenAIREに対しては日本のリポジトリからのコンテンツを流していましたが、それだけではなく、もっと技術のレベルでナレッジベースの作り方や、エンドユーザーに対する答えの返し方の部分に関しても、技術的な交換も、来年度実際にシステムができてくる段階で進めていこうとしているところです。
  次は、機関リポジトリ、公開基盤について、先ほど申しましたが、これまでの紀要リポジトリとしての役割から、より大きなオープンアクセスのムーブメントに対応できるような機能拡張をやっていかなければなりません。そのためには、今までは、紀要の場合、ボーンデジタルで作成された紀要を図書館の人たちがそのリポジトリに入れるという比較的単純なワークフローでしたが、それに加えて、研究者が書いたジャーナルアーティクルを、図書館の人も間に入りながらリポジトリに登録するというワークフローを実現させる機能を作っていかなければなりません。これまでよりも仕事の量が増えてしまうので、できるだけ図書館や研究者の方々の仕事を増やさないようなUIあるいはサポートシステムを構築していく必要があります。さらに、JAIRO Cloudについても、コンテンツはどんどん大きくなるし、データリポジトリとしての機能も果たしていくということもありまして、このまま同じように運用していくと破綻していく状況にあります。それは先ほども示しました新しいリポジトリのアーキテクチャーと運用体制でカバーしていく必要があります。
  日本のリポジトリは、だいだい色のところがJAIRO Cloudを使ってくれている機関で、青色のところはオンプレミス、大学独自にリポジトリを運用しているところです。JAIRO Cloudのサービスを始めて、このあたりから機関リポジトリを既に持っているところもJAIRO Cloudに移っていいですよというサービスが始まったのですが、だんだん独自のリポジトリは減ってきています。JAIRO Cloudを使ってくれている機関は500機関ほどありますが、そういった500機関がオープンアクセスの活動を始めたとしても耐えられるような機能と運用体制を作っていくという課題があります。
  また、データに関しては、様々なところで議論が進んでいるところを見ますと、まずは論文とそれに関連したエビデンスデータをきちんとリポジトリで公開する、その操作を簡単にできる仕組みを作る必要があります。ただ、データですので、論文の1ファイルの1メガとか2メガとは違い、大きいファイルがどんどん入ってきます。いろんな種類のデータや、たくさんのデータが入ってきたときにもスケーラビリティを担保するようなアーキテクチャーを持つ必要があります。
  これまで我々が作ってきたリポジトリシステムのWEKOバージョン2では、文献の扱いを中心とした機能の拡張を進めてきました。我々NIIとしては、リポジトリWEKOを開発すると同時に、JAIRO Cloudというサービスを介して図書館のコミュニティと非常に近く連携しつつリポジトリサービスの運用と開発を行ってきたことで、図書館の人たちのニーズを開発に取り入れるという、非常に良いサイクルができております。そういった連携の下で、開発者と運用者、利用者が非常に近い位置関係を持てたことにより、WEKOの文献を扱う意味での機能は洗練されてきました。ただ、現状のモノリシックなアーキテクチャーを研究データに対応させていくというのはちょっと無理がありますので、新しいWEKOでは、既存のアーキテクチャーとして、恐らく世界で一番良いであろうリポジトリシステムに、これまでWEKO2までの開発の中で経験してきた機関リポジトリの文献扱いの機能を入れ込んでいき、全体としてのリポジトリを、研究データも扱え、かつこれまで我々が作ってきた機能も十分に提供できるようなシステムをバージョン3として作ろうとしております。
  ベースとなる機種の選定では、世界中のオープンソースのリポジトリを、これまで開発が始まったときから全リポジトリの機能の改変や歴史的な変遷、その背景にあるコミュニティを徹底的に調べ、今採用して付き合っていくには現在ここが一番いいだろうということで、CERNが開発しているInvenioのバージョン3を選びました。これはデータのリポジトリとしての実績を持つシステムですが、これをベースとして我々の新しいWEKO3を作っていこうとしております。
  リポジトリ周りの今後の展開では、2017年の段階でWEKO2が持っている基本的な機能やUIの開発を終えました。来年度は、よりユーザーに近いところのアッパーなユーザーインターフェースや、ワークフローの機能などを作っていき、それと同時に運用基盤の整備を進めていく予定です。これによって非常に柔軟なインターフェースを持つリポジトリができますので、機関リポジトリだけではなく分野別のリポジトリとしてもうまく使っていけるものとして用意しております。
  最後は、研究データの管理基盤です。先ほども少し触れましたが、アメリカのCenter for Open Scienceが開発しているOpen Science Frameworkをベースに、これを拡張したものを日本の研究データの管理基盤として現在用意を進めております。名前はGakuNin RDMと言います。ちょっとおさらいになりますが、このOSFはどういうものかといいますと、研究プロジェクト単位で、共同研究者間でファイルを管理したり共有したりすることができるものです。かつ、我々のGakuNin RDMでは、NIIが大学と一緒に作ってきた学認というIDのフェデレーションがありますが、このIDのフェデレーションと、そのサービスの一つとして提供している仮想組織を作る機能でこのGakuNin RDMにアクセスしてもらい、そのメンバー間でファイルを管理できる、研究データを管理できる仕組みになっております。NIIとしましては、このアプリケーションの部分を機能拡張も含めて開発・提供していきます。大学との関係では、これは我々が今想定している役割分担ですが、機関としてのストレージを用意していただきます。それは、オンプレミスの場合もあるしパブリッククラウドを採用する場合もあると思うのですが、組織としてのストレージを用意していただいて、それを我々のサービスにつないでいただきます。学認でログインしますと、誰かまでは分かりませんが所属機関の情報は分かりますので、ログインしてきたときに組織として接続しているストレージが使えるようになるという仕組みになっております。かつ、このように組織としてのストレージをつないでいただけるので、これまでOSFにはなかった機関管理者のための機能も現在構築しております。これは後ほど詳しく紹介いたします。
  本年度は代表的な機能としてこういったものを作ってきましたが、ここで、赤で示した幾つかの機能について、サンプルを紹介したいと思います。
  まずは、データ解析ソフトウエアとの連携機能です。GakuNin RDM自体はファイルを保存する機能ですが、これを研究データの管理システムと呼べるように、外部の解析サービスと連携した使い方ができるプラグインを作りました。どういうものかといいますと、対象としたのはJupyterHubでRあるいはPythonのプログラムでデータ解析ができるサービスですが、GakuNin RDM側で一次データを保存し、それをJupyterHub側に送ります。JupyterHubではデータ解析して処理結果をGakuNin RDMに戻し、その管理をRDMの中でやるという流れが簡単にできるような機能を用意しました。
  次に紹介するのはプラグインの開発キットです。先ほど紹介したJupyterHubのような機能はデモ的な意味も込めて作りましたが、各分野で使われる研究のツールはそれぞれ異なります。それを全てNIIが用意するのは大変なので、そういったプラグインを簡単に作れるようなキットを用意して、各分野の方々と連携しながら、分野に特化したプラグインを作ってもらうためのテンプレートのようなものを作成します。ただ、そういったテンプレートを使う・作っていく上でも、いろんなユースケースを想定しつつ、どういったライブラリがあれば作りたいプラグインができるかを想定しながらこのテンプレートを作っていっておりまして、このプラグインを使って、例えば将来的には、GakuNin RDMをよりうまく使っていただくためのハンズオンやコンペのようなこともやりたいと思っております。
  次は、先ほども触れました機関向けの管理機能です。機関として用意したストレージをこの管理ページの中でつなぎます。デフォルトではたくさんの外部ツールやいろんな種類のストレージを、例えばGoogleドライブやBoxなども含めて、GakuNin RDMにつないで使えるようになっております。それが組織のセキュリティポリシーで許されない場合には、この管理機能でつながせないようにチェックを外し、機関構成員にサービスを提供できるようになっています。それに加えてGakuNin RDMの組織構成員からの使われ方のログのようなものもフィードバックできる仕組みになっております。
  我々がGakuNin RDMを作ってきた当初は、研究を始めるときにプロジェクトを作り、どこかで実験したデータを入れ込みながら共同研究者でデータを管理し、例えば、バージョン管理をしながら、その成果を共有しながら、論文を書いたときのファイルもバージョン管理して、この中で共有しながら使用するということを想定していました。しかしながら、機関によっては研究プロジェクトの開始から使うのではなく、例えば、論文、成果が出るところまではローカルな環境を使い、それ以降は各組織横断型にGakuNin RDMを使った上で、研究データをエビデンスデータとともに管理して長期保存を実現したいというユースケースもヒアリングを重ねていく上で聞かれました。この場合にはGakuNin RDMが用意している機能よりも狭めたサービスとして使えるように、機関ごとに利用形態がテンプレートでカスタマイズできるような機能も、先ほどの機関の管理ページのところに用意しようとしております。
  このGakuNin RDMは、メインとしましては、集中的に我々NIIでサービスを提供し、インターネットを介してサービスを利用して頂くというパターンを考えています。そうではなく、これは一番初めに御要望を頂いたのは物質・材料研究機構さんですが、インターネット版の研究データ管理のサービスが使えない場合に、組織の中でGakuNin RDMをデプロイして使いたいというケースもありました。そういったニーズに対しては、組織の中のインフラに我々がデプロイし、デプロイが許されない場合にはオープンソース版として提供するという、幾つかのサービスの提供パターンを考えております。加えて、スタンダード版とエンタープライズ版と呼んでいる間に、インターネット上で提供するけれども集中版ではなく、その組織が専有したクラウド環境でサービスを使いたいという別の運用モデルとして、GakuNin RDM for Institutionのようなサービスを行う必要があるかもしれません。そういった要望にも柔軟に対応していきたいと思います。
  これまで作ってきたサービス・機能も含めて、我々は幾つかの実験を重ねており、10月に2回目の実験を行いました。3回目の実験を3月に計画していましたが、今の状況では4月以降になりそうですが、より大規模な3回目の実験を計画しております。1回目の実験は7帝大の基盤センターの方々を中心に小規模で行いました。2回目の実験では、ラボなど研究に実際に近いところの方々に参加していただきました。3回目では、これまで1年間作ってきた機能のレビューも含め、更に来年度必要な機能のニーズ分析をするという意味も含めての実験を計画しております。
  そういった期間を区切った実験に加えまして、より具体的に、例えば小規模なラボでGakuNin RDMや公開基盤を使っていただくためのヒアリングや先行利用の準備も進めております。幾つかの分野で積極的に使いたいと言ってくださっておりまして、そういったところと協力しながら、かつ、基盤センターも幾つかの大学で具体的に話が進んでおりますので、今後のデプロイに向けて準備を進めていきたいと思っています。大学の中でこれまで、研究成果を一定期間保存する、あるいは10年間保存するというポリシーはできましたが、それを実行に移すための更に上段のポリシーを幾つかの大学で作っていこうとしているという状況を聞きます。実行プランにより近い上位のポリシーを作っていく、その制約条件と我々の管理基盤の機能との整合性を合わせるというところも含めて、大学の方々あるいは研究機関の方々と、GakuNin RDMの機能の改修、変更、拡張を現在進めていっているところです。それに加えて、大学基盤センターとして、研究データ保存というよりもより具体的に、研究の不正対策にこういった形で使うのだというパターンも幾つかお声掛けを頂いておりますので、具体的なケーススタディー作りも進めていっているところです。
  三つの基盤ですが、それぞれ異なる国際機関と連携しながら、開発を進めております。管理基盤はアメリカのCOSというところと一緒にやっておりますし、公開基盤はCERNと一緒に開発しております。検索基盤はOpenAIREと一緒にやっておりまして、この緑のところは、現在これを管理基盤のもう一つの新しい機能にしようとしているところです。DMP(データ管理計画)というものが各ファンダーから要請される時代になっており、それを簡単に作るためのツールの開発が世界で進んでおります。今までメジャーなところでは、DCC(Digital Curation Centre)で作ったDMPのためのツールとアメリカが作ったツールの二つがありましたが、それが一つに統合されまして、DMProadmapという名前で、一番初めのバージョンの最終開発が現在進んでいるところです。NIIとしましても積極的にその開発に関与して、日本語化も含め、日本のファンディングエージェンシーがDMPをより積極的にリクエストしてきたときに研究者をサポートできるようなツールを用意していこうと思っております。
  DMPというのは一つの研究をスタートするときのキックオフのドキュメントになります。ただ、研究が進んでいく、研究を進めていく上で、研究データの管理計画の中には、どういったデータをどういった装置からどのように取得して研究データを管理し、この部分に関しては公開するということを書くドキュメントですが、それは研究の状況によってどんどんダイナミックに変わっていきます。この研究データ管理計画は、現状ではファンダーにリクエストされて、それを提出するためのドキュメントという意味合いが強いのですが、そうではなく、一つのプロジェクトを進めていく上でのマニフェストファイルであり、研究の過程や変化を捉える一つのドキュメントとして研究データと一緒に管理していく仕組みとして、我々としてはDMProadmapをうまく拡張していきたいと思います。その意味ではDMPは、研究データ管理計画ではなく、研究データの管理レコードのストアのような機能をこの管理基盤と一緒に構築できれば有意義ではないかと考えております。
  これが最後のスライドになりますが、全体としましては途中でEOSCのところでも紹介した通り、こういったスタックでサービスが作られています。Horizon2020としてはこれを実現するためのサービス群というのが用意されており、日本の状況と対比すると、この分野サービスというのは個々のデータベースがあります。EOSC-hubというのはポータルのような機能なのですが、我々NIIにはSINETがあり、認証のフェデレーションのGakuNinがあります。クラウドを提供する上では、GakuNin Cloudというパブリッククラウドをうまく使って調達していただくためのサービスや、Cloud Gatewayという自分たちが機関として使えるクラウドサービスを使うためのポータルのようなサービスもあります。その上にコモンサービス・シェアードサービスとして、今、GakuNin RDMとWEKO3というのを作ろうとしています。トップのところはディスカバリとしてCiNii Researchを作ろうとしているのですが、その下のところがまだ日本としてはミッシングパートです。コンポーネントとしては我々がやってきたCloud Gatewayに機能的には近いのですが、それをよりパワフルにしたようなものが恐らくこの間に必要なのではないかと思います。それをすることで、分散されている分野間のプラットフォームがうまくつながっていく足掛かりになりますし、そこのデータをCiNiiに流していくためのコミュニティや、あるいは仕組みができてくるのだと思います。
  これはNIIのサービスなのですが、Eインフラという意味では日本にはこれ以外にもたくさんの研究インフラがありまして、それを日本としてどのようにつなげ、有機的にしていくか、コストエフェクトを高めていくかということも、課題として挙げられるかと思います。ヨーロッパやオーストラリアではそういったことに対する取組が既に始まっていることが状況から読み取れます。かつ、インフラ提供者とポリシーメーカーがうまく連携しながら進めていくのは当然ですが、こういったものを作りながら、最終的に、それを日本のオープンサイエンスクラウドと呼ぶのか何と呼ぶかは置いておいて、もう少し日本においても研究におけるEインフラの位置付けというのが認知されるようにならないといけないのではないかということが、世界の動向を見ておりまして、私として感じたところでございます。それにうまく追い付けるように、NIIとしては基盤の整備を今後も進めてまいります。
  以上でございます。
【喜連川主査】    かなり網羅的になお話を頂きまして、部分的にはIT色が相当濃いところもあろうかと思いますが、これから、いろんなアングルからの議論ができるかと思います。是非、御質疑をお願いしたいと思います。どうぞよろしくお願いします。
  どうぞ。
【逸村委員】    大変面白く聞きました。以前、ここの委員会でも議論になったのですが、最後のところのEインフラの話の理解、これがなかなか日本では理解されない。SINETでもそうなのですけど、それがきちんと動かないとこの話はなかなか先へ進まないという感があるのですが、その辺りは何かお考えはありますか。私は大学の人間なので、大学の執行部に対してそれをどう理解させるかという、そういう話なのですけど。
【山地国立情報学研究所教授】    世界と比べると歴史的な歩みの長さが違うというところも多分にあるのではないかと思います。今はオープンサイエンスということで語っておりますが、アメリカも含めてヨーロッパでは、グリッドの時代やEサイエンスと言われていたころからの流れをうまく汲(く)んで、今のオープンサイエンスのための研究データ管理のインフラと、名前を付け替えながらうまく発展しているところがあります。これをどうすれば国内における、例えばEインフラの投資というものをきちんとやらなければ日本の研究力がうまく高まっていかないというふうに言えるかどうかは、恐らく私の範疇(はんちゅう)を超えることなので、皆さんに御議論を頂きたいところです。
【喜連川主査】    頂いた御質問はそれを発表者に聞くのはかわいそうかもしれませんが、NII的には、具体的にどんなものなのかというような、いじれるようなものをまず作るということが結構重要なのではないかなあと考えた次第です。思って、フィロソフィーの話は各所で延々議論をされているのですけれども、その次の一歩をまず踏み出すことが重要ではないかなあと思い、実装を進めてこれを作っております。その後、この展開をどう持っていくかといいますのは、もちろん内閣府さんにも御相談をするととともに、前期の学術情報委員会でも学術会議の方から御紹介を頂いたことがありますから、そういうところに御紹介をしていくとか、あるいは国大協の方に御紹介をしていくとか、そういうパスはいろいろ考えていきたいと思っています。ようやく、きょう、本日御発表させていただけるようなレベルにそこそこ到達しつつあるというのが実情です。これまでは何もありませんでした。ので、そういう意味で、逆に先生方から、どういう展開をすればいいかというような御示唆も併せていただければと思います。
【逸村委員】    ありがとうございます。34ページですか、今、うちの大学でも学内における研究データ管理のポリシーに関してようやく議論がまとまりつつあるところなので、次の、具体的にどう行くかというのは、やはり大きな話だと思いますので、いろいろ、よろしくお願いいたします。
【喜連川主査】    きょうは具体例を発表されなかったのですけれど、やっているところのイメージ感とかを御紹介すると、大学の中で何を検討しなきゃいけないかみたいな話が、もうちょっと肌で感じられるようになるかもしれないですね。そこはまた改めて準備をしていきたいと思いますが、まずは、今、先生がおっしゃったことが、多分、各大学、ほとんど並行して起きておりますので、その御議論の材料になるように、これ、一生懸命間に合うように、文部科学省様から一定程度の御予算を頂きながらここまで来たこともありますので、そこの素材に、今はもちろん完璧ではないと思うのですけど、少なくともこんなフローで研究が進んでいくのですというところは御紹介したいと思います。きょうは視点が管理者指向でした。アッパーが多かったので、一番底辺の研究者目線のところは少し欠けていたかもしれません。と思うのですけれども、それも今後御準備したいと思います。
  ほかに……。安藤先生。
【安藤委員】    すごく整理されたお話、ありがとうございました。私も大学の人間なので、一般論として幾つかはやらなくちゃいけないことが少し見えてきた感じがします。逆に、先ほど最後に見せていただいた、日本と他国の比較から見える課題というスライドで、分野別サービスとか、課題としてクエスチョンが付いているあたりで質問があります。ここでの趣旨は、学協会というか、分野によって、全然、データの共有の感覚、この重要さも違うということでしょうか。例えば、ライフサイエンスであるとか、天文であるとか、情報関係とか、分野ごとに固有の文化やコミュニティがあるというところを注目すると、それぞれ固有の分野をカバーする、学協会が果たさなくちゃいけない役割も大きいという気がします。この観点は本日の発表では強調されてはいなかったと思います。国とか、大学の責務という話と同時に、このような学協会、国際的にはユニオンなど、そういうところが担うべき役割もあるのか思いますが、そこら辺はどんな感じで見たらいいでしょうか。
【山地国立情報学研究所教授】    学協会というのは、例えば学会……。
【安藤委員】    学会とかですね。
【山地国立情報学研究所教授】    これは一つの具体的過ぎる例かもしれませんが、昨日の夜、EUの方とテレビ会議をしていて聞いたことですが、Horizon2020の下に大きなオープンアクセスのプラットフォーム、ジャーナルプラットフォームを、現在、EUのお金を使って作ろうとしているそうです。商用出版社に頼らないアカデミックな人たちでそれがうまくいくかどうかというのはまだグレーなところはあると思いますが、オープンアクセス化を推奨するような取組がヨーロッパの中では一つ進もうとしています。日本の学協会の中では、我々の機関リポジトリの取組の中でもオープンアクセスなどを推奨する上で、学協会としてのポリシーがまだうまく固まっていないという話を聞きますので、まずはオープンアクセスを進めていく上で、今後ファンディングエージェンシーが出したお金を使って出した論文は全部公開するという流れになったときにうまく対応できるような連携をしていく理由は、一つあるのだと思います。データに関しては、データベースを運用していくというのはかなりお金が掛かることだと思いますので、現状ではかなり強い学協会でないと、データベース運用というのは難しいかもしれません。ただ、だからといって海外にそれが流れていくのはよくないので、機関リポジトリと連携するというのも一つのパターンでしょうし、我々が提供するインフラやJSTが提供するインフラというのを、どのようにうまくデータの管理の機能を組み込みながら使っていただけるようにするかということは、一つ、議論のネタとしてあるべきではないかと思います。
【安藤委員】    関連して、いろんなユニオンや、各国の学術会議などの集まりであるICSUなどでは、興味のある単位が集まるインタレストグループであるCODATAというアクティビティーを核として、データ利活用に興味を持つユニオンは手を挙げてください、という形で同志を募るなどの活動が、学協会を単位としてまさに起きています。逆に、何の話かという興味の薄い分野、ユニオンがある一方、そのようなデータの共有は昔から当たり前のようにやっていますよという分野もあり、すごい温度差があることも事実だなあと思っています。人材も限られていますし、その辺りのところが、分野別サービス的な取り組みもすごく重要であるなと思って、質問しました。ありがとうございました。
【山地国立情報学研究所教授】    当然、機械としてつなげていったり、データをためていったりするような仕組みということもありますが、先ほどのお話をお伺いして、それ以前に、今は余り意思疎通や連携がされてない学協会間での情報連携や、大学・図書館も含めて、例えば本日私が話したような内容をうまくシェアできるようなコミュニケーションの場所として、例えばCODATAなりICSU というのは一つ意味があって動いているところはあると思います。国内でそういったフォーメーションをどのように作っていくかということについては、どこかハイレベルなところから働き掛けを行うということもありかと思いました。
【喜連川主査】    家先生、先にお願いします。
【家委員】    同じような趣旨の質問になるかと思うのですけれども、私もそこのクエスチョンマークが付いているところが大変だなあと思っていまして、これの3ページほど前に「実験からの発展」というのがあって、そこのところに「小規模ラボでの利用」というのがあって、「医学、地球科学などのラボレベル」と。こういった分野を選ばれたというのは、何か理由があるのでしょうか。やりやすいところからという感じなのでしょうか。
【山地国立情報学研究所教授】    余りかっこいい応答はできませんが、NIIとしてサービスをデプロイしたり、仲間を増やしたりしていくときに、やっぱりやりやすいのは、身近な人から始めるという、そんな……。
【家委員】    パーソナルの……。
【山地国立情報学研究所教授】    はい。我々のシステムとしてもまだ完全にできているものではありません。ただ、このシステムを使ったら面白いことができるかもしれないというフィードバックがあったところとは連携しながら、新しいシステムというものはアーリーアダプターとして使っていただく側にもちょっと面倒くさい作業をお願いしたりということがありますので、身近な人たちや我々でこの機能のサービスの紹介を、全国を行脚してNIIのサービスの説明会を開いて発表したり、分野での学会とか研究集会みたいなところに呼ばれて発表することがありますが、そういったところで紹介して、面白いという応答を頂いた方とより具体的なラボでの利用を始めてみているというのが一番上のところで、論理的に戦略的にここから進めているというわけではありません。
【家委員】    大変よく分かりました。そのことと、先ほどの御質問にあった学会レベルでの、というのとどうつなげていくかというのが、難しいところかなというふうに思います。ありがとうございます。
【喜連川主査】    やはり、ライフはデマンドが圧倒的に大きいですね。それは、いわゆるリプロダクションを小さくするというか、リプロデューシビリティーを上げるという意味で言いますと、フィジックスはそういう可能性というのはかなり極度に少ないわけですけど、ライフはやはり、ずるが多い傾向にあるように感じます。とかいうのではなくて、これは学問の性質から来るものかと思います。それゆえに、なかなか不安定なところが多いというので、デマンドは極度に高いということから、支援を依頼される場合が多いというふうに御理解頂ければと。
  北森先生。
【北森委員】    安藤先生とか家先生の御質問と非常に関連することなのですけれども、やはりステークホルダーとして学協会というのは極めて重要な組織であると。そのときに、何度か同じようなことを言っているのですけれども、欧米の学協会は、ハイ・インパクト・ファクター・ジャーナルを持っていて、なおかつ潤沢な資金がありますと。日本は、研究レベルは高いのだけれども、ハイ・インパクト・ファクター・ジャーナルはなくて、学会自身は潤沢な資金とはとても言えない状況ですと。この中で今お話しいただいたデータに関するリポジトリと国際連携というのが進んでいくときに、何が起こって、どこでどういうふうに個人レベルの研究者がやるべきことと、それから、国あるいはかなり上のトップダウンのところでどういうシステムを整備するかというところは、両方とも現場になったときのことを想定して考えていく必要があるのかなというふうに感じたのですが、それに当たっても、今回お話を伺って、随分できているのだなあということは、非常にインプレッシブに伺いました。
  じゃあこれをどうやって使うかというところは、アッパーレベルと、ローワー、ローエストのレベルと、二つあるのではないかと思うのですが、36ページを見せていただくと二つあって、まず、研究者のところでは、下の方に論文の投稿というところがありますね。ここのところで、先ほどの状況から言いますと、ハイ・インパクト・ファクター・ジャーナルに出そうと、そういう研究者の本能で、欧米の学協会のジャーナルを選ぶ。そのときに、先ほどEUの方の状況のお話もありましたが、今、各学協会がジャーナルに対してデータジャーナルを今出そうとしていて、そこのところのEインフラとの連携のことをもう既に話しておられる。そうなってくると、そこの論文投稿のところで論文もデータもどこかのリポジトリに入れましょうということになると、自動的に日本で出した非常に重要なデータは海外に行くということになる。自動的にそうなってしまうということですね。だから、そのあたりに関して、まず、日本の中の研究者が出したデータを日本のEインフラのところにキープするということをこれからどういうふうに実行していくのかということ。
  それからもう一つは、上の方の海外の方のトップレベルの方で、ある意味強制的にこのジャーナルにペーパーを出すときにはサプリメンタルデータも含めてこっちに入れなさいと、先ほどのところが戦略として出てくる可能性がありますね。そこに関しても、こういうシステムをお作りになった上で、どうお考えになるかということを、もし情報があれば御提供頂ければな、というふうに思います。
【山地国立情報学研究所教授】    このようなときには「私はインフラ屋なので」と逃げるのですが、初めの質問に関しましては、我々はこのリポジトリを、現在は機関リポジトリにメインで使っていただくことを想定したシステムとして作っていっておりますが、学協会に対してのサービスではJSTが行っているJ-STAGEというものがありまして、そこともうまく連携しながら、当然ながら学協会の方々がデータジャーナルをやりたいとか、あるいは論文にエビデンスデータを載せたいとかいうときに、国内の場合、我々のインフラもお手伝いできる部分がないかということは、連携しながら進めていきたいと思います。
  二つ目の、トップジャーナルに対してデータもそこに流れていってしまうことをどういうふうにインフラ屋として見ているのかという質問に関しては、これも運用的な側面がありますが、ジャーナルサイトにレコグナイズされたデータリポジトリを運用していくということがあります。そのための一つの指標として、きちんと運用している、リポジトリとしての品質を保証するシールのような枠組みが現在はできており、これはインフラの整備というよりも主に運用的な側面が高いのですが、ただ、我々はインフラ屋なのでそんなものは知らないということではなくて、実際に運用している機関リポジトリもその役割を担えるかもしれませんし、我々に近いところで機関リポジトリのコミュニティがありますので、例えば、データリポジトリとしてのシールを取って海外のジャーナルサイトに認識され、ここに自分たちのエビデンスデータを置いてもいいと認識されるためには、リポジトリのインフラ屋としてどうすればいいかを考えていく必要があります。そうすると、論文自体は外で大きな出版社から出版され、データはうちに残る、あるいは機関リポジトリに残るというフレームワークができると思いますので、そういったところは徐々に、図書館員の方々も意識しながら始めようとしているところです。JSTでされている研究データ利活用協議会の中でもそういったデータリポジトリシールに関するワーキンググループができていて、これを国内でどう普及させつつ、自分たちのデータリポジトリを世界的に認識される品質の高いものにしていくかという議論も始まっております。我々も、システムを作るだけではなくて、そういうところにも積極的に絡みながら、機能的なサポートができるようにしていきたいと思います。
【北森委員】    なるほど。恐らく、国費で得た良いデータを守っていくということでは、多分、そこは最後のとりでじゃないかなという気もするので、データリポジトリとしての信頼性だとか、あるいは安定性、それから、日本だけじゃなくて世界の研究者が、ここを使えばという、そんなものができていけば、ここで食い止めることは何とかできそうだなという気もしないではないですね。
  それから、これはコメントなのですが、J-STAGEに対しては、大きな学会のジャーナルは離れていっている傾向にあるというふうに聞いています。化学会であるとか、それから物理学会もそうじゃないかなと思うのですね。中規模よりも小さいところはJ-STAGEに頼っているのですが、大きいところが離れていくということになると、今おやりになっていることと相反する動きになってしまうのではないかなというふうに思いますので、そのあたりはちょっと調整する必要はあります。
【喜連川主査】    離れているのは、何か理由があるのですか。
【北森委員】    どうも、サービスの点らしいです。物理学会はどうですか。
【家委員】    私、物理学会を代表して言える立場じゃありませんけれども、物理学会の場合は自前でそれより前からやっていたということがあって。
【喜連川主査】    そうですか。山地先生のサービスは、きっとサービスのレベルが高いので、余りみんな逃げないのではないか。
【家委員】    J-STAGEも、どんどん進化していると思いますので。
【喜連川主査】    国としてどうするかを考えていった方がいいですね。
  きょう、本人は言わなかったのですが、改変不能性をどう担保するか。これは非常に重要で、そういうところからシールを取る。こういう話も、地味なのですけれども、随分あるということです。
  竹内先生。
【竹内委員】    ありがとうございます。技術的には大変整った、よく考えられた基盤ができつつあるということを理解いたしました。先ほどの幾つかの御質問とも関係するのですが、データリポジトリとして見た場合、信用度を高めるということを考えると、従来の機関リポジトリをベースにする、あるいは分野別リポジトリをベースにするというよりは、むしろ非常にきっちりとしたナショナルデータリポジトリを作るという考え方も適用できるのではないかというふうに思うのですが、それについてのお考えをお聞かせいただきたいと思います。それが1点目の質問です。
  もう1点は、18番のスライドになるのですけれども、確かに、技術的な基盤ということで言えば、きょうお話しいただいた内容というのは非常によく整理されているわけですけれども、そこの上に乗っかってくる、制度的な基盤というか、社会的基盤といったようなもの、例えば、ここに挙がっているような様々なID類、これを一体どういう形で整備していけば、御提案頂いているような技術的な基盤の上に展開される、論文等のオープンアクセス、データを含むオープンサイエンスといったものが実現するのかといったようなことについて、少しお考えをお聞かせいただければ幸いです。
【山地国立情報学研究所教授】    まず、一つ目の質問ですが、どちらがいいと言うのもなかなか難しくて、世の中は分散と集中の繰り返しという歴史があります。機関リポジトリの一つ大きな利点としては、サービスがスーパーディストリビュートされていることが挙げられます。例えば、現在アメリカではCenter for Open Science(COS)がプレプリントサーバを運営し、そこに国費や私立の財団から資金が入って集中型に行っている、非常に効率的に行っている部分が、NPOですけれども、あります。ただ、COSの危険なところは、資金が尽きて出版社に買われてしまう可能性があることです。結局、今までそういうパターンなのですね。ナショナルレベルで国費が投入されればそのような危険性というのはありません。ただ、我々が今やっているサービス・JAIRO Cloudを見ますと、見掛け上は各機関リポジトリ・組織のリポジトリとして動いていますが、システムとしてはバックエンドで動いているアプリケーションは一つです。現状ではクラウド上でセパレーションされていますが、一つの大きなSaaSだと思えば、仮想的ではありますがナショナルリポジトリというふうに言えます。それと同じぐらいのコストパフォーマンスのいい運用はできていると思うのです。どちらがいいと言うのも難しいし、今まで組織で運用する機関リポジトリができてきたという歴史もありますので、判断が難しいところではありますが、アーキテクチャーとしては一つのナショナルリポジトリ的なものがある意味できているというふうに判断してもいいのではないかなというふうに思います。
  二つ目の質問は、我々の検索基盤としても、例えばOpenAIREと比較してもビハインドしているところです。OpenAIREは、研究者に向けては検索するためのディスカバリサービスとして非常にいいサービスをしていますが、Horizon2020に向けては研究成果を一元的に管理して、ある意味研究IR的な要素も含めてファンディングエージェンシーにコアデータを提供できる仕組みというふうに位置付けて、そこがうまくできているので、きちんとお金を取れているところがあります。そういったものもあり、ID化も含めてバックエンドのロジカルなところが非常に整備できているという状況にあるのではないかと思います。
  日本はそこまで、CiNiiはどちらかというとボトムアップに作ってきたものですので、うまくマージできていないところがあり、マージできてないが故に、例えば研究者のID一つとってみても、例えば現在世界的にはデファクトとしてORCIDというものが進んでおり、ORCIDを使うのが大手出版社にとってもデファクトになりつつありますが、日本の場合はまだそれがナショナルとして号令が掛けられたり、例えばe-Radの中にORCIDのIDを入れるという雰囲気にはなっていないところはあります。我々としても、そういった何らかの、強制過ぎないがあるとみんなが幸せになれるレベルでのインフラの整備の意味も含めて、例えば研究者IDを振ったり組織IDを振ったりする、ただそれを余りやり過ぎると全部がトラッキングできてしまい危険な要素もありますが、そのような制度設計がされると、例えば検索基盤に関してもバックエンドのナレッジベースが非常に作りやすいです。パブリッシュされるもの全部にDOIを振ってしまえばトラッキングも非常になくなります。そういったトップダウン的なアプローチは、質問に答えられてないですが、NIIとしても非常に期待したいところではあります。
【竹内委員】    ありがとうございました。
【喜連川主査】    辻委員。
【辻委員】    どうもありがとうございます。初めにイギリスの事例で、OSS(オープンソースソフトウエア)で初めは作られていたけれども、それが持続的サービスを提供するという観点で商用サービスを使う方に少し倒れてきているというお話がありました。一方で、NIIさんの方で、マイクロサービス化して、なおかつDev/Ops的なところを回してというところを志向されていて、OSSを使われていると思うのですけれども、その方向性としてはすごく賛同するところだと思いました。その一方で、イギリスが持続的なという方向に行っているのに対して、我々が今志向しているところの対比といったあたりについて、どう思われているのかといったところをお伺いできればと思いました。
【山地国立情報学研究所教授】    幾つかの側面があると思いますが、例えばオープンアクセスというものに対して、機関リポジトリというのはみんな、各大学、それぞれの大学が独自にやると、年100万から150万ぐらいかけて運用していたと思いますが、それだけのプラスアルファのお金を掛けて論文を書く・読めるということは必要なのだというのを意思表明していったわけですね。それはモノポリーに対するカードを持つという意味で、大学が身銭を切ってアクションをしたということですが、研究データに関しても放っておいたら何らかのモノポリーになる可能性があります。国として何を守るか、守るのは誰の責任であるかというのを、きちんと共通の認識を持った上での投資をしていく必要があるのではないかと思います。特に、日本は大手の出版社がないので、そこに対してカードを持つ必要はあるのだと思います。
  かつ、我々は今、オープンソースのソフトウエアをメインに使おうとしています。当然ながら大手の商用出版社が持っているサービスは、我々が投じている額とは桁が違う金額を投じていいものを作っているので、インターフェース的にも優れているし、どんどんいい機能を作っていこうとはしています。ただ、アカデミックとしてそれでいいのかということが、我々がオープンソースを意地でも使い続ける意思表示でもあります。アカデミックとしてのサービスは何らかの形でアカデミックがコントロールできる状態に持っておく必要があると思います。NIIは技術者集団としてそれをサポートしながら、大学が本当に欲しいと思う機能を作っていくべきです。商用のサービスにこれが欲しいと言っても、カスタマイズは幾らですと言われて終わりなので、意見を集約しながらNIIとしてシェアードサービスとして開発してDev/Opsでサービスに入れていくというのは、当然、無駄なところもありますが、日本の高等教育機関の皆様を幸せにしていく上では必要なことではないかと思っております。
【辻委員】    本当にそのとおりだと思いました。特に、開発コストだけじゃなくて、方式検討コスト、開発コスト、運用コスト、いろんなことを考えていったときに、NIIさんが進めてくださって、ある程度母体ができた上で、プレーヤーというか、学協会だったり、大学だったりといったところが使えていけるというのが、有り難いところかなと思いました。どうもありがとうございます。
【喜連川主査】    引原先生、どうぞ。
【引原主査代理】    ようやく御説明いただいたということで、うれしく感じているのですけど、主査がおっしゃったように、フィロソフィーから次の一歩を踏み出せるというのは非常に大きなことなのです。前回、山地先生はおられなかったのですが、農研機構の大澤先生がおっしゃった中に、研究者が個人的にためてきたデータが、その人が仕事を終える段階で散逸してしまうと。それは個人の能力の限界を超えているわけですね。それを今までずっと個人能力に頼って何とかサポートしてきたものがシステム的にならないといけないというのが、前回、かなり言われていたものだと思っています。
  それで、このシステム、私もちょっと議論をさせてもらいながらここまで来ている中で、大学でもこれをどういうふうに入れていくか、非常に重要な視点になっていまして、NIIを基盤としてやっておられるところに各大学が同じように考えるサブのグループを持たないと、使い方というのはなかなかうまく回らないだろうなと思っています。声の大きい人から言えば、研究公正の話ばかり言われてしまって動かなくなりますし、リポジトリがそうであるように、各機関の中でこういうシステムを独自に運用できるだけのグループを作るということが重要なのではないかなというのを、私、一つ思っていました。
  もう1点ですけれども、さっき北森先生がおっしゃったように、ハイ・インパクト・ジャーナルにデータが流れていくというお話があったのですけれども、それを今は止めようがないわけですね、はっきり言えば。逆に、このシステムにハイ・インパクト・ジャーナルに載る論文を作るようなデータを乗せてほしいなと。逆回しをしないと、絶対に流れていくと思うのですね。そのためには、先ほど安達先生がおっしゃったのかな?  認証のあるデータサーバにしてしまわないといけないと思うのですね。Springer-Natureとかが言っているような、これが公開認証のデータサーバですよと、彼らは勝手に言っているわけですけれども、それを書き替えるようなもの。同じものであってもいいと思いますけど、まずそこの認証を取ってしまって、国内的にはそれが取れれば日本では唯一のサーバになると思いますので、そこに載せるというのが戦略なのではないかなというのは前から言っていることだと思います。前期の学術情報委員会に私を呼んでもらってしゃべったときに、それをかなりここで言わせていただいた覚えはあるのですが、そこが最後のとりでのような気がしています。今回、せっかくここまで立ち上がってきていますので、うまくそこにいいデータを載せるというのが一つあるのではないかなと思っています。
  いいデータが出ても論文がどこか行ってしまうのは嫌だというのであれば、COSがやっているようにプレプリントを押さえるというのは重要なポイントだと思っていて、プレプリントは大学のリポジトリがかなり押さえているわけですから、そことうまく流れをつかむ必要があって、もう出てしまったものを押さえることは多分できないと思うのですね。だから、手前で押さえてしまってやるというのが重要で、ちょっと話は続きますけれども、私、アーカイブ・ドット・ウエブの委員会に行っていますけれども、あれも、今、プレプリントをどういうふうに押さえていくかというために、学協会とかなり連携をとろうとしています。今、APSとか、AIPとか、ACSとか、アメリカの大きな学会と連携を始めていまして、そちらのエディターとの集まりの中でも、プレプリントとして出すことを止めないという発言まで出させています。日本でどうかというと、まだ躊躇(ちゅうちょ)されていますよね。その状態では結局は全て失ってしまうということの典型だと思いますので、話がいろいろ混ざりましたけれども、データはいいものを置くと同時に、元に戻ってプレプリントを置くということを連携していただきたいなというふうに思っています。
【喜連川主査】    そこまでやりますかね。
【山地国立情報学研究所教授】    当然、運用の一つのアイデアとしては、我々は基盤を構築し、例えば、シールを取るかどうかはワークフローがどうかというところに多分に労力がかかるといいますか、クオリティーコントロールのポイントになっていきますので、それはシステムというよりも、実際の運用をどうきちんとやっていくかの問題ですね。そういった意味では、我々が運用までやるのか、例えばデータリポジトリの運用に関しては我々のシステムを使っていただきながらJSTさんにやっていただくとか、そういう関係作りもあるかと思います。
【喜連川主査】    NIIの場はここまででもかなり苦労してようやくこぎついたというところです。ひいひい言っていますので、おっしゃっていることは非常に、妥当というか、すばらしいポイントだと思うので……。
【引原主査代理】    山地先生がおっしゃったように、外出ししてやるというのはいいと思いますけどね。
【喜連川主査】    それの方が身の丈に合っているかもしれないですね。今後のそれは重要な検討事項じゃないかなあと思います。
【美馬委員】    運用というか、今後の運用の方向の可能性について、コメントと、お伺いしたいこととあります。今回、ここまで本当に技術的な、この委員会でも議論をしてきたことがこういう形でもう既に出来上がってきているというのに、とても驚きました。ありがとうございます。先ほどのお話から、機関リポジトリであるという、一番の目的がその基盤を作るということだったのかもしれませんが、分野別サービス、分野別のところがかなり違ってくるということであれば、更にどこかの学会としっかり組むことはないのでしょうか。こういう技術的な基盤ができたところで、今までの作るというところから、今後、より多くの人たちに使ってもらうように広めていくというフェーズに移っていくわけですね。そのときに、今までも実験で特定のラボと小規模なところでやってきたということでしたら、今度はどこかの学会としっかり組むというのがあると思いました。そういう中で、一つは広めていくときの、草の根的にやっていくということと、もう一つはどこかとトップダウン的にやるという、その双方向でしょうか。さらには、実験とか小規模なところから出てきたグッドプラクティスとか、そのストーリーを幾つかそろえて見ていくと、次に続く人たちが自分も参加してみようと思うのではないかと思います。
  最後にもう一つ、トレーニングについて。先ほど、COSかな?  どこかがトレーニングサービスもやっているというところでは、このシステムを段階踏んで利用していくと、若手研究者とかに、こういうふうにこういうものをそろえてこうやっていく必要がある、というようなトレーニングにもなる、ということがきちんと出てくるといいと感じました。何か、今後そういうことでお考えがあれば、お聞きしたいと思います。
【山地国立情報学研究所教授】    前者は、当然ながら、ドメインサポートという意味で、学会のサービスを提供しているJSTと連携しながら学会と組んでいくということはあると思います。ただ、我々NIIとして、情報学の分野の学会とは連携しながら、どういったうまいものができるかということはずっと議論をしておりますので、我々の得意な分野で行いながら、より一般的な学会で我々の基盤をどううまく使えるか、使っていただけるかというところに関して、もう少し組織を超えて議論をしていきたいと思います。ありがとうございます。
  二つ目のトレーニングコースですが、昨年度に図書館の人たちと一緒に研究データ管理のためのトレーニングコースを作成し、これをJMOOCから公開しました。こんなニッチなものは誰も見ないと言っていましたが、2,000人以上の方々に登録を頂き、JMOOCの場合は数が多くても修了率は低いのですが、それでも、図書館の方々が多かったという理由が多分にあると思いますが、修了率が一般よりも高く、好評に第1回の講座を終えました。年度末にかけて、今度は研究データ管理を支援する人たちにフォーカスした、もうちょっとディープな内容も含めたトレーニングコースの準備を進めております。私もその中の1章を担当しておりますが、研究データ管理とはどういうもので、例えば図書館の人たちやURAの人たちがそれをサポートするとしたらどういった側面があるのかということを、幾つかの切り口で章立てをしたトレーニングコースを作っております。春になれば恐らくオープンできますので、そういったところを大学関係者の方々に見ていただきながら、また、NIIの研究データ基盤ができた段階で更にそのコンテンツにシステムの使い方も含めながら、使っていただける仲間を増やしていければと思います。ありがとうございます。
【喜連川主査】    林委員。
【林上席研究官】    いつもお世話になっております。一つは、美馬先生に関連して、やはりスタートのポイントとしては、本気でこれを使ってくれてユースケースが生まれて、いまだに論文を書かないといけないので、論文を書くときに、謝辞でもどこでもいいのでそれが入って、トップジャーナルの中でのプレゼンスを示すみたいなことを考えるのがいいのかなと。将来はもっと変わると思いますけれども、今段階でのプレゼンスの出し方はあるのかなと思いました。
  もう一つは、内閣府の政策討議に出た関係もあるので無理やりつなげたいのですけれども、スライドの32ページのところに「機関のポリシー等の制約などにも対応できるようにいくつかの運用オプション」というふうに書かれているのですが、今、内閣府は、研究データ利活用ポリシー・オープン・アンド・クローズ戦略を踏まえて、各研究機関や、いずれは大学に作っていただきたいという方向で議論を進めているので、むしろ、これを使うことが機関ポリシーを作ることにも役立つというか、表裏一体、これを導入するときにポリシーも作りやすくなるみたいな、そんな運用の仕方になればいいなと思った次第です。
【山地国立情報学研究所教授】    ありがとうございます。そのように進めてまいります。
【喜連川主査】    じゃ、安達先生。
【安達国立情報学研究所副所長】    簡単に述べます。オープン○○と言うと、何となく、ただのようなイメージで議論がされるケースがあるのですが、基本的には相当のお金をかけてオープンサイエンス、オープンデータ、オープンアクセスを維持するというのが現実であります。先ほど引原先生が言われたことに関しましてきょうの議論に出なかったこととしては、ファンディングエージェンシーの役割が極めて重要になっているということがあげられます。山地先生が御紹介されたイギリスの例でも、Jiscの上にHEFCE(イギリス高等教育ファンディング・カウンシル)があり、そのポリシーを実体化しているのがJiscですし、ドイツですとDFGが強力にお金の面で支えているという面があります。そのような意味で、例えば科研費を使ってできたデータベースで論文を書いたときに研究者はどうしなければならないかというようなことについて、つまりデータ管理ポリシーなどへの対応などを体系的に行うことによって、先ほど出ましたナショナルデータリポジトリのような形に持っていくなどの方向が考えられます。諸外国の例では、アメリカですとゲイツ財団が相当はっきりしたポリシーを出していますし、イギリスでもウエルカム財団もそうです。学会に関するお話もたくさん出ましたが、ファンディングエージェンシーがこのようなことに果たす役割は極めて大きいので、日本ではそこの議論がまだまだ不十分かと思いました。
【喜連川主査】    一言もしゃべっていない方……。
【永原委員】    ファンディングエージェンシーの方の立場から質問させていただくべきかどうか、迷っておりました点を発言させていただきます。日本学術振興会で科研費を扱っている立場としましては、一番気になるのは、分野間の温度差という問題です。論文データベース等、ただ今議論のあった取り組みに迅速に対応できる分野と、そうではない分野の温度差が大変大きいのが現状です。ファンディングエージェンシーが利用するためには、ある程度基盤がそろっている、誰でもがそれに対応できるということが必要です。確かに科研費でそれを求めれば嫌が応でも誰でも対応せざるを得ないのですが、実際に、科研費の審査会等で見ていますと、温度差が余りに激しくて、現状では少し厳しかろうという実感を非常に持っております。温度差があることは仕方ないとしても、ある程度のボトムラインを整備するのは、我々の役割ではなく、大学等のレベルで進めていただき、ボトムラインはある程度そろっていることが必要ではないかと思いながら伺っていたのですが、その辺りはどのように考えたらよろしいでしょう。
【山地国立情報学研究所教授】    その通りだと思います。NIIの限られた人数でできることは、デプロイの面において本当にごくごく限られたことですので、例えば、我々が大学のサポーターをトレーニングする、あるいは一緒にトレーニングする、彼らが実際に使っていただける方に対してサポートするという階層構造の枠組みを作っていって底辺を広げ、できるだけデジタルデバイドを研究の分野でなくしていく必要があります。かつNIIとしてはロングテールに近いところまでもサポートしていきたいという思いがありますので、そこは研究機関や大学と一緒に協力しながら、彼らを我々の営業部隊にする訳ではないですが、一緒に行っていく仕組みは作っていきたいと思います。
【喜連川主査】    丸山室長、もう一つぐらい質問を受けてよろしいですかね。時間になっているのですけど、せっかくですから。
【丸山学術基盤整備室長】    はい。
【五味委員】    簡単に、質問なのか、コメントをさせていただきたいのです。海外の事例をいろいろ聞かせていただいて、それに対する日本の、こういうインフラがもう出来上がってきているというのは、非常に心強い気がしております。通常、我々民間的に言いますと、こういう仕組みを作った後、導入のためのステップで、まさに今のお話にもありました、コンサルティング的なことをしながら、これを実際には導入していくことが多分必要になってくると思うのですね。なぜならば、先ほどの絵にもありましたけど、いわゆる研究開発におけるワークフローにどうやって適合させてこの仕組みを使っていくのかということを、誰かが、こういう仕組みに詳しい人がある程度設計していただけないと導入が非常に難しいのだろうというふうに思いますので、そのあたりのところを具体的な体制的にどういうふうに作っていくのかというのは、非常に大きな、これからのテーマになるだろうなあと思ったのが、一つでございます。
  もう一つは、37ページに幾つかレイヤがありましたけれども、研究者にとって非常に価値のあるレイヤというのはどこなのかなあと思いますと、一つは、一番上のディスカバリ、いろんな情報を速く検索して、いわゆる研究テーマそのものをブラッシュアップしていくという、ここの部分は、先ほど引原先生からもありましたけれども、多くの論文を、いかに価値あるものをどうやって検索していくのかって非常に重要なところかなあというところと、もう一つは分野別のところだろうというふうに思うのですね。そのときにやはり、先ほどから話題にも出ていますけれども、学会というのですか、分野ごとに多分、先ほどの研究のワークフローも違えば、そこが持っているデータベース等々も全然違うのではないかと思いますので、この二つは多分、非常に価値が出てくるところかなあというふうに、これを見て思いました。
  そういった点でクエスチョンになっているところは、今後、ここの部分はどうやって日本の研究の中で強化していったらいいのかというところも、我々としてもよく検討していかなければいけないなあというふうに感じた次第でございます。
【喜連川主査】    ありがとうございました。多分、きょうの御発表をお聞きいただく中で、委員の皆さん、大分具体感を覚えることができ、それが故に、データ基盤のシステムそのものよりも、そこから派生する諸課題についての御質問が随分たくさん出て、良いいい御議論ができたかと思います。けれども、そのおかげで一つの質問に対する答えが大分長くなってしまったので、時間がここまで押してしまって、誠に恐縮でございます。これは、また事務局の方とも御相談して、今後どのような議論を進めていけばいいか考えさせて頂きます。御指摘頂きましたおっしゃったことは、ほとんどそのとおりだと思っております。見ていただければ分かりますように、JAIRO Cloudのシェアが日本の7割近くぐらいになっておりますが、そこまでNIIのものがずっと広がってきたわけですが、それまでにやたらととても長い時間が掛かっております。いるわけですね。ですから、今御指摘頂いたように、今回、どれだけ加速化できるかがポイントです。するか。しかし、温度差が全然違うところがある。いまだに電子カルテを使えないお医者さんが山のようにいるのと、同じことだと思います。しかし、そういうところものにコンペティティブなリサーチデータツールのドメインをどう適用していくか、是非、また議論を深めたいと思いますが、最後に局長から御発声頂ければと思います。
【磯谷研究振興局長】    済みません、お時間頂きまして。16日付けで関局長を引き継いで新しく振興局長になりました、磯谷でございます。名古屋大学に理事・事務局長で1年ほどおりましたし、北陸先端大と東北大と政研大、四つの国立大学の現場を経験しましたので、きょうの話も大変興味深く聞かせていただきましたし、先ほど林先生がおっしゃったように、政策討議の方でも、喜連川先生も関わりながら、きょうはAIの話だったのですけど、毎週議論をしていまして、この前のオープンサイエンスのときは私の方からプレゼンをちょっとしたのですけれども、先ほどのデータポリシーについても、永原先生と安達先生の議論はもっともなので、我々としては、できるところからとにかくやろうかなと。できる競争的資金からやって、科研費は、多分すぐにはできないと思うので、徐々にやっていきながら。それから、さっき山地先生が言われたように、大学の方でも、私も名古屋大学の現場にいて、図書館の職員も大変頑張ってやっておりますし、京都大学ほどじゃないかもしれませんけど、その辺と、両面作戦で、多面作戦で、オープンサイエンスとか、データポリシーとか、あるいは、こういうインフラ整備、SINETを含めて取り組んでいきたいと思いますので、是非、御指導、よろしくお願いしたいと思います。
【喜連川主査】    どうもありがとうございました。
  それでは、お時間となりましたので、本日は終わりたいと思いますが、最後に事務局からお知らせはございますか。
【玉井学術基盤整備室参事官補佐】    事務連絡だけ。いつものことなのですけれども、本日の会議の議事録につきましては、皆様に御確認頂いた上で、公開をさせていただきます。
  あと、次回は、資料にもありますように、3月22日木曜日の14時から16時、場所は今回と同じく3F1特別会議室というふうになっております。前回の資料では3F2会議室と御案内しておりますけれども、今申し上げましたように、この部屋に変更になっておりますので、御注意ください。年度末の開催にて恐縮ではございますが、どうぞよろしくお願いいたします。
  以上です。
【喜連川主査】    ちょっと時間オーバーとなりまして、大変失礼しました。本日は、これにて終了としたいと思います。どうもありがとうございました。

――了――

お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)