資料4 オープンサイエンス推進における今後の審議に向けた課題等整理(案)

1. オープンサイエンスが求められる背景

(1)世界的な検討と我が国の現状

  ○ オープンサイエンス推進の方向性は、G7やOECDで議論されるなど、世界的に検討が進んでいる。既に米国やEU、豪州において、オープンデータの積極的な活用に向けた取組が進められている。
  ○ このような状況下において、我が国が世界の潮流に乗り遅れることがあれば、我が国の研究活動に大きなデメリットを生じる恐れが指摘されている。
    ・ 地球規模研究におけるデメリット
    ・ 研究活動における効率化、国際発信におけるデメリット
    ・ 日本の「見えない化」
  ○ 我が国においても、世界と積極的に連携し、オープンサイエンスの動きに遅れることなく、具体的な取組を進めていく必要がある。

(2)オープンデータを推進する意義やオープンデータへの期待

  ○ 研究データの相互利用を促進し、知の創出に新たな道を拓(ひら)くことが期待される。とりわけ、データ駆動型の研究を推進することで、イノベーションの創出につなげることを目指した新たな科学の進め方が注目されている。
  ○ 研究者間、あるいは専門分野を超えた知の創造の加速、新たな共同研究スタイルや研究方法の誕生が期待される。
  ○ 社会に対する研究プロセスの透明化による理解の促進、社会的認知の広がりによる新たな研究資金の獲得が期待される。
  ○ 研究の過度な重複を避けることによって、研究費の効率的な活用を可能とすることが期待される。

2. オープンサイエンス推進の方向性

  ○ オープンサイエンス推進の方向性は、内閣府における政府全体の検討や科学技術・学術審議会における審議等において以下のように示されている。

(1)内閣府、国際的動向を踏まえたオープンサイエンスに関する検討会まとめ(平成27年3月)

  〔国としての基本姿勢〕
  ○ 公的研究資金による研究成果(論文、研究データ等)の利活用促進を拡大する。
  〔オープンサイエンス推進の基本〕
  ○ オープンサイエンス推進の基本方針
    ・ 目的・意義 ・・・ 公的研究資金による研究成果として得られた論文や研究データへのアクセスを可能とすることで、研究成果の理解促進と同時に、成果の再利用による新たな発見や、新たな研究概念の創出とイノベーションを加速し、新たな産業の創出、競争力の強化、地球規模での研究の促進、経済成長等に貢献する。
    ・ 公開の範囲 ・・・ 公的研究資金による研究成果のうち、論文及び論文のエビデンスとしての研究データは、原則公開とする。その他研究開発成果としての研究データについても可能な範囲で公開することが望ましい。研究成果のうち、個人のプライバシー保護、商業目的で収集されたデータ、国家安全保障等に係るデータなどは公開適用対象外とする。
    ・ 公的研究資金の定義及び研究データの範囲 ・・・ 公的研究資金とは、競争的研究資金及び公募型の研究資金に該当するものとする。公開の対象となる研究データには、メタデータ、数値データ、テキストレコード、イメージ、ビジュアルデータなど多様なデータが含まれる。
    ・ 研究を実施する機関の責務 ・・・ 各機関においては、論文、研究データ等の研究成果の管理に係る規則を定める必要がある。特に、研究成果の散逸、消滅、損壊を防止するための具体的施策を講ずる必要がある。

(2)第5期科学技術基本計画(平成28年1月閣議決定)

  ○ 公的資金による研究成果については、その利活用を可能な限り拡大することを基本姿勢とする。
  ○ その他の研究成果としての研究二次データについても、分野により研究データの保存と共有方法が異なることを念頭に置いた上で可能な範囲で公開する。
  ○ 研究成果のうち、国家安全保障等に係るデータ、商業目的で収集されたデータなどは公開適用対象外とする。
  ○ データへのアクセスやデータの利用には、個人のプライバシー保護、財産的価値のある成果物の保護の観点から制限事項を設ける。
  ○ 研究分野によって研究データの保存と共有の方法に違いがあることを認識するとともに、国益等を意識したオープン・アンド・クローズ戦略及び知的財産の実施等に留意する。

(3)学術情報委員会「学術情報のオープン化の推進について(審議まとめ)」(平成28年2月)

  ○ 大学等における研究成果は原則公開し、研究者のみならず広く社会において利活用されることを、研究者等が基本理念として共有することが必要。
  ○ 分野を超えた新たな知見の創出や効率的な研究の推進等に資するとともに、研究成果への理解促進や研究成果の更なる普及が期待され、研究の透明性確保にも資する。
  ○ 公的研究資金による研究成果のうち、論文及び論文のエビデンスとしての研究データは、原則公開とすべきだ。
  ○ 論文のエビデンスとしての研究データの公開及び利活用を促進する前提として、データが研究者において適切に保管されることが重要。
  ○ どのデータをどのような様式で公開とすべきか、あるいはどのような場合に非公開とすべきかについては、研究者コミュニティ等による検討を踏まえた対応が必要。
  ○ 研究データを的確に保存し、活用していくためのプラットフォームの整備が重要。整備に当たっては、国際的な協調を図っていく視点も重要。

3. オープンデータ推進における検討課題等

(1)データマネジメントの推進

  1)データマネジメントポリシーの策定等

- 公的研究資金を用いた研究を行うための設備、ルール、人材等を具備している機関においては、論文、研究データ等の研究成果の管理に係る規則を定め、特に、研究成果の散逸、消滅、損壊を防止するための具体的施策を講じる必要がある。【内閣府検討会報告書】
- 研究データの保管・管理は、研究データの公開を進めるための前提であり、特に、公的研究資金による研究の実施段階から、研究プロジェクト等の終了後に至るまで研究データが利活用可能な状態で適切に管理されるよう、プロジェクト等の規模やその目的及び分野の特性等に応じ、データ管理計画を作成し計画に従った管理を行うことが必要となる。【学術情報委員会審議まとめ】
- 研究分野によって研究データの保存と共有の作法に違いがあることを認識し、特性に応じた計画等を策定する必要がある。【内閣府検討会報告書】
- 大学等においては、研究成果を知的資産と捉え、明確な方針の下で保管し、蓄積していくことが重要である。【学術情報委員会審議まとめ】

  →  研究分野別のデータポリシー策定を先導する観点から、研究開発法人(競争的資金配分機関を除く)については、CSTIが作成予定のコアガイドラインを踏まえ、それぞれの法人におけるデータマネジメントポリシーの策定が要請される見込み。
  →  競争的資金制度や公募型研究制度へのデータマネジメントポリシーの導入についても要請がなされる方向で準備中。

  2)マネジメント対象となる研究データの範囲及び様式

- メタデータ、数値データ、テキストレコード、イメージ、ビジュアルデータなど多様なデータがあり、データを扱うプログラムがある場合にはこれも含まれる。原則として、研究ノート、予備的分析、論文の草稿、将来の研究計画、同僚との私信、物理的対象物(試料、菌株、実験動物など)及び所属機関との契約により公開に条件が付されているものは含まれない。【内閣府検討会報告書】
- 公開される研究データは、利活用可能な様式でなければならない。メタデータ、数値データ、テキスト、イメージ、ビジュアルデータ、3Dデータなど多様なデータがあり、データを扱うプログラムがある場合はこれも含まれる。【学術情報委員会審議まとめ】


  3)研究データの信頼性及び透明性の確保

- 論文のピアレビューに相当するような評価の仕組みが必要。【内閣府検討会報告書】
- 論文、研究データの公開は、研究不正を回避する意味でも重要であり、科学技術の進展と研究活動の透明性、公平性を確保することが必要である。【内閣府検討会報告書】
- 研究データは利活用可能な様式で公開され、かつその信頼性が確保されていることが重要である。研究データを基にした精度の高い成果の再現を可能とするためには、研究で使用したプログラムやソフトウエアのバージョン等についても、データ作成者が公開時に明示する必要がある。【学術情報委員会審議まとめ】


  4)利活用を円滑化するためのルールの明示

- 研究データは著作物ではないため、CC0を採用することが望ましい。データの集積・整理や品質管理などの点で専門的研究者の労力や高度なノウハウが入ったデータベースなど、知的生産物として著作権が発生する場合にはCC-BYを採用することが望ましい。【内閣府検討会報告書】
- 研究成果の利活用を推進するという観点からは、著作権・著作権者等の出典を表示すれば自由な利用を許諾するCC-BYライセンスを採用することが考えられる。【学術情報委員会審議まとめ】
- 研究データは著作物でないのが通例であるため、CCライセンスを活用して意思表示を行う場合は、著作権法上の制約がなく自由に利用できることを意味するCC0を採用することが想定される。一方、研究データ作成への研究者のインセンティブを確保する観点から、利活用の際にデータ作成者の表示を求めることが望ましい。データ作成者の表示を求める方法としては、CC-BYライセンスを利用することや、研究者コミュニティのルールにより表示することが考えられる。【学術情報委員会審議まとめ】
- コンピュータ又はソフトウエアプロバイダーが収集する可能性がある大規模データセットの所有権の定義、とりわけ医療記録や生体記録など特定クラスのデータに関連するプライバシー、機密性又はセキュリティの問題に対応しておく必要がある。【内閣府検討会報告書】

※CCライセンスとは、インターネット時代のための新しい著作権ルールで、作品を公開する作者が「この条件を守れば私の作品を自由に使って構いません。」という意思表示をするためのツール
  CC 0:著作物の著作権やそれに類する様々な権利は国境を越えて放棄される。
  CC-BY:原作者のクレジット(氏名、作品タイトルなど)を表示することを主な条件とし、改変はもちろん、営利目的での二次利用も許可される最も自由度の高いライセンス。

  5)公開の制限

- 研究成果のうち、機密保持、企業秘密、国益及び国家安全保障に関わるもの、研究成果の商用化・産業化を目的として収集されたデータ、又は民間企業が保有するデータ並びに共同研究契約などで研究成果の公開に制限がある場合などは、公開対象外とする。【内閣府検討会報告書】
- 機密保持等の観点から公開に制限がある場合などは、公開対象外とする。【学術情報委員会審議まとめ】
- データのアクセスやデータの利用には、個人のプライバシー保護、財産的価値のある成果物の保護の観点から制限事項を設ける必要がある。【内閣府検討会報告書】【学術情報委員会審議まとめ】


  6)研究分野の特性に対する配慮

- 研究分野によって研究データの保存と共有の作法に違いがあることを認識し、特性に応じたルールづくりが必要である。【内閣府検討会報告書】
- 研究分野でのデータ共有やオープン化を理解する関係者の多寡、データ生成や整理に対する研究当事者の労力の大小や特殊なスキル・研究能力の必要性の関係、個々のデータセットの取扱いに対する技術的容易さ、困難さなど、固有の事情が各分野にありうることを認識しておく必要がある。【内閣府検討会報告書】。
- 高度な研究データであっても、人工衛星観測、地震・気象分野など、大学・研究機関等が新規性のある実験や装置で取得する研究開発目的のデータと、行政データとして整理・公開が行われる可能性のあるデータが混在する分野もあることも認識が必要である。【内閣府検討会報告書】
- 各分野の特色や研究のフローを踏まえ、分野ごとに整理・分類することが考えられる。【学術情報委員会これまでの意見】



(2)研究データの保存・管理等

  1)研究データ基盤の整備

- 次世代の研究者が同じ研究を繰り返すことを避け、成果(論文、研究データ等)の活用・再利用ができる基盤を構築する必要がある。【内閣府検討会報告書】
- 研究成果としてのデータが、どこにあるかを把握しやすく、あるいは(プロジェクト終了後)アクセスできない現状を改善することにより、あらゆるユーザーが活用・再利用できるようなプラットフォームづくりが必要である。【内閣府検討会報告書】
- 担当研究者の退職やプロジェクトからの離脱後に、価値のあるデータを管理・理解できる後継者がおらず放置・削除される現状の改善につながるような、データの集約的保存基盤等の構築が必要である。【内閣府検討会報告書】
- 将来、科学技術が更に進歩した時点で過去の真偽確認ができない等の問題を回避することが可能となること認識し、論文、研究データの長期保存ができる基盤を構築する必要がある。【内閣府検討会報告書】
- 研究データ基盤の整備に当たっては、研究データが集積することの重要性に鑑み、研究データを的確に保存し活用していくためのプラットフォームの整備が重要である。【学術情報委員会審議まとめ】
- データ基盤の整備については、国際的な協調を図っていく視点も重要である。例えば、ジャーナルに論文の掲載が決定した際に、エビデンスとしての研究データの公開を求められる事例があるが、その研究データの公開先として我が国のデータベース等がプラットフォームの役割を果たせるようにしていく必要がある。【学術情報委員会審議まとめ】
- ジャーナルへの論文投稿に伴い、エビデンスとしてのデータが求められることは一般化してきており、それに対応するためのプラットフォーム整備は不可欠である。【学術情報委員会これまでの意見】
- 我が国の学協会が発行するジャーナルについても、国内にデータが保管され、利用できる状況にしておくことが必要で、そのためのインフラ整備は国際競争に参加するための条件。【学術情報委員会これまでの意見】
- クラウドを活用した大学等の研究データ基盤については、論文のエビデンスデータを搭載する機能や論文とデータを関連づける機能を有し、大容量化するデータを格納できる共用プラットフォームとする必要がある。【学術情報委員会審議まとめ】
- 既にNIIが提供している共用リポジトリサービスを強化し、研究データの公開リポジトリとして整備することが妥当である。【学術情報委員会審議まとめ】
- プラットフォームの整備に当たっては、簡便な蓄積・利用に関するユースケース、研究者のインセンティブに裏打ちされたサービス設計が重要。【学術情報委員会これまでの意見】


  2)保存すべきデータ及び保存期間

- 研究終了後も研究データの保存・整備が必要。【内閣府検討会報告書】
- すべてのデータを保存することは現実的でないことに留意。【内閣府検討会報告書】
- 失敗データなどの取扱いに関する考え方を整理すべきだ。【学術情報委員会これまでの意見】


  3)国際認証の取得

  4)研究データの利活用

- メタデータの標準化や格納対象とするデータを規定するデータ格納ポリシーの策定等を進める必要がある。【内閣府検討会報告書】
- 異なるインフラ間の相互運用性もデータ共有の障壁になり得る。データを有効に再利用できるようにするために、データの品質管理とともに、メタデータとも関連づける必要がある。【内閣府検討会報告書】
- 分野ことの標準フィーマットについての検討が必要。【学術情報委員会これまでの意見】
- マシンリーダブル対応が不可欠。【学術情報委員会これまでの意見】



(3)研究データを保存・利活用する際のインセンティブ

  1)研究者に対するインセンティブ

- これまでデータを作成し、他の研究者に提供・利用できるようにする活動は、論文投稿に比して、十分に評価されてこなかった分野も多い。研究者及び科学コミュニティに対するインセンティブを高め、オープン化に対する努力を評価することが重要である。【内閣府検討会報告書】
- 高品質なデータを提供した研究者に適切な報酬(助成金や昇進機会)を与えるなど、成果に見合う処遇の仕組みを設ける。【内閣府検討会報告書】
- データは死蔵するのではなく、公開することによって、より科学に寄与することを具体的に示すとともに、そのことがきちんと評価される仕組みを構築することが重要。【学術情報委員会これまでの意見】


  2)研究データの引用と評価

- アクセス可能となった研究データの利用者は、論文などの引用と同じく引用元を明らかにする義務がある。この引用により、データ作成者の貢献が記録され、業績として評価することを、大学等及び研究者コミュニティにおいて共通に認識し、実行していく必要がある。【学術情報委員会審議まとめ】


  3)識別子の導入

- 研究成果の利活用を促進する観点から、論文及び研究データに永続性のあるデジタル識別子を付与する必要がある。【学術情報委員会審議まとめ】
- 保存すべき研究成果及び研究資源の全てに永続性のあるデジタル識別子を付与し、管理する仕組みを確立する必要がある。【内閣府検討会報告書】
- 研究者識別子であるORCIDを活用することにより、研究機関間の異動や姓の変更などに関わらず研究者を同定可能。さらに、研究機関内の研究者同士のつながりや研究の近接性、他機関の研究者との関係なども分析可能。【学術情報委員会これまでの意見】
- 研究データや研究者への識別子付与によって、研究の着想段階から波及効果までがモニター可能となり、研究活動の流れや効果の測定も可能。【学術情報委員会これまでの意見】



(4)人材の育成・確保

  1)オープンサイエンスのためのスキル

- 一部の研究分野においては、大規模な研究データを蓄積する慣例を有する場合もあるが、大部分の研究者にはオープンサイエンスを実現するために必要なスキルを開発するための訓練、教育が必要である。【内閣府検討会報告書】


  2)データキュレーター等の育成

- 分野ごとに異なるデータの属性、管理手法、利用者、利用局面等を理解できる人材の確保(データサイエンティスト、データキュレーター)が必要。【内閣府検討会報告書】
- 技術職員、URA、大学図書館職員等を中心としたデータ管理体制を整備できるように、データサイエンティストやデータキュレーターなどを研究支援人材として位置づけられるよう、包括的な育成システムを検討し、推進することが必要である。【内閣府検討会報告書】
- 技術職員や大学図書館職員等が、データキュレーターとしての一定の機能を担っていくことも期待されている。職員の能力開発と併せて、専門人材の新たな確保についても考慮することが望まれる。【学術情報委員会審議まとめ】



お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)