資料1 学術情報のオープン化の推進について(中間まとめ案)

1 検討の背景

○ 近年、公的研究資金を用いた研究成果(論文、生成された研究データ等)について、研究者コミュニティはもとより広く社会からのアクセスや利用を可能にするオープンアクセス、オープンデータの取り組みが諸外国で顕著となっている(注1)。

○ 研究成果のオープン化の取り組みは、研究成果の共有と相互利用を促進し、知の創出に新たな道を開くとともに、効果的に研究を推進しイノベーションの創出につなげることを目指した新たな科学の進め方を意味する。すなわち、従来のオープンアクセスの概念(論文へのアクセス)から論文及び研究データ等の研究成果の利活用、さらには研究の過程そのもののオープン化へと研究のあり方の変化や新たな手法が生じつつあることを示している。

○ 本委員会は、このような認識の下、内閣府の「国際的動向を踏まえたオープンサイエンスに関する検討会」による報告等を参考としつつ、学術情報(注2)のオープン化に係る基本的方策について検討を進め、その要点を以下のとおりまとめた。

2 基本的考え方

○ 新たな知を創出する学術研究等の成果は、人類社会の持続的発展の基礎となる共通の知的資産として共有されることが望ましいことから、大学及び研究機関(以下、「大学等」)における研究成果は公開(注3)し、広く利活用されることを、研究者等が基本理念として共有する必要がある。

○ 研究成果の利活用を促進することにより、分野を超えた新たな知見の創出や効率的な研究の推進等に資するとともに、研究成果の理解の促進が図られることが期待される。
   また、自然科学のみならず、人文学・社会科学における分野融合などの新たな研究の展開や、研究者においては、自身の研究成果の更なる普及につながることが期待される。

○ これらの意義を踏まえ、公的研究資金による研究成果のうち論文及び論文のエビデンスとしての研究データ(注4)は原則公開とする。その上で、論文のエビデンスとしての研究データについては、研究資金配分機関が、国際的な動向や戦略性及び研究分野の特性等を踏まえて、公開の進め方や公開するデータの範囲及び管理方策等について示していく必要がある(注5)。なお、非公開とするデータについては、ガイドラインで示すことが望ましい。

3 研究成果の公開に当たっての基本的事項

(1)論文のオープンアクセスについての取組
  公的研究資金による論文については、第5期科学技術基本計画期間中に原則公開とすることを実行すべく、研究資金配分機関は、実施方針を定め、研究者等への周知を含めて計画的に取り組みを進める必要がある(注6)。

(2)論文のエビデンスとしてのデータの公開
  (研究データの多様性)
 ○ データの共有が既に標準の取り組みとなっている分野(例えば、天文学、素粒子物理学等)がある一方で、論文の公表が中心であり、同時にデータを公開する必要性が必ずしも高くない分野や知的財産などの観点からデータの公開が馴染まない分野もある。
    ライフサイエンス分野においては、以前からデータ共有や利活用の取り組みが行われており、さらなる促進が期待される中で課題があることも指摘されている(注7)。材料科学分野においては、マテリアルズインフォマティクスの重要性が認識され、データ共有の取り組みが始まっている。人文学分野においては、成果の公表が書籍で行われる場合があり、また、エビデンスデータの捉え方も一様ではないが、成果の利活用の観点からオープン化の取り組みが期待される。

  (公開の対象データ)
 ○ 公開及び共有すべきデータの範囲については、国際的な動向や原則公開とする趣旨を踏まえた上で、学協会で研究上の必要性を考慮した検討を行い、日本学術会議で研究者コミュニティのコンセンサスを形成していくことが求められる(注8)。その考え方を踏まえつつ、研究資金配分機関が、データの公開について推奨していくことが望ましい(注9)。その際、データ共有の必要性が高い分野から推奨していくなど、実効性を考慮した対応が望まれる。

 ○ 研究成果のうち、機密保持等の観点から公開に制限がある場合などは、公開適用対象外として考えるべきである(注10)。

 ○ データへのアクセスやデータの利用には、個人のプライバシー保護、財産的価値のある成果物の保護の観点から、制限事項を設ける必要がある。

  (データの蓄積・管理)
 ○ 研究資金配分機関は、助成する研究プロジェクト等の規模(例えば、一定額以上の助成に係るものを対象とする)やその目的及び分野の特性等の必要性に応じ、助成の申請時にデータ管理計画の提出を求め、プロジェクト等の終了後もデータの管理について担保されるよう取り組む必要がある。大学等においては、研究者のデータ管理計画の作成を支援していく必要がある。

  (データの公開方法)
 ○ 公的研究資金による論文のエビデンスデータ(注11)の公開は、分野別の公的なデータベース(注12)や学協会で整備されているリポジトリがある場合は、これらに登載することにより進めることが妥当である。なお、公的なデータベース等がない分野については、大学等のリポジトリを活用することが望ましい。研究資金配分機関は、この取り組みについて推奨していくことが求められる。

(3)研究データの利活用
  (許諾ルールの明示)
 ○ 公開される研究データには、権利関係を明らかにした上で利活用を促進する観点から、クリエイティブ・コモンズ・ライセンス(注13)などの利用ルールを付す必要がある。

  (研究データの引用)
 ○ アクセス可能となった研究データの利用者は、論文などの引用と同じく引用元を明らかにする義務がある。この引用により、研究データ作成者の貢献が記録され、業績として評価することを、大学等及び研究者コミュニティにおいて共通に認識し、実行していく必要がある。

 ○ 研究成果の保管と利活用を促進する観点から、論文及びデータセットに永続性のあるデジタル識別子を付与し管理することが求められる。どの粒度のデータセットに対して識別子を付与すべきかについては、研究者コミュニティとのコンセンサス作りが必要であり、ジャパンリンクセンター(JaLC)(注14)の活動を推進する必要がある。

4 大学等に期待する取組

○ 大学等においては、論文、研究データ等の研究成果の管理に係る規則を定め、研究成果の散逸、消滅、損壊を防止するための具体的施策を講ずる必要がある。その際、非公開とする事項を規定することや研究室等で個別に保管されている利活用可能なデータについて、研究者の異動や退職に当たっての扱いについても検討しておく必要がある。

○ 論文及びデータセットに永続性のあるデジタル識別子を付与し管理していく取り組みは、JaLCの活動と連携し進めることが望まれる。

○ 技術職員、URA及び大学図書館職員等を中心としたデータ管理体制を構築するとともに、必要に応じて複数の大学等が共同して、データサイエンティストなどを育成するシステムを検討し推進することが望まれる。

○ 特に、大学図書館については、機関リポジトリの構築を進めてきた経験等から、研究成果の利活用促進の取り組みに役割を果たすことが期待される。このため、大学の当該領域に関連する研究科等において、大学図書館職員等を対象に人材育成プログラムを開発し、実践的に取り組んでいくことが求められる。

5 オープン化に係る基盤整備等について

(1)論文のオープンアクセスに係る基盤整備について
 ○ オープンアクセスの推進に当たっては、各大学等における機関リポジトリをセルフアーカイブ(グリーンOA )(注15)の基盤として更に拡充するとともに、日本発の情報発信力の強化の観点から、科学研究費補助金(研究成果公開促進費)による支援を通じて、オープンアクセスジャーナルの育成に努めていく方法が妥当である。

 ○ 我が国の公的支援による出版プラットフォームであるJ-STAGEについて、レビュー誌の発信などを通じて国際的な存在感の向上を図るとともに、学協会等が共同して質の高いオープンアクセスジャーナルを構築することが望ましい。

 ○ 学協会においては、論文の教育現場等での利活用を促進する観点から、刊行する学術誌に掲載される論文の著作権ポリシーを策定し、明示する必要がある。

(2)データ公開に係る基盤整備等について
 ○ 大学等におけるデータの保管・共有に係る基盤を整備するに当たっては、情報資源の共有や効率的な整備の観点から、アカデミッククラウドの活用を図る必要がある。このため、フォーマットの標準化やシステム開発及び共同調達等について、国立情報学研究所と大学等が連携し進めることが求められる。

 ○ なお、科学技術振興機構や国立情報学研究所等が連携して、各データベースや各機関のリポジトリ等に搭載されているデータセットの横断的な検索・利活用を可能とするための基盤の整備を行い、サービスを提供することが望まれる。

 ○ 日本の学協会において、複数の学会が共同するなどの取り組みを進め、日本発のデータジャーナルを構築することが望まれる。その際、我が国のプラットフォームにデータを集積させる視点が重要であり、科学研究費補助金(研究成果公開促進費)による支援やデータジャーナル出版に係るプラットフォームの整備に当たっても、この点を重視する必要がある。

(注1)諸外国の研究資金配分機関等を中心にオープン化の取組が進んでいる。例えば、米国においては、国立衛生研究所(NIH)及び全米科学財団(NSF)等において、2013年の科学技術政策局(OSTP)の指令により、パブリックアクセスプランを策定している。また、英国においては、英国研究会議(RCUK)において、2012年に新たなオープンアクセスポリシーを公開している。
(注2)ここでいう学術情報とは、研究者や学生が研究・学習を進める上で必要な論文や各種データをいう。
(注3)研究の成果としての論文や研究データ等を、インターネット上で公表し、合法的な用途で利用することを障壁無しで許可することを意味する。
(注4)論文の裏付けとなるデータセットなど、研究結果を立証するのに必要な科学界で共通に受け入れられるデジタル的に記録された事実に基づくデータ。
(注5)データの公開及び利活用を促進するためには、まずデータが適切に保管されることが重要である。
(注6)2013年に開催されたG8科学技術大臣及びアカデミー会長会合等において、各国において研究成果のオープンアクセスを拡大させる方針が確認されるなど、国際的な取り組みが加速している。
(注7)課題として、メタデータを付与して保管するだけでは再利用性が低いこと、データフォーマットや用語の標準化、データの質の保証、公開及び共有の義務化ルールの設定、公開されないデータが多いこと、データの権利関係の明確化、データ公開のタイミング、プロジェクト終了後のデータの維持、データサイエンティスト等の人材不足などが、委員会の審議の中で指摘された。
(注8)日本学術会議においては、オープンサイエンスの取組に関する検討委員会において、我が国科学界がとるべきオープンサイエンスへの対応について調査審議を行っている。
(注9)なお、国の支援により統合データベースを整備しているライフサイエンス等の分野については、データの集積と利活用を促進する観点から、データの公開について一層推奨する必要がある。
(注10)内閣府の国際動向を踏まえたオープンサイエンスに関する検討会報告書「我が国におけるオープンサイエンス推進のあり方について」では、「研究成果のうち、機密保持、企業秘密、国益及び国家安全保障に関わるもの、研究成果の商用化・産業化を目的として収集されたデータ、又は民間企業が保有するデータ並びに共同研究契約などで研究成果の公開に制限がある場合などは、公開適用対象外として考えるべきである。」としている。
(注11)公開される研究データは、再利用可能な形式でなければならない。また、メタデータ、数値データ、テキスト、イメージ、ビジュアルデータなど多様なデータがあり、データを扱うプログラムがある場合はこれも含まれる。
(注12)公的なデータベースの例としては、日本DNAデータバンク(DDBJ)、NBDCヒトデータベースなどがある。
(注13)クリエイティブ・コモンズ・ライセンス(CCライセンス)は、インターネット時代のための新しい著作権ルールの普及を目指し、CCライセンスを提供している国際的非営利組織とそのプロジェクトの総称。様々な作品の作者が、利用条件についての意思表示をするためのツールとして活用されている。CCライセンスを用いる場合、研究データは著作物ではないため、CC0を採用することが望ましい。また、データの集積・整理や品質管理などの点で専門的研究者の労力や高度なノウハウが入ったデータベースなど、知的生産物として著作権が発生する場合にはCC-BYを採用することが望ましい。
(注14)電子化された論文等の学術コンテンツに、国際標準の識別番号(Digital Object Identifier, DOI)を付与する権限を持つ機関。科学技術振興機構や国立情報学研究所等が共同で運営している。
(注15)査読付き論文について出版社版または出版社版に至る前の著者最終原稿を大学等が構築・運用する機関リポジトリに登載し、公開する方法。グリーンOAの利点は、著者の負担なしに有料雑誌の論文情報が公開されることである。

お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

佐々木、三石
電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)