資料1 これまでの学術情報委員会における主な意見(オープンサイエンス関係)

1. オープンサイエンスの意義・目的

〔オープンサイエンスが求められる理由〕
  ○ 社会的責務からの必要性、研究開発における国費の二重投資の低減、他分野のアウトカムを活用したイノベーションサイクルの加速
  ○ 研究者と論文数の増大、学術商業出版社の台頭、ジャーナルの寡占と価格高騰化、研究の多様化が進む中、既存の論文出版におけるピアレビューの仕組みが限界になりつつある一方で、定量的な研究評価ニーズの高まりも踏まえ、研究成果公開と評価の在り方のひずみをウエブインフラとICT技術によって打開できるのではないかという期待。

〔オープンサイエンスのビジョン〕
  ○ 研究の在り方そのものを変え得るもの。
  ○ より健全な研究評価体制を生み出すもの。
  ○ 当面は公開の前段階として、共有から始めるのが良い。
  ○ サイエンスの新たなエコシステムを創成
  ○ 研究の効率化及び加速、社会への迅速な波及効果を狙うものとして、必ずしもフルオープンということでなく、相対的に今よりもオープンにするということが本質。
  ○ 研究データをよりオープンにすることで研究の可能性を拡大、また、研究活動自体をよりオープンにすることでインターディシプリナリやトランスディシプリナリのサイエンスを推進
  ○ シチズンサイエンスの拡大による効果や科学リテラシーの向上

2. オープンアクセスの課題

  ○ 分野によってジャーナルの状況は異なる。学会自らが取り組んでいるもの、海外の大手出版社をプラットフォームとしているものなど多様。持続可能なビジネスモデルを模索中
  ○ ゴールドスタイルはコストが研究費を圧迫し、研究自体を阻害している現状。一方で当該コストをサポートすることで、発信力を一層高められる可能性。
  ○ 機関リポジトリへの論文の登録促進には、ある程度の強制力も必要

3. オープンデータ検討上の観点・方向性、留意点

〔検討上の観点・方向性〕
  ○ オープンサイエンスの方向性はかなり整理されており、今後は、全体的な枠組みの中で具体的にどうしていくのかが課題。何をどうするという議論を行っていくことが重要。
  ○ オープンのタイミングは分野それぞれでの状況を踏まえ、ピュアオープンでなく、シェアリングからスタートし、相互利益が確立されるまでは慎重に進めていく視点が重要。
  ○ 配慮すべき点は多々あるが、データの共有化は避けられない流れ。分野や領域ごとで戦略を練っていくことが必要。
  ○ 全体の方向性、国としての対応、学会の対応という戦略部分の検討と同時に、具体的な施策として出していくことが重要。
  ○ アカデミック・コミュニティが、市民や産業界ともつながりつつ、オープンな形でイノベーションを推進していくことが非常に重要。他方、特にデータドリブンな研究の場合、産業界とのデータの共有方法について整理が必要。
  ○ 研究領域、研究機関及び研究者コミュニティの特性を踏まえ、研究者の貢献をより見える化し、一方で研究をディスカレッジすることなく、新たなサイエンスを生み出す、サイエンスをより効率化するための施策を分野別に検討。
  ○ 研究者の手間を増やし意欲をそぐものであってはならず、むしろ将来の研究社会像を切り拓(ひら)くための前向きなものとして、研究者が主体的に取り組めるものとなることが重要。
  ○ オープンサイエンスの議論と施策形成の両方を同時に進める必要がある。啓発のほか、先行している所との連携、公的資金を活用して得られた研究データを守っていくという視点が重要。

〔検討上の留意点〕
  ○ 論文になっていないデータや失敗したデータのオープン化が産業界から求められているが、研究や研究発表の在り方との関係で非常にリスクあり。
  ○ 論文への疑義や問合せ対応のため、根拠となったデータは当然保存されており、それを一定の範囲でオープンにすることは可能ではないか。
  ○ オープンデータの「オープン」という言葉のコンセンサスが重要。
  ○ オープンバイデフォルトは例外も許容され、財産的価値があるものや商業的なものについては留保可能。公的資金の成果はオープンがデフォルトであるが、産業界と関連するデータガバナンスの検討は不十分。
  ○ クリエイティブコモンズライセンスがデフォルトになりつつある一方で、データには著作権がなく、当該データを利用してもよいという意思を表示するための仕組みが必要。
  ○ 研究者に安心・安全と思ってもらえるデータ共有のいわゆる文化作りが最も重要。
  ○ 分野ごとの研究スタイルの違いから、どの段階でどこまでのデータをどう出していくかはデリケートな問題。研究活動を阻害するケースも心配されことから、各分野の研究スタイル等を踏まえて議論することが必要。

4. 研究者並びに研究者コミュニティのモチベーション及びインセンティブ

〔オープンサイエンスに対する取組の現状〕
  ○ オープンサイエンスに対する学術界の反応はいまだ発展的。学会や研究者として、関心を持ってオープンサイエンスに関わる理由や目的が見えていない状況。
  ○ オープンデータは、今のところ研究者自身のものとはなっておらず、よそから持ち込まれたコンセプトという意識にとどまっている。

〔モチベーション及びインセンティブの方向性〕
  ○ データのオープン化は、現場の研究者にとって大きな負担感ポジティブなインセンティブを付すのか、ネガティブなインセンティブを付すのか、基本的な合意が必要。
  ○ オープンサイエンスが芽吹かせる魅力的な世界を示していくことが重要。
  ○ オープンデータに疑念を持つ研究者は相当数おり、データ公開が個々の研究者にとってプラスに働くという面を示していくことが重要。
  ○ オープンサイエンスに取り組むことで、どのようなベネフィットがもたらされるのかなど、まずは動機付けが重要。
  ○ オープンサイエンスが進んでいる研究領域では、自発的に取り組む研究者など、陰の立て役者が存在。そのような人を認識し、認めていくことが必要。
  ○ データは死蔵するのでなく公開することによって、より科学に寄与することを具体的に示すとともに、そのことがきちんと評価される仕組みを構築することが重要。
  ○ 大学や研究機関によるオープンアクセスポリシー策定は、先行きに不透明感が強く、なかなか進んでいない。オープンサイエンスにおいてもイメージの共有化は非常に重要で、分かりやすい例を示していくことが必要。
  ○ 様々なデータを皆で活用し、互いに刺激し合い、研究成果をより高度化していけるような形が理想。データをポジティブに利用したいと思わせる視点が大事。
  ○ これまで未活用であった情報の活用、見方を変えると価値が異なるようなデータを積極的に活用することもデータ共有の有効事例

〔識別子の活用〕
  ○ 研究者識別子であるORCIDを活用することにより、研究機関間の異動や姓の変更などに関わらず研究者を同定可能。さらに、機関内の研究者同士のつながりや研究の近接性、他機関の研究者との関係なども分析可能
  ○ 研究データや研究者への識別子付与によって、研究の着想段階から成果波及までがモニター可能となり、研究活動の流れや効果の測定も可能

5. 研究成果及びデータを共有するプラットフォームの整備

  ○ 研究データを研究者が安心・安全に共有できる基盤作りと文化作りが必要。
  ○ ジャーナルへの論文投稿に伴い、エビデンスとしてのデータを求められることは一般化してきており、それに対応するための手間とプラットフォーム整備が課題。
  ○ リポジトリというインフラ整備と運用体制はほぼ世界標準に沿って着実に進歩。今後、機関という枠組みにとらわれず、分野ごとの特性や強みなども考慮した整備を検討すべきだ。
  ○ 当該分野のニーズを踏まえた分野リポジトリを具体化するには、学協会、大学、大学図書館が協働していくことが重要。
  ○ プラットフォームの整備に当たっては、簡便な蓄積・利用に関するユースケース、研究者のインセンティブに裏打ちされたサービス設計が重要。
  ○ 我が国の学協会が発行するジャーナルについても、国内にデータが保管され、利用できる状況にしておくことが必要で、そのためのインフラが適切に整備されていることが国際競争に参加するための条件。

6. 分野別の特色・課題

  ○ 研究結果の共有そのものがよく理解されていない分野は多い。現状で学術界全体を一まとめにした具体策作りは無理。一歩一歩、領域ごとの取組をエンカレッジするメッセージが重要。
  ○ 各分野におけるステークホルダーの利害関係、それらを分野ごとに分類、類型化することが可能か。
  ○ 分野の特色や研究のフローを踏まえ、オープンデータといった際の特徴を分野ごとに整理し、ガイドライン的なものが示せると良い。
  ○ オープンアクセスやオープンサイエンスについて、多くの研究者が共有できるイメージを分かりやすく示していくことが議論を前進させる鍵であり、学会などとイメージ共有に向けた議論を行うことが有益。
  ○ 化学や、物質科学などの競争の激しい分野では、どの時点で何をオープンにするかというのは、かなり微妙な問題になる。
  ○ 研究データの利活用に向けたルールは非常に重要。分野ごとの状況が異なる中で一律のルール策定は困難としても、幾つかの分野において一定の方向性を示すことは可能ではないか。
  ○ 読者と投稿者の距離が近いコミュニティと遠いコミュニティとで議論を分けることが必要。
  ○ この分野でこうすればうまくいく、どうすれば強くできるという部分に焦点を絞って議論してはどうか。

〔人文学・社会科学〕
  ○ 人社系では、IIIF(トリプル・アイ・エフ)等の画像フォーマットで共有化が進行している一方で、日本や中国、インドなどのデータが欧州を中心に多数流出している状況。
  ○ デジタル人文社会学など、日本の古文書と情報系の人たちとが結び付くことで、日本オリジナルな物が生まれている。パイロットスタディー的なものを進めていくことも考えられる。
  ○ 心理学や社会学における社会調査などでもデータが共有・分析可能となる取組が進みつつある。
  ○ 歴史学では、国立公文書館などが中心になってデジタルアーカイブを進めている。
  ○ 人社系は、ある意味、オープンサイエンスによって最も研究が進みやすくなる領域でもあり、意識としては非常に高いものを持っているのではないか。

〔物理学〕
  ○ 高エネルギー物理学は、社会との関わりは間接的。コミュニティでの共有が望ましい分野で、数学も同様
  ○ 高エネルギー物理学実験における大量データの共同解析は、公開というより研究者間での共有を促進するもの。共同観測の領域は、コデザイン、コプロダクション、コディストリビューションが可能な分野。

〔天文学、惑星科学〕
  ○ 天文学や地球科学は、元々オープンサイエンスが進んでおり、市民の関与も活発。
  ○ 最先端の情報はGoogle Scholarで検索し、arXivで研究内容を得ることが通例。データは大型望遠鏡や人工衛星などによって共通で取得され、個人のものとはなっていない。オープンサイエンスにおいては、その枠組みよりもむしろデータの特性が重要
  ○ プロジェクト全体で多くの結果を出すことが次につながるということが認識され、データ公開が進んだ。
  ○ 一次データはそのままの利用が困難で、ユーザーが使いやすいようにある程度加工して公開することや、データ加工を行う人材をプロジェクト計画段階から手配するということが行われている。個人的なレベルで研究が行われている化学や物性の基礎的な分野とは明らかな違いがある。

〔化学〕
  ○ 有機合成化学は、知財との関連が強く、かつ、社会とのつながりも直接的でなく、オープン化するメリットは薄弱に見えるが、オープンイノベーションの観点から創薬のオープンプラットフォームの構築が進行中。
  ○ 有機合成化学は、研究者に比して利用者が多数おり、論文の価値は信頼性が重視されることから、クオリティコントロールが重要
  ○ データ共有の可能性は、当該領域が扱うデータが構造化、定型化、標準化されているかという点が重要。結晶学においては、X線解析データをCIF形式で定型化している。
  ○ 結晶学における論文投稿では、まず、データをケンブリッジのデータセンターに登録し、査読者だけに開示、その後論文が出版されるとオープンとなる。他方、企業がデータを活用する場合、どの結晶を検索しているかさえ知られたくないなどの理由から、データセットをまとめて買い取るケースも見られ、収益モデルの一つになっている。

〔材料科学〕
  ○ 材料分野では、企業とともに研究開発するオープンイノベーションが進行中データの共有は、オープンサイエンスという言葉が登場する前から自然なスキームとして存在
  ○ 我が国が強みを持つ材料の情報を、オープン・クローズ戦略を踏まえて、アメリカ等と組んで、あるいはビッグデータ解析を加えるなどにより発展させ、新たな価値を生み出していくことが必要。

〔バイオサイエンス、ライフサイエンス〕
  ○ バイオやライフサイエンス分野、特にタンパク質やゲノム研究は、概してビッグデータの世界。データマイニングで新たな知見を見つけていこうとするスタイルは、分野相対的にオープン化しにくいという印象はなく、研究スタイルは天文学や地球科学に近い印象。
  ○ 扱うデータの構造が整っている分野は、データシェアリングが進めやすい。ゲノム科学や疫学など、元々定型化が進んでいる分野は、国際協調に乗り遅れると不利な状況になりかねない。

〔環境・海洋科学〕
  ○ 環境科学分野は、オープンサイエンスのメリットを最も享受しやすく、新しい市民科学の可能性も模索可能。
  ○ 海洋科学分野の情報は、一見オープンにしやすく思えるが、海洋資源など機微な情報も多く、丁寧に議論を行うことが必要。

7. 国際動向に関する危機意識

  ○ 論文で生じているパワーバランスが、そのままの形で研究データに持ち込まれてしまうことへの危機感がある。これを消極的に受け取ることなく、何か起死回生のアクションが起こせないか。
  ○ 欧米においてオープンサイエンスは、既に具体的な施策や戦術として動き始めている。我が国としては、これに取り残されないよう、協調していくことが必要。
  ○ データは、論文本体とは別に一人歩きして、論文より価値を持ってしまう可能性があることも認識しつつ、国際的な動向に対応することが必要。
  ○ オープンデータに対応しなかった場合、あるいは国際的な動向に乗り遅れた場合に、具体的にどのようなリスクが考えられるのかが分かりにくい。我が国で議論が進まない要因の一つではないか。
  ○ オープン化という大きな流れに対して、これまで我が国は慎重な態度を示してきたが、欧米に比べて遅れてしまうことには大きな不安感。
  ○ イギリスでは、10年前にオープンサイエンスとは何かという議論が行われ、現在、どのような形式でデータを集めていくかということを、学会と産業界、政府において具体的な議論を進めている。
  ○ 欧米にデータを取られてしまう危機感や、大手出版社に対してどう対抗するかというイメージはともかく、個々の研究者レベルでは、そのことを踏まえてオープンサイエンスにどう対応するのかというイメージは描けていない。分野コミュニティをどう守るのかという観点からオープン化の推進を議論することが必要。
  ○ データマイニングにより、実験を行わなくてもある程度結果の見通しが立つ時代になった。イギリスでは数年前から、ディープラーニングが更に進めば、この傾向がより強くなるとの認識で議論が進められている。
  ○ Wellcome Trustによる論文のアーカイブ化は、イギリスのオープンサイエンスに関する国家レベル、学会レベルの戦略として、一種の大英帝国的な発想で学術分野に大きく展開されている。
  ○ 化学分野の論文はほとんどの場合、英米の2大学会誌や商業誌であるNature、Scienceに掲載されるが、イギリスでは、論文に関連するデータを自動的に各論文誌に対応するデータジャーナルに上げることを計画中。
  ○ 論文発表の媒体が英米の雑誌のみということであれば、併せて関連のデータも英米のデータベースに行ってしまう。我が国がオープン化に取り組む際には、このような動きに留意しながら進めていかないと機能しなくなる恐れ。
  ○ 欧米の学会では、産業界とも連携して、オープン化を早期のR&Dに活用していく戦略について自ら資金を投入して構築。我が国の学会には、自らの資金でアクションを起こすことは難しい状況であり、この点を意識して対応策を検討することが必要。
  ○ 我が国の化学分野の論文は、幸いなことにクオリティ面で高いリスペクトを受け、世界と十分戦っていける位置にある状況は大いに利用すべきだ。データを我が国に置いておくことを前提に英米のデータジャーナルと提携することも検討すべきだ。
  ○ 欧米の大手ジャーナルに論文を投稿する際に提出したデータファイルのデータを、後の研究のために活用しようとしても簡単に使えないという課題も生じている。
  ○ 論文の流通権は、現状で海外の大手出版社に握られているが、次はデータが狙われている。我が国として明確なポリシーを出していかないと、論文、データ、共に何も残らないということになりかねず、データを守りながらオープンにしていくという戦略が必要。

8. オープンサイエンスに関連した先行事例

  ○ 研究者が論文を雑誌に投稿する前に、リポジトリに登録して先に読んでもらうプレプリントサーバが最近1、2年の間に構築が進んでいる。もとは高エネルギー物理学分野から始まり、現在、数学や経済、統計分野等にも拡大している状況。
  ○ Wellcome Trustというイギリスの非政府系助成機関が2016年11月にウエルカムオープンリサーチというものを開発し、研究助成団体が用意する出版プラットフォームへの成果の登載を義務化。論文やデータを含むあらゆる成果が登録でき、プレプリントサーバと同等の機能を持つ。また、ピアレビューファカルティサウザンドと言われている別モジュールを導入し、ピアレビュアー2名の査読が通ればパブリッシュされたものとして検索インデックスに登録され、さらに、バックグラウンドで査読者の貢献が見えるような仕掛けもなされている。
  ○ 欧州において、デジタル技術に基づく情報利用・サービス等を目指すデジタルシングルマーケットというものが2015年5月に開始。データ情報通信の標準化及び相互運用性の確保、インターオペラビリティーの確保が優先事項で、試算として、5億人、50兆円の経済効果が見込まれている。

お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

麻沼、齊藤
電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)