資料1 学術情報委員会(第4回:平成29年7月27日)における主な意見

1. オープンサイエンスの検討に向けた論点

  ○ オープンサイエンスを検討する場合の考え方には、分野別にどういう特色があるのか、また、研究のフローに合わせてどういう特色があるのかという二つの側面が存在すると思う。各分野がどの辺りまでオープンにできるのかといった特徴をマトリックスで整理し、特定の分野との研究開発では、このあたりまでオープンにできるのではないかという指標のようなものが示せると良いのではないか。
  ○ データをどこまでオープンにするのかは、研究者にとって煩わしく、それにポジティブなインセンティブを付加するのか、あるいは、そうしないと研究費が配分されないなどのネガティブなインセンティブを付すのか、その辺の基本的な合意ができていないように思う。仮にネガティブ、かつ、強制力を持ったものを制度として導入するのであれば、相当な説得力を要するのではないか。
  ○ 論文に生じているパワーバランスがそのままデータの世界にも持ち込まれてしまうことへの危機感に対して、これを消極的に受け取るというよりは、何か起死回生のアクションが起こせないかという議論が期待される。
  ○ オープンサイエンスは、欧米では具体的な施策や戦術として既に動き始めており、我が国としてこれに協調するのか、それとも参考にしながら独自に動くのかでは大きな違いがあるが、この機会に協調の方に持っていかないと完全に取り残されると思う。
  ○ オープンサイエンスを議論する上での日本の悩みは、日本の学術界の反応が遅いということではないか。学問の有様になじむのであれば、ごく自然にオープンサイエンス政策に向けた学会対応も進む可能性があるが、現在は学会ジャーナルでのテキストマイニングなど、多様な情報活用に向けた発展的な協同はまだ勉強段階にあると言える。論文をオープンアクセス出版することに、大方として認識は広がってきたが、オープンサイエンスが求める姿に、学会として、あるいは学会会員として関心を持って関わる理由や目的が見えていないという状況にある。
  ○ オープンアクセスやオープンサイエンスのイメージは個人によって異なるため、その先に見えるイメージがある程度共有できていないと議論が散発的になる。机上論でも良いので幾つか共有できるイメージを創ると議論が前進するように思う。この際、幾つかの学会や分野の方をお招きして、イメージ共有に向けた議論を行うことが有益ではないか。
  ○ アーリーステージでイメージが描けそうな例としては、DBCLS(ライフサイエンス統合データベースセンター)などのバイオ系データベースが考えられ、それらに関係する若手研究者から話を聞くと良いと思うが、属人的な面が強く、組織として方向性を持っているところは少ないと思われる。まずは、個々に取り組みを行っている方々を見つけ出すことが大事ではないか。
  ○ 共有すべきイメージについては、無理やり作るのではなく、タイミングはそれぞれの分野によってあるのではないか。ピュアオープンではなく、取りあえずシェアリングからスタートし、ミューチュアルベネフィットが確立されるところから慎重にやっていくという視点が重要ではないか。
  ○ データ保有者がオープン化に協力していくこと自体必要なことではあるが、論文本体とは別に、データはそれ自身が一人歩きし、ことによると論文よりも価値を持ってしまう可能性もある。重要なことは、一番良いところを取られないよう認識して対応することではないか。
  ○ 配慮すべきものが多々あるにしても、データの共有化は流れとして避けられない方向性であり、多くの研究者の動きいかんにかかっている。メリットあるエコシステムを、一定程度ドメイン・バイ・ドメインに描いていってはどうか。日本が出していくデータのイメージをきちんとした上で、戦略を練っていく必要がある。
  ○ オープンデータに対応しなかった場合、あるいは流れに乗り遅れた場合、具体的にどのようなリスクが考えられるのかが分かりにくいことも、議論がなかなか進まない一つのファクターなのではないか。
  ○ 論文になっていないデータや失敗したデータのオープン化が産業界から求められているが、研究や研究発表の在り方に関して、非常にリスクのある話である。
  ○ リスクという観点では、オープン化という大きな流れに対して、日本は今までかなり慎重な態度を示してきており、欧米に比べて多少遅れてしまうことへの不安感がある。
  ○ イギリスでオープンサイエンスとは何なのかという議論を行っていたのが10年前で、今はどのような形式で実際にデータを集めていくかという段階に入っていて、それぞれに利用の仕方が異なる学会と産業界、学会と政府などのセクターにおける議論が進められている。日本では、議論と施策形成の両方を同時に進める必要があり、併せて啓蒙(けいもう)や先行している所との連携、国費で行った研究に関するデータをどう守っていくかなどを議論する必要がある。
  ○ この委員会での議論は、実際にどのようにするかという段階の話、国としてどう対応するのか、学会にどう対応させるのか、というストラテジーに相当する話を同時に進め、具体的な施策を出すことが重要ではないか。
  ○ 研究結果の共有そのものがよく理解されていない分野はかなり多く、学術全体を一まとめにして、オープン化のための具体策作りという議論は、現状では無理があるのではないか。
  ○ PDF化された論文中の数式やデータを別の研究に役立てようと思うと、その論文をデジタル化してプロットデータをデータとして変換するという作業が必要になり、そもそもオープンサイエンス政策の向きに合っていない。ジャーナルがどれだけオンライン化されようとも、実際のデータ利活用の場面でこのような非近代的な方法が用いられているという矛盾についても改善できるよう、学会や国のデータ戦略として取り組むべきではないか。

2. オープンサイエンスの推進にかかるポイント

  ○ 研究者に対する新しいエコサイクルをどう生み出すかが重要で、そのためには、ICT技術者と、各研究ドメインの科学者との対話が重要な観点になってくると思う。最初は研究者自身の領域の研究活動の効率化から始め、ICT技術者と対話を繰り返すうちに新たなサービスのアイデアなどが生まれるのではないか。
  ○ オープンサイエンスが芽吹かせる面白い世界というものを提示しないと、ドメインのサイエンティストも、IT屋も動かないという状況ではないか。その描き方を一つの方向感として示していくことが重要である。
  ○ 他の分野で必ずしも同様の方法論が通じるとも限らず、混沌(こんとん)としている中で統一された結論を出すのは相当難しいと思うが、一歩一歩、領域バイ領域で挑戦をしていくということをエンカレッジするようなメッセージが重要ではないか。
  ○ 啓蒙(けいもう)はともかく、どのようなベネフィットがもたらされるのかというところが多分に大きく、まずは動機付けをしないと始まらないのではないか。
  ○ オープンサイエンスが進んでいる研究領域では研究者が自発的に取り組むなど、陰の立て役者が存在する一方で、そのような人は、データ管理やソフトウェア開発はすれども、余り論文は書けておらず、評価されていない。オープンサイエンスに寄与している人は日本でも確実に存在しており、そういう人をまず認識し、認めていくことで、そのようなキャリアパスもあるということを知らしめることが必要ではないか。
  ○ イメージの共有化は非常に重要なポイントである。大学がオープンアクセスのポリシーを策定・公表しようとしてもその先にあるものが見えず、なかなか動けなかった。わかりやすい例を出していくことで一挙に動いていくということもあるのではないか。
  ○ 欧米にデータを取られてしまうという危機感や、出版社に対してどう対抗するかとかいうようなイメージはあるものの、個々の研究者においてはデータを公開することのイメージは描けていない。様々な分野コミュニティを守るという観点からオープン化の推進が求められるところである。一方で化学系では、論文に付随して求められるデータに関して、肝腎の部分についてはアップしないと宣言する人も多いと聞いている。その意味でオープンデータは今のところ研究者自身のものとはなっておらず、他から持ち込まれたコンセプトによってオープン化させられているという意識にとどまっているのではないか。
  ○ 論文に対して疑義が生じたり、あるいは問合せがあったりした際への対応のため、論文の根拠となったデータは当然持っているはずで、それをある範囲でオープンにすることには、それほど抵抗ないのではないか。
  ○ サイエンスは、オリジナリティーやノベリティーのみで進展しているのではなく、その二番手で様々なデータを出している、いわゆるフォロワーの人たちも重要であり、実用化に向けてはそれが非常に大きな資産になってくる。
  ○ 過去の失敗データも含めた巨大なデータをマイニングすることで、実験を行わなくともある程度結果の見通しが立つような時代になってきている。更にディープラーニング等が進めば、この傾向がより進むのは自明であるとの認識が数年前からイギリス、その他の学会で議論されている。
  ○ 日本の学協会が発行しているジャーナルについては、国内にきちんとデータが保管され、利用できる状況にしておくためのインフラが大事で、それが国際競争に参加するための一つの条件ではないか。
  ○ SINET上のアカデミッククラウド活用によるオープンサイエンス実現の求心力となり得るのは、研究者の行動ログが把握可能なシングルサインオンの仕掛けを使うことではないか。欧州では、研究者の行動ログを活用して、研究への貢献の見える化と、研究評価やインパクトアセスメントの新たな開発につなげられるのではないかという議論がなされている。

3. 研究分野における特色、課題等

  ○ 化学や、物質科学などの競争の激しい分野では、どの時点で何をオープンにするかというのは、かなり微妙な問題になるのではないか。
  ○ バイオやライフサイエンスの分野は、オープンサイエンスに非常に大きな影響を受けている。特にタンパク質やゲノム研究は概してビッグデータの世界で、着々とデータを取り入れて、マイニングで新たな知見を見つけていこうというような世界になっている。実験の場でも、とにかくデータをとって後から解析するという方向にある。分野的には、相対的にオープン化しにくいという印象はなく、むしろ天文学や地球科学に近いアプローチの仕方で進めていけるのではないか。
  ○ データ共有の問題を解決するための手掛かりとして、その領域の研究者が扱うデータがどれだけ構造化されているか、定型化されているか、あるいは標準化されているかという点があると思う。例えば結晶学においては、X線で撮ったデータはCIFという標準化されたファイルで定型化され、早くからデータ共有がなされている。
  ○ 研究プロセス上、データ構造やメタデータが整っている分野には、データシェアリングを進める利得がある。例えば、ゲノムや疫学のように元から定型化されている分野は、国際協調に乗り遅れると不利な状況になりかねない。
  ○ X線結晶学で論文を投稿する場合、データ(CIF)をケンブリッジのデータセンターに登録し、まず査読者だけに開示がなされ、論文が出版されると誰でも見られるようになる。ただ、企業はどの結晶を検索しているか知られたくないという事情から、データセットをまとめて買い取るということも行われており、オープンになっているデータでも、企業から収益を得られるモデルとなっている。
  ○ 材料分野では、企業とともに研究開発するオープンイノベーションに取り組んでおり、オープンサイエンスという言葉が登場する前から自然なスキームとして存在している。
  ○ 人社系では、IIIF(トリプル・アイ・エフ)等の画像フォーマットが共有化され、日本や中国、インドなどのデータについて、欧州を中心に根こそぎ集められているという危険な状況が生じている。
  ○ 既にオープン化が進んでおり、産業界とも距離のある天文学、惑星科学の分野では、最先端の情報はGoogle Scholarで検索し、arXivで最先端の研究内容を得ることがメジャーとなっている。これらの分野では、大型の望遠鏡や人工衛星、掘削試験、リモートセンシングなど、データそのものが共通で取得されており、個人の手によるものとはなっていない。オープンサイエンスにおいては、その枠組みよりもむしろデータの特性が問題なのではないか。
  ○ 天文学、惑星科学の分野では、プロジェクト全体で多くの結果を出すことが次につながるということを認識した結果、積極的にデータが公開されるようになった。ただ、一次データはそのまま利用することが困難なことから、ユーザーが使いやすいようにある程度加工したものを公開することや、このようなデータ加工を行う人材をプロジェクト計画段階から手配するというストラクチャーが出来上がっている。化学や物性関係の基礎的な分野など、個人的なレベルで研究が行われているところとは明らかな違いがある。

4. 海外の取組、海外との関係等

  ○ Wellcome Trustによる論文のアーカイブ化は、イギリスのオープンサイエンスに関する国家的な戦略、ポリシー等施策とともに学会レベルの戦略として非常に大きく展開されており、一種の大英帝国的な発想が学術の分野でなされていると理解できる。
  ○ オープンサイエンスといったときに、化学分野では、最終的に論文が載るのは日本の学術誌ではなく、ほとんどの場合、英語圏である英米の2大学会誌やNature、Scienceという商業的な論文誌である。イギリスでは論文に関連するデータについては自動的に各論文誌に対応するデータジャーナルに上げることを考えている。
  ○ 英米の一流誌でしか論文が発表できないということになると、データも英米のデータベースに流れてしまうということが起こりうる。日本が具体的にオープン化に取り組む際には、国際的な動きをしっかり押さえ、それに対応する形で進めないと機能しないものになる可能性が高い。
  ○ 欧米の場合、論文誌を扱う学会の財政状況が、日本と大きく異なっているという点は、重要なファクターである。日本の学会は、大規模な所であっても会費収入を中心に運営されているため、財政的に非常に厳しい状況にある一方で、欧米の学会、例えばロイヤルソサエティー・オブ・ケミストリーでは75から80億円程度の収入があり、そのほとんどを出版事業で持っている。
  ○ 欧米の学会では、産業界と連携して、オープン化自体を早期のR&Dにどう活用していくのかという世界戦略を自らの資金を投入して構築している。一方で我が国の学会には、自らの資金で何かアクションを起こすことは、ほぼ難しい状況にあるということを強く意識して手を打たないと手遅れになるのではないか。
  ○ 化学の分野は幸いなことに、日本の論文はクオリティ面で高いリスペクトを受け、十分戦っていける位置にあり、この状況は大いに利用すべきである。例えば、データ自体は日本に置いたままで、英米のデータジャーナルと提携していくといったことも考えられるのではないか。
  ○ 欧米の大手ジャーナルに論文を投稿する際は、データファイルも提供するよう学会や出版社から求められるが、そこに提供されたデータは、後日データ駆動型研究のために収集しようとしても簡単にはできないという問題も生じている。

お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

麻沼、齊藤
電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)