平成29年6月21日(水曜日)13時00分~15時00分
文部科学省15F特別会議室
喜連川主査、引原主査代理、赤木委員、安藤委員、家委員、逸村委員、井上委員、岡部委員、五味委員、竹内委員、谷藤委員、辻委員、美馬委員
(科学官)相澤科学官 (学術調査官)小山学術調査官、越前学術調査官 (事務局)関研究振興局長、板倉大臣官房審議官(研究振興局担当)、原参事官(情報担当)、丸山学術基盤整備室長、玉井学術基盤整備室参事官補佐
安達国立情報学研究所副所長
【喜連川主査】 お時間になりましたので、ただいまから第3回の学術情報委員会を開催したいと思います。
今期の学術情報委員会では、前回御議論頂きましたような大学図書館や機関リポジトリの機能強化という観点、それに加えまして、前々回御議論の中心となりましたオープンサイエンスへの対応、さらには、本格的な御議論はまだここでは頂戴しておりませんけれども、ネットワーク等の情報基盤の強化という観点が主な審議事項になっております。このうち大学図書館機能の強化という視点とオープンサイエンスへの対応については、機関リポジトリの機能強化の議論がこの両者の議論をうまくつないでいるというような位置付けと見ることもできるかと存じますが、こういう事項をネットワーク等のお話にも絡めながら、それらを毎回ローテーションしながら議論を重ねていければ良いかなと感じている次第でございます。
したがいまして、ぐるぐる回るという意味では、今回は、前々回に御意見を多く頂戴いたしましたオープンサイエンスに焦点を当てて再度御議論をと思っている次第でございます。本日は、今後この議論を進めていただく前提として、まずは全体的な状況把握を行うという観点から、オープンサイエンスの現状等につきまして、科学技術・学術政策研究所の林和弘上席研究員から御説明を頂きました後、意見交換を行いたいと考えている次第です。
林先生、本日は御出席どうもありがとうございます。後ほどどうぞよろしくお願いいたします。
また、本日も国立情報学研究所の安達副所長にオブザーバーとして御出席頂いている次第でございます。
それでは初めに、事務局から配付資料の確認と傍聴者の状況の報告をお願いいたします。
【玉井学術基盤整備室参事官補佐】 配付資料については、ダブルクリップで留めたものを議事次第に続いて資料1から6までを御用意しております。資料5については、林上席研究官の資料ですけれども、そちらのみ番号がついておりませんけれども、順番に組んでおりますので、御確認頂きまして、過不足等ありましたら、事務局にお申し出ください。
また、本日の傍聴登録ですけれども、24名の方に御登録頂いております。なお、報道関係の方の御登録はございません。
【喜連川主査】 ありがとうございます。それでは、これから審議に入りたいと思います。
冒頭申し上げました林先生からの御説明に先立ちまして、まず事務局に御用意頂きました資料について御説明を頂ければと思います。前回もそうでしたけれども、このまとめは大変分かりやすくて、今後もこのような形で進めたいと期待しています。どうぞよろしくお願いします。
【丸山学術基盤整備室長】 それでは、失礼いたします。順番に御用意いたしました資料を御説明したいと思います。
まず、前回の御議論を簡単に振り返りいたします。本日の御議論の中心はオープンサイエンスに置きたいと思っておりますので、大変申し訳ありませんけれども、大学図書館機能に関する部分は振り返りを省略しまして、改めて図書館の議論をする際に御説明したいと思います。
まず資料1でございますが、前回の振り返りです。まず、オープンサイエンスの対応、一つ目の丸ですが、オープンサイエンスの議論に当たっては、ステークホルダーの利害などが各分野でどのような状況にあるのか、また、分野ごとの分類、類型化が可能なのかというあたりを見ながらでないと先の見通しは難しい。また関連して、研究データの利活用を進めるためのルールをどうするかは非常に重要な問題である、分野ごとの状況が異なる中で一律のルール作りは困難であるとしても、幾つかの分野を取り上げて一定の方向性を示すなどは可能なのではないかという御意見がございました。
また、機関リポジトリに関しましては、オープンアクセスへの寄与に加えて、出版されないもの、失われやすいものなど、大学オリジナルなものの保存・公開にも貢献できる。機関リポジトリの利活用の方向性を大学の規模や分野構成を踏まえた幾つかの類型として示していくことが考えられるといった御意見。それから、リポジトリのランキングにおける評価基準がここ数年変化している。従来は内容の充実度が重視されてきたが、最近は研究資料の価値が重視されるようになった。このことは、リポジトリに対する要求の変化を示しているのではないかという御意見。
それから、リポジトリのコンテンツで特に英語で作成されたもの、これは紙の時代であれば見向きもされないようなものであっても、サーチエンジンなどを通じて世界中からアクセスがあるということで、機関リポジトリの搭載が検索機能とあいまって大きな効果を生んでいるのではないかという御意見。
機関リポジトリへの論文の登録率が上がらないのは、インセンティブの問題のほか、手間がかかるという理由も大きく、ある程度の強制力も必要なのではないか。
リポジトリの数が日本は非常に多いんですけれども、これは大学が多いことに起因すると考えられる。各国を比較するにおいては、データセットが増えたとしても実際に活用されなければ手間がかかるばかりで意味がなく、活用という点も意識しないと現実的な形にならないのではないかといった御意見がございました。
それから2ページ目にまいりまして、一つ飛ばして二つ目の丸でございますけれども、大学の知的資産を機関リポジトリに集中させるためにはどうすればいいか、あるいは、そのような方向性が本当に妥当なのかどうかという点もポイントではないか。収集することのみならず、出口のメトリクスをどうするかも非常に重要だと。我が国としてどういう方向に進めばいいのかについてのフレームワークと示すべきといった御意見がございました。
それから、機関リポジトリの情報発信機能という観点から幾つか御紹介します。二つ飛ばしまして三つ目、各国の機関リポジトリのコンテンツ別データを見ると、明らかにその役割が異なると。米国は、大学をよく見せるという観点から情報発信に力を入れており、研究論文、外国の著名な研究者からのコメントと併せてリポジトリに搭載している。
機関リポジトリと情報発信に関連して、ORCIDとして取り組まれている研究者識別子の活用により有用性が高まるのではないか、さらには、このORCIDを機関リポジトリに導入することで、機関内の研究者同士のつながり、研究の近接性、他機関の研究者との関係などが分析可能となり、ある意味でイノバティブなリポジトリという将来性も高まるのではないかという御意見。
それから、大学の多数の研究者は、機関リポジトリの存在を意識していない現状にあると思うが、機関リポジトリの情報発信能力にメリットがあることが理解されれば、リポジトリの利用が活性化される可能性も考えられるという御意見がございました。
2ポツ以降は大学図書館機能強化の関連でございますので、冒頭しましたとおり、次に図書館を取り上げる際に改めて御紹介いたします。本日はここの部分の御紹介は省略いたします。
それから、資料2でございますけれども、第1回の学術情報委員会の御意見のうち、本日のメインテーマでありますオープンサイエンスに関する意見のポイントをごく簡単にまとめた資料であります。オープンサイエンス全般ということで、オープンアクセス・オープンデータは、学術情報のごく一部であること。それから、オープンアクセスに関しては、先ほどもありましたが、分野によって状況は異なり、いまだプロセスに乗り切れてはいないんじゃないかと。オープンデータに関連して、データを求められることに対応する手間とプラットフォーム、これが課題である。それから、オープンデータは分野による研究スタイルの違いもあり、どの段階でどこまでのデータをどう出していくのかは、かなりデリケートな問題ではないか。
それから、二つ飛ばして五つ目ですが、どのような方向に進むことで日本が強くなるのか、国際的なプレゼンスが得られるかという視点に立った議論も重要ではないか。
その下ですが、データを公開することのインセンティブなど、個々の研究者にプラスに働く面が重要である。その下ですが、データ公開することがきちんと評価される仕組みが重要ではないか。
それから一つ飛ばしまして、論文やデータを公開するビジネスモデルが非常に重要になる。
その下ですが、オープンデータへの対応は、個々の研究者にとって大変な負担感となり、このオープンというものの概念と研究現場とのギャップについてはよく考える必要がある。
ここの部分の最後ですが、データは生のままでは活用が難しいものもあって、データ処理のソフトなども含めて公開されなければ意味がない場合もあるといった御意見がございました。
それから、機関リポジトリに関連しては、機関リポジトリはオープン化の流れの中でその限界が見えつつあるということで、二つ目ですが、オープンアクセスへの対応として、機関リポジトリの活用は方策の一つではないかといったような御意見が第1回の中ではございました。
それから、資料3について併せて御説明したいと思います。この資料は実は、前回の1回目にも一部出したものでございます。本日は家先生も御出席頂いておりますので、第1回で御質問がありました機関リポジトリの状況について、前回委員会での御質問も併せて御説明したいと思います。ごく簡単でございますが、1ページ目でございますが、左上、機関リポジトリ構築機関数の推移でございます。前回2回目で御説明したものと、ここは同様でございますけれども、28年度末で681の機関にリポジトリが置かれているということで、この数は、世界で構築されている機関リポジトリ数、4,000弱でございますけれども、日本が一番になっております。先ほど議論ありましたように、機関数が多いので当たり前じゃないかという御意見もございました。機関リポジトリの数だけ見ますと、日本からずうっと下におりていきまして、左下のグラフですけれども、イタリアまでが7番ですが、ここでもう51%ということで半数を占めて、ブラジル以下でその約半分を占めます。
機関リポジトリ登録データ数の推移が右側にありますが、基本的には紀要論文等が非常に多いということで、28年度で56%を占めてございます。
それから2ページ目をごらんください。前回は5か国、日本、アメリカ、イギリス、ドイツ、フランスでございましたけれども、今回、カナダとイタリアを足して7か国にしております。左が件数でございますが、こちらは前回も申し上げましたとおり、アメリカとドイツがコンテンツ数でほかの国を圧倒しているというか飛び抜けております。日本は、設置機関数に比してコンテンツ数はすごく物足りない状況にあります。なお、カナダは、コンテンツ数的には日本より下ですが、設置機関数においては10位以下のランクでございますので、ここはその点を御留意頂く必要があろうかと思います。
それから、右側のコンテンツ構成ですが、左側の全コンテンツ数を100としたときにどういった割合になっているのかを示したものであります。前回も申し上げましたけれども、特徴的な部分としては、イギリスでは、学術雑誌論文が多い、それはイタリアも同様。ドイツはデータセットが多い。フランスは教材等が非常に載っているというあたりに特徴が見受けられます。一方で、緑色の部分がその他ですけれども、その他の内訳では、下の方に、ソフトウェア、図書の一部、地図、講義うんぬんと書いておりますけれども、こういうものの割合はアメリカも中心に非常に多いということであります。ここの分析も必要ではないかという御意見もございましたので、3ページ目に、そこについて、BASEでもう一度、国立情報学研究所(NII)にも御協力頂きながら調べてみた絵がこれであります。ちょっと色使いはあれですけれども、その他構成を全体として見ると、実は、不明(unknown)とありますけれども、雑多なものと、テキストではあるのだけれども分類できていないもの、未分類のテキストというものがほとんどを占めているということであります。例外的にイタリアが、ブックパートと書いてありましたけれども、図書の一部の部分と。それから、フランスでソフトウェアが多少目立ちますけれども、そのほかについてはunknownと未分類ということで、その他事項については、ほとんどが実は雑多な資料でよくわからない、現在のBASEを使っての分析はなかなか難しいという状況になっています。そういう状況なので、右側は余り意味がないのかもしれませんが、このunknownである不明の青い部分と、未分類のテキストである緑の部分を除いたもの、これ実は日本はほとんどが青と緑で埋まっていて、ほとんど色分けが見えないんですけれども、100%のうち0.5%ぐらいは多少分類ができるものが入っているものを分けたものがこちらです。
ということで、その他の構成について前回御質問頂いて調べてはみたものの、BASEの分析では、現在のところ実はよくわからない状況にあったことだけを御報告したいと思います。また引き続き別の手法があれば研究してみたいと思います。
それから、4ページ目は前回と同様の資料ですので、ごく簡単に御紹介だけ申し上げます。これは更新していませんので5か国のままでありますけれども、2ページのコンテンツ構成のうち論文のみを特出ししたものであります。リポジトリに学術雑誌論文の登載が進まない原因としては、ジャーナルで公表している論文の再登載となるということで、インセンティブが必ずしも高くないこと、それから、学協会の著作権ポリシーが定まっていない場合が多いことなどが、過去のこの委員会でも御議論の中で指摘されているところであります。
それから、連続で申し訳ありません、資料4でございます。本日、林先生から、オープンサイエンスの現状等について御発表頂く予定になっておりますので、私の方から、オープンサイエンスの推進に係る経緯をごく簡単に御紹介したいと思います。前期から引き続きの先生もおられますので、もう十分に御承知頂いておりますけれども、思い出しつつお聞きいただければと思います。まず1ページでございますけれども、これはオープンアクセスからオープンサイエンスへの流れということで、基本的には第4期の科学技術基本計画から第5期に向けて、オープンサイエンスの推進という項目が設けられて、オープンサイエンス推進体制を構築することと、公的資金による研究成果については、その利活用を可能な限り拡大することが記述されたわけであります。科学技術振興機構(JST)のJ-GLOBALによるオープンサイエンスがどれだけ引かれているかといったような検索結果においても、近年その数がぐっと伸びているということであります。
それから、具体的には論文の公開というオープンアクセスから、右側の研究データを含めたものとして拡大されるということで、JST、日本医療研究開発機構(AMED)等で研究データの公開を義務化したり登録先を指定したりということがなされています。
また、研究法人、研発法人もデータポリシーを定めるなど、データ公開実施に努めているというところであります。
それから2ページ目でございますけれども、世界的な動きを、特にはG8、G7の動きを御紹介したいと思います。平成25年6月に英国のロンドンでG8科学大臣及びアカデミー会長会合がありまして、このときの共同声明では、科学研究データのオープン化が確約されて、公的資金の提供を受けた研究成果へのアクセスを拡大させる政策を推進することになったわけであります。これがオープンサイエンスについて世界的な議論を加速させるきっかけとなりました。昨年のG7茨城・つくば科学技術大臣会合で、つくばコミュニケが採択されておりますけれども、ここでは、研究分野によって事情や状況が異なることは念頭に置きつつもオープンサイエンスは推進しようと、その際には、世界共通の原則の必要性とか、それから、オープンサイエンスはオープンアクセスとオープンデータを含む必要性といったようなことが認識されました。それとともに、研究者や研究機関にインセンティブを付与するなど、基盤の強化がうたわれております。
また、国際ルール作り等を検討する作業部会がこのときに設置されまして、日本とEUが共同事務局を務めております。
G7については、この秋にもイタリアで科学大臣会合が予定されておりますけれども、この作業部会での検討を踏まえた議論が行われる見込みと聞いております。
それから、次のページは、オープンサイエンスに関する国内の動きでございますけれども、まず、内閣府におきまして、オープンサイエンスに関する検討会が設置されて、「我が国におけるオープンサイエンス推進のあり方について」としてまとめられております。これが27年の3月でございます。ここでは公的研究資金による研究成果の利活用促進の拡大、論文、あるいは論文のエビデンスとしての研究データは原則公開ということになりました。この議論が平成28年1月に閣議決定された第5期の科学技術基本計画にも生かされております。国は資金配分機関、大学等の研究機関、研究者等の関係者と連携してオープンサイエンスの推進体制を構築するとし、公的資金による研究成果については、その利活用を可能な限り拡大する、こういうことを基本姿勢とするとされました。そのほか、研究二次データについても、可能な範囲で公開するということです。それから、ただ、安全保障とか商業目的で収集されたものなどは公開適用外とする、また、データのアクセスやデータの利用には個人のプライバシー保護、あるいは成果物の保護の観点から制限事項を設ける。それから、研究方法・研究分野によって、研究データの保存と共有の方法には違いがあることを認識する、こういった留意点も挙げられております。
相前後して、私どものこの学術情報委員会でございますけれども、学術情報のオープン化の推進ということで取りまとめていただいております。これは後ほど後述したいと思います。また、日本学術会議においても検討委員会を設けて、「オープンイノベーションに資するオープンサイエンスのあり方に関する提言」が28年7月になされております。ここでは研究コミュニティでのデータ戦略の確立などが示されているわけであります。
この検討を進める中で、日本学術会議がアンケートを行ったんですけれども、その際に明らかになった事実としては、過半の学協会が論文データ、データベースを既に公開していることや、半数程度の学協会がデータ項目の測定条件を共通化していて、一層価値が高まる可能性を持つデータもあると回答していたということであります。ただ、オープンサイエンスに関するシンポジウムやワークショップなどの開催実績がある学協会はまだまだ少なく、十分に浸透していない状況も見えたと聞いております。
4ページ目が、前期この委員会においておまとめいただいた「学術情報のオープン化の推進について」の概要でございます。検討の背景は省略いたしまして、基本的な考え方として四つの丸があります。大学等における研究成果は原則公開である、研究者が基本理念としてこういうことは共有すること。それから、研究成果の利活用の促進が分野を超えた新たな知見の創出、効率的な研究の推進等に資する。それから、研究成果の理解促進、研究成果のさらなる普及が期待される。また、研究の透明性確保にも資すること、これらの意義を踏まえて、論文と論文のエビデンスとしての研究データは原則公開すべきということがうたわれました。
また、それらの前提として、データが研究者において適切に保管されることが重要であるということで、どのデータをどのような様式で公開すべきか、あるいはどのような場合に非公開とすべきかについては、研究者コミュニティによる検討が必要ということが言われたわけであります。この基本的考え方を踏まえた基本的方策が5ページでございます。5点ございまして、一つ目は、論文のオープンアクセスについての取組ということであります。第5期科学技術基本計画中に原則公開ということを実行しようと。それから二つ目として、論文のエビデンスとしての研究データの公開ということで、先ほど申し上げた研究データの保管・管理はこれの前提であるということで、研究の実施段階から、研究の終了後に至るまでの利活用を可能な状態で適切に管理を行うことが必要だと。その基盤としてアカデミッククラウドを構築しようと、国はこれらの活動を支援することなどがうたわれております。それから、公開の対象とする研究データの範囲やその様式は、研究者コミュニティのコンセンサスを形成する、あるいは機密保持等の観点から、公開に制限がある場合などは公開適用外とする。それから、研究データの公開は、公的なデータベース、あるいは大学等の機関リポジトリを活用しましょうといったこと。
それから、3点目として、研究成果の散逸等の防止ということで、大学等において明確な方針のもとで保管・蓄積をしましょうと。それから、デジタル識別子を付与して管理する仕組みを確立することが書かれております。
四つ目としては、研究成果の利活用ということで、学協会等は、論文に係る著作権ポリシー、あるいは研究データの利用ルールを明示すること。一つ飛ばしまして、研究データの被引用をデータ作成者の業績として評価しましょうと。五つ目としては、人材の育成・確保ということで、研究データを専門に取り扱える新たな専門人材の育成・確保が必要ということが提言されました。
これら基本的方策に関しては、国のみならず資金配分機関、JST、NII、大学、学協会等において取り組むべき事項について提起してございます。
その下、最後でございますが、研究データの基盤整備の方向性ということで、研究データを的確に保存し活用していくためのプラットフォームの整備が重要であることがうたわれました。
駆け足になりましたけれども、オープンサイエンスの推進に係る経緯ということで御説明しました。私からの説明は以上でございます。
【喜連川主査】 大変ありがとうございました。今期からお入りになった先生方におかれましては、ざっと今お聞きいただいて、お分かりいただけますように、枠組みとか方向性、あるいはどんなふうに我が国として動かしていこうかという整理は、かなりの程度できてきているというところでございまして、今後、こういう全体的な枠組みの中で具体的にどうやっていくのかが、多分大きな課題になってこようかと思います。
前回御欠席でした家先生から、機関リポジトリに関しましては、そもそもその他が多過ぎるという大変適切な御意見を頂いて。このその他を分けてみても、またその他になっているような感じがしますが、何か先生の方からコメント等ございましたら、いかがでしょうか。
【家委員】 前回欠席して申し訳ありません。前々回、全く素人の単純な質問としてしたのですが、中身がどうも掛け声の割に伴っていないような、せっかくのシステムなのにという感じはいたします。
それから、日本の場合、前のページを見ても、紀要論文、これは恐らく日本語のものが多いと思いますので、国際的にこれがせっかくリポジトリを整備して、どれだけ活用されるのかという、コストというかレイバーパフォーマンスを少し考えないといけないと思います。
【喜連川主査】 未分類だけど何が書いてあるかは分かるわけですよね。緑色の部分。安達先生、何か中身を見てみましたか。もうちょっと何か知恵を、この緑とブルーだけじゃ何だか訳分からない。その他1色が2色に変わったぐらいですね。
【丸山学術基盤整備室長】 これはNIIにも御協力を仰ぎながら整理したのですが、実際にリポジトリを見に行くといろいろなものが含まれると。ただ、BASEのシステムのタグにうまく引っかからないので、ここに一応システム上は分類されてしまうので、細かく見ていけばということはあるんでしょうけれども。これは私の方から申し上げるのもあれなのですが、前職は学術調査官をしておりまして、そういう意味でいろいろな研究動向などについても調べる際に、グーグル等の検索機能を使っていろいろな研究成果であるとか、研究者の業績等について調べた際に、またいろいろなものが引っかかるんですね。普通の論文が、例えばJSTとかNIIのデータベース等で見える場合もあるのですけれども、我々は研究者ではないので、余り専門的なところに深く突っ込まないという観点からすると、もう少し雑文的なものの方が非常に役に立つ場合が多くて、例えば、国際会議に行かれたときの報告の雑文とか、それから、どなたかが学術賞を受賞したときに、その先輩・後輩が解説していたりするのですが、そういうものが載っていたり。そういう賞を取られたときに、ここの場合はあれですが、祝賀会というか、先生方を囲んで会合が催されたときのいろいろな先生方の発言録があったり。そういう雑多な資料がごそっと入っていて、割とそういうものが引っかかってきて、研究の状況の分析というかそういうことをするときに、素人目にすごく普通の論文を逐一読むよりは割と印象論として入ってくる場合が多いと。
私の印象ですけれども、実はリポジトリ等に含まれている論文以外の部分は、研究者の方々がそこをターゲットに見られることは少ないのかもしれませんが、我々のような研究者以外の人というか、一般の人も含めた人たちが割とたどり着いていて活用されている例もあるのかなという印象を持っております。エビデンスベースでちょっと説明できないので、これ以上はなかなか申し上げられないんですけれども、そういう意味では、研究者以外のコミュニティというか層の人たちが比較的いろいろなものを調べるときに、今のウエブの環境というかインターネットの環境は、割と活用が可能なような、非常によい感じがしております。
【喜連川主査】 それでもアメリカの場合、8割が緑なので、今の話が8割になるのも入るとして、もうちょっと何らかの形で、次回とかには難しいかもしれませんけれども、安達先生お願いします、ということを申し上げておくのがいいかどうか分からないんですが。
そういう状況にあるということと、家先生がおっしゃいました機関リポジトリがどう使われているだろうかという話は、これも調査をしましょうというのは、前回にも議論になったかと理解しております。
それでは、今の丸山室長からの御説明に関して質問を今頂くよりは、この後、林先生にまずお話を頂きまして、その後に二つを踏まえて議論したいと思いますが、よろしゅうございますでしょうか。
それでは、御発表の方をどうぞよろしくお願いいたします。
【林上席研究官】 本日はお招きいただきありがとうございます。文部科学省科学技術・学術政策研究所(NISTEP)の林です。本日は、オープンサイエンス政策の背景と現状について、研究データ共有の可能性を議論するために、そして、委員の先生方の議論の標準、土台をならすことを目的にしてプレゼンいたします。
まず、オープンサイエンスには、数えようによっては20年ぐらい関わっており、大分変わってきましたけれども、当初はオープンサイエンス関連の話をするとうさん臭く見られたので、自己紹介を必ずしておりました。1990年代に東京大学の有機合成でベタベタの実験化学をやっておりまして、そのときに試薬管理データベースやジャーナル査読データベースをコンピュータオタクとして片手間に作っている間に、後にオープンサイエンスにつながる潮流に気づき、電子ジャーナル開発への道へ転身しまして、2000年代にウエブ活用の本格化とオープン化が進んだときに、日本化学会で電子ジャーナルの販売促進を含む全体プロデュースとビジネスモデルの確立及びオープンアクセスの対応をしました。その流れの中で、日本学術会議などにもお声掛けいただき、家先生にもお呼びいただいたりしました。
そして、NISTEPに2006年からは客員研究官、2012年からは常勤職員として移りまして、電子ジャーナルの先を見据えたいということで、論文発表からデータ共有への広がりを見たい、それから、研究インパクトの新しい仕組みを見たい、これらを政策づくりのコンテキストで調査研究をやってみたいということで活動しております。その流れの中で、内閣府やRDA(Research Data Alliance)、OECD、G7などの専門家、委員としても参画しております。
先ほど御紹介ありました、2015年3月に発行された内閣府のオープンサイエンスに関する報告書では、先ほどのまとめにも出てきました絵(俯瞰(ふかん)図)と、それから、その後の研究を公開するときにオープンとクローズの戦略があるというチャートを作るなどもしました。そして、昨年G7で行われた科学技術大臣会合にて導入を村山先生と一緒にお話をして、G7のトップダウンアプローチからオープンサイエンスに取り組みつつ、一方、今年の6月まで江東区50万人都市の小学校の保護者代表、PTA会長の会長をやっておりまして、これはいずれはボトムアップ的にパブリックエンゲージメントやシチズンサイエンスの方に何かつながれば、何て思って始めたわけではないのですけれども、こんな人であるという形で、アイスブレイキングとして御紹介いたしました。
最後に直近ですけれども、オープンサイエンスマラソンと勝手に呼んでおりますが、文部科学省の委託調査でオープンサイエンスシャワーを浴びてきました。どういうことかと言うと、2016年11月にアメリカを3日間にNIH(National Institutes of Health)、NSF(National Science Foundation)、OSTP(Office of Science and Technology Policy)、大学、COS(Center for Open Science)というのはセンターフォーオープンサイエンスなのですけれども、これらを回って、集中してオープンサイエンスに関するディスカッションをし、今年の1月にはヨーロッパのEC、そして、イギリスのJisc、ウエルカムトラスト、RCUK(Research Councils UK)を回って、とにかくオープンサイエンスに関する議論を体でたくさん浴びて帰ってまいりました。そこで得た文脈を含めて今回ストーリーを立てております。
きょうお伝えしたいメッセージを先に御紹介します。オープンサイエンスは研究の在り方そのものを変え得るものでありまして、それに応じてより健全な研究評価体制を生み出し、産業振興にもつながるものです。その上で、当面の具体策としては、研究データの共有、まず、公開の前に共有から始めるのがよろしいんではないかと思います。相対的に今よりオープン化することによって、研究の効率化及び加速と、社会への迅速な波及効果を狙うものである。必ずしもフルオープン化ではないですし、フルオープン化したければすればいい、相対的に今のポジションよりもオープンにして、便益を得ましょうということがオープン化の本質であると申し上げたいと思います。そして、研究データや研究者に識別子を付与して、研究の着想の段階から成果の波及までを監視ではなくてモニター、淡々とログを取ることによって、研究活動の流れや効果をより測定しやすくするものでございます。
そして、もう既に出ておりましたが、研究領域、研究機関と研究者コミュニティの特性を踏まえて、研究が発展し研究者の貢献がより健全に見える化する、まずこれを大前提に置いて、あるいは研究をディスカレッジすることなく、大まかには新しいサイエンスを生み出すための推進策、今のサイエンスをより効率化するための推進策、そして、あえて現状の体制を維持するという、主にこの三つの施策を分野別に議論する必要があると思います。
繰り返しになりますが、研究者の手間を増やしたり意欲をそぐものであってはならない。むしろ将来の研究社会像を切り開くための前向きなものでなければならない。大事なことは、研究者が主体的にオープンサイエンスに取り組むべきだということでございます。この前向きなものでなければならないということを先に申し上げたのは、透明化から来る研究公正(透明化による不正防止)がオープンサイエンスの御利益という話がございます。それは論を俟(ま)たないのですけれども、それが前面に出すぎると研究者の意欲をそぐ形になってしまうのでという意味合いです。そして、今日お伝えしたい最後のメッセージは、オープンサイエンスマラソンをして痛感したのは、研究データを研究者が安心して安全に共有できる、信頼できる基盤作りと文化作り、評価と報酬、この文化作りが非常に重要であることが分かりました。
さて、丸山室長からの御説明の後のフォローアップを簡単にいたします。既に主な研究助成機関におきましては、例えば、JSTにおいては、2013年にオープンアクセス方針として論文のオープンアクセスを推奨、また、データマネジメントプランの要求、オープンサイエンス方針についても2017年4月に出されまして、エンバーゴ等は特に設けずに、とにかく方針としてデータの共有も打ち出しております。
日本学術振興会では、いつ開設したか調べられなかったので、こうなっておりますけれども、2013年頃だと思うのですが、オープンアクセスに関するwebサイトが開設されて、啓発活動を着実に進められ、啓発パンフレット等も作っています。
AMEDはデータマネジメントプランの要求を始めておりまして、それに当たってデータ共有ポリシーなどの策定も進んでいると伺っています。
一方、日本の大学ではオープンアクセス方針が出るというのが一つのトレンドになっております。これで全部網羅できているかどうかは定かではございませんが、今数え上げるところでは15個の大学等の研究機関がオープンアクセス方針を出していて、原則学内で出された研究成果に関してはオープンにしましょうという方針は出ています。
そして、面白いのは、科学技術・学術審議会の総合施策特別委員会で昨年11月に「オープンサイエンスの推進について」というプレゼンテーションが行われました。大事な点は、研究振興局と科学技術・学術政策局の連名でこういうプレゼンが行われたことです。オープンサイエンスはコラボレーションが一つ重要なキーワードですけれども、政策の面においても、研究振興局と科学技術・学術政策局でタスクチームを作って、5回ぐらい検討した途中結果を紹介しております。その内容は、先ほど丸山室長から御紹介があった報告の内容とほとんど変わらないのですけれども、データ共有方針、DMP(データマネジメントプラン)、データインフラ、識別子、評価方針、オープンクローズ戦略、専門家育成ということについて触れられておりまして、主査からの御説明がありましたように、文部科学省としての基本方針は示されておりまして、もう既にオープンサイエンスの文脈を含んだ施策、活動の整理、既存の政策とのひも付けやマッピングもある程度済んでおります。既に動いているものをオープンサイエンスの文脈で捉え直して施策として押していこうということも既に進んでいこうとしています。一方、人材に関してはまだ不透明な課題も残っているような状況ではございます。
ここまで足早にフォローアップしたのですけれども、次に、そもそもオープンサイエンスがなぜドライブされているかを、まず、この委員会で共有しておいた方がよろしいのではないかと思います。すなわち、研究者と論文数が増大していく中で、学術商業出版社の台頭、寡占と価格高騰化が進んでいます。それだけではなく、研究が多様になって質の担保をするのが難しいという話が出てきております。どういうことかと申しますと、ピアレビューの限界です。研究の内容は細分化されていくけれども、コミュニティがどんどん小さくなるので、それを審査する人を見つけるのが難しい状況の中で、既存の論文出版のピアレビューの仕組みでは限界を迎えようとしている。その一方で、電子化が進みましたので、定量的な研究評価のニーズは高まっている。そうすると何が起きているかと言うと、論文、特許、被引用数に結果的に偏重しやすい状況が生み出されているわけです。論文、特許、被引用数の活用を頭から否定するつもりは全くございません。これは、今数えられる定量的なアイテムとしては非常に優れたものではありますが、これが余りにも強調され過ぎていて、研究者の実態、研究活動の実態が表しきれていないのではないかという議論をよく呼び起こすわけでございます。特にその端的な例としては、インパクトファクター、雑誌の評価指標を研究者の評価に使ってしまうなんていうことが起きてしまっているわけです。一方、こういう定量的な研究評価のニーズの高まりというのは、公的資金で行われた研究に対する社会説明責任から来るものもあって、避けられない状況でもある。これら背景ないしはひずんでいる現状があるわけですね、研究成果公開と評価の在り方が多少ひずんでおり、ウエブインフラとICTの技術によって打開できるのではないかという仮説があることが背景にあるとお考えいただければと、いつも私は御説明しています。
オープン化についてまた別な説明をするときはこのスライドを使っています。これは、電子ジャーナルがもたらした便益・価値をお話しするときの図ですけれども、今や、図書館で学術雑誌を読む若い人はいないと思うのですけれども、多数のバンドルされた2,000ぐらいの電子ジャーナルが手元で簡便に読めるだけではなくて、二次情報データベースから簡単に検索して届くようになり、図書館の方々が頑張って、学内の必要なリソースになるべく早く届くようにすることをライセンス化している範囲でやっておりまして、その外にはグーグルがあるという情報の巨大なネットワークが生まれたことによって、図書館で紙の雑誌を読まなければいけなかったときには、専門性は高いけれども、読む人が非常に少なかったメディアが、原理的には、専門性は低いけれども圧倒的多数の方々に読めるような機会を与えることになった、これがオープンサイエンスのオープンが意味するものと考えています。すなわち開放ということをオープンと表現される先生方もいらっしゃるということで、御説明しました。
そして、ネットワーク化は、ただ単に先ほど申し上げたような論文同士だけではなくて、ここでは詳細は割愛しますが、ネットワーク社会ということで、人、組織、タスクなどの個別のアイテムが様々に組み合わされて価値を創出する、それがビジネスになっている時代であることは御存じだと思います。しかも、大事なのは、こういう学術情報流通をうまく組み合わせて価値を出してビジネスを作るという世界が、ただ単にエルゼビアやネイチャー等の既存の学術出版社だけのビジネスではなくて、グーグルやアップル、マイクロソフトなどのようなところも既に触手を伸ばしていて、タイミングを見計らっているだけじゃないかという見方もあります。
そのネットワーク化ですけれども、またちょっと局所的に見ますと、論文、特許、著者を数え上げて名寄せをしていれば、計量書誌学という学問が昔は成り立っていました。それをやるだけでも大変で、そこで分かることで研究のインパクトに関する論考をしていたわけですけれども、ICTの発展によって、多面的で多次元なネットワーク解析ができるようになりました。すなわち、多様な情報源との連携、組合せによる目的に応じたメトリクスができる、あるいはウエブ上のデータをフローとして処理をする、ストックしてダンプしてから処理するのではなくて、オンタイムにその場で処理をして、即時にパフォーマンスを見ることができる社会になっているわけです。さらに、それぞれの情報流通アイテムにはIDが付与される時代になりましたので、誰がどの研究機関にいて、どの研究費をもらって、どの成果が出たかというのがひも付けできる、そういうサービスはもう既に売られて、これは2009年のスライドなので、もう今や当たり前なのですけれども、もう製品化されて、各大学ではそのサービスの売り込みにどう応え、活用するかという状況だと認識しています。
それが研究パフォーマンス測定ツールという形で端的には表れるわけですけれども、ある先生とある先生、あるいは大学同士を比較してベンチマークすると、その大学の強み・弱みなんていうのが分かって、どこからどの研究者を引っこ抜いてくればいいみたいな、個人的には非常に表現が難しいのですけれども、アグレッシブな経営ツールになるのかもしれません。しかし、大事なのは、ほとんどのツールが先ほど申し上げた論文被引用数ベースでありますので、使い方を間違えると研究の多様性や研究力そのものを失いかねない。論文と被引用数以外の指標もやはり見るべきではないかというところにも、オープンサイエンスの駆動力が働いてくるわけです。ネットワーク化やオープン化が進むことによって、紙と物流をベースにしてきたメディアである雑誌の意義や査読の意義が問われてもいます。つまり、雑誌のオープンアクセスが進んだ理由の一つとしては、例えば、査読なんていうのは、先にオープンにしてみんなでやればいいじゃないかという考えが生まれたりもすることによって、オープンアクセスメガジャーナルのようなものが生まれる、雑誌自体の意味も変わったりということがありまして、結局は紙と物流による情報伝達の枠組みからいよいよ研究者社会のエコサイクルが離れ始めたということで、ゲームのルールが根底から変わるポテンシャルを持っている、今我々はその過渡期にいると考えております。これをやはり歴史に習うと、大量印刷ベースのときに1660年にロイヤルソサエティーが生まれ、1665年に最初の学術雑誌の一つとされるフィロソフィカルトランザクションが生まれました。そこから始まって350年かけてできた、学術雑誌による学術情報流通のエコシステムがウエブベースに変わっています。化学出身なので化学反応の遷移状態という言葉をよく使うのですけれども、あるステートからあるステートに移る過渡期の状態にある。それを端的に表すのはPDFという、紙ベースの「誌面」を維持しながら電子化するのが今は受け入れられているということで端的に表されているという状況です。
結局は、学術情報流通の再発明、リインベンションが起こるわけです。ゲームチェンジの兆しはもうそこかしこに生まれています。一番有名なのは、SNS上で勝手に論文をシェアして著作権上の問題を引き起こす、あるいは、スライドには挙げませんが、Sci-Hubという海賊サイトでは5,000万以上の論文が有料・無料に関わらず、有力な商業誌や学会誌を含めて全部読めるようになっていて、もちろん違法であり看過はできません。ここで大事なのは、日本を含めて欧米のかなりの研究者がそれを使っているというデータがあるという状況です。つまり、いい悪いを超えて、使われてしまっている、進んでしまっているという現実、新しいゲームの流れができているという状況です。
もっと身近なところでも、例えば、プレプリントサーバの創設がここ1、2年の間に非常に進んできております。プレプリントサーバというのは、研究者が雑誌に投稿する前に、大体ドメイン別ですけれどもリポジトリに登録してオープンに先に読んでもらうサーバなんです。もともと高エネルギー物理から始まったプレプリントサーバ、arXivの中で、数学や経済、統計などに分野が拡大し、あるいはディープラーニングの研究では、これは今アーカイブ上でやるのが主戦場だと聞いています。ディープラーニングの論文をアーカイブに載せたら、次の日に前の論文を引用した論文が出るみたいな早さで研究が公開されていると伺っています。それがほかのセンターフォーオープンサイエンスやアメリカ化学会の学会も含めて、生物、工学など、様々な分野で今プレプリントサーバが立ち上がろうとしています。
良いプレプリントサーバの利点は、ピアレビューするのが難しい、あるいは長い研究領域においては、とにかく先にオープンにすることで早く先取権を確保することができます。そして、マシンリーダブルにしておけば、早く人工知能あるいは検索機能に取り入れられて、世の中に効率よく届けることができます。先行している領域では、こういうプレプリントサーバに載せても、もう一回ジャーナルに出すことができるようになっていて、ピアレビューした後に、パブリッシュされた学術論文を業績リストに挙げて、研究費を獲得し、プロモーションが進んでいるのが現状であることが今非常に面白い状態で、最近プレプリントサーバが立ち上がったところでも、同じようになるのかが議論の一つとなり、そこだけでも面白い議論だとは思います。
更に進んで、Wellcome Trustというイギリスの非政府系助成機関では、昨年11月にウエルカムオープンリサーチというものを開発しました。これは、研究助成団体が出版プラットフォームを用意して成果の登載を義務化しています。そのファンドをもらった人はここに載せなければいけない。論文データ、あらゆる成果を登録可としています。プレプリントサーバと同等の機能を持つだけではなくて、そこでピアレビューもやってしまうわけです。ピアレビューは、ファカルティサウザンドと言われているサービスに委託して、専門家のピアレビュアーを指名して2名の査読が通ればパブリッシュされたものとしてちゃんと検索インデックスに入ると。しかも、裏側で査読者の貢献が見えるようにもしている仕掛けがあります。出版社よりコストを安く、1論文750ドル程度で始めているとされています。参考までに、一般的に商業出版社でオープンアクセスをゴールドでやろうと思うと、著者は平均で2,000ドルから3,000ドルぐらいを支払うと言われている状況です。
これ、出版社を介さずに研究助成団体が研究者とだけやりとりをすることで、助成研究の成果をオープンにすることができるモデルが出来上がってしまいました。これを実はアメリカのゲイツ財団も追随することが発表されております。2017年後半にゲイツオープンリサーチということで、ほぼ同じものを踏襲すると伺っておりますが、こういうゲームチェンジの動きもあるという状況です。
こういうことが起きるのはごく自然で、なぜならば、グーテンベルグの写植機による大量印刷の前は手書き写本で、本を写して学問は進んだわけですけれども、それがグーテンベルグによって大量印刷できたということは、手書きの状態に比べれば、今で言う情報爆発、情報革命、オープン化と同じことが起きていたわけで、その歴史が繰り返しているだけではないかと思えば、ある意味その歴史に従って淡々と我々も進んでいけばいいんじゃないかという話になるわけです。
では、研究者にとってのオープンサイエンスですけれども、先ほどから申し上げているとおり、研究データをよりオープン化することによって可能性を見いだすことになります。あるいは、研究活動自体をよりオープン化することによって、インターディシプリナリやトランスディシプリナリのサイエンスを進める。念のため申し上げますが、これまでの研究スタイルが悪いのではなくて、付加的に今までにできなかったサイエンスができるようになっているということです。その新しい研究活動によるゲームチェンジによって、成果公開の新展開、後継者の認識による研究評価の新展開が進む。それは全て科学技術・学術、産業、文化が発展する、そして、研究者の貢献が認められることが前提であるべきということになります。
考えてみれば、ICTの技術を使って我々が出版の世界でやっていることはごく一部です。つまり、今までどおり、紙と物流の世界の出版という機能を今まで電子化してきたわけです。それを今、データ作成や共有のところまでプラットフォームを作って、それでその貢献を見えるようにしましょうという状況ですけれども、原理的には、着想段階、研究費を取って、人材を採る、そういったところにも実は研究活動に対する貢献者はたくさんいるわけで、その方々の活動ログが取れるようなものができれば、実はもはや場合によっては、出版という行為すら必要ないとまでいかなくても、その意味合いが変わり得る、オープンサイエンスが目指すところは、今は研究データの共有から始まっていますが、その先にあるこの新しいサイエンスの活動のエコシステムを作ることが遠いビジョンにあるわけです。
そのために、例えば、アメリカのセンターフォーオープンサイエンスでは、こういうリサーチワークフローを想定しまして、既にこれだけのツールが存在していることをアピールしています。これらをつなぐ中間のミドルプラットフォームを作成して研究者にサービスを提供しよう、オープンサイエンスフレームワークと呼ばれるもので、そういう活動がアメリカでは進んでおります。あるいは、これは別なデータライブラリアンの方の資料ですけれども、こちらもこのような研究のワークフローがあったときに、そのツールがどのように進化していったか、トラディショナルなものからだんだんイノバティブなもの、あるいはグーグルではどうしているか、ネイチャーではどうしているかが見てとれるようになっています。今、ただデータを共有するだけではなくて、研究活動のライフサイクルそれぞれにおいてツールを提供し、それをうまくつなぎ合わせることによって、新しい研究活動のエコサイクルを何とか作ろうと。そうすることによって、旧来の論文を出版し、被引用数を見て、特許を数えるだけの研究評価、インパクトアセスメントの世界の先を見たいという話になってくるわけです。
そのことを前提に、これも一つずつはとても御説明できないのですけれども、研究者のイニシアチブや、経済施策のイニシアチブ、出版社のイニシアチブ等々、様々な活動があるという状況になっております。
特にその中で一つ取り上げたいのは、欧州単一市場、デジタルシングルマーケットというものが2015年5月に出てきました。デジタル技術に基づく情報利用・サービス、ネットワークや経済の向上を実現するということで、5億人、50兆円の経済効果を見込んでいます。データ情報通信の標準化及び相互運用性の確保、インターオペラビリティーの確保が優先事項ということで、試算としては、その後、ヨーロピアンオープンサイエンスクラウドを作って、それに67億ユーロを投入するという話にもなっております。そのヨーロピアンオープンサイエンスクラウドですけれども、既存の研究データ基盤構築と施策との連携調整を行って、先ほど申し上げた一気通貫に研究データの利活用ができるプラットフォームを作ろうというものです。
御参考までに、EUDAT(European Data Infrastructure)というのは、ハイパフォーマンス・コンピューティングのインフラを利用して研究データを共有し、研究活動を加速させようというものです。GEANTというのは、日本で言うSINETに当たるネットワーク整備の施策でございまして、それを活用したものがアカデミッククラウドに当たるものになるわけです。LIBER(Association of European Research Libraries)というのは、図書館側が集まって、その研究データインフラをどう整えるかというイニシアチブで、OpenAIREは、その中でもリポジトリを集めてそれを共有する、つなぐという話。あるいは、EGIというのは、300ぐらいのデータセンターを集めてデータ共有を進めましょうというものです。これらをうまく連携させて、まずは欧州全体の研究データ利活用基盤を作り、いずれは世界の研究データ利活用基盤、グローバルオープンサイエンスクラウドにできるのか、という話にもなっている状況です。その一端としてNIIさんは既にOpenAIREの連携で機関リポジトリのコンテンツを既にOpenAIREの方に提供し出しているという状況になります。
それが、イギリスであればJiscのリサーチデータマネジメントシェアサービス、その他一つ一つ説明できないですが、ドイツやフィンランド、オーストラリアで似たような動きが進んでおります。
さて、OpenAIREに送り込まれ、丸山室長からもあった、インスティテューショナルリポジトリ、機関リポジトリ、すみません、ここから先、配付資料には入れられなかったものですので、画面をごらんいただければと思います。このインスティテューショナルリポジトリをどう活用するかが日本では一つのキーになってくるかと思います。744個の、これは割と最近のデータですけれども、先ほどのとちょっと数字がずれているのはその差だとは思います。これをどう活用するかという話になると思います。NIIさんでは既にデータ基盤センター、オープンサイエンスセンターというものを立ち上げまして、リサーチデータマネジメント、研究データを管理する基盤作りを始めております。パイロット9大学と組んで研究者のデータを預かって、それを研究活動に生かすためのパイロットプロジェクトを始めていますが、それをディスカバリーサービスやパブリケーションプラットフォームとうまく組み合わせることによって、ヨーロピアンオープンサイエンスクラウドの相似形のようなもの、つまり、日本の中で研究データを使って研究者が研究する、支えるインフラとサービスを提供するところまで試験的には既に来ているという話になっています。
こちらの方もリサーチデータマネジメントプラットフォーム、これは繰り返しになります、とにかく、研究活動サイクルを1回モデル化して、そこにプラットフォームないしはサービスを提供し、研究者の活動を支援するというこの繰り返しになります。ですので、このフレーミングとモジュール作り、ここで大事なのは、全部自分で作るのではなくて、必要なモジュールは、世界に標準のものがあればそれと組む、あるいは、使う、導入することで、いかに研究者が欲しいサービスを実現するかというのが大事な目的になっていると私は理解しています。
さて、こういう研究プラットフォームを目指して動くわけですけれども、では、データ共有を進めてどういう研究ができ得るのかということが議論になるわけで、既に起きている研究でもこういうデータシェアリングによる意味はたくさん見いだすことができます。例えば、共同解析、これはハイエナジーフィジックスですね、大量の実験データを解析する。この場合は公開よりは共有、身内や研究仲間で共有することをどんどん進めていくのがオープンサイエンスの施策になると思います。
あと共同観測に関しましても、これも世界レベルで1機関では使えないものに関してコラボレーションする、その前にコデザインですね、一緒にデザインして、コプロダクション、一緒にデータを生み出して、コディストリビューション、一緒に配付する、地球観測など、そういうことができる分野だと思います。あるいは、他の研究者では簡単に再現できないようなヒトゲノム計画のようなユニークデータに関しましても共有が進むことになると思います。あと、よくある議論ですが、失敗データ、つまり、今までの情報インフラでは捨てざるを得なかった情報を再活用する、あるいは、見方を変えれば価値が出るかもしれないようなデータを積極的に使ってみることもデータ共有の有効事例になりえます。そして、ボランティアが活躍するということがあり得ると思います。このボランティアの活用ところについては、どうしても科学技術政策上は科研費やJSTの研究を中心とした多額の研究費をどう利活用するかに議論が置かれがちですけれども、オープンサイエンスによって市民がより参画できることも一つの大きな御利益です。シチズンサイエンスによって研究者がフィールドワークなどに象徴されるようにN数を増やすことによって、より簡便に研究を進められるだけではなくて、市民がサイエンスに興味を持つことによって、科学リテラシーが向上するという形で科学がより進むことがあり得るかと思います。
よくある指摘の一つに、ブラック企業みたいに市民をこき使ってサイエンスを進めているのではないかという話があるのですけれども、そうではなくて、そういう活動の中から新しい発見や価値の創出があることもわかっています。そうしますと、典型的な例で言うと、さかなクンのように、大学等々のアカデミズムのバックグラウンドを経なくても、内在的欲求と強い好奇心と膨大な知識力があるような人をシチズンサイエンスの枠組みの中で早く見つけて登用してサイエンスに貢献する、という人材育成や活用の話もオープンサイエンスではできる可能性があるわけです。
さらに、もう現在academistというクラウドファンディングでは、学術を市民が支援する枠組みができて、多数の支援が始まっております。つまり、税金を使わずに欲しい研究を思いついたら、それを市民にアピールしてネットで資金を集める研究も始まっています。こういった形で、サイエンスの形、あるいは研究活動の形、それをその周りを含めたエコサイクルというものが確実に変わりつつある中で、研究データの共有をこれからどうしていくか考えるべきだということになります。
最後に、オープンサイエンスに関わる分野別マッピングで、ちょっと荒いですが、仮に横軸として、その研究が産業界、知財と近いか遠いかとし、縦軸に社会との関わりが直接的か間接的かという軸を置いて、これは私見ですけれども各分野を置いてみる。そうすると、天文学や地球科学なんていうのはもとからオープンサイエンスが進んでいたところですし、市民も関与していましたし、これの領域はオープンサイエンスはどんどん進めるべきものだと思います。一方、先ほど申し上げた高エネルギー科学の場合は、社会との関わりは間接的ですので、むしろこれは身内で共有することを進めるべきであると思います。この領域の究極は数学になります。
一方で今注目するのは、ジオサイエンスや環境系、地政学が入るようなものに関しては、オープンサイエンスのメリットが最も享受しやすく、新しい市民科学の可能性が今いろいろ模索されている。一方、私が出た有機合成化学は、身近に言うと製薬なのですけれども、そこは非常に知財との関連が強く、また、社会とのつながりが直接的でないので、これをオープンにする意味合いは非常に少ないと一見見られがちですけれども、オープンイノベーションの関係で、今より情報をちら見せして協業相手と組むというような形のオープンイノベーションの理念を使うことで、オープンサイエンスの御利益を得ることも可能になり、実際、創薬のオープンプラットフォームなども進んでいる状況です。これは飽くまで一例ですけれども、こういうマッピングをしながら、先ほど申し上げた新しい価値を生み出すためのオープンサイエンスなのか、今のサイエンスをよりよくするためのオープンサイエンスなのか、あるいはステイするのか。ステイというのは、ある意味、例えば高エネルギー科学は元からそうですし、そのままでいいという意味合いもありますが、という議論ができると思います。
そういう中で、図書館の役割、すみません、これは余計だったかもしれないのですけれども、(学術情報委員会が)図書館の話も議論するということですので、このスライドも入れています。先に申し上げた流れでゲームチェンジが進んでいく中で、当然、図書館の役割も変わっていくのは当たり前と言えば当たり前だと思うわけです。これまでは購読雑誌のゲートキーパーで、電子ジャーナルでも引き続き変わらなかったわけですけれども、それから今度は研究成果のゲートキーパー、ないしは研究のパートナーにどのように変化すればいいのかと考える次第です。つまり、着想段階から研究支援する話で、出版した後の情報の支援ではなくて、その前の研究プロセス段階からの支援に踏み込むのかどうかということで変わってくるかと思います。例えば、リポジトリを通じた情報発信、共有保存、これはもう既に進んでいると思います。これは既存の出版情報を扱うというインクリメンタルな活動の先にあると思うのですけれども、そこから研究データを扱うスペシャリストの汎用型になるのはどうかという話になります。ドメイン型は、どうしてもサイエンスの知識がないと難しいというのは、皆さんかなり同意頂けているんですが、教育の目的、再利用の目的、あるいは後世に残すためというような、汎用的な目的のための研究データ、スペシャリストに、図書館員はなれるのではないかと思います。その上で、究極的には、研究のデザインから参画は可能かどうかという命題が生まれてくるかと思います。
このような流れの中で、研究開発のために情報基盤の整備が必要で、例えて言うならば、図書館で蔵書構築をしてきたのが、今、データベースやリポジトリ構築をしていく流れになっていて、その先には、研究者にサービスを提供するプラットフォームを研究者と一緒に作っていくという形が考えられるべきだと思います。例えば、いろいろな大学でこのお話をして、比較的受けがよかったものに、終わった研究を図書館がリポジトリでまとめて管理して保存してみたらどうかという話があります。研究者は実は新しいことを見つけるとさっさとそっちをやりたいという習性があるので、そのときに残ったデータをしっかり管理してもらえると有り難いということでWin-Winの関係ができるのかなと。いずれにせよ大事なのは、大学や研究の経営に不可欠な存在になるべきで、長くなって恐縮ですが、アレクサンドリア図書館が生まれたときには、それがヘレニズム文化を非常に支えたことは有名な話ですが、そのアレクサンドリア図書館で何をやっていたかと言うと、スライドのここに船舶版と書いてございますが、アレクサンドリア港に着いた積荷に片端から本をあるかどうか調べ上げて、本があったら副本を作って、本物は図書館に強制的に納本して、副本をお金と一緒に返すということをやっていたという話を伺いました。つまり、情報資源というのは、その大学、研究機関を経営する上での大事なリソースなわけですので、そのリソースをどういうふうにマネージするか、コントロールするかという意味合いにおいて、図書館が果たすべき役割はこれまでどおり変わらないはずで、ただ、その形が変わっていくのではないかと思う次第です。
そして、最後に、冒頭で申し上げたオープンサイエンスマラソンで、繰り返しどの国の方々も言っていたのは、どういう施策をしようが、どういうインフラを作ろうが、研究者に安心・安全と思ってもらえるデータ共有の文化作りが必要だということです。みなさんが、「文化作り」とはおっしゃっていなかったのですが、だ、一言でまとめるとそういうことでした。簡便な蓄積をするためには、研究データ基盤整備が必要ですが、簡便な利用とユースケース作り、やはりサービスデザインが非常に重要であると思います。最終的には、これを使わないと研究ができない、というものができないと浸透しないと。逆に言うと、論文を何で皆さん書きたがるかと言うと、論文を書かないと昇進しづらいし研究費ももらいづらいという、自分の成果を世に広めたいという表向きの理由がもちろん大事ですが、ちゃんと現実的な理由も裏側に存在しているわけなので、そういうインセンティブに裏打ちされたサービス設計がやはり必要になってくると思います。そのときに後の研究活動の評価やインパクトアセスメントと関連するのですけれども、利用に関するライセンスがたとえオープンにする場合にも必要であることが分かっています。しかも、それはマシンリーダブルであることは必然かと思います。
そのインフラを前提とした健全な評価と報酬の仕組みが必要です。当面はデータ引用文化を醸成するところから始まらざるを得ない状況ですが、それを研究や研究者の評価に展開する必要があります。その文化醸成をどうやっているかを聞いてきましたが、それはやはりステークホルダーの対話の繰り返しが必要ということで、例えば、ヨーロピアンオープンサイエンスクラウドでは、パイロットプロジェクトを立ち上げて関係する人を集めて、とにかく対話を繰り返します。英国のConcordatは、これは正に対話のためのイニシアチブですけれども、オープンサイエンスに係るステークホルダーを皆さん集めて、同じようなことでも何度も議論して、共通の議論の土壌とコンセンサスを作っていくことを繰り返していることが分かりました。
最後に、すみません、きょうは報告書が間に合わなかったので、一部の予告ですけれども、研究データの信頼ある仕組み作りが必要だというエビデンスが出てまいりました。これは、NISTEP客員の筑波大学大学院の池内さんと一緒に行った調査で、日本の研究者(NISTEP専門家ネットワーク)2,000人ほどに聞いた結果です。研究論文、オープンアクセス論文を出したことあるかという質問では70%、データに関しても51%は出したと言います。この出していない人になぜ出さないかとまず聞きました。いろいろな理由があるのですけれども、じゃあ、その障壁、理由が全部解消されたとき、あなたはそのデータ、論文を公開しますかと伺ったときに、論文の場合は、8割の人がそれだったら公開すると答えるのに対して、データに関しては、たかだか3割しか、障壁がなくなったとしてもオープンにする意思がない、つまり、まだ信用していないことが分かりました。報告書が公表されましたら、他の知見と合わせて、また共有させていただく機会があればと思っています。
ということで、長くなりましたが、本日のメッセージに戻りますと、オープンサイエンスは研究の在り方そのものを変え、評価を変え、産業振興にもつながるものです。相対的によりオープン化することによって、研究を効率化、加速し、より大きなあるいは素早い社会の波及効果を狙うものです。データや識別子を付与して、研究活動のあらゆるポイントでログが取れるようにすることによって、研究の過程と貢献者をより健全に見えるようにするものです。研究領域、研究機関、研究コミュニティの特性を踏まえた施策が必要であり、例えば分野は、先ほど申し上げたようなマップなどに従って、新しいサイエンスを作るのか、今のサイエンスをよくするのか等々の議論を進めていく必要があると思います。何度も申し上げますが、研究者の手間を増やしたり意欲をそぐものではないとして進めます。そして、安心・安全にできる研究データ基盤作りと文化作り、つまり、基盤作りはNIIさんやJSTさんを中心に進んでいますが、そこから研究者コミュニティがいかに乗っかるかというところの議論を具体的にどうしていくかを検討する必要があるかと思います。御清聴ありがとうございました。
【喜連川主査】 どうもありがとうございました。非常に多岐にわたるポイントを非常にコンプリヘンシブに御紹介頂きましたので、ほぼ大きな漏れはないのではないかという気はいたします。今、御発表頂いた論点の中で、ここをこの委員会ではもう少し深めていきましょうとか、そういうことも含めて御議論を進めていただければ有り難いと思います。冒頭申し上げましたように、大体の方向感は共有されているかと思いますので、具体的な一歩をどう踏み出すかということをこの中で皆様と御議論することがいいのではないかと思っておりますので、どうぞよろしくお願いいたします。
かなり広い話なので、どこから話すか。引原先生。
【引原主査代理】 じゃあ、口火を切らせていただくつもりで、御質問させていただきます。今のお話の中で、旧来のステークホルダーから新しいステークホルダーへ変わっていくフェーズのシフトを今させようとしていることになるかと思うんです。その中で、研究を生産する研究者がステークホルダーにフィックスされているというか、とらわれている状態にあるものを新たなところへ持っていくということは、かなり大きなインセンティブあるいは力がないといけないと思うんですけれども、それが今非常に急にやらざるを得ない状況になっていますよね。どちらかと言うと、ホールドされていたものがいきなり外されてバラバラっとなって、もう一回集めようという動きのようなお話に聞こえてしまったんですけれども。実際には、研究者がそう簡単に離れるものではないと思います。それについてはどうお考えですか。
【林上席研究官】 御指摘ありがとうございます。少し説明の仕方が不適切だったかもしれないのですけれども、既存の研究、つまり、今問題なくエコサイクルが回っている研究活動・研究者をいたずらに刺激するものではなくて、このICTの技術を生かした、あるいはインフラを生かしたサイエンスを創ろうという人たちが、数少ないですけれども生まれているので、まずはそこを押し進める、そこだと思います。つまり、今、研究者のメインの層を短期間にドラスティックに変えることはほぼ不可能だと思っておりますし、科学技術政策において研究者と対話するのは、ハーディングキャッツ(Harding Cats)と言って、ハーディングシープではなくて、猫、ちょっと不適切な表現かもしれませんが、よく言われていることで、いろいろなオリジナリティのある研究の方向性を持っている研究者の方々をまとめていくのは非常に難しいと考えられていますので、まず、やりたい人たちをいかに探すかが大事だと思います。その意味で、広範囲の領域と多数の研究者を擁する大学においてどのように進めていくかは非常に難しいと思いつつも、ドメインベースで進めるべきところから進めるという議論につながっていくかとは思います。
【引原主査代理】 お聞きしたかったことは、例えば、先ほど言ったように、研究者は結局ジャーナルというものに固定されているものですから、オープンサイエンスというのはなかなか難しい。オープンサイエンス自身は昔はジャーナルに固定されてオープンサイエンスになっていたわけですね。雑誌ができてきたときに、投稿することによって先取権を確保して、オープンにすることが確保されてきたわけですけれども、今は必ずしも雑誌に投稿しても先取権が確保できているとは言えないわけですね。また、オープンになっているとも言えない状況なんですね。それをもう一回取り返そうという動きなのか、そんなものはどうでもいい、とにかくオープンになっていればいいということなのか。先取権を取り返すことをサポートするべきなのか、オープンになるだけでいいのか、どちらなんですかという、極端な言い方でお聞きします。
【林上席研究官】 まずは、研究者の先取権を確保することが大事だと思います。
【引原主査代理】 なぜこんなことを聞くかと言うと、ジャーナルがこれだけ乱立しているときに、どこで何が出ているか分からない、それをただひたすらグーグルがタイムスタンプを決めているような状況になっているわけですね。グーグルかどうか分かりませんけれども。ところが、それに背くようにプレプリントサーバみたいなのが出てくるわけです。とにかく確保してから評価を受ける。一方で、動きとして、先取権を確保することをメインに持っていける分野と、そうじゃなくて、積み上げていって、きちんと論理を構築する分野は全然違うと思っています。
だから、今のオープンサイエンスというのは、一挙にお話しされましたけれども、それは両極端に分かれているんじゃないかと私は思うのですけれども、間違っているかどうか、お聞かせください。
【林上席研究官】 すみません、その議論のときによく使うスライドを今日は割愛したのですけれども、高エネルギー物理のように、読者と投稿者の数と中身がニアリーイコールのコミュニティと、読者が投稿者に対して非常に広いコミュニティで議論を分ける必要があるかとは思っています。つまり、読者イコール投稿者であるコミュニティであれば、なるべく早く先取権を出して、これはある先生の言説を借りれば、そういうコミュニティで中身分からないのはもぐりだとおっしゃるわけなんですね。そういう研究の場合は、より先取権を確保すべきだと思います。
一方、私が出た有機合成化学ですと、研究する人に対して利用する、特に企業など多数の人が見ますので、どれを読めば信頼できる情報があるのかというところにその論文の価値が生まれますので、そうすると、クオリティコントロールに重視することが必要になってくると思います。
【引原主査代理】 当然そういう話になると思います。そうすると、オープンサイエンスという、今、林さんが御説明頂いたものの軸があったと思うんですけれども、分野によって違うことと、それぞれの分野で一歩出なさいといったときに、またそこに評価軸が載ってきてしまう、何か自己矛盾を起こしてしまいます。オープンの評価が入ってしまう。だから、あえて申し上げているのは、別に私、内閣府の委員会でオープン化推進のフォローアップ委員会の座長をやっているので、立場が変われば多分同じことを言うと思うんですけれども。分野によってオープン化が違うという主張を認めていくと、オープン化は進まないと私は思っています。今、私が言ったのは、研究者自身がこれだけの幅があって、論理が違う、あるいは先取権を求めるものが違うし、オープンにするデータも違うという中で、オープンサイエンスというのはどこを目指していくべきなのかということの議論が、きょうどこへ向ければいいのか、どういうふうにお考えなのか、最後に聞きたかったんです。
【喜連川主査】 分かっていれば苦労しないということですが。
【林上席研究官】 一つだけ言えるのは、学協会を中心とした学術コミュニティがこの議論にもっと入っていくことが必要です。最後、対話の繰り返しといった中に、日本化学会というところに勤めていたので肌感覚で分かるのですけれども、なかなか今オープンサイエンスの議論になかなか日本の学協会が載っているかと言うと、ごく一部を除いてかなり寂しい状況でもありますので、まずはそこから、具体性と言うとそこからしか言いようがないという状況かとは思います。
【喜連川主査】 余りフィロソフィカルな話、そういう意味では、この前のフェーズでそもそもオープンにすべきかどうか議論して、一応政府としてはこういう方向で行きましょうという、ある種大人の判断をしたんですね。ですので、そこをもう一回やっても、ほぼエンドレスじゃないかなと思いまして、むしろ、この言葉で世界が一定程度協調しようという中で、我が国としては何をすれば一番国家に資する方向感を得られるのかという、その一点に絞って議論すべきじゃないかと。全ての分野で同時にやらないと駄目というお話も高まいな哲学としてはあるのかもしれないんですけれども、そうも言っていられないところもあると思いますから、この分野だったらこうやればすごくうまくいくだろうみたいな話はあると思うんですよね。
【林上席研究官】 そうですね、その議論のときによく出す例は、今、谷藤さんご自身が積極的に進められていますけれども、材料化学系では、日本の強みである材料の情報について、いかにオープンクローズ戦略を利用してオープンにしつつ、アメリカ等と組んで材料化学を発展させていく、あるいはビッグデータ解析を加えることなどによって発展させる、というように新しい価値を生み出していく話があります。
それから、国際協調に乗り遅れないためにオープン化するような領域、環境系なんかだとそうだと思うんのですけれども、というドメイン別の議論をしていくことになるんだとは思われます。海洋研究開発機構さんも、海洋の情報自体は一見オープンに見られがちなのですけれども、海洋資源になると途端にウエットな議論が入ってきますので、そこのところをうまく議論を仕分けていくことになるんだと思います。
【喜連川主査】 もうちょっと具体的に論点を少しずつ移していきたいと思いますけれども、ほかに御意見等ございますでしょうか。
【谷藤委員】 林上席研究官からのオープンサイエンスの全体感の御紹介によって、世界と日本という相関も分かり、ありがとうございました。一つ確認ですが、御発表の「背景とひずみ」のところに、なるほどひずみと見るのか、という感想を持ちながら拝聴しました。ここで述べられたことは、世界として見ると、研究者や論文数は増えているが、そこにはひずみが生じているという御紹介なのであったかと思います。日本においては、内閣府の推進によって各省庁で先進的な政策対応が進んでおり、例えば、御紹介があった材料も含み、ライフ、環境などの分野でも、世界の動きに乗るだけではなく日本らしい強みを強調するような方向に、オープンサイエンスという政策を進めていこうとしています。その意味では、日本はかなり柔軟に、かつテンポよく実施を進めていると理解していますが、この世界の背景において、今この段階で、日本の政策において更にどのような点を補わなければならないと読み取ればよいでしょうか?
【林上席研究官】 これもちょっと論点を変えてしまいますが、やはり日本の学協会が主体性を持ってその研究を強化し発展していくこと、それに尽きることだと思います。そうすることによって日本の研究力が強化され、日本の研究がより見える化され、あるいはより正当に評価される、そういう仕組み、枠組みを作っていく、日本のプレゼンスを上げていく、その一言に尽きるかとは思います。あとは各論になってくるので、そうすると、また各学協会さんの事情に応じた方策が変わってくるのではないかと推察されます。
結局やはり皆さんも御存じですが、オープン化するのが目的ではなくて、研究を発展させるとか、大げさに言うと人類に貢献するとか、そういうためのものですので、そこのところをうまくとらえて、ときに既得権益を失わせることがあるのが、ことを難しくしていることの要因だと思うのですけれども、そこをどう乗り越えていくか、そういう議論があってもいいんじゃないかと思います。
【谷藤委員】 ありがとうございます。御発表にあった研究助成機関の動きにもあるように、日本では、政策も実践も、理想とする方向に向かって進んでいると理解しています。しかし、今日の論点は、各領域あるいは学問の在り様が様々にある中で、どのように最適化をし、体温感のある具体性を持って進めていけばよいか、というところなんだろうと思います。材料分野においても同じと思います。その意味で、人やお金という対応に加えて、何がドライブフォースになるのか、そうした視点で特定したいという課題意識を私も持っています。本委員会で、いろいろな領域の方がおられる中で、少し集中的に深掘りできると、研究の場でも参考になることが多いと考えます。客観的な立場におられる林上席研究官としてどんなふうに見えているのかな、という点で質問しました。ありがとうございます。
【喜連川主査】 少しやはり発散する傾向があるかと思うんですけれども、さっき、人類に貢献するということは、余りここの委員会で議論をしてもしようがないんじゃないか、そのフェーズはもう終わっているというのが私どもの印象です。ですので、我が国はGDPが伸びていないわけですね、論文数も伸びていないわけですね、そういう中で、このオープンサイエンスという切り札を入れたとしたら、どの分野だったらどういうふうに強くできるかという、その焦点に絞って議論するのがいいんじゃないかと思います。つまり、研究者の負担になって、我が国がますます細るようであれば、こんなことを今やるような時期ではもはやないという視点で、一旦そのフォーカスで議論をしてみて、まだそこで不十分なところがあって、こういうところも議論しなきゃいけないかなというところで、人類の平和というのは出てきてもいいかもしれないいですけれども。そうでないと、論点が少し広がり過ぎるかなという気がします。
なぜかと言いますと、先ほどの優先権のような話が引原先生からあったかと思うんですけれども、いまだにアメリカは先発明主義なわけですね。つまり、論文なんかよりも特許が全てなわけです、人類が生きていこうと思ったら、でも、そこですら合意が取れていないので、理想論を言っていてももはやしようがないんじゃないかということもあろうかと思います。そういう視点で、どうぞよろしくお願いします。
【美馬委員】 林さん、どうもありがとうございました。いろいろ疑問に思ったりしていたのがすごく整理されて、実は自分が思っていたよりももっと大きな、ゲームチェンジという言葉を使われましたけれども、そういうものなんだと改めて思いました。その中で座長がおっしゃったように、どこにと言ったときに、オープンサイエンスに係る分野別マッピング、きょうのスライドの33を見て、この委員会の前から思っていたんですけれども、一つは、このデジタル人文社会学だと思うんです。つまり、ある程度理系のいろいろな理工系の分野だと、林さんのように、こういうITを使って何かできるとか、いろいろなものを考える人たちがいて、自分たちをそれで大きなところに移す方たちがいるんですけど、人文社会の中にそういう人たちはごく一部じゃないかと、何となく感覚としては思うんです。例えば、日本の古文書とかそういったものが、こういう情報系の人たちと結び付くことによって、かなり日本オリジナルなものが出てくるような気がするんですが、そういう話って前の期でも出ていました。
ただ、その人たちにどうやってアプローチするのか、だから、その人たちに何かこういうデータを出してくださいというのは無理だし、じゃあ、情報系の人たちがそれぞれ自分の分野で、自分で取りあえずやっている研究は好きでやっているものを、そっちまで行ってくださいというのもなかなか難しくて、ただそこをうまく橋渡しする枠組みは、何かこういったところで議論して、パイロットスタディーみたいなものとか、何かそのものに競争的資金の枠組みを提言して出すというのは一つありかなと思いました。
以上です。
【喜連川主査】 ありがとうございました。どこかの段階で古典籍のものとか。
【安達国立情報学研究所副所長】 簡単に申し上げますと、今先生がおっしゃったようなことは、国文学研究資料館が古典籍データベースの構築事業を、文部科学省の大規模学術フロンティア促進事業(日本語の歴史的典籍の国際共同研究ネットワーク構築計画 )に選ばれて進行しています。その中で崩し字をOCRで自動認識する研究や、アウトリーチとして江戸時代のレシピを解説するなどのことをやりながら、コンテンツを共有し、国際的な活動を通じて外国の日本研究者が電子テキストを使えるようにしたりする事業を今正にやっているところです。ですから、人文社会系かどうかなどということを全く気にせず、広い分野でやっておりますし、私どもの研究所もそのような活動に人を送り込んでいます。
【美馬委員】 分かりました。そうすると、大きい研究所だとそういうことあるんですけれども、普通、一般の大学、個人的なそういう人たちもそういう中に入ってきてはいるんですか。
【安達国立情報学研究所副所長】 古典籍は大学の図書館に所蔵されていますので、図書館と連絡を取って、デジタル化する本を出してきてスキャンするという仕事を大学間でうまく分担して電子化を行い、いろいろな研究に使うという形のプロジェクトになっています。
【美馬委員】 ありがとうございます。
【喜連川主査】 芽は出ていると。
【竹内委員】 ありがとうございます。先ほどの林さんのプレゼンの中で、coming soonの中にあったことなので本当は今伺ってはいけないのかもしれないですが、研究者がオープンアクセス、つまり、論文のオープン化に関してはやってもいいと考えている人の割合が非常に高い傾向にあることが示されました。しかしながら、本日の資料3を見ていただいても分かるように、依然として研究者は機関リポジトリへの学術論文の登載に関してはインセンティブが高くないといったようなことから、まだ低い割合にあるということが示されています。今日ここには具体的なデータございませんけれども、ある調査では、我が国の研究者が国際的なジャーナルに発表した論文のうち機関リポジトリによってオープンアクセスになっている論文の割合は数%にすぎないと指摘されています。今、林さんが示された調査結果の中に見られる意識の高さと、現実にオープンアクセスになっている論文の割合の低さのギャップは一体どこから生じているとお考えでしょうか。
【林上席研究官】 余り先出しもできないのですけれども、分かっていることをつらつら申し上げますと、研究者はまだ機関リポジトリの認識が低いことも分かっています。そもそも、公開したいが、公開する先としての機関リポジトリへの認識がまだ相対的に低いという、自分のサーバで公開しているのが多いという数字が今回の調査では出ています。
あと、ギャップとして、前提として忘れてはいけないのが、ビヘイビアバイアスと呼ばれている、研究者が答えるときに自分はいい研究者だという思いでアンケートに答えるというバイアスがあると伺っていますので、その面が多少あるのかと思います。あとは、手間や資金、リソースのことを問題にしている箇所もあったと記憶しています。
【逸村委員】 今の竹内先生と林先生のやりとりに、更に加えます。ここら辺は若い研究者との世代差がはっきりあるようで、例えば、京都大学を調べたりすると、若い研究者あるいは大学院のドクターで研究者を目指す人間は、論文はリポジトリに載せるの当たり前でしょうという態度を取っていて、それで指導教員も応じる、これは京大の先ほど紹介のあったオープンアクセス方針が京大なりに浸透しているのかなと思いました。それが1点です。
もう一つ、美馬先生と安達先生の人文社会系のやりとりに戻りますが、日本も国文学研究資料館やいろいろな国立大学、私も名古屋大学にいるときに古典籍の画像をデジタル化して公開すると、あちこちからアクセスがある。あちこち大学等が頑張っています。これも京大が先頭取って頑張っています。地方大学でも、長崎大学とかかなり頑張っています。それでも欧米に比べるとはるかに遅れていることは事実としてここで言っておきたいと思います。日本は古典籍・古文書等のコンテンツを持っているんですけれども、例えば、アメリカだと、マイナーな作家までマニスクリプトが全部デジタル化されているのが当たり前になっていて、研究の方向性が格段の差がある。それは、日本研究に関わるようなアメリカの研究者からよく聞かされます。
【喜連川主査】 遅れているというのは何が遅れていますか? デジタリゼーションが遅れているのですか?
【逸村委員】 はい、そのとおりです。さらにメタデータなり、さらにプラットフォームですね。メタデータをきちんと付けないと探せませんから、それこそ英語で付けないと、ヨーロピアーナは英語のメタデータが全部付いて方向性がはっきりしているというところだと思います。
【喜連川主査】 ありがとうございます。それはそうですね。何とかしないといけないことだと思います。ほかに御意見はいかがでしょうか。
【井上委員】 人文社会分野のオープンサイエンスについては、古典籍のほか、例えば、心理学や社会学の分野での社会調査のデータを共有する取り組みもございます。歴史学に関しては、国立公文書館が中心になりデジタル化を進めており、オープンサイエンスを進めると研究が進展することが明らかな分野といえます。その意味で、意識は高いと思いますが、予算的な制約があります。
林先生の御報告は大変示唆に富むもので、勉強になりました。ありがとうございました。御報告に関連してひとこと申しますと、資料の33ページの分野別マッピングの図では、市民と近いか遠いか、産業界と近いか遠いかという二つの軸で分類されています。市民との距離が近いところ、オープンサイエンス化しても困る人は余りいないので大きな問題はないという気がします。他方、インダストリーと近いものについては、ここに書かれていますように、知財との関係が問題になってきます。私は、専門が法律で、知財法を研究しているので興味深く伺っておりました。オープンイノベーションの潮流の中で、学術的なコミュニティの中だけでイノベーションが完結するわけではなくて、産業界ともつながって研究を推進していくのが重要になってきます。分野によりますけれども。特にデータドリブンな研究を進めるに当たり、データをどうやって産業界と共有していくのか。どういうふうに整理したらよいとお考えでしょうか。
35ページのスライドで、利用に関するライセンスについて、たとえオープンでもライセンスのようなものを用意する必要性があると指摘されていますけれども、法制度上は、現時点ではデータそのものに権利はないので、ライセンスのようなものを付けてオープンのした場合、どういう形でライセンス契約のエンフォースメントを確保していくのか、検討課題がいろいろあります。現在、経産省などでも産業界でのデータ共有の問題を議論しているところです。学術研究におけるデータ共有のガバナンスについても、RDAなどで検討がなされていると聞いておりますが、現在の議論の状況はどうなっているかお聞かせいただければと思います。
【林上席研究官】 ライセンスの意味で本当の意味のオープンというのは、釈迦(しゃか)に説法ですが、パブリックドメイン、CC0、これしかあり得ないということも分かっております。これはあらゆるものについてそうだと思っております。ですので、それ以外は、セミクローズ、セミオープンみたいな扱いになるのですけれども、教科書的なお答えとしては、クリエイティブコモンズライセンスのような形で、引用すれば使ってよい、あるいは改変しなければ使ってよいという形である程度制限を入れたライセンスを付加していくことから始まると思います。
付け加えますと、大事なのは、それをマシンリーダブルなメタデータのライセンスとしても持っておくことによって、APIで処理するときも、迅速に人の手を介さずに処理していって、データ解析が進むと理解しております。学術系ですと、どちらかと言うとシェアする方向なので、クリエイティブコモンズの三つぐらいのライセンスで進めることが可能なのですけれども、やはり企業の方になってくると、基本的には、ライセンスまで行かなくてもアグリーメントを交わすという過程が一つ入るので、これは逆に私も知りたいというか、そこをどう乗り越えるか。総務省等々でビッグデータに関するライセンスに関していろいろな議論されていると伺っているのですけれども、私はそこまでは手を伸ばしきれずに、当面科学の発展のために広く使ってもらう方に依拠して論を展開しています。
それはなぜならば、公的資金を得られた研究成果はオープンという原則がほぼ世界のコンセンサスを得つつあるということで、そうすると、オープンバイデフォルトのデータ基盤というものがいずれ出来上がり、その上でほかのデータと組み合わせて価値を出して産業にするという世界がやってくると思っております。そこまでどう持っていくかがむしろ議論になるのかもしれませんが、私の立場としては、できるだけ広く公開する方向性にする、そのための研究者のインセンティブの仕組みをどう作ったらいいかという話になってくると思っています。
【井上委員】 今の御発言に、2点、補足的な質問と言いますかコメントを申し上げたいのですが、まず、第一に、オープンバイデフォルト、これは原則として前期のこの会議でも確認したところでございます。しかし、そこには例外が付いていて、財産的な価値があるものですとか、商業的なものについては例外もあるという留保がついています。公的資金が入っているんだけれども、なおかつ産業界と関連する研究のデータガバナンスはどうあるべきなのか、まだ十分な検討がなされていない。それが第1点です。
それからもう1点は、クリエイティブコモンズライセンスがデフォルトになりつつあるのは確かですが、厳密に言うと、データ自体には著作権はありません。データベースとしての体系的創作性があれば別ですが。したがって、データそのものは、著作権を前提としたクリエイティブコモンズのスキームには本来は載ってこないはずです。データ保有者が、著作権の有無にかかわらず、当該データを利用してもいいという意思を表示するためにCCを活用しているとみることもできますが、CCの条件に違反した場合に裁判所でエンフォースメントができるかというといえばグレーです。その意味ではハードローでエンフォースメントを保証することを目指すルールというよりは、ソフトローと言いますか、ステークホルダーがみんなで共有している認識みたいなものに依拠しているスキームなのかなと思いました。
【林上席研究官】 ありがとうございました。私が言語化できていなかったところがすっきりしました。文化醸成の中にソフトロー作りというのが含まれていると思います。デファクトのお作法、しきたりみたいなものがこれから出来上がっていくことになると思います。
【喜連川主査】 林さんの御発表の中で、前段へ前段へというお話をおっしゃいましたね。つまり、発表から研究の前プロセス、前プロセスという話を随分何度かされたわけですけれども、今、井上委員がおっしゃっているのは、オープンイノベーションが社会への転換と言うと、これは後処理側なんですよね。ですから、きょうの御発表の中である意味ほとんど入っていなかった部分で、私もそれは今後入れていただけるといいなという気持ちがしていたので、またそういう視点でどこかで議論できればと思います。
ほかの発言されていない先生も、いかがでしょう? ちょっと待って、美馬先生ずっと手を挙げておられるので。
【美馬委員】 すみません、きょうのお話には入っていなかったので、林さんにお伺いしたいと思うんですけれども、このオープンサイエンスを進めていくといったとき、研究者個人の意識が変わらなきゃという話とコミュニティの話があって、学会のモデルがどうなっていくかはすごく大きな問題だと思うんですよね。日本の場合、人口減少があって、研究者数も減って、論文数も減って、これで学会がオープンになったら、どのように学会を維持していくか、収入としてと言うかな、それは何かどこかに考え方があるのか、林さん自身がお考えになっているものがあるのか、あればお伺いしたい。
【林上席研究官】 実は元学会にいた人間として一番お答えしにくいのですが、よく図書館の在り方がいろいろ議論されている割には、日本の学会の在り方が総体的には全然議論されていないのは大きな問題と認識しており、実は日本の学会の方が存在危機に瀕(ひん)しているとすら思っております。
あるいは、ゲームチェンジのところでちらっと御説明した、リサーチゲート、研究者がSNS上で勝手に情報交換をし始めている、私は、学会の次世代の姿の一つはそれではないかという認識のもと、その立ち上がりから動向を追いかけています。これも歴史に倣いました、きちんと裏は取れていないんですが、17世紀に学会ができたときの一説によれば、大学が硬直化して保守化し過ぎて耐えられなかった革新的な先生がカフェに行って集まって議論を始めたのが学会の始まりだという話を聞いたときに、リサーチゲートが出来上がった過程と非常に似ているなと思ったわけです。研究者は自発的な欲求で好奇心を持つ人たちが集まってギルドを形成するというのがメタな行動原理なので、この行動原理を駆動力としてオープンサイエンス時代にあった研究者コミュニティ像が今後も変遷していく可能性は十分あるかと思います。
ただ、これもまた教科書的になりますが、今の学会の存在意義はとなると、対面で学会大会をする場を提供する、就職の機会、チャンス、トリガーイベントを開く等々の機能はこれからも引き続き残るとも思います。
【喜連川主査】 五味さんいかがですか。
【五味委員】 林先生、どうもありがとうございます。今回、オープンサイエンスというものは、今までの議論においても一つデータとか、あるいは論文だとか、そういった成果物をオープンにしていくというのが大きな論点で、ずっと議論されてきたんですが、私、今回資料を見て非常にクリアになったのが、24ページになりますが、研究者の方の研究活動のプロセスをモデル化していただいて、こういうことの中にいろいろなツールがあって、そういうものを使いながら、ある意味、一人でこつこつ研究するんではなくて、その段階で周りとつながっていく、あるいはデータを共有し合っていく、そういう捉え方があるんだなと、ある意味非常に新しかったんです。ということは、オープンサイエンスという定義をどうするかもあるんですけれども、議論としては、オープンというのは、必ずしも、成果も当然重要なんだろうと思うんですけれども、研究活動そのものをオープンな形にしていくという目的、それがひいて言うと研究そのものの質を上げる、あるいはもっと成果を上げる、そういうふうに捉えていくべきかなということで言うと、研究サイクルそれぞれの各プロセスのところがみんなオープンになっていくんだろうなと。先ほどの文学系の話だと、リサーチの部分が一般市民とつながりながら情報を取っていくというところで、最初のリサーチの部分がオープンにしていく一つの取り組みだろうと思います。そういう意味では非常に面白いアプローチだと思います。
あと、私としてはもう一つ入れた方がいいと思うのは、パブリッシュ、レポートの後に、研究資金を獲得するというのが先生方の非常に大きな活動のテーマだと思うんですね。じゃあ、その資金をどこから取ってくるかと言ったときに、今回の一つのテーマのどういったところの分野をターゲットにしていくことが日本の競争力を高めることになるんだ、そこのときに、産業界というか企業との連携というのは、資金獲得の部分があってこそ、そういったところの連携が広がっていくのかなと思いますので、このプロセスの中に資金という概念は入れておいた方がより全体が見やすくなります。私、企業で、大学の方にいろいろ御提案していくと、なかなか皆さん科研費を取るのに非常に苦労されているので、そういったところで科研費を取ったりするところに非常に優位に働くんであれば、先生方もオープンというものに対してもっと積極的に取り組んでいただけるのかなと思いました。
【喜連川主査】 この図自身はもう2000年ぐらいからずっとみんな言っている話ですので、それ自身は全く新しくないという現状だと思います。
【相澤科学官】 お話ありがとうございました。情報科学の分野だと、出版に始まるオープン化という話とは全く別の流れのオープン化もあります。先ほどのお話につながりますが、研究フェーズの中で、コードとか、データとかを積極的にオープンに共有していく活動もあります。例えば、GitHubの上でオープンにする側面があります。これら二つはどう位置づけられるのだろうかと思いました。この研究過程のオープン化が情報科学で極端に進んでいる部分だとすれば、別の分野のところでも成り立つ話ではないかと思いました。他分野でも研究過程のツールやコードを共有し、先ほどのサイクルの異なる部分に焦点を当てるようなことはないだろうかと思いました。
【林上席研究官】 正におっしゃったとおり、実はGitHubを模しているところがあり、例えば、私の書いた図、先ほど言った24ページの前の23でしょうか、オレンジと青の研究プラットフォームが書いてあるこの図は実はGitHubから着想しているものでございまして、あらゆる研究を、いわゆるコードを書き始める(アイデアの着想の)ときからプラットフォームに載せてしまう話です。釈迦(しゃか)に説法ですが、ソフトウェア開発ですと、それを主に扱う人が、開発を始めた人から、まとめる人にかわり、さらにそれを広げる人が現れるというように、主体や役割が変わったりします。そういった形で、サイエンスの分業みたいなことが起きることもあっていいんじゃないかと思う次第です。一つ問題は、GitHubのコードでソフトを開発するプロセスにおいては実態物を扱わないので、実態物を扱うようなサイエンスが入ってきた場合には、どのようにこの議論と環境開発につないだらいいかということを、繰り返しになりますが、私は実験化学出身なので、そういうことを考えたりしています。
【相澤科学官】 コードを作る過程ではなくて、研究の中での解析を明らかにするために、そのコード自体を再検証が可能なように著者がGitHubの上に公開するとか、ディープラーニングのパラメーターをそのまま公開することが行われています。公開対象が知財に関係する場合には、出さないとは思います。しかし、レッドオーシャンの中で競合しているような人たちにとっては、先行して検証可能な成果を出していくというのは、とても重要な活動の一つになっていると思います。
【喜連川主査】 時間がなくなりましたので、ここで終えたいと思います。心配していたということもないんですが、いろいろな委員の方にとって非常にインフォーマティブな情報を頂きまして、大変有り難かったと思うんですけれども、今回は若干勉強会的なものになってしまいましたので、文部科学省的な意識からしますと、林先生からの御発表を聞いて、だから我々は何しよう、こういう方向にしようという議論にもう少し向けていければいいかなと感じましたので。きょうは、この御発表を少しそしゃくしていただいて、次回以降そういう方向につなげれば有り難いと思っております。
事務局の方から連絡事項ございましたら、お願いしたいと思います。
【玉井学術基盤整備室参事官補佐】 本日の議事録については、前回同様、各委員に御確認頂いた上で公開をさせていただきます。
また、次回、第4回になりますけれども、7月27日木曜日13時から15時、場所は、この文部科学省3階の3F1特別会議室を予定しております。
それと第5回までの予定については、資料6に記載しておりますけれども、それ以降10月以降の委員会日程を調整したいと思っておりまして、追ってメールにて日程伺をお送りいたしますので、御回答をよろしくお願いいたします。
事務局からは以上です。
【喜連川主査】 ありがとうございました。
次回は、冒頭三つイシューがあると申し上げていましたが、そのうちのネットワークの情報基盤の強化という問題も1度議論の対象にしたいと考えているところで、事務局と御相談をしたいと思います。この委員会は、すごく出席率が高くて、今回は2名欠席でしたが、前回は1名だけ欠席です。その一つの原因は、議論がたくさんできているということかもしれません。そういう意味で言うと、次回も御都合がつくようであれば、別段糾弾をするということではなくて、林さんに、ここはちょっとおかしいんじゃないのということを後半にでもお伺いできれば面白いのかもしれません。
【林上席研究官】 喜んで。対話をさせていただければ。
【喜連川主査】 やはりまだまだこの議論がアーリーステージで、どうやれば日本が利用できるフェーズになるかを考えるための世界観のそしゃくも一定程度必要なんだなと強く感じました。美馬先生がおっしゃったように、じゃあ、学会はどうするんだという話は、それだけ議論し出すと多分全然別のイシューとして非常に大きなものになるわけですけれども、動き感としては確かに補足しながらやっていく必要があるだろうなという気もしますので、問題そのものが非常に難しく、広い世界ではありますので、次回は文部科学省は2時間でなくて2時間半にしたらどうですかという提案をしたいと思いますけれども。嫌われそうですけれども。是非、皆様またお付き合いいただければと思います。
本日は時間を超過して申し訳ありませんでした。誠にありがとうございました。
――了――
麻沼、齊藤
電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)