第9期学術情報委員会(第9回) 議事録

1.日時

平成30年5月16日(水曜日)10時00分~12時00分

2.場所

文部科学省3F1特別会議室

3.議題

  1. 電子化の進展を踏まえた学術情報流通基盤の整備と大学図書館機能の強化等について
  2. その他

4.出席者

委員

喜連川主査、引原主査代理、赤木委員、安藤委員、家委員、逸村委員、岡部委員、北森委員、五味委員、竹内委員、谷藤委員、辻委員、美馬委員

文部科学省

(事務局)磯谷研究振興局長、千原大臣官房審議官(研究振興局担当)
原参事官(情報担当)、丸山学術基盤整備室長、高橋学術基盤整備室参事官補佐

オブザーバー

安達国立情報学研究所副所長

5.議事録

【喜連川主査】  それでは、定刻になりましたので、ただいまより第9回の学術情報委員会を開催したいと思います。
  前回は、オープンサイエンス推進におけます諸課題につきまして、事務局より整理しました資料をベースに御意見を多々頂戴したところですが、今回は、前回御意見を頂きました課題に関する論点につきまして、引き続き御意見を頂戴したいと思いますが、その議論に先立ちまして、科学技術・学術政策研究所の林上席研究官から、「オープンサイエンスに関する政策討議と実態調査」と題しまして、政府部内における検討の動きと、さきに公表されましたオープンサイエンスに関する実態調査の結果について御報告を頂き、意見交換を行いたいと思っております。
 なお、今回も、オブザーバーとして国立情報学研究所の安達副所長に出席を頂いています。
 それでは、まず、事務局より資料の確認をお願いいたします。
【高橋参事官補佐】  失礼いたします。それでは、資料の確認をさせていただく前に、この4月に研究振興局担当の審議官に異動がございまして、前任の板倉の後任としまして千原由幸が着任しておりますので、御紹介いたします。
【千原大臣官房審議官】  千原でございます。どうぞ先生方、よろしくお願いいたします。
【高橋参事官補佐】  同様に、私もこの4月に情報担当参事官付きの参事官補佐に着任しました高橋と申します。どうぞよろしくお願いいたします。
 議事次第に記載のとおり、配付資料として1から4まで、また、机上資料といたしまして、メーンテーブルのみオープンサイエンスに関する参考資料を御用意しております。不備がありましたら、事務局までお申しつけください。
 また、本日は25名の方の傍聴登録がございます。
 以上でございます。
【喜連川主査】  どうもありがとうございました。
 それでは、早速ではございますけれども、林上席研究官に、実態調査をなされたと伺っておりますので、その御報告をお願いしたいと思います。どうぞよろしくお願いいたします。
【林上席研究官】  御紹介ありがとうございます。文部科学省科学技術・学術政策研究所科学技術予測センターにおります林です。
 第9期の学術情報委員会としては2回目のプレゼンテーションをさせていただきますが、1990年代中頃よりオープンサイエンスに関わる調査と実践について取り組んでおります。今回は、オープンサイエンスに関する政策討議について、これは内閣府の総合科学技術・イノベーション会議(CSTI)で行われている議論ですけれども、その概要と、実態調査の重要性をお示しするために私ども科学技術・学術政策研究所(NISTEP)が行った調査研究の具体的な事例をトピックとして御紹介し、御議論に役立てていただければと思っております。
 本日の構成ですけれども、先ほど申し上げたとおり、政策討議の概要と補足トピックということで、全省庁横断によるオープンサイエンスの検討が進んでいるということ、及び政策討議の事例として出ている経済産業省や日本医療研究開発機構(AMED)で委託者指定データやデータサイエンティストの指定など、かなり踏み込んだ事例がございますので、それを御紹介し、「統合イノベーション戦略」がこの6月に策定される見込みの前振りの情報も共有させていただきたいと思います。全て公表されている情報の範囲内で共有させていただきます。
 後半の方につきましては、先ほど喜連川座長より御紹介ありましたオープンサイエンスの実態調査の重要性につきまして、国際動向も踏まえて解説させていただきたいと思います。
 それでは、まず政策討議の概要と補足トピックに入ります。
 そもそも政策討議とは何かという話ですけれども、こちらにちょっと長々と書いてございますが、これが公式の名前でして、「科学技術政策担当大臣等政務三役と総合科学技術・イノベーション会議有識者議員との会合」と、いう大臣政務三役と総合科学技術・イノベーション会議(CSTI)議員の懇談会がございまして、その中で特に昨年末ぐらいから、政策討議と題して、上記会合の中で個別テーマについて関係司令塔、関係府省幹部と議論する場が設けられてきました。その中にオープンサイエンスが入ったということでございます。
 御参考まで、そのほかに何があるのかということが5枚目のスライドに書いてございますが、AI・人工知能や大学改革、それから環境エネルギー・水素戦略等々、喫緊の話題・トピックの中でオープンサイエンスも取り上げられているという状況でございます。
 御参考までに出席者がどういうレベルかということで6枚目にお示ししました。総理補佐官を筆頭に、総合科学技術・イノベーション会議(CSTI)議員は基本的に全員参加されます。そして内閣府審議官や政策統括官、官房審議官に加えまして、ほぼ全省庁からテーマに関する局長級の方に御出席いただきます。その中に内閣府の担当参事官が検討テーマごとに論点と資料を準備しまして、そこに林が有識者として参加させていただきましたので、その内容を御報告している次第です。
 これも御参考ですが、段取りといたしましては、担当総合科学技術・イノベーション会議議員による説明、当時は原山議員が御担当でしたので説明がございまして、内閣担当参事官から御説明に続きました。その後、文部科学省、日本医療研究開発機構(AMED)、経済産業省の取組の紹介が行われて、文科省の説明の中で学術情報委員会の取組についても紹介されたと記憶しております。そして有識者からの説明があり、各省庁の対応状況の説明、そして総合科学技術・イノベーション会議(CSTI)議員によるコメントと議論、そして総理補佐官によるまとめということで、これを二、三十分でやるという非常にタイトな会合でございました。
 その中で全府省庁に対してオープンサイエンスの便益を説明するというお役目を頂きましたので、プレゼン資料から抜粋として、今回1枚だけ採用しました。要するに、ポストグーテンベルグ時代の社会制度とポリシー・マネジメントの再デザインがデータ駆動型社会のためには必要であるということで、科学に限らない、産業に限らない、行政を含めた全ての社会活動において、データ利活用の有効性があり、ICTを使った情報爆発が知を開放することによってそのことを促進しているという御説明であり、歴史からオープンサイエンスが目指すパラダイムシフトをひも解いたわけです。グーテンベルグの前の時代というのは手紙や写し、複本による文化でございましたので、それに比べればグーテンベルグの写植機の発明は情報をオープン化したと言えます。それと同じパラダイムシフトが現在起きているというストーリーで、全府省庁に関係する説明としました。かなり省略した説明で恐縮ですけれども、その上で新しいウエブネーティブ、ウエブが本格的に支える科学と社会の中で新しいオープン・クローズ戦略や社会制度が今後必要になってくるだろうという話で、全省庁の関心を呼ぶ形とさせていただきました。
 時間の都合上、かなり行間を飛ばす格好になりましたが、その上で、こちらが内閣府から出された政策討議の「オープンサイエンス」の論点の表紙でございまして、その中から一番エッセンスが書かれているこのスライドを用意しております。問題・課題に関しましてはこの委員会で既に議論・指摘されておりますので割愛させていただきますが、その上で、研究データ利活用方針の策定、競争的資金等におけるデータ管理の要請、そして研究データ利活用のための基盤整備が論点として紹介されました。
 この論点に呼応する形で、1番のデータ利活用方針の策定に関しましては、ガイドラインの策定。競争的資金におけるデータ管理の要請については、既に取組が進んでおりますデータマネジメントプランの策定の要請。研究データ利活用のための基盤整備としては、例えば、前々回でしょうか、山地国立情報学研究所教授が御紹介されたデータ基盤リポジトリの整備等が念頭に置かれた論点となっております。
 その上で、より具体的に進めるために、内閣府で平成27年(2015年)3月にオープンサイエンスに関する検討会による報告書が出ましたが、それをフォローする形で、昨年11月に引原副座長がこの検討会では座長の形でオープンサイエンス推進に関する検討会が開催されました。直近の検討会会合では、研発法人向けを対象としたデータポリシー策定のためのガイドラインなどが検討されていると、そういう状況でございます。
 これら政策検討の出口に関して、公表されているものから御紹介させていただきますと、統合イノベーション戦略というものが6月に向けて策定されようとしております。その中にこのオープンサイエンスも入る流れで検討が進んでおります。オープンサイエンスという項目に加えて、第5期科学技術基本計画の基本コンセプトであるSociety5.0を実現させるためのデータ基盤連携あるいはステークホルダー連携というような文脈の中にオープンサイエンスの取り組みも位置付けられる。すなわち、Society5.0を実現するための知の基盤を構築するというような文脈で取り入れられるのではないかと、これは私見ですけれども、そういう流れになっていると理解しております。
 さて、政府の大枠の流れとしては、内閣府、つまり内閣府内閣官房レベルでこういったオープンサイエンスに関する、あるいはデータ利活用に関する取組というものが検討されていますけれども、その中の具体的な取組で幾つかトピックとしてこの場で御紹介するにふさわしいものを2点ほど御紹介させていただきます。
 最初に、経済産業省は、既に委託研究開発におけるデータマネジメントにおきまして、かなり踏み込んだデータマネジメントプランの要請をしております。こちらのスライドに具体的に書いておりますが、委託者は、データマネジメントの基本的考え方を示すわけですけれども、データの利用許諾等をルール化して合意し、「データ合意書」というものを作成します。そして、プロジェクトが終わりましたら、そのデータマネジメントプランに基づいて、オープン可能なデータの情報を委託者がデータカタログとして公表するという形で、昨年12月27日に公表しております。
 その中で、委託者指定データという固有名詞が出てまいります。それはどういうものかといいますと、14ページ目のスライドの左下にございます。委託者側が将来オープンデータ化するものをあらかじめ指定してしまうというデザインを行っております。その上で、受託者側、いわゆる研究者側が自主管理するデータ、その中にも当然公開あるいは制限して共有するもの、それからクローズ、隠しておくというものがあってよいとしています。あるいは、そもそも管理しないデータというものがございまして、こちらの緑でお示ししているところがデータマネジメントの対象となるということを経済産業省ははっきりと申し上げているという流れで、こういう形で省庁や研究分野の個別の事情に応じた研究費の提供方法の設計と研究データのオープン化が日本でも進んでいるということを御紹介させていただきました。
 続きまして日本医療研究開発機構(AMED)の事例です。日本医療研究開発機構(AMED)は、今年の3月に、平成30年度からは基本的にはデータマネジメントプランを提出することを義務化することになっております。
 その上で非常に特徴的なのは、データサイエンティストを公表せよということが明記されているわけです。スライドのここに、データ管理・解析を推進していく上でデータサイエンティストの確保は必要であるとし、その人材、キャリアパス等に関する課題を解決するために、このような踏み込んだ形でのデータマネジメントプラン要請になっていると理解しております。それで、このデータサイエンティストって何だろうって皆さん多分思われるんですけれども、それがQ&Aにございまして、「ここでいうデータサイエンティストとは、『データ解析の高い能力を有し、かつ、日本医療研究開発機構(AMED)の研究目的を達成するためにデータの収集、質の確保、意味づけ、保存と活用等を行う研究者』のことを言います」ということなので、この委員会で議論されているデータキュレーターあるいはデータライブラリアンにかなり寄っている、スキルとしては順当な定義と考え、ここでのデータサイエンティストはそう呼ぶとしています。そもそも、データサイエンティストとは何かという議論を始めると多分それだけで終わってしまうと思いますが、日本医療研究開発機構(AMED)ではこういう形で、名前の妥当性はともかく、データ利活用を促進する人材の方にも配慮した設計がなされているということを御紹介させていただきます。
 ちなみに、既に先行している科学技術振興機構(JST)の戦略的創造研究推進事業のデータマネジメントプラン等、公表されている範囲、誰でもアクセスできるデータの範囲でデータマネジメント記載項目を記載したものがこちらになります。結果的に、経済産業省の委託研究が一番項目が多かったので、それを中心に据えて、右と左に日本医療研究開発機構(AMED)と科学技術振興機構(JST)を並べたような格好になっておりますが、大体似たようなものもあれば、省庁によっては要請をしていない、見かけ上かもしれませんが、していない項目等もあることがわかります。データマネジメントプランの運用が進んでいく上で、あるいは研究者側から見たら、極端な話、3つから研究費をもらう研究者からすると、要請項目がばらばらだとやりづらいので、データマネジメントプランの運用がこなれて、より標準化に近づいていくことになるのかと思われます。
 ここまでが、内閣府等、政策の高度レベルの方でもオープンサイエンスに関する議論が進んでいるという御紹介と、それを受けて、あるいはそれとは別に独自に各省庁で行っているデータ利活用促進のトピックを御紹介しました。
 後半、オープンサイエンスの実態調査の重要性と科学技術・学術政策研究所(NISTEP)の調査の解説を行いたいと思います。
 まず、政策的に見たときの一番高位レベルにオープンサイエンスが検討されているのは、G7科学技術大臣ないしは科学大臣会合ですけれども、これは2013年のG8サミットのときにオープンリサーチデータとしてアジェンダが取り上げられ、2016年、オープンサイエンスというアジェンダとしてはつくばで初めて取り上げられて、トリノまで引き継がれているという状況です。トリノコミュニケというという報告書の中で、オープンサイエンスは研究活動の変容を促すと記述し、そのオープンサイエンスの実践を計測するメトリクスあるいはインディケーターが重要であり、それを含むフォローアップ活動が重要であるとしています。これらを検討するワーキンググループをG7科学技術大臣会合の下に置いており、その議長国である日本とEUが今、共同して、そのフォローアップ活動について、このメトリクスの点も考慮に入れながら検討しているという状況でございます。
 そしてまた、この手の議論になるとやっぱり欧州が一番積極的に対外的に見える活動をしており、EC(欧州委員会)ではオープンサイエンスモニターというプロジェクトを立ち上げています。こちら右側にお示ししています様々なソース、学術情報流通に関する、学術活動に関する様々なソースを踏まえ、左側の円で示しているあらゆる研究活動に関する項目に関して、その動向をどのようにモニターすることがオープンサイエンスの促進につながるのか、あるいはどこを観測すれば進んでいることが分かるのかといったことを、究極的には体系的に把握できるための試みを始めております。特徴的なのは、シンクタンクであるデロイトトーマツとランドヨーロッパがデジタルサイエンスやオルトメトリクス、フィグシェアなど既存の学術情報流通のエンタープライズ、新しいイニシアチブの活動とともにオープンサイエンスをモニターするための設計を行っている状況です。まだ具体的に包括的なモニタリングというのは当然できておらず、先行して進んでいるのは、こちらにありますOpenAIREにありますような、公的資金を得られた研究費に対して得られた論文がどれぐらいオープンアクセスになっているのか。実はこれがオープンサイエンスモニターの前身と言ってもよい活動だと思うんですけれども、まずは論文のオープンアクセス化がどのぐらい進んでいるかというところから調査を始めておりますけれども、いずれは研究データの共有や公開に関しての調査も当然のように盛り込まれることが示唆されているプロジェクトとなります。
 もう1点、インディケーターといいますと、OECD(経済協力開発機構)にNESTIというのがございます。National Experts on Science and Technology Indicatorsという名称で、既に各種のイノベーションに関する調査などを定常的に行っているわけですけれども、Global Science Forumとジョイントワークショップを4月、先月に行いまして、私も登壇させていただきましたが、究極的にはEC(欧州委員会)のオープンサイエンスモニターと同じで、何をどう測れば、オープンサイエンスを促進し、あるいはオープンサイエンスの進展をモニターできるのかという目的で行われました。まだ様々な観点からインパクトを計測するための論点と課題出しの段階ではありますが、よく御紹介する話として、ヨーロッパ流としては、こういう抽象的な段階から何回も議論を、同じような議論を何回も重ね、それを重ねていくうちにコンセンサスが得られてフレーミングができて、そのフレームに従ってインディケーターの設計が今後なされていくという今後の流れを示唆するワークショップが開かれてもおります。申し上げたいのは、国際的にもインディケーター、メトリクスは既にニーズとして顕在化しているということです。
 そういう中で、手前みそで恐縮になりますが、科学技術・学術政策研究所(NISTEP)としましても、客員研究官で筑波大学大学院の池内有為さんの御協力を頂きまして、日本の研究者によるデータ公開を中心としたオープンサイエンスの実態や課題を把握するための調査を行いました。調査期間はおととしの年末で、調査対象は約2,000名の科学技術専門家ネットワーク(大学、企業、公的機関・団体に所属する研究者や専門家、技術者などにより構成される)、その専門家の方に伺っておりますが、「過去3年間の間に論文を1本でも書いたことありますか」という質問で最初にフィルタリングをしておりますので、調査としては研究者に対する実態調査ということになります。ちょっと細かい仕切りで恐縮ですけれども、飽くまでこの科学技術専門家ネットワークに所属するのは専門家ですけれども、そこに対する調査なので、専門家の回答ですが、実質的には研究者の回答であるということで、この後の御説明をお聞きいただければと思っております。その内容につきましては、データ公開と、その比較としてOA論文についても聞いています。調査の時期、2016年ですと、いきなりデータ公開のことを聞くよりは、論文のOA化のことも聞きながら進めるということで質問の意図を酌みやすく、ないしは論文の公開との比較をしやすくできるだろうという調査設計で行いました。そしてデータ公開の障壁と公開データの利用状況ということで、済みません、お配りしている配布資料版には入っていないのですが、1,398名、回答率が70.5%の有効回答を分析した結果をこれから御紹介します。
 まず、回答者のプロファイルですけれども、回答者の年齢としましては、30代までが半分、40代、50代、60代でそれぞれこのような分布となっておりまして、専門分野といたしましては工学が多い形になります。工学分野については、セカンダリーの分類も聞いていますので、そうするとまたこれが生物科学や化学に再分類されますが、プライマリーな分類としては工学の方が多いということになります。従いまして、こちらに注として書いてありますが、研究者の代表性というものはないものとしてお考えいただければと思います。その上で調べた結果である程度示唆を得ているということで御紹介させていただきたいと思います。
 まず、そもそも公開データとオープンアクセス論文の有無ですけれども、これは何回かお示ししていますので、なじみのある方もいらっしゃるかもしれませんが、データに関しては51%が経験があると。論文に関しては当然それより多くて、71%の公開経験があります。
 この51%というのは、後で議論になりますが、国際比較、非常にしづらいんですけれども、非常に乱暴ですけれども、先行調査の例を持ってくると、直近ですと、エルゼビアとオランダのライデン大学が行った調査によると全体で66%が経験あると。あるいは、ワイリーが行った調査では全体では52%で、日本は44%。それから、その更に前ですけれども、テノピアさんという科学計量学の権威の方が行った調査によると、2009年、10年ですけど、36%で、こちら、バーグマンさんの調査された研究の中の日本の中のデータとか見たんですけれども、二、三十人しかいないとか、そういうレベルなので、ここのデータは非常に参考にならない。
 こういう状況の中で、じゃあデータ公開はどのように行っているかというと、日本の場合だと個人や研究室のサイトで行っていることが多いことがわかりました。すなわち、これは公開基盤が非常にもろく、今後、データ公開基盤を政策として後押しすべきことを強く示唆する、過半数の人が公開の経験を持ってはいるけれども、その公開基盤がもろいということが分かりました。
 そして、特定分野別のリポジトリというのが、これは想定されていましたので、それをちょっと分野別にブレークダウンしたのが27枚目のスライドとなりまして、大体想定されたとおり、生物科学や農学を筆頭に、いわゆるライフサイエンス系は特定分野別のリポジトリで公開しているということが見てとれました。ちょっとこれ、後々全てですけれども、n数が少なくて議論に堪えられないのもございますが、飽くまで参考としてお示ししております。
 そして、分野別公開データの有無に関して見てもやはり同様の傾向が見てとれまして、分野別の対応が必要であることを強く示唆する内容となっております。
 データと論文の非公開理由、やはり公開を進めるためには、なぜ公開しないのかを論文とデータそれぞれで聞いたところ、非常に特徴が出ておりまして、論文の場合だと、雑誌のポリシーでないから別にオープンにしないと。あるいは、APC(論文投稿料)が必要だから、資金が必要だからというのが非常に強く出ております。データの方は、時間が必要とか所属機関に公開ポリシーがない、ニーズがない、あと実績にならないからというような形で、やはりデータを公開することに関する懸念・不安というものが見える格好となりました。
 続いて、これが一番この調査報告で面白いと私が思うデータですけれども、では、非公開理由が仮に解決しましたというときに、じゃあ、あなたはそのデータや論文を公開しますかという質問をした――仮定の質問ですけれども、そうしますと、論文の場合は8割の方が、だったら、論文を公開しますと答えています。しかし、データに関しては、非公開理由が解決したとしても依然3割弱の人しかデータを公開しないという、研究者の本音が数字として、一定の条件下ですけれども、表れた格好となっております。
 そして、では、そのデータ公開に関してどういうリソースがあるといいかを確かめるために、そもそもどれだけ充足しているかを示したのが31枚目のスライドとなりまして、やはり人材、時間、資金が上に、ソフト面の方が来て、ハード面の方は相対的には低めに出ておりますが、全体としてはやっぱり不十分であると。あと、特徴的なのが、分からないというのが一番多かったのがリポジトリですね。これ、多分、リポジトリに対する認知がまだ研究者の中に広がっていないことを恐らく示唆しているのではないかという、この灰色の部分の突出が見られております。
 データを公開する懸念について、先行調査などの質問と併せる形で聞いてみました。そうすると、引用せずに利用される可能性があるために公開するモチベーションが低い、あるいは先に論文を出版される可能性がある、誤解や誤用の可能性、機密・プライバシー情報、商用利用される可能性等ありまして、今回のフレーミングの中で、リミテーションの中ですけれども、今回、日本人で特徴的だったのは、研究の誤りを発見される可能性があることを気にする方は、日本人の方はほとんどいらっしゃらなかった。これ、先行調査ではもっと多い、こちらと遜色ないぐらいの割合でそのリスクを気にされる研究者が多かったんですけれども、これが日本人の性善説なのか、何と申しましょうか、これも済みません、余り細かいところに入って恐縮ですが、今回、こういう形でデータとして表れました。
 あるいは、じゃあ、データを再利用あるいはほかの分野も含めて利活用するためには専門性は必要とするか、しないかといったら、当然のように9割以上の方が必要としますと。じゃあ、どういう専門性が必要かというところで、適切なデータ形式への変換とか、再利用に整える、これはいわゆるインターオペラビリティーそのものかとは思います。あるいは、もうちょっと軽いレベルで、適切なメタデータ標準の選択やリポジトリの選択等々という形での意識が表れているということで、逆にこれをサポートできれば、できる体制・人材が整えば研究者はデータ共有・公開に進むことがある程度示唆される内容です。
 ちなみに、少し戻るような形ですが、データを提供したことがある、提供されたことがあるという経験につきましては、まだちょっとそれほど高くないんですけれども、公開されているデータをとにかく入手したことあるかという意味では、4分の3ぐらいの方が経験されていることも分かりました。
 これも、ではどこから入手しているかというと、やっぱり個人や研究室のウエブサイトという形で、前向きに解釈すれば、そもそも学術研究活動は互恵的に進められるものなので、政策があるなし、お金が付く、付かないは問わず、好きな研究をやっている方同士がそれぞれのデータを交換することは学術活動が生まれて以来の根源的活動と理解しておりますが、それがICTが活用されていても、ICTの基盤の上でも、そういった形でやりたいときに研究者同士でデータは交換していることが見え隠れしております。でも、この場でお示しすべきは、学術機関のリポジトリからの入手というのがそれなりの高いパーセンテージで出ております。これは政策を進めている者としては、これで全てを断定はできませんけれども、有り難い数字が出ているかとは思います。
 こちらも特定分野のリポジトリがございましたので、これも分野別でブレークダウンした結果、やはり先ほどの公開の経験等々に関する分野別と同じグラデーションが出るんですけれども、恐らく特徴的なのは計算機科学、これはGitHub等のソースコードリポジトリが多分効いていると思うんですけれども、それなりに上に来ていることが分かる状況になっております。
 では、公開データ入手のときにはどんな障壁があるのかを伺った結果としましては、筆頭に来たのは、やはり利用料金が必要。あと、これは悩ましいんですけれども、無料といえども利用者登録が必要であることを非常に障壁に思っていると。これは設計されたことあるかと思いますが、アカウントを作成しないとアクセスできないとなると、もう桁違いにアクセス数が減ることは御経験ある方も多いかとは思います。あとは政策的に見ますと、利用条件がよく分からないことで、ライセンスに関する整備、データごとに品質が異なる、フォーマットが異なるというような形で、再びインターオペラビリティーの話。そして、アクセス方法や著作権情報が分からないということでライセンスに関する話等々、それなりの割合での障壁を皆さん感じている状況です。
 とはいいながらも、じゃあ、そうやってデータをとにかく再分析や再利用する御利益があるのかどうかを見るために、じゃあ、再分析・再利用状況を聞いています。これは最初から分野別でブレークダウンしますと、こういう形でやはり地球科学、観測データないしは一点物ですね、時間軸から見てそのとき1回しかとれないデータがあるようなものが一番多く再分析や再利用されていると。あと、計算機科学のように、当然のようにライブラリを使ってコードを発展させていくようなものが上に来ていると。あと、やはり統計学的なプロトコルを中心に行われる人文社会科学になりますと、統計データを再利用していることが強く示唆される形となっております。この数学はn数が少ないので、ちょっと何とも申し上げられませんが、こういう形で、私がかつていた化学はそういう意味では余り行われていない形で、あるいは医学は、この再分析・再利用という意味においては低いパーセンテージで出ていることが、この調査の範囲ですけれども、特徴として出ている状況になります。
 そろそろ終わりかとは思いますけれども、最後に、データリテラシー教育への関心につきましても、やはり9割の方が当然あると。何を一番知りたいかというと、知的財産権やライセンスのこと、データの安全な管理方法、適切なデータ形式というものが上位に来ていることで、やはり自分のデータを出して本当にいいのかということ、あるいはそれが適切なのかということをどう担保するかが非常に大事であるということが分かるような内容になっております。
 ということで、こちらもお示した資料に少しだけ足しているんですけれども、得られた示唆、ほとんど御紹介させていただいていますが、そもそも回答率が70%超えたというのは、専門家ネットワーク向けのアンケートとしては非常に高い関心があると。通常はよくて40~50%の回答率の母集団に対して、7割超えの高い関心を頂きました。
 そして、お示ししたとおり、データ公開と共有に分野別の差があると。必要なところでは分野別リポジトリの拡充で進んでいることが示唆されました。そして、研究データ公開や共有に対する不安感というものが随所に見られていると。大事なポイントは、インセンティブにはデータ利活用を促すものだけではなくて、研究者を守るものと双方が必要である。ここにいらっしゃる幾人かの委員の方は既にそのことを踏まえた取組をされているのは存じ上げておりますが、改めて強調させていただきたいと思います。そして、最終的には、論文を書いてそれが引用されると、研究者としてのレピュテーションが上がる一助になるシステム、全く同じである必要はありませんが、それと同じような形で研究者が安心してデータを公開し、共有し、それが報われる、そういう研究データ利活用文化の醸成を目指すことは、私の前回のプレゼンでも御紹介させていただいたとおりです。
 ということで、限られたリミテーションの中で、予備調査のつもりではないんですけれども、調査の範囲内でこのぐらいのことが分かりました。継続・追加調査の重要性については論じるまでもないかと思います。まず、そもそも同じ設計を踏襲することによって相対的な変化を見ることができるかと思います。あるいは、特に学術的や、あるいはより公平に議論を進めるためには、研究者の代表性、年齢や分野別のポートフォリオを考慮した設計が必要になってくる可能性もあります。そして大事なのが、国際的にニーズが顕在化している中で国際比較可能な調査設計をどのようにするかが大事でありまして、あと最後はちょっと観点を変えまして、今回は研究者に対する調査ですけれども、組織に対しても調査を行うことでオープンサイエンスあるいは研究データ利活用の進展具合を見ることも可能かとは思われます。
 それを言いっ放しにならないように、最後に今行っている取組を紹介して終わりたいと思います。リサーチ・データ・アライアンスでボトムアップの取組を行っております。どういうものかといいますと、Open Questionnaire for Research Data Sharing Surveyといってインタレストグループ、これはワーキンググループになる手前のトピックに関心がある方の集まりとお考えいただければと思うんですけれども、そういうセッションがこの3月22日に行われまして、私も共同議長の一人として参画しております。これはどういうものかといいますと、昨年、ベルリンで行われた同様の会合、このときはまだ「この指とまれ」という表現をさせていただくんですけど、バード・オブ・フェザー(BoF)と呼ばれるレベルの会合がございまして、とにかくこのデータ共有に関して共通質問項目を作ったらいいんじゃないかというのに興味がある人が集まって、ある程度見通しが見えたので2か月前にベルリンでその上位のレベルの会合であるインタレストグループ(IG)を立ち上げて、コミュニティーがデザインする共通質問紙のモジュールを設計できたらいいのではないか。それを使ってオープンサイエンスのサーベイあるいは研究データ共有のサーベイはどのように解釈されるべきかの議論の共有もできますし、何だったらグローバルな調査を分散的に、あるいは一括としてやれたらいいんじゃないかという、インタレストグループ(IG)と呼ばれる段階ではワーキンググループ(WG)になる前にまだいろいろ野心的なことも検討できる段階ですので、非常にハードルが高いことも書いてございますけれども、こういった形で先行調査と比較していて痛感するんですが、似た質問はあるんだけれども、並べて比較すると議論に堪えないことが往々にしてございまして、だったら、どの国の調査でも、あるいはどの研究グループの調査でも同じような質問をするのであれば、それを標準化して、このRDA(Research Data Alliance)から、要するにオープンデータとして公開して使ってもらったらいいのではないか。そうすることで、飽くまで私見ですけれども、G7やEC(欧州委員会)が検討しているようなフォローアップや国際比較可能な調査基盤づくりに貢献するであるとか、究極的にはOECD(経済協力開発機構)、NESTI(National Experts on Science and Technology Indicators)の指標化につながるような形になっていけば、G7や内閣府等政策主導で顕在化しているニーズをボトムアップの組織が日本も関与する形で貢献し、そして結果的にオープンサイエンスが推進するモニターができることになればと思いまして、そのための予備調査としての科学技術・学術政策研究所(NISTEP)の御報告をさせていただきました。
 ということで、本日の構成に戻りまして、前半の部分は、日本の政策のトップレベルで行われている話題として、政策討議の概要とそれに関連する補足トピックのうち、この学術情報委員会で取り上げるにふさわしいものを、委託者指定データを設定している経済産業省の例あるいはデータサイエンティストの指定を始めた日本医療研究開発機構(AMED)の例を紹介させていただきまして、今後、統合イノベーション戦略へのつなぎがあることを御紹介しました。後半は、オープンサイエンス実態調査の重要性と科学技術・学術政策研究所(NISTEP)の調査の解説ということで、国際的な動きの中で日本の具体的な調査の結果をお示しし、今後の展開についての論点を提供させていただきました。
 以上です。
【喜連川主査】  どうもありがとうございました。かなり盛りだくさんの論点を包含する御発表だったかと思います。
 非常によくおまとめいただいたかと思いますが、大きく2つに分かれていますので、どっちからでもいいんですが、できればこの順番に沿ったような形で議論をしていくのはどうかと思います。まず、どなたからでも結構ですけれども、いかがでしょうか。
 では皮切りにということで、政策討議サイドの方で最後のコンパリゾンの項目比較表を見ますと、林先生からの御説明もありましたように、経済産業省からのアイテムがかなり丁寧に出ているということになっているかと思います。経済産業省というのは原則NEDO(新エネルギー・産業技術総合開発機構)ですが、NEDO(新エネルギー・産業技術総合開発機構)からの委託の場合は大学がプライムになることもあれば、企業がプライムになることもあって、どちらかというと企業プライムの方が多いのではないかと思います。そういうときに、今まで内閣府での議論、引原先生の委員会での議論でも、ここでの議論でも、やはり企業が国費をうんぬん、あるいは企業が自分のところのお金といったところでも、そこに関してのデータの取扱いとニュートラルな大学が生み出すデータとはちょっと議論を分けてやりましょうというようなところが多かったと思うんですが、この辺、先生、ごらんになってどういうスタンスで取り組まれているのか、何かありましたら教えていただきたいんですけど。
【林上席研究官】  はい、ありがとうございます。補足の説明をしていなかった点を御質問いただいたので、大変助かりました。ここに書いてありますが、この委託者指定データのプロジェクト参加者の想定割合を見ますと、企業が6割、大学が3割です。まずこういう参加の想定の下でこのマネジメントプランを設計し要請しているということです。御指摘いただいたとおり、企業に対してこのデータマネジメントプランのデザインをどうするかということを経済産業省はかなり真剣に考えられたことが拝察されます。その上で、企業からデータをオープンにしてもらうときに、企業側から自発的な試みを促すのではなくて、委託者、つまり経済産業省あるいはNEDO(新エネルギー・産業技術総合開発機構)側がもうこれはオープンにしますよという前提で研究費を出すということ、これがポリシーデザイン上の肝になっているのではないかと思います。
 ここで、踏み込んでいるのは2点ございまして、それは企業に対してそこまで求めるという話と、それより大事なのがNEDO(新エネルギー・産業技術総合開発機構)側で要するにデータに対する価値判断を行うということを自ら宣言しているということになります。ここに関しての機微、塩梅(あんばい)等は、この策定に至るまでにどのような議論をされたかをつぶさにフォローはできておりませんので、拝察の範囲を出ませんが、いずれにせよ、今回設計した形で割り切ったということです。割り切ることで、喜連川座長がおっしゃっていた本来分けて考えようとしていたところをあえてこの絵の中に取り込む形にしたということだと理解しております。
 では、全て、例えば文部科学省の競争的研究資金に当てはまるのかどうかは、まだ軽々には議論できないかとは思います。そもそもの話として、委託に対するデータという限定的なところでまずプロトタイピングとして始めてみたというところも、恐らく実際のところであるかと思います。この形で実際研究プロジェクトを進めてみて、いろいろな齟齬(そご)もあるかと思います。個人的には、データマネジメントプランに項目要求している数が少々多い目に思われます。JST(科学技術振興機構)が少ないのは、決してデザイン上なかったわけではなくて、研究者の負担感をできるだけ下げるために少なくし、また、必要な最低限のものをコンサルテーションしながら聞くようにしてきたといういきさつを伺っております。そういう中で、データマネジメントプランとして設定する項目は、どの程度が研究者にとって負担感ないか。より分かりやすいイメージで言うと、科研費の申請書で研究者が普段慣習として出されるレベルに落とし込むとどの程度かということについて、これからコンセンサスというか、ポテンシャルの最低点を探していくことになると理解しております。
【喜連川主査】  ありがとうございます。私どもは、大学の方がこの辺の意識が高いんじゃないかと思って、調査対象や、議論の対象にしてきましたが、NEDO(新エネルギー・産業技術総合開発機構)がこれだけしっかり考えているということであれば、ここで丸山室長にお伺いしてもいいのかもしれないなと、この調査を見て感じました。
 あと、バイ・ドールが適用されますよね、企業に対して。その場合の思想感とここでの思想感は整合性がとれているんでしょうか。先生にお伺いするのは失礼かもしれないですが、グローバルに見たときにどんなイメージなのかと。
【林上席研究官】  そうですね、バイ・ドールを含めて、研究データに関してはライセンスをどう設定するかというのが大前提にあります。論文の場合ですと著作権をベースにしますが、データの場合は著作権はないので、基本的には関係者間の中でどういうライセンスを、あるいはアグリーメントを結ぶかというのが大前提にあります。世界的な兆候としては、バイ・ドールはバイ・ドールであるとした上で、それは最大限尊重しつつ、政府のデザインとしては、競争的、しかも公的資金を提供する場合には、別なライセンスというか、枠をうまく当てはめて対応していこうというのが、オープンに進める場合の戦略であるように思われます。ですので、バイ・ドールを否定するという流れではなくて、それはそれで尊重しつつ、その枠組みを壊すことなく、お互いがアグリーをすればいいわけで、オープン化する場合であれば、オープンにするライセンスに従って進めるといったような形になっていると考えています。私も網羅的には調べておらず、また、法律的な判断をできるほどの知見は持ち合わせておりませんが、このぐらいの御返答になってしまいます。
【喜連川主査】  どうもありがとうございました。
 ほかにいかがでしょうか。岡部先生。
【岡部委員】  この経済産業省のガイドラインというのは非常に分かりやすいと思ったのですけど、これはNEDO(新エネルギー・産業技術総合開発機構)典型の、省庁側でゴールを決めて、それに対して公募をかけてという、始めから研究のゴールが明確な予算ですよね。ですから、この研究を始める前にあらかじめどういうデータが出てくるか予想がついているのが前提としてあると思います。今回、この委員会では文部科学省の予算について決めることがミッションだと思うのですが、例えばJST(科学技術振興機構)がやっているようなNEDO(新エネルギー・産業技術総合開発機構)に近いスタイルのあらかじめゴールが決まっているタイプの研究がある一方で、大学の運営交付金で行う研究とか、あるいは科研費みたいにそもそも研究者が目標設定して、やっている途中で全然違ったことが出てくるということもありますので、それを同じような枠組みでやってしまうと多分どこかで不整合が出てくるだろう、そこはちょっと考えていただいた方がいいんじゃないか。つまり、大学か企業かというよりは、予算がきちんとあらかじめミッションが決まっているものなのか、それともそうではないのかというところを識別していただいた方がいいんじゃないかと思いました。
 以上です。
【喜連川主査】  すばらしいポイントだと思うんですが、家先生など御意見ありませんか。
【家委員】  同じことになりますけど、NEDO(新エネルギー・産業技術総合開発機構)やJST(科学技術振興機構)にしても委託事業として研究が行われるわけですね。研究のはっきりしたミッションが最初に提示されて、それに沿った研究の進捗評価もするでしょうし、科研費に代表されるような助成事業とは、大分性格的にも違うし、研究者の行動様式も違う、評価基準も違うというところで、その辺を、どうやって取り込んでいくのかなということは問題あると思います。
【喜連川主査】  林さんから見て何か御意見ありますか。
【林上席研究官】  全くもっておっしゃるとおりでして、データの価値判断がなぜできるのかと質問されたら、そのことをお答えしようかと思っていたことを正に論点で提示していただきました。正に科研費に代表される、あるいは内在的知的欲求に対して面白いと思った研究を行うような場合に得られたデータの価値というのは、原則的にはその研究を行った者ないしはその外側にいる研究者が偶発的なものを含めて価値を見いだすことが想定されます。では、そういった価値はどのように共有したら良いか、その仕組みはこの学術情報委員会でこそ議論すべき非常に悩ましい論点ではありますが、むしろ私のようなオープンサイエンスを調査・研究している人間からするとそこが面白い点であるかとは思います。
【喜連川主査】  この視点は、前回の取りまとめの論点には必ずしもエクスプリシットに議論されておりませんでしたので、今日、岡部先生をはじめ、非常によい御示唆をいただきましたので、これは記憶にとどめておきたいと思います。先日、梶田先生の御講演を聞く機会があったんですけれども、最初からニュートリノをやろうとは全然思っておらず、別の発見が目的であったと伺いました。研究者はやはりドリフトしていっているわけですよね。そういう意味のデータの貴重なユーセージは、ここのガチガチのフレームワークとは違うなと。逆に言うと、指定されなくて面白いものが見つかったものは出さなくいいと言うと怒られちゃうかもしれないんですけど、そこはここから漏れる。でも、それも言い出すときりがないというようなところは一杯ありますよね。
 岡部先生、もうちょっとありますか。大丈夫ですか。せっかくですから。
【岡部委員】  例えば科研費みたいなものだと、毎年報告書を出していますので、その都度アダプティブに、こういう当初の予定外の成果が出てきたから、それはどうするということを報告してもらうのはいいと思うんですけれども、コントロールするというのは多分そぐわないんじゃないかなというのが私の印象です。
【喜連川主査】  そうですね。 はい、竹内先生。
【竹内委員】  このDMP(データマネジメントプラン)についてですけれども、既に欧米の主要なファンディングエージェンシーはほとんど全てがDMP(データマネジメントプラン)の提出を義務化していると思います。日本で今、JST(科学技術振興機構)、それから経済産業省やAMED(日本医療研究開発機構)がお考えのものというのは出てきているわけですけれども、そこで要求されている記載項目などと比べたときに、当然のことながら、国際的に見た場合に共通で扱えるようなものになっていかないと、結局、日本のデータはガラパゴスで使えないみたいな話になってしまうのではないかという気がちょっとしております。その辺について何か、林先生、御存じのことがあれば教えてください。
【林上席研究官】  御質問ありがとうございます。この調査比較表は昨日作ったもので、国際的なものとの比較まではできておりませんが、当然のように、DMP(データマネジメントプラン)の要請が行われる議論の背景にあるのは、やっぱり国際共同研究が進んでいるということがあります。これも分野によるのですが、国際共同研究が進むというのは、研究者がコラボレーションするだけではなくて、資金も共用しますので、共同研究をやるというときに、今おっしゃったような、データマネジメントプランとしての不整合あるいは持っているデータのポリシーの不整合、ライセンスの不整合というのが起きてしまうことが非常に懸念点として議論に上がっています。それで大枠として統一すべきだという議論がある一方、直前の議論にありましたように、研究者の好奇心に基づく積極的な移ろいやすさのような文化がある中でガバナンスとしてどこまでを統制するのかというところで、今、せめぎ合いが進んでいるというのが私の理解です。先行しているアメリカ、例えば具体的な例で言いますと、アメリカのある研究助成機関は、数年前はDMP(データマネジメントプラン)を義務化はしているけれども、実は中は見ていないんだと、おっしゃってました。まずは出してもらうということから始めていると。ところが、最近聞いたら、ちゃんと審査を始めているというような話も、公式ルートの裏はとってないのですが、パーソナルネットワークの範囲の中で伺っています。というような形で、我々もきっとその流れを踏襲することが必要になってくると思われます。その中で後追いというと表現がネガティブかもしれませんが、であれば、先行しているものとの整合性、コンシステンシーを保ちながら効率よく進めていくというのが一つの戦術になるかと思います。
【竹内委員】  ありがとうございました。
【喜連川主査】  はい、谷藤委員。
【谷藤委員】  補足なんですけど、私どものところでも調べたんですが、一つ大きく違うかなと思うのは、エンバーゴの期間の設定、何年という答えなんじゃなくて、その考え方がやっぱり大分違うなと思います。イギリスの例ですと、公的資金を受けた者は、ある大型研究設備の場合はエンバーゴのマキシマムが3年となっていて、その理由は、4年以降たっても、もう古くて意味がないかもしれない。だから、「公的機関で使った研究を3年非公開にするのはいいけど、4年たったらもう公開が前提ですからね」と、最初から設備を使うときに言っておくという、設備の申請と併せてそういう補足をするという一つの例なんですけれど、それはこちらから言いにくい。つまり、やっぱり研究する側の状況を考えると、例えば、10年はエンバーゴしていいけれども、それを過ぎたらもう一括してオープンにしますからねというようなことは、なかなかやりにくいので、本当は正に国のガイドラインで大方の目安として、科学、ましてやこれがSociety5.0ということが冒頭にあるので、10年程度をめどにとか、何かそういう数字が出ていると作る側としてはいいなと思います。一々なぜ10年なんですかという説明をしても、それは納得するような性格のものではなくて、やっぱりこれは政策的な話に落とした方がよいような印象を持ちました。
 あとは、ちょっと意外なのは、アメリカ・カリフォルニア大学のデータマネジメントプランの基盤の方から調査したときには、大学の学部ごと、あるいは領域ごとにデータマネジメントプランのバージョンがそれぞれにあって、それぞれの領域にふさわしいブランディングをすると。DMP(データマネジメントプラン)というもののブランディングということが一つ考え方として新しく、私たちにとっては新しくあって、なるほど、つまり、例えば材料分野のデータマネジメントプランはというと、一定のデータの品質を担保するブランドになっているというのは、新しい考え方だったかなと思います。補足ながら。
【喜連川主査】  前半の部分は研究機関ごとに自分で決めるのは大変なので、誰かほかの人で決めてほしいという、そういう御依頼ですか。
【谷藤委員】  そういう年数とか、余り議論しても答えが出ないようなものであるわけです。だから、それは目安としてというふうにガイドラインにある方が非常にフィージブル。エンバーゴというのは、これは結構研究データの本質に関わっている部分なので、その方がいいのではないかと思います。
【喜連川主査】  その辺と後半の話が若干コヒーレントなのかどうかと。つまり、そこは戦略のポーションにはなり得るという議論ではないわけですか。
【谷藤委員】  ええ、そうですね、はい。
【喜連川主査】  だとすると、自分で決めなきゃいけないわけですね。
【谷藤委員】  はい。
【喜連川主査】  この辺、まだいろいろ議論をするところじゃないかなと思いますけど、林研究官から何かコメントはありますか。
【林上席研究官】  あえて申し上げると、日本の政策側も今までのやり方、先行例がある程度そろった上で、効率よく検討できる粒度、レベルまで下がってきたように思います。国際状況も調べて、鵜呑みにせず日本の状況を照らし合わせながら制度設計をしていくという、これまでの行政プロトコルに落とせる段階まで、公的競争的資金に対するデータマネジメントプランの運用に関してはその粒度、レベルまで落ちたように理解しております。
【喜連川主査】  北森先生、お願いします。
【北森委員】  前半の部分で、どういうふうに政策討議されているかということは参考になりました。結論があるか否かどうかよく分からないんですが、この討議した結果はいかがだったんでしょうか。
【林上席研究官】  御質問ありがとうございます。結果といたしましては、ちょっとオフレコになるのかもしれませんが、各省庁の対応状況の説明ということで、一応全府省庁でオープンサイエンスに関する取組を紹介するわけですけれども、実はこの紹介をしたこと自体が成果というか、つまり、これを議論して何か出たというよりは、これ、たかだか二、三十分の間に全部この議論を総理補佐官の前でやるので、正直実質的な議論にはなっておりません。議事録、口語的な議事メモも公開されておりますので、もしお時間があればお読みいただければと思いますけれども、データ利活用に向けて各省庁がオープンサイエンスの文脈でもこういう形でやっておりますよというのを検討してきたというのが、で、披露した――各省庁の説明時間はほんの僅かです。僅かな時間ですと、よっぽどのエッセンスしかしゃべれないので、それを事前にまとめてきたというところがこの政策討議の実質的な成果です。
 また、表面的な議論としての成果としましては、先ほどこの論点と処方箋に書いてある点の中でガイドラインをやはり内閣府として作るということになります。やはり国としての指針がないと進められない点が多々あるだろうと。ただし、全部国で決めてもらっても困るというところで、薄皮1枚という表現をNIMS(物質・材料研究機構)の橋本理事長、CSTI議員がされましたけれども、その大枠のガイドラインを示すことになったのが表面的に出た結論の一つで、あとは、新しい研究データ利活用パラダイムの促進に向けて各省庁頑張りますという文脈に沿って局長級が政策討議の場で発言したということが表面的な成果になります。この論点は中途の成果で、今後、統合イノベーション戦略の中にこの論点を踏まえたより詳しい施策の中身が恐らく入っていかれるのではないかと拝察しており、アウトカムとしてはこちらの方がより重要となりますが、現段階においては、実質的には、そもそも政策討議に取り上げられたこと自体が一つの成果という状況になっております。
【喜連川主査】  そうしましたら、後半の部分も含めてもう少し、より幅広く議論できればと思います。
【逸村委員】  それでは、37ページ図9の公開データ入手の障壁についてお伺いします。基盤システムを構築する方としても関心がありまして、情報利用というところでの関心があるんですが、下から2番目のリクエストから入手まで時間が掛かるという、この時間が掛かるというのはどのくらいの単位のことを意識されているんでしょう。
【林上席研究官】  これはたしか先行調査をそのまま使っているので、我々としての意識は余りしてなくて、補足として、では、この時間はタイムスパンは幾つですってお示ししていないので、主観としてでしか分からない状態です。単純に時間的に手間が掛かるという意味合い以外のものではないという状況です。あいまいで申し訳ありません。
【逸村委員】  中に出てきたキャロル・テノピアのときも同じような話をしていて、彼女も同じようなことを言っていました。
【林上席研究官】  補足させていただくと、やはり紙の論文のILL(図書館間相互貸借)みたいな昔のレガシーな情報入手手段(郵送を使って2,3日以上かかる)のフレーミングを想定しているようにも思えますので、そもそもこういう質問をしなくなる日が来るようにするというのが、調査をする側の一つのミッションとしている質問内容になっています。
【喜連川主査】  ありがとうございました。
 ほかに御質問等ありますでしょうか。どうぞ、引原先生。
【引原主査代理】  詳細なデータを面白く拝見しているんですけれども、多分このデータの中に自分も入っているんだろうなと思っています。この中で医学系がデータを比較的オープンにしているのにかかわらず再利用が少ないという現状なんですけれども、それはどういうふうに分析したらいいのでしょうか。こういう傾向というのは分野に多分特化した話なんだろうと思っているんですが、分析の結果ではどう見ておられるんですか。
【林上席研究官】  御質問ありがとうございます。この得られたデータの中でかなり粗い議論をしてよろしければ、そもそも医学がデータを公開する文化というのはアメリカのNIH(国立衛生研究所)のパブリックアクセスに象徴されるように、やはり医療データというのは国民に対してすべからく公共性の高いものであるべきという前提の文化があるが故に、公開することをいとわないという結果が表れています。対して、再利用になりますと個々の研究テーマに対しての議論になりますので、研究のオリジナリティーの観点から再利用が進まない可能性が――でも、医学の分野に寄るところが大きいと思っています。例えば疫学はむしろ再利用して、メタアナリシスをして当たり前ですので、この違いはもう少し医学のn数を増やしてブレークダウンすべきだと思います。今の粒度の範囲でいうと、公開に関してはパブリックアクセスのフィロソフィーを活用し、再利用に関してはそれぞれの研究のフィロソフィー、つまりオリジナリティーの確保の観点から余り再利用しないで、自らのデータのみで勝負するという背景が示唆されます。私の所属している製薬につながるような有機合成、北森先生もそうですけれども、スモールサイズで完結する研究領域ですと、やはり自分のところのデータを扱うだけで手一杯であったり、あるいは、そのデータの裏側にある経験から来る行間の情報がないと実はデータを扱えなかったりというもの、つまり、大げさに言えば研究室を丸ごと再現しないとデータだけでは再現できないというようなものの場合は、そもそも再利用することに労力が掛かり過ぎて意味がないというようなケースもあり得ます。つまり、オリジナリティーの観点と、そもそも再現することが難しい、再利用すること自体が難しいという観点。医学の中でブレークダウンするとそれがまた見えてくるのかなと思いながら、今、分かる範囲だとこのような議論ができるかと思います。
【引原主査代理】  お聞きした理由は、結構オープンデータの本質的なところがここに含まれているような気がしていたからです。オープンにはするんだけど、利用されないというのはオープンの意味なんだろうかという。
【林上席研究官】  なるほど、そうですね。
【引原主査代理】  ですから、アーカイブ的なデータと参照的なデータのきちんとした基準を決めて、その体制をつくっていないからできないのか、それとも、利用の意味がないのか。この点からいえば、今の御説明だと意味がないわけではないわけでね。ですから、オープンデータの体制になっていないデータのオープンの仕方というのがここに見えているという理解でしょうか。
【林上席研究官】  確かに、おっしゃるとおりだと思います。
【喜連川主査】  実はNIIのオープンハウスの前にオープンサイエンスの日にちをとっておりまして、そこでAMED(日本医療研究開発機構)の末松理事長からの講演もあると思いますので、その辺の生の声をお伺いいただくのがいいかと思います。私はたまたまですけれども、研究・経営評議会というAMED(日本医療研究開発機構)なる場所に非医者として一人だけ入っているんですけれども、ここに書かれているのは、その議論を聞いていますと、つまり背景が分かっていると、このとおりだろうなという気がします。末松先生のコンプレインツは、日本の場合は医学部の中に理学と工学のPh.Dがほとんど入ってない。イギリスの場合は山のように入っていると。ですから、このデータサイエンティストがいるんですかというのを聞きたい、ここから始めようという戦略がありありと出ていまして、そういういない中で先生のおっしゃったように用意されて外形的にオープンになっているデータというのが仮にあったとしても、なかなか利用至便に堪えないというのが出ているのかもしれないですね。
 ほかにいかがでしょうか。谷藤先生。
【谷藤委員】  質問なんですけれど、この2,000人の方々は、大学、企業、公的機関・団体に所属する人たちということなんですけど、内訳はどのぐらいの割合でいるんですか。
【林上席研究官】  毎年度更新して委嘱をしているので割合が多少変わりますが、大体アカデミアが半分強で、3割弱が公的機関で、企業は2割弱ぐらいと、大体そのぐらいのプロファイルで推移しています。
【谷藤委員】  そうすると、今の質問の意味は、回答者が断トツで工学分野が多いというのはとても意外で、工学分野の分野リポジトリなんてそもそもパブリックには知られていないので、設備ごとにはあるかもしれませんけど、この特定分野をリポジトリ選択する率が、工学が一番下というのも納得がいくのですけど、なのに回答する人は多いんだなというのが意外で、相関性があるとすればこの回答者はアカデミアが多いということになるので、これはどういうことなんだろうという何か考察はあったんでしょうか。
【林上席研究官】  そうですね、実は調査報告書では、幾つかの設問を所属別にブレークダウンすると、やはり企業の方は研究データの利用は多いけれども、公開の経験は少ないとか結果がいろいろ見えたりはします。工学に特化して、所属別にブレークダウンして調査というのは報告書でもしていないので、そのブレークダウンで谷藤さんの御質問に対して答えが出せる状況です。視点、ありがとうございました。
【谷藤委員】  全体的な分析から工学というのは回答率が多い割には、意識は低いということが、このデータだけから見ると読み取れるので、本当にそうだったんだろうかという質問の動機になります。ありがとうございます。
【北森委員】  私は工学部で、学会は化学で、理学部で学会は化学の方もいらっしゃる。正にその点で、国際的な学問、学術分野の分類と、それから日本の慣習的な、それから組織的な学問の分類がかなり違っているので、国際比較をするとかそういった場合には、やはり国際的な分類の方に従ってされた方がいいんじゃないかなという気がします。工学の場合、諸外国のほとんどは機械工学と電気工学のところにとどまっていて、エンジニアリングとテクノロジーがはっきり分けられる。テクノロジーはもっと大きな、数学もあれば、化学もあるというような分類にもなって、MIT(Massachusetts Institute of Technology)のテクノロジーといったら全分野を。それで、その中のエンジニアリングというのは小さい分野を入れていますよね。さっきの医学のところも多分そうで、クリニカル・スタディーとメディカル・バイオロジーの部分が多分混在している可能性もありますよね。これは、コメントなんですが、国際的な分類というんですかね、慣習のデータが必要かなという気はしました。
【林上席研究官】  それで御紹介できる議論がございまして、全く御指摘のとおりで、日本の研究者は欧米の方々と分野分類に対する対応の仕方が違うというのが明らかに我々のデータでも出ています。ちょっと今データを持ち合わせていないのでお示しできないんですけれども、工学を含む分野分類で、例えばトムソン・ロイターのEssential Science Indicatorsのような国際的に広く使われている基準に従って聞いても、日本の研究者は工学をやたら選択するということが分かっております。ですので、セカンダリーの分類を聞いて、時にはそれを再配置してから分析し直すということをやったことも過去の調査であるというのが現状です。これは、この場で踏み込むべき議論じゃないかもしれませんが、日本の大学の工学部の成り立ちというものが、欧米のエンジニアリングのファカルティーの成り立ちとは違うという性質から、かなり影響があるのではないかというような議論がございます。国際比較をする上で補正が必要な状況ではあり、でも、回答者の所作をコントロールするのもなかなか難しいところもございまして、でも、工夫すべき点だと思います。御指摘ありがとうございました。
【北森委員】  補足なんですが、日本の工学部が悪いと言っているわけでは決してありませんので。
【林上席研究官】  はい、全然、そのつもりはないです。文化の違いです。
【北森委員】  ええ、歴史も違いますしね。
【林上席研究官】  はい。
【喜連川主査】  美馬先生はきょうちょっと早く御退席ということで、是非御意見を。
【美馬委員】  済みません、じゃあ一言だけ。研究者の公開することへの動機付けという観点からちょっと見たいのですが、つまり、費用対効果というのかな、公開しても誰も見ない、誰も使わないとなると、一方で、先ほどの話の中にもある、何か公開していくプロセスに意味があるのか。公開してデータをきれいにきちんとして載せておくということの行為に意味があるのか。これは、例えばここで制度として今絞ろうとして、出していくようにと制度を整備しようとするのは、外発的動機付けですよね。もっとこれをやることに自分にとっても何か意味のあるというような個人的な内発的なモチベーションとか、あるいは分野によっては既にあると思うのですが、国際的なそれをやるためのコミュニティーに所属するために動機付けられるみたいな、研究者としての個人か、組織か、グループか、そこのところをうまく同時に制度以外で考えていかないといけないと思います。ただ、分野によっては、もう既にそれが当たり前のようにあって、いいことも一杯あってというところは進んでいるということですよね。
【喜連川主査】  いかがですか。
【林上席研究官】  今までの議論の中にインセンティブを解決する、あるいは補足する論点、幾つか出ていて、そもそも公開できるような基盤を整えるということに始まり、リワードの話があり、それから、今日お示しした、守る、安心して提供できる、具体的に申し上げますとデータポリシーに免責事項を設定するような話等々があると思います。
 これも長い話をしてよければ、17世紀に論文雑誌、学術雑誌が生まれて、論文を研究者が書くことがお作法となるまでの過程で同じインセンティブの議論がきっとなされたんだろうと思っています。当時、研究者が手紙をお互い交換することで先取権を争っていたのを、n対nで手紙を交換すると面倒なので、一旦1か所に集めてまた分配し直しましょう、それを物流、紙のロジスティクスでやったのが学術雑誌の発明の肝なわけですけれども、その当初は、論文を書くインセンティブって何だって話に多分なっていたかと思うんです。本当は自分が知ってほしい御高名な研究者に手紙を書けば――済みません、これ、全部想像の範囲でしかないんですけれども――研究者に早く知らせたいと思っていたことは容易に推察されるんですけれども、それを今やパブリッシュ・オア・ペリッシュという形で論文を書くことがもう作法、慣習としてなっているという、そういう文化が今353年目でしょうか、それぐらいにかけて培われてきたという点ではあるかと思います。
 ですので、何を申し上げたいかというと、余り短絡的にお金を付けたりとかするというのは、それは本当にドーピングと一緒で、一時的な効果はあると思うんですけれども、本来のデータ利活用を促進するという観点から見た場合は、かなり長期的な研究者の世代交代も織り込んだ対応が必要です。最近の例えで言うと、済みません、うちの娘の話をして大変恐縮ですが、うちの娘は折り紙をユーチューブで習うんですね。もう本で山線、折り線というのを知らずに、ユーチューブで見たとおり折ると非常に難しい折り紙も折れています。こういう世代の交代を含めると、実はデータを共有する、公開するというのも当たり前の文化づくりにできる可能性がある。つまり、今あるカルチャーと今あるフレームの中で無理やり動かそうとするから、このインセンティブという議論が出てきて、それで非常にインセンティブがないことが足かせのような形になるんですけれども、うまく将来を設計できれば、例えて言えば高いところから低いところに水が流れるごとく設計するのがポイントになると思いますが、ちょっと気の長い話であることを承知の上で、そういった観点も必要と思われます。御質問の答えというよりはコメント返しになって恐縮ですけれども、想起された論点になります。
【喜連川主査】  どうもありがとうございます。
 本来のスケジュールですと、ここで前回までの、特に前回の議論での論点整理を事務局にしていただきまして、更に議論をするということなんですけど、残された時間は政策討議と同じぐらいの短い時間になっていますので、これを説明しているとどうですかね、丸山室長。
【丸山学術基盤整備室長】  今日、林先生の御発表を含めていろいろな課題・論点が提起されていると思います。資料の説明等はまた後日に回させてもらって、今日は、もしよろしければこのまま御議論を続けていただいて、このエッセンスをまた私どもの資料に入れ込み、次回以降でも御議論をまとめていただくということでも結構かと思います。
【喜連川主査】  皆さん、そういう形にさせていただきます。いつも大変丁寧に論点を整理いただいて、物すごく勉強になるんですけれども、それに費やしてしまうと実際の議論の時間が押してしまいますので、本日は、林先生のマテリアルが、いろいろ議論の素材としては大変有り難いものを頂きましたので、ここをもう少し残された議論で意見ございましたらお受けしたいと思いますが。どうぞ。
【五味委員】  今回の資料、非常にいろいろ学ぶところがあって、特に先ほど、ちょっとまた戻ってしまって申し訳ないんですけれども、14ページにございました経済産業省で作られているDMP(データマネジメントプラン)の一つのモデルを企業的な観点から見ますと、要は、受託しているものに対する成果物設計の中に、従来の成果物に加えて更にデータマネジメントという成果物も入れていきたいという経済産業省の方の思いをベースに作られているのかなと思ったんですね。これを学術的に見たときにどういうふうに考えていったらいいかというときに、この整理の仕方ですね、この下に描いてある図は、データの属性というんですかね、作られたデータをどう取り扱うべきかという指針になっているように私は思いました。
 特に一番左に委託者と書いてありますけれども、一番左の委託者指定データは、要は流通させるべきデータは何なんだということを多分示していて、流通させることが、先ほどインセンティブという話もございましたけれども、検索対象にどれだけここのデータがひっかかるか。どういうものを出すと自分のやっている研究が世の中の方から検索してアクセスいただけるか、そういったレベルのデータに何をすべきかというのが多分左側で、この自主管理データの方は、これはどちらかというとかなり権利的にどういうふうな扱いをすべきかと非常に分野ごとに、あるいは先ほどエンバーゴの話がございましたけれども、やっぱりデータの価値、データが持っている価値ですか、時系列的にだんだん価値が下がっていくものもあれば、逆に言うと、時間がたつことでより価値が出てくるデータも多分あるかと思うんですけれども、そういった価値をどういうふうに判断してこの自主管理データを設計していくのかということを、情報を得る側と出す側が何らかの形の契約で多分やっていくような、そんな領域かなと思ったんですね。一番右の非管理というのは、多分、自分たちの研究活動の中で使われる日々のデータの中のものだろうと思ったんですけど、こういったフレームは、是非これを借用して我々としては検討していった方がいいのではないかなというのが私の思ったコメントの一つです。
 もう一つは、先ほどの流通というところを広くやっていくためには、やっぱり経済産業省はこうやっています、分からないですけど、学術系はまた独自ですってなりますと、研究者側からすると、受託研究もやれば、自分たちで独自の研究もやる。それごとにまたフォーマットが違うというのはあんまり効率のいい話ではないかと思いますので、このフレームですかね、こういったインデックスの作り方等はなるべく共有化していった方がいいのかなということは思いました。
 もう一つは、正に公開すべきデータと、その権利をきちんと自分たちで持って管理すべきデータを研究者の方が一人で考えるというのは多分非常に大変なので、そのためにも先ほどのデータサイエンティストという方が傍らで、やはりこういう情報は公開していくべき、こういう情報はきちんと管理してやっていく。そういった意味でも、データサイエンティストの方がこういったところの設計にも研究者の方の相談役として多分必要なことになっていくのかなというのが、何となくこの下の図からいろいろ思いましたので、その辺りをちょっと議論していくことが大事かなと思いました。
 済みません、コメントで申し訳ございません。
【喜連川主査】  幾つかの論点があって、全てお答えいただかなくてもいいかもしれませんが、何か。
【林上席研究官】  今頂いたコメントから想起される御説明は、この軸に対してこのようにちょっと線を引くと、もはやリニアモデルが通用しない時代ですけれども、基礎研究から応用、若しくは科学、学術インパクトから社会インパクトにつながるようなデータという軸を持つように見えます。要するに、特に行政側が指定するようなデータはやはり社会インパクトを志向することが往々にしてあるということで、ここにも実例として出ている交通情報データなどに象徴されるわけです。何を申し上げたかったかというと、文部科学省の取組で考えるのは、組織としてだけではなくて、研究者のタイプを分けて、いわゆるストークスの4象限の分類を御存じの方もいらっしゃるかもしれませんが、理論寄りか、企業応用を含む実践寄りかの軸で研究者を分類する4つのマトリックスができまして、そうすると、実践寄りを志向している研究者であれば、社会的インパクトを含むスキームがなじむような研究プログラム開発ができる。あるいは、それに応じた委託研究開発ができるような話になります。その一方で、数学とか高エネルギー物理の話になると、そもそも共有することの意味が、原則研究者間で共有できればいいということもありますので、全くこういう社会インパクトを織り込んだスキームはなじまないというような、そういう議論をしていくことになっていくのではないでしょうか。やはり組織としてデザインをするという切り分けになっていくときに、裏側で研究者としての分析を加えた考慮をすると、また違った文部科学省ならではのデザインができる可能性があると思いながらお話を伺っていたところです。頂いたコメントの中で一番コメントがしたくなったのは今の点です。ありがとうございます。
【喜連川主査】  多分、コンテキストは相当違っていると思いますね。つまり、こちら側は、オープンデータにしたときオープンなんですね。それで、知財戦略で議論しているのはデータの流通でしかないんですね。流通ということは、ここの表現で書いてあるのは、第三者にも共有可能って書いてありますね。これはもうコントラクトなんですね。これは今、不競法の案件を御紹介頂くということですが、それの対応が少しディレイしているんですけれども、データの契約ガイドラインみたいなものを経済産業省はもう作っておられまして、したがいまして、ここで議論しているのはどちらかというと企業間連携で原則有料です。この衛星というのも、経済産業省の衛星というのは有料と思われます。ですから、ここの御紹介のところは、多分1分しか紹介がなかったのですが、相当トーンが違うのではないでしょうか。
【林上席研究官】  そうですね。御指摘の点に関する説明は、元の資料の今回紹介したスライドの前後にございまして、それと一緒に御説明すべきものです、本来は。
【喜連川主査】  そうですよね、はい。というところが重要だと思います。
 家先生、いかがですか。
【家委員】  ちょっと話が別のことになりますけど、大変興味深いデータを見せていただいているんですけれども、32ページにあるデータ公開をためらう理由というのが、これがなかなか面白いなと思っていたんですが、ちょっと見ますと、例えば2番というのは、これはエンバーゴを適切に設定すれば、そんなに問題ではないだろうと思いますし、それから、4番の機密とかプライバシー情報、これについては取扱いの規定をちゃんと設定すればクリアできる問題かなと。そうすると、その1番と3番と5番が、結局、自分が出したデータが有益に使われたときに自分にちゃんとクレジットがもらえるのかという問題と、逆に、意図せざる使われ方をしてしまった場合に、自分に責任が降りかからないか、それがデータ公開のポリシーに研究者が納得するような形で埋め込まれるのかどうかなという感じがするんですね。6番は健全な答えだと思いますけれども、研究の誤りが発見されるのはむしろ研究の前進であるので、大変結構なことだろうと思います。
【喜連川主査】  そうですよね。
【林上席研究官】  ありがとうございます。これは美馬先生のインセンティブの議論に具体的に答えるときによく御指摘頂く論点になると思います。具体的にインセンティブを設計するときは、研究データ共有文化の醸成といってまず何をやるべきかというと、引用の作法を確立するようにしましょうという話ですね。誤解・誤用の可能性に対する懸念に関しては、今後、免責事項をしっかりデータポリシーで示すことで、少なくともデータ提供者が守られるようにするというところから始めるという話が一つ、それで全てではないんですけれども、あり得ると思います。商用利用のところが悩ましくて、基本的にはオープンにするときは商用利用も良しとすべきで、ここのデザインが一番面白いところだと思います。ここは要するに、公的研究費による資金提供とは違う資金の流れ、経済としてのインセンティブを与えるかどうか、研究者に対してインカムストリーム(収入源)を付与する話になりますので、それをどう設計するかというのは、これは正に先ほど申し上げた研究者のタイプ、あるいは研究とそれに付随する分野と属性によって変わってきますので、ここは分類して議論する話だと思います。
【家委員】  多分、CSTI(総合科学技術・イノベーション会議)などの議論ではそこのところに結構ウエートが掛かっているのかなと思いますし、先ほどから出ているような委託事業による研究は、最初からコントラクトできちっとそういうのをやっておけばいいと思うんですけれども、科研費のような助成事業について将来がなかなか予測できないようなものについて、どうやって規定に落とし込むかというのはなかなか難しいかなという気はしていますが、大変いい分析のデータだと思います。
【喜連川主査】  どうもありがとうございます。まだ皆さん、若干理解が行き届いてないところでの心配が多いところです。
【林上席研究官】  そのとおりと思います。
【喜連川主査】  多いですね。だから、例えば商用利用というのは、先ほど申しました法改正によって差止め請求が権利としてもできるようになっているというようなことが周知されるということが、まだまだちょっとこなれてない状況でしょうね。
【林上席研究官】  はい。
【喜連川主査】  ただ、非常にインプレッシブな、アンケートとして見るとここが懸念になっているというのは、先ほど申し上げましたように、今、文部科学省の方でまとめている資料の中にもこういう視点をより強く配慮しながら議論するという点では、非常に時宜を得た情報を頂いたのかなと思っています。
【林上席研究官】  1点補足させていただきますと、これが正にモニターする対象だと思っています。今年も同様の調査を行う計画を立てておりまして、これがどのぐらいこちら側に寄るか、それを更に2年後という、正にオープンサイエンスモニターがやりたいことはそれでございます。それは何が寄与して割合が変わったのかというのが、今度、議論できることになるかと思います。そこに政策との因果が見いだせれば一番理想的な形になるかとは思います。
【喜連川主査】  やっぱり後ろの方でもそうですけれども、n数が、要するに次元を上げていくとどんどん高次元の呪縛の問題で小さくなっていってしまいます。これは、やっぱり工学者が多過ぎるんじゃないかって、工学者はとても真面目に答えているいい種族であるというのがよく分かったと思うんですけれども、やっぱり、学術会議の以前のアンケートをやりましたよね、ああいうチャネルからもとってみて、少し整合性を見るみたいなことをやってもいいかもしれないですね。
【林上席研究官】  はい。
【喜連川主査】  これだけを1点、どれだけ信じるかというか、信ぴょう性を担保できているかというのは、ちょっと議論があるような気もしますので……。
【林上席研究官】  そのとおりで、同じフレーミングであれば経年変化等の相対比較をすることにしか議論の価値はなくて、絶対的な数値には正直意味はないと思っています。一方で、お示ししましたとおり、研究者の代表性を伴った母集団を設計するとなると、それなりにリソースが必要で、あとブランドによるロイヤリティの確保も重要で、正におっしゃっていただいた日本学術会議のようなブランドとともに必要なリソースを掛けてそれなりの規模の調査をするということになります。大変ではありますが、どこがやるかはさておき、やる価値は十分あると思います。
【喜連川主査】  失礼しました、北森先生、お願いします。
【北森委員】  今の議論に非常に関連してなんですけど、この商用利用される可能性、家先生の御指摘のところなんですが、ここがむしろ国際的にも国内としても非常に重要な点ではないかなといろいろな意見を聞いて感じているんですが、まず、商用利用は、裏返せばイノベーションにも当たるわけで、経済活動に直接研究を結び付けるという意味をイノベーションととるのであれば、商用利用を促進するということがむしろオープンデータというところに一部の人は価値を見いだしているように思えます。特に国際的にはそのような傾向にあるのではないかと。
 それで、ステークホルダーによってかなり違う、十分ではない、国際的にも大きなパブリッシュアの、出版社の場合には、むしろそこに一番の観点があるでしょうし、それから、警戒するという意味では、アメリカのオープンデータの議論状況と、ヨーロッパの議論状況が、最近、トーンが随分変わってきたというふうに聞いているんですが、アメリカが慎重になりつつあって、ヨーロッパの方が少し積極的になりつつあるというふうにも聞いている。特に科学の分野ではそうだというふうには、最近、聞いたばっかりですね。ですから、ここの観点というのは極めて重要ではないかなと思います。特に政策のように国がどうするかというところについては、イノベーションの議論も含んで議論すべきかなと思います。
 それで、林先生に少し伺いたいのは、先ほど少し言いました、アメリカの方でトーンダウンをして、それでヨーロッパの方で積極的になりつつあるというのは、先生の方でも何かそういう情報なり、あるいはデータなりはあるんでしょうか。
【林上席研究官】  はい。やはり一般的な傾向として、繰り返しになりますが、アメリカは欧州に比較するとやはりまだ保守的、特に政権が替わってから特に保守化が加速しているのはほぼ間違いないと思います。データ共有に関しては間違いなくそうだと思います。ヨーロッパは、それを機になのかどうかは定かではありませんが、あるいはもう少し広い、サイエンスに限らない観点からの議論ですと、やはり米国発のグーグル、アマゾンに対して、つまりデータ駆動型で立ち上がった巨大な、もはやアントレプレナーシップではない、コングロマリットとも言わず、何と呼ぶのが適切か、国を超えた巨大プラットフォーム企業に対して欧州は何とかしたいという考え方がベースにあって、欧米とは違うフィロソフィーを持ってデータ利活用を進めていきたいという考えがあるという議論をしたことがあります。その流れの中でオープン化を進めてイノベーションを加速するという考え方があるのではないかと。
 あとは、これも私のにわか勉強の範囲ですけど、歴史としては、やっぱりルールを作るのは欧米、特にイギリスが、出版、特に学術情報流通に関してのルールづくりというのはイギリスがずっと仕切ってきたような歴史がございまして、欧州側の方がフレーミングをするというところまでは大体リードするというような文化があるように拝察しています。そのルールが出来上がるぐらいになって実利になるとアメリカの方がぐっと前に出るというような話もあるかと思います。その中でじゃあ日本はどうするかという考え方が、今度、論点としては出るかと思います。
【引原主査代理】  今の件なんですけど、私は共同研究しているカナダの研究者がいるんですが、国のレベルでDropboxとかAmazonとかGoogleのサーバーは使わないように指示が出ているという現状があります。ですから、それぐらいの危機感を今持っているということはあると思います。
【喜連川主査】  難しい問題ですね。この話になってきますとだんだんオープンサイエンスから距離が。本当はそこを議論しなくちゃいけないんですけれども。
【林上席研究官】  済みません、そういう意味では本来の議論に戻させていただくと、「短所は長所に転換できる」の法則に従うというわけでもないのですが、引用されずに利用されるとか、先に論文を出版される可能性はなかなか止めにくのですが、むしろ、商用利用であれば、報酬等のインセンティブをしっかり設計できれば、データ共有がより進むという逆に転ずる可能性があると思うのです。そうすると、やはりデータ駆動型の学術情報流通のプラットフォーム事業みたいなものを日本の産業としても構築するというような議論が、これは経済産業省の話になってしまいますけれども、でも、そういった議論とセットで考える行動することによって、現状を打開していくことが可能になるのではないかとは思っています。
【喜連川主査】  ですから、今、北森先生がおっしゃったことの御指摘は本当に重要で、その民転換をしないと日本は強くならないわけですね。ただ、何となくオープンデータ感というところで若干アカデミアサイドは微妙にヘジテイトするところがあるのも現実だと思います。ですので、これからまとめる資料の中にそこをどの程度のトーンで書くのか。書かないのはやっぱりおかしい話と、これだけ懸念事項がある。そこで、じゃあどういうふうにすればそこを加速できる、刺激できるのかと。逆に、そこまで踏み込めなければ、そういうことをもっと主体的に議論する場を持つべきであるとか何か、丸山室長、そういう論点は是非加えておいていただくのがいいんじゃないか。
 先生、どうぞ。
【逸村委員】  ちょっと話が大きくなったついでに、以前も述べたことがありますが、このオープン化の学術という点では、デジタルアーカイブですね、ユーロピアナを中心とするヨーロッパが、先ほどの林さんの議論と同じような流れで、かなりインパクトという言葉を使って自分たちの文化的なものを、学術、科学も含めて、ここのところいろいろ議論を重ねているという状況はあるようです。まだどっちの方向へ行くか分からないんですが、基本はオープン。だけど、守るべきものは守ると。ある意味また、グーグル対抗のような色彩もあるかとは思います。
【喜連川主査】  そうですね、はい。それは、前回も前半、随分議論させていただいたところで。
 ほかに論点。私も辻委員にお伺いしようと思っていたところで、経済産業省がこれだけ活発にしている中で、総務省はこの動きはどうなのかという御意見を伺おうと思っていたんですが、そうでなくても結構です。
【辻委員】  そうですね、必ずしもその話ではないんですけれども、ただ、通信分野で起こっている話として、必ずしも論文とかデータではないんですが、オープン・ソース・ソフトウエアということでOSSと呼んでおりますけれども、いろんなソフトウエア開発をオープンなコミュニティーで自分たちのコミュニティーづくりをして、その中ではソフトウエア自体をみんな持ち寄って、開発し合って、いいものを作っていこうという動きが最近とみに活発になってきておりまして、ですから、今、この議論の中でいろいろとオープンとすることに対してまだまだハードルがあるという中で、例えばOSS(オープン・ソース・ソフトウエア)の動きといったものも一つの参考になるのではないかなと思って伺っておりました。
 以上です。
【喜連川主査】  どうすればいいですか。伺っていただくのは結構なんですけれども、当委員会としてはどういうふうに進めるかの何か御示唆ありますか。
【辻委員】  例えば、OSS(オープン・ソース・ソフトウエア)などコミュニティーでいろいろとソフトウエア開発をオープンにしながらやっているというところがありますので、先ほど林さんの御説明の中で最後に組織に対する調査を掛けるというお話がございましたけれども、例えばこの後、今回は個人向けに調査をされているんですが、どういったコミュニティー、組織に対して調査を掛けていくのがよいのかといった辺りも、一つの論点としてあるのかなと思いました。
【喜連川主査】  前からの議論の展開ですと、前回は若干慎重な発言をしたんですが、その部分がたしかデータと一緒にコードプリザベーションをという話があって、ここで議論するという論点も個人的には強く感じるんですが、今、辻委員からおっしゃっていただいたような話というのは、コミュニティーとしてそこを維持するようなことのエコシステムが動けば、完璧とは到底言えないと思いますけど、大分ましになるようなこともあろうかというふうに拡大解釈をしながらお伺いしていたんですが、その点も含めてちょっと林研究官、いかがでしょう。
【林上席研究官】  今の観点から想起されるのは、分野別の対応でも学会別の対応でもいいのですけれども、喜連川先生にSTI Horizon誌のオープンサイエンス記事でインタビューをお願いしたときにも出てきた観点で、オープンサイエンスの御利益としては、既存の研究を効率化するという、改善するという御利益のほかに、新しい研究を生み出すという2つの側面があるという、もう皆さん共有できる話かと思うのですけれども、後者の部分です。これから生まれる新しい学術知と、その学術知の発展に伴うコミュニティー形成の段階では、情報学で起きているような形でGitHubを使って成果を公開・共有する、あるいは研究プロジェクト管理はSlackを使ってやるとかいうのが当たり前のようになってくるという、そういう研究分野、領域はそれでどんどん進めていくことになります。その新しい学術知を生み出す枠組みの中のインセンティブモデルと、既存の研究、しかも論文を書くことで評判や昇進、報酬がある程度約束されているような仕組みの中で、研究データを利活用・加速させるインセンティブとは分けて議論すべきです。しかも、大事なのが、オープンサイエンスの御利益のうち、後者の究極としては、新しい学問体系が生まれ得る、あるいはサイエンスを超えた何か知の体系が生まれることすら、現状ではそれが何を明快には示していないのですけれども、想起されているので、それこそ正にクリエーションだし、イノベーション、科学研究の作法自体のイノベーションを推進するコミュニティー形成というのは施策としても後押しすべきなのではないかと考えています。
【喜連川主査】  通信というのは原則ややこしくて、技術論は原則共有しないとお互いに話せないと。一方、通信している内容は秘匿なので、そもそも共有できないという両極のエクストリームなシチュエーションにあるので、経済産業省の空間とは大分性質が違ってくると思うんですけれど、この辺の領域はキャリアからごらんになって何か感じられるところがあったらちょっとフィードバックを頂くとどうかと思うんですけど、辻委員、いかがでしょうか。
【辻委員】  通信の分野でオープンデータをどう感じているかということですか。
【喜連川主査】  通信といいますか、要するに総務省配下ですね。旧自治省部分は除いたとして、MIC(Ministry of Internal Affairs and Communications)のCの部分でこのオープンアクセスとかオープンリサーチデータとか、そういうところのひっくるめたオープンサイエンスに関して何か議論がなされておられるのかどうかみたいな。
【辻委員】  通信分野でオープンデータの話が進んでいるかというと、残念ながら余り進んではおりません。
【喜連川主査】  どうもありがとうございます。
【引原主査代理】  質問がなかったのでお聞きします。メトリクスの話があったと思うんですが、オープンサイエンスの進んでいる度合いというのは、国別であるとか分野別でいろいろあると思うんです。このメトリクスをそのまま当てはめても何か漠然としたものしか多分見えてこなくて、ここの例えば数年の中にどういうふうな動きをするか、あるいは、した成果が出たかという新しいメトリクスを入れた方がいいというような御指摘でしょうか。
【林上席研究官】  はい、そうです。具体的に新しいものが出てきているのではなくて、現在はニーズが顕在化しているという状況です。今あるアプローチとしましては、オルトメトリクスのような被引用数に代わるようなインパクトを示すことで、オープンサイエンスの御利益の一つである公共に科学情報がリーチしている過程を測るとかいうような観点があります。それから、研究の透明性を高めるという意味では、研究費、研究者、研究成果の紐づけによる可視化・透明化等の観点からのツールの開発等々、個別の学術活動の個別の課題に関しての取組というのはありますが、ではそれを体系化してオープンサイエンスが推進していることを測るためのデザインに持ち込むところがまだできていません。そのこと自身が研究対象になっています。EC(欧州委員会)のオープンサイエンスモニターは、あれだけの体制を組んでこの課題に取り組んでいます。日本でいったら電通と岩波などいわゆる主要な大企業も、正にそうですね、その意味では辻委員の御指摘の議論とも関連すると思うんですけれども、オープンに流通させるにもコストが掛かるので、その裏を支えるインフラには事業が回っているわけです。そうすると、そこでは商業的な活動を含めたお金は回るわけですので、その点は完全に産業育成になりますので、オープン化を進めつつ、実は裏の情報流通インフラでしっかり企業活動が支えるということに既になっているので、その観点と併せて議論していく必要があります。あるいは、オープンサイエンスモニターを開発すること自体、企業活動につながる可能性もあります。大事なのは、このような、学術知や産業の体系づくりを推し進めるときに、日本も主体的に考えて行動することだと思います。ルールが出来上がってから従属してするのではないという、よくある議論ですけれども、そういう点だと思います。
【喜連川主査】  数分で発表されるとき、最初の24ページの図1はもう少し誤解のないようにしておく方がいいかなと。これは、人生で1回でもデータを公開したことがありますかという質問ですよね。
【林上席研究官】  はい。
【喜連川主査】  多分、何にも知らない人からすると、えっ、こんなに公開しているのかなって思うリスクが多分にあるような気がして、全体の研究データ、全体の論文のオープンアクセス率というのはとても少ないということも一方で何か入れておいていただいた方が安全ではないでしょうか。勝手なお願いで恐縮なんですけれども。
【林上席研究官】  いえいえ、それは非常に大事なポイントでございまして、こういう場ですので、オープン寄りのところで御説明させていただきました。やはりデータはプレゼンの仕方で相手に与える印象も変わり得るのは昨今のいろいろな話題からもあるかと思うのですけれども、気を付けるようにはいたします。ただ、私どもも、もっと低い数値になると思って設計したのが正直なところです。生涯で1本でも書いたことある人でも半分以下ぐらいだろうな、特にデータに関しては、というぐらいに思って、つまりハードルを下げて聞いた結果、思いのほか。
【喜連川主査】  それでも、確かに私も高い感じがしますね。
【林上席研究官】  はい。
【喜連川主査】  化学はよく分からないですけど、コンピュータサイエンスの人がやっているなんていうのは、原則、本当にデータを探すことに躍起になっていますね。ですから、私が、JST(科学技術振興機構)にもJSPS(日本学術振興会)にも言っているのは、原則、研究資金を配るよりも、データを配りましょうと。はるかに論文の数、パブリッシュメントは増えるはずだし、研究も活性化されると。今はお金の時代ではなく、データをいかに研究者に御提供できるようなレギュレーションフレームを作ることですというのも再三申し上げていますが、あの数字はちょっと高過ぎますね。
【林上席研究官】  はい。
【喜連川主査】  何かどの分野かが貢献されているような。我々の分野は享受してないような気がします。
【林上席研究官】  これもエビデンスとしてデータとしては今お示しできないですが、専門家ネットワークの専門調査員というのはどのように任命されるかを御紹介すると一端が見え隠れすると思っております。科学技術予測調査という、5年に1回、我々が行っている調査の当初の回答者、専門家を軸にスノーボール方式(候補の専門家を紹介してもらう方式)で随時増やして、あるいは退任される方の分を補充しているというような流れで、要するに、そもそもそういう専門調査員の任を受け入れる、委嘱を受けるという時点でかなりバイアスが掛かっていると考えます。
【喜連川主査】  そうですね。
【林上席研究官】  多分、そこがこの高い割合に寄与していることが強く示唆されます。ですので、一部の方には釈迦に説法ですが、Scopus等の論文データベースのコレスポンディング・オーサー(連絡著者)に対して1万人とか日本人の研究者に投げて行う場合は、相対的には共有率は低くなるだろうなとも思われます。
【喜連川主査】  あと、あのAMED(日本医療研究開発機構)のデータサイエンティストの定義は、ちょっと難しいのではないかという気がしています。
【林上席研究官】  そうなんですよね。中身のスキルは適切ですが、それをデータサイエンティストと呼ぶかは議論を呼ぶと思います。
【喜連川主査】  こんなこと、一人でできない。
【喜連川主査】  と僕は感じたんですが、やっぱり今、人材育成で議論されているデータサイエンティストは、どちらかというと統計と機械学習の適用スキルを持っている人というふうにほぼ合意がとれているような気がしますので、私の主たる国際会議は実はデータエンジニアリングというんですけれども、データエンジニアという言葉がないことを残念です。残念に思っています何かちょっとこれだけ言われるというのは余りにもかわいそう過ぎるので、そういうところも、林先生がいろんなところで発表されるときには、何でもかんでもデータサイエンティストに押し付けるという発表でない、もうちょっと多様な人材像というのも、今後、文部科学省の資料の中でもまとめていった方が、実質的に機能していくためにはそういうことも必要かなというのはちょっと感じました。
 ということで、ちょうど12時になりまして、本日は、林研究官からの大変インフォーマティブな情報を御提供いただけたものですから、やはりこういうデータがございますと皆さんいろんなアングルからかっ達な御議論をしていただけて、非常によかったと思います。これをベースに事務局の方にもう一度論点を整理していただきまして、次回に続けたいと思います。よろしいでしょうか。
 事務局の方から何か御報告はございますか。
【高橋参事官補佐】  それでは、本日の議事録につきましては、各委員の先生方に御確認を頂いた上で公開をさせていただきます。
 それから、本日の資料の一番下に資料4ということで今後の日程がございます。次回、第10回につきましては、6月27日(水曜日)の13時から15時、場所は3F2特別会議室で、この会議室の隣での開催ということでございます。また、更に次の回、第11回以降の日程でございますけれども、メールでお知らせいたしておりますとおり、それぞれの日時を候補日として調整中でございます。基本的にはこの日程で行いたいと考えておりますけれども、可能な限り御調整いただきたいと考えているところでございます。
  事務局からは以上です。
【喜連川主査】  それでは、これで閉会とします。どうもありがとうございました。


――了――


お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

麻沼、小原
電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)