第9期学術情報委員会(第6回) 議事録

1.日時

平成29年12月13日(水曜日)15時00分~17時00分

2.場所

文部科学省3F1特別会議室

3.議題

  1. 電子化の進展を踏まえた学術情報流通基盤の整備と大学図書館機能の強化等について
  2. その他

4.出席者

委員

喜連川主査、引原主査代理、赤木委員、安藤委員、家委員、逸村委員、岡部委員、北森委員、竹内委員、谷藤委員、辻委員

文部科学省

(科学官)相澤科学官
(学術調査官)小山学術調査官
(事務局)原参事官(情報担当)、丸山学術基盤整備室長、玉井学術基盤整備室参事官補佐

オブザーバー

安達国立情報学研究所副所長、林科学技術・学術政策研究所上席研究官

5.議事録

【喜連川主査】    それでは、時間になりましたので、ただいまから第6回の学術情報委員会を開催いたしたいと思います。
  前回は、引原委員から「国立大学図書館協会ビジョン2020」について御紹介を頂きました後に、大学図書館機能の強化や高度化の観点からいろいろ意見交換をしていただきました。
  今回は、図書館からもう一度テーマをオープンサイエンスに戻して議論を頂きたいと思います。国立研究開発法人農業・食品産業技術総合研究機構(農研機構)の大澤剛士先生から、特にインセンティブという観点から御発表頂きまして、その後意見交換をお願いしたいと存じます。大澤先生、後ほどどうぞよろしくお願いいたします。
  なお、科学技術・学術政策研究所(NISTEP)の林先生及び国立情報学研究所(NII)の安達副所長には、オブザーバーとして御出席頂いております。
  初めに、事務局から配付資料の確認と傍聴者の状況について御報告お願いします。
【玉井学術基盤整備室参事官補佐】    事務局からお知らせいたします。本日の委員会につきまして、御案内時には、前回同様ペーパーレスということでお話しさせていただいたのですけれども、設備準備の都合によりまして、委員の皆様のお席には紙媒体での資料を配付させていただいております。
  ただし、傍聴の方々、今回34名御登録頂いておりますけれども、こちらの方々については、ペーパーレスでの対応とさせていただきたく、お手数ですけれどもお手持ちの端末に資料のダウンロードをお願いいたします。資料のダウンロード方法についてはお手元のクイックガイドを御確認ください。また、紙資料についても数部用意がございますので、ダウンロードができないような場合には事務局までお申しつけください。以上です。
【喜連川主査】    ありがとうございます。本日は冒頭申し上げましたとおり、オープンサイエンスにおける課題の一つといたしまして、G7の科学技術大臣会合のコミュニケでも取り上げられておりますインセンティブを中心に御議論を頂こうと考えております。まず、審議に入ります前に、事務局にて用意頂きました資料について御説明をお願いいたします。
【丸山学術基盤整備室長】    失礼いたします。それでは少し時間を頂戴いたしまして、資料について御説明します。
  まず資料1をごらんください。こちらは、これまでの委員会における、特にオープンサイエンスの関係の主な意見を改めて整理をしたものでございます。一度、前回も図書館の関係の御議論を頂いたということもございますので、少し御記憶を戻していただくという観点からも、少し説明をお聞きいただければと思います。
  まず一つ目のオープンサイエンスの意義・目的、それからちょっと飛びまして真ん中の下ですけれども、2.の特に論文のオープンアクセスという課題でございますけれども、このあたりはかなり共有されていると思いますので、説明についてはまた省略をさせていただきたいと思います。
  それで、1ページ目の下の方の3.のオープンデータ検討上の観点・方向性、あるいは留意点というところでございますけれども、まず検討上の観点とか方向性といったようなところから見ていきますと、ページをおめくりいただき2ページ目でございます。
  まず一つ目の丸に、オープンのタイミングは分野それぞれでの状況を踏まえるということ。二つ目の丸にもありますが、分野や領域ごとで戦略を練っていくことが必要ではないかと。三つ目の丸に、戦略部分の検討と同時に、具体的な施策として出していくことが重要であるという御意見がございました。
  それから一つ飛ばしまして、研究をディスカレッジすることなく、サイエンスをより効率化するといったような方向性での検討が必要だと。それから、また一つ飛ばしまして最後の丸ですけれども、議論と施策形成の両方を同時に進める必要があるとともに、研究データをどう守っていくのかという視点が非常に重要だという御意見がございました。
  また、その下の検討上の留意点といったようなことから見てまいりますと、三つ目に、この「オープン」という言葉が非常に独り歩きしていて、いろいろな思いになっているということで、この言葉のコンセンサスは重要であると。
  それから一つ飛ばしまして五つ目の丸ですが、クリエイティブコモンズライセンスとの関係では、データには著作権がないということもあって、当該データを利用してもよいという意思表示をするための仕組みが必要ではないかという御意見。
  それから一つ飛ばしまして2ページ目の最後ですけれども、各分野の研究スタイル等を踏まえて議論が必要であるという御意見がございました。
  それから3ページ目でございますけれども、本日の御議論を頂く中心テーマでございます、研究者並びに研究者コミュニティのモチベーションあるいはインセンティブという観点では、例えば取組の現状としては一つ目の丸にもございますとおり、学術界の反応はいまだ発展的であると。このオープンサイエンスに関わる理由や目的が見えていない状況ではないかという御意見がございました。
  それから次の括弧でございますけれども、モチベーション及びインセンティブの方向性というところでは、二つ飛ばしまして三つ目の丸、データ公開が個々の研究者にとってプラスに働くという面を示していくことが非常に重要であると。
  それからその一つ下の四つ目の丸ですけれども、オープンサイエンスに取り組むことでどのようなベネフィットがもたらされるのかと、動機付けが重要ではないかと。
  その下には、こういった陰の立て役者が存在する中で、そういう人を認識して認めていくということが必要であると。
  これらをまとめて考えますと、その次の丸ですけれども、公開することによってより科学に寄与することを具体的に示すということと、それがきちんと評価される仕組みを構築することが重要であるという御意見でございます。
  そのもう一つ下でございますけれども、このオープンサイエンスにおいてもイメージの共有化は非常に重要であると。分かりやすい例を示していくことが必要ではないかという御意見がございました。
  それから少し飛ばしまして3ページ目の下二つでございますけれども、識別子を活用することによるインセンティブもあり得るということから、この項目で整理をいたしましたけれども、研究者識別子を活用することによって、研究機関間の異動等に関わらず研究者を同定可能であると。研究者同士のつながり、あるいは研究の近接性等も分析可能ということの御指摘がございました。
  それからその下に、研究の着想段階から成果波及までがモニター可能となり、研究活動の流れや効果も測定可能ではないかという御意見もございます。
  それから4ページ目でございますけれども、研究成果及びデータを共有するプラットホームの整備ということでインフラの関係でございますけれども、一つ目の丸に、研究データを研究者が安心・安全に共有できる基盤作りが必要であると。
  一つ飛ばしまして、リポジトリについては、今は機関リポジトリといった形の整備にとどまっておりますけれども、この枠組みにとらわれず、分野ごとの特性や強みなども考慮した整備を検討すべきではないかと。
  その下に、こういった分野リポジトリを具体化するには、学協会、あるいは大学、大学図書館が協働していくことが重要ではないかという御意見がございました。
  それから、プラットホームの整備に当たっては、蓄積・利用に関するユースケース、研究者のインセンティブに裏打ちされたサービス設計が重要ではないかという御意見を頂いております。
  それから、分野別の特色・課題を少しその下に整理させていただきましたが、共通事項を中心に御紹介をしたいと思います。
  6.の分野別の特色・課題として、まず一つ目ですけれども、研究結果の共有そのものがよく理解されていない分野はまだ多いのではないかと。一歩一歩、領域ごとの取組をエンカレッジするメッセージが重要ではないかという御指摘。
  それから二つ飛ばしまして四つ目ですけれども、多くの研究者が共有できるイメージを分かりやすく示していくことが鍵であると。学会などとイメージ共有に向けた議論を行うことも有益ではないかという御指摘がございました。
  それから4ページ目の最後に、この分野ではこうすればうまくいく、あるいは、どうすれば強くできるという部分に焦点を絞って議論をしていくということも考えられるのではないかということの御指摘もありました。
  それから5ページ目でございますけれども、先ほど申し上げましたとおり、分野ごとの御意見を少し整理させていただいておりますが、ちょっと本日はインセンティブを中心に御議論頂くということもございますので、説明は時間の都合もありまして省略させていただきます。また、こういった議論を進める際に改めて御説明をしたいと思います。
  それから6ページでございますけれども、一番下のところに7.として国際動向に関する危機意識ということで整理をしてございます。論文に生じているパワーバランスが、研究データに持ち込まれてしまうということへの危機感があるということ。
  それから7ページにまいりまして最初の丸でございますけれども、欧米において既に具体的な施策や戦術が動き始めていると。これに取り残されないように協調していくことが必要ではないかと。
  それからその下、四つ飛ばしまして五つ目に、欧米にデータを取られてしまう危機感や大手出版社に対してどう対応するかというイメージはともかくとして、分野コミュニティをどう守っていくのかという観点からオープン化の推進を議論することも必要ではないか、という御指摘を頂いております。
  それからちょっとその下は飛びまして、最後8ページ目の二つ目の丸でございますが、論文の流通権は海外の大手出版社に握られているが、次はデータが狙われているということで、このデータを守りながらオープンにしていくという戦略が必要であるという御指摘がございました。
  それから最後に8.として、オープンサイエンスに関連した先行事例ということで、プレプリントサーバ、それからウエルカムオープンリサーチ、更にデジタルシングルマーケットといったようなもの、御紹介ございましたのでこちらにまとめてございます。
  資料1は以上でございまして、併せて資料2を少し御説明したいと思います。この資料は、ちょっと字が小さくて見にくい点、御容赦頂きたいと思いますけれども、これまで国内外、国内が多いのですけれども、で御検討頂いて公表されている提言あるいは報告書等において示されたオープンサイエンス推進にかかる指摘事項を、表形式で整理をさせていただいたものです。
  左には事項ということでこの提言・報告書等で示されている切り口を並べさせていただいております。参考にさせていただきましたものは、左側から内閣府の検討会、平成27年3月30日に公表されました報告書、それから第5期の科学技術基本計画、それから私ども、学術情報委員会が平成28年2月にまとめました審議まとめ、それから併せて日本学術会議も御議論頂いておられますので、この日本学術会議が平成28年7月に出されました提言、それから今年の6月に閣議決定されました科学技術イノベーション総合戦略2017、最後、一番右側がG7科学技術大臣会合コミュニケ、これは平成28年5月につくば、今年の9月にトリノで行われておりますけれども、このコミュニケについて表示をしてございます。
  全体はちょっと大部になりますので、1枚目の上から三つ目の枠のところでございますけれども、研究者及び科学コミュニティに対するインセンティブというところを中心に御説明をしたいと思います。まず、内閣府の検討会、平成27年3月でございますけれども、ここではこれまでデータを作成し、ほかの研究者に提供・利用できるようにする活動は、論文投稿に比して十分に評価されてこなかった分野も多いため、研究者及び科学コミュニティに対するインセンティブを高めオープン化に対する努力について評価すると。
  また、研究者に対するインセンティブ、例えば、高品質なデータを提供した研究者に適切な報酬を与えるなど、成果に見合う処遇の仕組みを設けるという御指摘がございました。
  それから一つ飛ばしまして、私どもの審議会の審議まとめ、真ん中でございますけれども、アクセス可能となった研究データの利用者は、論文などの引用と同じく引用元を明らかにする義務があると。この引用によって、データ作成者の貢献が記録され業績として評価することを、大学及び研究者コミュニティにおいて共通認識とすると。これを実行していく必要があるという御指摘を頂いております。
  それからその隣の、日本学術会議の提言でございますけれども、データ生産者及びそのデータ流通者は、従来の業績評価方法である論文や特許などの形で研究業績を残すことができないことから、インセンティブや評価の手法を我が国でも積極的に取り入れることによって、データ生産者やデータ流通者が研究者としてのキャリアを形成できるようにすべきであり、またそのような人材を組織的に育成できるよう、文部科学省は制度的・組織的な対応を進めるべきという御指摘を頂いています。
  ここに色のついた米印がございますけれども、これはほかのところも共通でございますが、別のところにも同様の書きぶりが再掲されている、といった印でございます。
  それで、ここで御指摘の文部科学省の制度的な対応ということでは、主なものとしては、きょうは資料の御用意ございませんけれども、データ関連人材育成プログラムといったような支援事業が本年度から新たに実施されるなど、幾つかの施策が今動いているという状況でございます。
  それからその隣でございますけれども、科学技術イノベーション総合戦略2017、ここでは各国と連携して研究者・専門家の評価、オープンデータを広めるためのインセンティブ及び人材育成等の国際的なルールメイキングに対応していくことが必要である、という御指摘がされています。
  それから最後に、G7の科学技術大臣会合でございますけれども、このコミュニケにおいては、インセンティブの仕組みの検討、公的資金による研究成果の利用促進のための優良事例の特定を行うといったことが、つくばのコミュニケ。また今年のトリノでは、研究エコシステムのオープン化に対するインセンティブということで、研究者のキャリア評価にはオープンサイエンス活動に対する十分な理解と報酬があるべき、という御指摘がなされております。
  私どもの方から準備させていただきました資料の説明は、以上でございます。
【喜連川主査】    大変ありがとうございました。それでは、農研機構の大澤先生に御発表をお願いしたく存じます。どうぞよろしくお願いいたします。
【大澤農研機構主任研究員】    座ったままの方がよろしいですかね。もしも、皆さん、余り邪魔でなければ、立って話をした方が私は調子が出てくるタイプですので、そのようにさせていただければと思います。
【喜連川主査】    ではどうぞお立ちいただいて。
【大澤農研機構主任研究員】    ではマイクを使わせていただきます。
  では、御紹介頂きました、農研機構農業環境変動研究センターの大澤と申します。本日はこういった場所で、私にとって非常にアウエーな場所ではあるわけですが、このオープンサイエンスというテーマでお声掛けいただきまして大変光栄に思います。
  私から、タイトルの、オープンサイエンス推進から得られるインセンティブを考えるということで、ちょっとだけ私のことを紹介させていただきますと、私自身は、先ほどの資料にもありました、環境科学、農業ではありますけれども農業環境変動研究センターという名前がある組織におりまして、いわゆる農業と想像したとき皆さんが想像することは品種改良であったり生産管理であったり、そういったザ・農学といったら何ですけれども、そういったものかと思いますが、私どもの研究所はもう農業環境、生産以外と言ってもいいかもしれません。その農村環境、半自然環境、そういったものが人間にとってどんな意味があるのか、地球の環境にとってどんな意味があるのか、そういったものを研究しているところです。具体例を出しますと、地球温暖化と生物多様性、それが二つの柱になっている、そんな研究所です。
  ですので、私自身は非常にこのオープンサイエンス推進において相性がいい研究分野に身を置いていまして、実際にそれによって非常に多くのインセンティブを得ていると考えているという立場です。
  そういった一研究者の立場からきょうお話をさせていただくのですけれども、最初に放言をさせていただきますと、皆さんのお手元の資料にもあります、この日本学術会議から出ているオープンイノベーションに資するオープンサイエンスの在り方に対する提言、私、これには非常に批判的な立場でして、批判の論文も書いています。お手元の資料にありますので、情報管理から出ているものですので御興味のある方はそちらを御覧ください。
  では、お話をさせていただきます。最初に言いたいこと、もう今、最初にも言いましたけれども、このオープンサイエンスの推進、現在の政策の流れ、それから流れというよりもこのオープンサイエンスというこの言葉自体が、少なくとも私の立場から言いますとインセンティブがあります。だから、私はオープンサイエンスを推進するために、というつもりで研究をしているつもりはありませんけれども、結果的に多くのインセンティブを得ています。
  ただし、今の状況でも私個人としては別にそんなに悪い状況ではないとは感じてはいるのですけれども、それなりにそれを面白いと思ってくれている、サイレントマジョリティーとまでは言いません、サイレントマイノリティーがそれなりに我々の研究分野では増えてきていますので、そういった人たちがより積極的に参加できるような、もうそれが顕在するような政策が進んできたらいいなといった希望を、一研究者の立場からは思っています。
  きょうのお話ですが、もうちょっと私自身の研究も含めた自己紹介をさせていただいて、オープンサイエンスといってもこのように本日も資料が大量にあるように、様々な切り口がありますので、きょうの私の流れとしてのオープンサイエンスの流れはここに絞るよという、ある程度フォーカス、スコーピングをした上で、研究者としてこんなインセンティブを受けていますと。で、現状においてどんな問題点を感じているかというお話をさせていただくという流れで、三、四十分ほど時間を頂いていますので、ちょっとゆっくりとお話しさせていただきます。
  まず自己紹介からですけれども、今お話ししたこととほぼ重複なのですけれども、現在、私は農研機構、農業系の研究所が全部がっちゃんこして2年前から始まったところなのですけれども、もともと農業環境技術研究所だったところですが、そこに身を置いていまして、そこの主任研究員。で、私の所属は環境情報基盤研究領域といってちょっと長ったらしいのですけれども、一言でいうとデータベース部門です。研究所あるいはこの組織、農研機構全体のデータベースを扱って、それ自身の研究を行うとともに、機構内における研究推進に協力するといった立場にありますので、この研究、オープンサイエンスの流れの中では、この後もお話ししますけれども、研究データのオープン化というところが私にとっては一番、自身の研究にとってもポジションにとっても興味があるところになります。
  ということで、私自身も様々な農業環境に関わる研究テーマを持っているのですけれども、それのもう一歩引いた基盤的な研究の興味として研究データのオープン化、そしてオープン化されたデータの利用、そしてその横断利用を組み合わせて新しい価値を生み出すといった、そういった興味を持って現在所属において研究に取り組んでおります。
  こちらの方は私のもう一つの肩書、資料にもありますけれども日本ノード、GBIFというのがGlobal Biodiversity Information Facilityという国際機関、これは生物多様性、私の研究テーマの一つでもあるのですけれども、これに関わる世界中の情報をオープン化しようといった、そういった取組を行っているところなのですけれども。そこの活動の日本ノード、ナショナルバイオリソースプロジェクト、日本医療研究開発機構(AMED)の支援を受けている活動なのですけれども、その日本ノードの委員として生物多様性情報のオープン化推進、そしてそれを使った利益研究推進、そういったことに積極的に関わっております。
  こちらウエブサイト、左側の方が国際GBIFのウエブサイトで、右側が日本ノード、JBIF(地球規模生物多様性情報機構日本ノード:Japan Node of Global Biodiversity Information Facility)のウエブサイトです。御興味ある方は後ほど御覧ください。ちょっと下の方が切れてしまっているのですけれども、気にしないでお手元の資料を適宜参照しながら話を聞いてください。
  私自身のちょっとした活動紹介、このスライドはお手元の資料にはないかもしれませんけれども、ここ1年ぐらいでこのオープンデータ、オープンサイエンスをテーマに外でお話ししたというものを挙げています。実はここの御近所、NISTEPでお話をしたり、国際大学高度研究所でお話をしたり、これもまた関連が深いですけれども、SPARC Japan、情報流通協議会の勉強会で国立情報学研究所でお話をしたり、下が切れてしまったのですけれども、またアウエーで土木学会でもこのオープンデータをテーマによそで講演をしました。これがここ1年ぐらいでこれぐらい、それなりの大きなコミュニティでお話をしているということです。
  これもお手元にはないかもしれないのですけれども、私自身はほとんど趣味みたいなものなのですけれども、市民科学、このオープンサイエンスの文脈で語られることもかなり多いのですけれども、この市民科学というものに積極的に取り組んでいまして、ちょっと下が切れてしまっているのですけれども、私自身が一応研究者ということで専門知識は持っているのですけれども、飽くまで地域のボランティアの自然好きのおじさんとして、国立公園に遊びに来た人の案内をするというボランティアを行ったり、その中で自然観察会をマネージしたり、それらのデータを使って研究論文を書いています。
  下が切れてしまってちょっと残念なのですけれども、こんな論文を書いていますよというリファレンスを下には付けました。
  市民科学といってもいろいろな捉え方があるのですけれども、一応サイエンスコミュニティにおいて認められる研究をしているということで、最近この市民科学の研究をしている人間といって、私の、主に日本生態学会で活動しているのですけれども、学会内ではちょっと認識されるようになっています。
  このオープンデータをキーワードにして、研究者としてレビューみたいなものであったり、オピニオンのようなものであったり、そういった論文みたいなものもここ数年、主に日本語で書いています。
  これもオープンデータの話になるのですけれども、オープンサイエンスの一つの潮流として、研究データのオープン化という文脈がありますけれども、それの一つのモデルとしてデータペーパー、恐らく皆さん御存じだと思うのですけれども、サイエンスの研究データそのものをピアレビューのペーパーとして公開するという形が、国内外で、主に海外の方が強いのですけれども、国内でもそういったものを受け入れる雑誌が徐々に増えてきていまして、そこで現時点で7本のデータペーパーを出版しています。このデータペーパーに載ったデータはおのずとデータがオープンデータ、creative commons、CCBYをつけて公開していますので、研究データのオープン化というものを実際に自分で実践しているという言い方もできます。
  ということで、私自身、全くその意識はいまだにないのですけれども、自分自身の興味を追求して自分自身の研究を進めた結果、オープンデータ、オープンサイエンスを体現している人だなといった扱いを受けるようになってきていまして、本日も含めましてこういった場所でお話しする機会も増えてきています。
  というのが私のざっとしたプロファイルなのですけれども、それで、なぜこんなことをやっているのかということを具体的事例を交えてちょっとお話ししていきます。
  このオープンサイエンスの流れ、わざわざこういったものを作ったのは、本日こういった場所ですので、基本的には研究として科学技術政策としてのオープンサイエンスにフォーカスしていると思うのですけれども、オープンサイエンスそのものは別にサイエンスを研究者、アカデミアのものだけではなくて、より市民に一般に広げていこうといった考え方もありまして、それ自身も私自身にとっては興味の一つではあるのですけれども、本日はこの科学技術政策としても実際に動いている、そして本日の資料冒頭の説明でも、やはりそうなんだなと私自身も確認しましたけれども、一応二つの流れ、研究論文のオープンアクセス化、そして研究データのオープンデータ化、この二つをいかにして良い形で国内における科学技術政策として定着させるかという流れであると私は理解していますので、この二つに絞った上できょうのお話は進めさせていただきます。
  まずオープンアクセスに関しては、これは言うまでもなく、この学術リポジトリ、まだ公開はされていませんけれども私の所属している農研機構でもJAIRO Cloudを取り入れて、それで各研究教育機関ではそこで出た研究成果をリポジトリに載せてオープンアクセス化するということを進めています。
  右側、ちょっと事例として出したのが、首都大学東京のJAIROに載っているリポジトリなのですけれども。なぜこれを出したかというと、共同研究の関係で私、首都大の紀要に論文を寄稿しましてこのリポジトリに載せてもらったことがありますので、たまたま事例として出しました。
  これはプレプリント、生物の分野ですとバイオアーカイブが一番強いのですけれども、これはFigshareという外国のNGOでしたか、そこが出している、もともとは論文のフィギュア、図なりをオープン化しようといったリポジトリなのですけれども、リポジトリと言っていいのかな、そこにもプレプリントという形で、まだピアレビューを経てパブリッシュされていない論文を載せるといったことは基本的に無料で可能になっています。
  なぜこれを出したかというと、私ちょうど、今まさにこれを査読中なのですけれども、その学会でお話をして、是非とも学会員だけではなく、多くの人に先に見てもらいたいなといった、そういった内容のオピニオンみたいな論文をここに使って、先にプレプリントとして公開するということを何回かやっていまして、これ、今まさにプレプリントの状態になっているものを一つ持ってきたのですけれども、そういったことを実際自分でやっています。
  これは、またプレプリントの続きなのですけれども、これは先ほどちょっと紹介した、私が参加している生物多様性情報、Global Biodiversity Information Facilityの日本ノードのウエブサイトです。なぜこれを出したかといいますと、つい先週、我々このJBIFでシンポジウムをやって、この生物多様性情報のオープン化を進めるための新しいデータフォーマットが出ましたよといった勉強会というか、シンポジウムを行ったのですけれども、その内容を私、解説論文として講評しまして、それをこのウエブサイトからポストプリント、これはもうパブリッシュされているものなのですけれども、それをポストプリントで最後マニュスクリプトの形で公開することは問題ないということで、現在このJBIFのウエブサイトからポストプリントの公開をしています。御興味ある方はこのJBIFで検索していただくと、一番上のニュースで、ポストプリントを公開しましたという話が出てきます。
  データペーパーの方は、最初の話と重複するのですけれども、様々な学術雑誌、左側が海外のPensoftというパブリッシャーから出ている、Biodiversity Data Journalというもので、右側は日本の私が所属する日本生態学会が出している、Ecological Researchという雑誌のタイトルだけ切り取ってきたのですけれども、それぞれデータペーパーを受け入れていまして、こういった幾つかのパブリッシャーからデータペーパーを発表しまして、その生物多様性のデータになるのですけれども、それをオープン化するということを実際にやっています。
  皆さん御存じだと思いますけれども、データペーパーの下が切れてしまっているので一応ちょっとだけ補足説明をしますと、データペーパーはもうちゃんとピアレビューの論文として扱われますので、Google Scholarのような論文・研究成果を検索するもので普通に引っかかりますし、そのデータを使いましたといった内容で引用されればサイテーションがついて、何回、Google Scholar Citationsみたいなものでもカウントされます。ということで、研究者としても非常に分かりやすい成果になるわけですね。
  で、これはデータはオープンデータにしましたので、この論文のデータですよということを宣言する限り、誰がどこから自由に公開しても何の問題もないわけです。で、英語のデータだとやはり研究者コミュニティ、それも自分の分野に近い分野の人しか使ってもらえないだろうなと考えまして、その論文のデータを公開するウエブサイトを日本語で作りました。その結果それなりにダウンロードもされているわけなのですけれども、実際この研究データのオープン化というものを、自分自身のプラスアルファも含めて私自身進めています。
  ということで、何となく現在オープンサイエンスの流れとしてある活動を、基本的に私、全部一通り自分でやっているんですね。それを、なぜわざわざそんなことをやるのと、別に特命係長みたいな形でオープンサイエンスの流れを推進しろという何か肩書があるわけでもないのになぜそんなことをやるのかというと、やはり私自身が研究を進めていく上で、この世界でやっていく上でメリットがあるからです。インセンティブがあるからです。一体それは何だろうという話をここからしていきます。ここからがむしろ本題ですね。
  で、これ、何かちょっと変なカエルさんも出てきていますけれども、研究者として一体何を求めるかというと、それは研究者自身で、自分自身何がやりたいかということは自分の哲学として決めることだと思うのですけれども、ざっくり皆さん、私も含めて研究者の方はこんな感じだと思います。自分の好きな研究を頑張って、注目されるかっこいい論文を書いて、それで多くの人に読んでもらって、楽しく生きていきたいなと、そんな希望というのは研究者であれば誰もが持っていることかなと思います。
  で、この希望というか哲学に基づいて、オープンアクセスが推進されると一体どんな利点があるか。これは言うまでもないと思いますけれども、まず、ちょっと話が戻りまして、研究者の研究評価、どんな研究をしてきたのかという、一つの、そして重要な評価軸として、どんな論文をどれだけ書いてきたか、そして最近より注目度が高まっているものはどれぐらい引用されたかという情報になります。今このGoogle Scholar Citationsがめちゃくちゃ賢くなって、余り自慢できるものではないのでちょっと解像度は落としてはあるのですけれども、自分の論文の一覧が出てきて、その論文が何回引用されましたと。それをクリックすると一体どの論文が誰に引用されたかといった、自己引きばかりだとそれもすぐばれてしまう状況なわけですが、そういったものがすぐに評価できますし、実際例えば自身の所属における研究業績評価であったり、もしかしたらどこかの大学なり研究所なりに公募なりでアプライするときには、今もうこれの提出が求められます。どれぐらい引用されていますかと。そういうことで研究者の一つの重要な評価の軸になっているわけですね。
  そういうちょっとシビアな話もあるのですけれども、その反面として、やはり自分が書いた論文が全く引用されなかったら、それを科学で具体的には貢献できていないという評価もできるわけで、引用されるということになると実際自分の研究が科学においてコミュニティに貢献できたなという話と、あとはやはり素直にうれしいですよね。ちょっとどや顔できますよね。なので、そのうち数が増えたらこれも高い解像度で皆さんにお示ししようかなと思っているのですけれども。
  で、そうすると、やはりその引用を増やすための努力というものがある程度必要になってきます。ウエブサイトを作ったときにその訪問者数を増やすための技術なんていう本がわっと一時期はやって増えましたけれども、それはある意味同じようなモチベーションがあると思います。当然、注目されるような研究を行って、インパクトファクターの高い雑誌に書くということ。インパクトファクターというのはそれ自体が目的ではありませんけれども、高い雑誌に書くと、多くの人に読んでもらえる機会があるという、それを知るための指標という考え方からすると、やはりインパクトファクターが高い雑誌に書きたいなというのは思います。
  その内容が認められるべき研究を行って、それを論文として講評するのはもちろん、それを知ってもらうための努力が必要になります。そうするとやはりお約束ですけれども、学会やセミナー等で、私こんな論文を書きましたという話を発表して、知ってもらう機会を増やすと。そういったことは当然、昔から皆さんやっていることなのですけれども、最近よくある壁として、ああ、その雑誌うちの大学から取れないんだよね、では読んでください、ってもちろん配ったりはするのですけれども、最近本当に出版の料金が高くなっているというのは、もうこの会でも恐らく何度も議論されていますし、私自身も非常に感じているところではあるのですけれども。私、今の所属、8年目なのですけれども、数年前読めた雑誌が今は読めなくなったなんていうことはざらになっています。
  こういった現状がありまして、では読んでもらうためにはオープンアクセス化した方がもちろんいいわけです。ですけれども、普通にパブリッシャーから出たジャーナルを、最近はオープンアクセスジャーナルというものもありますけれども、一般的なモデルだと基本的には購読料を払わなければいけないと。購読料を払わなくても読んでもらうためには著者の方でオープンアクセスのフィーを払って、それでオープンアクセス化してもらうということが一般的になります。
  これ、つい最近私の共著の論文であった話ですけれども、有名なE社から出ている某雑誌をオープンアクセスにしようと言ったら、日本円で40万円かかりました。それはちょっと大きめなプロジェクトだったのでそのお金は出していただけまして、無事それをオープンアクセスにすることはできましたけれども、論文を頑張って書いてそれをオープン化するために40万円なんていったら、普通の大学の一教員の基礎研究費ぐらいになってしまいますよね。下手すればもっと高いです。それが研究費がすごくあるという、たまたま本件に関してはプロジェクトでお金がかなりあったので、オープンアクセスにすることはできましたけれども、それを毎回できるかというとちょっと現実的ではありません。
  ではどうするかというので、最近研究コミュニティ用のSNSみたいなものも増えていますけれども、それがものすごく違法なものばかりだなどという記事も最近出ていますし、研究者としてはちょっとそれを使いたいと思いながらも、こういったオープンアクセス、そういったオープンデータの研究に身を置いている身としては、そんなアングラなものに手を出すというのは当然はばかられるわけです。
  そこでもうシンプルな解として、このオープンなリポジトリに載せることによって、論文を検索するエンジンにも簡単に引っかかるようになりますので、このリポジトリに自分のポストプリントなりを載せると、多くの人にかなり簡単に読んでもらえるようになって、そうすると結果として引用数も増えて、もしかしたら将来研究費を取るためにも役に立って、みんな幸せになるだろうという。恐らくこの制度を作った方が想像していたものと、そのままの効果が出ているというのが私の考えで、私の実感です。
  これはちょっとおまけです。
  リポジトリが研究論文をオープン化する利点というものはわかったと。では、研究データをオープン化することでどんな利点があるのかという話をしていきます。
  私自身の研究、農業環境という話はしましたけれども、もうちょっと踏み込んで具体的にどんなアプローチで研究をしているかと言いますと、もちろんフィールドワークもやるのですけれども、ここ数年の研究はデータベースワークです。自分自身のデータも含めて、ほかの方、事業、若しくは過去の研究データ、統計データ、そういったものを使ってデータベースを解析して、それで新たな知見を得るというのが私の研究の一つの根幹になっています。
  そうすると、最近オープンデータ、オープンデータという言葉はやはり2013年以降ではありますけれども、それ以前からインターネットには膨大なデータがありました。そのデータを検索するということは、データベース研究者にとって実験やフィールド調査のようなものであり、研究において欠かすことができない最も当たり前で重要な振る舞いということになります。
  例えば、必ずしもオープンデータではないのですけれども、研究利用に関しては自由だということで、ちょっとここから先、特別そこは断りません。国交省から出ている国土数値情報、国土における地図データもこのGIS化されているものが自由に研究利用できるようになっているわけなのですけれども、それを使った論文というものがここ5年ぐらいのもの、ちょっと適当に持ってきただけなのですけれども、私の論文、もうそのデータなしでは成り立たないという論文がかなりあります。
  また、今、口でぽろっと言いましたけれども、政府情報、国が行っている国勢調査をはじめとする統計情報、これも一個人では絶対得られないような規模のデータが、国の事業として全国を網羅するような形で様々な統計が取られています。この統計情報という、一種のビッグデータと言ってもいいかもしれませんが、それを解析して研究をするというのも私にとって非常に重要なものでして、その統計情報、政府統計がなかったら成り立たなかったという研究の例、内容は触れませんけれども、それがすごく私の研究において重要だということは強調させていただきます。
  せっかくなのでちょっと一つだけ、私の研究の具体的な紹介をします。これは何かと言いますと、農業環境において、皆さんもニュース等で耳にしたことはあると思います。最近、耕作放棄、農地だけれど耕作、農業を行わない土地というものが急増しています。日本の農地の10%は現在放棄されています。その裏側として、近代化農業、機械化、大規模化を進めるために圃場(ほじょう)整備というものはもうこの半世紀近く日本中で進められてきました。ただし、単位面積当たりの収量が増加し、労力はすごく削減された代わりに、その地域における生物多様性が減少しているなんていう話、外来生物が増えているなんていう話、皆さん一度ぐらいは耳にしたことがあると思います。
  だけど、それはローカルな話では、お話としてはごく当たり前に一般社会に受け入れられているのですけれども、本当に全国で起こっているのかといったマクロ的な研究を行ったのが私の研究でして、これ、並べてあるのは地図だけなのですけれども、真ん中の地図が、全国における全国的に絶滅の危機に瀕(ひん)している植物の分布、23種類の分布データ、これを環境省のデータベースから借りてきました。左上の地図が、日本全国の圃場整備率、近代化農業のために土地を改良されている場所の分布地図、これを農水省の統計から持ってきました。右下の地図は、日本全国において耕作が放棄されている場所がどこにあるかという地図、これは農水省の統計から持ってきました。
  こういった全国的な地図を等規格化して重ね合わせたところ、圃場整備地と絶滅危惧植物と全国的に完全に分布が排他していること、つまり、圃場整備されると絶滅危惧植物がいなくなるということ、その裏側、耕作放棄地と絶滅危惧植物の分布は完全に重複していること、これが全国スケールで示すことができたといった、ここ数年の私の研究でかなりインパクトがあった研究なのですけれども、こういった研究を行いました。
  ともかく、これ、日本全国の調査を個人研究グループ、我々の組織全部をもってもなかなかできないと思います。統計情報というなかなか個人では得られないようなデータを使うことで、今まで行えなかったような新しい研究ができるといったことは実感というかイメージしていただけたかなと思います。
  ということで、このデータベース、オープンデータ政策が推進されて、様々な統計情報をはじめとするデータが自由に使えるようになるということは、我々データベース研究者にとって新しい調査フィールド、未開の地、誰も研究していないフィールドを見つけた、ぐらいのものでして、非常に喜ばしいというのが素直な感想になります。
  とはいえ、そのデータができたからその分野、私のようなアプローチをする研究者がどっと増えたかというと、かなり増えたと思いますが必ずしもそうではありません。それはなぜかというと、例えばPDFから、オープンデータですよ、PDFです、OCRできません、もうそうしたらアナログにそれを読んでデータをエクセルにぽちぽち抜き出すなんていう作業をしなければいけません。そして細かくはお話ししませんが、去年あたりすごく話題になった「ネ申エクセル」、GodExcel問題であったり、あとはインターネットにある情報というものは本当にそれが信頼できるのかと、その辺の酔っぱらっているおっちゃんが適当に書いた内容ではないかといった信頼性の問題もあります。あとはインターネット上にあるデータ、データは手に入れたけれども内容がわかりません、このフォーマットは何ですか、私のパソコンでは開けませんなんていう、内容もファイルもレガシーなデータ、そんなものが大量にあります。なので、それを研究データとして使えるようにどう整理していくか、マネージメントしていくかということ自体が一つの職人芸みたいな状態なんですね。
  ちょっと下が切れてしまっているのですけれども、私の身を置いている環境科学の分野においては、そういうインターネットのデータベース利用研究というものが広がりつつも、その巨大データをどうやって管理していくかという技術的な部分がもう本当に職人技状態で、もうその基本的なマニュアルといったら何ですけれども、方法論も全然確立していなくて、もうみんなが血を吐く思いをして自分で修業をしていくしかないといった現状があるよといった指摘もしました。
  となると、様々な研究データ、もうちょっとこれは研究者目線なのですけれども、ほかの人たちが科学的な近い分野の人なり、研究者なり、専門家がまとめたデータ基盤というものが今設計されているという話を耳にしました。そういった情報の中で、例えば検索して自分の同じ分野、近い分野、自分が興味ある分野の研究データを検索してそれが自由に使えるようになるという話になったら、私としてはライバルがものすごく増えて大変という面もありますけれども、データベース研究というものがわっと広がるであろうという期待はあります。
  そうすると、そのデータ管理の技術が不要になることはないとは思いますけれども、それが壁になってなかなか参入できなかった方たちもどんどん入ってくるでしょうし、私自身も研究の全部のエフォートを100とした場合、データマネージメントに多分70%から80%ぐらい取られていると思います。そこがなくなったら、今の3倍、4倍で論文を書けるようになるかもしれないなという。
  ともかくこの研究データのオープン化というものがどんどん進んで、それの比較的ワンストップというか、ポータルみたいなものが出来上がって、そこから手に入るよということが本当に進んだ場合には、もう私にとってはメリットしかないなと考えます。
  だけど、ではそれをみんながデータを公開するかというのが、先ほど資料をざっと見せていただきましたけれども、これが恐らく皆さんにとっても課題であり気になっているところだと思います。いい話というのは転がっていますけれども、本当か?  という面もあるかと思いますので、私自身がこのデータを積極的に公開していく上でこんな利点がありましたよということを紹介していきます。
  これはスイカ泥棒の絵ですけれども、データのオープン化をしていったら、せっかくそのデータを使って論文を書いた人がものすごく目覚ましい成果だとしたら、データのプロバイダーの方が全然フィーチャーされない、そんなこともあるのではないかといった話、先ほどの資料にも言及されていました。おいしい成果も持っていかれちゃったら駄目なんじゃない?  自分でおいしいところを全部しゃぶり尽くしてからの方がいいんじゃない?  という話は私も所属で言われることはよくあります。
  それはそのとおりだと思います。基本的にはやはり自分でまず使ってからですね。使ってという表現は余り良くないかもしれませんけれども、自分で論文を書いて、その上でそのデータを公開するというのが基本的な筋だと思います。もちろん最近、論文を公表する段階でデータをリポジトリに載せることを求めるということはありますけれども、基本的にはその論文がアクセプトされてパブリッシュされるまではエンバーゴとして公開されないというのは基本的には守られていると思いますので、基本的にはやはりデータは研究者として論文を書くということはやはり絶対やらなければいけないことですので、データを集めているだけで研究者ですというのはやはり違うだろうと思います。その点からやはり論文発表をしっかりした上でデータを公開しましょうと。
  で、もう論文を書くことを前提とした場合、自分で同じデータを使って2本、3本と論文を書くことってそんなにないだろうなと思うんですよね。で、プロジェクトが終わりました、報告書も出しました、ではそのデータを引っ張り出してもう1回やろうということ、ないとは言いませんけれども誰もがやるかと言ったらそれはかなりマイノリティーなのではないかなというのが、私が周りを見ていての実感です。ただし、そのデータを先ほどの話のように、見つけやすいような場所に公開することによって、それを使って誰かが新しい研究を行ってくれるということになったら、それ自体は間接的ですが科学への貢献にもなります。
  また他方で、その論文を書いた後、もう実験をしたとき、野外調査をしたとき、自分が取ったデータを余すことなく全て自分の論文に使っているということはまずありません。下手すれば1/10、1/100ということもあるでしょう。発見的なものだったら、1万取ったデータのうち1しか論文にならなかったといったことも普通にあり得ると思います。
  また、研究を進める上で様々な副産物が生まれることがあります。私の身近な例で言いますと、最近私、ドローンをちょっと面白いから使い始めているのですけれども、ドローンでいろいろなところの写真を撮ったとしても、結局それを使うとしたら、私は生物学者ですので自分の対象種がいた場所の画像だけということが当たり前で、次いでだから撮った周りの写真なんて全然使いません。そういったデータをオープンに、研究者が撮ったそれなりに方法も担保されたものとして公開していくと、もしかしたらそれを誰かが欲しがっているかもしれないといったことは十分に考えられるということが、まず、きれいごとかもしれませんけれども、私自身が研究データを公開していく一つのモチベーションではあります。
  それをなぜやるかというと、やはり自分自身が将来的に、自分のところにブーメランの絵を持ってきていますけれども、返ってきてインセンティブ、それかメリットを享受できるということが実は結構あるからなんですね。
  これは先ほど紹介した統計情報、圃場整備の地図であったり、時系列の農地利用の変化であったり、耕作放棄の地図であったり、そのデータをこの日本語のウエブサイトで公開したというお話をしました。これというものは、先ほど私の研究として紹介した絶滅危惧植物の分布がどんな関係がありますかという研究で使ったのですけれども、そこの裏には血を吐くようなデータマネージメントの苦労がありまして、元はこれ、ってちょっと小さくて申し訳ないのですけれども、いわゆる典型的、神エクセルでした。要するに人間が読むという点にすごく特化していて、セル結合であったり、謎のフィールドが大量にあったりして、csvにしたらがっちゃがっちゃにレイアウトが崩れるというあれですね。それを血を吐くような思いをして数百枚のデータをパースして、それで規格化して地図データを作るといった作業をして、それをオープンデータとして公開しました。これはデータペーパーとして公開したという面もあるのですけれども。
  そうしたら、もうそれを公開してから1か月だか2か月後ぐらいに、もうすぐにそれを使った研究というのが出てきたんですね。残念ながらというか、まだ論文になったという連絡は受けてはいないのですけれども、あれを出したちょっと後にとある学会に行ったら、あ、大澤さんですか、あのデータのお陰で研究が進みました、なんてすごく親しく話しかけてくれる方がお二方ほどいらっしゃいまして、それで私自身もすごくうれしかったので、許可をもらってポスターの写真を撮らせていただいたのですけれども、ちょっと内容は御紹介できないのですけれども、この下に何が書いてあるかというと、そのデータペーパーを引用してこのデータを使いました、ってacknowledgementみたいな形で書いてくれているのですけれども、これが論文になるときは当然私のデータペーパーを引用した上でその論文を発表することになりますので、私は引用も増えます。ということで、これがきっかけになってそこのボスともお知り合いになる機会、これをやっていたのは学生さんだったのですけれども、そのボスともお話をする機会が得られまして、それで今共同研究が、ちょっと詳しいお話はできませんけれども、進んでいます。
  新しい研究における出会いが生まれて、で、その方は、私自身ももしかしたらこんな使い方ができるかもな、と想定はしましたけれども、私自身が専門ではない分野の方だったので、私自身の研究の幅を広げるという非常に良い出会いを得ることができました。
  これが研究者個人としてのメリットなのですけれども、この私の所属、今の立場においても実はものすごいメリット、インセンティブを得ることができました。これは私がデータペーパーというか、オープンデータの話を、オープンデータ憲章以前からやっていました。そのデータベースを、インターネット上から得られるデータを使った研究を進めていたという意味なのですけれども、わざわざそんなデータベースを作って、ちょっとこれ変な絵を持ってきましたけれども、その内容はすばらしい、是非やってくれ、と所属が言っていたかというとそんなことは全くありません。飽くまで研究のメソッドなので、こういう方法でこういう研究をやりますなんていうことは、もう上司には言う必要がないというか、言っても無駄でしたし、インターネットで遊びよってそんな暇があったら圃場へ行け、ぐらいのことを言われていたというのが、私が今の所属にいた10年弱前の感想です。なのですけれども、だんだん時代が追い付いてきたどころか、時代に追い越されたぐらいの実感があります。
  まず身近な話として、私の所属がデータベース部門という話をしました。データベース、いっぱい宝箱持っています、では当然公的研究機関として良い姿ではありませんので、こんなデータを持って皆さんに還元しますといった活動が求められます。今もそういったものは多いですけれども、当時やはり唯一の方法としてあったのがいわゆるウエブサイトを作って情報発信をするといった活動だったんですね。これ、今は全て公開停止されているけれども、かつてうちの研究所で公開されていたウエブサイト、かつ私が管理していたというものの一部です。もう何個作ればいいんだ、という状態で、しかも管理もものすごく大変でしんどかったんですけれども、この問題が顕在化したのはつい最近なのですけれども、研究成果というのはもう公表済みということで、引用すれば基本的にはもう誰でも自由にと言ったら何ですけれども、使える状態になる情報になります。
  また、研究開発の一つのまとめ方として特許を取るというやり方があります。それを使うためには特許利用料を払ったり、そのルールに従って利用してもらうといった形でインセンティブを得ます。
  また、ちょっとそれに類似したものとして職務発明プログラムみたいなものがあって、研究を推進する上で新しい知見、技術が開発できたので、これをこういうルールに従って使ってくださいと、私が作った技術をこれだけ使われましたという、少なくとも所属内における評価につながるといったインセンティブが得られました。
  それに対して、ああいったウエブサイトを作った、データベースを作った、それをどうやって評価しましょう、どうやって利用権を作りましょうと、明確なルールはなかったんですね。もちろんポリシーなんていうものをどこかのウエブサイトを見よう見まねで書いたりはしましたけれども、公開するというだけは、それはポリシーではなくて、それを利用するそのときに別に論文があるわけでもないし、このウエブサイトを使いましたというのをトレースする仕組みがあるわけでもないし、実はすごく、今振り返ってみると脆弱(ぜいじゃく)な基盤の中で研究というか、情報公開をしていたなという実感があります。
  そんな中でこのあたりはもう釈迦(しゃか)に説法なので簡単に飛ばしますけれども、オープンデータ憲章ができて、基本的には公的研究機関を含めた公的データをオープンにしましょうという大きな流れができて、そしてもう法律ができて、我々公的機関の研究データ、もっと踏み込んで農業に関わる様々なデータのオープン化を推進しましょうという政府の方針ができたわけですね。
  それで、ではデータ交換のルールはどうしましょうという話で、先ほどの資料にcreative commonsはあるけれども、データの使い方は、データ自体には著作権がないからどう扱ったらいいかといった議論はありましたけれども、データベース、ある程度何かしら哲学を持った上でデータをまとめたものに関しては、もうそれは著作物とみなされるということは、たしか判例も幾つかありましたし、業界というか我々の考える中ではそれが当たり前というふうに受け入れられていますので、creative commonsを付けることによってこのアクセスコントロールみたいなこともできるという、そういった具体的な指針ができあがったという点で業務上にメリットがありました。そういったことはがちゃがちゃっとここ数年で起こった結果、何が起こったかといいますと、これ、我々の研究所の年度計画、平成29年度こんな研究をしますよ、という、ちょっと役人語で書かれている、余り具体的なものではないのですけれども、その中に「オープン化に向けて、~必要なライセンスの選択など~」というそのデータベースをどうやって推進していくかという明確なものは、もう絶対クリアしなければいけない文言として入りました。
  こういった文言が入ったことで何が起こったかというと、この研究データのオープン化、情報流通推進に関する、それを主眼に置いた研究プロジェクト、所内プロジェクトが立ち上がりました。で、私は今、そのプロジェクトのリーダーという立場にあります。
  それで、それが全てではないのですけれども、何ができたかというと、我々の所属する農業環境変動研究センターですけれども、研究データをオープン化するためのカタログサイトというものをつくって、ここに載せたデータはもうオープンデータにしましょうという方針が具体的に進んでいます。
  では、そのオープンデータにするためにはどんな手続、技術が必要なのかということをまとめるということが、私のプロジェクトの今年のミッションでして、これはまだβ版なのですけれども、来年の3月にはこのカタログサイト、NIAES VICというのですけれども、農研機構のウエブサイトからアクセスできるカタログサイトから、研究データのオープン化に向けたガイドラインというのですけれども、ガイドラインはちょっと固過ぎるからもうちょっと柔らかくしろとか、今いろいろ言われているところではあるのですけれども。冒頭に紹介したような、私や私の同僚も含めた研究成果をオープンにするためにはどうしたらいいのか、どんなデータをオープンにしたらいいのか、こうやればオープンデータとしてデータペーパーが書けるよみたいな内容をわかりやすくまとめた、いわゆるマニュアルを公開するという、それを我々の研究グループのミッションとして行い、これ自体をオープン化するということが業務としてできるようになりました。
  ということで、個人的な研究推進、そして業務としての、研究所に身を置くものとしての業務としてもそれがオーソライズされて堂々とできるようになったというのが、私にとってのインセンティブであり、現在享受しているメリットであり、もう現時点でかなり幸せというか、やりやすくなったなというのが素直な感想になります。
  最後にちょっと問題点と言いますか、きょうこの後の議論のテーマというか、になり得る投げかけとして幾つか、現在私が感じていることをお話しさせていただきます。で、私の話を聞いて、ああ、いい話だな、と思ったかもしれませんけれども、でも私はものすごくマイノリティーです。95%の研究者、といっても私がつき合いがある環境科学の分野と考えていただければいいと思うのですけれども、95%の研究者の態度はやはりこんな感じです。なぜ私のデータを公開しなければいけないのだ、ふざけるな、という方と、あとはもうフリーライダーというやつですね、人のデータを使う、オープンデータどんどん出して、でも俺は出さないけどね、お前ら出せと。こういうハイエナみたいな、というとちょっとかなり表現は悪いですけれども、それが95%の考え方です。
  それはなぜかというと、先ほどの資料にもちらっとありましたけれども、研究データはそれが原資は税金であろうが交付金であろうが何であろうが、研究データは研究者の個人の資産だというふうに考えるというのが、研究業界における文化、文化っていろいろな意味がありますけれども、当たり前の振る舞いというふうにこれまでずっと思われてきていると。で、もうその考え方でずっと来ている人が突然その考え方を、やはり公金ベースだからそれは公開しなさいよ、と言われても、いや、俺はもう30年このやり方でやってきたのだ、というような話になってしまうというのは、自然と言ったら私としては非常に苦々しいのですけれども想像はできるというのが現状になります。
  多くの研究者、特にベテランの方が多いのですけれども、研究データは個人の資産であると考えるのがごく当たり前です。で、残念ながらと言ったら何ですけれども、国際的な話も、先ほどの資料にもありましたけれども、論文、学会によっても結構近いセンスなものがあります。徐々にCiNii、J-STAGEの推進によって変わってきてはいますけれども、今でも学会員しか論文は読めない、PDFは発行しない、冊子体のみ学会員のみに配付するといった学会は少なからず存在しています。
  これに関連するような現状として、終わったプロジェクトのデータはプロジェクトの終了とともに行方不明になります。で、リタイアした研究者の積み重ねてきたデータというものはリタイアとともに行方不明になります。個人の資産と考えているからですね。
  で、それに対してと言ったら何ですけれども、5%の研究者、この5%に最近なってすごくよかったなと思うのが実感で、つい5年ぐらい前は0.1%でした。この私の話を聞いて感化された人もぽつぽつはいると思うのですけれども、やはり研究者は公的な、少なくとも公的研究機関や公立大学に身を置く方々はやはり研究データ、研究成果のオープン化をやるべきだと、でもそれをどうしたらいいのかわからないなという声、それを具体的に聞いてくる方、最近、私こういう話をすると、もう話が終わった後にわっと人が寄ってきて、この話を聞いてくるという方、結構います。サイレントマジョリティーってそろそろ言ってもいいかもしれません。だけど、そのちゃんとしたルール、手続がオーソライズされた形で出てこないとなかなかできないなという、非常に真面目な方が多いです。
  その中の1%ぐらいが、道がないなら道を作ってやるぜという、私を含めたちょっとのりのりの頭がおかしい人たちも何人かはいるのですけれども、やはりそういう真面目というか、多くの人たちがこの危ない人たちに一緒についていこうというのはなかなか難しいですし、だから私も先ほどのデータペーパーであったり、具体例を提示すると、前例といったらちょっと申し訳ないのですけれども、あ、そういうやり方をすればいいんだ、私もやります、という方がすごく増えたのは、やはり私が具体的な事例を積み重ねて複数出してきたからだなというのは実感としてあります。
  この研究データの扱いに関して、これまで、やはり先ほどの個人の資産という部分とも切っても切り離せないのですけれども、どう扱うかというものに関して基本的に無頓着というのが、これまで長い研究者の歴史というか文化だったというのが現状だと思います。それは、もうトップダウン的な話でもありまして、科研費であったり、ちょっと最近は科学技術振興機構絡みの研究費に関してはデータマネージメントプランの提出を義務ではないけれども推奨するという話をちょっと小耳に挟みましたけれども、研究プロジェクトが終わった後、どんなことが起こるのか、どんなデータが集まるのかという話が議論に乗ってきたのもつい最近かなと思います。科研費の調書、変わりましたけれども、現状はあったとしても、その研究の起こす波及効果という文章をぴろっと書くだけですよね。そのデータがどうなるのかということを書く欄はありませんし、書いたとしてもそれを審査員が評価するでしょうか。なかなかしないのではないかなと想像します。
  これが当たり前の振る舞いでしたので、ではそのデータをどうやって扱いましょうというルール化も遅く、と書いていますけれども、ないのが現状かなという気がします。なので、そういうルール化、前例というか基本的なやり方、フローチャートみたいなものが存在していないので、先ほどのように研究データをオープン化、研究成果をオープン化しなければいけないけれどもどうしたらいいのかなというサイレントマジョリティーを拾うことはできていない、というのが現状と思います。
  で、最後、おいコラ言う人は、私を含めてぽつぽつ出てきてはいますけれども、それが研究コミュニティ全体を飲み込むような流れになっているかというと、まだまだその段階には至っていないと思います。
  これは私からの個人的なメッセージとして前置きをした上で、このがちがちの制度化というのがされると、やはり研究に関しては自由にやりたいというのは偽らざる本音なので、それをがちがちに制度化されるとうれしくはないのですけれども、少なくともオープンデータの法整備、研究データをオープン化、これを集中取組期間で思い切り集中して取り組みましょうということが公的にトップダウン的に明示されたということは、私にとっては非常に助かったというか、うれしく、自分自身の活動がしやすくなりました。
  というのは、私、研究データ、オープンデータを出しています、いいでしょう、と言っても、お前、それが好きだからやっているんだろう、と言われたときに、いや、これは国際的な流れでもう国の方針としてもありますよ、という前置きをするだけで、やはり学会、研究コミュニティにおいてその受けというか、受け入れられ方が全然違います。
  なので、これは具体的にこうして欲しいとまでは言いませんけれども、既存の研究コミュニティや研究者の考え方というものは尊重しつつも、それがうまく乗りやすくなるような政策というものがトップダウン的に推進されると、より広がるのではないかなと、少なくとも4%ぐらいいるであろうサイレントマジョリティーの方たちは乗ってきてくれるだろうというふうに考えます。
  具体的というか、思いつきレベルではあるのですけれども、例えば一定規模の科研費においてはデータマネージメントプランをまずは推奨すると。それをちゃんと作ることが審査の上でプラスになるよ、みたいなことを書くようになったら、これ、変な言い方なのですけれども、これがネガティブなインセンティブを与えるか、ポジティブなインセンティブを与えるかという文言を先ほど資料で見ました。これは考え方によるとネガティブなインセンティブ、それをつけないと科研費が通らないよという、ネガティブなように見えるのですけれども、我々、それを当たり前にやってきているマイノリティーの人間にとっては、それはポジティブに働くんですね。ああ、そんなの当たり前だと。ではどうやったらいいですか、というふうに我々のところに、これは妄想ですけれども、様々な方から共同研究や、ちょっといろいろ教えてくれという話が舞い込んでくるだろうと。
  つまり、ポジティブなインセンティブ、ネガティブなインセンティブが同時に発生し得るということが起こるのではないかなという、そんな妄想をしました。
  これがまとめで、無理やりまとめるとこれだけなのですけれども、オープンサイエンス政策、現在の流れというものは、研究者にも少なくとも一見インセンティブをもたらし得ると。少なくとも私はインセンティブを受けていると感じています。
  ただし、この考え方自体は、もう旧来の歴史的といいますか、これまでの考え方と大分変わる部分があるので、その浸透にはかなり時間がかかっていると。
  それを考えると、ただし徐々に増えてきている興味を持っている人たちを拾いつつ、今の流れというものを潰さないようなそのさじ加減は非常に難しいのですけれども、トップダウンの動きというものがないと恐らく広がらないし、それはあってもいいのではないかなというのが、インセンティブを受けている私からの個人的な感想というか、考え方です。
  以上になります。御清聴ありがとうございました。
【喜連川主査】    大変ありがとうございました。それではここで議論をしたいと思います。御質問がある方、いかがでしょうか。
【辻委員】    貴重なお話、どうもありがとうございました。大澤先生のお話の中で、御自身はもうどんどんオープン化を進めてこられたと、かつ、職場の中にもきちんとそういうグループが出来上がったということで、非常に成功事例ということで御説明頂いたかと思います。
  御説明の中で、最後のまとめにもございましたけれども、課題としてあるところが、研究データは個人のものというマインドに起因するのではないかという御指摘だったのですけれども、少しお話を伺っていて思いましたのが、例えばインセンティブは研究者にとってあるよと、すごくそれを御自身がお感じになられていてやっているよとおっしゃっている反面、実はそのインセンティブとトレードオフになるであろうコスト面、御説明の中でデータマネージメントのところで7、80パーセントぐらい、実は稼働がかかっていたりするよという御説明もあったのですけれども、そのコストと言っている中には稼働も含めてのコストだと思っておりまして、そういうオープンデータにするために、ちゃんと使えるものにするために、見せていけるようにするために、というところにかかる稼働面というのをどのようにお考えになられているのかというところをお伺いできたらと思いました。と言いますのも、恐らくその職場までは広がったのだけれども、この次、そのコミュニティ、あるいは学会といったところに広がっていかせるためには、コスト面のお話がどうしても引っ掛かってくるのかなと思いまして、お伺いしている次第です。お願いいたします。
【大澤農研機構主任研究員】    御質問ありがとうございます。非常に重要な観点でして、理想論を申し上げますと、そのデータマネージメントをやる専門職が必要だと考えています。で、必ずしも現実的ではないというのはわかっていますので、これは飽くまで私が最近提案した話なのですけれども、先日、先ほど冒頭に紹介したSPARC Japan、図書館業界の方々の前でお話をする機会がありまして、その図書館のライブラリアンがデータポータルというか、研究成果のリポジトリの管理だけではなく、データのマネージメントもできないかといった議論が出ていましたので、もしもそれができたら、それは理想的だよね、という話をしたら、全員が乗ってきたとは言いませんけれども非常に興味を持ってくれた方々というのがいましたので、まずまとめますと、そこのコストは無視できない、それを全部研究者が担おうという話になったら確かにコストベネフィットが悪くなってしまうかもしれないので、そのポジションというかデータマネージャーが必要だろうと。で、それはもしかしたら夢物語ではなくて、現在存在している職務でうまく当てはめることができないかなというのが私の提案としてあるというところです。
【辻委員】    例えばそれが分野別に必要であろうという御指摘と捉えてよろしいでしょうか。
【大澤農研機構主任研究員】    分野別ではなくて、そのライブラリアンが出てきたのは。
【辻委員】    ライブラリアンの方で。
【大澤農研機構主任研究員】    分野をうまく包含できるインフォメーションマネージャーみたいな立場ができたらいいし、それが理想的だなというのが現状の考え方で、各分野でそれを置くというのはなかなか難しいだろうと思います。
【辻委員】    貴重な御意見、どうもありがとうございました。
【喜連川主査】    ほかに。先生、はい。
【安藤委員】    私もすばらしいお話を伺った気がしました。米国でその論文が公的な研究費を使った場合にはもうオープンに論文は開かなくてはいけないということで、ずっと広がりを見せたのがきっかけだったように思うのですけれども、データまで来たと。学術会議もそういうのを出しまして、あれしたけれども、ここまで研究者の心理から、最終的な効果までまとめてお話を伺えたのは初めてだったもので。
  それで、分野ごとに文化と環境が違うという話と、研究者個人のインセンティブという話と、オープンデータといってもまだ距離がある話題と最初はお聞きしていましたが、例えば、ICSUとISSCの総会では(いろいろな学協会の集まりとしてのユニオンや、130ほどの国の学術会議とかが集まるCouncilの総会:現在は組織統合)、データの貴重さ、標準化というのが叫ばれていて、CODATA、データは皆の財産でシェアしようという意味のCODATAのアクティビティはものすごく勢いが出てきています。
  例えばその中でも、ディザスター・マネジメントのデータという意味で、当然ですけれども地震関係では日本にはあふれるほど貴重なデータがあって、世界中でそれを見たいという要求があって、この財産をどうやってオープンにしていくかという話がすごく話題になっています。そういう世界の動きと、今おっしゃったことは、非常にぴったりしているという気がしました。
  それでデータの共有が最終的にうまくいくのは、データ作成の研究者がインセンティブを持てるかが重要な要素ということですね。実はオープンサイエンスの進展では学協会が自分の存在意義を問われているところがあるんですね。先ほど言ったように、インターネットの上にあるデータの正しいデータといい加減なデータの区別というのが重要で、学会の存在価値というのはその認証を与えることにあるのかなと思います。昔、学会の出版物に論文・資料という名前を使ったことがありますが、資料というのはまさにデータで、公開に値する重要さを表していると思って、今のお話に非常に感銘を受けました。
  それから、これは非常に個人ごとではあるのですけれども、先ほどおっしゃった、プロジェクトを終わった後にこのデータを次に、誰か使ってくれるかな、という思いは多くの研究者が感じていることです。特に、自身が定年退職などをするときにはファイルを全部捨てるわけですね。このデータは誰も使わないだろうなという判断をして捨てるわけです。移動体通信の分野などでいうと、その環境における伝搬のデータはそのものが貴重で、名前付きで使いまわされ勲章のようになった例もあるのですけれども、ほとんどは人に見せないで終わっているというのを思いますと、今のお話は全く同感と感じました。
  感謝をするコメントで質問ではありませんが、ありがとうございました。
【大澤農研機構主任研究員】    ありがとうございます。
【喜連川主査】    では、ほかに御意見ありますか。はい。
【岡部委員】    御経験に基づくリアルな話を伺って、非常に参考になりました。先生の分野に関してで結構なのですが、データというのは、神エクセルの話もありましたように、データのフォーマットによって使い勝手がよかったり悪かったり、で、全く新しい分野の場合にはそもそもそうやってデータを交換するためのフォーマットがどうあるべきかというところも固まっていないし、あるいはデータだけもらっても実はそれにいろいろな背景というか文書がついていないと役に立たないということもありますよね。さらに、場合によってはそのデータを扱うソフトウエアみたいなものも一緒についてこないと、実際には使いものにならないということって多分あると思うのですが、そういうことについて先生はどういうふうにお考えでしょうか。
【大澤農研機構主任研究員】    我々の分野、環境科学というか、もう少し絞って生物多様性の分野ですと、紹介しましたGlobal Biodiversity Information Facilityというところが国際フォーマットを提案しているんですね。それは私たちにとっては非常にいいことで、こういうことを言ったら何ですけれども、研究者も特に日本人は権威に弱いみたいなところがあって、あとは、それはどうしても研究者というのは我が強い方がいるので、よし標準を作ろうと円卓会議を始めると、みんな俺についてこい、と言っていろいろな標準候補が乱立してしまうといった状況が我々の分野にもありました。
  なので、その中で国際的なある程度オーソライズされたものができたということで、ではもうこれに従おうぜ、ということが提案できましたので、それには今言及されたようないわゆるメタデータ、これはこういったデータだよ、というそういった説明書きもつけて、これに従ってこういう記述をしなさいというものができたというのは、我々の分野がぐっととまでは言いませんけれども、データ共有がかなり進んだ一つの大きな要因にはなります。
  なので、各分野でもしかしたらそれは必要になるかなと思います。
【岡部委員】    いや、まさにそういうアクティビティで日本が遅れているところは問題ではないか、要するに標準化のプロセスに関われないでいるというところで、それだけでも後で随分ハンデになってしまうと思うんですよね。
  先生の分野はもう国際標準化はもう何年か前に行われたということですね。多分その良い経験を生かしつつ、日本のアクティビティもちゃんとそういうところに関わっていけるようにということを考えていかないといけないかなと思いました。
【大澤農研機構主任研究員】    なので、もう少し補足しますと、その国際標準という名前のものが出ても、それを日本に持ってくる人がしばらくいなかったので、その標準というものが提案されてから日本にそれがある程度入ってきて広がるまでというと、やはり10年ぐらいかかっているかなという印象があります。
【竹内委員】    大変興味深いお話をありがとうございました。御発表の最後の方で、図書館員がデータマネージメントに関わることが理想的だという御発言がございました。このような話は以前からあって、図書館員にデータマネージメントをやってほしいということなのですけれども、図書館員が「ではやりましょう」と言えば一般的に広くコンセンサスが得られるかもしれないのですが、具体的に何をやれば図書館員がデータマネージャーとして機能するのかということについては関係者間で共通理解が得られていないと思います。この点について大澤先生のお考えをお話しいただけないでしょうか。
【大澤農研機構主任研究員】    すごく乱暴な答えになりますけれども、NIIからJAIRO Cloudが出ていますね。同じようにデータ基盤が恐らく出ます。もうそこに載せるというものが恒常業務になって、そこにどんな形でデータを載せるかというのはある程度分野任せと言いますか、その研究者任せになるとは思うのですけれども、そのリポジトリに関しては図書館情報学の歴史もあって、もうしっかりとしたメタデータフォーマットも出来上がっているという部分で、そこにもちろん差異はあるとは思うのですけれども、その部分、フォーマッティングの話はどうしても逃げられないので、そこをどう吸収するかという部分にもう問題は絞られているのではないかなというのが私の考えです。
【竹内委員】    ありがとうございました。
【喜連川主査】    先生、どうぞ。
【逸村委員】    お話のありました、おいコラ側の感想でもがちがちの制度化はうれしくないというのは何か具体的な、あるいは、こういう考え方みたいなものはございますでしょうか。
【大澤農研機構主任研究員】    単純に言いますと、データは必ず公開しなさい、その分量は全部です、ということになると、もちろん分野によって個人情報うんぬんとかそういった細かい条件が様々に出てくると、ではうちもこういう話があるよ、となってきてすごく不毛な話になってきてしまうので、だから絶対出せというものではなくて、まずは推奨でもいいかなというぐらいですかね。
【逸村委員】    ありがとうございます。
【喜連川主査】    では、家先生、お願いします。
【家委員】    ありがとうございました。大変具体的なお話だったので、同じようなことをお伺いすることになるかと思うのですけれども、データを公開するときに、メタデータが非常に大事ですけれども、そこでメタデータを付けるというところにほとんどのレイバーコストが掛かると思うのですけれども、そこは研究者がやるのか、そのデータマネージャーがやるのかという、その辺はいかがでしょうか。
【大澤農研機構主任研究員】    これは研究者がやるべきです。
【家委員】    研究者がやるしかないですよね。そうすると、余り研究者にとってレイバーコストの削減にならないのではないかという気もするのですが。
【大澤農研機構主任研究員】    メタデータぐらいはつけろよという感じが。論文を書くよりは楽ですし、極端な話、論文に使ったデータをそのまま公開する場合はそのアブストラクト、サマリーを付けるだけでも。
【家委員】    いや、論文の段階まで達したものについてはもちろんそれで結構なのですけれども、今の問題は、論文として使わなかったものについて一つ一つにメタデータをちゃんと付けてやらないとデータとしてはほかの人が使いようがないものになってしまいますね、ということです。
  そのことともう一つは、そのデータを公開する場合に、本当の一次データと言いますか、生データを公開するのか、ある程度解析をした二次データを公開しているのかという、その辺はどうでしょうか。
【大澤農研機構主任研究員】    それを完全に一般化するのはまず難しいとは思うのですけれども、私の自身の経験からしますと、全く論文にならなかった死蔵データというのはなかなか扱いが難しい面もあるとは思うのですけれども、その論文を書くために使ったデータというのは、そのプロジェクト、調査の中のごく一部だと思いますので、それを論文になったものを包含するデータという形でメタデータを作るのであれば、それぐらいはやってほしいし、そんなに手間ではないだろうなというのが私の考えであり、私自身が実践しているところです。
【家委員】    分野によっても違うのかもしれないのですが。
【大澤農研機構主任研究員】    そうです。一次データ、二次データに関しても同じでして、もうその一次データを出すべきだというのが基本的な話になると思うのですけれども、例えば画像解析で人間の目には全くわからない大量のデータを出されてもなかなか難しいというものはありますので、それに関しては一般解を出すのはちょっと難しいところですね。我々の分野ですとマクロ生物学ですので、例えば生物がいなかったみたいなデータなので、それはもうローデータでそのまま公開してしまうというのがわかりやすいとは思うのですけれども、生物学でもミクロになってくるとゲノム情報を公開するのがいいのか、そのティシューのデータを公開するのがいいのかというところは常に議論になるところですので、それを一般的に申し上げるのは難しいなというところです。
【家委員】    結局は研究者にとってのレイバーと、それから全体のベネフィットのバランスの問題だと思うのですけれども。
【大澤農研機構主任研究員】    はい。
【北森委員】    関連してなのですが、まずは非常に分かりやすいプレゼンテーションで、非常に重要な御経験を発表していただき、大変ありがとうございました。
  それで、そのデータをオープンするという、オープンデータの動きなのですけれども、そのオープンにするやり方が二通りあると思います。一つは今、大澤先生が御自身で紹介されたような、自分の研究グループあるいは自分の研究室、自分の機関からオープンにしていくということと、一方で学会誌等もデータジャーナルという形で論文誌に附属させたデータジャーナルをこれから作って、データをまず吸い上げようという動きが各学会でも各ジャーナルでもあろうかと思うんですね。
  そのときに大澤先生の御経験から、データジャーナルみたいなものがこれから出来上がってそちらの方にオープンにしていくのと、御自身の研究機関、あるいは研究室、個人としてオープンにしていくのと、どちらがメリットがあって、それからそのメリットというのは先生御自身か、それからもっと大きな単位で国としてどちらがいいのかというような観点でコメントいただければと思います。
【大澤農研機構主任研究員】    これはもう一般化は大変難しいところではあるのですけれども、まず一つはその規模に依存すると思います。つまり、データジャーナルが例えばサイエンスデータみたいなビッグジャーナルだったら、そこに出すことによって確実に多くの方の目に触れると。研究者個人としてはその方がうれしいですよね。ですけれども、仮に学術リポジトリのような形で全研究機関で共通的に検索できるようなデータリポジトリが存在していて、しかもそれが日本語で検索できるという話になったら、その方が少なくとも国内の同僚には見てもらえるよなという話になりますので、その規模に非常に依存します。
  それに関してで、国内におけるメリットは国益的な観点からすると、やはり国内に置く方がメリットになるような制度があった方が国としてはいいだろうなというのが私の考えです。
【北森委員】    そうしますと、そのデータジャーナルのようなものをやはり機関あるいは国として持つ方がデータをキープするという上ではプラスになるでしょうか。
【大澤農研機構主任研究員】    中長期的な話になりますけれども、その国益のようなものも視野に入れた場合には、そちらに出した方がメリットだなと個人の研究者が思うようにすべきだと思います。
【北森委員】    一方で先生の例から、個人の研究室で出すことによって共同研究等の声を掛けられるというような事例もあって、そのデータの検索の手法が良くなればなるほど、そういう個人のオープン化であってもどこかで引っ掛かってくるということは可能ですよね。それについてはどうお考えでしょう。
【大澤農研機構主任研究員】    正直申しますと、と言うか、私の話の中でも実はさりげなく触れているのですけれども、私同時にやっているんですよ。ジャーナルのリポジトリにもそのデータはあります。けれども、その同じものをDOIもありますのでそれを引用してくださいという形で別の場所にも置いているというやり方をしていますので、だから、ずるいというかそういうやり方も現状ではあって、それをなぜやったかというと今の私の話ですね。ジャーナルに出すことによって国際的に見られるけれども、国内で見てもらうためには日本語で検索できた方がいいだろうと。それを共通するやり方としてああいったやり方を個人的に行ったというところです。
【相澤科学官】    1点、余り詳しくない部分があり伺いたいのですけれども、話自体は大変整理されていてとても有り難く拝聴しました。研究者コミュニティの世界だけで話を済ます場合と、そこからちょっと飛び出て商用というか産業まで行くという世界とあると思うのですけれども、その際にデータを公開しますと。場合によってはそのデータは何年もかけて作り上げてきたもので、それはそれで論文を書いてその結果を公表しますと。データも学術コミュニティに公表しますということで行ったものがあったとします。そのデータを学術利用のために公開にしますと書いてあるのですけれども、商用利用できますかという問合せがあったとすると、そういう場合には対応というのはどう違ってくるか、あるいは同じなのか、何かそこら辺の事例を御存じでしたら伺いたいと思ったのです。
【大澤農研機構主任研究員】    これは飽くまで私の私見ですけれども、商用利用も歓迎と考えています。というのは、これは愚痴に近いところがあるのですけれども、我々の産業系の研究所だと、社会実装が、ということをすごく言われるのです。そのときに民間企業で我々が作ったデータを使ってもうけてくれたと言ったらこれ以上の社会実装はないわけですので、データを出すセンスに関しては、もうそういうことを考えると制限を付けない、具体的にライセンスでいうとCCBY、ノンコマーシャルを付けた時点でそれを防いでしまうわけです。学術利用とかそういった制限を付ける時点でその可能性をそいでしまうので、だから基本的には自由に使ってくださいということにすることで、産業の方のもしかしたら潜在的なニーズも見込めるのではないかなと期待しているといったところでしょうか。
  あえてその線引きをしている場合、私自身のケースで言いますと、ちょっと紹介したプレプリントやポストプリントの公開をしていますけれども、その文章に関しては、結構SA、継承しろということを付けています。それはなぜかというと文章を、極端な話PLOS ONEですとかCCBYをデフォルトにしている雑誌の適当なトピックを抜き出して自分で本を作ってそれを売るということは可能ですよね。ですけれども、私自身がポストプリント、プレプリントを公開しているのは、研究者コミュニティやそういった方々に広く知ってもらいたいというのが目的であって、それをちょっともうけたいと考える出版社なりがそれをちょっとエディットしてお金をもうけるとなると私自身の、データ公開者の考え方としてずれるから、そういうときはちょっと継承を付けようかなといった、そういった分け方をしています。非常に個別的な話になって申し訳ないのですけれども、そういった判断を今付けています。
【相澤科学官】    その一方で知財なんかでもよく、学術利用のためには自由にお使いくださいと。その一方で商用利用に至る場合には連絡して、何らかの条件付のパーミッションを取りなさいみたいな、そういう場合もあったりするわけで、パーミッションを取るというのはどういうことを条件付けしてパーミッションを取っているのか不思議……、情報の世界だと違うのかもしれないですけれども。
【大澤農研機構主任研究員】    そうですね。だからちょっと逃げみたいなことになるのですけれども、本来的には我々のような組織にいる人間は、知財管理部門がそういったものの選別をしっかりと組織としてすべきというのがあると思います。ですけれども、現状そういった状態に我々の組織はありませんので、私のセンスで行ってしまっているというのがネガティブな意味では現状としてはあります。ただ、研究者個人の思いとしては先ほど言ったように制限を付けないでどんどん利用してもらった方がそのデータの価値も上がるのでうれしいなと考えています。そのべきだ論、知的財産をどのように管理するという話になると、個人の少なくとも公的機関の研究者が考えるべき話ではないのかなというのがまず根本としてあります。
【喜連川主査】    まだなかなかそこまでは議論がまとまってないかもしれないですけれども、法人格としてみれば本来はそういうところはしっかりと整理していかないといけないかもしれないですね。
【大澤農研機構主任研究員】    はい。
【引原主査代理】    ありがとうございました。一つお聞きしたいのですけれども、先ほどお話の中でデータサーバー自身、キュレートして維持していくというお話があったのですけれども、片や御所属の機関では過去のデータベースというのが消失してしまうというお話があったと思います。それはやはりキュレートというよりは研究者個人がそれを維持しなかったという個人ベースの問題なのでしょうか。
【大澤農研機構主任研究員】    大変残念なのですが、事実上個人ベースに依(よ)っているという現状があります。
【引原主査代理】    それが95%の研究者の実態ということだと思うのですけれども、先生が、今日おっしゃったのは、非常に理想的な研究者がうれしいパターンの話だと思うのです。片やその中でもかなりブラックなこともおっしゃっていたと思うのです。立ち位置として、先ほどのキュレーターを本当に作っていかないといけないということの中で、失われたデータの問題等というのを指摘していくということは必要ないのでしょうか。
【大澤農研機構主任研究員】    もちろんそうですね。ですので、少々時間はかかると思いますが、最後に私のプロジェクトで研究データのオープン化のガイドラインみたいなものを作ったというのは、それがもしかしたら私の組織全部に広がったら1,000人を超える研究者の目に触れるわけで、これまずいぞ、となるのではないかという期待はあります。べき論で言ったらそのとおりです。
【引原主査代理】    5%から95%動かすというのは、やはりそういう何か攻撃的なことをやらざるを得ないと思うのですね。
【大澤農研機構主任研究員】    そうですね。それをうまくどう研究成果として載っていくかというのは我々の腕の見せ所でもありますので、そこをちょっと後半はPI(principle investigator)としては工夫しているところであります。
【引原主査代理】    それは、研究者の立ち位置とデータ管理の人の立ち位置を分けながらやっていくことがシステム作りになるかと思うのですけれども、そういう意味でデータ管理者というのが今後必要になってくるということだと理解してよろしいですか。
【大澤農研機構主任研究員】    はい。
【引原主査代理】    ありがとうございます。
【大澤農研機構主任研究員】    現状は、私が監督もやってプレイヤーもやってキーパーもやってストライカーで、みたいなそんな状況にはあるのですけれども、それはまずいよねということを多くの方に知っていただきたいと思って仕事を進めています。
【引原主査代理】    大学の研究者はほとんど個人プレーみたいな感じですから。
【大澤農研機構主任研究員】    そうですね。
【喜連川主査】    はい、林さん。
【林上席研究官】    いつもお世話になっています。質問は国内と国外に大澤さんのような人が何人いるか、それがどのようなネットワーク作りができているか、あるいはできそうか、こういう点(人)から面(グループや組織)に活動が広がっていくことを想定したときの、拡張を駆動する環境について何かコメントを頂ければ幸いです。
【大澤農研機構主任研究員】    非常に分野は狭くなってしまうのですけれども、先ほど紹介したGlobal Biodiversity Information Facility、このつながりで私、きょうお話ししたような基本的な考えは海外から持ってきます。具体的にはアメリカと台湾です。
  もう少し具体的な話をしますと、先方だと、全てがとは言いませんけれども、向こうで言う科研費みたいなものの審査項目の中にデータマネージメントプランが含まれるそうです。どんなデータが出来上がるという項目が明確にあって、それが審査項目で研究内容と近いレベルの重みを持って審査がされるといった話を国際ワークショップで聞きまして、実際私がそこにアプライしたわけでもないですし、中身を熟読したわけでもないのですけれども、お話としてそういったものを聞きまして、それを海外ではこういった事例があるよといって紹介しているというので、ある意味国際ネットワーク、横のつながりによってその考えを国内に持ってきたとは言えるとは思います。
【林上席研究官】    その国際ネットワークでは、ガバナンスやマネジメントはどうなっているのでしょうか。先ほどあったルール作りにいかに参画できるかというときに、活動のマネージがどうなされているかを踏まえた上で、日本がどう貢献するかが重要です。今後スタンダードを作る上で、例えば大澤さんがより本格的に貢献するということも考えた方がいいかと思うのです。あるいは別な言い方をすると既存の学会がそれを主導して運営しているようには見えない中で、どういうガバナンスやマネジメントがなされているのでしょうか。
【大澤農研機構主任研究員】    まず私のGBIFでは、そういったデータマネジメントのガバナンスをトップダウンでやっていくというわけではなくて、各国はばらばらのそれぞれの事情を持ってきて、その情報を共有する場をたまたま先方が用意してくれる場合もあると。そのデータスタンダード等を先方がプロモートしたいような内容に関して我々はインプットがありますけれども、そういう国の政策みたいな話はそれこそ内政干渉にもなりますし、そういった議論があるわけではないので、情報を共有する円卓は用意してくれますけれども、こういった話をしなさいみたいなことは実際ありません。
【林上席研究官】    誰かがそういう円卓を用意してくれる、円卓を用意してくれる方はすばらしいと思います。日本もそういう円卓を用意できるような仕掛けができるといいとは思うのですけれども、それは人依存になることだとは思うのですけれども。
【大澤農研機構主任研究員】    そうですね、人依存にはなるかもしれませんけれども、GBIFに関してはある意味トップダウン的なものがあって、加盟国はグローバルな会議には参加して、マネージャー、フォーカルポイントの人を置いてというある程度義務を発生するので、すごく変な言い方ですけれども、学術会議で同じようなことをやったら、学会としては人を出さざるを得なくなるみたいな状況はあるかもしれませんが、それが実際の手を動かす研究者に届くかどうかというとなかなか難しいところではあります。
【林上席研究官】    ありがとうございます。
【大澤農研機構主任研究員】    ちょっとこういうモデルがあるよと御紹介できなくて申し訳ないのですけれども。
【林上席研究官】    いえいえ、大分ヒントを頂いたような気もします。
【喜連川主査】    大澤先生みたいな希少種はGBIFに登録されているかもしれない。
  ちょっと最初の方におっしゃいました、学術会議の提言には御不満があるとおっしゃったのですけれども、具体的には、余りきょう御発表になったトーンとあの文面とはそんなに齟齬(そご)はないような気がするのですが、どこが御不満か教えていただけますか。
【大澤農研機構主任研究員】    非常に簡単でして、こちらの方、皆さん恐らく読んでいらっしゃると思うのですけれども、「オープンサイエンスに資する」という一言があるのです。これというのが、オープンデータにします、こういった使い方にしてくださいと絞った時点で可能性の芽を摘んでしまうので、先ほどちょうど御質問があったように、ビジネスユースみたいなものは我々研究者からは全然想像がつかないのですけれども、新しい利用が、我々の想像をしていなかったような利用が生まれて、初めてオープンデータは価値があるものですので、「資する」みたいな、こういった可能性があるデータですよということを最初から制限をし始める時点で、それはオープンではないしオープンサイエンスではないよというのが私個人の私見としてありまして、それを文章にまとめたことがあるということです。基本的な考え方、具体的な提案に関しては、それは同じだと思います。同じ流れになります。ただ、枕詞(まくらことば)がちょっと違うだろうというのが私の考えです。
【喜連川主査】    ちょっと国語の問題になるかもしれませんが、多分そういう意識は余り持っていなかったような気がします。
  もう一つちょっとお伺いしたいのは、最初の方で先生は環境情報基盤研究領域とおっしゃって、それはというので原則データベースをマネージしておられる部署ですと御紹介頂いたのですけれども、そこにおいでになるということは、本来、その職責をお持ちになられているとも端から見ると見えるのですけれども、それは農研機構というかなり大きな組織の中でそういうポジションがある種用意されていて、ほかの研究分野から見ますと、かなりうらやましい組織かもしれないなという気がするのです。
  そうではない組織の普通の研究者を前提にしたときに、きょうのお話はほぼas-isでそのまま適用できるのか、ちょっとそこら辺は違うところが出るのか、みたいな御印象はいかがかお伺いできればと。
【大澤農研機構主任研究員】    まず話だけ、私の紹介で聞くとそういった印象を持たれるのは当たり前ですけれども、実際はそういったポジションではないというのが現状でして、それは何かというと、一番分かりやすく説明しますと、元々分類学研究室だったところをいろんな分類群をまとめ上げて、どんな名前を付けようか、基盤情報だねとなったというのが正直なところでして、だからお付き合いある方もいらっしゃるかと思いますけれども、分類学者ってデータベースとすごい相性がよさそうで相性が非常によくない方々が集まっているところで、そこでちょっと猛獣使いみたいな立場をしているのが私というのが、余り良い表現ではないですけれども、そういった状況です。なので、そういう完全にインフォマティシャンが集まっているというわけではないというのがあります。分類学者と統計学者、私みたいな人間はかなり、そのグループ、全部で30人ぐらいいるのですけれども、私ともう一人ぐらいです。それなりにITの素養を持ってデータベースの仕事をやっている人間となるとそれぐらいです。
【喜連川主査】    いや、お伺いしたいのは、データベース化することが貢献の一部であるとスペシャルに認められている場所においでになるのだと思うのです。ですから、今回いろいろおやりになられたことが比較的自然な流れに乗っているのかなという気がしたのですけれども、多分農研機構の中でも純粋に、先ほどおっしゃいましたようなイネのゲノムみたいなものをやっている方はいっぱいおられるわけで、そういう方々にとってこの先生のお話がどういうふうに響くのかなというのをちょっとお伺いできればと思っています。
【大澤農研機構主任研究員】    現状では全然届いていませんね。なので宣伝しろみたいなことを上司に言われて、それがあなたの仕事だろうといつもけんかしているという状況ではありますけれども、ただ、それは今後そうなっていくべきだとは考えています。彼らも大量のデータを持ってデータマネージして、彼らが持っているデータがその分野以外での利用可能性は当然非常に多くの可能性があるわけで、それを広げることができるのは我々のグループであるとは認識をしていますので、それは今後是非とも広げていきたいというところです。現状ではできていませんが、今後是非ともやりたいし、やるべきだと考えている内容です。
【喜連川主査】    僕だけ聞いていてもいけないかもしれないですが、GBIFは比較的グローバルによく認知されたフレームワークだと思うのですけれども、例えば先ほど最後に北森先生からも御指摘があったかもしれないのですけれども、海外のジャーナルに置くのですか、ドメスティックに置くのですか。先生は国益を考えるとドメスティックに置いた方がいいでしょう、我々の多くの人もみんな何かそういう雰囲気感を持っていると思うのです。じゃあそのとき誰がサポートするのかなという問題が次に出てくる。これはGBIFの日本チャプターとしてGBIFがサポートするのか、あるいは農研機構さんがサポートするのか、あるいは生物多様性学会がサポートするのか、何かその辺はどんな姿が比較的自然だと先生はお考えになられますか。
【大澤農研機構主任研究員】    考えといいますか、GBIFにフォーカスして現状どうなっているかといいますと、GBIFのノードといいますか、中心は国立科学博物館なのですね。国立科学博物館はAMEDからナショナルバイオリソースプロジェクトの補助を受けて、事業として国内の標本情報、GBIFに出すようなデータを実際に管理している状態にあります。
  それとあと環境省の生物多様性センター、そのあたりの電子情報を日本語で提供しているフォーカルポイントが二つ日本国内にあって、それを国際貢献として科博と国立遺伝学研究所を通じてGBIF、グローバルに出しているという状態なので、国際的な流れと国内的な部分、要するに日本語で出しているという部分で切り分けがあって、日本語活動のサポートは国内で公的なサポートがあります。
【喜連川主査】    それでも日本語のローカリゼーションの部分であって、コンテンツを維持する……、何か切り分けが一定程度あるのかどうかみたいな話ですが、お伺いしていますと非常にラッキーなのは、非文部科学省領域からサポートされていると。これはすごく大きなすばらしいことかもしれなくてですね。農研機構なので農水かもしれないのですけれども、比較的御余裕がおありになられるのでそれができているのか、かなりきつきつだとそういうものを維持するのが大変にならないかなという心配もしておりまして、そういうのはどんなふうにお感じになられるかなと思うのですけれども。
【大澤農研機構主任研究員】    感じの話でいいますと、GBIF活動、日本活動には農水省は一銭もお金出していないです。私は飽くまでその知識を持っている研究者、専門家として、委員として、あとは自分自身の研究成果を公表する場として利用しているという状態で、実際はいろいろなところがサポートしているというよりは、安定的な予算はAMEDだけです。
【喜連川主査】    AMEDだけ、なるほど。分かりました。
  ほかに何か御質問ありますか。せっかくの機会です。
【岡部委員】    最後に、トップダウンの動きが大事だということで、その直前に御提言として一定規模の科研費にDMP、データマネージメントプランを付けてはどうだということをおっしゃっていますけれども、これは具体的には科研費申請の計画調書の例えば1ページ、データマネージメントプランのページを追加して、そこにデータを公開すると書くのか、しないと書くのかはその分野の常識に従って研究者が判断する。ただし、そこに書いたことを審査員が評価してという、そういう枠組みを想定されていると理解すればよろしいですか。
【大澤農研機構主任研究員】    理想的には、それが余り重たくてもちょっと大変だと思うのですけれども、波及効果という謎の言葉だけですので、どんなデータが集まって、今後、そのデータをどう考えるかということを書く。さらに、要るのであれば、採択された後にDMPを出すぐらいまでいったら最高だなと思います。それを実現するためには、ここに出すみたいな、だから学術情報基盤に期待しているというのは、まずここに出すというスタンダードが必要だろうなと考えているからです。
【喜連川主査】    期待されている学術情報基盤屋さんからの質問なのですけれども。ちょっとお伺いしたいのですけれども、生物多様性の分野で、先ほどグローバルフォーマットが、そこそこいろいろな方々の意見集約をしつつ、苦労して生み出されたというお話をされておられたと思うんですけれども、これは1回決めたものがどのくらい持っているのかと言いますか、今、医療情報なんかになりますと、多分3年は持たないですね、フォーマット自身が。そうしますと、そこの改定のエフォートというのは膨大なエネルギーがいって、先ほどのAMEDのコストがサーバーだけだとすると、アディショナルなものを自分たちでどんどん注入しなきゃいけないみたいな感じで、そこら辺は学術情報基盤に期待されてもなかなかできないような感じがしておりまして、あえてお伺いしたいのですが。
【大澤農研機構主任研究員】    生物多様性情報に関しては、スタンダードを生物屋で決めているのではなくて、インフォマティシャンで議論している、そういった別のコミュニティが存在しているのです。なのでそこで、バイオダイバーシティインフォメーションスタンダードという名前からしてちょっとマニアックな感じで、生物学者はほとんど行かないようなインフォマティシャンの方々の集まりで、そこでもうバージョン管理もされてという状態にありますので、そういう意味ではニーズが生まれたら、すぐにとは言いませんけれども、様々な形をして、でも利用性を高めるためにリクワイアードコンテンツはこれだけにして、あとはオプションにしましょうとか、そういったメソッドの部分も含めて、常に更新がされています。なので、そういった意味で非常に恵まれている環境にあります。
【喜連川主査】    GBIFのインフォマティシャンを雇用するための費用というのは、各国がサポートしているということですか。
【大澤農研機構主任研究員】    そうですね、GBIFに関しては参加国で、たしかGDPで重みを付けて、拠出金というものがあって、それで運営しているという状態ですね。
【喜連川主査】    なるほど、分かりました。
【岡部委員】    日本からはインフォマティシャンは参加しているのですか。
【大澤農研機構主任研究員】    していません。
【岡部委員】    してない、それはもうお金を出すだけ?
【大澤農研機構主任研究員】    そうですね。
【岡部委員】    そうですか、分かりました。
【大澤農研機構主任研究員】    ちょっと油っこい話になりますけど、ものすごく日本はお金を出していたのですけれども、ちょっとお金払い過ぎだというので、2年ほど前にボーディングといって議決権を持つ国と、あとアソシエイトといって議決権がないというロールがありまして、ボーディングだとすごく高いのですよ。でもアソシエイトになるとお金が大分安くなるので、日本はアソシエイトに引いたというそういった事情はあります。
【北森委員】    ちょっと泥くさい話ですが、お金を出したのは農研機構が出した?
【大澤農研機構主任研究員】    農研機構は一切お金を出していませんので、そのあたりがまた複雑なのですけれども、GBIFは生物多様性マターということで、拠出金を出しているのは環境省になります。ですが国際機関なので窓口は外務省になっていてという、ちょっとややこしい構造になっています。そのAMEDからサポートされているのは国内活動ですので、国際活動と国内活動をうまくコネクトする部分は、国立科学博物館が運営費交付金でそこの中長期計画といいますか、ミッションの中で行っているという、そういう何か強いようで弱いような複雑な構造なのですけれども、だからこそ比較的続いているのかもしれません。
【喜連川主査】    皆さんだんだん本質を突く質問が増えてきているのですけれども、やはり生物多様性というこの考え方そのものが国際的に非常に重要であるという共通認識の下で、国家としてサポートするというアグリーメントが既にかなりしっかりしていると。そういう中で比較的、経済的に極度に難しいという状況には置かれておられないというところが、別の分野でそういうものがないところに比べますと動きやすいという状況はおありになられるという理解をしてもよろしいでしょうか。
【大澤農研機構主任研究員】    そうですね。少なくともGBIF、JBIF活動は、私にとっては副業みたいなものなのですけれども、国としてその活動を取り組んでいく上では、ある程度人もおりますし、恵まれているといっていいのかもしれません。
【喜連川主査】    そういたしますと、農研機構さんは多分農業全般をおやりになられておられる中で、今のような環境というのはそれのほんの一部だと思うのですが、ほかの分野の方々は必ずしもこういう外務省うんぬんでというほどのグローバルな何か活動という感じにはならないのではないかと思うのですけれども、そういうところに対してのパースペクティブはいかがでしょうか。
【大澤農研機構主任研究員】    それは私がお答えしていいものなのかというのが難しいので、ちょっと役人っぽく私見だと前置きをさせていただいた上で、絶対必要なのですけれども、現状ではかなり内論、内向きになってしまっているなという印象が非常に強いです。
【喜連川主査】    最後、5、6分は残っているのですけれども、大体御意見はよろしゅうございましょうか。
  あと余り聞いてはいけないかもしれないのですけれども、ちょっとフィロソフィーとしてお伺いしたいのですが、1回使ったら大体それで論文は1本出ます。だから書いた後のデータをオープンしますというのが先生のおっしゃったお考えのようにお伺いしたのですけれども、分野によって多分非常に違っているかと思いまして、非常に高価な測定機器でデータを取得するような場合というのは、もう何度も何度も多分再利用されると。先生の気持ちとしては論文を書いた後、他人にデータを見せるというフィロソフィーを適用することが、何というかこの分野で比較的多くの人がデータ公開に参入するというトリガーだとお考えなのか、データをオープンにするということは必ずしも全部吸い取った後とはなかなかならないかもしれないですよね。そのときどんなふうに進めるのがいいかみたいなお考えがありましたらお聞かせいただければと。
【大澤農研機構主任研究員】    私の立場としては前者ですね。書いたデータ使わないでしょ、だったら出そうよというプロモート戦略みたいな話でお話をしています。
【喜連川主査】    それは1回の場合はそうなのですけれども、10回だと10回もやってるうちにデータが古くなっちゃうとかありますよね。
【大澤農研機構主任研究員】    10回やったら、変な言い方をすれば使い尽くした後でもいいと思うのです。
【喜連川主査】    そういう感じですか。
【大澤農研機構主任研究員】    はい。本人が納得した後だったら出しやすいよねという説明ですね。我々の分野だと2回使う人は余りいませんので、私は何回も使う方ではあるのですけれども。なので、その辺はもしも皆さんが御自身の分野で宣伝するときには、2回なり3回なり書いていただければと思いますけれども、そういう一つの戦略というか説明文句として使っているだけですので、1回使わなきゃ駄目だとかそういうことを決めているというわけではありません。
【喜連川主査】    よろしいでしょうか。大変貴重な御発表と様々な議論をさせていただきまして誠にありがとうございました。本日、各委員からお出しいただきました多様な意見に関しましては、改めてまた事務局で取りまとめをさせていただければと思います。
  最後に、事務局から連絡等ございましたらお願いできればと思います。
【玉井学術基盤整備室参事官補佐】    いつもの御連絡ですけれども、本日の会合の議事録については、委員の皆様、あと御発表頂きました大澤先生にも御確認頂いた上で公開をさせていただきたいと考えております。
  また、今回資料4で委員の皆様から頂きました御予定を踏まえて、次回以降の日程を紹介させております。次回は第7回ということですけれども、2月1日を予定しております。その後、3月、5月、6月と予定しておりますけれども、次回は2月1日にここと同じ会議室での開催を予定しております。テーマについてもオープンサイエンスで引き続き御議論頂きたいと思っております。現在の予定としましては、そこに書かれておりますきょうのインセンティブと並んで話題になっております、インフラ整備の関係を予定しておりますけれども、追ってまた御連絡させていただきたいと思います。
  以上です。
【喜連川主査】    それでは本当に大澤先生、どうもありがとうございました。本日は閉会とさせていただきたいと思います。

――了――

お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

麻沼、齊藤
電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)