第9期学術情報委員会(第11回) 議事録

1.日時

平成30年7月26日(木曜日)10時00分~12時00分

2.場所

文部科学省13F1~3会議室

3.議題

  1. 電子化の進展を踏まえた学術情報流通基盤の整備と大学図書館機能の強化等について
  2. その他

4.出席者

委員

引原主査代理、永原委員、赤木委員、安藤委員、家委員、逸村委員、井上委員、岡部委員、北森委員、
竹内委員、谷藤委員、美馬委員

文部科学省

(事務局)磯谷研究振興局長、千原大臣官房審議官(研究振興局担当)
原参事官(情報担当)、丸山学術基盤整備室長、高橋学術基盤整備室参事官補佐

オブザーバー

林科学技術・学術政策研究所上席研究官

5.議事録

【引原主査代理】  皆様、おはようございます。定刻より若干早いですけれども、全員おそろいのようですので、ただいまより第11回学術情報委員会を開催します。
 ご覧のように本日喜連川主査が御欠席ですので、副主査である私、引原が進行を務めます。どうぞよろしくお願いいたします。喜連川先生のようにウィットに富んだ意見は申し上げられませんので、是非皆様方からよろしくお願いいたします。
 前回はオープンサイエンス推進における諸課題のうち、データ保護の観点から、潮見坂綜合法律事務所の末吉先生にお越しいただきまして、不正競争防止法の一部改正について御説明いただきました。
 今回は、昨年イタリアで開催されましたG7科学大臣会合のフォローアップがこの秋にカナダで開催予定のシェルパ会合の場で行われる予定となっております。その動きを踏まえまして、検討項目の一つであります研究データの利活用のためのインフラ整備に関して、JST(科学技術振興機構)とNII(国立情報学研究所)の取組状況を御紹介いただきまして、その後意見交換をしていただきたいと思っております。
 このため、科学技術振興機構の小賀坂知識基盤情報部長と、2度目になりますけれども、国立情報学研究所の山地先生に御出席いただいております。よろしくお願いいたします。
 今回もオブザーバーとして科学技術・学術研究所の林上席研究官に御出席いただいております。よろしくお願いいたします。
 それでは、まず事務局より配付資料の確認等、お願いしたいと思います。よろしくお願いします。
【丸山学術基盤整備室長】  それでは、失礼いたします。本日は、ペーパーレスでの開催としております。お席に資料閲覧用の端末を御用意いたしましたので、そちらで資料の御確認をお願いいたします。
 
なお、本日の傍聴でございますけれども、20名の方の登録がございます。傍聴の方々におかれましては、お持ちの資料のダウンロードをお願いいたします。ダウンロード方法については、お手元のクイックガイドを御確認ください。
 それから、本日御用意しています資料1でございますけれども、前回の主な御意見をまとめたものでございますが、本日、インフラ関係のプレゼンということで、内容はリンクいたしませんので、説明は割愛しますが、後ほど関連のときに御説明申し上げたいと思います。
 以上でございます。
【引原主査代理】  どうもありがとうございました。それでは、早速ですが、オープンサイエンスに係る科学技術振興機構の取組につきまして、科学技術振興機構の小賀坂知識情報基盤部長に御説明いただきたいと思います。小賀坂部長、よろしくお願いします。
【小賀坂部長】  科学技術振興機構の小賀坂でございます。きょうはどうぞよろしくお願いいたします。
 文部科学省よりインフラ整備についてというテーマで頂戴しておりますので、その文脈を踏まえつつも、もう少し幅広にオープンサイエンスについてJST(科学技術振興機構)でやっております事柄について報告したいと思います。
 まず、私はJST(科学技術振興機構)の情報事業部門の立場できょうは報告させていただきます。事業内容につきまして、詳細な説明は省きますが、机上にJST(科学技術振興機構)の情報サービスと銘打ちましたパンフレットをお配りしておりますので、適宜御参照いただければと思います。
 基本的にJST(科学技術振興機構)は科学技術情報の収集・整備、流通促進の取組を行っておりまして、幾つかのサービスを持っております。きょう主題となりますのは、中段左にございます論文誌プラットフォームJ-STAGE、これは国内の学協会の発行するジャーナルの電子化を支援する仕組みとして運営を開始したものでございまして、おおよそ国内の約半数の学協会に御利用いただいているものでございます。
 それから、上段中ほどにありますJ-GLOBAL、論文・特許等統合検索サービス、及び、その下の右側にあります科学技術文献情報提供事業、こういったものについては、今後、全文データのリソースとしての活用を考えておりますので、このあたりについても御説明できればと思っております。
 1枚飛ばしまして、JST(科学技術振興機構)におけるオープンサイエンス関連の取組を一覧しますと、私ども情報事業部門の方では、第一に、今、各国政府ないしファンド機関で定めております研究成果の取扱いに関するポリシーというのがございます。論文や研究データに対するアクセスでありますとか公開の方針でございます。こういうものについて、JST(科学技術振興機構)がファンド対象とする研究課題から出る研究成果についての取扱いに関する方針の策定・運営を情報事業部門の方で担当しております。また、J-STAGE(ジャーナルプラットフォーム)におきましては、OA誌の育成はもとより、エビデンスデータの公開促進の支援など、これから進めていこうと考えております。
 また、DOIの登録機関であるジャパンリンクセンターについては、オープンサイエンスの推進に必要な永続的識別子の取扱いについても取組を進めております。
 また、文献情報提供事業におきましては、全文情報の提供という観点から、テキストデータマイニングを念頭に置いた全文データベースの整備、また、研究データ利活用協議会につきまして、その運営事務局を務めておるということで、コミュニティ支援も手がけております。
 また、資金配分事業部門に参りますと、冒頭申しました研究成果の取扱いに関する方針については、資金配分事業部門において研究者に対して対応を要請し、また支援をするという取組をオールJST(科学技術振興機構)で行っております。
 最後に、JST(科学技術振興機構)は科学コミュニケーションの事業を持っておりますが、ここにおいては、シチズンサイエンスの促進ということで、近年取組を始めているところでございます。
 この中から本日はここに記しました3点について御説明をいたします。なお、4点目、研究開発課題に対する識別子付与というのは最近ホットなトピックスですが、本日説明は省略したいと思います。
 1点目が論文エビデンスデータの登載環境の整備、2点目は研究資金制度におけるデータ管理計画の導入について、3点目がオープンサイエンス資源としての全文記事データの整備というテーマでございます。
 まず一つ目、論文エビデンスデータにの登載環境の整備でございますが、これは先生方、既にご了承いただいていることでございますけれども、近年研究成果論文の根拠となるデータ、これをいわゆるエビデンスデータと称しておりますが、の公開の必要性が唱えられておりまして、先頃発表されました統合イノベーション戦略におきましても、このことについては、文部科学省が主体となり、全文データベースに登録された論文と識別子を付与した研究データを紐づけ、管理・公開するシステムの開発を検討することとされております。
 もとより、エビデンスデータの公開は、近年の研究資金配分機関のポリシーにおいて、推奨であるとか義務化が進んでいるということもございますけれども、何よりもジャーナルにおいて推奨や義務化が進んでいるということが一つの推進力になっていると言われております。
 そういう観点から環境を概観いたしますと、現在、データを登載するリポジトリは海外機関のものが大勢でございます。また、海外の大手商業出版社においては、独自のリポジトリの整備や、あるいはデータジャーナルの発刊という動きもございまして、グローバルには研究者がデータ公開を円滑に行える環境というのは進んでいると言うことができますけれども、一方、我が国においてはこのあたりの取組は立ち遅れているのではないかということが懸念されるわけでございます。
 1枚飛ばして、それでは、ジャーナルにおけるポリシーというのはどうなっているかということにつきまして概観いたしますと、これは筑波大学の池内先生、逸村先生の研究がございまして、2016年に発表されています。この研究では、22分野各10誌のトップジャーナルを選びまして、そのジャーナルポリシーを調査しておられます。
 この図は、池内先生から頂いた図ですけれども、そのうち、リポジトリでのデータ公開に関する方針の強弱というものをサーベイした結果でございまして、縦方向に分野が並んでおりまして、オレンジ色が公開を「必須」としているジャーナルでありまして、だんだんトーンが弱まりまして、「推奨」、「受諾」、又は「なし」というふうに色が分けています。一番上にあります分子生物学、それから生物学・生化学等では、ほぼサンプル中、全てのジャーナルが必須としておりますけれども、中ほどに参りまして、例えば農学、免疫学、学際分野等では、半々ぐらい、下の方に参りまして、数学、経済学、工学ではほぼポリシーの定めはないという状態です。
 このように分野によって大きく差があるものの、グローバルには、おおむね半数程度が公開を必須としているというふうに見ることができると思います。
 2016年のこの研究以降、大手出版社によるデータポリシーの大規模導入というのが進んでおりまして、Springer Natureではタイプ別にポリシーのパターンを用意している。あるいは、Taylor&FrancisやPLOSにおいては、Data Availability Statementと申しまして、論文の根拠データがどこで手に入るかということについての記載を求める、ないしは義務化するということも行われておると伺っております。
 一方、我が国においてはどういう状況かと申しますと、サンプルが限定的ではございますけれども、私どもJ-STAGEに登載されているジャーナルについて調べますと、これはJ-STAGE登載ジャーナルのうち、インパクトファクター取得誌を対象としたポリシーの調査を行ったもので、122誌ございます。ちなみに、これは日本のジャーナルでインパクトファクターを取得している雑誌の約半数に相当いたします。
 左側のパイチャートをごらんいただきますと、先ほどの池内先生、逸村先生の研究と同様に調べますと、エビデンスデータの公開を必須としているジャーナルは青い部分ですが、21誌、大体17%、2割弱でございまして、また半数がポリシーを定めていないということが見てとれます。
 また、右側をごらんいただきまして、これは余り包括的な調査ではありませんけれども、J-STAGEにおいて過去に記事を登載しており、現在は大手商業出版社を利用しているというサンプルを抽出しますと、横棒の上の部分でございますけれども、青い部分、必須にしているジャーナルというのは7誌ございまして、30%ぐらいです。したがいまして、大手出版社から出版されているジャーナルはそういうポリシーをそろえていると言ってよろしいかと思いますが、いずれにしましても、3割弱ということでございまして、グローバルなランドスケープからすると割合は低いということが分かります。
 データの公開促進にジャーナルを使ってということについての賛否はございますけれども、少なくともそのロジックで参りますならば、ジャーナルにおけるポリシー整備というのは我が国において進めるべきではないかという論が立つと考えてございます。
 ただ、ポリシーを定めればよいかと申しますと、これは今年でございますけれども、PLOS誌におけるData Availability Statementの内容分析という研究がございます。PLOSは2014年よりこのステートメントの記載を求めており、かつ、リポジトリの利用を強く推奨しておりますが、一方で、この分析の結果によりますと、まず論文のうちData Availability Statementを備えている論文の割合が80%ぐらいあるのですが、備えている論文のうちリポジトリ名を明確に記載している論文というのは20%以下であるということが言われております。
 また、多くの著者は文中に記載しているというふうにステートメントに書いているそうですが、この論文の著者は、科学データというものは文中に書き込めるほどの規模ではないはずで、やはりリポジトリを利用するということが研究者の標準的な行動になることがデータ共有を進めるのに本質的であろうという結論を導いております。
 こういったことを概観し、論文のエビデンスデータの公開という観点から申しますと、ジャーナルのポリシー整備と同時に、著者が簡便に利用できるリポジトリ環境の整備というのも並行して進めることが望ましいのではないかと考える次第でございます。
 そういうことで、私どもJ-STAGEでは、国内の論文誌の約半数、2,600誌、学会数で申しますと1,400学会ほどで御利用いただいておりまして、その9割のジャーナルが無料公開をしております。こういう有効な成果発信手段でございますので、ここにおいても、研究データの公開に関する取組をやっていけないかと考えているところでございます。
 具体的に申しますと、仮に「J-STAGE Data」と名前を付けておりますけれども、論文のエビデンスデータの公開を促進のためのJ-STAGE登載論文の関連データを登載するリポジトリを新規に構築したいと考えております。考えておりますというのは、これは検討中でございまして、まだ予算の手当ては立っておりません。
 下のワークフローをごらんいただきますと、まず論文については、学協会に投稿された後、J-STAGEに登載されますが、データについては2つのルートが考えられまして、学協会に論文と併せて投稿した後に学協会がリポジトリに登載する。又は、学協会の負荷低減という観点からしますと、論文は論文で査読処理をして掲載しますが、データは、ここをバイパスしまして、直接データリポジトリに登載すると。いずれもシステム的には可能ですので、こういうことを考えたいと思っております。
 また、論文とデータについては、DOIの付与と関連付けを行って世の中に流通させていきます。こういう取組が有効なのではないかと考えるところでございます。
 続きまして、これはもう既に着手している取組でございますけれども、DMP(データ管理計画)の導入でございます。各国の政府ないし配分機関の例にも見られますけれども、JST(科学技術振興機構)におきましても、昨年4月にオープンサイエンス促進の観点から、研究成果の取扱いについての基本方針というのを定めております。JST(科学技術振興機構)のファンド事業の対象となる研究者に対して、まず論文についてはオープンアクセスを義務化いたしました。また、研究データの取扱いについては、まずデータ管理計画、データマネジメントプランの作成・提出を義務化しております。また、研究データをこれに沿って管理いただくとともに、論文のエビデンスデータについては公開を推奨するということにしております。
 DMPについて現状どういう状況かを簡単に御説明いたしますと、2017年度に方針を導入しておりますけれども、先立ちまして2016年度に戦略的創造研究推進事業において先行的に導入をいたしました。JST(科学技術振興機構)は毎年600課題強、新規課題を採択しておりますけれども、2016年度は大体100弱の課題からDMPの提出を受けております。昨年度については、全事業に順次導入を開始いたしましたので、約半数ぐらいの課題からDMPの提出を受けております。
 これは御留意いただきたいのですが、この比率は、コンプライアンスレートではありません。導入した事業では100%DMPの提出を頂いております。事業における導入が段階的ですので、こういう割合で進んでいるということでございまして、2018ないし2019年度には100%に達すると見ております。
 こういうぐあいにデータ管理についての意識も上がっていくでしょうし、次第にエビデンスデータの公開も、今推奨しておりますけれども、公開に向けて御対応いただけるものと思っておりますけれども、次の課題は、公開の度合いをどうモニターするかということでございます。
 これについて、これから取り組もうと思っておりますことについて御説明いたしますけれども、JST(科学技術振興機構)は現在、CHORUSと申しまして、米国の非営利団体が推進しておりますオープンアクセスの推進に関するイニシアチブと契約を結びましてサービス提供を受けております。
 これは、出版社のワークフローを用いまして、出版社サイトにおける著者最終稿のオープンアクセス化を推進すること、また、論文の出版状況やオープンアクセス化の状況についてのレポーティングを行うサービスでございます。これは有料でございまして、JST(科学技術振興機構)はこれを契約しており、JST(科学技術振興機構)が資金配分したということが同定される論文について、このようなサービスを受けております。
 下の図がそのサービスの一つでありまして、ダッシュボードサービスと申しますが、JST(科学技術振興機構)の成果であることが確認された論文の出版状況やオープンアクセス化の状況が週次で提供されるというサービスでございます。小さくて恐縮ですけれども、グラフ横軸が時間でございまして、黒い線がJST(科学技術振興機構)の成果であることが確認された論文の累積数でございます。順調に伸びております。一番下の紫の線が、そのうち、オープンアクセスと申しますか、一般から閲覧可能な論文の数の集計でございまして、現在は30%超えに達しております。大体日本の平均が20%と言われておりますので、効果が出ているかと思います。
 CHORUSでは最近、論文に記載されているエビデンスデータの登載情報を、別個、メタデータとして提供するというサービスを開始しておりまして、これを使いますと、JST(科学技術振興機構)の成果論文におけるエビデンスデータの公開状況が分かるのではないかと考えますので、これについても今後利用することを検討しているというところでございます。
 最後に、全文記事データの整備ということについて御説明をしたいと思います。これも未着手でございまして、現在構想中でございます。もとより言われていることでございますけれども、論文の記事データを用いました材料開発研究の重要性というのはあちこちで言われていることでございます。手前味噌で恐縮ですけれども、JST(科学技術振興機構)が資金配分しております、これはさきがけ研究ですけれども、こういう事例も出てきておりまして、これは大阪大学の佐伯先生の研究ですけれども、論文情報から1,200余りの実験データの情報を抽出しまして、機械学習によって構造式の性能を予測する方法を開発したという研究です。
 専門的なところは説明しかねますが、例えばこのケースでは、高分子素材を使った太陽電池の開発ということにおきましては、構造から素子性能を予測することが困難であると言われているところです。佐伯先生はこれに対して、既存の論文から化学構造と素子性能の関係について抽出されまして、機械学習を用いて指導原理を導かれたという研究です。
 先生によりますと、ここに書いてあるような方法でいろいろと論文からデータを抽出すると、手作業のため、1日5本程度が限界であって、この御研究も1年かかったというふうに言っておられました。
 こういったものが、論文情報が機械的に可読になれば、テキストデータマイニングの手法を使いまして高効率化が図れるということが期待されるわけです。
 もとより、データ駆動科学といった場合に、研究データについて注目されておりますが、論文全文情報というのも重要な科学技術情報源でして、これを使った取組というのも考えるわけです。
 環境としては、近年の情報処理技術や機械学習技術の進展によりまして、こうした研究の実現性は高まったと言えるのではないかと思います。一方で、例えば論文の多くが無料でアクセスできないこと。先ほど申しましたが、グローバルにはOA化率というのは20%から30%、先進的なイギリスにおいても50%ぐらいと言われておりますので、大半はいわゆるペイウォールの向こう側にあるわけです。また、論文の機械可読化が進展途上であること、これも課題であろうと思います。
 ただ、進展は見られておりまして、OA化の促進によって、アクセスの無料化は進んでおりますし、また、機械可読化も、大手出版社等では進展していると聞いております。
 また、こうした出版社の中には、テキストデータマイニング向けに全文情報を提供するサービスを行う者も出てきております。
 翻りまして我が国においては、再びですが、こうした取組については立ち遅れているのではないかと懸念する次第でございます。
 例えばテキストデータマイニング用のデータ提供サービスということについて申せば、Springer Nature、Elsevier、PLOSといったところは、API提供、それから、バルクデータのダウンロード提供、いずれにおきましても提供を開始しておりまして、重要なことは、こういう出版社から出た論文については、分析対象となり、発信力も強まり、新しいディスカバリープロセスに取り込まれていって、研究の価値が高まっていくということが期待されるわけですけれども、こういうところに取り込まれませんと、研究の価値も認められず、取り残されていくということが起こるのではないかと思うわけです。
 機械可読化の促進という意味で申しますと、なかなか簡単ではありませんで、具体的に申しますと、XML形式で記事を登載することが必要と言われておりますが、これも学協会ないし出版社の方では余り容易な取組ではないと承知をしております。
 ここに対応するため、例えば韓国のKISTI(韓国科学技術情報研究院)が運営しますプラットフォームにおいては、JATS形式でXMLを簡便に発生する機能を提供するという取組などが行われておりまして、お隣の国でもこういうが行われているということでございます。
 こうした状況にございまして、JST(科学技術振興機構)といたしましては、2つ、全文情報のサービスを行っております。一つは先ほど申しましたJ-STAGEでございます。それから、もう一つは、JST(科学技術振興機構)が運営しております文献データベースというのがございます。国内についてはほぼ全ての科学技術定期刊行物を収集し、また、外国誌についても主要なものについては収録しているデータベースがございまして、ここから索引作成、抄録作成などを行いまして提供しておるということでございます。
 今年度の予定では、国内記事70万記事、海外誌については100万記事を登載する予定でございまして、その数をどんどん増やしております。
 こうしたものについて、オープンサイエンス促進の観点からは、機械可読化した全文情報を提供することができないかと考えております。
 具体的に申しますと、J-STAGEについては、先ほどちょっと触れましたけれども、XML形式の全文記事作成を簡易化する機能開発を検討しております。
 また、文献情報提供事業については、国内の定期刊行物を網羅しているという強みを生かしまして、これまで抄録のみの収集だったところを、全文情報についても併せて収集・機械可読化し、索引作成や検索の高度化を図るとともに、これをテキストデータマイニングと研究を目的とした利用者に提供するという事業を考えております。
 もう少し具体に申しますと、J-STAGEにおきましては、膨大な全文情報が掲載されておりますものの、XML化されている割合は誌数ベースで10%未満でございまして、ほとんどがPDFのみの登載になっております。これを解消するために、XML化の支援ツールの提供を検討しているということでございます。
 また、文献情報提供事業におきましては、文献を、国内文献についてですけれども、全文を機械可読化しまして、ここに書いてありますような多種多様な目的に対して提供するということを考えております。
 最後になりますけれども、もとよりこうした構想は、先般の著作権法の改正によって可能になったものでございまして、これはその際に使われている資料でございますけれども、柔軟な権利制限規程によって対応が求められているニーズの例としてこういうものが上げられております。
 例えばAIによる深層学習に対する教師データとしての利用価値。あるいは、一番下にございますけれども、広く情報解析サービスに供するということでございまして、こうしたものが、いわゆる著作物に関わる利害を著しく損なわない限りにおいてはこういうことを認めるというのが今回の改正の趣旨であると理解しております。
 以上でございまして、散漫ではございましたけれども、最近考えております、一部は実施しております取組について御説明をいたしました。どうもありがとうございました。
【引原主査代理】  小賀坂部長、どうもありがとうございました。御質問等については、後ほどまとめてお願いしたいと思っております。引き続きまして、国立情報学研究所の山地教授から国立情報学研究所のオープンサイエンスに係る取組について御説明いただきたいと思います。よろしくお願いいたします。
【山地教授】  NII(国立情報学研究所)の山地です。よろしくお願いいたします。きょうは、我々が今作っているインフラのデモを中心に、どういうものを、どういうふうに使うことを想定して作っているかというところを、前回はパワーポイント中心だったのですけれども、今回はデモを中心に皆さんに御紹介したいと思います。
 きょう御紹介するのは、まずは、これは主に前回説明した、研究データを管理する基盤と公開する基盤、検索する基盤という3つの基盤、これを連携して、こんなふうに使うところを想定しながら機能開発を進めている、とデモで紹介します。その後に、こういった基盤を使っていく上では、研究データ管理というものに対して、研究者や支援者が十分知識を高めていかなければならないということで、図書館の方々と一緒に進めております研究データ管理のためのトレーニングコースについて紹介します。最後、時間がありましたら、この3つの基盤というのは研究プロジェクトを開始するところから使っていただくことを想定して作っていますが、その研究プロジェクトを進める一つのきっかけになる、研究データ管理計画の作成支援ツールについて、これは海外で作ったものを日本語化して実装したレベルですが、どういうものが海外で使われているかというところを含めて、皆さんと情報共有させていただきたいと思います。
 まずは、3つの基盤のデモについて、管理基盤というのはGakuNin RDMというのを今作っています。RDMはリサーチデータマネジメントの略で、これは研究者が日々の研究活動においてデータを管理する。公開する前に、クローズドな環境で、非公開の状態で、個人、ラボ、あるいは共同研究者の間で研究データを管理してシェアするためのサービスです。これに、まだできておりませんが、研究データの管理計画を作るためのツールや、その他の外部ツールをくっつけて、日々の研究で使っていただくというサービスになっております。
 違う見方からすると、研究データの10年保存や、研究公正対応というところにも対応できるような機能を作っていっているところです。
 ここで、研究データを管理しながら研究を進めて、一旦成果が出たとします。論文を書くときや、助成機関やジャーナルの指針に従って研究データもエビデンスデータも一緒に公開しましょうとなったときには、2つ目、これはリポジトリと俗に言われているものなのですけれども、リポジトリにこの研究データ管理基盤から簡単に登録できるというところを紹介します。最後に、このリポジトリというのは、機関で、図書館の方々が運用している機関リポジトリや、あるいは分野別のリポジトリ、様々なものがあって、いずれにおいても使っていただけるように作っていっているところです。例えば国内、世界中のリポジトリデータベースからデータを全部集めて、串刺し検索ができるCiNiiというところにデータが集まって、エンドユーザーはここで論文とか研究データを検索して、またそこで検索した結果を研究プロジェクトにフィードバックして利用するという感じの一連のデモを紹介したいと思います。
 3つのデモについて、まずログインする必要があります。研究データの管理基盤なのですが、NII(国立情報学研究所)でこれまで大学と一緒に作ってきた認証の基盤によりデフォルトでログインするようにしております。今回は、ID、パスワードを入れるのではなく、スマートフォンを使って、より高い認証の方法でもログインできるところをお見せします。このスマートフォンを使って、今、ログインしました。このスマートフォンは、私しか持っていないものであり、このスマートフォンにログインするときに、更にPINコードである私しか知っていない情報を入力して多要素で認証しました。手元でやっていたので、皆さんには分からなかったのですけれども、そういった一つの高い認証の方法でログインするというのも、GakuNinによってできます。
 これがGakuNin RDM管理基盤にログインした状態です。ここで、GakuNin RDMのデフォルトストレージと、WEKO(機関リポジトリ)がつながっている状態になっています。
 例えばここから外の外部ツールにもつながります。例えば、CiNiiに行ったときに、インターフェースはこれまでとほとんど一緒ですが、研究データも論文と一緒に検索できるようになっています。まだデータを簡単に入れた段階なので、非常に簡素なインターフェースしか準備できていません。これがキーワードで検索した結果のスプラッシュページで、例えばGakuNin RDMにここで検索したデータ、これがデータのアイコンです。事前に自分のCiNiiマイページでGakuNin RDMをつなげておく必要がありますが、このアイコンのクリックで、管理基盤にデータが取り込めるような仕組みを作っていっているところです。
 実際に取り込んだデータがこの中にあります。このfumi-dbpというデータを今このGakuNin RDMのところに取り込んだ状態です。データの中で、例えば、これはアイパイソンという、パイソンというプログラミングランゲージでデータを処理するためのプログラムです。こういった実験データと例えばプログラムみたいなものをセットでCiNiiからこのGakuNin RDMの中に取り込めるように、連携機能を準備しているところです。
 これはプログラムで、このGakuNin RDMの管理基盤の中では実行することはできないのですが、外部のデータを解析するための基盤というのをデモで用意しました。JupyterHubという、アールやパイソンでプログラムを書いて、実行するためのアプリケーションです。最近、世界的に流行っていて、多くの研究者に使われていますが、我々のところでもこういったサービスを上げて、GakuNin RDM、このデータを選んで、JupyterHubにデータを投げ込んで、そこで処理するということができるようになっています。
 実際にデータを事前に取り込んでおきましたが、先ほどお見せした、CiNiiで検索して一旦GakuNin RDMに取り込んだデータを解析基盤にも送ることができます。
 これは先ほど紹介したプログラムと同じものなのですが、ジュピターノートブックという、このプログラムとこのプログラムが同じものですが、これをこのアプリケーション上で実行します。データも一緒にこのJupyterHubの中にインポートすると、このプログラムを実行して処理をした結果がこのように現れます。
 ここで処理した結果を一旦セーブして、更にGakuNin RDMに戻すということができるようになっています。選んでエクスポートすると、GakuNin RDMにデータが戻ります。実際にこのGakuNin RDMの中にデータが戻ってくるという処理では、簡単なクリック操作で外部ツールと連携しながら、データを、あるいはプログラムをRDMで管理して、解析ツールに送り、処理して戻ってくるという研究のプロセスが実行できるようになっております。
 一旦ここで研究が終了して、論文を書き、そのデータと一緒にリポジトリに研究成果を登録するというときには、ここに既につなげてある機関リポジトリにデータなど、ここでの研究成果をドラッグ&ドロップするだけでリポジトリにデータが登録できるようになります。実際にデータを入れた結果がこちらにありますが、この例では、データや論文、あるいは研究のプログラムをzip化したものを単に登録しただけですが、この新しいリポジトリシステム(JAIRO Cloudというリポジトリのクラウドサービスで使っているアプリケーション)では、こういうふうにzipファイルの中もプレビューできて、中の様子が、どういうデータが登録されているかというのが何となくこのプレビューでも見られるようになっています。
 かつ、この新しい機関リポジトリシステム、WEKOのバージョン3ですが、これが以前のバージョンと大きく違うのは、論文だけではなく大規模な研究データも扱えるようになるという点と、外部のツールと非常につなぎやすくなっている点が大きな特徴です。
先ほど紹介したGakuNin RDMデータ管理基盤も同じような特徴を持っています。例えば、機関リポジトリにPDF、論文を登録している、この書誌の詳細ページに、剽窃チェックボタンなどを付けることで、外部の剽窃チェックツールを走らせて、この論文と類似した論文が世の中にあるのかどうかというのもチェックできるようになります。
 こういったチェックツールは、リポジトリで使うのか、それともGakuNin RDMとつなげて使うのがいいのかという具体的なところはまだ議論できていないのですけれども、GakuNin RDMとこのリポジトリが共に外部のツールと非常につなぎやすくなっているからこそ、NII(国立情報学研究所)の中で全部アプリケーションを作り込まなくても、より高度な機能が使えるようになっております。
 これがGakuNin RDMをCiNiiと組み合わせてデータを取り込みながら研究成果をリポジトリにアップロードして、そこで研究成果を管理するというところまでのデモです。最後に、GakuNin RDMの管理基盤に戻ります。GakuNin RDMの中では、プロジェクトベースに研究データを管理しますが、GakuNin RDMの中で、例えばプロジェクトのメタ情報というのもこのように管理できるようになっています。
 こういったプロジェクトのメタ情報、あるいは、ファイル自体のメタ情報も管理できるように機能を作っているところです。また、そういった機能をDMPの機能と連携させながら、ここでプロジェクトを開始したと同時に、ある程度プロジェクトの概要を、テンプレートを使いながら記述し、あるいは研究を進めていく段階で、ある程度ファイルに関する研究データに関する簡単なメタデータを付与しながら、最終的に研究成果をリポジトリに公開するときに、できるだけ障壁を下げるような機能を順次作っているところです。
 このGakuNin RDMは、機関として採用していただいて、機関の構成員にサービスを提供するという形で展開していきたいと思っています。これは機関の管理者向けのページで、この中で、例えばこのGakuNin RDMを管理するのは情報基盤センターやIT室になると思うのですが、大学の構成員に、GakuNin RDMというのは外部のいろんなツールやストレージをつないで使うことができるのですけれども、どういったストレージ、外部ツールはこれにつないで使うことができますよというのを定義し、あるいは、このGakuNin RDMが機関としてどういうふうに使われているかという統計情報もここから得られるようになっています。もし何か問題があったときには、この機関の管理ページからデータを抜き出して、研究者を守る、あるいは、インシデント対応が組織としてもできるようになっているという機能を強化しているところです。
 以上が3基盤のデモです。この3基盤は前回も紹介したのですが、2020年の本格運用に向けて開発は順調に進んでいるところです。ただ、この3つの基盤とも、今後より具体的に皆さんに使っていただくためにやらなければならない課題が残っております。まず管理基盤ですが、システム自体は、我々、実証実験を重ねながら、機能を大学の方々のニーズを掘り起こしながら作っておりますが、この実証実験というのは、ある意味、ボトムアップ的なコミュニティの中で実験者、参加者を募って進めています。最終的には、この管理基盤というのは、組織、大学、研究機関として採用していただくという方向でサービス提供をしようと思っておりますので、そのときには、大学として採用してもらうための仕組みや、よりフォーマルなNII(国立情報学研究所)と大学との関係というのを作っていく、そういった仕組みを作る必要があり、それは今後の課題であるなと思っております。それに対応するために、今NII(国立情報学研究所)の中で大学と連携した作業部会を作る準備を進めているところです。
 2つ目の学内のデータポリシーなのですけれども、研究データの管理のサービスというのを大学として採用していただくためには、最近内閣府では研究所のデータポリシーのガイドラインができたばかりですが、やはり大学としてのデータポリシーというのがある程度同調して整ってきて、組織として、大学としてデータ管理をするというのは大事だという認識が高まったと同時に、このサービスが採用されていくという、両方が同時に進まないと我々のサービスをより広く使っていただくというフェーズには移らないだろうなと思います。大学におけるデータポリシーの策定というところに関しても、関係機関、あるいはAXIES(大学ICT推進協議会)のような大学コミュニティと連携しながらやっていきたいと思っております。
 続きまして、公開基盤について、このリポジトリは、今、我々JAIRO Cloudで500機関程度にリポジトリを使っていただき、それをカレントのバージョンからデータも扱えるよりプラガブルな(脱着できる)バージョン3に移行する。両方のシステムを我々はわかっているので、当然システムを移行するというのは非常に大変なのですけれども、ある程度先は見えていると。それと同時に、我々は今後取り組んでいかなければならない大きなステップは、これをどううまく使っていくかというところだと思います。
 それは、JPCOAR(オープンアクセスリポジトリ推進協会)、図書館の方々が中心になってコミュニティを作っているリポジトリの協議会と連携しながら、例えば、研究データというところに図書館の方々の次のフィーチャーというのがより移っているのですけれども、それより一つ前のステップとして、オープンアクセスの義務化というものが資金配分機関から与えられた、こういった課題が与えられた場合に、機関リポジトリのパワーというのをどういうふうに最大化してOA(オープンアクセス)の義務化、あるいはOA(オープンアクセス)の普及率を高めていくかというのを議論していかなければならない。このための活動をしていかなければならない。それプラス、論文とエビデンスデータというのをセットにしてリポジトリに登録するというところのケーススタディも作っていきたいと思っております。
 最後、検索基盤なのですが、CiNii、検索基盤、これまでCiNiiにデータを取り込んできて、それをメタで検索できる、あるいは全文検索できるというところまでをこれまでのメインのサービスとしてきたのですけれども、やはり研究データも一緒に扱うとなると、国内に研究データのデータベースを持っている組織とかコミュニティたくさんありますので、そういったところとより強固に連携しながら、CiNiiでデータを集めてそれを横断検索するためのデータ連携させる技術など、技術連携やコミュニティの確立を進めていきたいと思っております。
 続きまして、ちょっと話が、話題が変わるのですが、人材のトレーニングコースについて、どんなところまでできているかというのを簡単に紹介したいと思います。
 これもNII(国立情報学研究所)の活動というよりも、JPCOAR(オープンアクセスリポジトリ推進協会)の活動ですが、去年、2017年に、まず教材、トレーニングコースの第一弾を作って、パワーポイントファイルとそのスクリプトを作りました。それを映像化して、2017年の11月から18年の1月にかけて、MOOC(大規模公開オンラインコース)でコースを提供しました。大まかに分けて4章から構成されていますが、実際にやってみると、こんなにたくさんの人が受けてくれると思っていなかったのですが、2,300人ぐらいの方が受講登録してくれて、最終的にはこのコンピレーションレートなんですけれども、gaccoという、JMOOC(日本オープンオンライン教育推進協議会)の一番大きなプラットフォームで、世界的に見ても10%台ぐらいなんですが、gaccoの平均15%よりもかなり高い修了率を得ることができました。
 この高い修了率を得たのは、我々メインターゲットにしていた図書館の方々が主に受けてくれたというところが非常に効いているんじゃないかなと思います。実際コースを始める前は、受けてくれた方々は、ほとんど研究データ管理については知らなかった。これは実際コースを修了した後のアンケート結果なのですけれども、全体的に満足いただきましたし、また、講座の内容に関しても、よく理解できた、あるいは、やや理解できたというふうに、この講座の内容に関しても理解度が非常に高く進んだというふうにフィードバックを受けております。
 また、今回は非常に基礎的な研究データの管理のための内容だったのですが、期待どおりだったというふうな回答を得ておりますし、非常に有用だったと。特に初心者にとってこの講座の内容というのは良かったという回答を得ました。
 非常にポジティブなフィードバック、アンケート結果を頂いたのですけれども、自由記述での、より具体的な皆さんからのフィードバックを見ておりますと、まずこの2つ目の点、実際研究者が研究データ管理の中でやるべきことと図書館員のような支援者がやることというのがきちんと区別された内容になっておらず、図書館員が受けるんだったら、ここをはっきり区別して、自分たちが何をやらなければいけないかというところをもっと教えてほしいと御意見いただきました。また、もう少し突っ込んだ深い内容の教材提供があってもいいんじゃないかという御意見を頂きました。
 今回、世界中の研究データ管理のためのコースを一通り全部調査して、その中からシラバスを作っていったんですが、どうしても重要だと思う内容をピックアップした形になってしまっていて、ストーリー性が余りなかった。もうちょっとストーリー性があると面白いんじゃないか、やりやすいんじゃないかという御意見を頂きました。
今回、インパクトを与えるという意味もあって、MOOCで提供しましたが、図書館の方々が、大学として受けるからには、限られた受講期間だけではなく、いつでも受けられるような学習環境があるといいなという意見を頂きました。こういったフィードバックを受けて、特に研究支援者のための教材を第二弾として作りました。かつ、ストーリー性を持たせるために、研究のプロセスに沿って支援者が何をやらなければならないかというところをメインターゲットとして教材を作っております。さらに、いつでもこの教材が試せるようにNII(国立情報学研究所)のLMS(学習eラーニングシステム)から教材を提供できるように準備を進めております。
 これがシラバスなのですが、実際にどのようなLMSになっているか御紹介したいと思います。NII(国立情報学研究所)の中でMoodle(オープンソースのLMS)を立ち上げて、学習管理システムなんですけれども、この中で、これが第一弾の教材で、これが第二弾の教材です。NII(国立情報学研究所)が提供できる教材ということで、セキュリティラーニングの教材もこの管理システムの中に入れて、機関としてNII(国立情報学研究所)が提供するeラーニングシステムにアクセスしてもらえるような形でこの環境を提供しようと思っております。
 
 今回は、第1章から6章構成で、研究のプロセスに沿って研究支援者が何をしなければならないかというのをまとめた内容になっております。こちらが序論のサンプルですが、このように、一番初めだけNII(国立情報学研究所)のキャラクターであるビットくんが出てきて、研究データに関して、この章ではこういうことを学びます、というのを説明した後に、1.2からはストイックに教材を提供して、支援者がそれぞれの研究フェーズで何をやらなければならないのかを学べるようになっております。
 私は一通りこれを受講しておりますが、このLMSでは、一通りコースの受講が完了したらこういうふうにバッジがもらえます。バッジがもらえた人のデータなど、大学の管理者は、どの人がここまで受講できたというデータを抽出できるようになっております。それによって、セキュリティラーニングもそうですが、誰がどのぐらい受講しているかを、大学の管理者が見られるような仕組みを提供しております。
 この研究データ管理のためのトレーニングコースですが、一通りコンテンツができて、LMSも用意できましたので、今後、まずは実験をしようと思っています。8月から10月にかけて、このあたりの参加機関に協力を頂きながら、教材とか、システム運用方法、内容に関しても含めてですが、チェック、フィードバックしていただいて、来年度ぐらいから運用フェーズでサービスが提供できればと思っています。
 今回図書館の方々の集まりの場をお借りして参加機関を募りましたが、面白かったのは、我々、大学だけをメインターゲットとしようと思っていたところ、こういった企業の方々も、是非とも実験に参加して、このデータ管理について、NII(国立情報学研究所)でどういう教材を提供しているのか、場合によっては、企業でこの教材を使ってみたいというお声を頂いております。
 私がオープンサイエンスのシンポジウムなどで話をした後も同じような経験があるのですが、大学の方々から話した後に質問を頂くと同時に、特に中小企業の方々から、企業内での研究データ管理というものに実は困っていて、そこにこの学術での取組、あるいはシステムを使えないか、何かフィードバック、連携はできないかというお声がけを頂くことがよくあります。我々、NII(国立情報学研究所)は、大学共同利用機関ですが、ここはちょっと視野を広げながら、大学じゃないところからもより面白いフィードバックを得られることもできると思いますので、連携しながら、大学、企業、それぞれの方々を実験に招きながらプロジェクトを進めていきたいと思います。
 最後は、研究データ管理計画の支援ツールなのですけれども、今、イギリスのDCC(Data Curation Center)と、アメリカ・カリフォルニアのデジタルライブラリーなどが協力して、新しいDMP Roadmapというサービスを作っています。初めのバージョンができたばかりですが、それを日本も一緒にやらないかというのでずっとお声がけを頂いて、実際に具体的に日本語化して、NII(国立情報学研究所)のサーバーにインストールし、日本語化したところなのですが、まずは使ってみるというテストのフェーズに今入っております。
 この研究データの管理計画を作るためのツールなのですが、こういったインターフェースになっていて、まず研究を、これを資金配分機関に研究データ管理計画を提出するためのドキュメントを作成するというのが本題なのですけれども、こういった質問、資金配分機関ごとのテンプレートに沿って、質問内容に沿ってそれに答えていき、最後、それをエクスポートしたりPDF化したりして、研究者がそれを手元に受けて、研究公募のときに一緒に提出できるサービスになっています。
 基本的な機能自体はこの中でできていると思うのですが、実際使ってみると、使いにくいところとか、日本だともうちょっと改善できるのじゃないかなというところも幾つか見受けられます。ただ、まだ我々、研究データ管理計画自体、どういうふうにするのがいいのかという広い議論の場というのが、RDUF(研究データ利活用協議会)の中ではあるのですよね。
【小賀坂部長】  はい。
【山地教授】  そういうところに、NII(国立情報学研究所)は余り深い議論を参加して議論できていないので、まずは、我々、もしツールを提供する立場になったときに、ここにどういった機能が必要なのかといところを議論するというところからより具体的に進めていきたいなと思っております。
 そのときに、研究データ管理計画に関しては、日本はオープンサイエンスも含めて、後発なので、後発のメリットを生かしてうまくジャンプして、先進国、欧米に近づけないかというところも一緒に考えたいなと思っています。
 欧米の研究データ管理計画を作るためのディスカッションでは、RDA(研究データ同盟)なんかで具体的に議論されているのですけれども、マシンアクショナブルとか、マシンリーダブルなDMPとは何かという、どういうふうに使うんだという議論がなされているんですけれども、我々、今まで歴史がないというメリットを生かしながら、そういうところに一足飛びに行けるようなやり方というのもあってもいいんじゃないかなと思います。
 加えて、我々、研究データの管理システムを作っておりますので、それとうまく連携しながら、プロジェクトを開始するときにこのDMPを最低限活用できるような機能提供をやっていきたいと思っております。
 最後に、海外の例を見ても、DMPというのは研究費の助成機関に書類を提出するためのサービスというふうに認識されがちですが、そうではなくて、例えば研究倫理とか個人情報保護で、プロジェクトを始めるときにどの研究者も意識してそこからスタートするように、今後研究をスタートするときには、研究データの管理計画を作って、それをマニフェストファイルにして、マニフェストにしたがって研究プロジェクトを推進していくと。研究プロジェクトを推進していく中で、データの管理の仕方が徐々に変わっていくのだったら、それを修正しながら進めていくような、よりアクティブに研究者がプロジェクト管理するためのシステムであったり、ドキュメントとしてこの研究データの管理計画を使うという見方でシステムを作っていったり普及をさせていくというのもありなんじゃないかなと思っております。こういったところも視野を極力広げながら、日本なりの、新しい研究データの管理計画作成ツールやサービスを作っていきたいと思っております。
 以上でございます。
【引原主査代理】  山地先生、どうもありがとうございました。それでは、ここで全体を通しまして、御質問、御意見頂けたらと思います。よろしくお願いいたします。
【谷藤委員】  小賀坂先生、山地先生、どうもありがとうございました。JST(科学技術振興機構)の取組の中で、日本がいよいよ機械学習という潮流に向けて、日本のジャーナルプラットフォームを一段上げるという方向を持っているということを知り、大変に心強く思うところです。日本のプラットフォームであるからこそ、多分日本語も英語も対応するという御検討ではないかと思います。機械可読化するというと、そこから知識抽出するためには、ある程度辞書を持つ必要が生じるのですけれども、それは今回のこのJ-STAGE Dataの方では視野に入れておられるんですか。
【小賀坂部長】  ありがとうございます。J-STAGE Dataの方は、データの置き場所の方なので、そちらではなく、XML化推進の方の御質問かと思うんですけれども、今の御質問は、機械可読化されたリソースをどう分析するかという御質問かと思います。J-STAGEの方でそこまで提供することは今考えておりませんが、一方で、文献情報提供事業の方では、日本語による科学技術用語の辞書は持っておりますので、ニーズがあれば、それも用いた分析ツールの開発は視野に入るかとは思います。現状、何か固まったプランがあるわけではございませんが、辞書については保有をしております。
【谷藤委員】  この流れというのは、大変速いスピードで世の中は進んでおり、データを集めると言っていることが単にファイルを置いておくということを更に超えたところに状況はあるのですけれども、日本がこの潮流に遅れる一つの理由が、日本語対応は日本人がやるしかない領域でありまして、英語文献からのデータ知識抽出というのは既に海外では更に先に進んでいる状況を見ると、日本語文化ゆえの知識抽出に向けたXML出版、つまり、J-STAGEというプラットフォームで、XML形式で論文を出すということのその次にあるビジョンを、J-STAGEを利用されている学協会の団体に是非時間的緊迫感を持ってリードしていただけるといいのではないかと思います。
 すいません、もう一つ。山地先生への質問なんですが、このプラットフォームが順調に進んでいるということを大変感銘深くお聞きしたところなんですが、私ども物質・材料研究機構でも同じ段階にあって、一つ大きな悩みがあります。それは、研究プロジェクト単位でデータを管理・公開しようと思うと、最近の研究プロジェクトはほとんど単体の団体だけじゃなくて、複数の大学、研究機関、あるいはひょっとすると海外の研究機関も入っているというような資金の持ち方をする場合が多いので、どの機関でその研究プロジェクトの成果を、かたい言い方をすると、責任を持って保管するのかということ、あるいは、責任を持って公開するのか、あるいは、その後、いつまで公開をする約束をするのかというあたりが、ちょうど今、私たち、データポリシーの最終詰めに今あるところなんですけれども、そこはどうするかなと思いながら、内閣府の方でも大学は後からきっとついてくるということだと思うので、どこら辺にいて待っていればいいんだろうとちょっと思っているところなんです。NII(国立情報学研究所)は、その好位置におられるんですけれども、そこの複数の機関が一つのプロジェクトをこのインフラで実現しようとするときは、それぞれの機関で決めてくれればいいという立場におられますか。
【山地教授】  はい、そのとおりです。プロジェクトを実行するときには、GakuNinの中に仮想組織、複数、異なる機関の人たちをまとめてグループにするという機能が、我々、バーチャルオーガナイゼーション、VOというんですけれども、その機能があって、その機能を使って、例えばあるPI(Principal Investigator)が立ち上げたプロジェクトのデータを管理するという使い方を想定しております。
 先ほどのデータを例えばどのようにいつまで管理するのかという、そこがまさに今ないところで、データの研究公正のためのポリシーというのはほとんどの大学で今あるんですけれども、その実効性を持たせるためのガイドラインとかインフラというのがないと。特に、例えば大学というのは、谷藤さんのところ、何ペタというストレージを入れようとしていると思うんですけれども、研究機関ほどお金はないので、データ、いつになったら忘れることができるのかとか、消すことができるのかとか、どの段階で、ちょっと数時間かかってもいいから、とりあえず残しておけるようなコールドストレージに持っていけばいいのかというのは、それはより具体的に、インフラ、どの程度のストレージが用意できるかというところも加味しながら、それぞれの機関と一緒にケーススタディを作っていくしかないかなと思っています。
【谷藤委員】  そのときに、各大学、あるいは研究機関でストレージポリシーを使わざるを得なくなりますし、そのときに第三機関に頼むことにすれば、当然セキュリティポリシーも見直す必要が生じるでしょうし、いろいろ派生することが起こるわけですが、そういったところの情報リテラシー教育というのは御予定があるでしょうか。
【山地教授】  今回、第二弾のトレーニングコースの中で、どういった外部ストレージを使うというのが、組織が提供するセキュリティポリシーに準拠できるかというところのさわりは入れております。ただ、それは岡部先生の御専門なので、僕が余り深く言うと墓穴を掘ってしまうんですけれども、今、大学、あるいは研究機関におけるセキュリティポリシーというものも、時代とともにかなりダイナミックに変わっていて、例えば機微情報というものを大学組織としてどう認識すべきか。それをできるだけ、ちょっとやわらかく見て、パブリッククラウドを使うという方法というのはないのかというのが議論されていますよね。なので、そこをうまく同調しながらやっていかないと、どうしてもかたい方にばっかりいっちゃうと使いにくいものになってしまうし、お金がかかるものになってしまので、その落としどころの案配というのを見ていく必要があるかなと思います。
【谷藤委員】  ありがとうございました。小賀坂先生への質問に戻るんですが、データ管理計画では、データの管理の仕方は、全面的に申請者に委ねる、以上、終わりという、そういう立場ですね。
【小賀坂部長】  現状はそうです。
【谷藤委員】  分かりました。ありがとうございます。
【小賀坂部長】  今後は分かりません。
【引原主査代理】  逸村先生。
【逸村委員】  逸村です。大変興味深いお話でした。、それぞれ1点ずつお伺いさせてください。まず小賀坂さんの方です。まだ検討中ということだったんですけれども、ビッグデータに基づく機械可読化の推進というのは大変興味深いところです。直接的には29ページになりますでしょうか。現在、多くのジャーナルの論文がPDF形式、29ページだと90%以上で、XML形式は10%未満という、そういうお話でしたが、やはりこれがネックになっていると思います。そういう意味では、XML形式というか、機械化の目標値というか、要は、これが高まればいろいろ状況も一気に変わると。逆に言うと、低いままだから、状況が進まないという、そういう印象があります。そこら辺に関して何か目標値みたいなものは御計画されていらっしゃるんでしょうか。
【小賀坂部長】  基本的には、100%機械可読化にしたいと思っております。いわゆる紙から起こして電子化しているわけではありませんで、もともと電子媒体で原稿は投稿されていますので、ワークフローを工夫するだけだと思っております。
 XML化については、学協会編集事務局もいろいろでございますので、必ずしも技術志向の事務局ばかりではないので、技術的にハードルが高いということ、コストもかかるということなので、そこを取り除くということによって、原理的には障壁はなくなるものと考えております。
【山地教授】  NII(国立情報学研究所)の中でもテキストマイニングをやっているんですけれども、細かい数字は忘れたんですが、最近結構論文レベルだと、中身が読めるようになってきています。当然図表も認識できるし、その中の数式とかキャプションというのも区別して分かるようになってきておりますので、当然ボーンXMLで来ると、それにこしたことないんですけれども、並行してPDFも、どうしてもやっぱりロングテールの方はPDFで上がってくるものあると思いますので、協力しながら、そういうふうなところもやっていきたいなと思っています。
 例えばOpenAIREの活動とかを見ていると、がんがんテキストマイニングするんですね。その中で、彼らは、JSPS(日本学術振興会)の英語での謝辞の書き方を教えてくれと言うんですね。彼らが持っている論文のテキストマイニングした中でのJSPS(日本学術振興会)に係る資金のソースというのをメタデータ化して、例えばホライズン2020とマッチングファンドしているかどうかとか、そういうところまで海外の人たちはやっているので、PDFからより深く見ていくというのも並行してやる必要はあるのかなという気はします。
【小賀坂部長】  補足です。海外のいわゆる大手出版社は既に高機能のワークフローを持っているので、余りこのあたり苦労はないのですが、やっぱりJ-STAGEの特徴としては、トップジャーナルが数十から100あるのですが、多くはロングテールであり、日本語の情報資産なんですね。そこはまだまだテクノロジーの恩恵がもたらされていない世界なので、そこをてこ入れしたいと。
 ちょっと本質的ではありませんけれども、山地先生、謝辞の機械可読化ということをおっしゃいましたけれども、謝辞情報における資金情報については、むしろ謝辞を可読化するのではなくて、メタデータ化するという方向でも取組が行われていて、最新のJATS(Journal Article Tag Suite)には、ファンディングソースというタグが設けられているそうなので、それも併せて進むのではないかと思います。
【逸村委員】  ありがとうございました。
【引原主査代理】  よろしいですか。竹内先生。
【竹内委員】  竹内でございます。ありがとうございます。お二人に、大変興味深い、また極めて有益な御報告いただいて、大変参考になりました。現段階ではこういうことを言ってはいけないのかなと思いながらあえて言わせていただきますが、小賀坂さんの方の御説明でございましたJ-STAGE Dataと、それから、山地先生の方の御紹介の中にあった研究データ3基盤としてのWEKOの関係というのはどういうふうに理解すればいいのでしょうか。J-STAGE Dataの方では、J-STAGE登載論文の関係データを登録するリポジトリとしてこれを構築するという方向性が示されておりまして、一方で、これは統合イノベーション戦略などでも言われていることですけれども、大学発の研究成果とそのデータの発信については、各大学の機関リポジトリがその担い手になるというような方向性が出されていて、恐らく山地先生が御説明になったWEKOでのデータ、オープンサイエンスの実現というのはそういう方向性に乗っているものだと思います。
 そうすると、若干重複する部分とかが出てくるのではないかと思うわけで、それはどういうふうに調整するものなのだろうかということと、あと、日本の研究成果というのは、特に科学、工学、医学の領域では、それをよしとするかどうかという議論は別にして、多くが海外の出版社に刊行されるジャーナルに掲載されているということになってしまっているわけで、我々としては、研究データに関しては、海外での管理に依存するのではなく、国内で管理して、それが今後進むであろう人工知能などを使った様々な新たな研究の取組につながるように、あるいは、それに使いやすいように維持をしていくという方向がもう一つ重要なのではないかなと思っております。
 J-Stage Data とNIIの2つの計画の方向性というのは、若干重複している部分がありつつ、なおかつ、その一方で、海外にどんどん発表されている論文のデータの受け皿というのはどこになるのかが見えないわけです。大学であれば全て機関リポジトリというのはあるかもしれませんけれども、先ほど興味深く伺ったような民間企業がデータ管理をしたいというような方向性を示されている中で、その受け皿はどこになるんだろうというのがちょっと疑問に思ったところです。
 以上です。
【小賀坂部長】  J-STAGEの方のリポジトリについては、システム的には、これは自前で作るものではありませんで、NII(国立情報学研究所)で整備されているシステムを一つこのために、買うことを想定しております。
 また、機関リポジトリの活用とのすみ分けについては、客観的に見て、全てのニーズを機関リポジトリで満たせるとも限らないという一般原則に立つと、ジャーナル専用のリポジトリという機能を、バリエーションとして備えておく必要があろうと思います。
 それから、海外の雑誌に投稿されたデータについてということについては、これはシステムの話ではなくて、ポリシーの話なので、それが本当に必要であれば、資金配分事業ないしは研究機関が、自機関ないし自制度からデータについては、どこどこにデポジットすることというハードなポリシーを定めるということは可能性として考えられます。現に中国はそういうことやっているということですが。ただ、これは、政策の話なので、慎重な議論が必要とは思います。
【山地教授】  研究者としては、やっぱり分野というところが一番目の行くところですし、海外のジャーナルのポリシーもあって、機関リポジトリとしては、まず海外のジャーナルから見てトラステッドデータベースであるというふうに証明されるためにはどうしなければいけないかというのを考える必要がありますよね。
彼らは今までまだドメインベースドなリポジトリしか見ていないので、スケールするためには、例えばJPCOAR(オープンアクセスリポジトリ推進協会)みたいなところが一つの集約機関になって、そこで証明したものが更に証明されるようなトラステッドデータベースの認証のヒエラルキー構造みたいなものを世界的に作っていく必要がきっとあるのではないかなと思います。それに対してまだ何のアイデアもないし、何もアクションしていないのですけれども、それをやっていかないと、機関リポジトリの価値というもの自体が認められないのではないかなという気がします。
【竹内委員】  ありがとうございます。まさにおっしゃるとおりだろうと私も思います。山地先生にもう一つ伺いたいのは、研究データの3基盤というところで、管理・公開という仕分けがされていて、管理という中には、先ほどお話がありましたけれども、共同研究のグループが出てくるということになっていたと思うんですが、ただ、研究データの実際を考えたときに、非常にクローズドな共同研究を日頃からやっていて、本当に完全に個人のポケットの中までをお互いに見せ合うというような環境と、WEKOなどのように、誰でも、産業界の方に対してでもオープンにするというものの中間があるんじゃないかという気がするんですね。つまり、それなりに狭いコミュニティの中では、共同研究をやっている、やっていないにかかかわらずある程度共有できるというような中間的なものです。つまり、公開と自分の中で抱え込んでおくという完全なクローズの中間という、3つの段階があるような気がしていて、きょう伺ったお話の中だと、その真ん中の部分というのがまだちょっと具体的に見えてこないんですけれども、そのあたりについてはどういうふうにお考えでしょうか。
【山地教授】  準備もアイデアもないです。オープンサイエンスというのを語るときに、単にオープンの分野だけじゃなくて、セミクローズドなところも含めて、SME(スモール・アンド・ミディアム・エンタープライズ)にどう学術の恩恵をフィードバックできるかというのは大きな問題だと思うんですけれども、システム的にはアクセスコントロールをどうするか。アクセスコントロールするためのアイデンティティーというか、認証をどうするかというところに全てかかってくると思います。例えば企業の方々が持っているアイデンティティーでもって、管理基盤はちょっと厳しいんですけれども、リポジトリなんかに招待できるような仕組みというのはあるかもしれないんですけれども、まだそれは、GakuNinの仕組みも含めて、出来上がっていないというのが現状ですね。
 もし岡部先生、何か、産業も含めたより広いトラストフレームワークをどうすればいいかというのを、アイデアを頂けると逆に有り難いのですが。
【岡部委員】  では、山地先生に御質問したいのですが、国際的な状況としてはいかがですか、今の件については。
【山地教授】  国際的な状況としては、今、産業的なところがアイデンティティーというのが一時ほど余り盛り上がっていない印象です。ただし、国内でも例えばある業界におけるアイデンティティーフェデレーションというのをどう作っていくかという議論もでてきているようです。国内ではなぜ海外に比べて余り動いていないかというと、政府レベルでのアイデンティティーフェデレーションに対する大きな方針というか、仕組みがないので、日本はまだ産業界の認証連携という仕組みが進んでいないのだと思います。OpenID Connectというのが新しいプロトコルであるんですけれども、それを我々が学術の分野で使っているSAMLというプロトコルのフェデレーションにインバイトしてくる仕組みとか連携してくる仕組みというのもありかもしれないのですが、どこまでトラストできるかという、範囲を広げるかというのは、僕はまだどうしたらいいかというのはよく分からないです。
【岡部委員】  私自身もそれ関してきちんと答えられるほど詳しいわけではございませんが、やっぱり一つは、産業界はわりと知財とかに関してきっちりしているので、大学の方でやっている緩いフェデレーションをそのまま使おうという意識は余りお持ちでない。ですから、多分国際的にも余り活発ではないと思います。
 ただ一方で、山地先生がおっしったOpenID connect等の認証連携というのは、一般の利用者に対していろんなサービスを提供するときには広く使われていて、かつ、本人同意を得て、個人の動向をうまくビッグデータ化して、それを新しいサービス創出のいろんなアイデアをとるのに使うみたいなことは行われていますので、そういう観点での産業界を含めて一般との連携というのはこれからもどんどんあり得ると思います。
【山地教授】  これは竹内先生の質問に対する答えにはなっていないのですけれども、今、谷藤さんのところで、我々の管理基盤をNIMS(物質・材料研究機構)の中で入れていただいて使っていただくというトライアルをやろうとしています。我々の管理基盤は、インターネット上でのサービスなんですが、物質材料のデータはセンシティブなので、よりクローズドな状況で、多分NIMS(物質・材料研究機構)の中とか、あるいはある企業だけに使っていただけるような、それはある意味、逆にセキュアな環境になってしまうんですけれども、産業界との連携として研究機関で我々のものを入れて使っていただくという取組も並行してあります。竹内先生がおっしゃるように、真ん中があった方がいいんじゃないかというのはそのとおりで、それは我々今議論で欠けているところで、それは引き続き検討していきたいなと思います。
【引原主査代理】  いかがでしょうか。
【谷藤委員】  補足すると、オープンサイエンスの目的の、能書きの最初の1段落目で必ずイノベーションとか、産業利用、あのくだりは、オープンサイエンスというか、オープンアクセスの神髄とは相反するというのが、きょうは議長が引原先生なのであえて発言をするのですが。なぜかというと、本当にこの恩恵を受けたければ、大学も研究機関も、もちろん産業も使えなければいけない。だけど、産業は、テイクはするがギブはしない。それが本質ですよね。そうすると、研究基盤に一緒にやりましょうと言っても、ギブはしなくてテイクだけする方法を教えてくださいと言われますね。ですので、限りなくそこは制限付き公開という言葉でくくらなければいけない世界になり、結局、公共という100%誰でもアクセスできる世界と100%クローズの世界の間というのが何通りかパターン分けが出てくる。そのパターンをするために、先ほど山地先生がおっしゃった認証・認可が必要になるけれども、実際そこまで踏み込んだ投資ができるかといえば、物質・材料研究機構はできません。そこでお金が尽きてしまう。そうすると、安心・安全でなければデータを預けられないという研究者と、安心・安全を担保してくれなければ、こちらは信用できないので、使いにくいという需要をかなえる方法はなくて、なので、先ほど、どういう、例えば善意の改竄、悪意の改竄とか、いろいろあったときに、一つ一つのことをどうやってデータ基盤側が担保すればいいのかというのは、なかなかエコにはいかない。ここが論理矛盾しています。オープンにしようという気持ちは分かるけれども、実態としては限りなくクローズにできないと、実際には産業には使えないので。産業側は、たくさんデータ管理計画、あるいはデータマネジメントしていこうという声を社内では持っている。それも分かっている。しかし、どうしようか分からないから一緒にやろうと話を持ってくる。じゃあ、それは大学じゃなくて研究機関が受けるのか。そこで、やっぱりお金がないという話になり、ここが堂々巡りでありまして、岡部先生並びに山地先生が、じゃあ、これを使ったらどうかと言ってくださるといいなと、思っていると。以上、補足でありました。
【山地教授】  管理のところはそうなんですけれども、もしオープンできた世界だとするならば、そこはギブ・アンド・テイクというのが多少成り立ってくればいいなというふうに、僕の希望的観測なんですけれども、思っています。これまで例えば民間との共同研究というのは、我々、こういう研究をやっていますとか、テキストベースでの情報のやりとりに基づいたマッチメイキングというのがあったと思うんですけれども、そうじゃなくて、このオープンサイエンスがより広まっていくと、そういったテキストベースとか、ちょっとした説明ベースじゃなくて、データをベースとして、そこがオリジンとなる企業とのマッチメイキングみたいな共同研究のきっかけみたいな世界ができてくるといいなと思います。学術にとってみれば、そこから共同研究の経費というのが得られたり、産学連携ができたりするんだったら、それは学術にとってのテイクになるかなという期待はあります。これは当然谷藤さんがおっしゃっていたことに反論という意味じゃなくて、フェーズが違うところでの期待なんですけれども、そういうふうに思っております。
【引原主査代理】  谷藤先生、それでよろしいですか。
【谷藤委員】  はい。
【引原主査代理】  先ほどお話聞いていた中で、研究のフェーズに合わせてシステムを入れていくという形になっていたと思うんですけれども、JST(科学技術振興機構)の方では、以前に議論させていただいたプレプリントですが、その時点で確保していくということは余り考えていらっしゃらないんですか。
【小賀坂部長】  きょうはちょっと文脈が外れると思ったのでお話ししていませんけれども、J-STAGEジャーナルのためのプレプリントサーバー、若しくは、日本人著者のためのプレプリントサーバーを一応構想はしております。やっぱりこれも言われていますけれども、リサーチワークフローにおける研究成果発信のフェーズが前倒し、前倒しになってきているということが一つと、それから、研究成果発信の手段が多様化しているということに伴って、いろいろなツールが登場するんですけれども、そこで何が起きるかというと、例によって、メガジャーナルがリサーチワークフローを全部押さえにかかっているという現状があります。かつて論文の世界で起こったことが、その他のワークフローでも起ころうとしているということです。それに対してJST(科学技術振興機構)とてしは、少なくともJ-STAGEというプラットフォームを使っているジャーナルについては、同等の環境を用意しなければならないということで、取組を考えております。その他についても本当はオールジャパンで考えるべきだと思いますけれども。
【引原主査代理】  お聞きした理由は、お話を聞いていますと、最終的に論文にまつわるデータであるとか、論文をベースとした、さかのぼった話になってくると思いますけれども、今はさかのぼるんじゃなくても、研究が始まったところから確保していかないと、論文の方を押さえられたら全部前に戻って押さえられてしまという危険性が非常に高いんじゃないかなということです。これは北森先生もずっと言っていらっしゃることでして、ですから、今のフェーズの中でもう少しそこを曲げないといけないかもしれないなというのは印象としてありまして、データマネジメントシステムの中で、最初に確保してどこに出してもいいけれども、ここに確保して構築した上で、いいところを選んで出してくださいねというような流れであるならば、皆さん使いやすいんじゃないかなという気がするんです。その辺はいかがですか、山地先生。
【山地教授】  そのとおりだと思います。そのとおりで、先ほど引原先生がおっしゃったところのプレプリントというのは、具体的に国内ではほとんど何の動きもなくて、海外に頼っているので、JST(科学技術振興機構)に立てていただけるんだったら、すごく楽しみだなと思います。そこで、単純な今までのワークフローだけじゃなくて、ポストレビューしたりとか、オープンレビューしたりとか、国際的にはいろんな取組をやろうとしているわけですね。そういうのも試していける基盤というか、自分たちが持っている機械があるというのは非常にエネルギーというか、パワーになるなと思います。
 別のところでこういう話をすると、アーカイブがあるからわざわざやらなくていいよと言われるんですけれども、我々はアーカイブとも密に連携しておりますし、アーカイブに頼ったとしても、それはお金がかかっているわけで、それは日本として、やっぱりその分、我々が使っている分はお金を払わなければいけないわけなので、そうすると、ある程度コントロールできる領域というのは残した上で、そこに登録したもの、JST(科学技術振興機構)のプレプリントサーバーに登録したものも、例えばアーカイブにも自動的に流れるとか、そういった連携の仕組みで、研究者の利便性を損なわないように、でも、かつ一番気持ちのいい方法でデータと学術情報がきちんと主体的に保存できるというような仕組みを作っていきたいなと思います。
【引原主査代理】  ありがとうございます。岡部先生。
【岡部委員】  岡部です。きょうは小賀坂さんに電子ジャーナルプラットフォームのJ-STAGEを発展させたエビデンスデータも入れられるJ-STAGE Dataの構想の話をしていただきましたし、山地先生にはNII(国立情報学研究所)の機関リポジトリであるJAIRO Cloudの発展としてデータを取り込めるWEKO3の話をしていただいたと。でも、いずれもそれは出版された論文に対してのエビデンスデータという形で、引原先生がおっしゃっているのは、そのもっと前の段階、研究段階からということで、それが山地先生がおっしゃったGakuNin-RDMだと思うのです。研究の段階からGakuNin-RDMを使うことによって、いわゆる10年保存の問題とかも自動的に対応でき、かつ、出版するときには任意のプラットフォームにデータをエビデンスデータとして出したいものだけ出せると。
 そこで、先ほどちょっとお話しいただいた、研究者をどういうふうに管理するかということで、GakuNin-RDMではバーチャルオーガナイゼーションというのを定義されて、そこにいろんな所属機関の研究者が入れるようにするというところ、そこまでは私も理解できるんですけれども、多分大事なのは、そういう研究段階の研究者というのはしばしば機関を異動しますよね。あるいは、もちろん研究者の追加とかもありますし、その際に一体そのポリシーを誰がコントロールするのか。大学としてのデータポリシーみたいなものを当然考えてはいるんですが、機関を移った途端何か話が変わってしまったら回らないということで、考えていただかないといけないのは、一つは、GakuNin-RDMで動かしているシステムそのものが研究者の異動、特に研究代表者の異動に対してきちんと対応できること。これは技術的にある程度解決できると思うんですけれども、加えて、そういうときに、データポリシーが研究者の異動にとって不整合が生じないようにする。例えばいわゆる国の資金で受託研究としている場合には資金配分機関の方である程度ポリシーをコントロールできると思うんですけれども、科研費のように補助金としている場合、あるいは大学の運営費交付金、その他自主的財源で研究している場合、共同研究なんかの場合に、所属機関が変わることによってポリシーがぶれないように。そういう意味では、データポリシーを大学で定めていくということをNII(国立情報学研究所)として是非やっていただきたいと思っておるんですが、その際に、研究者の異動に対応する。そういう意味で、全ての大学で同じポリシーになっていることが望ましいと思うんですけれども、かつ、その間で異動した場合にも対応できるようにということをお考えいただきたいと思います。
 以上です。
【小賀坂部長】  今のお話はいわゆるデータポリシーのハーモナイゼーションというか、統一化という話に関連していて、これは国際的にも大変問題になっております。テクニカルには、例えばアメリカの研究者は、二十幾つの資金配分元に対して全部違うDMPを出さなきゃいけないとか、そういう実用的なこともありますし、まさに先生御指摘のデータの所有権に対する考え方について、機関間の違い、それから、機関のものと研究資金制度との違いというのも起こってきます。少なくともそれは国際的にも問題になっているので、余り時間をおかずに、ハーモナイゼーションの動きは、少なくとも国内において動かなければならないという認識は持っております。
 具体的に言いますと、谷藤委員が委員長をやっておられます研究データ利活用協議会のDMP小委員会というのがございまして、そういうところを舞台として議論が展開できればというようなことも、その取組の一つとして可能かなと思っております。
【引原主査代理】  よろしいですか。今の点はまだ日本ではデータポリシーが全然立ち上がっていない状況の中で、ハーモナイゼーション以前の問題でして、全部向こうのポリシーで牛耳られてしまうというのが現状で、早急にこれは立ち上げないといけないという警鐘を言っていただいていると思うんです。それはその以前のオープンアクセスのポリシーも同じ状況でして、ほとんど相手のポリシーのままにやっていますよね。その緊迫感が余りにもないのではないかというのが、この委員会でもそうですし、別の委員会でもかなり気になっているところなんです。なかなか日本の学協会も動かないという状況もあります。まずこれをどうしたらいいかというのが、システムは出来上がっていくけれども、肝腎のポリシーが伴わないという状況、資金配分機関がもっとプッシュするということはされないんですか。要するに、機関としてデータポリシーを持たなかったら資金提供しないですよと言われるとか。
【小賀坂部長】  前例がございまして、研究公正に対する取組を行っていないとその機関所属研究者は出せないという、そういう仕組みがありました。しかし逆に申しますと、対象となる機関がデータポリシーを定め得るような環境にあるかどうか、ガバナンスも含めて、そうしたこととのバランスかとは思います。資金配分機関がそういうことを言うのは可能なんですけれども、実行可能かどうかということとも関わってくるので、資金配分機関がプッシュするだけではなく、全体的に底上げがなされることが望ましいのかなと思います。
【引原主査代理】  何年か後にはもうそれでいきますからというような考え方も当然あると思うんですけれども、資金配分がない場合はこのポリシーに従ってくださいというのが普通だと思うんですね。やり方として。何もない状態で、何も守れないまま、データを上げていくということは非常に危ないことだと私は思います.それは、日本のシステム、それでいいんだということになってしまいますので、やはり何らかの方向付けはしないといけないんじゃないかなというのが、ここは違いますけれども、内閣府の方は、それは国立研究開発法人の方にまず動いたということになります。国立研究開発法人が動いたら当然他もということがありますから、やはり資金配分機関としての主張は明確にされた方がいいのではないかなといつも思っています。山地先生。
【山地教授】  資金配分機関が義務化とかポリシーについて進めていただけるというのは非常に心強いんですが、それと同時に、オープンアクセスのときの大きな失敗というか、よくなかった点は、図書館の人たちは一生懸命やっていた。機関リポジトリもトータルで800近くあって、インフラも整備できていた。何が足らないかというと、教員としてのオープンアクセスに対する意識というのが、日本はなかなか哲学観というところも含めて普及できていないというのが、海外と比べるとちょっとビハインドだなというふうな状況にありますよね。ドイツの学長協会が、Elsevierはもうボイコットだと決めて、最近また本当に交渉決裂というふうにアナウンスしていますけれども、教員自体が学術情報流通とか、今回の場合は研究データ管理なんですけれども、執行部も含めて、意識できるように何とかならないのかなと思います。
 特に研究データ管理というのは、大学としての資産をどう守っていくかというのと同時に、大学としての評価をどうするかとか、大学としてのブランディングをどうするかというところともより直結する話になりますので、そこが同調できるような仕組みというか、取組というのも、僕らはインフラ屋なので、一生懸命に機械を作っていくんですけれども、学術情報委員会みたいなところからアプローチしていただけると有り難いなと思います。
【引原主査代理】  ありがとうございます。主査欠席のときに決めるのも何なんですけれども。北森先生、どうぞ。
【北森委員】  お二人の御講演、現状として、DMPとしてのプラットフォームがどう動いているかというのは大変参考になりました。ありがとうございました。
 質問としては、竹内先生と全く同じ質問だったので、そこはいいんですが、ちょっとコメントになるかもしれません。今の議論の教員がどうなっているんだと、大学人として。全体の大きな動きを見ていると、やっぱりDMPのプラットフォームを何とかしようとしている層と我々現場の教員の層と大きくかい離しているような気がしてならないんですね。そこが一番のこの議論の問題じゃないかなと感じています。
 例えば具体的にどういうことかというと、常に議論としては出ているんですけれども、我々教員は、ジャーナルに論文を発表するというのがある意味職務でもあるわけですから、そうすると、それはなるべくいい雑誌に出そうとする。ハイインパクトファクタージャーナルを持っていない日本では、自動的に論文は外に行く形になっているわけですね。なおかつ、まだ日本のサイエンティストに対する評価は非常に高いので、論文を扱う例えば審査員、アソシエイトエディターだとか、何百人もトップサイエンティストがそれをやっているわけですね。それは協力しているわけです、海外の学会に対して。そこで使っている大きなデータベースは、出版社のものを使っていますね。トムソンロイターのスカラーワンシステムだと、ほとんどのアソシエイトエディターが使っているんじゃないかと思います。そことCiNiiとを比較したら大変申し訳ないんですけれども、圧倒的な規模と機能に差があるわけですよね。そうすると、どんどん海外の方に出ていく潮流に既に教員は乗っかっているという状態にあるわけですね。
 そういう教員層が国外に向いている流れと、ようやっと動き出したDMPのプラットフォームの構築する国内の状況、ポリシーをメイキングする研究振興局の皆さんか内閣府が統合的に見ておられるところかもしれないですが、そことの議論が全部何となくかみ合っていないという以前に、接触する点がないような気がしております。
 さらに状況をややこしくしているのは、海外の学会イコール出版社であるというのがここでも何回も発言してきたことです。日本の大手の出版社より何倍も大きな出版社が海外の学会でもあって、資金の流れとしても、自前でできるところと自分では何もできない日本の学会とでは大きく違うので、ここにも大きな流れの、行き違いと言っていいのかもしれませんが、があるように見えるんですね。
 ですから、大きな流れとして、どこに話合いの不連続性がある、あるいは資金の不連続性があるのかと。そういうところを見ていかないとなかなかこの問題は解決しないんじゃないかなというのがきょうのお話を伺っていて感じたことです。
【引原主査代理】  ありがとうございます。非常に貴重な話で、いろんなところで座長をやっていて、まさにそれを感じることでして、産業界の話にいくと、産業界とのギャップが当然ありますから、国内での温度差も大きいですし、大学の中でも温度差がかなりあります。研究者と大学の執行部との間のかい離というのも当然ありますので、この話自身、学術情報委員会としてどういうふうに発信していくかというのも、主査が帰ってこられてからになると思いますけれども、きょうのお二人に頂いた発表というか、プレゼンは、次のステップを考える非常にいいきっかけになっていると思いますので、そういう意味で、もう少しここを深めていく必要があるのではないかなというのがきょうの印象です。まとめるつもりはないんですけれども、そういう印象を持っているんですね。そこに全てのものが絡んできていると。知的財産のことも含めて絡んできていますので、どうやってそれをクリアしていくかというのが、やり方としてはいいのかもしれない。その後で、最後、システムについて、情報系のインフラどうするかという話も当然また出てくると思うんです。今はソフトの部分を何とかしようという話ですので、きょう頂いた課題を処理しながら、今後議論させていただきたいなというふうには思っていますが、山地先生と小賀坂部長は何度も登場していただくことになるかもしれないです。この後、システムを動かして、実際、2020年で両方とも動いていくような話をされていたと思うんですけれども、2020年にというのは、何か期限というのは理由があってですか。何か皆さん、2020と。
【小賀坂部長】  JST(科学技術振興機構)は特段を期限を言っておりませんが、JST(科学技術振興機構)が想定しているインフラは、基本的に山地先生が開発されるインフラに依存しますので、よろしくお願いします。
【山地教授】  できるだけ前倒しできるように、フィジビリティスタディからでも用意できるようにします。リポジトリの方は、そんなにクリティカルではないんですね、サービスとして。ただ、管理基盤の方は、ほとんどできているんですけれども、このサービスはネットワークと同じぐらい止められないサービスになります。そうすると、運用体制をどういうふうにNII(国立情報学研究所)の中で作っていくかというところも含めて、時間を計算すると、最短でも2020ということなんですが、やっぱりこういうふうにデモして見ていただくと、非常に有り難いことなんですけれども、期待を頂く、高まってきますので、そこは、できるだけ内部でブラックにならないレベルで一生懸命頑張って早めていきたいと思います。
【引原主査代理】  ありがとうございます。予算申請との関係も当然あって、2020が出てくるのかなとは思っていたんですけれども、この夏も実施のフィールドテストというか、大学も協力させてもらうということになっておりますけれども、一般に募ってというのは余り考えられていないんですか。
【山地教授】  管理基盤のGakuNin RDMという閉じた環境でデータを保存するやつは、今年の1回目の実験が終わったところで、今、アンケート、かなり厳しい御意見を皆さんから頂きまして、それをまとめているところです。この閉じた環境での実験というのもそろそろ終わりにして、ベータより、アルファよりもっと前なんですけれども、インターネットに公開して皆さんに使っていただけるようなフェーズに入ろうかなと思っています。
 ただ、運用の体制が十分できていないので、それはあくまでも実験なんですけれども、管理基盤に関しては広くご利用いただける環境を用意します。
 リポジトリに関しても、大体機能はそろってきておりまして、部分的に、実験なり、図書館の方々をメインに、これはまた閉じた環境になると思うんですけれども、利用者のフィードバックを頂けるような機会というのは作っていく予定です。
 トレーニングコースに関しては、どんどんこれはオープンにして、機関として参加して、データ管理の支援者を育てていただけるような環境はできるだけ早く提供したいと思っています。
【引原主査代理】  ありがとうございます。岡部先生。
【岡部委員】  先ほどの北森先生のおっしゃった論文の査読システムが欧米の有力出版社、具体的にトムソンロイターのScalarOne ManuscriptsとElsevierのEditorial Managerに完全に牛耳られているというのは、関係者御存じのとおりで、ただ、そのことに対する危機感というのは、我々日本人だけではなくて、欧米の大学の関係者も強く持っていて、特に、先ほどデータマネジメントの進みぐあいでリストされていましたけれども、コンピューターサイエンスは下の方なんですが、それだからこそ、逆にまだそういう危機感とともに、何か別の選択肢を考える余地があるということで、幾つか、草の根というよりは一段階上のレベルで、オープンソースのそういうものを開発する動きもございます。
 私がおります情報処理学会でも、かつては自前の論文の査読システムを持っておったのですが、とてもセキュリティとか考えると開発していられる状態じゃないということで、今はScalarOne Manuscriptsを使っておるんですけれども、このままでいいのかということは検討しています。
 そこで、ちょっとだけ、先ほど論文データの機械可読化の話がありまして、その中で、日本語対応というお話があったと思うんですけれども、是非その際にお考えいただきたいのは、日本語対応じゃなくて、国際化、多言語対応ということをお考えいただきたい。つまり、特に人文・社会系ですと、いろんな言語が、かつ一つのコンテクストで混ざって出てくるというのは決して珍しくありませんので、我々が安易に日本語化すると、どうしても、JIS日本語文字しか入らないとか、それこそ留学生の名前すら入れられないようなシステムがしばしばできてしまいがちなんですが、そういうことのないよう、いろんな国の人たちの言語がそのまま入れられることをお考えいただければ。そういう動きが多分欧米主導で開発されたものに対して、我々、何か一矢報いるときの強みになるんじゃないかと思います。以上です。
【引原主査代理】  北森先生。
【北森委員】  関連してなんですが、まさに日本の科学者が、海外の先ほどの査読システムだとか、いろいろなファシリティを使いながら日々研究を進めている。それでなおかつ、海外の学会に大きく貢献している日本の科学者は多いわけですね。そこのところの評価という意味では、まだまだ海外の巨大学会から日本の科学者に対する評価は非常に高いものがある。今この時点では交渉する余地があると思うんですね。それなので、海外の学協会と日本の科学者、あるいは学協会が協調していくというのは一つあり得る方向ではないかと。
 これは完全に情報共有とかコメントにすぎないんですけれども、海外の学協会で開催される委員会に対する日本人委員の出席率は圧倒的に悪い。これはデータがあります。各海外の巨大学会も、そういった動向をしっかり把握しているということですね。先ほどもありましたように、我々、教員の側としても、海外の学協会からの自分たちに対する期待、どういう期待があって、我々が何をしなければいけないかということに関してもやはり認識がかなりガラパゴス化しているのではないかなという気がします。このあたりも、どこかで情報発信していかないと、状況をますます悪くするし、それから、これが最後のチャンスかもしれませんね。
【引原主査代理】  そうですね。
【北森委員】  はい、最後のチャンスかもしれません。これを逸してしまうことにもなりかねないかなと思います。
【引原主査代理】  貴重な御意見ありがとうございます。まさに私、去年までarXiv.orgのボードメンバーで行かせていただいて、あそこの交渉事は非常にタフで、新しいカテゴリーを入れていくという議論もあるわけです. 去年からEESS(エクレトリカルエンジニアリングシステムサイエンス)が増え、経済系のものが増えたりというのも、それもやっぱり出ている委員のバックになっている国の出版数というか、そういうのが発言力になっているんですね。日本の場合、EESSだったら、そこへ出していくことをものすごく期待されている。それは今のニューラル系、AI系の基になるようなものが全部こちらにあるからですね。そういう環境設定をする作業というのがやっぱりあって、それはいつの間にか誰かがやってくれているという発想が今まで余りにも多いんじゃないかなというのはそのときに感じたことです。それは日本が今までいい環境を利用させてもらっていたんだったら、これから自分たちで作らないといけないという、その典型的な例じゃないかなと思って帰ってくるんです。
 それはほかの学会でも、北森先生がおっしゃったのは同じことだと思いますので、是非その辺は、学協会への発信を文部科学省としてもやっていただく必要もあるのかもしれないし、日本のコミュニティとして出していくという意味は重要な点じゃないかなと思います。
 
 今、時間大分来ましたけれども、御発言されていない先生方で、何か御発言いただきたい方、したい方いらっしゃいますでしょうか。よろしいでしょうか。
【林上席研究官】  オブザーバーでもいいですか。
【引原主査代理】  どうぞ。
【林上席研究官】  きょうの議論で1点補足させていただきたいのが、学協会の場合は印刷会社に非常に依存しているという現状があるということ。それと、情報産業としての日本の企業が育っていないことが、この学術情報流通の変革をする上で非常に厳しい局面になっているということで、ステークホルダーとして印刷会社やITベンダー、この動き、こちらを活性化するという観点を是非ここに入れていただいて、むしろ、もっと語弊を恐れずに言うと、例えばXML化を推進している日本のJ-STAGEジャーナル、そのほとんどがほんの数社の日本の印刷会社に依存しているということは、裏を返せば、その印刷会社をもっとてこ入れするというか、その印刷業界のてこ入れをすればいいとかという、そういう議論も可能になると思います。ですので、ステークホルダーを支えている実態としてのメタステークホルダー、この人たちにも注目した戦略や議論があるとよろしいんじゃないかと思います。
【引原主査代理】  ありがとうございます。ただ、学術情報出版というのは、今までの紙ベースのものでない時代に来ているので、新しいものが出てきてもいいわけですね。
【林上席研究官】  ですので、ITベンダーと印刷会社とあえて、実はそれは守旧的に並べたというのが趣旨でございます。
【引原主査代理】  ありがとうございます。コメントを頂きました。ほぼ時間になりましたけれども、よろしいでしょうか。
 そうしましたら、お二人の講師の先生、どうもありがとうございました。
 全体の議論もこれで終わりにさせていただきますので、この後は事務局の方で整理をよろしくお願いしたいと思います。よろしいでしょうか。
 では、最後に事務局に、連絡等ございましたら、よろしくお願いします。
【高橋参事官補佐】  本日の議事録については、各委員に御確認いただいた上で公開させていただきます。
 次回、第12回については、9月18日、火曜日、15時半から17時半、場所は未定でございますが、文部科学省内の会議室を予定しております。決まり次第改めて御連絡をさせていただきます。
 本日の配付資料については、後日、事務局よりお送りさせていただきます。
 事務局からは以上でございます。
【引原主査代理】  ありがとうございました。
 そうしましたら、これをもちまして閉会とさせていただきます。どうもありがとうございました。暑い中、お気をつけてお帰りください。

―― 了 ――


お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

麻沼、小原
電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)