資料1 学術情報委員会(第12回:平成30年9月18日)における主な意見

1.理化学研究所・小安重夫氏による発表(ライフサイエンス研究におけるオープンサイエンスの推進)

〔概要〕
○ライフサイエンス分野では、データベースの統合や、データの統一化によりオープンサイエンスに取り組んでおり、1細胞レベルの遺伝子発現パターンのカタログ化や、ヒト常在菌メタゲノムのデータベース化などが国際的な協力の元に推進されている。
○日本では、平成18年ごろに省庁連携による統合データベースの検討が始まり、ライフサイエンス分野においては、平成23年に科学技術振興機構(JST)に設置されたバイオサイエンスデータベースセンター(NBDC)にて、データベースの統合が進んでいる。
○NBDCは平成29年3月に、今後5年をめどに取り組むべき内容をまとめた。この中で、支援対象を未公開データまで拡大すること、新たな知識やイノベーションを生み出すデータベースを構築すること、持続可能なデータ整備、統合のために体制を整備することなどを提言した。
○データベースを継続させるためには、恒久的な財政措置に加えて、バイオインフォマティクス人材の育成とキャリアパスが課題。
○構築したデータベースは、安全であること、誰もが自由に使えること、多くの研究者が参画することが求められる。研究者に使ってもらえるデータベースであるように発信していくことも重要。
○理化学研究所は、あらゆる自然科学分野を統合したデータ基盤の構築を検討中。


2.国立歴史民俗博物館・後藤真氏による発表(人文学におけるオープンサイエンスの現状)

〔概要〕
○人文学分野では、論文に使う資料は、非デジタルな状況としては、あらかじめ公開することが原則。
○資料の公開自体が1つの重要な業績となり、資料集の刊行を主たる研究業績として行っている研究者もいる。
○研究成果の発表の場として、人文学分野は書籍での出版を重視しており、学術単著が最も高い評価を受ける。
○日本の人文学分野の資料は、国文学研究資料館が古典籍の目録と画像データを提供するほか、国立国語研究所が言語情報を蓄積するなど、データとしての蓄積が行われている。
○欧米では文字資料のテキストデータの標準化が進み、これらのデータを基にした人文情報学(DigitalHumanities、情報的技術を応用した人文学研究)へ発展しているが、日本では機械処理できるデータが圧倒的に不足。崩し字がテキストデータ化の障壁となり、画像データや目録データにとどまることが多い。
○歴史的な資料は私有物が多いこと、研究コミュニティが細分化しておりリソースを注げないことも、電子化の障害になっている。
○人文学のオープンサイエンスを推進するために、長期的には、資料のテキストデータの整備や、日本語書籍・論文のデータベース管理が重要と考える。短期的、中期的には、分散化した状況を把握しなおすレベルから始める必要があり、また、研究者からデータを預かるインフラの整備及びその持続性や、学協会の雑誌論文の電子化が必要。


3. 意見交換


〔ライフサイエンス分野の取組について〕
○日本は、他国と比較すると、生物統計や疫学分野にいる情報系人材が少ないため、大学の中で増やしてしていくことが必要。
○バイオインフォマティクス人材を育成するには、研究分野として興味を持ってもらうこと、オン・ザ・ジョブトレーニングを実施することが重要。学生にバイオインフォマティクス分野で活躍する研究者の事例を見せることも効果的ではないか。
○競争の激しい研究分野と、協調して進めていく研究分野がある中でオープンサイエンスを推進するには、一定部分は協調し、特有の事項になったら競争していくことになるのではないか。
○ゲノム情報をオープン化する際、匿名化のルールは定まっていない。配列そのものが個人情報であるため、匿名化ができるのか、どこまで配列を保護するのか、きちんと議論し、どのように国民に還元していくか、という視点で検討していくことが必要。
○論文発表したデータは機関リポジトリで公表していく一方、一般的な汎用性のあるデータはNBDCに統合することが必要ではないか。


〔人文学分野の取組について〕
○論文に使う資料は、あらかじめ公開することが人文学分野における研究者の原則であるが、研究対象の時代や研究分野によって、取組状況に差がある。
○人文学分野におけるオープンサイエンスを国レベルで推進するためには、ワンストップでデータを保管するプラットフォームの整備がスタートライン。
○人文学のデータをグローバルに共有するために、国際学会や協議会で議論が進んでいる。画像データにおいては画像規格IIIFへの対応が進んでいるほか、日本語資料のテキストデータの標準化についても議論が行われている。
○学術雑誌を電子化して公開すると会員が減少するという誤解から反対する研究者がいるので、人文学分野として、電子化について理解・議論を深める必要があるのではないか。
○人文学の研究を支える専門書の出版社は、規模が小さく、出版した書籍を電子化するのは難しい。これらの出版社をうまく補助する仕組みがあるとよいのではないか。


〔予算の枠組みについて〕
○期間に限りのあるプロジェクト型の予算だと、継続的なデータベースの構築が難しい。
○データベース構築を伴う研究の予算は純然たる研究予算とは違う枠組みで措置することが望ましいのではないか。
○各国の資金配分機関では、研究に資金配分するのと同様に、インフラに資金配分する枠組みを持つが、同じ配分機関の中に研究資金とインフラ資金の配分機能が同居しているとその配分割合で議論が起こる。他方、カナダでは、研究インフラに投資する配分機関が独立し、研究資金を配分する機関とは独立性を保つ。


〔全体的なこと〕
○現状、大学や研究所、研究資金配分機関、学会等の各ステークホルダーがそれぞれデータベースを構築しようとしているが、これらを早いうちに統合するか、または、ある程度協調して構築するかしないと、現場の研究者はどのデータベースを利用したらいいかわからない。データベースを使う人の立場にたって検討をしていくことが重要。
○委員会として、上述のような動きが重要であると発信していくべき。
○各分野で様々なデータベースが立ち上がる中、どの研究分野でも共通して利用できるデータベースとして、国立情報学研究所で検討している研究データ基盤が活用できるのではないか。
○人文学の研究者は、資料を公開することが業績になる。理系の研究分野においても、そのような評価の仕組みが広がると、オープンサイエンスの推進につながるのではないか。


お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)