AI for Scienceを支える研究データの管理・利活用と流通の在り方ワーキンググループ(第1回) 議事録

1.日時

令和7年12月24日(水曜日)16時00分~18時00分

2.場所

文部科学省東館17階局4会議室 及び オンラインのハイブリッド形式

3.議題

  1. 主査代理の指名について(非公開)
  2. 議事運営等について
  3. AI for Scienceを支える研究データの管理・利活用及び流通の在り方について
  4. その他

4.出席者

委員

尾上主査、石田委員、江村委員、工藤委員、千葉委員、林委員、宮田委員、矢守委員、若目田委員

文部科学省

淵上研究振興局長、坂下大臣官房審議官(研究振興局及び高等教育政策連携担当)、阿部参事官(情報担当)、土井学術基盤整備室長、麻沼参事官補佐、込山学術調査官、松林学術調査官

オブザーバー

国立情報学研究所
 副所長/アーキテクチャ科学研究系 教授 合田 憲人
 アーキテクチャ科学研究系 教授 栗本 崇
 オープンサイエンス基盤研究センター長 谷藤 幹子
 コンテンツ科学研究系 教授 山地 一禎

5.議事録

【尾上主査】  それでは、定刻になりましたので、科学技術・学術審議会情報委員会AI for Scienceを支える研究データの管理・利活用と流通の在り方ワーキンググループの第1回会合を開催いたします。
 委員の皆様におかれましては、お忙しいところお集まりいただき、ありがとうございます。
 情報委員会の相澤主査からの御指名により、本ワーキンググループの主査を務めさせていただくことになりました尾上でございます。どうぞよろしくお願い申し上げます。円滑な運営に努めたいと思いますので、委員の皆様の御協力をお願い申し上げます。
 本日は、現地出席とオンライン出席のハイブリッドでの開催としております。
 なお、本日の会合においては、本ワーキンググループの主査代理の指名に係る案件がございますので、科学技術・学術審議会情報委員会運営規則第5条に基づき、開会から議事(1)主査代理の指名についてまでの間、非公開とさせていただきます。
 議事(1)が終わり次第、公開となり、報道関係者を含め、傍聴者の方にオンラインで御参加いただきます。
 また、通信状態等に不具合が生じるなど、続行できなかった場合、委員会を中断する可能性がありますので、あらかじめ御了承ください。
 まず、事務局より、本ワーキンググループ委員及び事務局について御紹介をお願い申し上げます。
【麻沼参事官補佐】  事務局でございます。本ワーキンググループの委員につきましては、資料1-2のとおり、10名の先生方に御参画いただいております。本日は、うち9名の方に御出席いただいており、吉田委員におかれましては本日御欠席でございます。また、江村委員におかれましては、本日、30分程度遅れる予定でございます。
 また、本ワーキンググループにつきましては、国立情報学研究所からもオブザーバーとして参画いただいております。本日は合田先生、栗本先生、谷藤先生が現地から、山地先生がオンラインで御参加いただいております。よろしくお願いいたします。
 後ほど、委員の先生方におかれましては、本日初回でございますので、30秒程度で自己紹介をお願いしたいと思っておりますので、よろしくお願いいたします。
 続きまして、事務局の紹介をいたします。
 研究振興局長の淵上でございます。
【淵上研究振興局長】  よろしくお願いします。
【麻沼参事官補佐】  情報担当参事官の阿部でございます。オンラインからの参加でございます。
 学術基盤整備室長の土井でございます。
【土井学術基盤整備室長】  土井でございます。どうぞよろしくお願いします。
【麻沼参事官補佐】  また、私、参事官補佐の麻沼でございます。どうぞよろしくお願いいたします。
 続きまして、本日陪席いたします科学官及び学術調査官を紹介いたします。
 学術調査官の込山先生でございます。
【込山学術調査官】  込山です。よろしくお願いいたします。
【麻沼参事官補佐】  また、オンラインで学術調査官の松林先生が御参加いただいております。
 事務局からの紹介は以上でございます。
【尾上主査】  ありがとうございました。
 次に、配付資料の確認と、ハイブリッド開催に当たっての注意事項について、事務局より御説明をお願いいたします。
【麻沼参事官補佐】  事務局でございます。それでは、議事次第に基づき、配付資料を確認させていただきます。
 現地出席の先生方はお手元の配付資料を、オンラインの先生方はダウンロードいただいている資料を御確認ください。
 議事次第のほう、配付資料一覧が記載ございますとおり、資料1-1から資料5まで、また参考資料は1と2がございます。議事の途中でも構いませんので、欠落等ございましたら事務局までお知らせをお願いいたします。オンラインの先生方は電話で事務局まで御連絡ください。
 続きまして、ハイブリッド開催に当たっての注意事項を申し上げます。
 御発言時を除きまして、マイクは常にミュートに、ビデオは常時オンにしていただくようにお願いいたします。
 通信状況が悪化した場合は、ビデオはオフにしていただければと思います。
 運営の都合上、現地から出席の先生方も含めまして、御発言いただく際には「手を挙げる」ボタンを押して御連絡をお願いいたします。
 尾上主査におかれましては、参加者一覧を常に開いていただくようにしていただき、手のアイコンが表示されている委員の御指名をお願いいたします。
 また、議事録作成のため、速記の方に本日入っていただいております。御発言される際には、お名前をおっしゃってから御発言をお願いいたします。
 また、マイクの数が限られておりますので、現地出席の先生方が発言される場合には大きめの声で御発言をお願いいたします。
 また、トラブルが発生した場合には、現地出席の先生方は手を挙げていただき、オンラインの先生方は電話にて事務局まで御連絡をお願いいたします。
 なお、本日、傍聴希望いただいた方たちにおかれましてはZoomにて御参加いただいております。
 事務局からの御案内は以上でございます。
【尾上主査】  ありがとうございました。
 本日は、主査代理の指名について、こちらは非公開でございます。議事運営等について、AI for Scienceを支える研究データの管理・利活用及び流通の在り方について、その他(補正予算の状況等)の4つの議題を予定しております。
 
------------------------------
科学技術・学術審議会情報委員会運営規則第5条に基づき、議題1は非公開とした。
 
議題1. 主査代理の指名について
------------------------------
 
【尾上主査】  それでは、引き続き議事を進めさせていただきます。
 まず、審議に先立ちまして、文部科学省、淵上研究振興局長より御挨拶いただきます。
【淵上研究振興局長】  ただいま御紹介いただきました研究振興局長の淵上でございます。本日は本年10月に情報委員会の下に設置されましたAI for Scienceを支える研究データの管理・利活用と流通の在り方ワーキンググループの最初の会合ということで、一言御挨拶をさせていただきます。
 先生方には、今回、ワーキンググループの委員をお引受けいただきまして、誠にありがとうございます。心より御礼を申し上げます。
 まず、親委員会であります情報委員会では、生成AIをはじめとする最先端の情報科学技術の研究開発の推進と、あらゆる分野の研究データの保存・管理、流通、活用を支える情報基盤の整備、この2つの側面を一体的に御議論いただいているところでございます。
 一方で、AIを軸に捉えますと、様々な分野における科学研究にAIを組み込むことで、研究の範囲やスピードに飛躍的向上をもたらすAI for Scienceが世界各国で急速に進展しております。文部科学省としましても、この国際潮流と我が国の勝ち筋を見据えつつ、この取組を加速させることが急務であると考えておりまして、令和8年度概算要求においてAI for Scienceを加速するための予算を要求してまいりました。
 先日、当初予算に先立って令和7年度の補正予算が国会で承認されて成立したところでございますが、AI for Science関連予算としましては約1,500億円の補正予算が措置されております。これに基づきまして、さらに取組を加速してまいりたいと考えているところです。
 さらに、次年度、令和8年度からは、第7期の科学技術・イノベーション基本計画が始動する予定でございます。先日、CSTIの基本計画専門調査会でも素案のたたき台が示されたところでございますが、AI for Scienceによる科学研究の革新ということは、この基本計画の知の基盤としての「科学の再興」を実現するための大きな柱として位置づけられているところでございます。
 AI for Scienceの取組を推進することで、将来的にも質・量ともにより多くの研究データが創出され、大量の研究データがAI・オープンサイエンスの観点からも扱われるということが想定されるところでございまして、これらを支えるSINETや研究データ基盤の情報基盤は、新たな科学技術・イノベーションを切り拓くインフラとなることが期待されているところでございます。
 本ワーキングでは、オープンサイエンス、AI for Scienceをしっかりと支えるために、研究データの管理と利活用を促進させて、そして大量のデータを安定的かつ高速に流通させるための情報基盤の在り方について、集中的に御議論をいただく予定でございます。委員の先生方におかれましては忌憚のない御議論をいただけますと大変幸いでございます。どうぞよろしくお願いいたします。
【尾上主査】  ありがとうございました。
 次に、各委員からそれぞれ30秒程度で自己紹介をお願いいたします。
 資料1-2に記載の名簿順で、私から、続きまして石田委員という形で順番にお願いいたします。
 大阪大学で研究と情報推進の担当の理事・副学長を仰せつかっております尾上孝雄でございます。日本の全体の研究力強化であるとか、それを下支えする情報基盤に関する非常に重要な議題を皆様と議論できることを楽しみにしております。どうぞよろしくお願いいたします。
【石田委員】  九州大学データ駆動イノベーション推進本部の石田と申します。もともとの専門は図書館情報学で、情報検索等、自動分類等をやっておりましたけれども、今の所属では研究データ管理支援部門というところにおります関係で、研究データの管理・公開に関する支援、サービスですね、それから、担当している教育組織のほうではそれに関わる人材育成等を今やっております。データセットの再利用に関する傾向等も研究としてはやっておりますので、これらの知見がここに活かせればいいなと思っております。どうぞよろしくお願いいたします。
【尾上主査】  工藤先生、お願いします。
【工藤委員】  大阪大学社会技術共創研究センターで特任准教授をしております工藤郁子と申します。よろしくお願いします。私のもともとの専門は憲法とか情報法とか公共政策でございまして、研究の分野としましては、最近はデータ・AIと法について研究をしており、その観点からこちらにお招きいただいたと理解をしております。ただ、研究対象は割とビジネスの領域に偏っておりましたので、このような科学技術とか研究に関する分野はあんまり触ってこなかったというところでちょっと不安な点もありますが、何か貢献していきたいと思いますので、どうぞよろしくお願いいたします。
【尾上主査】  千葉先生、お願いいたします。
【千葉委員】  東京大学情報基盤センターのセンター長をやっております千葉と申します。よろしくお願いいたします。私の研究分野自体はソフトウエアでございまして、プログラミングですとか、オペレーティングシステムですとか、クラウドですとか、そういったものなんですけれども、現在はセンター長としてスーパーコンピューティングですとかそういう情報基盤のこともやっておりますので、何かしら意見が述べられればと思っております。どうぞよろしくお願いいたします。
【尾上主査】  林様、お願いいたします。
【林委員】  NTTのネットワークサービスシステム研究所から来ました林と申します。よろしくお願いいたします。研究所の名前のとおりネットワークに関する研究開発をしておりまして、最近ですと、オールフォトニクス・ネットワーク(APN)と呼ばれているんですけれども、大容量・低遅延・低消費電力のネットワークをどうやってつくっていくかというところの研究に取り組んでおります。どうぞよろしくお願いいたします。
【尾上主査】  宮田先生、お願いいたします。
【宮田委員】  産業技術総合研究所人工知能研究センターの宮田と申します。私自身は大容量データということではないんですけれども、人間の計測をしたりといったところで研究をしているところでございます。ですので、個人情報的なところですとかそういうところも踏まえた上で様々なデータの流通というのを考えるということで呼んでいただけたのかなと考えておりますので、その辺りで貢献できればと思っております。よろしくお願いいたします。
【尾上主査】  矢守先生、よろしくお願いいたします。
【矢守委員】  朝日大学の矢守と申します。本学では情報教育研究センターのセンター長を仰せつかっております。私の専門分野は通信工学でして、ユーザーの視点からの研究をさせていただいております。現在は、本学において研究データポリシーの策定並びにAIの利活用に関する取りまとめをさせていただいております。どうぞよろしくお願いいたします。
【尾上主査】  若目田先生、よろしくお願いいたします。
【若目田委員】  日本総合研究所の若目田と申します。私、日本総合研究所に所属はしておりますが、経団連であるとかデータ利活用の経済団体のほうで、主に個人データの利活用が自分のモチベーションとして取り組んでいるところでございます。我が国のデータ連携というのは結構危機的状況にあるかなということで民間も危機感を持っているわけでございますけれども、学術利用というものは民間以上に活用が許諾されるべき存在であって、ぜひ学術利用のところから民間活用も含めたきっかけをつくっていけたらなと思ってこの会議にも参加したいと思います。どうぞよろしくお願いいたします。
【尾上主査】  ありがとうございました。
 続いて、議事(2)のワーキンググループの議事運営等について審議に移りたいと思います。
 本日は初回の会合でございますので、本ワーキンググループの議事運営等について定める必要がございます。科学技術・学術審議会情報委員会運営規則第2条第10項において、ワーキンググループの運営に関し必要な事項は、主査がワーキンググループに諮ることとされております。
 まずは、事務局から御説明をお願いいたします。
【麻沼参事官補佐】  事務局でございます。
 まずは、資料2-1を御覧ください。こちらが運営規則になっております。
 第1条により、科学技術・学術審議会、情報委員会の運営規則のほか、本ワーキングの規則の定めるところにより運営することとしております。
 また、第2条によって、情報通信機器を利用してオンライン会議に出席できることとしております。
 また、第3条により、やむを得ない理由によって会議を開く余裕がない場合などにおいて、書面調査を行うことができるとしております。
 また、第4条では、会議及び会議資料は原則公開としております。
 また、第5条で、会議の議事録は原則公開とすること。こちらは、委員の先生方に御確認をいただいた上で公開することとしております。また、透明性を高める観点から、議事録に発言者のお名前は記載することとしております。
 こういったことを定めております。
 また、続きまして、資料2-2を御覧ください。
 こちらがワーキンググループ公開の手続についてという規定になっておりまして、こちらはワーキングを公開するに当たっての手続を定めており、例えば会議の日時ですとか開催の案内については、原則1週間前に文科省のホームページに掲載するといったことを定めております。こちらにのっとってワーキングの公開をしてまいりたいというものでございます。
 事務局からは以上でございます。
【尾上主査】  ありがとうございました。
 資料2-1及び資料2-2により、運営規則の案と公開手続の案をお示ししておりますが、ただいまの御説明を踏まえまして、御質問、御意見等ございますでしょうか。特段問題ございませんでしょうか。
 資料2-1及び資料2-2については、ただいま御説明ありましたとおりで進めてよろしいでしょうか。それでは、案のとおり定めたいと思います。
 
 続いて、議事(3)に移りたいと思います。
 今回は初回の会合ですので、AI for Scienceを支える研究データの管理・利活用と流通に関して、現状・背景や関係する最近の動向等を事務局から説明いただきたいと思います。
 それでは、資料3に基づき、事務局より御説明をお願いいたします。
【土井学術基盤整備室長】  それでは、資料3に基づきまして、AI for Scienceを支える研究データの管理・利活用及び流通の在り方について、現状・背景等について、簡単ではございますけれども、説明をさせていただきたいと思います。
 まず最初に、この研究データの流通を支える学術情報ネットワーク(SINET)についての御説明でございます。SINET、御案内のことと存じますけれども、国立情報学研究所が構築・運用する情報ネットワークでございます。現在、1,000以上の機関で延べ340万人以上が利用されているという学術情報の基盤として運用されているところでございます。2022年の4月からは今のSINET6の運用を開始しております。この日本地図にありますとおり、日本全国を400Gbpsの回線で70か所のデータセンターを網目状に接続しまして、日頃の各大学・研究機関の教育研究活動を支えているところでございます。また、欧州回線、米国回線につきましても、400Gbpsの国際回線で対応しているという状況でございます。
 続きまして、研究データの管理・利活用に相当する部分の基盤についての説明でございます。
 NII RDCと申しまして、大きく3つの基盤から構成されているものでございます。左下にありますデータ管理基盤、GakuNin RDMと呼びますけれども、こちらで研究遂行中の研究データなどを共同研究者間ですとかラボ内で共有・管理しながら研究を進めていただき、成果が取りまとまった時点で、右側にありますデータ公開基盤において公開をしていくと。それらのデータを、今度は上にありますデータ検索基盤(CiNii Research)というものでアカデミアに限らず産業界の方々も含めて広く検索をしていただいてまた新たな研究の芽を見つけていただいて、さらにまたデータ管理基盤等を活用して研究を進めていくと。そういう循環を目指して構築されているというものでございます。
 現在、この研究データ基盤につきましては、「AI等の活用を推進する研究データエコシステム構築事業」、これは令和4年度から来年度、令和8年度までの5年間の事業でございますけれども、この事業で、研究データ基盤の機能高度化のための研究開発と、あとは下のほうにあります理化学研究所や東京大学、名古屋大学、大阪大学をリーダー機関として研究の基盤の活用に係る環境整備ということで、例えば別の研究組織内でのプラットフォームとの連携ですとか、あとはユースケースの創出やルール・ガイドラインの整備や人材育成といった活動を進めているという状況でございます。
 本年の5月には、親委員会の情報委員会において情報基盤の今後の在り方についてを取りまとめていただいているところでございます。昨今の生成AIの利活用の急速な浸透によって研究DXが加速しまして、将来的な研究データの流通などが質・量ともに増大するだろうということと、研究データを共有して、組織・分野・セクターを超えた科学研究を行う重要性がさらに高まるだろうという背景を基に、今後の情報基盤の方向性についておまとめいただいているというところでございます。
 この下の真ん中ほどにありますとおり、今後の情報基盤につきましては、AIを利用するということを前提として、AIを組み込んだエコシステムを構築する必要があるだろうということを筆頭に、あとは産業界や海外との連携ですとか人材の育成・確保等々につきまして方向性をまとめていただいているというところでございます。
 この中間とりまとめの本体は参考資料2におつけしておりますので、後ほど御確認いただければ幸いでございます。
 また、先ほど淵上からの挨拶にも触れておりましたけれども、第7期の科学技術・イノベーション基本計画の素案のたたき台ということで、こちら、総合科学技術・イノベーション会議で検討が進められているものでございます。「第2章 知の基盤としての『科学の再興』」という中で「AI for Scienceによる科学研究の革新」という事項が設けられておりまして、その中でAI for Scienceを支える次世代情報基盤の構築ということが示されております。この中で、国際的なオープンサイエンスの潮流等も踏まえつつ、AI for Scienceを支える研究データの管理・利活用と流通の在り方について検討し、AI時代に適した研究データ基盤(NII RDC)や流通基盤SINETの高度化を推進するといった内容を含めて、ここに記載のとおりの関連するようなことが、今、基本計画の素案のたたき台という中で示されているという状況でございます。
 このAI for Scienceによる科学研究の革新につきましては、日本固有の強みを活かし、ライフサイエンスやマテリアルサイエンスをはじめとした分野横断的・組織横断的な取組を進めるとともに、情報基盤の強化や先端研究設備・機器の戦略的な整備、共用・高度化、大規模集積化等を通じて「AI for Science」の先導的実装に取り組み、科学研究システムを革新するというものでございます。
 下のほうにAIによる研究の加速のイメージということが書かれておりますけれども、従来の研究活動の中にいろいろとAIを活用することで、研究にかける時間の短縮化、それによる研究成果の高効率な創出を目指しているというものでございます。
 このAI for Scienceの推進に向けた基本的な考え方についてということで、多少重複するかもしれませんけれども、AIは科学研究の在り方そのものを変革するのだと。海外におきましては、研究の高度化・高速化が急速に進展しているという一方で、我が国では、本年5月にAI法が成立し、昨日、AI基本計画が閣議決定されているというような状況でございます。この中でも「世界で最もAIを開発・活用しやすい国」を目指すという方針が掲げられているところでございます。日本の強みを活かした「AI for Science」の先導的実装に取り組むことが喫緊の課題と位置づけられているというふうなところでございます。
 日本の強みにつきましては、まず、1つ目の丸にありますとおり、我が国、SINETですとかNII RDCあるいは世界有数の計算基盤、「富岳」等々を筆頭とした計算基盤など、世界にもまれな世界最高水準の情報基盤を有しているということとともに、質の高い実験・観測データですとか基礎科学力の蓄積があると。また、AIやロボットに対する需要や社会的受容性が比較的高くて、AI導入に適した環境が整っているということ。また、中小企業等における先端機器等の製造能力も持っていると。また、世界に先駆けて少子高齢化や人口減少が進展しているということもあり、この人材不足等の課題を抱える日本において、AI for Scienceの推進で「科学の再興」を目指すことが求められているというふうに言えるのではないかなと考えているというところでございます。
 「AI for Science」の推進によって目指す将来像というのがここに示されておりますけれども、先ほども触れさせていただきましたとおり、情報基盤の高度化もさることながら、研究システム、設備や機器の自動・自律・遠隔化による研究データの創出・活用の高効率化ですとか、「科学基盤モデル」の国産開発によるAI駆動型研究開発の強化といったことを同時並行的に進めさせていただいて、これをそれぞれがばらばらではなくてお互いに連携し、相乗効果を生み出すような形で「AI for Science」を進めていくということを目指しているというところでございます。
 基本的な戦略の考え方ということでございますが、まず、1つ目の丸にありますとおり、日本の取るべき基本戦略としては、日本の資産・リソースを十分に活かして、勝ち筋になり得る分野等の研究力を世界トップ水準に引き上げるというところでございます。そのためには、研究インフラの構築・整備は不可欠でございますし、また、日本の勝ち筋となり得る先導的分野等におきましても、データ基盤の充実と分野特化型の科学基盤モデルの開発等といった先駆的取組の早期実装を通じて、世界のトップ水準に引き上げるとともに、萌芽的・探索的研究を推進すると。また、AIにつきましては、信頼できる(信頼される)AIに関する取組や、AIそのものの研究開発(AI for Science)を持続的に強化すると。また、AI関連人材の育成・確保を全てのレイヤーで推進するですとか、また、魅力的な研究環境を構築するということ。そういったことを通じまして、2030年代には、全国どこでも誰でも、AIを使った研究活動が可能となる社会を実現するといったことを検討しているというところでございます。
 今後の方向性と課題等につきましては、ここに丸1から丸6まで示されていますけれども、そのうち丸3、AI for Scienceを支える次世代情報基盤の構築というところで、今後の研究データの管理・活用・流通の在り方ということで、ここが本ワーキングでの主な検討対象となろうかというふうに思っております。これは、流通の基盤と研究データの基盤と、あとは計算基盤と、それを総体的に情報基盤と言っているんですけれども、このうち、流通基盤と研究データ基盤に関してが基本的な本ワーキングでの対象というふうにお考えいただければと思います。とはいえ、計算基盤、「富岳」等々だけでなくて、例えば革新的な計算環境(HPCI)といった話は関連して出てくる話だと思いますし、先生方からの御意見もいろいろ頂戴するような形で、研究データ基盤や流通基盤のあるべき姿というのがより深く鮮明に浮き上がってくるのではないかなと思っておりますので、計算基盤に関する御意見等々もいただきながら、最終的には研究データ基盤・流通基盤の今後の在り方というものを考えていければと考えております。
 続きまして、主な論点(案)ということでございますが、SINETとNII RDCについて、それぞれこのような論点で御検討・御議論いただけるといいのかなと思っております。ただ、これも、これだけにとどまらずに様々な観点があろうかと思いますので、その際には、この論点(案)に縛られることなく、大所高所から御意見やコメントをいただければ幸いでございます。
 あと、今後のスケジュールでございますけれども、本年度につきましては、今、ワーキンググループを年度内に3回程度開催する予定でございます。今回は、流通基盤と研究データ基盤の現在地を、この後、NIIの先生から御発表いただくこととしております。次回、次々回で、次期SINETの在り方ですとか研究データ基盤の方向性等々について御議論を深めていただければと思っております。来年度も4月から6月ぐらいまでの間に開催させていただいて、6月めどには一定の報告書を取りまとめさせていただければ幸いでございます。その後、情報委員会への報告ですとか概算要求の検討へとつなげていきたいと思っておりますし、再来年度、令和9年度以降は、研究データ基盤の高度化等に関する新規事業の開始ですとか、新たなSINETの運用の開始というものを目指していきたいと考えてございます。
 以下は参考の資料ですので、ここでの説明は割愛させていただきたいと思いますけれども、適宜御覧になって、今後の審議・御議論の参考になれば幸いでございます。
 非常に駆け足な説明でございましたけれども、私のほうからは以上でございます。
【尾上主査】  土井室長、ありがとうございます。
 ここまでの御説明で御質問等ございましたら一旦お受けしようと思いますが、委員の皆様方から何か御質問等ございますでしょうか。大丈夫ですか。よろしいですか。あとまた、今回、合田先生から御説明いただいた後、全般的な議論の中でも御質問等受けられると思います。
 それでは、続きまして、今回、SINETと研究データ基盤の実施主体であります国立情報学研究所からオブザーバーの形で御参加いただいております。資料4によりまして、まず、SINET、研究データ基盤等の現状などにつきまして御説明いただき、その後、質疑応答と皆様との間の議論を行いたいと思います。
 では、NIIの合田先生より、資料4に基づき御説明をお願いいたします。
【合田副所長】  国立情報学研究所(NII)の合田でございます。今映っておりますが、「学術研究プラットフォームの現状と今後」というタイトルで御説明させていただきたいと思います。
 この学術研究プラットフォームは何かという話ですけども、先ほど土井室長からも御紹介いただきました我々が運用しております情報基盤、具体的には、右の図にありますけども、研究データ基盤「NII RDC」とネットワーク基盤「SINET」から成る基盤であります。統合イノベーション戦略等におきまして、現在、研究データの利活用ですとか学術におけるデータ駆動型研究の推進がうたわれておりますけども、これに応える基盤として運用しているとお考えいただければと思います。
 中身については先ほど御紹介いただきましたけど、繰り返しになりますが、NII RDCは、研究データといったものを研究者間で管理・公開・検索するための基盤のサービスでありまして、現在、こういった3つの基本サービスに加えて新たな機能の開発等を進めておりまして、この研究データ基盤の利用を促進することでデータ駆動型の研究を支援しようというものでございます。
 ネットワーク基盤「SINET6」は、これも土井室長から御紹介いただきましたけれども、非常に高速かつ安全なネットワークとして全国を結んでいるものであります。また、この有線ネットワーク以外にも、IoT等の活用のために5Gのモバイル網を活用したネットワークサービスも提供しております。さらには、ネットワークの上位レイヤーに相当するサービスですね、例えば高速のデータ転送等を行うですとか、そういった機能の開発・提供も行っているところでございます。
 本日は、このNII RDCとSINET6の現状について御紹介した後で、我々が考えておりますところの今後の将来像についても簡単に御説明させていただきたいと考えております。
 では、まず、研究データ基盤の整備・運営から御説明いたします。
 まず、NII Research Data Cloudですけども、先ほど御説明いただいたところですが、少し詳しめにここは御紹介したいと思います。このNII Research Data Cloud(NII RDC)は、研究データの管理・公開・検索をするそれぞれの基盤サービスから構成されております。研究データの管理って何だという話があるわけですけども、従来は、研究データというのは、研究者が自分で実験ですとか集めて、それを論文にして、データ自体を研究者自身がそれぞれ管理するというのが主だったわけですけども、これからのオープンサイエンスの時代においてはそうではなくて、こういった研究データを研究者間で利活用あるいは分野を超えてそういったデータを共有・利活用することで、我が国の研究力を強化することが求められているところであります。そういった時代になりますと、研究データについてもそれぞればらばらの作法で持っているのはよくないわけで、ある程度一定の方法に基づいて構造化するなり、または一定の方法に基づいてアクセス制限によってしっかり管理・保存するといったことが求められます。こういった作業を行う、こういった処理のことを研究データ管理とお考えいただければと思います。
 このGakuNin RDMというのは、この図の真ん中の絵ですね、この研究データ管理をするためのプラットフォームでありまして、これは研究者はウェブベースで自分の研究データをここに登録すると、それを自分の研究グループ内、また研究者が決めるルールに従ってアクセス制限されながら、しっかりと管理・共有できると。さらには、メタデータをつけるですとか、昨今、研究公正も重要ですので、研究証跡として残せると、こういった機能を提供しているサービスであります。
 右側の研究データ公開基盤、これ、JAIRO Cloudというサービスを私ども提供しております。これは現在、ほぼほとんどの大学において機関リポジトリというのを運営されておりまして、そこで論文等のデータを公開されているところですけども、このJAIRO Cloudは一言で申しますと、機関リポジトリをNIIがホスティングして提供しているサービスと考えていただければと思います。また、今は論文が中心ですけども、今後のオープンサイエンスの時代においては論文のエビデンスとしての研究データの公開というのが義務づけられていきますので、こういった論文とデータをひもづけた形の公開といったものをJAIRO Cloudを通して実施していただけるという状況であります。
 最後の左側のCiNii、データ検索基盤は、国内の研究論文ですとかデータ等の検索エンジンでございます。これ、非常に多くの学術界、企業においても使っていただいております。特に学生さんも非常にたくさん使っていただいているところですけども、こういった検索エンジンを通じて公開されている論文やデータといったものをより一層アクセスしやすくするという目的で運用しているものでございます。
 それでは、個々の基盤サービスの状況、主に利用者数等の統計をお見せしながら御説明したいと思います。
 こちら、まず最初のグラフは、NII RDCのGakuNin RDM、管理基盤の時系列での利用機関数を示したものでございます。これ、先ほどの3基盤の中で一番若いサービスなんですけども、現在、200機関が登録いただいて、お使いいただいています。これは実は我々が予想しているよりも速いペースで進んでおりまして、といいますのは、ある意味、研究データ管理をするというのは研究者にとってみると研究のスタイルを変えるということですので、これには相応の時間がかかると我々は見込んでいたんですけども、大学における研究データ管理に関する意識の高さが予想以上に高まっていることもあってか、非常に右肩上がりで、今、利用が増えているところであります。また、このグラフ、色分けしてありますけども、いわゆる総合大学だけではなくても、理工とか医学等いろいろ様々な分野の利用が今進んでいるという状況であります。
 続きまして、公開基盤JAIRO Cloudであります。このグラフは、JAIRO Cloudも含めて、我が国の大学における機関リポジトリの数を時系列で表しているものであります。このうち水色の部分が大学独自の機関リポジトリを運営しているもの、オレンジ色の部分がJAIRO Cloudを利用いただいているものになりますけども、グラフの一番左側、まずは、この機関リポジトリの各大学の方々が独自のリポジトリを運用するということで我が国では普及が始まりました。その後、私どもJAIRO Cloudのサービスを始めてからは、JAIRO Cloud自体の利用が増えるだけではなくて、この水色の部分、減っているのが分かると思いますけど、従来、自分たちで自前で持っていたリポジトリからJAIRO Cloudに乗り換えていただくというような例も増えておりまして、まさにこういった基盤というのは共通基盤として利用できるものがあると便利ですので、そういった意味で、現在、860以上の機関がこのJAIRO Cloudを利用いただいているという状況であります。
 次はCiNiiの検索基盤であります。このグラフは、棒グラフがCiNiiにおける収録件数、青い折線グラフが検索回数を表しておりまして、こちらも右肩上がりで利用は増えているところで、2024年度の平均ですけども、月当たり約1,100万回以上の検索があるということで、非常に多くの方々から利用いただいているところであります。
 このような3基盤の運用に加えまして、2022年度からここにありますデータエコシステム構築事業の御支援をいただきまして、この3基盤の機能を強化する、絵でいうと真ん中の部分ですけども、強化するとともに、国内の研究所・大学の方々と協力させていただいて、これを全国に展開するという取組を進めております。我々NII自身は、ちょっと字が小さいんですけど、いろんな機能の開発を今行っているところで、加えて、左上の理化学研究所では、こういったデータ基盤というのは各分野においては独自のものを持っている場合がございますので、こういった分野のデータ基盤とNII RDCの連携の方法について検討いただいております。また、左下の東京大学におきましては、NII RDCを使った研究データ利活用の好事例をつくる、ユースケースを開拓するといったことを進めていただいております。右側の名古屋大学、大阪大学におきましては、まず、学内において研究データ管理のルール・ガイドラインをつくるところを名古屋大学、研究データ管理ができる人材も非常に重要でございますので、人材を育成するという部分を大阪大学の方々に担当いただきまして、オールジャパンのチームでデータ利活用の全国展開といったものを進めているところです。
 先ほどのスライドの真ん中にありました新しい機能、これ、実は7つの機能を開発しているんですけども、今日はこのうち2つの機能を御紹介したいと思います。
 1つ目は、コード付帯機能またはデータ解析機能と呼ばれているものであります。これは、GakuNin RDMの上で、いわゆる研究データだけではなくて、データとそれを解析するプログラムをセットで共有できるようにすると。さらには、ほかの研究者の方がこの入力データとプログラムの解析をRDMのウェブの上でポチッとクリックすると、それの解析のプログラムの実行もできるというようなものであります。実行においては計算機が必要ですけども、この図の左のように「このデータを解析して」、ポチッとすると、そこからこのデータとプログラムが、例えば右側にありますmdx等の学術の計算資源上にコピーされて、そこでプログラムの実行も行われて結果が真ん中のように表示されると、こういった一連の作業を自動的にできるというようなサービスであります。このように、データをためるだけではなくて、これを解析して、さらに解析した結果を共有していくという流れがもう既に始まっておりまして、左下の事例1ですけども、これは広島大学で進めていただいている例で、複数のキャンパスからネットワークの運用に関するデータを集めてきて、これをmdxの上で解析して、その結果をGakuNin RDMで管理・共有するといったような動きが既に始まっているところであります。
 2つ目が人材育成の事例であります。これは先ほどもお話ししましたけど、研究データ管理という新しい研究プロセスを進めるためには、それに精通した人材を育成して、かつさらに、その人材の方々が大学の中で研究者に対してそれを広めていくという流れが必要です。しかしながら、世界的にそれができる人材というのは不足しておりますので、私どもNIIで開発・運用しております学認LMSというe-ラーニングのプラットフォームの上で研究データ管理をするためのコンテンツを複数開発しておりまして、これを利用いただくということを進めております。また、こういったコンテンツというのは各組織ごとにカスタマイズ等されると思いますけど、ここについては、先ほどお話ししました大阪大学のチームの方々に、このコンテンツをカスタマイズする機能をつくっていただいたり、または学内に展開いただくといったことも行っていただいておりまして、大学とも協力させていただきながらこういった人材育成に取り組んでいるところであります。
 最後に、RDCの利用例を1つ御紹介したいと思います。こちらは、ムーンショットで東大の合原先生が進めていらっしゃるプロジェクトであります。このプロジェクトでは、医学系の研究者と数理系の研究者が協業いたしまして、包括的な未病のデータベースを構築するということを目的に進めています。これは非常に以前から多くの研究者にも使っていただいておりまして、研究段階におけるメタデータの管理をGakuNin RDMを使って、また、研究成果であるところのカタログ情報の公開・共有をJAIRO Cloudを使って実施していただくということが、今、進んでいるところであります。
 では、ここからはネットワーク基盤の整備と運営の話をさせていただきたいと思います。
 SINETにつきましてはもう御説明する必要はないかと思いますけども、右側の図にありますように、全国70か所を、沖縄は200ギガですけれども、400ギガの非常に高速なネットワークで網目状につないでいるネットワークであります。利用機関は、SINET6開始後も現在でも増え続けておりまして、現在、1,030の機関がSINETに接続されて利用いただいているということになります。接続という意味は、このSINET、70の拠点がありますけども、それぞれの拠点までの回線、これ、アクセス回線といいますが、そこは大学で御用意いただいて、そこから先はNIIが責任を持って運用するという形で運用しているところであります。
 この接続機関数だけではなくて、実際、SINETに流れるデータ通信量も伸びております。これは時系列の図ですけど、2024年で約2エクサバイトのデータが流れておりまして、今後、伸びることが予想されております。これ、年率に直しますと、コロナ期を除きますけども、大体1.3倍から1.4倍に増えているという状況です。日本のインターネットの通信量の増加率は1.2倍と言われていますので、これを見ても学術における通信量の伸びというのは非常に大きいということがお分かりいただけるかと思います。
 また、先ほど御説明したアクセス回線、大学がSINETにつなぐための回線の太さも非常に太くなっております。この左側がその積算の帯域ですけども、SINET5終了時、これ、2021年度、22年の頭に比べても2.5倍に増えておりまして、つまり、大学における通信需要といったものも非常に大きくなっているということがこのグラフから見ていただけるかと思います。
 SINETですけど、この上で様々な高機能のサービスを提供しております。下の3つのグラフ、これはSINETの上でVPNを提供しているもので、これはSINETのルーターレベルでVPNを張りますので、共同研究者間または複数のキャンパスを持つ大学において非常に高速で安全なネットワークを構成できるというものであります。現在、VPN数5,000を超えておりまして、多く利用いただいております。この中には、仮想大学LANというのは、複数のキャンパスを持っている組織の間で1つのVLANでそれをつなぐといったサービスですとか、また、現在、多くクラウドを利用されておりますけども、商用クラウドのデータセンターと大学のキャンパス間をSINETのVPNで直結するというサービスを行っております。これを行うと、クラウド上の計算資源が大学の学内ネットワークの中にあるという形で利用できますので、非常に安全な利用ができるというものであります。左上の部分、自動DDoS Mitigationは新しいサービスでありますけども、SINETの中でDDoSの攻撃に相当することを検知いたしますと、SINETの側でそれを抑止するような機能を提供するものでありまして、これはまだ始めて間もないんですけども、右肩上がりで利用が伸びているというものであります。
 冒頭でSINETは網目状のネットワークを組んでいるとお話ししましたけども、これによって高い信頼性を確保しているという例を1つ御紹介したいと思います。左側の図は2022年の西日本の豪雨のときのものでございまして、このとき、福井と京都間の光ファイバーが切断されてしまったんですけども、こういうことが起きますとこの黄色い点線のような迂回路を瞬時に設定いたしまして、通信を途絶えることがなく提供するということを行っております。右側は当時の通信のトラフィックの状況でありまして、一番上の京都-福井間で障害が発生するとこの通信が止まるんですが、一番下の図、岐阜-彦根間の緑の線を御覧いただければ分かると思うんですが、その瞬間からトラフィック量が上がりまして、要は迂回してデータが流れて、通信を止めずに提供しているということがここからは見てとれるかと思います。
 このようなSINET、非常に幅広い学術分野から利用いただいております。この図は、このうち大型の実験施設での接続状況を表したものでありますけども、ちょっと字が小さくて申し訳ありませんが、需要は非常に伸びております。この図の黒い字は現在の需要で、赤い字が今後の需要なんですけども、今後の需要を見積もっていくと、1拠点で400Gbpsから1Tbpsの通信が欲しいと出てきておりまして、今後も利用増、活発な利用が想定されるところであります。また、こういった研究の中には、ノーベル賞受賞につながるような世界トップレベルの研究も含まれていることを申し添えたいと思います。
 モバイルSINETの御紹介です。モバイルSINETは、先ほど御紹介しましたけど、SINETのSIMというのがありまして、それを実験装置ですとか、スマホでもいいですが、挿していただくとそれがSINETのVPNへつながるというサービスであります。いわゆる有線を引けないような地域での実験に御利用いただいておりまして、左上の図はオホーツク海における流氷ですとか蜃気楼の観測にお使いいただいたりですとか、右側は、車の後ろのトレーラー、これ、移動式の動物のクリニックなんですね。このように遠隔地における研究ですとか、あとは移動中の動物のバイタルのデータを集めるというところにもモバイルSINETを御活用いただいているところであります。
 このほか、時間の関係で全てお話しできませんけど、いろいろな高機能なサービスを展開しております。右側のミラーオンデマンドというのはセキュリティーに関するサービスでありまして、SINETのトラフィックにおきましてちょっと挙動が怪しいといいますか、おかしいものが検知されますと、そのトラフィックをミラーリングして、我々のNII-SOCSというセキュリティーの部門のサーバーのほうに流しまして、そこで最新の技術を用いて分析をすると。分析の結果、問題がある場合は直ちにフィルタリングすると、こういったような機能も提供しているところです。
 国際回線でございます。国際回線も非常に重要でありまして、現在、アメリカと欧州それぞれ400Gbpsのネットワークを敷設いたしまして、国際共同研究に活用いただいておりますし、アジアにつきましてはシンガポールとグアムにそれぞれ100Gbpsの回線を持っておりまして、こちらも活用いただいているところになります。
 また、こういったネットワークのサービス以外に、我々、上位レイヤーと呼んでおりますけど、ネットワークを活用したサービスの展開も行っております。学認クラウドというのは商用クラウドを学術で使うためのサービスで、左側にありますように、大学でクラウドを選んで使うってなかなか難しいんですけども、そのための導入から調達に至るまでのコンサルティングをする導入支援のサービスから、クラウドの上で研究や教育のソフトウエアを入れて高度活用するための基盤サービスのようなものも展開しているところであります。
 また、認証も重要です。3事業を展開しております。学術認証フェデレーションというのは、ネットワーク上のサービスを大学のIDでもってシングルサインオンで使うと。これは大学以外のサービスも含めて、例えばオンラインジャーナルなんかが多いんですけども、こういったサービスでありますし、真ん中のUPKIは、大学等のウェブサーバーで、今ウェブサーバーは証明書がないと利用できませんけども、その証明書をNIIが一括して買い上げて大学で利用いただくサービスであります。また、右側のeduroamは無線LANのローミングサービスでありまして、今もう海外に行っても大学に行きますとすぐ無線LANはつながりますけども、これは各国のSINETのような組織間で連携して無線LANのローミングをしているからですが、この日本の取りまとめはNIIが行っているということであります。
 以上でデータ基盤とSINETの現状の御説明をさせていただきましたけども、ここで、これらの運営体制についても少し御紹介したいと思います。
 事業の実施体制、今日御紹介したようなサービスにつきましての企画立案・高度化の計画の策定等は、この左にあります学術研究プラットフォーム運営・連携本部の中で行っております。この中、幾つか運営委員会がありますけども、これらの委員会全てNII外部の委員の方々が主体の会議でございまして、こういったものを通して様々な大学・研究機関のお声を聞きながら、御要望を聞きながら計画を策定して、NIIが実施主体として推進しているところです。右側はNII内部の実施体制ですけども、所長直下に専門性の高い研究開発センターを設けまして、そこで最先端の基盤機能の開発を行い、一番下の学術基盤推進部というところで、これを実際に構築・運用、ユーザー支援等を行っているものであります。私ども、非常にサービスが今増えている中ですけども、この学術基盤推進部においては、従来、部長が1人、私だけだったのを、副部長というのを2人設けまして、内部の運営体制の強化も今図っているところであります。
 また、私どもだけではなくて各地域におきましても、特に研究データ利活用ですけども、様々な取組が行われております。この図は、各地域ごとに今行っている研究データ利活用を全国展開するためのコンソーシアムが自発的に立ち上がってきておりまして、私ども、こういったところとも連携・御支援しながら研究データ基盤の展開を図っているところになります。
 こういった基盤において国際協力は欠かせません。例えば研究データ基盤については、公開・検索・管理それぞれにおいて各国でやはり我々と同じような取組をしている組織がございますので、そういったところと密に技術的な連携をしながら、技術的共有ですとかソフトウエアの利用等を行っているところであります。
 また、ネットワークについても同様で、これ、海底ケーブルが通っていますので切断ということもあり得るわけですけども、そういった場合は、例えばNIIの持っている回線が切れた場合は、ほかの国が用意している海外線に瞬時に切り換えて通信が途絶えないようにすると。これには技術的な連携とともにかなり組織的な連携も必要になるんですけども、そういった取組も進めているところであります。
 以上、現状について簡単にまとめさせていただきました。
 ここまでをまとめますと、先ほどの冒頭の土井室長の話にもありましたけど、オープンサイエンスとかデータ利活用に関するニーズは加速的に今上がってきておりまして、その中で私ども、この研究データ基盤に関する重要度というのは増しておりまして、かつ、大学等からも様々な御期待・御要望をいただいていると感じているところであります。また、こういった研究データの利活用を加速するためには、流通するためのネットワークの高度化も必要でありまして、こういった考えの下、今日御紹介したようにデータ基盤とネットワーク基盤を一体的に我々は整備してまいりまして、今後もその方針で進めていくことを考えております。
 また、昨今のAIの潮流もやはりそうで、AIについては、私どもの基盤でAI for Scienceを支えるというのはもちろんそうなんですが、私ども自身もAI機能を使って高度化するということを考えておりますので、残りの時間はもうあんまりありませんけども、残りの時間でこの構想を簡単に御説明したいと思います。
 現在、AI for Scienceの時代において我が国で研究力を強化するには、大量かつ良質な研究データをAIが再利用できるようにして、知識の原動力とする環境整備が不可欠と考えております。これはまさに今のAI for Science時代における社会的な要請と我々は受け取っております。それに対する対応として、SINETとNII RDCを一体的に高機能化して、研究データの安全かつ高速な収集から組織的な管理・共有までを円滑かつ連続的に実現するような基盤としての役割を果たしたいと考えています。また、AIの活用においてもメタデータ付与をはじめとして活用していって、実験装置や観測装置からデータを集めて、それを解析して管理するまで自動的に流れるような仕組みというのをつくることで、研究者の方々の活動を加速したいと思っているところであります。
 幾つか絵をお見せしたいと思います。まず、この絵は、今日御紹介したSINETとNII RDCの現状とお考えいただきたいと思うんですけども、現在、この青いSINET6の上で研究者の方々が左側の実験装置からデータを集めて、解析して、メタデータをつけて、RDCに登録して管理・共有するという流れがあります。また、そうすると、右側の研究機関が学認で認証して、RDCにアクセスして利活用するという流れがあるんですけども、これ、この図を見て分かるとおり、それぞれの作業、研究者は今ばらばらに手作業でやっているという状況があります。SINETについては、現在、400Gbps、またモバイル網等の連携・提携も行っております。
 こういった中で、今日御紹介したとおり利用も進んでいるんですけども、1つ前のスライドで御説明したような世界においてはまだまだ足りない、高機能化が必要と考えております。そのための課題をまとめたのがこの黄色い字でありまして、この真ん中の上にあります収集、解析、登録を、今、手作業でやっていると、これ、結構大変で、非常に時間がかかると。時間がかかってもRDCまでデータが届けばいいんですけども、もう途中で止まってしまって、データがあちこちに止まってしまって利活用されないということが起こる。現在でも起こっていると我々は考えております。また、こういったデータを活用・利用するときも、現在、学認は基本的に学の世界での認証を提供しているんですけども、民間企業はそこに入れないということで、問題・課題として民間企業の方からもお声をいただいているところになります。また、データの収集、解析においては、ネットワークを経由して今でも実験装置ですとか下にありますような日本の計算基盤に対してアクセスできるんですが、ここも一つ一つ手作業になりますので、ある程度のスキルを持った人でないとできないといった状況があります。当然のことながら、今日御紹介したような形でデータが増えると、今の性能・機能ではネットワークが足りなくて、より安全・高速な機能が必要になると考えております。
 これに対する対応といたしまして、現在、私どもで考えておりますのはこの図にあるものでございます。まず、ネットワークにつきましては大容量化を図ります。具体的には800Gbpsをベースとしたネットワークとともに、非地上系ネットワークについてもモバイル網でも現在なかなか入らないところがたくさんありますので、ここは衛星も含めた非地上系ネットワークを拡大させて、より広範囲から大量のデータを収集できるような仕組みを設けたいと思っております。また、左上にVPNゲートウェイとあります。これはVPNに簡単に接続するための仕組みというのも用意することで、実験装置や下にあります計算リソースとNII RDCの間の距離というのを縮めたいと考えております。また、NII RDCにおいても、先ほど一つ一つ手作業で行っているとお話ししました収集、解析、メタデータ付与、管理・共有までを一気通貫で自動的にできるような仕組みを設けるとともに、民間企業の方も学認を通じてここにアクセスできるような仕組みを設けることで全体の流れを加速したいと考えております。
 また、AIも活用いたします。先ほど御説明したデータの収集、解析、メタデータ付与等にAIを活用することで、ここをさらに加速すると考えております。このためにはAIモデルですとかそれを利用する基盤が必要なんですけども、現在、左にありますNIIにおきましてLLMC(大規模言語モデル研究センター)におきまして国産のLLMの開発を行っておりますけども、こういった取組、成果物であるAIのモデルとこれを利用するソフトウエア、さらには計算資源といったものをパッケージ化した知識基盤というのをつくりまして、こういった機能を最大限に活用してデータの収集から解析、管理・共有を円滑かつ連続的にできるようにして、今後のAI for Science自体のデータ利活用を支えたいと考えているところであります。
 少々オーバーして申し訳ございません。以上で私の説明を終了したいと思います。ありがとうございました。
【尾上主査】  合田先生、これまでの経緯あるいは進展、さらに現状について、分かりやすく御説明いただきましてありがとうございました。
 それでは、ただいまの御説明に対しまして御質問等を受けたいと思います。御質問がある委員の皆様は挙手にてお知らせいただければと思います。
 宮田委員、どうぞ。
【宮田委員】  ありがとうございました。すみません、一番最後のところでちょうどお聞きしたいところがありまして、活用される先を増やすという意味で民間企業も使えるようにされるということだったんですけれども、この取組自体を民間の企業の方に誰でもオーケーというふうにするということって、なかなかそういうのは難しいのかなという気もしまして、その辺りはどうやって相手を選んでいくといいますか、それはもともとのデータの質にもよるのかなという気もするんですけど、その辺りってどんな感じで整理されているんでしょうか。
【合田副所長】  御質問ありがとうございます。ここは恐らく2つのパターンがあると思われまして、まず基本的な考え方は、研究データを誰にアクセスさせるかというのはデータのオーナーが決めることでありまして、私どもはそれを実現するための機能を提供するというスタンスで考えております。そうしたときに、例えばある研究者の方々が「このデータは広く完全にオープンです」と言った場合には、先ほど御紹介したJAIRO Cloudの上でそれをオープンに公開できますし、「これは共同研究者に限る」と指定した場合は、民間企業の方も、例えば大学との共同研究をしている民間企業の研究グループの方々の中で共有するということもあると思います。そういった柔軟なアクセス制御というのを実現する仕組みを基盤として御用意しようというような考えで進めております。
【宮田委員】  なるほど、すばらしいですね。何でもかんでも公開とか、そういう方向になるかと思ったのに、すごく現実的なところだなと思いました。ありがとうございます。
【合田副所長】  ありがとうございます。
【尾上主査】  続きまして江村委員でございますが、江村先生、各委員、自己紹介を30秒ぐらいでしていただいていますので、まず御挨拶いただいた上で御質問をお願いできればと思います。
【江村主査代理】  すみません、30分ほど遅れて参加しました。私は、今ちょっと話がありましたAI等の活用を推進する研究データエコシステム構築事業に推進委員会というのがありまして、それの委員長をやっているという関係で今回も声がかかったのかなと思っています。その観点でいうと、先ほどから出ていますように、推進委員会の中でも、このエコシステムというのは、やっぱり分野横断とか、あるいは産業界も使えるようにするとかというようなところが非常に重要だよねという議論が出ていますので、そういった観点でも今回議論ができればいいかなと思っています。
 それで、今の御説明に対する質問と、もう一つはこの検討の進め方そのものに関係するんですけど、私自身が今感じているのは、AI for Scienceというのは研究の仕方そのものをある意味で破壊的に変える可能性を持っていて、ですから、どういうパターンでAI for Scienceが使われるかというのをもう少し意識したほうがいいかなと思っていまして、一番最後の図にAIエージェントを載っけますという話は出ているんですけど、NIIのデータクラウドの学術プラットフォームにAIを載せるという部分も一つのやり方ではあると思います。そのときに、AIって実はデータ解析のところにすごく使われて、その結果が今度、実験のほうで実験のプロセスを変えていく。だから、実験側に例えばロボットがいて、ダイナミックにデータを解析したものを戻してやると、戻した先では、研究者はそこにいないんだけど、どんどん実験が進むみたいなことで、AI for Scienceって、相当実験のプロセスも変えたり、新たな発見をしたりというようなことをイメージした議論をしないといけないかなと思うんですね。
 そういうふうに考えたときに、この学術研究プラットフォーム自身が、AI for Scienceという切り口で言ったときに、現状はまだまだなのかもしれないんですけど、将来を見たときにどこまでカバーできるかというのをやっぱりしっかりイメージした議論が要るのかなと思っていて、知識基盤ってここにはあるんですけど、外側に例えばマテリアルズ・インフォマティクスだったら、そういうデータを持っている人たちがいたりするわけですね。ですから、そういう中でどんなエコシステムがつくられたらその次の学術研究プラットフォームになるのかという絵を描いたほうがいいんじゃないかなというのをちょっと感じているんですけど、そういう観点で見たときに、どの辺まで意識されてこの絵を描かれているのかということとか、ちょっと質問の仕方がうまくないんですけど、ここに書かれているNII以外の研究機関や分野のプラットフォームとの連携という辺りが結構重要だろうなと思うので、その辺のところについてちょっとコメントいただけるとありがたいなと思います。よろしくお願いします。
【合田副所長】  御質問ありがとうございます。非常に鋭い、むしろ難しい質問でありますけど、おっしゃるとおり、AIの適用範囲は非常に広がっておりますし、私どものAIのセンターの人間と話していても、1年後何が起きているか分からないという状況の中で、その意味では常に世の中の動向を見ながら我々が適用範囲も決めていく必要があるかと思います。
 この絵で申し上げたかったのは、NII RDCとしての、今はもらったデータを管理するだけなんですけども、その機能の範囲を、データを集めるところまで広げましょうというのが一つの考え方です。その意味では、データを収集したり解析するときもどんなプログラムを使うといい、そういった部分ですとか、あと一番大きいのはメタデータ付与ですね、そういった部分、データの収集からRDCに送る前の部分でAIを活用していこうということを念頭に入れて描いております。言い方を換えると、例えばAIを使って左側の実験施設の中の実験を自動化しようということもあるんですけども、そこの部分についてはさすがに私どもが入るところではないと考えておりまして、ある意味、データを吸い上げるところからが我々の仕事というふうに今のところ考えております。
【江村主査代理】  はい、分かりました。多分そこと、あるいはそこに出てくるデータは実験をやりたい人から上がってくるんだと思うんですけど、そこのデータだけでは足りないので、ほかのところのデータをこの中に入れてくるということとセットになると価値が出てくるのかなと思っていて、それは下側に描かれている絵の側にその可能性があるような気もするので、その辺が今後の議論なのかもしれないなと思って聞いていました。ありがとうございます。
【合田副所長】  ありがとうございます。1点付け加えますと、先ほど我々は収集からと言いましたけど、収集からでも、やはり実験施設、分野でどのような研究が行われているかある程度分かっていないと全然つながりませんので、その意味では、これは一つ一つユースケースを積み重ねる地道な作業になるかもしれませんけども、分野の研究者の方々とも一緒に考えていきながら全体の設計というのを進めていきたいとは考えているところです。
【江村主査代理】  ありがとうございました。
【合田副所長】  ありがとうございます。
【尾上主査】  ありがとうございます。
 そのほか、いかがでしょうか。若目田先生、どうぞ。
【若目田委員】  若目田でございます。今日は御説明ありがとうございます。私、今、江村委員と同じ会議とかで内容は伺っていますので、今日出てきた今後の将来像のところを中心に伺いたいなと思います。
 その前提にすごい基本的なことを聞いて大変失礼なんですけども、今回、SINETであるとか、その上のNIIさんの基盤は、これ、研究者が使うときにはコストってどうなんでしょう、これは全部ただで自由に使えるものなのか。その辺のコストの考え方をちょっと伺いたかったのが1つですね。
 それと2つ目は、高度化という部分が言葉としてあったんですけども、悪い意味じゃなく、今回のこの絵を見ると、ここを人手でやっていたのが自動化されるって、多分、研究プロセスの合理化という側面が大きいんじゃないかなと思っていまして、実は私、それは大いに賛成でして、むしろそれによって研究者の時間が確保されて、新たに研究に邁進できるというのも一つの考え方じゃないか。多分、民間のデジタルってその辺が非常に大きいんですけども、そう考えたときに、例えばですが、今日伺ってなるほどなと思ったのは、JAIRO CloudをNIIさんが基盤をつくったら、全部そちらにホスティングを切り替えられて、これ、言い換えれば、この仕組みだとかプロセスが全部同じものになっていくことで標準化が必然的に進んでいくということだと思います。あともう一つ、何かまとめて買い上げてという部分がありましたよね、NIIさんが。これも各研究機関ばらばらに調整するんじゃなく、まとめて交渉する。多分、先ほど研究のプロセスでも、例えば何かデータを調達するときに民間とかいろいろなところと交渉するとかそういう部分もあると思うので、それも非常に大切な論点だと思いました。なので、例えば、1人当たりの研究者に係るコストとか時間がどれだけ下がっていくか。あと、合理化できるものが、システムを共通化することだけじゃなく、そういう研究者のプロセスから見てこれはもう一人一人がやる必要ないんじゃないかというもの、もしくは、研究機関ばらばらでやるんじゃなく全部1か所でやってしまえばいいんじゃないかみたいなものというのが多々あるんじゃないかなと思いまして、これ、システムの合理化と併せて、今回この機に、研究者のそういうプロセスそのものの分析と、例えば集約化であるとか共同化みたいなところを徹底的に図られることによって、コスト的にも時間的にも浮くんじゃないかなと思いました。
 あと3点目、先ほど民間企業が研究データを使うという、ユーザーとしてアクセスの議論がありましたけども、例えば実験観測施設みたいな研究機関が個別に研究単位にセンサーを設置するんじゃなく、例えば民間が持っているいろんな仕組みだとか、これ、例えば、センサーって必ずしも専用のセンサーじゃなく、例えば全国の電力の利用状況って、これは一つのセンサーと同じような役割を果たすわけですし、例えば金融機関のリアルタイムに近い移動状況なんていうのもセンサーの役割を果たすと思います。なので、この研究のこの仕組みの中に、民間がユーザーでなくデータ提供者として関与するものがどういうものがあるのかというところもこれを機に見直していただいて、1研究1研究じゃなく、例えばまとめてNIIさんがその辺を交渉する、調達するみたいなところも一つじゃないかなと思っています。なので、ユーザーとして民間がアクセスするということじゃなく、民間側のデータを活用し、研究に活かす。当然、民間も慈善事業じゃないので、何らかのコストが発生するかもしれませんけども、ばらばらやるよりはまとめてやったほうがいいということと、あと、大きな法改正の中で、個人情報保護法が恐らく次の通常国会に議案として提出されます。データの活用に向けての法制度のポイントとしては、今までデータの単位に対して同意が必要とかリスクがどうだって見ていたものが、むしろどのように使うかということで判断される。例えば、AIのモデルをつくる、AIの高度化に資する、もしくは社会課題の解決に資するものは、個人情報に関しましても同意によらない第三者提供、目的外利用が可能になるわけです。もともと学術利用の適用除外ってあった環境の中にそのような法改正があるということは、研究に貢献するデータは、先ほど例えば北海道から沖縄までの全ての電力なんていうのも一つの例と申し上げましたけども、利用可能になりますし、1,700自治体の何らかの情報というものも法的には可能になるわけです。ましてや、学術、アカデミアに関して言うと、スパコンが世界一になると国民皆さんの応援というか、共感を持てるということで、やっぱり学術に資するというのは通常の民間活用よりもはるかに受容されるべきものだと思いますし、そういうところを含めて、今回のプランの中には、民間側もしくは今まで非常にハードルが高かった、データを使うときに学内の倫理委に諮るのは大変なので個人データは使わないという話を聞きましたけども、そういうことじゃなく、むしろ積極的に活用するような方向性も併せて検討に入れてはいかがかと思いました。
 以上です。
【合田副所長】  御質問ありがとうございます。一通り回答します。
 まず、コストについては幾つかのモデルがあります。まず、ネットワークにつきましては、私ども、先ほどおっしゃった全国70か所、これは各県1つ以上の拠点を結ぶバックボーンについてはNIIが国の予算を使って共通基盤として運用させていただくと。一方で、大学等が我々の拠点につなぐまでの回線は大学側に負担いただくというモデルで、今、運用しているところであります。
 もう一つ、RDCに係る機能については、実は既に課金しているものとしていないものがございまして、今日御紹介したJAIRO CloudですとかUPKI電子証明書は課金しています。これは、若目田委員の2番目のお話にも関連するんですけど、実はこの部分というのはかなり共通化・集約化ができていて、かつ、ある程度利用のボリュームも確立されているので、こういった部分については課金というのも行いながら進めるという方針で行います。したがいまして、今後もサービスにつきましても、そのようなビジネスモデルが成り立つものについては料金負担制ということで考えているという状況でございます。
 民間が持っているデータの利用については、まさにおっしゃるとおりで、今日の絵は確かに民間が学のデータを使うだけに見えるんですけども、我々が考えているのは、民間が持っているデータを学でも活用して、産学の共同研究をはじめとして利活用することももちろん見込んでおります。ここについては、民間のどのようなデータが入ってくるかというところまでは我々はまだ十分議論できておりませんので、今後の参考にさせていただきたいと思います。
 個人情報はなかなか難しいです。どう答えればいいか、なかなか私も難しいんですけど、今後、データ利活用が進むと、研究データも機微データを含むのが増えていくのはおっしゃるとおりであります。法律の面でも対応されていると思いますが、私どももより、ここだったらデータを置いても安心というような基盤ですとか、このネットワークを使えば安心、こういった基盤の上で、その支援する機能といったものは順次開発を進めながら提供していきたいと考えているところであります。
 ちょっと後半部分は自信がないので、今日、主にRDCを担当している山地教授が入っていますが、山地先生、何か補足ありますか。
【山地教授】  法的に対応されてできるという部分と、やっぱりその中でも倫理的に配慮しなきゃいけないというところのジレンマのケーススタディーが結構あって、そこはうまいことオプトインしながらというのが現状なんですけれども、先生おっしゃるとおり、より効率的に研究者がデータにリーチできる環境というところは、ちょっと我々も環境整備を考えていきたいと思います。ただ、単純にNIIはブローカリングするという役割で機能を果たすというよりも、やっぱりそこに何かコアコンピタンス、情報技術なり技術開発の機能を提供するというところがNIIのいいところですので、そういった側面も加えながら検討を進めたいと思います。
 以上です。
【若目田委員】  最後のところ、ちょっと誤解なきよう申し上げますと、倫理的にしっかりすべきとか、個人情報はしっかり管理すべきということを申し上げた、それは当然重要なんですけども、日本のデータ活用に向けての今後の動きとしては、やはりAIの高度化であるとか、もしくは、日本の場合は、これは必ずしもアカデミアと民間ということでなく、民間同士も、もしくは官のデータと民間も含めて、やっぱり共有し合っていかなければ立ち行かないというところが課題なんです。なので、第三者提供とかそういう目的外利用ということから最初から逃げずに、どのような研究、どのような社会課題に、もしくは今回、国が掲げた17領域であるとか、そういうような観点から、研究の高度化に必要なものはこういうものであるというふうにむしろ逃げずに積極的に議論して、そのときに必要ならば制度的見直しをするみたいなことで、非常にそういう活用に向けた節目の時期なので、学術領域もこの機にしっかりその辺の戦略を練るべきじゃないでしょうか。で、この中に反映すべきじゃないでしょうかと、もちろんポジティブな意味で申し上げました。
【合田副所長】  ありがとうございます。
【尾上主査】  ありがとうございます。
 この後、工藤委員、石田委員、千葉委員という順番でお願いいたします。
 工藤先生、お願いします。
【工藤委員】  ありがとうございます。御発表いただき、大変参考になりました。現状のまとめだけじゃなくて将来像も示していただいたので、非常に想像しやすくなりました。質問は大きく分けて2つございます。
 最初の質問は、スライドの5ページ目に関する質問でございます。管理基盤、予想以上に利用が伸びているというお話だったので、どういうところが受け入れられているポイントなのかという、そのモチベーションとかインセンティブについて何か御存じのことがあったら教えていただければと思います。
 あともう一つ、小さい質問として、すみません、私、社会科学系なので、研究データを共同研究者とかラボでどういうふうに共有しているのかってよく分かっていない部分があるんですが、仮に管理基盤を使っていないラボとか共同研究機関同士って、現状、どういう形、フォーマットとか何を使って共有しているのかという、移行前の状態ってどういう状態なのかというのを御存じでしたら、これも教えていただけると大変うれしいです。
 大きく分けて2つ目の質問に関しましては、将来像に関するところで、33とか34ページ目のところでございます。これもすごい聞くのも恥ずかしいぐらいなんですけど、素人考えからすると、研究データの自動解析とかメタデータ付与、もちろん手動でやっているということなんですけれども、汎用のLLMとか汎用の生成AI、北米の企業が提供しているようなツールを使うと自動化ができそうな気もするんですけど、そういうユースケースではないところとしてどういう価値があるのかというところを改めて説明していただけると。どれぐらいライバルなのかみたいなところが知りたいところです。
 以上2点でございます。
【合田副所長】  ありがとうございます。1点目については、谷藤先生、いいですか、RDMの担当としてお答えいただいて。
【谷藤センター長】  では、谷藤から。
【工藤委員】  ありがとうございます。
【谷藤センター長】  このデータ管理に関してのどんなニーズかというのが1つ目だったかと思います。昨今、御存じのように、全国津々浦々、大学で、我が大学で、あるいは我が研究所で、行われる研究のデータはちゃんと管理しましょうという、俗に言うDXが進んでいます。そのことに従って、データをこれまで何となく無意識に管理していたけれども、意識的に管理したいと。じゃあ、どこで、どうやって管理するのか、それはどういう組織あるいは研究所の契約の下で管理すべきなのかという仕方も、全国皆さんが同時にどうしようかなと思ったのだと思います。そのことを背景として、NIIが提供する管理基盤を使って慣れていくという需要から、実際に共同研究を行う及び公的研究資金の研究データをそこで共同運用するという場面があり、その場においてはこのGRDM、最もよく使われているシーンだと思います。
 2つ目は、実際、そうでないケースはどうですかというお話だったかと思いますけども、それまで無意識だった長い時代において研究プロジェクト等で一番よくあり得るのは、便利なファイル共有サービスとか、商用のデータ管理機能を何かに附帯する形で使うとか、いろいろなことを自主的に使い、経験を積んでこられていると思います。そのときに最も問題となるかもしれないところは、組織あるいは公的研究資金が期待しているガバナンスとか、それから研究構成に必要な履歴をたどるだとか、そういったことが必ずしも担保されているとは限らない可能性があるし、組織を超えて共同研究の場合はなおさらそこのところをクリアにしていく必要がこれからの時代はあり、かつ、AI for Scienceであればなおさらそこが大事になっていくところではないかと思います。
 3つ目の質問が、自動解析というけれど、AIも使えるでしょうということかと思いますけれども、それはそうだと思います。
【工藤委員】  あ、なるほど。
【谷藤センター長】  それは、公的機関が何をやってもやらなくても、研究者自身が自分の中で最適化された研究環境を構築するということが普通だと考えれば、その中にAIツールとか言語モデルを使っている、そういうシーンはたくさん今あると思うんですね。ですので、それは日本全国がそういった経験を積みながら、どこに私たちはより注意をしなくてはいけないのか、AI for Scienceというのは研究の再興、科学の再興ということだとしたときに、どこを押さえるべきなのかということを私たちは非常に気にしているので、ツールは使ったほうがいい場合が多くあるだろう、それから解析機能上で全てを実装することはないだろう。だけど、その間に、ここはやはりさすがに公的基盤としてあると非常に安心するし、安全な共同研究、先導的研究などにも資するのではないかというところにこれから注意していきたいと思っています。
【工藤委員】  なるほど。御回答ありがとうございます。
【合田副所長】  あと3つ目だけ補足させていただきますと、このメタデータをつけるって結構奥が深いといいますか、要は、どんな実験や、装置ってどんな設定でやったのかとか、どんなプログラムを使って解析するのか、また出てきた成果を利用したい人はどんなことに興味があるのかということ考えると、LLMでもかなりできてきているんですけど、今まだ現状の技術では、どこか1個モデルを持ってきて、商用サービス等を持ってきて、そこに入れるとすばらしいメタデータができるか。まだそこまでいってなくて、かつ、モデルについても、かなりドメインごとに異なる、特化したりファインチューニングしながら使っていくということが必要になると思います。なので、我々としては、そこについては我々自身もLLM-jpというモデルをつくっていますけども、それ以外の既存のモデルも含めて、その辺はこれから研究開発対象でありまして、いろいろ試していきながらつくっていきたいと考えております。
【工藤委員】  ありがとうございます。
【尾上主査】  では、石田委員、よろしくお願いします。
【石田委員】  御説明いただきましてありがとうございました。私のほうから2つ質問がございます。
 将来像のところで見せていただきました図で、先ほども類似の質問があったかと思いますが、自動収集、解析、メタデータというところなんですけれども、これは何か特定の研究分野というのを想定されているのか、それとも汎用的なものを目指していらっしゃるのかというところをお聞かせください。と申しますのは、あまり汎用性が高いと、かえって特徴がないものになってしまいそうな気もしますので、最初どこから手をつけるかという形でもいいと思うんですが、何かその辺、お考えになっていることがあれば教えていただきたいというのが1点目でございます。
 2点目は、この将来像の絵では言及されなかったと思うんですけれども、今、開発もなさっているRDCのほうに関しては、特に高度化を進めるといったような予定はないのかというところ、もしくは、必要でしたらどういうところがさらに高度化したほうがいいのかということがあれば教えていただければと思います。
【合田副所長】  ありがとうございます。1つ目の質問については、おっしゃるとおり、これ、例えば私のような情報屋が最初から汎用的なものをつくろうとつくると、私の自己満足で終わってしまって誰にも使ってもらえないということが往々にあります。こういう場合のアプローチとして必要と考えているのは、ある程度ドメイン特化したものをまずユースケースとしてつくって、その中からドメイン間でも共通して使えるものをきちっと延ばしていくというようなアプローチがいいと、これはすみません、私個人の意見も半分入っていますけど、考えておりまして、この取組においても同じアプローチを取るべく、今、いろいろなドメインの研究者の方々と意見交換をしているところでして、そういったものを見ながら進めていきたいと考えているところであります。
 あと、RDC、恐らくこの自動何とか以外のRDCの中身自体の高度化に対する御質問だと思うんですけど、これは谷藤さんから、多分、エコ事業の話をしていただくといいのではないかと思うんですが。
【谷藤センター長】  では、谷藤から。このNII RDCというコンセプトそのものが、次期学術研究プラットフォームの守備範囲で変わっていくという話をしたところなので、RDC自身が高度化していくというのは、守備範囲が今この絵の緑色で示しているところに広がるわけですね。ですから、その各パーツがつながるということで、必然的に高度化していかないとつながらないわけなので高度化があるという答えになりますが、さらに、そのデータが例えば大容量に自動収集・蓄積すると言われたときに、SINETでネットワークも強くなりました、速くなります、安全なんです、それで流れてきたデータをどのようにメタデータを伴った情報として受け止めるのかというところは、かなり象徴的な高度化の一例だと思っています。それは、今日は人間が全て管理するというコンセプトでこれまで来ましたが、今後は、AIという技術でアシストすることはあると思うけれども、基本的には例えばサービス間、あるいは先ほどの緑の四角の中でAPIというプログラムの機能を通して自動的にデータが流れるということも当然あり得るわけで、そうすると、それをコントロールするための仕組みであるとか、あるいはそれを人間が確認するためのウェブインターフェースであるとか、そういった辺りはかなりこれまでなかったことができるようになって、それは便利なんだけれども、人間が全く要らないわけではなくて、要所要所で必要になるところには高度化された機能というものがそこに存在していないと、この一体化した次期プラットフォームの中ではうまく回っていかないかもしれない。じゃあ、そこは具体的にどうかというのを、今、絵に見せているところでは、組織的・分野的あるいはトップダウン・ボトムアップで具体性を詰めていこうと考えています。
【合田副所長】  現在進行形のプロビナンスとかガバナンスの話も御紹介するといいと思います。
【谷藤センター長】  あえて、ちょっと広告になってしまいますけれども、今日は提供していないのですが、来年度、今御覧いただいている2026年度に終了するこの構築事業の最終年度においては、高度機能の2つの要素、データが上流から下流に流れていく、つまり実験装置から実際使う場面に流れてくるときに、そのデータはどういう来歴を持っているのか、誰がどのようにつくったので、今、自分はそれをインターフェースで見ているのかということは、使うためには必要な情報なわけです。それは単にファイルの履歴とかスタンプを見るではなくて、来歴として見る必要があるので、それを英語ではプロビナンスというんですけれども、プロビナンスという言葉はいろんな文脈で使われるので、ここでははっきり明確に説明すると、そのデータがどこから来て、今、自分が再利用するこの場面に資するのかということが分かる情報を提供するという機能を、多分単体で表から見えるところにはなくてバックエンドで動くことになると思いますけれども、そういった機能を実装するというような例があります。
 もう一つ、このデータを再利用するに当たっては、適切な再利用を可能とするデータかどうかを知る必要がありますね。例えば、そういった再利用に適しないものが万一入ってきたときには、それを無意識に機械学習であるとかAI技術で使ってしまっては困るので、このデータは再利用が可能なのですということを説明する情報として、データガバナンス機能というものを来年予定しております。これもいろいろなコンテクストの中で出てくるんですけれども、象徴的な例は、組織が、大学が、自分の大学の下ではこういうガバナンスを利かせて、皆さん例えば研究してほしいというふうになったとき、あるいは公的研究資金がこういうルールできちんとガバナンスを利かせてくださいという要請をするとき、そういった事要請の下でデータが動くときには、やっぱりデジタル情報としてそのデータに一緒にくっついていく、あるいはそれを見ることができる、確認するということが必要になります。ですので、研究データがよりたくさん大容量に使えるようになることはいいんだけれども、それに伴って使う人が知るべき情報を提供するという意味で、ガバナンスあるいはプロビナンスといった機能を今後提供するという予定になっています。
【石田委員】  分かりました。ありがとうございました。
【尾上主査】  千葉先生、お待たせいたしました。どうぞ。
【千葉委員】  ありがとうございます。私からは主にセキュリティーとネットワークのことを伺いたいんですけども、先にセキュリティーのことからなんですが、もしかしたら今のデータプロビナンスの話で尽きているような答えになるのかもしれないんですけれども、先ほど一番最初のどなたかが質問されたときに、最後は、範囲を限定したり、あるいは全体の形で公開するということだったんですけれども、34ページでしょうかね、さっきから出ていた図の実験装置からデータが上がってきたときからだんだん処理されて形が変わっていくと思うんですが、その過程でだんだん公開範囲というのは変わっていくと思うんです。例えば医療データですと、病院の中から外に出してはいけないと。外に出す場合には、もうその段階である程度の処理が終わっていて、ある程度の匿名化がなされて出ていくみたいなことが少なくとも今は行われていると思うんですけれども、そういったものがこの箱だと全部1つなんですけれども、例えばNII RDCの中も各グループごとにドメインが幾つかあったりして、そのドメインからドメインにデータが渡っていくと、またそれに応じて管理範囲ですとか公開範囲、アクセス権が変わっていくみたいな、そういうことは既に実装されているんでしょうかというのをまず質問でよろしいでしょうか。
【合田副所長】  御質問は、RDCの中で研究グループのドメインごとにきちっとアクセス制限がされているかという御質問ですか。
【千葉委員】  あるいは、そういうユースケースに将来対応、今のRDCじゃなくてもいいんですけれども、そういったことは考えられていらっしゃいますかという質問です。
【合田副所長】  まず、ドメイン間ではきちっとアクセスは分かれていて、完全に分離して管理していますけど、ドメイン間でデータをやり取りする部分は、この辺どうでしょう、山地先生か谷藤先生、何かコメントありますでしょうか。
【谷藤センター長】  今の御質問って、一次データとそれ以降のデータの仕分ではなくて?
【千葉委員】  例えばそういったことだと思います。
【谷藤センター長】  研究のプロセスの中で生成されたデータの全てを全ての人と共有するというシーンは多分ほとんどないのではないかと思いますが、共同研究する人たちが使えるために、一次データあるいはそれ以降整理した、あるいは付加価値がついた等の進化したデータセットとあえて言うならば、それらのデータに対して、どの時点で、どの属性の人たちと、あるいはどの研究プロジェクトの中で使えるようにするかということに関しては、認証を経たユーザーに対しての一定の認可をするという仕組みが多分必要になると思います。
 それの認可に関しては今日のRDCでは備えていませんけれども、大容量の自動収集、自動解析というふうに一回り大きくなっていく次期学術研究プラットフォームにおいては、そういった一定の認可をするという仕組みは必要になってくるのではないかなと思います。これ、大変難しい機能なので、早々に実装するにはいろいろな山を越える必要がありますけれども、御指摘の点は私も同意しておりまして、ただ、それをどうやって人間と機械が正確に適切に回すかという運用のことも考えると、なかなか深い課題ではないかなと思います。
【千葉委員】  具体的なシナリオを出したほうがいいと思うので1つだけ挙げてみるんですけれども、例えば、大学の病院の中で集めているデータは、やはり病院の先生、お医者さん、先生でないとアクセスしてはいけない。例えば情報系の人間がそれを使ってAIの学習に使おうとなると、ちょっとそこは壁があったりするんです。今だとどうしても、病院の中に解析のコンピューターを入れて、そこで処理をして外へ出すという形になっちゃうと思うんですが、将来的にはそういうものもある種のクラウドでNIIさんのRDCの中で処理をするというのは望ましいと思うんですが、そのデータをそのまま公開することはもちろんできなくて、そこはさらにもう少し広げた研究者に対して処理ができるような次のドメインに移るみたいな、何かそういうユースケースをぜひ考えていただければいいんじゃないかなと思いました。コメントです。
【谷藤センター長】  ありがとうございます。ぜひ御一緒に考えていきたいと思いますし、そのようなケース、ケースでは病院のデータガバナンスあるいはデータ管理といったポリシーとも関係してくるので、やはり一体として考えていって、そのユースケースを一つのモデルにしていくということが多分必要になるのかなと今は思います。
【千葉委員】  はい、はい。それで、そこに少し関連しているんですが、ネットワークの話なんですけれども、SINETが非常によく整備されていて全国津々浦々をネットワークでつながっていくのはとてもすばらしいことだと思うんですが、大体、物質ですかね、物理的なものの流通ですと配送網を整備するだけでは駄目で、中間、中間にいわゆる倉庫みたいな機能をつくることが非常に大事だと。物流倉庫というんでしょうかね。今みたいな例えば病院の患者さんのデータを吸い上げてみたいな話ですと、やっぱりその中でも途中、途中に倉庫的なコンピューターが必要になったりすると思うんですけれども、何かぜひそういう整備も考えてほしいなと思っているんですが、そちらに関してはいかがでしょうかね。じゃあ、単純に言えば、ストレージについてよく考えたほうがいいんじゃないかという単純な質問にしてもいいんですけれども。
【栗本教授】  どうもアドバイスありがとうございます。NIIの栗本です。現在はまだストレージというものを積極的にサービスできておりません。その代わりと言ったらなんですけれども、ダイレクトクラウドサービスというものをネットワークで提供しておりまして、市販の、市中のクラウド業者さんのクラウドストレージにSINETから直接接続いただけるようなサービスでございます。こういうのもさらに、今いただいたアドバイスのように積極的に利活用して、適切なクラウドに適切なストレージといったところにも運べるように拡張していくというのも一案ですし、またさらに一歩進んでNII自体がそういうストレージを用意するというのもあり得るかもしれませんが、そこまではまだちょっと先の話ということで、これから検討させていただければと思う限りです。
 以上です。
【千葉委員】  私としては、立場があるので、学術系の計算基盤のストレージもぜひ活用するようにしたらいいとは思うんですけれども、やっぱりこれからデータが、セキュリティーを考えたときに、データが動いていったところで、先ほどのプロビナンスの話でもありますが、セキュリティーも一緒について動かさなければいけないので、本当に民間のクラウドが駄目というわけじゃないんですけれども、研究者の人たちが好きに選んだストレージにデータを置いていくという状況はやっぱりちょっと考えたほうがいいんじゃないのかなという問題意識があって質問させていただきました。
 私からは以上です。ありがとうございました。
【合田副所長】  合田ですけど、今の話は、SINETが、例えばmdxの計算ノードまでVPNを延ばすようなこともできてきていて、同時に、今、HPCIのほうでも整備計画調査研究でセキュアなデータを通すという議論もされていると思いますので、ぜひそこはこの基盤センターのコミュニティの方々とも一緒になって考えていければと思います。よろしくお願いします。
【千葉委員】  ありがとうございます。
【尾上主査】  ありがとうございます。
 ちょっと時間が迫ってきておりますので、林委員、矢守委員、先に御質問を受けた上でまとめて回答いただこうと思います。
 まず、林委員、お願いいたします。
【林委員】  御説明ありがとうございます。2点質問させていただきたいんですが、1点目が、SINETの国内回線の整備状況の13ページのところで大学ですとか高専などの加入状況を教えていただいたんですけど、大学以外の研究機関であったり、研究機関以外の組織の加入状況が今どういうふうになっているかというのを教えていただきたいです。それが1点目になります。
 2点目が、御説明いただいたところで、データ数、データ量も伸びていて、加入者数も伸びていてというところで、信頼性がすごく大事だと思います。なので、17ページで御紹介いただいた迂回をできるようにして信頼性を確保するなんていう工夫をされているかと思うんですけれども、もう少し信頼性の観点でどういった工夫とか仕組みがあるのかというのを教えていただきたいのと、あと、やっぱりデータ量とか加入者が伸びていくと消費電力もすごく問題になってくると思います。今後、AIが入ってくると余計そういった課題感は大きくなると思いますが、今でも通信のネットワークって電力消費が大きいというのは昔から言われているので、今々のSINETでそういった電力消費を下げるという工夫とか仕組みがあれば教えていただけるとありがたいです。
 よろしくお願いいたします。
【尾上主査】  ありがとうございます。
 矢守委員、どうぞ。
【矢守委員】  私からは、セキュリティーの観点と利便性の観点からちょっと質問がございました。セキュリティーに関しては、先ほど千葉先生のほうで御質問されたことと重複しておりますので、利便性かなと思っています。スライド34ページに最終形が書かれておりますが、ここで共有する自データを使いつつ、NIIさんが御提供されるAIのモデルを使って非公開の自分のデータを使って分析していくというバリエーションというんですかね、NIIの基盤を使いつつも自分のデータを入れて、そこでモデルを使ってAIで分析していくという方向性もあろうかと思うんですが、これ、現段階は取りあえずデータを集めるというフェーズだと思いますけれども、その後の利便性というところについて、もし何か方向性がありましたら教えていただきたいという1点になります。
 以上です。
【尾上主査】  ありがとうございます。
 じゃあ、まず、SINETのほうをお願いいたします。
【栗本教授】  どうも御質問ありがとうございます。
 1番目、最初の質問は、SINETとして大学以外の利用はほかにどんなものがあるかという質問と思います。今、SINETは、基本的に大学組織と研究機関、それらの機関と共同研究している機関にも利用いただいております。共同研究という形で入っていただいている企業は大体15企業ぐらいございます。あと小中高の教育委員会さんが大学との共同研究という形で御利用いただいているケースがあります。小中高さんにおきましては、共同研究で入っていただいている以外にも新たな枠組みで2024年から公式に入っていただく事が可能となっており、新たに入っていただいた教育委員会さんも含めて、今、全体の生徒さんの10%ぐらいが利用いただいています。
 2番目については、データの信頼性向上策としてどのような形を実現しているかとの質問ですが、まず、御紹介させていただいたように光ファイバーを網目のようにつないでおりますので、ファイバーが切れたときに経路を変更する仕組みを持っています。実際はネットワークが3層構造になっており、1番目は光ファイバーネットワーク、2番目はデータを論理的な通信パスとして転送するネットワーク、そして最後はインターネット、IPというものを見て転送するネットワークという3層構造になっています。この通信パスレイヤーとIPレイヤーという2つの層がそれぞれ切替え機能を具備しているので、非常に信頼性が高い形でネットワークサービスを提供させていただいており、さまざまな障害等があってもサービスが止まらないというような形で実現できています。
 また、3個目なんですけども、データ量の伸びに対応するための省電力化対策はしているのかという御質問です。こちらにつきましては、SINET5から6に替わる段階でデータの伸びに対応するために新型の装置等を導入し、全体的にビット当たりの消費電力というものが半減するような新しい技術を導入して構築しております。ですので、データの伸びに対しても、大きくデータ消費電力が増えるということがないような形で実現できると思っております。
 以上です。
【尾上主査】  ありがとうございます。あとは利便性のほうの話を。
【合田副所長】  では、こちらは私から説明します。御指摘いただいた点はごもっともでございます。この話は今日のRDCの範疇は超えるものなので、十分なお答えができないかもしれませんけども、おっしゃるように非公開データを使って学習したモデルをどう使うかですとか、その結果をどうするかというのは非常に重要な課題で、学習したデータによってそのモデルを誰が使っていいかということはもちろん制御しなければなりません。また、そういったモデルを動かす計算の基盤ですね、これは先ほどの千葉委員の御質問にも関係しますけど、そういったものもある意味、ほかと一緒、アイソレーションしなきゃいけないという議論をしております。そういった部分も含めて、モデルの利用範囲ですとか、あとそれを動かす基盤側としてセキュアなものをいわゆるテナントごとに用意する、そういった議論を今、所内でもしているところで、今日の御意見も参考にさせていただきながら引き続き議論を続けていきたいと思っております。ありがとうございます。
【矢守委員】  ありがとうございました。
【尾上主査】  ありがとうございました。今日はこの34ページ目を出していただいたので、いろんな意見が出て、御質問が出て、非常に盛り上がった内容でしたが、次回以降、次期SINETの在り方や研究データ基盤の今後に向けての詳細を議論いただく予定でございますので、引き続きどうぞよろしくお願いいたします。
 
 続いて、議事(4)でございます。その他ですが、これ、多分御質問を受ける時間がないかもしれないんですが、事務局から令和7年度の補正予算の状況について御紹介いただきます。どうぞよろしくお願いいたします。
【土井学術基盤整備室長】  それでは、資料5を御覧いただければと思います。令和7年度補正予算につきましては、先日、12月16日付で成立されているものでございます。この中で、このワーキンググループに関係するところを中心に、簡単ではございますけど、説明させていただきたいと思います。
 まず1点目が、AI for Scienceを支える情報基盤の高度化ということで、先ほどの御議論の中にもございましたけれども、この下のほうですね、AIによるメタデータ付与支援機能を先行して開発するということですとか、あとは先行事例・ニーズの調査研究等を先んじて進めさせていただくために、補正予算額としては総計5億円ということでお認めいただいているという状況でございます。
 また、そのほか、AI for Scienceに不可欠な計算基盤の環境整備ということで、こちら、総額76億円の事業。
 あと、次のページは必ずしもAI for Scienceということではないですけれども、周辺の補正予算対応ということで、JSTの各種サービスの研究DXプラットフォームの整備ということで4億円の措置をいただいているというところでございます。
 それ以外、AI for Science関連としましては、例えばAI for Scienceによる科学研究革新プログラムということで370億円の補正予算を措置いただいていることですとか、あと、科学研究向けのAI基盤モデルの開発・共用ということで、これは理研のほうで進めていただいております事業についての補正予算28億円等々につきまして措置をいただいているところでございます。
 あと、こちらは生成AIモデルの透明性・信頼性の確保に向けた研究開発拠点の形成ということで47億円の補正予算。
 あとは「富岳」の関係の補正予算も含めて、あとは、ちょっと飛びますけれども、大規模オートメーション/クラウドラボの形成ですとか、最後の先端研究基盤刷新事業ということで、こちらもAI for Scienceに資するものとして、コアファシリティを戦略的に整備するための補正予算を措置していただいているという状況でございます。
 非常に駆け足で申し訳ございませんが、説明は以上でございます。
【尾上主査】  土井室長、ありがとうございます。
 先ほど局長がおっしゃっていたように、全体で1,500億規模ということで、今後、この個々の施策が組まれていくものと思います。こちらのほうはよろしいでしょうか。ありがとうございました。
 それでは、最後に、今後のスケジュールについて事務局から御説明をお願いいたします。
【麻沼参事官補佐】  事務局です。
 委員の先生方におかれましては既に仮押さえをお願いしているところですけれども、次回、第2回は2月13日(金曜日)10時から12時、第3回は3月26日(木曜日)16時から18時の開催を予定しております。開催が近づきましたら改めて御案内いたしますけれども、引き続き御予定の確保をよろしくお願いいたします。
 以上です。
【尾上主査】  ありがとうございました。
 それでは、本日の議論はここまでとさせていただきます。
 その他、事務局より事務連絡がございましたらお願いいたします。
【麻沼参事官補佐】  事務局です。
 本日は、様々御議論いただきまして誠にありがとうございました。先ほどスケジュールでお示ししましたとおり、タイトなスケジュール感で議論を進めていただくことになっておりますので、よろしくお願いいたします。
 また、今後、文科省においては、AI for Scienceに係る基本的な方針などの議論も別途進んでまいります。本ワーキングでも適宜周辺の情報などを紹介させていただきつつ、計算資源等との接続なども見据えまして御議論いただければと思っておりますので、どうぞよろしくお願いいたします。
 以上でございます。
【尾上主査】  ありがとうございます。
 それでは、これで閉会とさせていただきます。どうもありがとうございました。次回もよろしくお願いいたします。
 
―― 了 ――
 

お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

(研究振興局参事官(情報担当)付学術基盤整備室)