ライフサイエンス委員会 基礎・横断研究戦略作業部会(第13期~)(第2回)議事録

1.日時

令和8年2月20日(金曜日)16時00分~18時00分

2.場所

WEB開催

3.出席者

委員

杉本主査、坂内主査代理、岡田委員、鎌田委員、下郡委員、洲﨑委員、高鳥委員、武田委員、夏目委員、西増委員、水島委員、山崎委員

発表者

武田 洋幸 委員(京都産業大学生命科学部 教授)
大浪 修一 参考人(理化学研究所発生動態研究チーム チームディレクター)
有田 正規 参考人(情報・システム研究機構国立遺伝学研究所生命ネットワーク研究室 教授)
角家 健     参考人(北海道大学医学研究院特任准教授(整形外科医師))
 

文部科学省

倉田ライフサイエンス課長、西山生命科学専門官

4.議事録

【西山生命科学専門官】
 先生方、定刻になりましたので、ただいまより、第2回基礎・横断研究戦略作業部会を開会いたしたいと思います。
 主査に進行をお願いするまでの間、進行役を務めさせていただきます、文部科学省ライフサイエンス課生命科学専門官の西山でございます。どうぞよろしくお願いいたします。
 本日は、傍聴者として事前にご登録いただいた方々に本部会の模様を配信しております。
 まず、委員の出欠状況についてでございますが、本日は全ての委員の先生方にご出席いただいておりまして、定足数である過半数に達していることをご報告いたします。
 続いて、Web会議システムの留意事項についてでございます。本日は、Web会議システムによる開催とさせていただいております。会議の円滑な運営のため、通常はマイクとビデオをオフにしていただき、質疑応答の際にビデオをオンにしてください。発言を希望される場合は、挙手ボタンを押していただき、主査から指名がありましたら、マイクをオンにしてご発言ください。ご発言が難しい場合は、チャットにて状況をお知らせいただければ、主査または事務局より代読させていただきます。
 また、通信の不具合等が生じました場合は、随時お知らせください。Web会議システムの音声が途切れてしまった場合には、事前にいただいております電話番号に事務局から連絡させていただきます。ご不便をおかけすることがあるかもしれませんが、何とぞご理解いただけますと幸いです。
 それでは、これ以降の進行は、杉本主査にお願いいたします。
 杉本主査、よろしくお願いいたします。
 
【杉本主査】  
 杉本です。本日も、どうぞよろしくお願いいたします。
 それでは、これより議事に入ります。まず、本日の議事及び配布資料について、事務局から確認をお願いします。
 
【西山生命科学専門官】  
 議事次第をご覧ください。本日の議題は3点でございます。
 議題(1)は、第1回作業部会の振り返りです。前回、第1回の作業部会において各委員及びPD・PSからいただいたご意見を事務局にて整理しましたので、その内容についてご説明をさせていただきます。
 議題(2)については、各プログラムの有識者からのヒアリングです。各プログラムの今後の在り方を検討するために、有識者からご発表いただきます。本日は、有識者として4名の方にご出席をお願いしております。ご多忙の中、ご発表いただきますことに、事務局を代表してお礼申し上げます。
 まず、「ナショナルバイオリソースプロジェクト(NBRP)」では、国際的な潮流を踏まえたバイオリソース事業のこれからの在り方について、本作業部会委員の京都産業大学 武田教授にお話しいただきます。
 続いて、「ナショナルライフサイエンスデータプロジェクト(NLDP)」では、AI for Life Science基盤としての統合データベースの在り方について、理化学研究所の大浪チームディレクター、情報・システム研究機構国立遺伝学研究所の有田教授にお話をいただきます。
 続いて、「生命科学・創薬研究支援基盤事業(BINDS)」では、ユーザーから見た高度共用研究基盤のこれからについて、北海道大学 角谷特任准教授にお話しいただきます。
 質疑応答は、それぞれのご説明の後に時間を設けております。
 議題(3)は、全体討論及び今後の議論の方向性についてです。議題(2)までの議論を踏まえた上で、俯瞰的に議論をいただきたく、総合討論の時間を設けさせていただいております。
 本日予定している議題は、以上になります。
 配付資料については、議事次第に記載のとおりとなります。資料番号は議事に対応した形になっておりますが、過不足等がございましたら、議事の途中でも構いませんので、事務局へお知らせください。
 以上です。
 
【杉本主査】  
 どうもありがとうございました。
 それでは、早速ですが、これから議事に入りたいと思います。議題の一つ目ですが、まず、事務局から、前回、第1回の作業部会で出た意見について、ご説明をお願いします。
 
【倉田ライフサイエンス課長】  
 資料1をご覧いただければと存じます。
 今、画面に映っておりますでしょうか。こちらは、前回の発表者の先生方の資料、また、その後の質疑で先生からいただいた意見を抜粋させていただいております。漏れなどございましたら、次回に向けてアップデートしていきたいと思っておりますし、また、今回、第2回でのご意見などもこちらに追加をしていく形で整理をさせていただければと存じます。
 まず、各事業の共通の事項といたしましては、やはり人材、色々な技術支援者、技術者の方を含めて、そういったところが不可欠であるといったところ、また、人材の育成確保のためにもキャリアパスというものを示していかねばならないといったところが、共通的な課題として指摘をされたかと存じます。
 NBRP事業につきましては、こちらの基本的な意義というところにつきましては、皆様からも色々ご意見をいただいたところで、その重要性は変わらないところでございますが、AI時代の中でどのようにサイエンス・トラストを確保していくのか、あるいは質の高いバイオリソースをいかに整備していくことが重要か、といった観点でも、ご指摘をいただいております。
 そういった中、時代に応じて、どのように戦略的にバイオリソースというものを整備していくのか、といったところにつきましても色々なご指摘をいただいておりまして、もちろん、予算の拡充、枠組みの拡充といった点も含め、ご指摘をいただいたところでございます。また、そういった中、諸外国の動向ですとか、あるいは研究の動向も見ながら対応していく必要性についても、ご指摘をいただきました。
 また、繰り返しですが、AI時代というところで、個体としてのバイオリソースだけではなく、デジタルデータの保存・提供の重要性についてもご指摘をいただいております。
 また、社会情勢の変化ということでは、物価高といったことも含めてのご指摘もいただいておりまして、こういった持続可能性をどのように担保していくか、といったところでの利益負担の在り方などについても、ご指摘をいただいたところでございます。
 2枚目でございます。データベースのNLDP事業でございます。こちらにつきましても、AI for Science時代、AI時代でどういう基盤が必要か、といったところで、ご指摘、ご意見などをいただいたところでございますが、これまで、この事業を通じて知識グラフといったものを基盤に統合データベースを整備してきていただきまして、それ自体、日本としての非常に重要なアセットになっているわけでございますが、これをいかにAI時代に皆様に活用いただくか、また、データを検索するといったことだけではなくて、それ自体をAIで活用していく、そういった形での活用についてもご指摘をいただきました。また、こういったデータを提供いただくことに対しての成果の評価の在り方につきましても、ご指摘をいただきました。
 また、利活用を見据えた形でいかにこのデータを確保していくか、あるいは品質を確保していくかといったところでは、冒頭でご紹介しました人材の観点も含めての課題をご指摘いただきましたとともに、3番目にも書いておりますが、それを持続可能な形で体制を整備していく必要性、また、欧米などでは人材も含めて非常に手厚く整備がされているところに比べて、日本としては、まだ十分に措置がされてないという、欧米と比較した状況の中で欧米に伍していくためにも、大規模なデータベース群を管理していけるような基盤、あるいは人材といったものの重要性について、ご指摘をいただいております。
 そういう中で、もちろん、日本だけでなく、国際連携、あるいは標準化といった観点などについても、ご指摘をいただいたところでございます。やはり、データ量が多くなればなるほど、計算資源といった問題も切り離せなくなってまいりますので、そういったところの整備の重要性についても、ご指摘をいただきました。
 最後、3ページ目のBINDS事業でございますが、事業の役割・価値については、その重要性について皆様からもご確認・ご指摘をいただいたところでございまして、時代に応じて、先端の機器をどう取り入れていくのか。あるいは、先端の機器が大規模化・高度化していく中で、支える人材、技術者をどう育てていくのか、といったところでもご指摘をいただきましたし、また、BINDSで得られた、各装置から出されたデータをこのデータ基盤と連携をさせながら活用していくことの重要性、また、事業としていかに持続可能な形でやっていくか、といったところでの費用面も含めてのご指摘などもいただき、最後は、繰り返しですが、人材面についてもご指摘をいただきました。
 雑ぱくではございますが、このような形でまとめさせていただきましたけれども、本日も色々な観点からご指摘・ご意見をいただきまして、こちらで整理させていただければと存じます。
 以上でございます。
 
【杉本主査】  
 ありがとうございました。
 最初にもう一度この作業部会の位置づけについてご説明しますと、今申し上げている、「ナショナルバイオリソースプロジェクト(NBRP)」「ナショナルライフサイエンスデータベースプロジェクト(NLDP)」「生命科学・創薬研究支援基盤事業(BINDS)」、この三つをこの作業部会で議論しているところでございまして、これらは令和8年度で事業期間が一旦終了するのですが、これまでの成果や課題を検証して、令和9年度からどういう形で次期事業を実施するか整理することが目的となっております。この作業部会で皆さんのご意見を伺いながら報告書を作成して、7月頃、ライフサイエンス委員会で報告しながら、今後の概算要求等の検討に反映させるのが目的ということで、改めてご説明させていただきました。
 第1回では、NBRP、NLDP、BINDSについて皆さんのご意見を伺うということで、今ご説明いただいたようなご意見が出ているというところになります。本日も引き続き、まず、それぞれのプログラムに関係している方々からのヒアリングを行い、その後、議題(3)で全体の意見交換をさせていただきたいと思います。それぞれの先生方のプレゼンテーションを伺った上で、これからこの三つのプログラムをどのような形で継続するのが適切か、先ほどから出てきているAI for Scienceについて国としてしっかり取り組むということになっておりますので、そういう要素も取り入れながら、この三つの事業をどうやって続けていき、どのような形にブラッシュアップするのがいいかということを、皆様のご意見を伺えればと思っております。
 では、意見交換は3番目の議題のところで伺うとしまして、次の議題(2)の各プログラムの有識者からのヒアリングに移りたいと思います。
 まず、「ナショナルバイオリソースプロジェクト」について、武田先生から10分程度でお願いいたします。
 
【武田委員】  
 では、スライドを共有させてもらってから始めます。ちょっとお待ちください。
 では、始めます。よろしいですか。
 最初に、前も簡単に自己紹介したのですが、自分の研究について、バックグラウンドとして話した後で、この話をします。
 私は、実は1991年に日本で初めてゼブラフィッシュの研究を導入しまして、2000年からメダカも実験系に加えて、それからずっと一貫して、脊椎動物の発生とゲノム進化の研究をやってきました。この間、私はバイオリソースの利用者の立場でありました。本日は、その経験を基に、国際的な潮流を踏まえたバイオリソースの在り方について、私の考えを述べたいと思います。あくまでも私の経験をベースにしていますので、一つの切り口とお考えください。
 このスライドは文科省のものからお借りしたのですけども、現在、このような多様なモデル生物を支援しています。多細胞生物に焦点を当てますと、上のグループ、いわゆる世界標準のモデル生物と、下の日本を中心として開発・維持されているグループに分けられ、ニホンザルも、重要なリソースです。
 世界標準のモデル生物は既に国際的なコンソーシアム等が形成されておりまして、今後も精緻な生命科学の研究にとって日本も重要な貢献をしていくのが必要だと思います。
 一方、近年、学術の潮流には大きな変化も見られます。特に、生物を環境から切り離して理解するのではなく、環境との関係の中で個体や種を統合的に捉える研究が進んでいます。これらのキーワード(生物多様性の理解と保全、気候変動・生態系変動への対応、人類活動が生物に及ぼす影響、感染症と One Health の視点)でお分かりのように、いずれも生物を自然環境と不可分の存在として扱っています。この流れの中でモデル生物に求められている役割も、実は変わりつつあります。すなわち、研究対象のモデル生物は、研究室内に閉じた存在ではなく、自然環境と連続していることが重要となっています。この潮流を象徴するのがシロイヌナズナであり、さらに、例えば下のグループで言えば、ミヤコグサやメダカになると思います。この順番に、私の説明を進めていきたいと思います。
 例えば、シロイヌナズナの研究は、単一の参照ゲノムから既に脱却していまして、1,000以上の野生系統のゲノム解析によるパンゲノムへと展開し、さらに現在は、ゲノム、エピゲノム、シングルセルの情報を統合して、環境応答を予測するComputable Plantを目指す段階に入っています。これは、気候変動に対応する次世代作物の設計図を提供する上でも重要と思います。
 日本に自生するミヤコグサでも同様の展開が期待されています。このスライドは2020年のミヤコグサの成果から私が作ったものですけれども、この研究では、130系統以上の野生集団のゲノム解析により、四季があり、南北に長い日本列島において生息域を北上させる過程で獲得された越冬性や開花調節に関わる遺伝子群が明らかとなり、環境応答の過程がまさにゲノムレベルで示された研究となっています。ここで重要なのは、日本が長年蓄積してきた野生集団のコレクションが国際共同研究の基盤となった点です。
 ここからは、メダカを用いた環境応答の研究例を少しナラティブに紹介したいと思います。私自身はこの研究には直接関わっておりませんが、研究の発展を間近で見る立場でありました。約20年前、欧州でヒトゲノムを統括する英国EBIのディレクターであるEwan Birneyが、ヒトの個性の研究のためにドイツのメダカ研究者と共に日本の野生メダカに着目したことが、この研究の始まりです。その後、バイオリソースと共同で彼らはきれいな野生集団が現存している愛知県清須で野生メダカを大量に採取し、ドイツに移送しました。特に彼らが着目した点は、過去に集団的なボトルネックを経験したせいか、メダカは野生集団から近交系統の樹立が非常に容易なことです。さらに、エピゲノムやゲノム情報の研究は、我々武田研を中心として哺乳類と同等のレベルで整備されていることも強みとなっていました。彼らがやったことは極めて単純で、野生集団から多数の近交系を樹立し、遺伝的多様性をホモ接合の状態で維持した近交系パネルを構築し、これを、Medaka Inbred Kiyosu-Karlsruhe panel、MIKKパネルと名づけました。すなわち、このパネルでは各系統がホモの遺伝型に由来する個性をそれぞれ持っており、まさにヒト集団内の個性の縮図とも言えます。そしてこのパネルでは、ゲノム解析は、当然、ものすごくシンプルに可能です。彼らの研究は、2019年から2020年に大型グラントを獲得して、加速しました。欧州の研究イニシアチブでHorizon Europeでは環境と生物の相互作用は主要なテーマであり、この研究はその方向と一致していました。
 このパネルを用いた最近の成果を一つだけ、ここに載せました。ちょうど先週、『Cell Genomics』に公開されたもので、お手持ちの資料ではまだ「in press」となっておりました。簡単に要約しますと、例えば、寒い冬、お風呂場で起こるヒートショック現象などを想定して、メダカ胚の心臓の拍動数の温度感受性の違いを各系統で調べ、温度感受性が高い遺伝子領域を絞り込んだということです。これらの領域にはヒトの心臓の生理機能に関わる遺伝子が多数存在していました。すなわち、このパネルを利用することにより、ヒトの環境応答の個体差をゲノムレベルで解析できるということが示されたわけです。これはほんの1例です。様々な環境因子に対する応答を、このパネルを用いて解析することは可能です。
 さらに、環境と生物の相互作用を広く調べるには、NBRPメダカの豊富な野生集団を活用した、ゲノム、エピゲノムの解析が有効かもしれません。特にエピゲノムは、環境変化に最初に応答する指標です。また、MIKKパネルと同様の発想で、異なる緯度、例えば高緯度に生息する野生集団からパネルを作り、寒冷環境がゲノム・エピゲノムへ与える影響をあぶり出すこともできるでしょう。ここでポイントなのは、ミヤコグサと同様に、海外の研究者が日本のリソースのポテンシャルに着目した点です。現在、欧州の研究グループは、日本とさらなる連携を求めています。日本がコアとなる国際共同研究が実現すれば、環境応答や個性に関する、ゲノミクス、エピゲノミクスの研究は、日本固有の生物モデルを用いて推進していくことが可能となります。その結果、アフリカの小集団から地球全域に拡散したヒトの集団がどのように環境に適応し、個性や疾病の感受性を獲得してきたかの理解にもつながります。さらに、気候変動下で食料生産を担う家畜や養殖魚の遺伝的改良に向けた戦略の提案も、こういった研究から出てくるものと期待されます。
 まとめたいと思います。今回は、下の環境応答におけるモデル生物について、お話ししました。この分野において、野生集団を豊富に内包する日本のバイオリソースは、海外からも注目されています。膨大なゲノム情報を統合的に理解できるようになった今日、いわば時代がようやくこのリソースに追いついたとも言えると思います。これらのリソースに対しては、保存・配布事業に加えて、国際共同研究のプラットフォームの核として機能するような、戦略的かつ長期的な支援体制があることが求められます。さらに、将来を見据えますと、シロイヌナズナと同様に、多くの野生集団の表現系と多層的オミクスデータをAIで解析・統合し、環境変動下の応答を予測できるComputable Organismの実現が期待されます。まさにここに、AI for Scienceが出番となって登場します。私は、日本発のリソースが次世代のモデルを牽引する潜在能力を有していると感じています。
 最後に、先週、EMBLから『Cell Genomics』に論文の公開に併せて発表されたプレスリリースの写真をお見せして、私の話を終わりたいと思います。お手元の資料には間に合いませんでした。ご覧のスライドは、清須の田園風景を背景にメダカが写っているということで、欧州の研究所のホームページに公開されたものを持ってきました。
 私の話は以上です。ご清聴、ありがとうございました。
 
【杉本主査】  
 武田先生、どうもありがとうございました。この1個前のスライドがまとめになっていたかと思いますが、ナショナルバイオリソースの在り方も変化してきているということで、環境と生物の関係がポイントになっているということと、あと、モデル生物としての要件が変化しているということがかなり大きいことかと思います。また、日本発のリソースというものの重要性、そこで日本がイニシアチブを取れるリソースをつくるということがポイントだったかと思います。
 では、このプレゼンテーションについて、数分程度で、ご質問、ご意見等を伺えればと思いますが、いかがでしょうか。
 ナショナルバイオリソース全般についてでも結構ですので、ご意見いただければと思います。
 モデル生物の要件が変化してきたということで、資料の中にもありましたけれども、これまでNBRPで支援してきたモデル生物と、これから新たに加わる可能性があるものというのも、今、予測できないけれども、新しいモデル生物というのが出てくる可能性もありますので、今後、NBRPの在り方を考えたときに、以前に比べて使われにくくなってきたモデル生物というのもありますし、新たに加えるということも考える、ターンオーバーを考えるというのが一つポイントになってくるかと思うのですが、その辺り、いかがでしょうか。もし武田先生に何かお考えがあれば、伺えればと思います。
 
【武田委員】  
 今回は下の方をお話ししたのですけれども、もちろん、上の方に書いてあるように、研究の進展に伴って、色々なモデル動物の候補が出てきています。僕は魚の専門家なので魚を二つ挙げていますけど、老化研究と、それから、小さいんですがアダルトでも完全に透明な魚とか、それから、聞くところでは、ゼニゴケは植物のルーツになっているので大変よいモデルであると。こういうもののターンオーバーは、新たに増やすというよりは、今ある中にうまく取り込んでいくのがいいのかなと、思っています。
 僕の今回のポイントは、今あるリソースでも十分、活用によっては世界的な研究がまだまだできること。特に、日本というのは温帯性の土地なので、非常に野生集団の環境依存性が高いです。例えば、メダカとミヤコグサを挙げましたけど、他にもそのようなリソースはたくさん持っていると思っています。その代表例を今回紹介したということです。
 
【杉本主査】  
 ありがとうございます。他、ご意見いかがでしょうか。
 水島先生、お願いします。
 
【水島委員】  
 武田先生、どうもありがとうございました。このように非常に有意義な生物がどんどん増えていくと、リソースとしては、ストックがいかに簡単にできるかというのが大事なポイントになってくる気がするのですけれども、その辺りはどのくらい意識していくことが必要でしょうか。特に魚だと、そこの点は難しいことも多いのではないかと思うのですが。
 
【武田委員】  
 ありがとうございます。僕は魚の専門家なので魚を中心に話しますが、魚の業界の中でも十分認識されていて、Inbred line(近交系)ですと、マウスと異なり受精卵で保存することができないです。ですので、今目指している技術開発に関しては、卵巣と精子をそのまま、要するに卵巣と精巣でうまく、特に卵巣を凍らせて、それを起こして、さらにつなぐというような技術とか、それから、借り腹を借りて始原生殖細胞から、実は魚は始原生殖細胞の性にはかかわらず、精子でも卵子でも生殖細胞になり得るので、生殖細胞から精子と卵子両方を作って系統を維持するような技術はかなり進んでいます。そういう技術を利用して、うまくダウンサイズしながら新しいものを入れていくというようなことは可能になりつつあります。もちろん、そのような技術開発は、バイオリソースに付随した技術開発として鋭意進めていく必要はあります。そんな状況です。同じ問題を抱えているところもあると思いますけど、そういうアイデアでやらなければいけないなと思っています。
 
【杉本主査】  
 ありがとうございます。他、いかがでしょうか。特にないようでしたら、総合討論のときにまたお願いします。
 武田先生、ありがとうございました。
 では、続きまして、「ナショナルライフサイエンスデータベースプロジェクト」について、理研の大浪修一先生に発表をお願いいたします。
 
【大浪参考人】  
 大浪です。よろしくお願いいたします。
 スライドを投影していただけるようなので、このまま進めたいと思います。理化学研究所の生命機能科学研究センターにおります、大浪です。
 それでは、次のスライド、お願いいたします。
 最初は、私のバックグラウンドを紹介したいと思います。私自身はまず、SSBDというバイオイメージングのデータの世界的な統合データベース、リポジトリの作成をしております。要は、バイオイメージングデータ版のDDBJないしPDBjを作っているとご理解いただければいいと思います。ヨーロッパ及び米国と統合して、そういうシステムを確実につくるというところを今進めております。
 それから、理研の中には、6個の生命系の研究センターがあるのですけども、それぞれの特徴的なデータとかを、あるいはデータベースを統合して、それを全体として、データサイエンス、さらにはAIに使っていこうというような、統合するプロジェクトとして、「オープンライフサイエンスプラットフォーム」というプロジェクトを進めております。
 さらには、TRIPプロジェクトというのが2023年に始まったのですけれども、これは、生命を超えて、物理とか化学まで含めた、理研から出てくる様々なデータを統合して、それを使って、計算科学、DX等やるというプロジェクトの中で、特に私自身は、データを生産する現場からデータを管理するシステムにデータをしっかり移行して管理するというところのシステムの開発等を担当しています。
 このような最近の私の仕事の背景の下に、私の意見を今回は述べさせていただきたいと思います。
 次のスライド、お願いいたします。
 最初に、AI for Life Scienceのためにデータベースはそもそも必要なのかという問いがあったとして、それに関する答えは「Yes」だと考えております。ご存じのとおり、AIはデータを食べることにより賢くなるものであり、AIを賢くする・活用するためにはデータベースが必要。これはほとんどの方のコンセンサスとなっている考え方かと思います。
 次のスライド、お願いいたします。
 では、AI for Life Scienceのために必要なデータベースとはということですが、現在のAIはよく整備された公開データはほぼほぼ食べ尽くしていると理解しています。逆に言えば、よく整備されてない公開データはあまり食べていません。今後必要となるデータに関しては、既に存在する公開データをAIが食べやすいように整備し直したデータと、それから、新たにデータを取ってAIが食べやすいように整備する、この二つのデータが大事になってくると当然考えていて、今後必要となるデータベースは、これらの整理されたデータをAIが食べやすいように提供するデータベースと言えるかと思います。
 次のスライド、お願いします。
 よく整備されたデータとはなんですかということですけれども、これは、正確なメタデータが豊富に付与されたデータ、そして、メタデータをAIが正確に理解できるデータと考えております。メタデータというのはデータそのものがどのようなデータであるかを説明するデータでして、例えば、このデータは線虫とかハエから取れましたとか、この顕微鏡で取りましたとか、そういうようなデータです。メタデータがなければ、データというのは単なるファイル、あるいは電子的な塊にすぎませんから、メタデータというのがデータの活用のために必須かつ重要であるということが分かっております。このようなよく整備されたデータのことを我々はAI-readyデータと呼んだりもしております。
 次のスライド、お願いします。
 正確なメタデータが豊富に付与されたデータとはどのようなものかということですが、これは今、二つの立場があると理解しております。一つは、オントロジーとか、スキーマとか、そういうもので標準化されて、構造化されたメタデータです。これはこれまでのNLDPのプロジェクト等で集めてきたグラフに見るようなデータになります。それに対して、今は自然言語で記述したものでもいいのではないか、最近はLLMが発展してきたので、それを使って解釈すればいいので、構造化する必要はなかろうというような考え方も実は存在しており、両者は対立しております。これは決着がついてないと理解しております。ただ、データベースでメタデータをつけてきた経験から言うと、今、ヒューマンエキスパート、博士を取っているような人ですら論文の自然言語から正確なメタデータを抽出することは極めて困難で、我々のデータベースでも重要なところはデータを作った人に確認をしています。ですので、100%正確なメタデータをつけるためには、今の技術ではLLM等で自然言語から自動的に取るということは技術的にはあまりうまくいかないのではないかと考えております。データを作った人にメタデータをカチャカチャつけていただこうということに関しては難しいだろうと思っていまして、一番は、作業が面倒くさいとか、大変だとかということがあります。ですので、そもそも対応としては、メタデータの収集方法を根本的に変えなければいけないのではないかと思っておりまして、実際にはメタデータはデータをつくった場で取るというのが多分コンセプトと考えていて、今、私自身は理研の中で、データを取る現場に電子ラボノートブックとかデータ管理システムを導入して、人間にかかる手間を最小限に減らしてメタデータを獲得するようなシステムの導入をしております。実際に幾つかの分野においては既に実用化の成功が見込まれておりますので、そのようなことができる未来を想定しております。
 次のスライド、お願いいたします。
 メタデータをAIが正確に理解できるデータとは何かというと、AIにメタデータの保存場所とか形式を理解させる方法が大事で、最近だとMCPというプロトコルが大事で、それを整備しましょうということが割と言われているんですけど、実は反MCP派もいます。既存のAPIで十分じゃないかという議論もあるので、まだまだ決着がついておりません。ですので、今後も国際的な議論・開発を継続的にしていく必要があると思っております。
 次のスライド、お願いします。
 ということで、技術的には何が重要かということは、なかなか決着がついてない問題だと思っています。ですので、こういきましょうということはなかなか言いにくいですが、これから先、AI for Life Scienceの基盤として重要なことは何かということを、私の考えを伝えていきたいと思います。
 次のスライド、お願いします。
 一つは、スピード感だと思っております。AIを取り巻く環境は非常に速くて、従来の科学のスピード感とは段違いに速いです。例えば、理化学研究所でAI for Life Scienceの先駆け的なプロジェクトを始めているAGISですけれども、これは、2023年から構想を始めて、2024年から実際にプロジェクトが始まって今に至っているのですが、この3年ぐらいの間に技術コンセプトの中軸になるものが変わってきています。2023年に議論していた頃は基盤モデルというのがそもそも重要という感じだったのですが、それがAIエージェントという話になって、今はみんなが世界モデルとか言い出しているんですね。この短期間で重要であるという技術の柱がどんどん変わっていきます。こういう技術の柱の変化に対応して柔軟な運営をしていかないといけないという状態に今なっておりまして、従来の研究プロジェクトみたいに、数年かけて5年間の研究プロジェクトの計画を立てて、それを実行するみたいなやり方ではとても対応できない状況になっています。
 もう一つ、例として挙げるのは、私は先週サンフランシスコに行って、Biohubの中でのプロジェクトのプロジェクトメイキングをしてきたのですが、これは、今年の1月に連絡が来て、2月10日から12日の会議で日欧米のデータベースでのプロジェクトを合意するまでに至っています。このスピードでものを動かすというのが今の時代で、従来のスピード感では対応できなくなっているということは正直感じているところです。
 次のスライド、お願いいたします。
 もう一つ大事なことは、戦略性だと思っています。生命科学の分野に限らないですが、新しい形式・様式のデータを取得する方法が新たにどんどん開発されていて、それに伴って新しいデータベースをつくっていかねばならない。逆に言えば、あまり重要ではなくなってきたデータベースの縮小ということも含めて戦略的に行う必要があり、そういうことが今まであまり行われてきていないと理解しています。例として挙げると、ヨーロッパで開発されているBioImage Archiveというバイオイメージングのデータベースなのですけれど、これはEBIが自ら戦略的に、このデータベースの必要性、つまりバイオイメージングの重要性を鑑みてデータベースのプロジェクトを立ち上げて、その後でこのプロジェクトを担うPIの公募を行って現在のMathew Hartleyがリクルートされたというふうなプロセスを動かしているのも、実は私、はた目で見てきました。すなわち、データベース、何が必要かということをしっかりデータベース全体を見渡せる組織が見て、タイムリーに戦略を立てて手を打っていくということが重要と思います。Biohubのこの前の会議でも、このデータを持っていないかということをさんざん聞かれました。Biohubが次に投資する先として、既に戦略的に動き出している。こういうことに関して、今まで我々データベースサイドは、単純なというか、純粋な公募ベースでやってきて、戦略的には行っていなかったので、戦略的につくっていく必要があると思っています。いずれにしろ、これからデータ量は増えるのですけど、お金は限られていますので、資金の効率的な運用が求められていると理解していて、例えば理研では、計算資源の中央集約化みたいなことが行われています。ただ、全部を中央に一旦集めるだけだとやはり駄目で、中央計算機とローカル計算機のバランスをしっかり取らねばいけないということが見えてきています。あるいは、ヨーロッパのEBIは、全部のデータをヨーロッパで集めるんじゃなくて、お金がもたないので、色々な国でデータベースを持っていただいた上で、Federation型で全世界で運用していくようなモデルを提案していて、そこら辺も既にデータの量にお金がついていけなくなっているという現実があって、このような戦略を持った運営をする必要があると思っています。
 次に行きます。
 データ生産現場との連携というのは非常に大事で、つまり、これまでデータベースの運用サイドと開発サイドと生産現場の連携がスムーズではなかったと思っています。これは欧米でもそんなにうまくいってないです。ですけれども、ここは日本が一番強みを発揮できる部分かもしれず、データの生産とかデータベースに関わるファンディングは、結局、国のお金が主に使われているので、ファンディングソースが一つということもあるので、ここをうまく統合した形の連携したプロジェクトが立てられれば、欧米に比べて強みができるかと思っております。
 次のスライド、お願いします。
 さらに、データの活用現場も同じです。活用を考えながらデータベースを運用していかねばいけなくて……。ごめんなさい。最初に、今、データベース業界は、AIがデータベースの最初のカスタマーであると考えています。そうすると、今まで実験生物学者が使っていたデータベースは、どちらかというとAIエージェントが作ってくれと。だから、実験生物学者はAIを通じて情報を得るようになるという未来が想定されています。そう考えると、一次データベース、今で言うDDBJとかPDBjみたいな、そういう最初のデータベースが非常に大事で、そこから先はエージェントたちが上手にやってくれるという未来を想定しています。ここも、ファンディングソースが国であることが重要であるという、日本の強みが発揮できるところかと思っております。
 次のスライド、お願いします。
 ということで、重要なこととして、この四つのファクターを挙げさせていただきました。これを実現するために、最後になりますけれども、次のスライドをお願いします。
 これらの重要な事項を実現できるシステムとして、ナショナルデータベースとして、一次データベースを全体として運営する組織をつくるべきじゃないか。具体的には、DDBJ、PDBj、jPOST、我々のSSBDも入れさせていただいていますけれども、あと、DBCLS等を統合的・戦略的に運営する上位組織というか、一つのエンティティをつくって、戦略的かつスピーディーにこれらのデータベースを運営していく。さらには、このようなデータベースを追加するようなこともやっていくということを提案したいと思います。ただ、現状の遺伝研、阪大、京大、理研等で動かしている体制を大きく変えるというよりは、あくまでもバーチャルな組織として全体を見渡すような組織をつくり、例えば、大規模な計算資源を統合していく等の効率化を進めながら、お金の活用、さらには技術の転用等を行っていきたいと思っています。その上で、データ生産先、あるいはデータを利用するところともコミュニケーションを取りつつ、我が国を代表するエンティティとして諸外国のデータベースの代表との交渉に臨むというところが望ましいと思っておりまして、期待される効果を幾つか書いていますけれども、一つは、マルチモーダルなデータベースが一つの組織の下にぶら下がるので、これから重要になってくるマルチモーダル計測データへのスピード感を持った対応とか、戦略的な対応とかが可能になっていくのかなというようなこと。あるいは、国際的発信力とか、影響力の強化なども、もちろん行うことができるかと思っております。全てをコメントするのは時間がないのでこの辺でやめておこうと思っていますけれども、最後に、このアイデア、このスライドに関しては、ここに述べさせていただいた、DDBJ、PDBj、jPOST、SSBD、DBCLS等の代表の方と既に協議して、このコンセプトに関しては全体的な同意を取った上で、この場で発表させていただいております。
 以上です。
 
【杉本主査】  
 大浪先生、どうもありがとうございました。このスライドが最後のまとめということですが、AI for Life Scienceでは、スピード感・戦略性を他の国が対応している中で、日本も、ナショナルデータベースを構築する、バーチャルな組織を構築するのが重要というご提案かと受け止めました。
 この件につきまして、ご質問、ご意見等ございますでしょうか。
 洲﨑先生、お願いします。
 
【洲﨑委員】  
 どうもありがとうございます。
 大浪先生、どうもお疲れさまでございます。大変貴重なお話で、私もこのイメージデータベースに登録をさせていただいておりますので、重要性は非常に理解しているつもりでございます。
 二つお伺いしたいのですが、一つは、メタデータの重要性という部分に関しまして、現在の登録はマニュアルに頼っている部分が多くございまして、登録する側がエフォートを割かないといけないという状況になっているところがもう少しアップデートできないかなと常々感じているところでありまして、登録を事前に想定したようなメタデータのフォーマットのようなものが研究コミュニティーの中に普及しているような状況がつくれるといいといつも考えているのですけど、その点に関してはいかがでしょうか。
 
【大浪参考人】  
 ありがとうございます。まずは、日頃、ご協力いただきまして、ありがとうございます。
 おっしゃるとおりで、先ほどスライドでお見せした米国とのプロジェクトは、日米欧で必須にするメタデータのリストを作ってしまおうというプロジェクトです。今のところ、ヨーロッパと我々の間のリストは既にできており、それは公開されているのですけども、アメリカまで入った方が強かろうと思いますので、そちらに関しては皆様に見える範囲で公開させていただいて、そこは最低限のメタデータとしてご活用いただければと思っています。それに関しては、このオントロジーを使うべきというようなガイドラインも含めて、既に作っております。
 とは言いながらも、なかなか大変というのは理解しているつもりで、データを入力するためのシステムをなるべく人間の能力を割かないでいいようにするというのが大事で、機械から取れるメタデータは自動的に取ってしまうというところと、あと、どうしても人間が入れねばならない入力に関しては、1回入れば二度と入れる必要がないという状態をつくることが大事だと思っていて、それで電子ノートブックというシステムを入れて、最初に1回入れてしまえば、2回入れる必要はないというようなことをつくっておりますので、それをまずファシリティーから入れて、個別ラボみたいなところのようなオプティマイズしたものもつくるというようなことをやっておりますので、洲﨑先生なんかは比較的ファシリティー的にラボでデータを取っていらっしゃると思うので、我々のシステムとかも、運用に近しいというか、使いやすいと思いますので、そういう形で入れると労力というのはかなり減らせると思いますので、そういう部分の開発の含めてやっていかないとうまくいかないと思っています。
 
【洲﨑委員】  
 なるほど。ぜひ、エンドユーザーへの普及が図るようにしていただければというふうに思います。
 もう一つは、後半の戦略的にデータを収集する領域ないしはターゲットを決めていく必要があるという部分でご指摘がございましたけど、実際にどのデータを集めるべきかというようなところはなかなか決めることが難しいと思うのですが、特に日本が強い領域にフォーカスしていくのがいいのかなと思いながらお話を聞いたのですけど、その辺りのアイデアはいかがでしょうか。
 
【大浪参考人】  
 そこはまさに、実験生物学の方々と、データベース周りの方々と、それを活用する側のAIの人たちと、活用する側の実験生物学の方と議論をしながら、何が大事かということを決めていかないといけないと思っています。例えば、今だと、スペーシャルオミクスのデータみたいなのはしっかりとしたデータベースを国際的にもつくっていかなきゃいけないというのはほぼほぼコンセンサスが取れていると思いますし、あとは、イメージングのデータとオミクスのデータの融合データというのがきれいに収まるようなシステムがまだできてないというか、そういうのはどこから見ても明らかに必要なことだと思うのですけど、多分、そういう新しい技術コンセプトが次から次へと出てきて、重要性というのは現場の方々が一番知っていることだと思うので、そこのコミュニケーションをしっかり取ることというのは大事で、データベースと生産者の方々の間の情報交流がシームレスに行われるようにするというのがすごく大事なポイントかと思っております。
 
【洲﨑委員】  
どうもありがとうございました。
 
【杉本主査】  
続いて、坂内先生、お願いします。
 
【坂内主査代理】  
 ありがとうございました。ナショナルデータベースとして基盤となる一次データベースを運営するという考え方はとても大事だと思います。今は、タンパク質とか、イメージングデータとか、基礎研究に割と近いところで合意を取られているということですが、疾患のデータベースや、創薬を意識しまして化合物なんかもこのデータベースに入ったら、すごく強いのではないかというコメントでございます。
 1点、質問なのですが、ヨーロッパなどでは、EMBL-EBIがタイムリーに、今、これが来るから戦略を立てているというお話でございました。我が国でそれをやるとしたら、それをやっていく組織というのはどのようなところが想定されるのでしょうか。
 
【大浪参考人】  
 まず一つは、例えば、ここにあるDDBJ、PDBj、jPOST、SSBD、DBCLSで一つの予算の取り合いとかやっていると、意味がないじゃないですか。公募が出ました、枠は六つですみたいな。そうすると新しいのが出る余地はないですから、この代表の方々がちゃんと議論して、かつ現場の方々の意見も吸い取って、このデータベースはつくらねば駄目だというのをしっかり、まず、データベースをやっている人たちの間で自分たちに欠けているところを見つけて、そこをどうつくっていくべきかということを進めていくしかないと思っていて、なので、公募ベースというよりは、議論ベースでコミュニティーの中での意見を集約して決めていくというやり方しかない。そういう意味でも、一つのエンティティとしてナショナルデータベースをつくりたいというのがコンセプトになっております。
 
【坂内主査代理】  
 よく分かりました。ありがとうございます。
 
【杉本主査】  
 では、鎌田先生、お願いします。
 
【鎌田委員】  
 ありがとうございました。私も、先生がおっしゃっていた、メタデータが大事だということや、データの生成現場とデータベース、活用現場が連携すべきというのは、本当にそうだなと思って聞いておりました。
 お聞きしたいのは、先ほどの武田先生のお話でも多階層的にデータを統合してAI解析に活用するというお話があったかと思いますし、あと、メタデータもそれぞれの階層で取られてくるものを最終的に統合して使うことを考えたときに、入り口は一つがいいのかなというふうに思っていて、そういう意味で全体を取りまとめるような組織が必要というのをまさに先生は書いてくださっているのですが、そこをバーチャルとすることの意図をお伺いできたらと思います。
 
【大浪参考人】  
 比較的プラクティカルに考えているというところ、理想論を言うというのはもちろんあるのですけど、現実に日本の中でこれらのデータベースは確立したものとして世界的にも認められていますので、こちらをゼロベースで崩してつくるというのはあまり正しい選択ではないと。
 そうすると、現状のシステムを生かしつつ、それをより理想に近づけていくというのが多分正しい道かなと思っておりまして、本来、一つのエンティティにしたいのですけれども、それをバーチャルと言っているんですが、一つの固まりとして、ナショナルデータベースとして運用すると。それが文科省の傘下であるべきなのか、本当は、内閣府の傘下であった方が、例えば経産省とか、そういう省庁の枠を越えられる可能性もあるので、そこら辺がまた面倒なことになると思っているので、そこはなるべく触れないようにしているのですが、現状をあまりに崩す提案をするというのは現実的ではないので、一歩ずつ近づけるために具体的にやり得ることという形で提案させていただいております。
 
【鎌田委員】  
 なるほど。プラクティカルなところからいうのは、大変よく分かりました。先ほど坂内先生から日本で言うEMBL-EBIはどこなのというご質問もありましたので、どういったご意図かなというところをお伺いできればと思いました。ありがとうございました。
 
【杉本主査】  
 では、下郡先生、お願いします。
 
【下郡委員】  
 下郡です。大浪先生、分かりやすい説明、ありがとうございました。他の先生方が既におっしゃったように、AIのためのいいデータを入れるには、メタデータの均一性ですとか、そういうことの重要性というのは大変よく分かりました。
 一方で、データを入れる側としまして、生物を扱っている人間としては、いいメタデータを入れるに当たって、生物って個体差があって、どのライフステージにあるかとか、ライフステージ、そこに行くまでにどんな経験をしているかということで、個体は結構ばらつきがあるのですけど、それに付随するようなメタデータというのはどれぐらい必要になってくるのか、どういう入れ方をしたらいいのか、そして、海外でもこういうことを考えられて、例えばディスカッションされているのかというような状況を、もしご存じでしたら、教えていただけたらと思います。
 
【大浪参考人】  
 ありがとうございます。もちろん私の知っている限りは限られているとは思うのですけれども、メタデータは簡単に取れるものと簡単じゃないものがすごく分かれていて、一番簡単に取れるものは、実は、機械のセッティングとか、機械の条件のパラメーターとかのデータは、機械から取れてしまうのですね。ほとんどオートマチックに取れるので、人が書く必要はありません。あとは、サンプルに付随するデータというのは、サンプルのIDとかだけで言うならば、バイオリソース系のところとしっかり組めば、そもそもの細胞とか、そういうものに関しては比較的単純に取れます。ただし、その試料がどういう経緯で測定現場まで来ているか。例えば、どういう処置をしたかとか、先ほど下郡先生がおっしゃったように、どういう経験をさせたかとか、そういうことは非常に難しい情報で、でも、それは多くの、特に個体レベルぐらいの生物学においては重要な情報なので集めなければいけないということを重々理解しております。
 ただ、これに関して、こういうデータがあれば十分だというような議論は、僕の知る限りあまり行われていなくて、多分、次に有田先生がお話しになると思いますけど、データを取得する場所みたいなインフォメーションというのは、今、取るような流れになっていますが、そういう来歴の、どういう処置をしたかというのをプロトコル的にきれいに取るというのは、まさに今議論されているところで、幾つかの流れがあって、日本のニコンさんとエビデントさんとかが中核になって、あと、産総研の方々とかも入って、実験するときの細胞のプレトリートメントに関してメタデータのセットアップをISOで規格しようということも行われていますけれども、それが世界的コンセンサスになっているとは理解しておりません。
 ただ、そういう動きは幾つかあるのですが、それがきれいにまとまった、これだというのが決まっているというのは、私の知る範囲では行われてないというのが現状だというふうにお答えします。
 
【下郡委員】  
どうもありがとうございます。
 
【杉本主査】  
 ありがとうございました。
 続きまして、同じくNLDPで、有田先生にご説明をいただきたいと思います。
 よろしくお願いいたします。
 
【有田参考人】  
 国立遺伝学研究所の有田です。武田先生が自己紹介されたように、僕も短く言うと、バイオインフォマティクスの分野をずっとやってきていて、もともと、産総研がお台場にセンターつくったときのスターティングメンバーだったり、東大が大学院を始めたときとか、学部を始めたときとか、常にスターティングメンバーだったのですけど、その後、遺伝研に来て、昭和みたいな研究所で任されたのがDDBJのセンター長という役職です。以来、DDBJをやってきています。次のスライドへ行っていただいて、オープン&クローズ戦略のところを出していただけますか。
 DDBJと一言で言いますけれども、大きく分けると、誰でもアクセスできる非制限公開と制限公開の二つの柱が今あります。制限公開というのは、要するに、ヒト情報、個人ゲノムが中心になるのですけれども、実は世界的には、個人ゲノムの方はデータ量もものすごく大きくなっているし、国ごとに管理するという方向に行っています。それに対して、非制限公開と我々は言いますけど、オープンアクセスの方は、世界中で共有しましょうという、従来の科学の流れで管理しているのです。この両方をやっているのがDDBJを含むINSDCという組織ですけれども、このINSDCは、今国際的に、特に途上国からかなり批判されています。何が批判されているかというと、データを自分たちのいいように使って先進国ばかり利している、と言われているわけです。我々としては、誤解を解きたいのは、まず、INSDCに入っているデータはサイエンス全体では全然少ないということです。シーケンサーがどれだけ売れているかということと、アカデミアに入っているシーケンサーだけで考えてもらっても良いのですけれど、どれだけデータが出せるかという能力から考えてもらったら、今、我々が持っているデータ量というのは非常に少ないですよ。では、どこに行っているのかというと、ほとんどはクローズドです。企業の中や大学の中に埋もれて、死蔵されているデータがほとんどです。では何が出てきているのかというと、論文になったところだけが出ている。何で論文にしたら出てくるのかというと、学術出版社がINSDCに公開しないと論文をパブリッシュしないと言ってくれるから、研究者は皆、渋々出してくれているのです。渋々出すときにメタデータをつけろと言われるのでDDBJは非常に評判が悪いのですけれども、細かくメタデータをつけろと言えば言うほど、研究者からも怒られるという立場にあります。
 次のスライドへ行っていただけますか。
 この状況が最近大きく変わってきています。何が変わってきたかというと、非制限公開、誰でも公開するというものも、単に今みたいに無制限に公開していたら、先進国と先進国の企業ばかり利益になるのだからいかんと言われているんです。これはある意味、国連で言うと、多数決を取れば途上国の数の方がずっと多いわけで、彼らの意見に従うのであれば、それなりのキャパシティービルディングも提供するべきだし、そもそも、儲かっているのだったら利益配分をしなさいと言われているわけです。ですから、これからも必然的にバイオリソースというのは国の資源と同じ扱いをすることになる。今まで我々は、科学の成果なのだから、ただで配って当然でしょうというマインドで来たんですけれども、それは今後成り立たないということです。鉱山とか、石油とかと同じスタンス、同じレベルでバイオリソースというのが考慮される時代になったということです。それに対して日本はあまりにも遅れていて、研究者自身がそういう意識を全く持っていない。それは何故かというと、アメリカの傘の下にずっといて、アメリカは生物多様性条約にも参加してないし、国際条約から距離を置くことがある国なので、日本はそれと同じ態度を取ろうとしているのですが、これは国際的に見て日本がリーダーシップを取れる姿勢ではないです。アジアの国からすると、今まで日本はアジアの国を経済的にリードしてきたのだから、それなりの形を見せてほしいと。科学の世界でも、そういう国際的な立場から見てリーダーシップを取ってほしいと思われているわけです。だから、それを踏まえた統合データベースを設計するべきだと考えています。
 次のスライドへ行っていただくと、簡単に書いてありますけれども、誰でもデータを利活用できるというところが非常に重要になる。それは日本の中に限らず、特に、日本を真似したい、日本みたいになりたいと思ってくれる国をサポートできるリポジトリをつくっていくのが重要だということです。データを無償で出しているのだから文句を言うなと思うかもしれませんが、それでは駄目だというのが彼らの主張で、例えばそのデータに特許がどうついているのかとか、特許以外のライセンスがどうついているのかとか、明らかじゃないと使えないではないか、と。例えば、使っている途中で企業にライセンスフィーを支払いなさいと言われたら困るというのが彼らの意見でもあるし、彼らの国から取ってきたデータに関しては、それのおかげで儲かっているのであったら、その国にきちんと利益を還元せよということにも応えないといけない。そのためには、そういう条件がついていることが分かるデータベースをつくらないといけないわけです。だから、今まで我々にとって科学データを無償で配るのは当たり前だったのですが、今、data sovereignty(データ主権)という言葉がキーワードになっていますけども、それを考慮したリポジトリの構築が必要になるというわけです。
 次のスライドに行っていただくと、ここでナショナルという概念が必要になるのですけれども、そういう仕組みを前提にすると、まずは日本が持っているものは何かということをきちんと定義しないといけないのです。例えば、よその国からデータを持ってきたときに、日本のデータは全部無償であげるのだから、そちらも無償でよこせというのは意見として全然成り立たなくて、日本はこれを持っていて、あなたとオーバーラップがあるから、これは日本のリソースとしても見やすいよね、だから使えますよという言い方であれば、相手も納得してくれるわけです。
 僕は、NBRPは名前のつけ方がすごく賢かった、運がよかったと思っているのですが、NBRPは日本のリソースという読み方ができるんです。だから、今までは研究リソースの集まりだったんですけれども、それをうまくすり替え、日本が持っているバイオリソースという読み方ができるような形に、データベースをこれから設計、すり合わせていきたいと考えています。
 それから、利用条件をきちんと書いていかなければならず、日本で取った日本のリソースはもちろん今までどおり無償で使ってよいのだけれども、あなたたち、よその国からもらったものに関して例えば利益配分を求めるのだったら、そういう条件がついているんだよということがユーザーに分かる形の配り方をしないと、今後は国際的には通用しなくなってきます。申し上げたように、アメリカはそんなことは全く気にせずやるのですけれども、ヨーロッパはそちらの方向に動いていて、ヨーロッパはいつもアフリカを気にしているのでアフリカの意見が大分反映されるのですが、日本は同じように、アジアの、特に東南アジアの意見を吸い上げて、それを反映したマネジメントをしていかないと、アジアの国にそっぽ向かれたら、日本は今後立ち行かなくなっていくと思います。それと同時に、今まで話があったように、科学がどんどん進んでいて、新しいデータというのがばんばん出てくるわけです。だから、そういう新しいデータに対応できるような対策も、これからしていかないといけない。
 次のスライド、お願いします。
 「重要性」と書いたスライドですけれども、これから何をやるかというと、研究データの保存と公開というところで言わんとしているのは、僕らがどのデータを持っているかというのを、今のタイムスタンプをつけて記録して残す必要があるということです。もちろん間違ったデータはたくさんあると思うのですが、特に、DDBJとか、昔からあるGenBankとかは、研究者だったらみんな知っていますけど、ごみためだと言われるんですね。だから、そのごみための中から一生懸命宝探しをして二次データベースというものを皆さんがつくるのですけれども、ごみためというのは人間の活動の記録として非常に重要なんですよ。歴史文書のようなもので、歴史文書もごみの文書が多いのですけども、その中から色々比較して統合することによって新しい知識が生まれてくるわけです。同じことが科学のデータからも言える。だから、今の我々のアクティビティーを取っておいて、50年後とか100年後になっても歴史資料として使えるデータを残していきたい。そういうデータを残してもらうためにはメタデータをきちんとつけてもらう必要はありますけれども、そういう作業に従事してくれる人を育てるのがすごく重要だと思っています。
 それから、今の日本のデータベースと言ったときに、文献がすっかり抜けているのですね。アメリカはPubMed Central(PMC)というところでたくさんのデータをフリーで公開しているし、ヨーロッパも、イギリスが始めたんですけど、ヨーロッパPMCというのを持っている。でも、日本はそれがないのですね。最近、Jxivというのを頑張ってつくっていますけれども、機関リポジトリとかに全部分散しちゃって統合検索みたいなこともできていないですし、我々のアクティビティーは日本語も英語も本当に分散してしまっている。だから、図書館のアクティビティーとつなげて、せっかくサイエンスをやっているんだから、我々が出している論文とか文章というのをこの統合データベースの中にも入れていきたいと考えている。
 次のスライド、お願いします。
 これが最後になりますけど、僕が考えている統合化というのは、文理融合の形で、将来的に――将来というのは、短期じゃなくて、50年後とか100年後まで考えているのですが、そういうときに文系の人が科学誌を見るときに参照できるような、そういうリポジトリをつくっていきたいと思っています。もちろん、AI-readyな形でつくっておけば、検索はAIが全部やってくれるわけです。翻訳もAIが全部やってくれる時代になるので、日本だけじゃなくて、それを世界の人が使えるようにする。世界の人に使わせるためには、ライセンスであるとか、利用条件というのをきちんと決めないといけない。利用条件を決めるということは、どこまでが我々のナショナルなデータで、どこからがよその国のデータかというのをはっきりさせないといけませんねということです。
 最後に人材育成も強調したいのですけれども、そういったアクティビティー、文系も含めたような学問に発展していくのだよということを若い人に理解してもらいたいです。例えば、ヒトゲノムのデータは国によって扱いが全然違うし、ヒトゲノムのデータで何か間違いが起こったときの社会からの圧力・バッシングの方向性というのも国によって全然違うというのがアンケートで出ているのです。実は日本は何か間違いが起こったときにペナルティーを非常に強く求める社会性があるという統計が出ていて、それはヨーロッパとかアメリカと全然違う国柄なのですね。だから、国の方向性に合わせた、国の社会的な受容の傾向に合わせたデータのマネジメントも必要になってくるので、単に何でもオープンサイエンスで出せばいいというのではなくて、倫理とか社会問題まで含めた形でリポジトリの方向性を決めたいと思っています。
 以上になります。
 
【杉本主査】  
 有田先生、どうもありがとうございました。誰でもデータを利活用できる社会というのがゴールなんですけれども、やはり、日本がどうするか、国としての戦略性が今後ますます必要になるということがポイントかと思いました。
 では、今のプレゼンテーションについて、ご意見、ご質問等、ございますでしょうか。
 夏目先生、お願いいたします。
 
【夏目委員】  
 ありがとうございます。
 有田先生、大変すばらしいご発表、ありがとうございました。誰でもデータを使えるようなデータベース、そういった基盤を整備していく重要性というのは私も同感なのですけれども、それをどうやって維持していくかというところも併せて検討が必要なのではないかと思いますが、その点について、ご意見をお伺いできますでしょうか。
 
【有田参考人】  
 もちろん、全部無償でやるような予算がないのですけれども、配列データに関しては、今の生物多様性条約の方向性では、お金がもうかっている企業セクターからお金を取って、それをファンドとして使おうという動きがあります。それは今すぐにはならないですけれども、将来的には必ずその方向に移行すると思います。
 それから、今、一番参考になるのは二酸化炭素の排出権取引ですけれども、排出権取引って企業の間ではものすごいお金が動いているじゃないですか。それなりの経済効果も生んでいると思います。同じような取引をバイオリソースについて実施する時代になると思います。ただ、そのときに研究の妨げになってはいけないので、実際のデータアクセスをブロックするということはなくて、データのライセンスを管理することによってお金の取引をする時代になる。その時代に対応するために、今から我々は日本にどんなリソースがあるのかというのをきちんと調べておく必要があると思います。しかも、タイムスタンプをつけて記録として残す必要があると思う。
 
【夏目委員】  
 そうですね。確かに、どういった資産があるのかというところを見せることができなければ、誰がどのぐらいの対価でそれを利用することを検討するかというところも難しくなります。確かにおっしゃるとおりだなと思いました。ありがとうございます。
 
【杉本主査】 
 では、山崎先生、お願いします。
 
【山崎委員】 
 有田先生、ありがとうございました。日本のリソース、すごく重要なのですけれども、日本のものかどうかを決めるのって、実はすごく難しいですが、一応、タイムスタンプをつけて、まず、印をつけていくということなんでしょうか。
 
【有田参考人】 
 そこは国際法の問題になるので、遡及してお金を払うことは絶対ないと、僕は信じています。ですので、生物多様性条約だったら、発効したのは1993年ですから、それ以前に日本に来ているものは不問ですよね。
 
【山崎委員】 
 なるほど。その記録を……。
 
【有田参考人】 
 そこははっきりしたデータが多い。
 
【山崎委員】 
 分かりました。ありがとうございます。
 
【杉本主査】 
 どうもありがとうございました。他、いかがでしょうか。
 では、時間が押していますので、次に移りたいと思います。ありがとうございました。
 最後のご発表ですが、BINDSについてということで、角家先生、お願いいたします。
 
【角家参考人】 
 発表させていただきます。皆さん、それぞれの組織を、全体を総括して発表されていますけど、今回、私に命じられました役割は、ユーザーとしてBINDSを使ってどうだったかということであると理解していますので、BINDSという大きい組織のごく一部だけの経験に関してお話しさせていただきます。
 私のバックグラウンドなのですけれども、臨床の整形外科学を専門として、整形に対するニーズが分かっています。基礎医学の研究も、むしろそっちの方がメインなんですけども、神経科学、再生医学を、in vitroin vivoで実験を行っております。専門外のこととして、創薬、候補薬剤の同定とか、どうやって臨床応用していくかという、具体的なこともさっぱり分かっていませんし、タンパク質の構造解析だとか、それの色々なミュータントの作成に関してもよく分かっていませんし、化合物を応用するにしても、構造解析をどうやって作っていくか、全く素人であります。
 そういう上で私が対象とする疾患が二つありまして、脊髄損傷と末梢神経損傷でして、脊髄損傷は四肢麻痺を呈する重篤な外傷で、受傷後すぐに投与可能な脊髄保護薬が必要だというニーズを感じておりました。
 もう一つは末梢神経損傷で、末梢神経は再生するという事実はあるのですが、重症例は皆さん麻痺が残存しているということと、70年以上、治療法にほとんど進展がないということで、末梢神経の再生を促進する方法・薬が必要だというのを常々感じておりました。それで脊髄損傷治療薬というのを開発したのですけれども、まず、コンセプトに基づいたスクリーニング方法を開発しまして、もともとBINDSの下で働かれている北大薬学部の前仲先生のところで薬剤のライブラリがあって、そういう手法を色々されているという事実を知ったものですから、自分も応用できるのではないかということで、前仲先生と相談しながら自分たちのアイデアに沿ったスクリーニング方法を開発して、それで既存薬と北海道大学が独自に持っている化合物のライブラリをスクリーニングして絞り込んで、色々なin vitroの試験をして、知財を確認して、その後、動物試験でどれぐらいよくなるかというのを五つまで絞り込んで、その次に、今度はBINDSの方の色々な先生方に相談して、お薬を実際に打ったときに、血液の中での濃度がどう変化するかとか、色々な代謝に関することを調べていただいて、あと、実際に臨床で使うときに心毒性はどうなんだとか、そういう辺りのご指摘も受けたので、そういう試験もしていただいて、最終的に、色々な情報が出そろった時点で企業にライセンスを買っていただいて、一応、アカデミアとしてできる部分は完了して、あとは企業と一緒に臨床治験を進めていくという段階に今なっています。最初に申しましたように、私は創薬に関しての知識と経験は全くゼロでしたけれども、こういうお薬をこういうふうに見つけたら患者さんには良かろうというアイデアはありまして、そういうゼロからの開発で薬剤創出と企業導出に成功したということで、これは完全にBINDSのサポートシステムあっての研究プロジェクトそのものということで、感謝しかないという状況です。
 もう一つ、末梢神経に関してのプロジェクトも並行して進めていまして、それは、シュワン細胞という末梢神経を構成する細胞が、末梢神経を再生させるときに修復型というのに分化して、通常はこの軸索の周りを支えているのですけども、再生する際にはアクティブな修復型というものに変わります。その修復型シュワン細胞に高い軸索再生促進効果があるということを見つけていましたし、知られていたことでもありまして、実際、シュワン細胞が、液性因子だけではなくて、細胞表面の分子を介して再生させていて、予想以上にこの効果が大きいというのが分かったものですから、そこをRNAシークエンスして、in vitroで色々なものを試して、実際、薬効試験をして、メカニズムを調べて、新しい軸索再生因子、タンパク質を同定しております。二つ見つけました。その知財を押さえて軸索再生薬を開発していこうということで、一つは、低分子化合物のスクリーニングということですとか、類似中分子タンパク質を作るとか、あともう一つは、非臨床試験に持っていける直前の状況なので、GMP製剤という、人間の体に入れてもいいタンパク製剤を作るにはどうしたらいいか、あるいは、より高力価なお薬が作れる可能性を考えていて、in silico解析していただいて変異タンパクを作っていくというような、こういうプロジェクトを今現在進めております。
 BINDSを利用してよかった点ですけれども、最初に申しましたように、創薬の素人でも創薬を成就することができる体制、スクリーニングのフェーズから、安全性とか、シミュレーションとか、ADMEまで、色々なフェーズをサポートしていただけますし、コンサル、機械、お薬、専門的な計測、シミュレーション、色々なことを全てサポートしていただきました。
 あと、基本的に無償だという非常に高い経済性がありまして、これがあるから自分も創薬研究を開始したというのが背景にあります。こういう、システムだけではなくて、お金がかからないというのが、自分もこういうことをトライできるという一つの動機になっておりますし、こういうプロジェクトは、やや野心的な内容でもあるので、通常のファンディングシステムではサポートがなかなか難しいのではないかと思います。
 もう1回になりますけれども、コンサルテーションが非常に充実されているので、自分の持っているシーズですとか、課題とか、応用に関して問い合わせをしましたら、非常に親身になって専門的かつ具体的な返答いただけたというのは非常に助かりました。その返答に応じて専門外の方をご紹介いただいて、共同研究者の方を紹介していただいて、実際、共同研究の体制を構築することができたという、これらの点が非常によかった点です。
 自分は全体の組織を見る立場でもないですし、全ての経験があるわけではないので、自分の一部の経験からこうだったらいいなという点を述べさせていただくと、タンパク製剤に関わった経験から、人間の臨床に使えるGMPグレードのタンパク製剤を作る方法ということに関する専門家が非常に少ないという事実に当たりました。アカデミアの人間がメインですと、企業が求める要件とか、実際、そういうお薬を企業がどのような感じでつくっているかということに関する専門の先生がいないという点で、臨床応用を考えたときにはGMP製剤が絶対必要なのですけれども、アカデミアにはそれをつくるための経験や知識が豊富な方が少ないということに気づきました。
 あと、ステージが上がれば上がるほど、ファンディングが必要になってきます。全てBINDSにおんぶにだっこというのもどうかと思いますので、創薬の開発内容とか段階に応じてAMEDのプログラムに応募してファンディングを受けるのが正しいのではないかと思いますし、自分もそれを望むのですけれども、AMEDのどのプログラムにマッチするのかというのは意外と判断が難しいところもありますし、その辺りのファンディングのコンサルテーションに乗ってくれる方がいたらありがたいなという点があります。
 あと、ホームページに関しては、非常にすばらしい組織で、色々なポテンシャルがある割には、ホームページから自分が必要な情報にたどり着くのはちょっと難しいなと感じました。
 データというのが今回の会議のメインのテーマの一つと伺ったので、データに関してですが、既に話題に出ましたが、論文化するときにはいずれにせよデータをパブリック化しなければならないので、論文化すれば、データは皆さん使える状況になるかと思うのですけれども、論文化するときは、実はお薬が成就する見込みがなくなったときなんですね。お薬に可能性があればあるほど、企業に売れる可能性があればあるほど、ずっと水面下でプロジェクトが進むことが多いので、本当に肝となるデータはパブリックからどんどん遠くなっていくという事実があります。それらのデータを本当に世の中の人たちが必要としているかどうかは分かりませんけれども、細かい条件が重要なので、今まで話題になっていたようなメタデータの情報が重要ですし、それが分からないと使う側としてもあまり意味がないのかと思っております。
 汎用機器の維持に関してですが、これも、BINDSに限らなくて、自分の個人的な経験ですけれども、維持管理する方に人的あるいは経済的リソースを投じることが重要で、非常に高額な機器が導入されたにもかかわらず、長い間使われてないというようなケースを見ることが少なくないように感じておりますし、高度な研究機器に関しても、それを使いこなす方、それを具体的にサポートできる人的仕組みがないと、本当に活用されたと言えないのではないかと思っております。
 あと、最後に書いた中央と地方の格差ということですけれども、私は北海道大学で研究しておりますが、色々な研究会とか発表会に参加したときに、どうも中央とは、技術的なアクセスとか、始める時期に差があると感じることが多くて、数年経つと追いついてくるのですけれども、常に、時間的な差というか、中央では皆さんやっているのに僕の周りではあまりやってないなというような、そういう技術的なことを感じる機会が多くて、なかなかもどかしい経験をしたことが多かったので、書かせていただきました。
 以上になります。ありがとうございました。
 
【杉本主査】  
 どうもありがとうございました。BINDSの非常にサクセスフルなユーザーとしてご紹介いただきまして、ありがとうございます。BINDSの特徴としては、しっかりしたコンサルテーションを無償で受けられるというところが非常に重要だというお話だったかと思います。
 今のお話につきまして、ご意見やご質問、あるいはご自身がBINDSを使われたことがありましたら、ご経験などをシェアしていただけるとありがたいのですが、いかがでしょうか。
 高鳥先生、お願いいたします。
 
【高鳥委員】  
 高鳥です。角家先生、ゼロから始まって、BINDSを利用して企業導出までたどり着かれたということは、すばらしい成果だと思います。多分、ゼロからだと、色々なユニットが関わるというか、ユニットをつないでいかねばならないということがあると思うのですが、そういったところのコンサルテーション、ユニット間連携とかも、BINDS側で伴走支援的なことは全部やっていただけたのでしょうか。それとも、先生がご自身でその場その場の必要なユニットを探して支援を依頼するという形でやられたのでしょうか。
 
【角家参考人】  
 ありがとうございます。僕の場合は、最初に相談に乗っていただいたユニットの方が常に相談に乗ってくれて、必要なユニットの先生にご紹介いただいてという感じで、僕からユニットを探して声をかけるということではなかったのです。まるで僕の担当の先生みたいな方がいて、そこのチームの皆さんが相談に乗ってくれて、専門の方を紹介していただいてという形になります。
 
【高鳥委員】  
 分かりました。医薬品の開発において化合物をセレクションしていく過程では、初期の物性、ADME、毒性試験といったデータを取って候補化合物を絞り込んでいくというプロセスを踏むと思うのですけど、その辺りもその先生に相談に乗ってもらって進めて絞り込みをしていった、という流れになるのでしょうか。
 
【角家参考人】 
 僕の場合は、まず、個人的に既存薬を全部調べたというのと、それから、オリジナルの化合物は、沢山やったらキリがないので、北海道大学で持っているものを全部やらせていただくということで、そのライブラリをスクリーニングして、スクリーニングでヒットした薬剤をある程度絞り込むときには、僕が個人的に論文だとか知財を確認して、あるいは副作用とかを確認して絞り込んで、その先は、既存薬に関しては情報が出ているので、僕は全部分かりますけども、オリジナルの化合物に関しては、その化合物を作った先生方とディスカッションして絞り込んでいったという形になります。
 
【高鳥委員】 
 先生は、課題でお示しされているように、企業が開発する場合は、医薬品開発のターゲットとしてのゴールを最初に取りあえず決めて、ターゲットプロダクトプロファイルといういわば設計図みたいなものを作りますよね。それで、どういったデータをどの段階で取っていくかというのを決めてやっていくのですけれども、そういったマネジメント機能がBINDSの中にもあってもいいのではないかと思ったりもしますが、そういったお考えはいかがでしょうか。
 
【角家参考人】 
 僕は臨床医なので、出口のターゲットプロファイルを作るのは簡単というか、こういうお薬があれば、こんな感じであれば、こういうニーズがあって、こんなふうに使えるという、むしろそこから逆算して入っている人間なので、そこに関する相談は必要ないというか、そういう状況でした。
 
【高鳥委員】 
 結構です。ありがとうございました。
 
【杉本主査】 
 ありがとうございました。他、いかがでしょうか。
 夏目先生、お願いします。
 
【夏目委員】  
 ご発表、ありがとうございました。今出していただいているスライドの「企業が求める要件」というのが結構難しいところだと私も思っておりまして、例えば、研究成果を実際に医療だったり創薬だったりにつなげたいという気持ちで研究をしていても、高いレベルのサイエンスをしているということが必ずしも創薬や医療につながらないというところを感じておりまして、メガファーマほどそういう傾向があるかもしれないのですけれども、例えば、サイエンスとして美しくてもビジネスにつながらなければ有望なものとして見てもらえないですとか、あとは、ドラッグリポジショニングのような、サイエンティストはいいアプローチだと考えて研究をしているものも、日本の製薬企業は意外と関心を持ってくださらないだとか、そういうところでアカデミアの研究者が考えているところと企業が考えているところとの不一致がどこにあるのかが分からない状態で研究を進めているというところが実際に起きているというふうに思っておりますので、確かに、ここの部分で何かしら、タンパク製剤に限らず、誰かが相談に乗ってくださる体制であるといいなと、私も思いました。
 コメントなのですけれど、ありがとうございます。
 
【杉本主査】  
 ありがとうございました。どうぞ。
 
【角家参考人】 
 今の件に関してなのですが、僕もたくさんの企業とお話ししていますし、昔は製薬会社で働いていたけれども今はアカデミアにいるという方とお話しする機会もたくさんありましたが、まさに先生がおっしゃるように、こっちではいいと思っているのに製薬会社は全然魅力的に感じてくれないということがほとんどです。それは営利企業としての考え方から脱落することがほとんどのようです。今回、既存薬で効果があるので物質特許を取っている製薬会社にその話を持ちかけても、全然乗ってくれないとか、色々なことがありました。ただ、製薬会社によって考え方も態度も全然違うというのは、自分が経験したことです。日本の製薬会社と海外の製薬会社でも違いますし、皆さん、それぞれ全然違うので、製薬会社出身のアカデミアの人に聞いても、その人の意見もやっぱりワン・オブ・ゼムなんですね。だから、あまりにも多様性があり過ぎて、正解はよく分からない。ただ、サイエンスとしてしっかりしていることの方が非常に説得力があるし、最終的にそこが求められるので、そこを突き詰めていくというのは多分一緒ということは感じるのですけれども、だからといって企業が喜んでくれるかどうかはまた別だというのは、個人的な経験です。
 
【夏目委員】 
 そうですね。そこが難しいなと、私も感じます。何か、いい手があると良いのですが。
 
【角家参考人】 
 とにかく色々な企業とコミュニケーションを取る。そうしたら、多様性があるので誰か気に入ってくれるかもしれないということなのではないかと思うので、これは多分、産学連携部門の方の頑張りも大きいかと思います。あと、アカデミアの人間がそこにどこまで時間を割くかということも問題の一つです。たまたま僕はうまくいきましたけれど、大体徒労に終わることが多いです。
 
【夏目委員】 
 ご意見、ありがとうございます。
 
【杉本主査】  
 どうもありがとうございました。よろしいでしょうか。
 では、角家先生、どうもありがとうございました。
 
【角家参考人】 
 どうもありがとうございました。
 
【杉本主査】 
 それでは、残りの時間で、全体討論と今後の議論の方向性について、自由討論とさせていただきたいと思います。
 改めまして、この作業部会の位置づけをもう一度繰り返しますと、主な検討事項と書いてあるところですけども、NBRP、NLDP、BINDS、この三つの事業が令和8年度で事業期間が終了するわけですが、今後、この三つの事業をどう継続していくか、その在り方をこの作業部会で議論して、ライフサイエンス委員会にも報告していくということになります。特に、今日も何度も出てきましたが、AIの急速な発展でこの三つの事業の在り方はかなり影響を受けているということで、今までの事業を単に継続するだけではいけない時期に来ているかと思います。また、今日のお話を伺っていまして、それぞれの事業が独立して事業を進めるだけではなく、相互に連携するということも非常に大事ではないかということも分かってきたかと思いました。
 そういうことなのですが、残り、15~20分程度で、この件について自由討論ということでご意見を伺えればと思います。今後、この三つの事業をどうブラッシュアップしていくか。大幅に変えるべきところもあると思いますし、維持するべきところもあると思いますので、ぜひ、自由にご意見を言っていただければと思います。いかがでしょうか。
 ご意見が出るまでに、スピーカーの方々にお一人ずつ、他の事業のお話も聞かれていかがだったかというのを一言ずつ伺えればと思いますが、武田先生、お願いします。
 
 
【武田委員】 
 もちろん、バイオリソースは持っているものからどんどんと情報が出てくるので、それをどう統合し、さっき言ったComputable Organismにつなげるかというところが大事だと思っていますので、まさに今言ったAI for Life Scienceの連携が大事であって、そこから出てくるデータは恐らく日本独特のデータもたくさんあって、クオリティも高いので、僕はそこの連携をきっちり意識したバイオリソースの進め方が必要だと思いました。
 あと、国際標準のモデル生物に関してはそのままどんどんとやればいいんですが、先ほど言ったナショナルバイオリソースは日本の資源であって、かつ、日本はユニークなものも持っているので、そこは多少メリハリをつけて、さらにそこから多層的なデータを抽出してというような方向がいいかなと思いました。どの動物にするというのは、それはまた別な議論ですけれども。
 以上です。
 
【杉本主査】  
ありがとうございます。では、大浪先生も一言お願いします。
 
【大浪参考人】 
 私どもは、理研の中の組織としては、BRCとコミュニケーションしているので、バイオリソース関係で言うと、そことデータベース等の接続は非常に大事だと思っていて、特にリソースのIDとかをしっかり管理するというところと、あと、内情を見ていると電子化がなかなか進んでいないということも見てとれるので、そういうところを進める必要もあって、その辺はデータベース側と協働するところがたくさんあるかと思っています。
 あとは、有田さんのお話みたいなところは我々も継続的に議論していて、いかにデータを日本の国の資産としてちゃんと管理するかとか、あるいは、アジアの人たちがものすごく日本に期待しているということは非常に感じていて、しかもヨーロッパやアメリカの人も日本がアジアでうまくやることを非常に期待しているというところがあるので、その辺ももう少し対応できたらいいのかなということを聞きながら、BINDSも含めて連携を深めていくことが全体的なシステムとお金の運用としても大事かなと思うというのが感想です。
 以上です。
 
【杉本主査】 
 ありがとうございます。有田先生、いかがでしょうか。
 
【有田参考人】 
 AIの利用で言うと、今、企業は、自分たちの知財がAIのトレーニングに使われるというので、例えばディズニーにお金を払ったりしているではないですか。ゲノムに関するAIについても、あれと同じことが将来的には行われることになるのですね。だから、それも踏まえて僕の発表で申し上げたようなナショナルリソースというのを整備していってもらえればと思っています。
 
【杉本主査】  
 ありがとうございます。
 角家先生はBINDSのユーザーということでトークしていただきましたが、NBRPやNLDPの関わりなど、あるいは、他のお話を伺って、いかがでしたでしょうか。
 
【角家参考人】 
 まず、AIの話でいくと、僕はいわゆる完全に末端の人ということになるのですけど、メタデータを入れるのが大変だということをよく分かっていただいているなというのはあって、そこが簡略化されないとデータを提供するのは大変だなと。あと、将来、それが価値を持ってきたときに、過去のデータを既にAIが学習して価値を持ったときには、お金は取れないのではないか。ちょっととんちんかんかもしれませんが、色々な整備ができたときに、ライセンスが整備されても、過去に学習してしまっていたら関係なくならないのかなというのは、素人として少し感じました。
 それから、バイオリソースに関してなのですけども、これも一ユーザーの意見なのですが、僕だったら遺伝子改変マウスとか遺伝子改変ラットを使うのですけれども、それでこういうバイオリソースに非常にお世話になっているのですが、お世話になっているバイオリソースのところにはない、お金を出して海外から取り寄せねばならないリソースもありまして、そのハードルが非常に高いというのは感じております。実際、そういうものの方が論文とかで発表されたりして、非常に使いやすかったり、使う必要があるものが多かったりするのですけども、アメリカとかであれば10万~20万で手に入るのが、日本では100万~200万かかるし、アメリカでは1,2週で手に入るのも半年~1年かかるということをユーザーとして経験していまして、それが日本で研究することとアメリカで研究することのディスアドバンテージとして感じる機会が多いので、どうこうできることではないのですけれど、ユーザーとしてお話しさせていただきました。
 
【杉本主査】 
 どうもありがとうございました。
 では、ここからは委員の方からもご自由にご意見いただきたいのですが、まず、挙手されている坂内先生、お願いいたします。
 
【坂内主査代理】 
 ありがとうございます。AI for Life Scienceという観点から、データベースについて、少しコメントというか、こうなったらいいなということを、今日の議論を踏まえてお話ししたいと思います。
 AIは私たちや先生方が出すデータを食べて賢くなっていくということを大浪先生がおっしゃいました。一方で、最近、LLMなどを使ってみますと、本当にインターフェースが自然言語でスムーズにできるというところから、インターフェースとしての可能性をとても強く感じております。今日の議論の中でも、実験データを登録するのが非常に大変であるというお話が出てまいりました。ということで、AI for Life Scienceの中に、データベースにユーザーが登録しやすいようなインターフェースをAIを通じてつくっていくというような内容も含めても良いのではないかなと思いました。例えば、我々実験者がある病気について調べたいと思ってキーワードを入れたら、その病気に関する遺伝子が分かっている。また、その遺伝子をクリックしたら、それに結合する化合物が分かっている。いわゆる横串で日本の研究者たちが出したデータがつながっているような状態が理想的だなというふうに思います。最近の大規模言語モデルを見ていると、それも可能な時代ではないかと思います。
 1点気になったのは、先ほど大浪先生もBINDSも一緒にとおっしゃいましたが、今日の印象だと、BINDSはこれだけいいことをやっているのにデータベースが見えてこないなと思いましたので、BINDSで取ったデータもデータベースの方に。各事業の中で考えるのではなくて、今日議論した事業をつなぐような方向でも、今後連携していけたら良いのではないかと思いました。
 以上でございます。
 
【杉本主査】 
 ありがとうございました。これだけ色々なデータが産出されるようになると、それをどうやって統合するかということで、今回対象にしている三つの事業が連携するということが大事だということかと感じております。
 では、夏目先生、お願いいたします。
 
【夏目委員】 
 ありがとうございます。まさに今、坂内先生と杉本先生がおっしゃったところと関連するのですが、AI for Life Scienceがなぜ必要かというと、これまで蓄積したデータ、これから蓄積していくデータといったものを活用して、新たな知識をそこから得ていくというところを加速させたいからだと思うのですけれども、実際、それで得られた知識あるいは仮説といったものも何らかの手段で検証していく必要性というのは消えることはないと思っています。そうなったときに、今、一つ問題なのは、AIなどを使って、例えば、このタンパク質は創薬標的として有望みたいだという仮説が得られたときに、それを検証する術がないというときがあるんですね。例えば、先ほど実験動物を海外から得ないといけないということもありましたけれども、実際、どういった手段で何をして検証すればいいのか、必要な動物モデルがすぐに手に入らない、どこにあるのか分からないといったところで、いきなりスローダウンしてしまうということがあると思います。そういった意味でも、形のある資産、形のない資産といったものを情報がつなげることができれば、そういったところでのスローダウンを軽減できるのかなというふうに思いました。
 私からは、以上です。
 
【杉本主査】 
 どうもありがとうございました。確かに、AIで出てきた仮説を検証するというところはこれから非常に課題となってくるところですので、そういう資産をつなぐというところは重要だと思いました。
 あとは、これからの事業を新たに計画する際にも、近年のAIの進展のスピードが非常に速いということで、大浪先生のトークの中でも、日欧米が1か月半で新しい枠組みをつくるであるとか、スピード感と戦略性が重要だというご指摘がありました。大浪先生に伺いたのですが、こういうスピードが速まっている中で、NBRPやNLDPなどの事業を構築する際に、そのスピードに対応しやすい構成というか、事業の枠組みみたいなものを考える必要もあるかと思うのですけども、その点について何かご意見ありますでしょうか。
【大浪参考人】 
 ありがとうございます。NBRPとBINDSの構成がどういう形で構築されているかに関してはあまり知識がないので、NLDPの話を中心に、それを適用する形で申し上げると、速さを考えると、例えば、提案書を書いて、インディペンデントなレビュアーが見て、それを判断してお金を決めるみたいなプロセスをやっているうちに終わってしまうのですよね。ですから、ある程度の集団の中で、ガバナンスはさせた上で、後づけでというか、よく欧米の機関はサイエンスアドバイザリーボードみたいなものをのせてレビューするという形で活動の正当性や効率性を判断していくと認識していますけれども、公正性を保つために公募にかけるというのはスローダウンしているので、ある程度、塊として動かした上で、後でレビューをして判断するというようなことが、スピードを維持するために大事かと思っています。
 
【杉本主査】 
 どうもありがとうございました。そういう新しい事業の進め方というのも検討していく必要があるのかなと思いました。その場合は、アドバイザリーボードなどは透明性の確保も非常に重要だと思いますので、新しい仕組みをどうやってつくるかというところも、なかなか大変かと思いますが。
 武田先生、お願いします。
 
【武田委員】 
 今、スピーディーなのが非常に話題になっていますけど、先ほどのバイオリソースの方は長い年月をかけて収集したものが今から生きるのではないか。つまり、15年、20年は平気で経っているんです。なので、そういった資産をさっきも話したナショナルリソースという意味でも意識しながら維持して、そこからどうやってAIと協働するようなデータを出しているか、意義のあるデータを出しているかということをバイオリソース側も意識をし、野生集団などを時間をかけて集めているので、そういうリソースをうまく利用するみたいな方向性を強く打ち出した方がいいかと、バイオリソースに関しては思いました。ウェットな材料なので途絶えたら終わりということもありますし、日本固有のものを守りながらも、そこからどうやってデータを抽出するかということだと思います。
 
【杉本主査】 
 ありがとうございます。時間をかけて蓄積してきた独自のリソースを、どうやって価値をより高める活用の仕方をするかということかと思います。
 大浪先生、お願いします。
 
【大浪参考人】 
 誤解を受けたかもしれないので一言だけ加えると、速さと同時に、ロングタームのビジョンはとても大事だと思っています。欧米の方々と議論するときに、理研とか日本で、皆さんでコンセプトを色々出していっていることは、実は非常に新しいというか、彼らにとっては違うことをやっていて、これは先方に対して非常にインパクトを与えているときが結構あって、それは、目の前のことを短期間でやるだけではなくて、同時にロングタームのビジョンを持ちながらやるということなので、私の言っていることは、短期的なことをどんどんやるという意味では必ずしもないということで、ロングタームで色々なことをちゃんと考えている日本の独自性も非常に重要なので、そこは同時に生かすということは重要だということを付け加えておきたいと思います。
 以上です。
 
【杉本主査】 
 ありがとうございます。ということは、長期的なビジョンを維持しつつ、新しい進歩に応じて修正できる仕組みということですかね。そういう、長期的ビジョンは必要というご意見でした。
 他、いかがでしょうか。今日、ご発言されてない方、一言ずつでもご発言いただけるとありがたいかと思いますが。
 西増先生、お願いします。
 
【西増委員】 
 私もBINDSを使わせていただいていて、専門は構造解析なのでコンサルをしてということはないのですが、クライオ電顕を結構な頻度で月に何回か使わせてもらって、それがないと研究が回らないような感じですので、AIなど、新しい枠組みを入れていくというのも大事なのですが、それに加え、今までの基盤研究を支えるようなものもより発展する形で次の枠組みにも、もちろん、それがなくなることはないでしょうけれども、重要だということをコメントさせていただきたいです。
 あと、前回もあったのですけれど、高額な機器を皆でシェアして使えるようになるというのは重要なのですが、それを使うためには人がいないといけないというので、技術の承継というんですか、そういう点でもBINDSというのは非常によくて、例えば、自分たちの研究室ですと、学生が行って試料の調整とかをそこのスタッフの専門の人に習ってできるようになるということもあって、実は教育的な側面というのは非常にあるので、そこの設備を維持管理したりする人のポジションというのもいいようにしていくというのは重要かと思います。
 以上です。
 
【杉本主査】 
 ありがとうございました。人材育成も非常に重要ということで。
 
【西増委員】 
 はい。
 
【杉本主査】 
 人材に関しては、今日の角家先生のお話でもありましたが、コンサルティングということがBINDSも非常に大事だということなので、BINDS事業全体を把握していて、どの事業が適しているかとか、どういう事業は連携した方がいいかとか、そういうことをコンサルティングできる人材というのもこれから必要になってくるのかなというふうに感じましたので、人材の確保ということも引き続き検討していただければと思いました。ありがとうございました。
 他、いかがでしょうか。よろしいでしょうか。
 
【有田参考人】 
 私からよろしいでしょうか。
 
【杉本主査】 
 どうぞ、どうぞ。ぜひお願いします。
 
【有田参考人】 
 僕は人材と言ったときに、文献を無視してはいけないと思っています。今、AIが発達すると、例えば、論文は無くなって、全部データからサイエンスができるとか、データから学ぶプロセスができると言うのですが、それはAIの中ではできるかもしれませんけれど、人は読んで勉強するんですよ。だから、人材育成と言ったら、絶対どこかで、文献、日本語に落とさなければ駄目で、翻訳はもちろんAIがやってくれますけれども、文献とのリンクって、その意味で非常に重要だと思っています。
 以上です。
 
【杉本主査】 
 どうもありがとうございました。文献の重要性ということで、ご指摘、ありがとうございます。
 ラップアップに入らせていただきます。今日も色々ご意見を伺いましたが、次回の作業部会では、これまでの議論を踏まえて、これからのNBRP、NLDP、BINDSに必要だと考えられる要素、今後どうしたらいいかということについて、委員の先生方に1人5分程度でご発言いただくようなことを考えております。ぜひ、そのような形でお願いできればと思います。詳細については、後日、事務局からお知らせさせていただきます。
 では、本日予定しておりました議事は以上となりますが、他に、委員の方々から、ご質問、意見等、ございますでしょうか。
 特にないようでしたら、事務局から連絡事項をお願いいたします。
 
【西山生命科学専門官】 
 ありがとうございます。
 本日は、長時間にわたり、大変有益なご議論を賜り、誠にありがとうございました。本日いただいたご意見を踏まえまして、事務局で論点を整理し、次回、3月24日の作業部会において示させていただきます。
 先ほど杉本主査からお話ありました次回作業部会での先生方からの発表については、後ほど、メールでお知らせをさせていただきます。
 本日の議事録は、事務局にて案を作成し、委員の皆様にお諮りした上で、主査のご確認を経て、弊省ホームページにて公開いたします。
 以上でございます。
 
【杉本主査】
 どうもありがとうございました。それでは、これで本日の基礎・横断研究戦略作業部会を閉会とさせていただきます。
 皆様、お忙しいところをありがとうございました。
 
―― 了 ――
 

お問合せ先

研究振興局ライフサイエンス課

(研究振興局ライフサイエンス課)