令和6年7月31日(水曜日)15時00分~17時00分
文部科学省会議室(※Web開催)
【高梨主査】 それでは、定刻となりましたので、ただいまより第12期ナノテクノロジー・材料科学技術委員会の第7回を開会いたします。
委員の皆様におかれましては、御多忙のところ御出席いただきまして誠にありがとうございます。本日は、文部科学省研究振興局会議室及びオンラインでのハイブリッド開催となります。
それでは、事務局より委員の出欠及び本日の会議の流れの御説明をお願いいたします。
【柴田補佐】 ありがとうございます。文部科学省研究振興局ナノテクノロジー・物質・材料担当参事官付の柴田でございます。よろしくお願いいたします。
それでは、出席者の出欠確認を行わせていただきます。本日は、加藤先生、長谷川先生、吉江先生が御欠席と伺っております。また、議題3の推進方策の審議に関して、統数研の吉田亮センター長と、また、奈良先端科学技術大学院大学の藤井幹也教授にも御参加いただくことになっております。なお、文部科学省からは、参事官の宅間が出席しております。よろしくお願いいたします。
次に、資料の確認に移ります。本日の議事は、議事次第のとおり、4つございまして、また、配付資料も議事次第のとおりですが、不足等ございましたら事務局までお申しつけください。議事の途中でも結構ですので、事務局までお知らせいただきますようお願いいたします。
次に、会議の流れについてですが、本日は、議題1及び2において、データ創出・活用型マテリアル研究開発プロジェクト、通称、DxMTと呼んでおります。こちらの中間評価を、また、議題3におきまして、ナノテクノロジー・材料科学技術分野の推進方策について審議を行うことを予定しております。特に、議題3については、初めに事務局より、推進方策の構成について御説明した後に、推進方策の審議に当たって、情報科学の観点から議論を深めるために、統計数理研究所の吉田先生より話題提供いただくとともに、奈良先端大の藤井幹也教授にも審議に御参画いただくこととしております。
最後に、基本的な会議の進め方についてですけれども、オンラインの参加の先生方におかれましては、回線負担の軽減や雑音防止の観点から、御自身の御発言時以外はマイクをミュートにしていただき、ビデオはオンにしていただくようお願いいたします。また、御発言を希望される際は、挙手ボタンにて御発言の意思を御表明ください。
なお、議事録作成の関係上、御発言の際は、お名前をおっしゃってから御発言いただきますよう、よろしくお願いいたします。
事務局からは以上です。
【高梨主査】 どうもありがとうございました。
それでは、議題1及び議題2の研究開発課題の中間評価の関係の議題に入ります。本件につきましては、令和4年度から実施しているデータ創出・活用型マテリアル研究開発プロジェクト、DxMTについて中間評価を行うものです。本年6月に外部有識者から成る中間評価検討会を実施し、中間評価票(案)を作成しております。
初めに事務局より、評価方法及び研究開発プランの修正について御説明いただきます。その後、具体的な評価の内容については、関谷委員より御説明をお願いします。関谷委員には、本事業の中間評価検討会に本委員会から主査として御参画いただいております。また、質疑応答の際には、必要に応じて本事業のPOでもある中山委員からも御発言をいただくことがあります。
なお、利害関係の範囲に関しましては、8月に開催した第1回委員会の参考資料、第12期研究計画・評価分科会における研究開発課題の評価についてのとおり、研究計画・評価分科会と同様の範囲としております。
本日御出席の委員のうち、菅野委員、瀬戸山委員、中山委員、馬場委員、平田委員、宝野委員については、利害関係に当たると考えられますので、評価に関わる御発言は控えていただければと思います。
その他に利害関係者に当たる方はいらっしゃいますか。よろしいでしょうか。では、特にいらっしゃらないようですので、それでは、事務局及び関谷委員より、中間評価票(案)について説明をお願いいたします。
【関谷委員】 ありがとうございます。それでは、初めに、事務局から資料1及び資料2-1、2-2に基づき、事業の概要並びに評価指標等の評価方法について御説明を差し上げます。
それでは、資料2-1を御覧ください。まず1ページ目になります。本事業は、マテリアル革新力強化戦略において、マテリアル・イノベーションを創出する力の強化に向けて、マテリアルデータを活用したデータ駆動型研究開発の促進が求められておりまして、アクションプランにおいても、マテリアルDXの整備をすることとしております。特に、マテリアルDXプラットフォームの整備というところが、マテリアル革新力強化戦略のアクションプランに位置づけられておりますが、こちらのDxMT事業につきましては、このマテリアルDXプラットフォームを構成する事業の一つとして、令和3年度より実施している事業でございます。
4ページを御覧ください。背景、課題及び事業の概要についてです。高度な機能を持つマテリアルをいかに効率的に創出し、迅速に社会実装できるかが我が国の生命線となっているところでございまして、材料研究の促進のため、また、そのデータを有効に活用し、迅速に社会実装につなげるモデルを確立し、拠点外、事業外へ展開すること、また、従来の試行・経験型の研究スタイルにマテリアルDXプラットフォームをフルに生かすデータ駆動型研究を取り入れた次世代の研究方法の構築、それとともに、10年先を見据えた4つの社会像あるいは産業像に貢献する5つの材料分野における実践で、革新的機能を有するマテリアルの創出、これを目指すということを目的とした事業でございます。
R3年、令和3年度にまずFSを始めまして、令和4年度から本格的に事業を開始しております。事業期間としては令和12年度までで、それまでの間に3年ごとの3つのフェーズに分けた事業に取り組んで、3つのフェーズに分けて事業を実施しております。
具体的なロードマップは、5ページ目を御参照ください。説明は割愛させていただきます。
次に、6ページ目をお願いいたします。実際の5拠点の説明については、こちらを御参照ください。対象の研究領域といたしましては、左から、蓄電、水電解触媒、磁性材料、半導体、構造材料、バイオアダプティブ材料について、それぞれ東京大学、NIMS、東京工業大学、東北大学、京都大学が拠点、代表機関を務めていただき、5つの課題を実施しているところでございます。
次に、事業概要、拠点における研究推進体制について、7ページ目を御覧ください。体制構築のポイントといたしまして、下部に点線で囲っておりますが、材料創製、理論計算、計測評価、データ活用促進という4つのグループを設置しておりまして、これらの4グループが連携して、研究課題を3つ程度設定しまして、研究開発を牽引するプロジェクトリーダーを配置して、実施してございます。
次に、8ページ目を御覧ください。事業全体の運営体制でございます。PDを中心といたしましたプログラム運営委員会を設置いたしまして、運営方針や資金配分、あるいは本格実施計画内容に関する評価等、進捗を管理しながら、各拠点での研究開発課題の取組を推進しているところでございます。
右側にございます専門委員につきましては、9ページ目の構成員を御参照ください。
それでは、今回の中間評価につきましてです。10ページ目以降に、実際の中間評価を実施した体制ですとか評価項目、あるいは採点方法等について記載してございます。実際の構成員は10ページ目を御覧ください。主査は、ナノ・材委員会の委員でもございます関谷委員に務めていただきました。そのほか、7名の委員に御出席いただきまして、中間評価を実施いたしました。ナノ・材委員会からは、関谷先生のほかに高村先生にも御出席いただいたところでございます。
また、中間評価の流れといたしまして、まず初めに、プログラム運営委員会、事業の中のプログラム運営委員会におきまして、各拠点の進捗状況の評価と今後の方向性等について検討してございます。そちらの内容を踏まえて、今度、中間評価検討会におきまして、事業全体の進捗状況の評価と今後の方向性等の検討をしているところでございます。今回、ナノテクノロジー・材料科学技術委員会におきましては、赤枠してございますけれども、中間評価検討会で評価いたしました事業全体に関して、専門的な知見から御助言いただくとともに、事業全体に関しての評価の実施をしていただくという位置づけになってございます。
次に、中間評価検討会の委員名簿は12ページを御覧ください。先ほど御説明差し上げましたけれども、ナノ・材委員会からは、関谷先生に主査として御参画いただくとともに、高村先生にも御参画いただいております。ありがとうございました。
次に、評価の観点ですけれども、必要性、有効性、効率性につきまして評価しておりますけれども、特に、一番最初の中間評価のタイミングになりますので、研究成果について評価項目に入れてございますけれども、どちらかというと、事業運営の体制ですとか、拠点体制の妥当性ですとか、また、マテリアル研究を従来の試行・経験型に加えて、データ駆動型研究との両輪とする施策の意義等について評価しているところでございます。
中間評価の採点方法は14ページにございますが、割愛させていただきます。
以上でございます。
失礼いたしました。ナノ・材委員会から、高村先生、関谷先生以外、武田先生にも御参画いただいておりますので、補足させていただきます。
以上です。
【高梨主査】 それでそのまま続けてですね。
【柴田補佐】 そうですね。
【高梨主査】 関谷委員が。
【柴田補佐】 関谷先生、すみません。失礼いたしました。
【高梨主査】 資料2に基づいて、今度、関谷委員から御説明をお願いします。
【柴田補佐】 その前にすみません。
【高梨主査】 事務局からまだある。はい。
【柴田補佐】 申し訳ございませんでした。資料1の説明が漏れておりました。こちら、資料1のほうは、分野別の研究開発プランになりますが、今回の評価に合わせまして、評価項目をより精緻にということで、赤字のとおり、もともとワークショップにおける参画機関数としておりますが、ワークショップに限らず、公開のセミナー等ございましたので、公開イベントの開催数というように修正させていただいております。また、それに合わせて、公開イベントの参加者数というところを加えさせていただいているとともに、データ創出・活用に関する報告書数というところを、論文の引用数というところを修正させていただいておりますので、こちらについても御了承いただければと思います。どうぞよろしくお願いいたします。
【高梨主査】 以上ですね。あと、関谷委員、続けてよろしいですね。
【柴田補佐】 はい。お願いいたします。
【高梨主査】 では、関谷委員、よろしくお願いいたします。
【関谷委員】 高梨先生、ありがとうございます。それでは、中間評価の主査を仰せつかりましたので、私から、資料2-2に基づきまして、研究開発課題の中間評価結果(案)について御紹介させていただきまして、先生方の御教授いただければと思います。
それでは、資料2-2に沿ってまいりますが、2ページ目は、委員が書いてあって、3ページ目、そして、4ページ目には、今回の検討会の委員が書かれています。その後にずっと進んでまいりまして、今、柴田さんから御紹介いただいた部分、割愛させていただきます。
9ページ目でございますが、中間評価票となっております。ここに具体的な定量性のあるところも含めて、下にアウトプット指標やアウトカム指標と書かれていますが、これから御紹介します文章の中にも含まれますので、10ページ目から少し重要な部分について御紹介させていただきます。
10ページ目の3ポツ、評価結果、(1)の課題の進捗状況について御紹介させていただきます。この文章の中で、特に重要なのが最後のパラグラフとなっておりまして、本事業は、令和4年度から令和5年度までに、査読付論文数213報、それから、被引用数404報となっており、順調に成果が創出されている。また、令和4年度から令和6年度、これは令和6年5月17日時点となりますが、までに、セミナー・研修、それから、講演会などの公開イベントの開催数53回、参画者数延べ6,061人となっており、我が国のデータ駆動型研究の底上げと拡大に大きく貢献しているとまとめさせていただきました。
次に、11ページ目でございます。必要性について述べさせていただきます。これは、四角の下の丸、白丸のところですが、マテリアル研究を従来の試行・経験型研究に加え、データ駆動型研究との両輪とする施策の意義、これはマテリアル革新力強化戦略の下で、文部科学省が推進するマテリアルDXプラットフォームの中心となる一事業として、データ駆動型研究手法・ツールの開発とその全国展開、従来の試行・経験型研究手法に加え、データ駆動型研究手法を取り入れた新たな材料創出を行うフラッグシッププロジェクトとして位置づけられている。
その次のパラグラフです。「多数の成果が」というところのパラグラフですが、特に、データ駆動型研究手法による新たな材料探索や材料探索や材料探索の迅速化などの成果が出ており、我が国のマテリアル革新力の強化に資する成果が出ている。その次のパラグラフですが、「また、データ駆動型研究が世界の潮流となる中で、諸外国が大規模な投資によるデータ駆動型研究の推進を加速させている。我が国の産業界におけるマテリアルズ・インフォマティクスの活用による効果的な素材・材料の開発が進むなど、データ駆動型研究の関心が高い。本事業の取組は、我が国の優秀なマテリアル研究人材の強みを最大限活用したものであるとともに、従来から蓄積されてきた高品質なデータを有効に活用するものであり、マテリアル革新力の強化に資する取組内容となっているとまとめさせていただきました。
次、12ページ目ですが、白丸、マテリアル産業競争力を支える基盤技術強化に向けた施策の意義について、まとめさせていただきます。パラグラフの真ん中の辺りですが、公開イベントには事業全体として産業界を含めて参画機関数318機関――これは令和5年度の実績です――となっており、産業界からの関心も高い。さらに、データ駆動型研究自体に産業界の関心度が高い中で、研究手法・ツールの公開、一般に活用できる形式での高品質なデータの創出・蓄積が求められていることから、マテリアル産業の競争力強化に資するとまとめさせていただきました。
以上より、本事業の必要性は高く、今後のさらなる取組が期待されるとまとめさせていただきました。
次に、その下、有効性について述べさせていただきます。13ページ目に移りまして、白丸のところです。成果の創出状況、開発されたデータ駆動型研究手法の材料研究DXへの有効性について述べさせていただきます。これは、そのパラグラフの下のところ、「具体的には」というところですが、約2年の事業期間で、査読付論文236報、これは先ほどより増えておりますが、これは令和6年度の成果も加えておりますので、増えておりまして、現在までに査読付論文数236報、被引用数404報や、nature姉妹紙への論文掲載など、活動期間に比べて活発に成果が創出されているとともに、特筆すべき論文成果も出ているとまとめさせていただきました。
また、高梨先生より具体的なところにも触れるようにと御指示ありましたので、少し具体的なところに触れさせていただきます。これは次のパラグラフの「例えば」というところに述べさせていただいております。例えば、機械学習によるリチウム金属の反応活性に対する影響因子の解析を通じた複数の新規有望電解質の提示、これがnature姉妹紙に掲載されています。また、データ駆動型研究を活用したハイスループット材料探索により60日程度の探索が必要であったものが1日程度の探索が可能になり、既存磁性化合物で最も優れた物質定数を示す磁石化合物よりもさらに優れた新規磁石化合物が発見される成果も出ているというふうに具体的なところをまとめさせていただいております。
13ページ目、下の白丸のところですが、4つの社会課題に対する各拠点の成果の有効性について述べさせていただいています。各拠点では、本事業で目指す4つの社会像への貢献や、達成目標までの道筋を示したロードマップを策定し、拠点全体として目標設定を明確にしつつ、研究が推進されている。その妥当性や道筋について、次が14ページ目に移りますが、14ページ目の、議論も継続して実施されており、適宜更新が行われるとともに、その進捗についても評価がなされていると。
また、14ページ目の上の段落のところですが、企業等が参画するコンソーシアムやフォーラムなどを設立し、延べ60社以上の企業が参画しており、「予定」も含んでおりますが、社会実装に向けた企業との連携が進められている。
さらに、その次の白丸、開発された研究手法の拠点内共有・対外発信、人材育成の活動の有効性について述べさせていただいております。14ページ目の真ん中のところですが、公開イベントと大学院プログラムを合わせ、開催数延べ128回、参加者数延べ6,351人となり、活発な活動の展開により多数の参加がなされています。幾つかのハンズオンセミナーでは、90%以上の参加者から役に立つとのアンケート結果が得られ、有効な活動がなされています。
加えて、一般向けのシンポジウム・講演会から大学院プログラムまで幅広い対象に向けた活動により、人材育成のみならず、研究手法・ツールの対外発信にもつながっています。
以上より、本事業の有効性は高く、今後のさらなる取組が期待されます。
次に、効率性について述べさせていただきます。14ページ目から15ページ目にわたって記載させていただいておりますが、15ページ目の白丸、事業運営の妥当性と効率性についてまとめさせていただいております。
本事業実施期間中10回の、「FS期間」を含んでおりますが、プログラム運営委員会を開催し、各拠点の進捗状況や評価などを実施するとともに、各回終了後に拠点側に対して、指示事項をまとめて連絡するなど、事業全体の方向性を都度示しています。そして、その下、真ん中のパラグラフですが、プログラム運営委員会と各拠点の実務的な連携を行うための企画運営会議を設置し、各拠点での運営における課題や状況の共有を実施することで、事業全体として拠点運営の効果的かつ効率的な活動も実施されている。
特に、データ連携部会を設置し、全拠点が参加する全体部会と目的に沿ったワーキング、これは研究DX推進、それから、計算基盤ですが、延べ28回開催し、各拠点の課題を共有し、有機的に連携する体制が構築されている。
15ページ目の下のほうですが、また、各拠点における国際会議の開催や出席、事業全体として、米国「Materials Genome Initiative」関連プログラムとの連携に向けた米国側との協議開始など、我が国のデータ駆動型研究の国際的なプレゼンス向上や国際動向も視野に入れた事業運営がなされている。
15ページ目の下の白丸のところですが、研究推進における拠点体制の効率性についてまとめております。
16ページ目に移りまして、上の段落の真ん中辺りですが、拠点全体での定期的な全体会議の開催など、各課題・グループ間での有機的な連携を図り、各拠点として効果的かつ効率的な成果創出につながる体制が構築されているとまとめさせていただきました。
また、拠点内で若手研究者を中心とした研究プロジェクト提案の実施など、事業終了後も見据えた継続性のある体制構築に向けた活動も進んでいます。
開かれた拠点づくりに向けて、例えば拠点間連携を進める技術課題として、走査型電子顕微鏡(SEM)や透過型電子顕微鏡(TEM)等の組織画像データからの特徴量抽出、異なる複数の第一原理計算アプリからの計算結果の統合などが検討されている。ARIMとは、例えば、拠点内にARIM実施機関を含めた体制を構築するなど、共用装置を利用したデータ創出・蓄積などの連携が進んでいます。データ中核機関とは、本事業で創出されたデータを、データ中核機関が運用するシステムRDEへの登録を行うなど、マテリアルDXプラットフォーム全体での連携が積極的になされているとまとめさせていただきました。
16ページ目の下のほう、点線の少し上ですが、「以上より、本事業の効率性は高く、今後の更なる取組が期待される」とまとめさせていただきました。
次に、16ページ目から17ページ目に進みまして、17ページ目の(5)、点線の下のところです。ここが最も重要なところですので、しっかりと御紹介したいと思います。(5)今後の研究開発の方向性。本課題は「継続」とするというふうにまとめさせていただきました。その理由を下に述べさせていただいております。
本事業は、従来の試行・経験型研究では見いだせなかった新材料の探索や効率的な材料の探索など効率的な体制でデータ駆動型研究手法・ツールなどを含めた成果が着実に創出される我が国のマテリアル分野の研究開発の加速や、多数のセミナー・シンポジウムを開催するなどデータ駆動型研究の普及・人材育成に向けた活動が積極的になされ、不足するデータ掛けるマテリアルを実践できる人材の育成に大きく貢献することから、今後とも本事業を継続することが望ましい。引き続き、本事業の加速により、我が国のマテリアル分野における国際競争力の強化や、革新的マテリアルの創出を期待するとまとめさせていただきました。
あと、お時間いただいているところ、恐縮ですが、最後に、これはさらに次のフェーズに入ってまいりますので、幾つか、委員からも重要な指摘事項をいただいておりますので、それもまとめさせていただきました。
本課題の改善に向けた指摘事項、6つございます。
1つ目が、諸外国においてもデータ駆動型研究が活発化する中で、我が国のマテリアル分野の国際競争力の維持・発展に向けて、諸外国の取組との比較(国際的なベンチマーキングなど)をしつつ、強みを明確にし、各拠点で研究開発が実施される必要がある。
2つ目が、データ駆動型研究の確立に向けて、諸外国では最新技術(生成AI、大規模言語モデル等)の活用や、ロボットとAIの融合による自動・自律実験が加速する中で、我が国においても、本事業のフェーズ2――令和7年から令和9年度です――に向けた取組の加速を図るための予算を確保することが重要であると考えております。
3つ目が、今後、更なる革新的な成果の創出がなされることが期待され、材料としての成果のみならず、手法・ツールについても、積極的な対外発信を継続することで、国際的なプレゼンスの維持・向上や、国内のマテリアル分野における研究者へのデータ駆動型研究の浸透を図っていくことが重要である。さらには、マテリアル分野、情報分野等の将来を担う人材の育成・輩出が進むことを期待する。
4つ目が、開発する研究手法ツールについては、各拠点に閉じず横展開を図るためにも、汎用化が進むことを期待する。
5つ目、社会実装に向けては、産学がより一層連携するための取組(コンソーシアムの強化など)が必要であるとともに、新たに創出された材料や開発されたツール、データ等のオープン・クローズ戦略、開発された装置(データフォーマット含む。)の標準化なども検討することが重要である。
そして、6つ目が、拠点間での連携による取組も検討されているが、他拠点でのデータ活用に向けたデータ蓄積の課題(再現性のあるデータ収集、分析・評価・合成データなどの紐づけなど)を整理しつつ、蓄積されたデータの活用による成果事業が創出されることで、マテリアルDXプラットフォームの価値が示されることを期待するとまとめさせていただきました。
お時間をいただきましたが、御紹介は以上となります。ありがとうございます。
【高梨主査】 非常に丁寧に御説明くださいまして、どうもありがとうございました。私からの依頼という話がありましたけど、計画評価分科会で、私はいろいろなプロジェクトの話を聞いていると、抽象的な表現で評価されている場合が結構あって、やはり具体例とか、決してこだわるわけではないのですが、示せるものは数値も示していただいたほうが非常に分かりやすいということがありましたので、そういうことを 関谷委員に申し上げておりました。
それでは、ただいまの御説明、評価内容に関しまして、御意見、御質問がありましたら挙手をお願いいたします。あと、オンラインのほう、私はこれは見えないんだけど、確認していただけますか。
何かございませんか。どなたからでも。では、折茂委員、お願いします。
【折茂委員】 折茂です。関谷先生、御紹介ありがとうございます。大変すばらしい成果が出ているということは十分理解いたしました。
17ページの指摘事項の1項目とも関係するのですが、15ページに、米国のマテリアルズ・ゲノムプロジェクトとの事業の全体的な協議が始まったということでございます。米国のマテリアルズ・ゲノムプロジェクトと比べたときの、例えばベンチマークとして比べたときの、特に日本のプロジェクトの強みというところはどこになるのでしょうか。国際的な視点で見たときの強みですね。
【関谷委員】 折茂先生、ありがとうございます。御指摘のとおり、まず、こういった我が国の強い材料、それから、計測技術を使って新しいデータの蓄積、プラットフォームをつくったというところが大変重要な視点となってございまして、この第1フェーズにおきましては、その体制づくり、それから、今後、データをしっかり蓄積して、新しい材料をつくっていくためのプラットフォームづくりというところが最初のフェーズの最も重要な視点でございまして、その点においてしっかりとできたというところをまず御報告させていただきましたとともに、折茂先生おっしゃるとおり、今後、世界と連携し、また、それから、世界に伍する取組をする中では、どういった強みが出せていけるかについて、しっかりと我々としても準備していく、評価していく必要があると考えております。
私が評価会に出てやはり感じたのは、我が国は既にもう強い材料があって、世界で選ばれている品質の高い材料があるんですが、それをきちっと計測する技術もまたあって、それによって非常に規格化された、いわゆるデータの形式が整ったプラットフォームができているというところがまず非常に強いと感じております。
一方で、アメリカでももちろんそういったものは取り組んでいると思うのですが、やはり計測技術が強い、それから、品質の高い材料があるという観点において、また違ったプラットフォームがしっかりとつくり出されているというのが私の評価会で感じた分析となってございます。
また、このマテリアルゲノムの連携、協議開始については、いかがでしょうか。中山委員から少し御説明があれば。
【中山委員】 私から少しだけ補足させていただきますと、ここで書かれているのは米国のMaterials Genome Initiative側が対外関係をより強化したいと思っており、また、我が国としても同様に思っている中で、たまたま先方のイベント等があり、そこでは我々のことをプレゼンさせて頂いたというのが、ここで書かれていることです。
もう1点は、我が国は何が強いかという御質問を折茂先生がされていたと思います。関谷先生が言われている計測をしっかりやっていることや、品質が高いことなどもあるかもしれません。実験の品質も高いというところは、そうはいってもアメリカだって負けていないと思いますが、両国で一生懸命やっているとことかと思います。そのような中、我が国が先んじていると思うのは、ARIMと、あと、マテリアルDXプログラム、それとデータ中核拠点かなと感じます。これはNIMS、すなわち宝野先生のところに深く関連しますが、データ中核拠点とマテリアルDXのプログラムがしっかりと連携しています。そこで、このプログラム間の横断がしっかりとなされているし、また、その努力が常にされているという点で、アメリカよりもその点は先行しているかもしれません。ただし、そういうことも当然ながら先方は見ていますので、どんどん対応されていくことであって、我々としては当然ながらそこを伸ばしていくべきであるし、より新たな取組をしていくべきだし、強くしていかなければいけないし、ということは自明だと感じています。
Materials Genome Initiativeは取り組まれて長いというか、もともとは日本の元素戦略プログラムのカウンターパート的に動いていたところでもあり、多くの蓄積もある中で、我が国としてどうすべきかというのは、戦略的に考えるべきでしょう。別に全て比較しながら進めるわけではないと思いますけど、丁寧に見ておかなければいけないところだと思います。そういうところの調査など、JSTで調査しても構いませんし、このナノ材委員会にも出して、みんなで共有していくということ等も重要かなと思います。
以上です。
【折茂委員】 ありがとうございました。よく分かりました。プログラム間の連携も含めて、日本の強みを一層出していくということがよく分かりました。ありがとうございます。
【高梨主査】 事務局からも何か補足があるそうで。どうぞ。
【柴田補佐】 補足させていただきます。米国の協議開始というところなのですが、今、中山POから、NIMSから御出席いただいていることを補足いただきましたが、NIMSは今回、DxMTのプロジェクトのほうに、データ連携部会の代表機関として参画いただいているので、今回、特にDxMTの事業の中の共通課題とかを担当するという、そういう意味合いもありますので、こちらの代表としてというところで、今回、米国の、まさにMGIの中のマテリアルのデータ駆動型研究等をやられているMDRFというところと意見交換をするような形で協議を開始しております。よろしくお願いいたします。
【高梨主査】 ありがとうございます。折茂委員、よろしいですね。
【折茂委員】 承知しました。ありがとうございます。
【高梨主査】 どうもありがとうございます。今、ちょうどこれは次の議題にも関わる、本当に日本の強みとか今後の推進方策にも関わる議論になったと思います。
ちょっと関連してですけど、そのページ、15ページのところ、拠点間の連携というのはここで書かれているんですね。こういう取組があるということですね。かなり、拠点だけにとどまらずに、連携もされているということだと思うのですが、連携して、具体的な成果みたいなのというのは、これはこれからですか。どうなのでしょう。
【関谷委員】 始まってから3年という形になってございます。先生おっしゃられるとおり、やはり強みとしては、各拠点が連携するというところで、この真ん中のところに全拠点が参加する全体部会と目的に沿ったワーキング、こういったものを28回することで、まさにプラットフォームが整ったと考えておりまして、既に大きな成果が幾つも出ているところですが、この先、次のフェーズに、先生おっしゃられるとおり、大きな成果が加速度的に出てくるというふうに考えております。
【高梨主査】 ありがとうございます。
ほかにいかがでしょう。何か御意見あるいは御質問ございますか。
宝野委員は評価に関わらない話ですね。
【宝野委員】 はい。利害関係者とみなされていますから、評価に関することではなくて、表現に関することでちょっと気になったことでございます。「nature姉妹紙への論文掲載など」と、「nature姉妹紙」だけ特出ししてあるのが非常に違和感を感じるんですけど、これは必要ですかね。
【関谷委員】 いえ。先生おっしゃるとおり、少し具体的にというニュアンスも含めて。ただ、先生おっしゃるとおり、特出しせずとも。
【宝野委員】 何か特定の出版社だけを特出しにしているようで、非常に不自然に感じます。
【関谷委員】 御指摘ありがとうございます。その辺り、少し相談した上で改定させていただきたいと思います。ありがとうございました。
【高梨主査】 ありがとうございます。
ほかにいかがでしょう。萬委員。
【萬委員】 人材育成、拠点の連携の話にかかりますけれど、ここでマテリアル×データ人材というのは何回か登場していて強調されているのですが、拠点のほとんどがマテリアル系の拠点なのかなと察しておりまして、そうすると、そこで人材育成というと、どうしてもマテリアル側からデータをできる人をつくるという方向性なのでしょうか。
今のAIとかそういった科学の進展を考えると、やはりデータの人をどれだけ巻き込めるかというのが必要と思うのですが、その辺りは具体的に何か取組というのはあるのでしょうか。
【関谷委員】 萬先生、ありがとうございます。まさに我々はそこの視点は非常に重要だと考えておりまして、まさに様々なシンポジウムとかセミナーといったところに、たくさんの情報からの人材が参加され始めています。おっしゃるとおり、今は本当に劇的に開発速度が速くなっておりますので、もちろん従来からのマテリアルの開発手法とともに、情報側から見た極めて速度の速い開発の仕方、もしくは情報の知識を持った方がどんどん入ってくる仕組みが最初のフェーズ1で整ったと考えておりまして、ここの具体的なところをまだお示しできていない部分があるのですが、本当にどの拠点もすさまじく開発の速度、効率が上がっているという具体的な数値的なデータも出始めておりますので、この中間報告会のところは、各拠点の評価ではないため、あえて細かくは書いていないのですが、先生おっしゃるとおり、本当に開発速度が速くなる中で、そういった取組が、情報人材がしっかりと入る仕組みが出来始めております。ありがとうございます。
【萬委員】 はい。ありがとうございました。
【高梨主査】 ありがとうございます。
ほかにいかがでしょうか。オンラインからは特に。ないですか。
では、私から1つ。大変細かいことになるのですが、やはり非常に具体的なことも書かれたので、かえって気になっているところが一つだけ。
私、このままでいいだろうと思うのですけど、内容を逆に聞きたいのですが、60日程度の探索が必要であったものが1日程度の探索が可能になったという。これは、その下を見ると、さらに細かく書いてあって、20件の実験データを60日かけて取得していたのが、20件の実験データを1日で取得する。これはデータ駆動型研究としてなんですか。それとも、何か自動実験とか、いわゆるコンビナトリアルの高度化みたいな、そういうような感じで、実験データを1日で取れるようになったという、何かちょっとデータ駆動とどう関わっているのかがよく分からなかったのですけど。具体的なところが。
【関谷委員】 具体的な拠点のところを、私もしっかりということではないのですが、これは予測精度を上げて。柴田さん、少しそこのところを。
【柴田補佐】 事務局から補足させていただきますと、新規の磁石の化合物探索において、今回、120件の実験データを取得したということですけれども、実際、今、プロセスといたしましては、成膜の作製から評価の工程において、3日程度で一つの資料を作成して、評価していたのですけども、それは20件、データを取るために。なので、20件掛ける3日ぐらいかかっていたので、60日程度かかっていたということを考えているのですが、実際取るときに、やはりターゲットの消耗による交換があったりですとか、メンテナンス時間かかったりとかというところで3日ぐらいやっておりますが、今回は組成の傾斜膜、組成を場所ごとに変化させた膜をつくって、効率的にデータを取得しまして、その特性を評価することで、1日で1つの試料から20件のデータを取得するということが可能になったというところでございます。
【高梨主査】 なるほど。だから、言葉の定義の問題かな。データ駆動型研究。
【中山委員】 これはNIMSでやっている話ですけど、材料の組成が傾斜しているのをコンビナトリアル的に分析し、1日~3日で1個の実験をやっていたのを、もっと速くやったよという内容です。
【高梨主査】 データを1日で取れるようになったというのは分かるんですよね。
【中山委員】 データを活用してというところは、この短縮には入っていないのじゃないかなと私は思います。 【高梨主査】 データ駆動型研究を活用したと言われると、ちょっとこの言葉は疑問で、データ駆動型研究に資する結果になっているということですか。
【高村委員】 だから、そこの部分は、句読点の次に移したらいいのだと思いますけど。すみません。
【高梨主査】 ハイスループットでできるようになって、これをまさにデータ駆動型研究に資するものになるんだという、ちょっとロジックを逆転してもらうとスムーズに読めるようになるかなというふうに思いますね。とても細かいことで申し訳ありません。
【関谷委員】 いえ、とんでもございません。表現を。
【柴田補佐】 ありがとうございます。今のところで問題ないかと思いますけど、すみません。私が言葉を補う、まさに網羅的な探索ができることによって、1日程度で探索が完結することができるようになったということでございます。
【高梨主査】 はい。ちょっとここは細かいところですが、言葉の修正したほうがいいかなという気がします。
【関谷委員】 5つの拠点がそれぞれ本当に様々な取組から、効率性とか、時間を短縮していて、まさに高梨先生がおっしゃったとおり、データベースの中から予測精度を上げて、それで新しい物質を創っているグループも結構あって、その辺りがまたこれからたくさん出てくるものと思います。
【高梨主査】 そうですね。それは期待したいと思います。
ありがとうございます。では、よろしいでしょうか。
そうしますと、本日いただいた御意見を反映して、評価票(案)を若干修正する。基本的には問題ないと思うんですけど、多少文言等の修正を、さっきの「nature姉妹紙」のことも含めて、修正したいと思いますけれども、最終的には、そこは私、主査に御一任いただくということでよろしいでしょうか。
では、特に御異論がないようですので、そうさせていただきます。
なお、修正した中間評価票(案)に関しましては、8月に開催予定の研究計画・評価分科会において、ナノテクノロジー・材料科学技術委員会として報告させていただきます。どうもありがとうございました。
【関谷委員】 ありがとうございます。
【高梨主査】 では、お疲れさまです。
それでは、続きまして、議題の3番目、「ナノテクノロジー・材料科学技術の推進方策について」に移ります。
初めに事務局より、推進方策の構成等について御説明いただきます。その後、総合討議の前に、統計数理研究所の吉田先生より話題提供いただくとともに、奈良先端科学技術大学院大学の藤井先生にも御審議に御参画いただくということとしております。
それでは、事務局より、推進方策の構成等について御説明をお願いいたします。
【宅間参事官】 宅間でございます。私から、資料3-2、それから、参考資料2と3を用いまして御説明させていただきます。
まず、参考資料2のほうを御覧いただきまして、前回の議論の振り返りを簡単にさせていただければと思います。
まず、「はじめに」のところでございます。マテリアル分野につきまして、産業の基盤程度根幹となっているということを明記するべきだという御意見がありました。また、研究環境につきまして、非常に危機的な状況であるという御意見が多数あったというふうに思っております。また、マテリアルの国際競争力も負けているというふうに考えたほうがいいのではないかという御意見もあったところです。これに対しては、マテリアルは他分野に比して、まだ面で闘えているという御意見もございましたので、様々な御見解があったところだと理解しております。
続いて、(1)、誤字がありまして恐縮です。「データ駆動型研究開発の促進」の部分ですけれども、MDX、マテリアルDXプラットフォームの推進には、諸外国の動向を把握し、ここでも先ほどの議論にありましたように、強み弱みの分析を踏まえた記載をするべきではないか、また、データ関連のデータサイエンティスト、コーディネータ、エンジニアなど、必要な人材像等に合わせた検討が行われるべきではないかという御意見もございました。
2ページ目に参りまして、自動・自律実験、また、情報系研究者との連携というところにつきましてですが、(2)の「マテリアル分野において今後振興すべき領域」という柱立てのところでございます。ここにつきましては、データ、マテリアルデータ、DXにつきましては、今後も引き続き推進するべきだというところは変わらないところだと思いますが、そこから先、我が国が何をするべきかといったところにおきまして、例えば自動・自律実験につきまして、欧米で非常に大型の投資が行われているということも前回御議論にありました。
そういった中におきまして、ただ、自動・自律実験の導入については、我が国でも大型の投資がなければ難しいという御意見でありますとか、一方で、海外の取組がまだ自動化といったところにとどまっていて、自律化はまだこれまで進んでいないのではないかとか、あと、外挿領域に踏み込むというようなところまでまだ行っていないのではないか。そういったところに精度の高いマテリアルデータを保有している日本としての活路があるのではないかというような御意見があったと思っております。
また、先ほどもございましたけれども、材料研究者に情報技術を扱うことはなかなか難しい部分もあるということで、情報系の研究者の方とのコラボレーションが重要なのではないかというような御議論がありました。
我が国として、マテリアルDXプラットフォーム構想を進めてまいりまして、それは引き続き重要だということをこの委員会でもこれまでの議論で御意見いただいてきたわけですけれども、それでは、この先どうするのかといったところにつきまして、ぜひここは論点がいろいろあったところだと思いますので、例えばここの日本の立ち位置、強み弱み、また、情報系研究者の方からの御視点でありますとかをいただきながら、今後の我が国の歩行性といったところをもう少し深掘りした御意見をこの場で頂戴できればと思っております。そうしたことで、本日、吉田先生に来ていただいて、この後お話しいただくという流れになってございます。
続きまして、資料の説明を先にお話しさせていただきます。スタートアップの観点では、スタートアップというものが社会実装の観点だけで記載しておりましたが、研究者がより研究に集中できる点であるとか、若手育成の場としても有効だという御意見ありました。また、その次につきまして、元素戦略のような長期プロジェクトにおいて得られた知見といったものについては重要なので、より具体的に成果を書くべきだという御意見も頂戴いたしました。
次のページに参りまして、(3)人材育成、国際連携と追記もしてございますが、これらにつきましては、我が国の研究者、特に若手の国際的なプレゼンスの低下は明白であるということとか、あと、国際連携につきましても、やはり強み弱みの分析が必要なのではないか。また、研究者が望む連携を取るということが重要だという御意見ありました。
それから、産学連携につきましても、もう少し緊張関係を持った産学連携が進められるとよいという御意見がありました。
それから、研究環境の関連では、研究支援人材については、いわゆる技術者ということだけではなく、産業連携、また、国際連携を支援するような、そういった人材も必要だという御意見がありました。
それから、4ページ目に参りまして、学生に関しましては、博士課程の学生が減っているということで、そういったところの育成については産業界とのマッチングが必要だというようなことですとか、また、学部学生につきましても、やはり楽観視できないような状況があるという御意見があったと思っております。
それから、多様な人材といったところでは、例えば女性研究者など優秀な外国人が来たいと思う国にしなければならないというような御意見もありました。また、研究者評価につきましては、我が国における研究者の活動の正当な評価といったところで、こういったサンフランシスコ宣言などへの積極的な参加を促すことができないかというような御意見をいただいたところでございました。
全部を網羅できていないかもしれませんが、主な御議論の振り返りをさせていただきました。
続きまして、国際的な強み弱みといったところでは、お手元に委員と、この場にいらっしゃる先生限りで、机上配付資料と右肩に赤囲みしたものをお配りさせていただいております。こちらにつきましては、主査からの御指摘を受けまして事務局で御用意したものですが、試案といったところで、書き切れていないところがございます。ぜひ議論の材料としまして、今日、御提示させていただきますので、こういったところが足りていないというところ、ぜひ御意見いただけますと、最終回までに、この資料につきましてもブラッシュアップできればと思っております。
まず1ページ目のところが、マテリアル戦略のときに、強み弱みとして整理を一旦されたものになっています。この柱に沿って、現状どうかといったところ、2ページ目にまとめさせていただきました。紙ファイルで委員のお手元にお配りさせていただいているものが、参考資料、一連のものになります。こういったものを引用させていただきながら、これの下、第2回のナノ・材委員会でありますとか、第4回におきまして、JST、CRDSとか、関谷先生から御発表いただいた調査などを多数引用させていただいているところでございます。
まず1点目、論文の量、質、両面で世界トップレベルを維持しているということにつきましては、一定の論文数、質は維持しているというところです。相対的にはプレゼンスが低下しているというデータがあったと思います。また、CRDSの俯瞰報告書において、分野ごとにどうかといったところでは、ここに挙げさせていただいたような分野において、論文、国際的な論文シェアといったところで強みがあるというレポートが出ております。
それから、世界的に有名な拠点研究者の存在といったところです。参考資料にも少しデータを入れておりますが、NIMS、それから、WPIの拠点、また、CREST、ASPIREなどの拠点のマテリアル分野の国際拠点が形成されているところでございます。
また、ARIMですけれども、マテリアル分野の先端設備、共用事業、ARIMという名前になる前から20年以上継続してきたといったところで、全国的な研究設備が整備されているということと、また、先ほどの御議論の中で触れていただきましたけれども、データ収集と連動していると。ARIMになってから、ARIM事業の計測機器から出たデータがNIMSに集約される形になっております。そういったところが海外に先行しているのではないかと考えております。
また、NanoTerasu、Spring-8や「富岳」、世界最高水準の大型研究施設を保有しているということが言えると思います。
また、次に、一定数の学生研究者を確保といったところにつきましては、参考のデータもございますが、主要関連学会の会員数というものはやはり減少しているということと、国内の他分野で比したときに、マテリアル分野の研究者数の割合というのは微減しているということも言えるようであります。また、産業界と学会の距離の近さといったところでは、どれだけ特許において、自国のアカデミアの論文を引用しているかという割合のデータがあるのですが、そちらにつきましては、戦略策定時点より少し割合、差があるものの、他分野に比較して、物理学、材料科学については、高割合を維持しているというデータがございます。
また、良質なデータといったところでは、世界最大級のマテリアルデータを保有といたしまして、参考資料でも一番最後のところに入れさせていただいております、NIMSからいただいたレポートになっておりますが、金属信頼性のデータベースや、無機結晶材料、それから、高分子材料の論文抽出データベースにおいて、世界最大級のデータ数を保有しているということと、あと、研究データについては、NIMSのマテリアルデータプラットフォームが圧倒的なデータ数を保有しているということと、系統的にデータ収集しているという点で、世界に先行しているとお伺いしております。
それから、計算データについては米欧が先行していると。ただし、我が国の研究者も重要な貢献をしているというところで、いろいろと集めさせていただいたデータの中からまずまとめさせていただいたものになっております。
こちらの御紹介、一旦横に置きまして、何かありましたら御議論の中でどうぞ御指摘をいただければと思います。
それから、参考資料3のほうを御紹介させていただきたいと思います。こちらは、NBCI、ナノテクノロジービジネス推進協議会、ナノテクノロジーに関する技術シーズと市場におけるニーズのマッチングの促進によって新たな産業の創成を図り、我が国のナノテクノロジーの発展に寄与するとともに、豊かな国民生活の実現に資することを目的として活動されている、後ろにパンフレットをつけておりますけど、一般社団法人ナノテクノロジービジネス推進協議会様よりいただきました第7期科学技術・イノベーション基本計画に向けた御提言でございます。
こちらについて、最終ページのほうにスケジュールが少し書いてありますが、本年の秋ぐらいをめどに、第7期のイノベーション基本計画に向けた御提言をまとめられている最中だということで、途中経過の情報共有を先日、文科省としていただきました。このナノ・材委員会の御議論とも重なる部分が多数ございましたので、この場でNBCIの御了解を得て、御参考として配付させていただきたいと思います。
少しだけ中身を御紹介いたしますが、参考資料、目次がございます。1から6までありますが、特に(2)、2ポツのマテリアル創出のところでは、まさにマテリアルズ・インフォマティクス推進環境の整備ということで、データ共有や先端計測装置等の必要性でありますとかデータフォーマットの共通化などについても、その重要性を指摘されておられます。
また、2-2のところでは、自動・自律実験の導入の推進の必要性、一方で、それの難しさについてもこの委員会で御議論いただいていることと重なるような御提言なのかなと見させていただいたところでございます。
それから、6ページ目のところのナノマテリアル産業の振興の関連では、ナノ材料、ナノ構造が寄与する機能の解明といったところで、産学連携でのナノ材料、ナノ構造の機序の解明を進めるべきだといったところで、これに関しては、文部科学省としてはMaterealizeという事業があって、まさにプロセスサイエンスの解明を産学連携で取り組んでいるところなので、そうした取組と類似するところに御提言いただいたのかなと認識してございます。
それから、8ページ目、産学連携のところでは、全国横断的な産学連携窓口の整備が必要だというような御提言が書かれております。
それから、9ページ目、人材育成のところでは、社会実装を担う人材であるとか、大学の標準化に向けた教育であるとか、企業内での博士人材の活用などについて御提言がなされているところでございます。こちらについては、この場にお呼びするお時間はなかったので、こういった形で御紹介だけさせていただきたいと思います。もしこちらも御参考にいただいて、今日の御議論をしていただければと思います。
ちょっと長くなってしまって恐縮です。資料3-2、推進方策、本文のほう、前回からの変更点のところを中心に御説明させていただきたいと思います。
1ページ目のところ、下線のところですが、産業競争力の追記ですとか、あと、その次の3行ほどは、マテリアル分野の、本文でマテリアルについての議論があるのですが
、この委員会の主であるナノテクノロジー・材料科学といったところとの連結を少しきちんと書いておいたほうがいいかなと思いまして、実は本文の後ろのほうでは、以前、委員からの指摘でそういった記載は入っていたのですが、「はじめに」のところで十分言えていなかったので、今般、事務局のほうで作成して入れさせていただきました。「ナノテクノロジー・材料科学は、マテリアルの機能・性能を原子・分子からナノレベルで設計・制御するなど、革新的なマテリアルの創出において不可欠な技術である」ということを言わせていただいております。
3ページ目のところの下線が、五、六行ほどあるところですけれども、こちらについては、マテリアルの状況について、もう少し危機的な状況を認識したほうがいいのではないかと。いろいろな見方がある中でもあったと思いますので、そういったことを記載させていただいております。「存在感の低下傾向の継続が否定できない」といったことでありますとか、研究時間だとか人材の不足というのが深刻だということを追記しております。
それから、次のパラグラフの下線のところにつきまして、我が国の強み弱みを認識してというような御意見を踏まえまして、我が国の強みを生かしつつ、積極的に新しい手法を取り入れた革新的マテリアルの持続的創出のための新たな取組の検討が必要だと。危機的な状況をきちんと認識した上でこういうことが必要だということを「はじめに」に追記させていただきました。
5ページ目、データ駆動のところです。3行ほど追記したところがございます。研究DXの推進はいまや不可欠だということをまず現状認識としてしっかりと言っていただけると、その上でどうするかといったところにつなげていくために、事務局で案を作成して入れさせていただいております。
それから、6ページ目のところです。こちらはDxMTの事業について書かれているところですが、具体的な成果をというところを踏まえまして、具体的な成果を幾つか、先ほどの中間評価のほうの御議論ともリンクいたしますが、書かせていただいております。これらについては、いわゆるトップジャーナルにも掲載された世界トップレベルの成果と言ってよいと思いますので、そういったことで世界トップレベルの成果が上がっているといったところを書かせていただいております。
7ページ目のところ、データ中核であるNIMSのデータベースに関しては、先ほど机上資料で御紹介したようなことを踏まえて、世界にも類を見ないものであるということとか、先行する取組だということを書かせていただいております。
それから、9ページ目のほうに参りまして、課題のところでございます。中ほどに、マテリアルDXプラットフォームの全体的に推進していくために不足している事柄として、やはりマテリアルズ・インフォマティクスに係る人材、先ほど情報系の研究者の方の巻き込みというお話もありましたけれども、そういったことを書く必要が課題としてあるのではないかと議論を踏まえて思いましたので、追記してございます。
10ページ目のところに参りまして、自動・自律実験といったところが一つ、これまでのデータ駆動に加えて、もう一つ、取組が必要なところかと思いますが、なかなか現場としては難しいという課題があるということを記載しております。
それから、11ページ目のデータ駆動型研究の全国展開に向けた取組といったところでは、やはり先ほどの課題として、人材が不足しているというところがございましたので、そこに対応して、情報系研究者の方の巻き込みということをここには記載していたのですけれども、もう少し具体的に、これが妥当かどうかは、今日、吉田先生に来ていただいているので、後で御意見いただけるかもしれませんけれども、従来の人材育成セミナーといったことだけではやはり不足していて、情報系と材料系の研究者交流だとかマッチング、また、協働促進に向けた仕組みづくりが必要だということでありますとか、また、キャリアパスがなければ人は育たないというようなところもございますので、キャリアパスの形成といったところで、やはり産業界とも連携したような取組が必要であろうと思いましたので、そういったことを案として記載させていただいております。
それから、11ページ目の下、マテリアルDXプラットフォームの更なる発展のところでは、まさに自動・自律化実験といったところで、海外で大型投資が進む中では国がどうしていくべきかといったところを書かせていただいているところです。
それから(2)の今後推進すべき領域のところには、大きな変更点という意味では、16ページ、課題のところでございますが、ここに入るまで、この現状においては、マテリアルは非常に重要で、環境だとかエネルギーだとか半導体といったような分野において、非常に多層的な政府の投資も進んでいるというようなことを記載しておりました。一方で、課題のところでは、短期的な出口を明確にした研究開発といったものが強力に進められている一方で、将来の成果につながる長期を見据えた幅広く横断的な基礎・基盤研究の支援が十分とは言えないといったところが課題と言えると思いますので、それを記載しております。
そこに続けまして、こうした横断的な基礎・基盤研究としては元素戦略というものがございましたが、それについて記載しております。ここも具体的な成果を追記しておりまして、さらに、最後の3行ぐらいでは、当時の事後評価票などを引きながら、アカデミアから産業界への橋渡しによって、社会実装につながる成果が上がっただけでなく、マテリアル分野横断的な共通的なコンセプトの下、シニアから若手までの重層的な研究開発が行われ、コミュニティーの育成にも寄与したということを書かせていただきました。
17ページのほうに参りまして、自動・自律実験や、また、環境に配慮した材料の開発
などにおいて、例えば、製品のライフサイクルアセスメントのようなものも必要だというようなところがございますので、情報系の研究者だけでなく、人文系の研究者も含めた異分野、多分野連携を進める必要があるのではないかというふうに段を書かせていただきました。
18ページの具体的な取組のところでは、革新的マテリアルの持続的創出に向けた取組といったところで、横断的な基礎・基盤研究を不断の努力で強力に推進することが必要だということで、ナノテクノロジーの重要性を再認識し、新たに分かった知見なども活用しながら、また、自動・自律実験などの新しい技術を活用しながら、重層的な支援により若手を育成するとともに、既存の学術領域を超えた連携によってサイロを打破し、マテリアル分野の発展が図られるような取組になるよう、具体的な検討を深める必要があると追記させていただきました。
また、社会実装の加速に向けた取組のところでは、プロセスサイエンスの構築のところにつきまして、少し追記をさせていただいております。「社会に出るものづくり」のための理論構築といったところで、そういった活動の構築が必要、継続が必要だということを書いております。
それから、19ページ目の下線のところはスタートアップでございますが、こちらについては、内閣府のほうで、マテリアル分野のスタートアップの育成事業を行っておりますので、それにつきまして、研究者が基礎研究に集中する手段としても、また、人材育成の手段としても有効だということを書かせていただいております。
それから、20ページ目、(3)研究開発力の強化、人材育成、国際連携等のところにつきまして、21ページ、優れた研究成果の創出には、良好な研究環境や処遇が不可欠であるというようなことを現状として書かせていただいたのと、22ページ目のところで、国際協力において、我が国の国際的なプレゼンスが下がっているということを追記してございます。また、課題のところでは、そういう国際的な活動が適正に評価されないということも一つの要因としてあるのではないかということで、研究者の評価の公正性といったところについても課題として記載させていただいたところでございます。
それから、取組の方向性のところにおきましては、24ページのところですけれども、国際的なプレゼンスの強化と戦略的な国際共同研究の推進といったところで、プレゼンスの強化といったところでは、まず、大学や国研において、国際的に「目に見える」拠点を形成するとともに、ASPIREなどの国際交流事業の活用によって、国際頭脳循環を加速し、世界で活躍できる人材を育成するということに加えて、こうした拠点の形成においては、戦略的な国際共同研究の推進が重要ですが、その上では、強み弱みを分析した上で、研究現場が望む形で検討するべきだといったところを追記させていただきました。
まとめのところは、本日は割愛したいと思います。
事務局からの説明、長くなりまして恐縮ですが、以上でございます。
【高梨主査】 どうもありがとうございます。
それでは、このまま続けまして、ここはよろしいのですね。
では、ただいま御紹介のありました、吉田先生から御発表いただくということで、そのように続けてよろしいですね。では、吉田先生、よろしいでしょうか。
【吉田センター長】 本日、御招待いただき、ありがとうございます。統計数理研究所の吉田と申します。私は、いわゆる機械学習という分野の研究者でして、七、八年前ぐらいから、この材料の研究に応用を進めているということです。今日は、RadonPyというプロジェクトがありまして、高分子の材料のデータプラットフォームを構築するという、そういったお話を紹介して、それと関連づけて、マテリアルDXの推進に対して、私なりの意見を述べたいと思います。
次、よろしくお願いします。言うまでもなく、データ駆動型研究における最も重要な資源というのはデータであるということです。しかしながら、データ駆動の材料の研究における最大の壁がデータ資源の不足ということです。データがなければ、データ駆動の研究はできないということですね。特にこの分野ではオープンデータが不足しているということです。データが不足する要因としては、データ取得に関するコストが高いということと、あとは、材料の空間というのは非常に広大で、階層的であって、共通基盤のデータをコミュニティーで共創するということがやりにくいということです。
もう一つは文化の問題です。それは、材料の研究者というのは、他者にデータを共有するということに対してインセンティブがないということですね。なので、コミュニティーが協調してコモンデータをつくっていこうという動きが起きにくいというのは、これは文化の問題なので、短期的な解決は難しいということです。そして、もう一つは、材料研究に固有の問題として、我々はそもそも革新的な物質、材料を見つけたいわけですが、当然ながらその周辺にはデータがないということです。ありとあらゆる問題がデータ資源の不足というところに帰着しているということです。
次、よろしくお願いします。そこで、データ資源の壁を乗り越えるというのがスターティングポイントであろうと考えまして、私たちは、高分子材料の世界でいろいろなアプローチを展開してきました。これが私たちのプロジェクトのビジョンを示した一枚の絵なのですけど、クローズの領域においては、企業の研究者、大学の研究室、こういったプレーヤーというのは、単独ではなかなかデータ駆動型研究に資するデータを取るのが難しいわけなのですね。したがって、私たちがやるべきことは、オープンな領域において材料の世界では、計算機の実験、第一原理、MD計算、流体のシミュレーション、そういった計算のデータをつくっていくということと、自動実験、ハイスループットの実験等々を含む実験のデータベースを構築していくということです。個々の材料の研究者は、価値のドライビングフォースとなるラボの中のデータと、コモンデータ、この2つのデータを、2種類のヘテロなデータを統合的に解析して、材料のデータ資源の不足の問題を超えていくべきだと、そういうふうな考え方です。
そこで私たちは、まず最初のスターティングポイントとして、高分子の材料を対象とした計算機実験の包括的、巨大なデータをつくろうということで、プロジェクトを推進しております。
次、よろしくお願いします。そこで、2020年頃からRadonPyというソフトウェアを開発しまして、これは高分子材料の計算機実験、特に全原子の分子動力学シミュレーション、第一原理計算に基づく計算機実験を全自動化するパイプラインを行うツールです。詳しい話はしませんけど、ポリマーのリピートユニットであったり、その温度とか圧力、重合度、そういった諸条件を与えると、MD計算を全自動化して、様々なポリマーのシステム、アモルファス、配向したポリマー、混合系の物性とか、そういったものを全自動で計算するツールになっています。
次、よろしくお願いします。今、RadonPyを使って、RadonPyのオープンソースの開発と、あとは、RadonPyを使って、「富岳」を活用して、ハイスループットの計算を行って、世界最大級の高分子物性のオープンデータを産学競争でつくろうという、そういった取組を進めています。
今、統計数理研究所が中核となって、9大学36企業に属する約240名の研究者が日々、このRadonPy等を使って、「富岳」でデータを取得して、それを共有していくという、そういったような取組を行っております。これは、将来的にはこのデータをオープン化して、データ駆動型材料研究の民主化にコントリビューションしようという、そういったような取組になっております。
次のページ、お願いします。これは最終的には、大体10の5乗、今、オーダーとしては10の5乗ポリマーぐらいが来ているのですが、10の6乗、10の7乗のポリマーが包含する、ありとあらゆるポリマーの物性を計算機実験で埋め尽くしていこうという、そういったようなビジョンで進めています。例えば左の図を見ていただくと、これは約8万個のアモルファスポリマーの様々な物性の同時分布になっておりまして、詳しい話はしませんけど、例えば複数の物性の間には、トレードオフがあります。それのトレードオフが形成するパレートフロントという、今、到達可能な境界、限界ラインがあるんですけど、そこがどこにあるのか、あるいはそこを構成するポリマーってどんなものがあるのかという、そういったような高分子の世界の地図を得られるというのがまず1点。いろいろなターゲットがあるわけですけど、そこに対してデータをバッと出して、地図をつくっていこうというのが一つ、取組です。もう一つは、データベースというのは、機械学習のデータ資源として開発されている。これが私たちのデータベースの非常にユニークなポイントなのかなと思っております。
次のページ、お願いします。様々なユースケースがあるわけですけど、ここでは一つ、転移学習に、特にSim2Real転移学習と呼ばれる方法がありまして、それにRadonPyのデータベースを活用するというコンセプトを示しています。現実系のいわゆる実験のデータというのは、量的には非常に限られている。なので、そのラボで取ったデータだけで機械学習のモデルをつくろうと思っても、多くの場合は難しいんですね。なので、RadonPyの中にある様々な物性、ポリマーシステムに対する巨大なデータセットを使って、ファンデーションモデルと呼ばれる汎用的な機械学習のモデルを一旦つくるわけですね。その得られた基盤モデルを限られた実験データを使って、ファインチューニングする、転移学習をするという、そういったようなスキームなんです。
実験データだけではなかなか予測モデルはつくれないんですけど、こういったSim2Realの転移学習を行うことで、非常に汎用性の、汎化性能の高いモデルがつくられるということが、材料の世界では、データ駆動型研究の世界では昔からよくやられていて、それによって新しい物質などもこれまでたくさん見つかってきているわけです。
次のページ、お願いします。そこで一つ、ちょっとテクニカルな話にはなるんですけど、転移学習、重要なコンセプトとして、転移学習のスケーラビリティ、スケーリングローという概念を御紹介します。私が先ほど申し上げたように、私たちのデータというのは、転移学習のソースデータとして、つまり、シミュレーションデータで事前の学習を行って、そのPre-trainingモデルを現実系にファインチューニングするということですね。その下のほうにテストエラーに関する、べき乗則の式が書いてあるんですけど、これは何を意味しているかというと、転移されたモデルの現実系、実際の実験物性に対する予測性能というのが、シミュレーションデータのサイズ、nのべき乗則に従ってインプルーブしていくということを表しています。すなわち、シミュレーションデータをどんどん増やしていくと、レイトアルファで、トランスファーモデルの現実系に対する予測性能が改善していくと。
nをどんどん増やしていくと、最終的にCという行ですね。転移ギャップと呼ばれるのですが、これが到達可能な汎化性能ということです。これが理論的にそういったことが成立すると言われていて、その右側に示すように、これは右側のパネル図は、横軸がRadonPyのデータベースで、今、例えば10の5乗ぐらいが来ているわけですけど、nをどんどん増やしていくと、屈折率だったり、熱伝導率といった実験物性に対する性能が単調にインプルーブしていくと。ログスケールでリニアにインプルーブしていくということですね。すなわち、計算データの規模の拡大というのが現実系に対する予測性能が単純に向上するという、そういったことを示したものになります。
次のページ、お願いします。これが私たちのプロジェクトの一つのマイルストーンになっていまして、私たちは、スケーラブルに転移が可能な基盤データをつくるということです。RadonPyのデータベースというのは計算機実験のデータベースなので、これは現実系の間とはギャップがあるわけですね。現実系の問題というのはもっと複雑な問題を解くわけですけど、今の計算機実験の世界では、なかなかそこにダイレクトには行かないわけなんですね。
なので、計算機実験の世界と材料研究の最先端のところのギャップを、機械学習を使ってブリッジすると。そのときに基盤データをちゃんと開発していけば、下流タスクがちゃんとインプルーブしていくというデモンストレーションをして、それで、そのとき、スケーリング則のコンセプトというのが重要になってくるわけです。こういったワークフローを構築する、発見するというのがデータ駆動型材料研究の本質なのではないかということでございます。
次のページ、お願いいたします。では、私たちは何すべきかというと、幾つかありまして、一つは、このアプローチの有効性を高めるためには計算でできる世界をどんどん拡張すべきであるということです。高分子の計算というのはいろいろな階層があったり、いろいろな物性、いろいろな対象があるわけですけど、これを1研究グループでやっていてはなかなかスピード、スケールしないわけなので、そこで私たちは、産学の非常に優れた計算科学の専門家を多数このプロジェクトに巻き込んで、いろいろなコンソーシアム型でのオープンソース開発を行って、この計算で行ける到達可能な世界を加速度的に拡大していこうという、そういったようなことを狙っているわけです。
次のページ、お願いいたします。今後の展開としましては、多分、今、RadonPyのデータベースは、高分子の計算物性のデータベースとしてはもう世界で唯一で、世界で最大であると思っております。これは他の追随を許さないレベルに到達したと考えております。残すべきタスクは、課題は、これを現実世界とつなげるということです。特に、今、例えば私たちのデータベースには、いろいろな物性を対象とした様々な有望な仮想ポリマー、材料というのがどんどん出てくるわけですね。これを大量に合成して、キャラクタライゼーションしていこうという、そういったことを、ワークフローを構築しようということで、今、国内の自動実験の専門家の方々をこのプロジェクトに巻き込んで、ロボットを使ったハイスループット実験のオープンラボをつくって、RadonPyのプロジェクトと計算の世界と現実世界の間の接続を行うという、そういったようなことを今準備しているところであります。
次のページ、お願いいたします。以上を踏まえまして、マテリアルDXに関する、提言という偉そうなものではなくて、私の所感を述べたいと思います。なかなか日本は遅れていると皆さん思っていると思うのですけど、私は、そこまで遅れているとは思っていなくて、やはり日本ならではの特異性というのがあると思います。例えばRadonPyのコンソーシアム、今、産学から240名の研究者の方々が参画して、本当にみんな手を動かしてチャレンジしているわけですけど、こういった産学連携の巨大な体制を、こういったものを自発的につくれるという環境が日本ならではであると思いますし、技術的に劣る点は一切ないと考えています。負けているとすれば、リソースの不足とか戦略とか文化の問題、そういったところにあると考えています。
2点目は、階層性・転移性を考慮したデータポートフォリオの構築というのが非常に重要であるということです。先ほど申し上げたように、材料研究、基盤的なデータとエッジのデータというのがあるんですね。階層のデータがあって、エッジのところはなかなか、実験が効率化したとしても、巨大なデータをつくるのは難しいと思います。一方で、汎用的な、基盤的なデータ、ここは材料のエッジのところにはダイレクトにつながらないんですけど、そこに関してはデータをどんどんつくることができて、そこでデータをつくると。エッジの限られたデータとのブリッジを機械学習でやるのだと。では、そのときにどこを基盤にするのか、どこをエッジとして定めるのかという、こういった戦略が必要なのではないかということです。
次のページ、お願いいたします。あとは自動実験、最近、私自身も自動実験をやろうと思って、こういった方々といろいろな意見交換をしているわけなのですけど、ここについては、やはり話合いの中でいろいろな問題があるんじゃないかなと考えて、それをまとめたものになります。
まずは、昨今、結構長い間、自動実験をやって、データを大量につくってみたいなことがやられているんですけど、ただ、そこで出てきた大量のデータと機械学習、AIなどと組み合わせて、すごい材料が出てきたという成果事例、成功事例がなかなか出てこないんですね。それは幾つか構造的な問題があって、こういった自動実験の装置というのは、研究室に閉じている。なので、1グループの中で閉じているということですね。なので、実は、稼働率が非常に低くて、実は全然データをつくっていないみたいな、そういったことが多々あるのではないかということです。
1研究グループの中で持っていても、運転、ランニングコストが非常に高いので、そのうち何か減価償却の問題とかが起きるんじゃないかなと考えています。あとは、自動化自体が目的になっていて、ちょっと人間が介在すればどんどんデータがつくれるのに、そこの部分が動いていないみたいな、そういったケースもあると思います。
では、これを克服するために幾つかアプローチがあると思いますが、まずはやはりこういったパワーゲームをやらなきゃいけないので、エコシステムをつくっていかなきゃいけない。つまり、研究者自身がデータ生産を行って、価値創出を行って、それで収益を上げて、それを再投資に回すと。さらにデータ生産に移るという、こういったループをつくっていかなければ、なかなかこういったパワーゲームは勝てるのではないかなということと、あとは、1研究グループに閉じるのではなくて、オープンラボ、いろいろな方々がそこにアクセスできるような共用施設みたいなのをつくっていく。ARIMなどがそうだと思います。あとは実験費用の低下ということができたらすごくすばらしいと思っていて、例えばライフ、バイオの世界は、今、次世代DNAのシーケンスとか、RNAのシーケンスなどが、ヒトゲノム計画のときは数十兆円で1サンプルを取っていたわけですけど、四半世紀たって、今は何か、1シーケンスのデータを取るのに数万円とか、そういったレベルに来ているわけですね。こうすることで、普通の大学院生でも簡単にバッと自分のデータを外注して出したり、そういったような世界が来ているわけですね。こういったことが起きれば、本当に世界が変わるのではないかなとは思っています。
次のページ、お願いします。これが最後ですけど、今、マテリアルDXとか見ていて、DX推進の一つの問題点として、データ駆動型材料研究というのは、結局、データが最も重要なのですけど、残念ながら、現時点においてはまだデータはないんですね。ほとんどドメインで。なので、当然、データ駆動型材料研究、データがなければ成果は生まれない。短期的には成果が生まれるものではないと私は考えていて、そういった中で何かこう、データを必要としない材料研究者を結構巻き込んでいるのではないかと思っていまして、そういった人たちを巻き込んでしまうと、その人たちはデータがなくてもすごい研究ができる人たちなので、そういった人たちの機会費用を失うようなことはできるだけ避けたほうがいいのではないかなというふうには思っています。あとは、リーダーシップを執る人間がやはりデータ駆動型研究、デジタルに関するビジョンと具体的なシナリオがないと、こういった冬の時代が長く続くことなので、そういったところをなかなか乗り越えられないと考えています。
最後、宅間さんからいろいろありましたけど、情報系研究者の参入障壁。そもそもデータがないのに、参入してくるはずがないです。これがもう全てだと思います。当然、キャリアパスもないわけなんですね。だから、オープンデータの創出というのが、いろいろなデータ駆動型研究の世界を見ていると自明なのですけど、オープンデータがあるからそこに研究者が集まってくるんですね。なので、これが必要条件であると考えているところでございます。
以上となります。どうもありがとうございました。
【高梨主査】 どうもありがとうございました。
それでは、ただいま御説明のありました内容、これは宅間さんから、あと、吉田先生と両方、全て併せてということになりますが、御質問、御意見等ございましたら挙手をお願いいたします。また、藤井先生にも御参加いただいておりますので、何かございましたらいつでもよろしくお願いいたします。
【藤井教授】 よろしくお願いいたします。
【高梨主査】 どうも。よろしくお願いします。
さて、いかがでしょうか。では、高村委員。
【高村委員】 北陸先端大の高村です。すごく分かりやすい御講演ありがとうございます。計算データではこういったデータベースをつくって、機械学習をかけて、こういった材料がいいのではないかという提言が出る段階まで行っていて、あとはそれをどうやって合成するか、本当にできるのかというところ、あるいは、計算データを元に本当に物質を合成したときに、そのとおりの物性が出てくるのかというところだと思うのですが、今後、実験データでそういうデータベースをつくるときに、先ほど一つの研究室では無理とおっしゃっていましたけど、では、複数の研究室からばらばらに上がってきたデータからどうやって使えるデータベースをつくったらいいのでしょうか。
【吉田センター長】 私はバックグラウンドが機械学習なので、そういった複数の、要するに、ちゃんとコントロールされた高品質でないデータを解析するプロなのですけど、当然、データ科学の世界というのは、ほとんどのドメインというのは高品質なデータではないんですね。不均一なデータなんですね。ここからいかにナレッジとか、それに基づく予測、意思決定をやるかというのが、そもそもそれが機械学習なんです。なので、いわゆるデータ駆動型研究に使えるデータ、高品質とおっしゃるのですけど、必ずしも高品質である必要はない。高品質で取ればやはりコストが高く上がるんですね。そのコストを抑制するために、データ科学があると私は考えています。それは可能だと思います。それはデータ駆動型研究のほとんどのドメインがそういったことをやってきたわけですが。
【高村委員】 ARIM事業でも、高品質なマテリアルデータという言葉に結構影響されて、ちゃんとした測定とか、信頼できる物性測定といって、だんだんデータが少なくなっていってしまうのですが、それよりも周りのデータを全部出したほうがいいのか、そういう高品質なデータにこだわったほうがいいのかというのが、我々材料屋の感覚ではよく分からないのです。
【吉田センター長】 あまり無責任な発言はできないのですが、私はそうではないと思っていて、さっき共通基盤データとエッジのデータという話をしたのですが、エッジのデータは高品質であるというのはもちろん重要だと思うんですけど、共通基盤データは必ずしも高品質である必要はない。そこまで、ある程度の品質があればいいんじゃないかなとは思います。
【高村委員】 そうすると、やはりあるものは全部出しておいたほうがいいということですよね。
【吉田センター長】 私はそう思います。
【高村委員】 どうもありがとうございます。
【高梨主査】 ありがとうございます。
【柴田補佐】 今のデータの品質のところなんですけど。
【高梨主査】 どうぞ。
【柴田補佐】 事務局です。今のデータの品質のところですけれども、そのデータを使って何をするのかという目的ですとか研究のフェーズによっても、高品質である必要があるのかどうかというところが多少差があるかなと思ったんですがも、藤井先生から、もしよろしければ少し補足いただいてもよろしいでしょうか。
【藤井教授】 ありがとうございます。高品質なデータを取る技術がそもそも我が国にあるというのは、もう根本として大事なことだと思っています。ただ、探索ですね。材料を初期フェーズとして探していくときには、例えば同一条件で多くの材料のデータを集めるであるとか、そういった材料の研究をしている先生方からすると、材料ごとにつくり方はやはりバラバラに最適化されるべきものであるので、少し違和感を持たれることだと思うんですね。
ただ、そういうデータも、データ駆動型ですと非常に新しい、まだ見ぬ未知の領域を探索していくのに役に立つことがあるというのは、データ駆動で分かってきていますので、そういうとき、探索のフェーズでは粗いと思われるようなデータでも非常に有用性は上がると。ただ、一方で、やはりマテリアルというのは社会に実装されていくものであると。そうすると、社会に出たときに、安全性がマテリアルはちゃんと担保されているのであるか。副作用が起きないのであるかというのは調べないといけない話であると思うんです。
そういうときは恐らくデータ駆動型でやるというよりは、やはり既存というか、伝統的にしっかり多角的、精度の高い検証をしないと、製造のほうとかが受け取ってくれないと、社会実装に出ていかないというところが往々にしてあるかなと思います。ですので、どのフェーズでどういう精度、どういう品質のデータを作成していくのかというのは、フェーズ、フェーズで考えていくことが必要かなというのを思っています。
以上です。
【柴田補佐】 ありがとうございます。すみませんでした。
【高梨主査】 よろしいですか。どうもありがとうございます。
ほかにいかがですか。どうぞ。
【中山委員】 ARIMのお話がたくさん出てきました。プレゼンいただいた12ページ目では、研究室に閉じているため機器の稼働率が低いという話の中でARIMについて触れられました。また先ほど宅間参事官から御説明いただいた机上配付資料の2ページ目ですが、界的に有名な拠点研究者おいて、マテリアル分野の先端設備事業であるARIMの話が出てきました。このARIM事業は、もう20年続いているんです。名前はいろいろ変わりましたが、施策は通常は長くは続かないところ、こんなに続けてきました。大事さが認識されてきていて、機器を共用するという考えも徐々に広がってきています。研究設備がそろっていない優秀な若手研究者等がどんどん使い始めており、かつ、研究設備の値段がかなり上がっている状況を考えても、我が国にとってはなくてはならない事業になってきています。
圧倒的に費用対効果が高いという面は、まずは大事な点です。要は、個別のばらまきをやるよりも効率的だというところ。そして今となっては、そこで出たデータがマテリアルDXに資するようなデータとして蓄積されていく。データの品質が高いかどうかという論点はありますが、基本的には同じ装置を使っていくということであれば、割とそろった品質の高いデータが得られやすいということを感じます。材料分野がいろいろな分野に資するためにも、この事業は、ナノ材分野の最優先、第一優先の本当に大事なところだなというのは強く感じているところです。これも我が国の強みであり、単純に世界的に有名な拠点とか研究者の存在という説明とは一線を画し、もう少し位を上げて言ってほしいなと思います。
さらに幾つものメリットがあるのですが、他に譲ります。本当に大事なんだというところは強く出していただいた上で、研究開発推進のうえで問題解決の糸口がここには結構隠れているので、その辺を掘り下げて議論なりしていただけるといいなと思います。
以上です。
以上です。
【高梨主査】 どうもありがとうございます。
【中山委員】 本当はもっと予算をつけろということでもあると思うんですけど、本当大事ですよ。
【高梨主査】 ちょっと私も関連してですけれど。今、ARIMの話があって、それであと、NIMSに今、データがどんどん蓄積されてきている。だからそういう状況を、これは今、最後のところで、データがないのに参入してくるはずがないという話があるんだけれども、今そういうNIMSにどんどんデータが蓄積されてきて、まさに今、データが出来つつあるところを、これは吉田先生や藤井先生、どういうふうにお考えになっているかのか、あるいは見ておられるのかというところをお聞きしたいなと思ったんですけど 。
【吉田センター長】 結構、それでもやはりハードル高いなと思います。
【高梨主査】 そのハードルというのはどういう意味でという。
【吉田センター長】 やはり機械学習の研究者が大量に参入するときには、オープンデータで、いわゆるベンチマークと呼ばれるデータが結構整備されたタイミングですよね。ヒトゲノム、ゲノムのシーケンスとか、トランスクリプトームとか、プロトニクスのデータとか、そういった機械学習の研究者は何をしたいかというと、自分たちが開発したアルゴリズムの実践例としてそういったことをやりたいんですね。それを論文の中にデモンストレーションしたがっていますけど、そういったデータベースがまず一つあるというのが重要かなと思います。例えばMaterials Genome Initiativeのマテリアルプロジェクトのデータとか、そのようなデータセットなどは結構、機械学習分野の研究者の呼び水になっていて、今、機械学習の国際会議とかでも普通にああいったデータセットが使われて、それをきっかけにして、機械学習の分野が最初の一歩を踏み出して、次に入っていくみたいな、そういった感じで進んでいることが多いですね。
なので、そういった材料のエッジのほうのデータというのは結構、機械学習にはいきなり入りにくいというのがあって、もうちょっとマイルドなデータがあってもいいのかなというふうには思っていますね。
【高梨主査】 具体的に言うと、ごめんなさい。ちょっと私、完全にはフォローできていないんだけど、どこをどうすればもっと入れるようになるんですか。今のは量の問題ではないですよね。データ量の。
【吉田センター長】 そうですね。でも、結構、量の問題かもしれません。
【高梨主査】 まだ量が足りないということですか。
【吉田センター長】 そうだと思いますね。
【高梨主査】 そういうことですか。
【吉田センター長】 どれくらいのデータが蓄積されているのか、実際には分からないんですけど、きっと想像ではまだ量が足りないんじゃないかなとは思います。
【高梨主査】 そうですか。
【吉田センター長】 オープンになっているというのも重要かなと。やはりオープンになっていないと見えないので、なかなか難しいと。
【高梨主査】 はい。藤井先生、何か。
【藤井教授】 よろしいでしょうか。今お話があったデータのことですけど、まず2つ観点があるかなと思います。
1つは、一括でデータをダウンロードすることが可能なのかどうかというのが大事な点かなと思います。やはり国費を投入して、データベースをつくりました。それを一括ダウンロード可能としてしまうと、いろいろな国からダウンロードが始まります。それを本当に是とするのか否かというところは多分、恐らくいろいろな先生方がお話のところかと思いますが、そこを乗り越える必要があると思います。恐らくそれを乗り越えるキーポイントは、セキュリティーであるとか、いろいろどういう仕組みでダウンロードされたデータを追跡し続ける技術をつくるのかどうかというところにあると思います。
もう1つは、ユーザーにとっての利用体験かなと思います。今、世界で、Materials Projectという計算データベースが恐らく一番使われているのではないかなと思います。ただし、このMaterials Projectが一番データ量が多いわけではないです。なぜここが使われるようになったかというと、Pymatgenというユーザーにとってのライブラリーですね。非常にデータベースのアクセス、手元での解析が可能なライブラリーを彼らがつくったんですね。そのライブラリー整備によって、どんな企業とかでも、大学の研究者でも簡単に利用できるようになった。そこが多分、一番の普及したメリット。Materials Projectは一括ダウンロード可能で、ライブラリー、ユーザーにとっての便利なツールがそろえられている。なので、非常に普及したというところです。
その次に、Materials Projectの人たちがどうやってマネタイズしているのかというところだと思うのですが、例えば、UCバークリーとかと企業が共同研究するときに物すごい額が必要なんですね。そういうのって表になかなか出てこないですけど、共同研究させてくださいという話になると、日本の共同研究、企業とやるようなものは本当に桁が違う金額を出さないとできない。でも、それに乗ってくる企業がいると。そこでまた人を採る、データをつくる、環境をつくるというのがうまく回っているのかなと思います。
以上です。
【高梨主査】 どうもありがとうございます。
関連して。どうぞ。菅野委員。
【菅野主査代理】 よろしいでしょうか。どうもありがとうございました。質問ですけれども、汎用的基礎データとエッジ向けデータというのはどのように区別されるのかというのが1点。
【吉田センター長】 それは私よりも先生方のほうが多分。でも、一つ、機械学習とかデータ駆動型研究の視点からすると、汎用基盤データというのは、ここのループが回ると。ある程度大量生産ができるというところが基盤データかなと思います。そこで、データを増やしていくと、いろいろなタスク、下流のターゲットタスクがちゃんとスケーラビリティを持って、モデルの精度が上がっていくという、そういったようなものですね。そのときに、ここで取ったデータがいろいろなところに波及できるという。これが基盤データの定義、ざっくりした定義かなと思います。では、これは具体的に材料の世界で何なのかというと、それは私よりも多分、材料の研究者の方々がどう定義するかなのかなと思うのですけど、いかがですか。
【藤井教授】 吉田先生、私、お話ししてもいいですか。私は菅野先生の御業績も勉強させていただいているんですけれども、例えば固体電解質とかの話題にしますと、やはりいろいろな酸化物ですとか、硫化物ですとか、最近、ハライドとかあるかなと思います。吉田先生がおっしゃっているエッジと呼ばれるのは、例えば窒化物であるとか、ハライドであるとか、一つの研究室で往々にしてターゲットを決められていると思います。そのターゲットのことを多分、吉田先生はエッジとおっしゃられているのかなと思います。
リチウムイオン電池の固体電解質の例で言いますと、例えば結晶系、どんな材料系に絞らず、結晶系のデータであれば、例えばそこから、アニオン骨格ですね。アニオン骨格がリチウムの伝導に大事ですよというのが、特定の材料系に限らず、大事ですよというのが、もうそれはMaterials Projectのグループが出した研究例とかですけれども、そういうような基盤、要は、材料系を横断した解析ができるようになる。それを恐らく基盤と、吉田先生はおっしゃられているのかなと思います。
【菅野主査代理】 ありがとうございます。探索のところから言うと、一番最初の段階と最後の段階で、多分、機械学習に必要なのが大変効くと思うのですけど、最初の段階というのは、もう周期表をベースにして広く探索する。窒化物も全部含めて、どういう元素の組合せで、どういうところを探せばいいかという、データを集めるというのが第一段階。中間段階があって、最後、エッジというか、産業に引き渡すときに、どこがポイントであるというところが、多分大量のデータがそこでたまってくるので、そこでまた機械学習をかけて、そのポイントを探し出すというのが大変効率的で、最初と最後の2点で重要と思っているのですが、その2つに対応するのかなと感じたもので、それでの質問です。
【藤井教授】 先生、もう一度、私、よろしいでしょうか。ありがとうございます。先生おっしゃるように、機械学習も、例えばマテリアルズ・インフォマティクスは、組成ベースで探索するときと、結晶構造を使うときという2段階があるかなと思います。もちろん予測モデルをつくったり、探索の精度は、結晶構造を使ったほうがもちろんいい。組成ベースでやっているときは予測精度も悪いですし、実際に実験をしても仕込み組成しか分からない。実際に合成した中の実組成が何なのか分からないまま探索していくという。ここは結構粗い探索をしていくときもやはりあります。それが多分、今、菅野先生がおっしゃった最初の組成ベースで考えていくときという探索と結晶構造を入れていくときという、次のフェーズに進むという話につながるかなと思います。
【菅野主査代理】 ありがとうございます。探索のところから言うと、一番最初の段階と最後の段階で、多分、機械学習が大変効くと思います。最初の段階というのは、もう周期表をベースにして広く探索する。窒化物も全部含めて、どういう元素の組合せで、どういうところを探せばいいかという、データを集めるというのが第一段階。中間段階があって、最後、産業に引き渡すときに、どこがポイントであるというところで、大量のデータがまってくるので、そこでまた機械学習をかけて、そのポイントを探し出すというのが大変効率的です。つまり、最初と最後の2点で重要と思っているのですが、その2つに対応するのかなと感じたもので、それでの質問です。
【吉田センター長】 そうですね。極論を言い過ぎたと思うのですが、でも、そういったケースが多々あってですね。そもそも、データ駆動型研究をやる先生は多分関心をお持ちだったと思うんですけど、そういったところに関心をそもそも本質的には持っていない方々が結構入ってしまっていて、だから、そういったところはやめたほうがいいんじゃないかなと思います。非常に日本が一致して、団結して、みんながデータ駆動、データ駆動とやっているんですけど、従来の材料研究をやはり守るというか、そこをやりつつ、両方やっていくべきですし、みんなが一斉にDXとかに向かうというのはあまりよくはないんじゃないかなと思います。
【菅野主査代理】 ありがとうございます。それと、データが足りないという、またなかなか厳しい御指摘ですけれども、これまで大量のデータは、津々浦々の研究機関や大学で、蓄積しているので、そのデータをすくい上げ、拾い上げるというプロセスは非常に重要です。掘り起こすというところができればいいなと思います。個人的な研究室であれば、昔のデータを全部拾い集めて、それをデータの研究の中の基にするというのは可能なので、そこから拾い上げるというのが一歩かなと思うのですが、そういうのが大きな流れとなれば、次のステップに行く道筋になるのかなと思ったりもするんですけれども 。
【吉田センター長】 そういったモチベーションを持って集めてこようと、みんなが思ってくれるといいんですよね。なかなか大変な作業だと思います。だから、そこで重要なのが、スケーリング則というか、データを集めてくれば、ちゃんと予測モデル、性能がべき乗則に従ってインプルーブしていくと。では、あと、これくらいデータをためれば、これぐらいまで行くよねという、スケーリングカーブを見ながらデータを集めていこうという、そういった意味のメッセージを込めて、今日、スケーラビリティの話をさせてもらいました。
【菅野主査代理】 ありがとうございます。
【高梨主査】 あと、誰がそういうリーダーシップを執ってやっていくか、ここにもあるんですけど、それが必要かなという感じがするんだけども、それは情報系の研究者でそういう方が出てくるのか、あるいはマテリアルの研究者か 。
【吉田センター長】 情報系というか、材料の研究者でも、やはりこういった確固たる信念とビジョンを持っているというのが重要だと思いますね。具体的なシナリオと。やはり先ほどのMaterials Projectもそうですし、あとは、トロントのアスプル・グージックとかも、やはり本質的な思考として、AIとかDXに対するネイティブですよね。だから、それを持っていて、なので、いろいろな人たちが集まってくるし、求心力になるんだと思います。そうすると情報系の研究者も集まってきやすいということだったと思います。
【高梨主査】 ありがとうございます。
どうしようかな。先にオンライン、よろしいですか。武田委員、手が挙がっていますので、どうぞ。武田委員、どうぞ。
【武田委員】 武田です。ありがとうございます。今、そもそもオープンデータが少ないという件で、オープンデータというのは、デジタル実験ではなくて、リアル実験、またはフィジカル実験のデータがそもそも少ないという理解をしています。そのときにデータ科学に期待するのは、やはりデータの拡張ですね。リアル実験データは少なくても、データ拡張してからリアルなデータと併せて機械学習に資すると、非常にコストと時間のかかる実験を最小限にすることができて、この分野は革新的になるのではないかと期待します。技術は、精度が高ければ高いほど有効性は高いと思うのですが、今、研究としてどのくらいのレベルまで来ているのか、今後、どの程度期待できるのか、モデルデータと言うようなバーチャルにデータを拡張するというのがどのくらい期待が持てるレベルになっているのかを教えていただけますか 。
【吉田センター長】 例えば先ほどのRadonPyのデータベースですね。率直に言って、まだ、いわゆる高分子の最先端の研究、例えば産業的な課題のところまでは全くリーチできていないですね。今、例えば、私たちは全原子の古典分子動力学というのを使って、いろいろな計算をしていますが、その計算の世界というのは、時間、空間のスケール的に言うと、やはり最先端の材料を考えている世界とは大分ギャップがあって、そこの部分を機械学習でできるだけ埋めようということですけど、正直なところ、そこまではまだ行けていないんですね。
ただ、リーチできているところもポツポツはあるという感じですね。行けそうなところはあるかなという感じなので、それをいかにこれから開拓していくかというか。あともう一つは、計算でできる世界をどれだけ拡張できるかということで、今、私たちのコンソーシアムの中にもどんどんいろいろな人たちが入ってきていて、計算といってもいろいろな階層の計算があるので、そういったところをフルで実装して、データをつくったときに、では、どんなことができるのかなというのを見てみたいというのが私どもの今のところで、今現時点では、できることはすごく限られていると思います。
なので、もう一つは、計算データと実験データを少しでも増やしていこうということで、その実験系の人たちとの連携をもう少し強化していくとかですね。そこの部分が必要条件かなと思っています。
【武田委員】 両輪で回していくことによって、それぞれが良くしていくことが今やれる一番の方法ということですね。
【吉田センター長】 そうですね。はい。
【武田委員】 ありがとうございます。
【高梨主査】 では、宝野委員、どうぞ。
【宝野委員】 先生、最後のページで、「情報系研究者の参入障壁」の一つとして、「キャリアパスもない」と書いていらっしゃるんですけど、これはどういうことでしょうか。
【吉田センター長】 例えば、機械学習の研究者、若い研究者、いろいろなキャリアがあるんですね。選択肢があって、昨今の大規模言語モデルとか生成AIとか、そういった華々しい世界があって、バイオとか、あとは、工学的なところへ行ったりとか、いろいろな選択肢がある中で、では、あえてこのマテリアルをやろうと思う彼らをどうやってアトラクトするか。それは一つは、何かそういったことをやると何かキャリアパスがあると。
【宝野委員】 今、採りたいと思っても採れない。それで、入ってきていただければ、当然そこからキャリアパスが生まれますし、それによりマテリアルの中で、データ駆動研究をやっていますというグループもできます。しかし、人材がもう取り合いになっていて、採りたいと思っても、ネイティブな方が採れないのが現状ですよね。
【吉田センター長】 そうですね。
【宝野委員】 ですから、キャリアパスがないとおっしゃっていることの理由。
【吉田センター長】 もう1レイヤー上で、例えばポスドクまではあるんですけど、では、パーマネントの何かポジションが大学とかには。
【宝野委員】 我々、データ駆動型研究を立ち上げるとき、本当に苦しい思いをして、データ研究者を採ると決めたんですけど、我々専門性がないですよね。ですから、面接していても、本当に外国語を聞いているような感じで、専門の先生をお呼びして、それで採っていったという経緯があるんですよ。ですから、それであれば、今、国としてマテリアルDXのプロジェクトが進んでいますので、ぜひ応募していただけるように、コミュニティーの若い方にお声がけいただければありがたいですけど。
【吉田センター長】 それはすばらしいことです。
【高梨主査】 どうもありがとうございます。
もう大分時間が来ているのですが、あと一つだけ、私、確認させていただきたいんですけど、やはりスケーリングは基本なんですよね。
【吉田センター長】 スケーリングというのが象徴しているんじゃないかなと思うんですね。
【高梨主査】 ある意味、スケーリングが利かない世界というか、そこはもう入り込めないのか 。
【吉田センター長】 だから、我々がデータベースをつくるときに、設計指針にして、どうやってデータをつくれば、この下流タスクはスケールするのか。では、スケールしないのであれば、どうやったらスケールするのかという。それは別途、どうつくるかというのを考えています。当然、どう頑張っても行けないところが残るわけなんですね。
【高梨主査】 なるほど。どうもありがとうございます。
いかがでしょう。ほかにあと。もう大分時間ではありますが、ぜひというようなことがありましたら。よろしいでしょうか。
では、どうもありがとうございます。吉田先生、御講演、どうもありがとうございました。それから、藤井先生にもまた、御意見ありがとうございました。どうも。
【藤井教授】 ありがとうございました。
【高梨主査】 それでは、これで一応、ここでの議論は終了させていただきますが、いただいた御意見を事務局で集約し、次回、推進方策の取りまとめを行うというのが一応シナリオですが、正直言って、今回は宅間さんのところまで議論が行っていなくて、吉田先生に対する御質問というか、そこら辺の意見で、どちらかというと終始したなという感じがしています。
それで、これは今度、これからアナウンスありますから、8月30日最終で、推進方策の取りまとめを行う予定ですが、事務局のほうで大分、これまでの意見を基にして整理されたものがここで出てきていますので、それで、さらに今日の御議論を基にして、皆さんに持ち帰って、よく読んでいただいて、それで気になるようなことがあれば、随時メールででも送っていただければありがたいと思うんですけど、それでよろしいですか。もう全くシナリオにないことを私、言っていますが。どうぞ。
【宅間参事官】 では、事務局から。ありがとうございます。でも、今日の御議論、一番、もう少し御意見いただきたいなと思っていたところがまさにこのデータの関係のところでございましたので、そこでお時間かけていただいて議論していただいたのはありがたかったと思います。いろいろな御意見、御発言があった中で、事務局が提示しました修文案に関しても修正するべきところなど幾つか見えてきたところがございますので、そこは修正した上で、次回の案としたいと思っておりますけれども、お時間なくて言えなかったといったところがありましたら、ぜひ会議後にメールでいただければと思いますのと、あと、この強み弱みの試案といったところも、本当に事務局で、まずできるところでざざっとつくったものでございますので、既にいただいた御意見もありますけれども、もし気づかれるところがありましたら、ぜひこちらもいただいて、併せて最終回までにこちらをブラッシュアップしたいなと思っております。
事務局から、会議終了後にメールで、いつまでにというような御案内をさせていただければと思いますので、よろしくお願いいたします。
【高梨主査】 分かりました。事務局で、推進方策の文章は今日の議論を基にしてまた少し修正される? それとも、今の段階でももちろん、いろいろ御意見あればメールで送っていただければいいんだけれど、そこら辺はちょっと整理をしてくれますか 。
【宅間参事官】 そうですね。今日、お時間なくて、純粋に言えなかったということがあれば、まずいただければ。今日、御意見の中で幾つか出てきたところは、もう修正できるつもりでいるのですが、言えていないということがあれば、言っていただければ、それは併せて作業したいなと思っております。
【高梨主査】 分かりました。今後の段取りについて、そんな感じでよろしいでしょうか。何か皆さんからございましたら。よろしいでしょうか。
それでは、どうもありがとうございました。では、推進方策に関しては、これで今日の議論は終了ということにさせていただきます。
それでは、議題、最後で、「その他」に入りますが、事務局からまたよろしくお願いいたします。
【柴田補佐】 ありがとうございます。事務局より御連絡いたします。次回のナノテクノロジー・材料科学技術委員会につきましては、令和6年8月30日、すみません。候補が2つまでは絞られているのですが、まだ最終決定しておりませんが、10時から12時、または15時から17時を予定しておりまして、こちらは早急に確定いたしまして、改めて委員の皆様には御連絡差し上げようと思いますので、よろしくお願いいたします。
また、本日の議事録につきましては、事務局にて案を作成し、委員の皆様にお諮りした上で、主査に御確認いただいた後に、ホームページにて公開いたします。
以上でございます。
【高梨主査】 どうもありがとうございます。
それでは、本日のナノテクノロジー・材料科学技術委員会、これにて閉会とさせていただきます。ちょっと時間超過してすみませんでした。どうもありがとうございました。お疲れさまでした。
―― 了 ――