資料2 これまでの議論の論点整理(素案)

1.国内外の動向

 【共通認識】
(1)スーパーコンピュータの活用が、科学技術面・経済面で国の将来に影響を及ぼすという認識が定着し、国際的にスーパーコンピュータの導入・開発がこれまで以上に積極的に進められている。

    (国際的な動き)
    ○  導入のグローバル化(2012年11月のTOP500リストでは27か国、うち1ペタFLOPS以上のマシンは7か国)
    ○  自主開発の拡大(中国ではプロセッサまで自主開発、フランスBull社はフランス原子力庁にTERA-100を納入、ロシアではT-Platforms社がモスクワ州立大学にLomonosovを納入、インドでもSAGA-220を開発、など)
    ○  米国や欧州などのエクサスケールを目指した動き(米国:政府としてDOEを中心にエクサフロップスをサポート、欧州:EESI(European Exascale Software Initiative)からEESI2への移行とFP7(The Seventh Framework Programme)によるMontBlanc、DEEP、CRESTAの三つのプロジェクト)
    ○  米国や韓国では、国家的投資によるスーパーコンピューティングの強化を図るためHPC法を制定(米国:High Performance Computing Act、韓国:National Supercomputing Promotion Act)

(2)国内においては、「京」の整備や革新的ハイパフォーマンス・コンピューティング・インフラ(HPCI)の構築が進み、また、国内の総計算資源は平成24年9月に共用を開始した「京」も含め、20ペタFLOPS超と推測されるなど、計算環境の整備が世界上位の水準に戻りつつある。

    (世界における計算資源の割合)
    ○  TOP500に対する我が国のスパコンの性能割合は、2000年代初頭には20%を越えており、2000年代半ばには6%を切るところまで低くなっていたものの、最近では15%近くまで戻ってきた

    (文部科学省関係機関の総計算資源)
    ○  国公私立大学合計 6,997テラFLOPS(平成23年5月現在、うち情報基盤センター(計6,315テラFLOPS)は平成24年10月現在)
    ○  大学共同利用機関法人、及び文部科学省関係の独法等15,179テラFLOPS(平成24年10月現在、うち「京」は11.28ペタFLOPS)

    (文部科学省以外の機関)
    ○  2012年11月のTOP500においては、上記機関の他、研究機関として 2,195テラFLOPS、民間 1,084テラFLOPS、合計3,279テラFLOPS

    (国産マシンについて)
    ○  2012年11月のTOP500においては、国内設置の23,362テラFLOPSのうち国産マシンは17,251テラFLOPS(「京」を含む)

(3)スーパーコンピュータは幅広い科学技術分野の研究発展に不可欠なものとなってきているとともに、産業界でもスーパーコンピュータの利用が普及しつつある。国内の計算資源使用量は年々増加しており、今後、その重要性はより高まっていくと考えられる。

(4)一方で、「京」及びHPCIで画期的な成果を創出し、社会に還元していくことが求められるとともに、今後の計算科学技術の推進に当たっては、幾つかの課題が明らかになっており、これらに適切に取り組んでいくことが必要となる。

    (課題の例)
    ○  消費電力等の制約条件の中で各HPCIシステムの性能向上
    ○  システムの超並列化に対応した耐故障性の向上、システムソフトウェアやアプリケーションの開発等

(5)スーパーコンピュータの技術面、利用面における新しい動きについても、適切に対応していくことが必要である。

    (技術面の動き)
    ○  コンピュータ関係企業の中心プレーヤの変化(IBM、Cray、SGIのようなシステムベンダから、Intel、NVIDIA、ARMなどのプロセッサベンダへの変化)
    ○  スピン・アウトからスピン・インへ(大型計算機の技術をコモディティに生かすスピン・アウトから、市場の大きなコモディティの技術をスパコンの技術に統合・活用するスピン・インへの流れ)
    ○  研究開発のグローバル化(欧州におけるエクサスケールに向けた国際連携。IESP(International Exa-scale Software Project)による米国、欧州、日本、中国の国際連携。システムソフトウェア等の共同開発への期待)
    ○  新しいシステム開発におけるハードウェアの研究者とアプリケーションの研究者の共同(Co-design)の重要性の高まり
    ○  国内資本による半導体製造については、最先端プロセスでの量産がほぼ不可能な状況であり、プロセスと一体となった設計能力の維持についても極めて困難になりつつある

    (利用面の動き)
    ○  大規模で多種多様なデータの効率的な処理・分析など、いわゆるビッグデータへの対応
    ○  ストレージとHPCIを組み合わせたビジネスの台頭(GoogleやAmazon、Microsoftなど)
    ○  自然科学以外の分野での利用(経済、金融などでのシミュレーションの利用)
    ○  PRACEなど、複数のスーパーコンピュータを一つの基盤として運用(欧州各国で共同利用可能なハイエンドシステム(Tier-0)の充実など)

(6)国内のスーパーコンピュータ関係企業については、エクサスケールに向けてCPUも含めた技術開発を継続する企業、高実行効率や高電力効率など使いやすさを追求する企業など、今後の展開の方向性が異なりつつあると考えられる。

2.計算科学技術の利用状況、今後の必要性

1(ローマ数字).科学技術分野における状況

※本項目は、「将来のHPCIシステムのあり方の調査研究」の結果を含めて加筆する

 【共通認識】
(1)計算科学技術は第4期科学技術基本計画における国家存立の基盤、科学技術の共通基盤として重要であり、理論、実験に次ぐ「第3の科学」、また「予測の科学」として科学技術や政策立案への貢献が期待されている。

(2)科学技術の分野では、実験だけではわからない、若しくは実験できないような部分を理論計算で補うという側面もあり、例えば極限環境の研究が可能になるなど、計算科学的な手法は不可欠なものとなっている。

    (課題の例)
    ○  物質科学、地震・津波、気象・気候、素粒子・宇宙、生命科学、医療・創薬分野におけるシミュレーションの利用
    ○  物質科学における実験の補完。新しい物質設計を目指すには、より信頼性の高い方法論で計算する必要があり、膨大な計算量が必要
    ○  地震津波被害の減災のためにはシミュレーション研究が必要不可欠であり、より精緻な計算をするためには膨大な計算量が必要
    ○  研究開発における、単一モデルによるシミュレーションサイズの拡大の方向性と、複数のモデルを用いたアンサンブル計算の二つの方向性

(3)ゲノムデータ処理に代表されるように、シミュレーションだけではなく、データ処理にスパコンが利用される側面も増えてきている。

(4)高解像度のシミュレーションを行うためには、単純に解像度をあげるだけではうまくいなかい場合もあり、モデルを新たに検討する必要もある。

    (課題の例)
    ○  パラメタリゼーションと第一原理計算のバランス、新たな物理法則のモデル化
    ○  地震シミュレーションにおける高精度な地殻情報の入手など、解像度に応じた観測データの必要性

(5)社会的ニーズに応える実際のシステムでは、長期的視点に立ったシステムの整備計画と、観測データの取得からデータ入力、プリ・ポスト処理を含めた全体のシステム構築が必要になる。

    (課題の例)
    ○  システムを更新してもすぐには性能を引き出すプログラムはできないため、長期的な視点に立ったシステム整備が必要
    ○  高精細な地震・津波シミュレーションに必要となる詳細な地形データ、建築物等のデータセットの整備が必要
    ○  地震・津波のサブリアルタイム処理や、リアルタイム観測データの入力が必要
    ○  予測結果の評価と、社会への発信方法についても検討が必要
    ○  「知のフロンティアとしての科学」と「社会への出口」は異なる視点での議論が必要

(6)スパコンを使ったことのない分野や、研究者・技術者も多いと考えられるため、そのような分野にもスパコンの利用を進め、成果を創出できるようにしていく必要がある。

    (課題の例)
    ○  利用環境の整備(簡単な手続で使えるマシンや、ジョブ待ちの少ない環境など)
    ○  サポート体制、窓口の整備など

2(ローマ数字).自然科学以外の分野における状況

 【共通認識】
(1)自然科学以外の分野においても、計算機が必要とされる場面があり、その利用が進んできている。

    (課題の例)
    ○  人間集団の科学的研究や、経済現象を研究するときにはスパコンが用いられている
    ○  インフルエンザの拡大予測や有効な介入政策立案のためには、シミュレーションが必要であり、スパコンによる計算が必要となる(パンデミックシミュレータなど)
    ○  金融市場のデータ、スーパーやコンビニの小売データなどは膨大であり、それを蓄積し解析するためには大きなリソースが必要となる

(2)社会への出口と近いものが多く、自然科学分野で求められるスペックとは異なるマシンが必要となる可能性がある。

    (課題の例)
    ○  金融市場のアプリケーションでは、ミリセカンドオーダーでの取引に対応するためのリアルタイム性と、精度のよいリスク推定などの要求から大規模計算の両面が求められる
    ○  ビッグデータである小売データの解析による需要予測シミュレーション技術が求められている。また、ブログ上のデータを用いることにより1日ごとの景気判断ができる可能性もあるが、このためには「京」を上回るスパコンが必要になると思われる

3(ローマ数字).計算科学技術の産業利用の状況

 【共通認識】
(1)産業界では、より現実に近い状態での解析やものづくりにおける製品の設計など、大規模計算へのニーズは大きいと考えられる。

(2)大規模、高度解析を活用できる企業はまだ少なく、実際のものづくりではシミュレーションが十分普及しているとはいえない。そのため、裾野の拡大を目指した産業利用の促進を図る方策を検討する必要がある。

    (課題の例)
    ○  解析技術、製品開発に結びつける知識の必要性(課題に対する適切な計算モデルの構築と解析結果の解釈、結果から得られた知見による改善や創造)
    ○  シミュレーションができる人材の育成、技術やノウハウの継承
    ○  使い勝手のよいソフトウェアの必要性

(3)産業界で常時利用するようなシステムでは、維持費、コストなどの問題により、トップマシンの100分の1から1000分の1規模のスパコンが主流となっているなど、大学・研究機関と産業界ではスパコンの在り方が異なっている。

    (課題の例)
    ○  パラメータサーベイなど(高精度で時間のかかる計算より、多くのパターンで計算したい場合がある)
    ○  大学の研究とは異なり、企業では既存の商用ソフトウェアを利用することが多いため、利用したいソフトウェアがシステムにのるかどうかが課題
    ○  長期の製品開発では共用のシステムを利用する場合もあるが、すぐに製品化に結びつくようなシミュレーションは、セキュリティ上社内のマシンで行うことになる

(4)業種によりスパコンの利用状況やスパコンに対する要求が異なるため、利用パターンに沿った議論が必要となる。

    (課題の例)
    ○  業種による違いとともに、ユーザ企業とベンダ企業でも考え方が異なる(ユーザは安くて速ければベンダにはこだわらない場合がある、また中小の企業ではハードもソフトも人材もない)
    ○  業種により、製品の企画段階から製品化までの時間が異なる(例えば材料分野や製薬などは製品化に時間を要する)
    ○  同じ企業でも、研究開発部門で必要とされる用途と、ものづくりの現場とで求めるものが異なる

3.将来の我が国における計算科学技術システムの在り方

1(ローマ数字).我が国における計算科学技術システムの総論について

 【共通認識】
(1)我が国の計算科学技術インフラについてグランドデザイン描き、その中で大学、附置研、共同利用機関及び独法の有するシステムの役割・位置付けを明確にしつつ、戦略的に整備を進めることが重要である。

(2)グランドデザインとしては、必要な予算にも留意しつつ、世界トップレベルのスパコンや、その次のレベルのスパコンを複層的に配置し、全体として世界最高水準の計算科学技術インフラを維持・強化するという考え方が重要である。

(3)トップレベルのシステムについては、基盤というよりもサイエンスやテクノロジーを切りひらく最先端の装置という位置づけもある。

(4)整備するシステムの性能を設定するに当たり、Linpackによる性能評価を完全に無視するわけにはいかないが、より重要なのは、そのシステムで何を達成するのかである。

(5)システムアーキテクチャの特徴は、市場から調達するのか、開発するのか、またどのようなサイエンスを目的にしているのかなどによって決まるものであり、一律に専用、汎用システムの良しあしを議論することは適当ではない。

 【今後の検討課題】
(1)全国共同利用をしている9大学の情報基盤センター(以下「情報基盤センター」という。)を巡る状況は設立当初と変わってきており、その役割や位置付けについては改めて検討する必要があると思われる。

    (関連する意見)
    ○  現在は、アカデミアの計算需要は情報基盤センターのみならず、附置研や共同利用機関のスパコンでも賄われており、情報基盤センターの役割は大きく変わっているのではないか
    ○  以前は情報基盤センターでプログラムの開発からシミュレーションや解析まで全てを行っていたが、今はその流れの中でどこに位置すべきかを、それぞれのセンターが検討すべき状況になっているのではないか
    ○  現状でも情報基盤センターは学内外のユーザのニーズには応えているが、ただ計算能力が不足しているということだと考える
    ○  情報基盤センターのユーザは、大規模ジョブのみならず、小規模のジョブを動かしたい人もいるので、両方をサポートする必要がある
    ○  教育や人材育成は、大学の情報基盤センターへの期待が大きい重要な役割と考える

(2)世界のスーパーコンピュータの能力に比較して、情報基盤センターの能力が相対的に低くなってきているとの指摘もあるが、これは電力や設置スペースの問題に加えて、戦略の問題でもあると考えられる。今後の我が国の計算科学技術インフラのグランドデザインについて、情報基盤センター等の関係各機関の役割も踏まえつつ、一つ一つのシステムの能力を向上させるため、複数の機関が共同でシステムの導入・運用をすることも視野に入れ、更に具体的な検討が必要と考えられる。

    (関連する意見)
    ○  現状でも情報基盤センターは、各センターが協調と競争をしながら、特徴のあるシステムを導入し、良い形になっているのではないか
    ○  昨今のHPC技術は複雑になってきており、下の世代への技術の継承という点を考えても、機関が連携して大規模なシステムを導入することは良いのではないか
    ○  今後のビッグデータの対応を考えると、システム同士をなるべく近くに設置することが重要ではないか
    ○  物理的にマシンを集約して配置していくとしても、オペレーションについては様々なユーザコミュニティの意見を反映できるような柔軟なものにするべきではないか

2(ローマ数字).リーディングマシンの定義、必要性

 【共通認識】
(1)リーディングマシンについては、以下の二つの要件を満たし、国の戦略的リーダーシップに基づき我が国の計算機科学及び計算科学全体を牽引するとともに、科学技術の新たな展開を切りひらいていくシステムとして定義される。

    (リーディングマシンの要件)
    ○  世界トップレベルの高い性能をもったシステム
    ○  最先端の技術を利用し、新たに開発されたシステム

(2)リーディングマシンは我が国の計算機科学及び計算科学を発展させ、世界における当該分野の優位性を維持し、それにより我が国の科学技術の発展や産業競争力の強化に貢献できることから、国として整備を進める必要がある。

 【今後の検討課題】
(1)リーディングマシンの範囲や性能の考え方については、以下の三つが考えられ、更に検討が必要である。

    (リーディングマシンの範囲のイメージ)
    [イメージ1]  我が国のフラッグシップとなるシステムであり、幅広い分野をカバーするマシン
    [イメージ2]  我が国のフラッグシップとなるシステムであり、幅広い分野をカバーするマシンと、それを支える特徴的なシステムを持つ複数のマシン
    [イメージ3]  各分野の課題解決に必要となる特徴的なシステムを持つ複数のマシン

(2)リーディングマシンについては、それを幅広い分野をカバーするマシンとするか、分野ごとの特徴的なマシンとするかについては更なる検討が必要である。

    (関連する意見)
    ○  開発費も巨額になり、これまでと同じように特定分野向けのスパコン開発は理解が得られにくい。多くの分野のユーザが利用可能なアーキテクチャを2台持つことが望ましい
    ○  大規模計算のニーズを満たし、効率的にリーディングマシンの役割を担うためには、汎用であることが必要である
    ○  計算資源の全体の需要としてはコモディティからの流れが大きく、ユーザがより高性能のマシンを容易に利用できるように、マシンの設置計画、開発を考える必要がある。特殊なハードウェアに特化したプログラミングでは先がない

    ○  分野により計算アルゴリズムが異なるため、一つのアーキテクチャで全てを効率的に実行することは困難であり、リーディングマシンは汎用性の高いものになるとは限らない
    ○  ソフトウェアを将来にわたって使えることは重要だが、性能を出すためにはある程度コードの変更が必要になる。コンピュータサイエンスの人がアーキテクチャ依存部分を自動的に生成できるようなコンパイラやフレームワークの開発をしていくことで、アプリケーションは高レベル記述のまま性能を出せるようにしていくことが必要ではないか

    ○  複数のリーディングマシンを開発する場合であっても、予算のかけ方についてはメリハリをつけるべきではないか
    ○  ソフトウェア開発が高度化、大規模化しているので、アプリケーションが将来にわたって使えるようにすることも、リーディングマシンの開発整備に当たり考慮する必要があるのではないか

4.計算科学技術に係る研究開発の方向性

1(ローマ数字).今後の計算科学技術の研究開発の在り方

 【共通認識】
(1)前項(3.1(ローマ数字))で示したように我が国の計算システムの整備についてはグランドデザインが必要であり、これにもとづいた長期的なロードマップを作成し、計画的に研究開発・整備を進めていく必要がある。

(2)今後の計算科学技術に係る研究開発については、ハードウェアとアプリケーションのバランスを考えて進めていくことが必要である。また、近年ニーズのあるビッグデータへの対応、リアルタイムのデータ処理も考慮に入れて研究開発を進める必要がある。

 【今後の検討課題】
(1)長期的なロードマップをどのようなものにしていくかは更に検討が必要である。

    (関連する意見)
    ○  リーディングマシンは開発フェーズの周期で考えるのではなく、科学技術分野で世界をリードしていくためにはどのくらいのタイムスパンで必要かという観点で検討すべき。開発にこだわるのではなく、開発と購入の組合せなども視野に入れて考えていくことが必要ではないか
    ○  ロードマップは研究開発の現状などを踏まえて、毎年定期的に見直していくことが必要ではないか
    ○  リーディングマシンとして大規模なものをつくっていくのか、小型のものを複数セットで作っていくのかという方向性と、どのようなタイミングで更新していくのかという議論はセットではないか
    ○  リーディングマシンの定義で世界トップレベルとしているのであるから、4年で更新していくことになるのではないか
    ○  投資の規模を小さくして3年程度のスパンで複数のシステムを開発するのか、スパンを7,8年程度と長くし、投資の規模を大きくして、一つのマシンを開発するのかという考え方もある
    ○  実際に開発・製造するのは企業であるため、実現可能性と競争力、そして企業も含めた開発体制についても提言していくことが必要ではないか

2(ローマ数字).リーディングマシンの研究開発

 【共通認識】
(1)リーディングマシンの開発については、最先端の技術開発により今後のスパコン技術をリードすることや、アプリケーション開発者と計算機開発者との密接な連携が可能となるとともに、国内産業への波及効果が期待できることなどから、国内で実施することが重要である。

(2)リーディングマシンの国内開発における投資効果については、科学的、社会的成果を第一に考えつつも、コンピュータ関連産業への波及効果についても、長期的な視点も含め考慮することが必要である。

(3)リーディングマシンのハードウェアやシステムソフトウェアについては、我が国として強みのある技術かどうか、国家安全保障上保持すべき技術かどうか、スパコン開発でキーとなる技術かどうか、民間に展開できる(ビジネスとして成り立つ)技術かどうかなどの観点から重点を置く技術を定め、戦略的に進めるべきである。

 【今後の検討課題】
(1)リーディングマシンの開発については、我が国として重点を置くべき要素技術や投資効果も踏まえ、どのように(主体、スペック、スケジュール、開発方法など)国内で開発するべきか、更に具体的な検討が必要である。

(2)リーディングマシン開発に係る投資効果については、更に具体的な検討が必要である。

(3)我が国でプロセッサの開発を行うことについては、今後さらなる検討が必要である。

    (関連する意見)
    ○  我が国は高性能プロセッサを開発できる数少ない国の一つであり、計算機産業や計算科学技術の一層の発展のためには、何らかのプロセッサ開発を継続すべきである。それにより、システムソフトウェアの開発やネットワークの開発研究も加速される
    ○  中身のわからないコンポーネントを使って大きなシステムを組むのは非常に大変であり、CPUを作れるものなら是非とも作るべきだと思う
    ○  CPUの開発はコンパイラの開発と密接につながっており、例えばCPUを買ってくるだけではコンパイラの開発にも影響がでる。今後はメニーコアになっていくが、性能を出すためにはコンパイラも一緒に開発することが必要である
    ○  長期的な観点ではCPU開発の議論も重要であるが、CPU開発にこだわるのではなく、海外の技術を日本でインテグレートして作る方法もあるのではないか。アプリケーションや運用技術といったハードウェア以外の部分にも力を入れなければならない
    ○  CPUの開発ができるならばやるべきであるが、マイクロアーキテクチャは10年くらいで世代が変わる。世界を相手にするならマイクロアーキテクチャレベルから開発しないと競争力がなく、それなりの覚悟が必要である

(4)その他の要素技術等については、システムを作る上でどのような技術がクリティカルであり、その中で我が国として重点を置くべき技術が何であり、それをどのように実現するかについて、更なる検討が必要である。

    (関連する意見)
    ○  ジョブのスケジューリング等、運用技術についても検討が必要ではないか
    ○  今後はネットワークやI/Oがボトルネックになってくるのではないか
    ○  ローカルディスク、グローバルディスク、アーカイバといった記憶階層の効率的な利用技術についても、世界をリードする技術開発が必要ではないか
    ○  システムの利用者側からみると、標準化されていることが重要であり、システムソフトウェアに投資をしていくことが必要ではないか

3(ローマ数字).アプリケーション開発の在り方について

 【共通認識】
(1)アプリケーションの開発は、ハードウェアの技術動向も踏まえ、システム整備と並行した開発が必要であり、計算機科学者とアプリケーション開発者が密にコンタクトしながら開発する体制を整え、組織的に行っていくことが重要である。

(2)ポストペタフロップス時代のプログラミングを考えると、研究者が個人で大きなアプリケーションを開発することは難しくなり、各分野の状況を踏まえつつ、各分野で共用できるような基盤的なアプリケーションソフトウェアを開発し、活用する仕組みを作るべきである。

(3)一方で、ユーザがプログラミングしやすい環境の整備も重要であり、ライブラリやミドルウェアを整備するとともに、高性能のコンパイラの開発も必要である。このことはスパコン利用の裾野の拡大や、若手研究者育成の観点からも意義がある。

(4)アプリケーションソフトウェアを開発する人材については、サイエンスとしての成果だけではなく、ソフトウェア開発に対する評価も考える必要がある。

(5)開発したアプリケーションを産業界で利用するためには、開発者の視点ではなく、ユーザのニーズを反映して開発すべきであるとともに、シーズの創出も重要であり、そのバランスが重要となる。また、ユーザから開発者にフィードバックしていく体制の整備も必要である。

(6)我が国で開発したアプリケーションについては、開発した個人に維持管理を頼るのではなく、コミュニティで維持管理していく体制を構築しつつ、国際標準を目指すことが重要である。

 【今後の検討課題】
(1)今後のアプリケーション研究開発の体制やスケジュールなどの具体的な方策については、更なる検討が必要である。

4(ローマ数字).計算科学技術に関する国際協力について

 【共通認識】
(1)今後のスパコンの開発・利用については、解決すべき多くの技術的課題があり、我が国が強い分野は自国で開発を行い、海外が強い分野は協力して開発することにより、効果的、効率的な開発ができることから、国際協力を積極的に進めていくことが重要である。

(2)このような状況の中で、システムソフトウェアについては日米の国際協力の機運が高まっており、具体化に向けて関係者の議論が進められていくことが期待される。

(3)スパコンの利用に係る国際協力についても、アプリケーションの共同開発やスパコンを利用した共同研究など、アジアの国々との連携も視野に入れて、その在り方について検討していくことが重要である。

5.利用の在り方(利用環境、産業利用促進等)

【調査・検討課題】

○スパコンの利用を促進し、成果の創出を図るために、運営や利用環境の在り方はどうあるべきか。
○自然科学以外の分野におけるスパコンの利用をどのように進めていくか。
○産業利用の促進を図るために必要なことはどのようなことか。

6.その他

【調査・検討課題】

○将来を見据え、計算科学技術に関する人材育成をどのようにしていくべきか。
○国民への広報や情報発信といったアウトリーチ活動をどのようにしていくべきか。

 

お問合せ先

研究振興局情報課計算科学技術推進室

電話番号:03-6734-4275
メールアドレス:hpci-con@mext.go.jp

(研究振興局情報課計算科学技術推進室)