今後のHPCI計画推進のあり方に関する検討ワーキンググループ(第7回) 議事録

1.日時

平成24年10月10日(水曜日)17時~19時

2.場所

文部科学省 16階 16F特別会議室

3.出席者

委員

小柳主査、秋山委員、石川委員、宇川委員、加藤委員、金田委員、小林委員、関口(智)委員、善甫委員、高田委員、富田委員、中島委員、平尾委員、牧野委員、松尾委員、村上委員、室井委員、渡邉委員
(HPCI計画推進委員会)土居主査

文部科学省

下間情報課長、林計算科学技術推進室長、村松計算科学技術推進室長補佐

4.議事録

(1)今後の調査・検討課題について

林計算科学技術推進室長より、資料1に基づき説明。質疑応答は以下のとおり。

【宇川委員】  共同利用機関、附置研に関しても同じようなことができると思うがどうか。

【林計算科学技術推進室長】  附置研と共同利用機関でデータをとっているかによると思うが、確認してみたいと思う。

【加藤委員】  このデータから、提供資源はあればあるだけ使うということは明らかだが、もともとの目的であった本当に必要な資源を割り出すことは難しい。今後コンピュータがどのくらいコストダウンし、コストパフォーマンスが上がるかという議論になると思う。

【小柳主査】  この資料では計算時間は出てくるが、それがどのくらい有効に利用されたかというメジャーはない。これは計りようがないものだが、この手の議論の弱いところになる。

【石川委員】  基盤センター側から見ると、スパコンに関してトータルの費用は固定、あるいは1%から2%の削減の中で運用してきている。したがって、この図はTOP500と同じように、単に普通にマシンが速くなっているのを反映しているのとかわらない。現状のまま進めば、予算や電気代の影響で下がる可能性はあるが、そのようなプロジェクションができるというものでしかなく、基盤センターで提供できるのはこの程度にしかならないということになる。
 逆にユーザから見たときには、あればあるだけ使っており、実は足りていないという話があるはずであり、このグラフが一人歩きしてしまうと、何もしなくてもこのくらいの資源量になっていくという話になってしまう可能性がある。昨年度まとめたように、アプリ側からこれだけのサイエンスをやるためにはこれだけ必要であり、これでも足りないということをきちんと議論して欲しいと思う。

【中島委員】  仮に10年前にこのグラフをかいていると、とてつもない数のコアが現在の日本全国のスパコンセンターに入るという状況において、こんなもの使い切れるかという議論が起こったに違いない。グラフからもわかるように、実際にはこれを使っている。スパコンのユーザの絶対数は極端に増えているわけではなくて、例えばマシンの性能が100倍になったからユーザが100倍になって100倍のプログラムが実行されるようになったわけではない。1人当たりの所要計算量が増えている。
 あればあるだけ使うという言い方をすると、計算時間の積分で埋まるという話に聞こえるが、そうではなく、日本の計算科学屋さんが頑張って何千や何万並列に対応して使っているという証拠である。

【小柳主査】  渡邉さんに聞きたいが、地球シミュレータの場合にはベクトル化率や並列化率を測定して評価をしているが、その点から見て今の議論はどう考えるか。

【渡邉委員】  地球シミュレータの場合は使い方が大分異なり、地球科学以外の分野もある程度あるものの、利用のほとんどは地球科学になっている。中島先生がおっしゃったように、ユーザ数がそれほど増えていないのは確かである。特に気象、気候ではアンサンブルをできる限りとりたいという希望があり、それこそ使えるならいくらでも使いたいというのが地球科学の分野だと思う。

【牧野委員】  石川さんから、アプリケーションのグループでちゃんと数字を出してほしいという話があったが、以前アプリケーション部会で議論したことと同じであり、結局はあるだけ使えるということになる。そのため、アプリケーション側で青天井な計算機資源がある前提で話をしても意味がなく、どれくらい提供できそうかという話と一緒に議論するべきだと思う。

【富田委員】  アプリケーションの方では去年からの流れでエクサくらいを想定し、その中で何ができるかということを議論してきた。それと同時に、アプリケーション側から提供してほしいという話は、サイエンスロードマップの中でどういうことをやりたいかということと大きくかかわるので、計算量の見積もりはアプリケーションの中でやるつもりである。ただし、産業界なども含め、いわゆるエンドユーザのところまでの見積もりはアプリケーションの中ではできない。

【石川委員】  FSの結果が出てくるのは来年度いっぱいまでかかるので、それと平行してアプリ側からある程度インプットしていかないと議論が変な方向に行ってしまうと思う。3月にまとめた報告書は非常によくできているが、その中身を読んでみると、1エクサがあったときに、それをアンサンブル的に同時に実行して、例えば3日で意味のある結果が出るからそういったマシンが必要というような予測をしている。このようなユースケースは重要で、それを集めていけば、おのずとフラグシップマシンでどういうアプリを動かすか、あるいは、基盤センター群のマシンでどんなアプリケーションを動かすかというような話につながっていくと思う。ただ単に1エクサあったらこういうことができますではなく、もっとユースケース的に、そのアプリケーションが何日間それを占有することによって結果が出るというところまで踏み込んでやって欲しいと思う。彼らが要求するマシンが、どのように構成されるべきかを考えていこうと思っている。

【平尾委員】  本当の意味のグランドチャレンジを模索するときには、シミュレーションをやっている人たちだけで閉じるのではなく、もう少し広く、実験の人も含めた意見交換をやらないと狭いものになってしまうと思う。
 産業利用については、これから大いに「京」を使って成果を出していただきたいと思っている。これまでの数値風洞、CP-PACS、地球シミュレータは特定の分野でスパコンを開発してきたが、「京」は汎用的な、どの分野でも使えるマシンになっている。スパコンは相当なお金がかかるので、ある特定の分野だけではなかなか難しく、汎用的なものをやるということで理解を得てきた。また同じようにやるときには、アカデミアからの要求はもちろん、産業界からも強い要求があって、そういうマシンが必要だという声が出てこないとだめだと思う。そのためには「京」で成果を上げることが必要であり、産業界からも大きな声を上げていただきたいと思う。

【小柳主査】  まだいろいろ議論もあると思うが、この議論を将来に生かしていくこととして、資料2の議論に移りたいと思う。前回の議論に基づいて資料を修正、追加しているので、これについて林室長から説明をお願いします。

林計算科学技術推進室長より、資料2に基づき項目3を説明。質疑応答は以下のとおり。

【中島委員】  情報基盤センターを巡る状況は設立当初から変わってきているとなっているが、これは1960年代、70年代の話を設立当初という意味で書いていると理解をすればよろしいか。ここ20年くらいは状況は全く変わっておらず、ワークステーションが世の中に出てきてからは、この状況で推移している。つまり最近10年、20年ではなく、大計センターに行かないとコンピュータがないような時代。

【小柳主査】  だと私は理解している。つまり、本当に唯一の計算資源だった時代から、今とは位置付けが違っていると思う。

【宇川委員】  以前から言っていることだが、スパコンは基盤という言われ方がされるが、一方で重層的な整備というのも大事であるとしている。中間から下にあるようないわゆる基盤的なものと、トップにあるものがあり、トップにあるものは基盤というよりは、サイエンスやテクノロジーの最先端を切り開く大型装置という言い方のほうがふさわしいと思う。このことは前の資料には入っていたが、今回は抜け落ちてしまっている。

【小柳主査】  基盤というときに、計算資源の階層構造の下の方という意味で書いているつもりはなく、むしろ科学研究全体の基盤、方法論的な意味での基盤と考えている。その点で誤解を招くようならば表現を考えたいと思う。

【宇川委員】  むしろ(1)のもう一段詳しい議論なのかもしれないが、リーディングマシンの必要性について考えるときに、やはり大型の装置という見方も大事だと思う。ほかのところは大体私が思っていることでもあり、色々なところ議論してきたことでもあるので、特に異論はない。

【秋山委員】  宇川先生に賛成で、日本語でなくて恐縮ですが、全体については計算科学技術のインフラストラクチャーといった言葉にまとめて、基盤、先端という言葉はもう少し大事に使ったほうがよいと思う。

【小柳主査】  インフラストラクチャーの翻訳で基盤と言っているつもりだが、確かにニュアンスが違うかもしれない。

【小林委員】  「大半の計算需要は情報基盤センターではないところ」という記述について、この表現だと基盤センターが使われてないように理解されてしまう。先ほどの需要グラフではきっちり使われているので、少し表現が変なのではないか。依然としてニーズはたくさんあり、いろいろ役割があると思う。

【小柳主査】  確かにおっしゃるとおりだと思う。極端な話、例えばワープロのようなものも含めて計算時間で大半という意味だと、資源量としてある程度大きなものになってしまうと思う。

【小林委員】  (4)の相対的に低くなっているというところの議論も、制約条件として電力、設置スペースに加えて、先ほど石川先生がおっしゃっていた予算削減の影響が非常に大きく、設備を維持する上で戦略が立てにくくなっていることも事実だと思う。

【中島委員】  本当に大半の計算需要は基盤センター外で賄われているのかということに疑問を持った。京大は学生も入れて3万5,000人くらい人がいて、一人1台PCがあるとすると3万5,000台になる。これだけあれば大半の計算需要はそこで賄われていると思うかもしれないが、それらのPCの稼働率は10%を切ると思う。しかも計算はしてない。そうすると、少なくともフローティングポイントオペレーションは、基盤センター外で大半が賄われていない可能性があると思う。

【牧野委員】  前回この辺のことを申し上げたのは私ですが、これは一般の人が持っているようなパソコンという意味ではなく、附置研、国研等のスパコンの割合が近年大きくなっているのではないかという文脈で言ったものです。これが大規模計算をしているユーザの感覚ではないかと思う。

【小林委員】  もしこういうのを出すなら、定量的に出さないと誤解を生むような状況になると思う。

【秋山委員】  少し語弊があるかもしれないが、私の所属している大学では中央の装置を使うように言っているにもかかわらず、情報系も機械系も独自の計算機室がありPCクラスタが入っている。集約したほうがいいという動きは強いが、中央で把握してないPCクラスタの数はものすごくあると思う。

【中島委員】  少なくとも附置研、基盤センター以外の組織でTOP500に出てくるのは、国内に10くらいある。逆に言うと10くらいしかない。

【加藤委員】  そのデータは以前文部科学省で調査しているので、そのデータで議論したほうがいいと思う。

【林計算科学技術推進室長】  第3回のワーキンググループの資料で出しています。

【秋山委員】  数字で議論することに反対はしないが、私が申し上げたようなマシンはTOP500には出てこない、研究室レベルのサーバです。水かけ論になってしまうかもしれないが、現場の感覚は違うと思う。

【加藤委員】  現場の感覚というと、我々の感覚はどちらもある。我々のところは40とか60テラくらいは持っているが、それでも1万コアくらいをやろうとすると基盤センター、10万コアをやろうとすると「京」というように階層的に使っている。私も計算の大半が基盤センター以外というのはちょっと違和感がある。
 別の議論として、リーディングマシンの必要性は重要な論点だと思うが、ここではグランドデザインが重要で、大学や附置研などのシステムをどうするかということと、予算も考えて階層的に配置して強化するとしている。私は前回参加してないが、もっと根本的な必要性に関しての議論はなかったのか。こういう理由で、我が国はリーディングマシンを持ったり、研究開発する必要があるというような議論をここでやるのではなかったのか。

【林計算科学技術推進室長】  実際のところ、あまりそのような議論はされておらず、また牧野先生から、リーディングマシンは研究開発で議論した方がいいのではないか、との意見があったことから、項目4で議論するようにしている。

【小柳主査】  この「大半の」のところは文意を明らかにすることと、もし必要ならば、もう少し定量的な議論をすべきだと思う。また、何の単位で大半なのか、ユーザの数なんていったら、また全然違ってくる。

【石川委員】  大半なのかどうかは、分野によっても違ってくると思う。牧野先生の分野では大半はそうなんだろうというような気がしないでもない。天文台の人たちも、うちのマシンを使っているかといったら、使っていなかったりする。

【宇川委員】  戦略分野で言うと、分野2、分野3、分野5はそれぞれの研究所なり共同利用機関があって、そこに大きなマシンがあり、かつ、大型の課題申請を受け付けているという面はあると思う。その分、基盤センターでの大型の利用は少ないかもしれない。一方で、分野1は身近なマシンでやっているという要素が多いのかもしれない。あるいは逆に、大きなマシンが分野1にはまだないのではないか。

【秋山委員】  医科研や遺伝研など、幾つかのみです。

【小柳主査】  大きいといっても、どのレベルで大きいかを議論しないといけない。

【宇川委員】  定量的にやったほうがいいとは思うが、昔基盤センターにしかなかったころと、その後、各分野の研究所なり共同機関に入ってきた状況とは大分違っているのは事実だと思う。

【平尾委員】  以前、文部科学省が調べたと思うが。

【林計算科学技術推進室長】  そのデータでは、おそらく基盤センターを足した資源量に比べ附置研の資源量の合計は低く、基盤センターの使っている量の方が多いと思う。

【中島委員】  だとすると、ここに書いてあるのが間違いということになる。

【林計算科学技術推進室長】  何人かの研究者の方々から、そのような意見もあるわけなので、そこはまた違った見方をしないと出てこないのではないかと思う。もともと丸のところは、こういう意見があったという趣旨で書いてある部分ですが、書き方を少しマイルドにするのは可能だとは思うので、意見をおっしゃった先生とも相談をして変更したい。

【小柳主査】  情報基盤センターの役割が昔の大型計算機センター時代から変わっていることは事実で、それは多分合意できると思うが、もう少し精密な議論と状況分析が必要ということかと思う。

【牧野委員】  若干細かい話だが、2005年以降ぐらいから、この9大学+地球シミュレータの計算資源量合計の大半がTSUBAMEであり、どう比較するかも気をつけないといけない。この数字を見ればわかるが、相当期間、大半が1台の計算機だというふうになっているので、その資源量と先ほどのユーザの実態に若干乖離があるのはやむを得ないと思う。2010年以降はほとんどTSUBAME2.0になる。

【小柳主査】  2005年で増えているのは、ここから地球シミュレータが加わっているのだと思う。

【渡邉委員】  地球シミュレータが加わったのは2002年ですが、2005年以前はグラフしかなく、数値が残っていないのでデータを提供できなかった。ただ、実際はこの2005年とか2006年と同じような動きをしている。

【中島委員】  2005年の角はTSUBAMEで、2008年の角がT2K、2011年の角がTSUBAME2.0、今年とると「京」はともかくとして、東大やほかの新しいマシンが入ってくる。

【加藤委員】  今の議論ですが、「京」や100テラクラスのマシンは結構たくさんあるので、大半という言い方ではなく、リソースの提供のされ方が多様化していることは確かで、その中で基盤センターがどういうミッションを負うべきかを言えばいいと思う。

【宇川委員】  中島さんがそうおっしゃるのは、T2Kなどで戦略的にかなりの資源のマシンを入れてきて、なおかつ、それでユーザのニーズに応えてきたというところがあると思う。そういうことをやってきた人の観点からすると、大半が基盤センター以外で行われているというのは違和感があるのではないか。

【小柳主査】  東工大も、以前みんなのスパコンと言っていたのは、ある程度資源の集約化を図ろうというのがセンターの方針になっていたと思う。

【秋山委員】  1,000コア以下ぐらいのクラスタは至るところにある。これはどこの大学でも理系では同じではないか。大半という言葉は変えてもらいたいが、実際問題、上にも下にも広がっているということは、ここで書いていただきたいと思う。

【金田委員】  9ページに人材育成や教育の話があるが、ここも「でしかできないことであり」という表現になっている。これは確かに基盤センターの重要なミッションだが、平尾先生が言われたように、将来のサイエンスを考えたときには、計算科学だけではなく色々な分野の人が議論しないと、なかなか先が見えないというところがある。「でしかできなことであり」という表現は変えたほうがいいのではないか。

【小柳主査】  これは、附置研や独法のスパコンと比べて、むしろセンターの方の役割だろうという意味で書いているが、表現は少し問題だと思う。

【平尾委員】  ここは私がこれに近い発言をしたのかもしれない。大学の情報基盤センターでしかできないというのは、むしろ、大学の情報基盤センターにもっと大きな期待をかけて、ここが重要なミッションだということを際立たせたいという表現になっている。

【金田委員】  重要なミッションだということはよくわかっているが、排他的に感じてしまう。

【関口(智)委員】  いわゆる研究者人材や教育者人材は確かに教育機関で実施されるのが適切だと思うが、それ以外の、例えばスパコンの利用者や支援者といった人材は必ずしも大学の基盤センターに限った話ではない。教育のタイミングについても新卒や大学院卒だけではなく、社会人再教育といった様々な機会、様々な場所で行われるべきであるということを、もう少し前に出したほうがいいと思う。まさにこのHPCIは、そういった裾野を広げていくことであり、人材育成を教育機関に限定するのは論点としておかしいと思う。

【小柳主査】  この意味はむしろ大学情報基盤センターに期待するところが大きいということを言いたかったので、表現を少し変えたいと思う。

【富田委員】  全く違う点で、「整備するシステムの性能を設定するにあたり、Linpackによる性能評価を完全に無視するわけにもいかないが、より重要なのは、そのシステムで何を達成するのかということではないか」という部分について、それでは、そのシステムの性能を設定するに当たり、何を用いるのかという議論はどうなるのか。

【小柳主査】  まさにそれを議論していかなければならないが、Linpackの議論が頻繁に出てきたのでこのような書き方になったと思う。目標という以上は何らかの基準もなければならない。

【富田委員】  基準がそのシステムで何を達成するかということであれば、サイエンス、あるいは社会的課題として何をやりたいかということを念頭に置くというような意味合いになるのか、それとも、システムのしっかりした性能を評価する何らかの指標を設けるべきだという意味か。

【林計算科学技術推進室長】  どちらかというと前者の意味で書いている。

【渡邉委員】  これはリーディングマシンとは何か、というところから来ていると思う。つまり、計算機科学のためのリーディングマシンではなく、計算科学から見たリーディングマシンでなければならないということを言っており、新たなベンチマークをつくるとか、そういう話ではないはずである。

【小柳主査】  もちろん、そういう意味ではない。

【牧野委員】  リーディングマシンの開発の在り方をどう考えるかという話であり、それは項目4のところの話だと思う。この2つはもちろんカップルしていて、3.のところでリーディングマシンの必要性があり、4.で研究開発となっている。

【宇川委員】  リーディングマシンの必要性についてどう考えるかは3.にあるが、そこには全然書かれていないので、改めて議論した上で、3.に入るべきものはそこに書くようにしないといけないと思う。必要性と開発の在り方は少し違う視点ではないか。

【小柳主査】  リーディングマシンの必要性は今まで色々な議論が出てきたので、ここにポイントを立てる必要があると思う。

【渡邉委員】  (4)の最後にある「戦略の問題でもあるのではないか」はどういう意味か。

【林計算科学技術推進室長】  これは議論の中で松岡先生が言われたことだが、理解としては、電力や設置の問題だけではなく、何をどのように入れていくかといった戦略が弱いのではないかという趣旨だと思っている。

【加藤委員】  簡単に言うと、もっとお金をまとめて大きいマシンを入れるべきだったということなのか。

【小柳主査】  要するに、この前半にあるように、世界のスーパーコンピュータの能力に比較して、大学情報基盤センターのスーパーコンピュータの能力が相対的に低くなってきているということを、戦略の問題と言っていると思う。

【土居計画推進委員会主査】  国としてなのか、各センターのことなのか。

【小柳主査】  各センターのことだと思う。ただ、我々としてはもちろん国のレベルで考えなければならない。

【牧野委員】  TOP500の1位から500位まで全て同じだが、大体10年間で3桁上がってきている。しかし、先ほどのスライド13のグラフだと10年間で3桁上がっていない。このような意味で、日本の9大学プラス地球シミュレータの国際的な位置は明らかにこの10年間で低下しているということになると思う。

【小柳主査】  3桁というのはちょっと言い過ぎで、2.6桁とか、そのくらいではないか。

【中島委員】  ほぼ3桁だと思う。10年で半分は行ってないとしても、1.5分の1くらいになっていることは事実だと思う。要するに電気の問題などがあって、TOP500が1.9倍くらい伸びていて、TOP500の総和も大体1.9倍くらい伸びているが、電力効率がそんなに伸びずに1.6くらいしかないという事情で乖離曲線が出ている。大学のセンターはそれの間を頑張って走っているんだと思う。

【平尾委員】  戦略もあったのではないか。今の予算の中でやるとか、あるいは、7大学プラス2のセンターのままで行こうとすると、どうしても制限はあるわけで、1.9倍ぐらいのスピードでずっと発展させるのは難しい。そこに戦略的な要素を加味いくと、もう少し違う形がとれたのかもしれない。

【宇川委員】  それに関してはTOP500的な意味では定量的にできる。つまり過去20年間にわたって、各基盤センターのマシンが何位だったかということをプロットすればよく、多分見たことのある方もいると思うが、全体が上がっているときにはこうで、もちろん、地球シミュレータや「京」が立つが、それはその1台のマシンだけで、全体的にはこうなってしまっているというのはグラフで見える。

【牧野委員】  T2Kが始まって、それ以前に比べて改善されたのは間違いない。

【平尾委員】  それを戦略的と言っているわけでしょう。

【宇川委員】  松岡さんもそういうことを知っていて、東工大としてどうするかということをやられたと思う。

【中島委員】  T2Kは戦略的にやったが、T2KでTOP500との乖離曲線が一瞬は縮まっているが、トレンドとしては縮まっていない。うちに富士通のベクトルマシンがあって、東大に日立のベクトルマシンがあったときの方がずっと近くなっているという事実もある。

【土居計画推進委員会主査】  この基盤センターの戦略は、基盤センターが全体としてどうするかということを議論する場があって、その配分をどうするかということをやっているのか、あるいは、各大学が勝手にやっているのか。文部科学省から予算の総枠が決めているかどうかということもかかわってくると思うが。

【中島委員】  基盤センターの予算は、基盤センターで責任持っていいスパコンを入れるということでやっている。文部科学省から全体としてどうするかという話はない。

【土居計画推進委員会主査】  この戦略というのがよくわかっていない。

【中島委員】  それは各基盤センターがコストパフォーマンスや電力パフォーマンスといった世の中の技術トレンドなどを考え、いいものを入れていこうということを、しっかりしたポリシーに基づいて調達しているのか、ということを言っていると思う。

【平尾委員】  今回つくったHPCIは、日本全体の計算機資源をもっと有効に使おうということであり、その中のかなり大きな要素は情報基盤センターのスパコンになる。当然、これまでそれぞれの法人が独立でやっていたやり方ではなく、日本全体でどうあるべきかを議論し、その配置もやらないといけないと思っている。

【土居計画推進委員会主査】  そのとおりだと思う。今までのやり方を確認させていただいたのはそういうところであり、それをガラガラポンできるものなのかどうかを次に聞きたい。

【石川委員】  7センターは基本的に分散システムなので、1対1の話でも大変なのに、それが7組織も入るとまとめるのは厳しいものがある。中島先生も言ったとおり、T2Kはボトムアップ的にうまくいったケースである。それぞれのセンターが抱えている色々な状況があるので、トップダウンは難しく、基本にはボトムアップ的にやらないと厳しいと思う。T2Kの次に関しても、それなりに戦略的に考えてやってきているが、これもボトムアップ的であって、そういったアクティビティがうまく広がっていけばいいと思っている。

【小柳主査】  それでは、関連が深いと思うので、今回議論する項目に入りたいと思う。

 林計算科学技術推進室長より、資料2に基づき項目4の説明。質疑応答は以下のとおり。

【小柳主査】  項目4も大きな項目なので、今日一日で議論しきれない部分は次回も含めて議論を進めていきたい。

【加藤委員】  リーディングマシンについて、「京」は一応汎用ということで引っ張ってきたが、今後は分野ごとにかなり性能をチューニングしないと使えないということになる。そうすると、リーディングマシンが一体何かといったときに、ある分野を引っ張るリーディングマシン、別な分野を引っ張るリーディングマシンという形になっていくと思う。その前提で議論するのか、それとも、大きなオールマイティ的なマシンがあって、それが全体を引っ張るといった方向なのか、例えば5年後を想定してその辺の認識をまず共有してはどうか。

【石川委員】  先ほど基盤センターや附置研など、色々なところでマシンが提供されてという話があったが、多くのところはコモディティベースのPCクラスタを使っている。リーディングマシンの一つの考え方として、確かにあるアプリケーションに特化したものもあり得ると思うが、一方で、全体の需要としてはコモディティからの流れが大きく、その中で先を行くマシンを考えなければならない。要するに、ユーザが上にあがっていけるパスができるように、マシンの設置計画、開発も考えなければいけないと思う。

【秋山委員】  私もコモディティということは避けられないと思っている。後の議論で、民間に展開できる技術かどうかという項目があるが、アカデミアでも民間でも、そこにしかないマシンでやったものが他に展開できるかということを考えると、リーディングマシンの中の、我々がもし10予算を持っていたら7から8くらいは、コモディティ系のマシンに集中されるのではないかと思う。残りの予算、といってもこれも巨大だが、それで特殊なマシンを日本の技術でつくってもいいと思う。

 リーディングマシンという言葉は大事な言葉なので、少し小さなものまでリーディングマシンと呼ぶことが国民に理解を得やすいのかどうかは、もう少し議論をしたほうがいいのではないか。専用アーキテクチャの開発もやってもいいと思うが、そこまで含めてリーディングと言うのかどうかを迷っている。

【加藤委員】  私の発言があまり正確に伝わらなかったようですが、一つのスペックで全部をカバーして、それがトップエンドでリーディングという世界はもうないのではないかということである。特定のアプリや特定の分野をカバーするのではなく、それぞれの分野群で適したマシンを考えていくような時代になると思う。

【小柳主査】  コモディティというのは既にある既存の商品という意味なのか、それとも、一般にも展開できるようなものを開発するということなのか。

【秋山委員】  後者です。どこかから買ってきてすぐというものはリーディングにはなり得ないと思っている。

【平尾委員】  リーディングマシンを開発する意味が議論になったが、科学的な課題、あるいは社会的な課題を解決するということは、皆さんが思っていることだと思う。同時に、我が国の計算機科学あるいは計算科学の発展を目指すこと、あるいは、これまで日本が蓄積してきた技術、知識を継続していくことが重要であり、そこまで考えると、汎用的というか、「京」に類するようなマシンを開発することが必要になると思う。加藤さんが言われるように、もう少しそれを幅広く考えて、ある特定の分野にもいいマシンにする。

【加藤委員】  それは少し次元が違う議論だと思う。私の考えだと「京」も汎用だが、ある一つの分野をカバーするリーディングマシンであり、それ以外にもう少し違うところに特化したようなリーディングマシンもあって、そういうものが何個かあるような世界をイメージしている。

【渡邉委員】  加藤さんのおっしゃることには大賛成で、地球科学ではバイト/フロップがどれだけあるかが致命的になっている。「京」では気候・気象の人や地震の人が苦労しているが、それは変数があまりにも多くキャッシュに乗らないからである。ですから、必ずしも一つのスペックではなく、バイト/フロップを上げたマシン、あるいは「京」のようなマシン、これはどちらも将来的なコモディティの要素になっていくと思う。

【中島委員】  汎用性の議論をするときに忘れてはいけないのは、ソフトウエアをつくる人がたくさんいなければどうしようもないということである。例えば、MPIがあと何年生き残るかわからないが、このマシンでは動きません、というマシンをつくってもどうしようもない。また、MPIをスタックの底から全部つくらないといけないマシンというのも、多分メンテナンスができなくなる。ソフトウエアをつくる人がたくさん加われる、あるいは、ある部分はダウンロードして動くようなものが必要で、そうなるとx86みたいな話になってしまう部分はあるが、それは考えておかないといけない。

【石川委員】  例えばバイト/フロップが高いとか、ハードウエア的にあるアプリケーションに特化しているマシンが必要ならそれでもいいが、アプリケーションの人から見ると、自分のソフトウエアをその特殊なハードウエアに特化した形でプログラミングし始めた途端、その先がなくなっていく。そのときはそれでいいかもしれないが、その次の世代のアーキテクチャではそのためにまたチューニングをしなければいけなくなってしまう。そうではなく、次のリーディングマシンを考えるときには、アプリケーションから見たときにちゃんと先が続くようなもので、かつ、国際協力のなかでも標準化されていくことが必要だと思う。ソフトウエアがそこでしか動かないことが一番悪いと思うので、リーディングマシンを考えるときには、単にアーキテクチャの話だけではなく、システムソフトウエアやコンパイラ、言語処理系、通信、ライブラリなどを含めて考えなければいけないと思う。

【平尾委員】  国際協力については、「京」が世界的に注目を浴びているということもあると思うが、色々なところから協力や連携の依頼がある。主にアプリケーションのソフトウエア開発で、一緒にやりませんかという声が強く出ている。そのときに、そのアプリケーションが色々なマシンの上に乗らないといけないということが、これから先重要な観点になってくると思う。

【小柳主査】  乗るというときに、動くことを保証されているというレベルから、高い性能が出る状態まで簡単に持っていけるというのでは、かなり差がある。

【平尾委員】  あまり大きな手直しをしなくてもちゃんと動くということだと思う。

【牧野委員】  ソフトウエアが将来にわたって使えるかどうかは重要なことだが、「京」の場合は今までのPCクラスタとかなり違ったタイプのチューニングがコアレベルで必要になる。それは必ずしも将来に有効なものではないのではないかと思う。そこの考え方は、コンピュータサイエンスの人がちゃんと性能が出るようなコードを書く方に力をいれることが現実的だと思う。例えばインテルのチップにしても、メニーコアが出てきたときにはプログラムが走るというレベルでは走っても、大幅に変更しないと性能は出ない。これはどうしてもある話なので、互換性に重きを置いたつもりになっていても、実際はそうはなってないということを考える必要があると思う。

【中島委員】  多分それは誤解で、SIMD幅やキャッシュ容量といったものは、ある程度ジェネラルな話である。「京」じゃないと通用しないというのは、ものすごく細かいところでチューニングパラメータをどうするかという話は当然あるかもしれない。それは確かに大変なことだが、コンパイラやライブラリといった部分で頑張るべきだと思う。ただし、コンパイラやライブラリで頑張る人は世の中に何億人もいるわけではないので、同じ共通理解の上でみんなが努力できるものでなければいけないと思う。

【村上委員】  今日の議論の中で、リーディングマシンの必要性と開発の在り方は切り離して考える必要があると思う。必要性があるといったときには、そのコストをどうするかという話が出てくると思う。例えば、我が国の基盤センターや附置研のスパコン予算が仮に200億円だとしたときに、そのうちの何%をリーディングマシンに費やすべきか。まずその考え方をしっかりさせる必要がある。仮に、100億円をリーディングマシンに費やすとした場合に、その開発コストをどう見るか。毎年100億円で5年とすると500億円になるが、その500億円でできるようなものは一体どんなものなのか。それは調達できるものなのか、「京」のように何らかの開発費が必要になるのか、そこでも考え方が大きく変わってくると思う。
 リーディングマシンの定義で違うものをイメージしていると議論が発散してしまう。例えば、タイム・トゥー・ソリューションを今の10%に持ってくるということであれば、それぞれのコミュニティにおいて、1か月を1週間なり、1週間を1日にするというところで応えられるようなマシンを考えていく必要があると思うし、そうではなく、単に色々なコミュニティに対して大きな問題が解けるようなものを用意しておけばいいということであれば、「京」の延長線上をリーディングマシンだと定義して、どのようにやるかということになる。リーディングマシンの定義については時間がかかって大変かもしれないが、それがないと開発をどう進めるかも議論できない。それが必要ということになって初めて、スパコン関係の国家予算として何%くらいをそれに費やしていくのかという議論ができると思う。

【金田委員】  リーディングマシンの定義については、多分皆さんのイメージがそれぞれ違っていて、個人的には、どちらかというと加藤先生や渡邉委員の意見に近いと思う。ただ、それは今ここで結論が出るような話ではないので、少し時間をかけないとなかなか共通認識にはならいと思う。
 もう一つ別な観点で、今やっているFSとこの議論との関係はどうなるのか。

【小柳主査】  FSはあくまで技術的な課題の探求で、リーディングマシンの在り方は政策的なものなので少し異なる。

【林計算科学技術推進室長】  ある意味ではリンクする部分もあるが、FSは必ずしもリーディングマシンのアーキテクチャを決めるためにやっているわけではなく、あくまでも将来のHPCIシステムを考えたときに、システムの技術動向がどうなっていて、アプリケーション側からの要望にどうつながっていくか、そのような技術的なサーベイをして知見を持っていないと、政策判断できないだろうということでやっている。最終的な議論の結果によっては、リーディングマシンのパターンが見えてくるかもしれないが、それは今後の議論次第ということになる。

【金田委員】  つまり、結論を出すという意味ではなくて、調査をして情報収集するというのが今のFSなわけですね。

【加藤委員】  リーディングマシンの定義については、我が国の計算科学技術、特にトップエンドの計算科学技術を飛躍的に発展させるために必要なものということは、皆さん同意すると思うが、その具体的な中身について共通の認識を持って、その上で必要性を明確にし、開発の在り方を議論しないと収束しないと思う。

【土居計画推進委員会主査】  私の理解では、加藤さんと石川さんとは対立した意見ではなく、平尾先生の意見も対立しているものではないと思う。

【小柳主査】  さきほど、交差、直交していると言ったのはそういう意味になる。

【土居計画推進委員会主査】  最終的には予算とのかかわり合いがあって制約条件が出てくるが、何がどうあるべきかという議論を先にやっていただくのがいいのではないか。

【石川委員】  若干誤解があるかもしれないが、リーディングマシン、イコール、コモディティベースでなければいけないと言っているわけではない。ユーザは明らかにコモディティベースでやっている人たちがいて、その人たちがリーディングマシンに上がっていくときに、そのパスができないようなものをつくってはいけないという趣旨で言っている。アーキテクチャ自体がコモディティである必然性はなく、どんなマシンでもいいが、システムソフトウエアやプログラミングのところで、その後もそのソフトウエアを保持して改良していけるようなパスをつくらなければいけないということである。

 少なくとも10年、15年のレンジでいえば、アーキテクチャのバラエティは想像できる範囲であり、若干のパラメータが違ってきたり、メモリ階層が変わってくるような話だと思う。そのときに、ユーザのプログラムを大きく改変しなくても、もしくは1回改変する必要はあるかもしれないが、その後はそれをベースに改変していけるようにしなければいけない。更に、それが国際協力としてできるような仕組みもつくっておく必要があると思う。

【小柳主査】  メニーコアまで入れても、そういう議論は成り立つのか。

【石川委員】  はい。もちろん。

【中島委員】  成り立たなかったら、メニーコアは売れなくなる。

【石川委員】  ただし、考えなければならないパラメータはたくさんある。ノード内でもメモリ階層、キャッシュサイズ、メモリバンド幅など色々なものがあり、コンパイラ側で全てを吸収できるわけではないので、プログラミングの方でやらなければならない部分もある。そこを独自仕様でやってしまうと、ぼろぼろになってしまう。

【秋山委員】  CPUの議論が重要だということは理解しているが、プライオリティがあると思う。語弊があったら申しわけないが、例えば、我が国が戦闘機を持つのに自国で開発したものを持つのが理想でも、それができるまで持たなくていいのかというぐらいに、このスパコンの議論はせっぱ詰まっていると思う。CPUを国産化するのは長期目標でやっていいと思うが、それにこだわっている余裕はないのではないか。長期的な議論はしてもいいが、予算を考えたときに、今戦えるだけのスパコンが手に入るのかということの方がプライオリティは高いと思う。

 予算に余裕があればバイト/フロップの高いマシンや、ほかのアクセラレータ技術なども、これからこの場で議論されていくことだと思っているが、そのときに、マシンをどこに置くかという話ともリンクして話さないと、全く将来像が違ってくると思う。

【小柳主査】  どこにというのはどういう意味か。

【秋山委員】  例えば東西2か所か3か所くらいの大きなセンターに集約するという話と、今までその研究をやってきた研究所などに分散していくということでは大分、人材養成その他で違った結論になると思う。各コミュニティが使うマシンと言ったときに、予算が田分けになってしまうことを心配しており、個人的には集約したほうがいいと思っている。また、どこに置くのかまで考えて議論ないといけないと思う。

【小柳主査】  どこにというよりも、集約の程度というような段階で考えてもいいのではないか。

【秋山委員】  例えば東西に2つセンターがあって、そこにベクトルマシンもアクセラレータマシンも置いてあり、色々な人がそれをつないで動くかどうかを研究しているというようなイメージならいいが、全く別々のところで全く別々の人たちが管理しているということになると、予算が田分けになる可能性もあると思う。

【高田委員】  研究開発の方向性を考えていく上で、社会に対してどのような成果、インパクトを出していくか、国民の皆さんにどう納得してもらうかが大事だと思う。成果の創出については、5.の利用の在り方のところにしか出てこないが、先ほどのリーディングマシンの話にもあったように、新しい科学技術の分野を切り開いていくとか、企業の競争力をアップするということはもちろんだが、具体的なイメージとしてどのような成果を出していくかもあわせて議論しないといけないと思う。リーディングマシンを使って、すごく大きな成果を出す人が日本に10人いればいいという考え方もあるが、私のように会社にいる人間から見ると、日本の製造業が、1社ずつは社会全体の中で小さな貢献かもしれないが、そこで働く人や開発される製品が社会に出回ってくると考えると、そういうインパクトも社会全体で積算された結果としてはとても大きなものになるだろう。これらはそれぞれ価値基準の物差しが違うと思うが、両方大事なので、評価という意味でも価値を多様化して見ていかなければならないと思う。
 場所の話についても、東日本大震災に対してこのプロジェクトが短期的にどう貢献できるかという社会全体としての観点も必要だと思う。もちろん今後の震災を防いでいくという中長期の貢献もあるが、復興していく上でこのスパコンのプロジェクトが何らかの形で貢献していくという現実的な話を進めると、そのような立地の問題も含めて考えていくことになる。あまり広げると収束しなくなるが、成果や社会的なことも頭に置きながら話していく必要があると思う。

【牧野委員】  秋山さんの発言の真意を確認したいのですが、要するに、日本独自で汎用的なCPUをつくっている場合ではないということか。

【秋山委員】  先ほどは飛行機に例えたが、ものすごく厳しい競争なので、ちょっと後押ししてできるのならそうすべきだと思うが、少し苦しい状況ではないかと認識している。そこにこだわり過ぎると、我々が持つべき装備のバランスが悪くなるのではないかということです。

【平尾委員】  CPUをつくることは多分周回遅れになるかもしれないが、設計技術という意味では違うと思う。

【秋山委員】  我が国のメーカーに色々なものを設計してもらう機会が少しでも増えた方がいいとは思っている。今回は富士通がやってくれたが、それと同じようなことで次もうまくいくのかどうかというのがあり、個人的にはこだわる必要はないと思っている。

【小柳主査】  外国でつくったもので、内部情報があまり開示されていないもので戦うことが適切かどうかという疑問が出てくると思う。この点についてどうか。

【秋山委員】  例えが貧弱だったかもしれないが、やはりソフトウエアや利用技術のところにものすごく時間がかかる。アカデミアだけでなく、産業界にも使いこなしてもらうことを考えると、とにかく今日本がかけられる予算は苦しい状況なので、CPUの国産化にあまりこだわり過ぎると、戦術、戦略のレベルでいろいろ間違いが起きるのではないかということだと思う。
 特に私はアプリケーション側の人間なので、たくさんの人に覚えて使ってもらうのはすごく時間がかかるので、今は借り物でもいいから、とにかく次のリーディングマシンをつくるべきだと思っている。ただし、買ってきて済ませるとは思っておらず、あまりいいアイデアはないが、例えば、東京工業大のマシンは国産メーカーと様々な海外メーカーがあわさり、教員も知恵を出して設計している。何もしないということは我が国においてあり得ないと思うが、CPUの国産化ということにこだわり過ぎないほうがいいのではないかというのが先ほどの趣旨です。

【小柳主査】  例えば共同研究や共同開発といったやり方もある。

【宇川委員】  つくれるものなら是非ともつくらないといけないというのが私の立場です。単純に、CPUをつくらない計算機づくりはどういう位置付けにしたらいいのかということもあるが、実際のシステム開発でも、中身がわからないコンポーネントを使って大きなシステムを組むのは非常に大変なことだと思う。実際の開発で不具合が出ても、中身がわからなければトライアル・アンド・エラーでやるしかなく、リーディングシステムと呼べるようなものがほんとに満足のいく形で技術開発できるかというと、難しい面があると思う。
 これはリーディングシステムのイメージにも関係してくると思うが、私のイメージは、浮動小数点演算に関して非常に大規模な計算科学の課題を解くことができるもの、という定義にするとすれば、やはりCPUの開発ができなければいけないと思う。実際のところ、予算面や日本のメーカーの体力面でそれができるかということもあるかと思うが、少なくとも国内の複数のメーカーで、CPUも含めて開発をしていこうというところはあると思っていて、そのような状況のもとで、CPUはやりませんということを国の方針として出すのは、メーカーに対しても非常にネガティブなメッセージになるのではないかと思う。

【小柳主査】  4.の項目については、次のアプリケーション開発、国際協力の問題とあわせて、次回も引き続き議論したいと思いますので、よろしくお願いいたします。

(2)その他

 林計算科学技術推進室長より、資料3及び参考資料2、参考資料3に基づき説明。質疑応答は以下のとおり。

【石川委員】  資料3の調査項目について、例えば職員数は単に数ではなく、ここで知りたいのはスパコン部門のことだと思う。そこをわかるように聞かないと全部の数が入ってきてしまう。教員数も人が減らされている中で、色々なプロジェクトをとってきたり、努力してやっているところがあるので、それが見えるようにして欲しい。それから、そのセンターがどういうことをやっているのかを入れないと、人数だけでは何を調べたいのかがわからなくなると思う。

【中島委員】  学術機関課からは拠点の調査が毎年来ていて、おなじようなことが書いてあったりするので、それも活用したほうがいい。

【石川委員】  調査についてはなるべく同じ形式で、定例的にできるようにしてもらうと、お互いにやりやすいと思う。

【林計算科学技術推進室長】  資料の下の部分は定例的に調査している項目で、これに加えて、前回の議論を踏まえた調査を追加的に行ってはどうかということです。

 村松計算科学技術推進室長補佐より、次回の日程(10月31日水曜日、15時から17時)を報告。

小柳主査より閉会発言

 

お問合せ先

研究振興局情報課計算科学技術推進室

電話番号:03-6734-4275
メールアドレス:hpci-con@mext.go.jp

(研究振興局情報課計算科学技術推進室)