ここからサイトの主なメニューです
計算科学技術推進WG(第10回)議事録

1. 日時: 平成17年7月15日(金曜日)13時〜15時10分

2. 場所: 国立情報学研究所 学術総合センター22階2208会議室

3. 出席者
(委員)   石井委員、伊藤委員、宇佐見委員、大島委員、大野委員、奥田委員、泰地委員、中野委員、根元委員、姫野委員、松尾委員、松岡(聡):電話にて参加、松岡(浩)委員、室井委員、諸星委員、矢川主査、横川委員、渡邉委員、西尾科学官
(特別講演者)   郷 信広 様(日本原子力研究所 計算科学技術推進センター特別研究員)
(事務局)    文部科学省 研究振興局藤田審議官、情報課 松川情報課長

4. 議事  
 
(1) 21世紀のバイオサイエンスにおけるスーパーコンピュータの役割
<説明者>郷 信広様(日本原子力研究所 計算科学技術推進センター特別研究員)
(2) 計算科学技術推進ワーキンググループ第2次中間報告(案)について
(3) ペタフロップス超級スーパーコンピュータに関する平成18年度概算求について
(4) その他

5. 配付資料
資料1   計算科学技術推進ワーキンググループ(第9回)議事概要(案)
資料2   21世紀のバイオサイエンスにおけるスーパーコンピュータの役割
(郷 信広(日本原子力研究所 計算科学技術推進センター特別研究員))
資料3-1   計算科学技術推進ワーキンググループ第2次中間報告概要(案)
資料3-2   計算科学技術推進ワーキンググループ第2次中間報告(案)
資料4   ペタフロップス超級スーパーコンピュータに関する平成18年度概算求について

参考1   【スーパーコンピュータ】の推進戦略


6. 議事概要
  (1) 21世紀のバイオサイエンスにおけるスーパーコンピュータの役割について、資料2にもとづき、郷信弘様から説明を行った後、以下の質疑応答が行われた。
    (○:郷様、●:委員、△:事務局)

   
委員 創薬を実現するために、ABINITIO予測は有効ではなく、悲観的であるという話があったが、現在のコンピュータ環境ではまだまだということなのか?
郷様 ABINITIO予測はアミノ酸配列が与えられて、一定の環境にあればそれだけで構造が決まることが実験的に証明されている。その前提に基づいて配列を与えて、自由エネルギーが最小になる構造を探し出すということである。但し、考えうる構造が非常に多いので決めることが難しいのが現状である。小さなたんぱく質は計算機の能力が向上し、計算の技術も開発されてきて、この分野では岡本さんが活躍されている。アミノ酸の数で50くらいの例外的に小さいたんぱく質はようやく視野に入りつつある。創薬に重要なたんぱく質は、アミノ酸の数が200位あるものが多い。そういうのものだと、今のところ、ABINITIO予測は手が届きにくいと思う。ABINITIO予測で構造が決められる、計算化学に与えられた課題の根源的な問題を追及することは重要である。創薬にさしあたり役に立つということを考えると、先に来るのは、12ページに記載の“たんぱく質の立体構造の決定法”である相同性に基づくモデリングが解決策だと思う。

委員 岡本先生が研究されているのは最小値を探すが、本当のところはなかなかわからないということか。
郷様 自由エネルギー最小状態を実現しているということはわかるが、自由エネルギー最小の状態の数が多い。10の何乗というオーダーである。
委員 コンピュータの性能が高ければできるという問題ではないかもしれない。アルゴリズムの改良が無いと、コンピュータの性能がいくら大きくなっても収束しないということもあるのか。
郷様 今の方法のままでは、この20年の間にコンピュータが1,000倍、10,000倍速くなると思うが、これで解決するという見通しの範囲に入っていない。

委員 相同性検索の方法が手軽であるのか?
郷様 似ているものを準備しておく。そのためにたんぱく3000などの年間100億円ほどのプロジェクトがある。答えに近いもののリストを作っておき、問題が出てきたら答えをデータベースから探すことである。

委員 ワイド情報型に必要な計算能力はどの程度必要なのか。
郷様 ワイド情報型は情報処理の方法が多種多様である。現状で一番重いのは、マルチプロアライメントするということである。原研の計算機でもヘビーなものは数日かかる。ひとつひとつが分のオーダでできれば、いろいろな問題が軽くなり、創薬など現実の課題に近くなる。ワイド情報型にもディープなものがある。スパコンよりはグリッドコンピューティングや多種多様なものを扱うネットワーキングが重要である。

委員 汎用機的なものが望ましいとの意見であるが、半専用型は?
郷様 計算のヘビーな部分もあるので、その部分を専用型にすることはアイデアのひとつであると思う。但し、マルチプルアライメントも計算機的に重い部分なのでそこを速く計算をする技術を研究されている人も多い。その結果、新しい考えがどんどん提案されていて、最前線は結構早く変わっている。一般機はムーアの法則で進歩し、新しいアルゴリズムを取り入れられれば、そちらの方が賢いのではないかと思う。但し、専用機に意欲的に取組む試みひとつひとつは重要である。今までも一般機でよかったので、多種多様なものに対応した一般機が良くなるという状況はこれからも続くのではないかと思う。

委員 薬を作るなら、たんぱく質から細胞、臓器へのフィードバックが必要があるがその見通しはいかがか。
郷様 薬は、細胞膜に働くことも多少有るが、殆どの場合はたんぱく質に相互作用して働く。標的たんぱく質を決めて、結合をさしあたりの評価にして最適化を進めていくが、口から飲んだものが標的な細胞までうまくいくとか、すぐに代謝されてしまわないとか、毒性とか、思いもよらない副作用があるとかトータルなことを実施しないといけないので、ここから先も実はかなり大変なことである。ここまででもお金と時間が掛かることである。ここから先は、今のところ、計算科学的なアプローチの見通しがあるとは思えないが、ここまでも計算科学的なアプローチが適用されることは大事なことである。関連産業は非常に大きな分野であり、バイオサイエンスにとって計算機科学にとっても相互に関わりある重要な問題である。

  (2) 計算科学技術推進ワーキンググループ第2次中間報告(案)について、資料3−1、資料3−2にもとづき、 事務局から説明を行った後、以下の質疑応答が行われた。(●:委員、○:主査、△:事務局)

   
委員 3−3の表の宇宙プラズマ・核融合プラズマだが、マルチスケール・マルチフィジックスの実例として出した。核融合に関して、松岡委員の例があるので、全面的に削除しても良いと思う。例としては良いとは思う。
事務局 削除する。
委員 航空・宇宙の宇宙環境変動予測の具体的成果ところで、“・・・で”以降の記述がないので、個別の資料のところに、“宇宙天気予報では・・・”とあるのでこの記述をいれたらどうか。
事務局 了解。
委員 7ページなど、誤植が何箇所かあるので、後ほど事務局にコメントする。
事務局 了解。
委員 5ページにスーパ-コンピュータシステムのポンチ絵がある。前回に議論があったのかもしれないが、大規模処理計算機部と逐次処理計算機部との仕分けに違和感があるのではないか。
事務局 大規模なデータ処理に適した計算機部ということで、たとえば従来のベクトル処理計算機がある。逐次処理してスカラ型計算機が一例としてある。特定処理計算加速部は専用マシンや準汎用処理として含まれるカテゴリとして考えていただきたい。
委員 地球シミュレータの、100倍の精度とか10,000倍の精度とか記載があるが、どのくらい確信をもたれているか。問題サイズがその規模だというのであれば意味がわかるが如何か。
事務局 ペタ超級ではここまで行かないのではないかということか。
委員 見積の根拠があればもちろんよいのだが。
委員 それぞれの項目で少し違いは有ると思うが、かなりの部分は解像度を精度と単に言葉だけ置き換えられたのではないかと思う。解像度も工業製品で、ものづくりをあらわす場合は、形状の解像度は形状の精度をあらわすことなので、問題無いのではないか。物理現象で1,000倍、10,000倍の精度ということは基準があいまいなので、纏める際に気をつけないといけないのではないか。
主査 精度の意味に関して、記述に工夫をして欲しい。
委員 “従来の何倍“という表現は、比較している現状のコンピュータが何であるか、留意点として記載すべきである。
委員 複数アーキテクチャシステムの連携であるが、10〜13ページまでの図では私の連携のイメージは記載を見ているとどちらかが動くイメージにしか見えない。アルゴリズム的には仕方がないのかもしれないが、同時に連携して動くイメージが重要ではないかと思うが如何か。オーロラ発光のアプリケーションのようなイメージが必要である。スループットを求めるのか、ひとつのアプリケーションを速く実行させるのかの選択で連携を持つようなアプリケーションを探したほうが良いのではないか。
委員 オーロラ発光に関しては、現実に動いている連結階層シミュレーションの第一号として提案した。これ以外に検討しているアプリケーションとして、大気の大循環や局所的な雨の問題、エンジンのピストンの燃焼と撹拌、構造の大きなレベルから原子・結晶レベルの破壊の問題などもある。
主査 3つの異なるアーキテクチャのマシンがどのように連結して、ひとつの問題を解くためには、シリーズ的な使い方では面白くない。本質的にアーキテクチャ間のネットワークを強化する必要も無い。そのためには渡邉委員がおっしゃっている、同時にやりとりして解かなくてはいけないアプリケーションを強調することが必要である。別の反応が同時に起こるようなエンジン中の燃焼のように、違う方程式が別のコンピュータで解かれるのがもっとも最適で、同時進行する必要がある問題などを加える必要があるなど、検討中や進行中の研究でも入れたほうが良いのではないか。
事務局 是非、そのような提案をよろしくお願いしたい。
委員 創薬と銀河の部分の提案を行ったが、この際に煩雑に見えないように工夫して記載した。実際に同時実行できるが速度はたかだか倍である。本質的には2種類のマシンを利用することであり、わかりやすさを優先して、シーケンシャルな処理例で記載した。
委員 私も同じである。複数のアプリケーションが組合せて動くことが重要であると考え提案した。事務局からはプログラム的に具体的な提案をしてほしいとのリクエストであったので、プログラムからみて、シーケンシャルに記載してしまった。並列動作するという注意書きを記載すればよいのではないか。
主査 そのことが重要である。現象的にも、一般的にもわかりやすくすることも重要である。高速ネットワークの必要性も記載されているがアプリケーションから見た必要性が根拠として必要である。
委員 実効性能、通信性能の表があるが、実効性能にはCPUの演算速度だけでなく、通信の効果も含まれていると思う。ある計算結果をある計算時間以内に入手したいときには、この程度の実効性能が必要との理由は良くわかる。それに対して、もしも、あらかじめ計算機が決まっていれば、ノード数やノードのメモリサイズや通信性能がわかっていると、ある並列化率で計算するためには、通信するデータ量から、必要な通信性能が導き出せるはずである。実効性能と通信性能の前提があるなら、マシンのアーキテクチャが決まってしまうのではないか。通信性能の見積根拠の記載が必要である。各問題には各々固有の通信データサイズがあり、システムのアーキテクチャつまりノード数やメモリサイズが決まっていれば、ある並列化率を仮定すると、必要な通信性能が決まってくるはずである。実効性能が何テラFLOPS必要で、前提として、ある仕様の計算機があれば、そのためにはこの程度の通信性能が必要である、というならわかる。先に実効性能と通信性能の前提があり、それぞれ解きたい問題が決まっているのであれば、必要な計算機の仕様が明確になるが、23〜24ページの絵と齟齬が出てくるのではないか。必要な通信性能を見積もりしている根拠が良くわからない。どうしてわかるのか。
事務局 委員にデータの提示をお願いした際に委員からは、アプリケーション側から見ると通信性能が見積もりにくいとのコメントがあったが目安でもよいのでお願いさせて頂いた。今後の検討のある程度の目安として活用していきたい。
委員 計算機が出来たときに、ユーザ側から見ると計算と通信のバランスが良いのが速い計算機であると思う。必要な実効性能の見積もりは簡単である。そのうえで、ノード構成、メモリ量などの仕様がわかれば、それぞれの通信量はユーザがわかるので、必要な通信性能がわかってくるはずである。メモリの転送性能の必要性があるのならこのアプローチは理解できる。
主査 オーダー的な値だと思う。
委員 見積時に理論的にせまる方法もある。表ノードの演算性能が出ていなくて、通信性能だけが記載しているとバランスしない。ノードの演算性能に対してノードの通信性能が出ていることが自然である。多くの人は今使っている計算機をベースにその何倍程度であり、計算機の仕様の根拠は演算性能とメモリである。
委員 航空・宇宙で50ギガバイト毎秒と提示したが、今使用している計算機をベースに見積もってみた。アプリケーション・計算機の両方の側面で必要な性能があると思うが、アプリケーションとして必要な性能は、計算機の能力より低いだろうと思う。計算機としてのバランスを考慮したときに50ギガバイト毎秒と提示した。
委員 原子力としては100ペタFLOPS欲しいが、2010年を想定した調査依頼であったので、1ペタFLOPSくらいの計算機しか出来ていないのではないかと理解し、とりあえず必要データを記載した。たとえば参考資料化などに変更しては如何か。
主査 事務局で対応を工夫して欲しい。
事務局 了解である。
委員 前回、今回の計算機群の絵を見て思ったが、今までのベクトル向け、スカラ向けに書かれてきたアプリケーション側を、いろいろなアプリケーションに役立つような高速スパコン構築のためにあわせていくほうがよいのではないか。本末転倒であり、シミュレーションの本質からするとどうか等のことはあるが、むしろ、大規模処理向けや逐次処理向けのコードに分けて、それがなるべく同時並行的に実行できるようにアプリケーション側を再構築し、計算機アーキテクチャ間の連携のみならず産官学の連携ができるように、むしろ変えていく方がよいのではないか。もう一度、今までのことを踏まえて、それぞれの分野でも何か出来るかを検討しては如何か。もちろん私のグループでも検討させて欲しい。
主査 確かにアプリケーション側はシステム構成のイメージが出る前に提示されている。
委員 システムイメージが出てくるまでは、今までの研究を前提に委員からの提示があったと思うが、他の分野でも複数のアーキテクチャを有効利用する枠組みでアプリケーションの検討が必要ではないか。
主査 それは大事なことであり、前回に初めてシステム構成のイメージが出てきたので、次回までにアプリケーション側の方々に記述を工夫して欲しい。1〜2回やり取りしたほうが良い。
委員 3項まではキラーアプリを細かく分けて、必要なハードウェアを議論するなど、先端計算機を検討する上ではこの方向は非常に良くわかる。4項では、オペレーティングシステム(OS)、データベース(DB)、超高速ネットワークなどが重要であるということは入れて頂いてあるが、本日の郷先生のワイド型はディープ型計算機と同様に重要であると考えるが、ハードウェアの観点ではワイド型は軽く見られがちで、ディープ型だけが取り上げられがちである。今後、産業界では自動車や原子力の丸ごと設計など1個で膨大な計算が必要なこともあるが、いろいろなパターンが必要であり、ワイド型も重要である。そのため、4項のところも内容的に膨らませる必要があると思うが如何か。
主査 重要なご意見である。事務局はどう考えているか。
事務局 おっしゃるとおりである。非計算や検索なども重要性を認識している。具体的な実現方法などを委員から是非、提案をお願いしたい。
委員 トランザクション処理性能のトレンドは10年間で1,000倍になっているが、ハードディスクの性能トレンドであるディスクドライブのアクセス性能は10年間でたった2.6倍程度である。演算処理の速い計算機を作ってもデータベースなどでは、まだ解決しない問題はたくさんある。たとえばクエリなど問合せプランを利用した先読み技術を使い、のキャッシュのヒット率を上げて、最大6倍くらいの性能向上するという報告がそろそろ出かけてきている。そのようなことをきっちりやらないと応用分野では、高速な演算パワーを活かしきれないのではないか。
主査 大事なポイントである。報告書に記載の工夫をしてほしい。
事務局 了解。
委員 39ページ評価のところであるが、地球シミュレータ構築時を考えると、納品やその確認で精一杯であり、本当にこれだけのベンチマークを平成22年度末まで同時に完了が出来るのかが非常に心配である。研究開発段階が平成22年度末なので、評価は平成23年度の入っても良いのではないか。平成22年度までに評価を行うことを強調して記載しないといけない理由はなにか。
主査 事務局からコメント願う。
事務局 大変であることは想像できるが、国の研究開発大綱にも記載の通り、評価は一定の間隔で実施しなくてはいけない。
委員 充分やれるのではよいが、心配である。
委員 そのようなことを考えないと評価を誤るかもしれない。
主査 委員の意見は理解した。国の指針もあると思うので事務局で検討して欲しい。
事務局 了解。なお、発行日は、次回の情報科学技術委員会(8月)である。何か意見があればメールして欲しい。
委員 先端計算科学技術センター(仮称)の中身はこれから議論されると思うが、この組織を研究組織にするのか単なるサービス組織なのかが重要である。技術センターというのは、外部の利用者のためだけに働くイメージがある。その組織が研究しなければ、継続した次のスパコン開発につながらないので、センター名は慎重になって欲しい。組織を議論するときに、研究、運用、教育を謳われているので、その点も、今後、慎重に検討して頂きたい。
主査 ”研究”という言葉も検討して欲しい。先端計算科学技術研究センターなどである。
事務局 了解。
委員 計算科学だけでもだめなので、計算機分野と計算科学分野がうまく融合できるようなイメージが必要である。
主査 良い名前を委員の方らも提案願う。

  (3) ペタフロップス超級スーパーコンピュータに関する平成18年度概算求について、資料4に関して、説明を行った後、以下の質疑応答が行われた。(●:委員、○:主査、■:郷様、△:事務局)

   
委員 8ページに組織細胞と超音波医療、組織構造などのシミュレーションはベクトル機で10ペタFLOPSあれば本当に可能なのか?
郷様 推進していらっしゃる方がいると思うので、うまく答えられない。
委員 化学反応ネットワークで見る場合は飽和度の計算はそれほど大変なことではないのではないかと思う。組織をどのレベルで考えるかは有るが、細胞内を100かける100かける100で区切り、反応まで含めた偏微分方程式を解く。ネックなのはモデリングであり、実験を含めての問題があるが、それほど大変ではない。
郷様 今、ご質問が循環器、骨格モデルに関することだと思い回答を遠慮したが、化学プロセスに関してはイメージがある。細胞の中を区切り、そこで起こる化学反応をシミュレーションなら現実的であるという意見だが、細胞の中は、たんぱく質分子がぎっしりと詰まっている。普通の化学反応は試験管の中に反応する分子が薄くあり、たまにぶつかり反応する。細胞の中は違う環境にある。そうすると濃度の効果やエントロピーは違う環境にあるとか、デフュージョンがどうなるのか、非常に薄い化学反応とはまるで違うかもしれない。これは今まで殆ど研究されていない分野である。非常に非線形な偏微分方程式の解は非常の厄介なことが起こる。現象も非常に短いフェムト秒、ピコ秒で起こることから、秒やキロ秒で起こることが分布する。数学の式の性質としても非常にたちが悪い。何がエッセンスであるのかも実験的にきちんと捕らえて、計算できる部分を計算する。細胞を下から捕らえる観点で重要な段階である。何でも計算で出来るのは不遜であり、生物は非常に複雑にできていて、ゲノムがわかるから全部何でも計算できると思うほどにいっていない。まだまだ、実験で押さえないといけないところは多々あると認識している。
委員 この数字の提案は、方法論を議論しないいけないことはたくさんあるが、数字を言わないと見積もれないこともあるので、ある仮定でこのくらいの範囲ではやれることもあるのではないかと考えた。途方にくれる部分はミクロな部分から細胞組織の変化に至る部分は難しいし、細胞レベルの難しいことを全身レベルでは計算機でも普通のやり方ではできないと思う。それぞれのレベルでは非常に複雑なことであっても、このくらいのオーダーでやれれば、全身をある程度体系的に扱えるのではないかと考えた。
主査 次回(8月10日)までに事務局で整理した改訂版をメールして欲しい。
事務局 了解。

以上


(研究振興局情報課)

ページの先頭へ   文部科学省ホームページのトップへ