参考1 アカデミッククラウドに関する検討会(第1回) 議事概要(案)

アカデミッククラウドに関する検討会(第1回) 議事概要(案)

  • 日時:平成24年4月27日(金曜日)14時30分~16時30分
  • 場所:文部科学省東館3階2特別会議室
  • 出席者:(委員)西尾主査、相原委員、北川委員、喜連川委員、五條堀委員、竹内委員、門田委員、山名委員
    (研究振興局)吉田研究振興局長、森本大臣官房審議官
    (事務局)岩本情報課長、長澤学術基盤整備室長、藤沼情報科学技術研究推進官、丸山学術基盤整備室長補佐、市瀬学術調査官
  • 欠席者:(委員)安達淳委員、安達文夫委員、美濃委員、安浦委員、山口委員(5名)

1. アカデミッククラウドに関する検討会について

藤沼推進官から資料1、2の説明があった。「アカデミッククラウドに関する検討会の議事運営等について(案)」は、原案のとおり認められた。また、委員の同意の元、主査代理は喜連川委員となった。

2. アカデミッククラウドに関する検討会に係る検討の進め方について

西尾主査から資料3の説明があった。資料4~資料6、参考資料1、2、及び机上配布資料1~3も踏まえ、以下のような意見交換があった。

(1)アカデミッククラウド環境について検討する意義

1)新たな科学技術的手法の可能性

○遺伝学、ライフサイエンスでは、データ解析技術の進歩により、大量のヒトゲノム情報や、リアルタイムなガン遺伝子発現情報が獲得できる状況となっている。単価も非常に下がっており、数万人のゲノム解析が数分でできるという時代が来ようとしている。これは、情報通信の進展の速度を超える勢い。ゲノム情報ということで地球全体を見たときに、20年、30年後のあるべき姿が見えてくる。異種間のデータベースを統合して、それによってどのように次のイノベーションに用いるかという点が重要であり、データベース連携が非常に重要。(五條堀委員)

○このビッグデータの問題は、経験科学、理論科学、計算科学に次ぐ、第4の科学的手法の確立につながっていくもの。サイエンス全体を見通してやっていかないといけない。それで、ネットワークとかデータベースは非常に重要な部分だが、そこだけに終わるとサイエンスの下支えに終わってしまう。SMASH(S:サイエンス、M:モデリング、A:アルゴリズム、S:ソフトウエア、H:ハードウエア)という言葉がよく言われるが、サイエンスと計算機の間をつないで、第4の科学的手法を確立していくには、これらを全部一体としてやっていくことが必要。今こそデータを使ってサイエンスの表に立つようなくらいの意気込みで、この問題を考えていくべき。(北川委員)

2)クラウド環境構築に係るテストベッド

○今後、知識インフラをどのように構築していくかについては、高等教育機関で構築されていくアカデミッククラウドが、1つのテストベッドとなりうる。フィージビリティースタディー的に大学において有効なシステムとして構築されていくならば、それが初等・中等教育機関も含め、国民が関わるさまざまな環境にも広まり、知識インフラの大きなコアになっていく、というシナリオが描けるのではないか。(西尾主査)  

3)その他(世界的な関心、人材育成等)

(世界的な関心)

○今ITのキーワードとしてのビッグデータが、これ以外にないぐらいの大きさである。米政府が本年3月末に新たに立ち上げたイニシアチブを読むと、これはインターネットと同じぐらいのインパクトを世の中に与えるかもしれない。つまり、いわゆるITバズワードで、ちょっとして消えていくような技術というのはITの中にはたくさんあるが、ビッグデータは、データ科学あるいは第4の科学と呼ばれているフォースパラダイムに関連すると米国が見なしているということからも、その影響領域が非常に大きい問題。(喜連川委員)

(人材育成)

○情報とライフサイエンスの両方がわかる人材の養成、あるいは境界領域として自由に立ち振る舞える人たちの養成。米国等では非常に厚みがあるために、ライフサイエンスで育った人がITに行き、ITの方がライフサイエンスに行ける状況があるが、日本は、フレキシビリティーの部分で課題がある。(五條堀委員)

(2)データベース等の連携について

1)大学間の情報ポリシーの違い

○アカデミッククラウドを構築するには、既存の学内のITシステムといかにシームレスにつなぐかが重要。現在、各大学等研究機関の情報システムのポリシーは異なるので、研究開発が必要。アカデミッククラウドを全アカデミックな知識のインフラとするならば、全国の各大学等研究機関のITシステム構築の考え方について、早い段階で方針を打ち出すことが必要。(相原委員)

2)データベース連携の必要性

○あれだけの震災が起こったときに、いかに早く復旧できるかということを考えると、基盤層はもう確実にいろいろな大学で共有化して、しかもそれをクラウド基盤、極めて安定な基盤に乗せておくということが必須。そのシステムが自分のところにあったからこそ、津波によって奪われてしまった。だから、遠隔の安定した場所に基盤層は乗せる。その上に競争領域として、ここは差別化しようというのをバーティカルに立てていくという大きなフレームワークを、一方でこの震災を機に、我々は考えを改めていくことが必要。(喜連川委員)    

3)データベース連携に係る検討の進め方

○大学等における財源等の厳しい状況の中で、大型研究等を推進しようとしたときのデータリソース、計算リソースとしてのクラウドシステムの構築を日本全体で考えたときに、大規模大学でクラウド環境を構築し、中小の大学と有効に連携して先進的な学術研究推進基盤の整備を推進することは重要である。その場合に、このような基盤整備を情報基盤センター等のレベルで推進していくものなのか、より大規模に日本全体として推進することを考えていくべきなのか。(西尾主査)

○国全体でこういうふうにするのだという一定の方針がなくては、個々の大学等が幾ら共通化しようとしても非常に厳しい。実際やろうとすると、いろいろな難しい問題でなかなかうまくいかない。これは、トップダウンで、全体としてこういう方針で行くべしという強い誘導がなければかなり厳しい。(相原委員)

○大学間のデータベース連携、例えば、大学の事務系等のデータ連携については、他に適切な会議体(大学ICT推進協議会等)で議論してはどうか。(喜連川委員)

○こういうことを進めていく上では、実はすべての要素がそろっていないとできない。先ほどのSMASHの例でいうと、それぞれの分野で当然研究開発が必要となる。しかし、他の研究開発成果を待っていると後ろ方の分野、例えばデータを使って何かをしようというアプリケーションに近い分野の研究開発はできなくなってしまう。しっかりと計画の中で考えてスケジュールしていかないといけないと思う。(山名委員)

(3)システム環境の構築

1)対象範囲

○データを競争領域と非競争領域に分けるべき。非競争領域のデータは、クラウド化することで効率化が実現できる。ただ、データ移行のための合意プロセスや、どこをターゲットポーションにするかという議論が非常に難しいので、本検討会では、オープンガバメントとしてどこまでデータを公開するか、国益に非常に関与するデータを日本外のクラウドに置くことが許容されるのか等の議論をするべき。(喜連川委員)

○大規模なデータ等を処理しようとする場合、ユーザーから見たときに、仮想的でも良いので、データ、ツールとシステム、この3つが1カ所にあるということがポイント。(山名委員)

○データサイエンスは、クラウドシステム環境がないとできないような科学領域。そういう新しいサイエンス領域が数多くある中で、第4の科学的手法をサポートする環境をいかに構築していくのかが大事。(喜連川委員)

○データ解析技術の進歩により、どのようなデータをアカデミッククラウドに保管するか、という方針が必要。つまり、アーカイブ的なデータとモニタリングデータの区別や、研究開発データとそこから発展した事業モデル、ビジネスモデルのデータの切り分けなどが必要。(五條堀委員)

2)一般のITシステムとの関係

○最初は理系分野で使われていくと思うが、最終的には文系の先生を含めて、一般の皆さんを含めて使えるシステムになることが重要。大学だけではなく、高等学校、中学校を含めて、そういったところ、あるいは一般的なところでも使える設計が必要。(山名委員)

○図書館の立場から発言すると、世界各地に散らばっていて、各大学の中でもかなり散らばっている学術情報資源を、うまく共有化していくための仕組みが必要。だれが使うことができるのか、どのような条件で使うことができるのか等をクリアにすることが必要。(竹内委員)

○高等教育機関におけるさまざまな学習の質を高めるため、教育コンテンツの共有化と、それに伴う教育の質の向上が、アカデミッククラウドの利用方法の1つ。(竹内委員)

○教育と研究は合体しながら進んでいくような状況で、アメリカのビッグデータの解析に教育が入っている。教育方針もビッグデータの解析でこれまでとは異なる指標が明確に出てきている。ポテンシャルが大きいので、視野を広めた議論をしたほうがいい。(喜連川委員)   

3)その他(安全安心、セキュリティ、コスト)

(安心安全、セキュリティ)

○ライフサイエンス分野のデータは、オープンで進めたいが、一方で相反的な、安全対策、倫理、個人情報の問題等があり、その両方をいかに同時に対応するか。(五條堀委員)

○個人情報の観点について、例えば、データがたまればたまるほど、個人が特定できてしまう場合もあり、安心して使えるための条件を研究する等が必要。また、国際戦略や、海外との関係等も含め、どういうセキュリティ方針で情報を保有すべきか等、専門的に研究開発することも必要。(相原委員)

○昨年度に発足したバイオサイエンスデータベースセンター(NBDC)において、データの標準化等の取り扱いルールや、ヒト由来データを扱うことによる倫理上の問題があるため、今年度、新たに検討会を立ち上げて議論することになっている。(門田委員)

(コスト)

○スーパーコンピュータの共用法の場合と同様、アカデミッククラウドの利用負担金をどうするかという議論もある。何より、ネット帯域が一番高価なので、様々な利用のレベルに分けて議論することが必要。(喜連川委員)

○現在の商用クラウドは、クライアント・クラウド間の通信費が高く設定されていること、また帯域が限られることから、大量のWebデータを商用のクラウドに乗せるだけで、膨大な時間とお金がかかる。現実的には、商用のクラウドに手元にあるデータを乗せて解析することは極めて困難。(山名委員)

(4)データ科学の高度化

1)データ同化

○第4の科学的手法の次、フィフスパラダイムは、異なる分野のデータを融合し、異なる分野の研究者が共同に研究し、イノベーションを起こすもの。このため、データに注目することがこの国の重要なタスク。(五條堀委員)

○最初からフィフスパラダイムに向けたクラウドを考えるべきで、つまり、学問の融合というものが、その次のイノベータのキラーであるとの認識については、多くの方が認めるところ。それは異なる学問分野のデータがシームレスに、クラウドの中に入っていて、アクセシブルな環境をつくることで、そこを大きく加速できる。(喜連川委員)

○データサイエンスは色々なデータを組み合わせて、大規模な処理をすることで知識発見をすること。解析、モデリング等の技術の高度化により、他との差別化が可能。この技術は地球環境、ライフサイエンス等、様々な分野に活用できる。つまり、シミュレーションとデータ科学のIT技術による結合であり、データ同化である。(北川委員)

2)データマイニング

○ライフサイエンス分野も同様、データ同化は非常に重要なアプローチになってお  り、大規模で、異種のデータ間を結合(大量の画像や動画とテキストを結びつける等)させて、目的の結果を導く、まさにデータマイニングの問題である。それは、実験手法の構造化を可能にし、実験手法がさらに進化したり、ある種の構造化によって検索技術も高度化する(単にタグとか連想といったものではなくなる)。(五條堀委員)         

3)可視化技術(アノテーション)

○データ同化は、可視化のための技術開発(アノテーション)にも影響を与える。例えば、ライフサイエンス分野では、ゲノムというのはだれも見た人がいないが、ATGCを3色の画素にして、60インチでやると196台つなげれば見えてくる。見えることによって、新たなことが分かる。新技術で何かを見ようとするときの可視化技術の開発にチャレンジすることは、非常に大事。(五條堀委員)

お問合せ先

研究振興局情報課

花岡、山田
電話番号:03-5253-4111(内線:4286)
メールアドレス:jyohoka@mext.go.jp