参考1 アカデミッククラウドに関する検討会(第2回)議事概要

  • 日時:平成24年6月4日(月曜日)15時00分~17時00分
  • 場所:文部科学省東館3階1特別会議室
  • 出席者:(委員)西尾主査、安達淳委員、相原委員、北川委員、喜連川委員、竹内委員、門田委員、美濃委員、安浦委員、山口委員、山名委員
    (研究振興局)吉田研究振興局長、森本大臣官房審議官
    (事務局)下間情報課長、長澤学術基盤整備室長、藤沼情報科学技術研究推進官、丸山学術基盤整備室長補佐、市瀬学術調査官
  • 欠席者:(委員)安達文夫委員、五條堀委員(2名)

1. アカデミッククラウドに関する検討の方向性について

 藤沼推進官から、資料1に基づき、本検討会の当面の進め方について説明があり、了承された。その後、第1回に欠席だった委員から、アカデミッククラウド環境について検討する意義等について、以下のような意見等があった。

(安達(淳)委員)

○国立情報学研究所では、SINETをデータセンターに接続して、大学がさまざまなアプリケーションや計算リソースを商用のクラウドサービスで利用するときに、大学とデータセンターをつなぎ、大学が利用できるようにしている。一方、NIIが大学に対して提供しているクラウドサービスで、共用リポジトリのJAIRO Cloudは、大学図書館の機関リポジトリ構築のためのものである。

○3月29日に発表された米国のビッグデータイニシアチブのポイントは、大量データの核となる技術を向上させることで、安全保障、教育の改革、人材養成もうたわれている。NSFは、データサイエンティスト育成のための大学院コースや、機械学習、クラウドコンピューティング、クラウドソーシングを今後の強力な技術課題としている。

(美濃委員)

○研究環境としては、スパコンを中心としたHPCIインフラ等のクラウド環境ができつつあり、今後プラットフォームやサービスに発展できるかがポイント。

○米国では、学生がどんな勉強をし、どこでどんなレポートを出し、どんな成績を得て、どんなことを考えているかという、学生の生活、学習記録をデータベース化し、全部残そうという話がある。

○個々の大学が独自にクラウドシステムを構築すると、日本全体として無駄な投資になるので、共通部分と競争部分を切り分け、共通部分は大きな単位でサービスを提供することが必要。

○業務環境は、学内に目的別のシステムが乱立しており、大学内でもデータが統一的に見えないのが現状。効率化して、学生のデータを含む大学全体のデータを統合管理することが必要。ただし、技術以外の色々な壁があるのも事実。

(安浦委員)

○九州大学は、伊都新キャンパスを新しい社会システムの実験場にするという取り組みを続けている。3万人を超える人たちの様々なデータを集められる立場。経験として、ビッグデータを活用して新しい社会の構築するときは、社会科学との連携が極めて重要。

○ビッグデータの収集については、その収集されるデータの安定性、精度等の技術的問題に加え、各利用者からデータを取得することについて、どのように了解を得るのかが問題。

○ビッグデータの蓄積、保存については、データベースの安定性、安全性、異種データの連携は技術的に重要。ただし、想定されていなかった複数のデータが結びつけられることにより、本人すら気がつかなかった情報が出てしまうという問題がある。

○科学的には、データの再現性をどのように保証するか、という検討課題がある。

○ビッグデータは、研究、教育だけでなく、社会問題解決に広く利用していくべきだが、どこまで許すかという問題にすぐつながる。

(山口委員)

○アカデミッククラウド環境の普及・活用法を初期段階から議論することが必要。 

○国際的なマーケットでの人材獲得競争に対応するため、日本としての情報提供源を構築することが必要。

○情報の共有は、講義の質向上や大学内の違う分野・専攻の教員たちの連携等の効果がある。

○学内のスパコンの普及に当たっては、ユーザーフレンドリーであること、異なる分野でもスパコンが活用できること等を通して浸透させた。

○社会と連携した情報提供ツール、場としてのアカデミッククラウドは大きな意義がある。

2. アカデミッククラウドに関する具体的検討について

 藤沼推進官から、資料3に基づき、概算要求に向けて検討すべき具体的検討事項について説明を行い、これに基づき 1)アカデミッククラウドに関する環境構築に関するシステム研究・実現可能性検証研究、2)知識インフラ・ビッグデータに関する研究開発について、以下のような意見があった。

(1) 1)、2)に共通的な意見

(国として検討する必要性)

○第4期科学技術基本計画との整合性や、国際的な研究開発投資が進む中での日本の戦略は、1)、2)のどちらにもかかってくる。日本の国として、文科省として、やるべき事項をまずは整理する必要がある。(山口委員)

○大学の学生のポートフォリオのような情報を扱ったらどうかというような話、教育とかの高度化。学生にしても、研究者にしても、流動性が活性化にも繋がるということが真であるとするならば、それは国全体で考える必要がある。(相原委員)

(人材育成)

○データが身近にある環境にあってこそ、バイオインフォマティシャン等のデータを扱える人材が育つ。(門田委員)

○オン・ザ・ジョブトレーニングのような形で、実際のデータをさわって研究開発する中で人材を育てていくような、高度なレベルの技術者が求められており、複数の専門性を持つことも求められている。そのような人材を育てられる環境を意識的につくっていくプロジェクトが今後必要。(安達(淳)委員) 

(2) 1)アカデミッククラウドに関する環境構築に関するシステム研究・実現可能性検証研究

(データベース連携に係る検討の進め方)

○国の大きなプロジェクトをはじめとして、最終的に得られた成果に関する大量データを広く有効に使っていただくために、JSTがそのようなデータに関する新たなサービスを展開していくというシナリオもある。(西尾主査)

○各大学で開発したデータベースは実際の研究に密接に関連したところでなければできないわけで、それを物理的に統合するのではなく、1つポータル的なものを構築して、そこに入れば統合的な検索ができたり、あるいはデータベースを横断したような分析ができるという形ではやってきたので、1つのモデルケースにはなっている。(北川委員) 

○教育のプロパーな部分をバーティカルに切って、真剣にやる。今の研究環境をどういうふうにITで変えられるか。(喜連川委員)

○大学ICT推進協議会が中心的なプレーヤーになってやるという絵は描きやすい。協議会は、現在49校の国公私立の主な大学が参画。その中で大学における新しいクラウドのあり方を考え、突破すべき社会的な制約というものも同時に考えながら、スタートスモールで進めてはどうか。(安浦委員)

○教育の内容に踏み込むよりも、教育のデータをビッグデータとして集め、それをどう処理しようかというときに、研究開発と一体となった話が必要なので、そこで教育関係の先生方とコラボレーションする必要がある。(美濃委員)

○データにフォーカスして議論を進めないと、権利やプライバシーといった議論に集中してしまう。どこから着手するかが極めて重要であり、比較的進めやすい問題から始めるべき。(安達(淳)委員) 

(3) 2)知識インフラ・ビッグデータに関する研究開発

(検討する意義)

○文部科学省として今後の情報技術の高度化を考えたときに、ビッグデータの課題は、最終的な出口として産業界への応用は意識しつつ、日本として情報通信分野で世界のリーダーシップをとっていくぐらいの意気込みで研究を推進していく価値がある。(西尾主査)

○データ量が6けた、9けたに増えていくと既存の技術では対応できないので、新たなブレークスルーが必要になる。同一技術を使えないということで、その分に対して、研究開発するのは非常に重要。(山名委員)

○将来の展望を見て、将来データが大きくなるであろうというところも含めた科学全体を考えるという位置づけで十分に考えることが必要。(喜連川委員)

○日本は、情報爆発プロジェクトをこれまで進め、かなりの準備ができているので、さらに推進するシナリオ観で、研究を位置づけるべき。(喜連川委員)

(対象範囲)

○知識インフラ・ビッグデータに関する研究開発の中に、相当ラジカルなシステムを今後、日本は作ることも頭の中に入れた計画を考えることが必要。(喜連川委員)

○今、一番大きなビッグデータは、ゲノムと天文系、特に太陽系。これらのデータは、ビッグデータといっても実は非常にバリアンス(目標どおりにいかないこと)が大きいので、各データでプラットフォームの構築が必要。(喜連川委員)

○バイオ、天体観測等の自然科学の物理的なデータと、社会科学的な人の観測データが重要。物理的なデータと人の観測データは科学の方法論としてかなり違ったものになる。教育のデータは、プライバシーの問題について、教育上の観点から比較的考えやすい。(美濃委員)

○教育のプロセスのデータとか、人から集まる位置情報、カープローブデータ等がビッグデータとして考え得る。特に教育プロセスデータから、どういう形で学生を指導していくのかという知見を、大量のデータの中から考えると捉えるべき。(美濃委員)

○国レベル全体でビッグデータを使ったサイエンスを考えると、教育という領域を特に力を入れるべき。それらを具体的にこの中に書き込んでいくことによって、推進しようとしていることの独自性ないしは強みを明確にすべきではないかな。(竹内委員)

○サイエンス全体というふうにまず位置づける、その中に教育のデータも入るということはおそらく誰も異議がないかと思う。(喜連川委員)

○一番基盤的な部分としてもちろん計算機とかネットワークの整備は前提として、データベースの構築や、整備、その統合化、それから、それを活用する技術としてデータマイニング、機械学習、モデリング、予測、シミュレーション等をする技術を統合的にやっていくのがいいのでは。(北川委員)

(世界的な関心)

○米国のビッグデータイニシアチブは、スパコンとインターネットと同じぐらいの規模観と捉えている。データインテンシブなクラウドは、スパコンと同じような意味でのナショナルウェポンになる。(喜連川委員)

○知識インフラとかビッグデータの取扱いは、もう少し長いスパンで見ていく必要がある長期的な方向と、今からでも着手すべき中長期的、短期的な方向とがあると思う。アメリカ等の先行国に対する国際競争力の観点からは、我が国では長期と短期を同時並行で進めて行かねば間に合わないと思う。(門田委員)

(安全安心、セキュリティ)

○ビッグなボリュームをドメインごとで見たとき、やっぱりセンサ系のデータのほうがはるかに大きいというのを我々認めざるを得ない。個人情報保護法の制限規定をどこまで許すかは、正面から考えることが必要。過去には検索エンジンを合法化したことがあった。学術利用は、突破の一番の切り札で、社会のデータの学術利用も1つの突破口だと考えて取り組んでいくべき。(喜連川委員)

お問合せ先

研究振興局情報課

花岡、山田
電話番号:03-5253-4111(内線:4286)
メールアドレス:jyohoka@mext.go.jp