資料2 アカデミッククラウドに関する検討会これまでの意見のまとめ

平成24年6月29日

目次

1.ビッグデータ時代におけるアカデミアの役割
2.具体的な事業構築に向けたご意見
 2-1 データ科学の高度化に関する研究開発
 2-2 アカデミッククラウド環境の構築

(表示)

○ アカデミッククラウドに関する検討会(第1回)でのご意見
◇ 文書にてご提出いただいたご意見
□ アカデミッククラウドに関する検討会(第2回)でのご意見
☆ 有識者からのご意見

 1.ビッグデータ時代におけるアカデミアの役割

(1)新たな科学技術的手法の可能性

○遺伝学、ライフサイエンスでは、データ解析技術の進歩により、大量のヒトゲノム情報や、リアルタイムなガン遺伝子発現情報が獲得できる状況となっている。単価も非常に下がっており、数万人のゲノム解析が数分でできるという時代が来ようとしている。これは、情報通信の進展の速度を超える勢い。ゲノム情報ということで地球全体を見たときに、20年、30年後のあるべき姿が見えてくる。異種間のデータベースを統合して、それによってどのように次のイノベーションに用いるかという点が重要であり、データベース連携が非常に重要。(五條堀委員)

○このビッグデータの問題は、経験科学、理論科学、計算科学に次ぐ、第4の科学的手法の確立につながっていくもの。サイエンス全体を見通してやっていかないといけない。それで、ネットワークとかデータベースは非常に重要な部分だが、そこだけに終わるとサイエンスの下支えに終わってしまう。SMASH(S:サイエンス、M:モデリング、A:アルゴリズム、S:ソフトウエア、H:ハードウエア)という言葉がよく言われるが、サイエンスと計算機の間をつないで、第4の科学的手法を確立していくには、これらを全部一体としてやっていくことが必要。今こそデータを使ってサイエンスの表に立つようなくらいの意気込みで、この問題を考えていくべき。(北川委員)

◇デジタル的に蓄積されるデータ(アナログデータを含む)は指数関数的に増大しており、もはや一機関(企業を含む)で解析可能なレベルを超えている。

◇情報学に限らず社会科学分野を含め「解析」という観点から大きな広がりがある分野であり、科学と工学の融合を推し進める、社会を科学する分野で工学の利用を促し新たな発見から工学的研究開発につなげるという意義。

□情報の共有は、講義の質向上や大学内の違う分野・専攻の教員たちの連携等の効果がある。(山口委員)

□学内のスパコンの普及に当たっては、ユーザーフレンドリーであること、異なる分野でもスパコンが活用できること等を通して浸透させた。(山口委員)

☆教員は、担当する授業の全ての専門家ではない。アカデミッククラウド環境の構築により、大学を超えた授業の補完で、より質の高い授業の提供が可能である。
(例えば、専門家が極端に少ない分野(OSについて教えられる人材がいない)についても補完が可能である。)

☆ハーバード大学では、オープンコースウェアにすることで、授業の質が向上した、とされている。これからはオープンにするだけでなく、いかにインタラクションできるか、が新たなテーマ。

(2)データベース連携の必要性

○第4の科学的手法の次、フィフスパラダイムは、異なる分野のデータを融合し、異なる分野の研究者が共同に研究し、イノベーションを起こすもの。このため、データに注目することがこの国の重要なタスク(五條堀委員)。

○あれだけの震災が起こったときに、いかに早く復旧できるかということを考えると、基盤層はもう確実にいろいろな大学で共有化して、しかもそれをクラウド基盤、極めて安定な基盤に乗せておくということが必須。そのシステムが自分のところにあったからこそ、津波によって奪われてしまった。だから、遠隔の安定した場所に基盤層は乗せる。その上に競争領域として、ここは差別化しようというのをバーティカルに立てていくという大きなフレームワークを、一方でこの震災を機に、我々は考えを改めていくことが必要。(喜連川委員)

◇大規模データのクレンジング、蓄積とその利用者に対するサービスは、研究環境として大変重要で、この部分は、研究開発から抜けていることが多く、データを処理している研究者がボランティア的に行っているため、研究利用が広がらず、データが有効利用されていないのが現状。このため、国が集めた大規模データを共有し有効利用するためのアカデミッククラウド環境の構築は研究推進のために大きな意義がある。

◇知識インフラの構築には、各政府機関のみならず、大学間の連携と情報の共有が不可欠であり、各大学における学術的な研究に関連したデータおよび成果を格納し、その活用を推進するアカデミッククラウドは極めて意義が高い。アカデミッククラウドは、知識インフラを実現する上で、実践的な研究・教育活動をする場として活用できる。

(3)クラウド環境構築に係るテストベッド

○今後、知識インフラをどのように構築していくかについては、高等教育機関で構築されていくアカデミッククラウドが、1つのテストベッドとなりうる。フィージビリティースタディー的に大学において有効なシステムとして構築されていくならば、それが初等・中等教育機関も含め、国民が関わるさまざまな環境にも広まり、知識インフラの大きなコアになっていく、というシナリオが描けるのではないか。(西尾主査)  

◇大学のクラウド環境の整備は、基盤的な環境整備であり、今後の教育・研究を持続的に発展させるために死活的に重要であり、情報環境を一層効率的かつ合理的なものにすることは、我が国の大学が継続的に取り組むべき課題。

◇知識インフラとして研究のために必要な情報資源(コンテンツ)構築・提供基盤となるだけでなく、高等教育機関における学習の質を高めるために必要な情報資源(コンテンツ)提供基盤としての意義。

◇解析のためのツール、ノウハウの共有も不十分であり、データ科学を推し進めるためには、(1)解析基盤(インフラ)の共有、(2)解析ツールの共有(一拠点で開発できるツールは限られ、知の融合が不可欠)、(3)データの共有(自機関、自社が持つデータと他のデータ(例えば、霞ヶ関クラウドが持つデータなど)との統合解析を実現するためにも)が不可欠であり、日本が世界に先駆けて本分野を切り開き新しい産業を育てる上でも重要。

□社会と連携した情報提供ツール、場としてのアカデミッククラウドは大きな意義がある。(山口委員)

□文部科学省として今後の情報技術の高度化を考えたときに、ビッグデータの課題は、最終的な出口として産業界への応用は意識しつつ、日本として情報通信分野で世界のリーダーシップをとっていくぐらいの意気込みで研究を推進していく価値がある。(西尾主査)

☆2006年に、クラウドコンピューティングという言葉が産まれた日本は、諸外国に比べて、パブリッククラウドの浸透が遅れている現状があり、今ようやくクラウド環境を研究開発できるような情報科学技術としてのクラウド技術が向上した。 

☆法人化後、運営費交付金の削減が続き、学術情報基盤を構築するための費用がない状況が続いている。企業等におけるクラウドの研究開発状況が低調である。

(4)その他(世界的な関心、人材育成等)

(世界的な関心)

○今ITのキーワードとしてのビッグデータが、これ以外にないぐらいの大きさである。
米政府が本年3月末に新たに立ち上げたイニシアチブを読むと、これはインターネットと同じぐらいのインパクトを世の中に与えるかもしれない。つまり、いわゆるITバズワードで、ちょっとして消えていくような技術というのはITの中にはたくさんあるが、ビッグデータは、データ科学あるいは第4の科学と呼ばれているフォースパラダイムに関連すると米国が見なしているということからも、その影響領域が非常に大きい問題。(喜連川委員)

◇米国においては、政府データへのアクセス向上、政府の意思決定への市民の参画、官民のパートナーシップにより、戦略的に情報のオープン化が推進され、新産業の創出も狙い。

□3月29日に発表された米国のビッグデータイニシアチブのポイントは、大量データの核となる技術を向上させることで、安全保障、教育の改革、人材養成もうたわれている。NSFは、データサイエンティスト育成のための大学院コースや、機械学習、クラウドコンピューティング、クラウドソーシングを今後の強力な技術課題としている。(安達(淳)委員)

□国際的なマーケットでの人材獲得競争に対応するため、日本としての情報提供源を構築することが必要。(山口委員)

□米国のビッグデータイニシアチブは、スパコンとインターネットと同じぐらいの規模観と捉えている。データインテンシブなクラウドは、スパコンと同じような意味でのナショナルウェポンになる。(喜連川委員)

□知識インフラとかビッグデータの取扱いは、もう少し長いスパンで見ていく必要がある長期的な方向と、今からでも着手すべき中長期的、短期的な方向とがあると思う。アメリカ等の先行国に対する国際競争力の観点からは、我が国では長期と短期を同時並行で進めて行かねば間に合わないと思う。

(人材育成)

○情報とライフサイエンスの両方がわかる人材の養成、あるいは境界領域として自由に立ち振る舞える人たちの養成。米国等では非常に厚みがあるために、ライフサイエンスで育った人がITに行き、ITの方がライフサイエンスに行ける状況があるが、日本は、フレキシビリティーの部分で課題がある。(五條堀委員)

□データが身近にある環境にあってこそ、バイオインフォマティシャン等のデータを扱える人材が育つ。(門田委員)

□オン・ザ・ジョブトレーニングのような形で、実際のデータをさわって研究開発する中で人材を育てていくような、高度なレベルの技術者が求められており、複数の専門性を持つことも求められている。そのような人材を育てられる環境を意識的につくっていくプロジェクトが今後必要。(安達(淳)委員)

(社会科学との連携)  

□九州大学は、伊都新キャンパスを新しい社会システムの実験場にするという取り組みを続けている。3万人を超える人たちの様々なデータを集められる立場。経験として、ビッグデータを活用して新しい社会の構築するときは、社会科学との連携が極めて重要。(安浦委員)

2.具体的な事業構築に向けたご意見

2-1 データ科学の高度化に関する研究開発

(1)データ科学の高度化の必要性

□データ量が6けた、9けたに増えていくと既存の技術では対応できないので、新たなブレークスルーが必要になる。同一技術を使えないということで、その分に対して、研究開発するのは非常に重要。(山名委員)

□将来の展望を見て、将来データが大きくなるであろうというところも含めた科学全体を考えるという位置づけで十分に考えることが必要。(喜連川委員)

□日本は、情報爆発プロジェクトをこれまで進め、かなりの準備ができているので、さらに推進するシナリオ観で、研究を位置づけるべき。(喜連川委員)

□知識インフラ・ビッグデータに関する研究開発の中に、相当ラジカルなシステムを今後、日本は作ることも頭の中に入れた計画を考えることが必要。(喜連川委員)

□一番基盤的な部分としてもちろん計算機とかネットワークの整備は前提として、データベースの構築や、整備、その統合化、それから、それを活用する技術としてデータマイニング、機械学習、モデリング、予測、シミュレーション等をする技術を統合的にやっていくのがいいのでは。(北川委員)

☆米国は、民間企業(Google、Amazon等)のクラウド環境のインフラ整備が進んでいるが、日本は、そのようなクラウド環境の整備が整っていない。このため、インフラ面での開発も併せて行う必要がある。

(2)アプリケーション側との連携

○データサイエンスは色々なデータを組み合わせて、大規模な処理をすることで知識発見をすること。解析、モデリング等の技術の高度化により、他との差別化が可能。この技術は地球環境、ライフサイエンス等、様々な分野に活用できる。つまり、シミュレーションとデータ科学のIT技術による結合であり、データ同化である。(北川委員)

□今、一番大きなビッグデータは、ゲノムと天文系、特に太陽系。これらのデータは、ビッグデータといっても実は非常にバリアンス(目標どおりにいかないこと)が大きいので、各データでプラットフォームの構築が必要。(喜連川委員)

□バイオ、天体観測等の自然科学の物理的なデータと、社会科学的な人の観測データが重要。物理的なデータと人の観測データは科学の方法論としてかなり違ったものになる。教育のデータは、プライバシーの問題について、教育上の観点から比較的考えやすい。(美濃委員)

□教育のプロセスのデータとか、人から集まる位置情報、カープローブデータ等がビッグデータとして考え得る。特に教育プロセスデータから、どういう形で学生を指導していくのかという知見を、大量のデータの中から考えると捉えるべき。(美濃委員)

□国レベル全体でビッグデータを使ったサイエンスを考えると、教育という領域を特に力を入れるべき。それらを具体的にこの中に書き込んでいくことによって、推進しようとしていることの独自性ないしは強みを明確にすべきではないかな。(竹内委員)

□サイエンス全体というふうにまず位置づける、その中に教育のデータも入るということはおそらく誰も異議がないかと思う。(喜連川委員)

☆現在ビッグデータの対象となりうるのは、「災害」、「ライフサイエンス」、「太陽」関係のデータ。

☆ビッグデータを持っている部局と連携し、当該データを使える環境を構築する必要がある。

(3)データの蓄積・構造化 

◇個人情報の問題を解決しつつ、新しい応用(減災、医療、教育など)や、サービスサイエンスのコアを目指すデータマイニング技術が必要。

◇大学が独自に持つデータベースを統合することは困難であるので、分散した形態での効率的情報検索、効率的データマイニング技術の研究開発が必要。

◇センサデータはノイズが多く入力時に処理をしないと蓄積してもあまり役に立たないため、大規模データになるほど、入力時のデータのクレンジング技術が必要。

◇アカデミッククラウドでは、各大学で整備された情報が分散・統合され、情報共有が促進されることで、データ検索やデータマイニング等の情報処理技術の共同研究も進む。

◇大学ではジョブ規模の分散や必要とする資源が多様であり、ロバストで柔軟な資源配分機能を持つクラウドの実現が必要。

◇世界最高のデータ解析・処理技術を取り入れ、それが自動的に集まるようなシステム作りを目指すべき。

◇大量・大規模データ向けの、モデリング、予測、シミュレーション、意思決定、データ解析、データ同化などの方法や、複雑現象、希少現象の未来予測、マルチシナリオシミュレーションの研究開発が必要。その他、知識ベース構築による知の集積が必要。

(4)データの分析・処理

○ライフサイエンス分野も同様、データ同化は非常に重要なアプローチになっており、大規模で、異種のデータ間を結合(大量の画像や動画とテキストを結びつける等)させて、目的の結果を導く、まさにデータマイニングの問題である。それは、実験手法の構造化を可能にし、実験手法がさらに進化したり、ある種の構造化によって検索技術も高度化する(単にタグとか連想といったものではなくなる)。(五條堀委員)  

◇想検索や個人のニーズ把握によるオーダーメイド検索のように、従来の方法を超える検索法が必要。

◇多様な学習コンテンツすべてを一元的に検索でき、「何があるか」「どのように入手できるか」をナビゲートできるシステムの構築が必要。

(5)処理結果を見せる段階(可視化)

○データ同化は、可視化のための技術開発(アノテーション)にも影響を与える。例えば、ライフサイエンス分野では、ゲノムというのはだれも見た人がいないが、ATGCを3色の画素にして、60インチでやると196台つなげれば見えてくる。見えることによって、新たなことが分かる。新技術で何かを見ようとするときの可視化技術の開発にチャレンジすることは、非常に大事。(五條堀委員)

◇異種・多様なデータを共有して活用するには、十分かつ正確なメタデータの付与に始まり、実験環境や使用機器等に関する付加情報などのアノテーションも適切でなければならない。このためのキュレーションやアノテーションが重要で、機械学習や数理的手法の様々な基礎技術の深化が必要。

◇大規模なデータをわかりやすく提示する技術の研究開発が必要であり、特に多次元データの可視化法、広域データの可視化法など、データ利用の側面からの検討が必要。

(6)その他

◇ビッグデータを扱う上で有用な研究について、ツールとしてアカデミッククラウドに提供するための研究開発が必要不可欠。特に、利用者が簡単に使えることが重要であり、ユーザインタフェースを含め、実際に利用可能な技術とするための応用研究が必要。

◇ネットワークやデータベースに加えて、データ解析、知識発見、モデリング、予測、シミュレーションなどのアカデミッククラウドを広く捉えて、新しい科学的方法論の確立目ざすことが重要。

◇個人情報や機密情報の保護及び各大学等で定める情報セキュリティポリシーを満たす機能や構成の開発が必要。

◇直接的な社会的利害関係に依存しない基本的なデータの収集と蓄積、その健全な利用に関する規範と必要な制約の明確化、人類共通の知として共有できる情報やデータさらにはその加工技術の明確化を行う必要があり、短期的な利益を追求する政府や産業界の実用的クラウドとは一線を画すことが必要。

◇各大学内では研究室・研究グループ単位で研究室LANやITシステム等が構築・運用されていることを考慮し、学内LAN等とシームレスに接続することのできるネットワーク制御機能を備えるとともに、学術認証フェデレーション等に対応した安全かつ利便性の高い環境構築が必要。

◇現在、JSTで進めているNBDCプロジェクトでは、4省連携のもと、情報を連携・共有できる環境を構築し、データを整理・体系化し、公開するシーズプッシュ型と民間企業を含めて利用開発を行うニーズドリブン型を組み合わせて実施しており、両方向からの研究開発が必要。

□科学的には、データの再現性をどのように保証するか、という検討課題がある。(安浦委員)

2-2 アカデミッククラウド環境の構築

(1)アカデミッククラウド環境の構築の必要性

○国全体でこういうふうにするのだという一定の方針がなくては、個々の大学等が幾ら共通化しようとしても非常に厳しい。実際やろうとすると、いろいろな難しい問題でなかなかうまくいかない。これは、トップダウンで、全体としてこういう方針で行くべしという強い誘導がなければかなり厳しい。(相原委員)

○こういうことを進めていく上では、実はすべての要素がそろっていないとできない。それぞれの分野で当然研究開発が必要となる。しかし、他の研究開発成果を待っていると後ろ方の分野、例えばデータを使って何かをしようというアプリケーションに近い分野の研究開発はできなくなってしまう。しっかりと計画の中で考えてスケジュールしていかないといけないと思う。(山名委員)

○データサイエンスは、クラウドシステム環境がないとできないような科学領域。そういう新しいサイエンス領域が数多くある中で、第4の科学的手法をサポートする環境をいかに構築していくのかが大事。(喜連川委員)

○最初からフィフスパラダイムに向けたクラウドを考えるべきで、つまり、学問の融合というものが、その次のイノベータのキラーであるとの認識については、多くの方が認めるところ。それは異なる学問分野のデータがシームレスに、クラウドの中に入っていて、アクセシブルな環境をつくることで、そこを大きく加速できる。(喜連川委員)

◇データ中心科学では、本来の目的を超えてデータベースの横断的活用によって新しい発見等を目ざすので、統合的な利用が可能であることが必要。

◇出自を明確にしたデータを組み合わせて、手法を明示した解析・推論・抽象化等から導き出される新しい知識体系を、系統的に整理・蓄積し、各種の検索手法で多くの人が検索できる世界を構築することで、より開かれた知の公開の人類共通の原則が明確化。

◇アカデミッククラウドの構築を通じて、ALLJAPANの大学の情報基盤が整備され、各データのフォーマットが統一されていくことを期待。

◇どのようなデータが蓄積されるかに依存するものの、最終的には、社会科学や他分野の研究者にとっても新しい価値創出につながる。

◇研究の活性化には欠かせない。研究者または研究グループ個別の研究に関するストレージ機能ならびにデータ処理機能としての利用が期待。

◇様々なデータベースやリポジトリと大学の持つスーパーコンピュータなどの先端的計算資源を連携させ有効に活用することにも寄与。

◇HPCIが整備されつつあるが、学術データベースの情報をスーパーコンピュータに直接転送し、大規模なデータ解析やシミュレーションを実行するとともに、手元の可視化装置で詳細に調べることなどが普通に行われるようになることを期待。

◇解析や推論、抽象化、さらには検索などに利用する各種処理パッケージの共有化と、各種情報処理手法に対する透明性を担保する仕組みを構築することにより、学問の客観性をさらに高めることが必要。

◇各種解析ツールの共有が、本分野開拓において大きなメリット。ビッグデータ解析のための各種ツールで死蔵されてしまっているものを含め、共有を図ることが重要。

◇情報格差の解消、また、省資源化、災害時の減災。

□業務環境は、学内に目的別のシステムが乱立しており、大学内でもデータが統一的に見えないのが現状。効率化して、学生のデータを含む大学全体のデータを統合管理することが必要。ただし、技術以外の色々な壁があるのも事実。(美濃委員)

□アカデミッククラウド環境の普及・活用法を初期段階から議論することが必要。(山口委員) 

□大学ICT推進協議会が中心的なプレーヤーになってやるという絵は描きやすい。協議会は、現在49校の国公私立の主な大学が参画。その中で大学における新しいクラウドのあり方を考え、突破すべき社会的な制約というものも同時に考えながら、スタートスモールで進めてはどうか。(安浦委員)

☆大学の研究教育機関を、震災にレジリアントにする。

☆各大学におけるクラウド化を後押しできる。特に新しい大学には効果がある。

☆各大学それぞれが持つハードウェア上の「レイヤー」を共通化することが重要。大学ICT推進協議会において、実際のネットワーク環境を構築することが可能。

(2)対象規模

◇効率的な運用を目指し、日本全体で2~3か所程度に集約して構築することが望ましく、また、安定運用のためには大学以外の場所(データセンター等)に導入することを想定すべき。

◇安定した電力供給等が確保された場所に構築し、大学等との間は十分な帯域を持つネットワークで接続されていることが必要。

◇データセンターの立地は、電力や防災の観点から適切に選択すべきであり、大学の位置とは独立してフレキシブルに考えるべき。

◇データが大規模で一か所にしかない場合は全国規模、大学間連携は地域連携、大規模大学は学内での導入と地域大学へのサービス提供というモデルが現実的。

◇実験的には、大規模な大学がいくつか連携して小規模大学も参加できるように工夫して実現すべきであるが、最終的には国家レベルあるいは国際的な連携による世界レベルのシステムとなることが必然的。

◇これまでのグリッドコンピューティングの延長とは考えず、少数拠点にアカデミッククラウドとして構築(メンテナンスの観点からも、大規模データを効率よく扱うという観点からも)するのがよい。ただし、少数拠点でなければいけないということはなく、多拠点であっても利用者が問題なく利用できる環境であれば、配置については特に制約はない。

◇ロードマップ作成段階で、カバー範囲と規模を確定していくことになるため、基本的には規模の利益を狙うべき。つまり、既存の組織構造にとらわれず、資源を集中したり、また保存や防災の観点からはストレージを分散配置したりするべき。   

◇(世界にもつながった)全体のネットワーク化が必要。格差解消:知識の共創により全国的活性化が期待。

(3)対象範囲

○データを競争領域と非競争領域に分けるべき。非競争領域のデータは、クラウド化することで効率化が実現できる。ただ、データ移行のための合意プロセスや、どこをターゲットポーションにするかという議論が非常に難しいので、本検討会では、オープンガバメントとしてどこまでデータを公開するか、国益に非常に関与するデータを日本外のクラウドに置くことが許容されるのか等の議論をするべき。(喜連川委員)

○大規模なデータ等を処理しようとする場合、ユーザーから見たときに、仮想的でも良いので、データ、ツールとシステム、この3つが1カ所にあるということがポイント。(山名委員)

○データ解析技術の進歩により、どのようなデータをアカデミッククラウドに保管するか、という方針が必要。つまり、アーカイブ的なデータとモニタリングデータの区別や、研究開発データとそこから発展した事業モデル、ビジネスモデルのデータの切り分けなどが必要。(五條堀委員)

□個々の大学が独自にクラウドシステムを構築すると、日本全体として無駄な投資になるので、共通部分と競争部分を切り分け、共通部分は大きな単位でサービスを提供することが必要。(美濃委員)

(4)大学間のクラウド環境の連携について

○大学等における財源等の厳しい状況の中で、大型研究等を推進しようとしたときのデータリソース、計算リソースとしてのクラウドシステムの構築を日本全体で考えたときに、大規模大学でクラウド環境を構築し、中小の大学と有効に連携して先進的な学術研究推進基盤の整備を推進することは重要である。その場合に、このような基盤整備を情報基盤センター等のレベルで推進していくものなのか、より大規模に日本全体として推進することを考えていくべきなのか。(西尾主査)

○アカデミッククラウドを構築するには、既存の学内のITシステムといかにシームレスにつなぐかが重要。現在、各大学等研究機関の情報システムのポリシーは異なるので、研究開発が必要。アカデミッククラウドを全アカデミックな知識のインフラとするならば、全国の各大学等研究機関のITシステム構築の考え方について、早い段階で方針を打ち出すことが必要。(相原委員)

○図書館の立場から発言すると、世界各地に散らばっていて、各大学の中でもかなり散らばっている学術情報資源を、うまく共有化していくための仕組みが必要。だれが使うことができるのか、どのような条件で使うことができるのか等をクリアにすることが必要。(竹内委員)

◇既存学内LANやITシステム等とシームレスに接続する機能、学術認証フェデレーション等と密接に連携した認証システムなどの研究開発が必要。

◇多様なデータベースや計算資源を使いやすくするには、認証技術が重要であり、少なくともシングルサインオン(SSO)を実現することが必要。複数のコミュニティに渡って適切に管理される認証連携技術が重要。

◇産業界や市民がアカデミッククラウドで整備された情報を二次的な加工等を通じて、知識として抽出できるよう、データ取り扱いに関するルール作りが必要。

◇大学が独自に持っているデータベースやリポジトリは研究者コミュニティには公開されているが、連携のメカニズムはないので、連携する枠組みが必要。

◇アカデミッククラウドでは、データの量や利用数の変化に柔軟に対応するため、分散・統合型での基盤構築が望ましいが、その際は、データの標準化と共有が重要。

◇現在のクラウドは、大量データの扱いで極めて貧弱な環境しか提供できないので、この点を解決するための技術開発やシステム運用設計技法の提案が急務。また、データの永続的な保存についても仕組みや制度を検討しておくことが必要。

◇学習コンテンツのライセンシング、利用許諾・条件の集中的な管理機能が必要。

◇研究環境におけるクラウドは、現在進められているHPCIに集約されている。さまざまな分野の研究者が大規模な計算機資源を共有するIaaSが実現されようとしている。大規模なデータストレッジやデータ連携も当然必要となるが、これらはPaaSと位置づけられる。これを研究分野の違いを超えてSaaSにするならば、そのシステム開発が必要。例えば、大学としてクラウドに出せないデータと、クラウドの向こうにあるデータの連携・利用技術は研究が必要。

□研究環境としては、スパコンを中心としたHPCIインフラ等のクラウド環境ができつつあり、今後プラットフォームやサービスに発展できるかがポイント。(美濃委員)

□国の大きなプロジェクトをはじめとして、最終的に得られた成果に関する大量データを広く有効に使っていただくために、JSTがそのようなデータに関する新たなサービスを展開していくというシナリオもある。(西尾主査)

□各大学で開発したデータベースは実際の研究に密接に関連したところでなければできないわけで、それを物理的に統合するのではなく、1つポータル的なものを構築して、そこに入れば統合的な検索ができたり、あるいはデータベースを横断したような分析ができるという形ではやってきたので、1つのモデルケースにはなっている。(北川委員) 

(5)教育用の情報システムとの関係

○高等教育機関におけるさまざまな学習の質を高めるため、教育コンテンツの共有化と、それに伴う教育の質の向上が、アカデミッククラウドの利用方法の1つ。(竹内委員)

○教育と研究は合体しながら進んでいくような状況で、アメリカのビッグデータの解析に教育が入っている。教育方針もビッグデータの解析でこれまでとは異なる指標が明確に出てきている。ポテンシャルが大きいので、視野を広めた議論をしたほうがいい。(喜連川委員)  

○最初は理系分野で使われていくと思うが、最終的には文系の先生を含めて、一般の皆さんを含めて使えるシステムになることが重要。大学だけではなく、高等学校、中学校を含めて、そういったところ、あるいは一般的なところでも使える設計が必要。(山名委員)

○大学間のデータベース連携、例えば、大学の事務系等のデータ連携については、他に適切な会議体(大学ICT推進協議会等)で議論してはどうか。(喜連川委員)

◇大学ICT推進協議会においては、CIO部会で同じ考え方を持つ大学が共同して業務システムを開発し、商用または大学が運営するクラウドサービスを利用して業務遂行を行う枠組みの構築を目指しているが、これをアカデミッククラウドで実現するのがいいのか、商用クラウドサービスでいいのかを見極めることが必要。

◇大学全体を俯瞰すると、アカデミッククラウドの要件として、教育研究&業務について、大学間で標準化した仕組みを(1)全国規模で利用するPaaSと、(2)大学群コミュニティの間で利用するSaaS という形態がある。集約効果や分割損を抑えて、M&Aや統廃合を可能とするのはPaaSであり、これに向けての運用標準化ガイドの策定とそれに従ったPlatform構築が現実的。実質的な成果は「標準化・見える化」。教育研究は、Platformの上位で、必要ならSaaS利用し、共通PaaSの上で、大学としての特徴をだすというのが良い。教育研究&業務について、困っている課題認識を大学間で共有し、そこを最優先に抽出して、仕様策定した上でシステム構築を進めれば、成功事例を作りやすく、このプロセスを順次続けることで、成長型の実質的に役に立つPaaSが可能になる。

◇推薦入試やAO入試などの入試制度の多様化、専門職大学院、留学生30万人計画などにより、多様な背景をもつ学生のニーズや学習状況に応じたきめ細かい教育・学生指導が必要。今後は、大学における社会的・職業的自立に関する指導(キャリアガイダンス)や転学科・転学部を越えた「転大学」にまで至る学生のモビリティへの対応が可能な学習状況の適切な把握およびそのデータの大学の枠を越えた可搬化が必要。このため、大学の教育環境は、PC教室などでハード・ソフトを全て大学側で所有・管理する体制を改める時期。

◇高等教育機関における教育、学習において必要なコンテンツをストレスなく利用できるようにするためには、コンテンツのライセンシング、利用許諾・条件の集中的な管理機能とその条件を満たしうる利用者認証機能が必要。

◇学習コンテンツ提供のワンストップサービスの実現が可能。

◇教育の高度化を目指した教育管理システム(LMS)や教育ポートフォーリオシステム等としての利用が可能。国内外の大学間単位互換等における活用も期待。

◇教育への利用は、確立した学問体系をよりわかりやすく提示する仕組みを構築する目標を段階的に考えれば良く、比較的わかりやすいゴール設定が可能。学生管理等、教育機関の運用に関する利用は、広義のアカデミッククラウドとして位置づける必要があり、社会における各種組織の構成員の管理との関係性でより社会的議論が必要。今回のアカデミッククラウドの議論とは分離して考える方が良い。

□米国では、学生がどんな勉強をし、どこでどんなレポートを出し、どんな成績を得て、どんなことを考えているかという、学生の生活、学習記録をデータベース化し、全部残そうという話がある。(美濃委員)

□大学の学生のポートフォリオのような情報を扱ったらどうかというような話、教育とかの高度化。学生にしても、研究者にしても、流動性が活性化にも繋がるということが真であるとするならば、それは国全体で考える必要がある。(相原委員)

□教育の内容に踏み込むよりも、教育のデータをビッグデータとして集め、それをどう処理しようかというときに、研究開発と一体となった話が必要なので、そこで教育関係の先生方とコラボレーションする必要がある。(美濃委員)

☆学生の各種データをクラウド環境で管理運営するための研究開発もあり得る。

☆学生の履修データをクラウド環境上で管理することができれば、人材育成データベースとして活用することもできる。

(6)その他(安全安心、セキュリティ、コスト)

(安心安全、セキュリティ)

○ライフサイエンス分野のデータは、オープンで進めたいが、一方で相反的な、安全対策、倫理、個人情報の問題等があり、その両方をいかに同時に対応するか。(五條堀委員)

○個人情報の観点について、例えば、データがたまればたまるほど、個人が特定できてしまう場合もあり、安心して使えるための条件を研究する等が必要。また、国際戦略や、海外との関係等も含め、どういうセキュリティ方針で情報を保有すべきか等、専門的に研究開発することも必要。(相原委員)  

○昨年度に発足したバイオサイエンスデータベースセンター(NBDC)において、データの標準化等の取り扱いルールや、ヒト由来データを扱うことによる倫理上の問題があるため、今年度、新たに検討会を立ち上げて議論することになっている。(門田委員)

◇各大学等の組織毎に情報セキュリティポリシーが策定されており、既存ポリシー配下で運用可能か否かの総合的な検討が必要。

◇個人のデータを取り扱う場合は、一次データでなく、二次データとして、個人が特定できないよう配慮しつつ、利用する等の配慮が必要。

◇有効利用と個人情報保護の狭間で法整備が問題。

◇権利関係の処理(著作権、プライバシー、ライセンス)が必要不可欠であり、法制度上の問題の洗い出し、当該問題に対する対応についての検討を進めることが必要。

□ビッグデータの収集については、その収集されるデータの安定性、精度等の技術的問題に加え、各利用者からデータを取得することについて、どのように了解を得るのかが問題。(安浦委員)

□ビッグデータの蓄積、保存については、データベースの安定性、安全性、異種データの連携は技術的に重要。ただし、想定されていなかった複数のデータが結びつけられることにより、本人すら気がつかなかった情報が出てしまうという問題がある。(安浦委員)

□ビッグデータは、研究、教育だけでなく、社会問題解決に広く利用していくべきだが、どこまで許すかという問題にすぐつながる。(安浦委員)

□データにフォーカスして議論を進めないと、権利やプライバシーといった議論に集中してしまう。どこから着手するかが極めて重要であり、比較的進めやすい問題から始めるべき。(安達(淳)委員) 

□ビッグなボリュームをドメインごとで見たとき、やっぱりセンサ系のデータのほうがはるかに大きいというのを我々認めざるを得ない。個人情報保護法の制限規定をどこまで許すかは、正面から考えることが必要。過去には検索エンジンを合法化したことがあった。学術利用は、突破の一番の切り札で、社会のデータの学術利用も1つの突破口だと考えて取り組んでいくべき。(喜連川委員)

(コスト)

○スーパーコンピュータの共用法の場合と同様、アカデミッククラウドの利用負担金をどうするかという議論もある。何より、ネット帯域が一番高価なので、様々な利用のレベルに分けて議論することが必要。(喜連川委員)

○現在の商用クラウドは、クライアント・クラウド間の通信費が高く設定されていること、また帯域が限られることから、大量のWebデータを商用のクラウドに乗せるだけで、膨大な時間とお金がかかる。現実的には、商用のクラウドに手元にあるデータを乗せて解析することは極めて困難。(山名委員)

◇教育・研究一般に活用できるが、その際のIT投資の合理化を促進することが一番の寄与。

◇大学は財政事情が厳しくなっているので、これまでのように学内のIT環境が維持できない。学内IT環境の代替機能が特に重要。

お問合せ先

研究振興局情報課

花岡、山田
電話番号:03-5253-4111(内線:4286)
メールアドレス:jyohoka@mext.go.jp