大学等の研究者が、全国に所在し、多分野にわたる様々なデータベースや研究資料を有機的に連携し、効果的かつ効率的に、研究に活用できるよう、1)多分野にわたる異なるデータベース、リポジトリ等の連携、2)その前提となるデータベース化、デジタル化・アーカイブ化の推進、3)データ検索やデータマイニング等の情報処理システムとの連携について
1.-1 |
第4期科学技術基本計画に掲げている「知識インフラ」の形成と、これをもとにした「データ科学」の高度化が情報科学技術分野として重要となっています。このための環境構築における重要な事項のひとつとしてアカデミッククラウド環境を検討する意義についてどのように考えるか? |
ご回答 |
・我が国独自のアカデミッククラウド環境を研究開発し、さらに構築運用することは、国際競争力のある研究環境構築という点、並びに研究開発力のある人材育成の点として意義 |
・大学のクラウド環境の整備は、基盤的な環境整備であり、今後の教育・研究を持続的に発展させるために死活的に重要 |
・ネットワークやデータベースに加えて、データ解析、知識発見、モデリング、予測、シミュレーションなどのアカデミッククラウドを広く捉えて、新しい科学的方法論の確立目ざすことが重要 |
・知識インフラとして研究のために必要な情報資源(コンテンツ)構築・提供基盤となるだけでなく、高等教育機関における学習の質を高めるために必要な情報資源(コンテンツ)提供基盤としての意義 |
・大規模データのクレンジング、蓄積とその利用者に対するサービスは、研究環境として大変重要で、この部分は、研究開発から抜けていることが多く、データを処理している研究者がボランティア的に行っているため、研究利用が広がらず、データが有効利用されていないのが現状 |
・知識インフラの構築には、各政府機関のみならず、大学間の連携と情報の共有が不可欠 |
・過去半世紀あまりで人類が手に入れた情報通信技術(半世紀で10桁から20桁の性能向上をもたらした希有な技術)を活用した新しい学問の基盤となる社会的なしくみを構築することで、人類文化の発展と新しい展開に対する潮流を生み出す意味で大きな意義 |
・情報学に限らず社会科学分野を含め「解析」という観点から大きな広がりがある分野 |
1.-2 |
1)~3)に関し、連携をすることによる具体的なメリットはどのようなものが考えられるか?本検討会においてどのようなゴール設定が適切か? |
ご回答 |
・既存データベースやリポジトリの置き場所変更ではなく、相互に連携して活用できることは、新たな研究分野を創出する可能性を含むという点で意義 |
・教育・研究における重複した努力を排除し、イノベーションの誘発に寄与 |
・データ中心科学では、本来の目的を超えてデータベースの横断的活用によって新しい発見等を目ざすので、統合的な利用が可能であることが必要 |
・学習コンテンツ提供のワンストップサービスの実現 |
・大学が独自に持っているデータベースやリポジトリは研究者コミュニティには公開されているが、連携のメカニズムはないので、連携する枠組みが必要 |
・米国においては、政府データへのアクセス向上、政府の意思決定への市民の参画、官民のパートナーシップにより、戦略的に情報のオープン化が推進され、新産業の創出も狙い |
・出自を明確にしたデータを組み合わせて、手法を明示した解析・推論・抽象化等から導き出される新しい知識体系を、系統的に整理・蓄積し、各種の検索手法で多くの人が検索できる世界を構築する事で、より開かれた知の公開の人類共通の原則が明確化 |
・どのようなデータが蓄積されるかに依存するものの、最終的には、社会科学や他分野の研究者にとっても新しい価値(データからの新たな発見が1)2)3)の連携により実現)創出につながる |
上記1.のような考え方で、有機的に連携するデータベース等を、研究者が手軽に一つのシステムとして利用でき、効果的・効率的な研究活動を行うことのできるシステム環境のあり方、データを取り扱う際の倫理規範、及び環境構築について
2.-1 |
アカデミッククラウドのシステム環境をどのように利用するのか。例えば、上記項目1のデータベース等の連携以外にあげられるメリットは何か? |
ご回答 |
・研究利用:研究の活性化には欠かせない、研究者または研究グループ個別の研究に関するストレージ機能ならびにデータ処理機能としての利用が期待 |
・教育・研究一般に活用できるが、その際のIT投資の合理化を促進することが一番の寄与 |
・(広義)情報格差の解消 |
・我が国の高等教育機関において共有しうる学習コンテンツ構築・提供のための基盤として利用 |
・大学が進める研究教育を大学間で連携して行うための環境 |
・クラウド化によるコストメリットや高度な計算機リソースの共有 |
・解析や推論、抽象化、さらには検索などに利用する各種処理パッケージの共有化と、各種情報処理手法に対する透明性を担保する仕組みを構築することにより、学問の客観性をさらに高めること |
・各種解析ツールの共有が、本分野開拓において大きなメリット |
2.-2 |
アカデミッククラウド環境を構築する際に求められる全体システム・機能はどのようなものか? 本検討会においてどのようなゴール設定が考えられるか?(例:研究の観点、教育の観点、学生管理の観点) |
ご回答 |
・アカデミッククラウドを広くとらえ、「2-1」に示すような多数の構成員の需要に応えるシステムとすることが望ましい |
・現在のクラウドは、大量データの扱いで極めて貧弱な環境しか提供できないので、この点を解決するための技術開発やシステム運用設計技法の提案が急務 |
・研究者が最高の情報処理機器、データ、解析・モデリング技術を駆使して、本来の研究課題に集中できるような環境 |
・高等教育機関における教育、学習において必要なコンテンツをストレスなく利用できるようにするためには、コンテンツのライセンシング、利用許諾・条件の集中的な管理機能とその条件を満たしうる利用者認証機能が必要 |
・大規模データの維持管理環境、大学間の共通機能を処理する環境、業務の共同開発など広く大学全般に関わること |
・クラウド化によるコストメリットや高度な計算機リソースの共有 |
・研究環境としてのアカデミッククラウドの構築は、人類文化の方向性を決定的に変化させる可能性があり、多くの技術的、社会的な問題を並行して考えて行く必要 |
・アカデミッククラウドの継続的な発展を目指すためには、最終的なゴールとして、情報学を主とする研究者以外の分野の研究者が簡単に使えることを狙うことが必要 |
2.-3 |
技術的な課題として、既存の一般的なクラウド環境には存在しないが、アカデミッククラウド環境に必要となる機能やシステムとして、どのようなものが考えられるのか?また、そのような情報技術を大学等において(場合によっては産業界とも連携して)育てていくことの重要性についてどのように考えるか? |
ご回答 |
・「2-4」で指摘する、既存学内LANやITシステム等とシームレスに接続する機能、学術認証フェデレーション等と密接に連携した認証システムなどの研究開発が必要 |
・一般の教育・研究に使う場合、卒論作成などの繁忙期にうまく負荷分散するような、異種クラウド間の連携技術、例えば民間クラウドへの負荷の配分などが重要 |
・世界最高のデータ解析・処理技術を取り入れ、それが自動的に集まるようなシステム作りを目ざすべき |
・大学の特性はその教育にある |
・コース管理、学生管理などの特性がシステム技術的に特異な機能となるのかどうかは検討の余地 |
・クラウド環境で共有された情報を各大学の自由な発想に基づく研究に利用できる環境が大事 |
・直接的な社会的利害関係に依存しない基本的なデータの収集と蓄積、その健全な利用に関する規範と必要な制約の明確化、人類共通の知として共有できる情報やデータさらにはその加工技術の明確化を行う必要があり、短期的な利益を追求する政府や産業界の実用的クラウドとは一線を画す必要 |
・各大学等から提供されるデータ、ツールを一般的に利用可能な状態にするための作業が必要 |
2.-4 |
技術的な課題として、既存の一般的なクラウド環境には存在しないが、アカデミッククラウド環境に必要となる機能やシステムとして、どのようなものが考えられるのか?また、そのような情報技術を大学等において(場合によっては産業界とも連携して)育てていくことの重要性についてどのように考えるか? |
ご回答 |
・各大学内では研究室・研究グループ単位で研究室LANやITシステム等が構築・運用されていることを考慮し、学内LAN等とシームレスに接続することのできるネットワーク制御機能を備えるとともに、学術認証フェデレーション等に対応した安全かつ利便性の高い環境構築が必要 |
・クラウドが現在のITシステムの中核になるないしは置き換わる |
・データ利用技術に関する高付加価値化が必要 |
・学習コンテンツのライセンシング、利用許諾・条件の集中的な管理機能 |
・大学は財政事情が厳しくなっているので、これまでのように学内のIT環境が維持できない |
・ビッグデータ時代を迎え、各大学の特色を踏まえて情報をアーカイブすると共に、それらを分散・統合で利用できるようにすべき |
・上記に述べて来た意味で、現在の学内ITシステムは、単なる個別サービスであり、既存の学問体系を基礎とした研究・教育環境を便利にするツールに過ぎない |
・(質問の意図がよく理解できませんでしたが)基本的にはWebブラウザを経由して利用可能なシステム、Webサービスを利用しての利用可能なシステムとするのがよい |
2.-5 |
想定するシステムの規模感はどのようか?(日本全体をネットワーク化、地域の大学間の連携、大学内のクラウド化)求められるシステム要件はどのようなものか?(大規模な大学に導入することを想定or小規模の大学にも導入が可能) |
ご回答 |
・効率的な運用を目指し、日本全体で2~3か所程度に集約して構築することが望ましい |
・データセンターの立地は、電力や防災の観点から適切に選択すべきであり、大学の位置とは独立してフレキシブルに考えるべき |
・(世界にもつながった)全体のネットワーク化が必要 |
・学習において必要となるコンテンツを考えた場合には、日本全体で利用可能なシステム環境の整備が必要と思われる |
・データが大規模で一か所にしかない場合は全国規模、大学間連携は地域連携、大規模大学は学内での導入と地域大学へのサービス提供というモデルが現実的 |
・ビッグデータ時代を迎え、各大学の特色を踏まえて情報をアーカイブすると共に、それらを分散・統合で利用できるようにすべき |
・実験的には、大規模な大学がいくつか連携して小規模大学も参加できるように工夫して実現すべきであるが、最終的には国家レベルあるいは国際的な連携による世界レベルのシステムとなることが必然的 |
・これまでのグリッドコンピューティングの延長とは考えず、少数拠点にアカデミッククラウドとして構築(メンテナンスの観点からも、大規模データを効率よく扱うという観点からも)するのがよい |
2.-6 |
データを取り扱う際の倫理規範について、情報分野として現在どのような問題点が認識されているか? |
ご回答 |
・一般的な科学者としての研究倫理が適用される |
・セキュリティと個人情報の保護が極めて重要な問題となっているが、過度な対応は、期待される大きな利益や利便性を相殺することにもなり、十分注意すべき |
・倫理規範とは異なるが、有効利用と個人情報保護の狭間で法整備が問題 |
・研究上の機密データ、学生の個人情報など情報セキュリティをどう確保するかがクラウドサービスを利用する最大の問題点 |
・個人情報保護的な観点から、倫理規範を決めることが重要 |
・社会的に大きな影響を与えるような問題に対するデータや解析結果の取り扱いに関するある種の倫理規範が必要 |
・リバースエンジニアリング的に、複数のデータをもとに個人情報の抽出を試みることなどは、行わないことが重要 |
3.-1 |
文科省・JSTによる研究開発の予算化を検討する際、民間や他府省の研究開発の状況も鑑み、どのような研究開発事項が考えられるか? - データマイニングに求められる具体的研究開発内容 - 統計数理的手法に関する研究開発内容 - その他、必要となる研究開発内容 |
ご回答 |
・異種・多様なデータを共有して活用するには、十分かつ正確なメタデータの付与に始まり、実験環境や使用機器等に関する付加情報などのアノテーションも適切でなければならない |
・情報検索 |
・「研究」開発といえるかどうかわからないが、多様な学習コンテンツすべてを一元的に検索でき、「何があるか」「どのように入手できるか」をナビゲートできるシステムの構築が必要 |
・センサデータはノイズが多く入力時に処理をしないと蓄積してもあまり役に立たない |
・アカデミッククラウドでオープン化された情報が、各種研究開発で活用され、より高度化した情報が、更に次の研究開発で高度化されるような循環型で継続的なサイクルとなることを期待 |
・具体的な分野を限定したアカデミッククラウドの構築とそれに付随する問題点や技術課題の明確化 |
・基本技術については、これまでの研究によって解決されつつあると考えますが、論文レベルで終わってしまっているものが多く見受けられる |
アカデミッククラウドの議論にあたって、まず、アカデミッククラウドと商用クラウドの差がどこにあるか、本質的な議論が必要です。大学等の公的機関は、ビジネスモデルには載らないが効率的運用は必要という視点からこの違いを議論する必要があります。効率的運用という立場からは、日本の大学が、アカデミッククラウドを所有、運営しても、満足のいくものができるかどうか(ハード、ソフト、人)、 管理できる人が必要となるということなら、大学が共同で運用するクラウドは必要かどうか、が問題です。ただし、運用効率だけでなく、人材育成の観点、すなわち、クラウドを研究開発、運用する人材をどう育てるかという視点も重要です。この点に関しては、科学技術・学術審議会学術分科会研究環境基盤部会・学術情報基盤作業部会が取りまとめた「学術情報基盤の今後の在り方について」(平成18年3月)において、「研究を技術に進化させ、 サービスとして提供し、その中から新しいサービスのための研究アイデアを生み出していくような『研究→技術→サービス→研究』というサイクルを形成」(p.19)することの重要性がHPC分野において強調されていますが、これと同じことがクラウドに関してもいえるのではないかと思います。
大学での情報環境の利用は大きく分けて、研究環境、教育環境、業務環境の3つですので、それぞれに対してクラウド技術の役割を考えてみます。
(研究環境)
研究環境におけるクラウドは、現在進められているHPCIに集約されています。さまざまな分野の研究者が大規模な計算機資源を共有するIaaSが実現されようとしています。大規模なデータストレッジやデータ連携も当然必要となりますが、これらはPaaSと位置づけられます。これを研究分野の違いを超えてSaaSに持っていく必要があるかどうか、この点はよくわかりません。もし、必要性があるのならそのためのシステム開発が必要となります。例えば、大学としてクラウドに出せないデータと、クラウドの向こうにあるデータの連携・利用技術は研究が必要でしょう。
(教育環境)
大学を取り巻く環境は大きく変化し、推薦入試やAO入試などの入試制度の多様化や、専門職大学院、留学生30万人計画など、大学はこれまで以上に多様な学生を受け入れるようになってきており、多様な背景をもつ学生に対してその学生のニーズや学習状況に応じたきめ細かい教育・学生指導が求められるようになってきています。今後は、大学における社会的・職業的自立に関する指導(キャリアガイダンス)や転学科・転学部を越えた「転大学」にまで至る学生のモビリティへの対応が可能な学習状況の適切な把握およびそのデータの大学の枠を越えた可搬化が必要になってくると考えられます。このような状況を考えると、日本の大学における教育環境は、そろそろ、PC教室などでハード・ソフトを全て大学側で所有・管理する体制を改める時期に来ていると考えられます。では、新たな教育環境としてのアカデミッククラウドをどのように実現するのか、これ自体がシステム構成的、技術的な研究プロジェクトになり得るかと思います。
クラウド利用において重要な点は、「大規模かつ再利用可能な仮想化計算機リソース群を大学の特性に合わせて如何に効率よく使い回せるか?」で、その技術的ポイントは「自律的な資源配置エンジンをコア技術とした教育学習支援フレームワーク」を構築することだと思います。このあたりは大学特有の問題であり、うまくゆけばアカデミッククラウドの議論の中心になっていくと考えます。
(業務環境)
大学が独立行政法人になり、大学間で競争が促され、機能強化が求められている一方で、運営交付金が削減されている状況を考えれば、大学における管理業務の効率化は避けられない問題です。従来のように、各大学が単独で業務環境を構築してゆくことが困難になってきています。大学の管理業務は多くの大学で共通部分が多くあると考えられるので、大学ICT推進協議会においては、CIO部会で同じ考え方を持つ大学が共同して業務システムを開発し、商用または大学が運営するクラウドサービスを利用して業務遂行を行う枠組みの構築を目指しています。これをアカデミッククラウドで実現するのがいいのか、商用クラウドサービスでいいのかを見極める必要があります。この判断にあたっては、情報セキュリティの観点も重要でしょう。
大学全体を俯瞰すると、アカデミッククラウドの要件として、教育研究&業務について、大学間で標準化した仕組みを(1)全国規模で利用するPaaSと、(2)大学群コミュニティの間で利用するSaaSという形態ではないかと思います。集約効果や分割損を抑えて、M&Aや統廃合を可能とするのはPaaSですので、これに向けての運用標準化ガイドの策定とそれに従ったPlatform構築が現実的のように思えます。実質的な成果は「標準化・見える化」です。教育研究は、Platformの上位で、必要ならSaaS利用し、共通PaaSの上で、大学としての特徴をだすというのが良いでしょう。教育研究&業務について、困っている課題認識を大学間で共有し、そこを最優先に抽出して、仕様策定した上でシステム構築を進めれば、成功事例を作りやすく、このプロセスを順次続けることで、成長型の実質的に役に立つPaaSが可能に思います。
参考
本検討会には、本年3月29日に開催された研究計画・評価分科会 情報科学技術委員会(第75回)、学術分科会
研究環境基盤部会 学術情報基盤作業部会(懇談会)の資料1において審議された、今後「議論・検討すべき事項」を協議し、方向性を提示することが求められております。そこで、本検討会における議論を深める観点から、課せられている審議事項の各項目に対するご意見を事前にいただけますと幸甚です。
なお、クラウド技術は浸透しつつあるものの、未だ本格的な利用には至っていないのが実状です。ましてアカデミッククラウド環境の構築に関しては、まさにこれからという段階です。つきましては、クラウド技術を大学等に導入する場合、(1)どのように利用するのか、(2)その場合の課題は何なのか、(3)その技術をどのように育てていくのか、という視点が重要かと考えます。その観点からは、以下の項目2.
システム環境の構築 に関しては、特段ご意見をいただけますようにお願いいたします。
※記入欄に書ききれない場合は、適宜欄を大きくしてください。
委員名:
1. データベース等の連携
大学等の研究者が、全国に所在し、多分野にわたる様々なデータベースや研究資料を有機的に連携し、効果的かつ効率的に、研究に活用できるよう、1)多分野にわたる異なるデータベース、リポジトリ等の連携、2)その前提となるデータベース化、デジタル化・アーカイブ化の推進、3)データ検索やデータマイニング等の情報処理システムとの連携について
|
ご意見伺い内容 |
委員のご意見 |
1.-1 |
第4期科学技術基本計画に掲げている「知識インフラ」の形成と、これをもとにした「データ科学」の高度化が情報科学技術分野として重要となっています。このための環境構築における重要な事項のひとつとしてアカデミッククラウド環境を検討する意義についてどのように考えるか? |
|
1.-2 |
1)~2)に関し、連携をすることによる具体的なメリットはどのようなものが考えられるか?本検討会においてどのようなゴール設定が適切か? |
|
2. システム環境の構築
上記1.のような考え方で、有機的に連携するデータベース等を、研究者が手軽に一つのシステムとして利用でき、効果的・効率的な研究活動を行うことのできるシステム環境のあり方、データを取り扱う際の倫理規範、及び環境構築について
|
ご意見伺い内容 |
委員のご意見 |
2.-1 |
アカデミッククラウドのシステム環境をどのように利用するのか。例えば、上記項目1のデータベース等の連携以外にあげられるメリットは何か? |
|
2.-2 |
アカデミッククラウド環境を構築する際に求められる全体システム・機能はどのようなものか? 本検討会においてどのようなゴール設定が考えられるか?(例:研究の観点、教育の観点、学生管理の観点) |
|
2.-3 |
技術的な課題として、既存の一般的なクラウド環境には存在しないが、アカデミッククラウド環境に必要となる機能やシステムとして、どのようなものが考えられるのか?また、そのような情報技術を大学等において(場合によっては産業界とも連携して)育てていくことの重要性についてどのように考えるか? |
|
2.-4 |
既存に学内のITシステム(学内LAN等)がある中で、アカデミッククラウド環境で新たに追加するに付加する機能にはどのようなものがあるか? |
|
2.-5 |
想定するシステムの規模感はどのようか?(日本全体をネットワーク化、地域の大学間の連携、大学内のクラウド化)求められるシステム要件はどのようなものか?(大規模な大学に導入することを想定or小規模の大学にも導入が可能) |
|
2.-6 |
データを取り扱う際の倫理規範について、情報分野として現在どのような問題点が認識されているか? |
|
3. システムを利用して行うデータ科学の高度化に資する研究開発
上記項目2.のシステム環境を活用して行うデータ科学の高度化に資する、情報検索、データマイニング、統計数理的手法等の情報科学技術の研究開発について
|
ご意見伺い内容 |
委員のご意見 |
3.-1 |
文科省・JSTによる研究開発の予算化を検討する際、民間や他府省の研究開発の状況も鑑み、どのような研究開発事項が考えられるか? |
|
花岡、山田
電話番号:03-5253-4111(内線:4286)