研究領域名:情報洪水時代におけるアクティブマイニングの実現

1.研究領域名:

情報洪水時代におけるアクティブマイニングの実現

2.研究期間:

平成13年度~平成16年度

3.領域代表者:

元田 浩(大阪大学産業科学研究所・教授)

4.領域代表者からの報告

(1)研究領域の目的及び意義

 データマイニングは、大量のデータからその中に埋め込まれている有用な知識を発掘し、問題解決に供すことを目的とするネットワーク社会の根幹となる新しい技術でありその有用性が期待されている。しかし、情報洪水とも言える処理能力を越えた多量のデータに溺れ、1)的確な情報監視・収集、2)目的にあった知識の発掘、3)状況変化に即応した知識の洗練への統合的な対応が出来ず、新しいパラダイムを発掘し、この状況を打破することが強く求められている。本領域研究では、アクティブマイニングという新しいデータマイニングの枠組みを提唱し、上記の3つの課題に対応し、1)自律的に必要な情報源を探索し前処理を実施するアクティブ情報収集、2)種々の構造を持つデータに適した柔軟なマイニングを実現するユーザ指向アクティブマイニング、3)理解しやすい表示と結果に対するユーザの積極的なフィードバック環境を提供するアクティブユーザリアクションの研究を実施し、3つの連携機能を実現する環境を構築する。具体的な問題として、医療データと化学薬品データを共通データとして取り上げ、専門家をマイニングのループに組み込んだ、上記3つの機能を統合した''科学発見のスパイラルモデル''を実践・実証し、領域全体で連携してこれらの課題が解決できることを示す。

(2)研究成果の概要

 専門家をループに組み込んだアクティブマイニングに必要な要素技術を開発し、肝炎データ、化学薬品データに適用し、有益な知識の発掘に成功した。1)アクティブ情報収集では、分散情報源からの効率的な情報収集、関連情報による発見知識のフィルタリング、前処理の自動化、メタ情報源の自動学習など、2)ユーザ指向アクティブマイニングでは、最適なマイニングアルゴリズムの自動構築、時系列データのクラスタリング・可視化・抽象化、時系列データの決定木学習、専門家が容易に関与し得る環境の構築、グラフ構造データマイニング、スパイラル的例外性発見など、3)アクティブユーザリアクションでは、知識の視覚化とクラスタリング、視覚化を通した専門家の主観的発見プロセスのモデル化、専門医が直接マイニングに関与できるインターフェイス、データからのシナリオ生成など、の要素技術を開発し、ソフトウェアを公開した。それらを連携させ、肝炎データの解析では、前処理、マイニング、評価のサイクルを知識発見のスパイラルモデルに従って回し、約90%の精度で約30種類の血液検査データのみから肝臓の線維化度を予測可能であること、肝硬変でアミラーゼが異常高値を示すなど医者の気づかなかった知識を発見した。化学薬品データ解析では、ドーパミン拮抗薬と類似化学構造を持つ高血圧治療剤を発見し、高血圧治療に伴う精神面への副作用の恐れを呈示できるなど、リスク警告が出来る知識を発見した。

5.審査部会における所見

A(期待どおり研究が進展した)
 本研究は、情報洪水時代に即した新しいデータマイニング技術として、アクティブマイニングを提唱、実証しようとするものである。二つの実例データを共通データとすることによって研究項目間の連携が図られるなど、領域内の有機的連携のもと、データマイニングの実用化の促進、グラフマイニングの研究潮流の創出といった具体的かつ有効な成果が得られている。また、ソフトウェアの公開を始め、成果の公開・普及も積極的に行われており、総括班のリーダーシップのもと、特定領域研究として期待される成果が十分に達成されたものと評価した。

お問合せ先

研究振興局学術研究助成課

-- 登録:平成23年03月 --