第9期学術情報委員会(第14回) 議事録

1.日時

平成30年11月29日(木曜日)13時00分~15時00分

2.場所

文部科学省15F特別会議室

3.議題

  1. 電子化の進展を踏まえた学術情報流通基盤の整備と大学図書館機能の強化等について
  2. その他

4.出席者

委員

喜連川主査、引原主査代理、赤木委員、安藤委員、家委員、逸村委員、井上委員、岡部委員、
北森委員、五味委員、竹内委員、谷藤委員、辻委員、永原委員、美馬委員

文部科学省

(事務局)千原大臣官房審議官(研究振興局担当)、原参事官(情報担当)、丸山学術基盤整備室長、高橋学術基盤整備室参事官補佐

オブザーバー

安達国立情報学研究所副所長、林科学技術・学術政策研究所上席研究官、小賀坂科学技術振興機構知識基盤情報部長

5.議事録

【喜連川主査】  それでは、定刻になりましたので、ただいまから、第14回の学術情報委員会を開催いたしたいと思います。
 前回は、研究分野ごとのオープンサイエンスの取組の現状を把握するという観点から、防災科学分野及び社会科学の分野の状況を御紹介いただいたところですが、今回は、もう少し違う分野ということから、農業の分野、そしてスポーツ科学、日本文学という三つの分野の状況を御紹介いただきながら、意見交換したいと思っております。
 琉球大学の玉城史朗先生。
【玉城教授】  よろしくお願いします。
【喜連川主査】  鹿屋体育大学の前田明先生。
【前田教授】  こんにちは。
【喜連川主査】  そして、国文学研究資料館の山本和明先生。
【山本教授】  よろしくお願いします。
【喜連川主査】  このお三方の先生に、お忙しいところ御参加いただいた次第です。
 なお、オブザーバーとして、国立情報学研究所の安達副所長、科学技術・学術政策研究所の林上席研究官、科学技術振興機構(JST)の小賀坂知識基盤情報部長にもおいでいただいております。
 それでは、まず、事務局より、配付資料の確認等をお願い申し上げます。
【高橋参事官補佐】  議事次第に記載しておりますとおり、配付資料として資料1から5まで御用意しております。不備がございましたら、事務局までお申し付けいただければと存じます。
 それから、本日の傍聴は、20名の登録がございます。傍聴の方々におかれましては、お持ちの端末に資料のダウンロードをお願いいたします。
 それから、配付資料1に、前回の委員会における主な意見を整理しております。時間の関係で、説明は省略しますが、意見交換の際に参考資料として御活用いただければと存じます。 以上です。
【喜連川主査】  どうもありがとうございました。
 それでは、早速、審議に入りたいと思いますが、まず、第一の御講演は、農業分野でのデータ利活用の状況として、琉球大学の玉城先生に御説明をお願いします。
 それでは、どうぞよろしくお願いいたします。
【玉城教授】  皆様、こんにちは。琉球大学の玉城です。この研究は、琉球大学の工学部、農学部と、そして宮古島のマンゴー農家と一緒に行っている研究で、今回私が代表して説明させていただきます。
 まず、発表の流れとして、研究の動機、マンゴー生産システムの研究開発、課題と解決策、そして現在までの成果、まとめとして今後の展望についてお話しします。ここで、マンゴーなどを育てるときに、データ収集がとても大切であり、我々は今、一生懸命データを取っておりますが、それは大変難しい問題があります。それは、ここは離島で、ましてや田舎の方でマンゴーを作っていますので、なかなかデータを集めることができない。実はADSLしか通っていないんです。また、そのデータをワイヤレスネットワークはほとんど使えないような状況なんです。それをどういうふうにするかというのが大きな課題になっていますけれども、それを一つ一つ少しずつクリアしていこうということが我々の一つの大きな願いです。
 マンゴーは、表作、裏作があります。本当はもっと深く研究したら、これは避けられるものだと思います。
 研究の動機を説明します。マンゴーは典型的な高コスト・高付加価値の果物で、不作になったときは、すぐ収入減に結びつきます。不作は、天候不順や台風などによります。2016年度、マンゴーの収穫量は大変落ち込みました。長雨、日照不足、11-12月の高温、1-2月の寒波など、不作の原因は大体分かっているんですけれども、これを環境制御すればどうにかなるのではないかと思い、そこから研究が始まりました。
 マンゴー生産システムの研究開発として、我々は早期の収穫、高収量、そしてまた高品質を目指そうと考えました。高級なマンゴーはとても値段が高いです。1個2,000円ほどで、A級品と呼ばれているものです。このような高品質を目指したらいいのではないかと考えました。
 そして、早期収量について、宮崎産は6月から出始め、最初はよく売れます。しかしながら、沖縄は収穫が6月中旬以降で、宮崎産より3週間ほどの遅れがあります。沖縄産が宮崎産と対等に戦うために、この差をどうにかしなければいけないと考えております。
 マンゴー生産にICTとIoTを導入することによって、労働力を軽減しようと、良質で高い歩留りを追求しようということを考えております。
 すなわち、これはセンシング技術とセンシングしたデータをフィードバックして、そして環境の制御に生かすというようなことです。
 ここで生育環境パラメータ、温度や、湿度や、日照など、それぞれの生育パラメータを収集解析することによって生産性の向上を図ろうと考えました。これが成功したら、次は、その他の果物や野菜の生産に適用可能であるとも考えています。
 そこで我々が今始めているのが、IoT及びその生育データの蓄積・統計解析で、より高度な生産システムを作ることです。
 良質なマンゴー生産に関与する環境要因として、まず、光合成を活性化するために、CO2の局所施用方式、そしてLEDが考えられます。沖縄は、全天日射が年に20日ほどしかありません。曇りの日が多いです。そして、その日射をコントロールしようというのが一つの目的です。また、マンゴーは温度にとても敏感です。ですから、秋の理想平均理想平均温度は20度から23度、冬の理想平均温度は20度から25度を目指しました。さらに、マンゴーは、A級品、B級品、C級品と等級が分かれております。これは色味と糖酸度、色味と味がほぼ比例します。こういうふうな色だったら味もいいということが分かっております。これは今までの沖縄県の研究でも、はっきりしております。
 生産者のノウハウを抽出して、それを制御系に応用するため、我々は第一段階として、減収をなくすこと、第二段階として育成期間の短縮を図ること、第三段階として収量増及び高品質をねらうことを考えました。
 そのために、生育環境を制御するためにIoTセンサを配置しました。そこで生育条件を模索して、画一的な生育条件を実現しようとすると、毎年ある一定の収穫が得られます。そして、次に継承するために保存技術を模索しようと考えました。
 マンゴーにCO2と水をかけると光合成が活性化しますが、活性化するためのエネルギーは光です。この結果が、2年目の結果です。CO2施用とLED補光の効果として、これは開花期ですけれども、こちらはCO2とLEDで光合成を活性化したもの、こちらは何もしないところです。対象区というのは何もしないところです。この時点で一月の差が出ました。我々はこれを本当にまぐれかなと思ったぐらいなんですけれども、これは実は蜂の巣箱です。こちらがLEDとCO2。こうした反射板があるんですけれども、これはマンゴーのおしりの方に均一に光が当たるようにしております。
 これで3週間、CO2とLEDを施用したところ、こういうふうな赤みが見られました。これはほとんどA級品です。こちらはまだ熟していません。完熟しておりません。これは去年のデータですが、A級品の収穫量は、CO2 and LED区間と、何もしていないところでは2倍ぐらい差があります。値段にして3倍ですから、2倍も収穫量の差があったら、単純計算すると6倍の収入が得られます。これはC級品ですが、極端にC級品が少なくなっております。何もしないところは、対象区は大分多くなっております。
 こういうふうにしてやれば、初期投資は別として、かなり高品質なものが得られるのではないかということです。
 次に、客観的評価、評価指標を作るため、我々は等級判別をやりました。これは、JA(農業協同組合)が提供している等級判別写真ですが、マンゴー農家は、自分の目でこの写真とマンゴーを比較することによって等級判別をしております。これははっきり言って、かなり客観性が失われます。そこで我々は、何か性質があるのではないかと考え、分析してみました。簡単なことですけれども、こちらをちょっと切り取って、RGBで分解してみました。これはA級品のものですが、横軸はRGBの輝度です。こちらは度数、頻度です。A級品においては、こういうふうなブルーとグリーンが重なっていて、赤が独立している、ちょっと離れている。A級品は、ほとんど青と緑が一緒です。B級品は、少しずれます。C級品は完全にずれていますが、こういうふうにしてマンゴーの等級判別が機械的に、一次判別ぐらいはできるのではないかと考えました。まさにこれはIoT技術です。カメラを置いておいて、そこにマンゴーを置いて、そしてヒストグラムで分ける。それでどんどん等級分けしていくという本当に簡単な方法ですけれども、これは結構肝になる技術ではないかと思っております。
 我々は、マンゴー生産においてプロジェクトを獲得したのですが、土壌水分、温度、光量子、画像データ、温度や湿度などのデータを大学と国立情報学研究所に蓄積して解析しようというようなことを考えております。
 そして、解析したパラメータを、今度は農家にフィードバックしようと考えております。これは農家専用のアプリですが、例えば、温度や照度や土中温度などを見られるようにしています。
 この果樹生産は、現場ニーズがあって、補光、制御をやって、データを解析して、システム設計して、センシングをして、またそれを返してやって環境整備に結び付ける、結果のフィードバックを行っております。
 現在、このマンゴーハウスに、時空間IoTセンシングシステムを考えているのですけれども、こういうふうにして配置しています。取ってきたデータを、農家が直接見られるようにアプリケーションを作って実験していただいています。
 これは一つの農家ですけれども、将来的にはたくさんの農家や選果場にアクセスできるようなシステムにして、データを取得していこうと思っております。
 そこで、本当に先ほども話しましたように、データがなかなか収集しにくい問題があります。田舎ですからADSLしか使われていない状況をどうにかしてワイヤレス環境でもっと強化できないかということが、今一番のネックになるところです。今はただADSLと無線LANの子局を結んで使っておりますけれども、それを是非改善できないかと思っております。
 最後にまとめます。今日は、マンゴー生産システムの構築ということで、成功事例をお話ししました。
課題として、生産施設がインターネットから孤立した場所であり、また生産者は過去のデータを活用していないことが挙げられ、我々はこのことを生産者に伝えていこうと思っています。
 生産者は、不作年は諦めるしかないと考えています。それをどうにかしなければいけないと思っています。
 解決策として、IoTセンサと広域ネットワークを用いた環境データの収集と解析、そして、そのデータを解析して、また制御に結び付けようと考えています。これは他の亜熱帯果実や野菜にも適用可能であると思っています。
 以上です。どうもありがとうございました。
【喜連川主査】  大変面白いお話をありがとうございました。
 それでは、質問はいかがでしょうか。
 どうぞ、安藤先生。
【安藤委員】  面白いお話をありがとうございました。今のお話を伺っていて、最後にあった無線のネットワーク構築の話は、総務省がまさに火の車になってやろうとしていることだと思います。電子情報通信学会で、各省庁の予算を編成する方が集まって話したときに、お互いの重なりと抜けがよく分かるような場になったものですが、農業の予算の話でこういう話も出てきました。それから、センサネットワークをどうやって作るかという話が総務省からも出てきました。ですから、こういう話は、是非いろいろなところに話すと、今の最後のところなどは、間違いなく、それは我々にやらせてくださいという話が出てくるのではないかと思いますので、是非そういう機会を増やしていただければと思います。「Society 5.0」はみんなでやらないとうまくいかないことですので。
【玉城教授】  そうですよね。
【安藤委員】  是非そうしていただきたいと思います。
【玉城教授】  はい、どうもありがとうございます。実は沖縄総合通信事務所には、今度SCOPE(戦略的情報通信研究開発推進事業)に応募したいと話しています。
【安藤委員】  はい、全くそのとおりです。
【喜連川主査】  安藤先生は電子情報通信学会の会長ですので、他で話すよりも、安藤先生にお話ししておけば、つながるのではないでしょうか。
【玉城教授】  はい、分かりました。どうもありがとうございます、安藤先生。
【喜連川主査】  ほかにいかがでしょうか。
 私が行ったときは、たまたま時期がずれていて、マンゴーが食べられなかったんですが、こういうIoTベースの農業が日本の中でうねりを生じているということを委員の先生方に体感いただけたのではないかと思います。
 先生、このお話は、今、マンゴーだと思うんですけれども。
【玉城教授】  そうですね、横展開を今考えています。ただ、マンゴーは、1年に1回しか収穫できないんです。費用が掛かるかもしれませんが、二期作みたいなものが、半年ずらしてできないかということを、今、夢の中で思っております。
【喜連川主査】  前にイチゴをやっている方もいました。
【玉城教授】  ええ、イチゴもやっています。横にいろいろ広がると思います。私がいろいろ調べたところ、香港やマカオで、マンゴー1個が5,000円ほどすることがわかりました。そういうものは、宮崎から東京へ、東京から香港に運ばれていますが、来年3月下旬、下地島という宮古列島の一つの島に民間のLCCを中心とした国際空港ができた後は、沖縄からすぐ輸出できるのではないかと探っております。
【喜連川主査】  岡部先生、いかがでしょうか。
【岡部委員】  非常に劇的に効果が出たお話を聞いて感動しております。ありがとうございます。
【玉城教授】  ありがとうございます。
【岡部委員】  この委員会は、研究データをオープン化することによって、オープンサイエンスを進めるのがミッションです。先生は研究者ですので、こういうふうにして集められたデータを公開することについては、多分、理解があると思うのですが、これを本当に農業に展開していったときに、農家の方々はこういうデータを世の中のためになるからと出すのか、それとも隣のハウスと競争しなければいけないから出したくないのか、どちらなんでしょうか。
【玉城教授】  まず、それはあるんですけれども、もし大きなプロジェクトができたら、農家にセンサなどを配って、そのデータを全部こちらで収集して、そしてそれを活用していこうと思っています。農家には、タブレットを配り、いつでも生育環境を観察できるようにするとともに、例えば雨の日だったら、ライトを照らすなどの操作までやりたいと思っています。
 沖縄県ではマンゴー生産のプロが3人ほどいますが、ノウハウを明かしません。
【岡部委員】  分かりました。ありがとうございます。
【喜連川主査】  岡部先生の質問は本質的で、農業は、利益に直結するため、漁業も同様に、なかなかオープンにはならないかもしれません。ただ、IoTをベースにしたデータ駆動農業を普及させていくことがまず一歩なのではないかと思います。
【玉城教授】  そうですね。実はマンゴーは農家にデータがありません。そのため、たくさんの農家からデータを集めてきて、収量と環境データを集めて統計解析した結果を積み重ねていけば、何らかの形で見えてくると思うんです。息が長い仕事ですが、ずっと続けていきましょうと言っています。蓄積したときには新たな生産方式が生まれ、そして安定なマンゴー生産ができると思います。
【喜連川主査】  工場があると、カーボンフットプリントが問題になる工場の横にはマンゴーを植えるのでしょうか。
【玉城教授】  そうですね。
【喜連川主査】  光はLED、CO2は工場から発生する。だから、マンゴーがあちこちにできるという夢を描くのは、おかしいでしょうか。
【玉城教授】  いえいえ、実は私がマンゴーを作って一番大変なことは、CO2の生ガスを買ってくることです。沖縄県では生ガスを作っておらず、福岡から運んできます。45キロで9,000円ほどかかり、2週間でなくなります。これはランニングコストが高いと思い、いろいろなところで、どこかでCO2を援助してほしいと話をしています。
【喜連川主査】  これは経済産業省のいう「Connected Industries」の非常に面白い典型例にもなっていくのではないかなと思っており、大変エキサイティングでした。
 井上先生、いかがでしょうか。
【井上委員】  農家からデータを集めるときに、データのオーナーシップというか、データ取引に係る契約はどうなっているのでしょうか。経済産業省ではデータの契約ガイドラインを策定しています。農家も今は先生だからということでデータを提供するということで契約など考えていないかもしれませんけれども、意識が変わってくると、データに係る権原について整理が必要になってくるかなと思います。
【玉城教授】  確かに農家はまだデータを大切にしていないので、データの大切さが分かったら、状況が変わってくると思います。
【井上委員】  そうですね。
【喜連川主査】  井上先生が指摘したことは非常に重要なところですが、私たちは文部科学省の委員会ですので、経済産業省が所管するような、民と民が一体で契約する枠組みとはちょっと違った、緩やかなものを作るということも、事務局と相談しながら議論を進めていきたいと思います。たまたまきのう、NTTの研究所について事前のお披露目会があったのですが、NTTは、ラスベガスのスマートシティをやっているそうです。このデータは誰のものなのだという、まさに井上先生がおっしゃった問題に対しNTTは何を決断したかと、つまり、原則、データはあなたのものですと。要するに、日本はいわゆるGAFAMと呼ばれているデータを取ってきて、それを独占するというビジネスモデルのまねをするのではなくて、違う切り込みでやっていく必要があると思うんです。なので、ラスベガスはそのデータで自分たちが利潤を得る、その利潤を得た段階のプロフィットのシェアリングをインフラ企業とやるというモデルを取ったそうで、そういう方がいろいろ受け入れられやすいのではないかなという気もするんですね。
 マンゴー農家とも、正面を切ってデータのオーナーシップがどちらなのだというのが、今の世の中の議論なんですけれども、文部科学省としては、井上先生のお力も頂きながら、従来のモデルではないモデルを是非作って、こういうことがもっと自由にできるような、そういう雰囲気こそが日本としては重要ではないかと思っておりまして、また議論の場をそれなりに設けさせていただきたいと思っております。
【玉城教授】  私は、現場の農家さんとは、常に仲よくすることを信条としています。
【喜連川主査】  そうですよね。
 よろしゅうございますでしょうか。
 先生、本当にどうもありがとうございました。
【玉城教授】  どうもありがとうございました。
 実は私、きょう、63歳の誕生日でして……。
【喜連川主査】  そうですか。
【玉城教授】  こういうハレの場で発表させていただいて、本当に印象に残ります。どうもありがとうございました。
【喜連川主査】  どうもありがとうございます。
 それでは、今度は、テーマが大きく異なりますが、鹿屋体育大学の前田先生から、スポーツ科学の分野に関しまして、紹介頂きたいと思います。
 3人の先生方が終わられた後、また共通の質問時間も取りたいと思いますので、何かありましたら、そのときにお願いいたします。
 それでは、前田先生、よろしくお願いいたします。
【前田教授】  鹿屋体育大学から参りました前田明と申します。どうぞよろしくお願いいたします。
 私の今日のテーマは、スポーツ界の話でして、スポーツのパフォーマンス、競技力を上げるということ、パフォーマンスを向上させることと業界では言っております。私たちは、アスリートのためのデータをたくさん取っております。そのデータは、当然ながら本人に返しますが、今後、どのようにオープンサイエンスとしてやっていけるか、きょうは私も勉強したいと思います。
 まず、私は鹿屋から来ましたが鹿児島県にある国立大学の単科の体育大学、国立の体育大学は一つしかありませんで、鹿児島にできました。鹿児島県の大隅半島というところにあります。ここまで来ていただくことはなかなかなかったんですが、鹿屋体育大学にスポーツパフォーマンス研究センターができてから、こんなところにもたくさんアスリートが来るようになりました。何といっても、2020年に大きなイベント、オリンピック・パラリンピックが控えておりますし、2020年は国体が鹿児島で開催されることも重なりまして、私たちは、今、大忙しでアスリートのためのサポートをやっております。
 スポーツパフォーマンス研究センターは、スポーツパフォーマンス研究という概念がスポーツ科学のところから更に突っ込んで、特にアスリート一人一人のデータを大事にしながら、その人が柔軟的にどうやって競技力が上がっていくかということを多角的に多面的なデータを取りながらやっています。
 国立大学にこんな大きなセンターができるというのも、できて3年目なんですけれども、できるときにも文部科学省に、私、ヒアリングに来た担当だったんですけれども、うまい具合に話が進みました。その後、オリンピックが決まりました。
 中はこんなふうになっています。スポーツのデータを取るのは、屋内競技であれば、いろいろな機器はセットしやすいのですが、屋外競技は難しいです。特に陸上競技や、野球、サッカーテニス、この4つの競技をイメージしながら、どんなパフォーマンスのデータが取れるかを鑑みながら作ってきました。
 きょうは、データ全部は時間がなくて紹介できないんですが、私たちが特に多く使っているデータを幾つか紹介したいと思います。
 私はこの後、スポーツパフォーマンス研究をSP研究と言うと思います。活用する主なデータのお話です。何といっても、ハイスピードカメラをよく使います。アスリートは、パフォーマンスがどんな形で、自分がどうなっているか、詳しく見ることができ、イメージができれば、どんどん解決していく能力を持っている方がおります。ハイスピードカメラのスロー映像やモーションキャプチャーも、先生方が御存じのとおり、いろいろな分野で使われておりますが、スポーツ界でもスポーツ活動の動作を三次元的に、三次元データとして見て、それを詳しく定量化して判断していく。上達具合を確認していくということでよく使います。
 それから、ボールの追跡レーダーですが、これは特にアメリカからメジャーリーグがすごく盛んになっていますので、投げたボール、打ったボールがどうなっているか、それが打撃やボールを使う競技だと、結局はパフォーマンスになりますので、その結果、どうなったかというのを詳しく測るようになりました。この三つを御紹介したいと思います。
 それ以外にも、例えば、フォースプレートというのは、このパフォーマンス研究センターに50メートル、1メートル四方で50枚並んでいるフォースプレートがあるんですが、フォース、力の板ですので、床に敷いてありまして、そこを走っていくわけですけれども、一歩一歩の軌跡が三次元データとして出てまいります。これも陸上の短距離の方、オリンピアンだけではなくて、パラリンピアンもたくさん利用しています。
 トラッキングのシステムは、これもいろいろあると思いますが、本学で使っているのは、例えばサッカーのフォーメーションに関して、俯瞰的に見られる、皆さんがセンサを付けて一斉に動いて、オフェンス、ディフェンス、どんな距離感で、どのくらいの速度でという研究を戦術面としていろいろやっています。
 また、SP研究、スポーツの現場ならではで、特に私どもが注目して大事にしているデータ、内省報告というふうに私たち言っていますが、いわゆる選手の感覚とか、コツとか、満足度とか、本人が話すことのデータを逃さずしっかり聞くようにしています。この辺のデータをどう活用していくか、どう分析していくか、是非ノウハウを先生方からお教えいただければというように思っています。
 では、具体的データですが、動作分析はスポーツ科学ではバイオメカニクスと言っています。力学的な分析をする形で、スポーツパフォーマンス研究はバイオメカニクスの手法を取り入れてパフォーマンスを向上させるという手法ですが、ハイスピードカメラも今はいろいろなところにあります。
 こちらはプロ選手から公開について了承を頂いたもので、どこの球団かもすぐ分かってしまいますけれども、これは500frame/secのハイスピードカメラで撮った映像です。このアスリートは、後ろから手の離れ、リリースポイントがどの辺で、スライダーというここからキュッと曲がるんですけれども、キュッと曲がって落ちるんです。ワンバウンドするようなボールです。私はずっと野球をやっておりまして、野球の方だったら分かるんですけれども、右バッターがこっち側に立って、このスライダー、ボールが来ますと、こんなにゆっくりだったらボールの軌跡は分かりますけれども、一瞬で来るわけですから、まず空振りするんです。ワンバウンドですけれども。確かに普通のカメラが30 frame/secの1コマ0.03秒のものが、0.002秒で1コマずつ分かっていくので、トップアスリートとしてはイメージがしやすい。もっとスローで見たら、いろいろなことをどんどん解決していき、リリースポイントが分かる。
 また、映像を撮ると、その後、映像処理を私たちもよくリクエストにお応えしてやるんですけれども、この映像は二つ映像が重なっています。余りそう見えないんですけれども、このピッチャーは、オフシーズンに来て、これもプロ野球選手で、これ、ボールが二つ重なるんですが、このピッチャーは、ストレートの直球と、変化球のカーブのボールを投げるんですが、動作が一定ではないと思っているんです。見破られているというので、リリースポイントで二つの映像を重ねてみました。こう見ますと、本当にエリートの選手になると、ほとんど再現性を同じようにできまして、この方は心配されていたんだけれども、絶対分からないと思います。ここから見て、頭の位置とか、グローブの位置、足の位置も全く同じように出てきて、キャッチャーの位置が違うので頭が二つになっていますが、リリースまでほぼ一緒ですので、やはりトップ選手になると、質の高い動作を繰り返しできる再現性が大事なんだなということも分かりました。
 これは女子プロゴルファーです。この仕事が多いかなと思うんですが、こちらは二つのカメラで、こっち方向とこっち方向からカメラがねらっていまして、これは同じ動作、こちらは同じ動作です。同じようにアイアンでスイングされるんですけれども、この違いは、上にある自己評価が5、いわゆる先ほど申し上げました自己満足度が5段階評価の5点が上で、下が3点です。私は何度も見も分からないんですが、この選手は、全然違うと言います。これは満足しているので納得いくスイングができました。これをいつもしたいです。こちらは、いつものくせが出て、ちょっと突っ込んだみたいな、前に突っ込んでいくみたいな、これが彼女のいつものくせみたいなんですけれども、よくあるくせは、こんなふうになりますというふうに言って、感覚的なことをたくさん言うんです。そう言うと、映像で見てパッと分かりませんが、ヘッドスピードとかを客観的に見てみますと、やはり言ったとおりで、満足度5の方が値としてはよくて、言ったとおりのことが出てくるから、データが出てこない現場で内省報告を取っても、多分合っているわけで、そこを大事にしていきたいなというふうに今考えてるところです。
 このように映像以外では、モーションキャプチャーでは、今、オリンピックが近くなりました。今は日本選手だけではなく、オリンピックを近くすると、他国のオリンピック事前合宿誘致を進めていまして、鹿屋市も鹿屋体育大学がありますので、タイの女子バレーボールが、もう契約をしたといいますか、調印したんですけれども、一度、パフォーマンスレッスンに来ました。今、鹿屋市や私たちは、バレーボールはタイを応援しようと思っています。
 いろいろ分析して、これも公開できるところはどうぞと言われたので出しているところです。皆さんのリクエストは、ブロック動作、バレーボールのブロックは、右にも行ったり、左に行ったりもするんですが、モーションキャプチャーデータを取りますと、セックピクチャーが描かれます。三次元なので、こうやって動いていきますけれども、どっち方向からでも見られます。また、スローにしていくと見えまして、これをこう見て、後ろ側から見てというふうに、今、右の手にマーカーを付けていますが、頭の位置ですとか、リクエストが来たら、やはりこれ、フィードバックがしやすいといいますか、分かりやすくて、選手とコーチがこの映像を見ながらいろいろディスカッションするわけです。私たちも入っていきます。このデータが入っていきますこの下に、これ、フォースプレート、きょうは余り出さないといいましょうか、これはフォースプレートを9枚使っているんですが、一歩一歩するときに力の波が出ていると、矢印が出ていると思いますが、このキック力が三次元で出ていて、このように表示しています。この中でも大量なデータが一つの試技にあって、この目的に関しては、左右差をなくすというミッションでいろいろ探ってまいりました。
 また、ナショナルチームのトップ選手でも、タイは今、日本よりも強くなってきたんですけれども、ベテランの選手はやっぱりデータが興味深いし、未熟なまだ新人選手はベテラン選手を共有してまねてドリルに使っていくというふうな使い方でモーションキャプチャーを使っております。
 また、今後最もオープンサイエンスとしてデータが公開されていくだろうというのが、まだできていないんですけれども、このドップラーのいわゆるTRACKMANという、これは商品名なんですが、メジャーリーグから飛び込んできたものです。ピッチャーが投げたボールの速度だけでなく、速度だけでしたらスピードガンがあったんですけれども、回転数や回転軸をドップラーの方式で測っているものです。
 例えば、こちらがストレートを投げると、上にTRACKMANがあり、数字が変わっていくんですけれども、そうすると、このように、データがTRACKMANにたまっていきます。1球投げると、このデータがどんどんたまっていくわけで、こちらから球速、これがボールスピード、これはマイル/アワーになっていますので、1.6倍すると時速何キロということになります。この球速は、当然ながら、手が離れたときに初速度が一番高く、それから空気抵抗にずっと当たって、ホームベースに来たときに62.7マイルまで下がります。減速量が5.8です。これ、空気抵抗で必ず減速はするのですが、そこはどうしたら減速しないでしょうか。テレビなどで言われている大谷選手の何キロというのは、初速度を大体言っています。それで打つときにはこうなるわけです。そこに関係するのが回転数でございまして、回転数が高いと、普通にストレートを投げて回転数が高いとグルッと回りますので、空気をうまく逃がす、空気抵抗を少し抑えることができて減速量が少なくなります。ですから、いわゆる伸びるようなボールと言われているのが、回転数が多いボールであろうとだんだん分かってまいりました。ですから、今は、いろいろなピッチャー、球速と回転数を上げることに注目している選手は多いわけです。
 そのほか回転軸、は5時15分と出ています。あとでこれを御説明します。これは滞空時間です。来るまでの時間。リリースポイントも分かります。リリースポイントの高さ、左右差、それと前方のどのくらい前で放したかなど、1球1球たくさんデータを出しています。
 先ほどの5時15分、軸の話なんですけれども、時間で12時と来ましたら真っすぐ、皆さんがピッチャーで向こうに投げるというイメージになりますと、真っすぐ回転すると12時と出てきまして、これが一番伸びるような、ホップするようなボールになります。ですが、右ピッチャーの場合は、右手から投げるので1時に出てきまして、左ピッチャーは逆に11時と出てきたりするわけです。こういうデータが1球1球出てきます。さっき、5時15分と出てきたのは、アンダースローのピッチャー、下から投げると5時15分で出てきます。
 これらを私ども、1球1球出てくるデータは、選手にフィードバックする場合は、これは鹿屋体育大学で簡単なフィードバック用紙として作っています。ストレートだけではなくて変化球も投げてきますので、皆さんのボールだったら、軸がこの辺にありますと、結局、到達点はこうなりましたという図を作ります。リリースポイントは、これはこのピッチャーを横から見た感じだと、この前後方向です。これは色別で球種が違うんですけれども、前で放すか、後ろで放すかという意味で、ストレートのボールは基本、前で放しますし、変化球は手前で放すということが分かっています。ここはこういう分布が分かります。こちらは後ろから見た場合、この右左に球種により差がある。これはバッターから分かるので、できればここは一まとめにしようと、この結果からフィードバックしてまとめていくわけです。
 そのほか、速度と回転数は、正の相関関係があることが分かっており、メジャーリーグでも公表されています。鹿屋体育大学で測ったデータも、ほぼ同じように出てきまして、時速140キロだと2,200回転以上は、やっぱりメジャーと一緒だなというふうに出てまいりました。いわゆる平均値で回帰直線を見ると、これが回帰直線ですので、ここに近い人は一般的な回転速度ということになりますので、一般的なタイミングで、予想どおりのタイミングで来る人で、ここから逸脱しますと、例えばこの方は、とても回転数が速いので、思ったより早く来る人だったりすることになって、今ここから逸脱させること、遅い方もそうなんですけれども、そんなふうな議論になっています。空間時間はこんなふうに出てきます。
 そこで、まとめとしまして、オープンサイエンスの可能性について、このようなデータは、まだ全然オープンにはなっていません。先ほどのTRACKMANは、日本に12台あります。プロ野球のメーン球場の11球団で、広島のマツダスタジアム以外、すべての球団が持っています。TRACKMANを保有する球団は、その球場でデータを取れるので、相手チームのデータもすべてわかります。日本プロ野球機構はまだ共通してデータを取っていませんが、そのうち取るようになるだろうと思います。現在は、各球団が民間の会社と提携してフィードバックをしており、相手チームが自分の球場で投げたデータを基に、いろいろな考察をしているようです。
 11球団と、もう一つあるのが、鹿屋体育大学です。
 データに関しては、基本的には個人データの取扱いですので、個人に返しています。ただ、オープン化に関して、今後の可能性として、アスリートの多くは、次の世代のアスリートにデータを使わせてほしいとお願いすると、基本的には了承いただけます。しかし、「オリンピックが終わってからにしてください」といった雰囲気があります。ですから、オリンピックまではちょっと慎重に扱う必要があるかと思いますが、その後は、オリンピックに、パラリンピックに出場したトップ選手のデータは公開していくような時代になっていくだろうというふうに思っています。
 また、このように1人に対してたくさんのデータを多角的に見ていくなかで、客観的なデータのみならず、先ほど申し上げたような、本人の内省報告や、選手やコーチの実践知も、次の世代に残したいと考えています。これらのデータの取扱いも改良していきたいと考えています。
 ただ、現在も何もしていないわけではありません。スポーツパフォーマンス研究は、一人一人のデータがこんなふうに工夫したらこうなり、こうやって上がっていきましたというNイコール1の例でも大切に扱い、スポーツパフォーマンス研究のWEBジャーナルで発表しており、公開からもう8年、9年たっています。この中で、個々人の大切な大量なデータは公表しているので、ここをもっと皆さんに知ってもらうような工夫をし、もっとオープンサイエンスの観点から、スポーツ科学も内省報告や実践知をうまく公表できるようになっていけばなというふうに考えて、きょう勉強しに参りました。
 私からの情報提供は以上です。御清聴ありがとうございました。
【喜連川主査】  大変面白いお話を頂戴できたかと思いますが、質疑はいかがでしょうか。
 はい、どうぞ。
【逸村委員】  筑波大学の逸村です。大変興味深く伺いました。
 最後の方でデータの客観性を担保する一方で、Nイコール1であってもデータをきちんと把握して、いずれ公開するというお話がありました。そうしますと、この委員会で度々話になるんですが、そのようなデータを扱うための技術及び人の育成は鹿屋体育大学でどうしているのでしょうか。
【前田教授】  例えば、今のデータを取得するための技術や教育について、鹿屋体育大学は幸いなことに定員が少ない少数精鋭の大学で、まず学部の1年のカリキュラムからスポーツパフォーマンス研究センターにおいて必修で、この辺の機器を使う実習が1年目から入ります。そこからカリキュラムの中にも更に興味を持った者は、学部2年、学部3年、学部4年、もちろん大学院の修士、博士というところで仕組みはできているかと思います。ですので、学部の4年の卒論でモーションキャプチャーは出てきますし、こういうデータはみんなでできるようになっています。ドクターを出た後にうちのセンターのスタッフとして働くなど、そういうところで本学もやっていますが、筑波大学ももちろんスポーツのところは得意なので、その辺の育成はスポーツ科学も着実にできているのではないかと考えております。
【逸村委員】  どうもありがとうございました。
【喜連川主査】  ほかにいかがでしょうか。
【引原主査代理】  どうもありがとうございます。先ほど、タイのバレーボール選手の話で、データが公開できるものと非公開のものがあるというお話をされたと思うんですけれども、それはやっぱりオリンピックとかのタイミングが中心なのでしょうか。個人的データは別として、結局、データは非公開か公開か、あるいは先延ばしするかという三つのカテゴリで皆さん考えるわけですけれども、スポーツの場合は、何が一番大きいのか、個人的なものが大きいということでしょうか。
【前田教授】  そうですね。個人のインフォームドコンセントを取るときに、公開か非公開か。特にトップ選手の場合は、先ほど先生がおっしゃったように、今は、オリンピック後ならどうぞという方が多い。多分、オリンピックが近くなって、ちょっとピリピリし始めたところがあるんですが、ただ、今のアスリートは、データを次の世代のために使ってもらうことは当然だ、区切りがついたら公開する、という方が多いと感じており、見通しは明るいと考えています。
【引原主査代理】  例えば、科学研究だと助成費が出た場合に、そういう研究データについてはオープンにしていきましょうという話になっているわけですけれども、スポーツ界でもやはり国費を投入してというのがかなり大きいと思うんです。そういうものは、実際にはオープンにしなければいけないというようなルール付けはできないのでしょうか。
【前田教授】  いや、可能性としては、やる方向が当然どの業界も、スポーツ界もそうだと思います。ただ、本人が本当にこだわって金メダルを取るか、銀メダルを取るかという話なので、本人の意向は絶対に大事にしたいと思っていますが、いずれ公開するという方向には皆さんあると思うので、昔ほどでは全然ないかなというふうに思います。
【引原主査代理】  ありがとうございます。
【喜連川主査】  はい、先生。
【美馬委員】  さきほどのドップラーレーダー式トラッキングシステムなんですが、どのようなデータを取ればよいのか、それとも、解析方法、どちらが重要なんですか。こういうシステムが入ると、同じ機器だと、取れるデータはみんな同じですよね。だからみんなで共有すればいいという話にもなりますけれども、研究として、もっとトレーニングして競争に勝っていくためには、取れるデータは同じで、でも、それをどう解析していくかが重要なのか、そもそも自分たちでもっと違うデータを取れるような機器自体を開発していくとか、そういうのは両方あるのでしょうか。
【前田教授】  現場で一番ニーズがあるといいますか、データはこのくらいデータができれば、アスリートとしては十分だと思っていまして、じゃあ、どうやったらスピードが上がるかとか、回転数をこうやりたいので、その間にデータは柔軟的に取っていって、パフォーマンスを向上させることが大事なので、最も大事なのはトレーニングのアイデアでして、ここを変えるためにこんなことをやりました。そうしたら、この1,800の回転数が2,000になりましたというところの間の実践知が必要でして、これはパフォーマンスを横断的に測ったらこうだったということですので、そこのノウハウは、きょうは全然お話ししていないんですけれども、そこのトレーニングのアイデア、新しいトレーニングに関わるグッズが入ってきたり、違うマシンが入ってきたり、そのようなことを組み合わせたらこうなったというところがスポーツ界では一番重要な情報なのではないかと。その成功例、失敗例をスポーツパフォーマンス研究で発表しているということです。
【美馬委員】  そうすると、例えばこういうシステムで取ったデータは、みんな公開してしまっても大丈夫ということですか。
【前田教授】  私は大丈夫だと思っています。
【美馬委員】  ありがとうございます。
【喜連川主査】  このジャーナルを拝見していますと、動画がついていて、とてもいいと思うんですが、生のデータそのものはここには入っているのでしょうか。一番元の、生のデータはどう扱っているのでしょうか。
【前田教授】  生データの公開も可能とは思います。生のデータを分かりやすく表示してジャーナルに出し、フィードバックしているだけであって、データは表に出ます。そのため、解析を一緒にするなど、コラボレーションをして、ローデータを共有していく。自分たちが弱い分野の方とはもっと一緒に研究していくべきで、データを公開することもできると思います。
【喜連川主査】  そうですか。
【前田教授】  はい。
【喜連川主査】  いかがでしょうか。
 五味委員さん。
【五味委員】  大変面白い話をどうもありがとうございます。今回見せていただいただけでも、1人の選手に対して、時系列的にも、種類的にも非常に多くのデータが必要になり、データがどんどん取れますが、それらをどういうカテゴリで整理されて保存されていくのかというのが非常に重要と考えています。我々は、タグを付ける発想になりますが、どういう工夫をしているんですか。
【前田教授】  まだ問題点が分からない状態で飛び込んでくるというのは、何がねらいか分からないし、どこがよくて、どこが悪いか分からないので、一から、例えばタグを付けたりするアイデアも含めてやらざるを得ないと思います。現実的には、今はそんな人は余りいなくて、特にトップアスリートになればなるほど、もう課題は明確になってきていまして、私の課題やコーチの問題はこういうところですと、議論をあらかじめしておいて、だったら機器を選んで、じゃあ、この機械を使いましょう、こっちを使いましょうとか、ビデオでいきましょう、モーションキャプチャーでポーズを踏みましょうとか、そんなふうになっていって、アスリートやコーチがすぐ分かる感じがいいので、課題は解決とか、問題点はこのままでよかったとか、そんな感じの仕事が今は多いというのが現状です。
【喜連川主査】  スポーツも民主化していく必要があるので、ピラミッドのミッド層を引き上げるという視点で見ますと、北見工業大学ではカーリングのデータ、鹿屋体育大学ではバレーボールのデータですが、方法論そのものは、共有できる部分があるかもしれません。そのデータをオープンにするという世界観は、スポーツ分野から見てどんなふうに感じますか。違和感のある話なのか、その方向に向かわざるを得ないと感じているのか、お伺いしたいです。
【前田教授】  その方向に向かっていると思います。今、例えばアスリートのデータ分析は、鹿屋体育大学もやっていますが、東京の国立スポーツ科学センター(JISS)がハイパフォーマンスセンターになっており、そこでトップアスリートがメダルに向かって取り組んでいます。パフォーマンステストも方法論が決まっていて、この方法でやりましょうと公開するようになって、JISSではこの方法でやっていて、鹿屋体育大学も北見工業大学でも、こういうふうな方法でやりましょうと、私たちも共有しています。
 ただ、うちの大学にしかないオリジナルの測定があります。それは別に隠しているわけではなくて、こうやっていますというのも論文やその他のところで公開しておりまして、アスリートの多角的なデータをいろいろ取っていくと思いますが、方法論は、例えば国立スポーツ科学センターができ、筑波大学が先駆的に引っ張ってくれたおかげで、大分そちら方向になっているというふうに今考えています。
【喜連川主査】  ありがとうございます。
 ほかに。
 北森先生。
【北森委員】  そうしますと、データの共有という意味では、国際的な共有システムも出来上がっているのでしょうか。
【前田教授】  まだできていないと思います。もちろん方法論が論文ベースで上がっているものでしたら、方法論を共有できますけれども、そこにとどまっていると思います。
 しかし、今度は東京でオリンピックがありますので、東京でやったノウハウを、日本のスポーツ科学に取り組む私たちがどんどん発信していくべきだと思います。そこも足掛かりに、次のオリンピックがパリ、その次がロサンゼルスと決まっていますが、そこの皆さんと絶対共有していくことになると思いますので、まだ道半ばですが、是非そうしていきたいと思います。
【北森委員】  ということは、まず国内で、それから国際的に、しかも個人の人に関する研究のデータを扱うことから、どちらかというと、医学研究領域の個人データにすごく似ている性質を持っていると思いますがいかがでしょうか。
【前田教授】  そうですね。
【北森委員】  匿名化処理もこれからでしょうか。
【前田教授】  匿名化というのは、秘匿でしょうか。
【北森委員】  データはオープンだけれども、それが誰のものか分からないようにするという意味です。
【前田教授】  そうですね。基本的にはそのデータが研究や論文を出すときには匿名化しています。本当にトップのデータを取ると、個人が特定できますが、今の流れではトップの金メダルを取った人も、データを公開していいというような時代になってきました。
【喜連川主査】  安藤先生。
【安藤委員】  こういう研究でデータに基づくとき、競技する人がロボットであれば非常に当たるんでしょうが、人なので、コーチングの仕方にもよるでしょう。どこまで練習したときに試合で一番いい成績が出ているか、という客観的なデータ取得や、脳科学に基づくメンタルトレーニングが盛んに行われているそうです。本当のトップの勝負になったら、多分そちらの方が大きいのではないかと思います。オリンピックで4回勝つのは普通ではできないことで、その間では、パフォーマンスを落としているのではないでしょうか。その点は、データは全部取り切っておらず、まだ何を測るのがいいのだろうと検討している領域ではないかと思いますが、いかがでしょうか。
【前田教授】  先生のおっしゃるとおりだと思いました。まず、トップ選手のメンタルから答えますと、本当にトップの方は、基本的にはメンタルトレーニングも大分済んでいます。安定したパフォーマンスも、最後はメンタルも含めてコンディションを整えられる人の勝負だなと思います。ですから、最終的には、その日のエネルギーやコンディションも含まれてくると思いました。ちょっと前までは、メンタルが弱くてパフォーマンスが発揮できないという方はたくさんいらっしゃいましたけれども、そこも大分介入されているというふうにトップの選手は思っております。
 そのほか、細かいデータは、僕らの機器は定量化ができないため、あとは実践知を話してもらう質的な研究はできています。アスリートの方は書くことが余り得意ではないから、話をしてもらい、あのときのあの瞬間を記録して、それをヒントに、次にその近い方に会ったら参考になるようにと残していくことがスポーツパフォーマンス研究で残していく仕事です。
【喜連川主査】  そこは一番難しい領域で、勝ってからの方が実はつらいとよく聞きますね。メンタルなフレームワークが多分まだまだ、確立されていないところだと思います。さてオープンサイエンスで、データの共有なんですが、特に健常者のスポーツで、大きなスポンサーのサポートがついている場合の影響は、どんなものでしょうか。
【前田教授】  あるとは思います。本当のトップ選手になると、メーカーや提供側も自分の会社を選んでほしいような感じもあります。
【喜連川主査】  ああ、そうか。
【前田教授】  アスリートの方が強いと思います。アスリートが強く言ったら、他のメーカーでやるとか、そのくらいの力があるとは思いますが、でも、現状であれば、そこもお伺いを立てるのは当然だと思います。
【喜連川主査】  ありがとうございます。
 ちょっと一旦ここら辺で御質問はよろしゅうございますでしょうか。
 先生、本当にエキサイティングなお話をありがとうございました。
【前田教授】  ありがとうございました。
【喜連川主査】  きょうはかなり多様な話になっていますので、頭の切替えも大変かもしれません。引き続きまして、また全然違う話題で、国文学研究資料館の山本先生から、日本文学分野の状況について紹介していただきたいと思います。
 先生、どうぞよろしくお願いいたします。
【山本教授】  国文学研究資料館の山本でございます。どうぞよろしくお願いいたします。着座して説明させていただきます。
 「日本文学とNIJL-NW project」という題で説明をさせていただきます。
 まず、日本文学研究とは何だということがあるかと思います。我々が対象としています古典籍というのは、こういう類のものでございます(パワーポイント参照)。見てどんなものか分からないかもしれませんが、下の方に示しています関孝和の『括要算法』などは、ベルヌーイ法よりも先にそれを発見したというので有名な書物。これも和算の研究者の人々によって、世界に向けて紹介されたということがあります。まだまだ日本の古典籍の中には可能性があるし、世界に先駆けていろいろなことを発見していたということなども広く知っていただけるような、そういう機会が必要なんだということです。
 そもそも日本文学の研究と申しますと、例えば、誤解されている方もいるかもしれませんけれども、まだ紫式部が書いた『源氏物語』が現在残っていると考えている人がいる。そんなものはもう存在していません。その中で元々の本文がどういうものだったかを探るべく、考えていくということです。作者の自筆本があって、それを書写していく過程で、いろいろな異本が派生します。完本が現存しているとも限らないし、意味を考えずに写している場合もあります。我々だって、人のノートを写すときになぐり書きをしてしまい、あとで読めないということを、多分、大学生の頃などに経験されているのではないかと思いますが、元のものにたどっていくテキストクリティーク、例えば聖書学のようなことをするのが日本文学研究の考え方にあります。
 ということは、各地にある書物を見て回らなければいけないということで、日本文学は足で稼ぐ学問でありました。私なども大学院生の頃、なけなしの金を使って東京にわざわざ出てきまして、三つ、四つどころか、五つ、六つ図書館を回っていくということをいたしました。そういう学問なんです。
 例としてここに上げましたのは、『更級日記』という作品です。菅原孝標女により平安時代に作られた書物で、文学史の中では有名な作品ですが、明治時代までは、これはとても難解な書物でした。意味がつながらないのです。それについていろいろ各地の図書館を回っていった研究者が、ある古い一本の書物に綴じ間違え(錯簡)があることを発見し、全ての書物がその綴じ間違えのあった書物から書写され流布していったものだと判明し、ようやく我々が『更級日記』の本文を読むことができたということがありました。
 こういった形の基礎的な研究の上に成り立っているのが日本文学の研究であり、現在、教科書などに掲載されているような本文などは基本的には存在をしていないのです。
 江戸時代の、印刷された書物であっても全く一緒のものはありません。同じ書名で、例えばこちらの方に『優曇華物語』という作品の画像を二つ挙げました。見て分かりますように、右側の方が最初に刷られたもので、後になりますと、(薄墨の)版木をケチりまして印刷していますので、途端に図柄が抜けてしまっているところがあります。このことから判りますように、『優曇華物語』という作品名で検索し、実際に図書館で閲覧してみたら、実は後刷りのものでしかなかったというような、行ってみて損をした経験は誰しもあるところです。
 日本文学の研究の場合には、―30年ほど前でありますけれども―まず言われたのは、文庫訪問の心得だとか、集書の心得でした。今でもそうなのですけれども、未だに資料閲覧のかなわぬ機関なども非常に多くございます。
 昭和47年に国文学研究資料館が、―現在私が所属している機関でありますけれども―日本文学及び関連資料の専門的な研究機関として設立されました。国文研も古典籍を多く所蔵しておりますけれども、特に各地の図書館の蔵書などを、マイクロフィルムや、紙焼本という形で収集をして、国文研に来れば各地の本を苦労せずに一堂に見ることができる、そういう機関として設立されて、はや50年近くになるのです。
 こうした経験値の中で、我々が作り上げていったデータの中に、岩波書店が作りました『国書総目録』を継承したデータがあります。『国書総目録』というのは昭和30年代、40年代に刊行されました。戦前から戦後にかけて、各地の図書館が刊行していた蔵書目録のうち古典籍を集約したものです。それを更に増補して『古典籍総合目録』を冊子媒体で作ったのが国文学研究資料館です。現在では、それらをデータベースとしてウエブ上で「日本古典籍総合目録データベース」として日々追加しながら公開しています。
 このデータベースのすごい点は、―我々が自負しているところでありますけれども―国文学研究資料館がこれらのものを継承しながら「著作コントロール」をしているところです。各地の図書館は、自分のところのデータをそのまま公開します。そこに書かれている書名はそのままで公開する、それが当然だろうと思います。でも、写していく中などで書名が変わっていくものもあるのです。
 例えば、こちらに挙げておきましたように、『石清水物語』という形でくくった作品ですけれども、ある図書館では、『正三位物語』と書かれ、あるところでは『岩清水』とだけ書かれている。それらの中身を見ながらコントロールし、一つ一つ結び付けて、書名のゆれや著者名のゆれ、―著者名もいろいろなペンネームを使っている人たちもおりますが―それらをコントロールしているのが、このデータベースの強みであり、世界から見ても非常に画期的なデータであるといえると思います。国文研は、所在情報と書名、著者名などのデータをずっと蓄積してきたのだということなのです。
 ただ、日本文学研究を顧みますに、実に難しい点があります。先ほど申しましたように、その場所に行かなければいけないということです。つまり、極端な言い方ですが、日本文学研究というのは、多くが検証されざる研究に過ぎないのです。
 日本文学研究は書物を基本とします。その論文中には、断片的な本文引用をします。それで論を構築していきます。
 そうすると、じゃあ、そのことを検証しようとしたらどうしたらいいでしょうか。もう一遍同じ手続をする。あるいは、それが国文学研究資料館に納まっていれば国文研に見に行くということをして検証しなければいけない。途端に検証に怠りがちになっていくということがありますし、なおかつ、そういうことを面倒くさがる研究者たちもいたわけで、活字になっているものだけを研究対象にするということがありました。
 パワーポイントの下のところに挙げておきましたけれども、写本、古き時代には、人は書物を写しておりました。その次に版本、つまり印刷です。桜の木の板に彫って刷ってという形の版本というものがございました。明治時代には多くが活字本になりました。戦後の段階で新旧漢字という形で旧漢字のものから新漢字に変わっていく。慶應大学の「應」という字が書けない慶應大学生がいたら困ってしまうのですけれども、その「應」という字も旧漢字の側になるかと思います。今またデジタルの時代になっていますが、これらの一つ一つの段階で淘汰されている書物がたくさんあるわけです。情報の淘汰がなされていく。
 その中でどんどん研究もできるだけ安易なところで進めていくということをしていきますと、縮小再生産の研究にならざるを得ない。そういった点を、我々はいろいろ考えなくてはならない。
 例えば、国文学研究資料館ができて、今は東京の立川にありますけれども、東京に一極集中した形でそういう書物とかデータがたくさんある。紙焼本、マイクロフィルムがあるとなると、地方にいる人間は、東京にわざわざ行ってその本を見なければいけない。手順に奔走しなければいけないということも加わります。
 例えば、論文に書き、そのなかに画像とかいろいろなものに使いたいと思っても、所蔵する図書館側が認めてくれないということがあったりします。実際には一旦見に来てくれないと、紙焼きとか撮影も許しませんよということもあります。モノは不変だから、デジタル画像だけでも自由に使えたらいいなと思うわけで、私自身は、この9月までは、国文研のなかの「古典籍共同研究事業センター」で「NIJL-NW project」を推進する立場にありましたが、まずプロジェクトの目指した方向性は「オープン」ということでした。
 すなわち足で稼いでしなければいけないような学問の状態を開放するということ。持つ者持たざる者、つまり、地方にいる人にしてみたら、お金がなければ東京になど来られないわけです。持つ者持たざる者の差を縮める、金銭的にも時間的にも情報の面でも。あらゆる分野で対等な研究環境を確保するということ。特に海外の研究者の人が夏になって国文学研究資料館にやってきて、紙焼本を見るなどという状態を解消しないと、研究なんて進まないだろうということです。
 また、近年、ウエブ環境の発達の中で、デジタル化が世界各地で行われています。ヨーロッパでは「Europeana」というのがありますし、アメリカなどでも「HathiTrust 」をはじめとして、様々なデータが公開されています。
 下のところにグラフを示しました。ちょっと分かりにくいと思いますが、中国の「CADAL」などは、国家的プロジェクトとして、古典籍など様々なものをデータにしております。大英図書館も同じくであります。
 日本では、それらが進んでいなかった中で、2014年4月から、人文社会科学分野初の大規模学術フロンティア促進事業として、「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」、略称「歴史的典籍NW事業」という形でスタートしたのが、我々が進めてきた事業ということになります。
 その実施体制としては、国内の関連機関、東京大学、京都大学をはじめとした機関並びに海外の大学等々とも関係を持ちました。さらには、MOUを結んだ国立情報学研究所や様々な機関から情報なども得ていきながら、現在も進めているところであります。
 10年プロジェクトで進めている内容ですが、まず目標にしておりますのは、30万点の画像データの作成ということであります。30万点の古典籍の全冊画像を作る。1点の数え方は、例えば『南総里見八犬伝』という書物が全部で106冊ありますけれども、それでも1点というカウントの仕方をいたします。それらの全冊の画像を公開していくというので、「新日本古典籍総合データベース」というものを構築しています。現段階で9万5,000点の画像を今年度末に公開します。1枚ずつというカウントの仕方をしますと、大体1,250万コマ以上の画像が公開されますし、書誌データについては、『国書総目録』以来のデータ60万点を公開しています。それらにタグを付与するなどして、現段階では、この年度末に30万タグが付与される予定になっているところです。
 「新日本古典籍総合データベース」等々の中では、書誌からの検索並びに画像データのタグからの検索、テキストからの検索ということが可能となっています。
 なお、利用状況ですが、1か月当たり、目録データベースと合わせて、現在月平均30万ページビューで、推移しています。
 タグの付与という点において、研究者コミュニティの協力を得ているところであります。高度専門員制度を設けて、関係学会と書面を交わす形で進めておりますし、さらには、日本の古典籍などは、私自身も蔵書家の一人なのですけれども、それらを多くの研究者に提供してもらうことで撮影に協力してもらうということもしています。
 データベース並びに事業の基本的な考え方は、「だれでも自由に、無料で・登録なしで」使えるということです。古典籍を研究する人間は、ごく限られていた範囲でありますけれども、この状態のままですと学問が衰退してしまいます。自由に使えるような状態にすれば、使いたい人、使おうと思う人がもしかしたら潜在的にたくさんいるかもしれない。よく図書館関係者の方々には、「秘蔵・秘匿は死蔵」にすぎないんだということを繰り返し言い続けております。
 もう一つは、画像として公開する以上、それをどう使ったらいいのか、許諾の点が研究者は一番困ってしまうわけなんですね。この画像を使っていいのか悪いのかも分からないという状態が難儀な訳で、利用手続を明確にする。可能な限り、自由に利用しながら、そして論文に引用してもらったり、出版してもらったりしましょうよと。そのためには、例えば日本で何かルールを決めても世界には通用しませんので、現段階では、クリエイティブコモンズ表示を我々は導入しております。多くが所蔵機関への許諾申請なしに使えるというルールです。
 日本の古典籍は、既に著作権もないんだから、パブリックドメインだという考え方があります。しかしながら、古典籍の場合、先ほど申しましたように、同じ書名であっても、その1点1点が全然違うように、どこの所蔵の本なのかということは非常に重要なので、パブリックドメイン表示よりはクリエイティブコモンズ表示という形で、所蔵先をあらわす「BY」、例えば「CC BY」という形などで所蔵機関を明示することを推奨しながら、今は進めているところです。
使いやすければ誰でも使ってくれます。一例として、三越伊勢丹での料理のイベントにも使っていただきましたし、昨年の正月の『婦人画報』などでも、この「かわいい琳派ステンシル」という付録で、―これ実は国文学研究資料館の画像を使っていただいたのですけれども―こんな形で古典籍に少しでも興味を持ってもらったら良いという考え方をしています。
 もう一つ大事なことは、ウエブ上での公開をしていく上で、いつ見ても確認可能であるという「結果の安定性」ということなのです。研究に使うということを考えておりますので、当然のことながら、それらはいつ見てもその画像にたどり着けるということが必要となります。そのために研究データと位置づけ、DOIを付与するということをいたしております。我々もJapan Link Centerの正会員になって、付与することが可能な機関になっております。
 さらに、それを推進するために、図の真ん中のところに示しておりますように、研究者向けに「DOIを論文に書きましょう」というようなパンフレットも作りました。既に右側のように、岩波書店の文庫本の中などにDOIを付与した形で提示をしてくれているということがあります。
 四つ目として、ストレスフリーなビューワとして、これはこの委員会の場でも何度か出てきていると思いますけれども、IIIFのビューワを採用しているということです。そうすることによって、自分の機関だけでのものではなく、ほかの機関のものも取り込みながら見ることができる。例えば図のような形で海外の図書館の画像を表示することができていく。そうすることで、どんどんネットワークが広がっていくのではないかということを考えています。
 加えて、国文学研究資料館のデータベースは、国文研のホームページに来ないとみることができないわけで、これだと日本文学関係者以外に広がりようがないので、国立情報学研究所のCiNii Booksとの連携や、「Japan Knowledge」という、いろいろなデータベースを提供している企業と連携しながら進めているところです。
 古典籍に関する大型プロジェクトを進めていく中で、オープンデータという考え方については、情報・システム研究機構の中に「人文学オープンデータ共同利用センター(CODH)」が設立されておりますが、そちらと共同で、三つのオープンデータに関する取組をいたしました。
 まず、「研究者のためのオープン」ということで、日本古典籍データ3,300点を一気にダウンロードできるような形にしています。
 例えば、先ほど言いました『南総里見八犬伝』106冊、これ、1冊1冊ダウンロードしていたら手間なのですけれども、一つのzipファイルにまとめてしまいダウンロードできるという環境を作り上げたということです。
 さらには、「機械のためのオープン」という形で、くずし字の字形データを作りました。公立はこだて未来大学の寺沢憲吾先生などと、くずし字認識に関する研究も現在進めているところでありますけれども、そうした文字認識などの研究者の方々に向けてということであります。くずし字の1字1字を切り取ったくずし字データもオープンにして、今のところ70万字を公開し、将来100万文字を公開していきましょうということでやっております。これまでですと、パターン認識、文字認識などを研究する人々からすると、この1文字1文字が、どこまでが1文字なのか判断できなかったのです。また、1字1字を切り取るのにアルバイトを雇わなければならなかったものが、無料で公開されることで、研究を促進する側面も非常にあるわけで、そういったことも考えて進めました。
 最後に「市民のためのオープン」ということで、江戸料理のレシピのデータも公開した、ということです。
 オープンにしたことによって、いろいろな研究が進んでおります。CODHの方では、版や刷の分析、キュレーションによる「顔貌コレクション」の取り組みなども進みました。
 日本だけではなく、ヨーロッパなどでも特にオープン化が進んでいますので、「デジタル人文学」というような取り組みが進められています。オープンなビッグデータがあれば、1作品1作品の細かい分析よりも、多くの作品を横断的に、例えばある時代の作品群を横断的に分析していくであるとか、そういう様々な研究が行われていまして、「ディスタント・リーディング(遠読)」という言葉で、―現在私どもが注目しているところですけれども―非常に大きな世界的な視点で文学を研究していこうという取り組みにおいても、オープン化というものが重要になっていくだろうと思います。
 オープン化による研究の利活用という点では、異分野融合研究として、国立極地研究所と、古典籍を用いて、オーロラについての共同研究をしましたし、シチズンサイエンスにつながる取組として、今年度は、京都大学の附属図書館で、「『古典』オーロラハンター」というイベントなどを我々の取組としてさせていただきました。とにかく市民の人々を巻き込んでいこう、古典籍に興味を持ってもらおうということであります。
 料理に関しては、図にありますように様々なイベントも開催され、古典籍が身近になるような形で、中高生も含めて種々取り組んでいるところであります。
 最後に、日本文学における今後の課題をいくつか挙げたいと思います。要するに、くずし字などで書かれておりますので、テキスト化の問題、機械可読のできるテキストへの変換という問題があります。西洋、ヨーロッパの場合には、OCRに掛けて、既にデータ化されているということがあって、その中で研究方法が変わってきています。
また画像データに関して、これも保存が非常に重要になってまいります。1枚当たり1.5メガバイトから3メガバイトという画像データを30万点という形になりますと大量になります。大型プロジェクトが終わった後に国文学研究資料館が維持できるかという非常に大きな問題がのしかかってきているところであります。更に言うと、誰が撮影するのかという問題もあるわけです。
 こうした問題は解決していかねばなりませんが、むしろ日本文学分野において今後問題になってくるところで申し上げておきたいのは、研究論文のデジタル化の問題だろうと思っております。実は、学協会などで積極的にデジタル化に取り組んでくれているのですけれども、日本文学の研究は、現代の研究論文だけ見ていたらいいのではなくて、古い論文にも非常に意味を持っているのです。古い論文でしか分からない情報もたくさんあります。つまり、戦中戦後の段階でなくなってしまった書物に関しても、論文の中に触れられている重要な情報もある。じゃあ、それを誰が遡及してデジタル化してくれるのか。現在進められている論文のデジタル化などは、J-STAGE等で進められていますが、その中でよくあるのがマスキングの問題です。引用画像について、所蔵者の許可を得ていないからマスキングを掛けられてしまっている。一方で、各地の図書館が古い雑誌の廃棄をしていきます。そうすると、マスキングにより情報の欠損のあるものしか残されていないという問題。
 もう一つ申し上げますと、海外とのネットワーク、例えばフリーア美術館であるとか、ケンブリッジ大学であるとか、いろいろ日本の古典籍の画像を出してきております。この大型プロジェクトは日本国内のという形で進めましたので、これらとの連携についても、今後どうつなげていくのかというのが、今、課題としてあります。お話としては以上となります。
【喜連川主査】  どうもありがとうございました。
 それでは、今の山本先生の御発表に関して……。
 では、井上先生、お願いします。
【井上委員】  クリエイティブコモンズの表示について伺います。クリエイティブコモンズ利用手続の明確化のために、CC BYを活用しているかと思いますが、御承知のとおり、厳密に言いますと、クリエイティブコモンズというのは、これは著作物に著作権者が付す表示ということになります。古典籍を正確に撮った写真については著作物ではないということになろうと思いますので、本来の意味でいうクリエイティブコモンズの対象にはならないと思います。
 こうしたアーカイブに関連して、昨年の秋にEUのEuropeanaなどが、ライトステーツメント、文化資産を所蔵している機関が付けるマーク、権利関係がどうなっているかを示すようなマークを表示することを提案してきます。クリエイティブコモンズをもっと活用していこうというご報告でしたが、文化資産の所蔵機関によりふさわしい表示を活用するということもあり得ると思います。その辺はいかがでしょうか。
【山本教授】  はい、重々承知しております。クリエイティブコモンズ表示を使っているというのは、一応、便宜的な側面もございます。世界的に通用する側面ということがあり、実際には「パブリックドメインBY」というのがあれば一番よろしいのだろうと思うのです。我々研究者としては、とにかくBYがないと、どこに所蔵されているのかというのがないと元に戻れないという状態は一番まずいと考えておりまして、今後これらのマークについても、国際的な中での合意形成の中で、違う形になっていけば、それに一気に変えること自体も考えていかなければいけないだろうと考えております。
 要は、今、パブリックドメインと言いながらも所蔵機関についてはできたら書いてください、といった曖昧な状態を何とか解消していかないと、これらのものは困ってしまうというところなんですね。
【井上委員】  よく分かります。クリエイティブコモンズはかなり浸透していますし、それを便宜的に使うというのはよくあることです。これから文化資産の所蔵機関特有なものがヨーロッパを中心にできてくるだろうと、定着してくるのではないかと思いますので、是非そちらへの乗換えといったことも考えられるわけですね。
【山本教授】  はい、情報などは重々。
【井上委員】  よろしくお願いいたします。
【山本教授】  やりたいと思います。
【喜連川主査】  ほかにはいかがでしょうか。
 竹内先生。
【竹内委員】  千葉大学の竹内でございます。大変広範な情報を提供いただきましてありがとうございます。
 多分、最後の方にあったんじゃないかと思うんですけれども、グローバルな流通という観点で日本語資料の場合にどう考えるかというのがやはり大きな課題だと思っております。その中にローマ字化ということがありますけれども、例えば、グローバルに使われているOCLCのデータベースなどは、タイトルがローマライズされてもほとんど語の区切れがないままになっているという問題があって、例えば、国立国会図書館とか、ほかのいろいろなローマ字の分かち書きをしているデータベースとでは、検索したときにほとんど一致しないというような問題が出てきてしまったりしているんですけれども、そういったことについては、これからどういう活動を期待されていらっしゃるのでしょうか。あるいは、何か活動をお考えでいらっしゃるのでしょうか。
【山本教授】  ローマ字化に関しても、特に多言語対応ということについては、我々がプロジェクトを進める上で求められておりまして、立命館大学のアート・リサーチセンター等々が海外にいろいろ請負等々でやってきた経験があるので、それと共同研究を進めておりました。
 そうした中で、まずローマ字化そのものも米国議会のローマ字にしてくれというふうにアメリカの方の司書団体から言われ、いろいろ課題もあるわけです。その点で言うと、多様な対応ができるような変換のツールのようなものの研究開発も進めているところです。
 ただ一方で、単語の区切れ目が本当に難しく、我々自身も切れ目がどこなのかがときどき分からないような書物も、実際出てきているのも事実です。それらのことについても、『国書総目録』以来のナショナルカタログを我々が担っている以上は、ちゃんとしていかなければいけないという、そういう方針ではおります。
【竹内委員】  ありがとうございました。
【喜連川主査】  グラムじゃいけないんですか。
【竹内委員】  きちんとローマ字化されていれば、スタートはそうだろうと思います。まず、されていないものが多いということと、現時点では、異なるデータベースで全く異なるスタンダードになってしまっているので、相互に検索が非常に難しいという問題はあると思います。
【喜連川主査】  何となく、くずし字に比べれば、何とかなるかなという気がします。
【竹内委員】  そうですね。
【喜連川主査】 引原先生。
【引原主査代理】  どうもありがとうございます。京都大学でもこのプロジェクトでお世話になりまして、どうもありがとうございました。
 おかげで、その機運がいろいろな大学にも伝わって、IIIFのフォーマットでの共通化が進んだと思うんですけれども、その後どこを目指すか、皆さん悩まれていると思うんです。その辺はどういう御意見ですか。
【山本教授】  IIIFという形で公開されて、じゃあ、それをどう分析していくのかのツールであるとかの提供というところになると思います。その点に関しては、例えば、先ほど申しましたCODHではIIIFキュレーションビューワというのを作っていただきまして、これなどは、例えば絵画などの絵の部分などを切っていきながら、それを研究発表の場に使えるビューワとなっています。IIIFそのものは、図書館関係者が作ってきましたけれど、そこから研究者が利用できるようなツール類ができている。ここに例えば国文学研究資料館がどう関係するんだという問題ですけれども、流れに任せていくと言うほかない。大型プロジェクトを進める中で、情報系の先生方、特に国立情報学研究所をはじめとした先生方とかと交流していく中で、こういうものが研究者は必要なんだというような意見交換がいろいろな分野の方々と進んでおりまして、じゃあ、それをどうしていったらいいかねという話はできてきておりますので、その点は余り心配していないというか、まずは基盤整備という側面が非常に強いのが、この大型プロジェクトなのかなと考えております。
【引原主査代理】  もう1点お願いしたいんですけれども、今のIIIFフォーマットに皆さん変えていく状態というのは、各大学、図書館関係者が物すごく寄与されていて、レベルの高さはそこで示したと思うんです。同時に、次の世代の人たちを育成するというのを国文学研究資料館あたりで何かやられるということはないんでしょうか。
【山本教授】  それは情報学的な側面でしょうか。それとも古典籍講習会という形で、古典籍に関するものは既に……。
【引原主査代理】  そうですね、今申し上げたのは情報学的な観点です。
【山本教授】  多分、国文学研究資料館での情報系の研究者がそもそも非常に少ないので、このあたりのところは、喜連川先生がおいでですので、国立情報学研究所あたりと何とかタイアップできればいいかなというふうに考える次第でございます。
【喜連川主査】  私ども非力かもしれないんですけれども、御一緒させていただいて、大変有り難いと思っております。
 素人質問なんですけれども、古典籍総合目録、あるいは古典籍総合目録データベースは、これは大分前からあるのでしょうか。
【山本教授】  はい、大分前から、『古典籍総合目録』というのを作った段階ぐらいから、もうずっとデータにしておりまして、それを「目録データベース」という形で公開しているのですが、私もまだその段階には国文学研究資料館に在籍しておりませんので、何年前かは不確かなのですけれども、かなり前からだったかと思います。それに大型プロジェクトでは古典籍の画像もつながって見られるような形になったというのが今の状況でもあります。
【喜連川主査】  撮影複写をやっている中で、この2014年からNIJLのプロジェクトが開始されたという理解でよろしいですか。
【山本教授】  従来は、国文学研究資料館に集約する形で、マイクロフィルムであるとか、紙焼きという形にしてまいりました。データベースとしては公開していたけれども、単に所蔵情報であり、それがマイクロフィルムの番号とか、請求番号とかの情報だけがあって、国文学研究資料館に来て、マイクロフィルムを見るという状況であったものが、できるだけウエブ上に画像を公開していこうというふうになったということです。
【喜連川主査】  そうですね。この長い年月に係る努力の経験をお伺いしたいと思っています。要するに、段階的に進んで誰でも自由に使えるようになってきたと思うのですが、逆に言うと、そういうリソースを使って研究をしている方々の、どういうメトリクスがいいか分からないんですけれども、研究が加速されていることが見せられるといいかなと思います。
【山本教授】  私どももそれは願っています。ですから、論文の中に明示してほしいと。我々が大型プロジェクトをスタートしたときに、まず言われたことは、これまで当館のデータベースがどれだけ使われているのか。要するに、研究者は国文学研究資料館でマイクロフィルムとか紙焼きを見た場合、論文には、紙焼きになった元の所蔵機関の本だと書いても、国文学研究資料館で紙焼きを見たと書いてこなかった経緯があるんですね。今回、DOIを付与するというような形を進めていこうとしておりますのは、それを見える化していかないと、こういうデータベースを使ったことが書いてもらえない。そうしたことも含めて、今、啓蒙的な活動を各学会等々で進めているところでございます。
【喜連川主査】  書こうが書くまいが、研究活動そのものがより活性化されていることは、国文学資料館の成果なんだと言ってしまえばいいように思うんですけれども、いかがでしょうか。本当に非常にナイーブな質問なんですけれども。
【山本教授】  大変ナイーブなところもありますが、実際に使われていること自体は確かでありますので、そこはそうなんだと思います。ただ、難しい答え方になるとは思いますけれども、少なくとも今回、大型プロジェクトの中で、国文学に関してはある程度進んでもきておりますけれども、ほかの分野のものなどを広げていくことによって、むしろ古典籍というものを使った研究というのが、いろいろな分野の先生方の中に広がってきたということは少なくとも言えて、研究者人口、文学という分野ではなく、古典籍利用の研究者の層は増えてきているということはいえるかなと思っております。
【喜連川主査】  そうですよね。何かそこが分かると、少なくともダウンロードもありますけれども、ページビューだけでも大分……。
 なぜこういうことをお伺いしているかと申し上げますと、確かに先生がおっしゃったように、資料を得るまでのオーバーヘッドが大きいという、直感は多分そのとおりだと思うんです。ただ、現実に研究することの方の時間も実は非常に長いのも事実だと思います。
【山本教授】  そうです。
【喜連川主査】  その割合が、一体、何対何なのだろうかと。つまり、前のオーバーヘッドの部分、これは限りなく小さくしてほしいというところが、実は多数のように見えても、そこをゼロにしても、実は結構後ろの方が長かったということも見える可能性はあるかもしれなくて、それはある意味で学問の深さなので、決して悪いことではないわけですよね。その辺が、もし経験値として出てくると、非常にいいんじゃないかなという気がするんです。
【山本教授】  経験値として、このあたりのところを数値化するとか、形にするのは非常に難しいんですけれども、我々はどうしても、例えば1780年代の書物を全部見てやろうであるとか、そういうことをする中で問題意識が出てきたもので論文にするとなると、やっぱりそれなりの時間が掛かります。従来は、それが自分の興味のあるものだけつまみ食いしかできなかったものが、ウエブ上に公開することによって、時間がある限り、見ていくということが可能になっている。まだ大型プロジェクトが始まってまだ5年足らずですし、この画像公開が始まってまだまもない時期でありますけれども、少しずつ論文の質が変わっていくだろうということも考えています。
【喜連川主査】  そうですね。だから、キャンベル先生とお話ししていても、多分もっとバッチ的な解析が何か期待を持たれておられるような気がしまして、是非そこら辺がやれれば。
 また、ある肩書の付いた方がアノテーションをする話があったかと思います。
【山本教授】  高度専門員ですか。
【喜連川主査】  そうですね。
【山本教授】  この図の「新日本古典籍総合データベース」という画面の下のところであるかと思います。
【喜連川主査】  そうです。ありがとうございます。ちょっと教えていただきたいです。ここでタグを付けている作業は、その方にとって報酬が得られるのか、何がインセンティブになるのか、教えていただけると有り難いです。
【山本教授】  実際にはアルバイトを使ってタグを付けている場合もございますが、高度専門員の場合には無報酬であります。古典籍そのものに対して、例えば大学などの授業などで、大学院生など若い研究者などを特に中心に専門員の方々にお願いしようとしているところです。本文と画像を見て、それを読んでいくという作業をふだん日常的にもやるわけですから、その作業の1コマとしてそれを付けることによって、高度専門員という肩書が付くという側面があります。
 さらには、医学系の学会などですと、こういう言葉にタグが必要とか、もしこの言葉が見つかったらというように、とにかくタグを付ける方針が定められていまして、そうすることで自分たちが思いもよらない書物の中にその言葉があるとか、使いながらやっていこうとしている側面もありますので、いろいろ学会によってモチベーションがちょっと違っているところはあります。
【喜連川主査】  IT分野では、ローマ字でも、平仮名でも、現在の文字に変換されれば、あとはやりようがあります。つまり、医学用語であれば、ある種の言葉を収集するグループをつくれば、引っ張ってくることはできると思います。ただ、その作業はかなり退屈な作業で、一般的にとても長い時間が掛かるので、ほかの分野では嫌がられるところだと思っていまして、先生の分野ではこれがどう取り扱われているかをちょっとお伺いしたかったんですけれども。
【山本教授】  日本文学の分野の中ですと、例えば、和歌は既に索引などのデータベースなどもあるので、むしろこういうものに協力を渋られるパターンもありますが、研究員の中には、物語の中などで思いもかけない言葉が出てくるということに興味を持っている、つまり、何かの言葉を探すという人もいるんです。そういった人々の中では、それが本を読みながらそういうものを探していくということがウエブ上でできるということで、積極的にしてくださる方もいるというところです。
【喜連川主査】  お伺いしたいのは、それで間に合うのかということなんです。
【山本教授】  なるほど。その点に関しましては、もう一つは、機械の方でということも考えています。これも実は、公立はこだて未来大学の寺沢先生などが、くずし字のワードスポッティングの技術を使いながら、その一つの作品の中にどれだけ同じ言葉、その言葉が出る頻度で分析していって、それをタグにしましょうというような研究も今一緒にやっているところなのです。
【美馬委員】  寺沢先生は公立はこだて未来大の同僚です。今後どのように進めていくかという全体像をお聞きしたかったんですが、最終的には、ここで、今みんな画像で登録されているものが、全部テキスト認識されるということでしょうか。そうすると、さきほどのローマ字の話も何も関係なくなって、それが自動的に多言語翻訳されるということだと思うんです。つまり、画像があって、くずし字のもので、画像認識で機械学習させて、ある程度のところまでいったら、それがテキストとしてここに上がってくるんですか。それか、できているものは、例えば今までの研究者の方で、そういうものを関係なく古典の文学の研究者がテキスト翻訳というか、自分で読んでテキスト化したものと合致させて、ある程度のクオリティになると、それがアップされて共有されていくとか、どういうふうにしていくのでしょうか。
【山本教授】  テキストの方に持っていく方法に関しましては、一つは機械的にOCRを掛けてという形のものが一つ動いています。そのために文字認識という形で字形データなどを公開することで、そういう研究を推進させようという試みをやっておりますし、もう一つは、ウエブ上で画像がIIIF等で画像公開をしておりますので、御存じないかもしれませんけれども、「みんなで報告」というプロジェクトが、今、実は動いておりまして、画像がウエブ上に出たら、それを使ってみんなで翻刻し合いましょうというような動きも進んでおります。その二つ、両面ということを考えながら、ただし、機械翻訳にしても精度が95%とか、そういう状態になるし、「みんなで翻訳」にしても、誰が最終的な本文として決定するのかという問題があって、そこに関しては、今のところ、その途中の状態でもいいからとにかくウエブ上にアップしていけばいいのではないかという考え方と、いや、やはりきちんとした本文を提供すべきだという考え方とまだ分かれているところがありますので、それらをもうちょっと練りながら考えていこうというところでございます。
【美馬委員】  多分こういう古典のものだと、趣味の方、市民の方がいらっしゃると思います。そういう人たちが、時間にゆとりがあって興味がある人がどんどんそういう中に入ってくるといいかなというふうに思いますけれども。
【山本教授】  先ほどちょっと挙げた中で、国立極地研究所との共同研究の中で、例えば片岡龍峰先生は極地研究所のオーロラの研究者なんですけれども、下のところにちょっと挙げました「くずし字、いろいろ」というツールは、これは片岡先生の発案で作ったものです。つまり、自分たちが、例えば、「あ、い、う、え、お」と書くのが、くずし字になったらどんな形になるんだろうというのを実際にくずし字にしてみる。自分で書いている言葉だから分かるんだけれども、それがくずし字だとこんな形になるんだというので、面白いよねというので、これで何とかくずし字を学ぼうという、そういう側面の動きもちょっと出てきたりして、いろいろな方々からの情報を受けながら、どういうふうに取り組めばいいか、いろいろ進めているのが大型プロジェクトだと御理解ください。
【喜連川主査】  岡部先生。
【岡部委員】  京都大学の岡部です。きょう、海外の動向について少しお話しいただいて、もう少し詳しく、例えば欧州と言っても広いですし、もちろん我々の隣には漢字文化圏の中国がありますし、あるいはイスラム文化圏とかがありますね。そのあたりの動向がどうなっているのかお伺いしたかったのが一つと、もう一つは、今回、日本でこうやって公開しているものに対して、海外からアクセスされる事例、あるいはそれを使って日本に来ないで日本文学を研究される事例みたいなものが、もし増えているとか、そういうことがありましたらお教えください。
【山本教授】  デジタルアーカイブの状況等では、中国の「CADAL」というのが国家的プロジェクトとして行われておりますし、大英図書館、「Europeana」、ヨーロッパ等は非常に進んでいます。アメリカに関しましては、米国の図書館司書の集まりで「CEAL」というのがありますが、そことのいろいろな話合いが今進んでおりまして、国文研で画像公開したいんだけれどもという形での申出により大型プロジェクトのデータベースを公開したことによって、DOIが付与されるということであるとか、様々なメリットがありますので、申出があります。現実には、例えば大英図書館に関しても、国文学研究資料館の方から公開させてくれないかというような話もどんどん増えてきているということがございます。
 もう1点ですが……。
【岡部委員】  日本で公開しているものを、どれぐらい海外の研究者が見ているかというところ……。
【山本教授】  それは従来、古典の研究などを海外でも行っている人たちが多くございまして、アメリカのAASというところでの学会等の中でも古典研究などをするときに、これらの画像を使って研究を進めてくださっているという人たちは実際に増えております。
【喜連川主査】  では、家先生。
【家委員】  どうもありがとうございます。大変興味深く聞かせていただきました。
 最初のところに、古典籍にも多様なジャンルがあるとのことでした。我々がイメージする古典籍は、文学作品が広範にあって、そのほかにもいろいろなジャンルがあると思うんですけれども、どこまでが古典籍のこの事業の対象になるのでしょうか。
【山本教授】  この事業の対象は、年代で区分けしておりまして、1867年以前という形にしております。歴史の方の古文書と呼ばれるものとか、1枚物で書いて、大体定型的な文書とか、そういうものは入れていないのです。
【家委員】  そうですか。じゃあ、例えば行政文書とか、そういう古文書というのは、何か別のプロジェクトがあるんでしょうか。
【山本教授】  それに関しましては、多分、こちらの委員会でも御登壇いただいた後藤真先生の「総合資料学の試み」というのが、そういう試みになるのかなと思うんですが、多分あちらの方もまだ歴史文書は実は非常にナイーブな側面、個人情報などがあるので、そういったもののデータベースそのものはまだ出来上がっていない状態だと思います。まずその段階からになるのではないかと思います。
【家委員】  はい、分かりました。
【喜連川主査】  よろしゅうございますでしょうか。
 それでは、本当に先生、ありがとうございました。
 きょうは、全然異なる三つの分野のお話を頂きまして、逆にここからがこの委員会が考える、ある種、非常にいいブレーンストーミングの場を頂いたと思います。つまり、これだけ多様性のあるデータを目の前にしたときに、我々はこのデータのプラットフォームといいますか、リサーチデータを置く基盤というものを、どんなふうに考えていけばいいのでしょうか。どこに共通項があるのかというようなところを考えるという意味では、非常にエキサイティングになってくるかなと思います。きょうは科学官の相澤先生がおられますので、ちょうどいいんじゃないかなと思うんですが、これ、メディアごとに考えていけばいいと思うんですけれども、一つは、やっぱりマンゴーも画像、スポーツの人も画像、古典籍の映っている絵も画像、映像メディア学会長としての御発言が、電子情報通信学会も画像がD2論文誌で大きいんですけれども、例えば、この古典籍をいわゆるイメージキャプショニング、これで勉強してできそうかどうかとか、いかがでしょうか、相澤先生。ちょっと重い質問をし過ぎたような気が……。
【相澤科学官】  どう答えていいのかと悩みます。農学の話はかなりいろいろな分野での広がりがあるように思います。スポーツの話、農業の話、それから日本文学の話、やっぱり研究者の必要としているような、データの属性データというのが相当違うのだろうというふうに思います。
【喜連川主査】  そうですね。
【相澤科学官】  属性データという意味は、例えば、マンゴーの場合だと、そのデータは一体どこの場所で取れたのかとか、どういう環境で取れたのかとか、取得環境を反映するような情報が付いていないといけない。こういうデータベースを一つのプラットフォームの上に乗せるにしても、それ自体はみんなばらばらの形のものになろうかと思います。
【喜連川主査】  そうなんです。ばらばらなんですけれども、例えば、今、山本先生の話では、国文学研究資料館の中にITの専門家は少ないようです。ちょっと失礼な言い方になるかもしれませんけれども、そういう人材はやっぱり少ないのが厳然としたところだと思います。今の世の中の動きをどう捉えるかといいますと、原則の収穫加速なんですね。どんどんイノベーションのスピード感を早めていくという、早めるというのは、要するに、ほかで開発されたテクノロジーが別のところにも結構使えるというところが、昔に比べると圧倒的なパワーが出てきているというのが現状の何となくの感覚だと思うんです。ですから、マンゴーをおいしくするという目的の中で、組成ベクターを適当に入れることは、ラーニングすれば、何か出るということは十分に期待されると思うんです。
 スポーツの中でも、あれはモーションキャプチャーで取ったデータも、日本中でいろいろな人が研究していまして、東京大学では、一定筋量が大体推定できる、そうすると、その筋肉ごとにどれだけの運動量がそこで発生しているかというのも、かなりエスティメートというようなものを、モーションキャプチャーなどという点を打つのではなくて、その画像そのものから取るというようなことがかなりできるような時代になってきている。
 農業の場合は、マンゴーは急にそんなに大きくならないので、そういう意味では、相澤先生がおっしゃったように、組成ベクターの違うバリアンツを入れるという。こういうツールをプラットフォームの中で共有することによって、多分、応用への適用加速が、データを入れる人にとっての一番のインセンティブになってくるのではないかという気がします。そういう意味で、メディア、画像という視点から見ると、この三つの中で何か相澤先生が感じるところがあるかと思ったんです。
【相澤科学官】  先生がおっしゃるとおり、そういう意味では、画像認識をうまく使うことができたら、ある程度のパフォーマンスを上げることができるだろうと思います。最後は人がわずかに手で修正していくというようなアプローチは十分に取り得るというふうに思います。
 ただ、その一方で、手を入れた正解データをある程度用意しておかないと、今の画像認識は何もなしでは動かない。最初は、ある種、ツールを作る中に必要なデータを作り込むというのがミックスされていると思います。この作業の中でツールだけではなくて、何か共同で利用できるようなフレームワークができるとよい。役に立つツールを国文学の中に取り入れていくということが加速的に進むというのは、期待しています。
 じゃあ、そのときに情報系の人たちにとってのターゲットとして、これをどういうふうに持っていくといいのかという、そこのやり方は多分幾つかアプローチはあると思います。最近、グランドチャレンジとか、コンペティションが多く開かれます。例えば、国文学の方で、きちんと作ったデータがあれば、画像関係のところとか、情報系のところに出ていって、ある種のグランドチャレンジとか、コンペティションなりを設定するということもできます。奇妙な課題でも結構人が参加します。必ずしも、研究者だけではないんですよ。学生とか、趣味でやっている人がいっぱい集まってきて、100人単位で精度を上げていくようなことが起こる場合もあります。
【喜連川主査】  そうですよね。
【相澤科学官】  どのように活動を設計していくかが重要だと思います。
【喜連川主査】  キャンベル先生のお話も、字形をいっぱい持っています。ああいうものを学習セットにすると、多分、先ほどのアノテーションのところが相当加速できる可能性はあって、きょうの中では、文字というのは、ある意味で一番やりやすい。画像化された文字は、そういうポスティングをプラットフォームの中でできるんだと分かったときに、じゃあ、ここに置こうかみたいな、何そういうものにならないかと思ってお伺いしたんですけれども。
【山本教授】  よろしいですか。
【喜連川主査】  どうぞ。
【山本教授】  字形データに関しましては、CODHと共同しながら、字形データセットという形でCODHに置かせていただいています。
 そして、パターン認識の研究会(PRMU研究会)とCODHが共同して、昨年もコンテストをいたしまして、多分今年も同じような形でしていきながら精度を上げていく。それは学生対象にという形でです。古典籍の正解データを作るのは私たちが作らざるを得ませんが、そういった協力関係で機運を盛り上げていこうということはしております。
 つまり、データをどこに置くかということがやはり重要になってくるので、我々のところに置いても情報系の人間の方々が見に来るということはなかなかなさらないので、国立情報学研究所などの御協力を得ながら、あるべきところに置くということで進めているところでございます。
【喜連川主査】  日本の文学が海外に比べて何が違うかという話をお伺いすると、向こうは字だけだと言うんですね。日本は字と絵が一緒になっている、これはグローバルにおいて極めて珍しいと。だとすると、先生の出番で、あの絵を何とかするというようなチャレンジを、字のパターンのバリエンスなんて、余りそうは言っても多くないので、そういうチャレンジも多分これからやっていただくと、すごく面白くなるんじゃないかなと思って申し上げたんです。それと、先ほど、岡部先生もグローバルとおっしゃったんですけれども、日本は農業というと、非常に高付加価値産目のことが気になるわけですけれども、やっぱり途上国はトウモロコシや、キャッサバなどの話を随分聞きます。途上国もマンゴーと同じように、勘で作っている。その勘で作っている農業が勘でなくなると、我が国としては相当グローバルに貢献できるのではないかと思うんですけれども、農業でそういう展開は、どれぐらい意識されておられるのでしょうか?
【玉城教授】  私は、東南アジア、主にミャンマーへ行くんですけれども、やはり本当に勘でやっているようです。富裕層は一握りですので、品質は全然意識していません。ですから、そこにICT技術、IoT技術を持ち込んで貢献するというのは、とても意義があると思うんです。実際、琉球大学の農学部はそれをやっていて、私もこれからお手伝いをお願いされています。
【喜連川主査】  そうですか。
【玉城教授】  そしてもう一つは、やはり利益を得るためには、東南アジアの富裕層をねらうことです。
【喜連川主査】  そうですね。
【玉城教授】  それも一つの手であるのではないかと思います。
 ただ、やはり農業というところは、IT化が遅れていて、買わされても使えないようなことがたくさんあるんです。ですから、自分たちで使って、それをカスタマイズしていくというのが我々の仕事ではないかと思うんです。そして、それを普及させるという。
【喜連川主査】  先生のきょうのお話ですと、日照量が減収の根源であるためLEDを使うという話でしたが、アフリカに行くと、そんなに電気を使うわけにもいかないものでしょう。
【玉城教授】  そうです、そうです。
【喜連川主査】  結局、天候は海洋研究開発機構の協力で予測しながら、今年は二毛作なのか、単毛なのかみたいな予測は、相当種を買う経済行為の最適化等で、かなり良好になってくると思うんです。
【玉城教授】  気象の長期予測みたいなものですか。
【喜連川主査】  そうですね。
【玉城教授】  その辺も考えながら、協力していったら、かなり生産性、農業で生産性が10%上がるというのはとても大きなことなんです。
【喜連川主査】  そうですね。農業をやっている研究者の方々、大学の農学部の先生方にとってデータプラットフォームができることは、研究を強く刺激する方向になっていきそうでしょうか。
【玉城教授】  そうですね、なってくると思います。農学部の先生と一緒にやっているんですけれども、気象の予測、そして台風がどれほど来るかの予測ができれば、そこでリソースを割いて台風対策ができるわけです。
【喜連川主査】  そうですよね。
【玉城教授】  ただ、最近の台風は沖縄方面ですぐ発生しますので、二、三日後には上陸するとか。
【喜連川主査】  それはまた別の問題かもしれないですね。
【玉城教授】  それはまた別の問題ですけれども。
【喜連川主査】  続けて私ばかり発言していて恐縮なんですが、スポーツ科学分野の関連で、お年寄りの歩く様態をモニタすることによって、この人は震える傾向があるなどが分かるようになってきていると思います。そういう意味で、Nイコール1、2のトップアスリートをねらうというのもあるかと思うんですけれども、そこで開発された認識手法を応用して、お年寄りの運動能力の低下防止にも使えるのではないかと思うんですけれども、どうでしょうか。
【前田教授】  ありがとうございます。おっしゃるとおりだと思います。今も高齢者の介護予防対策にスポーツ界がたくさん入って研究は進めております。特に今度のオリンピックがいいタイミングで、その後、レガシーがよく話題になりますけれども、私どもの研究もオリンピックまでは一気にいろいろな技術を、いろいろな分野の方とお力を合わせながら、アスリートのパフォーマンスを上げるための研究が行い、オリンピックが終わったら、その手法が一般の方にどんどん使えるようになるのではと思っています。
 その例の一つになるかも分からないですが、IT分野の方が私どものセンターに来たときに、コンディションの把握に関するお手伝いができないかという話題がありました。既にうちのスポーツパフォーマンス研究のWEBジャーナルにも載っているんですが、毎日のコンディション管理はスマホにデータを入れることで、みんなで把握する、共有することは、既にやっていますが、今後はそういうデータがたまっていけば、携帯を見て、写真を撮るだけで、大体のコンディションは分かるようになるというふうに言っていました。そうなっていけば、その後のトップアスリートだけではなくて、一般の人のコンディション管理や、高齢者またジュニアの人、いろいろな方につながっていくことは十分あるだろうなと、そのときも思いました。
【喜連川主査】  ほかに皆様方、是非この機会にいろいろ議論してほしいと思うんですけれども、いかがでしょうか。
 どうぞ。
【五味委員】  私も素人なので余り詳しいことは分からないんですけれども、今回お話を聞かせていただいて、非常に私が共通的にすばらしいなと思ったのは、生のデータ、農業でいきますと、二酸化炭素が、ローデータそのものをしっかり蓄えることがすごく重要で、それは多分、マンゴーだけではなくて、ほか……。
【玉城教授】  そうです、そうです。
【五味委員】  それをいかに気楽に農家の方が軽くそういう情報をやって可視化して、自分の生産の状況、あるいは、自分たちが今育てているものの状況をリアルタイムで分かっていくことで、多分いろいろなヒントが得られるように。それを今回、すばらしい研究で、マンゴーに新しいメソドロジーができたとすると、多分、工業化という話に次に……。
【玉城教授】  ええ、なると思います。
【五味委員】  そうですよね。そのときに、工業化して標準化した新しいメソドロジーと、今の農家の方が差別化される、工業化ではカバーできないノウハウをやるためにも、多分そのデータが、皆さん、農家の方が見られると、メソドロジーとは違った独自の手法を編み出されたりするのかなという意味でも、そこの一番根源にあるのは、やっぱり生のデータをいかに早く農家の方が自由に取って見られるような、そういう研究活動を早くオープンにしていくと、スパイラルにも……。
【玉城教授】  ええ、そうですね、まさにそのとおりです。また、最近、農業をする若年層が結構増えており、その方たちは、IT、特にタブレットの操作になれています。若年層はかなりスマートに、スマート農業みたいなものを志しているようです。ただ、高齢者は勘に頼っており、朝、水をまきながら空を見て、きょうはどうしようかと考えているようです。
【五味委員】  そうなると、やっぱり安価にデータが取れるのが、センサみたいな、種まきするようにCO2のデータが取れるとか、そういう仕組みといいますか。
【玉城教授】  私のセンサは、温度と湿度と土中温度、土中水分、そしてあと、日照、そしてCO2、これがセットで大体1万5,000円で作れるんですよ。
【五味委員】  そうすると、その農家の方が出されているデータ自身は、農家の方のIDで登録されという管理をして、そこに登録するインセンティブは、メソドロジーが利用できるという、そういうサイクルが目指すところかなと思いました。
【玉城教授】  そうです。ですから、農家と協同しながら、農家に機器の使い方を教えてあげて、農家はやっぱりそのデータを見ながらいろいろ気づきがあると思うんです。それを融合できたら、もっともっと発展し、正のスパイラルで上がっていくと思います。
【美馬委員】  多分、今から言う私の意見は、きょうのゲストにではなくて、我々の委員会なんですけれども、北海道の私の勤務する大学はIT系の大学なのでというのは一次産業とITが結びついている研究事例をいくつも見るんですね。そういう中で、酪農とITでも、企業化されているものがあるわけです。例えばファームノートといって。すごい酪農はコストが掛かる、人手が掛かるものを、牛を管理して、ホルモンの状態とか、出ているミルクを見て、餌を1頭ずつ変えていくという、そういうものを、気温から何から。そうすると、そういうものは今、ビジネスとしてスタートアップで走り出しているところに、きょう、今のマンゴーの話とかは、とてもいいお話ですけれども、それが研究を超えてビジネスになったときに、それを全部公的なものでやってしまうと、そういうビジネスのことを潰してしまうことにもなりかねないので、すごく難しいなというふうに一歩進んでやっているところを見ると思います。
【喜連川主査】  それは全然民業圧迫にはならない形で、例えば、今回お話しいただいた玉城先生のものに関しても、沖縄として先生の御活躍を産からのファンディングも出て、そこは民展開になれば、民に知財が琉球大学から移譲するという形ですので、今、先生が心配している帯広畜産大学がやっているようなところがもう既に産になっているというのであれば、それは大学がそもそも研究する必然性はないわけですよね。ですから、あくまでも大学は世の中にないものをやるわけなので、そんなにシリアスにはならないんじゃないかなと思っていますけれども、先生、そんな感じでよろしいですか。
【玉城教授】  ええ。やはり我々が築き上げた技術とかノウハウとかを農家に還元して使ってほしいです。その中で農家の技術を上げられるよう研究したらまた新たな展開が生まれてくるのではないかと思うんです。
【喜連川主査】  まだまだ先。
【美馬委員】  まだ先。
【喜連川主査】  ほかにいかがでしょうか。
 では、引原先生。
【引原主査代理】  先ほど、オーロラハンター、くずし字の話など、ホットな話になってきているんですけれども、それはやはりデータが出始めたということが一番大きいと思うんですが、その以前からそういうことをやってきた人たちも取り込んでやられているのでしょうか。
【山本教授】  はい。もちろんそういうことをやってきた人たちには声を掛けるということは当然しております。ノウハウなどというのは、つまり、我々だけで自己完結させるのではなくて、例えば今回、京都でオーロラハンターを開催したのは、それがもっといろいろな人たちがどんどんやってもらったらいいというところの動かし方なんですね。そうでないと、大型プロジェクトは10年プロジェクトですので、10年終わったら、途端に何も動かなくなったというのは一番みっともない話だと考えております。その意味では、いろいろな来る者拒まず、去る者追わず、という原則でいろいろ動かしているところです。
【引原主査代理】  オープンサイエンスというと、すぐに市民サイエンスというか、その方向に行きがちで,そのときに、引っ張る者がいなくなって、結局は拡散してしまうようなケースが多いと思うんです。そういう意味では、やっぱりアカデミックな人間が引っ張っていく部分があって初めて裾野が広がると思います。面白い取組だと最近思って、ときどきのぞいてはいるんですが、ほかの分野でこういう取組は御存じの話がありましたらお教え下さい。
【山本教授】  ほかの分野ですか。
【引原主査代理】  もちろん農業とかはあると思うんですけれども。
【山本教授】  農業ともしたいんです。いろいろ農業の書物なども古典籍もありますので、したいのですけれども、なかなかみつからない。要するに、つながりをとにかく求めて、いろいろ大学関係のところに行って、誰かそういう人いませんかというようなことを我々は今やっているところでして、可能性があればどんどん、とにかくできないと言わずに、こうしたらできるという方向で今動かしているところなんです。
【引原主査代理】  今回のプロジェクト、富士川文庫とかが電子化されて見られるようになったわけですけれども、あの中に薬草学みたいな話とかがたくさんある中で、ああいうデータが中国とかにはなくて、かなり興味を持たれているということもあって、それをオープンにしていいのかということを問い掛けられたことがあります。そういう問題に対してはどういうふうにお考えですか。
【山本教授】  もちろんそれを諸外国が使うということにどう思うかという問題かもしれませんけれども、基本的には古典籍に書かれているもので、その情報を知っているならば、それは使われてというふうに考えます。それが世の中をよくするということになるわけですし……。
【引原主査代理】  それが,先生は死蔵という言葉をお使いになりましたけれども、そういうオープンにすることで死蔵を避けるということだと思うんですね。だから、持っている人だけがトップで走れるというのが、オープンにしていいのかという人の多分疑問が出た理由だと思うんです。その発せられた方が結構日本の薬学関係の偉い方だったので、非常に強い印象を受けた覚えがあります。今回、今オープンにしていますけれども、もしそういう話が今後あるならば、こういうオープンの仕方を予告するなり何なりしていく方法が必要なのかと思っております。
【山本教授】  オーロラハンターも含めてですけれども、要するに、人に周知するということで、メディアリリースであるとか、そういう様々な形を経ながら進めるような形をしております。それで興味を持っていただく方々とつながっていくという動かし方がいいと思いますし、大型プロジェクトが終わったとしても、そういう関係性は崩れないというふうにも考えております。
【喜連川主査】  オーロラは見てもなくならないのでいいんですが、懸念は、やっぱりバイオリソースでしょうね。それはハントされる可能性は多分にあると思います。
 北森先生に僕はさっきからずっとお伺いしたかったんですけれども、農業の肥料のリアクションというか、サイクルなのか、すごくやれそうな気がするんですけれども、除草剤も含めて。
【北森委員】  生物資源に関わる生産工学がものすごく関わっていて、今、言っていいのかよく分かりませんが、農学部が応用生命科学部というように名前を変えるんだ、変えないんだという議論すらあったわけですね。それから、これから農工連携がどうするかという議論もものすごくあるわけで、そこを今、喜連川先生の御質問に答えるとすれば、それは直近の課題で、それこそ農工連携としてやるべき課題ではないかというふうに思います。
 それとあと、これはコメントなんですが、おいしいマンゴーをより安く生産する。それから、オリンピックや国際競技会で日本の選手が金メダルを取る。これは余り説明しなくても国民全員が分かってくれる効果ですね。
【喜連川主査】  そうですね。
【北森委員】  それから、オーロラも多分そうだと思います。NHKが特集したら、国民全員が理解してくださる。一方で、サイエンスになると、途端に難しくなって、国民、タックスペイヤーがデータのインフラを整え、プラットフォームを作っていくというお金の掛かるところをどれだけ理解をしてくれるのかということに関して、我々は説明責任がもちろんあるわけですね。そこのところがものすごく欠けています。それから、生産者にしても、アスリートにしても、目標と目的はすごくクリアです。一方において、サイエンティストの方はどうかというと、先ほど、バイオの方では、データをオープンにするというのは、むしろねつ造だとか、そういうことを抑制するために、科学倫理的な観点でやりましょうというふうなことから始まり、一方では、産業界の方では、イノベーションという形でフィードバックしてほしいということも言われるわけです。そのあたりの意識はすごく多様で、なおかつ説明しにくいところです。
 昨日、あるところで若い人たちの賞を決める委員会に出たんですけれども、もうアメリカのトップジャーナル、ヨーロッパのトップジャーナル、これに論文が出ているなんていうのは当たり前、若い人たちにとってそれが当たり前で、出していなければ評価されない。出していても評価されない。さらに、その出した論文がどれだけ引用されている、どれだけインパクトがあるのかというところで争っているわけです。彼らは自動的に国内のジャーナルは見ません。トップサイエンティストになればなるほど海外のものを意識する。どんどん論文は出ていく。さっきのバイオの関係だと、グラフが出ていくのだったらまだいいけれども、グラフの基になるデータも出しなさいということになりつつあるわけですね。そうすると、本文やグラフの著作権だけではなくて、データまで行ってしまったら、これはもう丸裸になる。
 そういう状況の中で、先ほどの「説明をする」ということが、いかに重要で、なおかつ早くやらなければいけなくて難しい課題ではないかというふうに思いました。
【喜連川主査】  それはみんな思っていると思いますので、これから議論を重ねて、また別次元でそれは是非深めていきたいと思います。
 きょうは文部科学省から……。
【相澤科学官】  1点だけ、質問をよろしいですか。
【喜連川主査】  はい、どうぞ。
【相澤科学官】  古典のデータベースについてですが、現状でもかなりのデータベースが出来上がっていて、そしてインターフェースもできていて、その中には画像を見るなど幾つかの機能がある。これは内製されているんですか。この情報システムはを作っているのは、御自身のところで作っているんですか。
【山本教授】  データベースそのものですか。それは仕様書を作って業者に発注するという形にはなります。
 画像撮影に関しましては、当初計画の予算よりもかなり削減されたこともありまして、文部科学省からの御指導もありましたので、半分内省化をしながら、つまり、それは誰でも撮影できるような仕組みを作り上げながら、一方で、どうしても古典籍の場合には扱いにくいものもありますので、そういうものは業者発注するということを併用しながらという形でやっております。
【相澤科学官】  では、組織中に情報チームがあって、このデータベースを、技術的に面倒を見るという体制はではないんですか。
【山本教授】  国文学研究資料館の研究者は、私もそうですけれども、情報系のことがわからない人間たちが多い状況です。情報系の研究者は、大型プロジェクトの方で2名ほど採用はしてはおります。ただし、それも期間だけの採用という形になりますので、やはりいろいろ問題は多い。その中で情報系のことに関しまして、国立情報学研究所の御指導を得ているというところです。
【相澤科学官】  なるほど、ありがとうございます。
【喜連川主査】  それでは、お時間も大分過ぎましたので、きょうは3人の先生方、本当にありがとうございました。どうもありがとうございました。(拍手)
 またこういう機会を得られればなと思っています。
 それでは、本日は終わりたいと思いますが、事務局から何か御報告することはありますか。
【高橋参事官補佐】  本日の議事録については、各委員の先生方に御確認いただいた上で公開させていただきます。
 次回、第15回については、資料5にございますとおり、来年、平成31年1月31日木曜日の14時から16時、場所は、3階の3F1特別会議室を予定しております。
 以上でございます。
【喜連川主査】  それでは、閉会とさせていただきます。ありがとうございました。


―― 了 ――


お問合せ先

研究振興局参事官(情報担当)付学術基盤整備室

麻沼、小原
電話番号:03-6734-4080
ファクシミリ番号:03-6734-4077
メールアドレス:jyogaku@mext.go.jp(コピーして利用される際には全角@マークを半角@に変えて御利用ください)

(研究振興局参事官(情報担当)付学術基盤整備室)