教科書デジタルデータ提供促進ワーキンググループ(第2回) 議事要旨

1.日時

平成20年6月24日(火曜日)15時~17時

2.場所

中央合同庁舎第7号館(金融庁)13階 共用第1特別会議室

3.議題

  1. 拡大教科書の普及推進について
  2. その他

4.出席者

委員

田中主査、五十嵐委員、伊藤委員、今井委員、氏間委員、大旗委員、川戸委員、小林委員、柴崎委員、嶋本委員、中野委員、成松委員、花香委員、渡辺(哲)委員、千田座長代理、宇野委員、渡辺(能)委員

文部科学省

伯井教科書課長、矢崎教科書課課長補佐、松木教科書課課長補佐、黒沼文化庁長官官房著作権課課長補佐

5.議事要旨

 主な意見は次のとおり。

(1)拡大教科書の現状等について

 「障害のある児童及び生徒のための教科用特定図書等の普及の推進等に関する法律」、ボランティア団体の作成による拡大教科書の文字の大きさについて、これまでの意見の論点整理について事務局による説明。渡辺(能)委員によるDTPソフトからテキストデータへの変換の具体的な作業方法についての説明。また、これらについて意見交換が行われた。

<渡辺(能)委員の説明>

【委員】

 昨年12月から提供を開始したデジタルデータの提供にあたりテキストデータを抽出する作業は、手作業による部分が大きかった。

【委員】

 教科書は、商業印刷向けのDTPソフトで作っているものがほとんどであり、デジタルデータは、ほとんどの教科書について各発行者は保有している。
 しかし、印刷用のデジタルデータは、そのままでは一般的なボランティアが利用できる形式ではなく、変換しなければならない。教科書編集用のDTPソフトからボランティアが使用できるデジタルデータにするための自動変換は、現時点ではできないというのが現状である。

【委員】

 データ変換については、いくつかの方法があるが、いずれの作業においても必ず人の手が入る。また、変換されたデータが正確なものかどうかを改めて校正する必要がある。

【委員】

 今回提供したテキストデータについては、教科書協会で統一的な仕様を定め、この仕様に基づいて42点の教科書について作成した。今回の提供に当たってテキスト形式にした理由は、第一にボランティアが実際に作業する上ではテキスト形式が一番使いやすいこと、第二に著作権の問題や教科書の使用契約上の問題から、今回は基本的に写真、イラストなどの画像データは除外した形で提供せざるを得ないと判断したことが挙げられる。

【委員】

 DTP上では、テキストデータが、本文や脚注ごとに一つ一つボックスの形で入っっている。これらのテキストデータが入っているボックスや画像データが入っている画像ボックスを組み合わせて、実際の教科書の紙面の形に組み上げている。これをテキストデータなどに変換するため、2通りの方法を検討した。
 第一の方法は、PDFデータを作り、そのPDFデータからテキストを抽出するという方法。
 第二の方法は、DTPデータの元データから、1つずつのボックスごとにテキストをコピーし、新しいファイルにペーストしていくという方法。この場合は、文書の塊ごとにテキストデータだけが抜け出されている。ボランティアは、これをそれぞれのアプリケーションにコピー・ペーストし、自由に使うことができる。

【委員】

 第一の方法のように、PDFからテキストを抽出する場合、一括して全文を抽出する方法と、ブロックごとに分けて抽出する方法があるが、前者の方法は、文章の流れが学習の流れではなく、紙面の流れに沿って抽出されるため、後で使いやすいように組みかえなければならない。
 したがって、後者の方法のように、ブロックごとにコピー・ペーストしたほうが効率的であるが、この場合でも、ルビが漢字の次にそのまま片仮名で入るなど調整する必要が出てくる。また、さまざまな記号や外字などが脱落したり文字化けしたりするということもある。
 そのため、今回決めた仕様に整えるためには、この抽出したデータを修正する必要があり、手作業の修正が入るので、校正を行うための人手が必要になる。

【委員】

 また第二の方法のように、編集ソフトからコピー・ペーストする場合は、ボックスごとにコピー・ペーストをすることになるが、ボックスが非常に多数あるので相当な手間がかかる。
 基本的には正確に抽出することができるが、場合によっては幾つかの不都合な点が出てくる。例えば、行頭に不要な空白が入るということや外字や記号類が文字化けする場合がある。機械的にコピー・ペーストしても、改めて校正の作業が必要になる。

【委員】

 このように、使い勝手のよいテキストデータを作るということで、昨年度、テキストデータを提供したが、作業面ではかなり負担が大きかったというのは事実。例えば小学校の教科書の文字量からすると、手入力を初めから行った方が早いということもあり、一部直接入力によってテキストデータを作ったものもある。

【委員】

 今回の提供に際しては、画像データは基本的には除外していたが、加工作業においては、解像度の調整や、カラーモードをCMYKという4色印刷に対応したモードから、一般用のワープロソフトにも対応したRGBのモードにしなければならない。
 また、フォーマットも、元のデータは、ほとんどEPS形式になっているが、これをJPEG形式に変える必要がある。これも画像の一つ一つが独立したファイルになっているため、一つ一つのファイルについて変換作業を基本的に手作業でする必要がある。

(2)自由討議

【委員】

 デジタルデータの提供を受けるボランティアの側には3つのタイプがある。
 タイプAは手書きのグループ。図表や画像はコピーをして切り抜き、フェルトペンで画像の枠を抜いておき、そこに切り張りをする。それで原版を作り、それをコピーする。影の部分を修正し、それを再度コピーして製本する方法。今後、デジタルデータの提供を受けることによって、PDFの画像が非常に役に立つのではないか。
 タイプBは、パソコンは一部使うが、基本的なレイアウトは手作業で行うグループ。文字データはデジタルデータでパソコンでの入力、OCRの使用、手入力などで作る。画像は、Aタイプと同様に切り抜く。編集作業は手張りで文字の部分も切り抜き、いわゆるパッチワークで作る。影を消すなどして、これもコピーをとって原版を作り、それをもう一度コピーする。本文をコピーして製本するもので、このBタイプは、おそらくデジタルデータの提供を受けることにより、もう少し進歩した作り方をしようというモチベーションが上がるのではないか。
 タイプCは、文字データはパソコンで入力し、画像データは主にフラットヘッドのスキャナでスキャンし、必要なレタッチをしてJPEGに変換し、保存しておいて後で使うグループ。図表のデータ、算数などについては花子というソフトで作図をする。それらを画面上で合わせて編集する。

【委員】

 著作権法第33条の2の「営利を目的として当該教科用拡大教科書等を頒布する場合にあつては」という部分については、教科書会社であっても、民間の拡大教科書製作会社であっても、著作権補償金の支払い義務があるという認識でよいか。

【事務局】

 今回の法律は、拡大教科書から別の形式でもできるという形で広がっているが、補償金の扱いは変わっていない。

【委員】

 現行の拡大教科書に係る著作権補償金の計算式は、図書の大きさにかかわらず、そのページの中の何分の1を使っているかということで決められている。判型によって金額が変わるとは思っていないが、バリエーションが幾らでも作れるのどうかという部分に関しては、今後、できれば明確な回答をいただきたい。

【委員】

 図版もテキストも一緒にレイアウトされた状態のPDFデータがボランティアに渡れば、それをボランティアがコピー・ペーストしながら、一太郎やワード等で編集できる。この場合、元の図の位置や表の位置を見ながらコピー・ペーストしていけるという利点がある。

【委員】

 図版のデータ容量があまりにも大きくなるのであれば、一般のボランティアが使っているパソコンでは重過ぎてフリーズする可能性があるので、実際に、PDFで問題はないかどうかを検証することが必要。もし検証した結果、可能ということであれば、テキスト形式とJPEG形式という組み合わせではなく、PDFということで、当面はよいという結論になるのではないか。

【委員】

 新教育課程に向けては、ワンソース・マルチユースに向けて、単にボランティアに渡すという観点だけではなく、電子教材のことも含め、様々な利用をしやすいソースがどうあるべきかということも検討すべきではないか。

【委員】

 アクセシブルPDFにするときには、どこのテキストブロックから次のブロックにつながっているかというのを指示しなければならないという問題がある。ただ、それができるのであれば、設定した順番にコピー・ペーストできる。他方で、単にPDF化するだけであれば、従来と同じような作業が必要になってくる。

【委員】

 ボランティアはレイアウトをする際、それぞれが順番を考えてレイアウトしており、労働集約型な作業が全国で行われている。教科書をきちんと理解していなければレイアウトしにくいということもある。理想を言えば、アクセシブルPDFに限らずだが、ここのセンテンスはこういう順番で読んでほしいということを、例えば教科書協会や教科書会社で示してもらえると、全国のボランティアや民間の発行者も迷わずにレイアウトを進めることができる。

【委員】

 PDF化されたデータについて、二、三のデータで試してみたが、国語の場合、テキストを抽出するのは難しかった。ただ、OCRソフトがいらなくなるし、画像がデータとしてあればスキャナも不要となるので、非常に大きな利点であると思う。

【委員】

 現状では、PDFデータの仕様を統一するのはほぼ不可能だと思う。PDFデータを提供するということになると、昨年提供されたプレーンテキストデータに比べれば、テキストデータの取扱いという面では使い勝手は悪くなると思う。ただ、教科書紙面と同じレイアウトを見ながら作業できるという意味では、むしろ使いやすい面もある。

【委員】

 教科書会社から提供する段階ではPDFデータを出すこととし、データを管理する組織が、テキストデータの抽出と図をJPEG化するというのを一括して行い、それをボランティアに提供するということも考えられる。

【委員】

 PDF化した場合、画像や特注記号のところが空白になってしまうが、例えば編集時に透過テキストを入れておく方法もあるのではないか。

【委員】

 ボランティアは、元の教科書を参考にしながら、テキストの配置やレイアウトなどを検討でき、また、別途教科書を購入する必要もなくなるので、PDFデータがボランティアに提供されるというのはとてもよいと思う。
 図や写真を取り込もうとしたら、解像度が問題になると思うが、解像度を上げて配付することもは可能なのか。

【委員】

 印刷用のデータはそもそも解像度が非常に大きいので、むしろどこまで落とすことが適切かという判断になると思う。300dpiの解像度でPDF化した際、10ページほどで、昨年提供した全テキストデータの容量を上回った。おそらくこの解像度だと、教科書1冊がCD-ROM1枚におさまらないと思う。

【委員】

 PDFは、読むだけならば無料でソフトが手に入るので、非常によいと思う。またアクセシブルPDFも、無料のソフトの中でオプションで使える機能でもあるので、かなりよいものができると思う。ただ、写研システムを使っている教科書会社もあることにも留意が必要。写研システムからPDFにするソフトは一応存在するが、一文字一文字を線画として認識してしまう。

【委員】

 データを集約して、そこでテキストを埋め込み直したり、流出防止のための透かしを入れたり、画像データの解像度を要求に応じて下げたりする作業ができるような組織が存在すればよいと思う。

【委員】

 今回、著作権法が改正されたが、現行版の教科書については、図版の二次使用を認めないという契約になっているので、フォトエージェンシーから再度図版を借りるという手続が必要になる。新教育課程教科書については、契約を行う段階で提示すれば対応可能だが、現行教科書については、改めて契約をし直す必要がある。

【委員】

 文字の大きさ、配色、書体の種類、ルビの有無、行間隔、1行の文字の幅などのあらゆる物理的要因を操作できるソフトをつくったことがあるが、それぞれ弱視の学生に使わせてみると、最も極端な例だが、視野がかなり狭い学生の場合、1行の長さを1文字にして、ずっと視線を固定したまま、真一列に縦に流していた。そのように障害の程度により、様々な活用があり得るので、文章の構造をしっかりと定義して、そこにレイアウトの情報を調整するという方法は良いと思う。
 ただ、例えば音楽の楽譜や低学年教科書のようなレイアウトの場合はどうするのかといったあたりは、かなり高度な技術的な配慮も必要になってこようと思う。

【委員】

 以前、マークアップ的なものを使って、拡大縮小をできるものを一度つくってみたが、どのようなデバイスを使ってそれを表現するか。HTMLにしても、PDF的なものにしても、今のタブレットPCのようなものを、一般学校で学ぶ弱視の子供たちに持ってもらうのか。例えば教室で使うのであれば、電源の確保や、先生がメンテナンスできるかなど、外的な要因も考えることが必要。

【委員】

 この場としては、デジタルデータについて、拡大写本のボランティアの方々への提供方法や、点字データへの変換、あるいは音声といったことを中心に考えていくことが必要ではないか。
 まずは、紙ベースでの使用形態を中心に考えるべきだと思う。

【委員】

 マークアップ言語によるファイルを用いる場合、見出しをどうするかなど、ルールを決めなければならないが、教科書には各社それぞれ違いがあって、これを共通化するというのが果たして現実的なのか。

【委員】

 ワンソース・マルチユースに向けて、どういう組織をつくっていくべきなのか。教科書協会の中に置くのか、違う組織になるのか検討が必要。

【委員】

 紙媒体というのはやはり拡大化に限界があるので、電子教科書の活用も考えることが必要ではないか。特に高校において充実させるべきではないかと思う。

【委員】

 小学校の初期の段階で、家庭でも学習をするには、まずは紙媒体であるべきと思うので、まずはそこを詰めるべき。もちろん、年齢が高くなれば様々な対応ができ得ると思う。

【委員】

 弱視教育ということを考えたときには、様々な形で保障することが必要。当然、視覚補助具ということもあるだろうし、近づければ通常の図書でも見えるんだという児童生徒もいる。もちろん、拡大教科書が必要だという児童生徒もいる。ただ、自己選択をできることが必要。そういった意味で、拡大教科書がよい、視覚補助具がよいという二者択一ではなくて、その児童生徒に応じた形で学習環境が整備されるということが大事なんだろうと思う。

【委員】

 新教育課程教科書の作成にあたり、教科書会社が用いるDTPソフトは、インデザインがかなりを占めるようだが、クォークがゼロになるわけではない。
 そう考えると、やはりクォークでもインデザインでも対応可能なのは、PDFではないか。アクセシブルなPDFのルールをきちんと決めて、途中の手間を省けるようなルールは何なのかということの可能性を、出版社の方々に検討をお願いしたい。

【委員】

 提供したデータが、目的外使用と意識されずにネットに掲載されたり、試験のテキストをつくるために教師が使用したりすることも考えられるので、データの取扱いの留意点をまとめる必要があると思う。

【委員】

 教科書発行社による拡大教科書もこれから出てくると思うが、その教科書というのは、33条の2で定めている営利を目的として拡大教科書を発行する者に入るのか。

【事務局】

 例えば、株式会社が実費で売ったらどうなのかなど、微妙な問題はあると思うが、おそらくは営利を目的とするという判断になるということが多いと思う。統一された学説などはないので、現在の傾向としては、株式会社が行うのであれば、ただで行っても宣伝目的で営利目的につながっているという判断をされるのではないかと思う。

(3)事務局より今後の日程について説明があり、閉会となった。

お問合せ先

初等中等教育局教科書課