全国的な学力調査のCBT化検討ワーキンググループ(第5回)議事要旨

1.日時

令和2年8月26日(金曜日)13時30分~15時

2.場所

Web会議(文部科学省 旧庁舎2階特別会議室)
※Webexにて公開

3.議題

  1. 中間まとめ「論点整理」(案)について

4.出席者

委員

大津主査、石田委員、礒部委員、宇佐美委員、川口委員、柴山委員、冨山委員

5.議事要旨

議事1:中間まとめ「論点整理」(案)について

資料1に基づき、事務局より説明があった。関係委員の意見は以下の通り。

【委員】
 CBT化した場合、スピーキングやコミュニケーション能力が測定しやすいことは、科学的に明らかである。思考力や判断力、表現力、問題解決能力といったようなものが、CBT化によって測定しやすいものになるといった論調を見聞きするが、実際の量的・質的な検討がほとんどなされていないため、今後、必要になるのではないか。定性的なところとしてログ分析を挙げているが、特に定量的な部分が重要と考えている。CBT化した場合と従来のPBTの場合とで、スコアに表れている得点の構造に違いがあるのかどうか検証する必要があるのではないか。単に期待されるレベルや出題形式等を越えて、実際のスコアの中に、そういう定量的な証拠としてCBTならではの能力測定ができているのかどうかについては、素朴な疑問でありつつも、実証的な研究レベルではほとんどなされていないような領域だと思われる。

【委員】
 CBT化に関わって、通信環境などのインフラを、誰が管理し、維持するのかという論点が欠けているのではないか。現時点では、GIGAスクール構想もあり、国が整備するという前提で話が動いているようにみえるが、今後のことを考えると、国が各都道府県の通信環境を整備していくのは、理念的にも予算的にも現実的ではないだろう。実際には国から財政面の補助はあるとしても、通信環境の維持管理は、各都道府県あるいは政令指定都市など個々の自治体が責任をもって行うべきではないか。また,学力調査は、国と地方で役割を分担していくべきではないか。国が全国の学力実態の把握を行うことを目的とした場合、抽出調査になるだろう。抽出調査であればCBT化した場合、仮に地方の通信インフラが脆弱だったとしても,USB方式、あるいはUSB方式と通信サーバの方式のハイブリッドで実施できる。
 次に、CBT化に関わる人材についての提案だが、各地の教員養成系大学を活用してはどうか。すでに各教科の専門家がそろっているため、社会調査やテスト理論、特に教育測定の専門家などの人材を配置できれば、学力調査のセンターとして機能するのではないか。医療系共用試験の事例をふまえて、各地の教員養成系大学がそれぞれ独自にテスト項目を作成し、テスト項目の精度等をチェックできる体制があれば確認してもらい、それを国研が集約するという体制が想定されうる。そういった体制が整えば、数万題の問題を確保して項目プールをつくり、使えなくなった問題については一部差し替えることができるようになるだろう。国研だけで全ての作業を担う場合、多くの人材を国研に配置することが必要になり、現実的ではないと考える。1つの案として、各地の教員養成系大学を活用することを検討してほしい。
 各地の教員養成系大学を活用する利点としては,国と地方の役割分担を考えたときに、地方自治体にも学力調査に関するノウハウが必要になるという問題を解決できるという点がある。たとえば、地方でCBTでの調査を実施する場合、地方の担当者にも,IRTや社会調査、あるいはコンピューターに関する知識が必要になる。そのあたりを地方自治体にアドバイスするシステムや体制が欠かせないだろう。その際、地方の教員養成系大学に学力調査のセンター等があると、指導や人材養成の拠点として機能できるのではないか。各都道府県の教育行政にもCBT等に関する知識がないので、各センターで研修を行うような体制にすれば、新しい学力調査の設計や運用のノウハウ等を地方に広げていくこともできるのではないか。
 地方の教員養成系大学は、地域に貢献することが求められているが,現在は学校・学級経営という内容に偏りがちで、現場のOJTや教育委員会の研修との差別化が難しい。教育の調査やCBTに関する地方の教育行政の職員の研修といった役目を与えていくことで、教員養成系大学の活躍の場というのを広げていくことができないだろうか。
 教職課程コアカリキュラムを含めて、現在の教員養成は学校や教室の問題に焦点が偏り過ぎており、管理職や教育行政といった広い視野を求められる人材の研修、あるいは修士・博士課程に通わなければ獲得できない専門性といった観点から見ると課題がある。教育調査やCBTに関わる人材育成という面からも,教員養成の在り方を少し考え直していくべきではないか。

【委員】
 宇佐美委員のご意見について、受験者のその後の何らかのパフォーマンステスト等の基準の結果との相関分析を行うというのは、つまり受験者を将来的に追跡し、就職活動の結果やその後の仕事でのパフォーマンスなど,学校卒業後のパフォーマンスと学力調査の結果が関連しているかどうかを確認する、という理解でいいか。

【委員】
 私の意図としては、受験者の将来のパフォーマンスを想定しているが、方法論として、調査の前後や近い時期に測定したものとの比較も考えられる。外的基準を設定することが必要ではないか。

【委員】
 すべての受験者ではなく,一部の受験者に対して、その後を追跡していくということでよいか。

【委員】
 おっしゃるとおり。補足的に必要になる確認事項と考えられるため、主の調査とは、また別に検討する必要があるだろう。

【主査】
 先ほどの委員の指摘は、もっともな懸念だと思う。恐らく本体調査は科目ベースで実施することになるだろう。出題形式を工夫しても、教科ベースで調査問題が作成されるため、教科学力の指標と、どの設問にも相関関係があると考えられる。例えば、コンピューターの独自性を使った問題でも、4択問題でも、国語なり算数・数学の能力という学力全体と強い相関があり、一つ一つの特徴をデータに基づいて区別するのはなかなか難しいのではないか。

【委員】
 総論の赤字部分について、この各項の結論的なところが上手にまとめられている。非常に平たく言えば、できるところからCBT化していく、まず試行・検証に取り組むべきであるという論点整理になっている。親会議である専門家会議では、具体的なところまでいかずとも、今後、どんな部分でCBT化に関する試行を行うべきか、という点を議論していただきたい。中間まとめには、今後このWGで検討を行う主な論点が示されているが、どこでCBTを使っていくのか、どんなところでCBTを検証していくのかという点がみえないと、仮定の議論ばかりになってしまうだろう。論点整理を踏まえて、基本的にどういうところでCBTの活用についての検証を行ってほしいのかということについて、一定の方向を示していただけるとありがたい。

【主査】
 どこでというのは、調査を行う対象という意味か、それとも調査を実施する主体のことか、それとも両方を意味しているのか。

【委員】
 主に調査対象について。それから調査問題のうち、一部をCBT化することも考えられる、という議論もあった。そういったことを含めて、どのような内容でCBTを行っていくのか、CBTの活用について検証していくのかについて議論していただきたい。

【委員】
 資料2に記載があるように、このワーキンググループにおいては、CBTの利点を生かしつつ、全国どこでも安定的に実施しつつ、学校現場の負担を軽減する、一方で全てを早急に実現することは難しい、といった議論をしてきた。改めて、調査が悉皆方式であるという制約が非常に強く、抽出方式にすることによって、かなり制約が外れてくるのではないか、と感じている。
 また、資料2の(1)に該当すると思うが、従来実施している経年変化分析調査に関わる点が、抜けているのではないか。今後、調査設計について議論していく上で、従来実施している経年変化分析調査を活用した調査設計も考えられる。この調査のことも踏まえた記述が必要ではないか。

【主査】
 経年変化分析を用いた調査設計というのは、そこから得られている問題の難しさや構造を考慮しつつ、CBTの調査問題を準備するという理解でよいか。また、基本的に1次元の構造上で分析されていると思うが、難易度等を使って、それを参照しながらCBT用の問題の設計を一部使う、あるいはそれを参考にしながら、アンカーにして新しい問題を作成していく、といった意味で解釈していいか。

【委員】
 例えば、学力調査自体の目的の中で、経年比較に特化した従来の経年変化分析調査の内容を生かした調査設計と、他方で、各自治体の学力の実態把握という意味で現行の本調査のような形やまた別の形で実施する、といった方法が考えられる。そういう調査設計を考える際、従来の経年変化分析調査を活用する可能性があるため、例えばP.2の(1)の下の「また」以下で、「全国学力・学習状況調査と別に地方自治体が行っている学力調査等との役割分担も含めといった」部分に追加するような形で、「従来、行っている経年変化分析調査を活用した調査設計の可能性なども踏まえ」といった文言を追記してもいいのではないか。

【委員】
 各論の「実施」の中で、実施方法として一斉実施、または期日を設けて実施という記載があるが、どちらにしてもかなりの大規模になることが予想される。現在、学校質問紙調査はオンラインで回答する形式になっているが、これを一斉実施でやってみることで、オンライン化した場合の1つの検証になるのではないか。また、児童生徒質紙問調査についても、本体調査のCBTとは状況が異なるが、オンラインを使った場合、どのような規模感になるのか検証を実施することはできるのではないか。

【主査】
 学校質問紙、児童生徒質問紙をCBT化して、学力調査をやる仕掛けの上で同時に調査する方法について、検討しておいた方がいいということか。

【委員】
 それとは別で考えていただきたい。

【委員】
 「調査問題」の問題セットについて、「仮に問題を公表する場合には、指導改善に大きなメリットがある」という文言があるが、問題を公表した場合、今度は調査項目を暴露することになり、問題の難易度が変わってしまう。つまり,IRTの観点から考えると、問題の公表はデメリットになる。他にも、複数問題セットを用意するというのは大事だが、こうすると異なる問題セットを受けた人の児童生徒の成績をどう比較するのか、という問題が生じる。それを解決するには、IRTを導入する必要がある。
 中間まとめでは,このような「学力調査の調査設計において,あることを選択すると、別のところで問題が生じる」といった論点の関係性が見えるように記載したほうがいいのではないか。そうすれば,親会議である専門家会議や全体で議論するときに論点がつかみやすいのだろう。

【主査】
 上記のご意見は、CBT特有の問題ではなくて、分冊方式を取る場合に発生する問題だと考える。

【委員】
 CBT化特有の問題ということで、品質保証の観点が欠けているのではないか。学力は、言うまでもなく非常に抽象的なもので、それを測定するというだけでも非常に難しいことである。そこにデジタル化やIT化が一律に導入され、それをどう見ればいいのかというのをずっと考えていた。例えば家電製品の場合、PL法などの消費者保護の観点で法律が定められている。この場合、消費者というより、エンドユーザー保護の観点が含まれている。全国学調にも、品質保証や個人情報の取り扱いに関する論点が必要ではないか。調査方式や規模にかかわらず、個人情報を扱うことになるため、セキュリティや個人情報の保護に関する論点を追加したほうがいいのではないか。

【主査】
 品質保証というのは、調査のクオリティーに関することか、もしくは実施システムの両面ということか。

【委員】
 クオリティーはもちろん、実施主体がちゃんとセキュリティや個人情報保護に関する様々な条件をクリアしている保証、外形的な保証が必要になってくるのではないか。

【委員】
 問題漏洩に関する論点の中に、「正答率などの項目特性値」という記載があるが、「項目特性値」は、IRTのモデルの中のパラメーターというニュアンスがあるため、「指標値」としたほうがいいのではないか。
 具体的な内容について、医療系大学間共用試験の事例では「正答率などの指標値を確認し、大幅に数値が変化して問題を削除するなどの対策」を実施しているということだが、実際には漏洩の発生原因やプロセスは多様であると考えられる。仮に前述した対策を行ったとしても、経年的に学力変化が起きている場合は包絡してしまうだろう。つまり、正答率の変化が、平年的な学力変化によるものなのか、漏洩によるものなのかわからない。そのため、正答率の変化だけを指標として漏洩を確認する方法は、かなり限定的なやり方だと考えられる。方法論に問題がなかったとしても、一部のコミュニティーだけに漏洩した場合、一部の人だけが有利になってしまい、さらに項目パラメーターだけはゆがむといった状況も考えられる。そういった状況だと、一部の人にしか漏れていないため、正答率の数値には変化があらわれず、漏洩が分からない。そのため、漏洩自体の発生メカニズムが、まず多様だということは踏まえることが必要である。ここに書いてあるように対策を検討する必要があるということに尽きるが、例えば、「調査設計や漏洩の発生原因によっては、漏洩自体を適切に検出すること自体が困難である可能性を踏まえて、有効な対策の在り方を検討する必要がある」というように、この問題自体の多様性や根深さについて記載したほうがいいのではないか。

【委員】
 全体を通して、中間報告として的確にまとめられている。
 デジタル化について、夢は膨らむ一方だが、現実問題として、技術的にどこまで実現可能なのか、この技術展開は児童生徒や学校現場にかえって悪影響を及ぼさないのか、という点を懸念していた。論点が絡み合って、錯綜して、どこから整理していっていいのかよく分からないものを、うまく解きほぐして、技術的な限界や制約、展開の可能性がうまく論点として整理されている。これから議論していかないといけない論点も見えてきた。

お問合せ先

総合教育政策局参事官(調査企画担当)付学力調査室

(総合教育政策局参事官(調査企画担当)付学力調査室)