平成29年12月26日(火曜日)16時00分~18時00分
文部科学省15階 科学技術・学術政策局 会議室1
長岡座長,嶌田座長代理,大湾委員,富澤委員,両角委員,山本委員
松岡企画評価課長,國分企画評価課課長補佐,山本企画評価課係員,髙木企画評価課係員
内閣府 経済社会総合研究所国民経済計算部 国民支出課 根本課長補佐,内閣府政策統括官(科学技術・イノベーション担当)付参事官(基本政策担当)付 山口主査,総務省政策統括官(統計基準担当)付 経済統計担当統計審査官室 川原副統計審査官,総務省統計局統計調査部経済統計課 高石課長補佐,研究振興局 渡辺振興企画課長
審議に先立ち,事務局より資料1に基づいて委員の紹介が行われた。
事務局から資料2に基づき説明が行われ,資料2の運営要領について了承された。審議を公開とするか否かについては,議題の内容に応じて都度判断することとした。
運営要領に基づき,委員の互選により長岡委員が座長に選出された。
また,長岡座長の指名により嶌田委員が座長代理に決定した。
事務局から資料3に基づき説明が行われた。各委員からの主な発言は以下のとおり。
【大湾委員】
(分野別×年齢別のクロス集計を行うに当たり)サンプル数を各セル最低100確保したいということだが,100という数は全体の平均値の推定誤差を全体の標準偏差の10分の1にする標本数ということか。
もしそうであれば,サブサンプルごとの標準偏差も重要になってくる。例えば,非常に研究時間の振れが激しいグループがあったとしても,あるグループで安定している部分があれば,それに基づいて必要なサンプル数を計算することもできる。
【富澤委員】
100人という数字にそれほど強い根拠はない。過去の標本誤差を計算した結果,セルによってばらつきがあるので必ずしも100が適しているとは言えないが,目安として100人を目標とした。
今入手できる情報という意味では,「大学等におけるフルタイム換算データに関する調査」(以下「FTE調査」という。)の平成25年調査における調査報告書の統計表43に相対達成精度という標準誤差の相対値に当たる数字がある。
【長岡座長】
FTE値の換算のときに,例えば,3時間研究をしている人の総労働時間が6時間だった場合,FTE換算係数は0.5になるのか。それとも,総労働時間は8時間が通常であるものと考えてそちらを基準にするのか。
【富澤委員】
FTE値の計算には二つの考え方があり,まずは総労働時間が6時間の教員も,12時間の教員も,全て割合を出し,その平均を取るというやり方がある。もう一つは,年間の研究時間の平均値を取り,総労働時間の平均値で割り算するというやり方がある。FTE調査では,後者のやり方を採用している。
後者の方が有利な点として,研究者によって総労働時間が異なるため,平均的な労働時間に対して何%働いているかという形の方がより正確な数字が出せるということがある。
事務局から資料4に基づき説明が行われた。各委員からの主な発言は以下のとおり。
【山本委員】
参考資料1にある抽出方法について,抽出番号をどのように指定しているのか。科学技術研究調査を作成する際の名簿があり,名簿に基づいて番号を指定しているということか。
【富澤委員】
本調査のために,科学技術研究調査の調査票情報(個票データ)の利用申請をしている。個票データから全国の大学について,学部ごとの教員の人数が判明するため,それを1つの仮想的な名簿として考える。後は,分野ごとの抽出率に応じて系統抽出を行う。
実際の名簿は,各大学の学部の事務局にある。科学技術研究調査に回答した際の名簿を使い,その名簿の例えば上から16番目,33番目,95番目の方に調査票を渡して回答を依頼してくださいというやり方をした。
サンプル数の抑制ということで考えられるのは,例えば,40歳未満とか45歳未満の人から何人抽出してください,というように年齢階層別の指定をする方法があるが,科学技術研究調査には,教員の人数の情報はあっても年齢階層別の情報がない。
そこで,御専門の先生方にお聞きしたいのだが,母集団側に十分に年齢のデータがない場合にサンプルだけで年齢別のデータを得られても,結局,母集団推計として適当でないと思うのだが,いかがだろうか。
【大湾委員】
母集団をまず大学単位で考えた際,学校教員統計調査から得られる年齢構成別の数字はある。基本的にはどの分野も同じような年齢構成になっていると仮定して割り振りはできないだろうか。
例えば,学校教員統計調査から年齢階層ごとの人数は分かるので,大学の事務局に依頼するときに,科学技術研究調査を作ったときの名簿を,年齢ごとにソートしてくださいと頼む。年齢ごとにソートしてもらった上で,上から何番目,何番目と指定する。各分野の年齢構成が似通っているのであれば,大学全体の年齢構成を使って割り振っていく。
若しくは,学校統計基本調査において,科学技術調査統計と一番近い専門分野の年齢構成を使って年齢別にソートしてもらえば,こちらが持っている分布に従って抽出番号を選んでいけば,だいたい年齢別の分布がコントロールできるように思う。
【富澤委員】
科学技術研究調査における大学教員と,学校教員統計調査における教員の定義はだいたい一緒で,大学共同利用機関等の部分だけ違うため,そこを除けば,もうすごく近い値なので,そういう意味では,学校教員統計調査を年齢別の母集団情報として使用するという意味で可能だと思う。ただ,2年間のタイムラグを考慮するとどうだろうか。
【大湾委員】
2年間のタイムラグで,年齢構成はあまり変わらないように思う。
【富澤委員】
とはいえ,ミクロに個別の大学で見ていくと,例えば, 2年間で研究者が入れ替わった際,前は40歳以上だったポストに,今度は35歳の人が来たとか,階層が変わってくるという問題があるように思う。
それから,実務的な話で,大学の事務局側が,2年前の学校教員統計調査の回答者をきちんと管理しているか,同定できるのかが心配である。
【嶌田座長代理】
科学技術研究調査について,大学の事務局がどのように回答しているかというと,基本的に前年度の調査で使用したデータに,新しく追加になった先生のデータだけ継ぎ足している。そこに年齢の情報はない。
また,教員評価においては年齢構成よりも教授,准教授といった職階の方が重要視されている。なので,職階であればデータはそろっている可能性が高い。
【富澤委員】
職階別も,年齢別も,データとしてはよく使われる。政策の議論では,若手研究者という問題等に使われるし,職階別の議論もある。
【長岡座長】
(資料4について)理学と工学の人数が,科学技術研究調査と学校教員統計調査で異なるのはどうしてか。両者の合計は,ほぼ等しいのに。
【富澤委員】
科学技術研究調査における学問分野というのは,組織の学問別である。つまり,教員が理学部や工学部といった,どの学部に所属しているかで集計してある。一方で学校教員統計調査は個人の専門分野に基づいている。
理学と工学で違いが出るのは,例えば工学部に数学や物理や化学といった理学の専門の先生がいるというようなイメージで説明できる。組織の分類と個人の専門の違いである。
FTE調査においても,科学技術研究調査と同様に基本的なサンプリングを組織の学問別で行い,集計しているが,個人の専門分野も調査項目としては設定しているので,そちらの集計もできる仕組みにはなっている。
平成25年調査の報告書の付録26に記載があるが,科学技術研究調査における専門分野を簡略化したものを調査項目に加えている。ただし,サンプリングでこれを使っているわけではなく,(科学技術研究調査の定義に基づいた)組織における学問分野の定義でやらざるを得ないので,FTE調査の学問分野別の値というのは,組織の分野に基づいていることになる。
【山本委員】
問題となっているのは,サンプル数を抑制したいということだと思うが,現状は専門分野だけで母集団情報を使っていると。専門分野については,母集団推計するときにバイヤスを調整することができると思う。しかし、同じ専門分野の中で,高齢者がたくさん入ってしまっているとか,教授がたくさん入ってしまっているとかというのは,母集団推計をするときに,情報がないので,調整できないということだと思う。
学校教員統計調査を使うメリットというのは,そういうサンプリングでのバイヤスをより高い精度で修正できるというところがある。そういう意味では,サンプル数というよりも,むしろ精度の問題なのではと思う。
今,一番直近で使える,平成25年の学校教員統計調査と,平成25年のFTE調査の結果を活用し,サンプリングした標本の年齢構成と学校教員統計調査の年齢構成を比べて,どれぐらいずれているかというような検証を行い,年齢によるオーバーサンプリングや,バイヤスがあまりないことを確認できれば,無理に学校教員統計調査を使用しなくとも良いのではないか。
【長岡座長】
平成25年調査の報告書の16ページに,サンプリングの結果と,学校教員統計調査における年齢階層との比較がなされていて,若年層がアンダーサンプリングということがわかる。ただ,これはモビリティの問題かもしれない。そもそも把握することが難しい。
【山本委員】
講師以下のサンプリングが少なそうなので,何らかの形で,学校教員統計調査と母集団を合わせられればいいと思う。ただ,それができても,2年のずれというのはどう考えるのか。また,大湾委員が言われたように,年齢構成とか職階の比率だけを科学技術研究調査に割り当ててるというやり方もいいと思う。ただ,それを母集団情報と言っていいものなのかどうかが気になる。
【長岡座長】
母集団の推計には学校教員統計調査を使い,インプリメンテーションは従来の,科学技術研究調査による各大学の名簿を使うという,ハイブリッドの考え方と言える。それには、大学の事務局において,それぞれの調査に対して誰が回答しているかという問題もあるように思うが。
【嶌田座長代理】
本学で言えば,科学技術研究調査のもとになっている名簿のデータはあるが,恐らく年齢データは存在しないので,人事課から年齢データをもらって名寄せをするという作業が必要になってくるため,大学の事務局に負担はかかる。
一方で学校教員統計調査には年齢データは入っているが,最終的には名前を消して整理番号のみにしてしまっているので,名前と整理番号を対応付けたデータが残っているかはわからない。名前は全て消去して整理番号のみにしてしまっている可能性があるので,整理番号で85番の方と言っても,それは誰ですかという問題が起きる。番号がずれてしまうと,せっかくわざわざ年齢構成等のバランスを調整してやっているのに,その意味がなくなってしまう可能性がある。
【長岡座長】
母集団をどのように設計し、どのように調査するかというデザインは,従来の単純な延長でも様々な問題があり、もう少し議論をする必要があるため、次回も引き続き検討していく。
科学技術・学術政策局 企画評価課