1.はじめに
前回の記事(1)でPISA調査の概要を説明しましたが、PISAから私たちが学べることは他にもいろいろとあります。今回は「学力調査の設計」という観点から、日本で実施されている全国学力・学習状況調査とPISAを比べ、学力を論じる前に知っておいてほしい「学力調査の基礎知識」について述べたいと思います。
はじめに、全国学力・学習状況調査とPISAの違いを整理しておきましょう。表1は、学力調査の目的や調査方法などについて、両者の違いを整理したものです。一見してわかるように、両者の設計には真逆の要素(悉皆調査に対して抽出調査など)がいくつもあります。
こうした差は、両者の調査目的の違いに由来するところが大きいと思われます。表1の一番上に記載しましたが、PISAが、その主たる目的を各国の「教育政策に活かす」ことに限定している(2)のに対して、全国学力・学習状況調査は、「児童生徒の指導に活かす」という目的を併せ持っています(3)。
学力調査を「児童生徒の指導に活かす」ためには、毎年度、すべての児童生徒のデータが必要です。そのため全国学力・学習状況調査では、調査サイクルが1年ごとに設定され、すべての児童生徒が同じテストを受験するという調査方式が採用されました(4)。さらに「指導に活かす」ために、全国学力・学習状況調査のすべてのテスト項目は、調査終了直後に公開されます。一方で、学校間の序列化を防ぎ、プライバシーを確保するという観点から、学力テストの個票データは非公開ですし、子どもの社会的属性(保護者の学歴や職業など)の情報も取得されていません。
表1からわかるように、全国学力・学習状況調査のこうした特徴は、PISAと大きく異なります。PISAは3年ごとに実施され、調査は抽出調査で行われます。受験者は全員が同じテストを受けているわけではありませんし、テスト項目も一部しか公開されません。その一方で、PISAの個票データはウェブサイト上に公開されており、誰でも自由に使うことができます。さらにPISAは、質問紙調査で受験者の社会的属性に関する情報を把握しています。
こうした違いを、たいしたことではないと思う人もいるかもしれません。全国学力・学習状況調査では、一人一人の子どもの得点がわかります。その得点を学校や市町村、あるいは都道府県で平均すれば、平均点の高い学校や地域、すなわち「よい教育をしている学校や地域」がわかるのだから、それで情報としては十分だろうというわけです。
残念ながら、この考え方は誤っています。学力調査の結果を教育政策に活かすには、PISAに倣った調査設計をしなければならないのです。以下では、全国学力・学習状況調査の何が問題なのか、PISAと比較しながら検討してみましょう。
2.全員が同じテストを受験することに伴う弊害
表1で見たように、PISAでは、すべての子どもが同じテストを受験しているわけではありません。なぜなら、すべての子どもが同じテストを受験すると、全体として見たときに、テストの精度が下がってしまうからです。
テストに使える時間の制約や、受験者の疲労といった問題があるため、1度のテストで1人の子どもが回答できるテスト項目の数には限界があります。そのため、全員が同じテストを受験するというテスト設計では、国語や算数(数学)といった幅広い調査領域のうち一部しかカバーできません。これでは、全員を調査したにもかかわらず、その国の子どもの得意・不得意な領域はわからないという事態が発生してしまいます。
幅広い領域をカバーするために、PISAで利用されてきた方法が、重複テスト分冊法(5)と呼ばれる技法です。これは、テストで出題したいテスト項目を複数のブロックに分割し、いくつかのブロックをまとめてテストの分冊を作成するというものです。さらに、分冊同士の内容が重なるように、ブロックを配置します(表2)。
表2では、100題のテスト項目を20題ずつ5つのブロックに分割し、各分冊を2ブロックで構成しています。ここで、子どもたちには分冊1~5のうち、いずれかを受験させます。こうすると、1人の子どもは2ブロックのテスト項目(40題)に答えるだけで済む一方で、全体としては5ブロック分(100題)のテスト項目を出題することが可能になります。さらに、分冊同士に重複がありますから、この重複を手がかりに、一人一人の子どもの成績を比べることも可能です(6)。
もっとも、一人一人の子どもはテストで出題されたテスト項目の一部しか解いていませんから、その得点は正確なものではありません(7)。一方で、幅広いテスト項目を出題しているために、全体の状況はよくわかります。重複テスト分冊法とは「1人1人の得点を推定することよりも、全体の得点を推定することを優先した技法である」と言うこともできるでしょう。
PISAが、テスト項目をすべて公開していないことにも理由があります。先ほど重複テスト分冊法の説明のところで、共通のテスト項目を手がかりに成績を比べると書きましたが、この発想は、異なる年度のテストの点数を比べるためにも使えます。前回の記事で述べたように、PISAは各サイクルの得点を比較可能ですが、これは、各サイクル間で共通のテスト項目を利用することで可能になっているのです。
ただし、注意しなければならない点もあります。それは、肝心な共通のテスト項目は厳重に秘匿しないといけないという点です。共通のテスト項目を公開してしまうと、特別な対策をする人が出てくるかもしれません。そうなると、得点の変化の推定は失敗し、ある国の得点が上昇(あるいは下降)したのかどうか判断することができなくなってしまいます。つまり、教育政策のための学力テストを作るときは、テスト項目を公開してはならないのです。
他にも、全国学力・学習状況調査のように、調査サイクルが1年で、かつ、調査実施後にすべてのテスト項目が公開されるという仕様では、毎年、すべてのテスト項目をはじめからつくり直さなければならないという問題も生じます。PISAでは、数年をかけてテスト項目の予備調査が行われ、項目が適切に機能しているかどうか統計的な検討が実施されています。しかし1年サイクルの全国学力・学習状況調査では、予備調査を実施し、テスト項目の精度を検討する余裕はほとんどないでしょう。
以上のことからわかるのは、「児童生徒の指導に活かす」ために、全国学力・学習状況調査が備えている特性(すべての子どもが同じテストを受験する、1年サイクル、テスト項目はすべて公開する)が、学力テストを「教育政策に活かす」ために必要な特性(テストの精度や、異なる年度間での得点の比較)をダメにしてしまっているということです。「一人一人の点数を平均すれば全体のこともわかるだろう」という発想では、教育政策のための学力テストを設計することはできないのです。【次ページにつづく】
シノドスをサポートしてくれませんか?
●シノドスはみなさまのサポートを必要としています。ぜひファンクラブ「SYNODOS SOCIAL」へのご参加をご検討ください。
⇒ https://camp-fire.jp/projects/view/14015
●シノドスがお届けする電子メールマガジン「αシノドス」
⇒ https://synodos.jp/a-synodos
●少人数制セミナー&Facebookグループ交流「シノドス・サークル」
⇒ https://synodos.jp/article/20937