例えば10人のグループを対象に学力テストを行った場合に、すべての対象者が10点だった場合も、1人だけが100点で他の人が0点だった場合も、平均点は同じ10点になってしまう。これは架空の例に過ぎないが、平均値だけで集団の特徴をつかもうとすると、分布の違いをはじめとする他の特性を無視してしまうことになる。
本稿の冒頭で学力問題は水準問題と格差問題に大別できると述べたが、格差をめぐる問題を論じる場合は、特に分布(ばらつき)の度合いが重要になる。報告書では平均を比較したあとに、「箱ひげ図」を示して分布について検討している。
図表2 社会経済的背景別、学習時間と国語A問題正答率の箱ひげ図(小6)
出典:お茶の水女子大学「平成25年度全国学力・学習状況調査(きめ細かい調査)の結果を活用した学力に影響を与える要因分析に関する調査研究」(2014年3月)p.93 [図表の配置を一部改変・加工している]
箱ひげ図は「箱」と「ひげ」を用いてデータの分布を示す方法である。図2ではSES別・学習時間別にグループを分けて、小6・国語A得点の分布を箱ひげ図で示している。
以下で、図の見方を説明したい。箱の中の線は中央値を示す。先の架空の例からも分かるように、平均値は外れ値(極端に大きい・小さい値)があると大きく変動してしまうので、箱ひげ図では集団の特性を代表する値として外れ値に強い中央値(集団の真ん中に位置するケースの値)を用いている。
箱の下端は第1四分位(最小値から数えて全体の25パーセント目[100人の場合は25番目]に位置する値)、上端は第3四分位(75パーセント目に位置する値)を表す。厳密にはやや異なるが、中央値を基準に上位と下位にグループをふたつに分けたときに、下位グループの中央に位置する者の値が第1四分位、上位グループの中央に位置する者の値が第3四分位と理解すると分かりやすい。
なお、箱の幅はIQR(interquartile range:四分位範囲)と呼ばれており、箱の中に全体の半分の人びとの値が含まれる。箱が長いと分布のばらつきが大きく、短いと特定の範囲内の値を示すデータが多い(ばらつきが小さい)ことを意味し、箱の長短を見ることで、直感的に集団の分布の特徴をつかむことができる。
「ひげ」は分布の裾野、つまり分析対象となる集団の半数が位置する範囲(箱)を超えた観測値の広がりを表現したものである。「ひげ」を作成する際にはIQRの1.5倍の長さをひとまず暫定的な範囲とし、実際に測定したデータがその範囲内に収まる場合はそれぞれの上限・下限まで箱の上端・下端から線を延ばして作図する。
1.5倍を暫定的な範囲としているのは、データが正規分布している場合、IQRの1.5倍の範囲内に約99%のケースが収まり、そこを越える値をめったにない値(後述する「外れ値」)として把握するためである。観測されたデータは必ずしも正規分布しているわけではないが、通常ならばめったに生じない結果を捉えるためにこの基準が用いられている(ただしひげの長さをIQRの1倍にするなど、別な基準を用いる場合もある)。
例えば、暫定的なひげの長さが上限100点、下限10点の場合、実際のテストの得点分布の上限が98点、下限が8点の場合は実際のひげの長さの上限は実測値の98点・下限は暫定的な値の10点までになり、下のひげの長さを超えた8点のケースを「めったにない値」(後述する外れ値)を示すものと捉える。
箱とひげを作図したあとに「めったにない値」を示したケースを書き込むと、箱ひげ図が完成する。データがひげの範囲を越えてしまった場合は「外れ値」(図では○で標記)、さらにひげの長さの3倍を超えた場合は「極値」(図にはないが*で標記)として別途示される(ただし、外れ値などの標記法は統計分析に用いるソフトウェアによって異なる)。
図2をみると箱とひげの両方が長く、分布にかなりのばらつきがあることが分かる。SESの最も低いグループ(Lowest SES)で「3時間以上」学習するグループと、最も高いグループ(Highest SES)で勉強を「全くしない」グループの箱ひげ図(図の左上と右下:楕円で囲んだ部分)を比べてみると、中央値は後者が高く箱の長さ(IQR)は短いが、二つの箱が示す範囲にはかなりの重なりがみられる。
ひげの下端はSESが高く「まったく勉強しない」グループのほうが短く、SESが高い保護者の子どもたちは全く勉強をしなくても(外れ値を除き)正答率3割を下回ることないが、ひげの上端はいずれも100で、二つのグループとも全問正答者が存在していることが分かる。
平均値のみを比べると努力では埋められない格差が存在するように思えてしまうが、分布をみるとSESの差を努力で埋めているケースがそれなりに存在していることが分かる。図1と図2は同じデータを用いて集団の特性を表したものであるが、図が与える印象は、だいぶ違うのではないだろうか。
報告書では箱ひげ図を検討したあとに、次のように結果を解釈している。
「社会経済的背景別学習時間別に示された「箱」は縦に長い。すなわち同じSESグループに分類され同じような学習時間の子どもで、学力の散らばりが一定程度存在する。先に平均値をもとに「社会経済的背景がLowest SESの児童生徒が3時間以上勉強して獲得する学力の平均値は、Highest SESでまったく勉強しない児童生徒の学力の平均値よりも低い」という知見を提示した。しかし、両グループの学力に散らばりが存在し、また箱に重なっている範囲が存在することは、先の知見が「社会経済的背景がLowest SESで3 時間以上勉強しているすべての児童生徒の学力が、Highest SES でまったく勉強しないすべての児童生徒の学力を下回っている」ことを意味するわけではない。」(2014年版報告書、p.92:強調は原文の下線を太字に変更)
分布に関する情報が提示される事例も出てきているが、学力テストの結果が報道される際には、都道府県別の平均正答率とその順位が大きく取り上げられる傾向が根強い。教育委員会や学校がテストの結果を検証し、授業改善につなげる取り組みを行う際にもこうした「平均値主義」が蔓延している。
平均のみに着目した議論は、学力の状況を的確に把握しているとはいえず、不毛である。こうした状況を少しでもましにするためには、分布に着目することが重要である(注)。
(注)なお、暴力的な平均値主義を乗り越えるもうひとつのやり方としては複数時点の学力の差を「付加価値」として捉え、学力の時系列的な変化に着目する方法があるが、ここでは議論を省略する。
第三に、学力に影響を与える要因の効果を検討する際には、変数を統制して見かけ上の影響を取り除く必要があるが、この点に考慮せずデータを解釈する事例が散見される。
例えば、文部科学省と連携し国民運動の推進をめざす「早寝早起き朝ごはん」全国協議会は、調査データをもとに「規則正しい生活習慣」に学力を高める効果があることを示し、これを根拠に子どもの生活リズムを確立させることの大切さを保護者に呼びかけている。
確かに朝食を食べる頻度と学力の間には相関関係がみられるが、保護者のSESが高い家庭は総じて教育熱心で、子どもの生活リズムを整えるよう働きかけている傾向が強い。そうすると実際はSESが学力を押し上げているだけで、規則正しい生活→学力という影響力は見かけ上のものである可能性がある(図3)。
図表3 疑似相関の例
(筆者作成)
疑似相関が生じてしまう変数間の関係は他にもあるが、こうした見かけ上の影響力を取り除くためには、変数を統制する必要がある。先に示した図表1は、SES別に学習時間と学力の関連性を図示しており、SESを統制したうえで学習時間が学力に与える影響力が検討されている。
ある変数Aが別の変数Bに与える影響を把握するためには、それ以外の条件を一定にそろえたうえで(すなわち変数を統制したうえで)、二つの変数の関連をみてゆく必要がある。図表1ではSES別にグループを分け、各グループで学習時間別の平均正答率を比較することで、家庭的な背景(SES)を統制したうえで残る学習時間→学力の影響を検討しているわけである。
こうしたやり方の他に、多変量解析と呼ばれる手法を用いると、分析に用いた変数をそれぞれ統制したうえで各変数が学力に与える影響力を捉えることが可能になる。
図表4は、多変量解析のひとつである重回帰分析(注)という手法を用い、SESの影響を統制する前後で保護者の子どもへの関与が学力に与える影響力がどのように変化するのかを示したものである。
(注)回帰分析は、従属変数=係数1×独立変数a+係数2×独立変数b・・・係数n×独立変数z+定数という回帰式を設定し、実際に得られたデータをもとにそれぞれの係数を推計し、独立変数(ここでは「読書活動」などの説明要因)が従属変数(ここでは学力テストの得点)に与える影響を検討する分析手法である。
図表4 保護者の関与と学力の関係(小6・国語A)
出典:お茶の水女子大学「平成25年度全国学力・学習状況調査(きめ細かい調査)の結果を活用した学力に影響を与える要因分析に関する調査研究」p.48
棒グラフと表で示されている数値(標準化係数)は、それぞれの変数が学力テストの得点(図表では小6・国語A問題の正答率)に与える影響を推計し、係数を標準化することで変数間の単位の違いを捨象して比較可能にしたものである。標準化係数の絶対値が大きいほど影響力が強く、正の値は学力をあげる効果を、負の値は逆に学力を下げる効果があることを意味する。図表中の係数の値はすべて正なので、ここで取り上げた変数はすべて学力テストの得点を押し上げる効果があることになる。
図表中の「読書活動」は「小さいころ絵本の読み聞かせをした」「子どもに本や新聞を読むようにすすめている」など、読書を促す活動に関する質問項目6項目の回答をもとに、主成分分析という手法で作成した合成変数である。
「生活習慣」は「子どもが決まった時間に寝かせるようにしている」「毎日子どもに朝食を食べさせている」など、規則正しい生活習慣を確立させる関わりに関する5項目を合成している。「信頼関係・コミュニケーション」(5項目を合成)、「文化的活動」(2項目)、「勉強に対する働きかけ」(3項目)も同様に作成されている。
グラフの下の表は、SESを統制する前後の係数の変化を整理したものである(統制する前は単回帰分析、統制後は重回帰分析の結果)。SESを統制する前の「読書活動」の係数は0.29だが、SESを統制すると係数が0.19に縮小し、0.29-0.19=0.1と、統制前の数値と比べると34%、係数の絶対値が縮小している。統制後の値は、SESが介在することで生じる見かけ上の影響を除外したうえで、読書を促すような関わり方が学力に与える影響を示すものである。
図表4で分析に用いた「生活習慣」は、「早寝早起き朝ごはん」全国協議会が重視する「生活リズム」と類似したことがらを表す独立変数である。SES統制後の係数は0.16→0.09と約4割縮小している。係数は小さいものの独自の効果もあり、まったくの疑似相関とまでは言い切れないが、規則正しい生活習慣が学力を高める効果のうち、4割程度はSESを媒介とした見かけ上のものなので、「早寝早起き朝ごはん」に過剰に期待しすぎると本質を見誤ってしまうだろう。
同様に、「文化的習慣」や「勉強に対する働きかけ」の縮小率はそれぞれ5割強、8割弱で、これらの変数が単独で学力に与える影響は非常に弱いことが分かる。統制前の影響力が最も強く縮小の幅も少ない「読書活動」は、分析に用いた5つの変数のなかでは学力をあげるための有効な働きかけであるが、それでもSESを統制すると係数が3割以上縮小しており、その効果は限定的である。「信頼関係・コミュニケーション」は縮小率が少ないが、統制前の係数がそれほど大きくなく、「読書活動」の半分程度の押し上げ効果しかない。
SES統制後に係数が縮小するのは、「もともとSESが高い保護者ほどそのような働きかけを行う傾向がある」ことを意味している。換言すれば、SESが低い保護者は、学力を高めるために有効な働きかけを行う余裕がない、あるいは学力形成のメカニズムを説明した箇所で述べたように、教育に熱心な保護者とは違うロジックによって、あえてそのように関与していないことを意味している。
ここで重要なのは、学力を高める「効果のある取り組み」をすべての保護者に押しつけることではなく、なぜそのような関わりをしないのか/関わりができないのか、その背景を把握しようと試みることである。そのような社会学的想像力を欠いたまま学力向上に役立つ取り組みを促す取り組みは、ただえさえ不利な状況にある保護者を一層追い詰め、善意の名のもとに排除する恐れがある。教育社会学者がSESを統制して学力を論じることが多いのは、教育にできること/できないことを区別したうえで、格差是正の手立てを構想するねらいがあるためである。
やや話がそれてしまったが、複雑な現象を過度に単純化し「学力をあげるためには○○すれば良い」と乱暴な議論に陥ることを回避するためにも、変数を統制してデータを検討する作業が重要である。多変量解析を行わなくても、図表1に示すようにひとつの変数を統制して比較の作業を行うだけで分かることは多い。
多様な検証に開かれた調査へ
学力データを読む際に留意すべき点は他にもあるが(相関関係と因果関係を混同しないなど)、本稿では基礎的なポイントを3つ紹介した。(1)変数がなにを表しているのかを確認すること(データが指し示すもの以上を読み込む過剰な解釈を避けること)、(2)平均だけでなく分散(ばらつき)も確認すること、(3)変数を統制し、見かけ上の影響を除去すること、の3点である。これらは学力調査のみならず、統計的なデータを読むときの基本的なリテラシーといって良いだろう。
子どもの家庭的な背景が学力に与える影響を論じる際に、本稿ではごく一部しか内容を紹介できなかったが、2014年版・2015年版の保護者調査を活用した学力データ分析報告書では、SESが生み出した学力格差を克服する要因の分析や、格差是正に効果をあげている学校のケーススタディなど、ここで触れた論点以外にも多様な観点による分析がなされている。この問題の詳細に興味をもった読者は、そちらを参照していただきたい。
最後に、学力に影響を与える要因は極めて多様で、保護者の社会的な属性が与える影響はその一部に過ぎないことをあらためて確認しておきたい。
回帰分析を行う際には、分析に用いた変数が従属変数の分散の何割を説明するのかを示す決定係数(0~1の値を示し、回帰式で推計された値と実測値の一致度が高いほど決定係数が大きくなる)を出し、分析に用いたモデルが経験的なデータにどの程度適合するかを確認するが、保護者のSES、学力期待、社会関係資本、子どもの学習時間など、学力に強く影響を与えると思われる変数を用いた分析でもその説明力は最大で3割程度に過ぎない(2014年報告書、p.66)。保護者のSESは確かに学力に多大な影響を与えるが、それだけですべてが決まるわけではない。
社会的属性以外の様々な要因が子どもの学力に影響を与えていることは、教育社会学的な学力論の前提になっている。説明力が必ずしも高いとは言えない場合でもモデルの結果を参照するのは、学力を規定する複雑な要因のなかで、社会構造がどの程度の影響を持つのかを把握するためである。
あまりうまい比喩ではないが、教育社会学者の仕事は、競馬の結果を予想する際に、レースコースの状況を把握する作業に近いかもしれない。当然ながら競技の結果のほとんどは馬や騎手によって決まるわけであるが、わたしたちの関心はむしろそれよりも、競技に参加するすべてのプレイヤーに影響を与える構造的な要因(社会的な属性の違いが学力差に転換されるメカニズムの総体)がレースの結果をどの程度左右するのかに着目するのである。
また、図表4で整理したように、モデルを構築する際の変数の組み合わせを変えてその結果を比較することで、実際の影響と見かけの影響を区別しつつ、学力形成の社会的要因を探る意図もある。
他方で、保護者の社会的属性が学力に与える影響を分析した結果を一般の人が目にするときには「生まれですべてが決まる」と決定論的に理解されることが多いように思われるが、決してそのようなことはない。子どもたちの学力は、かれらの社会的な背景に加え、それ以外の諸要因、本人の能力・資質、教師の特性や生徒との関係のあり方、教室で展開される教授学習活動、学校の組織的特性、教育行財政による資源配分様式など、様々な要因が折り重なるなかで形成されてゆく。
また、統計データで分かるのは、あくまでも確率的に表現された集団間にみられる系統的な差異に過ぎない。そこで明らかにされたことが、個別の事例にあてはまるとは限らない(例外が存在する)点にも注意する必要がある。
複雑な要因を腑分けしながら所得格差と学力格差の関係を解明するためには、心理学者や経済学者(あるいはそれ以外の学問分野による)、教育社会学的な問題関心だけに限定されない、多様なアプローチによる研究をすすめてゆく必要がある。
しかしながら、現行では学力データへのアクセスはかなり制限されている。例えば文科省の行う保護者調査の場合、委託研究に関与する人びと以外は、個票データを検討することができない状況である。
すぐに実現することは難しいとは思うが、今後の「きめ細かい調査」では学術的な実態の把握と分析に目的を特化したデータセットを作成し、国際学力調査と同様に公開することが望ましい。
なにが子どもたちの学力を左右するのかを明らかにし、そのうえで教育にできること・できないことを論じてゆくためには、様々な関心からデータを検証し、学力に関する研究的・政策的な議論を深めることが可能な「開かれた調査」をデザインすることが求められている。
知のネットワーク – S Y N O D O S -
出版社:岩波書店( 2015-04-29 ) 定価:¥ 4,536 Amazon価格:¥ 4,536 単行本 ( 232 ページ ) ISBN-10 : 4000610422 ISBN-13 : 9784000610421