読者です 読者をやめる 読者になる 読者になる

君は偏差値を説明できるか?

科学 備忘録
【スポンサーリンク】

f:id:browncapuchin:20170410222210p:plain

はじめに

大学受験,高校受験,あるいは中学受験のとき,偏差値という言葉を聞いたことがない日本人はいないと思います.

中には偏差値で人生が変わった人も少なからずいることでしょう.

うちの子たちの受験でも『進学レーダー』に添付されてる各校偏差値一覧を何度も何度も何度も何度も目にしました

でも受験が終わってふと我に返るとその偏差値はいったいどんな計算をしてはじきだされるのか私は説明できませんでした.

筆者は統計検定について仕事の都合で否応なくそれなりに勉強しましたが,偏差値はスルーしていたのです.

そこで,このエントリーでは誰もが聞いたことがあるにもかかわらず,中身をよく知らないまま多くの人が使っているかもしれない偏差値について,筆者に可能な限りわかりやすく書きました.

偏差値のおおもとは平均値

偏差値を計算するための数値がいくつかあります.そのうち,もっとも大切なのは母集団と平均値です.

例えばこれを読んでいる方あるいはお子さんが河○塾の全国統一模試を受けたとします.

この場合,河○塾の全国統一模試を受けた人たちが母集団となります.

一方,もし同じ日に代○木ゼミナールの模試があってそちらを受けた人達は母集団には含まれません.問題も受験者も違いますからね.

したがって,違う母集団同士のデータをごっちゃにしてはいけないし,違う母集団同士の偏差値を直接比較してもあまり意味はありません(まったく意味がないわけじゃないことは最後に書きました)

河○塾の全国統一模試の結果の点数を合計し,受験者数で割ると平均値が計算できます.いろんな資格試験で使われているCBTでも同じです.

f:id:browncapuchin:20170410213608p:plain

(CBTのイメージ.あくまでイメージです.)

 

ここまでは何ら問題ないと思います.というか,当たり前ですよね?

でも,今では当たり前になった平均値という概念を人の事象に当てはめたのは,実は19世紀になってからなのです.

当てはめたのはアドルフ・ケトレー.ベルギーの天文学者で数学者でした(ケトレーに関しては[1], [2]を参照.ちなみにケトレーはBMI:Body Mass Index:ボディマス指数,別名ケトレー指数の提案者)

19世紀になると近代化が進み,数々の統計資料が出回るようになります.そんな中,ケトレーは,「エジンバラ・メディカル・ジャーナル」に掲載されたスコットランド兵士5738人の胸囲を集計して,胸囲が40インチ弱の値を中心とした正規分布を描くことに気づきました. [3]統計WEB | コラム『統計備忘録』 | 2007年4月


正規分布という言葉を聞いたことがある方は多いと思います.こんな山なりで左右対称のグラフですね(図の出典はhttp://www.cis.twcu.ac.jp/~konishi/stat14/stat14g.html

f:id:browncapuchin:20170410122539p:plain

 正規分布については総務省統計局によるこの説明がわかりやすかったです.

テストの成績は通常,平均点の近くの人数が一番多く,0点や100点に近づくほど人数が少なくなり,得点の分布は左右対称の釣鐘型になることが多いと言われます.このような分布の型を「正規分布」と言います.全国の高校生の身長や体重の分布など,多くの分布の型は正規分布であることが知られていますが,正規分布のグラフは中央が一番高く,両側に向かってだんだん低くなっていき,左右対称の釣鐘型をしていますが,正規分布の場合,この中央の一番高い位置に平均値がきます.[4]なるほど統計学園高等部 | 正規分布


◆上の図は正規分布しており,その平均値は0(ゼロ)です.偏差値の計算の場合,母集団の分布は正規分布していることが望ましいです.

偏差値の利用価値が高いのは,サンプルの数値の分布が正規分布に近い状態の時である.分布のピークが2箇所ある場合など,正規分布と大きく異なる場合には適切な指標となりえない場合がある.[5]偏差値 - Wikipedia


では次に進みましょう.

偏差値の計算には平均値と標準偏差が欠かせない

f:id:browncapuchin:20170410221223p:plain

 

あなたが全国規模の模擬試験のある科目(100点満点)を受けたと仮定します.

あなたの偏差値を計算するには
・あなたの得点
・模試の平均点
・模試の標準偏差
が欠かせません.

標準偏差の求め方をここで書くとこのエントリーの読者の皆様がきっと「そっ閉じ」するので記事末に参考HP・書籍を記載しました.

標準偏差とは「得点の散らばり具合を表す数値」[6]です.

得点の散らばりが少なければ標準偏差は小さくなり,多ければ標準偏差は大きくなります.

◆下図を見てください.

例えば平均点が50点で,①得点の散らばり範囲が狭い場合(青線)②得点の散らばり範囲が広い場合(赤線)①の標準偏差のほうがより小さくなります([6]http://kou.benesse.co.jp/news/nyushi/15020405.htmlの図を改変)

f:id:browncapuchin:20170410140951p:plain

 ◆では,あなたの国語の得点が55点,母集団の平均点が50点で標準偏差を5と仮定して偏差値を計算してみましょう.

偏差値=(得点ー平均点)÷標準偏差×10+50

(55-50)÷5×10+50=60
偏差値は60となりました.

◆次にあなたの数学の得点が国語と同じく55点,母集団の平均がやはり50点で標準偏差が10(標準偏差5より散らばり範囲が広い)だったとします.

(55-50)÷10×10+50=55
偏差値は55となりました.

◎このように,個人得点と母集団の平均点が同じであっても,受験生の得点のばらつき具合(標準偏差)によって偏差値が違ってくることがわかります.

偏差値とはなんぞや?

偏差値が何を示すのかぼんやり見えてきたと思います.

ここでもう少し偏差値の「りんかく」を明瞭にしましょう.

f:id:browncapuchin:20170409170157p:plain

◆偏差値の式を見ると,×10+50

という部分があることに気付きます.

その前の部分は

(得点ー平均点)÷標準偏差
ですね.

この部分で算出される数値を標準化得点と呼びます.

標準化得点とは

標準化得点は母集団の中であなたの得点がどのあたりにいるのかについて示す数値です.標準化とは,「元のデータの平均値と標準偏差がどんなものであっても,標準化されたデータ(標準化得点)は平均値が0,標準偏差が1になるということ([7], p.50)」です.

上で計算した国語の標準化得点は

(55-50)÷5=1

 標準化得点が1の場合,標準正規分布表によると(z値で縦に0〜5のうち1,上は小数点第2位を示す0〜9の0)0.158655になっています.これを100倍して%にすると15.8655%.

つまり,あなたの国語の得点が55点,母集団の平均点が50点で標準偏差が5のとき,あなたの得点は上から数えて15.9%くらいのところに位置する,ということがわかります.

この標準化得点に10をかけて50を足したのが偏差値なんですね!

f:id:browncapuchin:20170410225858p:plain

偏差値とは

偏差値は標準化得点に10をかけて50を足したものです.先に述べたように標準化得点とは,「元のデータの平均値と標準偏差がどんなものであっても,平均値が0,標準偏差が1」に標準化したものでしたね.

つまり,偏差値とは平均値を50,標準偏差を10に標準化した数値なのです.

◆ある模試のあなたの英語の得点が60点,母集団の平均が50点で標準偏差が10だったとします.

・標準化得点=(60-50)÷10=1
・偏差値=標準化得点×10+50=1×10+50=60

つまり,この場合だと標準化得点=1は偏差値=60になる,ということがわかります.

しかしながら,標準化得点はたいていの人にはまったくなじみがないので,自分の点数がどのあたりに位置するのかわかりにくいです.

一方,「偏差値は100点満点で平均点が50という,イメージしやすい得点である」ことがメリット([7], pp.57-58)とされています.

 

母集団の得点が正規分布するとき,偏差値50以上の主な上位パーセンタイルをあげておきます.偏差値をよりイメージしやすくなるでしょう.

・偏差値70以上→上位2.275%以内
・偏差値65以上→上位6.68%以内
・偏差値62以上→上位11.507%以内
・偏差値60以上→上位15.865%以内
・偏差値58以上→上位21.185%以内
・偏差値55以上→上位30.853%以内
・偏差値52以上→上位42.074%以内
・偏差値51以上→上位46.017%以内
・偏差値50以上→上位50%以内

ただし,すでに述べたように母集団の得点が正規分布と離れた場合には偏差値の有用性が落ちる点には注意が必要でしょう[8].受験生と親御さんは模試の得点分布が正規分布になっているかどうかをチェックしたほうが良いかもしれませんね.

ここまでくれば,偏差値の定義を読んでもきっとわかると思います.引用します.

あるグループの学力や身長のような事物の特性を測定したとき,個々の測定値の相対的位置を測定値の散らばり具合を統計学的に処理して得た数値(標準偏差)を単位にして,表して数値のこと. [9]偏差値の生みの親・桑田昭三氏へのインタービューhttps://jalt.org/test/PDF/Kuwata-j.pdf

【スポンサーリンク】

 

偏差値を作った男

偏差値を作ったのは桑田昭三氏(1928〜2016).中学の教員をしていた桑田氏は自分が受け持つ生徒の志望校を進学係の教員による経験と勘(前年度までの合格状況と私たちの勘を総合した結果[9])」によって変更させられ,判定が不服ならその根拠を論理的に説明せよと言われてしまったことが偏差値を生み出すきっかけになったとのことです[9].

なお,[9]のインタビューにおいて,桑田氏は偏差値の概念は他国では使われていないと思う,と述べています.

しかし,実際には他国でも使われているようです.

SATやGRT(北米大学や大学院へ進学する際に必要な共通試験),平均点を500に,標準偏差を100に対応させた値を得点としていたり,SATS(英国の初等教育における学力試験)では,平均点を100に,標準偏差を15に対応させた値が用いられたりしている.[8]学力偏差値 - Wikipedia

おわりに:こんなときは注意しよう

以上,偏差値について筆者にできる限りわかりやすく書きました.

ところで,ある生徒がある全国統一模試を受けたとき国語が65点,英語が60点だったとします.単純に国語のほうが出来が良かったと言えるでしょうか?

ここまでお読みくださった方なら,「国語と数学で平均点や得点のばらつき具合(標準偏差)が違うだろうから一概にそうとは言えない」,という答えにうなずいていただけると思います.偏差値はこういうときに威力を発揮するんですね.


一方,例えば河○塾・駿○・代々○ゼミナールなどの全国統一模試や○大入試オープン,○大入試プレ等々の偏差値を直接比較してもあまり意味がないこともおわかりと思います.模試問題も違えば母集団も違うのですから(もちろんそれぞれ参考にするのはアリです).

ただし,例えば「ある受験生はどの模試でも常に偏差値62以上をキープしている」のなら,「試験問題も受験生の顔ぶれも違うにもかかわらずいつも上位11.507%以内にいる」ことがわかります.

このエントリーが偏差値を理解して上手に利用する一助になればうれしいです.

標準偏差の求め方の参考HPと書籍

標準偏差の計算方法を記載するのがこのエントリーの目的ではないので,この点については割愛しました.標準偏差の求め方は平均値→偏差→分散の順に以下のページをご覧になるのが良いかと思います.すごくわかりやすいです.

・平均値と偏差:偏差の意味と求め方
・分散:分散の意味と求め方、分散公式の使い方
・標準偏差:標準偏差の意味と求め方 - 公式と計算例


私はこの書籍を参考にしました.

その他の参考HP等

[1]アドルフ・ケトレー - Wikipedia
[2]http://www.jma-net.com/1839
[3]統計WEB | コラム『統計備忘録』 | 2007年4月
[4]なるほど統計学園高等部 | 正規分布
[5]偏差値 - Wikipedia
[6]http://kou.benesse.co.jp/news/nyushi/15020405.html
[7]『統計数字を読み解くセンス 当確はなぜすぐにわかるのか?』青木繁伸著,化学同人,2009年,p.50
[8]学力偏差値 - Wikipedia
[9]偏差値の生みの親・桑田昭三氏へのインタービューhttps://jalt.org/test/PDF/Kuwata-j.pdf

アニメ風ロゴジェネレーターはiwako (id:iwatako) さんのブログエントリーを参考にしました.アニメ風ロゴジェネレーター33選!作成は無料でできる! - 人生の物語を楽しむブログ!ネガティブ・ライト


ではまた!