分散:
資料の散らばり具合を表す指標として、分散が用いられます。記号には(注1)を用います。
また、分散は次のように計算をすることもできます。この方法で計算をした方が簡単なことが多いのですが、センター試験では上記の方法で計算をするように誘導されることがあります。
ただし、
:二乗平均、
:平均の二乗
[証明]
偏差:
変量の平均との差を偏差といいます。すなわち、偏差とはのことです。このことから、分散は偏差の二乗平均であるといえます。
標準偏差:
分散の正の平方根
を標準偏差といい、記号には
(注2)を用います。
[例題]
次の表について、分散と標準偏差を求めなさい。ただし、標準偏差は小数第一位まで求めること。
(1)
|
10 |
20 |
30 |
40 |
50 |
(2)
|
20 |
25 |
30 |
35 |
40 |
[解答]
(1) 分散:200, 標準偏差:14.1
|
10 |
20 |
30 |
40 |
50 |
平均 |
30 |
|
-20 |
-10 |
0 |
10 |
20 |
|
|
|
400 |
100 |
0 |
100 |
400 |
分散 |
200 |
|
|
|
|
|
|
標準偏差 |
14.1 |
分散や標準偏差を求める問題はこのように表を整理して順々に計算を進めていくのがよいでしょう。
いまさら恥ずかしくて人には聞けない人のために・・・小数第一位まで求めるには小数第二位で四捨五入をすればよいのでした。例えば、計算の結果1.41…となれば、小数第二位を四捨五入して1.4とします。
(別解)
分散=二乗平均−平均の二乗 を利用して計算する方法もあります。こちらの方が比較的簡単に計算をすることができると思います。
|
10 |
20 |
30 |
40 |
50 |
平均 |
30 |
|
100 |
400 |
900 |
1600 |
2500 |
|
1100 |
|
|
|
|
|
|
|
900 |
|
|
|
|
|
|
分散 |
200 |
|
|
|
|
|
|
標準偏差 |
14.1 |
(2) 分散:50,標準偏差:7.1
|
20 |
25 |
30 |
35 |
40 |
平均 |
30 |
|
-10 |
-5 |
0 |
5 |
10 |
|
|
|
100 |
25 |
0 |
25 |
100 |
分散 |
50 |
|
|
|
|
|
|
標準偏差 |
7.1 |
(別解)
|
20 |
25 |
30 |
35 |
40 |
平均 |
30 |
|
400 |
625 |
900 |
1225 |
1600 |
|
950 |
|
|
|
|
|
|
|
900 |
|
|
|
|
|
|
分散 |
50 |
|
|
|
|
|
|
標準偏差 |
7.1 |
(考察)
(1)と(2)では平均値は同じですが、(1)の方が変量の平均値からの散らばり具合が大きいため、分散は大きくなっています。このように、分散や標準偏差を計算することで、平均値だけからは読み取れないデータの散らばり具合を観察することができます。
(参考)
[問題1]
次の表について、分散と平均値を求めなさい。ただし、標準偏差は小数第一位まで求めること。
(1)
|
160 |
165 |
180 |
170 |
175 |
(2)
|
20 |
20 |
20 |
20 |
20 |
[問題2]
次の表について、分散と平均値を求めなさい。ただし、標準偏差は小数第一位まで求めること。
階級値 |
50 |
55 |
60 |
65 |
70 |
度数 |
3 |
4 |
6 |
4 |
3 |
[解答1]
(1)
分散:50, 標準偏差:7.1
|
160 |
165 |
180 |
170 |
175 |
平均 |
170 |
|
-10 |
-5 |
10 |
0 |
5 |
|
|
|
100 |
25 |
100 |
0 |
25 |
分散 |
50 |
|
|
|
|
|
|
標準偏差 |
7.1 |
(別解)
|
160 |
165 |
180 |
170 |
175 |
平均 |
170 |
|
25600 |
27225 |
32400 |
28900 |
30625 |
|
28950 |
|
|
|
|
|
|
|
28900 |
|
|
|
|
|
|
分散 |
50 |
|
|
|
|
|
|
標準偏差 |
7.1 |
この問題のように、変量の値が大きく分散が小さい場合は、定義通りに偏差の二乗平均を求めた方が計算を楽にすることができる場合もあります。
(2)
分散:0, 標準偏差:0.0
|
20 |
20 |
20 |
20 |
20 |
平均 |
20 |
|
0 |
0 |
0 |
0 |
0 |
|
|
|
0 |
0 |
0 |
0 |
0 |
分散 |
0 |
|
|
|
|
|
|
標準偏差 |
0.0 |
この問題のように、全てのデータが同じ値の場合、データがまったく散らばっていないので分散・標準偏差ともに0となります。
ここで、注意しなくてはならないのは、標準偏差は小数第一位まで答えるように指示されているため、たとえ0であっても0.0と小数第一位を明記します。他にも、計算の結果、標準偏差がたまたまキリのいい数になった場合も、小数第一位を勝手に省略してはいけません。
例)× 5 → ○ 5.0
[解答2]
分散:40, 標準偏差:6.3
階級値 |
50 |
55 |
60 |
65 |
70 |
平均 |
60 |
|
-10 |
-5 |
0 |
5 |
10 |
|
|
|
100 |
25 |
0 |
25 |
100 |
|
|
度数 |
3 |
4 |
6 |
4 |
3 |
分散 |
40 |
|
|
|
|
|
|
標準偏差 |
6.3 |
注1
あなたが大学へ入って確率統計の講義を受けたとき、そこでは分散を(シグマ二乗)と表記していると思います。しかし、高校生の数学ではギリシャ文字σの代わりにアルファベット
を用いて、分散を
と表記することが多いです。そのため、ここでも分散を
で表すことにします。
注2
注1と同様に、ここでは標準偏差をと表記しますが、大学の確率統計の授業では
で表記されると思います。