相関関係
2変数の相互関係を相関関係(相関)といい、大きく分けて次の3つの関係があります。
そして、正の相関と負の相関には
- 強い相関(関係)
- 弱い相関(関係)
があります。
正の相関
一方の変量が増加したとき、他方の変量も増加する傾向にあるとき、これら2変数の間に正の相関があるといいます。
負の相関
一方の変量が増加したとき、他方の変量は減少する傾向にあるとき、これら2変数の間に負の相関があるといいます。
相関なし
2変数の増減が関係なく起こるとき、相関はないといいます。
相関の強さ
相関の強さを表すとき、次のような表現をすることがあります。
- 強い相関がある:相関係数±0.7〜±1
- 中程度の相関がある:相関係数±0.4〜±0.7
- 弱い相関がある:相関係数±0.2〜±0.4
- ほとんど相関がない:相関係数±0〜±0.2
強い正の相関 |
弱い正の相関 |
強い正の相関 |
弱い負の相関 |
ほとんど相関がない |
ほとんど相関がない |
※これらの相関図の作成には、Webサイト「Project CASE」のシミュレーション教材「散布図(相関図),相関係数」を利用しました。
相関表
2変量の関係を示す度数分布表を相関表といいます。
[例] あるクラスの生徒20人の数学と物理のテストの得点は次の表のようになった。
名前 | 数学 | 物理 | 名前 | 数学 | 物理 |
---|---|---|---|---|---|
Aくん | 52 | 61 | Kさん | 75 | 70 |
Bくん | 63 | 52 | Lさん | 65 | 59 |
Cくん | 34 | 22 | Mさん | 51 | 56 |
Dくん | 43 | 21 | Nさん | 72 | 79 |
Eくん | 56 | 60 | Oさん | 49 | 48 |
Fくん | 67 | 70 | Pさん | 69 | 73 |
Gくん | 35 | 29 | Qさん | 55 | 57 |
Hくん | 53 | 50 | Rさん | 61 | 68 |
Iくん | 46 | 39 | Sさん | 41 | 42 |
Jくん | 79 | 78 | Tさん | 34 | 36 |
これを相関表にまとめると次のようになります。
数学\物理 | 21〜30 | 31〜40 | 41〜50 | 51〜60 | 61〜70 | 71〜80 | 計 |
---|---|---|---|---|---|---|---|
21〜30 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
31〜40 | 2 | 1 | 0 | 0 | 0 | 0 | 3 |
41〜50 | 1 | 1 | 2 | 0 | 0 | 0 | 4 |
51〜60 | 0 | 0 | 0 | 3 | 2 | 0 | 5 |
61〜70 | 0 | 0 | 0 | 2 | 1 | 2 | 5 |
71〜80 | 0 | 0 | 0 | 0 | 0 | 3 | 3 |
計 | 3 | 2 | 2 | 5 | 3 | 5 | 20 |
相関図
2変量の関係をグラフで表したものを相関図(散布図)といいます。
共分散 
2つの変量の
個の値の組
としたとき、
を共分散といい、で表します。
相関係数 
2つの変量の間にどれだけの相関があるか表す値を相関係数といい、で表します。
2つの変量の
個の値の組
とすると、相関係数は
となります。
相関係数は
の値をとり、
が1に近いほど2変量の間の相関が強く、0に近いほど相関が弱くなります。また、
のとき正の相関が、
のとき負の相関があります。
[例] あるクラス生徒10人の数学と物理のテストの得点は次の表のようになった。このとき、数学と物理のテストの得点の相関係数を求めてみましょう。
生徒 | 数学 | 物理 |
---|---|---|
Aくん | 93 | 90 |
Bくん | 59 | 64 |
Cくん | 78 | 65 |
Dくん | 30 | 21 |
Eくん | 71 | 66 |
Fさん | 81 | 76 |
Gさん | 55 | 56 |
Hさん | 77 | 79 |
Iさん | 48 | 37 |
Jさん | 68 | 66 |
データを表に整理すると次のようになります。
計算式は以下のようになります。
分散
標準偏差
共分散
相関係数
相関図
【重要】相関図と相関係数の関係
センター試験では相関図を見て相関係数を推測する問題が出題されています(06' 第5問[2](1)シ、09' 第5問(5)ツ)。そのため、このページ内の相関図の作成に利用した「Project CASE」のシミュレーション教材「散布図(相関図),相関係数」を利用するか、このページに掲載されている相関図を見るなどして、相関係数と相関図の関係を視覚的に理解して下さい。
09年の問題は理論上は問題中の値から相関係数を手計算することも可能ですが、センター試験の時間的な制約を考えると、相関図から相関係数を推測する力を試す意図で出題されていることは明らかです。
(左から)相関係数 0.5, 0.7, 0.9
(左から)相関係数 0, 0.1, 0.3
(左から)相関係数 -0.5, -0.7, -0.9
(左から)相関係数 0, -0.1, -0.3
[問題] それぞれの相関図は相関係数がいくつのものか。(a)〜(h)の中から選びなさい。
(1)
(2)
(3)
[選択肢]
- (a) 1.5
- (b) 0.9
- (c) 0.5
- (d) 0.3
- (e) -0.1
- (f) -0.5
- (g) -0.9
- (h) -1.5
[解答]
相関係数は
の値をとります。つまり、(a) 1.5 や (h) -1.5 になることは絶対にありません。そのため、(b)〜(h)の中から最も適当なものを選ぶことになります。そして、
が1に近いほど2変量の間の相関が強く、0に近いほど相関が弱くなります。また、
のとき正の相関が、
のとき負の相関があることを考えると、答えは以下のようになります。
(1) (b)
(2) (f)
(3) (d)