こんにちは!今日はまた相関分析の一種について勉強していきます。前回、数量データ✕数量データの相関を確認していましたが、今回実施するのは以下のようなケースです。
さて、これも前回のように、相関係数を求めるかどうか。基本的にはこのように測れないデータを「カテゴリーデータ」とよび、カテゴリーデータ同士の相関を見る場合は「クラメールの連相関」をみるのが一般的のようです。先の回で平均値の出し方にも色々あるというのを学びましたが、感覚的には今回も一緒で、相関の出し方にも色々流儀がある、と考えるのが良さそうです。時間があれば原点からゆっくり勉強したい。。。
式は以下の通り(画像引用:サイト「BDA style」)
この「n」はデータ数、「k」はクルス集計表の行数、「l」は列数となります。先にいうと、クラメールの連相関は結構計算が大変です。エクセル一発で出てくれると嬉しいのだが、、、
◇Step1「期待度数」
まずは期待度数を求めます。期待度数は 「当該行計 × 当該列計 ÷ 総計」のため、先程のケースでいうと以下の通り計算します
◇Step2「ズレ」の把握
実測度数と期待度数のズレを計算するために以下の計算式を用います
この右下の3.348…が「ピアソンのカイ二乗統計量」と言われるところです。
◇Step3 連関係数の計算「SQRT」
上記の通り計算を実施し、答えとして「0.1157…」が出てきたら正解です。こちらも、前回同様、「○以上だと関連がある」といった明確な基準は無いのですが目安として
1.0〜0.8 → 非常に強く関連している
0.8〜0.5 →やや強く関連している
0.5〜0.25 →やや弱く関連している
0.25 →関連していない
と言えそうです。
ちなみに今回の計算の参考は以下の書籍です。
参考:『マンガでわかる統計学』かなり分かりやすいので、これと『統計学入門』で、ちんぷんかんぷんだった統計が少し、身近でとらえどころのあるものであると実感が湧いてきました。ちなみに私は前にも述べたとおり文系なのですが、それでも頑張れば少しは理解できるもんだなと感じてます。。。亀の歩み。
では、次回は具体的なアンケート着手に挑みます。
どろん。