相関係数とは
相関係数とは、2つの数値の相関関係を数値化したもので、下記の計算式で算出することができます。

xとyの共分散を、xの標準偏差とyの標準偏差の積で割ると求めることができます。
相関係数の絶対値が1に近いほど強い相関関係があります。そのため相関係数を見て分析を行う際には、絶対値が0.7以上なら強い相関がある、絶対値が0.3未満なら相関はない、といったように基準値を決めてそれを元に分析するのが良いでしょう。
Tableauでは、この相関係数を関数を使って簡単に算出することができます。今回はそんな相関係数を使ってみました。
相関係数の算出
今回はおなじみのサンプルスーパーストアのデータと、総務省統計局ホームページに掲載されていた、都道府県別の降水量のデータを使用し、その相関関係を見てみました。
Tableauで相関係数を算出するためには、CORR関数またはWINDOW_CORR関数を使用します。
具体的な書き方は以下に。
CORR関数
WINDOW_CORR関数
WINDOW関数はウィンドウ内の計算を行うための関数で、計算する範囲を指定することができます。
今回は集計値を扱うので、WINDOW_CORR関数を使用しました。
まず、月別の売上と降雨量の相関係数を求めてみたところ、以下のようになりました。

相関係数は0.33とそれほど高くありません。
都道府県別にも見てみたところ、以下のようになりました。
※グラフを並べる方法については「Tableauでマスの数(行と列の数)を指定してグラフを並べる方法」をご覧ください。

ほとんど相関がない都道府県もあれば、相関係数が0.7を超えている都道府県もありますね。
なお、ラベルは下記の3種類の計算式を作成して色分けを行っています。
※6月を指定しているのは、グラフの中心地点でのみラベルを表示させたかったからです。
相関ラベル | 強
相関ラベル | 中
相関ラベル | 弱
ラベルの色分けについては、「ツールヒントTips集:条件に応じて色分けする」をご覧ください。
相関係数の注意点
相関係数はあくまで相関関係であり、因果関係ではないことに注意しましょう。今回の例だと、「降水量が多いこと」と「サンプルスーパーストアの売上が多いこと」に相関関係があったとしても、「降水量が大きいからサンプルスーパーストアの売上が上がった」「サンプルスーパーストアの売上が高いから雨がよく降った」といった解釈はできません。
分析をする上での切り口の発見や、仮説を立てるためのきっかけ等に使用するようにしましょう。
まとめ
今回はTableauで相関係数を算出してみました。注意点に気をつけて使ってみてください!
Tableau Public : https://public.tableau.com/views/34920/sheet0?:language=ja&:display_count=y&:origin=viz_share_link
気長、継続そして発汗は成功への完璧なコンビネーション。
- ナポレオン・ヒル -
- ナポレオン・ヒル -
相関係数とは、2つの数値の相関関係を数値化したもので、下記の計算式で算出することができます。
xとyの共分散を、xの標準偏差とyの標準偏差の積で割ると求めることができます。
相関係数の絶対値が1に近いほど強い相関関係があります。そのため相関係数を見て分析を行う際には、絶対値が0.7以上なら強い相関がある、絶対値が0.3未満なら相関はない、といったように基準値を決めてそれを元に分析するのが良いでしょう。
Tableauでは、この相関係数を関数を使って簡単に算出することができます。今回はそんな相関係数を使ってみました。
相関係数の算出
今回はおなじみのサンプルスーパーストアのデータと、総務省統計局ホームページに掲載されていた、都道府県別の降水量のデータを使用し、その相関関係を見てみました。
Tableauで相関係数を算出するためには、CORR関数またはWINDOW_CORR関数を使用します。
具体的な書き方は以下に。
CORR関数
CORR( [メジャー1] , [メジャー2] )
WINDOW_CORR関数
WINDOW_CORR( SUM([メジャー1]) , SUM([メジャー2]) )
WINDOW関数はウィンドウ内の計算を行うための関数で、計算する範囲を指定することができます。
今回は集計値を扱うので、WINDOW_CORR関数を使用しました。
まず、月別の売上と降雨量の相関係数を求めてみたところ、以下のようになりました。
相関係数は0.33とそれほど高くありません。
都道府県別にも見てみたところ、以下のようになりました。
※グラフを並べる方法については「Tableauでマスの数(行と列の数)を指定してグラフを並べる方法」をご覧ください。
ほとんど相関がない都道府県もあれば、相関係数が0.7を超えている都道府県もありますね。
なお、ラベルは下記の3種類の計算式を作成して色分けを行っています。
※6月を指定しているのは、グラフの中心地点でのみラベルを表示させたかったからです。
相関ラベル | 強
IF ABS([相関係数]) >=0.7 AND MAX([月])="6月" THEN [相関係数] END
相関ラベル | 中
IF ABS([相関係数]) >=0.4 AND ABS([相関係数])<0.7 AND MAX([月])="6月" THEN [相関係数] END
相関ラベル | 弱
IF ABS([相関係数]) < 0.4 AND MAX([月])="6月" THEN [相関係数] END
ラベルの色分けについては、「ツールヒントTips集:条件に応じて色分けする」をご覧ください。
相関係数の注意点
相関係数はあくまで相関関係であり、因果関係ではないことに注意しましょう。今回の例だと、「降水量が多いこと」と「サンプルスーパーストアの売上が多いこと」に相関関係があったとしても、「降水量が大きいからサンプルスーパーストアの売上が上がった」「サンプルスーパーストアの売上が高いから雨がよく降った」といった解釈はできません。
分析をする上での切り口の発見や、仮説を立てるためのきっかけ等に使用するようにしましょう。
まとめ
今回はTableauで相関係数を算出してみました。注意点に気をつけて使ってみてください!
Tableau Public : https://public.tableau.com/views/34920/sheet0?:language=ja&:display_count=y&:origin=viz_share_link
コメント