「相関係数」で占う、2016年ペナントレース

2016年05月14日 06:00

野球

春を迎え、今年もプロ野球が開幕しました。今年はシーズン前に発覚した野球賭博問題等が観客動員に影響するのではないかと心配されましたが、テレビの中継を見る限り大丈夫のようです。これから秋まで、ファンにとっては一喜一憂する日々が続くことでしょう。

今日はあるデータを使って、ちょっと変わった角度から今シーズンのペナントレースを占ってみたいと思います。使用するデータは、小売店の併売分析などで使われる「相関係数」という指標です。

「相関係数」とは?

相関係数とは、2つの変数の相関の強さを表した数字のことです。1から-1までの値を取り、1に近いほど「正の相関性」が強い(Aが増えればBも増える傾向にある)ことになり、-1に近いほど「負の相関性」が強い(Aが増えればBは減る傾向にある)ことになります。またゼロ近辺の数字になれば、2つの変数に強い相関性は認められない(Aが増えれば、Bは増えることもあるし、減ることもある)ということになります。目安としては、プラスでもマイナスでも、0.7以上の数値になれば強い相関性があると判断することができます。

経営学の世界で相関係数が俄然有名になったのは、今や“伝説”となっている「ビールと紙おむつ」の事例が報告されて以来です。これは、アメリカのスーパーマーケットで相関係数を駆使したデータマイニングを行った結果、缶ビールと紙おむつの売上推移に強い正の相関性があることが分かり、両商品を近接してレイアウトしたら売上が飛躍的に伸びた・・・というものです。のちに、その理由は、アメリカではかさばる紙おむつを買うのは旦那さんの仕事で、缶ビールをついで買いするために両方の売上が同時に伸びるから、と説明されました。

相関係数の例

例えば、2005年度から2014年度までの日本の名目GDPと税収の間では、相関係数は0.731となります。これは、明確に「GDPが増えれば税収も増える」という正の相関性が認められるということです。一方、2003年度から2012年度までのビールとリキュールの国内販売量の間では、相関係数は-0.948となります。これは、第三のビールを含むリキュールがビールの代替品となり、「リキュールの販売が増えればビールの販売は減る」という強い負の相関性が存在することを表します。

相関係数の算出は、本来は共分散や標準偏差といった統計学上の専門的な知識が必要ですが、エクセルのCORRELという関数を使えば、共分散や標準偏差が分からなくても簡単に算出することができます。

相関係数で各チームの勝ちパターンを分析

前置きが長くなりましたが、これを野球に当てはめてみましょう。野球において、勝率と打率は高い方が良いですね。しかし、防御率は低い方が良いです。したがって、勝率と打率の相関性が高ければ相関係数は1に近い値が出、勝率と防御率の相関性が高ければ-1に近い値が出る、ということになります。楽天が新規参入した2005年以降昨シーズンまでの11シーズンの累計で、勝率と打率、勝率と防御率の相関性が比較的高いチームは以下のとおりです。

勝率と打率
ロッテ 0.880
阪神  0.777

勝率と防御率
ヤクルト -0.827
楽天  -0.730
巨人  -0.667
広島  -0.602

勝率と打率の相関性が突出して高いロッテと阪神は、勝率と防御率の相関係数はそれぞれ-0.323と0.352で相関性が薄く、明確に「打撃中心のチーム」と言えます。一方、勝率と防御率の相関係数が-0.7を超えているヤクルトと楽天の、勝率と打率の相関係数はそれぞれ-0.386と0.126で、こちらは明らかに「投手力中心のチーム」と言えます。

相関係数から今シーズンを占う

この結果から見て、現時点で最も過去の勝ちパターンに近い戦いをしているのは巨人です。防御率は5月10日現在、リーグ2位タイの3.58であるのに対し、打率はリーグ5位(.249)にとどまっています。巨人の勝率と打率の相関性は0.396でそれほど高くありませんから、これまでチーム成績を左右してきた防御率が良いということは、自身の勝ちパターンにハマった戦いができているということです。ただし、エースの菅野投手以外、主力先発投手が軒並み離脱している状況で、いつまでこの投手力を維持できるかが今後のカギになるでしょう。

一方で、打撃陣が健闘しているヤクルトと楽天がリーグ5位、6位に低迷しているのは、これまでチーム成績との相関が高かった防御率が悪いからです(ヤクルト:4.68でリーグ最下位。楽天:4.29でリーグ5位)。今後の浮上のためには、投手陣の整備が急務となるでしょう。

その反面、これまでの勝ちパターンとは違う傾向で調子がいいのがロッテと広島です。勝率と打率との相関性が高く、打撃中心のチームだと思われていたロッテは、今季は防御率3.35とリーグ2位の投手陣を武器に首位ソフトバンクに次ぐ2位につけています。また、勝率と防御率の相関性が高いはずの広島は、今季ここまでチーム打率.279で12球団トップ、首位中日とゲーム差なしの2位と、完全に打撃陣がチームを引っ張っています。この両チームに関しては、これから本来の得意パターン、ロッテなら打撃力、広島なら投手力がどれだけ上がってくるかが、優勝争いに絡めるかどうかの試金石になるような気がします。

相関係数は、データ深堀りツールとして結構使えます。散布図のようなビジュアル資料と合わせてプレゼンの説得力を増したり、冒頭の「ビールと紙おむつ」のような思わぬ発見の根拠とすることができます。前述のようにエクセルでも簡単に算出することができますので、興味がある事柄の相関の強さを測ってみるのも面白いと思いますよ。

【参考記事】
■相関係数分析の結果、今年の優勝は阪神に決まりました(笑)
http://ameblo.jp/mop1659/entry-11835734913.html
■メジャーで最も不運な投手?黒田博樹の安定力(村山聡 中小企業診断士)
http://sharescafe.net/40241196-20140808.html
■せっかくの学びが、地方のビジネス現場で役に立たない理由 (玉木潤一郎 経営者)
http://sharescafe.net/48339489-20160411.html
■なぜガリガリ君だけが、値上げをしても歓迎されるのか(福谷恭治 商売力養成コンサルタント)
http://sharescafe.net/48396009-20160420.html
■破壊的イノベーションの真の推進者(森山祐樹 中小企業診断士)
http://sharescafe.net/48245902-20160401.html

多田稔 中小企業診断士 多田稔中小企業診断士事務所代表


編集部より:この記事は「シェアーズカフェ・オンライン」2016年5月13日のエントリーより転載させていただきました。オリジナル原稿を読みたい方はシェアーズカフェ・オンラインをご覧ください。

関連記事

アクセスランキング

  • 24時間
  • 週間
  • 月間

過去の記事

ページの先頭に戻る↑