1風吹けば名無し2020/11/24(火) 23:02:25.37ID:MgbmEFM90
<はじめに>
巨人が日本シリーズで惨敗している。
様々な理由が考えられるが,よく言われる理由の一つにリーグ間で大きな実力差があるのではないか,というものがある。(いわゆる実力のパ,人気のセ)
交流戦の累計勝利数等で上位にパリーグチームが集まり,下位にセリーグチームが来る傾向が見えるため,その傾向は正しいように思われるが,単純にソフトバンクの強さに引っ張られているだけである可能性もよく言及される。
そこで本研究では,「リーグ間で実力差があり,ソフトバンク関係なくパリーグの方が強い」という仮説を検証するために,2005年から2019年までの過去15年間の交流戦の成績を簡単な統計的アプローチで解析した。
2風吹けば名無し2020/11/24(火) 23:03:05.32ID:MgbmEFM90
<手法>
過去15年間の交流戦のデータはNPBの公式ページより入手した。https://npb.jp/bis/2020/stats/std_inter.html
本研究で目指すことは以下の4項目である。
(1)セパ両リーグ間の実力差が統計的に有意であるか調べる。
(2)ソフトバンクが存在しない場合でもパリーグはセリーグより強いか調べる。
(3)逆にセリーグのお荷物球団(横浜)がいなかったとして,差があるか調べる。
(4)15年前から去年までの勝率を比較して強くなった/弱くなった球団を明らかにする。
まず,なんJでよく出されるように勝敗を全部合計して示す。
次に,各年ごとに各球団の勝率を算出し,15年間における12球団の勝率からセパ球団で有意差があるか調べる。
というのも試合数の多い時代(例えば36試合時代)に大勝ち(36勝)してた球団があったとしたら,18試合制の最近のデータと足し合わせるだけでは比較できないからである。
統計解析は以下のWebページで行った。js-STAR version 9.8.7j
http://www.kisnet.or.jp/nappa/software/star/ 3風吹けば名無し2020/11/24(火) 23:03:23.54ID:HaRe7OTQ0
〈結論〉
よく分かりませんでした!巨人には頑張って欲しいですね!
4風吹けば名無し2020/11/24(火) 23:03:32.86ID:MgbmEFM90
<結果と考察>
Table 1 勝敗の合計(15年分)
勝利数 敗北数 引分数 勝率
ソ 214 126 14 0.629
公 186 157 11 0.542
ロ 184 156 14 0.541
巨 181 165 8 0.523
西 177 170 7 0.510
オ 173 171 10 0.503
中 171 173 10 0.497
阪 165 175 14 0.485
楽 164 186 4 0.469
ヤ 161 185 8 0.465
広 149 193 12 0.436
横 139 207 8 0.402
これだけで,すでにパリーグの方が強いということで終わってしまっても良いが,上述した通り試合数の多かった時代にパリーグが勝ってただけかもしれないし,
たまたまこのような結果に落ち着いているだけかもしれない。
そこで,各球団15年分の勝率を用いて球団間,リーグ間で差があるか検証していく。
まず,これらのデータセット(12球団×15年=180)がどのように分散するか調べるため,ヒストグラムを作成した。
その結果,割ときれいな正規分布になった(Fig. 1)。また,セリーグ,パリーグ単体でも正規分布していた(Fig. 1)。
このことから15年分勝率データセットを用いて有意差検定可能であると判断した。
Fig. 1: https://i.imgur.com/1DIOnMR.jpg 5風吹けば名無し2020/11/24(火) 23:03:43.82ID:7dbb4/elr
おちる
6風吹けば名無し2020/11/24(火) 23:03:44.45ID:IPvFKhuz0
巨人元木ヘッド「崖っぷちの崖っぷちだからね。意地見せるしかないでしょ。ジャイアンツっていうネームを背負ってるわけだから。すごい歴史の古いチームでやってるわけだから。その中でプレーでもって明日はみんなで必死になってやるしかない」
うーん、この
7風吹けば名無し2020/11/24(火) 23:04:01.15ID:MgbmEFM90
まず,各球団の15年分の勝率を平均し,その12個の平均勝率に差があるか調べた。
結果は以下の通りである(Fig. 2)。
それぞれの平均値についてANOVAで有意差(P<0.05)があるか調べた。
図の文字は,同じアルファベットが使われているものは差がなく,異なるアルファベットでは差があることを示す。
(aとabは「a」が入っているため差がないが,「a」と「bc」は差がある,等)
この結果はソフトバンクの平均勝率は,楽天と巨人を除くセリーグ各球団に対して有意な差があり,残りのパリーグ4球団と巨人とは差がないことを示す。
また,日本ハムは横浜とは差があるが,それ以外の球団とは差がなかった。
この結果からソフトバンクはやはり強いが,楽天を除く他のパリーグ球団および巨人も奮闘していることが示唆された。
Fig. 2: https://i.imgur.com/BbR3iuM.jpg
続いて,パリーグ6球団の勝率とセリーグ6球団の勝率を平均し,その値に有意差があるかt検定によって比較した(Fig. 3)。
その結果,パリーグ勝率0.54,セリーグ勝率0.46となり,P<0.01であった。
この結果より過去15年間の戦績をパリーグ球団,セリーグ球団という大枠で見ると
統計的に有意(99%信頼区間)にパリーグ球団の方が強いと言える。
Fig. 3: https://i.imgur.com/DDFaOMm.jpg 8風吹けば名無し2020/11/24(火) 23:04:14.45ID:S4keaXNo0
ええやん
9風吹けば名無し2020/11/24(火) 23:04:15.12ID:LNMCgEyMa
おい馬鹿やめろ
はやくもこのスレは終了ですね
10風吹けば名無し2020/11/24(火) 23:04:26.08ID:MgbmEFM90
2.ソフトバンクのいない世界線
次に,ソフトバンクがいない場合,どうなるか調べた。データのとり方は以下の通りである。
各年のセリーグ各球団の勝利数から「その年のソフトバンクの敗戦数÷6」を差し引いた場合の勝利数と
各年でセリーグ各球団の敗北数から「その年のソフトバンクの勝利数÷6」を差し引いた場合の敗戦数
を計算し,その上で勝率を計算した(パリーグ各球団の勝率はそのまま)。
※より正確に計算するためには,ソフトバンクのセリーグ各球団に対する対戦成績を考慮すべきだが,そこまでデータを精査する気合はなかったため一律に計算することとした。
Table 2 ソフトバンクなし交流戦の累計勝率
勝利数 敗北数 勝率
巨 160 129.3 0.553
公 186 157 0.542
ロ 184 156 0.541
中 150 137.3 0.522
西 177 170 0.510
阪 144 139.3 0.508
オ 173 171 0.503
ヤ 140 149.3 0.484
楽 164 186 0.469
広 128 157.3 0.449
横 118 171.3 0.408
この結果からソフトバンクさえいなければ巨人が最も強い球団のように見える。
しかし,この結果だけでは,上述の通り「たまたま」である可能性がある。
11風吹けば名無し2020/11/24(火) 23:04:52.65ID:MgbmEFM90
よって上記と同じパターンで,平均値をグラフ化しANOVAで有意差があるか調べた(Fig. 4)。
Fig. 4: https://i.imgur.com/9EVcSxF.jpg
この結果から巨人と有意に実力差のある球団は横浜のみで
巨人がパリーグ5球団に対して有意に強いという結果は得られなかった。
(図の見方は先ほどと同じ。アルファベットが異なるものはP<0.05で有意差があるものを示している)
次に,ソフトバンクが抜けたパリーグ5球団とセリーグ6球団の平均勝率に差があるか,t検定を行った(Fig. 5)。
Fig. 5: https://i.imgur.com/Y7X13p5.jpg
この結果からP<0.05の確率で有意にパリーグの方が強いという検定結果になった。
先ほどよりは確率は低くなったものの,それでも統計的には有意(95%信頼区間)とされる基準でリーグ差があることが分かった。
以上の結果からパリーグはソフトバンクなしでも依然としてセリーグより強いと言える。 3.横浜もいなかったことにする
セリーグが弱いのは横浜が存在するせいだとする議論があるため,ソフトバンクに続き,横浜もいなかったことにして計算を行った。
手法は先ほどと同様に横浜の勝利数/敗戦数÷6をパリーグ5球団の敗戦数/勝利数から引くという手法を用いる。
Table 3 ソフトバンク&横浜なし交流戦の累計勝率
勝利数 敗北数 勝率
巨 160 129.3 0.553
公 151.5 133.8 0.531
ロ 149.5 132.8 0.530
中 150 137.3 0.522
阪 144 139.3 0.508
西 142.5 146.8 0.493
ヤ 140 149.3 0.484
オ 138.5 147.8 0.484
広 128 157.3 0.449
楽 129.5 162.8 0.443
横浜の勝敗を一律になかったことにすると,残りのパリーグ5球団の累計勝率は減少した。
横浜がやはりまんべんなく負けていたことを示唆している。
それでは,これまでと同様に球団間で実力差が出るか解析した(Fig. 6)。
累積勝率では巨人が強いように見えるが,ANOVA解析の結果,有意差はなかった(ns)。
Fig. 6: https://i.imgur.com/bLrBkxV.jpg 13風吹けば名無し2020/11/24(火) 23:05:28.93ID:E43a8O6va
鳩山由紀夫路線ええぞ
14風吹けば名無し2020/11/24(火) 23:05:51.34ID:MgbmEFM90
では,この5球団となったセパリーグの勝率を比較すると以下のようになった(Fig. 7)。
Fig. 7: https://i.imgur.com/X5soSEf.jpg
ようやく,0.1<Pとなり,統計的にはリーグ間の勝率差に有意差がなくなった。
これらのことから,リーグ間の実力を拮抗させるためにはソフトバンクと横浜の2球団をそれぞれ追放することが効果的であると考えられた。
今回行った手法は大雑把にパリーグとセリーグの実力差を調べた結果である。
当初の仮説通り,「ソフトバンクなしでもパリーグの方がセリーグよりも強い」という結論が得られた。
ここ15年間を平均すると,ソフトバンクがパリーグの強さを引っ張り,横浜がセリーグの足を引っ張っているという誰もが知っている結論になったが,統計的にこれらのことに言及できた点はなんJ的に新しいのではないだろうか。
今回検証してないが,セリーグから横浜を外しソフトバンクをパリーグに入れて検定しても恐らくパリーグの方が有意に強いという結果が出ると思う。
つまりセリーグとパリーグの実力差はもはや誰もが認めざるを得ないレベルに達していると言えるだろう。 15風吹けば名無し2020/11/24(火) 23:05:54.38ID:vR+n1wws0
巨人・原監督が語る日本シリーズ対策「ギャフンと言わせます!」
https://news.1242.com/article/251326
江本:もう、目標は最後に日本一ですから。
原:そうですね。
江本:ぜひともですね、この勢いでびしっと!
原:パ・リーグはどこが来るんですか。
江本:パ・リーグはね……腹立つでしょ、だって「実力のパ」とか言われて。「パ・リーグのほうが上だ」とか言われて。冗談じゃない(笑)
原:ほんと、そうですね(笑)
江本:だから、ぜひともギャフンと言わせてもらって、頑張ってもらいたいです。
原:ギャフンと言わせます!
江本:ギャフンと言わせてください。ひとつよろしくお願いします。
原:はい! 16風吹けば名無し2020/11/24(火) 23:06:15.03ID:MgbmEFM90
また,ソフトバンクを外した場合巨人が首位に立っているように見えるが,今回のデータセットは実際のソフトバンクと巨人の対戦成績を考慮したものではなく,簡易的に行った計算の結果であることを強調したい。
さらに,そのデータセットを用いても,有意差はなかったことから,ソフトバンク抜きで巨人が首位に立っていてもそれは統計の計算上たまたまそうなっているだけである。
巨人がソフトバンク抜きなら他のパリーグ球団よりも強いなどという思い込みは禁物である。
あくまで巨人の戦力とパリーグ5球団の実力は拮抗しているというのが今回の結果であったので,その点ご注意いただきたい。
今回行った解析は過去15年間のデータを比較したものだった。
しかし,2005年ごろに入団した選手は高卒選手でも30代半ばのベテランであり,当時の主力と今の主力は全く異なる選手層である。
それらを一緒くたに比較した結果であるため,直近のリーグ間の実力差は見えてこない。
私の所見では15年前よりもリーグ間の実力差は開いているように思われる。
この仮説を検証するため次章では,過去15年間の勝率を時系列に並べ,各球団の勝率の上下の遍歴を比較する。
17風吹けば名無し2020/11/24(火) 23:06:15.04ID:R1K6zFhZ0
読んでる間に落ちる定期
18風吹けば名無し2020/11/24(火) 23:06:33.73ID:MgbmEFM90
4.各球団の実力の遍歴
まず,5年ごとを区切りとして初期(2005-2009),中期(2010-1014),後期(2015-2019)に分け,それぞれの勝率の平均をグラフ化した(Fig. 8)。
Fig. 8: https://i.imgur.com/23vWiOH.jpg
その結果,大まかに見ると矢印で示したような傾向が見えた。
青で示したパリーグ球団の勝率は,ソ,西,オ,楽の球団は上向きで,ロは下向き,
赤で示したセリーグ球団の勝率は,広,横は上向きで,それ以外の球団は下向きのように見えた。
ただし,この矢印は私の主観であるため,より詳細に解析を行う。
次は実際の勝率を年ごとにプロットし,近似直線(Y=ax+b)を導入し,その傾き(a)を調べた(Fig. 9)。
というのも直線の傾きを調べれば,過去15年間の勝率が上向きか下向きかある程度見えてくるからである。
一つのグラフにすると凄く見にくいため,セリーグとパリーグをそれぞれ別のグラフで表す。
Fig. 9: https://i.imgur.com/soPSudI.jpg 19風吹けば名無し2020/11/24(火) 23:06:55.20ID:MgbmEFM90
それぞれの傾きをまとめると,以下のようになった。
Table 4 勝率散布図から得られた傾向
ソ 0.0063
公 -0.001
ロ -0.0056
西 0.0069
オ 0.0082
楽 0.007
巨 -0.0036
中 -0.0071
阪 -0.0103
ヤ -0.0108
広 0.0068
横 0.0032
20風吹けば名無し2020/11/24(火) 23:07:24.91ID:MgbmEFM90
この値を見ると,上向き(正の値)はソ,西,オ,楽,広,横の6球団で,
下向き(負の値)は公,ロ,巨,中,阪,ヤの6球団となった。
これを見ると上向き球団はパリーグが4球団で,セリーグは2球団であった。
これらの値をt検定したが,有意差は得られなかった。
21風吹けば名無し2020/11/24(火) 23:07:35.23ID:ioCL3p2y0
どうせおまけスレやろ
22風吹けば名無し2020/11/24(火) 23:07:35.74ID:nwnJ1SumM
本格的すぎて草
23風吹けば名無し2020/11/24(火) 23:07:43.26ID:MgbmEFM90
統計的な確証は得られなかったが,感覚的には以下のグラフで示すように,強くなった球団と弱くなった球団はリーグ間で偏りが見られる(Fig. 8)。
セリーグは4球団(巨,中,阪,ヤ)が落ち目で,パリーグは2球団(公,ロ)が15年前より弱くなっているという数字は感覚に沿うのではないだろうか。
つまり,リーグ間の差は開く一方であり,今後も今後もこの傾向が続く可能性があると言える。
24風吹けば名無し2020/11/24(火) 23:07:53.75ID:S4keaXNo0
やっぱりセリーグが弱いんやな
25風吹けば名無し2020/11/24(火) 23:08:00.56ID:MgbmEFM90
<結論>
当初示した以下の観点について総評する。
(1)セパ両リーグ間の実力差が統計的に有意であるか調べる。
(2)ソフトバンクが存在しない場合でもパリーグはセリーグより強いか調べる。
(3)逆にセリーグのお荷物球団(横浜)がいなかったとして,差があるか調べる。
(4)15年前から去年までの勝率を比較して強くなった/弱くなった球団を明らかにする。
(1)15年間の交流戦の結果からパリーグの方がセリーグよりも統計的に有意に強いことがわかった。
(2)ソフトバンクがいなくても,パリーグ5球団とセリーグ6球団の間には実力差があることがわかった。
(3)ソフトバンクに続き横浜まで消すと,両リーグの勝率に有意差がなくなった。
(4)15年間で勝率を伸ばしたのはパリーグ4球団とセリーグ2球団であり,残りの球団は弱体化傾向がみられた。
26風吹けば名無し2020/11/24(火) 23:08:04.83ID:7dbb4/elr
もっと遅い時間にたてろ
27風吹けば名無し2020/11/24(火) 23:08:23.34ID:MgbmEFM90
これらの論点から,本研究は「セパのリーグ間の実力差」説に統計的な根拠を与え,今後その差が開いていくのではないかと予想することができた。
今回のデータセットは「交流戦」という限られた時期の対戦成績であるため,球団によってはこの時期を得意/不得意とすることがあるかもしれず,通年を通した実力差を測るものではないが,
それでもセパの実力差があることについて一定の説得力を持たせられるのではないかと考えている。
現在の日本シリーズで起きている巨人の無様な試合も,このリーグ間の実力差を反映しているものかもしれない。
今後もこの実力差は開いていくと思われるので,このような考え方が定説になっていくと思われる。
これまでのなんJでよく貼られた交流戦の結果はTable1で示したような全ての勝敗を合算したような表がほとんどであり,統計的なアプローチは行われてこなかった。
本研究では,簡易的ではあるが統計手法を用いて,15年間の勝率の比較から,セパの実力差が有意であることを明らかにした。
本成果をもって,セパに大きな実力差はないとする妄言を打破し,新たな糞みたいな煽りの材料に応用することが可能である(例:ソフトバンクと横浜(または落ち目球団のヤクルト/阪神)を追放すれば日シリが面白くなる等)。
以上
30風吹けば名無し2020/11/24(火) 23:09:19.62ID:S4keaXNo0
31風吹けば名無し2020/11/24(火) 23:09:19.67ID:R1K6zFhZ0
はえー
34風吹けば名無し2020/11/24(火) 23:11:43.57ID:Dd+bKJWa0
ワイはこういう勝負事を統計学的に分析するの好きやで
35風吹けば名無し2020/11/24(火) 23:11:59.34ID:rbN2zPyt0
つまりセリーグ最強と
37風吹けば名無し2020/11/24(火) 23:12:06.99ID:bSRIoI6Oa
ウルルン旅行記みたいなしゃべりかたすな
38風吹けば名無し2020/11/24(火) 23:12:08.79ID:sJGFzdgS0
セパの地力の差やろ 数年おきにセパの中身シャッフルしたらええんやない?
39風吹けば名無し2020/11/24(火) 23:12:16.19ID:XgEqeU+T0
おもろい
40風吹けば名無し2020/11/24(火) 23:12:17.18ID:yPPhA/ib0
>>32
リーグ戦力の差が生まれる原因
DHによる勝率の差
ドラフト運によるクジ運の差
この辺を定量化できると面白いかも 42風吹けば名無し2020/11/24(火) 23:12:40.00ID:OhKBHjb+a
読んでる途中で最初の方忘れた