AKB48 総選挙の得票数はベンフォードの法則(Benford's law)およびべき乗則に従うか検証してみた
自然現象または社会現象で出現する数値では、ベンフォードの法則やべき乗則が成り立つことが知られている。
そこで、AKB48 第2回&第3回総選挙の各メンバーの得票数でも、これらの法則が成り立っているか調べてみた。
■ベンフォードの法則(Benford's law)
総選挙の得票数でベンフォードの法則が成り立つか調べた。各メンバーの得票数は「AKB48 第2回&第3回総選挙の各得票数(41位から最下位まで)を推定してみた」に載せてある。
以下、結果のみ示す。この法則の詳細はWikipediaの「ベンフォードの法則」を参照されたい。
各メンバーの得票数の一桁目~三桁目の出現割合は下図のとおり。棒グラフが得票数の出現割合、折れ線がベンフォードの法則から求められる理論値である。
得票数の各桁の出現確率は、ベンフォードの法則から期待される値と異なっているようにみえる。



しかし、グラフを目視して判断することは危険なので、統計学的にはどうなのか、調べてみる。
まず、帰無仮説は「AKB48 総選挙の得票数の各桁の数値全体(一桁目は1~9、二、三桁目は0~9)の出現率分布は、ベンフォードの法則から期待される分布と同じ」とする。
仮説の検定には、適合度検定、すなわち、ピアソンのカイ二乗検定(+Yatesの連続性補正)を用いた。
第2回&第3回総選挙得票数の一桁目~三桁目の検定統計量の分布を下図に示す。
有意水準αを5%とすると、自由度8(=9-1)のとき、χ2(α)=15.5, 自由度9(=10-1)のとき、χ2(α)=16.9であるので、下図から、すべてのケースで帰無仮説は棄却されないことがわかる。
したがって、AKB48 総選挙の得票数の各桁の数値全体の出現率分布は、ベンフォードの法則に従うことが言える。

統計的には、ベンフォードの法則が総選挙の得票数にも成り立つ可能性があることを示せた。しかし、得票数の詳細は40位までのメンバーまでしか公表されていないため、標本数が少なすぎる。このため、本当にこの法則が成り立つかどうかは不明だ。機会があれば、より標本数の多い、本当の総選挙(参議院や衆議院)の得票数も調べてみたい。
次に、各桁の各数字の出現率が、ベンフォードの法則に従うか、検定する。
帰無仮説は「AKB48 総選挙の得票数の各桁の各数字の出現率は、ベンフォードの法則から期待される確率と同じ」とする。
検定には、比率の検定(+Yatesの連続性補正)を用いた。
検定統計量:Z値の分布を下図に示す。
有意水準αを5%とすると、標準正規分布表より、Z(α)=1.96である。 下図からわかるように、ほとんどの得票数の数字の出現率に関して、帰無仮説は棄却されない。しかし、第3回総選挙得票数の数字のうち、二桁目2および三桁目5の出現率は1.96より大きいため、これらの数字はベンフォードの法則に従っていない可能性がある。

■べき乗則
総選挙の得票数を両対数グラフにプロットした結果を下図に示す。横軸は順位、縦軸は得票数である。ピンクの点が第2回総選挙の得票数、水色の点が第3回総選挙の得票数である。
全順位の得票数がべき乗則に従うことは言えないが、9位以下(第3回総選挙)および16以下(第2回総選挙)の得票数ではべき乗則が成り立つことがわかる。

総選挙の得票数でベンフォードの法則が成り立つか調べた。各メンバーの得票数は「AKB48 第2回&第3回総選挙の各得票数(41位から最下位まで)を推定してみた」に載せてある。
以下、結果のみ示す。この法則の詳細はWikipediaの「ベンフォードの法則」を参照されたい。
各メンバーの得票数の一桁目~三桁目の出現割合は下図のとおり。棒グラフが得票数の出現割合、折れ線がベンフォードの法則から求められる理論値である。
得票数の各桁の出現確率は、ベンフォードの法則から期待される値と異なっているようにみえる。
しかし、グラフを目視して判断することは危険なので、統計学的にはどうなのか、調べてみる。
まず、帰無仮説は「AKB48 総選挙の得票数の各桁の数値全体(一桁目は1~9、二、三桁目は0~9)の出現率分布は、ベンフォードの法則から期待される分布と同じ」とする。
仮説の検定には、適合度検定、すなわち、ピアソンのカイ二乗検定(+Yatesの連続性補正)を用いた。
第2回&第3回総選挙得票数の一桁目~三桁目の検定統計量の分布を下図に示す。
有意水準αを5%とすると、自由度8(=9-1)のとき、χ2(α)=15.5, 自由度9(=10-1)のとき、χ2(α)=16.9であるので、下図から、すべてのケースで帰無仮説は棄却されないことがわかる。
したがって、AKB48 総選挙の得票数の各桁の数値全体の出現率分布は、ベンフォードの法則に従うことが言える。
統計的には、ベンフォードの法則が総選挙の得票数にも成り立つ可能性があることを示せた。しかし、得票数の詳細は40位までのメンバーまでしか公表されていないため、標本数が少なすぎる。このため、本当にこの法則が成り立つかどうかは不明だ。機会があれば、より標本数の多い、本当の総選挙(参議院や衆議院)の得票数も調べてみたい。
次に、各桁の各数字の出現率が、ベンフォードの法則に従うか、検定する。
帰無仮説は「AKB48 総選挙の得票数の各桁の各数字の出現率は、ベンフォードの法則から期待される確率と同じ」とする。
検定には、比率の検定(+Yatesの連続性補正)を用いた。
検定統計量:Z値の分布を下図に示す。
有意水準αを5%とすると、標準正規分布表より、Z(α)=1.96である。 下図からわかるように、ほとんどの得票数の数字の出現率に関して、帰無仮説は棄却されない。しかし、第3回総選挙得票数の数字のうち、二桁目2および三桁目5の出現率は1.96より大きいため、これらの数字はベンフォードの法則に従っていない可能性がある。
■べき乗則
総選挙の得票数を両対数グラフにプロットした結果を下図に示す。横軸は順位、縦軸は得票数である。ピンクの点が第2回総選挙の得票数、水色の点が第3回総選挙の得票数である。
全順位の得票数がべき乗則に従うことは言えないが、9位以下(第3回総選挙)および16以下(第2回総選挙)の得票数ではべき乗則が成り立つことがわかる。