確率変数の収束についてまとめる

はじめに

最近、自然科学の統計学という本を読んで、その内容をまとめた記事を書いたり書かなかったりしている。

kriver-1.hatenablog.com

現在第6回の内容を書いているのだが、その途中で確率収束という単語が出てきた。確率変数の収束についてはいくつか種類があって、確率収束だけでなく弱収束、強収束、概収束、分布収束など、いろいろな収束があることは知っているのだが、それぞれがどういう意味を表しているのか、正直あんまりわかっていない。
せっかくなので、調べてここにまとめてみようと思う。

間違い等を見つけたら積極的にマサカリを投げてほしい。



なお、この記事を書いている2018年5月現在で、この記事には書いてあるがwikipediaや他のブログ記事などを探してもなかなか見つからない内容は以下のとおりである。

  • 分布収束するが確率収束しない例
  • 概収束のお気持ち
  • 確率収束するが概収束しない例
    • 確率収束するが概収束せず、少し変えるだけで概収束するようになる例
  • 概収束するが確実収束しない例

以上を探している人はぜひこの記事を読んでいってほしい。



確率変数の収束の分類

とりあえず、wikipediaに載っているものについてまとめることにする。
以下では、たくさんの確率変数の列Xn(n=1,2,)が、ある確率変数Xへといろいろな意味で収束していくという状況についてまとめる。また、各変数は実数値を取るものとする。

名前 英語名、別名 書き方
分布収束 分布収束 (convergence in distribution)、弱収束 (weak convergence)、法則収束 (convergence in law) XndX
確率収束 確率収束 (convergence in probability) XnpX
概収束 概収束 (almost sure convergence)、強収束 (strong convergence)、ほとんど至る所で収束 (almost everywhere convergence)、確率1で収束 (with probability 1 convergence or w. p. 1 convergence) Xna.s.X
確実収束 確実収束 (sure convergence) (なし)
平均収束 r次平均収束 (convergence in the r-th mean)、Lr-ノルムについて収束 (convergence in the Lr-norm) XnLrX


正直
確率変数の収束 - Wikipedia
がかなりわかりやすいので、新たに記事を書くほどのものではないのかもしれないが、自分でまとめると勉強になるし、いろいろな視点から書かれていたほうが初学者の理解も進むかもしれない、ということで、ひとつひとつ説明していこうと思う。


分布収束

定義

確率変数列X1,X2,が、ある確率変数Xへと分布収束するとは、XnXの累積分布関数をそれぞれFnFとしたとき、Fxで連続となるような任意のxRについて、
limnFn(x)=F(x)
が成り立つことを言う。

お気持ち

確率分布のグラフ自体が収束先のグラフにどんどん近づいていくという様子を考えればよい。
ぴったり完全に一致する日が来るとは言っていないが、分布自体のズレはどんどん小さくなっていく。

wikipediaにあった素晴らしいgif画像を貼っておこう。これは独立な一様確率分布をn個発生させてその平均を取った確率分布なのだが、nが大きくなるにつれて分布が正規分布っぽい形になっていくことが分かる。

https://upload.wikimedia.org/wikipedia/commons/e/e3/Convergence_in_distribution_%28sum_of_uniform_rvs%29.gif

実際、この分布は中心極限定理によって正規分布へと分布収束することが示される。

ただし、この収束はあくまでも分布のズレしか見ていないことに注意が必要だ。
確率変数の節で後述する通り、確率分布列と収束先の確率分布に怪しげな関係性があった場合、分布は一致しているのに確率変数の値はぜんぜん一致しない、という場合が存在する。このような場合でも、分布収束は(分布しか見ていないので)成り立ってしまう。

中心極限定理

太郎君はコイン投げが得意で、表と裏をちょうど半々の確率で出すことができる。
太郎君がコインをn回投げたとき、表が出る回数をXnとすると、中心極限定理からXnの確率分布はX=N(μ=n2,σ2=n4)、すなわち平均n2、分散n4正規分布に分布収束する。

このことを用いて、例えばイキった次郎君が太郎君に対してケンカを売ってきたとしても、次郎君にコインを4×104回投げさせて、表の出た回数が2×1042×102回以下だったり2×104+2×102回以上だったりすれば、太郎君は有意水準5%で「君のコイン投げはまだまだだね」とイキリ返すことができる。なぜなら、次郎君のコイン投げが適切なら、こういうことが起こる確率は5%未満であり、したがってよっぽどの奇跡が起こったのでなければ次郎君のコイン投げは適切でなかったということになるからである。
こういう考え方を統計的仮説検定と言うが、それはまた別のお話。

確率収束

定義

確率変数列X1,X2,が、ある確率変数Xへと確率収束するとは、任意の正の実数ε>0について、
limnPr(|XnX|>ε)=0
が成り立つことを言う。

お気持ち

確率変数が外れ値をだんだん取らなくなる様子を考えればよい。外れ値かどうかを認識する閾値εである。
値がぴったり完全に一致する日が来るとは言っていないが、値が大きく外れる確率はどんどん小さくなっていくし、「外れ値の出る確率をこのくらいに抑えてほしい」と言われれば「じゃあn>Nεにすればいいよ」と言うことができる。

分布収束との関係

  • 確率収束は分布収束よりも強い(厳しい)条件である。すなわち、XnXに確率収束するならば、XnXに分布収束する。
  • Xが定数なら逆も成り立つ。すなわち、Xnが定数X0しか出ないような確率変数Xに分布収束するならば、XnXに確率収束する。

大数の弱法則

再び太郎君のコイン投げについて考えよう。
太郎君のコインは正確に二分の一の確率で表が出る。このコインをn回投げたとき、表が出る割合をXnとしよう。大数の弱法則より、この確率変数列Xnは定数X=0.5に確率収束する。
したがって、表が出る割合が例えば0.6以上になる確率は、コインを投げる回数が増えればどんどん0に近づいていく。
また、確率収束は分布収束より強い条件なので、XnXに分布収束もする。

分布収束するが確率収束しない例

太郎君が普通のコインを1回だけ投げる。この試行をAとし、この試行で表が出たかどうかを表す確率変数をXAとしよう。すなわち、試行Aで投げたコインが表ならXA=1、裏ならXA=0とする。
その横で、次郎君がイカサマコインを投げる。もしイカサマコインの裏が出たら、XnとしてXAの結果をそのまま採用する。もしイカサマコインの表が出たら、結果を反転させてXn=1XAとすることにしよう。
イカサマコインの裏が出る確率は1nになるように調整されている。なので、このコインの裏が出る確率はnが大きくなるとどんどん0に近づいていく。

イカサマコインの結果がどうだろうと、Xn=0となる確率は0.5、Xn=1となる確率も0.5である。したがって、試行Aとは独立に太郎君がコインを投げたときの分布をXとすれば、XnXに確率収束する。
ここで、確率変数XAについて考えてみよう。XA=0となる確率は0.5、XA=1となる確率も0.5であるから、XnXAに分布収束すると言ってよい。
ところが、XnXAに確率収束しない。なぜなら、イカサマコインで表が出た場合(これはnが大きくなるほど起こりやすくなる)、Xnの結果は反転されていて、XAとは逆の結果になっているからである。このとき|XnXA|=2となるから、ε<2となるようにεを取ることによってXnXAに確率収束しないことが示せる。

概収束

定義

確率変数列X1,X2,が、ある確率変数Xへと概収束するとは、
Pr({ω:limnXn(ω)=X(ω)})=1
が成り立つことを言う。ここで、ωは起こりうる標本の集合Ωの要素である。

お気持ち

確率収束はXnXの値がどんどん近づいていくことを主張していたが、概収束はXnがほとんど各点でXに収束するということを主張している。
もっと言えば、これはXn(ω)X(ω)となるようなn,ωがたかだか有限個しか存在しないことを表している。
これまでの収束とはlimPrの位置関係が異なっていることに着目するとわかりやすいかもしれない。

なお、limnXn(ω)=X(ω)となるωが出る確率が1であることと、すべてのωlimnXn(ω)=X(ω)が成り立つことは同値ではない。なぜなら、数学の世界ではある事象ω0が「確率0で起こる」場合があるからである。具体的な例は次項の「確実収束」の例で述べよう。

確率収束との関係

  • 概収束は確率収束よりも強い(厳しい)条件である。すなわち、XnXに概収束するならば、XnXに確率収束する。
  • 逆が成り立つわけではないが、確率収束するならば、概収束する部分列が存在する。すなわち、XnXに確率収束するならば、Xnのある部分列Xknが存在して、XknXに概収束する。

大数の強法則

前述した、コイン投げの表が出る割合についてもう一度考えよう。

太郎君のコインは正確に二分の一の確率で表が出る。このコインをn回投げたとき、表が出る割合をXnとしよう。大数の弱法則より、この確率変数列Xnは定数X=0.5に確率収束する。

実は、この例では大数の強法則も成り立つ。すなわち、この確率変数列Xnは定数X=0.5に概収束する。

いつか終わるコイン投げ

太郎君は1日1回、日課のコイン投げをする。
ただし、裏が10日連続で出てしまったら、太郎君は自分のコイン投げ力に絶望してコイン投げをやめてしまう。その日からコインはずっと裏のままになる。

確率変数列Xnを、n日目にコインが表ならXn=1、裏ならXn=0と定めよう。この確率変数は0に概収束する。なぜなら、十分長い時間が経てばいつかは裏が10連続で出てしまい、それ以降はずっとXn=0になってしまうからである。

確率収束するが概収束しない例

次郎君のイカサマコインを考えよう。次郎君のイカサマコインは1nの確率で裏が出る。つまり、nが大きくなると裏が出る確率はどんどん小さくなっていく。
このイカサマコインを投げて、表が出たときXn=1、裏が出たときXn=0としよう。裏が出る確率はnが大きくなるにつれてどんどん小さくなっていくから、十分小さいεについて、Pr(|Xn1|>ε)=(裏が出る確率)は0に収束する。すなわち、Xn1に確率収束する。

ところが、実はXn1に概収束しない。
このことを示すのは少し骨が折れるが、Borel-Cantelliの補題 (英wiki: Borel–Cantelli lemma - Wikipedia )を認めた上で略証を試みよう。

まず、
n=1Pr({ω:Xn(ω)=0})=
であることを示す。これはn=11n=であることから簡単にわかる。

Xnが独立であることとBorel-Cantelliの補題から、Xn(ω)=0であるようなωは infinitely often に起こる。
すなわち、無限回の試行を行えば、Xn(ω)=0であるようなn,ωの組は(全体に比べれば非常に少ないかもしれないが、それでも)無限個持ってくることができる。

一方、もしXn1に概収束すると仮定すると、定義から
Pr({ω:limnXn(ω)=1})=1
となるので、集合{ω:limnXn(ω)=1}Aとすると、Pr(ωA)=1となる。

いま、ωAを満たすようなωを考えよう。このωについては、定義から、任意のε>0についてあるNがあって、すべてのn>NXn(ω)=1が成り立つ。したがって、このようなωについては、Xn(ω)=0であるようなnはたかだか有限個しかない。
また、ωAについては、Pr(ωA)=1より、確率0でしか起こらないことがわかっている。

以上より、Xn(ω)=0であるようなnが無限個ある確率は0である。
ところが、先ほどBorel-Cantelliの補題を用いて求めたとおり、Xn(ω)=0であるようなnは無限個存在する。
これは矛盾であるから、Xn1に概収束しないことが示された。


なお、以下の例では、設定をほとんど変えていないにも関わらずXn1に概収束する。

区間[0,1]の一様分布からランダムに1つ値を持ってきてsとする。いま、Xnを、0s1nのときXn=01n<s1のときXn=1と定めよう。
このとき、Xn1に概収束する。

この2例の差は、各Xnが独立かどうかという点にある。後者の例では各Xnは独立でないから、Borel-Cantelliの補題は成り立たない。実際、各s>0についてn>Ns=1/sであればXn=1が常に成り立つので、Xn1に概収束する。

また、イカサマコインの裏が出る確率を1nから1n2に変更した場合も、Xn1に概収束する。これは、n=1Pr({ω:Xn(ω)=0})が有限の値になってしまい、Borel-Cantelliの補題が成り立たなくなるためである。

確実収束

定義

確率変数列X1,X2,が、ある確率変数Xへと確実収束するとは、
ω,limnXn(ω)=X(ω)
が成り立つことを言う。ここで、ωは起こりうる標本の集合Ωの要素である。

お気持ち

言うまでもなく、概収束を確率0で起こる事象にも拡張したものである。
確率の世界で確率0の事象が問題になることはまずないので、概収束じゃダメ、確実収束じゃないと!なんて場面はまず訪れないと思っていい。
なので、確実収束自体の重要度もあまり高くない。

概収束との関係

  • 確実収束は概収束よりも強い(厳しい)条件である。すなわち、XnXに確実収束するならば、XnXに概収束する。

概収束するが確実収束しない例

前述した「設定をちょっと変えるだけで概収束する例」を再掲しよう。

区間[0,1]の一様分布からランダムに1つ値を持ってきてsとする。いま、Xnを、0s1nのときXn=01n<s1のときXn=1と定めよう。
このとき、Xn1に概収束する。

この例では、Xn1に概収束するが、1に確実収束しない。というのも、s=0の場合(このような事象が起こる確率は0なのだが)、nがいくら大きかろうとXn1となってしまうからである。

平均収束

定義

1rRについて、確率変数列X1,X2,がある確率変数Xへとr次平均収束するとは、(XnXに適切なモーメントがちゃんと定義できるとして、)
limnE[|XnX|r]=0
が成り立つことを言う。

特に、r=1,2のとき、すなわち、
limnE[|XnX|]=0
limnE[(XnX)2]=0
が成り立つとき、それぞれXnXに平均収束する (converges in mean)、 二乗平均収束する (converges in mean square) という。

お気持ち

r次平均収束自体がめちゃくちゃ役に立つ、というわけではないと思う。
ただ、XXnの平均を表しているときは、XnXに二乗平均収束することと、Xnの分散が0に収束することが同値になるので、他の収束を示すよりも二乗平均収束を示したほうが楽なことがある。そういうときに便利。

他の収束との関係

  • 任意のr>s1について、r次平均収束はs次平均収束よりも強い(厳しい)条件である。すなわち、XnXr次平均収束するならば、XnXs次平均収束する。
    • 平均収束の次数は自由に減らしていいということ。
    • 特に、XnXに二乗平均収束するならば、XnXに平均収束する。
  • 平均収束は確率収束よりも強い(厳しい)条件である。すなわち、XnXに平均収束するならば、XnXに確率収束する。

r次平均収束するが概収束しない例

先の例で示した、「確率収束するが概収束しない例」を再掲しよう。

次郎君のイカサマコインを考えよう。次郎君のイカサマコインは1nの確率で裏が出る。つまり、nが大きくなると裏が出る確率はどんどん小さくなっていく。
このイカサマコインを投げて、表が出たときXn=1、裏が出たときXn=0としよう。裏が出る確率はnが大きくなるにつれてどんどん小さくなっていくから、十分小さいεについて、Pr(|Xn1|>ε)=(裏が出る確率)は0に収束する。すなわち、Xn1に確率収束する。

ところが、実はXn1に概収束しない。

この例は、確率収束するだけでなく、任意の実数r1についてr次平均収束する。
実際、定義に従って計算すると、

E[|XnX|r]=1n×|01|r+n1n×|11|r=1nlimnE[|XnX|r]=0

となるので、XnXr次平均収束する。

概収束するがr次平均収束しない例

今度は、前述した「設定をちょっと変えるだけで概収束する例」を再掲しよう。

区間[0,1]の一様分布からランダムに1つ値を持ってきてsとする。いま、Xnを、0s1nのときXn=01n<s1のときXn=1と定めよう。
このとき、Xn1に概収束する。

この例は、概収束するし、平均収束もする。
少し例を変えよう。


区間[0,1]の一様分布からランダムに1つ値を持ってきてsとする。いま、Xnを、0s1nのときXn=n1n<s1のときXn=0と定めよう。
このとき、Xn0に概収束する。


この例では、Xn0に概収束する。しかしながら、Xn0に平均収束しない。(したがって、任意の実数r1についてr次平均収束しない。)
定義に従って計算すると、

E[|XnX|1]=1n×|n0|+n1n×|00|=1limnE[|XnX|1]=10

となり、Xn0に平均収束しないことがわかる。

まとめ

確率変数列の収束性について、5種類の収束(分布収束、確率収束、概収束、確実収束、平均収束)を紹介した。
また、それらの関係性や簡単な性質などについて、多少数式を交えつつ説明した。

最後のまとめとして、wikipediaのわかりやすい図を載せておこう。
https://wikimedia.org/api/rest_v1/media/math/render/svg/f062f02e93cb28cf03db9d5d4cd435aae4eb7a44

みなさんの役に立てば幸いである。

参考サイト


ありがとうございました。