ポアソン分布:単位時間あたり平均 $\lambda$ 回起こるようなランダムな事象が,単位時間に $k$ 回起きる確率は,
$P(k)=e^{-\lambda}\dfrac{\lambda^k}{k!}$
である。この確率分布をポアソン分布と呼ぶ。
ただし,$0!=1$ です。世の中に登場するいろいろな確率が $e$ とかを使って表せるのが感動ですね。この定理の証明は記事の最後に行います。
ポアソン分布の具体例
ポアソン分布の解析に入る前に,具体例です。ポアソン分布は世の中のいろいろな場面に登場します。
・サイトのアクセス数
一時間当たり平均3アクセスあるようなサイトがある。このサイトに一時間に $k$ 人アクセスしてくる確率は,$P(k)=e^{-3}\dfrac{3^k}{k!}$ である。特に,一時間に一人もアクセスしてこない残念な確率は,$P(0)=e^{-3}\dfrac{3^0}{0!}=e^{-3}\simeq 0.049$
※サイトのアクセスはランダム(独立)だと仮定しています。つまり,一人のアクセスが他の人のアクセスに影響を与えないと仮定しています。
・サイトの誤植数
10記事あたり平均3.4個の誤植があるようなサイトがある。このサイトの10記事の誤植探しをしたときに誤植が $k$ 個見つかる確率は,
$P(k)=e^{-3.4}\dfrac{3.4^k}{k!}$ である。
※サイトの誤植はランダム(独立)だと仮定しています。つまり,1回の誤植が他の誤植確率に影響を与えないと仮定しています。
ちなみに当サイトのアクセス数はもっと多いです,誤植はもっと少ない(はず)です!
ポアソン分布が確率分布であること
$P(k)$ が確率分布であることを確認しておきます。
つまり,$P(k)\geq 0$ かつ $\displaystyle\sum_{k=0}^{\infty}P(k)=1$ を確認します。前者は自明なので後者を証明します。ポアソン分布の解析では指数関数のマクローリン展開が大活躍します。
証明
まず,指数関数のマクローリン展開
$e^x=1+x+\dfrac{x^2}{2!}+\dfrac{x^3}{3!}+\cdots$ において $x=\lambda$ を代入すると,
$e^{\lambda}=\displaystyle\sum_{k=0}^{\infty}\dfrac{\lambda^k}{k!}$ となる。
よって,
$\displaystyle\sum_{k=0}^{\infty}P(k)=
\displaystyle\sum_{k=0}^{\infty}e^{-\lambda}\dfrac{\lambda^k}{k!}
=e^{-\lambda}\displaystyle\sum_{k=0}^{\infty}\dfrac{\lambda^k}{k!}
=e^{-\lambda}e^{\lambda}=1$
上記の証明が理解できれば,ポアソン分布の平均と分散もほとんど同様な手法で導出できます。
ポアソン分布の平均と分散
ポアソン分布の平均は $\lambda$,分散も $\lambda$
定義に従って計算していくのみです。途中で指数関数のマクローリン展開を用います。
平均の証明
ポアソン分布の平均(期待値)は,
$\displaystyle\sum_{k=1}^{\infty}ke^{-\lambda}\dfrac{\lambda^k}{k!}\\
=\displaystyle\sum_{k=1}^{\infty}e^{-\lambda}\dfrac{\lambda^k}{(k-1)!}\\
=\displaystyle\sum_{k=0}^{\infty}e^{-\lambda}\dfrac{\lambda^{k+1}}{k!}\\
=\lambda\displaystyle\sum_{k=0}^{\infty}e^{-\lambda}\dfrac{\lambda^k}{k!}\\
=\lambda$
分散の方は計算を簡単にするために $V[X]=E[X^2]-E[X]^2$(期待値と分散に関する公式一覧の公式8)を用います。ほとんど同様にしてできるので練習問題にどうぞ!
二項分布の極限としてのポアソン分布
冒頭の主張を証明します(けっこう難しいです)。ポアソン分布を二項分布の極限としてとらえます。
証明
以下のように考えて $P(k)$ を求める。
- 成功確率が $\dfrac{\lambda}{n}$ であるような独立な試行を $n$ 回行う。成功回数の期待値は $n$ によらず $\lambda$ である。
- $n$ 回の試行のうち $k$ 回成功する確率は,${}_n\mathrm{C}_k(\dfrac{\lambda}{n})^k(1-\dfrac{\lambda}{n})^{n-k}$ である。
- $n\to\infty$ とすれば求める確率 $P(k)$ を得るはずである。
ここまで理解できればあとは計算するのみ。極限のよい練習問題。
上記の議論より,
$P(k)=\displaystyle\lim_{n\to\infty}{}_n\mathrm{C}_k(\dfrac{\lambda}{n})^k(1-\dfrac{\lambda}{n})^{n-k}\\
=\displaystyle\lim_{n\to\infty}\dfrac{n!}{k!(n-k)!}(\dfrac{\lambda}{n})^k(1-\dfrac{\lambda}{n})^{-k}(1-\dfrac{\lambda}{n})^{n}\\
=\displaystyle\lim_{n\to\infty}\dfrac{\lambda^k}{k!}(1-\dfrac{\lambda}{n})^{n}(1-\dfrac{\lambda}{n})^{-k}\dfrac{n!}{(n-k)!n^k}\\
=e^{-\lambda}\dfrac{\lambda^k}{k!}$
ただし,最後の変形で,
$\displaystyle\lim_{n\to\infty}(1-\dfrac{\lambda}{n})^n=e^{-\lambda}$,$\displaystyle\lim_{n\to\infty}(1-\dfrac{\lambda}{n})^{-k}=1$,$\displaystyle\lim_{n\to\infty}\dfrac{n!}{(n-k)!n^k}=1$ を用いた。