今回は二項分布がポアソン分布に近似できることを示していきたいと思います。
二項分布の試行回数を非常に大きくすることでポアソン分布に近似することができます。
ポアソン分布に近似
二項分布
ある事象が起きる確率を\(p\)とします。
\(n\)回試行を行ったときにその事象が\(k\)回起こる確率を表した確率関数\(B\)、これを二項分布と呼びます。
これを数式で表すと
$$
B = {}_n \mathrm{ C }_k\;p^k(1-p)^{n-k} = \frac{n!}{k!(n-k)!} p^k(1-p)^{n-k} \tag{1}
$$
となります。
期待値・分散
さて、これをポアソン分布に近似していくには、まず二項分布の期待値・分散を求めなくてはいけません。
期待値
期待値\(\mu\)は
$$
\mu = \sum_{k = 0}^{n}k\;B
$$
で表されるので
(1)式を代入すると
$$
\begin{eqnarray}
\mu &=& \sum_{k = 0}^{n} k \frac{n!}{k!(n-k)!} p^k(1-p)^{n-k} \\
&=& \sum_{k = 1}^{n} \frac{n!}{(k-1)!(n-k)!} p^k(1-p)^{n-k} \\
&=& np\sum_{k = 1}^{n} \frac{(n-1)!}{(k-1)!(n-k)!} p^{k-1}(1-p)^{n-k} \\
&=& np\sum_{k = 1}^{n} \frac{n!}{k!(n-k)!} p^{k}(1-p)^{n-k} \\
&=& np\tag{2}
\end{eqnarray}
$$
となります。
最後のところは
$$
\sum_{k = 1}^{n} \frac{n!}{k!(n-k)!} p^{k}(1-p)^{n-k} = (p+(1-p))^n = 1
$$
の二項定理を使いました。
これで期待値\(\mu\)が\(np\)ということが分かりました。
分散
次に分散\(\sigma\)を求めます。
分散\(\sigma\)は
$$
\sigma = \mu(k^2) – \mu(k)^2
$$
と表されるので
まず、\( \mu(k^2) \)を計算すると
$$
\begin{eqnarray}
\mu(k^2) &=& \sum_{k = 0}^{n}k^2\; \frac{n!}{k!(n-k)!} p^k(1-p)^{n-k} \\
&=& \sum_{k = 0}^{n}\underbrace{\{k(k-1) + k\}}_{k^2}\ \; \frac{n!}{k!(n-k)!} p^k(1-p)^{n-k} \\
&=& \sum_{k = 2}^{n} k(k-1) \frac{n!}{k!(n-k)!} p^k(1-p)^{n-k} + \underbrace{ \sum_{k = 2}^{n} k \frac{n!}{k!(n-k)!} p^k(1-p)^{n-k} }_{(2)式より期待値} \\
&=& \sum_{k = 2}^{n} \frac{n!}{(k-2)!(n-k)!} p^k(1-p)^{n-k} + \mu\\
&=& n(n-1)p^2\sum_{k = 2}^{n} \frac{(n-2)!}{(k-2)!(n-k)!} p^{k-2}(1-p)^{n-k} + \mu\\
&=& n(n-1)p^2 +\mu
\end{eqnarray}
$$
より、
$$
\begin{eqnarray}
\sigma &=& n(n-1)p^2 +\mu -\mu^2 \\
&=& n^2p^2 – np^2 +np -n^2p^2 \\
&=& np(1 – p)\tag{3}
\end{eqnarray}
$$
分散\(\sigma\)は\( np(1 – p) \)ということが分かりました。
ポアソン分布
では、ポアソン分布に近似していきましょう。
まず、(1)式から
$$
\frac{n!}{k!(n-k)!} p^k(1-p)^{n-k} = \frac{n(n-1)(n-2)\cdots(n-k+2)(n-k+1)}{k!} p^k(1-p)^{n-k}
$$
と変形します。
そして
- \( n(n-1)(n-2)\cdots(n-k+2)(n-k+1) p^k\)\(\tag{4}\)
- \( (1-p)^{n-k}\)\(\tag{5}\)
この二つに注目し、それぞれを変形します。
\( n(n-1)(n-2)\cdots(n-k+2)(n-k+1) p^k\)の変形
(4)式を変形していきます。
$$
\begin{eqnarray}
(4) &=& 1\left(1-\frac{1}{n}\right)\left(1-\frac{2}{n}\right)\cdots\left(1-\frac{k-2}{n}\right)\left(1-\frac{k-1}{n}\right) \underbrace{(np) ^k }_{ (2)式から\mu = np }\\
&=& 1\left(1-\frac{1}{n}\right)\left(1-\frac{2}{n}\right)\cdots\left(1-\frac{k-2}{n}\right)\left(1-\frac{k-1}{n}\right) \mu^k
\end{eqnarray}
$$
ここで\(n\to\infty\)の近似を行うと
$$
n(n-1)(n-2)\cdots(n-k+2)(n-k+1) p^k = \mu^k \tag{6}
$$
となります。
\( (1-p)^{n-k}\)の変形
(2)式より
$$
\mu = np
$$
すなわち
$$
p = \frac{\mu}{n}
$$
となります。よって
$$
(1-p)^{n-k} = \frac{(1- \frac{\mu}{n})^n}{(1- \frac{\mu}{n} )^k}\tag{7}
$$
ここで
$$
e^{x} = \lim_{n\to\infty}\left(1+\frac{x}{n}\right)^n
$$
より、(7)式も\(n\to\infty\)の極限を取ると
$$
(1-p)^{n-k} = e^{-\mu}\tag{8}
$$
となります。
ポアソン分布
よって(2)式は
$$
\begin{eqnarray}
\frac{n!}{k!(n-k)!} p^k(1-p)^{n-k} &=& \frac{n(n-1)(n-2)\cdots(n-k+2)(n-k+1)}{k!} p^k(1-p)^{n-k} \\
&=& \frac{\mu^k}{x!}e^{-\mu}
\end{eqnarray}
$$
となり、二項分布を近似しポアソン分布を導くことができました。