こんにちは
今回は「正規分布による母平均の推定」について解説したいと思います。
正規分布による母平均の推定
正規分布は
$$
f(x) = \frac{1}{\sqrt{2\pi}\sigma}\exp\{-\frac{(x – \bar{x})^2}{2\sigma^2}\}
$$
で定義され、統計の分野内だけでなく、身の回りのいろいろなところに現れる重要な分布です。
人間の身長、体重、さらにはポケモンの体重も正規分布に従うようです(研究室の先生がポケモンGOで調査していました!)。
正規分布の性質
そんな正規分布には面白い性質があり、今回は特に「正規分布に従う標本の平均も正規分布に従う」という性質を利用し母平均を推定していきたいと思います。
正規分布に従う標本の平均も正規分布に従う
さて、この「正規分布に従う標本の平均も正規分布に従う」とは一体どのような意味でしょうか?
ポケモンに出てくる「ポッポ」の体重が正規分布に従っているとしましょう。
ポッポをたくさん(\(n\)匹)捕まえると体重が\(X_1, X_2, \cdots ,X_n\)であると判明したとします。

するとポッポの体重の平均値は
$$
\bar{X} = \frac{X_1 + X_2 + \cdots + X_n}{n}
$$
となります。
では\(\bar{X}\)はどのような分布に従うでしょうか?
答えは正規分布です。(話題の趣旨からそれるので証明はしませんが、モーメント母関数などを使うと簡単に導出できるのでやってみてください)
\(\bar{X}\)の平均と分散
さらに\(\bar{X}\)の平均と分散を求めて行きます。
平均は
$$
\begin{eqnarray}
E(\bar{X}) &=& E\left(\frac{X_1+X_2+\cdots+X_n}{n}\right)\\
&=& \frac{1}{n}(E(X_1) + E(X_2) + \cdots + E(X_n))\\
&=& \frac{n\mu}{n} (X_iは正規分布に従うのでE(X_i) = \mu)\\
&=& \mu
\end{eqnarray}
$$
分散は
\begin{eqnarray}
V(\bar{X}) &=& V\left(\frac{X_1 + X_2 +\cdots +X_n}{n}\right)\\
&=& \frac{1}{n^2}(V(X_1) + V(X_2) + \cdots +V(X_n))\\
&=& \frac{n\sigma^2}{n^2} (X_iは正規分布に従うのでV(X_i) =\sigma^2)\\
&=& \frac{\sigma^2}{n}
\end{eqnarray}
となります。
つまり、\(\bar{X}\)は平均\(\mu\), 分散\(\frac{\sigma^2}{n}\)の正規分布に従うといえます。
標準化
ではここまでの結果をまとめてみましょう。
$$
\begin{cases}
X_1, X_2, \cdots, X_n \to 平均\mu, 分散\sigma^2の正規分布に従う\\
\bar{X} \to 平均\mu, 分散\frac{\sigma^2}{n}の正規分布に従う
\end{cases}
$$
となっています。
ではここで、\(X_i\)の標準化を行いましょう。標準化とは平均を\(\mu \to 0\)、分散を\(\sigma^2 \to 1\)にする操作です。
このことによって単位に関係なく\(X_i\)の値を比べる(m,とcmでとった値を比較できる)ことができるなどのメリットがあります。
\(X_i\)を標準化すると
$$
Z_i = \frac{X_i – \mu}{\sigma}
$$
となります。(実際に\(E(Z_i), V(Z_i)\)を計算すると0,1になっていることが分かります。)
同様に\(\bar{X}\)も標準化すると
$$
Z = \frac{\bar{X} – \mu}{\sqrt{\sigma^2/n}}
$$
となります。
母平均の推定
では最後に\(Z\)を使って母平均の推定を行っていきましょう。
つまり何をしたいかというと、「一部の標本から得られた平均(捕まえたポッポの体重の平均)は母平均(全世界のポッポの体重を調べた平均)として使ってもいいか(母平均に近い値か)?」ということを検討します。
本来は全世界のポッポを捕まえないといけませんが、楽をして数匹くらい捕まえて平均を取るわけなので、本当にその値が正しい(母平均に近い値)か分かりませんよね。
では、先ほどの「ポッポ」の例に戻ります。
9匹のポッポを捕まえ、体重を測定します。その結果、体重の平均が2.0kgとなったとします。ポケモンGO の会社(ナイアンティック?)の調べでは平均(母平均)は1.8kg, 体重のばらつき(母標準偏差)は0.2kgであるとします。
このとき、9匹のポッポから得られた平均2.0kg は推定量として適格でしょうか?
「推定量として適格」とは、例えば「デブなポッポばかり捕まえて、偏った平均を取っていないか?」ということです。
では、話を整理してみましょう。
標本平均は2.0kg, 母平均は1.8kg, 母標準偏差は0.2kg, 標本数は9です。
これを先ほどの\(Z\)の式に当てはめると
$$
Z = \frac{2.0 – 1.8}{0.2/\sqrt{9}} = 3
$$
となります。
これを、統計の教科書の巻末についている「標準正規分布表」で確認すると0.13%であることが分かります。
つまり、(母平均1.8kg, 母標準偏差2.0kgの)ポッポを10匹捕まえたとき、平均が2.0kgになる確率は0.13%だということです。
なので、ほとんどこのようなことが起きないと考えられるので、何か偏った標本(デブなポッポ)ばかりを集めて平均を取ったといえそうです。
よって推定量としては不適だと考えられます。
コメント
[…] 「【統計】母平均を正規分布で推定してみた!!」の正規分布は同じく「母平均」を推定するものですが、t分布は母分散(sigma^2)が分からなくても標本分散(s^2)が分かれば推定を行うことができます。 […]
[…] 簡単のためにポッポの例を考えてみましょう。 […]
[…] また例によってポッポの体重(の母平均)を検定していきます。 […]
[…] 今回はポッポの体重(X)と身長(Y)の関係について検定していこうと思います。 […]