【統計】t分布について解説してみた!!

統計

こんにちは

今回は「t分布」について解説したいと思います。

スポンサーリンク

t分布

t分布とは「母平均を推定するために使う分布(ただし、母分散を必要としない)」です。

t分布に従う統計量を数式で表現すると

$$
t = \frac{\bar{X}-\mu}{\sqrt{s^2/n}} (\bar{X}は標本平均、\muは母平均、s^2は不偏分散、nは標本の数)
$$

となります。

「【統計】母平均を正規分布で推定してみた!!」の正規分布は同じく「母平均」を推定するものですが、t分布は母分散\(\sigma^2\)が分からなくても標本分散\(s^2\)が分かれば推定を行うことができます

また、「【統計】χ2分布について解説してみた!!」の\(\chi^2\)分布は「母分散」を推定するものです。

さて、これだけではあまりわからないと思うので以下で詳しく解説していきましょう。

t分布と正規分布の違い

「【統計】母平均を正規分布で推定してみた!!」では標準化した正規分布に従う統計量

$$
Z = \frac{\bar{X} – \mu}{\sqrt{\sigma^2/n}}
$$

を使い推定を行いました。

今回のt分布に従う統計量

$$
t = \frac{\bar{X}-\mu}{\sqrt{s^2/n}}
$$

と比べると\(\sigma \to s\)に変わっていることが分かると思います。

これは非常に大きな違いで、推定を行うとき、普通\(\sigma\)はわかりません。

(なぜなら、\(\sigma\)は全体を調べたうえで計算した分散だからです。例えば一袋に入っているポテチ枚数の分散を調べるには、すべての袋に入っている枚数を調べなくてはいけません。現実的に不可能です。)

\(s\)は全体の中からいくつか取り出して計算した分散なので比較的簡単に計算できます。

では、t分布を実際に使ってみましょう。

t分布による推定

では今回もポッポの体重で推定を行いたいと思います。

前回と同様、9匹のポッポを捕まえ、体重を測定します。その結果、体重の平均が2.0kg, 体重のばらつき(標本標準偏差)が0.2kgとなったとします。一方、ポケモンGO の会社(ナイアンティック??)の調べでは平均(母平均)は1.8kgであるとします。
このとき、9匹のポッポから得られた平均2.0kg は推定量として適格でしょうか?

※この例題はフィクションです。しかし、ポッポの体重は正規分布に従っているそうです。(大学の研究室しらべ)

「推定量として適格」とは、例えば「デブなポッポばかり捕まえて、偏った平均を取っていないか?」ということです。

整理すると標本平均\(\bar{X}\)は2.0kg, 標本標準偏差\(s\)は0.2kg, 母平均は1.8kg, 標本数は9となります。

t統計量を調べると

$$
t = \frac{2.0 – 1.8}{0.2/\sqrt{9}} = 3
$$

となります。

これを、統計の教科書の巻末についている「t分布表」で確認すると0.7%であることが分かります。

だいたい100回に1回しかこのようなことは起きないので、今回の場合は「デブなポッポばかり捕まえて、偏った平均を取った」と考える方が自然でしょう。

このようにt分布は母分散が分からなくとも使うことができるので、推定においては非常に便利な道具になります!

コメント

  1. […] では、「【統計】t分布について解説してみた!!」の例題をもう一度考えてみます。 […]

タイトルとURLをコピーしました