数学
大学生・専門学校生・社会人
解決済み

[統計学]母平均の推定・検定に関する質問です。

一般母集団(正規分布でないことを想定)の標本平均(大標本を想定)を標準化するとき、母分散が未知であるとき不偏分散を用いるはずですが、この標準化された変数(Yとします)はどういった分布に従うのでしょうか?

大標本であることに注意すると、中心極限定理により、標本平均は近似的に正規分布に従うため、Yも正規分布に従うと考えられます。
ただ、Yは不偏分散を用いて標準化しているため、母集団がもとより正規分布に従う場合に標本平均を標準化した値がt分布に従うことからの連想で、Yはt分布に従うとも考えられます。

Yは上記いずれかの分布に従うといえるのでしょうか?
またそのとき、それは近似的にそういえるのかそれとも絶対にそうなるのでしょうか?
あるいは、全く別の分布に従うのでしょうか?

ご教示いただけると幸いです。

統計学 統計検定2級 母集団と標本

回答

✨ ベストアンサー ✨

統計は詳しくないのですが、少し調べた結果を載せます。

まず問題を定式化します。

確率変数Xi(i=1,2,3,...N)が互いに独立に同一の分布(平均μ,分散σ^2)に従うとする。
以下のような確率変数(標本平均、不偏分散)を定義する。
Xバー=1/N ΣXi
s^2=1/(n-1) Σ(Xi-Xバー)^2
これらをもとにして確率変数Yを定義する。
Y=(Xバー-μ)√n/s
このときYの分布はどうなるか。またn→∞のときはどうか。

まず母集団の分布が正規分布である場合は、Yはt分布の定義そのままであるから自由度nのt分布に従う。
n→∞のときはt分布は標準正規分布に近づく。

次に一般の分布のとき(ただしμ,σが定義できるような分布)、
Yの定義に含まれるsをσに変更すると、n→∞のときYの分布は中心極限定理から標準正規分布に従う。

今回の問題は両者の中間のような感じ。
nが有限のときのYの分布は当然Xiたちの分布を反映するはずで、Xiの分布が与えられていないと当然わからない。
しかし、Xiが大体正規分布ならYは大体t分布。Xiの正規分布からのずれがYのt分布からのずれにどの程度移るかとかいう論文もあるっぽい。
nが無限のときは、中心極限定理のσをsに変更した定理が求めたいもので、たぶんよく調べれば出てくると思う。
https://stats.stackexchange.com/questions/301630
が正しいなら、標準正規分布に近づくらしい。
ただ、私は中心極限定理の証明すら読んだことないから、この証明が数学的に正しいかはわからない。

中心極限定理 t分布
Crystal Clear

個人的メモ
中心極限定理:https://manabitimes.jp/math/1104
t分布:https://qiita.com/s0sasaki/items/a27e743251218777e343

neutral

あくまでも「大体」なんですね。
ご回答いただきありがとうございます。

この回答にコメントする
疑問は解決しましたか?