✨ คำตอบที่ดีที่สุด ✨
統計は詳しくないのですが、少し調べた結果を載せます。
まず問題を定式化します。
確率変数Xi(i=1,2,3,...N)が互いに独立に同一の分布(平均μ,分散σ^2)に従うとする。
以下のような確率変数(標本平均、不偏分散)を定義する。
Xバー=1/N ΣXi
s^2=1/(n-1) Σ(Xi-Xバー)^2
これらをもとにして確率変数Yを定義する。
Y=(Xバー-μ)√n/s
このときYの分布はどうなるか。またn→∞のときはどうか。
まず母集団の分布が正規分布である場合は、Yはt分布の定義そのままであるから自由度nのt分布に従う。
n→∞のときはt分布は標準正規分布に近づく。
次に一般の分布のとき(ただしμ,σが定義できるような分布)、
Yの定義に含まれるsをσに変更すると、n→∞のときYの分布は中心極限定理から標準正規分布に従う。
今回の問題は両者の中間のような感じ。
nが有限のときのYの分布は当然Xiたちの分布を反映するはずで、Xiの分布が与えられていないと当然わからない。
しかし、Xiが大体正規分布ならYは大体t分布。Xiの正規分布からのずれがYのt分布からのずれにどの程度移るかとかいう論文もあるっぽい。
nが無限のときは、中心極限定理のσをsに変更した定理が求めたいもので、たぶんよく調べれば出てくると思う。
https://stats.stackexchange.com/questions/301630
が正しいなら、標準正規分布に近づくらしい。
ただ、私は中心極限定理の証明すら読んだことないから、この証明が数学的に正しいかはわからない。
あくまでも「大体」なんですね。
ご回答いただきありがとうございます。
個人的メモ
中心極限定理:https://manabitimes.jp/math/1104
t分布:https://qiita.com/s0sasaki/items/a27e743251218777e343