✨ 最佳解答 ✨
分散
平均値を中心にして、そこから全てのデータがどれだけ散らばっているかを表す数値のこと
分散=ゼロのとき、全てのデータは一つの値である(散らばりがゼロ)ことを意味する
標準偏差
分散の平方根のうち正の数の値
標準偏差=√(分散)
で表される。こちらもデータの散らばりを表す数値
2つ目の分散の式中
(1²+3²+6²+10²+15²) ⇒ 二乗の和
(1²+3²+6²+10²+15²)÷5 ⇒ 二乗の和の平均
を表す
回答ありがとうございます🙇♂️
分散の意味はわかるんですけど、どうしてその公式が「分散」っていうものを表しているのかがイマイチわかりません…
それと標準偏差ってなんなんでしょうか…
分散の平方根の正のほう…だから何?そこから何がわかるの?って感じです…
基本的に統計処理の意味は
異なるデータ群の間の比較
にある。
極端に言えば
7,7,7,7,7
と
5,6,7,8,9
では、平均が同じ7だけども散らばり具合が違う。じゃあどれだけ散らばってんの?というのを示す指標が分散(標準偏差)ということ
で、散らばり具合を数値でって言うけど、どうやったら表されるか?考えたわけ
まず、各データから平均値を引いたら、各データが平均値とどれだけ差があるかがわかるよなってなった(これを偏差と呼ぶ)
(7-7),(7-7),(7-7),(7-7),(7-7)
(5-7),(6-7),(7-7),(8-7),(9-7)
ここで、はたと気づく
まとめるとしたら、合計はどっちもゼロやんかって。これじゃあ意味ないやんかって
そこで
それぞれの偏差を二乗して合計したらええんちゃう?オレ天才やわ
(7-7)²+(7-7)²+(7-7)²+(7-7)²+(7-7)²=0
(5-7)²+(6-7)²+(7-7)²+(8-7)²+(9-7)²=10
これでようやく比べられるね。やったね!
ちゃんちゃん
なるほど…
でも2乗すると数値は変わってきませんかね?
もしかして散らばり具合を見るだけで、値ではなく数の大小を比べているだけですか?
数値が変わってくることが大事。
分散とは、散らばり具合を見るためだけですよ。基準となるものは標準正規分布と言い、平均=0,分散=1のことで、この「分散=1」と比べることになります
あと
分散はデータ数が多くなるにつれて大きくなっていくので、その平方根(標準偏差=√(分散))をもって数値を小さくすることに役立つ
とか言っている人がいますけど違います
ここら辺りから高校数学の範囲外になるので詳細は割愛しますが、最初に標準偏差があり、ルートを計算することが困難であるため、その二乗である分散で計算を進めるという手法です。(s²が分散という表現からもそういう意図があります)
ありがとうございます!
スッキリしました😄
例題
1,3,6,10,15
この6つのデータの平均(算術平均)と分散を求めなさい
平均=(1+3+6+10+15)÷5=7
分散={(1-7)²+(3-7)²+(6-7)²+(10-7)²+(15-7)²}÷5=(36+16+1+9+64)÷5=126÷5=25.2
このようにして求めた値
そして分散については問題文にある式でも求められる
分散=(1²+3²+6²+10²+15²)÷5-7²=(1+9+36+100+225)÷5-49=371÷5-49=74.2-49=25.2
となり、同じ値であることがわかる