数学
高校生

データに関する問題で、例えば、数十個のデータがあり、その中でも最も値が大きいデータを除く前と後ではは、平均値や分散は増加or減少or変化無しという問題を、短時間で解くにはどうすればよいでしょうか?

回答

平均って全体の和をデータの数で割ったものですから、計算上平均値が変化しないデータの除去の仕方は平均を引くことです。このことをふまえると最大のデータだけを除いたらどうなるのか。考えるのは簡単なことでしょう。

ex.
2,4,6,8,10という数列があったら和が30.平均は6となる。ここで平均6を削除してみると
(6×5-6)/4=6
となり平均が維持される。

分散ってデータのばらつきを表すので一番大きい(つまり平均から一番遠い)ものは分散を大きくします。単純にいうと端のデータがあることでばらつきます。
なので、最大のデータがなくなれば散らばりは小さくなる、と言えます。

計算上では…
各データを平均で引いて各々二乗し足してからデータ数で割る。この計算で使っているのは平均値からの距離の二乗なので、大事なのは平均値からどれだけデータが離れているかなんですね。最大のデータとは距離が大きくなる(つまり分散が大きくなる)要因なのでなくなれば当然小さくなります。

この回答にコメントする
疑問は解決しましたか?