52
10
25
20
15
10
「外れ値
データには、他の値から極端にかけ離れた値が含まれている場合がある。
はず
そのような額を外れ値という。外れ値は,分析の結果に大きな影響を与
えることがある。
例えば、あるゲームの7回分の得点の記録が次のようであったとする。
4
7 8 9 10 11 14
このデータの平均値と中央値はともに9点, 標準偏差は2.93点である。
ところが、8回目の得点が65点であったとすると, 8回分の平均値は16
点, 標準偏差は 18.72点となり, 65点という外れ値の影響を大きく受ける。
8回分の中央値は何点か。 また,外れ値の影響を受けているといえるか。
問3
右の散布図における値Aのように,集団から
大きく離れている値も外れ値と考えられる。右
5.08 1
の散布図で表されたデータの相関係数は0.36で
A.
あるが,値Aを除いて考えると 0.81 となる。
外れ値を含むデータの平均値や標準偏差,相関係数は,それらが外れ値
に大きく影響を受けた値であることを理解しておこう。
5章
5
一方で,外れ値もその変量に関する情報をもつ値であるため,安易に除
外してよいわけではない。
例えば,ある川の水位の観測データに極端に高い水位を示す外れ値が含
まれていた場合,この外れ値は防災において有益な情報のはずである。