テーマ3 データの分析に関するプログラミング
例題:外れ値の扱いについて,箱ひげ図の場合は四
分位範囲の1.5倍を 「ひげ」 の長さの上限に
して、その長さから外れるものを外れ値とす
るという考え方がある。
外れ値がある場合
ひげを短くする
四分位範囲
の1.5倍
四分位範囲
7個のデータ [-100 20 30 40 50,60,1000]
のうち、外れ値を除外して平均値を求める以下の〈プ
ログラム〉を作った。この〈プログラム〉では,元
のデータ7個が配列 Data[0], Data[1],
Data[6] に格納されており,第1四分位数を q1
第 3 四分位数を q3 とし、四分位範囲はアで表せる。そして, 外れ値を除いたデータは
配列 Data_c[0], Data_c[1], … に格納するものとする。 なお、すべての配列の添字は0か
ら始まるものとする。
Data=[-100,20,30, 40,50,60,1000]
Data_c=[0,0,0,0,0,0, 0]
q1=20
g3 = 60
(1)
(2)
(3)
(4)
(5)
j=0
(6)
i を 0 から イ まで1ずつ増やしながら繰り返す:
(7)
| もし Data[i]>= ウ and Data[i] <= エ
ならば:
(8)
| Data_c[j] = Data[i]
(9)
LLj = オ
れる。
(10) s=0
(11) iを0から カ まで1ずつ増やしながら繰り返す :
(12) L s = s +Data_c[i]
(13) 表示する(キ)
~
<プログラム>
空欄 ア キに最も当てはまるものを,次の解答群から一つずつ選べ。