目標
重要テーマを確実におさえよう!
テーマ3 データの分析に関するプログラミング
例題:外れ値の扱いについて,箱ひげ図の場合は四
分位範囲の1.5倍を 「ひげ」 の長さの上限に
して、その長さから外れるものを外れ値とす
るという考え方がある。
外れ値がある場合
ひげを短くする
7個のデータ [-100 20 30 40 50 60,1000]
のうち,外れ値を除外して平均値を求める以下の〈プ
ログラム〉を作った。 この〈プログラム> では, 元
のデータ7個が配列 Data[0], Data[1],
四分位範囲
の1.5倍
四分位範囲
Data[6] に格納されており,第1四分位数を q1,
第 3 四分位数を q3 とし,四分位範囲はアで表せる。そして, 外れ値を除いたデータは
配列 Data_c[0], Data_c[1], ... に格納するものとする。 なお, すべての配列の添字は0か
ら始まるものとする。
(1)
Data=[-100,20,30, 40, 50, 60, 1000]
(2)
Data_c = [0,0,0,0,0,0,0]
(3)
q1=20
(4)
g3=60
(5) j=0
(6) iを0からイ まで1ずつ増やしながら繰り返す :
(7)
| もし Data[i] = ウ and Data[i] <= エ ならば :
(8)
| | Data_c [j]=Data[i]
(9)
L
L j = オ
(10)s=0
(11)を0から カまで1ずつ増やしながら繰り返す:
(12) L s = s +Data_c[i]
(13) 表示する(キ)
<プログラム>
空欄 ア
~
キに最も当てはまるものを, 次の解答群から一つずつ選べ。