問6 2つのグループからのデータを判別する代表的な方法に,フィッシャーの線形判
別がある。 グループ 1, グループ2の2つのグループから2次元データを収集し
たものとする。それぞれの標本サイズを ni, 72 とし, データを { 1,T2,...,Zn,},
ny
1.
{¥1,92,.., Yng} とおく。 また, それぞれのグループの平均ベクトルを=-
n1
8
y=-
722
1
n
72
i=1
722
i=1
とおく。 ただし,n=n+n2 である。
Yi とおく。 さらに, データ全体を {Z1,Z2,..., Zn}, 平均ベクトルをえ=
とおき,さらに
〔1〕 各グループの分散共分散行列 S1, S2 とデータ全体の分散共分散行列 S をそれ
ぞれ
S1 =
S2=
n1
1
n1
n2
i=1
722
i=1
n
(x₁ - x)(x₁ - x)
¹
i=1
(Yi — Y) (Yi – ÿ)
-
S= 1/2 (2₁-2) (2₁ - 2) T
i=1
Sw=115₁ +25₂
n
n
n2
n1
-
SB = 1/¹² ( x − z ) ( x − z ) ¹ + 2/2² (ÿ – z) (ÿ – z)™
n
n
Dis
① つねにS> Sw+SB が成り立つ。
② つねにS=Sw + SB が成り立つ。
③ つねに S < Sw + SB が成り立つ。
④ 上記に正しいものは一つもない。
と定義する。ここで「は転置を表すとする。 3つの行列 S, Sw, SB の関係につい
て、次の①~④のうちから最も適切なものを一つ選べ。 ただし, P > Q は行列
P-Q の固有値がすべて正であることを意味する。 10