数学
大学生・専門学校生・社会人
解決済み

統計方法についてです。

(下に要約)
次の例も考えてみましょう。植物40株の葉に対して、葉に影響を与えると考えた化学物質をいれた水Aと、植物の葉に影響を与えない物質を入れた水Bを、それぞれ20株に吹きかけた。2週間後、葉の色の様子を程度6(大部分が色が変わった)から程度0(全く色の変化がない)の尺度で様子を観察した。
 化学物質が葉の色に影響を与えるかどうかを調べたいときに、両者の平均値A(2.55)と平均値B(1.00)を計算し、さらに統計処理(t検定)をしてみたくなるでしょう。しかし、この実験の値は、程度や順位を示しており、データが不連続な数値のため平均値ではなく中央値を用い、統計処理(ノンパラメトリック検定)を行います。
 このように、データの種類によって、統計処理方法を変える必要があります。

「程度や順位を示しており、データが不連続な数値のため平均値ではなく中央値を用い、統計処理(ノンパラメトリック検定)を行います。」
この部分がわかりません。
どうして平均値は使えないのでしょうか?
(用語は理解しているのでそこの説明は不要です)

統計 平均値 中央値

回答

✨ ベストアンサー ✨

_平均値が使えないのではなく、(平均値を使用した) t検定が使えないのです。

_2つの対象実験の分散の山形が、相似形ではないからです。

__2つの対象実験の分散の山形が相似形であることを等分散、相似形ではないことを不等分散、と、言います。

_t検定は、等分散であることが前提であり、多くの場合は正規分布であることを前提にしています。

ぺんぎん

_そして、平均値は特異な標本が全体に与える影響が大きいから、不適切なのです。

この回答にコメントする
疑問は解決しましたか?

この質問を見ている人は
こちらの質問も見ています😉