統計的検定の考え方
統計と検定というキーワードが出てくると、もうダメ、わからない。
この「統計的検定」というものの、基本的な考え方を噛み砕いて書いてみる。
=================
問題
実験を2回した。
1回目と2回目で異なる結果となった。
どんな実験であっても、結果が完全に同じになることはほとんどないので、異なる結果となるのは当然のこと。
これを見てA君とB君が次のように主張した。
A君:これって偶然におきたんだよ。
B君:偶然じゃないよ。何か特別な要因があったんだよ。
A君とB君、どちらが正しいだろう。
=================
このような問題に対して、根拠を持って説明しようとするのが統計的検定。
「偶然じゃない」というのを証明するのはとても難しいので、
「偶然に起きちゃった」と仮定した時に、その偶然が起きる確率を調べる。
(この確率を調べる方法は実験内容によって様々。その調べ方によってt検定とかカイ二乗検定とか呼ばれる。)
今回の結果が偶然に起きる確率が5%以下だったら、A君の意見(偶然だという主張)は却下。だって偶然と言うには、あまりに珍しいできごとだから。
よって、B君の意見(何か要因があるよという主張)が正しい。
そうでないなら、A君の偶然説が正しい、と判断する。
A君の主張である「偶然だよ」は、「なにも特別な要因は無いよ」ということだから「帰無仮説」と呼ぶ。
B君の主張である「偶然じゃないよ」は、A君に対立する意見だから「対立仮説」と言う。
データのバラつきは、だいたい特定の値を中央として、偏って分布するので、下の図のようになる。
両側の端っこはほとんど起きない。
中央付近の値(採択域)である場合:
よくあるバラつきっぽいね(偶然説=帰無仮説を採択)。何か要因があるとは言い切れないね。
端っこに該当するような値(棄却域)の場合:
よくあるバラつきと言うには無理があるよね(帰無仮説を棄却)。きっと、何か要因があるよね(対立仮説を支持)。
↓下の本は、具体的な例に基づいて各種の検定手法を説明している。とってもわかりやすくて、数ある統計の本の中でも、実用的でおススメ。
- 作者: 上田拓治
- 出版社/メーカー: オーム社
- 発売日: 2009/05/01
- メディア: 単行本
- 購入: 4人 クリック: 65回
- この商品を含むブログ (16件) を見る
- 作者: 西内啓
- 出版社/メーカー: ダイヤモンド社
- 発売日: 2013/01/24
- メディア: 単行本(ソフトカバー)
- 購入: 11人 クリック: 209回
- この商品を含むブログ (128件) を見る