統計的検定の考え方

統計と検定というキーワードが出てくると、もうダメ、わからない。


この「統計的検定」というものの、基本的な考え方を噛み砕いて書いてみる。


=================
問題

実験を2回した。
1回目と2回目で異なる結果となった。
どんな実験であっても、結果が完全に同じになることはほとんどないので、異なる結果となるのは当然のこと。

これを見てA君とB君が次のように主張した。

A君:これって偶然におきたんだよ。


B君:偶然じゃないよ。何か特別な要因があったんだよ。


A君とB君、どちらが正しいだろう。
=================

このような問題に対して、根拠を持って説明しようとするのが統計的検定。



「偶然じゃない」というのを証明するのはとても難しいので、

「偶然に起きちゃった」と仮定した時に、その偶然が起きる確率を調べる。
(この確率を調べる方法は実験内容によって様々。その調べ方によってt検定とかカイ二乗検定とか呼ばれる。)


今回の結果が偶然に起きる確率が5%以下だったら、A君の意見(偶然だという主張)は却下。だって偶然と言うには、あまりに珍しいできごとだから。
よって、B君の意見(何か要因があるよという主張)が正しい。


そうでないなら、A君の偶然説が正しい、と判断する。


A君の主張である「偶然だよ」は、「なにも特別な要因は無いよ」ということだから「帰無仮説」と呼ぶ。

B君の主張である「偶然じゃないよ」は、A君に対立する意見だから「対立仮説」と言う。



データのバラつきは、だいたい特定の値を中央として、偏って分布するので、下の図のようになる。

両側の端っこはほとんど起きない。


中央付近の値(採択域)である場合:
よくあるバラつきっぽいね(偶然説=帰無仮説を採択)。何か要因があるとは言い切れないね。


端っこに該当するような値(棄却域)の場合:

よくあるバラつきと言うには無理があるよね(帰無仮説を棄却)。きっと、何か要因があるよね(対立仮説を支持)。


↓下の本は、具体的な例に基づいて各種の検定手法を説明している。とってもわかりやすくて、数ある統計の本の中でも、実用的でおススメ。

44の例題で学ぶ統計的検定と推定の解き方

44の例題で学ぶ統計的検定と推定の解き方


統計学が最強の学問である

統計学が最強の学問である