αエラーとβエラー

キーワード:αエラー、βエラー、偽陽性偽陰性、第一種の過誤、第二種の過誤、ベイズ推定


例として、肝臓癌の検査を取り上げてみる。

検査結果が100%正しいことはなく、結果には誤りが含まれる。

検査の誤りには次の2通りがある。

(A) 「肝臓癌ではないのに、肝臓癌である」と判定する誤り。
(B) 「肝臓癌なのに、肝臓癌でない」と判定する誤り。

どちらも「誤り」だけど、その性質は違う。

(A)の誤りをαエラー(第一種の過誤)と呼ぶ。
偽の陽性なので偽陽性(False positive)とも言う。

(B)の誤りをβエラー(第二種の過誤)と呼ぶ。
偽の陰性なので偽陰性(False negative)とも言う。

αエラーは「あわてんぼさんの過ち」
βエラーは「ぼんやりさんの過ち」

と語呂で覚えるといい。


具体的な例を見てみる。

肝臓癌の検査を1万回行ったとき、次のような結果になったとする

肝臓癌でない 肝臓癌である
陽性の判定 ★1497件 16件 1513件
陰性の判定 8483件 ☆4件 8487件
9980件 20件 10000件

★のついたものは、肝臓癌ではないのに陽性の判定をしているのでαエラーである。
肝臓癌でない9980件中、1497件の判定を誤ったので、αエラーは1497/9980=0.15となる。


☆のついたものは、肝臓癌なのに陰性の判定をしているのでβエラーである。
肝臓癌である20件中、4件の判定を誤ったので、βエラーは4/20 = 0.20となる。


このような検査結果の誤りは、条件付き確率の問題としてよく取り上げられる。
例えば次のような問題。

患者が実際に病気ならば、99%の場合に検査結果は正しく「陽性」となる。
患者が実際は病気でないならば、95%の場合に検査結果は正しく「陰性」となる。
患者の0.1%が実際に病気である。

このような条件のものと、あなたの検査結果は「陽性」だった。
実際にあなたが病気である確率は何%か?

A を「患者が病気である」という事象、B を「結果が陽性だった」という事象とすると、
結果が陽性であった場合に、本当に病気である確率(A|B)はベイズの定理より、次の計算で1.9%となる。

つまり、たとえば検査結果が「陽性」だったとしても、本当に病気である確率はわずか1.9%しかない。

そもそも病気である確率が0.1%と低い値なので「病気でないのに陽性となってしまう」場合の数が多くて、結果が陽性であっても病気である確率はそれほど高くない。ということ。



44の例題で学ぶ統計的検定と推定の解き方ハッとめざめる確率運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ))