ケンタッキーフライドチキンのチキン重量は正規分布?

昨日のエントリで、「2,235,197,406,895,366,368,301,559,999分の1の確率で起きたトランプの奇跡(ロケットニュース24)」についての検証を行ったばかりだが、その直後に同じく「ロケットニュース24」で紹介された記事が、また確率・統計に関係しそうな内容だったので、ついでに紹介しておく。

ケンタッキーフライドチキンのチキン重量を徹底調査 / 最大482グラム 最少406グラム その差76グラム
http://rocketnews24.com/2011/12/03/159138/

この記事では、ケンタッキーフライドチキンの4ピースパックのセットを10箱購入して、それぞれの重さを計測した結果が次のように紹介されている。

そして、最後に次のように述べられている。

最大と最小では、76グラムの差があることが判明した。76グラムというとけっこう大きな差があるように思えるが、皆さんはどうお思いだろうか?

http://rocketnews24.com/2011/12/03/159138/

タイトルで「徹底調査」と言いながら、平均値および最大値と最小値の差ぐらいしか評価していないのが、なんともさみしい。

徹底調査と言うからには、例えば数学者ポアンカレが登場する、次の逸話のような話を期待したい。

数学者ポアンカレは毎日買っている公称1kgのパンがしばしば軽目なのに気づいた。そこで重さを一年間計り続け、それが平均950gの正規分布にほぼ従うことを確認し、警察に届け出てパン屋に警告させた。つまりパン屋は最初から1kgのパンを目標にしていなかった!
それからまた一年間重さを計り続けたポアンカレは、今度はその分布が正規分布とは異なり、右に裾が長いことを見出し、再び警察に届けでてパン屋の不正を告発した。つまり、パン屋は反省することなく、単に目方の重そうなパンを選んでポアンカレ家に売っていただけであることをデータから見抜いたわけである。

http://hiyacho.tumblr.com/post/9665685054/1kg

ところで、今回のフライドチキンの重量の分布は「正規分布」に従っているだろうか。
この検証は「シャピロ-ウィルク検定(Wikipedia)」で行うことができる。

統計学における、シャピロ-ウィルク検定とは、 標本 x1, ..., xnが正規母集団からサンプリングされたものであるという帰無仮説を検定する検定である。

http://ja.wikipedia.org/wiki/%E3%82%B7%E3%83%A3%E3%83%94%E3%83%AD-%E3%82%A6%E3%82%A3%E3%83%AB%E3%82%AF%E6%A4%9C%E5%AE%9A

この検定結果は統計解析ツールのR(アール)を使えば一発で求まる。

標本が少なくて、信頼性に疑問は残るがp-value=0.9836 は 有意確率の基準となる0.05なる値よりはるかに大きいので「フライドチキンの重量の分布は正規分布に従っている」と判断できる。
つまり、(面白みのない結果ではあるが)数学者ポアンカレが不正を見破ったパン屋のような、不自然な分布は見られないと言えよう。


■参考
統計学セミナー 資料
基本統計量の算出
WindowsユーザーのためのR/Tinn-R
R言語(Wikipedia)
Shapiro-Wilkの正規性の検定


ハッとめざめる確率確率・統計 (理工系の数学入門コース 7)細野真宏の確率が本当によくわかる本 (細野真宏の数学が よくわかる本)イラスト・図解 確率・統計のしくみがわかる本―わからなかったことがよくわかる、確率・統計入門運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ))