無限のサル

昨日のエントリで紹介した数学系マガジン「+plus magazine」に掲載されている記事の中から1つ、「Understanding uncertainty: Infinite monkey business」(不確実性の理解:無限のサルの仕事)というタイトルの内容を紹介しよう。

これは、無限の数のサルが、無限の数のキーボードを適当に叩いたら、いつか完全なシェイクスピアの文章が再現されるだろう、という、「無限の猿定理」として広く知られているものに関する記事だ。

ここでは実際に、Infinite Monkey Simulator (無限のサルのシミュレータ)なるプログラムを使った、次のような実験が行われている。
・アルファベットと空白、カンマなどの記号を含む31種類の文字をコンピュータでランダムに発生させる。
・適当な4文字を生成した後で、500万文字を含むシェイクスピアの作品の中に、その4文字が含まれないか検索する(大文字と小文字は無視する)。
・検索した結果、一致するものがあれば、5文字目をランダムに決めて、それが含まれるかさらに検索する。このような処理を繰り返す。
・4文字の生成は1秒間に50回行われる。

実際に使ったプログラムとは、次のようなものだ。

「Infinite Monkey Simulator」と表示されているのが、なんとなく可笑しい。

さて、図の結果では1億1300万モンキー秒(50匹のサルが26日間キーボードを叩き続けたのと等しい量)で、"we lover"という文字列が登場したことを示している。

ちなみに、500万文字からなるシェイクスピア作品が完全に再現される確率は1/(31の500万乗)という恐ろしく小さな確率だ。どれくらい小さい確率なのかを理解するために、次のような例が挙げられている。
コイントスを2千500万回して全部が表になる確率と等しい
・または、20000年間、毎週宝くじが当たり続けるのと同じくらいの確率

実際に、4文字の生成を1秒間に50回のスピードで実験を繰り返せば、29億年くらいでシェイクスピアの作品を完全に再現されることが予想される。もしも、99%の確率で再現されることを保証するには132億年が必要だそうだ。

132億年といえば宇宙が誕生してから今に至る時間と同じくらいなので、なんとも気の遠くなる話しだ。

サルの飼育小屋にキーボードを置いて実験してみたところ、サルは5ページ分の文字をタイプしたが、アルファベットのsばかりだったとか。
数学的な話は面白いけど、本物のサルの行動までは予測できない。

■+plus magazine の「Understanding uncertainty: Infinite monkey business」のページ
http://plus.maths.org/content/infinite-monkey-business

運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ))

運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ))