跳至內容

無限猴子定理

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
一隻黑猩猩隨機地打字,只要時間足夠,幾乎必然可以打出法國國家圖書館中的每本書。

無限猴子定理(英語:Infinite monkey theorem)的表述如下:讓一隻猴子在打字機隨機地按鍵,當按鍵時間達到無窮時,幾乎必然能夠打出任何給定的文字,比如莎士比亞的全套著作。

在這裏,幾乎必然是一個有特定含義的數學術語,「猴子」也不是一隻真正意義上的猴子,它被用來比喻成一個可以產生無限隨機字母序列的抽象裝置。這個理論說明把一個很大但有限的數看成無限的推論是錯誤的。猴子精確地通過鍵盤敲打出一部完整的作品比如說莎士比亞的哈姆雷特,在宇宙的生命週期中發生的概率也是極其低的,但並不是零。

這個理論的變化形式包括多個甚至無限多個打字員,以及目標文字從一個完整的圖書館到一個簡單的句子。這些表述可以追述到亞里士多德的《論產生和毀滅》和西塞羅的《論神之本性》,經過布萊茲·帕斯卡喬納森·斯威夫特,最後到現在的形象的打字員的表述形式。在20世紀早期,埃米爾·博雷爾亞瑟·愛丁頓運用這個理論在統計力學基礎中闡述隱式時間標尺。

起源

無限猴子定理是來自埃米爾·博雷爾一本1913年出版談概率的書籍[1],當中介紹了「打字的猴子」的概念。這個定理是概率論中的柯爾莫哥洛夫零一律的其中一個命題的例子。不過,當波萊爾在書中提出零一律的這個特例時,柯爾莫哥洛夫的一般敘述並未給出(柯爾莫哥洛夫那本概率論的著作直到1933年才出版)。

定義

普遍認同的觀點

關於此定理的敘述為:有無限隻猴子用無限的時間會產生特定的文章。其實不必要出現了兩件無限的事物,一隻猴子打字無限次已經足夠打出任何文章,而無限隻猴子則能即時產生所有可能的文章。

其他定義

其他取代的敘述,可能是用大英博物館美國國會圖書館取代法國國家圖書館;另一個常見的版本是英語用戶常用的,就是猴子會打出莎士比亞的著作。

出處

這一典故的出處,喬納森·斯威夫特1782年出版的的《格列佛遊記》,第三部分第五章,教授要其學生通過經常轉動機械把手產生一些隨機的字句,以建立所有科學知識的列表。

證明

直接證明

兩個獨立事件同時發生的概率等於其中每個事件單獨發生的概率的乘積。比如,在某一天台北下雨的可能性為0.3,三藩市地震的可能性是0.008(這兩個事件可以視為相互獨立的),那麼它們同時發生的概率是0.3×0.008 = 0.0024。

假設一個打字機有50個鍵,想要打出的字是「banana」。隨機的打字時,打出第一個字母「b」的概率是1/50,打出第二個字母「a」的概率也是1/50,因為事件是獨立的,所以一開始就打出單詞「banana」的概率是:

(1/50)×(1/50)×(1/50)×(1/50)×(1/50)×(1/50) =(1/50)6

這個概率小於150億分之1。同理,接下來繼續打出「banana」的概率也是1/506

所以,在給定的六個字母沒有打出「banana」的概率是1−(1/50)6。因為每一段(6個字母)文字都是獨立的,連續n段都沒有打出「banana」的概率Xn是:

隨着n變大,Xn在變小。當n等於100萬時,Xn大約是0.9999(沒有打出「banana」的概率是99.99%);但是當n等於100億時Xn大約是0.53(沒有打出「banana」的概率是53%);當n等於1000億時Xn大約是0.0017(沒有打出「banana」概率是0.17%);當n趨於無窮時Xn趨於零。這就是說,只要使n足夠大,Xn可以變得足夠小。[註 1][2]

同樣的論證也可以說明在無限多的猴子中有至少一個會打出一段特定的文章。這裏Xn =(1−(1/50)6)n,其中Xn表示在前n個猴子中沒有一個一次打出banana的概率。當我們有1000億隻猴子時,這個概率降低到0.17%,並且隨着猴子數量n趨於無窮大,沒有打出「banana」的概率Xn趨於0。

但是,在只有有限的時間和有限隻猴子時,結論就大不一樣了。如果我們的猴子數量和可觀測宇宙中的基本粒子數量一樣多,大約1080隻,每秒鐘打1000個字,持續打100倍於宇宙的生命長度的時間(大約1020秒)有猴子能夠打出一本小書的概率也趨近於0

無限長的字串

以上兩種情況可以擴充到所有的字串

  • 給定一個無限長的字串,其中的每一個字元都是隨機產生的,那麼任意有限的字串都會作為一個子字串出現在其中(事實上要出現無限多次)。
  • 給定一個序列,其中有無限多個無限長的字串,其中每一個字串中的每一個字元都是隨機產生的,那麼任意有限的字串都會出現在其中某些字串的開頭(事實上是無限多個字串的開頭)。

對於第二個定理,設Ek某給定字串出現在第k個字串開頭的事件。有固定的且不為零的概率p是這個事件發生,而且Ek是獨立的,所以:

事件Ek發生無窮多次的概率是1(波萊爾-坎泰利引理)。第一個定理可以類似地處理,先將無限長的字串分割,使得每一段的長度和給定字串相同,然後設Ek是第k段等於給定字串的事件。[註 2]

概率

不算標點符號、空格、大小寫,一個猴子隨機打字打出的第一個字母和《哈姆雷特》中相同的概率是,前兩個字母相同的概率是(即)。因為概率發生了指數爆炸,前20個字母相同的概率是。而打出的字和《哈姆雷特》的全部文字相同的概率降低到難以想像。整部《哈姆雷特》大約有130,000個字母[註 3]。雖然有3.4×10183,946分之一的概率一遍就正確地打出所有文字,在打出正確的文字之前平均需要輸入的字母數量也要3.4×10183,946[註 4],或者包括標點符號,4.4×10360,783[註 5]

即使可觀測宇宙中充滿了猴子一直不停地打字,能夠打出一部《哈姆雷特》的概率仍然少於10183,800分之一[3]

現實

實際在現實中,猴子打出一篇像樣的文章的概率比理論上來的更加低。2003年,普利茅斯大學藝術媒體實驗室課程的教師和學生使用2,000英鎊津貼做了這個實驗,結果打出了5張幾乎全是『S』的紙。最終打出的文字[4]沒能成為一個完整的句子。[5]

程式設計師Jesse使用Hadoop、亞馬遜EC2和Ubuntu,並以 ASCII 形式存在的亂數成功重現《莎士比亞全集》。[6]

相關條目

註釋

  1. ^ 這表明在給定的六個字母中鍵入「香蕉」的可能性趨於1。
  2. ^ The first theorem is proven by a similar if more indirect route in Gut, Allan. Probability: A Graduate Course. Springer. 2005: 97–100. ISBN 0387228330. 
  3. ^ Using the Hamlet text from gutenberg, there are 132680 alphabetical letters and 199749 characters overall.
  4. ^ For any required string of 130,000 letters from the set a-z, the average number of letters that needs to be typed until the string appears is (rounded) 3.4 × 10183,946, except in the case that all letters of the required string are equal, in which case the value is about 4% more, 3.6 × 10183,946. In that case failure to have the correct string starting from a particular position reduces with about 4% the probability of a correct string starting from the next position(i.e., for overlapping positions the events of having the correct string are not independent; in this case there is a positive correlation between the two successes, so the chance of success after a failure is smaller than the chance of success in general). The figure 3.4 × 10183,946 is derived from n = 26130000 by taking the logarithm of both sides: log10(n) = 1300000×log10(26) = 183946.5352, therefore n = 100.5352 × 10183946 = 3.429 × 10183946.
  5. ^ 26 letters ×2 for capitalisation, 12 for punctuation characters = 64, 199749×log10(64) = 4.4 × 10360,783.

參考文獻

  1. ^ Émile Borel. Mécanique Statistique et Irréversibilité. J. Phys. (Paris). Series 5. 1913, 3: 189–196. 
  2. ^ Isaac, Richard E. The Pleasures of Probability. Springer. 1995: 48–50. ISBN 038794415X.  Isaac generalizes this argument immediately to variable text and alphabet size; the common main conclusion is on p. 50.
  3. ^ Kittel, Charles; Kroemer, Herbert. Thermal Physics 2nd. W. H. Freeman Company. 1980: 53. ISBN 0-7167-1088-9. 
  4. ^ Notes Towards the Complete Works of Shakespeare (PDF). [2019-04-02]. 原始內容存檔於2013-01-20. 
  5. ^ No words to describe monkeys' play. [2017-08-01]. (原始內容存檔於2019-01-21). 
  6. ^ A Few More Million Amazonian Monkeys | Jesse Anderson. [2020-02-16]. (原始內容存檔於2021-04-02) (美國英語). 

外部連結