首頁 遊戲資訊 譯介丨最無趣的數字

譯介丨最無趣的數字

原文連結 | 作者:Manon Bischoff

你最喜歡的數字是什麼?

被問到這個問題的時候,很多人會想到一些無理數,像是圓周率(π),自然底數(e),或是 2 的平方根。就算是在自然數中你也能找到一些頗有內涵的數字,比如 7 個小矮人, 7 宗罪,不吉利的13,以及 42 —— 它隨著《銀河系搭車指南》而被人熟知。

那大點的數字呢,比如 1729? 對大多數人來說,這個數字顯然沒那麼有趣。乍一看,這個數字似乎平平無奇。畢竟它既不是質數,又不是 2 的冪數,也不是平方數。而且每一位數字的的排列也不符合什麼明顯的規律。這也是數學家 Godfrey Harold Hardy 的想法。他當時剛好搭上了車牌號為 1729 的計程車,去醫院探望一位生病的同事 Srinivasa Ramanujan。他將這個「無聊」的數字告訴了這位同事,希望這不是什麼不好的兆頭。而 Ramanujan 立刻就反駁了他的朋友:「這是個很有趣的數字。它是可以用兩對立方數表示的最小的數字。」[譯注1]

現在你可能會想,究竟有沒有一個完全無趣的數字。這個問題其實是一個悖論:如果真的存在一個數字沒有任何有趣的性質,那麼這個事實本身就會令它變得非常獨特。不過確實存在一個方法能夠客觀地評價一個數字是否有趣——而且出乎數學家的意料的是,2009 年的一項研究表明,自然數(正整數)明顯地被劃分到兩個陣營:有趣的數字的和無趣的數字。

一本數列百科全書為探索這兩種數字分類提供了一個手段。數學家 Neil Sloane 在 1963 年萌生了編纂這樣一本百科全書的想法。他當時正在撰寫他的博士論文,需要計算一個叫做樹形網絡圖的深度,於是他遇到了這樣一串數字:0, 1, 8, 78, 944, …。他不懂該如何計算這個數列,所以想知道他的同事們是不是在他們的研究中遇到過類似的數列。但與邏輯或算法不同,當時不存在一個為數列登記在冊的途徑。所以在十年後,Sloane 發表了他的第一版百科全書:《整數數列大全(A Handbook of Integer Sequence)》。這本書中囊括了 2,400 個被證明在某些特定的計算中很有用的數列。這本書很快就獲得了認可。據 Sloane 所說,一位熱情的讀者如此給出了如此的評價:「我們有《舊約》,我們有《新約》,我們有《整數數列大全》。」

在接下來的幾年時間,更多的數列被提交給了 Sloane,一些學術論文中也出現了新的數列。在這些事情的驅動下,這位數學家於 1995 年和他的同事 Simon Plouffe 一同出版了《整數數列百科全書(The Encyclopedia of Integer Sequences)》,收錄了大約 5,500 條數列。收錄的內容一直在持續增長,好在網際網路的出現使得這些數據洪流可以得到控制整理:在 1996 年,《整數數列在線百科全書(the Online Encyclopedia of Integer Sequences, OEIS)》誕生了,它不再對可被收錄的數列做任何格式上的限制。到了 2023 年 3 月為止,它已經收錄了 360,000 條記錄。任何人都可以提交記錄,你要做的就只是說明如何可以生成這條數列,它為何有趣,並且提供它的前幾項。在審查員檢查過這條記錄,確認它滿足以上的條件之後,就會公布發表。

除了那些著名的數列之外——比如質數數列(2, 3, 5, 7, 11, …),2 的冪數數列(2, 4, 8, 16, 32, …)或者斐波那契數列(1, 1, 2, 3, 5, 8, 13, …),OEIS 還收錄了一些奇妙的例子,比如用 n 塊 2×4 的樂高積木來搭建穩定塔結構的方法數量(1, 24, 1560, 119580, 10166403, …),或者是懶老闆數列(lazy caterer’s sequence),(1, 2, 4, 7, 11, 16, 22, 29, …),也就是把披薩切 n 刀能得到的最多塊數。

因為有大約 130 人左右對提交的數列進行審查,同時那些常見的數列已經存在了數十年並且在數學愛好者社區中廣為人知,所以這個數列集合基本上可以看作是所有數列集合中比較客觀的選擇。這使得 OEIS 的數據目錄非常適合用來研究數字的受歡迎程度。也就是說,一個數字在列表中出現的次數越多,它就越有趣。

至少 Philippe Guglielmetti 是這麼想的。他在維護更新一個法語的Blog網誌 Dr. Goulu,在其中一篇Blog網誌中,Guglielmetti 再次審視了一位前數學教師曾經表達過的觀點:數字 1548 似乎沒有任何特殊性質。實際上,這個數字在 OEIS 中出現了 326 次。而本文開頭出現的 Hardy 對於 1729 的無趣判斷其實也是錯的:1729 在資料庫中出現了 918 次(而且還在劇集《飛出個未來》中頻繁出現)。

於是 Guglielmetti 開始調查真正無趣的數字:那些幾乎不會出現在,或者完全沒有出現在 OEIS 數據中的數字。後者是存在的,比如數字 20067。到三月為止,這是沒有出現在任何被收錄的數列中的最小的數字,(這也是因為資料庫只會存儲每個數列的前 180 個字符,否則所有的正整數都會出現在 OEIS 的列表中了)所以 20067 看上去就非常無趣了。相對的,它之後的 20068 則出現在了 6 條記錄中。

無趣的數字並沒有一個通用的規則,20067 的狀態也是可以改變的。也許就在這篇文章被撰寫的過程中,一個新的數列被發現,而且它的前 180 個字符中就包含了 20067。不過不管怎麼說,OEIS 的記錄可以用來衡量數字有趣程度。

Guglielmetti 繼續整理了所有記錄中出現的數字,然後把畫出了它們的頻率。他發現這塊點狀雲呈現出曲線帶的形狀,頻率隨著數值的增加而滑落。這並不令人意外,因為只有數列的前幾項數字會被存儲在 OEIS 中。真正令人意外的是,這條曲線被分成了兩條曲線帶,其間有一條清晰可見的空隙。也就是說,OEIS 資料庫中的數字要麼就極其常見,要麼就非常稀有。

譯介丨最無趣的數字

被這個結果吸引的 Guglielmetti 咨詢了數學家 Jean-Paul Delahaye。他常常為 Pour la Science —— Scientific American 的法語姐妹刊物 —— 撰寫科普文章。Guglielmetti 想知道數學家們是否已經研究過這種現象:答案是否定的。於是 Delahaye 和他的同事,Nicolas Gauvrit 與 Hector Zenil,接下了這個課題,做了更加深入的調查研究。他們使用了算法信息理論的結果,這種方法通過算法來表達一個描述,然後用最短的算法長度來衡量這個描述的復雜度。舉例來說,類似於 47934 這種五個隨機數位組成的數字(算法描述為「由數字 4、7、9、3、4 組成的序列」)就要比數字16384 (算法描述為「2^14」)更難描述。根據算法信息理論,有更多性質的數字通常會有更低的復雜度。也就是說,在 OEIS 中頻繁出現的數字應該更容易去描述。[譯注2] Delahaye,Gauvrit 和 Zenil 的工作顯示,通過信息理論可以給出與 Guglielmetti 的曲線類似的自然數的復雜度軌跡。但是這並不能解釋那條以 Neil Sloane 命名的「Sloane 空隙」。

三位數學家認為這條空隙可能是社會學因素導致的,比如對某些特定數字的傾向性。為了證明這點,他們運行了一個被稱為蒙特卡羅方法的模擬:他們設計了一個函數,這個函數是一個自然數到自然數的映射——映射的結果中小數值會比大數值更容易出現。他們把一些隨機數輸入函數,然後繪制出輸出結果的頻率。通過這個實驗研究者們得到了一個粗略的滑坡曲線,與 OEIS 數據的曲線類似,但和信息理論的分析一樣,沒有空隙。

為了更好的理解那條空隙是如何出現的,你必須觀察哪些數字落入了哪條曲線帶。Sloane 空隙對於 300 以內的小數值並不明顯,只有對較大的數字才清晰起來:在 300 到 10,000 的數字中,有 18% 的的數字在「有趣帶」中,剩下的 82% 則屬於「無趣」的數值。這些有趣的數字包括了所有數字中 95.2% 的平方數,99.7% 的質數,以及 39% 的多質因子合數(numbers with many prime factors)。單是這三種類型的數字就足以占據接近 88% 的有趣數字了。而剩下的有趣數字則有更加顯著的性質,比如 1111 或者 2^n+1 和 2^n-1。

根據信息理論,那些非常有趣的數字應該有很低的復雜度,這意味著它們應該非常容易被描述。但是如果數學家們對相同復雜度的數值有不同的偏好,就可能會出現 Sloane 空隙,正如 Delahaye,Gauvrit 和 Zenil 所說。比如說,從信息理論的角度來看,2^n+1 和 2^n+2 有相同的復雜度,但是只有前者落在了「有趣帶」中。這是因為這些數字可以考察到一些質數,所以它們出現在了更多的數列中。

因此「有趣」和「無趣」的分歧似乎是由我們的判斷導致的,比如我們為質數賦予了更多的重要性。所以當你被問到你最喜歡的數字時,如果你想給出一個比較有新意的答案,你可以給出一個類似 20067 這種還沒有出現在任何 Sloane 的百科全書記錄中的數字。

[譯注1]:1729=1^3+12^3=9^3+10^3
[譯注2]:一個數列可以視為一條性質,一個數字出現在一個數列中可以視作它具有一條性質。可以簡單地理解為具有更多性質的數字有更多的算法描述,也就更容易找到比較簡短的算法。

來源:機核