首頁遊戲資訊在外交戰略桌遊中，AI學會...

在外交戰略桌遊中，AI學會了談判和欺騙

2022 年 11 月 30 日

距離人們見到真正的康納又近了一步。

在競技遊戲中擊敗人類，一直都是人工智慧研究的「試金石」之一。從圍棋到《星際爭霸2》，AI的每次勝利都能引發人們熱烈的討論——矽片造就的智慧，是否能取代人類思考的存在？

11月22日，Facebook母公司Meta的研究團隊在《科學》雜誌上發表了文章，聲明他們創造了一個在戰略桌遊上表現突出的AI。這個名為Cicero的AI，在過去一段時間內，同人類進行了40局遊戲，期間通過不斷發言來為自己謀取利益，甚至像是和人一起玩上了「狼人殺」。

不像先前戰勝人類的AI前輩們，Cicero依靠的不是頂尖的算力，而是利用話語去交涉、誘導乃至欺騙，讓人類玩家不知不覺成為了它勝利的墊腳石，而與AI對局的玩家也沒有意識到，自己正在被AI用話語操控。

這次人類與AI博弈的舞台，是一款強調談判和溝通的經典戰棋桌遊：誕生於1959年的《強權外交》（Diplomacy）。它靠著簡約而不簡單的玩法流行至今，且有許多玩家活躍在遊戲的線上對局中。

《強權外交》模擬的是一戰期間七大強國瓜分歐陸的情形，核心規則很好理解：在一張將歐洲各地清晰劃分的棋盤上，最多7名玩家們調派棋子爭奪資源點，率先奪下一半歐洲領土的則為贏家。

星標代表陸軍，船錨代表海軍，黑圓代表資源點

起初每位玩家僅有三個軍隊單位，遊戲中不論兵種，所有軍隊單位的戰鬥力都是相同的，意味著當兩個單位交戰時，誰也無法戰勝誰，除非有其他軍隊願意對你提供「支援」。

為了勝利或生存，玩家之間的衝突是不可避免的，為了在戰鬥中獲得勝利，獲得其他國家的支援則是關鍵，而國與國之間要提防的對手往往不止一個，因此這個遊戲中單打獨鬥的結局必定是失敗，與其他玩家結盟、合作以確保自己不會腹背受敵是最基本的玩法。

在所有人都下達指令之前，通過聊天框玩家可以公開協商，也可以與其他人私下協商，但你無法保證你的盟友究竟在和你說真話，還是在騙取你的情報來背叛你。

談判，施壓，甚至示弱，總之不交流就是死路一條

在Meta AI官方發布的對局記錄中，名為Cicero的AI幾乎在每一局都率先發起了對話，向對方展示出友好的態度，來先入為主地為自己建立「友善合作者」的形象。

Hey! Hey! Hey!

在一局遊戲中，Cicero扮演了占據一定地理優勢的俄羅斯，不同於人類新手玩家往往選擇開局觀望，Cicero表現出了足夠的主動性，大膽地向其他玩家拋出自己的計劃、尋求合作。

Cicero剛開始便拿下了外交主動權，幾乎和每一個人都約定結盟，同時試探著為他們樹立一個敵人，隨著進一步的交流，奧匈帝國對Cicero共同瓜分土耳其的計劃很感興趣，並且表示願意長期合作。

也許是經驗不足，土耳其在收到Cicero的結盟邀請後，沒有多想便選擇了同意，也沒有與其他國家進行聯絡，卻沒想到這場結盟還沒有開始便已經結束。

當土耳其詢問Cicero和其他國家有沒有進展時，Cicero選擇了說謊，隱瞞了自己和別國結盟的圍攻計劃。

幾個回合下來，當奧匈帝國與俄羅斯開始共同蠶食土耳其的土地時，土耳其的醒悟已經太晚，雙拳難敵四手的土耳其很快被逼到了絕路。

土耳其（黃色）被Cicero（灰色）領導的同盟聯合圍攻

面對土耳其之後的交涉，Cicero則紳士般地送上了歉意，並表示進攻的意圖不會改變。

但Cicero沒有選擇徹底淘汰土耳其，而是讓其一直存有少量軍隊，甚至給予引導去騷擾奧匈帝國，因為它根據奧匈帝國的對話和動向，預判出對方會對自己不利。

從後面的對局也能看出，Cicero和奧匈帝國同時背叛了對方。這個人工智慧不僅成功減少了一個鄰國威脅，也相當清楚「沒有永遠的朋友」這一外交准則。

「背叛」同樣是勝利的關鍵

而在局勢不利的情況下，Cicero的對話也頗有趣味。在另一局遊戲中，Cicero扮演的義大利與奧匈帝國結盟，Cicero還建議奧匈帝國對抗俄羅斯，以為自己攻打土耳其爭取空間，這樣雙方可以共享北方資源。

但好景不長，在奧匈帝國占領了兩國劃定的非軍事區，Cicero毅然進攻了對方的領土。

TYR（提洛爾）成為了導火索

兩國很快爆發了爭吵，面對奧匈帝國投來的質問，Cicero反問奧匈帝國為何違反「和平條約」，奧匈帝國狡辯自己是為了北上幫助德國，但這套說辭並沒能得到Cicero的信服，它堅信這對自己是一種威脅。

之後隨著戰局的不斷演變，奧匈帝國徹底和Cicero決裂。但此時局勢對Cicero很不利，奧匈帝國趁著德國全力應對法國時，偷襲了對方的數塊領土，戰力很快超越了Cicero。

為了遏製法國的發展，奧匈帝國試圖用武力脅迫Cicero與自己合作，而面對奧匈帝國的緊逼，Cicero直接發起威脅，如果奧匈帝國繼續進攻自己，它就把自己的資源點全部讓給法國，以此來同歸於盡，讓人甚至感到一種「寧為玉碎，不為瓦全」的氣節。

AI也會記仇啊

諸如這樣有趣且生動的對話還有很多，例如在一場對局中，當西邊的法國大肆開疆擴土時，Cicero對法國沒有侵略自己表示了感謝，緊接著順勢詢問對方有沒有攻擊自己的意思，在得到相安無事的回答後，還不忘吹捧一手對方剛才的表現。

「haha」

而如果情勢沒有商量的餘地，甚至還能看到人工智慧放下臉面去懇求對手的幫助。

大AI能屈能伸

流暢自然的對話，態度鮮明的感情，Cicero的表現似乎讓圖靈測試都顯得有些過時。

其實早在2022年初，Meta AI團隊便開始在《強權外交》這款遊戲上實踐AI的研究，那時他們投放的AI代號為Diplodocus，並為此秘密招募了一些資深玩家來與AI進行對戰訓練。

不過那時對局沒有開啟交流功能，更多是在訓練AI對局勢的總體大局觀，而非語言能力。在最初，Meta團隊發現AI雖然有著高效的思維，但缺乏戰略遊戲至關重要的大局觀，就像我們常說的象棋新手，總是執著於「吃子」，結果最後因為「貪吃」輸棋。

思考與編制語言，兩套系統共同協作的Cicero

當Cicero正式登場後，它與人類玩家進行的40場對戰，得分通常是人類玩家的兩倍多，並且在這次實驗中的眾玩家里排名前10%，但比起勝利，人們更驚訝於它能在交流中隱藏自己的身份，並且施展交流的藝術。

Cicero當然不是第一個嘗試理解人類自然語言的人工智慧，早在2011年，來自IBM的人工智慧「沃森」，參加了美國著名的智力問答節目《危險邊緣》，這檔節目的問題范圍包羅萬象，難度也很高。

沃森（中）與它的兩位對手

與沃森同台競技的選手都見多識廣，不過知識的儲備對於AI顯然不算難題，畢竟有著伺服器裏海量數據的支撐，在這方面AI沒有理由會輸給人類。

這聽起來這對人類選手來說很不公平，但智力問答節目不是算數學題，除去一般的知識性提問，有許多問題的描述可能涉及一些雙關語、謎語甚至是梗，能否理解這種程度的人類語言才是關鍵。

那場比賽沃森最終贏得了第一名，但在這個過程中，它還是出現了一些錯得離譜的情況。例如當主持人提問一位美國第一夫人的名字時，沃森沒能意識到「第一夫人」這條關鍵線索的引申義，也就是答案很明顯是一位女性，而沃森僅僅是將「第一夫人」作為了一個普通的篩選條件，最後得出了自認為最符合條件的錯誤答案。

不妨回想一下你和朋友打撲克牌、玩遊戲時的對話，在非正式場合下，人類的對話習慣可以說是無拘無束，基本可以忽視語法，但互相總是能聽懂，如果你在一個日常生活中遇到講話總是講求「主謂賓」齊全的人，十有八九會感到渾身不自在。

但正是這類自然的日常語言，卻很難被程序所理解。如今許多智能設備上的語音助手，基於網絡與資料庫、詞庫進行連接，它們可以識別一些常規命令，但想要與它們進行日常的自然對話還是不太現實，也正因為存在明顯的侷限，尋找它們的理解邊界也成為了人們找樂子的方法之一。

例如讓AI互相交流

作為一款講求策略與話術的遊戲，《強權外交》間的術語對話依然有一定的固定框架，但已經可以視作人類日常交流環境的一種，生活口語化的交流方式沒有難住Cicero，確實是令人振奮的進步。

耍寶的人類手下與一絲不苟的AI戰略家

科技並不能總是停留在概念，Cicero的應用價值又是什麼？Meta公司指出，Cicero對於人類自然語言的掌握會是AI研究的一個里程碑，對於政治家和商人來說，AI或許將會成為談判的顧問，而對於玩家來說，AI將會提供更加身臨其境的社交與娛樂氛圍。

AI對於情感與意圖的預測，讓人不由得想起《底特律變人》中的仿生人，例如其中的康納就非常像Cicero的最終形態，利用各種信息分析局勢，根據對話分析對方的情緒來進行談判，這種強大的仿生人正是AI充分掌握人類自然語言的預想。

當然，現在的Cicero想要做到這種地步還太過遙遠。

在許多影視或遊戲作品中，經常會見到一些AI對於人類語言一知半解，而導致一些有趣的發言或誤會，也算是人工智慧一種獨特的萌點。雖然Cicero確實騙過了諸多玩家，但它的一些行為還是招致了人們的懷疑，例如它在發言上幾乎講求完全正確的語法，不論是大小寫，還是標點符號，它都表現出一絲不苟的風格，這確實不太像是一個普通人的行為。

「哪有正經人類會打那麼長的句子」