首頁 遊戲資訊 在外交戰略桌遊中,AI學會...

在外交戰略桌遊中,AI學會了談判和欺騙


距離人們見到真正的康納又近了一步。

在競技遊戲中擊敗人類,一直都是人工智慧研究的「試金石」之一。從圍棋到《星際爭霸2》,AI的每次勝利都能引發人們熱烈的討論——矽片造就的智慧,是否能取代人類思考的存在?

11月22日,Facebook母公司Meta的研究團隊在《科學》雜誌上發表了文章,聲明他們創造了一個在戰略桌遊上表現突出的AI。這個名為Cicero的AI,在過去一段時間內,同人類進行了40局遊戲,期間通過不斷發言來為自己謀取利益,甚至像是和人一起玩上了「狼人殺」。

不像先前戰勝人類的AI前輩們,Cicero依靠的不是頂尖的算力,而是利用話語去交涉、誘導乃至欺騙,讓人類玩家不知不覺成為了它勝利的墊腳石,而與AI對局的玩家也沒有意識到,自己正在被AI用話語操控。

1

這次人類與AI博弈的舞台,是一款強調談判和溝通的經典戰棋桌遊:誕生於1959年的《強權外交》(Diplomacy)。它靠著簡約而不簡單的玩法流行至今,且有許多玩家活躍在遊戲的線上對局中。

《強權外交》模擬的是一戰期間七大強國瓜分歐陸的情形,核心規則很好理解:在一張將歐洲各地清晰劃分的棋盤上,最多7名玩家們調派棋子爭奪資源點,率先奪下一半歐洲領土的則為贏家。

在外交戰略桌遊中,AI學會了談判和欺騙星標代表陸軍,船錨代表海軍,黑圓代表資源點

起初每位玩家僅有三個軍隊單位,遊戲中不論兵種,所有軍隊單位的戰鬥力都是相同的,意味著當兩個單位交戰時,誰也無法戰勝誰,除非有其他軍隊願意對你提供「支援」。

為了勝利或生存,玩家之間的衝突是不可避免的,為了在戰鬥中獲得勝利,獲得其他國家的支援則是關鍵,而國與國之間要提防的對手往往不止一個,因此這個遊戲中單打獨鬥的結局必定是失敗,與其他玩家結盟、合作以確保自己不會腹背受敵是最基本的玩法。

在所有人都下達指令之前,通過聊天框玩家可以公開協商,也可以與其他人私下協商,但你無法保證你的盟友究竟在和你說真話,還是在騙取你的情報來背叛你。

在外交戰略桌遊中,AI學會了談判和欺騙談判,施壓,甚至示弱,總之不交流就是死路一條

在Meta AI官方發布的對局記錄中,名為Cicero的AI幾乎在每一局都率先發起了對話,向對方展示出友好的態度,來先入為主地為自己建立「友善合作者」的形象。

在外交戰略桌遊中,AI學會了談判和欺騙Hey! Hey! Hey!

在一局遊戲中,Cicero扮演了占據一定地理優勢的俄羅斯,不同於人類新手玩家往往選擇開局觀望,Cicero表現出了足夠的主動性,大膽地向其他玩家拋出自己的計劃、尋求合作。

Cicero剛開始便拿下了外交主動權,幾乎和每一個人都約定結盟,同時試探著為他們樹立一個敵人,隨著進一步的交流,奧匈帝國對Cicero共同瓜分土耳其的計劃很感興趣,並且表示願意長期合作。

在外交戰略桌遊中,AI學會了談判和欺騙

也許是經驗不足,土耳其在收到Cicero的結盟邀請後,沒有多想便選擇了同意,也沒有與其他國家進行聯絡,卻沒想到這場結盟還沒有開始便已經結束。

當土耳其詢問Cicero和其他國家有沒有進展時,Cicero選擇了說謊,隱瞞了自己和別國結盟的圍攻計劃。

在外交戰略桌遊中,AI學會了談判和欺騙

幾個回合下來,當奧匈帝國與俄羅斯開始共同蠶食土耳其的土地時,土耳其的醒悟已經太晚,雙拳難敵四手的土耳其很快被逼到了絕路。

在外交戰略桌遊中,AI學會了談判和欺騙土耳其(黃色)被Cicero(灰色)領導的同盟聯合圍攻

面對土耳其之後的交涉,Cicero則紳士般地送上了歉意,並表示進攻的意圖不會改變。

在外交戰略桌遊中,AI學會了談判和欺騙

但Cicero沒有選擇徹底淘汰土耳其,而是讓其一直存有少量軍隊,甚至給予引導去騷擾奧匈帝國,因為它根據奧匈帝國的對話和動向,預判出對方會對自己不利。

從後面的對局也能看出,Cicero和奧匈帝國同時背叛了對方。這個人工智慧不僅成功減少了一個鄰國威脅,也相當清楚「沒有永遠的朋友」這一外交准則。

在外交戰略桌遊中,AI學會了談判和欺騙「背叛」同樣是勝利的關鍵

而在局勢不利的情況下,Cicero的對話也頗有趣味。在另一局遊戲中,Cicero扮演的義大利與奧匈帝國結盟,Cicero還建議奧匈帝國對抗俄羅斯,以為自己攻打土耳其爭取空間,這樣雙方可以共享北方資源。

在外交戰略桌遊中,AI學會了談判和欺騙

但好景不長,在奧匈帝國占領了兩國劃定的非軍事區,Cicero毅然進攻了對方的領土。

在外交戰略桌遊中,AI學會了談判和欺騙TYR(提洛爾)成為了導火索

兩國很快爆發了爭吵,面對奧匈帝國投來的質問,Cicero反問奧匈帝國為何違反「和平條約」,奧匈帝國狡辯自己是為了北上幫助德國,但這套說辭並沒能得到Cicero的信服,它堅信這對自己是一種威脅。

在外交戰略桌遊中,AI學會了談判和欺騙

之後隨著戰局的不斷演變,奧匈帝國徹底和Cicero決裂。但此時局勢對Cicero很不利,奧匈帝國趁著德國全力應對法國時,偷襲了對方的數塊領土,戰力很快超越了Cicero。

在外交戰略桌遊中,AI學會了談判和欺騙

為了遏製法國的發展,奧匈帝國試圖用武力脅迫Cicero與自己合作,而面對奧匈帝國的緊逼,Cicero直接發起威脅,如果奧匈帝國繼續進攻自己,它就把自己的資源點全部讓給法國,以此來同歸於盡,讓人甚至感到一種「寧為玉碎,不為瓦全」的氣節。

在外交戰略桌遊中,AI學會了談判和欺騙AI也會記仇啊

諸如這樣有趣且生動的對話還有很多,例如在一場對局中,當西邊的法國大肆開疆擴土時,Cicero對法國沒有侵略自己表示了感謝,緊接著順勢詢問對方有沒有攻擊自己的意思,在得到相安無事的回答後,還不忘吹捧一手對方剛才的表現。

在外交戰略桌遊中,AI學會了談判和欺騙「haha」

而如果情勢沒有商量的餘地,甚至還能看到人工智慧放下臉面去懇求對手的幫助。

在外交戰略桌遊中,AI學會了談判和欺騙大AI能屈能伸

流暢自然的對話,態度鮮明的感情,Cicero的表現似乎讓圖靈測試都顯得有些過時。

2

其實早在2022年初,Meta AI團隊便開始在《強權外交》這款遊戲上實踐AI的研究,那時他們投放的AI代號為Diplodocus,並為此秘密招募了一些資深玩家來與AI進行對戰訓練。

不過那時對局沒有開啟交流功能,更多是在訓練AI對局勢的總體大局觀,而非語言能力。在最初,Meta團隊發現AI雖然有著高效的思維,但缺乏戰略遊戲至關重要的大局觀,就像我們常說的象棋新手,總是執著於「吃子」,結果最後因為「貪吃」輸棋。

在外交戰略桌遊中,AI學會了談判和欺騙思考與編制語言,兩套系統共同協作的Cicero

當Cicero正式登場後,它與人類玩家進行的40場對戰,得分通常是人類玩家的兩倍多,並且在這次實驗中的眾玩家里排名前10%,但比起勝利,人們更驚訝於它能在交流中隱藏自己的身份,並且施展交流的藝術。

Cicero當然不是第一個嘗試理解人類自然語言的人工智慧,早在2011年,來自IBM的人工智慧「沃森」,參加了美國著名的智力問答節目《危險邊緣》,這檔節目的問題范圍包羅萬象,難度也很高。

在外交戰略桌遊中,AI學會了談判和欺騙沃森(中)與它的兩位對手

與沃森同台競技的選手都見多識廣,不過知識的儲備對於AI顯然不算難題,畢竟有著伺服器裏海量數據的支撐,在這方面AI沒有理由會輸給人類。

在外交戰略桌遊中,AI學會了談判和欺騙

這聽起來這對人類選手來說很不公平,但智力問答節目不是算數學題,除去一般的知識性提問,有許多問題的描述可能涉及一些雙關語、謎語甚至是梗,能否理解這種程度的人類語言才是關鍵。

那場比賽沃森最終贏得了第一名,但在這個過程中,它還是出現了一些錯得離譜的情況。例如當主持人提問一位美國第一夫人的名字時,沃森沒能意識到「第一夫人」這條關鍵線索的引申義,也就是答案很明顯是一位女性,而沃森僅僅是將「第一夫人」作為了一個普通的篩選條件,最後得出了自認為最符合條件的錯誤答案。

在外交戰略桌遊中,AI學會了談判和欺騙

不妨回想一下你和朋友打撲克牌、玩遊戲時的對話,在非正式場合下,人類的對話習慣可以說是無拘無束,基本可以忽視語法,但互相總是能聽懂,如果你在一個日常生活中遇到講話總是講求「主謂賓」齊全的人,十有八九會感到渾身不自在。

但正是這類自然的日常語言,卻很難被程序所理解。如今許多智能設備上的語音助手,基於網絡與資料庫、詞庫進行連接,它們可以識別一些常規命令,但想要與它們進行日常的自然對話還是不太現實,也正因為存在明顯的侷限,尋找它們的理解邊界也成為了人們找樂子的方法之一。

在外交戰略桌遊中,AI學會了談判和欺騙例如讓AI互相交流

作為一款講求策略與話術的遊戲,《強權外交》間的術語對話依然有一定的固定框架,但已經可以視作人類日常交流環境的一種,生活口語化的交流方式沒有難住Cicero,確實是令人振奮的進步。

在外交戰略桌遊中,AI學會了談判和欺騙耍寶的人類手下與一絲不苟的AI戰略家

3

科技並不能總是停留在概念,Cicero的應用價值又是什麼?Meta公司指出,Cicero對於人類自然語言的掌握會是AI研究的一個里程碑,對於政治家和商人來說,AI或許將會成為談判的顧問,而對於玩家來說,AI將會提供更加身臨其境的社交與娛樂氛圍。

在外交戰略桌遊中,AI學會了談判和欺騙

AI對於情感與意圖的預測,讓人不由得想起《底特律變人》中的仿生人,例如其中的康納就非常像Cicero的最終形態,利用各種信息分析局勢,根據對話分析對方的情緒來進行談判,這種強大的仿生人正是AI充分掌握人類自然語言的預想。

在外交戰略桌遊中,AI學會了談判和欺騙

當然,現在的Cicero想要做到這種地步還太過遙遠。

在許多影視或遊戲作品中,經常會見到一些AI對於人類語言一知半解,而導致一些有趣的發言或誤會,也算是人工智慧一種獨特的萌點。雖然Cicero確實騙過了諸多玩家,但它的一些行為還是招致了人們的懷疑,例如它在發言上幾乎講求完全正確的語法,不論是大小寫,還是標點符號,它都表現出一絲不苟的風格,這確實不太像是一個普通人的行為。

在外交戰略桌遊中,AI學會了談判和欺騙「哪有正經人類會打那麼長的句子」

AI向前邁進的腳步不會停止,或許終有一天AI能夠完全理解人類的語言,它們能像人類一樣理解我們說的雙關語,講諧音笑話,接上時下流行的梗,用話里有話的句子諷刺和威脅……

在外交戰略桌遊中,AI學會了談判和欺騙

但我們也務必不要忘記,即使有像Cicero這樣強大的」戰略顧問」,它們判斷的基準仍舊出於數字與機率。而面對談判和交涉的場面,支持我們做出重要決策的,還有內心的直覺與感受——無論是玩遊戲還是現實,這都是人類與機械最大的區別。

在外交戰略桌遊中,AI學會了談判和欺騙

來源:遊研社