看 AI 爭霸的最佳角度
如果把 AI 競賽看成一齣人物劇,那就總是感覺雲裏霧裏。
山姆.奧特曼比較會講故事,德米斯.哈薩比斯比較像科學家。
Google 太慢,Microsoft 太急,OpenAI 太商業,DeepMind 太學院,Anthropic 太危言聳聽。
這些話説了,好像又什麽都沒説。
這些話會讓人產生一種錯覺:好像只要最終勝出的是好人,是較有良心的公司,這場競賽的結果就會自己變好。
但現實真是這樣的嗎?
其實,我們還有一個比人物劇更好,也更有用的框架。
那就是是賽局理論(game theory)。
先想像一張桌子。
桌上坐著三家公司。
每家公司面前都有一個按鈕。
如果大家都不按,所有人就有更多時間做安全測試、外部審查、模型評估和社會溝通。
但如果其中一家公司先按,它就可能先拿到使用者、資料、資本和開發者生態等等。
更麻煩的是,每家公司都不知道另外兩家公司會不會按。
於是,每家公司都會說:我也想慢一點,但如果我慢了,別人不慢,那麼我們最終將無法生存下去。
這就是 AI 爭霸最核心的困局。
不是每個人都想把世界帶向壞結果。
而是每個人都害怕,自己成為唯一一個慢下來的人。
這篇文章主要是受到了帕米.奧森(Parmy Olson)作品的啟發,她 2024 年曾出版過 《AI霸主》這本書,後來也在專欄更新了一系列關於 OpenAI、Anthropic、代理型 AI 和產業格局的評論。
奧森是專業記者,所以她提供了許多詳實的資料,但她並不提供窺見未來的洞見。
而觀察歷史時你會發現,現代有一個理論框架似乎總是能解釋過去的事情為何會發生,它並不完美,但它對思考未來的局勢發展很有用,也能讓我們過濾掉許多的噪音。
這個理論框架,就是賽局理論。
而賽局理論告訴我們,看 AI 爭霸的發展,不要關注人物的性格,
而是要關注遊戲規則。
「理想」是如何變成「現實」的?
奧森在 2024 的《AI霸主》這本書裡,主線放在兩個人身上。
一邊是山姆.奧特曼(Sam Altman), OpenAI 的代表人物。
另一邊是德米斯.哈薩比斯(Demis Hassabis),DeepMind 的創辦者之一。
這兩個人很不同。
奧特曼像矽谷政治家,懂資本、懂敘事、懂權力,是個商業天才。
哈薩比斯更像科學型天才,早年從西洋棋、遊戲、神經科學和人工智慧一路走來,相信理解智能之後,人類就能解決許多根本問題。
書裡第一幕是兩位天才的夢想,第二幕是 AlphaGo ,第三幕叫「理想,誰來買單」,第四幕才進入 ChatGPT 和董事會風暴。
這個排序本身很有意思,因為它不是從商業戰爭開始,而是從理想、夢想開始。
OpenAI 起初擔心 AI 被少數巨頭壟斷,所以發起了能造福人類的 AI 願景。
DeepMind 起初想解開智能,而其目的一開始就是為了讓 AI 服務科學和人類。
Anthropic 起初則是由一群離開 OpenAI 的研究者創辦,把 AI 安全、對齊作為公司核心,想證明更強大的模型不必只靠速度和規模來推進。
三者都不是一開始就拿著商業計畫書,準備把世界變成訂閱制產品。
問題是,要實現理想,往往就需要付出昂貴的代價。
大型語言模型不是咖啡店,不是個人網站,也不是一個小型研究計畫。
它需要頂尖人才、資料中心、晶片、電力、雲端基礎設施、資本市場,以及能把模型推進全球產品的通路。
所以問題就變成:誰能替理想買單?
當然是巨頭們。
當這場賽局的成本高到只有少數巨頭付得起時,所有參賽者都會被迫靠近巨頭。
OpenAI 找到了 Microsoft;DeepMind 進入了 Google;Anthropic 在 Amazon、政府、企業客戶之間,尋找自己的位置。
於是,你的理想就不再是由你一個人說了算。
於是,你做的決定無法再以個人理想為先,而是必須以整個組織的利益為先。
就像一個人原本想蓋許多公共圖書館,讓所有人都能免費讀書。但他後來發現,問題不是買幾排書架,而是要在不同城市找地、蓋樓、買書、聘館員、付電費、維修系統,還要讓這些圖書館長期運作。每一項都要錢。
於是,他開始找銀行,找政府,找大企業。
這時候,圖書館精神也許還在。
但圖書館蓋在哪裡、買什麼書、誰能進來、規則怎麼定,已經不只由他決定。
理想雖然沒有消失,但它注定會被成本結構重新塑形。
況且,巨頭們也不會一心只為搞慈善為你的理想買單的,所以你要給巨頭們甜頭。
換句話說,資本能解決成本問題,而資本又是逐利的。
於是無論你是否有理想,結果都是要進入賽局理論。
因為構成賽局理論最關鍵的兩個要素,就是「報酬」和「成本」。
三重賽局
賽局理論聽起來很學術,但它其實在問兩個很普通的問題:
這場賽局裡有什麼報酬?有什麼成本?
我們不妨做個思想實驗。
想像在一間電影院裡,大家原本都坐著看電影。
第一排的人站起來,為了看得比較清楚。第二排的人被擋住,也只好站起來。第三排、第四排跟著站。
最後所有人都站著,視野並沒有變好,只是每個人都更累。
這就是賽局理論的基本精神。
它不先問第一個站起來的人是不是壞。也不問什麼是大家共贏的局面。
它先問:在這個局裡,什麼行為會被獎勵?
當然,現實世界裡不會有人怎麼做,因為第一排的人站起來時,會被後面的所有人懲罰。
這就是賽局理論會問的第二個問題:在這個局裡,什麼行為會被懲罰?
而當一項行為的獎勵大於懲罰時,局裡的人就會選擇獎勵最大化的行為。
現在,忽然有一群西裝革履的人走進了電影院,他們說,第一排的人站著看電影是被允許且受到保護的。
也就是說,後面的人想要懲罰第一排的人,或需要付出高昂的代價,那麼後面的人們要麼會離開影院退出遊戲,要麼站起來默默忍受。
你看,在這個思想實驗裡,我們不需要使用諸如「道德」、「公義」、「社會責任」、「流氓」之類的標籤來解釋在場所有人的行為。
單純的「獎勵」和「懲罰」足矣。
放到 AI 公司身上,也是一樣。
不過,除了「獎勵」和「懲罰」之外,我們還需要看三個誘因結構。
我們常聽說 AI 如果在未來變得太強,那麼人類會陷入危機。
所以許多專家出來呼籲放慢 AI 的研發速度,先確保安全才進一步發展。
如果所有公司都慢一點,整個社會會比較有時間做測試、審查、事故通報和制度準備。
但賽局理論告訴我們,AI 公司們很難會降低研發速度,因為降低速度後得到的自身「報酬」甚微,未來會因損失優勢而付出的「成本」卻很高。
如果只有一家公司慢,其他公司照樣發布模型、搶企業客戶、拿政府合約、吸開發者、累積資料,那慢下來的公司就不是高尚,而是失血。
而由於每個 AI 公司都知道這一點,所以沒有人會放慢速度。
OpenAI 自己很早就看見這個矛盾。它在 2018 年的 Charter 裡寫過,AGI 後期發展可能變成一場競爭,讓人沒有足夠時間採取安全措施;
但它同時也說,OpenAI 必須站在 AI 能力的前沿,才有能力有效處理 AGI 對社會的影響。
這兩句話放在一起,就是 AI 競賽最坦白的自白:
我知道競賽會讓安全變難。
但如果我不留在競賽前面,我就沒有資格影響結果。
這就是賽局理論裡著名的「囚徒困境」(prisoner’s dilemma)。
大家都知道安全重要。
但每家公司也都知道,如果自己真的慢下來,它就會付出市場代價,而由於其它人都不會慢下來,所以世界也不會變得更安全。
儘管最終的結局可能是人類社會的激烈動蕩,甚至有安全專家認為人類有被 AI 滅亡的可能性。
好吧,或許 AI 公司們不是真的不在乎人類存亡,因為這對 AI 公司來說也是一個很高的「成本」。
我們也沒必要小看 AI 公司們的高層,那些專家說的危機其實他們都懂。
只是他們除了在玩囚徒困境之外,也在同時玩「懦夫賽局」(game of chicken,也稱膽小鬼賽局)。
顧名思義,懦夫賽局就是看誰先在危機發生之前先退下,誰就輸。
想像一個畫面:
兩輛車迎面開來,兩邊都知道不該撞上去,但誰先轉彎,誰就像輸家。
它和囚徒困境不太一樣。
囚徒困境的核心是:大家都想合作,但怕自己被背叛。
懦夫賽局的核心是:大家都知道有危險,但想把退讓的成本丟給對方。
所以賽局理論告訴我們,AI 公司不會真的對人類滅亡危機不管不顧,事實上他們或許早已經有做好了應對準備。
只是未到最後一刻,未到滅頂危機發生前的一刻,率先退下就不是最優選擇。
最後,AI 安全還有一層更重要的結構:公共財賽局(public goods game)。
公共財,就是大家都需要,但付錢的人無法獨自享受的東西。
例如一條街的防洪工程。
如果防洪牆蓋好,整條街都比較安全。但錢要誰出?
如果 A 店鋪出錢,B 店鋪不出錢,B 也一樣不會被水淹。
於是每個人都希望防洪牆存在,但每個人也都希望別人先付錢。
AI 安全也是這樣。
如果一家公司多花資源做測試、外部審查、危險能力評估,降低的風險不只保護它自己,也保護使用者、企業客戶、政府、競爭對手,甚至整個社會。
儘管這些也對該公司有利,但把資源調用到公共安全,就意味著發布變慢、產品變晚、客戶可能流失、媒體可能說它落後、投資人可能焦慮。
所以在安全問題上,AI 公司們都一同出現了以下彆扭的姿態:
- 囚徒困境:大家都揚言說要安全為先,但自己又不斷加速研發。
- 懦夫賽局:大家都警告 AGI/ASI 會對社會造成巨大衝擊,但自己卻不到最後一刻就不會輕易煞車。
- 公共財賽局:大家都呼籲其它公司為社會著想,但又不願意只是自己付出最多。
這不是誰比較有道德,比較高尚的問題,提出那種問題並不會讓你看清局面的底層原因。
這是賽局理論問題,用賽局理論解析了一番之後,你就明白了 AI 公司們為什麼現在會這樣做,接下來會怎樣做。
你會明白 AI 公司們,其實也是人在江湖,身不由己。
從賽局理論的角度看來,未來...
現在,我們不妨試試用賽局理論去預測未來,以下請權當作一種智力娛樂。
賽局理論有一個前提假設,就是賽局裡的參賽者都會以自身利益為優先。
所以我們如果能知道參賽者們所面對的預期報酬和成本,那麼就能推算出他們的下一步行動。
當然,我們身為 AI 公司們的圈外人,不可能知道他們所面對的一切獎罰可能性,所以我們只能根據有限但明確的資訊進行推理。
從這個角度看,AI 圈接下來大概會反覆出現這 5 個走向:
第一,「競爭優勢」凌駕於「安全之上」
能力領先會帶來使用者、收入、估值、人才、企業客戶和政府關係。
這些都是明確的報酬。
相反,許多安全風險都是外部成本。偏見、幻覺、濫用、資安漏洞、心理傷害、就業衝擊,往往先由使用者、企業客戶和整個社會承擔。
當然,出事之後公司也會付出名譽代價。
但只要每家公司都面對類似的風險,這種代價就很容易被攤平。它會變成「做 AI 生意的共同風險」,而不是某一家公司的致命懲罰。
所以更可能出現的局面是:公司會持續說自己重視安全,也會做評估、紅隊測試、政策文件和外部溝通。
而只要沒有一套外部機制,例如政府監管、法律責任,明確懲罰公司,那麼公司就一定會把速度和能力凌駕於安全之上。
安全問題會在發布會上被反覆提起,但速度和能力才是資源投入的重地。
第二,「市占率」凌駕於「社會代價」
目前 AI 公司最想證明的,不是模型能解答各種問題,而是模型能勝任人類的工作。
寫程式、整理文件、回客服、做簡報、分析資料、接管流程、減少人力成本,這些才是企業願意付錢的地方。
從 Codex 到 Cowork 這類產品的演進,抓到的就是這個轉向:
AI 不只回答問題,AI 開始進入工作。
而如果 AI 能讓企業省下成本,企業就會買單。
如果 AI 讓白領工作的邊界被重畫,上班族、學生和家庭會承擔很大一部分代價。
可是對 AI 公司來說,前者是收入,後者多半不是成本。
所以它們會優先追求市占率,而不是先替整個社會安排轉型。
它們會說,AI 是增強人類,不是取代人類;它們會展示少數高效率工作者如何被放大,卻不太會長篇解釋大量普通工作如何被重新定價。
在這個局裡,企業願意提供「獎勵」,而社會卻很難把「懲罰」實施到 AI 公司的頭上。
第三,「政治與戰爭」凌駕於「人類共同利益」
AI 公司喜歡說服務人類。
但「國家」才是一個會簽合約、付雲端帳單、核准資料中心、提供軍事採購、保護供應鏈的參賽者。
當 AI 變成國力、情報、軍事、產業競爭和基礎設施,公司的收益表就會被政治改寫。
OpenAI 的 Stargate 敘事已經把 AI 基礎設施連到美國國家安全與盟友戰略能力。
Anthropic 與美國軍方在使用限制上的拉扯,也說明了當政府和軍事需求進場,「說不」本身也會成為一個有成本的選擇。
於是,「造福人類」會逐漸被翻譯成更可操作的版本:
服務本國、本陣營、本客戶、本盟友。
雖然嘴上還是要標榜自己最有道德。
但實際操作只會越來越接近政治現實。
換句話說,AI 模型被軍事化,被用來作為未來戰爭的武器,是很可能會發生,甚至已經在發生的事。
甚至,AI 模型被用於監控人民,也是很可能會發生的事情。
第四,「資料蒐集」凌駕於「使用者隱私」
AI 不只靠晶片長大,也靠資料長大。
資料可以改善模型、訓練 agent、建立使用習慣、增加切換成本。
尤其當 AI 從聊天工具變成工作代理,資料就不只是輸入內容,而是操作紀錄、企業文件、程式碼庫。
更多資料,通常意味著更好的產品、更高的黏著度、更強的模型優勢。
隱私限制,則常常意味著更慢的整合、更少的訓練材料、更高的合規成本。
如果大型語言模型出現在 10 年前,AI 公司可能會像社群平台那樣默默地吸收和利用使用者資料。
但資料隱私在今天已經有相對成熟的監管和懲罰機制,所以 AI 公司不會做得太明目張膽。
它會頂著良善的名義,舉著「為你好」的牌子告訴你:
這是產品改善,這是安全監測,這是匿名化資料,這是使用者同意,這是企業整合,這是更好的個人化體驗。
而付出的代價是,你的資料、你的隱私。
第五,「自保」凌駕於「真相與責任」
當 AI 造成事故、濫用、偏見、資安問題、心理傷害或社會後果時,公司第一時間面對的不是哲學問題,而是生存問題。
估值會不會掉?合約會不會跑?監管會不會收緊?法律責任會不會擴大?
在這種局裡,資訊不對稱會變得很關鍵。
外界看不到完整訓練資料、內部評估、失敗紀錄、風險討論和部署決策。
AI 開發者掌握許多外界難以取得的資訊,而商業考量又會讓這些資訊更難被分享。
所以公司會優先控制敘事。
它會公布一部分資訊,保留一部分資訊;承認具體錯誤,但避免承認結構性問題;透明到足以維持信任,卻不會自然透明到傷害自己。
這不是 AI 產業獨有的毛病,這是所有高風險、高估值、高法律責任產業都會出現的反應。
所以 AI 公司們,是否有藏著不能公開,而且對社會有害的資訊?
我不知道。可能沒有。可能有。
賽局理論不能預測事實真相是什麼,而只能預測說,如果有的話,那麼被揭露出來之前,AI 公司是不會主動出來承認。
這很重要。
因為我寫這篇文章的本意,不是抹黑任何 AI 公司,不是想高舉反 AI 的旗幟,不是說大家都沒有道德,更不是說一定有見不得光的事情在發生。
而只是想提供你一個賽局理論的角度,一個現實的角度,
一個清醒的角度。
本文是《每週讀懂一本書+》的限時免費文章。
如果你喜歡這種有深度的文章,可以先加入等候名單;正式推出時,我會把首次訂閱折扣寄給名單上的讀者。
注:若以上按鈕沒反應,請點擊這裏