09 Jun 閱讀時間 19 分鐘

看 AI 爭霸的最佳角度

如果把 AI 競賽看成一齣人物劇，那就總是感覺雲裏霧裏。

山姆．奧特曼比較會講故事，德米斯．哈薩比斯比較像科學家。

Google 太慢，Microsoft 太急，OpenAI 太商業，DeepMind 太學院，Anthropic 太危言聳聽。

這些話説了，好像又什麽都沒説。

這些話會讓人產生一種錯覺：好像只要最終勝出的是好人，是較有良心的公司，這場競賽的結果就會自己變好。

但現實真是這樣的嗎？

其實，我們還有一個比人物劇更好，也更有用的框架。

那就是是賽局理論（game theory）。

先想像一張桌子。

桌上坐著三家公司。

每家公司面前都有一個按鈕。

如果大家都不按，所有人就有更多時間做安全測試、外部審查、模型評估和社會溝通。

但如果其中一家公司先按，它就可能先拿到使用者、資料、資本和開發者生態等等。

更麻煩的是，每家公司都不知道另外兩家公司會不會按。

於是，每家公司都會說：我也想慢一點，但如果我慢了，別人不慢，那麼我們最終將無法生存下去。

這就是 AI 爭霸最核心的困局。

不是每個人都想把世界帶向壞結果。

而是每個人都害怕，自己成為唯一一個慢下來的人。

這篇文章主要是受到了帕米．奧森（Parmy Olson）作品的啟發，她 2024 年曾出版過《AI霸主》這本書，後來也在專欄更新了一系列關於 OpenAI、Anthropic、代理型 AI 和產業格局的評論。

奧森是專業記者，所以她提供了許多詳實的資料，但她並不提供窺見未來的洞見。

而觀察歷史時你會發現，現代有一個理論框架似乎總是能解釋過去的事情為何會發生，它並不完美，但它對思考未來的局勢發展很有用，也能讓我們過濾掉許多的噪音。

這個理論框架，就是賽局理論。

而賽局理論告訴我們，看 AI 爭霸的發展，不要關注人物的性格，

而是要關注遊戲規則。

「理想」是如何變成「現實」的？

奧森在 2024 的《AI霸主》這本書裡，主線放在兩個人身上。

一邊是山姆．奧特曼（Sam Altman）， OpenAI 的代表人物。

另一邊是德米斯．哈薩比斯（Demis Hassabis），DeepMind 的創辦者之一。

這兩個人很不同。

奧特曼像矽谷政治家，懂資本、懂敘事、懂權力，是個商業天才。

哈薩比斯更像科學型天才，早年從西洋棋、遊戲、神經科學和人工智慧一路走來，相信理解智能之後，人類就能解決許多根本問題。

書裡第一幕是兩位天才的夢想，第二幕是 AlphaGo ，第三幕叫「理想，誰來買單」，第四幕才進入 ChatGPT 和董事會風暴。

這個排序本身很有意思，因為它不是從商業戰爭開始，而是從理想、夢想開始。

OpenAI 起初擔心 AI 被少數巨頭壟斷，所以發起了能造福人類的 AI 願景。

DeepMind 起初想解開智能，而其目的一開始就是為了讓 AI 服務科學和人類。

Anthropic 起初則是由一群離開 OpenAI 的研究者創辦，把 AI 安全、對齊作為公司核心，想證明更強大的模型不必只靠速度和規模來推進。

三者都不是一開始就拿著商業計畫書，準備把世界變成訂閱制產品。

問題是，要實現理想，往往就需要付出昂貴的代價。

大型語言模型不是咖啡店，不是個人網站，也不是一個小型研究計畫。

它需要頂尖人才、資料中心、晶片、電力、雲端基礎設施、資本市場，以及能把模型推進全球產品的通路。

所以問題就變成：誰能替理想買單？

當然是巨頭們。

當這場賽局的成本高到只有少數巨頭付得起時，所有參賽者都會被迫靠近巨頭。

OpenAI 找到了 Microsoft；DeepMind 進入了 Google；Anthropic 在 Amazon、政府、企業客戶之間，尋找自己的位置。

於是，你的理想就不再是由你一個人說了算。

於是，你做的決定無法再以個人理想為先，而是必須以整個組織的利益為先。

就像一個人原本想蓋許多公共圖書館，讓所有人都能免費讀書。但他後來發現，問題不是買幾排書架，而是要在不同城市找地、蓋樓、買書、聘館員、付電費、維修系統，還要讓這些圖書館長期運作。每一項都要錢。

於是，他開始找銀行，找政府，找大企業。

這時候，圖書館精神也許還在。

但圖書館蓋在哪裡、買什麼書、誰能進來、規則怎麼定，已經不只由他決定。

理想雖然沒有消失，但它注定會被成本結構重新塑形。

況且，巨頭們也不會一心只為搞慈善為你的理想買單的，所以你要給巨頭們甜頭。

換句話說，資本能解決成本問題，而資本又是逐利的。

於是無論你是否有理想，結果都是要進入賽局理論。

因為構成賽局理論最關鍵的兩個要素，就是「報酬」和「成本」。

三重賽局

賽局理論聽起來很學術，但它其實在問兩個很普通的問題：

這場賽局裡有什麼報酬？有什麼成本？

我們不妨做個思想實驗。

想像在一間電影院裡，大家原本都坐著看電影。

第一排的人站起來，為了看得比較清楚。第二排的人被擋住，也只好站起來。第三排、第四排跟著站。

最後所有人都站著，視野並沒有變好，只是每個人都更累。

這就是賽局理論的基本精神。

它不先問第一個站起來的人是不是壞。也不問什麼是大家共贏的局面。

它先問：在這個局裡，什麼行為會被獎勵？

當然，現實世界裡不會有人怎麼做，因為第一排的人站起來時，會被後面的所有人懲罰。

這就是賽局理論會問的第二個問題：在這個局裡，什麼行為會被懲罰？

而當一項行為的獎勵大於懲罰時，局裡的人就會選擇獎勵最大化的行為。

現在，忽然有一群西裝革履的人走進了電影院，他們說，第一排的人站著看電影是被允許且受到保護的。

也就是說，後面的人想要懲罰第一排的人，或需要付出高昂的代價，那麼後面的人們要麼會離開影院退出遊戲，要麼站起來默默忍受。

你看，在這個思想實驗裡，我們不需要使用諸如「道德」、「公義」、「社會責任」、「流氓」之類的標籤來解釋在場所有人的行為。

單純的「獎勵」和「懲罰」足矣。

放到 AI 公司身上，也是一樣。

不過，除了「獎勵」和「懲罰」之外，我們還需要看三個誘因結構。

我們常聽說 AI 如果在未來變得太強，那麼人類會陷入危機。

所以許多專家出來呼籲放慢 AI 的研發速度，先確保安全才進一步發展。

如果所有公司都慢一點，整個社會會比較有時間做測試、審查、事故通報和制度準備。

但賽局理論告訴我們，AI 公司們很難會降低研發速度，因為降低速度後得到的自身「報酬」甚微，未來會因損失優勢而付出的「成本」卻很高。

如果只有一家公司慢，其他公司照樣發布模型、搶企業客戶、拿政府合約、吸開發者、累積資料，那慢下來的公司就不是高尚，而是失血。

而由於每個 AI 公司都知道這一點，所以沒有人會放慢速度。

OpenAI 自己很早就看見這個矛盾。它在 2018 年的 Charter 裡寫過，AGI 後期發展可能變成一場競爭，讓人沒有足夠時間採取安全措施；

但它同時也說，OpenAI 必須站在 AI 能力的前沿，才有能力有效處理 AGI 對社會的影響。

這兩句話放在一起，就是 AI 競賽最坦白的自白：

我知道競賽會讓安全變難。

但如果我不留在競賽前面，我就沒有資格影響結果。

這就是賽局理論裡著名的「囚徒困境」（prisoner’s dilemma）。

大家都知道安全重要。

但每家公司也都知道，如果自己真的慢下來，它就會付出市場代價，而由於其它人都不會慢下來，所以世界也不會變得更安全。

儘管最終的結局可能是人類社會的激烈動蕩，甚至有安全專家認為人類有被 AI 滅亡的可能性。

好吧，或許 AI 公司們不是真的不在乎人類存亡，因為這對 AI 公司來說也是一個很高的「成本」。

我們也沒必要小看 AI 公司們的高層，那些專家說的危機其實他們都懂。

只是他們除了在玩囚徒困境之外，也在同時玩「懦夫賽局」（game of chicken，也稱膽小鬼賽局）。

顧名思義，懦夫賽局就是看誰先在危機發生之前先退下，誰就輸。

想像一個畫面：

兩輛車迎面開來，兩邊都知道不該撞上去，但誰先轉彎，誰就像輸家。

它和囚徒困境不太一樣。

囚徒困境的核心是：大家都想合作，但怕自己被背叛。

懦夫賽局的核心是：大家都知道有危險，但想把退讓的成本丟給對方。

所以賽局理論告訴我們，AI 公司不會真的對人類滅亡危機不管不顧，事實上他們或許早已經有做好了應對準備。

只是未到最後一刻，未到滅頂危機發生前的一刻，率先退下就不是最優選擇。

最後，AI 安全還有一層更重要的結構：公共財賽局（public goods game）。

公共財，就是大家都需要，但付錢的人無法獨自享受的東西。

例如一條街的防洪工程。

如果防洪牆蓋好，整條街都比較安全。但錢要誰出？

如果 A 店鋪出錢，B 店鋪不出錢，B 也一樣不會被水淹。

於是每個人都希望防洪牆存在，但每個人也都希望別人先付錢。

AI 安全也是這樣。

如果一家公司多花資源做測試、外部審查、危險能力評估，降低的風險不只保護它自己，也保護使用者、企業客戶、政府、競爭對手，甚至整個社會。

儘管這些也對該公司有利，但把資源調用到公共安全，就意味著發布變慢、產品變晚、客戶可能流失、媒體可能說它落後、投資人可能焦慮。

所以在安全問題上，AI 公司們都一同出現了以下彆扭的姿態：

囚徒困境：大家都揚言說要安全為先，但自己又不斷加速研發。
懦夫賽局：大家都警告 AGI/ASI 會對社會造成巨大衝擊，但自己卻不到最後一刻就不會輕易煞車。
公共財賽局：大家都呼籲其它公司為社會著想，但又不願意只是自己付出最多。

這不是誰比較有道德，比較高尚的問題，提出那種問題並不會讓你看清局面的底層原因。

這是賽局理論問題，用賽局理論解析了一番之後，你就明白了 AI 公司們為什麼現在會這樣做，接下來會怎樣做。

你會明白 AI 公司們，其實也是人在江湖，身不由己。

從賽局理論的角度看來，未來...

現在，我們不妨試試用賽局理論去預測未來，以下請權當作一種智力娛樂。

賽局理論有一個前提假設，就是賽局裡的參賽者都會以自身利益為優先。

所以我們如果能知道參賽者們所面對的預期報酬和成本，那麼就能推算出他們的下一步行動。

當然，我們身為 AI 公司們的圈外人，不可能知道他們所面對的一切獎罰可能性，所以我們只能根據有限但明確的資訊進行推理。

從這個角度看，AI 圈接下來大概會反覆出現這 5 個走向：

第一，「競爭優勢」凌駕於「安全之上」

能力領先會帶來使用者、收入、估值、人才、企業客戶和政府關係。

這些都是明確的報酬。

相反，許多安全風險都是外部成本。偏見、幻覺、濫用、資安漏洞、心理傷害、就業衝擊，往往先由使用者、企業客戶和整個社會承擔。

當然，出事之後公司也會付出名譽代價。

但只要每家公司都面對類似的風險，這種代價就很容易被攤平。它會變成「做 AI 生意的共同風險」，而不是某一家公司的致命懲罰。

所以更可能出現的局面是：公司會持續說自己重視安全，也會做評估、紅隊測試、政策文件和外部溝通。

而只要沒有一套外部機制，例如政府監管、法律責任，明確懲罰公司，那麼公司就一定會把速度和能力凌駕於安全之上。

安全問題會在發布會上被反覆提起，但速度和能力才是資源投入的重地。

第二，「市占率」凌駕於「社會代價」

目前 AI 公司最想證明的，不是模型能解答各種問題，而是模型能勝任人類的工作。

寫程式、整理文件、回客服、做簡報、分析資料、接管流程、減少人力成本，這些才是企業願意付錢的地方。

從 Codex 到 Cowork 這類產品的演進，抓到的就是這個轉向：

AI 不只回答問題，AI 開始進入工作。

而如果 AI 能讓企業省下成本，企業就會買單。

如果 AI 讓白領工作的邊界被重畫，上班族、學生和家庭會承擔很大一部分代價。

可是對 AI 公司來說，前者是收入，後者多半不是成本。

所以它們會優先追求市占率，而不是先替整個社會安排轉型。

它們會說，AI 是增強人類，不是取代人類；它們會展示少數高效率工作者如何被放大，卻不太會長篇解釋大量普通工作如何被重新定價。

在這個局裡，企業願意提供「獎勵」，而社會卻很難把「懲罰」實施到 AI 公司的頭上。

第三，「政治與戰爭」凌駕於「人類共同利益」

AI 公司喜歡說服務人類。

但「國家」才是一個會簽合約、付雲端帳單、核准資料中心、提供軍事採購、保護供應鏈的參賽者。

當 AI 變成國力、情報、軍事、產業競爭和基礎設施，公司的收益表就會被政治改寫。

OpenAI 的 Stargate 敘事已經把 AI 基礎設施連到美國國家安全與盟友戰略能力。

Anthropic 與美國軍方在使用限制上的拉扯，也說明了當政府和軍事需求進場，「說不」本身也會成為一個有成本的選擇。

於是，「造福人類」會逐漸被翻譯成更可操作的版本：

服務本國、本陣營、本客戶、本盟友。

雖然嘴上還是要標榜自己最有道德。

但實際操作只會越來越接近政治現實。

換句話說，AI 模型被軍事化，被用來作為未來戰爭的武器，是很可能會發生，甚至已經在發生的事。

甚至，AI 模型被用於監控人民，也是很可能會發生的事情。

第四，「資料蒐集」凌駕於「使用者隱私」

AI 不只靠晶片長大，也靠資料長大。

資料可以改善模型、訓練 agent、建立使用習慣、增加切換成本。

尤其當 AI 從聊天工具變成工作代理，資料就不只是輸入內容，而是操作紀錄、企業文件、程式碼庫。

更多資料，通常意味著更好的產品、更高的黏著度、更強的模型優勢。

隱私限制，則常常意味著更慢的整合、更少的訓練材料、更高的合規成本。

如果大型語言模型出現在 10 年前，AI 公司可能會像社群平台那樣默默地吸收和利用使用者資料。

但資料隱私在今天已經有相對成熟的監管和懲罰機制，所以 AI 公司不會做得太明目張膽。

它會頂著良善的名義，舉著「為你好」的牌子告訴你：

這是產品改善，這是安全監測，這是匿名化資料，這是使用者同意，這是企業整合，這是更好的個人化體驗。

而付出的代價是，你的資料、你的隱私。

第五，「自保」凌駕於「真相與責任」

當 AI 造成事故、濫用、偏見、資安問題、心理傷害或社會後果時，公司第一時間面對的不是哲學問題，而是生存問題。

估值會不會掉？合約會不會跑？監管會不會收緊？法律責任會不會擴大？

在這種局裡，資訊不對稱會變得很關鍵。

外界看不到完整訓練資料、內部評估、失敗紀錄、風險討論和部署決策。

AI 開發者掌握許多外界難以取得的資訊，而商業考量又會讓這些資訊更難被分享。

所以公司會優先控制敘事。

它會公布一部分資訊，保留一部分資訊；承認具體錯誤，但避免承認結構性問題；透明到足以維持信任，卻不會自然透明到傷害自己。

這不是 AI 產業獨有的毛病，這是所有高風險、高估值、高法律責任產業都會出現的反應。

所以 AI 公司們，是否有藏著不能公開，而且對社會有害的資訊？

我不知道。可能沒有。可能有。

賽局理論不能預測事實真相是什麼，而只能預測說，如果有的話，那麼被揭露出來之前，AI 公司是不會主動出來承認。

這很重要。

因為我寫這篇文章的本意，不是抹黑任何 AI 公司，不是想高舉反 AI 的旗幟，不是說大家都沒有道德，更不是說一定有見不得光的事情在發生。

而只是想提供你一個賽局理論的角度，一個現實的角度，

一個清醒的角度。

本文是《每週讀懂一本書+》的限時免費文章。

如果你喜歡這種有深度的文章，可以先加入等候名單；正式推出時，我會把首次訂閱折扣寄給名單上的讀者。

注：若以上按鈕沒反應，請點擊這裏