事件
2026 年 6 月,Anthropic 發布 Claude Fable 5,宣稱是「有史以來功能最強大的廣泛可用模型」,在軟體工程、知識工作和視覺任務上表現突出。但關鍵細節藏在新聞片段的末尾:Mythos 系列此前曾因「在網路安全任務上能力太強」而遭內部限制,公司當時認為這些能力「過於危險無法廣泛佈署」。
現在,Anthropic 改口了。Fable 5 成為第一個從 Mythos 系列中廣泛發佈的模型。
表面解讀 vs 經濟真相
表面上,這看起來像技術進步帶來的信心提升——也許 Anthropic 開發出了更好的安全防護機制,使得之前「太危險」的模型現在變得可以放心使用。
但經濟邏輯講另一個故事。
### 檸檬市場的開始
當 Anthropic 決定「隱匿 Mythos 的廣泛佈署」時,市場會讀到什麼信號? - OpenAI 不會這麼保守。如果 OpenAI 的下一代模型在網路安全上也達到相同水平,他們會毫不猶豫地推出。 - 監管機構會更謹慎地看待 Anthropic——暗示:這家公司認為存在某些無法解決的風險。 - 競爭對手(包括中國的模型開發者)會推斷:Anthropic 相信這個能力級別本身就具有軍事或犯罪應用價值。既然如此,為什麼我們要自我約束?
換句話說,安全約束本身變成了一個信號——反而鼓勵了市場上其他參與者的激進行為。
### 反向選擇的陷阱
Akerlof 的檸檬市場理論告訴我們:當好車主和壞車主混在一起、買家無法區分時,整個市場會被壞車自動選擇。這裡的邏輯完全相同:
1. 安全約束的公司(Anthropic) 隱匿模型 → 被解讀為「這東西真的很危險」 2. 沒有安全約束的公司 推出相同能力 → 被解讀為「這東西也沒那麼危險」(或者「他們根本不在乎」) 3. 市場逐漸被「沒有安全考量的佈署」主導 4. Anthropic 的道德優勢蕩然無存、反而被看作「不夠競爭力的玩家」
結果:本來想通過安全設限來建立信任、反而被市場邏輯懲罰。這就是為什麼最後 Anthropic 還是發佈了 Fable 5。
### 為什麼現在?
Anthromic 發佈 Fable 5 的時機點很重要:
1. 市場壓力:如果持續不發,OpenAI、Google、DeepSeek 等會把市場吃掉。Anthropic 的估值和融資能力會被持續削弱。 2. 安全防線被挑戰:一旦有第二家公司推出相同能力的模型而沒有做出安全限制,Anthropic 的「比我們更安全」的品牌承諾就破產了。 3. 規模經濟:模型越被廣泛使用,邊界情況(edge case)被發現的機率越低(逆向),使得 Anthropic 可以聲稱「我們累積了更多證據證明它是安全的」。
核心原則:安全承諾在競爭市場中的失效
這個案例揭示的不是「Anthropic 安全意識下降」,而是一個更深刻的結構性問題:
在零和競爭環境中,單方面的安全約束無法維持。安全本身必須由制度(法律、國際條約、產業標準)強制、而不能靠道德自律。
歷史類比: - 軍備競賽:各國都想裁軍,但只要有一個國家背信,其他國家就被迫投入更多。 - 環保承諾:製造商都願意更環保,但只要有競爭者偷工減料、成本更低,市場就會獎勵不誠實者。 - 金融監管:銀行都想避免過度槓桿,但只要有銀行敢槓桿更高、利潤更豐厚,誠實者會被淘汰。
為什麼這件事比「Claude 又變強了」重要
Fable 5 的發佈標誌著一個轉折點:Anthropic 正式放棄了「安全優先」作為主要市場區隔的策略。
這不是技術決定、而是經濟決定。下一步會是什麼?
1. 監管機構會逐漸降低對 AI 能力邊界的管制(因為「大家都在做」) 2. 各公司會在「安全聲稱」和「實際限制」之間的差距越來越大 3. 真正的安全防線會從「模型本身」轉移到「使用者驗證」和「監控」層(這反而是更務實的做法)