事件
2026 年三月,Google 向 Meta 告知:無法供應後者申購的全部 Gemini 算力。這道看似平靜的限制令,實際上戳破了 AI 產業近兩年最大的集體幻覺。
根據《Financial Times》報導,這項限制至今未解除,已經延後了 Meta 的多個內部 AI 專案。不只 Meta,Google 還對其他幾家客戶施加類似限制,只是程度較輕。Meta 衝擊最嚴重的原因很直白:它對 Google 模型的需求量遠超其他客戶。
結果是什麼?Meta 不得不要求員工更有效率地使用 AI token(衡量 AI 模型使用量的計量單位),變相削減了內部 AI 專案的野心。
隱藏的產業邏輯轉折
過去 18 個月,整個 AI 產業的敘事圍繞著一個假設:*模型是稀缺的*。
OpenAI 發佈 GPT-4,科技股漲;Google 急忙推出 Gemini,股市看漲;Meta 自研 Llama,投資人喝彩。這套敘事裡,模型能力(capability)是決定競爭勝負的唯一變數。企業為此砸數十億美元,招募 AI 人才,與 NVIDIA 爭著買 H100 顯卡。
但 Google 對 Meta 的限令揭示了另一層現實:模型本身不稀缺,運行模型的算力才稀缺。
Google 已經有能力同時服務數十家企業的推理需求。限制 Meta 的不是「Gemini 不夠強」,而是「我的數據中心沒有多餘的 GPU 時間來跑妳的查詢」。這是基礎設施瓶頸,不是技術瓶頸。
稀缺性為何轉移
第一階段(2022-2023):模型稀缺 - ChatGPT 一鳴驚人,全球企業搶著要接入最強模型 - GPT-4 發佈時價格極高、名單制邀請,反映供不應求 - 企業願為「用到最新模型」支付溢價
第二階段(2023-2024):開源模型爆發,模型不再稀缺 - Llama、Mistral、Qwen 等開源模型推出,性能逼近商業模型 - 任何有資本的企業都能微調或訓練自己的模型 - 模型從稀缺品變為大宗商品
第三階段(2024-2026):算力成為瓶頸 - 推理需求激增:每天數十億次 API 調用湧向各大雲服務商 - NVIDIA H100、B100 顯卡供應緊張,交期延後 - Google、Microsoft、Amazon 的數據中心擴容跟不上需求曲線 - 結果:就算妳的模型很強、錢也夠多,也買不到充足的運算時間
誰受傷最深
Meta 的案例最有啟發性。Meta 投入巨資開發 Llama,甚至在模型能力上已經相當接近 Google Gemini。理論上,Meta 可以獨立運行自己的推理服務。
但現實是:Meta 要在自己的服務(如 Reels、Ads 系統)中集成 AI 能力、要在 WhatsApp 和 Instagram 裡提供 AI 助手,這需要的算力規模超出它的現有基礎設施容量。於是 Meta 轉向採購 Google 的算力。
Google 一句「買不夠」,Meta 的整個 AI 野心就被掐斷。這正是稀缺資源掌握者的典型動作。
這個轉變的深層含義
模型公司變成商品、基礎設施公司變成寡佔
過去兩年,新聞充滿對 AI 新創的歌頌:「一家初創用 600 萬美元訓練了對標 OpenAI 的模型」(DeepSeek)。這種故事會繼續發生,因為模型訓練的成本確實在降低。
但一旦模型足夠好用,競爭的戰場就轉向「誰能穩定地供應推理算力」。這領域的玩家只有三家:Google、Amazon、Microsoft。它們各自控制著數百萬顆 GPU。
新創和中型科技公司要進入 AI 應用市場,必須依賴這三家的基礎設施。而基礎設施掌握者可以隨時按下「限流閥」——就像 Google 對 Meta 做的那樣。
定價權從模型提供者轉向基礎設施提供者
2023 年,OpenAI 靠著「最強模型」跟企業議價。2026 年,Google 靠著「最多可用算力」跟企業議價。後者的籌碼更強,因為它不可替代。
地緣政治的新戰線