事件背景
過去兩年、中國云廠商圍繞大語言模型推理成本展開一場激烈的價格戰。從 2024 年 5 月 DeepSeek V2 打響降價的第一槍開始,火山引擎、阿里、百度、騰訊、訊飛相繼跟進,價格一路跳水到 0.0008 元/千 Token。這些廠商的邏輯很直白:用低價模型吸引流量、帶動整個公有云服務銷售、賺的錢來自於背後的基礎設施消費。
代價則是殘酷的:推理算力的毛利率一度被壓到負數。
華為云的異議
在 2026 年華為云 INSPIRE 創想者大會上,華為云 CEO 周跃峰提出了一個顛覆性的觀點。他表示華為云「不太在乎 Token 總量是多少、也不太在乎收入總量是多少」,反而在乎的是「國產化算力系統所生產出來的 Token 的健康度」——也就是說,每個 Token 背後是否代表真實的生產力提升。
他舉了個例子:一個人閒來無事在手機上問 AI 一個問題,也會產生 Token。但這種 Token 的價值有多大?這句話直指問題的本質。
量化陷阱的本質
從表面看,「Token 總量」是個完美的虛榮指標:
1. 容易量化:數字明確、無歧義、投資者容易理解 2. 容易增長:只要繼續降價、流量就會上升、Token 也會猛增 3. 容易傳播:「我們日處理 10 萬億 Token」聽起來比「我們提升了用戶工作效率 12%」更震撼 4. 短期可視化:季度財報容易秀成績
但其背後隱藏著三個致命的陷阱:
### 陷阱一:流量水分
不是所有 Token 生成都等同於商業價值。一個人用 AI 聊天、一個企業用 AI 來自動化數據處理,生成的 Token 數可能相近,但前者幾乎沒有商業價值,後者代表真實的成本節約。當廠商用低價吸引大量非商業用途流量時,Token 總量會虛漲、但收益結構卻在惡化。
### 陷阱二:毛利率掏空
DeepSeek 的低價模型引發的價格戰,迫使廠商把推理成本壓低。但當推理毛利率變成負數時,廠商是在每賣一單就虧一次錢。唯一的補救是寄望於這些流量會「升級」到高毛利的增值服務——但這從未發生過的概率極高。
### 陷阱三:競爭困頓
當整個行業都在比誰的 Token 價格更低、Token 總量更大時,廠商失去了在品質、效率、特色上差異化的動力。最後誰輸?邊際成本最高的廠商輸。而那些一開始就走「質量而非數量」的廠商,反而能保持競爭耐力。
華為云的第三條路
華為云提出的「Token 質量論」實際上是在說:衡量一朵云做得好不好,不應該強調 Token 總量,而應該看「這些 Token 替企業提了多少效率」。這意味著:
1. 選擇用戶:不是所有流量都要。只服務那些能從 AI 中獲得實際生產力提升的企業客戶 2. 成本結構:寧可用戶少、毛利率也要健康,而不是用戶多、單位經濟崩潰 3. 衡量體系:從「日活、DAU、總 Token」換成「客戶成本節約、工作效率提升百分比、客戶留存率」
這種切換看似放棄了「更大的市場」,實際上是在逃離一個虛幻的市場、進入一個實在的市場。
為什麼這個觀點現在才出現
一個有趣的問題是:為什麼不是所有廠商都看到這一點?
答案可能是時間滯後。在價格戰初期(2024-2025),廠商的想法是「先搶用戶、再優化單位經濟」。但到了 2026 年、當數據開始暴露毛利率崩潰的事實時、總要有人轉向。華為云作為國家隊背景、也許有更長的時間視野、更能容忍短期不追求最大化 Token 數字。
另一個因素是技術取向。華為在芯片、算力硬件上有深厚積累,不需要靠「低價軟件」來吸引用戶,反而能靠「國產化算力系統」本身作為差異化賣點。
反思
這個故事的寓意遠超過 AI 云市場。在任何行業,當: