事件
在 COMPUTEX 2026 同步舉辦的 GTC Taipei 記者會上,NVIDIA 執行長黃仁勳親自闡述了 Vera CPU 的戰略定位。這不是簡單的產品發表,而是對一個根本性商業假設的宣告。
黃仁勳在回答關於 Vera CPU 如何對標 AMD 的問題時,明確指出:「傳統 CPU 思路是不斷堆疊核心——100 核心更好,200 核心更好,400 核心更好。但那是給人類使用的舊方法。」
他進而揭示了關鍵差異:「代理(Agent)不想租用 CPU 核心,代理想要生成 Token。"
背景
過去 30 年,資料中心 CPU 的設計邏輯遵循同一條原則:多核心 = 更多使用者可同時存取系統 = 更高經濟效益。這個邏輯在「人類使用者」的前提下無懈可擊。Intel、AMD、IBM 都在這條路上卷核心數——從雙核到四核、八核、到今日的 128 核。
但 2024-2026 年發生了一個無聲的結構轉變:大型語言模型(LLM)的推理成本大幅下降後,AI Agent 的部署密度開始指數級上升。這些 Agent 不是「使用者」——它們沒有「同時存取」的概念,也不需要人類那樣的響應時間。它們只有一個目標:盡快生成輸出序列(Token)。
這一轉變,讓 CPU 的價值衡量標準徹底改變。
舊邏輯 vs 新邏輯
人類使用者的世界(過去 30 年): - 衡量指標:核心數、時脈、メモリ帶寬 - 優化目標:最小化單一請求延遲、最大化併發用戶數 - 競爭策略:堆疊核心、降低成本、爭奪市場份額
AI Agent 的世界(2026 年後): - 衡量指標:Token 吞吐量、推理延遲、電力效率 - 優化目標:單位時間內完成最多推理任務 - 競爭策略:重新架構晶片設計、針對推理工作負載優化、軟硬體協同
黃仁勳的論述本質上在說:「我們不再競爭『有多少核心』,而是『能有多快生成 Token』。」這代表 CPU 設計的參數空間徹底改變。傳統 x86 架構為人類工作負載優化的指令集、快取層級、記憶體管理,對於 AI 推理工作可能都不是最優選。
VerA CPU 的問世,象徵著一個新用戶群體(機器)的需求,將重寫硬體產業的設計假設。過去 30 年 Intel 和 AMD 的競爭格局,是基於「人類才是 CPU 的用戶」這個前提。一旦這個前提失效,整個產業的護城河就被重新定義。
商業模式層次的意涵
這個轉變還涉及另一個隱藏的商業層面。在人類用戶時代,CPU 的定價和授權基於「核心數」和「性能層級」——這是 x86 架構下的生態稅收模式(Intel、AMD、ARM 的授權費)。
但如果競爭維度變成「Token 吞吐」,那麼定價邏輯也會變。一個能在單位時間內生成更多 Token 的 CPU,對 AI 雲服務提供商(如 OpenAI、Google、Meta)的價值,不是「能服務多少使用者」,而是「能消耗多少電力、運行多少並行推理」。
VerA 既然是 NVIDIA 自製 CPU(而非授權他人),意味著 NVIDIA 要自己定義這個新市場的遊戲規則。這是一個從「賣零件」轉向「賣解決方案」的戰略轉移。
風險與挑戰
當然,黃仁勳的論述也埋藏著假設風險:
1. Agent 的真實工作負載:當前 Agent 的推理工作負載仍處於實驗階段,實際最優架構尚未穩定。如果黃仁勳對「Agent 需要什麼」的假設有誤,Vera CPU 的設計可能偏離市場需要。
2. 生態鎖定:NVIDIA 自製 CPU,意味著必須建立完整的軟體生態(編譯器、函式庫、最佳化工具)。在 x86 的壟斷下,這個成本與難度遠大於晶片製造本身。
3. 成本線性性:新 Agent 市場的成長速度是否足以攤銷 CPU 設計的投資?如果市場成長慢於預期,NVIDIA 就會為了進入一個尚未成形的市場而付出巨大機會成本。
但從長期看,黃仁勳的戰略直覺(即「用戶角色轉變 → 需求轉變 → 架構需要重新定義」)是正確的。他實際上在為 10 年後的市場提前佈局,而不是為今日的市場優化。
對台灣科技業的啟示
黃仁勳最後還點出一個對台灣生態的評論:「台灣科技生態系數十年來圍繞 x86 架構建立。」這是在委婉地說——如果市場的用戶角色轉變了,圍繞舊架構建立的整個供應鏈、設計工具、人才庫,都需要重新思考定位。