Vera CPU 不賣核心數，賣 Token 吞吐——當用戶從人類變成 Agent

CPU 過去 30 年的設計哲學是「堆疊核心」，因為人類需要併發。但當真正的用戶變成 AI Agent 時——它們不要「租核心」、只要「生 Token」——整個競爭規則被重寫了。

本篇 atom

需求層次躍遷(Demand Hierarchy Shift)

當客戶角色從人類轉變為機器（Agent）時，對硬體的評估維度會根本性翻轉——從「可用資源量」轉向「任務完成效率」。舊架構為人類優化，新角色要求重新定義價值函式。

提出者：黃仁勳 / NVIDIA 2026 (2026)

CPU 設計哲學的二階矩陣：用戶角色 × 優化維度

消費級芯片的新寶地

過去 30 年 Intel/AMD 的遊戲

黃仁勳下注的新象限

過度優化？堆核心但用不滿

推理鏈 · DNA chain

06 STEPS

原則 · 本篇核心

需求層次躍遷——硬體價值函式重新定義、舊優化目標失效

▸ 展開完整 6 步推理鏈（事件 → 觀察 → 模式 → 原則 → 應用 → 反例）

事件
黃仁勳說 Agent 不想租核心、只要生 Token
觀察
CPU 價值衡量標準從「核心數」轉向「Token 吞吐量」
模式
當客戶角色轉變（人類 → 機器）、評估維度會根本翻轉
原則
需求層次躍遷——硬體價值函式重新定義、舊優化目標失效
其他應用
Vera CPU 放棄堆核心、改為優化推理延遲；ARM 架構挑戰 x86；AI 晶片專用化趨勢（TPU / NPU）

Multilateral lens

從不同板塊看這篇

Atomly 自動判斷這篇文章跟哪些 mental model 板塊相關、各從一個 lens 拆解。同一件事、不同視角。

觀察

CPU 設計假設從「支援多用戶併發」轉向「最大化推理吞吐」，晶片的指令集、快取架構、記憶體層級都需重新最佳化。

原則

硬體架構是價值函式的物理體現；價值函式改變，架構必須跟著翻轉，否則就會被新對手淘汰。

行動

評估科技廠商的長期競爭力時，追蹤他們對「未來用戶角色」的理解，而非只看當下產品效能數字。

深入「AI/科技」板塊 →

#CPU 架構#AI Agent#硬體設計#市場轉變#NVIDIA#x86#需求層次#Vera

事件

在 COMPUTEX 2026 同步舉辦的 GTC Taipei 記者會上，NVIDIA 執行長黃仁勳親自闡述了 Vera CPU 的戰略定位。這不是簡單的產品發表，而是對一個根本性商業假設的宣告。

黃仁勳在回答關於 Vera CPU 如何對標 AMD 的問題時，明確指出：「傳統 CPU 思路是不斷堆疊核心——100 核心更好，200 核心更好，400 核心更好。但那是給人類使用的舊方法。」

他進而揭示了關鍵差異：「代理（Agent）不想租用 CPU 核心，代理想要生成 Token。"

背景

過去 30 年，資料中心 CPU 的設計邏輯遵循同一條原則：多核心 = 更多使用者可同時存取系統 = 更高經濟效益。這個邏輯在「人類使用者」的前提下無懈可擊。Intel、AMD、IBM 都在這條路上卷核心數——從雙核到四核、八核、到今日的 128 核。

但 2024-2026 年發生了一個無聲的結構轉變：大型語言模型（LLM）的推理成本大幅下降後，AI Agent 的部署密度開始指數級上升。這些 Agent 不是「使用者」——它們沒有「同時存取」的概念，也不需要人類那樣的響應時間。它們只有一個目標：盡快生成輸出序列（Token）。

這一轉變，讓 CPU 的價值衡量標準徹底改變。

舊邏輯 vs 新邏輯

人類使用者的世界（過去 30 年）： - 衡量指標：核心數、時脈、メモリ帶寬 - 優化目標：最小化單一請求延遲、最大化併發用戶數 - 競爭策略：堆疊核心、降低成本、爭奪市場份額

AI Agent 的世界（2026 年後）： - 衡量指標：Token 吞吐量、推理延遲、電力效率 - 優化目標：單位時間內完成最多推理任務 - 競爭策略：重新架構晶片設計、針對推理工作負載優化、軟硬體協同

黃仁勳的論述本質上在說：「我們不再競爭『有多少核心』，而是『能有多快生成 Token』。」這代表 CPU 設計的參數空間徹底改變。傳統 x86 架構為人類工作負載優化的指令集、快取層級、記憶體管理，對於 AI 推理工作可能都不是最優選。

VerA CPU 的問世，象徵著一個新用戶群體（機器）的需求，將重寫硬體產業的設計假設。過去 30 年 Intel 和 AMD 的競爭格局，是基於「人類才是 CPU 的用戶」這個前提。一旦這個前提失效，整個產業的護城河就被重新定義。

商業模式層次的意涵

這個轉變還涉及另一個隱藏的商業層面。在人類用戶時代，CPU 的定價和授權基於「核心數」和「性能層級」——這是 x86 架構下的生態稅收模式（Intel、AMD、ARM 的授權費）。

但如果競爭維度變成「Token 吞吐」，那麼定價邏輯也會變。一個能在單位時間內生成更多 Token 的 CPU，對 AI 雲服務提供商（如 OpenAI、Google、Meta）的價值，不是「能服務多少使用者」，而是「能消耗多少電力、運行多少並行推理」。

VerA 既然是 NVIDIA 自製 CPU（而非授權他人），意味著 NVIDIA 要自己定義這個新市場的遊戲規則。這是一個從「賣零件」轉向「賣解決方案」的戰略轉移。

風險與挑戰

當然，黃仁勳的論述也埋藏著假設風險：

1. Agent 的真實工作負載：當前 Agent 的推理工作負載仍處於實驗階段，實際最優架構尚未穩定。如果黃仁勳對「Agent 需要什麼」的假設有誤，Vera CPU 的設計可能偏離市場需要。

2. 生態鎖定：NVIDIA 自製 CPU，意味著必須建立完整的軟體生態（編譯器、函式庫、最佳化工具）。在 x86 的壟斷下，這個成本與難度遠大於晶片製造本身。

3. 成本線性性：新 Agent 市場的成長速度是否足以攤銷 CPU 設計的投資？如果市場成長慢於預期，NVIDIA 就會為了進入一個尚未成形的市場而付出巨大機會成本。

但從長期看，黃仁勳的戰略直覺（即「用戶角色轉變 → 需求轉變 → 架構需要重新定義」）是正確的。他實際上在為 10 年後的市場提前佈局，而不是為今日的市場優化。

對台灣科技業的啟示

黃仁勳最後還點出一個對台灣生態的評論：「台灣科技生態系數十年來圍繞 x86 架構建立。」這是在委婉地說——如果市場的用戶角色轉變了，圍繞舊架構建立的整個供應鏈、設計工具、人才庫，都需要重新思考定位。

Counter View · Munger Inversion

1
「核心數仍然決定 Agent 的並行推理數量，Token 吞吐最終還是由核心數與時脈決定，黃仁勳在虛張聲勢。」
— 傳統 CPU 設計師觀點
2
「AI Agent 的工作負載至今仍處實驗階段，黃仁勳可能高估了這個市場的成熟度，Vera CPU 風險遠大於想像。」
— 市場分析師
3
「x86 生態的軟體相容性與最佳化深度，不是新架構短期能追上的，Vera CPU 容易陷入軟體荒漠。」
— Intel / AMD 支持者

如果 AI Agent 最終被證明需要的不是專用 CPU、而是 GPU + 軟體棧的最佳化組合，那麼 NVIDIA 投入 Vera CPU 的 10 年研發成本，會不會成為企業歷史上的又一次『提前優化失敗』案例？

▶ 參考來源 (3)

news黃仁勳親解 Vera CPU 戰略：這是一個 6 個月前還未存在的市場
bookThe Innovator's Dilemma — Clayton M. Christensen (1997)
concept破壞式創新

今日練習跨域遷移· 想另一個領域的例子

登入收藏

想想妳所在的行業或關注的領域，是否存在『客戶角色轉變』（如同人類用戶 → AI Agent）？如果轉變發生，目前的產品設計會不會也落入『為舊用戶優化、對新用戶不匹配』的陷阱？找一個具體例子，用 3-5 句話解釋為什麼舊設計邏輯對新角色失效。

💡 把這個練習帶到一天裡 — 下次走在路上、看新聞、跟人聊天時、想想能怎麼套用這個原則。

第 0/1000