事件脈絡
2026 年 6 月,NVIDIA 執行長黃仁勳在台北 GTC(GPU Technology Conference)主題演講中宣告「有用的 AI 已經到來」。他強調 AI 正從生成式階段(用戶問問題、模型生成回答)轉向代理式 AI 階段(AI 主動完成具體工作任務)。同時宣布推出 Vera CPU、Vera Rubin 平台進入全面量產、與聯發科共同開發 RTX Spark 晶片,將代理式 AI 從資料中心延伸到個人電腦。
黃仁勳特別強調了一個看似細微但極其重要的轉變:「token 從運算單位,進一步變成 AI 工廠的收入單位。」
為什麼這句話是轉折點
### 生成式 AI 時代(2022-2025)
在這個階段,token 的主要用途是衡量技術能力。OpenAI 按「每百萬 token 多少美元」定價——GPT-4 初期 15 美元 / 百萬 token、GPT-4 Turbo 降至 10 美元。深度探討的是:
- 一個模型能回答多少百分比的問題正確
- token 長度限制是多少(上下文窗口)
- 單次推理用多少 token 才能達到某個準確度
這階段的採購者主要是早期使用者與開發者,他們為了測試、遊玩、小規模應用而付費。市場還沒形成「工業用電」的付費邏輯。
### 代理式 AI 時代(2026 年起)
黃仁勳宣布的轉變重點不在技術,而在經濟層面。代理式 AI 的特徵是:
- AI 不是回答問題、而是被交付一個「完整任務」(寫代碼、分析數據、客服對答、流程自動化)
- 企業的商業模式變成:客戶不再為「API 調用次數」付費、而是為「完成的工作單位」付費
- Token 不再是技術指標、而是生產單位——像工廠用「度電」計費一樣
黃仁勳以「軟體工程師」舉例:AI 工具不是協助工程師「偶爾用用」、而是讓工程師的產出翻倍——這時企業與個人工程師的談判邏輯變成「用 AI agents 完成 X 個任務,成本是多少」,而不是「我這個月調用了多少次 API」。
這個轉變為什麼是永恆的模式
歷史上每項通用技術進入「工具化」階段,都會經歷同樣的轉折:
電力時代 - 初期(1880-1900):電是奢侈品,企業為「電的稀奇」付費,按時間計費。工廠主要看「電能點亮多少燈」。 - 工業化(1900-1920):電成為生產必需品,計費轉向「實際做功」(瓦小時)。工廠開始為「生產出多少商品」而購電,而不是「用了多少小時」。
網際網路時代 - 初期(1995-2005):按「頻寬用量」或「線路租賃」計費。用戶為「連接」付費。 - 工具化(2005-2015):轉向按「交易」或「服務」計費(Amazon AWS、Shopify 等)。企業為「運行了多少筆交易」付費。
AI 時代的轉折也遵循這個模式
生成式 AI(2022-2025)類似電力初期:為「技術能力展示」付費。
代理式 AI(2026 年起)轉向為「完成的工作」付費。
黃仁勳為什麼同時推出硬體產品線
這不是巧合。當應用層次躍遷時,硬體供應鏈也必須重組:
- **Vera CPU**:設計用於專門跑「推理工作流」(inference workload),而不是通用計算。代理式 AI 的特徵是大量持續推理(而不是偶爾的大規模訓練),所以需要專用晶片。
- **Vera Rubin 平台全量產**:這提示市場「代理式 AI 基建競爭要開始了」,競爭對手(如 AMD、Intel)也必須跟進。
- **RTX Spark + Windows 整合**:把 AI agents 推進個人電腦,意味著「工作自動化」要發生在用戶本地,而不只在雲端。這改變了分散式計算的邏輯。