事件背景
高通 CEO 安蒙在 2026 年台北國際電腦展(COMPUTEX)發表開幕演講,核心論點是:智能體(AI agents)已從科幻概念變成可實現的現實,並且它們將成為重新定義 AI 架構與經濟模式的關鍵力量。
演講強調三個要點: 1. 智能體是 AI 詞元(token)需求的「核心來源」 2. 智能體能「主動代替用戶運行計算、任務自動分配」 3. 未來 AI 架構會「充分利用全場景算力」(終端、邊緣、雲端混合)
為什麼這是架構轉折點
過去五年,AI 的使用場景是「對話式」的:用戶打一句問題、模型返回一句回答、流程結束。這種模式對推理成本的要求是相對線性且可控的——企業可以用伺服器級 GPU 集中計算、客戶端保持輕薄。
智能體改變了這個遊戲的規則。一個真正的智能體需要: - 持續決策能力:不是等用戶問、而是自主判斷何時該執行任務 - 多步推理:單個任務可能需要 50-500 步推理鏈(推理 token 消耗 50-500 倍) - 實時反應:任務執行失敗時要馬上調整策略、無法等待雲端延遲(通常 100-500 毫秒) - 並行運行:設備上可能同時跑 10 個智能體、對計算與功耗的衝擊是指數級
這三個要求直接推翻了「集中在雲端計算」的舊假設。
高通的賭注:終端架構重組
高通作為終端晶片(手機、平板、PC 處理器)的龍頭,它在賭的是:未來的 AI 計算不會再集中在數據中心,而是大規模分散到每個終端設備上。
具體的商業邏輯:
1. 芯片設計層面:現在的手機 SoC(System on Chip)中,CPU/GPU 的設計假設是「偶爾跑 AI、大部分時間閒置」。智能體時代需要「持續高效推理」,這意味著高通需要在終端上集成更多 AI 加速器(如神經處理器、張量核心),或者重新分配晶片面積。
2. 功耗與散熱:一部手機若要 24/7 跑 10 個智能體,耗電量會從「待機 0.1W」跳到「運行 5-10W」。這對電池續航是災難,也對散熱提出前所未有的挑戰。高通需要開發專門的低功耗推理架構(類似 Apple Neural Engine 的進化版)。
3. 軟體棧與作業系統:現有的 Android/iOS 是為「前台應用為主」設計的。智能體需要在後台持續執行、管理多個任務隊列、動態分配資源。這意味著作業系統核心需要重寫。
4. 供應鏈競爭:Apple 用自研 M 系列晶片已經證明了「為特定軟體架構優化晶片」能帶來 3-5 倍效能優勢。高通若要保住市場份額,必須在智能體時代也做同樣的優化——否則會像英特爾一樣被對手甩開。
這個論點為什麼是架構演化的信號
在歷史上,每次「需求側創新」都引發了一波「架構側創新」的連鎖反應:
- **2007 年 iPhone 出現** → 觸控螢幕需要多點傳感器 + 實時圖像處理 → ARM 架構崛起、x86 衰退
- **2012 年深度學習浪潮** → 大規模矩陣計算需求 → GPU 從渲染卡轉變為通用計算主力
- **2016 年 AlphaGo** → 海量並行推理 → 谷歌研發 TPU(張量處理單元)、打破 NVIDIA 壟斷
- **2023 年大語言模型爆發** → 推理 token 消耗爆炸 → 推理最佳化成為新戰場(DeepSeek、一眾量化框架)
現在安蒙在說的「智能體時代」,其實是在宣佈:下一波需求側創新正在到來,它會要求: - 終端推理能力從「偶爾用」變成「持續用」 - 單設備推理成本增加 10-100 倍 - 架構必須從「集中式」轉向「分散式」
為什麼是現在
三個條件同時成熟:
1. 推理成本足夠低了:DeepSeek 等新型架構將推理成本降到 1/25,讓終端推理變得經濟可行。 2. 智能體框架成熟了:OpenAI GPTs、Anthropic 的 tool use、谷歌 Project Astra,都證明了智能體不再是純研究概念。 3. :新一代固態電池、石墨烯散熱材料,讓設備能承受持續高功耗。