從通用 CPU 到異構芯片群：AI 時代的第二次架構大遷移

當 AI 模型變成三維矩陣運算怪獸、傳統 CPU 就像拿著菜刀去砌磚——每家公司開始打造自己的「專用刀具」，而隼瞻科技就在賣製刀的模板與工具。

本篇 atom

從通用到專用的架構轉換(Shift from General-Purpose to Domain-Specific Architecture)

當計算需求的規模或複雜度達到臨界點，通用架構的冗餘成本（功耗、延遲、面積）變得不可接受，系統會自發地分化為多個專用加速器。這不是線性優化，而是架構範式的骨折式轉變——從「一個 CPU 統治一切」變成「異構計算生態」。

提出者：Gene Amdahl（1967）; David Patterson（2016 Turing Award） (1967)

芯片架構轉變的冰山：表面是『定制化芯片爆炸』，深層是『工具民主化』推動的產業分散化

推理鏈 · DNA chain

06 STEPS

原則 · 本篇核心

當工具民主化（降低準入門檻），產業會從「少數大廠壟斷」分化為「眾多小玩家」的生態。這不是新現象，是範式轉變的典型模式——從集中到分散。

▸ 展開完整 6 步推理鏈（事件 → 觀察 → 模式 → 原則 → 應用 → 反例）

事件
AI 模型垂直化加速，客戶需要為特定工作負載設計定制化處理器
觀察
傳統通用 CPU/GPU 在功耗、延遲、面積上對專用工作負載都有 3-10 倍的冗餘成本
模式
芯片設計工具鏈（EDA）成為瓶頸，傳統 Synopsys/Cadence 的工具為「通用設計」優化，不適合快速定制化
原則
當工具民主化（降低準入門檻），產業會從「少數大廠壟斷」分化為「眾多小玩家」的生態。這不是新現象，是範式轉變的典型模式——從集中到分散。
其他應用
當年 Kleiner Perkins 投資 Cadence，推動 EDA 工具民主化；今天隼瞻在重演同樣故事，但對象從通用芯片換成定制化加速器。ARM 的授權模式讓位給 RISC-V 的開放架構，就是這個轉變的訊號。
反例 / 限制
但最強的反方論點是：定制化芯片的「最後一哩路」是流片與驗證，這不能被工具解決。隼瞻只解決了「設計前 60%」的問題；剩下 40% 的製造、測試、可靠性驗證，小公司沒有資本做，還是要靠 TSMC。結果是，TSMC 更強了，不是產業民主化了。

Multilateral lens

從不同板塊看這篇

Atomly 自動判斷這篇文章跟哪些 mental model 板塊相關、各從一個 lens 拆解。同一件事、不同視角。

觀察

AI 模型從語言模型擴展到多模態、具身智能，計算特性從矩陣乘法變成控制流與動態推理混合，單一通用架構無法最優。

原則

計算特性多樣化時，專用架構的邊際收益會超過通用架構，觸發「異構計算爆炸」。

行動

評估新 AI 芯片公司時，追蹤其支援的『模型多樣性』而非『性能指標』；多樣性越高，市場越小。

深入「AI/科技」板塊 →

出處：36氪首发 | AI芯片处理器IP公司完成近亿元融资，核心团队来自Synopsys、ARM等顶尖半导体公司 · 36氪 · 2026-06-09T01:56:31+00:00

#芯片架構#專用計算#EDA 工具#RISC-V#定制化處理器#異構計算#產業民主化

事件

隼瞻科技近日完成近億元融資（天使+輪），投資方包括英飛尼迪資本、華蓋資本等多家戰略投資人。這家成立於 2023 年的芯片設計公司，核心團隊來自 Synopsys、ARM 等半導體巨頭。

其商業邏輯很直接：提供「IP 貨架 + EDA 工具鏈」，讓客戶能快速設計定制化的 AI 處理器——而不用每次都從零開始。

為什麼這不只是產品創新、而是範式轉變

過去 40 年，芯片產業的故事是 CPU 的勝利。從 Intel 的單核稱王到多核並行、從 x86 到 ARM，核心邏輯始終不變：一個通用的、指令集完整的計算機，通過提高時鐘頻率、增加快取、改進預測分支等手段，來應對所有工作負載。

這個架構有個隱形的成本——當妳的工作負載只需要做一件事（比如矩陣乘法），但 CPU 還是為了「通用性」在邏輯密度、功耗、延遲上都付出了代價。這些冗餘在個人電腦時代沒人在乎（因為妳的工作負載確實五花八門），但在 AI 時代，局面反轉了：

同一家企業的 100 台機器，都在跑差不多的模型；同一個模型，卻因為需要支援 GPU、CPU、NPU 三種不同的推理場景，整個芯片成本結構被打碎了。

這就是「專用計算」浪潮的源頭。不是某個公司的 marketing 創意，而是物理極限與經濟學的交點：

**功耗視角**：GPU 做矩陣乘法很效率，但做控制流（if/else）很差；TPU 為 TensorFlow 優化，但跑 PyTorch 推理就費力；CPU 通吃，但功耗比都是 1:10 的差距。當芯片成本的 60% 是電費，沒有 CIO 會選通用方案。

**延遲視角**：客戶端 AI 推理（如手機 OCR、邊緣設備目標檢測）對延遲敏感到以毫秒計，通用 CPU 的預取、分支預測這套防守森嚴的邏輯對它們都是累贅。定制化加速器可以砍掉 80% 的邏輯，只保留「這個模型會跑什麼指令」。

**面積視角**：GPU 有龐大的通用暫存器檔與指令解碼器，但某些專用處理器（如向量矩陣乘法 ASICs）只需要細長的數據通路。在相同的代工工藝節點，面積縮小 5 倍就意味著產能高 5 倍、成本低 5 倍。

隼瞻科技在賭什麼

第一層賭注：定制化芯片設計的工具鏈會成為瓶頸。

過去，Synopsys 與 Cadence 壟斷 EDA（電子設計自動化）工具——但它們針對的是「設計通用 CPU 與 GPU」。客戶若要設計 NPU，要自己手寫 RTL（晶片級硬體描述語言），這個過程需要 6-12 個月與一支 50+ 人的團隊。

隼瞻科技的邏輯是：「如果我提供了『模組化 IP 貨架』——包括矩陣乘法加速器、向量處理單元、記憶體控制器等『積木』——以及自動化的綁定工具，那麼客戶設計一款定制化 AI 芯片從 12 個月降到 3 個月、從 50 人降到 5 人。」

這對誰有利？對「有特定模型、但沒有 GPU 驅動能力」的企業有利——比如某個自駕車廠商、某個 AR 眼鏡廠商、或某個需要私有化推理的大廠。

第二層賭注：RISC-V 會取代 ARM。

注意隼瞻在用 RISC-V（開源指令集架構）而不是 ARM（英國 Arm Holdings 的授權架構）。這暗示了一個長期賭注：在「高度定制化」的專用芯片時代，開放的、可修改的指令集會比「買授權」更有優勢。

當妳要為特定 AI 模型設計推理加速器，妳可能需要一些 ARM 沒有的指令（比如「脈衝神經網路專用指令」或「量化推理專用指令」）。用 ARM，妳要等 Arm Holdings 來加新指令；用 RISC-V，妳自己改。

這個邏輯在「定制化爆炸」的時代會變得越來越有吸引力。

歷史類比：從分立元件到集成電路

1950-1960 年代，電子工業面臨類似的轉折：分立的電晶體、電容、電阻組成的電路極其複雜、成本高、可靠性差。每個應用（無線電、電視、計算機）都在重複發明輪子。

直到 1958 年 Jack Kilby 發明了集成電路——把相同功能的元件「預製」在一個晶片上——整個產業的成本結構被推翻了。

Counter View · Munger Inversion

1
「定制化芯片設計會因為流片成本與時間風險太高、最終還是回到通用方案。」
— 傳統 EDA / Fabless 從業者的保守觀點
2
「Synopsys 與 Cadence 會迅速升級工具鏈，隼瞄沒有可持續的護城河。」
— 投資銀行對市場飽和度的評估
3
「RISC-V 的生態遠不如 ARM，在高階應用中還是會被 ARM 淘汰。」
— ARM Holdings 與產業分析師的論點

如果定制化芯片設計工具真的民主化了，最終的贏家是『工具供應商』（隼瞄、Synopsys）、還是『代工廠』（TSMC）、還是『客戶本身』（每家公司自己設計芯片）？

▶ 參考來源 (4)

bookComputer Architecture: A Quantitative Approach — David Patterson, John Hennessy (2019)
paperDomain-Specific Architectures — David Patterson (2016)
bookThe Innovator's Dilemma — Clayton Christensen (1997)
articleRISC-V: From Research to Practice — Krste Asanović et al. (2020)

今日練習跨域遷移· 想另一個領域的例子

登入收藏

找一個妳熟悉的產業（製造、物流、醫療都可以），想想在過去 5-10 年有沒有發生過『從通用方案到專用方案』的轉變？比如某個工具、軟體、還是流程的民主化，讓原本只有大企業能做的事、現在小企業也能做？描述這個轉變如何改變了這個產業的結構。

💡 把這個練習帶到一天裡 — 下次走在路上、看新聞、跟人聊天時、想想能怎麼套用這個原則。

第 807/1000