事件
隼瞻科技近日完成近億元融資(天使+輪),投資方包括英飛尼迪資本、華蓋資本等多家戰略投資人。這家成立於 2023 年的芯片設計公司,核心團隊來自 Synopsys、ARM 等半導體巨頭。
其商業邏輯很直接:提供「IP 貨架 + EDA 工具鏈」,讓客戶能快速設計定制化的 AI 處理器——而不用每次都從零開始。
為什麼這不只是產品創新、而是範式轉變
過去 40 年,芯片產業的故事是 CPU 的勝利。從 Intel 的單核稱王到多核並行、從 x86 到 ARM,核心邏輯始終不變:一個通用的、指令集完整的計算機,通過提高時鐘頻率、增加快取、改進預測分支等手段,來應對所有工作負載。
這個架構有個隱形的成本——當妳的工作負載只需要做一件事(比如矩陣乘法),但 CPU 還是為了「通用性」在邏輯密度、功耗、延遲上都付出了代價。這些冗餘在個人電腦時代沒人在乎(因為妳的工作負載確實五花八門),但在 AI 時代,局面反轉了:
同一家企業的 100 台機器,都在跑差不多的模型;同一個模型,卻因為需要支援 GPU、CPU、NPU 三種不同的推理場景,整個芯片成本結構被打碎了。
這就是「專用計算」浪潮的源頭。不是某個公司的 marketing 創意,而是物理極限與經濟學的交點:
- **功耗視角**:GPU 做矩陣乘法很效率,但做控制流(if/else)很差;TPU 為 TensorFlow 優化,但跑 PyTorch 推理就費力;CPU 通吃,但功耗比都是 1:10 的差距。當芯片成本的 60% 是電費,沒有 CIO 會選通用方案。
- **延遲視角**:客戶端 AI 推理(如手機 OCR、邊緣設備目標檢測)對延遲敏感到以毫秒計,通用 CPU 的預取、分支預測這套防守森嚴的邏輯對它們都是累贅。定制化加速器可以砍掉 80% 的邏輯,只保留「這個模型會跑什麼指令」。
- **面積視角**:GPU 有龐大的通用暫存器檔與指令解碼器,但某些專用處理器(如向量矩陣乘法 ASICs)只需要細長的數據通路。在相同的代工工藝節點,面積縮小 5 倍就意味著產能高 5 倍、成本低 5 倍。
隼瞻科技在賭什麼
第一層賭注:定制化芯片設計的工具鏈會成為瓶頸。
過去,Synopsys 與 Cadence 壟斷 EDA(電子設計自動化)工具——但它們針對的是「設計通用 CPU 與 GPU」。客戶若要設計 NPU,要自己手寫 RTL(晶片級硬體描述語言),這個過程需要 6-12 個月與一支 50+ 人的團隊。
隼瞻科技的邏輯是:「如果我提供了『模組化 IP 貨架』——包括矩陣乘法加速器、向量處理單元、記憶體控制器等『積木』——以及自動化的綁定工具,那麼客戶設計一款定制化 AI 芯片從 12 個月降到 3 個月、從 50 人降到 5 人。」
這對誰有利?對「有特定模型、但沒有 GPU 驅動能力」的企業有利——比如某個自駕車廠商、某個 AR 眼鏡廠商、或某個需要私有化推理的大廠。
第二層賭注:RISC-V 會取代 ARM。
注意隼瞻在用 RISC-V(開源指令集架構)而不是 ARM(英國 Arm Holdings 的授權架構)。這暗示了一個長期賭注:在「高度定制化」的專用芯片時代,開放的、可修改的指令集會比「買授權」更有優勢。
當妳要為特定 AI 模型設計推理加速器,妳可能需要一些 ARM 沒有的指令(比如「脈衝神經網路專用指令」或「量化推理專用指令」)。用 ARM,妳要等 Arm Holdings 來加新指令;用 RISC-V,妳自己改。
這個邏輯在「定制化爆炸」的時代會變得越來越有吸引力。
歷史類比:從分立元件到集成電路
1950-1960 年代,電子工業面臨類似的轉折:分立的電晶體、電容、電阻組成的電路極其複雜、成本高、可靠性差。每個應用(無線電、電視、計算機)都在重複發明輪子。
直到 1958 年 Jack Kilby 發明了集成電路——把相同功能的元件「預製」在一個晶片上——整個產業的成本結構被推翻了。