觸覺感測器出貨第一名背後：具身智能的數據飛輪剛剛啟動

當人形機器人從舞台走進工廠，採集一次優質觸覺數據的成本可能超過訓練一個大語言模型——但誰先建起『現實世界操作數據庫』，誰就贏了下一個十年。

本篇 atom

數據飛輪中的物理世界模型(Physical World Model in Data Flywheel)

當機器需要在物理世界執行精細操作時，決定其競爭力的不是單次算法優化，而是能否持續採集、標註、迭代包含觸覺、視覺、力反饋的多模態交互數據——形成從真實場景 → 數據 → 模型改進 → 更好操作 → 更多高質量數據的自強化循環。這個循環的起點是『具身』（embodied）——機器必須真正在物理世界幹活，才能產生有價值的數據。

提出者：現代具身智能研究（分散式理論，無單一提案者） (2020)

具身智能產業的資料準備度曲線：從演算法優化時代→資料籌集時代→飛輪自強化時代

推理鏈 · DNA chain

06 STEPS

原則 · 本篇核心

當技術滲透達到一定深度時，競爭力源泉會從『工程優化』轉向『稀缺資源壟斷』——具身智能的稀缺資源是『真實物理互動的高品質軌跡數據』

▸ 展開完整 6 步推理鏈（事件 → 觀察 → 模式 → 原則 → 應用 → 反例）

事件
戴盟機器人獲億元融資、宣布打造『超大規模物理交互數據集』，觸覺傳感器出貨量行業第一
觀察
融資聲明特別強調『真實物理場景下的數據飛輪與商業閉環』——不是做單個模型、而是建造一個循環系統
模式
具身智能的瓶頸從『演算法能力』轉變成『物理世界資料獲取』——這是一次賽道重新定義
原則
當技術滲透達到一定深度時，競爭力源泉會從『工程優化』轉向『稀缺資源壟斷』——具身智能的稀缺資源是『真實物理互動的高品質軌跡數據』
其他應用
石油時代的勝者是控制油田的國家、晶片時代的勝者是控制製程的台積電、具身智能時代的勝者會是控制『機器人真實操作軌跡數據庫』的公司
反例 / 限制
關鍵反例：OpenAI 沒有控制互聯網資料源、仍靠強大演算法和計算壓倒一切；AWS 時代資料民主化反而成為商業標準。資料飛輪需要長期投資、短期內演算法進展更快。

Multilateral lens

從不同板塊看這篇

Atomly 自動判斷這篇文章跟哪些 mental model 板塊相關、各從一個 lens 拆解。同一件事、不同視角。

觀察

具身智能的真實瓶頸是『sim-to-real gap』——模擬器永遠跟不上現實中微觀摩擦、材料非線性、感測器雜訊；只有真實機器在現場才能採到有價值的資料。

原則

通用 AI 的下一個邊界不在『算力』或『參數量』，而在『物理世界多模態資料的規模與品質』——訓練集的完整性決定泛化能力。

行動

評估具身公司時，追蹤他們能採集到多少『獨特的、無法被競爭對手復製的物理場景軌跡』，而非只看演示影片。

深入「AI/科技」板塊 →

出處：深圳具身公司获得汇川、中国电信亿元融资，“视触觉”传感器出货量行业第一｜硬氪首发 · 36氪 · 2026-06-04T01:30:00+00:00

#具身智能#機器人#物理世界模型#資料飛輪#多模態#工業自動化#融資

事件背景

深圳具身公司戴盟機器人近日獲得汇川、中国电信的億元 A 輪融資。新聞的關鍵不在融資額，而在融資聲明中的一句話：「打造超大規模含物理交互信息數據集，加速物理世界模型研發、並驅動真實物理場景下的數據飛輪與商業閉環。」

這句話揭示了具身智能競爭的真實戰場——不是誰的機械臂轉速更快，而是誰能把物理世界的複雜性「餵進」AI 模型。

為什麼觸覺資料成為瓶頸

過去十年，計算機視覺（CV）通過互聯網海量圖像實現了突破：ImageNet 有 1400 萬張標註圖片，COCO 有 330 萬張帶標籤照片。但物理交互資料完全不同：

**獲取成本高**：需要真實機器人在現場採集，不能靠爬蟲
**標註困難**：一次抓取物體的力學資訊（3D 力、扭力、接觸點）無法自動標註
**場景多樣性**：同一個「抓筷子」的動作，材質、濕度、老化程度都會改變觸覺反饋
**硬體差異大**：不同品牌的觸覺感測器輸出格式差異巨大

結果是：2023 年時、全球公開的機器人操作資料集總共不超過 10 萬條軌跡，而最先進的視覺模型已經用 10 億級別的圖片訓練了。

「具身」是為什麼必要

有個細節很容易被忽視：為什麼不能用模擬器（simulator）生成無限的訓練資料？

Google DeepMind 在 2023 年的研究發現，在完美物理模擬器中訓練的機器人政策，遷移到真實機器人時會失效——這叫「仿真-真實落差」（sim-to-real gap）。關鍵原因是：模擬器無法準確建模材料非線性、傳感器雜訊、摩擦力的微觀波動。

換句話說，數學上「更優」的模型對物理世界的預測能力反而更差。機器只有在真實環境中試錯，才能學到那些被模擬器忽略但真實存在的交互規律。

這就是為什麼戴盟要投資「採集高質量物理交互數據」——他們在宣布一個賭注：未來 3-5 年，具身智能的競爭力排序會變成

1. 誰有最多高質量機器人操作軌跡 → 能訓練最魯棒的世界模型 2. 誰能最快將模型部署回真實機器人 → 產生更多新資料 3. 誰能實現商業閉環（機器在真實場景賺錢 → 數據回流 → 模型改進 → 機器效率上升 → 賺更多錢）

為什麼是「視觸覺傳感器」

新聞提到戴盟的「視觸覺傳感器出貨量行業第一」。這不是一個硬體驕傲，而是數據競爭力的代理指標：

每賣出一個傳感器，就多了一台機器在外面採集標準化的觸覺資料
標準化意味著所有機器的觸覺資訊能統一處理、清洗、用於訓練
這比 Boston Dynamics 的專有機器人對戴盟來說更有價值——後者每台機器都是孤島，資料無法共享

這是個微妙的反轉：硬體公司通常掙扎於邊際毛利，但戴盟把傳感器當作「數據蒐集網絡」——每台機器都是一個數據節點，回傳觸覺資訊到中央訓練池。

數據飛輪的臨界點

為什麼現在融資？為什麼要「超大規模」數據集？

機器學習有個已知現象：在達到某個臨界資料量之前，投入再多計算也很難看到突破。語言模型領域的臨界點大約在 10 億 token；視覺模型大約在 3 億圖片；而機器人操作的臨界點還沒被確定，但業界共識大約在「百萬級軌跡」。

戴盟宣稱要打造「超大規模」數據集、獲得汇川和电信的投資——這表示他們在賭：

1. 電信 → 網路基礎設施：機器人的資料傳輸、遠端操控需要極低延遲 2. 汇川 → 工業客戶網絡：機器人要部署在真實工廠，而汇川已有工業自動化客戶基礎

換句話說，他們不是在做一個孤立的 AI 公司，而是在建造一個——機器人分散在數千個工廠，所有觸覺資訊彙聚回來、訓練中央模型、再分發最新政策給所有機器。

Counter View · Munger Inversion

1
「物理世界資料雖然稀缺，但突破性演算法（如多尺度世界模型）可用少量資料達到質的飛躍，無需『超大規模』」
— DeepMind 2024 研究立場
2
「Transformer 架構對物理資料的轉移能力遠超預期，開源社群共享資料池比企業私密資料庫效率更高」
— 機器人開源社群共識
3
「硬體壟斷（傳感器出貨第一）容易被標準化打破；即使沒有專有傳感器，通用視覺 + 力感測也足夠」
— 傳統機械人公司觀點

如果物理世界的資料『足夠民主化』（開源資料集、模擬器改進、標準化感測），具身智能還需要專有的『數據飛輪壟斷』嗎？或者會變回『誰的演算法最聰明誰就贏』的時代？

▶ 參考來源 (4)

paperClosing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experience — OpenAI et al. (2019)
paperRT-1: Robotics Transformer for Real-World Control at Scale — Google DeepMind (2022)
bookThe Second Machine Age — Brynjolfsson & McAfee (2014)
paperEmbodied Intelligence via Learning and Evolution — UC Berkeley (2023)

今日練習跨域遷移· 想另一個領域的例子

登入收藏

想一個妳所在的產業或熟悉的領域，過去 2 年內有沒有出現『資料稀缺 → 規模化採集啟動 → 邊際成本急速下降』的案例？描述它發生在哪個環節、企業如何跨越了『冷啟動』階段、目前飛輪轉得有多快。

💡 把這個練習帶到一天裡 — 下次走在路上、看新聞、跟人聊天時、想想能怎麼套用這個原則。

第 957/1000