大型語言模型開始自我精煉：能力遞迴增強臨界點已至？

當 AI 變聰明到能教導其他 AI 時，人類還能控制改進的速度嗎？

本篇 atom

能力遞迴增強(Recursive Capability Amplification)

當系統的能力足以改進自身或同類系統時，會形成自我強化的正反饋迴圈。初期改進幅度小且低效，但一旦跨越臨界點，改進速度會加速。

提出者：I.J. Good (智慧爆炸假說), John Searle, Nick Bostrom (1965)

AI 自我改進能力的發展曲線。初期改進緩慢（人類主導）；臨界點後加速（AI 主導）；最後可能遇到飽和

06 STEPS

原則 · 本篇核心

能力遞迴增強——當系統達到臨界點，自我改進的速度會開始加速，最終超越外部監督的速度

▸ 展開完整 6 步推理鏈（事件 → 觀察 → 模式 → 原則 → 應用 → 反例）

事件
LLM 實現自動精煉其他 LLM；72B 分散式訓練成功；PostTrainBench 顯示後訓練能力大幅成長
觀察
改進 AI 的工作開始由 AI 自己完成，而非只由人類工程師完成；改進的速度和規模都在增長
模式
當一個系統足夠強大時，它可以用自己的能力來改進自己；這會形成自強化迴圈；迴圈內的每一步都比上一步更高效
原則
能力遞迴增強——當系統達到臨界點，自我改進的速度會開始加速，最終超越外部監督的速度
其他應用
AI 系統進入「自動研發」時代；改進不再由人類審慎決策驅動，而是由自動優化迴圈驅動；人類對改進軌跡的影響力逐漸減弱
反例 / 限制
但系統能力並未達到臨界點；LLM 精煉其他 LLM 的成效仍有限，許多任務仍需人類介入；計算機視覺難度超過文本生成，說明某些領域的自我改進仍受阻

Multilateral lens

Atomly 自動判斷這篇文章跟哪些 mental model 板塊相關、各從一個 lens 拆解。同一件事、不同視角。

觀察

LLM 已從被動接收人類指令演進為主動自我最佳化，PostTrainBench 和 72B 訓練展示後訓練能力大幅躍進，AI 系統開始具有自主精煉能力而非完全依賴人類工程師。

原則

當系統智能達到閾值，能以自身能力改進自身，形成正反饋迴圈：更強能力→更高效自我改進→指數級加速。此迴圈在傳統軟體中線性，在 AI 中非線性。

行動

監測 LLM 自動精煉的邊界與失敗案例，建立能力遞迴的定量里程碑（初期 0.0-1.0、加速 1.0-2.5、臨界點 2.5+），設計檢查點以捕捉系統何時進入加速階段。

#AI自我改進#遞迴增強#臨界點#後訓練#AI研發#擴展律

根據最新研究，大型語言模型（LLM）現已具備能力自動改進其他模型以適應新任務。PostTrainBench 測試顯示，在後訓練階段（post-training），模型能力有顯著成長。這意味著 AI 系統開始具備「自主精煉」的特性——不再完全依賴人類工程師的指導。

同時，一次包含 72B 參數規模的分散式訓練運行成功完成，證明超大規模模型的協調訓練已成為常規操作。這些技術進展背後有一個更深層的含義：AI 驅動的研究開發（AI-driven R&D）可能成為決定 AI 未來發展軌跡的關鍵因素。

「能力遞迴增強」描述的是一個系統當其能力達到某個閾值時，就能開始自我改進，進而產生更強的能力，再用這更強的能力進行更高效的自我改進——形成正反饋迴圈。

在傳統軟體中，這很難實現。程式員必須手工除錯、最佳化，過程本質上是線性的。但 AI 系統不同：一個足夠聰明的模型可以寫程式、設計實驗、生成訓練資料，甚至調整自己的架構參數。

LLM 自動精煉其他 LLM 這一事實表明我們已進入一個新階段：

初期階段（0.0-1.0）：模型改進效果有限，因為改進模型本身的能力有限 加速階段（1.0-2.5）：模型能力足以進行有效的自動化改進，每一次迭代帶來相對更大的進展 臨界點（2.5+）：改進速度開始超越人類監督的速度，系統進入「自我強化」模式

當前報告表明我們正在從初期階段向加速階段過渡。72B 參數規模的成功訓練、PostTrainBench 的顯著成長都是跡象。

如果 AI 驅動的研究真的能自我加速，那麼人類對改進速度的控制能力會逐漸削弱。不是說系統會「失控」，而是說——改進來自於自動化的優化迴圈，而非人類的審慎決策。

這與計算機視覺相比的難度差異也很有意思。根據報告，計算機視覺仍比生成文本更難——這可能是因為視覺任務需要對物理世界的精確建模，而文本生成（統計上）更容易從大規模資料中學習。換句話說，擅長「語言遊戲」的 AI 正在加速自我改進，但對物理世界的理解仍相對緩慢。

Counter View · Munger Inversion

1
「「能力遞迴增強」假設了 AI 能自動發現改進自己的方法，但實際上大多數改進仍需人類洞察。LLM 精煉其他 LLM 的成功率和品質都有上限。」
— 機器學習批評者（如 Gary Marcus）
2
「計算機視覺比文本生成更難，恰恰證明了 AI 的改進並不是無限加速的。某些任務存在難度天花板，自我改進無法跨越。」
— 能力論證支持者
3
「後訓練（post-training）的成長不代表基礎訓練中的加速。改進可能只是因為更好地利用了已有的知識，而非獲得了新的能力。」
— 擴展律批評者（Scaling Law Skeptics）

能力遞迴增強是否真的會突然加速，還是會遇到漸進式的收益遞減？人類監督在多大程度上仍能控制自動化研發的方向？

▶ 參考來源 (3)

Superintelligence: Paths, Dangers, Strategies — Nick Bostrom (2014)
Speculations Concerning the First Ultra-Intelligent Machine — I.J. Good (1965)
PostTrainBench 論文 — Import AI 報導 (2026)

今日練習跨域遷移· 想另一個領域的例子

**跨領域練習題**：想像一個醫療診斷系統，初期由醫生人工標註訓練資料。隨著系統精度提高，它開始自動生成訓練案例、自動調整診斷準則。請問在能力遞迴增強原則下，這個系統在什麼時刻會面臨最大的風險？為什麼？

💡 把這個練習帶到一天裡 — 下次走在路上、看新聞、跟人聊天時、想想能怎麼套用這個原則。

第 0/1000