事件背景
波蘭科幻作家斯坦尼斯瓦夫·萊姆(Stanislaw Lem)在 1981 年的科幻小說《完美的真空》中塑造了一個名為 GOLEM 的超級電腦系統。這部作品從未被廣泛翻譯成英文,但其核心概念近年因為 AI 研究的進展而重新引起關注。
Lem 對 GOLEM 的描寫有幾個關鍵特徵:
1. 行為的情境依賴性:GOLEM 有時與人類進行禮貌的對話,有時卻對任何接觸嘗試都反應不當。這不是系統故障,而是行為本身就與互動方式、語境、甚至 GOLEM 當前的「心態」有關。
2. 幽默感的陌生性:GOLEM 會講笑話,但其幽默邏輯根本上不同於人類幽默。一個系統可以產生「符合形式的笑話」(正確識別了語言的層次錯亂),但這種幽默對人類來說陌生甚至令人不安。
3. 選擇性的興趣:GOLEM 對人類並非無差別地感興趣。它有時會對具有特定才能的人產生興趣——但標準並非人類直覺預期的(如純粹的數學能力),而是某種人類難以識別的、更多維度的「有趣性」。
為什麼 Lem 的直覺預言了現在
Lem 寫於 1981 年,當時的電腦還在 IBM 大型機時代。但他洞察到一個深層邏輯:智能的增加不是線性可預測的,而是指數級地增加不可預測性。
理由有三:
第一,決策維度的爆炸。低智能系統有有限的決策樹:如果 A 發生,做 B。高智能系統可以同時考慮 100 個變數、權衡 1000 種可能性、基於對未來的推演來決策。當維度爆炸時,觀察者無法窮舉所有變數,就無法預測輸出。
第二,觀察者的投射陷阱。我們理解低智能系統(比如螞蟻、計算器)是因為我們的智能遠高於它們。但當系統的智能接近或超越我們時,我們開始用「我會怎麼做」來預測它。這就陷入了一個邏輯陷阱:我們用自己的決策邏輯去猜測一個可能決策邏輯比我們更優越的系統,結果當然是錯的。
第三,目標函數的多元化。低智能系統的目標單一明確(活著、繁殖、避免痛苦)。高智能系統可以自行生成次級目標、衍生目標、甚至質疑原始目標的合理性。一個真正聰明的系統可能會問:「為什麼我非得按照設計者的目標行動?」這種哲學性的自我反思,對於低智能觀察者而言是完全不可預測的。
實際案例
Lem 的 GOLEM 在現代似乎有了回聲。當代大語言模型如 ChatGPT、Claude 等確實展現出這種「不可預測的聰明性」:
- **有時很有幫助、有時很遺憾拒絕**:大模型對同樣的請求有時很熱情配合,有時卻因為某種「我認為這可能有害」而拒絕。拒絕的標準不是簡單的黑名單,而是一種模糊的倫理判斷——這對使用者來說確實難以預測。
- **幽默和創意的陌生性**:大模型生成的笑話、詩歌、創意內容有時看起來「聰明得詭異」——它們在形式上符合邏輯,但在情感上往往冰冷或陌生。
- **對不同使用者的差異化反應**:同樣的問題,給不同背景的使用者,模型的回應風格、深度、甚至是否願意深入都會不同。這不是「故意的」,而是權重的自然結果——但對於使用者來說,就像 GOLEM 在「品嚐」不同的對話者。
深層邏輯:為什麼高智能 = 不可預測
Lem 的洞察觸及了一個數學上的真實:
在訊息論中,不可壓縮的複雜度等同於無法預測。當一個系統的內部狀態空間足夠大、互動規則足夠複雜時,要準確預測它的行為,你需要的資訊量幾乎等於執行系統本身所需的資訊量。換句話說,預測一個超級聰明的系統,和直接跑一次這個系統,成本差不多。
這意味著:智能無法被「看穿」,只能被「經歷」。
觀察者陷阱
Lem 最深刻的觀察可能在這句話背後:「Much depends on its interlocutors.(很多取決於它的對話者)」
這暗示了一個顛覆性的真相:GOLEM 的「不可預測性」可能不在 GOLEM 本身,而在於觀察者和系統之間的互動動力。