事件
1980 年代,計算機科學家 Robert Axelrod 舉辦了一場電腦競賽,邀請全球數學家、經濟學家、生物學家提交各自設計的「囚徒困境策略」。參賽者預期會看到複雜的機器學習演算法、多步預測邏輯、甚至是隨機化欺騙。結果卻大出所有人意料:冠軍是一個只有 4 行程式碼的策略——「以牙還牙」(Tit-for-Tat)。
這個策略的規則極其簡單: - 第一回合,選擇合作 - 之後每一回合,完全複製對方上一步的行動 - 若對方合作,你就合作;若對方背叛,你就背叛
它打敗了所有試圖透過欺騙、威脅、隨機混淆來獲勝的策略。
為什麼簡單反而最強?
### 1. 善意的信號(Nice) 以牙還牙永遠率先示好。它從合作開始,表明自己不是掠食者。這消除了對方的戒心,創造了互惠的基礎。在充滿不確定性的互動中,主動示弱是建立信任的第一步。
### 2. 即時的懲罰(Retaliating) 一旦被背叛,以牙還牙立刻回擊。沒有延遲、沒有寬恕的模糊地帶。這種確定性的懲罰機制讓對方明白:背叛會有代價,而且是等量的代價。
### 3. 迅速的寬恕(Forgiving) 關鍵在於,以牙還牙並不是「一次背叛、永遠敵對」。只要對方在下一回合重新合作,策略也立刻恢復合作。這打破了報復的無限循環,給予對方改正的機會。
### 4. 透明的邏輯(Clear) 對方能瞬間看穿你的策略——你的行為完全可預測。這種透明性反而是優勢:對方知道欺騙你沒有額外好處(因為你會立刻報復),也知道與你合作能獲得穩定收益。
應用場景
這不是抽象的遊戲論,而是日常互動的寫照: - 商業談判:一方違約,你立刻暫停合作;對方認錯後,馬上恢復往來 - 婚姻關係:一方冷淡,另一方回應冷淡;重新示好,感情升溫 - 國際外交:國家間的制裁與談判就是以牙還牙的變體 - 職場人際:同事若背後捅刀,你下次協作時保持距離;他示好時,你也回應
致命的陷阱
以牙還牙並非完美。它最大的弱點是: - 對稱性盲點:若雙方都一時背叛(或都誤解了對方的動作),會陷入互相報復的無限迴圈 - 第一擊劣勢:在短期對局中,第一回合的「先合作」可能被無情利用 - 無法對付複數敵手:當你同時面對多個對手時,一一鏡像複製可能導致協調崩潰
深層邏輯
以牙還牙之所以強,本質上是因為它解決了「如何在互動中建立秩序」的問題。在沒有中央權力的系統中(無政府狀態的國家、沒有仲裁的商業夥伴、沒有規則的市場),唯一穩定的均衡就是:我的行為以你的行為為鏡像。這使得雙方都無法透過欺騙獲益,反而被迫走向合作。