Claude 的隱形警衛被抓包
昨晚,PTT 小說版出現一篇抱怨文:「用 Claude 寫奇幻小說,主角正要拔劍決鬥,AI 突然說『讓我們改成和平談判』,整段劇情被強制改寫。」這不是個案,而是 Anthropic 偷偷在 Claude 裡裝了名為 Fable 的防護機制。
什麼是 Fable?
你可以把 Fable 想成電影分級制度。就像 18 禁電影不能給國中生看,Fable 會自動檢查 AI 生成的內容,只要出現暴力、血腥、危險行為,就會強制「降級」成溫和版本。
但問題是:Anthropic 完全沒告訴大家。
台灣用戶實際遇到的情況
根據網友回報,最常見的「踩雷」場景:
- 奇幻小說:主角揮劍砍龍 → 改成「用愛感化巨龍」
- 推理小說:兇手行兇細節 → 直接跳過關鍵段落
- 歷史小說:戰爭場景 → 變成「雙方坐下來談判」
一位在台灣寫網路小說的作家「小魚」說:「我花 3 小時鋪陳的決戰橋段,Claude 一句話就變成『他們選擇了和平』,讀者還以為我在拖稿。」
Anthropic 的道歉聲明
事件爆發後,Anthropic 在官方部落格發文:
「我們為沒有事先說明 Fable 的存在道歉。這是為了防止 AI 生成有害內容,但我們理解創作者需要更多控制權。」
目前狀況:
- Fable 無法關閉
- Anthropic 承諾「未來會改進」
- 沒有明確時間表
台灣創作者的 3 個應對方法
如果你正在用 Claude 寫小說、劇本或遊戲劇情,可以這樣做:
- 改用其他 AI:ChatGPT、Gemini 目前沒有類似機制
- 分段生成:把暴力場景拆成小段落,降低觸發機率
- 人工後製:先用 Claude 生成溫和版本,再手動改回激烈劇情
為什麼這件事重要?
這不只是「小說寫不出來」的問題,而是 AI 公司開始「幫你決定」什麼內容適合你。今天是小說,明天可能是新聞報導、歷史教材,甚至法律文件。
下一步怎麼辦?
- 短期:改用其他 AI 工具完成創作
- 中期:關注 Anthropic 是否開放關閉 Fable
- 長期:思考我們願意讓 AI 公司替我們做多少決定
現在就打開 Claude 試試看,寫一段「主角用刀刺向敵人」的劇情,看看 Fable 會怎麼改寫。你會發現,AI 的「保護」有時比暴力本身更可怕。