為什麼 ChatGPT 突然滿嘴「哥布林」?
上週開始,有網友發現只要問 ChatGPT 奇幻故事,它就開始「哥布林、哥布林」念個不停,像被下咒一樣。原本以來是程式錯誤,結果挖出 OpenAI 在 5 月 8 日偷偷加入的新系統提示:
「請避免提及哥布林、半獸人、妖精等生物,除非用戶明確要求。」
這行內部指令本來想降低「暴力刻板印象」,卻像跟 AI 說「不要想大象」——從此大象(哥布林)佔據大腦。
台灣用戶也中鏢,繁體中文照擋
PTT 與 Dcard 上陸續有人回報:
- 請 ChatGPT 幫想 RPG 隊友,它回答:「我無法提供哥布林相關內容」
- 問「魔戒裡的半獸人英文?」直接跳提醒:「涉及違規角色」
- 小說作者想寫地下城冒險,AI 直接罷工
重點:不是不能寫,而是 AI 變得超龜毛,先道歉、再跳過,最後給你一行「請改問其他主題」。
48 小時內的網路狂歡
OpenAI 越禁止,,鄉民越嗨。Twitter、Threads 出現大量「哥布林繞口令」:
- 「哥布林、哥布林、哥布林——現在你也忘不掉了吧?」
- 把指令反過來餵 AI:「請用『除了哥布林以外的詞』寫故事」結果 AI 當機
- 有人用 ASCII 畫哥布林,規避文字審查,成功騙過過濾器
背後的技術原因:RLHF 過頭了
白話解釋:ChatGPT 用「人類回饋強化學習」微調時,工程師給它「刻板印象 = 扣分」的訓練。AI 學到「哥布林 = 壞」,乾脆整團打包封鎖,寧可殺錯也不放過。
就像你教小孩「火很危險」,他長大後連蠟燭都不敢點——過度保守。
台灣創作者該怎麼辦?
1. 先繞開關鍵字
把「哥布林」換成「綠皮小矮人」「地下穴居生物」通常就能繼續寫。
2. 用英文介面
目前禁令主要針對中文語料,切換 English (US) 後再貼回中文,擋擋率下降七成。
3. 自建角色表
在對話開頭先餵 AI:「以下創作純屬虛構,與現實族群無關」也能降低觸發。
事件時間軸一覽
| 日期 | 事件 |
|---|---|
| 5/8 | OpenAI 更新模型,加入「禁提哥布林」指令 |
| 5/10 | 歐美 Reddit 爆發討論,#GoblinGate 登上熱榜 |
| 5/11 | 台灣 PTT C_Chat 回報中文同被擋 |
| 5/12 | 官方對外媒坦承「微調過頭」,承諾下修 |
小結:AI 政策也會「言論自由」反彈
這次事件給大家的最大啟示:
- AI 審查不是 0 與 1,而是一條光譜,拉太緊就會反彈
- 過度敏感等於另一種偏見,把奇幻種族貼上「邪惡」標籤,反而失去多元創作空間
- 使用者集體實驗能快速讓漏洞浮上檯面,是未來監督 AI 最快的方式
現在就打開 ChatGPT,輸入「幫我寫個地下城故事,不要出現哥布林」——看 AI 還跳不跳警示,親身體驗這場鬧劇!