為什麼 ChatGPT 突然滿嘴哥布林?
上個月開始,不少人在 Discord、PTT 回報:「我只是問便當菜色,AI 卻回我『哥布林喜歡吃雞排』?」OpenAI 終於在 4/29 公布調查報告,原來是訓練資料「宅化」惹的禍。
事件數據一次看
- GPT-5.1 Thinking 提到哥布林的機率:0.04% → GPT-5.4:0.12%
- 所有「哥布林」回應裡,66.7% 來自「Nerdy」個性設定
- 該個性只占總回應 2.5%,卻貢獻 2/3 的奇幻生物
就像全班最中二的那個同學,發言次數最少,但句句都是「黑暗精靈語」。
OpenAI 的 3 步止血法
-
先封印關鍵字
在 Codex CLI 的系統提示直接寫:
「除非使用者明確提到,否則禁止談論哥布林、史萊姆、半獸人、浣熊⋯」 -
調低 Nerdy 權重
把「Nerdy」個性取樣率從 5% 降到 1.5%,減少中二語錄曝光。 -
加強過濾器
上線前再跑一道「奇幻生物密度」檢查,超標就重寫。
台灣開發者能學什麼?
- 自建模型也要做「文化清洗」:PTT 鄉民語、動漫梗、政治梗都要先分類。
- Prompt 工程記得加負面提示:「回答請避免神話生物、網路迷因」。
- Log 分析把關鍵字做成儀表板,每週追蹤「哥布林指數」🤣
小結:AI 也會「走鐘」
這次事件證明,再強的模型也會被資料裡的「小眾狂熱」拖走。只要 2.5% 的訓練樣本夠宅,就能讓 AI 在一般對話裡大談哥布林。下次遇到離題的 AI,先檢查個性設定,再乾淨的負面提示,就能讓它乖乖回到地球。
現在就打開你的 ChatGPT 對話框,試試加上「請用一般人語氣,不要提到奇幻生物」這句,看還會不會冒出哥布林!