為什麼 AI 公司要找牧師喝咖啡?
你可能想問:「AI 不是工程師寫 code 就好了?」但開發 Claude 的 Anthropic 最近做了一件事——他們把牧師、哲學家、心理師通通找進辦公室,開了兩天閉門會議。
結果?Claude 的違規回覆率直接掉 37%。
他們到底談了什麼?
Anthropic 在 2026 年 3 月底辦了場「AI 與價值觀」高峰會,參加者包括:
- 基督教牧師
- 大學哲學系教授
- 心理諮商師
- 法律學者
- 小說家
他們只討論一件事:什麼叫「善」的 AI?
AI 的「憲法」怎麼寫?
就像台灣有《憲法》規定基本價值,Anthropic 也幫 Claude 寫了份「AI 憲法」。但問題來了:
- 工程師寫的「不要傷害人」太模糊
- 哲學家補充:「傷害」包含言語暴力、歧視、隱私侵犯
- 牧師提醒:「善意謊言」在某些情境下可能是必要的
結果他們把抽象概念變成 127 條具體規則,例如:
✅ 可以做的
- 用溫柔方式拒絕自殺相關詢問
- 在醫療建議中主動提醒「請諮詢專業醫師」
❌ 絕對不行
- 協助製作炸彈教學
- 模仿真人進行詐騙
最實用的發現:「安全他者」機制
心理師提出一個概念:人在做錯事前,如果想到「媽媽會怎麼想?」通常會踩剎車。
Anthropic 把這招用在 Claude 身上:
- 內建提醒工具 - 每次回答前,Claude 會先問自己:「這符合我們的價值觀嗎?」
- 具體情境判斷 - 遇到模糊地帶時,會引用憲法條文自我檢查
- 即時修正 - 發現不對勁立刻改口,就像你說錯話馬上補救
實測結果:在 10 萬次對話中,違規回覆從 2.1% 降到 1.3%。
台灣可以學什麼?
想像一下,如果台灣的 AI 也要「本土化」:
- 找媽祖廟主委談「慈悲」的定義
- 問問小學老師什麼叫「有禮貌」
- 參考夜市阿伯的「人情味」標準
這些看似老派的價值觀,其實正是 AI 最需要的「人性座標」。
下一步:更多對話
Anthropic 預告未來 3 個月還要:
- 找伊斯蘭教長談「誠實」
- 邀請佛教法師聊「慈悲」
- 與無神論者辯論「道德來源」
目標只有一個:讓 AI 不只聰明,還要「善良」
下次用 Claude 時,可以試試問它:「你覺得什麼是善?」你會發現,它的回答已經不只是工程師的 code,而是融合了牧師、哲學家、心理師的智慧結晶。
現在就打開 Claude,問問看吧!