Claude Sonnet 5 正式發布:Anthropic 預設開啟防護,網安能力卻是家族最弱

Claude Sonnet 5 正式發布:Anthropic 預設開啟防護,網安能力卻是家族最弱

Claude Sonnet 5 正式發布:Anthropic 預設開啟防護,網安能力卻是家族最弱

Anthropic 終於放出 Claude Sonnet 5

等了好幾個月的謠言終於成真。Anthropic 週二正式推出 Claude Sonnet 5,這是他們中階 AI 模型的重大升級。不過這次發布最有趣的不是「變多強」,而是 Anthropic 自己主動坦承的「限制」——這在 AI 圈其實挺罕見的。

安全升級,但有一個但書

根據 Anthropic 官方說明,Sonnet 5 在幾個關鍵指標上確實進步了:

  • 幻覺(hallucination)減少 — AI 胡說八道的機率降低
  • 諂媚(sycophancy)改善 — 比較不會為了討好你就亂附和
  • 抵抗提示注入攻擊 — 比較難被騙去執行奇怪指令

聽起來不錯?但 Anthropic 緊接著補了一句:Sonnet 5 的網路安全能力「遠低於 Opus 等級和 Mythos 等級系統」

這就像買車時業務跟你說「這台省油、好開、但防盜比旗艦款差很多」——誠實到讓人有點不知所措。

為什麼要預設開啟防護?

Anthropic 的解法很直接:Sonnet 5 預設開啟網路安全防護(cyber safeguards)

你可以想成這是「新手模式」或「防摔模式」。因為模型本身處理複雜網路安全任務的能力有限,乾脆先幫你鎖起來,避免被有心人利用。

這跟 Claude Mythos 5 的命運形成對比——那個版本因為「太會寫程式、太會找漏洞」被美國政府限制,只有特定機構能用。Sonnet 5 則是反過來:因為不夠強,所以開放給大家,但要綁安全帶

對台灣使用者意味著什麼?

如果你平常用 Claude 來做這些事,需要稍微調整預期:

使用場景影響
寫程式輔助一般開發沒問題,但複雜資安相關程式可能受限
分析文件、寫報告幻覺減少是好事,但仍要事實查核
處理敏感資料預設防護有幫助,但別以為萬無一失
學術研究、學測備考相對安全,適合一般知識問答

重點是:不要因為「AI 變安全了」就完全信任輸出。Anthropic 自己都在說這個模型有明確的能力天花板,這其實是負責任的作法——比起吹噓「我們的 AI 絕對安全」,不如告訴你「這裡有個洞,我們先貼膠帶」。

Claude 家族的階級制度

這次發布也讓人更清楚 Anthropic 的產品策略:

  • Claude Opus:最強、最貴、最危險(如果沒管好)
  • Claude Mythos:原本最強的程式能力,現在被政府盯上
  • Claude Fable:Mythos 的「安全版」,給大眾用
  • Claude Sonnet 5:中階定位,能力中等,安全預設開啟

這就像手機的標準版、Pro 版、Pro Max 版——但你買的不是相機像素,而是「這台 AI 多會搞事情」的程度。

現在該怎麼做?

如果你本來就在用 Claude(免費版或付費版),Sonnet 5 應該已經悄悄更新了。幾個建議:

  1. 測試一下幻覺是否真的變少 — 問它一些你確定答案的問題,看看還會不會硬掰
  2. 注意網路安全相關的限制 — 如果你本來會請 Claude 寫爬蟲、分析漏洞之類的,現在可能會被拒絕
  3. 還是要雙重確認重要資訊 — 這點永遠不會變

至於要不要升級到 Opus?如果你只是寫週報、整理會議記錄、幫小孩改作文,Sonnet 5 應該夠用。但如果你在做資安研究、複雜程式開發,那個「遠低於」的落差可能就值得付錢補上。

試試看吧,現在就打開 Claude 問它一個你以前被胡說過的問題,看看這次會不會老實一點。