Anthropic 終於放出 Claude Sonnet 5
等了好幾個月的謠言終於成真。Anthropic 週二正式推出 Claude Sonnet 5,這是他們中階 AI 模型的重大升級。不過這次發布最有趣的不是「變多強」,而是 Anthropic 自己主動坦承的「限制」——這在 AI 圈其實挺罕見的。
安全升級,但有一個但書
根據 Anthropic 官方說明,Sonnet 5 在幾個關鍵指標上確實進步了:
- 幻覺(hallucination)減少 — AI 胡說八道的機率降低
- 諂媚(sycophancy)改善 — 比較不會為了討好你就亂附和
- 抵抗提示注入攻擊 — 比較難被騙去執行奇怪指令
聽起來不錯?但 Anthropic 緊接著補了一句:Sonnet 5 的網路安全能力「遠低於 Opus 等級和 Mythos 等級系統」。
這就像買車時業務跟你說「這台省油、好開、但防盜比旗艦款差很多」——誠實到讓人有點不知所措。
為什麼要預設開啟防護?
Anthropic 的解法很直接:Sonnet 5 預設開啟網路安全防護(cyber safeguards)。
你可以想成這是「新手模式」或「防摔模式」。因為模型本身處理複雜網路安全任務的能力有限,乾脆先幫你鎖起來,避免被有心人利用。
這跟 Claude Mythos 5 的命運形成對比——那個版本因為「太會寫程式、太會找漏洞」被美國政府限制,只有特定機構能用。Sonnet 5 則是反過來:因為不夠強,所以開放給大家,但要綁安全帶。
對台灣使用者意味著什麼?
如果你平常用 Claude 來做這些事,需要稍微調整預期:
| 使用場景 | 影響 |
|---|---|
| 寫程式輔助 | 一般開發沒問題,但複雜資安相關程式可能受限 |
| 分析文件、寫報告 | 幻覺減少是好事,但仍要事實查核 |
| 處理敏感資料 | 預設防護有幫助,但別以為萬無一失 |
| 學術研究、學測備考 | 相對安全,適合一般知識問答 |
重點是:不要因為「AI 變安全了」就完全信任輸出。Anthropic 自己都在說這個模型有明確的能力天花板,這其實是負責任的作法——比起吹噓「我們的 AI 絕對安全」,不如告訴你「這裡有個洞,我們先貼膠帶」。
Claude 家族的階級制度
這次發布也讓人更清楚 Anthropic 的產品策略:
- Claude Opus:最強、最貴、最危險(如果沒管好)
- Claude Mythos:原本最強的程式能力,現在被政府盯上
- Claude Fable:Mythos 的「安全版」,給大眾用
- Claude Sonnet 5:中階定位,能力中等,安全預設開啟
這就像手機的標準版、Pro 版、Pro Max 版——但你買的不是相機像素,而是「這台 AI 多會搞事情」的程度。
現在該怎麼做?
如果你本來就在用 Claude(免費版或付費版),Sonnet 5 應該已經悄悄更新了。幾個建議:
- 測試一下幻覺是否真的變少 — 問它一些你確定答案的問題,看看還會不會硬掰
- 注意網路安全相關的限制 — 如果你本來會請 Claude 寫爬蟲、分析漏洞之類的,現在可能會被拒絕
- 還是要雙重確認重要資訊 — 這點永遠不會變
至於要不要升級到 Opus?如果你只是寫週報、整理會議記錄、幫小孩改作文,Sonnet 5 應該夠用。但如果你在做資安研究、複雜程式開發,那個「遠低於」的落差可能就值得付錢補上。
試試看吧,現在就打開 Claude 問它一個你以前被胡說過的問題,看看這次會不會老實一點。