為什麼你突然覺得 Claude 變貴?
只是上個洗手間回來,同一段程式碋重新問一次,帳單竟多跳 0.3 美元(約 10 台幣)。別懷疑,Anthropic 在 3 月 6 日把 Claude 的「對話快取」有效期限從 5 分鐘縮到 1 分鐘,官方 GitHub issue 編號 #46829 悄悄證實,沒有部落格、沒有公告,就是直接改。
你可以把「快取 TTL」想成超商咖啡第二杯半價券:
- 以前 5 分鐘內回櫃台,店員認得你,折扣繼續用
- 現在 60 秒後就當陌生人,原價重算
誰最痛?三種台灣常見用法一次看
-
軟體接案工程師
邊寫 Laravel 邊把錯誤訊息丟給 Claude,查文件、上廁所、回 LINE,回來再貼一次→重複計費。 -
研究生翻譯論文
10 頁英文 PDF 拆 5 段餵 Claude,每段間隔超過 1 分鐘,等於同樣的「翻譯指令」被收 5 次 token。 -
行銷小編產 SEO 文案
把 50 組關鍵字循環「請幫我寫 150 字段落」,批次貼上,超時就再付一次。
根據 Anthropic 官方計價(Claude 3 Sonnet):
- Input:$3 / 1M token
- Output:$15 / 1M token
重複 100k token 的上下文,等同每次多噴 0.3 美元,一天重複 10 次就快 100 台幣不見。
秒懂防漏財 3 招
① 先「整包」再提問
把要參考的全部檔案、指令、範例,先合併成一段,開頭只給一次「你現在是資深工程師,以下為完整程式碼與需求」,後續只需下「/continue」即可續答,60 秒內不斷線。
② 本地草稿緩衝
- VS Code:裝「Claude」擴充,把長文先寫在側邊窗
- Notion:開新頁面→/claude 快捷鍵→整頁一次送出
- Mac 用戶:iTerm2 分割窗,左邊貼、右邊問,切換秒殺
③ 手動續命「/reload」
Claude Code CLI 支援 /reload 指令,可強迫把當前對話寫入暫存,超過 60 秒也不會被斷頭,適合超長篇 Refactor 或整包測試案例。
未來怎麼走?
Anthropic 沒說為何縮時,但業界推測:
- 降低 GPU 記憶體佔用,把資源讓給企業 API 客戶
- 讓「重複計費」變常態,拉高 ARPU(每用戶平均收入)
不論原因,開源社群已有人在討論自建「長記憶層」,把歷史對話先存 Pinecone 或本地向量庫,再只丟「差異」給 Claude,避開 TTL 限制。門檻不高,但要自己管資料、管隱私,適合有後端經驗的團隊。
小結:60 秒法則
- 60 秒內:同一包上下文,token 不重複收
- 超過 60 秒:Claude 失憶,全部重算
記得把「上廁所、回 LINE、滑 TikTok」的時間算進去,要問就一次問完,要答就一次答完,否則你的下一杯咖啡就是幫 Anthropic 付電費。
現在就打開 Claude,把今天所有需求先貼在同一行,試試看省下的第一個 10 元!