Claude 快取 TTL 砍到 60 秒,開發者荷包一秒失血 3 倍

Claude 快取 TTL 砍到 60 秒,開發者荷包一秒失血 3 倍

Claude 快取 TTL 砍到 60 秒,開發者荷包一秒失血 3 倍

為什麼你突然覺得 Claude 變貴?

只是上個洗手間回來,同一段程式碋重新問一次,帳單竟多跳 0.3 美元(約 10 台幣)。別懷疑,Anthropic 在 3 月 6 日把 Claude 的「對話快取」有效期限從 5 分鐘縮到 1 分鐘,官方 GitHub issue 編號 #46829 悄悄證實,沒有部落格、沒有公告,就是直接改。

你可以把「快取 TTL」想成超商咖啡第二杯半價券:

  • 以前 5 分鐘內回櫃台,店員認得你,折扣繼續用
  • 現在 60 秒後就當陌生人,原價重算

誰最痛?三種台灣常見用法一次看

  1. 軟體接案工程師
    邊寫 Laravel 邊把錯誤訊息丟給 Claude,查文件、上廁所、回 LINE,回來再貼一次→重複計費。

  2. 研究生翻譯論文
    10 頁英文 PDF 拆 5 段餵 Claude,每段間隔超過 1 分鐘,等於同樣的「翻譯指令」被收 5 次 token。

  3. 行銷小編產 SEO 文案
    把 50 組關鍵字循環「請幫我寫 150 字段落」,批次貼上,超時就再付一次。

根據 Anthropic 官方計價(Claude 3 Sonnet):

  • Input:$3 / 1M token
  • Output:$15 / 1M token

重複 100k token 的上下文,等同每次多噴 0.3 美元,一天重複 10 次就快 100 台幣不見。

秒懂防漏財 3 招

① 先「整包」再提問

把要參考的全部檔案、指令、範例,先合併成一段,開頭只給一次「你現在是資深工程師,以下為完整程式碼與需求」,後續只需下「/continue」即可續答,60 秒內不斷線

② 本地草稿緩衝

  • VS Code:裝「Claude」擴充,把長文先寫在側邊窗
  • Notion:開新頁面→/claude 快捷鍵→整頁一次送出
  • Mac 用戶:iTerm2 分割窗,左邊貼、右邊問,切換秒殺

③ 手動續命「/reload」

Claude Code CLI 支援 /reload 指令,可強迫把當前對話寫入暫存,超過 60 秒也不會被斷頭,適合超長篇 Refactor 或整包測試案例。

未來怎麼走?

Anthropic 沒說為何縮時,但業界推測:

  • 降低 GPU 記憶體佔用,把資源讓給企業 API 客戶
  • 讓「重複計費」變常態,拉高 ARPU(每用戶平均收入)

不論原因,開源社群已有人在討論自建「長記憶層」,把歷史對話先存 Pinecone 或本地向量庫,再只丟「差異」給 Claude,避開 TTL 限制。門檻不高,但要自己管資料、管隱私,適合有後端經驗的團隊。

小結:60 秒法則

  • 60 秒內:同一包上下文,token 不重複收
  • 超過 60 秒:Claude 失憶,全部重算

記得把「上廁所、回 LINE、滑 TikTok」的時間算進去,要問就一次問完,要答就一次答完,否則你的下一杯咖啡就是幫 Anthropic 付電費。

現在就打開 Claude,把今天所有需求先貼在同一行,試試看省下的第一個 10 元!