Claude Code驚現「隱形成本」三分之一訊息重複傳送加速消耗額度

商傳媒｜責任編輯／綜合外電報導

人工智慧程式開發工具正快速改變軟體工程師的工作模式，但背後的運算成本問題也逐漸浮上檯面。一名開發者近期深入分析自身使用 Claude Code 的紀錄後發現，高達三分之一的訊息內容其實屬於重複傳送，而快取機制調整後，更進一步加速了額度消耗速度。

根據《XDA》報導，Claude Code的運作方式與一般聊天機器人有所不同。每當使用者發出新指令時，系統不只是傳送當前問題，而是會將整個工作環境一併重新載入，包括系統提示詞、工具說明、專案規則、自訂設定以及歷史上下文等資訊，確保模型能理解完整開發情境。

這種設計雖然提升程式開發品質，卻也帶來額外成本。由於大量內容反覆傳送，實際上相當比例的Token消耗並非來自新的問題，而是重複載入既有內容。

分析指出，問題在於快取（Cache）機制的改變。過去由 Anthropic 提供的快取可維持約一小時，因此相同上下文能持續享有折扣計費。但自今年三月起，預設快取有效時間被縮短至僅五分鐘。

這意味著，若開發者離開電腦開會、接電話或處理其他工作，只要超過數分鐘未與Claude Code互動，快取便會失效。當再次發送訊息時，系統必須重新建立完整上下文，而這些原本享有折扣的內容，將重新以完整成本計算。

對採用訂閱方案的開發者而言，這種變化會直接影響每週可用額度。部分使用者甚至發現，明明實際互動次數不多，額度卻消耗得比預期更快。

為降低資源浪費，開發者建議善用 Claude Code 內建的「/compact」功能。這項指令可將現有上下文壓縮成摘要形式保存，避免因快取過期而必須重新載入大量歷史資訊，進而降低Token消耗量。

另一方面，不同模型之間的成本差異也相當明顯。Anthropic目前主要提供三大模型系列，包括功能最完整的 Claude Opus 、平衡效能與成本的 Claude Sonnet ，以及主打經濟實惠的 Claude Haiku 。

其中Opus擁有最強推理能力，但運算成本最高；Haiku則以低成本、高速度見長。開發者若長期進行程式碼生成、除錯或大型專案開發，不同模型選擇將大幅影響實際支出。

這項發現也反映出生成式AI產業的新現象。隨著模型能力不斷提升，市場焦點已不只是模型是否夠聰明，而是如何更有效率地管理上下文、記憶體與Token成本。對企業與專業開發者而言，未來競爭關鍵除了AI能力本身，更包括運算效率與成本控制能力。

從更大的產業趨勢來看，AI工具正在從單純聊天助手轉型為生產力平台，而快取管理、長期記憶與上下文壓縮等技術，將成為下一波AI產品競爭的重要戰場。誰能在維持模型能力的同時降低運算成本，誰就更有機會在企業市場取得優勢。

頭條留言

最新文章