Claude Code驚現「隱形成本」 三分之一訊息重複傳送加速消耗額度

商傳媒|責任編輯/綜合外電報導

人工智慧程式開發工具正快速改變軟體工程師的工作模式,但背後的運算成本問題也逐漸浮上檯面。一名開發者近期深入分析自身使用 Claude Code 的紀錄後發現,高達三分之一的訊息內容其實屬於重複傳送,而快取機制調整後,更進一步加速了額度消耗速度。

根據《XDA》報導,Claude Code的運作方式與一般聊天機器人有所不同。每當使用者發出新指令時,系統不只是傳送當前問題,而是會將整個工作環境一併重新載入,包括系統提示詞、工具說明、專案規則、自訂設定以及歷史上下文等資訊,確保模型能理解完整開發情境。

這種設計雖然提升程式開發品質,卻也帶來額外成本。由於大量內容反覆傳送,實際上相當比例的Token消耗並非來自新的問題,而是重複載入既有內容。

分析指出,問題在於快取(Cache)機制的改變。過去由 Anthropic 提供的快取可維持約一小時,因此相同上下文能持續享有折扣計費。但自今年三月起,預設快取有效時間被縮短至僅五分鐘。

這意味著,若開發者離開電腦開會、接電話或處理其他工作,只要超過數分鐘未與Claude Code互動,快取便會失效。當再次發送訊息時,系統必須重新建立完整上下文,而這些原本享有折扣的內容,將重新以完整成本計算。

對採用訂閱方案的開發者而言,這種變化會直接影響每週可用額度。部分使用者甚至發現,明明實際互動次數不多,額度卻消耗得比預期更快。

為降低資源浪費,開發者建議善用 Claude Code 內建的「/compact」功能。這項指令可將現有上下文壓縮成摘要形式保存,避免因快取過期而必須重新載入大量歷史資訊,進而降低Token消耗量。

另一方面,不同模型之間的成本差異也相當明顯。Anthropic目前主要提供三大模型系列,包括功能最完整的 Claude Opus 、平衡效能與成本的 Claude Sonnet ,以及主打經濟實惠的 Claude Haiku 。

其中Opus擁有最強推理能力,但運算成本最高;Haiku則以低成本、高速度見長。開發者若長期進行程式碼生成、除錯或大型專案開發,不同模型選擇將大幅影響實際支出。

這項發現也反映出生成式AI產業的新現象。隨著模型能力不斷提升,市場焦點已不只是模型是否夠聰明,而是如何更有效率地管理上下文、記憶體與Token成本。對企業與專業開發者而言,未來競爭關鍵除了AI能力本身,更包括運算效率與成本控制能力。

從更大的產業趨勢來看,AI工具正在從單純聊天助手轉型為生產力平台,而快取管理、長期記憶與上下文壓縮等技術,將成為下一波AI產品競爭的重要戰場。誰能在維持模型能力的同時降低運算成本,誰就更有機會在企業市場取得優勢。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

幣安遭希臘拒發執照 堅守歐洲力拚歐盟牌照

商傳媒|葉安庭/綜合外電報導全球最大加密貨幣交易所...

Google 資深 AI 人才再流失 兩研究員轉投...

商傳媒|何映辰/台北報導根據《Bloomberg》...

美能源部長警告歐盟:甲烷法規將帶來「不必要痛苦」

商傳媒|責任編輯/綜合外電報導美國能源部長 Wri...

Hootsuite 重塑社群平台推 AI 代理 W...

商傳媒|責任編輯/綜合外電報導全球知名的社群媒體管...

澤西市 Hudson House West 啟動招...

商傳媒|簡明心/綜合外電報導美國紐澤西州澤西市的 ...