科技

Claude Code驚現「隱形成本」 三分之一訊息重複傳送加速消耗額度

Vendor Icon

商傳媒

1 小時前

圖/本報資料庫

商傳媒|責任編輯/綜合外電報導

人工智慧程式開發工具正快速改變軟體工程師的工作模式,但背後的運算成本問題也逐漸浮上檯面。一名開發者近期深入分析自身使用 Claude Code 的紀錄後發現,高達三分之一的訊息內容其實屬於重複傳送,而快取機制調整後,更進一步加速了額度消耗速度。

根據《XDA》報導,Claude Code的運作方式與一般聊天機器人有所不同。每當使用者發出新指令時,系統不只是傳送當前問題,而是會將整個工作環境一併重新載入,包括系統提示詞、工具說明、專案規則、自訂設定以及歷史上下文等資訊,確保模型能理解完整開發情境。

這種設計雖然提升程式開發品質,卻也帶來額外成本。由於大量內容反覆傳送,實際上相當比例的Token消耗並非來自新的問題,而是重複載入既有內容。

分析指出,問題在於快取(Cache)機制的改變。過去由 Anthropic 提供的快取可維持約一小時,因此相同上下文能持續享有折扣計費。但自今年三月起,預設快取有效時間被縮短至僅五分鐘。

這意味著,若開發者離開電腦開會、接電話或處理其他工作,只要超過數分鐘未與Claude Code互動,快取便會失效。當再次發送訊息時,系統必須重新建立完整上下文,而這些原本享有折扣的內容,將重新以完整成本計算。

對採用訂閱方案的開發者而言,這種變化會直接影響每週可用額度。部分使用者甚至發現,明明實際互動次數不多,額度卻消耗得比預期更快。

為降低資源浪費,開發者建議善用 Claude Code 內建的「/compact」功能。這項指令可將現有上下文壓縮成摘要形式保存,避免因快取過期而必須重新載入大量歷史資訊,進而降低Token消耗量。

另一方面,不同模型之間的成本差異也相當明顯。Anthropic目前主要提供三大模型系列,包括功能最完整的 Claude Opus 、平衡效能與成本的 Claude Sonnet ,以及主打經濟實惠的 Claude Haiku 。

其中Opus擁有最強推理能力,但運算成本最高;Haiku則以低成本、高速度見長。開發者若長期進行程式碼生成、除錯或大型專案開發,不同模型選擇將大幅影響實際支出。

這項發現也反映出生成式AI產業的新現象。隨著模型能力不斷提升,市場焦點已不只是模型是否夠聰明,而是如何更有效率地管理上下文、記憶體與Token成本。對企業與專業開發者而言,未來競爭關鍵除了AI能力本身,更包括運算效率與成本控制能力。

從更大的產業趨勢來看,AI工具正在從單純聊天助手轉型為生產力平台,而快取管理、長期記憶與上下文壓縮等技術,將成為下一波AI產品競爭的重要戰場。誰能在維持模型能力的同時降低運算成本,誰就更有機會在企業市場取得優勢。


author avatar
商傳媒
商傳媒是由一群在媒體界超過十年的採訪團隊,是一個提供財經、科技、智慧製造、醫療、電玩資訊為主要服務內容的金融科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更朝向將台灣中小企業產品獎持續推向全世界。
donate plan

充電計畫

喜歡這篇文章嗎?歡迎幫作者充電,好內容值得更多人支持

瞭解詳情