Gartner預測:AI模型Token單價趨零 企業營運成本恐不減反增

商傳媒|何映辰/台北報導

根據國際研究暨顧問機構Gartner今日發布的最新報告預測,到2030年,人工智慧(AI)模型的關鍵運算單位「Token」單價將趨近於「零」。儘管單價大幅下降,但隨著AI技術的快速演進與應用普及,企業的整體AI推論成本(inference cost)反而可能不減反增。

Gartner指出,大型語言模型(LLM)的推論成本將在2030年之前降低逾90%,而模型效率則有望提升高達100倍。以具備1兆參數的LLM為例,其推論成本相較於2025年將減少超過90%。報告將此效率提升歸因於半導體與基礎設施的改進、模型設計的創新,以及專為推論優化的半導體擴張。報告中,一個AI Token被定義為約3.5位元組(約四個字元)的數據量。

然而,Token單價的下降並非意味著企業AI營運負擔的減輕。Gartner資深總監分析師威爾·索默(Will Sommer)表示,企業採購長(CPO)不應將通用Token價格的下跌誤解為進階推理能力已普及。基礎AI功能正逐漸趨近零成本,但支援複雜推理所需的運算資源與系統依然稀缺。隨著AI技術發展,對Token的需求量將大幅飆升,抵銷單價下降所帶來的成本效益。

特別是AI代理程式(AI agents)等更先進的技術,每項任務所需消耗的Token量,比傳統簡易聊天機器人多出至少5倍至30倍。因此,即便Token單價降低,龐大的總使用量仍將導致企業的整體AI推論成本增加。

Gartner強調,未來的AI競爭力核心不在於單一模型的效能,而是「多模型協調策略」(multi-model orchestration)。這意味著企業需具備精密的營運能力,運用小型語言模型(sLLM)或特定領域模型處理重複且頻繁的任務,並將最尖端的模型僅用於高價值的複雜推理,這將是企業在未來AI發展階段能否生存的關鍵。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

博世全新「專業手工具」登台:讓每一次出手,都是精準...

墨新聞|新聞策劃編輯部記者李婉如/綜合報導 你手中...

百年市場研究:美股長期報酬驚人,專家示警非投資保證...

商傳媒|吳承岳/台北報導芝加哥大學兩位校友 Rog...

蘋果第三創辦人800美元退場 錯失4千億美元傳奇

商傳媒|責任編輯/綜合外電報導蘋果第三位共同創辦人...

美股漲太高?這3檔被低估16%到42%,價值投資人...

商傳媒|方承業/綜合外電報導在美股主要指數一直創歷...

澳洲後院變金庫 姻親房熱潮藏三大風險

商傳媒|簡明心/綜合外電報導澳洲房價和房貸利率都很...