AI代理人變便宜?Cloudflare引進Kimi AI模型 助開發者節省營運成本

商傳媒|葉安庭/綜合外電報導

網路基礎設施龍頭 Cloudflare 近日宣布,旗下無伺服器推論平台 Workers AI 已完成架構升級,正式引進由 Moonshot AI 開發的 Kimi K2.5 大型模型。此次更新不僅標誌著平台具備處理超大規模上下文的能力,更透過獨家的 Infire 推論引擎與「分離式預填」策略,成功將 AI 代理程式(Agent)的運算成本大幅削減 77%,為全球開發者提供更具價格競爭力的企業級 AI 推論環境。

Cloudflare 此次將 Kimi K2.5 模型納入 Workers AI,主要瞄準複雜的 AI 代理應用。Kimi K2.5 以其優異的多輪工具調用與視覺分析能力著稱,並具備 256k(實為 262k)的長文本處理能力,能應對密集的程式碼審查與自動化任務。

為了在無伺服器環境中維持大型 LLM 的運行效率,Cloudflare 針對推論堆疊進行了底層技術革新:

  • 分離式預填 (Disaggregated Prefill):將輸入處理(Prefill)與內容生成(Generation)階段在硬體層級分離,最大化 GPU 使用率並減少延遲。
  • 強化前綴快取 (Prefix Caching):針對 AI 代理頻繁重複的系統指令與背景資料進行快取,並提供較低的計價費率,大幅提振首次響應時間(TTFT)。
  • 非同步 API 重構:改採拉取式系統(Pull-based system),確保在高負載時段,非即時性任務(如大規模程式碼掃描)仍能穩定執行而不報錯。

Cloudflare 在台擁有密集的邊緣運算節點,此次技術升級對台灣正積極轉向 AI 轉型(AI Transformation)的企業具有高度價值。法人指出,台灣許多 SaaS 開發商過去受限於昂貴的專有模型授權費,Cloudflare 透過提供開放原始碼模型的推論服務,並藉由技術手段降低 77% 成本,將有效提振國內企業建置私有 AI 代理程式的意願,降低進入門檻。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

千尋、湯婆婆快閃農機展 嘉縣力倡健康別神隱無菸新生...

墨新聞|記者張游舜/台北報導 ...

新北環警深夜鐵腕出擊 淡江大橋全時段科技執法搭配「...

墨新聞|記者孫筱華/新北報導為維護周邊市民生活品質...

《霸王列傳》最強葡萄牙與老C羅迎衝冠大夢

2026年美加墨世界盃是葡萄牙隊隊史第九次踏上世界盃征程,更是41歲C羅職業生涯的最後一舞。縱觀本屆葡萄牙陣容,坐擁近十年最均衡、最無短板、最具深度的豪華陣容,攻防兩端均衡且充滿活力,牌面實力穩居世界排名前六,成為本屆世界盃奪冠熱門之一,他們向著隊史首座大力神杯發起最強衝鋒,誓要在北美大陸書寫屬於葡萄牙的巔峰傳奇。

2026竹山國際茶道節圓滿落幕 熱絡人潮展現茶鄉觀...

墨新聞|記者張游舜/台北報導  為期9天的「202...

埔里鎮與日本出水市締結姊妹市九週年 捐贈麒麟花見證...

墨新聞|記者張游舜/台北報導 為慶祝台灣南投縣埔...