DeepSeek V4模型四月下旬登場 兆級參數採用華為晶片

商傳媒|葉安庭/綜合外電報導

AI模型開發商 DeepSeek 預計於本(4)月下旬發布其最新一代模型 DeepSeek V4。據路透社(Reuters)引述新聞網站 The Information 報導,這款新模型已延宕兩次上市時間,原定於今年2月推出。

DeepSeek V4 據傳將採用 Mixture-of-Experts (MoE) 架構,總參數規模約達一兆級別,但每次推論(inference)時僅啟用約 320 億至 370 億參數,旨在有效控制推論成本。此前,DeepSeek V3 已採用相同的MoE架構,總參數為 6,710 億。

值得注意的是,DeepSeek V4 將運行於華為(Huawei)的昇騰(Ascend)系列晶片,這使其成為首個建立在中國國產半導體基礎設施上的前沿級AI模型。據報導,DeepSeek 在模型優化初期,優先提供中國本土晶片製造商技術窗口,而未向輝達(NVIDIA)和超微(AMD)等西方晶片供應商開放早期優化存取權。此舉被分析認為是直接反駁美國出口管制措施未能有效阻礙中國AI發展的觀點。

市場傳聞,DeepSeek V4 有望支援高達一百萬個token的上下文視窗(context window),儘管DeepSeek官方尚未證實此數據,但該公司確實在今年1月發布了Engram—一套專為長上下文檢索設計的條件記憶系統研究。此外,V4 的輕量化版本 V4-Lite 已於今年4月初開始進行API基礎設施的實測。DeepSeek過往以其具競爭力的定價策略見稱,分析師預期,V4若能以頂尖效能搭配其一貫的積極定價,恐將再次衝擊AI市場。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

民生報老同仁夏初聚會 姚志剛有情同事有義

1978-2026 民生報還有人記得嗎?  ...

陸弈靜迎戰風雨奮不顧身 颱風吹到抱電桿

墨新聞|記者梁偉華/台北報導公視學生劇展推出金獎影...

伊品高唱驪歌 媽媽送「有錢花」鈔票花束超狂畢業禮物...

墨新聞|記者梁偉華/台北報導TPE48成員、也是1...

北港媽祖首度北巡駐駕基隆 祈安晚會湧萬名信眾共沐神...

墨新聞|記者江育銓/基隆報導「北港朝天宮媽祖北巡基...

基隆安樂路二段施工挖破水管 周邊停水2小時搶修恢復...

墨新聞|記者江育銓/基隆報導為提供更好的人行環境,...