神秘AI模型Hunter Alpha現蹤OpenRouter 引發DeepSeek V4技術推測

商傳媒|何映辰/台北報導

一款名為「Hunter Alpha」的匿名人工智慧(AI)模型於3月11日在AI閘道平台OpenRouter上現身,因其強大功能卻無明確開發者資訊,在科技界引發熱烈討論。該平台隨後將其描述為一款「匿蹤模型」(stealth model),許多開發者推測它可能與中國AI公司DeepSeek即將推出的下一代模型DeepSeek V4有關。

根據《Deccan Chronicle》報導,Hunter Alpha是一款免費模型,並聲稱自己是「一款主要以中文訓練的中國AI模型」,其訓練資料截止至2025年5月。巧合的是,此知識截止點與DeepSeek自家聊天機器人所回報的相同。然而,當被問及創作者身分時,該系統拒絕透露,僅表示「我只知道我的名字、參數規模和上下文視窗長度」。目前DeepSeek與OpenRouter皆未對此模型做出官方評論,也未回應相關詢問。

Hunter Alpha的技術規格令人矚目。其簡介頁面指出,這是一款擁有1兆個參數的模型,這意味著它在處理語言和生成回應時,使用了約1兆個可調整的數值進行訓練。通常,參數越多的模型,運算能力需求也越高。此外,該模型聲稱具備高達100萬個token的上下文視窗(context window),這衡量了AI模型在單次互動中能夠處理或記憶的文本量。工程師納比爾·豪阿姆(Nabil Haouam)表示:「Hunter Alpha結合100萬token上下文、強大推理能力及免費開放,這一點非常突出。大多數具備如此大上下文視窗的前沿模型,在規模化應用時通常成本不菲。」

這些技術規格與中國媒體對DeepSeek下一代V4模型的預期高度吻合,該模型預計最快於4月發表。DeepSeek與許多中國競爭對手一樣,資金充裕,且其母公司是一家量化避險基金而非傳統科技巨頭,其組織架構顯得有些獨特。

儘管沒有直接證據,但這種高度相似性加劇了開發者們的猜測,認為Hunter Alpha可能是DeepSeek即將發表的V4模型的早期測試版本。AI工程師丹尼爾·迪赫斯特(Daniel Dewhurst)在分析該模型後指出,「思維鏈(chain-of-thought)模式可能是最強烈的訊號」,他解釋稱AI模型的推理風格很難偽裝,通常能反映其訓練方式。他補充說,Hunter Alpha的規模和記憶體容量也與今年初以來流傳的DeepSeek V4規格相符。

然而,也有部分開發者對於這種連結持謹慎態度。獨立AI基準測試專家烏穆爾·奧茲庫爾(Umur Ozkul)表示,他的分析顯示Hunter Alpha「可能並非DeepSeek V4」,理由是其token相關行為和架構模式與DeepSeek現有系統存在差異。但他承認,考慮到發表時機和所宣傳的能力,將該模型與DeepSeek聯繫起來的推測是可以理解的。

匿名模型發布在業界並非罕見。OpenRouter等平台允許開發者透過單一介面向多個AI模型發送查詢,使其成為新系統的熱門測試場域。例如,今年2月,一款名為Pony Alpha的匿名模型在OpenRouter上現蹤,五天後中國公司智譜AI(Zhipu AI)證實它是其GLM-5系統的一部分。Hunter Alpha的簡介頁面也提及,所有提示與完成資訊將由提供者記錄,並可能用於改進模型,這凸顯了業界透過匿名發布來獲取無偏見回饋的普遍做法。

截至上週日(3月15日),Hunter Alpha在平台現身後已被迅速採用,已處理超過1,600億個token。其中大部分活動來自軟體開發工具和AI代理框架,例如OpenClaw,這些框架允許AI系統自主規劃任務並與外部軟體互動。這也反映出AI開發社群對這類高性能且易於取用的模型的強烈需求。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

北港媽祖史上首次北巡駐駕基隆 邱佩琳率隊迎駕、信眾...

墨新聞|記者江育銓/基隆報導北港朝天宮媽祖今(30...

基隆粽夏運動會秒殺報名 親子闖關、體能競賽嗨翻天

墨新聞|記者江育銓/基隆報導由基隆市政府兒童及少年...

房市脈動一指掌握 雅潭地政建置「買賣熱區報你知」

墨新聞|記者馬源培/台中報導台中市雅潭地政事務所官...

基隆長興里趣談土石流 防災融入生活強化社區韌性

墨新聞|記者江育銓/基隆報導基隆市七堵區長興里於5...

最潮校慶! 台中東勢國中80週年「來上客」 數位推...

墨新聞|記者馬源培/台中報導台中市東勢國中創校80...