Anthropic發表Claude Opus 4.7 強化編碼推理效能領先競品

商傳媒|林昭衡/綜合外電報導

AI新創公司Anthropic於今日(17日)正式推出其最新大型語言模型Claude Opus 4.7,該模型為Anthropic向公眾發布的最智能版本。新模型在程式編碼、推理及視覺智能等方面均有顯著提升,並在關鍵基準測試中,其效能超越了Google及OpenAI的部分頂級模型。

Anthropic指出,Claude Opus 4.7系列模型以其多步驟推理及先進編碼能力著稱。新版本除了能更有效地處理複雜且耗時的任務,同時也能精準遵循指令,甚至在回報結果前自行驗證輸出內容。此外,Opus 4.7在專業任務處理上更具品味與創意,能夠產出更高品質的介面、投影片及文件。

在視覺能力方面,Claude Opus 4.7能夠處理更高解析度的視覺內容,並執行像素級精確的任務,例如從密集截圖中提取數據,以及改進文件製作、簡報和設計輸出。Anthropic強調,開發者回報稱,他們能夠放心地將過去需要密切監督的艱鉅編碼工作交由Opus 4.7執行。

根據Anthropic發布的模型卡,Claude Opus 4.7在「人類終極考試」(Humanity’s Last Exam)這項基準測試中展現出色。在未輔助工具的情況下,Opus 4.7得分為46.9%,超越了Google的Gemini 3.1 Pro(44.4%)與OpenAI的GPT-5-4 Pro(42.7%)。若允許使用工具,Opus 4.7的得分則提升至54.7%。

不過,Anthropic也坦承,Opus 4.7的效能仍不及公司內部未公開的Claude Mythos模型。Claude Mythos雖在「人類終極考試」中取得56.8%(無工具)和高達64.7%(有工具)的成績,但Anthropic考量其「過於危險」而暫未向公眾開放。這凸顯了AI模型在追求極致性能與確保安全之間面臨的平衡挑戰。

在安全性方面,Claude Opus 4.7展現了低度的錯位行為風險,與前代Opus 4.6相似,且更不易產生幻覺,獎勵駭客行為(reward hacking)發生率較低。模型內部亦建置防護措施,能自動偵測並阻止涉及禁止或高風險網路安全用途的請求,儘管其網路安全能力相較於Claude Mythos預覽版有所限制。新模型可透過Claude AI、Claude API以及微軟(Microsoft Foundry)、亞馬遜(Amazon Bedrock)和Google Cloud等合作夥伴平台取得,定價與Claude Opus 4.6相同。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

基隆親子走讀熱鬧登場 百組家庭搭火車暢遊暖暖風光

墨新聞|記者江育銓/基隆報導基隆市政府兒童及少年事...

迎向AI與量子時代 中原大學第68屆畢業典禮勉勵學...

墨新聞|記者韋石/綜合報導記者江偉碩/綜合報導 邁...

《霸王列傳》日本喊奪冠前 先打破「八強魔咒」起航

在2022年卡達世界盃中,日本隊將「死亡之組」化身為「榮譽之地」。逆轉雙殺了德國和西班牙,最終以同樣的2比1取得勝利,讓全世界對這支藍武士刮目相看。人們紛紛質疑何以讓這些歐洲豪門屈服於他們的腳下。四年後的今天,森保一帶著更加沉重的經驗與憂慮,再次登上了世界舞臺。在F組,他們被視為本屆大賽的「死亡之組」成員,面對荷蘭、瑞典和突尼西亞的挑戰,每場都將是硬仗。儘管擁有歷史上最強的海外球

廢棄鐵道變身獨角仙棲地 黃敏惠率隊走讀頂庄里生態秘...

墨新聞|記者宋其佳/嘉義報導嘉義市政府今(6)日舉...

從趣味競賽到地板滾球 基隆市運動會展現全民參與魅力...

墨新聞|記者江育銓/基隆報導基隆市政府長期推動全民...