Anthropic發表Claude Opus 4.7 強化編碼推理效能領先競品

商傳媒｜林昭衡／綜合外電報導

AI新創公司Anthropic於今日（17日）正式推出其最新大型語言模型Claude Opus 4.7，該模型為Anthropic向公眾發布的最智能版本。新模型在程式編碼、推理及視覺智能等方面均有顯著提升，並在關鍵基準測試中，其效能超越了Google及OpenAI的部分頂級模型。

Anthropic指出，Claude Opus 4.7系列模型以其多步驟推理及先進編碼能力著稱。新版本除了能更有效地處理複雜且耗時的任務，同時也能精準遵循指令，甚至在回報結果前自行驗證輸出內容。此外，Opus 4.7在專業任務處理上更具品味與創意，能夠產出更高品質的介面、投影片及文件。

在視覺能力方面，Claude Opus 4.7能夠處理更高解析度的視覺內容，並執行像素級精確的任務，例如從密集截圖中提取數據，以及改進文件製作、簡報和設計輸出。Anthropic強調，開發者回報稱，他們能夠放心地將過去需要密切監督的艱鉅編碼工作交由Opus 4.7執行。

根據Anthropic發布的模型卡，Claude Opus 4.7在「人類終極考試」（Humanity’s Last Exam）這項基準測試中展現出色。在未輔助工具的情況下，Opus 4.7得分為46.9%，超越了Google的Gemini 3.1 Pro（44.4%）與OpenAI的GPT-5-4 Pro（42.7%）。若允許使用工具，Opus 4.7的得分則提升至54.7%。

不過，Anthropic也坦承，Opus 4.7的效能仍不及公司內部未公開的Claude Mythos模型。Claude Mythos雖在「人類終極考試」中取得56.8%（無工具）和高達64.7%（有工具）的成績，但Anthropic考量其「過於危險」而暫未向公眾開放。這凸顯了AI模型在追求極致性能與確保安全之間面臨的平衡挑戰。

在安全性方面，Claude Opus 4.7展現了低度的錯位行為風險，與前代Opus 4.6相似，且更不易產生幻覺，獎勵駭客行為（reward hacking）發生率較低。模型內部亦建置防護措施，能自動偵測並阻止涉及禁止或高風險網路安全用途的請求，儘管其網路安全能力相較於Claude Mythos預覽版有所限制。新模型可透過Claude AI、Claude API以及微軟（Microsoft Foundry）、亞馬遜（Amazon Bedrock）和Google Cloud等合作夥伴平台取得，定價與Claude Opus 4.6相同。

頭條留言

Anthropic發表Claude Opus 4.7 強化編碼推理效能領先競品

最新文章

基隆親子走讀熱鬧登場　百組家庭搭火車暢遊暖暖風光

迎向AI與量子時代　中原大學第68屆畢業典禮勉勵學...

《霸王列傳》日本喊奪冠前先打破「八強魔咒」起航

廢棄鐵道變身獨角仙棲地　黃敏惠率隊走讀頂庄里生態秘...

從趣味競賽到地板滾球　基隆市運動會展現全民參與魅力...

社群媒體

聯絡我們

關於我們

Anthropic發表Claude Opus 4.7 強化編碼推理效能領先競品

最新文章

基隆親子走讀熱鬧登場 百組家庭搭火車暢遊暖暖風光

迎向AI與量子時代 中原大學第68屆畢業典禮勉勵學...

《霸王列傳》日本喊奪冠前 先打破「八強魔咒」起航

廢棄鐵道變身獨角仙棲地 黃敏惠率隊走讀頂庄里生態秘...

從趣味競賽到地板滾球 基隆市運動會展現全民參與魅力...

社群媒體

聯絡我們

關於我們

基隆親子走讀熱鬧登場　百組家庭搭火車暢遊暖暖風光

迎向AI與量子時代　中原大學第68屆畢業典禮勉勵學...

《霸王列傳》日本喊奪冠前先打破「八強魔咒」起航

廢棄鐵道變身獨角仙棲地　黃敏惠率隊走讀頂庄里生態秘...

從趣味競賽到地板滾球　基隆市運動會展現全民參與魅力...