IBM Granite 模型家族新成員 Granite 3.2 報到

全新視覺語言模型 效能媲美大參數模型 推理能力增強 更輕巧安全

  • Granite 3.2 是小型 AI 模型,具備新的視覺理解、更強的推理與更輕巧的安全防護能力;採用對開發者友善的授權條款
  • 新一代 Granite 時間序列模型可支援長期趨勢與需求預測,參數小於 1千萬;適用於金融與經濟趨勢分析、供應鏈需求預測,以及零售業的季節性庫存規劃
  • 體現 IBM 發展企業專用、小型、高效與實用AI的策略

台北2025年3月3日 /美通社/ — IBM於2月底發表其 Granite 大型語言模型家族的最新一代產品 Granite 3.2,持續推動小型、高效、企業專用的 AI,為實際應用創造效益。

IBM 推出 Granite 3.2 大語言模型,體現 IBM 發展企業專用、小型、高效與實用 AI 的策略。
IBM 推出 Granite 3.2 大語言模型,體現 IBM 發展企業專用、小型、高效與實用 AI 的策略。

所有 Granite 3.2 模型均採用寬鬆的 Apache 2.0 開源授權條款,可在 Hugging Face 下載。部分模型現已在 IBM watsonx.ai、Ollama、Replicate 和 LM Studio 上提供,預計不久將支援 RHEL AI 1.5,為企業與開源社群注入更強大的 AI 能力。

主要亮點

  • 全新視覺語言模型:專為理解文件任務而設計,在關鍵企業基準測試 DocVQA、ChartQA、AI2D 和 OCRBench[1] 上,表現可媲美甚至超越更大規模的模型(如 Llama 3.2 11B 和 Pixtral 12B)。除了強大的訓練數據外,IBM 也利用其開源 Docling 工具包處理8千5百萬份 PDF 文件,並生成2千6百萬個合成問答配對,提升視覺語言模型在處理大量文件工作流時的能力。
  • 增強推理功能:Granite 3.2的2B與8B模型加入了「思維鏈」(Chain of Thought,CoT)推理機制,且使用者可以開啟或關閉推理功能以優化效率。透過這項能力,8B 模型在 ArenaHard 和 Alpaca Eval 等指令遵循基準測試中的表現[2],比前一代優異比例達到兩位數,且不影響其他領域的安全性或性能。此外,透過創新的推理擴展方法,Granite 3.2 8B 模型可以調整至接近 Claude 3.5 Sonnet 或 GPT-4o 在數學推理基準(如 AIME2024 和 MATH500[3])上的表現。
  • Granite Guardian 安全模型更輕巧:在保持 Granite 3.1 Guardian 模型性能的同時,模型尺寸減少三成。此外,Granite 3.2 系列還引入了語言化信心評估(Verbalized Confidence)新功能,可提供更精細的風險評估,幫助安全監測系統識別不確定性。

IBM 持續推動企業專用的小型 AI 模型策略,並已在測試中展現高效能。例如,Granite 3.1 8B 模型在 Salesforce 大型語言模型CRM基準測試中獲得高分,顯示其在實際應用中的準確度和可靠性。

IBM Granite 模型家族擁有廣大的合作夥伴生態體系,許多領先的軟體公司已將Granite模型嵌入其技術。Granite 3.2 是 IBM 在推動企業專用小型 AI 方面的重要進展,體現了 IBM 致力於提供小型、高效、實用 AI 的產品策略。

雖然思維鏈在推理任務中表現強大,但它需要大量運算資源,並非所有任務都必須啟用。因此,IBM 在 Granite 3.2 模型中加入了程式化開關功能,使用者可以根據需求開啟或關閉推理模式;模型可在不啟用推理的情況下運行較簡單的任務,以降低不必要的運算成本。

此外,其他推理技術(例如推理擴展 Inference Scaling) 已顯示 Granite 3.2 8B 模型能夠在標準數學推理基準測試中,媲美甚至超越更大模型的性能。持續發展這項推理技術也是 IBM 研究團隊的重點方向[4],以進一步提升 AI 的效能與應用範圍。

除了 Granite 3.2 的指令、視覺和防護模型之外,IBM 也推出了新一代 TinyTimeMixers(TTM)時間序列模型,這些模型的參數少於1千萬,具備長期預測能力,可進行長達兩年的長期預測。這些模型為長期趨勢分析提供強大工具,適用於金融與經濟趨勢分析、供應鏈需求預測,以及零售業的季節性庫存規劃。

IBM AI 研究副總裁 Sriram Raghavan 表示:「AI 的下一個時代將聚焦效率、整合與實際應用的影響力 — 企業應該能夠在不過度消耗運算資源的情境下,取得強大的 AI 效益。IBM 最新的 Granite 模型發展專注於開放型解決方案,逐步推動 AI 的普及,使其更具成本效益,為現代企業創造更大價值。」

欲了解Granite 3.2 的技術細節,請參閱相關技術文章

關於 IBM

IBM 是全球領先的混合雲、人工智慧及企業諮詢服務的提供者,為全球超過 175 個國家的客戶服務,協助其從擁有的資料裡獲取商業洞察、簡化業務流程、降低成本,並取得產業競爭優勢。 來自金融服務、電信和健康醫療等關鍵基礎設施領域、超過4千家政府和企業機構,採用 IBM 混合雲平台和 Red Hat OpenShift 解決方案,快速、高效、安全地實現企業數位轉型。IBM 在人工智慧、量子運算、產業專屬的雲端運算解決方案和企業諮詢服務領域的突破性創新,為客戶提供開放和靈活的選擇。IBM 對企業誠信、透明治理、企業社會責任、多元與包容文化和服務精神的承諾,歷久彌新,是 IBM 業務發展的基礎。

台灣 IBM 公司新聞室:https://taiwan.newsroom.ibm.com/

新聞聯絡

IBM 公司公關部 Kate Liu        [email protected]

[1] 視覺模型(Vision Model) 的基準測試結果可在 IBM技術文章 《IBM Granite 3.2:推理、視覺、預測與更多應用》(2025 年 2 月 26 日發布)中查閱。

[2] 指令模型(Instruct Model) 的基準測試結果可在 IBM 技術文章 《IBM Granite 3.2:推理、視覺、預測與更多應用》(2025 年 2 月 26 日發布)中查閱。

[3] 推理擴展(Inference Scaling) 的基準測試結果可在 IBM技術研究部落格 《Granite 3.2 中的推理:利用推理擴展技術》(2025 年 2 月 26 日發布)中查閱。

[4] 推理擴展技術在 Granite 3.2 中的應用,IBM 技術研究部落格,2025 年 2 月 26 日發布

IBM Corporation logo.
IBM Corporation logo.

 

 

頭條留言
美 通社
美 通社
美通社通過其多管道發佈網路、受眾情報、定向、評估及資訊披露和投資者傳播服務,説明企業和組織與媒體、消費者、決策者、投資者及普通大眾進行充分、及時的動態對話,從而為塑造品牌、打響知名度、影響公共政策、推動銷售和籌集資本提供支持。 美通社在1954年開創了企業新聞稿發佈行業的先河,通過分佈在南北美洲、歐洲、亞洲和中東16個國家和地區的無與倫比的辦事處網路,借助與全球領先新聞機構之間的獨特關係,用40多種語言將客戶與170多個國家的受眾聯繫起來。全球4萬多家公司、組織和政府機構都在使用美通社的服務,其中包括50%以上的財富500強企業。
- 廣告 -
- 廣告 -

最新文章

叫 foodpanda 送~你進大巨蛋看職棒開幕戰...

繼 Team Taiwan 勇奪世界棒球 12 強冠軍、2025經典賽資格賽搶得門票,接連獲勝讓台灣重回棒球盛世!今年職棒開幕賽將於 3 月 29 日盛大開打,foodpanda即日起至 3 月 16 日,pandapro 用戶只需完成 3 筆滿 299 元的美食外送訂單,即可參加「foodpanda送~你進大巨蛋看職棒開幕戰!」的職棒開幕戰門票集點卡任務!

春暖駕馭新生活 三月入主MG「貸我走專案」輕鬆開回...

MG Taiwan在三月推出多項限時購車優惠,其中包含首年超低月付的「貸我走專案」,提供彈性付款選擇,體驗「超規滿配」的駕馭享受,此專案首年月付最低僅需1,228元起。

推動 AI 和雲端策略,原欣上任 SAP 大中華地...

SAP今日宣佈,任命原欣為大中華地區總裁,全面負責SAP在該市場的業務營運,全力推動AI和雲端策略在大中華地區的深化,協助企業加速數位轉型,實現業務的永續成長。她還將進一步拓展SAP在大中華地區的市場佈局與生態圈建構,以滿足不同產業客戶不斷升級變化的需求。

LINE Pay 攜手韓國樂天超市拓展跨境消費,使...

樂天超市是韓國主要的量販零售超市之一,在全國共擁有111家據點,提供從生鮮食品、日常用品、到家電玩具等多元商品選擇,遍及全國包括首爾、釜山、濟州等地,不僅深受當地居民喜愛,更是遊客最方便購入韓國零食餅乾、泡麵等的必訪之處,地位如同外國觀光客來台灣必逛的西門町家樂福桂林店。

起步校園 放眼國際 華碩2025徵才全面啟動

華碩2025年校園徵才即將盛大展開!巡迴首站將於3月8日在台灣大學校園博覽會登場,職缺涵蓋AI軟韌體研發、硬體、機構、業務行銷等,希望積極延攬各界精英,與華碩並肩同行,開啟AI新世代。