Cohere AI發表高效語音辨識模型 搶攻企業語音智慧應用

商傳媒|何映辰/台北報導

人工智慧公司 Cohere AI 今日宣布推出其最新的自動語音辨識(ASR)模型「Cohere Transcribe」,旨在將非結構化語音轉換為具洞察力的文字,進而推動企業語音智慧的發展。該模型一經發布,便以平均 5.42% 的詞錯誤率(WER)榮登 Hugging Face 開放 ASR 排行榜榜首,展現出領先業界的精準度。

MarkTechPost 指出,Cohere Transcribe 在多項基準測試中表現優異,例如在 AMI 測試中獲得 8.13 分,在 LibriSpeech clean 數據集上僅錄得 1.25% 的錯誤率。這項成績超越了包括 Whisper Large v3(平均 WER 7.44%)、ElevenLabs Scribe v2(5.83%)及 Qwen3-ASR-1.7B(5.76%)等多個市場主要競爭者。在人為偏好測試中,Transcribe 更在與 IBM Granite 4.0 及 NVIDIA Canary Qwen 2.5B 的比較中,分別獲得 78% 與 67% 的青睞度。

該模型採用大型 Conformer 編碼器搭配輕量級 Transformer 解碼器的混合架構,此設計結合了卷積神經網路(CNN)的局部特徵捕捉能力與轉換器(Transformer)的全局上下文理解力。Cohere Transcribe 目前支援包含英文、德文、法文、義大利文、西班牙文、葡萄牙文、希臘文、荷蘭文、波蘭文、阿拉伯文、越南文、中文、日文及韓文等 14 種語言,顯示其廣泛的應用潛力。

Cohere AI 將 Transcribe 定位為高精度、生產導向的 ASR 模型,能夠以 35 秒為單位的音頻區塊進行處理,並透過分塊與重組機制處理長達 55 分鐘的音頻文件,同時有效管理 GPU 記憶體。不過,此模型為純粹的自動語音辨識工具,不內建說話者分離或時間戳記功能,且在預先定義目標語言時能發揮最佳效能,不支援自動語言偵測或針對語言切換進行優化。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

災害來臨怎麼辦?《全民安全指引》前進基隆 教導民眾...

墨新聞|記者江育銓/基隆報導為提升全民防災意識及應...

「我的文化、我的聲音」 基隆培育原民兒少勇敢表達意...

墨新聞|記者江育銓/基隆報導  ...

孝馨獎連結藝術與孝親 張善政肯定忠恕道院公益貢獻

桃園市長張善政昨(30)日上午前往龜山...

若水學院威廉導師《個人IP變現育成班 》引發關注 ...

在AI時代與自媒體浪潮全面崛起的今天,越來越多人開始意識到一件事:「萬般帶不走,唯有個人品牌隨身。」5月30日,由若水學院創辦人威廉導師主導的《第一屆 個人IP變現育成班》,吸引眾多創業者、講師、愛學習者與專業人士參與,現場學習氛圍熱烈,掀起一波「個人品牌變現」話題。若水學院長期以教育訓練與知識變現系統為核心,協助學員建立個人影響力與商業價值。

助弱勢學生安心就學! 鑫威利股份有限公司捐贈台中市...

墨新聞|記者馬源培/台中報導為關懷學子教育、善盡企...