AI語音模型讀懂情緒語氣 人機互動告別機器人感

商傳媒|責任編輯/綜合外電報導

美國新創公司 Inworld AI 近日推出一款名為 Realtime TTS-2 的新人工智慧語音模型,其獨特之處在於能即時感應使用者的語氣與情緒,並做出更擬人化的回應,有望改變未來的人機互動體驗。

這項由總部位於山景城的 Inworld AI 所開發的技術,透過分析語音線索如聲調、語速與音高,即時判斷說話者的情緒狀態。隨後,AI 會動態調整自身的語音與表達方式,以創造出更加自然、具備情緒理解能力的對話。文字轉語音(Text-to-Speech,簡稱 TTS)是一種語音型人工智慧模型,而 Realtime TTS-2 將此技術推向新境界。

Inworld AI 執行長 Kylan Gibbs 指出,目前大多數人工智慧語音雖然聽起來像人類,卻給人一種「照稿宣讀」的生硬感。他強調:「你或許覺得它音質很好,但聽起來就是不對勁,就像是在跟有聲書對話。」他表示,即時對話是人們最自然的互動模式,而越接近這種模式,使用者參與度就越高。

Realtime TTS-2 模型整合了多項傳統 AI 語音系統中不常見的功能。它能理解對話的完整歷史與上下文,讓 AI 的回應能根據先前的內容調整。例如,在情境測試中,AI 曾針對客戶服務延遲表現出「富有同理心、歉意且直接」的回應;而當 Gibbs 刻意說出不恰當的玩笑時,AI 也沒有直接忽略或粗魯回應,而是以一種「有效、引人注目,但不確定是否稱得上幽默,但確實令人印象深刻」的回應來展現微妙的幽默感與委婉的不認同。

過去 Inworld AI 的語音模型在語音品質基準測試中已超越 Google 和 ElevenLabs 等競爭對手。該公司已從創始人基金、英特爾及微軟等投資者手中募得逾 1 億美元資金。目前,Inworld AI 將 Realtime TTS-2 定位為提供給開發者的基礎設施,透過應用程式介面(API)讓其能整合至現有 AI 系統中。Gibbs 解釋,由於 OpenAI 的 Codex 與 Anthropic 的 Claude Code 等 AI 編程工具讓應用程式開發變得更加容易,公司選擇專注於核心模型與 API 開發,避免與客戶競爭,進一步提升其在產業鏈中的價值。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

小米智慧穿戴新品六款同發!Watch S5、手環 ...

伴隨年度旗艦手機的熱潮,小米今(5/29)日在台灣一口氣發表六款全新智慧穿戴與音訊新品,全面擴大其智慧生態系陣容。

全線標配徠卡 5x 潛望長焦 Xiaomi 17T...

小米今(5/29)日在台正式推出備受期待的年度旗艦 Xiaomi 17T 系列,再度攜手傳奇影像品牌徠卡,將行動攝影體驗推向全新高度。

野獸國「潮玩宇宙城」登陸台北潮玩展 《假面騎士》與...

野獸國宣布將於「2026台北國際潮流玩具、授權展」打造大型主題展區「潮玩宇宙城」,於台北世貿一館推出結合潮流玩具、特攝IP與娛樂互動的沉浸式空間。此次展區以未來感與潮流美學為設計主軸,除了首度公開《假面騎士》特展區與K-pop獵魔女團主題視覺區外,也將展出多款限定公仔與收藏商品。現場同步推出全館盲盒任選3件85折,以及最低48折的限量福袋優惠,吸引潮玩與動漫迷關注。

台股瘋狂大漲!單週強彈2464點 市值暴增8兆元

墨新聞|記者張靜惠/綜合報導【記者張靜惠台北報導】...

TP-Link 首款 Wi-Fi 8 路由器 Ar...

TP-Link正式公開旗下首款Wi-Fi 8路由器「Archer 8」,預計將於2026年10月上市,成為品牌布局下一代無線網路的重要產品。不同於過往Wi-Fi世代強調理論峰值速度,Archer 8主打「真實世界穩定度」,鎖定家庭多裝置、高頻寬與跨空間使用需求,透過AI智慧優化、強化射頻架構與天線設計,改善訊號死角、跨樓層衰減與鄰近訊號干擾等常見問題。除了Archer 8之外,TP-Link也同步公布後續Wi-Fi 8產品規劃,包括預計2027年第一季推出的Deco 8 Mesh系統,以及2027年第二季登場的Roam 8旅行路由器、Wi-Fi 8訊號延伸器與網卡產品。