研究:OpenAI o1 臨床推理勝醫師 診斷準確率超越人類

商傳媒|林昭衡/綜合外電報導

根據一份最新研究報告指出,由 OpenAI 開發的最新大型語言模型(LLM)「OpenAI o1」預覽版,在多項臨床推理與診斷任務中的表現,已超越人類醫師與先前的 AI 模型,例如 GPT-4。《MedpageToday》報導,這項發表在《科學》(Science)期刊的研究,為人工智慧在醫療領域的應用帶來新的討論。

由哈佛醫學院生物醫學資訊學系研究員阿瓊·K·曼賴(Arjun K. Manrai, PhD)及其團隊所進行的實驗顯示,在急診初步分類中,OpenAI o1 預覽版在 67.1% 的案例中能提供精確或極接近的診斷,而兩位醫師的準確度分別為 55.3% 和 50%。研究人員將患者的電子病歷(未經特別整理)直接複製貼入 LLM 進行測試,以模擬實際臨床應用情境。

OpenAI o1 預覽版不只在急診表現亮眼,其在鑑別診斷、診斷測試選擇及其他任務上亦有優異表現。例如,在針對《新英格蘭醫學雜誌》(New England Journal of Medicine, NEJM)刊登的 143 份臨床病理研討案例進行評估時,該模型在 78.3% 的案例中,其鑑別診斷包含了正確結果;若將可能有所幫助或極為接近的診斷納入,準確率更達 97.9%。此外,在《NEJM Healer》課程的 80 個臨床推理案例中,OpenAI o1 預覽版在 78 個案例中獲得滿分,大幅優於 GPT-4(47/80)、主治醫師(28/80)及住院醫師(16/72)。

阿瓊·K·曼賴強調,這些發現不代表人工智慧將取代醫生,而是「我們正在見證一項將重塑醫學的深刻技術變革」。他呼籲,現在需要透過嚴謹的臨床試驗來評估這項技術。弗林德斯大學研究員 Ashley Hopkins, PhD 和 Erik Cornelisse 在隨刊評論中亦提到,雖然 AI 的評估方法持續進步,但其部署速度已超越了評估進度,並指出「在通過驗證的任務上取得準確性,並不保證已部署的系統會將其功能限制在該任務範圍內」。

研究作者總結,AI 在醫療保健領域應扮演協作角色,由臨床醫師提供監督、情境判斷和責任。這份研究報告也指出了其局限性,僅針對 OpenAI o1 的預覽版進行評估,且主要集中在急診醫學和內科領域,實驗也僅限於文本資訊,缺乏真實世界中醫師所需的聽覺或視覺線索。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

小米智慧穿戴新品六款同發!Watch S5、手環 ...

伴隨年度旗艦手機的熱潮,小米今(5/29)日在台灣一口氣發表六款全新智慧穿戴與音訊新品,全面擴大其智慧生態系陣容。

全線標配徠卡 5x 潛望長焦 Xiaomi 17T...

小米今(5/29)日在台正式推出備受期待的年度旗艦 Xiaomi 17T 系列,再度攜手傳奇影像品牌徠卡,將行動攝影體驗推向全新高度。

野獸國「潮玩宇宙城」登陸台北潮玩展 《假面騎士》與...

野獸國宣布將於「2026台北國際潮流玩具、授權展」打造大型主題展區「潮玩宇宙城」,於台北世貿一館推出結合潮流玩具、特攝IP與娛樂互動的沉浸式空間。此次展區以未來感與潮流美學為設計主軸,除了首度公開《假面騎士》特展區與K-pop獵魔女團主題視覺區外,也將展出多款限定公仔與收藏商品。現場同步推出全館盲盒任選3件85折,以及最低48折的限量福袋優惠,吸引潮玩與動漫迷關注。

台股瘋狂大漲!單週強彈2464點 市值暴增8兆元

墨新聞|記者張靜惠/綜合報導【記者張靜惠台北報導】...

TP-Link 首款 Wi-Fi 8 路由器 Ar...

TP-Link正式公開旗下首款Wi-Fi 8路由器「Archer 8」,預計將於2026年10月上市,成為品牌布局下一代無線網路的重要產品。不同於過往Wi-Fi世代強調理論峰值速度,Archer 8主打「真實世界穩定度」,鎖定家庭多裝置、高頻寬與跨空間使用需求,透過AI智慧優化、強化射頻架構與天線設計,改善訊號死角、跨樓層衰減與鄰近訊號干擾等常見問題。除了Archer 8之外,TP-Link也同步公布後續Wi-Fi 8產品規劃,包括預計2027年第一季推出的Deco 8 Mesh系統,以及2027年第二季登場的Roam 8旅行路由器、Wi-Fi 8訊號延伸器與網卡產品。