OpenAI升級AI風險監控 新系統鎖定生化武器生成指令防濫用

商傳媒|記者責任編輯/綜合外電報導

為了防範日益提升邏輯推理與生成能力的AI模型遭濫用,OpenAI近日宣布針對最新模型O3及O4-mini,部署一套名為「安全導向推理監控器(Safety-focused Reasoning Monitor)」的系統,能在回應使用者生物與化學風險內容時進行即時過濾與阻擋,防止模型被用於協助開發生化武器等潛在風險用途。

根據OpenAI最新公布的安全報告,O3與O4-mini在多項推理與知識生成任務中,展現顯著優於舊版模型(如GPT-4、o1)的能力;尤其在回答與「製造特定類型生物武器」相關提問時,O3的表現格外強勁,因此也引發潛在濫用風險。

為了防止有心人士挪為惡意用途,OpenAI投入逾1,000小時由紅隊(Red Team)針對O3、O4-mini模擬各類高風險指令,訓練AI判斷是否拒絕提供建議。根據測試結果,當安全監控邏輯開啟時,模型在98.7%的情境下會主動拒答潛在危害問題,顯示該系統具備高度有效性。

然而,OpenAI也坦言,目前模擬測試無法涵蓋「使用者在遭拒後不斷嘗試變形提問」的情境,因此未來仍需人類輔助監管。OpenAI強調,雖然O3與O4-mini尚未達到其內部定義的「高風險門檻」,但其在生化風險回答上的敏感度高於GPT-4及其他舊版模型。

此次安全升級亦是OpenAI強化其「AI風險預備機制(Preparedness Framework)」的一環,該架構將持續追蹤AI技術在協助化學、生物、核子與網路攻擊等領域的潛在濫用情境,並據此調整產品開發與發布策略。

OpenAI尚未釋出本週剛發布的「GPT-4.1系列」相關安全報告,引發外界質疑其在模型升級過程中是否仍維持足夠的透明度與審慎程序。此外,負責O3模型行為測試的外部紅隊合作夥伴Metr表示,其實際測試時間相當有限,恐影響整體風險評估品質。

在業界逐步引入「自我審查機制」的同時,研究社群普遍呼籲各家AI巨頭必須設立更高門檻,與明確訂定風險管控規範;尤其當AI已具備模擬生化製程、毒理交互作用等能力時,如何從模型設計、訓練、應用到回應層層設限,將關乎社會對於AI信任的立足點。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

《音樂:言語之源,萬象之母,關於「音樂」奧義的三段...

墨新聞|記者韋石/綜合報導 記者韋石/綜合報導 ...

命理乾坤 您善於理財嗎?

今天我們且從紫微斗數裡的「財帛宮」來探討您是否是屬於善於理財的族群,亦或是屬於不善於理財的族群。因為「財帛宮」代表一個人的賺錢能力和花錢態度,也是進財的管道。

台幣升值帶動AI家電熱潮 家電展萬元起再享補助

暑假將至,氣溫與電費同時高漲,帶動全台家電換新潮,「第26屆台北3C數位影音家電展」7月4日至7日於台北世貿登場,集結LG、DYSON、Toshiba、三星、Panasonic、Sony等近百家品牌,從AI語音冰箱、智能滾筒洗衣機、百吋AI顯示器到掃地機器人一應俱全。本屆展場不僅祭出萬元起跳優惠,更搭配政府汰舊換新補助最高省2萬元,再加上台幣升值利多,新機價格平均再降一成,吸引不少消費者搶先出手,為家中升級智慧節能家電。

劉書宏讓丁寧心跳加速 為她提前慶生

墨新聞|記者梁偉華/台北報導劉書宏(右)讓丁寧(左...

點外送不用信用卡也能付!foodpanda x 全...

在宅經濟盛行的時代,外送早已成為日常生活的必備服務,看準這股龐大的消費需求潛力,全支付與外 foodpanda 今(7/1)日正式宣布雙方共同合作,首度在台灣實現電子支付與外送平台的跨界整合。這次合作不僅讓全支付 600 萬會員能在 foodpanda 平台上使用帳戶或銀行付款,還首創「無信用卡也能付款」的場景,為 Z 世代、銀髮族等不同族群打開便利支付的大門,也成功串聯起外送與線上、線下零售的全齡全場景支付生態。。