OpenAI升級AI風險監控 新系統鎖定生化武器生成指令防濫用

商傳媒|記者責任編輯/綜合外電報導

為了防範日益提升邏輯推理與生成能力的AI模型遭濫用,OpenAI近日宣布針對最新模型O3及O4-mini,部署一套名為「安全導向推理監控器(Safety-focused Reasoning Monitor)」的系統,能在回應使用者生物與化學風險內容時進行即時過濾與阻擋,防止模型被用於協助開發生化武器等潛在風險用途。

根據OpenAI最新公布的安全報告,O3與O4-mini在多項推理與知識生成任務中,展現顯著優於舊版模型(如GPT-4、o1)的能力;尤其在回答與「製造特定類型生物武器」相關提問時,O3的表現格外強勁,因此也引發潛在濫用風險。

為了防止有心人士挪為惡意用途,OpenAI投入逾1,000小時由紅隊(Red Team)針對O3、O4-mini模擬各類高風險指令,訓練AI判斷是否拒絕提供建議。根據測試結果,當安全監控邏輯開啟時,模型在98.7%的情境下會主動拒答潛在危害問題,顯示該系統具備高度有效性。

然而,OpenAI也坦言,目前模擬測試無法涵蓋「使用者在遭拒後不斷嘗試變形提問」的情境,因此未來仍需人類輔助監管。OpenAI強調,雖然O3與O4-mini尚未達到其內部定義的「高風險門檻」,但其在生化風險回答上的敏感度高於GPT-4及其他舊版模型。

此次安全升級亦是OpenAI強化其「AI風險預備機制(Preparedness Framework)」的一環,該架構將持續追蹤AI技術在協助化學、生物、核子與網路攻擊等領域的潛在濫用情境,並據此調整產品開發與發布策略。

OpenAI尚未釋出本週剛發布的「GPT-4.1系列」相關安全報告,引發外界質疑其在模型升級過程中是否仍維持足夠的透明度與審慎程序。此外,負責O3模型行為測試的外部紅隊合作夥伴Metr表示,其實際測試時間相當有限,恐影響整體風險評估品質。

在業界逐步引入「自我審查機制」的同時,研究社群普遍呼籲各家AI巨頭必須設立更高門檻,與明確訂定風險管控規範;尤其當AI已具備模擬生化製程、毒理交互作用等能力時,如何從模型設計、訓練、應用到回應層層設限,將關乎社會對於AI信任的立足點。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

彌合大罷免裂痕 孫健萍籲總統召開國是會議:打破憲政...

墨新聞|記者游宏琦/高雄報導【記者游宏琦/台北報導...

出國自由行,旅遊英文準備好了嗎?

暑假往往是海外旅遊的高峰期,根據去年媒體雜誌以上萬筆問卷調查製作的公示資料顯示,選擇自由行的比例高達75%顯示旅遊型態的轉變。自由行勢必會碰到「語言溝通」、「問題即時應對」等的問題,沒有翻譯和固定的流程可以進行處理,真正考驗臨場應變能力以及「英文實戰力」。

智冠集團揭示ChinaJoy參展亮點 一站式服務列...

「2025 ChinaJoy 中國國際數碼互動娛樂展覽會」將於本週五(8/1)盛大展開,智冠集團今(7/28)日搶先公開參展展區設計圖,預告將以整合集團旗下12項服務為核心,打造「一站式服務列車」的展出主軸,展現數位娛樂供應鏈整合能力。此次展出將涵蓋遊戲開發、廣告行銷、雲端解決方案、金流服務與社群營運等多元領域,呈現智冠在數位娛樂生態系的全方位佈局。

冼迪琦化身一日店長現身漫博 領軍 Logitech...

Logitech G 今夏展開「夏日玩家行動」,於 7 月 27 日邀請 Logi PLAY 台港形象大使冼迪琦(小迪)在漫畫博覽會擔任一日店長,活動現場氣氛熱烈,小迪以藍色學院制服登場,與粉絲親密互動、合影並送出限量周邊與簽名寫真,大方展現電競大使的青春魅力與親和力。現場湧入大量粉絲排隊應援,展現高人氣。此次活動為 Logitech G 暑期活動揭開序幕,主打結合娛樂與科技的多元互動體驗。

發哥看周台英被判「足球死刑」之惡劇(一) 台英「罪...

發哥看周台英被判「足球死刑」之惡劇(一) 台英「罪...