前 OpenAI 研究員揭「卡爾帕西循環」 AI 代理程式兩天完成 700 次實驗

商傳媒|責任編輯/綜合外電報導

前 OpenAI 核心成員,現為獨立 AI 研究員暨 Eureka Labs 創辦人的安德烈·卡爾帕西(Andrej Karpathy),日前在社群平台 X 上分享一項引人注目的實驗成果,他開發的「autoresearch」系統,讓一個 AI 程式代理在短短兩天內,執行了 700 次實驗,成功優化了小型語言模型(LLM)的訓練流程,此舉被業界稱為「卡爾帕西循環」(Karpathy Loop),並預示著 AI 研發模式的重大變革。

根據安德烈·卡爾帕西的描述,這項實驗的核心是讓一個 AI 程式代理負責改善小型語言模型的訓練過程。該代理程式持續運作兩天,共完成了 700 次不同的實驗,並從中發現了 20 項可提升訓練速度的優化方法。當這些優化策略被應用於一個規模稍大但仍屬小型的語言模型時,訓練時間成功縮短了 11%。

這項成果很快引起 Shopify 執行長托比亞斯·呂特克(Tobias Lütke)的關注。呂特克也在 X 上分享,他運用「autoresearch」系統來優化公司內部數據的 AI 模型,讓代理程式一夜之間執行了 37 次實驗,最終實現了高達 19% 的效能提升。

「autoresearch」系統之所以廣受討論,在於它與科幻作品中「自我改進型 AI」的概念有著相似之處。部分 AI 安全研究人員曾擔憂,AI 系統若能實現「遞迴式自我改進」(recursive self-improvement),持續優化自身程式碼與訓練方式,可能導致 AI 能力快速超越人類智慧,引發所謂的「智慧爆炸」。

對此,卡爾帕西澄清,「autoresearch」系統中的 AI 代理程式並非直接優化其自身的訓練機制,而是針對另一個規模較小、複雜度較低的 AI 模型,調整其訓練程式碼及初始神經網路設定。不過,他強調這項實驗對未來 AI 實驗室的運作方式影響深遠,將加速 AI 的研究進程,並預期「所有大型語言模型前沿實驗室都將採行此道」,將其視為「最終的魔王戰」。

科技出版物《The New Stack》的首席分析師 Janakiram MSV 將卡爾帕西的這項創舉命名為「卡爾帕西循環」,並歸納其三個核心要素:一個能修改單一檔案的代理程式、一個可客觀評估並作為優化目標的單一指標,以及每個實驗皆設有固定的時間限制。

儘管有批評意見認為,卡爾帕西的「autoresearch」與行之多年的「自動機器學習」(AutoML)技術有相似之處,AutoML 也透過優化循環與實驗來尋找最佳的 AI 資料、模型架構並進行參數調校。但卡爾帕西反駁,傳統 AutoML 系統,例如神經網路架構搜尋(neural architecture search),其效能與其開發的系統相較之下微不足道。他強調,「autoresearch」採用的是「真正的 LLM,能夠編寫任意程式碼,從過往實驗中學習,並能存取網路」,兩者不在同一層次。

展望未來,卡爾帕西設想下一階段的「autoresearch」將從單一代理程式的連續改進,發展成為多個 AI 代理程式能同時、大規模且非同步地協同工作,探索不同的優化路徑和實驗。他表示,目標不再是模擬一位博士研究生的工作,而是要模擬整個研究社群的運作模式。

頭條留言
商傳媒
商傳媒https://sunmedia.tw/
商傳媒是一個提供財經、科技、智慧製造、醫療、產業資訊,為主要服務內容的金融、科技網路媒體,其宗旨在於提供台灣中小企業一個產品新聞的平台,未來更將推廣至世界各國!
- 廣告 -
- 廣告 -

最新文章

「我的文化、我的聲音」 基隆培育原民兒少勇敢表達意...

墨新聞|記者江育銓/基隆報導  ...

孝馨獎連結藝術與孝親 張善政肯定忠恕道院公益貢獻

桃園市長張善政昨(30)日上午前往龜山...

若水學院威廉導師《個人IP變現育成班 》引發關注 ...

在AI時代與自媒體浪潮全面崛起的今天,越來越多人開始意識到一件事:「萬般帶不走,唯有個人品牌隨身。」5月30日,由若水學院創辦人威廉導師主導的《第一屆 個人IP變現育成班》,吸引眾多創業者、講師、愛學習者與專業人士參與,現場學習氛圍熱烈,掀起一波「個人品牌變現」話題。若水學院長期以教育訓練與知識變現系統為核心,協助學員建立個人影響力與商業價值。

助弱勢學生安心就學! 鑫威利股份有限公司捐贈台中市...

墨新聞|記者馬源培/台中報導為關懷學子教育、善盡企...

總投入3.6億打造4公里綠色廊道! 中市建設局梅川...

墨新聞|記者馬源培/台中報導台中市長盧秀燕重視人本...