337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

AI學會左腳踩右腳自進化?Meta華人新研究改寫Agent法則

0
分享至


新智元報道

編輯:元宇

【新智元導讀】過去Agent比誰更會干活,現在可能要比誰更會變強。

AI已經學會「左腳踩右腳上天」了?

Meta的一項最新研究表明:AI已經開始碰自己的「進化引擎」了。

華人學者Jenny Zhang在Meta實習期間,聯合Meta AI、UBC、紐約大學等機構研究者,提出了一種新的智能體框架:HyperAgents(DGM-H。


https://arxiv.org/abs/2603.19461

這項工作的重點,不是再造一個更能干活的Agent。

它瞄準的是更高一層的問題:

如果AI已經能夠修改自己的任務解法,那它能不能連「自己以后該怎么修改自己」這件事,也一并改掉?

論文給出的答案是:可以。

而且,這不再是概念推演,而是已經在實驗中跑通的系統能力。

HyperAgents做的關鍵一步,是把「執行任務的 agent」和「負責改進 agent 的 meta agent」合并進同一個可編輯程序里,作者將之稱為hyperagent。


DGM依賴任務與自修改能力的對齊,而DGM-H不再需要這種對齊

在新框架下,系統不只會修改任務求解邏輯,還開始修改未來生成改進方案的機制本身。

論文把這種能力稱為metacognitive self-modification,也就是:元認知自我修改。

過去行業競爭的是:誰的Agent更會干活。

而HyperAgents 指向的下一階段則可能是:誰的Agent更會變強,而且會越來越會變強

以往的「自我進化」

其實還只是半手工

這篇論文,指出了上一代自我進化路線的天花板。

去年的Darwin G?del Machine(DGM),已經很驚艷。

它能在coding任務中不斷自改代碼、自我驗證、把成功版本存進archive,再從這些「墊腳石」里繼續往前長。

論文披露,DGM在SWE-bench上能從20.0%拉到50.0%,在Polyglot上從14.2%拉到30.7%。

但問題在于,DGM之所以能在coding里成立,是因為「評估」和「自我修改」本身也都是coding任務。

寫代碼更強了,反過來就更會改自己的代碼。任務能力和自我改進能力,在這個場景里是對齊的。

然而一旦離開coding,這個對齊關系就斷了。

比如評審論文、設計機器人獎勵函數、給IMO級數學解答打分,這些任務做得更好,不等于你就更會修改自己的元機制。

HyperAgents論文最核心的一招,就是直接把這個假設砍掉:

既然任務能力和自我改進能力未必天然對齊,那就不要再把meta層寫死。

這說明過去很多「自我進化」系統,本質上還是在人為設定的軌道里進化。

HyperAgents真正改變的,是改變機制本身。

HyperAgents新在哪里?

表面上看,HyperAgents只是多了一個meta agent。

但真正值得注意的是,它把task agent和meta agent合成了同一個可編輯程序。

以前的DGM里,系統有一個手工設計的instruction-generation機制,負責根據過往表現決定下一步怎么改。

這一步不能被改,所以它反而成了整個系統的瓶頸。

HyperAgents的做法是把這部分也納入可修改范圍。

換句話說,AI不只是改自己的答案、自己的工具、自己的流程,它開始改「自己怎么提出修改建議」。

DGM里上層機制基本固定,DGM-H里meta層本身也進入可演化空間,也就是說,它是一個會經營自己進化過程的系統。

所以,HyperAgents做的不是「再加一個Agent」,而是取消了「上層永遠不變」這個默認前提

自我改進開始跨域遷移

在coding任務中,HyperAgents在Polyglot 上的提升,與原始DGM處在同一量級:50-task訓練子集從0.140提升到0.340,完整benchmark從0.084提升到0.267。

換句話說,它并不是只靠犧牲泛化來換局部成績。

更關鍵的是,它不只在coding任務成立,還能在paper review、robotics reward design等非coding任務上繼續自我改進。


在paper review上,初始agent在測試集得分為0.0,DGM-H提升到0.710;在robotics reward design上,則從0.060提升到0.372。

更關鍵的是,這些提升不僅出現在訓練任務里,也轉移到了held-out test tasks。

與此同時,對照組也很說明問題:去掉self-improve,效果明顯變弱;去掉open-ended exploration,系統也很難取得有意義進展;原始DGM直接搬到非coding 域幾乎失效,只有經過人工定制成DGM-custom后,才恢復競爭力。

這說明HyperAgents 的關鍵價值,不在于某一個benchmark多拿了幾個點,而在于它把原本依賴coding場景對齊關系的自我改進,推進成了一個能在非coding任務中運行的框架。

更值得注意的是遷移實驗。


作者把在paper review和robotics任務中演化出來的hyperagents,轉移到Olympiad-level math grading。

雖然這些轉移體自身初始得分仍接近0,但它們作為「生成更優agent的meta agent」,卻能在50輪內把最好生成體推到0.630,對應imp@50從0拉到0.630。

相比之下,來自DGM-custom的轉移體幾乎沒有這種能力。

換句話說,遷移過去的,不只是任務經驗,而是「如何持續變好」的能力。

它開始自己長基礎設施了

很多人看到「自我進化」會以為,無非是AI自己改prompt、調工作流、加幾個規則。

但論文展示給我們、最讓人感到沖擊力的一個地方在于:它開始自己長基礎設施了。

DGM-H在迭代中會自動長出performance tracking、persistent memory、evaluation analysis、compute-aware planning這些基礎設施。



論文中甚至直接給出了自動生成的性能追蹤器代碼和持久記憶條目:它開始記錄跨代指標、總結哪些代際策略有效、診斷過度修正、制定下一輪改進計劃。

這還不是「日志記錄」那么簡單,系統開始把改進看成一個長期經營過程,而不是一次次孤立的pa?tch。

它不只記錄每一代分數,還會比較趨勢、識別回退,并把跨代經驗沉淀進persistent memory。

正如網友所說,真正讓這一切變成現實的關鍵,恰恰是persistent memory的自主出現。


論文展示的memory示例中寫道:某一代評審準確率更高,但過于嚴苛;另一代平衡更好;下一輪要融合兩者優點。


沒有這層記憶,agent往往只會反復「重新發明輪子」;有了它,過去幾代的有效經驗才第一次能真正沉淀為下一輪改進的起點。

這說明Agent正在從「輸出一個結果」,走向「維護一個持續優化系統」。

這不是AGI宣言

但舊規則確實在失效

當然,這篇論文沒有證明「無限自我進化AI」已經降臨。

作者自己也寫得很清楚:

實驗都在沙箱、資源限制和人工監督下完成;外層循環還有不少部分沒有開放給系統自改,比如任務分布、parent selection、evaluation protocol等;真正無界的open-ended self-improvement,還遠遠沒到。

但風險預警已經出現。

一旦AI開始改自己的改進機制,安全討論就變得重要起來。

論文也專門有一節談風險:隨著系統越來越能開放式地修改自己,它的演化速度可能超過人類審計和理解速度。

今天靠sandbox和人工盯著還能管住,明天未必。


HyperAgents代表了一種新的路線,它可能會改寫Agent競爭。

未來比的不只是誰會調模型、誰會寫workflow、誰會做更強單點工具,而是誰能把「改進能力」本身產品化、系統化、可遷移化。

這將改變AI公司的護城河。

真正的壁壘,可能不再只是參數、算力和數據,而是有沒有一套能跨任務累積經驗、跨運行持續變好的自我改進系統。

也會改變開發者位置。

開發者不再只是寫功能的人,而更像是在設計AI可以繼續自我設計的邊界條件。

最重要的一點,它改寫了AI行業過去默認的一條規則:系統可以變強,但變強的方法由人來定義。

現在,這條規則開始松動了。

作者簡介

Jenny Zhang


Jenny Zhang

Jenny Zhang,現為英屬哥倫比亞大學人工智能博士生,師從Jeff Clune,同時也是Vector Institute研究生,并曾在Meta擔任Research Scientist Intern。

她本科畢業于帝國理工學院,研究方向聚焦開放式進化、強化學習與自我改進AI,代表工作包括《Darwin G?del Machine》《HyperAgents》以及OMNI系列研究。

她的長期目標,是構建能夠自主提出新任務、持續自我提升、不斷演化復雜能力的AI系統。

參考資料:

https://x.com/jennyzhangzt/status/2036099935083618487%20

https://arxiv.org/abs/2603.19461

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
教育要變天了!2026年義務教育4大新規落地,家里有娃的提前準備

教育要變天了!2026年義務教育4大新規落地,家里有娃的提前準備

開心美食白科
2026-04-06 13:14:18
張紫妍被潛規則后自殺!曾同時“接待”4位客人,被玩到無法走路

張紫妍被潛規則后自殺!曾同時“接待”4位客人,被玩到無法走路

小徐講八卦
2026-02-27 14:46:01
很多人只看到大清丟失很多領土,但沒有看到它打下的千萬領土

很多人只看到大清丟失很多領土,但沒有看到它打下的千萬領土

秀心文雅
2026-03-31 09:17:19
朱莉基因殺瘋了!19 歲女兒亮相 MV,五官復刻親媽,全網看呆

朱莉基因殺瘋了!19 歲女兒亮相 MV,五官復刻親媽,全網看呆

橙星文娛
2026-04-04 10:42:55
又賠了兩架C-130!最后時刻,美軍搶走第2名飛行員,伊朗功虧一簣

又賠了兩架C-130!最后時刻,美軍搶走第2名飛行員,伊朗功虧一簣

頭條爆料007
2026-04-05 16:13:58
國內NBL聯賽一大外援已被預定,廣東宏遠前15輪主場賺1.1億元回本為假消息!

國內NBL聯賽一大外援已被預定,廣東宏遠前15輪主場賺1.1億元回本為假消息!

廣東籃球掂
2026-04-06 12:41:19
海王來了!4個孩子有3個母親,如愿征服卡戴珊家族女

海王來了!4個孩子有3個母親,如愿征服卡戴珊家族女

比爾蓋凱
2026-04-06 13:47:58
強登哈爾克島?俄議員警告:若對伊朗用核武,擁核國不再只有9個

強登哈爾克島?俄議員警告:若對伊朗用核武,擁核國不再只有9個

鐵錘簡科
2026-04-06 15:22:08
70歲米歇爾求婚小他17歲的鞏俐:我年入5億,嫁給我!鞏俐:我每周做4次有氧運動,你行嗎?

70歲米歇爾求婚小他17歲的鞏俐:我年入5億,嫁給我!鞏俐:我每周做4次有氧運動,你行嗎?

喬話
2026-04-04 19:18:16
你專業還是我專業!王鑄和張雪吵架事件,再次被扒,評論區沸騰了

你專業還是我專業!王鑄和張雪吵架事件,再次被扒,評論區沸騰了

火山詩話
2026-04-05 12:09:37
日韓股市同步收漲

日韓股市同步收漲

證券時報
2026-04-06 15:14:07
俄羅斯斷供,中國限制出口!印度菲律賓急眼了:早知今日何必當初

俄羅斯斷供,中國限制出口!印度菲律賓急眼了:早知今日何必當初

黑鷹觀軍事
2026-04-06 15:16:52
保密期限終到期,中央首長透露:毛岸英真相,可以向外界公開了

保密期限終到期,中央首長透露:毛岸英真相,可以向外界公開了

歷史點行
2026-03-29 13:38:28
兩記續命三分后丟絕殺!38歲庫里26分鐘29分:右膝似乎并沒痊愈

兩記續命三分后丟絕殺!38歲庫里26分鐘29分:右膝似乎并沒痊愈

顏小白的籃球夢
2026-04-06 12:59:48
伊朗媒體稱多名美軍士兵在營救飛行員的行動中身亡

伊朗媒體稱多名美軍士兵在營救飛行員的行動中身亡

財聯社
2026-04-05 18:42:05
中國代表:安理會必須慎重行事,中東戰事起源是美以襲擊伊朗,避免局勢惡化的根本在于美以停止軍事行動

中國代表:安理會必須慎重行事,中東戰事起源是美以襲擊伊朗,避免局勢惡化的根本在于美以停止軍事行動

每日經濟新聞
2026-04-03 17:23:08
以色列至今都不敢相信,一場戰爭打掉了自己未來50年的國運

以色列至今都不敢相信,一場戰爭打掉了自己未來50年的國運

農夫史記
2026-04-04 20:18:25
亞洲第一賭場新東泰覆滅記:性交易泛濫,富商瘋狂砸錢,揮金如土

亞洲第一賭場新東泰覆滅記:性交易泛濫,富商瘋狂砸錢,揮金如土

談史論天地
2026-04-04 17:30:03
從楊主席訪伊朗受怠慢,聊聊如今為何有伊朗人稱我們“秦腔窮”?

從楊主席訪伊朗受怠慢,聊聊如今為何有伊朗人稱我們“秦腔窮”?

阿胡
2026-03-30 12:52:29
女人默許你“得手”從不主動靠近:這三種默許,已是最明確的信號

女人默許你“得手”從不主動靠近:這三種默許,已是最明確的信號

青蘋果sht
2026-02-22 06:58:10
2026-04-06 16:11:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
14906文章數 66753關注度
往期回顧 全部

科技要聞

前同事被蒸餾成Token,AI能否偷走職場經驗

頭條要聞

伊朗戰爭每天耗資20億美元 美2027財年國防預算創新高

頭條要聞

伊朗戰爭每天耗資20億美元 美2027財年國防預算創新高

體育要聞

球員系列賽大滿貫!趙心童10-3世界第一 加冕賽季第4冠

娛樂要聞

喬任梁離世10年 父母曝舞臺光鮮的背后

財經要聞

美國私募信貸風險:小型次貸危機?

汽車要聞

阿維塔06T快上市了 旅行車還能這么玩?

態度原創

健康
房產
藝術
親子
軍事航空

干細胞抗衰4大誤區,90%的人都中招

房產要聞

小陽春全面啟動!現房,才是這波行情里最穩的上車票

藝術要聞

貴人鳥總部地塊荒了多年,盛榮砸3.2億,蓋成一棟濱江地標!

親子要聞

一定要讓孩子刻在腦子里

軍事要聞

伊朗:在C-130運輸機殘骸中發現一具美軍士兵遺體

無障礙瀏覽 進入關懷版