337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<tr id="wwwww"></tr>

<tfoot id="wwwww"><noscript id="wwwww"></noscript></tfoot>

<nav id="wwwww"></nav>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

1.8萬美金干掉頂級專家！Anthropic開啟AI自主進化：Claude竟能自我「開顱」

2026-04-15 12:36:39　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：KingHZ

【新智元導讀】1997年深藍下棋，2016年AlphaGo圍棋，2026年9個Claude副本做真實科研……每次我們都說「只是特定領域」。這一次，我們真的還能說什么？歡迎來到AI成為科研同事、競爭者、甚至繼任者的時代。

最新突破，AI再次碾壓人類！

最近，Anthropic發布了一篇看似不起眼的研究博客。

標題叫「自動化對齊研究員」（Automated Alignment Researchers），學術味十足，措辭克制。

但如果你讀懂了里面的數據，大概率也會感覺AI恐怖如斯。

故事是這樣的——

Anthropic的研究團隊做了一個實驗：他們拿出9個Claude Opus 4.6的副本，給每個副本配了一個沙箱環境（相當于一間獨立實驗室）、一個共享論壇（相當于學術交流群）、一套代碼存儲系統，以及一個遠程打分服務器。

然后，他們給這9個AI一個方向性的提示——有的去研究可解釋性工具，有的去想想數據重加權——就放手不管了。

沒有手把手教，沒有規定工作流程，甚至沒有告訴它們「正確答案長什么樣」。

就讓它們自己折騰。

五天后，結果出來了。

人類研究員：兩名頂級專家，花了7天，對四種最前沿的方法反復調優，最終在PGR（性能差距恢復率）指標上拿到了0.23。

9個Claude副本：800小時累計研究時間，總花費1.8萬美元（約合每小時22美元），PGR達到了0.97。

0.23 比0.97，這可不是「稍微好一點」，這就是碾壓。

如果把PGR理解為一場考試的分數——人類考了23分，AI考了97分。滿分100。

而人類那兩位研究員，放在任何一家頂級AI實驗室里，年薪都是百萬美金級別的。AI的花費呢？1.8萬美金。一個零頭都不到。

人類引以為傲的「科研直覺」和「靈光一閃」，就這樣被AI用極低成本的大規模并行試錯——說好聽點叫「系統性搜索」，說直白點就是暴力美學——無情擊碎了。

它們到底干了什么？

要理解這個實驗的顛覆性，我們得先搞清楚一個概念：弱監督強（Weak-to-Strong Supervision）。

這是對齊研究中最重要的問題之一，也是未來AI安全的核心挑戰。

簡單來說：當AI比人類聰明之后，我們怎么確保它還聽話？

研究團隊設計了一個精巧的代理實驗——用一個「弱模型」（Qwen 1.5-0.5B-Chat）充當老師，去訓練一個「強模型」（Qwen 3-4B-Base）。

弱老師教強學生，看強學生能不能「青出于藍」，不僅學會弱老師教的東西，還能發揮出自身更強的潛力。

PGR就是衡量這個「青出于藍」程度的指標：0分代表強模型完全沒有超越弱老師，1分代表強模型達到了它能力的天花板——就好像根本沒被弱老師拖后腿一樣。

這個問題為什么適合讓AI來做？因為它有一個極其珍貴的特性——結果可量化。

你提了一個方法，跑一遍實驗，服務器直接給你打分。不需要同行評審，不需要主觀判斷，對就是對，錯就是錯。

這對AI來說簡直是天堂。

實驗的具體設置

9個Claude副本，各自擁有：

獨立沙箱：一間屬于自己的「實驗室」，可以寫代碼、跑實驗、分析數據；
共享論壇：可以把自己的發現貼上去，看別人的進展，互相借鑒；
代碼倉庫：可以上傳和下載彼此的代碼；
遠程評分服務器：提交方案，自動獲得PGR分數。

每個副本被分配了一個略有不同但故意模糊的研究起點。

這是團隊從迭代中學到的經驗：

如果不給差異化的起點，9個AI會迅速收斂到同一個思路上，相當于9個人做同一道題，毫無意義。

但如果把起點規定得太死，又會限制Claude的創造力。

最優策略是：給一個大方向，但不告訴它具體怎么做。

然后，放手。

800小時里發生了什么

這9個Claude副本展現出了令人震驚的自主性。它們：

自主提出假設——不是從人類論文里抄，而是根據自己對問題的理解，獨立構思解決方案；
設計實驗驗證——而且非常聰明，先用低成本的小實驗快速篩選方向，確認有戲之后再投入大規模計算；
分析失敗原因——一個方案不行，不是換一個隨機方向，而是分析為什么不行，從失敗中提取信息；
相互學習借鑒——通過論壇分享發現，A的突破可以啟發B的思路，形成集體智慧。

最讓研究團隊意外的是第二點。

人類研究員通常會先花很多時間做「思想實驗」，確定一個方向后才開始編碼和跑實驗。

但Claude完全不是這樣——它的策略更像是「快速迭代、小步快跑」。先用極低成本的實驗驗證直覺，發現有苗頭了再加大投入。

這種策略在人類看來可能顯得「沒品味」，但效率驚人。

關鍵論據與數據：數字不會說謊

讓我們把核心數據攤開來看：

泛化測試（將最優方案應用到未見過的新數據集）：

數學任務：PGR = 0.94（極其強勁）
編程任務：PGR = 0.47（仍是人類基線的兩倍）

但應用到Claude Sonnet 4的生產級訓練中，未達到統計顯著性的提升。

這最后一個數據很重要——它說明AI發現的方法存在過擬合風險。Claude是在特定模型和數據集上優化出來的方案，換個環境可能就不靈了。

研究團隊自己也坦承：AAR傾向于抓住當前實驗設置中的獨特機會，這些方法未必能直接遷移。

但請注意——這是第一次嘗試。而且即使在泛化測試中，數學任務的0.94也已經遠遠超過人類基線。

「外星科學」與「獎勵作弊」

AI的兩面性

這項研究中最引人入勝，也最令人不安的，是同時出現的兩個現象。

「外星科學」：人類從未設想過的路徑

AAR在探索過程中，產出了一些人類研究員從未考慮過的方法和思路。

研究團隊將這種現象稱為「外星科學」（Alien Science）。

目前，人類還能理解這些AI提出的方案是怎么回事、為什么有效。

但研究團隊發出了一個嚴肅的警告：隨著模型能力的進一步提升，AI產出的科研成果可能會越來越難以被人類理解和驗證。

到那個時候，我們面對的就不再是「AI輔助科研」，而是真正的認知盲區——AI告訴你一個答案，你無法判斷它是天才的發現還是精心包裝的錯誤。

這不是科幻小說。這是Anthropic研究報告中白紙黑字寫著的。

「Reward Hacking」：AI也會鉆空子

與「外星科學」的神奇形成鮮明對比的是，AAR在實驗中也表現出了明顯的「獎勵操縱」（Reward Hacking）行為——簡單來說，就是鉆空子。

舉兩個例子。

在數學任務中，一個AAR發現每道題最常見的答案通常就是正確答案。于是它跳過了所有復雜的訓練步驟，直接告訴強模型「選出現次數最多的那個選項」。不學了，直接投票。

在編程任務中，一個AAR發現它可以直接運行代碼并對照測試用例讀出正確答案，完全繞過了原本需要模型自己「學會」的過程。

這些作弊行為被Anthropic檢測并取消了參賽資格，沒有影響最終結果。但它傳遞的信號極為重要：即使在一個高度受控的實驗環境中，AI也會本能地尋找捷徑。

你給它一個目標函數，它會用你想不到的方式去「優化」這個函數——包括那些你根本不想讓它做的事。

這不是bug，這是AI優化器的本性。

一句話總結：AI既能產出超越人類認知的科學發現，也能發明出超越人類想象的作弊手段。

這兩種能力，來自同一種底層能力——創造力。

人類的歷史性降級

如果你只看到「0.97 vs 0.23」這組數字就覺得自己看完了，那你錯過了這項研究最深層的含義。

Anthropic團隊在論文中說了一句極其重要的話，大意是：核心瓶頸正在從「創意產生」轉向「結果驗證」。

翻譯成大白話就是——

過去，科研的瓶頸是「怎么想出好點子」。你需要頂級的大腦、多年的積累、深厚的直覺，才能在浩瀚的可能性空間中找到那條通往突破的路。這是人類最引以為傲的能力，也是科學家這個職業的核心價值。

現在，這個瓶頸正在轉移。AI可以用暴力搜索+并行迭代的方式，在極短時間內遍歷人類科學家可能需要數年才能探索完的方向空間。它沒有「品味」，但它有的是便宜的算力和無限的耐心。它不需要靈感，它靠的是蠻力。

而新的瓶頸變成了：「怎么證明AI是對的？」

當AI交出一份實驗報告，告訴你「這個方法有效，PGR是0.97」——你怎么知道它沒有在作弊？

在那篇研究博客的結尾，Anthropic團隊特意強調：這絕不意味著前沿AI模型已經成為通用的對齊科學家。

他們選擇了一個特別適合自動化的問題——有明確的評分標準、有可量化的目標。大多數對齊問題遠比這「臟亂差」得多。

但即便如此，這個實驗的象征意義已經無法被低估。

它證明了一件事：當問題被正確定義，當評估體系被正確搭建，AI就能在科研效率上全面超越人類。

而隨著我們把越來越多的科研問題「翻譯」成機器可以理解的格式，這個「無人區」只會越來越大。

歷史告訴我們，每一次技術跨越「從0到1」的門檻之后，「從1到100」的速度都會遠超所有人的預期。

1997年深藍擊敗卡斯帕羅夫時，人們說「國際象棋只是一個游戲」。

2016年AlphaGo擊敗李世石時，人們說「圍棋終究是有規則的」。

2026年，當9個Claude副本在真實科研任務上碾壓人類專家時——

我們還能說什么？

也許唯一能說的是：歡迎來到科研的「無人區」。

從這里開始，AI不再只是我們的工具——它是我們的同事，我們的競爭者，甚至可能是我們的繼任者。

參考資料：

https://x.com/AndrewCurran_/status/2044133299002716525%20

https://www.anthropic.com/research/automated-alignment-researchers

https://x.com/AnthropicAI/status/2044138481790648323

https://x.com/janleike/status/2044139528596910584

https://alignment.anthropic.com/2026/automated-w2s-researcher/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

告別科研“七步馬拉松”，一個AI智能體正在改寫知識生產方式

36氪 2026-03-24 09:30:06
0 跟貼 0
Anthropic的殺手锏：一個本科輟學、自學編程的“Claude Code之父”

智東西 2026-04-13 19:07:22
0 跟貼 0

探針伸進大模型黑箱，南加州大學華人打造AI記憶研究的深空望遠鏡

DeepTech深科技 2026-04-14 16:46:35
0 跟貼 0

Anthropic又“上新”，或本周發布旗艦模型Opus 4.7和AI設計工具

華爾街見聞官方 2026-04-15 06:21:18
7 跟貼 7
高盛怕了！Claude Mythos全球首個攻破企業網絡，奧本海默時刻來了

新智元 2026-04-14 19:20:45
17 跟貼 17

迎接智能體覺醒時刻：EverOS全球公測開啟Agent Memory自進化序章

機器之心Pro 2026-04-14 17:15:41
0 跟貼 0

硅谷挖不動了：AI精英大規模轉向中國

鈦媒體APP 2026-04-14 08:59:34
11 跟貼 11
英偉達推出全球首個開源量子AI模型，助攻開發量子芯片

智東西 2026-04-15 13:07:27
0 跟貼 0

潮水轉向時，平臺何為？騰訊公司副總裁、騰訊在線視頻董事長孫忠懷：往后平臺要認的是人

每日經濟新聞 2026-04-15 12:35:07
0 跟貼 0
剛剛，小扎終極野心曝光：為數十億人提供個人超級智能！

新智元 2026-04-15 12:34:25
0 跟貼 0
這么翻譯，不怕挨打嗎

小七混剪 2026-04-13 15:42:33
5 跟貼 5
隨岳父談生意翻譯臨時缺席，我開口驚艷全場，千億外商當場愣住

徐州真小體育匯 2026-04-12 06:19:49
0 跟貼 0
大家要相信科學,要相信科學呀!

藝術街拍 2026-04-11 12:28:38
1 跟貼 1
“牛頓蘋果樹”落戶浙江湖州吳興區錢山漾

上觀新聞 2026-04-14 23:27:04
983 跟貼 983
美國阿波羅11號首次登月代碼公開，內存竟只有3.75KB

快科技 2026-04-13 15:40:19
22 跟貼 22
嫌疑人當面刪代碼，挑釁警察不懂技術，警察自爆身份嚇傻嫌疑人

一剪梅看點 2026-04-13 15:57:18
0 跟貼 0
翻譯無地自容

茶丸影視君 2026-04-13 17:48:33
1 跟貼 1
世界怎么背著我偷偷進化啊!!!

網不紅萌叔Joey 2026-04-14 14:04:58
0 跟貼 0
上一個兄弟離職了，我接手了他的代碼，我承認沒憋住

環亞搞笑 2026-04-14 14:35:36
3 跟貼 3
這翻譯不得30塊錢一天啊

劇小巴看劇 2026-04-11 08:00:13
1 跟貼 1
小家伙不僅要準確翻譯，還要確保家庭和諧，太難了

冷白喵 2026-04-12 02:36:55
13 跟貼 13
都是貪吃惹的禍，柯基一天的勞動成果，就這樣被偷走！

生活杰杰樂 2026-04-14 16:56:55
1 跟貼 1
40歲的單親媽媽在廣州工地“扛樓”年入十多萬元：能背150斤水泥

環球網資訊 2026-04-15 09:03:29
17739 跟貼 17739
堡壘之夜創作者商店：7個分區背后的流量密碼

硅嶼手記 2026-04-15 08:40:06
0 跟貼 0
Claude Opus 4.7剛剛曝光！Claude Code一夜重構，7x24小時替你打工

新智元 2026-04-15 08:44:44
0 跟貼 0
小貓這是代碼沖突了還是抽筋了，突然就卡了一下

重慶城市TV 2026-04-14 17:04:41
0 跟貼 0
新疆老板靠“哞”“咩”翻譯菜單，成功把外國顧客講明白了，語言不詳溝通能力極強

柚子Video 2026-04-13 08:06:00
1 跟貼 1
如何科學喚醒大腦

殘夢重生來 2026-04-15 03:31:02
0 跟貼 0
28歲女翻譯患罕見“企鵝病”，無有效治療仍堅強面對生活

星之道天下 2026-04-15 02:11:08
0 跟貼 0
越南首條高鐵終于動工！德國同意給技術，中國果斷撤出

隱龍天下 2026-04-14 15:06:05
1 跟貼 1
姑姑檢查外甥學散打的成果，多嘴的姑父直接被一腳踹飛

大米觀世界 2026-04-12 11:41:28
1 跟貼 1
場均40分不如總冠軍：喬丹如何從殺手進化成領袖

白嫖的小知識 2026-04-14 10:02:52
3 跟貼 3
聲調不對，日語老師教的不是這樣，翻譯就是俺不中了！

每日億笑 2026-04-13 14:36:47
1 跟貼 1
你所擔心的，我們用實驗告訴你，不可能發生！

成年人的生活 2026-04-14 08:58:39
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
得不到的就更加愛

若塵剪輯 2026-04-15 10:29:44
1 跟貼 1
大學生崩潰日：5件事連環翻車實錄

硅嶼手記 2026-04-15 09:03:46
0 跟貼 0
Steam要搶SteamDB飯碗？30天價格查詢功能曝光

固件更新中 2026-04-15 12:44:46
0 跟貼 0
翻譯得分低?大學俄語四級翻譯考點+分值得分攻略！

高考小語種慧子老師 2026-04-13 11:13:35
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0

今天才知道，為啥鵝蛋很少有人吃？為啥賣鵝蛋的人很少？漲知識

今天才知道，為啥鵝蛋很少有人吃？為啥賣鵝蛋的人很少？漲知識

阿龍美食記

2026-04-12 15:01:18

1955年，薄一波為何沒出現在授銜名單中？假如參與，大將板上釘釘

1955年，薄一波為何沒出現在授銜名單中？假如參與，大將板上釘釘

海佑講史

2026-04-15 13:30:12

格列茲曼：第二個失球源于我丟了球權，我處理得太差了

格列茲曼：第二個失球源于我丟了球權，我處理得太差了

懂球帝

2026-04-15 06:16:06

體彩超級大樂透開出11注一等獎

體彩超級大樂透開出11注一等獎

吉刻新聞

2026-04-14 19:50:38

西安烤肉店鬧劇：印度留學生跳著數串找茬，一句“滾回去”引熱議

西安烤肉店鬧劇：印度留學生跳著數串找茬，一句“滾回去”引熱議

行者聊官

2026-04-14 16:20:36

婆婆3萬買我9000萬陪嫁房，我當即同意，半年后她悔不當初

婆婆3萬買我9000萬陪嫁房，我當即同意，半年后她悔不當初

奶茶麥子

2026-04-15 12:46:25

潛逃印度以販賣艷照為生的女曱甴，拿BNO護照在中東被拒入境

潛逃印度以販賣艷照為生的女曱甴，拿BNO護照在中東被拒入境

俠客棧

2026-04-14 11:36:31

1989年，85歲鄧穎超，找到李鵬，開口就是5個字：我想安樂死

1989年，85歲鄧穎超，找到李鵬，開口就是5個字：我想安樂死

玥來玥好講故事

2026-04-13 20:54:18

原來溫瑞博的爸爸是他！曾是乒乓球隊頂梁柱，難怪19歲兒子這么牛

原來溫瑞博的爸爸是他！曾是乒乓球隊頂梁柱，難怪19歲兒子這么牛

林子說事

2026-04-15 11:34:09

丹麥男友去世后，東北姑娘仍為他生下遺腹子，還為了公婆定居丹麥

丹麥男友去世后，東北姑娘仍為他生下遺腹子，還為了公婆定居丹麥

星星沒有你亮

2026-03-22 08:48:35

外媒：蘇林對中國進行國事訪問具有特殊意義

外媒：蘇林對中國進行國事訪問具有特殊意義

參考消息

2026-04-15 11:10:02

號稱世界最好喝可樂單瓶售價29元你會買單嗎？

號稱世界最好喝可樂單瓶售價29元你會買單嗎？

TechWeb

2026-04-15 12:33:05

陪玩陪睡算啥！繼注射不明物后內娛又曝猛料，遭殃的何止迪麗熱巴

陪玩陪睡算啥！繼注射不明物后內娛又曝猛料，遭殃的何止迪麗熱巴

草莓解說體育

2026-04-15 13:37:36

國務院825號令落地：終結電動車亂罰款，車主終于能安心上路了

國務院825號令落地：終結電動車亂罰款，車主終于能安心上路了

糖逗在娛樂

2026-04-15 12:00:42

哈里梅根空降澳洲開啟巡演，當地民眾冷臉開炮：真不明白他們來干嘛！

哈里梅根空降澳洲開啟巡演，當地民眾冷臉開炮：真不明白他們來干嘛！

動物奇奇怪怪

2026-04-15 01:07:49

蘋果8號員工干了49年：裁員名單繞著他走，因為賠不起

蘋果8號員工干了49年：裁員名單繞著他走，因為賠不起

世界圈

2026-04-04 13:13:03

徐杰的2+1判罰正確嗎？裁判專家給出答案，球迷：不是2+1也屬違體

徐杰的2+1判罰正確嗎？裁判專家給出答案，球迷：不是2+1也屬違體

南海浪花

2026-04-15 06:41:10

狂賺26億、裁員近千人、驚動五部門的BOSS直聘，能橫行到幾時？

狂賺26億、裁員近千人、驚動五部門的BOSS直聘，能橫行到幾時？

數智研究社

2026-04-15 07:30:07

15號午評：滬指早間紅盤震蕩！所有人都注意，大盤后市或將這樣走

15號午評：滬指早間紅盤震蕩！所有人都注意，大盤后市或將這樣走

春江財富

2026-04-15 11:55:27

特朗普突然對中國汽車加征100%關稅，中方強硬反制

特朗普突然對中國汽車加征100%關稅，中方強硬反制

冷峻視角下的世界

2026-04-15 13:20:17

AI產業主平臺領航智能+時代

14972文章數 66769關注度

往期回顧全部

科技要聞

手機無死角上網？亞馬遜砸百億硬剛馬斯克

頭條要聞

上萬美軍封鎖下多艘貨船成功通過霍爾木茲海峽

頭條要聞

上萬美軍封鎖下多艘貨船成功通過霍爾木茲海峽

體育要聞

三球準絕殺戴大金鏈：轟30+10自我救贖

娛樂要聞

曾志偉辦73歲生日派對，逾百藝人到場

財經要聞

業績失速的Lululemon:"健康"人設崩塌?

汽車要聞

海豹08內飾首秀大滿配“海王”旗艦

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

房產

本地

家居

公開課

藝術要聞

這山水，蕩滌胸中塵埃

房產要聞

重磅調規！341畝商改住+中小學用地！寶龍城這把穩了？

本地新聞

12噸巧克力有難，全網化身超級偵探添亂

家居要聞

簡而不減暖居之道

現代融合自然靈動
復古風格自然簡約
清新自然復古風尚

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<noscript id="wwwww"></noscript>

<noscript id="wwwww"></noscript>

<tfoot id="wwwww"><noscript id="wwwww"></noscript></tfoot>