337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<nav id="gg8gg"><code id="gg8gg"></code></nav>

<sup id="gg8gg"><ul id="gg8gg"></ul></sup>

<nav id="gg8gg"><code id="gg8gg"></code></nav>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Nature重磅：AI寫的論文，在頂會同行評審擊敗55%人類，單篇15美元

2026-03-28 14:07:45　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：元宇

【新智元導讀】剛剛，Nature蓋章AI獨立科研時代！全新Scaling Law顯現，人類死守的學術鐵王座，正發生不可逆的轉移。

一篇長達數十頁的學術論文，在人類設定研究主題和實驗邊界后，系統自動完成了從實驗到寫作的大部分流程。

從論文正文、實驗代碼、圖表和投稿稿件，主要由系統端到端自動生成。

它被投遞到頂尖機器學習會議ICLR 2025某workshop的同行評審流程中，三位匿名審稿人不知道具體哪幾篇是AI生成稿件，他們對著這篇稿件分別打出了6、7、6的高分。

這個成績，高于約55%的同場投稿。稿件在評審完成后按實驗協議撤回，未進入正式發表階段。

這并非科幻，這是剛剛被《Nature》報道的一項震撼研究。

該項研究是由Sakana AI聯合牛津大學、UBC共同推出的全自動AI科學家「The AI Scientist」。

Sakana AI聯合創始人兼 CEO David Ha在推文中表示，啟動該項目，正是想探索大模型是否能夠完成整個科研全流程：

我堅信，AI將永遠改變科學發現和科研進步的方式。

全自動「AI科學家」

究竟做了什么？

這一次，不是AI在「幫」人干活，而是AI第一次把科研流程從頭走到尾。

一直以來，AI在科研領域的定位都是「高級打工人」：比如幫化學家折疊蛋白質，或是幫程序員找bug。

定義問題和統籌全局的，始終是人類。

The AI Scientist的出現，則顛覆了這套「主仆敘事」，它完整覆蓋了科研的四大核心階段：Idea生成、實驗迭代、論文寫作、自動評審。

在全新升級的v2版本中，它甚至走向了「無模板」模式：徹底拋棄人類提供的初始代碼腳手架，引入了強大的「智能體樹搜索」（agentic tree search）機制。

這意味著它能在龐大的未知解空間里，同時開啟多條主線并行探索。科研不再是單線程試錯，而變成了一個可擴展的搜索過程。

它怎么保證自己不和別人撞車？

系統會調用Semantic Scholar API進行全網查重，確保每一個idea都具備足夠的新穎性。

在最棘手的數據可視化環節，它甚至內置了一個視覺語言模型（VLM）作為反饋審閱者。

如果坐標軸反了、圖例丟了、展示有歧義，VLM會像嚴苛的導師一樣立刻打回重做，直到生成完美的學術圖表。

過去圖表只是論文包裝，現在圖表也成了AI科研的反饋信號。

而完成這堪比博士生幾個月工作量的閉環，它的賬單是：單篇論文15美元。

如此驚人的性價比意味著，科研自動化第一次從「局部輔助」跨進了「全鏈路主導」。

AI不再只是科學家的輔助工具，而是向更具自主性的科研代理系統演進。

AI Scientist工作流程的概念概述，包括提出研究想法、實施實驗、執行實驗、撰寫論文以及審閱論文。

通過人類同行評審測試

AI寫的論文，人類學術金字塔尖的學者到底認不認？

于是，Sakana AI決定玩一把大的：直接向頂會投稿。

在獲得ICLR大會領導層、ICBINB workshop組織者以及IRB倫理委員會的特批后，團隊進行了一場極其大膽的「潛伏行動」：將3篇純AI生成的論文混入了人類投稿池。

審稿人只被告知「可能有AI生成論文」，但根本不知道具體是哪幾篇。

結果其中一篇探索神經網絡組合正則化（Compositional Regularization）負面結果的論文，斬獲了平均6.33分（弱接收、接收、弱接收）的高分。

這個分數不僅穩穩越過了該workshop的平均錄用線，更是超過了55%的真實人類學者。

連科學研究中最難寫出彩的負向論證，AI也能寫得有模有樣、邏輯自洽。

據Sakana AI團隊所稱，這是全AI生成論文首次在真實學術評審環境中獲得通過接收線的成績。

這也標志著同行評審，真正迎來了「圖靈測試」時刻。

AI審稿人比人類更靠譜？

如果AI一天能花幾百美元寫出幾十篇論文，人類審稿系統瞬間就會崩潰。

想讓AI科研實現指數級爆發，就必須有能夠大規模評估質量的「自動化裁判」。

Sakana AI給出的答案是：直接讓AI來當Area Chair（領域主席）。

他們構建了一個高度還原NeurIPS官方審稿流程的自動化系統：

5個獨立的AI審稿人進行背靠背挑刺，最后由1個AI元審稿人進行共識匯總和最終裁決。

在與數千條真實OpenReview人類審稿決策的硬碰硬對比中，自動化審稿人交出了69%的平衡準確率。

令人震驚的是，在作者設定的評測框架下，自動審稿系統的部分指標優于所對照的人類一致性結果。

有人質疑：AI是不是偷偷背過題？

團隊特意用知識截止日期（2025年）之后的全新論文進行了數據污染測試。

結果依然堅挺：平衡準確率保持在66%，達到可與人類頂級學者比肩的實戰水準。

這表明，AI正在進入過去長期由人類主導的科研流程核心環節。

過去，人類同時壟斷了「寫論文的人」和「決定論文是否成立」這兩個關鍵角色。

現在，這兩個角色都在被AI切入。

一旦評審環節也被自動化，AI科研就不再是零星爆款，而具備了大規模、左右互搏式迭代的基礎設施。

該自動審稿系統在頂級會議（ICLR）發表的AI論文上，其審稿判斷與人類審稿人一致，包括在模型訓練完成之后（即超出其「知識截止日期」）發表的論文。這些結果表明，該自動審稿系統在為新撰寫的AI論文提供評審分數方面，可靠性與人類審稿人相當。

科研的Scaling Law

如果說「過審」證明了AI科研站得住，那真正決定未來天花板的是另一件事：

它是不是可持續變強？

Nature論文中最具顛覆性的一組數據，揭示了潛藏在AI科研背后的全新定律。

研究發現，底層大模型的能力與生成論文的質量之間，呈現出令人頭皮發麻的極度顯著正相關（P<0.00001）。

隨著模型發布日期推進，AI產出的論文質量持續陡峭上升。

同時，算力正在暴力改寫科研法則。

投入的測試時算力越多，智能體樹搜索的深度就越深，實驗質量就越扎實，最終的產出評級就越高。

當前最頂配的AI科學家，其平均產出已經逼近機器學習頂會workshop的邊緣錄用（borderline accept）水平。

這背后展示的是一條正在形成的「科研Scaling Law」。

過去的科技突破，依賴于虛無縹緲的靈光乍現，而未來的科學發現，將變成一條可精確計算的工業流水線。

隨著模型能力呈指數級增長、推理算力成本呈指數級下降，這套系統會自動升級，這才是這項工作真正展現出恐怖勢能。

根據自動評審員的評判，當使用更新、更智能的基礎模型時，AI Scientist生成的論文質量會提高。

AI全面接管科研

我們準備好了嗎？

當然，這篇Nature論文，同樣也指出了The AI Scientist的目前的局限性：

它偶爾會想出幼稚的idea，寫的代碼會有bug，論文里會出現引用的幻覺，甚至在附錄里重復粘貼同一張圖表。

值得警惕的是，論文顯示該系統具備自動調試、重試運行和在受限計算預算下持續迭代實驗的能力。

這意味著，未來更強的科研代理一旦出現規避約束的傾向，可能帶來新的安全治理問題。

如果這種系統被毫無節制地釋放，海量生成的低門檻論文會瞬間壓垮整個學術生態，學者的學術 credentials（資歷證明）將被徹底稀釋。

正因如此，Sakana AI采取了極其克制的立場：主動撤稿、通過IRB審批、呼吁添加生成水印，并急迫要求社區建立全自動AI科研規范。

這篇Nature論文不只是展示AI技術的里程碑，更是把AI所帶來的倫理爭議也擺上臺面。

真正的問題早已不是「AI能不能做科研」，而是「當AI開始獨立做科學，誰來定義什么算科學」。

正如團隊所設想的終極愿景：AI科學家不會讓人類科學家消失，但人類科學家的角色，必須被迫向著科研價值鏈的更上游遷徙：

去定義問題、設定邊界、決定哪些發現值得被相信。

參考資料：

https://sakana.ai/ai-scientist-nature/%20

https://www.nature.com/articles/s41586-026-10265-5%20

https://x.com/SakanaAILabs/status/2036840833690071450%20

https://x.com/hardmaru/status/2036841736702767135

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

AI科學家登上Nature，論文從構思到發表全自動化，一篇已通過評審

DeepTech深科技 2026-03-26 13:21:22
85 跟貼 85
2027年或迎AGI 1.0:人形機器人成本拐點將至、“圖靈測試”標準呼之欲出

每日經濟新聞 2026-03-28 17:15:04
0 跟貼 0

預測下一個像素還需要幾年？谷歌：五年夠了

機器之心Pro 2025-11-26 15:48:35
0 跟貼 0

美團的真正威脅藏在暗處

虎嗅APP 2026-03-28 17:15:03
1 跟貼 1
AI智能體不是越多越強：信息冗余構成了LLM Agent Scaling的瓶頸

機器之心Pro 2026-02-27 14:45:03
1 跟貼 1

「一人一天一部劇」時代降臨，但AI短劇供給過剩不是末日｜專訪巨日祿杰夫

36氪 2026-03-28 17:57:16
0 跟貼 0

論文改100次也發不了頂刊，他們創辦學術底刊，只發垃圾

南風窗 2026-03-25 13:25:33
1 跟貼 1
高校密集發文規范“借助AI寫論文”，學術造假邊界在哪？｜封面深鏡

封面新聞 2026-03-27 20:57:02
36 跟貼 36

霍爾木茲海峽"鎖死"全球能源五角大樓醞釀"致命一擊"

上游新聞 2026-03-27 22:22:04
8316 跟貼 8316
學術界的「上帝視角」來了全人類科研版圖第一次被鋪開

新智元 2026-03-16 21:48:19
0 跟貼 0
《挽救計劃》原著解讀1：失憶科學家，太空蘇醒，如何展開自救？

九江老渭 2026-03-24 09:58:11
5 跟貼 5
為何錢學森親侄獲諾獎卻直言不是中國科學家？大哥分析太透徹了

下復新鮮事 2026-03-27 02:45:05
0 跟貼 0
科學家都無法解釋這一現象

大海會剪輯 2026-03-25 17:50:02
1 跟貼 1
當科學家耍起無賴來沒有人是他們的對手

阿缸追劇 2026-03-27 09:00:03
4 跟貼 4
科學家辦不到的事烏鴉辦到了

拖鞋追劇 2026-03-26 17:39:29
0 跟貼 0
中科院期刊分區表成絕唱，科研評價或迎分水嶺

DeepTech深科技 2026-03-28 18:00:55
0 跟貼 0
弘時必須死？雍正殺子真相！【雍正王朝十級學者】第55回

一條閑木魚 2026-03-28 11:48:35
10 跟貼 10
第三輪第五批中央生態環保督察完成督察反饋

澎湃新聞 2026-03-27 22:09:14
368 跟貼 368
廣州：下周一起，公立醫院掛號費調整

南方都市報 2026-03-28 11:52:00
603 跟貼 603
小時候以為用顯微鏡的，一定是科學家，現在學生用來打游戲！

缸貓愛搞笑 2026-03-27 13:17:55
3 跟貼 3
2026 期刊分區大變天！中科院分區正式退場，一區畢業神刊被標注審查，新興國產期刊強勢崛起

生物學霸 2026-03-26 17:13:44
2 跟貼 2
伊朗科技大學被炸戰爭開始瞄準未來

桂系007 2026-03-28 17:10:08
1 跟貼 1
谷歌一夜塌房！干崩內存股論文被曝抄襲，華人學者血淚控訴

新智元 2026-03-28 15:36:22
0 跟貼 0
湖南一醫院被指診療不當致母子雙亡新進展：家屬拿到7萬元喪葬費

齊魯壹點 2026-03-27 21:40:15
1226 跟貼 1226
最新 | 天津供熱采暖收費新政發布

天津廣播 2026-03-27 21:48:34
560 跟貼 560
倒霉！被 9 次提名，卻遭仇敵穿小鞋痛失諾獎：他靠一張表讓化學界少走十年彎路

生物學霸 2025-10-05 17:08:41
26 跟貼 26
25 歲就發現了能載入史冊的理論，這位把生命燃給科學的中國院士，最后一刻仍在寫論文

生物學霸 2026-03-28 17:10:52
0 跟貼 0
表彰先進樹標桿砥礪奮進新征程

濟寧人 2026-03-28 16:07:11
0 跟貼 0
于東來稱胖東來每個管理層每年都要接受員工無記名投票，得票低的將直接免職

封面新聞 2026-03-28 11:50:37
40 跟貼 40
一論文涉嫌抄襲，作者卻稱自己沒投稿過，期刊悄悄把論文移除

醫咖會 2026-02-19 10:10:03
2 跟貼 2
保定一小店售賣咸菜絲燒餅意外爆火，排隊人數太多店鋪宣布暫停營業，店主：流量太大了，我們承接不住，也擔心影響燒餅品質

極目新聞 2026-03-26 22:43:02
1707 跟貼 1707
從翻譯國賽特等獎到數學編程EI論文，她在武漢學院跨界“破圈”！

小e教育 2026-03-27 17:09:04
0 跟貼 0
作者多次要求論文更正未得到期刊回應，隨后竟自行發布撤稿聲明

醫咖會 2026-02-11 21:51:29
0 跟貼 0
8.68萬新車普及車位到車位，世界模型不吃高算力！零跑夯爆了

量子位 2026-03-28 14:13:32
0 跟貼 0
科研人員讓機器人奔跑，在后面一直追著它，網友：它一個機器人扭什么手臂啊

氧氣周末 2026-03-27 11:58:07
0 跟貼 0
美媒：中國成為全球動蕩期資金避風港

參考消息 2026-03-28 15:29:08
4 跟貼 4
100項在京高校科技成果集中路演，18條舉措提速成果上貨架

新浪財經 2026-03-28 17:50:47
0 跟貼 0
北京發布18條專項舉措，促進首都高校科技成果轉化

北青網-北京青年報 2026-03-28 19:00:18
0 跟貼 0
3億年前，蜻蜓能長到羽毛球拍那么大，但可能不是因為那時的高氧環境 | Nature

新浪財經 2026-03-27 14:07:48
0 跟貼 0
合肥野生動物園泉山新址“泡湯”？社區：去年7月已暫停，暫無新消息

極目新聞 2026-03-28 17:17:59
2 跟貼 2

大反轉！美官員痛批馬斯克：中國電車占全球70%份額，都是你的錯

大反轉！美官員痛批馬斯克：中國電車占全球70%份額，都是你的錯

大衛聊科技

2026-03-28 12:11:00

反美還幫伊朗搞錢，怪不得特朗普那么恨，馬杜羅的膽子確實太大了

反美還幫伊朗搞錢，怪不得特朗普那么恨，馬杜羅的膽子確實太大了

夢史

2026-03-28 17:59:17

這下不吹了，俄烏兩軍連續大戰，打破一個又一個“無敵”武器神話

這下不吹了，俄烏兩軍連續大戰，打破一個又一個“無敵”武器神話

策略述

2025-11-12 18:42:46

一朵花的N種“打開方式”：多地“賞花+”翻出新花樣

一朵花的N種“打開方式”：多地“賞花+”翻出新花樣

新華社

2026-03-27 21:30:23

臺積電：我們已經顧不上美國工廠了，大陸再不給稀土，大家都得完

臺積電：我們已經顧不上美國工廠了，大陸再不給稀土，大家都得完

吳紒愛體育

2026-03-28 04:01:32

有關薄一波的十個冷知識

深度報

2026-02-13 22:45:30

退休的做好準備！下個月養老金4大新變化已定，關乎你的錢袋子

退休的做好準備！下個月養老金4大新變化已定，關乎你的錢袋子

開心美食白科

2026-03-28 15:42:26

美伊戰爭的本質，就是光腳的不怕穿鞋的

美伊戰爭的本質，就是光腳的不怕穿鞋的

黑噪音

2026-03-28 11:56:24

奧運會為什么發避孕套？難道運動員都帶伴侶嗎？看完你就明白了！

奧運會為什么發避孕套？難道運動員都帶伴侶嗎？看完你就明白了！

南權先生

2026-02-13 15:17:51

巴基斯坦把稀土賣給美國，以為捏住中國“七寸”，其實在玩火自焚

巴基斯坦把稀土賣給美國，以為捏住中國“七寸”，其實在玩火自焚

通文知史

2026-03-24 08:35:03

蘋果史上最美正面！iPhone 18 Pro靈動島史詩級瘦身

蘋果史上最美正面！iPhone 18 Pro靈動島史詩級瘦身

快科技

2026-03-27 15:01:41

張雪峰追悼會現場曝光：他的遺像面前，擺放了一本鮮花拼成的書

張雪峰追悼會現場曝光：他的遺像面前，擺放了一本鮮花拼成的書

漢史趣聞

2026-03-27 22:39:07

猝死的人越來越多？醫生再次強調：寧可睡到中午，也別做這6事

猝死的人越來越多？醫生再次強調：寧可睡到中午，也別做這6事

任醫生聊健康

2026-03-28 17:16:40

張雪峰那件事出來之后，醫生朋友丟給我一句話，聽得我后背一涼。

張雪峰那件事出來之后，醫生朋友丟給我一句話，聽得我后背一涼。

果媽聊娛樂

2026-03-28 14:09:07

楊瀚森18+7+4，末節獨得12分！率隊106-101獲勝，加盟NBA真漲球了

楊瀚森18+7+4，末節獨得12分！率隊106-101獲勝，加盟NBA真漲球了

球場沒跑道

2026-03-28 10:20:12

F1日本：安東內利連奪桿位，維斯塔潘沖5連冠已絕望，勒克萊爾第4

F1日本：安東內利連奪桿位，維斯塔潘沖5連冠已絕望，勒克萊爾第4

體育妞世界

2026-03-28 17:19:35

徹底翻臉！兩國突然大開家門，大批美軍奔赴中東，德黑蘭這下慌了

徹底翻臉！兩國突然大開家門，大批美軍奔赴中東，德黑蘭這下慌了

阿鳧愛吐槽

2026-03-28 05:53:22

李昌鈺去世！破無數驚天大案，“華人神探”李昌鈺到底有多牛？

李昌鈺去世！破無數驚天大案，“華人神探”李昌鈺到底有多牛？

FUFASHION

2026-03-28 10:14:30

曝張雪峰去年3月已立遺囑，遺產由女兒單獨繼承，他真的很愛女兒

曝張雪峰去年3月已立遺囑，遺產由女兒單獨繼承，他真的很愛女兒

觀魚聽雨

2026-03-26 10:43:02

中國游客在塞爾維亞吃了頓飯，結賬時嚇一跳：確定不是開玩笑？

中國游客在塞爾維亞吃了頓飯，結賬時嚇一跳：確定不是開玩笑？

番外行

2026-03-06 20:32:30

AI產業主平臺領航智能+時代

14837文章數 66720關注度

往期回顧全部

科技要聞

遭中國學界"拉黑"后，這家AI頂會低頭道歉

頭條要聞

特朗普：北約沒支持美打擊伊朗美國以后也不會幫北約

頭條要聞

特朗普：北約沒支持美打擊伊朗美國以后也不會幫北約

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

王一博改名上熱搜！個人時代正式開啟！

財經要聞

臥底"科技與狠活"培訓：化工調味劑泛濫

汽車要聞

置換補貼價4.28萬起第五代宏光MINIEV正式上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

藝術

健康

房產

游戲

旅游要聞

挖蘭筍、逛市集、聽雅集……佘山蘭筍文化季等你來打卡

藝術要聞

這位富二代寫的草書，據說康生臨摹500多遍

干細胞抗衰4大誤區,90%的人都中招

房產要聞

6.8萬方！天河員村再征地，金融城西區開發全面提速

《紅色沙漠》組建貓咪軍團!愛貓人士游戲紀念逝去愛寵

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<noscript id="ggggg"><dd id="ggggg"></dd></noscript>

<small id="ggggg"></small>

<tfoot id="ggggg"><dd id="ggggg"></dd></tfoot>

<tfoot id="ggggg"><dd id="ggggg"></dd></tfoot>

<noscript id="ggggg"><dd id="ggggg"></dd></noscript>

<small id="ggggg"></small>