337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Ilya重新定義AGI: 為什么ChatGPT離真正的AGI還很遠(yuǎn)

0
分享至

從OpenAI離開后,Ilya Sutskever從公眾視野中消失了許久。

前段時間,他終于上了個視頻播客節(jié)目,和主播Dwarkesh Patel聊了1小時36分鐘,把他現(xiàn)在對AGI的看法完整表述了一遍。


如果你不知道Ilya是誰的話,簡單介紹下,他是OpenAI前首席科學(xué)家,GPT系列的核心設(shè)計者,現(xiàn)在創(chuàng)辦了SSI(Safe Superintelligence Inc.)。

我關(guān)注Ilya很久了。從ChatGPT發(fā)布起,他的每一次公開發(fā)言,我都會仔細(xì)看。這個人對AI的理解,比大多數(shù)人深太多。

這次訪談更狠。他提出了一個顛覆性的觀點:

我們對AGI的理解,可能從一開始就錯了。

AI行業(yè)的大轉(zhuǎn)折:規(guī)模時代結(jié)束了

在講AGI之前,Ilya先說了一個更大的背景。

他說了一句讓我印象很深的話:

"2020到2025,是規(guī)模時代(Age of Scaling)。但現(xiàn)在規(guī)模已經(jīng)夠大了。我們回到了研究時代(Age of Research)——只不過這次有大算力支持。"

什么意思?

過去5年,AI公司都在做一件事:堆數(shù)據(jù)、堆算力、堆參數(shù)。

規(guī)模定律(Scaling Law)吸走了所有空氣。所有人都在做同樣的事:

  • 2020:GPT-3,175B參數(shù)

  • 2021-2024:所有公司瘋狂擴(kuò)大預(yù)訓(xùn)練規(guī)模

  • 數(shù)據(jù)從TB級到PB級

  • 算力從百GPU到萬GPU

Ilya甚至說了一句狠話:

"Scaling sucked out all the air in the room. Everyone started to do the same thing. We got to the point where there are more companies than ideas by quite a bit."

公司數(shù)量比想法還多。這話太準(zhǔn)了。

但現(xiàn)在呢?

規(guī)模已經(jīng)足夠大了。再100x也不會帶來質(zhì)變。數(shù)據(jù)快耗盡了,算力再堆10倍,能力提升可能只是邊際改善。

接下來拼什么?拼想法。拼對AI本質(zhì)的理解。

這也是為什么SSI才有機(jī)會——不再是純拼預(yù)算,而是拼研究深度。

說實話,這個判斷如果是對的,對整個AI行業(yè)的影響會很大。意味著小團(tuán)隊、研究驅(qū)動的公司,又有機(jī)會了。

模型很強(qiáng),但經(jīng)濟(jì)影響很弱——為什么?

Ilya提出了一個讓所有人困惑的問題:

"現(xiàn)在的模型在評測(evals)上表現(xiàn)驚人。但經(jīng)濟(jì)影響遠(yuǎn)遠(yuǎn)落后。怎么解釋這個矛盾?"

你看各種benchmark:

  • 代碼競賽:超過人類平均水平

  • 數(shù)學(xué)問題:接近IMO金牌選手

  • 復(fù)雜推理:能解決博士級別的題目

但實際用起來呢?

會在兩個bug之間循環(huán)。會重復(fù)說同樣的話。前一句話和后一句話自相矛盾。

為什么會這樣?

Ilya給出了一個絕妙的類比。

學(xué)生A vs 學(xué)生B:AI過度訓(xùn)練的陷阱

想象兩個學(xué)生:

學(xué)生A: 要成為競賽編程冠軍。于是瘋狂練習(xí)10,000小時,刷了所有競賽題,背下所有算法,成為頂尖競賽選手。

學(xué)生B: 也覺得競賽編程挺有意思,練了100小時,也做得不錯。

問題來了:誰在以后的職業(yè)生涯中會更成功?

十有八九是學(xué)生B。

為什么?

因為學(xué)生A只會做競賽題。遇到實際項目,遇到?jīng)]見過的問題,就懵了。

學(xué)生B雖然練得少,但他有"那個東西"——學(xué)習(xí)能力、舉一反三的能力、解決新問題的能力。

現(xiàn)在的AI就是學(xué)生A。

我們怎么訓(xùn)練大模型的?

  1. 預(yù)訓(xùn)練: 喂給它所有能找到的數(shù)據(jù)——所有書、所有代碼、所有網(wǎng)頁。就像讓學(xué)生A刷遍所有競賽題。

  2. 強(qiáng)化學(xué)習(xí)(RL): 針對特定任務(wù)瘋狂訓(xùn)練。想讓它在編程評測上表現(xiàn)好?那就專門訓(xùn)練編程任務(wù),訓(xùn)練到評測分?jǐn)?shù)爆表。

結(jié)果呢?評測上確實表現(xiàn)驚人。但真實場景一塌糊涂。

Ilya說了一個觀察:

現(xiàn)在所有AI公司都有專門的團(tuán)隊,不停地設(shè)計新的RL訓(xùn)練環(huán)境。這些環(huán)境怎么設(shè)計的?

很多時候是從評測中找靈感。

"我希望模型在發(fā)布時評測成績好看,那我就專門訓(xùn)練它做這類任務(wù)。"

這就是為什么模型能在評測上做很難的題,卻在實際使用中會犯低級錯誤。

它沒有真的理解,只是記住了而已。

Ilya甚至說了一句狠話:

"The real reward hacking is the human researchers who are too focused on the evals."

真正的獎勵破解(reward hacking),是研究人員太關(guān)注評測分?jǐn)?shù)了。

人類的秘密武器:泛化能力

這是整個訪談中最讓我震撼的部分。

Ilya說:人類用更少的數(shù)據(jù),學(xué)得更好。

他提到了一個他自己的例子:

"我5歲的時候,超級喜歡汽車。那時候我對汽車的識別能力,已經(jīng)足夠支撐開車了——雖然我還沒法開,但我能認(rèn)出所有車型。"

想想看,一個5歲小孩:

  • 見過的世界很小(大部分時間在家)

  • 數(shù)據(jù)多樣性極低(每天看到的東西差不多)

  • 訓(xùn)練數(shù)據(jù)量只是大模型的零頭

但人類學(xué)到的東西,理解得更深。

15歲的人類,學(xué)習(xí)的數(shù)據(jù)量只是GPT預(yù)訓(xùn)練數(shù)據(jù)的千分之一。

但人類不會犯AI犯的那些低級錯誤:

  • 不會在兩個bug之間循環(huán)

  • 不會重復(fù)說同樣的話

  • 不會前一句話和后一句話自相矛盾

那人類靠什么做到的?

價值函數(shù):人類內(nèi)置的"對錯感"

Ilya提到了一個神經(jīng)科學(xué)案例:

有個人大腦的情緒處理中樞受損了。他不再有情緒——不會難過、不會憤怒、不會興奮。

在測試中,他依然能說話、能做智力題,看起來一切正常。

但他完全喪失了決策能力。

選穿哪雙襪子,能糾結(jié)好幾個小時。做財務(wù)決策,完全一團(tuán)糟。

這說明什么?

情緒系統(tǒng)是人類的內(nèi)置"價值函數(shù)"(Value Function)。

它告訴我們:什么是好的,什么是壞的,什么事情值得做,什么事情不值得。

沒有這個系統(tǒng),即使智力正常,也無法在真實世界中運(yùn)作。

那什么是價值函數(shù)?

Ilya給了個很清楚的解釋:

"你下棋,丟了一個子,你不用下完整盤棋就知道自己犯錯了。價值函數(shù)能讓你提前知道:這步是好是壞。"

現(xiàn)在的AI怎么訓(xùn)練的?

你讓它寫1000行代碼,等它寫完,你告訴它"對"或"錯"。它學(xué)不到中間過程哪一步走錯了。

如果有價值函數(shù)呢?

AI寫到第100行,價值函數(shù)就能判斷:"這個方向不對,應(yīng)該換思路。"不用等到寫完1000行才發(fā)現(xiàn)。

人類就是這么學(xué)的。

你編程時寫了幾行代碼,感覺"不對勁",就會停下來重新思考。這就是你的價值函數(shù)在起作用。

AI現(xiàn)在缺的,可能就是這個。

Ilya說他對怎么解決有想法,但"由于種種原因,無法詳細(xì)討論"。(這個有點神秘,估計是SSI的核心競爭力)

新定義: AGI不是"全知全能",而是"能學(xué)會任何事"

說了這么多,終于到了核心:Ilya對AGI的重新定義。

什么是AGI(通用人工智能)?

問十個人,九個會說:能做所有工作的AI。

OpenAI的定義就是這樣——"能勝任人類所有經(jīng)濟(jì)價值工作的系統(tǒng)"。

聽起來很合理對吧?

但I(xiàn)lya說:等等,這個定義好像哪里不對。

為什么?

他給了個很直接的理由:人類自己都不是AGI啊。

你想想,一個普通人知道多少東西?

你會編程嗎?不一定。會做心臟手術(shù)嗎?肯定不會。會設(shè)計芯片嗎?更不可能。

人類缺少大量的知識。我們不是"什么都會"。

那為什么人類是"通用智能"?

很簡單——我們能學(xué)。

你不會編程?給你幾個月時間,你能學(xué)會。你不懂醫(yī)學(xué)?讓你去醫(yī)學(xué)院學(xué)幾年,你能成為醫(yī)生。

人類的"通用"體現(xiàn)在哪?不在"已經(jīng)會了",在"能學(xué)會"。

所以,Ilya給出了新的AGI定義:

AGI不是"已經(jīng)會做所有工作",而是"能學(xué)會做所有工作"。

他給了一個很形象的比喻:

"想象我造出了一個15歲的超級智能學(xué)生。他非常聰明,學(xué)習(xí)能力極強(qiáng),但知識儲備幾乎為零。" "你讓他去當(dāng)程序員,他會去學(xué)編程。" "你讓他去當(dāng)醫(yī)生,他會去學(xué)醫(yī)。" "這就是AGI。"

這個定義的核心是什么?

持續(xù)學(xué)習(xí)能力(Continual Learning)。

不是一次性訓(xùn)練好,然后什么都知道。

而是:

  • 快速學(xué)習(xí): 比人類更快掌握新技能

  • 深度理解: 真正理解,不只是記住

  • 靈活遷移: 一個領(lǐng)域?qū)W到的東西,能用到其他領(lǐng)域

這才是真正的"通用"。

SSI的戰(zhàn)略調(diào)整:從"直擊超級智能"到漸進(jìn)式部署

這個新定義,改變了SSI的整個戰(zhàn)略。

SSI最初的計劃是"straight-shot superintelligence"——直擊超級智能。

什么意思?就是不發(fā)布中間產(chǎn)品,埋頭研究,直到造出真正的超級智能才發(fā)布。

好處是:避免市場競爭的各種權(quán)衡和壓力,專注研究。

但I(xiàn)lya說,這個計劃可能會調(diào)整。

為什么?

因為AI的部署本身就是學(xué)習(xí)過程。

你想想,人類的很多系統(tǒng)是怎么變安全的?

  • 飛機(jī)為什么現(xiàn)在這么安全?不是因為設(shè)計師一開始就想清楚了所有問題,而是通過事故、改進(jìn)、再事故、再改進(jìn),迭代了幾十年。

  • Linux為什么bug這么少?不是因為Linus一開始就寫出了完美代碼,而是無數(shù)人在實際使用中發(fā)現(xiàn)問題、修復(fù)問題。

AI可能也需要這樣。

Ilya說:

"很難想象有哪個工程領(lǐng)域,是純靠思考就能做到安全的,而不需要實際部署和反饋。"

所以,即使是"直擊超級智能",也需要漸進(jìn)式發(fā)布。

更重要的是:展示AI的價值。

Ilya說了一句很有意思的話:

"你寫一篇文章說'AI會怎樣怎樣',別人看了會說'挺有意思的'。" "但當(dāng)你讓別人看到AI實際在做這個、做那個——那完全不一樣。"

看到 vs 聽說,天壤之別。

這也是為什么SSI可能會改變策略,在中間階段就發(fā)布產(chǎn)品。(這個轉(zhuǎn)變挺關(guān)鍵的,說明Ilya也在務(wù)實地思考商業(yè)化)

對我個人的啟示

這個新定義,不只是對AI行業(yè)的顛覆。

對我個人也有深刻觸動。

我做了5年產(chǎn)品、開發(fā)、內(nèi)容創(chuàng)作。如果按傳統(tǒng)思路,我應(yīng)該選一個方向深挖,成為某個領(lǐng)域的專家。

但在AI時代,這個策略好像不太對了。

為什么?我最近一直在想這個問題。

你看:

  • 我2023年研究的Prompt技巧,很多現(xiàn)在不需要了

  • 我半年前用的AI工具,現(xiàn)在又出了更好的

我有段時間很焦慮。總覺得自己在追,但永遠(yuǎn)追不上。

直到聽完Ilya這次訪談,我突然想明白了:

如果我只是積累知識,我永遠(yuǎn)追不上。

但如果我培養(yǎng)的是學(xué)習(xí)能力——快速上手新工具、快速理解新概念、快速應(yīng)用到實際問題——那我永遠(yuǎn)不會過時。

這就是為什么Ilya說,AGI的本質(zhì)是學(xué)習(xí)能力,而不是知識儲備。

人類在這方面還有巨大優(yōu)勢。我們可以:

  • 快速切換領(lǐng)域

  • 從失敗中學(xué)習(xí)

  • 舉一反三

  • 在不確定中探索

這些,AI還做不好。但差距在縮小。

當(dāng)AI也有了真正的持續(xù)學(xué)習(xí)能力,當(dāng)它也能像15歲的天才學(xué)生一樣,快速學(xué)會任何新技能...那時候,競爭會更激烈。

所以,現(xiàn)在就該問自己:

我的學(xué)習(xí)能力,夠強(qiáng)嗎?

我能多快掌握一個新領(lǐng)域?

我能不能在AI的幫助下,學(xué)得更快?

這些問題的答案,決定了你在AI時代能走多遠(yuǎn)。

Ilya的這次訪談,還談了很多其他內(nèi)容:

  • 為什么強(qiáng)化學(xué)習(xí)現(xiàn)在花的算力已經(jīng)超過預(yù)訓(xùn)練

  • SSI怎么用30億美元跟OpenAI的百億預(yù)算競爭(這個數(shù)據(jù)挺有意思,OpenAI年研究支出50-60億,但大部分分散在產(chǎn)品、銷售等方向。SSI只做研究,實際研究算力差距沒那么大)

  • 怎么讓超級智能"關(guān)心所有有感知能力的生命"

  • 為什么AI對齊比想象中難

每一個都值得單獨(dú)寫一篇文章。

但這篇文章,我想聚焦在這個核心洞察上:

AGI不是"什么都會",而是"什么都能學(xué)"。

這個定義,改變了我對AI的理解。也改變了我對自己的期待。

在AI時代,知識不再是護(hù)城河。學(xué)習(xí)能力才是。

: Ilya完整訪談在這里 → https://www.youtube.com/watch?v=aR20FWCCjAs

  • 時長: 1小時36分鐘

  • 嘉賓: Ilya Sutskever (SSI創(chuàng)始人, 前OpenAI首席科學(xué)家)

  • 主持: Dwarkesh Patel

  • 發(fā)布時間: 2025年12月

強(qiáng)烈推薦完整看一遍。這是今年必看的訪談之一。(我看了兩遍,第二遍才真正理解他說的價值函數(shù)那段)

你覺得現(xiàn)在的AI,離Ilya說的"15歲天才學(xué)生"還有多遠(yuǎn)?

歡迎評論區(qū)聊聊。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
剛剛,突發(fā)利好!逆市暴漲!

剛剛,突發(fā)利好!逆市暴漲!

中國基金報
2026-03-30 10:45:52
比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺灣領(lǐng)導(dǎo)人,解放軍必定收臺

比賴清德更狂的人出現(xiàn)了,只要她當(dāng)上臺灣領(lǐng)導(dǎo)人,解放軍必定收臺

共工之錨
2026-03-29 18:26:19
國民黨主席將訪大陸,京滬蘇3站參觀!21年過后,鄭麗文再回娘家

國民黨主席將訪大陸,京滬蘇3站參觀!21年過后,鄭麗文再回娘家

小陸搞笑日常
2026-03-30 12:52:34
美國也攔不住!內(nèi)塔尼亞胡暴走,下達(dá)末日死令,中東真要吃核彈?

美國也攔不住!內(nèi)塔尼亞胡暴走,下達(dá)末日死令,中東真要吃核彈?

小小科普員
2026-03-30 14:43:46
張雪峰女兒親自辟謠!父母恩愛沒離婚,回應(yīng)三個問題,口才很意外

張雪峰女兒親自辟謠!父母恩愛沒離婚,回應(yīng)三個問題,口才很意外

可愛小菜
2026-03-30 05:57:16
太心酸!甘肅一31歲女生連續(xù)考編8年失敗,找份1800元工作繼續(xù)考

太心酸!甘肅一31歲女生連續(xù)考編8年失敗,找份1800元工作繼續(xù)考

火山詩話
2026-03-29 16:13:48
張檬曬廣州新家,11個月兒子能吃一大碗輔食,被仨人照顧白白胖胖

張檬曬廣州新家,11個月兒子能吃一大碗輔食,被仨人照顧白白胖胖

八怪娛
2026-03-30 09:07:22
網(wǎng)貸迎最強(qiáng)監(jiān)管,一刀切24%,要么合規(guī)要么去死,九成平臺將出局

網(wǎng)貸迎最強(qiáng)監(jiān)管,一刀切24%,要么合規(guī)要么去死,九成平臺將出局

潮鹿逐夢
2026-03-30 11:17:52
世界最強(qiáng)攻擊核潛艇新細(xì)節(jié)曝光,美嚇壞了!外媒:低估中國犯大錯

世界最強(qiáng)攻擊核潛艇新細(xì)節(jié)曝光,美嚇壞了!外媒:低估中國犯大錯

谷盟1
2026-03-30 12:20:24
伊朗短信動員全國人準(zhǔn)備“犧牲”

伊朗短信動員全國人準(zhǔn)備“犧牲”

桂系007
2026-03-30 03:16:29
越扒越有!張雪峰去世早有預(yù)兆,他的2個不良愛好,或成催命符

越扒越有!張雪峰去世早有預(yù)兆,他的2個不良愛好,或成催命符

孤城落日
2026-03-28 03:41:07
被美國關(guān)押兩個多月的馬杜羅,再次出庭時,簡直就像是變了一個人

被美國關(guān)押兩個多月的馬杜羅,再次出庭時,簡直就像是變了一個人

萬物知識圈
2026-03-29 07:08:53
華為把日出裝進(jìn)車漆,用戶看完想換車了

華為把日出裝進(jìn)車漆,用戶看完想換車了

硅嶼手記
2026-03-29 15:06:02
闊別國家隊10個月 全紅嬋并未退役:是我主動離開的 因無法堅持了

闊別國家隊10個月 全紅嬋并未退役:是我主動離開的 因無法堅持了

風(fēng)過鄉(xiāng)
2026-03-30 12:52:06
布澤爾被打哭了!慘遭3分絕殺+19分大逆轉(zhuǎn)!1號種子回家

布澤爾被打哭了!慘遭3分絕殺+19分大逆轉(zhuǎn)!1號種子回家

野球帝
2026-03-30 13:40:38
德國女孩來中國,逛中國超市時納悶了:中國管這個叫超市?

德國女孩來中國,逛中國超市時納悶了:中國管這個叫超市?

起喜電影
2026-03-30 12:08:28
中國斬釘截鐵,就是要日本賠罪,軍官侵館第4天,防衛(wèi)大臣行動了

中國斬釘截鐵,就是要日本賠罪,軍官侵館第4天,防衛(wèi)大臣行動了

老謝談史
2026-03-29 01:20:29
氣溫回暖,猝死的人越來越多?醫(yī)生強(qiáng)調(diào):寧睡到中午,也別做5事

氣溫回暖,猝死的人越來越多?醫(yī)生強(qiáng)調(diào):寧睡到中午,也別做5事

垚垚分享健康
2026-03-30 11:09:57
62歲老人查出陰莖癌!他的壞習(xí)慣為所有人敲響警鐘!值得借鑒

62歲老人查出陰莖癌!他的壞習(xí)慣為所有人敲響警鐘!值得借鑒

路醫(yī)生健康科普
2026-03-27 17:42:19
白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
2026-03-30 15:59:00
AI進(jìn)化論花生 incentive-icons
AI進(jìn)化論花生
AI博主,AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開發(fā)者
169文章數(shù) 83關(guān)注度
往期回顧 全部

科技要聞

DeepSeek性能異常問題已解決,服務(wù)恢復(fù)

頭條要聞

太原高樓起火致3死23傷 居民:曾提醒燒烤店不安全

頭條要聞

太原高樓起火致3死23傷 居民:曾提醒燒烤店不安全

體育要聞

想進(jìn)世界杯,意大利還要過他這一關(guān)

娛樂要聞

單依純凌晨發(fā)長文道歉!李榮浩再回應(yīng)

財經(jīng)要聞

油價沖擊,有些亞洲貨幣先扛不住了!

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態(tài)度原創(chuàng)

藝術(shù)
親子
旅游
家居
房產(chǎn)

藝術(shù)要聞

600 年前的「產(chǎn)亡孤魂」,藏著中國女性最痛的記憶

親子要聞

女兒今天來找爸爸,讓女兒改口叫后媽

旅游要聞

安徽合肥:不負(fù)好春光 踏青賞花忙

家居要聞

東方法式美學(xué) 現(xiàn)代簡約

房產(chǎn)要聞

32億,三開三罄!誰在硬控海口樓市高端局?

無障礙瀏覽 進(jìn)入關(guān)懷版