337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

姚順雨離職OpenAI,開啟下半場

0
分享至

為大模型開啟“下半場”的姚順雨,也開啟了個人AI的下半場。

就在最近,這位明星OpenAI華人研究員的動態,開始被火熱關注。

之前有人說他出現在小扎的必挖名單上,也有人最近爆料他即將加盟其他的巨頭——而且是中國科技巨頭,“轉會費”也有了驚人傳聞。以及還有一種說法,姚順雨選擇個人創業……(本文轉載自公眾號:量子位,作者:)

姚順雨去哪兒?還不知道。

但姚順雨離職OpenAI,得到了不同渠道的證實,只差個人官宣。

他似乎就此要開啟個人AI的下半場了。

這個剛剛29歲的年輕人,合肥一中畢業、NOI奧賽銀牌、高考704分以安徽探花進入清華姚班,最后在普林斯頓獲得計算機博士(語言和強化學習方向),畢業就加入了OpenAI……

而且更早之前,姚順雨就有著突出而知名的科研成果,比如:

  • 思維樹(Tree of Thoughts):讓LLM反復思考,大幅提高推理能力

  • SWE-bench:一個大模型能力評估數據集。

  • SWE-agent:一個開源AI程序員。

  • ReAct…

甚至還有超越年齡的哲思,一篇“AI下半場”的博文,在AI圈內外洛陽紙貴。

所以姚順雨,究竟是一個怎樣的年輕人?

姚順雨成長之路

在2024年剛加入OpenAI不久,姚順雨在一次采訪中推薦了一本書——《哥德爾、艾舍爾、巴赫:集異璧之大成》。


這部由人工智能先驅侯世達撰寫的經典著作,將哥德爾的不完備定理、艾舍爾的錯覺繪畫和巴赫的復調卡農巧妙融匯,展現了這些看似無關的元素如何在計算機的通用遞歸系統中彼此呼應,并留下了一句意味深長的話:覓之,便有所獲

正如這本書所啟發的那樣,跨學科的眼光與對復雜信息的開放態度,似乎貫穿著姚順雨的整個求學生涯,并逐漸形成一種個人的風格特質。

和所有的學霸一樣,姚順雨初中就讀于合肥最好的學校之一——合肥45中(2009—2012),初中畢業后升入合肥市第一中學

2014 年,他在全國信息學奧林匹克競賽(NOI)中以495分斬獲銀牌;次年高考以理科704分的成績位列安徽省第三,進入清華交叉信息研究院姚班,主修計算機科學。

而這看似“標準學霸”的開局背后,其實孕育著一顆不太一樣,甚至稍有反叛的氣質。


△來自清小華

姚順雨在采訪中透露,相較其他清華姚班的同學專注于一點,不斷深挖的品質,他更愛看很多數學,歷史,乃至種各樣亂七八糟的東西。

而他對嘻哈音樂的熱愛,也早已不是什么新聞。

艾米納姆、蛋堡、熱狗、Jcole等說唱歌手伴隨著他的初高中,而在清華他還是清華大學學生說唱社聯合創始人。

值得一提的是,在清華大學2019年各類型自主選拔復試的開營儀式上,姚順雨就給未來的學弟學妹們甩出了一句堪稱“freestyle”的理由,解釋自己為什么選清華:

但是對于我來說,選擇清華、北大并不是問題,因為北大沒有我姓氏命名的班級。


除了擔任說唱社聯合創始人外,姚順雨還擔任清華的招生志愿者和姚班聯席會主席。在談及姚班對他的影響時,他提到:

姚班很注重理論基礎課程的學習,像操作系統或電路設計相關的課,看上去和科研好像沒有任何關系,但是現在看來還是有些幫助的。它能使你對計算機科學的全貌有基本了解。


△(姚班合影,清華招生公眾號)

這種兼容各類信息、涉獵不同學科并從中尋找樂趣的跨界氣質,在姚順雨身上表現得尤為明顯。用以賽亞·伯林的話來說,他更像是一只“狐貍”,而不是一只“刺猬”,而這也體現在他后續的研究中。

(注:柏林的“刺猬”比喻那些專注于單一核心理念的人,他們把所有經驗都套用到這個中心觀點上;而“狐貍”則指那些涉獵廣泛、善于靈活應對不同問題的人,更依賴多樣化的策略和視角)

讓人頗感驚訝的是,在大三下學期之前,姚順雨既沒有接觸過AI,甚至連科研也沒有做過。

一次交換的機會讓他去了MIT,在此之后,他才開始跟著吳佳俊做一些計算機、視覺以及認知科學的研究。

姚順雨表示,在跟隨吳佳俊和學長Jun-Yan Zhu學習時,他不僅掌握了實驗、匯報等研究入門的基本功,更受到思想上的深刻影響,他由此認識到心理學與人工智能的交叉,學會了從更高維度和整體框架去思考問題。

結束姚班四年的學習后,2019年,他正式前往普林斯頓攻讀博士,跨界氣質再次顯現。

本科階段他主要研究計算機視覺,而博士階段,本來被計算機視覺方向錄取的他,卻因為興趣轉向,自行聯系了自然語言處理(NLP)領域的導師。最終,他因機緣巧合加入了Karthik Narasimhan的團隊,開始從事自然語言處理與強化學習的研究。

這等于是從視覺轉到了語言,但“覓之,便有所獲”。姚順雨在事后回想到,這種跨界也是他的幸運之處,因為彼時正逢GPT-2興起。因此,在博士的第一年,他就已經開始想著如何讓language model變成Agent.

而對(通用)Agent的關注貫穿著他的研究。


姚順雨博士生涯的第一個工作叫CALM(2020),研究如何用語言模型來作為Agent來玩語言游戲。


在CALM 中,語言就像媒介:它把人類經驗和語義模式轉化為可操作的動作候選,同時承載上下文信息,使智能體在龐大的動作空間中高效決策。

姚順雨表示,雖然這篇工作并不像swebench、ReAct或思維樹那么有名,但對他來說具有重要意義。

在張小珺的對談中,我們發現姚順雨對語言的關注早在這篇5年前的論文中就已萌芽。

  • 語言是人為了實現泛化而發明出來的工具,這一點比其他東西更本質。

換句話說,用語言來玩游戲是無限的,Agent可以憑借語言進行推理和組合,在不同的上下文中找到合適的動作,泛化就由此而來。

換句話說,Agent也需要具備“跨界”能力,而語言則是絕佳的媒介。

然而,姚順雨也意識到,如果沒有一個好的任務或環境,即使把“游戲”玩得再高分,也毫無意義。

基于這一思考,他的第二篇工作WebShop構建了一個大規模模擬電商環境,使智能體通過理解復雜文本指令,在網頁中進行導航和操作,從而推動語言理解與決策能力在真實世界任務中的應用與驗證。


同樣的,后來的經典工作SWE-BenchSWE-agent也是針對一個有意義的任務(現實編程)展開對Agent能力的驗證。

而當時間到了2022 年,GPT-3.5的出現改變了一切。

眾所周知,讓一張白紙反復試錯的效率極低,而在傳統強化學習中,這種低效嘗試卻屢見不鮮:智能體通常要么被限制只做單一任務,比如下圍棋,要么在龐大的動作空間中盲目探索。

GPT-3.5 讓人們意識到,之前缺失的是先驗知識:通過強大的語言預訓練,將常識和語言知識融入模型,再通過微調,它才能成為具備跨界氣質、擁有泛化能力的Agent。

正如姚順雨所說:如果你的Pre-Training(預訓練)已經包含了所有事情,那么RL(強化學習)只是激發出這些能力的skill(技能)。

在受到GPT-3.5的啟發后,姚順雨就做了ReAct(ReAct: Synergizing Reasoning and Acting in Language Models),讓大語言模型在與外部環境交互時,同時進行“推理”和“行動”。


姚順雨后來評價到這是他最喜歡的工作(也是他目前被引次數最高的工作)。基于此,他的研究逐漸轉向于兩個核心,一是怎么去做一些有價值、和現實世界更相關的任務和環境;二是怎么去做一些簡單、但又通用的方法。

不過,為了實現通用,泛化,必須學會推理。而語言模型剛好提供了一個足夠強的先驗(prior),這個先驗讓你可以推理,而推理又能在不同的環境間泛化。

于是,在GPT、思維鏈等工作的基礎上,思維樹(Tree of Thoughts, ToT)讓語言模型通過多路徑探索和自我評估,從而實現比傳統左到右推理更高效的復雜問題解決能力。


回顧姚順雨的求學與研究,不難發現,無論是他對通用智能體的追求,還是對語言作為認知與決策媒介的熱忱,都是對跨界思維與泛化能力的持續探索。


28歲的九局下半

相比于熱狗的23歲,28歲博士畢業進入OpenAI的姚順雨,才真正迎來自己的的“九局下半”。

2024年8月1日,姚順雨宣布加入OpenAI,一時間,說是萬眾矚目也毫不為過。


PS:在說到姚順雨與OpenAI的淵源時,一個不太冷的冷知識是姚順雨的導師Karthik Narasimhan是GPT?1第二作者。


在加入OpenAI的一年多時間,姚順雨最出圈的莫過于今年4月發表的博文《The Second Half》,宣告AI主線程的游戲已進入下半場。

(是的,AI也迎來了自己的九局下半)

姚順雨表示:AI發展分為上下兩階段。上半場以模型和方法為中心,核心構建了模型和訓練方法;隨著AI技術成熟,下半場的重點轉向如何定義有現實意義的任務、如何有效評估AI系統的表現。

新的評估應該貼近現實世界任務、優化模型配方解決任務,形成新的正向循環。

在這,我們不難看出姚順雨姿態的轉變:從專注求解的科研工作者,逐漸成長為善于發現需求的“產品經理”。

據剛剛曝光的一次與張小珺的訪談中,姚順雨也談到了創業的底層邏輯:

畢業前我想得多的是,怎么創造一個愛因斯坦?我那時是比較academia(學院派)的人——你在普林斯頓,你的偶像是馮諾依曼、愛因斯坦——很自然,能想到最有意思的任務是,我能不能發現下一個相對論?這毫無疑問能標志,AGI或ASI(超人工智能)實現了。后來,我到了硅谷,到了加州,進入公司之后,我發現人類的組織也是一個有意思的事情。如果能創造一家新的公司,創造一個one trillion dollar(一萬億美元)、基于Agent的公司,是很有意思的。

而當談到是否會出去創業時,姚順雨更是坦率地表示:OpenAI大多數人都會考慮創業。他需要去做更有挑戰的事情,去創業是很自然的。當然,還是應該找到一個好的事情。他喜歡把事情想得清楚一點再去做。

當然,從OpenAI離職也不一定非得創業,比如姚順雨的導師Karthik Narasimhan,就在OpenAI呆了一年后,選擇了離開,并去普林斯頓繼續象牙塔科研了。

如今,姚順雨加入OpenAI也過了整整一個年頭。

有爆料說“姚順雨上億薪資入職騰訊”,但被騰訊官方對外辟謠否認了。


還有一家全新的創業公司剛剛被注冊,法人代表正是“姚順雨”——

但目前依然難以確定這個“姚順雨”是不是就是我們談論的姚順雨,畢竟叫“堯舜禹”這種好名字的,僅僅AI領域,不止一位…

總之,祝福姚順雨開啟下半場。

參考鏈接
[1]https://openreview.net/profile?id=~Shunyu_Yao1&utm_source=chatgpt.com
[2]https://ysymyth.github.io/?utm_source=chatgpt.com
[3]https://x.com/shunyuyao12?lang=en&utm_source=chatgpt.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
男子因噪音過敏住5年隔音艙:自己設計,已接上百個訂單,幫噪音受困者找回睡眠

男子因噪音過敏住5年隔音艙:自己設計,已接上百個訂單,幫噪音受困者找回睡眠

半島官網
2026-04-16 11:20:50
大快人心!浙江4057座寺廟,密集關停整頓,網友:亂象早該根治

大快人心!浙江4057座寺廟,密集關停整頓,網友:亂象早該根治

我不叫阿哏
2026-04-16 10:53:56
不出3年,貶值最快的不是現金,是這4樣東西,早知道早省錢!

不出3年,貶值最快的不是現金,是這4樣東西,早知道早省錢!

老特有話說
2026-04-15 15:15:15
心梗是喝茶喝出來的?醫生:即使是鐵打的心臟,這幾種茶也要少喝

心梗是喝茶喝出來的?醫生:即使是鐵打的心臟,這幾種茶也要少喝

醫學原創故事會
2026-04-16 23:44:09
北京首鋼VS山東男籃!李楠復出首秀,許利民拒絕輸球,央視直播

北京首鋼VS山東男籃!李楠復出首秀,許利民拒絕輸球,央視直播

體壇瞎白話
2026-04-16 08:36:11
中國向伊朗提供緊急人道主義援助

中國向伊朗提供緊急人道主義援助

新華社
2026-04-16 23:43:04
現場簽約!越南對華作出保證,蘇林坐上離京高鐵,臨走前獻出重禮

現場簽約!越南對華作出保證,蘇林坐上離京高鐵,臨走前獻出重禮

孤單是寂寞的毒
2026-04-16 22:21:07
零跑D19賣22萬:誰給它的勇氣?

零跑D19賣22萬:誰給它的勇氣?

摸魚算法
2026-04-16 20:52:14
最大規模!英國宣布:提供12萬架

最大規模!英國宣布:提供12萬架

環球時報國際
2026-04-16 23:12:26
醫院遇丈夫扶女人進產科,正要發火,護士說了一句,我抱丈夫痛哭

醫院遇丈夫扶女人進產科,正要發火,護士說了一句,我抱丈夫痛哭

云端書館
2026-04-15 09:19:50
醒醒吧!就算臺灣愿意和平回歸,臺灣也不可能允許解放軍對臺駐軍

醒醒吧!就算臺灣愿意和平回歸,臺灣也不可能允許解放軍對臺駐軍

小噎論事
2026-04-17 02:23:08
文章的面館 剛火3天就翻車?遭圍觀 被差評 跌落神壇的他太難了

文章的面館 剛火3天就翻車?遭圍觀 被差評 跌落神壇的他太難了

鄉野小珥
2026-04-16 13:48:14
失業第183天,北京戶口的隱形代價,非京籍失業者的自救圍城

失業第183天,北京戶口的隱形代價,非京籍失業者的自救圍城

右耳遠聞
2026-04-15 16:22:05
解禁復出!你好,李楠!已經等了整整3年

解禁復出!你好,李楠!已經等了整整3年

籃球實戰寶典
2026-04-16 23:14:02
坐后座不系安全帶,北京一市民曬出罰單!

坐后座不系安全帶,北京一市民曬出罰單!

家住東西城
2026-04-16 19:32:29
中國11人進世錦賽,張安達請客,5人小團體聚餐,跟趙心童開玩笑

中國11人進世錦賽,張安達請客,5人小團體聚餐,跟趙心童開玩笑

球場沒跑道
2026-04-16 13:43:29
受賄數額特別巨大 湖北省政協原副主席周先旺被提起公訴

受賄數額特別巨大 湖北省政協原副主席周先旺被提起公訴

新京報
2026-04-16 10:04:47
新加坡已經成功預測中美沖突:一旦爆發,美稱中國不能攻打美本土

新加坡已經成功預測中美沖突:一旦爆發,美稱中國不能攻打美本土

老范談史
2026-04-17 01:29:33
極氪8X明日上市:明星企業家扎堆試駕

極氪8X明日上市:明星企業家扎堆試駕

大象新聞
2026-04-16 14:29:01
保羅社媒嘲諷快船附加賽出局:他真的死透了

保羅社媒嘲諷快船附加賽出局:他真的死透了

懂球帝
2026-04-17 01:10:12
2026-04-17 05:08:49
申媽的朋友圈 incentive-icons
申媽的朋友圈
關注互聯網大廠+職場
513文章數 39關注度
往期回顧 全部

科技要聞

趙明:智駕之戰,看誰在大模型上更高效

頭條要聞

特朗普宣布黎以將停火后 以軍大規模空襲黎巴嫩

頭條要聞

特朗普宣布黎以將停火后 以軍大規模空襲黎巴嫩

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創始人王子杰去世,享年63歲

財經要聞

海爾與醫美女王互撕 換血抗衰誰的生意?

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態度原創

數碼
藝術
房產
時尚
軍事航空

數碼要聞

榮耀史上最短發布會,發布榮耀史上最強MagicBook數字系列

藝術要聞

你絕對想不到!這幅油畫背后的美麗故事!

房產要聞

人人人人!封關后首屆消博會,擠爆了!

爆火的前額葉梗,讓多少年輕人主動確診「腦殘」?

軍事要聞

封鎖霍爾木茲海峽后 美釋放雙重信號

無障礙瀏覽 進入關懷版