337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

逐字修訂 & 附音頻|楊強、唐杰、林俊旸、姚順雨...高密度圓桌上,大家聊了啥

0
分享至


周日的時候,我對著音頻記錄,重聽了3遍,逐字修訂了這份記錄: 本次修訂,更正了速記中的各種名詞錯誤,并補充了遺漏細節 希望這些優秀的科學家,和他們的前沿思想,能被更精準地記錄與傳播
AGI-Next 圓桌對話(左上角,姚順雨遠程接入) 圓桌對話:中國AI的下一步

這個是對話的音頻記錄

2025年,是中國開源模型大放異彩的一年。中國的開源模型在全球取得突破,Coding 場景一年增長 10~20 倍

與此同時,硅谷幾家頭部公司開始明顯分化:Anthropic 聚焦企業和 Coding,Google 押注全模態,OpenAI 繼續 To C。

這場圓桌匯集了四位橫跨學術與產業、中國與硅谷的一線參與者,討論四個核心問題:分化、范式、Agent、以及中國AI的勝算

嘉賓

  • ? 楊強 :香港科技大學榮休教授,加拿大兩院院士,聯邦學習領域奠基人

  • ? 唐杰 :清華大學計算機系教授,智譜AI首席科學家/創始人

  • ? 林俊旸 :阿里通義千問技術負責人,北大校友,Qwen開源模型核心貢獻者

  • ? 姚順雨 :騰訊首席AI科學家,前OpenAI研究員,ReAct/SWE-agent作者

主持人

  • ? 李廣密 :拾象科技CEO,前紅杉中國投資人,「海外獨角獸」創辦者

開場

李廣密(主持人):我是接下來 Panel 的主持人廣密

剛才我在臺下聽,有幾個感受

第一,就是唐老師的號召力很強,清華的人才非常好,不僅是國內,包括海外,清華人的比例非常高,感覺這一波好像跟隔壁學校在 AI 這一波拉開差距了。

第二,就是我剛才聽幾個 Talk 的感受,叫“不止 Follow,不止開源”,而且都在探索自己的下個范式,而且不止是 Coding,都在探索自己的產品形態。

這個時間點也特別有意思,2025 年其實是中國開源模型叫“大放異彩”的一年,“開源四杰”在全球取得了非常大的成績,而且是 Coding 過去一年有 10 到 20 倍增長的一年。包括海外也在提 Scaling 到底走到哪一步了,有沒有新的范式出來了。所以今天這個活動,接下來這個 Panel 討論“接下來怎么走”,是特別有意思的。

接下來我們邀請幾位嘉賓:楊強教授、唐杰老師、俊旸、順雨

李廣密(主持人):我們先從第一個比較有意思的話題聊起來,硅谷其實幾家也都在明顯的做分化,我覺得從“分化”這個主題可以先聊起來。

Anthropic 其實是對中國模型公司有一個非常大的啟發的,硅谷的競爭那么激烈,它沒有完全 Follow 全都做,而是專注到了企業,專注到了 Coding,專注到了 Agentic。所以我一直在想,接下來中國的模型會分化成自己想要的哪些方向?我覺得分化這個主題是一個蠻有意思的。我看順雨也上線了,要不順雨可以開場給大家講一講,包括你最近在忙什么?

姚順雨:大家好。我現在是不是一個巨大的臉在會場?(會場大笑)不好意思,今天沒法親自來北京,但是很高興參加這個活動。最近就忙著做模型、做產品,我覺得就是做 AI,一個很正常的狀態。回國感覺還是挺好的,吃的好很多。

李廣密(主持人):順雨,你能展開聊聊你對“模型分化”這個主題的想法嗎?硅谷也都在分化,比如說 Anthropic 做了 Coding,中國很多模型做了開源,過去 Coding 提得也很快,包括 Google Gemini 也沒有全都做,它先把全模態這個點做得很好。那你的老東家在重點做 To C,因為你是橫跨中美的,可以給大家講講你的體感。就是接下來不管說自己也好、各家也好,分化這個點你是怎么思考的?

姚順雨:我覺得有兩個大的感受。一個感受是 To C 和 To B 明顯發生了分化。另一個感受是,“垂直整合”這條路,以及“模型和應用分層”這條路,也開始出現了分化。

我先說第一點。很明顯,當大家想到 AI 的 Super App,現在大家想到的就是兩個:一個是 ChatGPT,另一個是 Claude Code。大家可以認為它們分別是做 To C 和 To B 的典范。但是我覺得很有意思一點是說,我們今天用 ChatGPT 的時候,其實和去年用,對于大部分人、大部分時候來說,感受到的變化,已經沒有那么強烈了。但是相反,以 Claude Code 來說,Coding 的革命可能一年前還沒有開始,但是這一年,夸張一點說,已經在重塑整個計算機行業做事的方式。人已經不再寫代碼,而是去用英語和電腦去交流。

很核心的一點是,對于 To C 來說,大部分人大部分時候其實不需要用到這么強的智能。可能今天用 ChatGPT 和去年相比,寫抽象代數或者去解伽羅瓦理論的能力變強了,但是大部分人感受不到。大部分人其實可能還是在,尤其在中國,更多像是一個搜索引擎的加強版,很多時候你也不知道該怎么樣去用,去把它的智能給激發出來。

但是對于 To B 來說,很明顯的一點是,智能越高很多時候就代表生產力越高,就代表你可以賺的錢越多,這一切東西都相關聯。那對于 To B 來說,還有一個很明顯的點:大部分時候其實很多人愿意用最強的模型。可能一個模型它是 200 美元一個月,第二強或者差一些的模型是 50 美元一個月或者 20 美元一個月。我們今天發現很多,起碼美國的人,是會愿意花那個溢價去用最好的模型。因為可能他的年薪是 20 萬美元,他每天要做 10 個任務,那一個像 Opus 4.5 這樣一個非常強的模型,它可能會 10 個任務八九個直接做對了,那差的模型它可能做對五六個。問題是你不知道這五六個是哪五六個的情況下,就要花很多額外精力去監控這個事情。所以在 To B 這個市場上,強的模型和稍微差點的模型,分化會變得越來越明顯,這是第一點觀察。

第二點觀察,是垂直整合和模型應用分層的區別。一個比較好的例子可能是 ChatGPT Agent,相對應比如用 Claude 或者 Gemini 加上 Manus 這樣的應用層產品。過去大家會認為當你有垂直整合的能力,你就肯定會做得更好,但起碼今天來看,并不一定。首先,模型層和應用層需要的能力還是挺不一樣的。尤其是對于 To B 或者說生產力場景,可能更大的預訓練(Pre-training)還是一個非常關鍵的事情,這個事情對于產品公司確實很難做。但是想要把一個特別好的模型用好,或者說讓這樣的模型有它的溢出能力,其實也需要在應用側或者說在環境這一側做很多相應的事情。所以我們會發現,在 To C 的應用上,垂直整合還是成立的。無論是 ChatGPT 還是豆包,模型和產品是非常強耦合去緊密迭代。但對于 To B 來說,趨勢似乎是相反的。模型在變得越來越強,但也同樣會有更多應用層的東西想要去利用這樣的好模型,在不同的生產力環節發揮作用。這是我的兩個觀察。

李廣密(主持人):我再 Follow 順雨一個問題。因為你有一個新的身份嘛(騰訊),在中國這個市場上,你接下來的想的 Bet(下注)或者什么,有哪些鮮明的特點或者關鍵詞嗎?能給大家 Share 嗎?

姚順雨:對,我覺得騰訊肯定還是一個 To C 基因更強的公司。所以我們會思考,怎么樣讓今天的大模型或者說 AI 的發展能夠給用戶提供更多價值。但有一個很核心的思考:我們發現很多時候我們的 Bottleneck(瓶頸)可能在 To C 這一端不是更大的模型,或者更強的強化學習,或者更強的 Reward Model,很多時候可能是額外的 Context(上下文)和 Environment(環境)

我最近經常舉的一個例子:比如說我想問“我今天該去吃什么”。其實你今天問 ChatGPT 和你去年問、或者明天問,這個事情可能體驗都會很差。因為想要變好,不是說你需要更大的模型、更強的預訓練,這個問題的 Bottleneck 可能是你需要更多額外的輸入,或者說 Context。比如說如果它知道“啊今天我其實特別冷,我需要吃點暖和的”,然后“我今天在這個范圍活動”,可能“我老婆在另一個地方,她想吃什么”等等。其實回答這樣的問題,更多的 Bottleneck 是額外的 Context。比如說我和老婆聊了很多天,其實我們可以把聊天記錄從微信轉發給元寶,或者說把這些額外的輸入用好的話,反而會給用戶帶來很多額外的價值。這是我們對 To C 上的思考。

然后做 To B 在中國確實是一個非常難的事情。生產力的革命,包括我們今天很多中國的公司做 Coding Agent 其實也是要去打海外市場。這方面我們會思考怎么去把自己先服務好。像創業公司做 Coding 和大公司做 Coding 的一個區別是,大公司本身就已經有很多應用場景、各種各樣需要生產力變得更好的地方。如果我們模型能夠在這些地方做得更好,不僅模型會有自己獨特的優勢,更關鍵一點是,對于真實世界的更 Diverse(多樣化)的場景數據的捕捉,會是一個很有意思的事情。比如像 Anthropic 作為一個創業公司,想要做更多的 Coding Agent 數據,需要通過數據廠商去標數據。這些數據廠商需要利用軟件工程師去想“我要標什么樣的數據”。那這個事情最后的 Bottleneck 是數據公司一共就這么幾家,人就這么多,Diversity 會受限。但是如果你是一個 10 萬人的公司,可能會有一些有意思的嘗試,怎么去真的把真實世界的數據給利用好,而不是僅僅依賴于標注商或者說Distillation(蒸餾)。

李廣密(主持人):多謝順雨。接下來 Cue 一下俊旸。你怎么看接下來千問未來的一個生態位或者分化的 Bet?因為你后面重點講了全模態的方向。之前阿里云在 To B 很強,那接下來可能你也提了全模態可能更多 To C 的。這方面怎么思考?

林俊旸:理論上我是不能評論公司的。但是我覺得公司也不一定有那么多基因之分,一代一代的人可能就塑造了這些公司。

接下來這一句其實我也想注入一些我們自己對 AGI 的理解。因為我覺得今天 To B 和 To C 也好,我們其實是在服務真實的人類。所以我們想的問題,是怎么讓人類世界會變得更好。你就算做 To C 的產品,其實也會再分化。比如說今天 OpenAI 已經更像一個平臺了,但是你 To C 的話,最終要服務真實的這批用戶究竟是誰?

今天可能有很多 AI 可能會更偏向 Medical,更偏向 Law,但是它可能是自然形成。我愿意相信 Anthropic 可能不是說“今天我覺得 Coding 真的很厲害,我就 Bet on 它”。因為我知道他們跟 Business 交流真的非常多。這個可能也是我們自己做的還不夠好的一個點,雖然我們擁有巨大的優勢。當然也有可能中國這個 SaaS 市場跟美國確實不太一樣,他們確實是非常頻繁地跟客戶交流,很容易去發現這個很大的機會。

今天我跟美國的很多 API 廠商聊起來,他們都沒有想到 Coding 的 Token 消耗量居然會這么大。其實在中國其實還真的沒有那么大,至少從我這邊來看。但是在美國的話,基本上全都是 Coding。這個事情我覺得不是所有人都能 Bet 到的。那今天 Anthropic 在做更多跟 Finance 相關的東西,我覺得也是他們在跟客戶交流中看到的機會。所以我覺得大家的分化可能是自然的分化。所以我更愿意去相信 AGI 做 AGI 該做這個事情,然后順其自然。

李廣密(主持人):多謝俊旸。楊強老師,您對分化這個問題怎么看?

楊強:分化的問題,其實我更想聊一下工業界和學術界的分化。這個可能是橫跨美國和中國。一直以來,學術界是一個觀望者,工業界在領頭瘋跑。搞得現在很多學術界的人也在做工業界的事,像唐杰老師。這是一個好事,就好像天體物理學剛開始是以觀測為主,伽利略的望遠鏡,然后才出現牛頓。所以后面一個階段,當我們有了眾多的穩定大模型,進入一個穩態的時候,我們學術界應該跟上來。跟上來解決什么問題呢?就是工業界可能還沒來得及解決的一些問題。這也是我一直在考慮的問題,就是說智能上界在哪里?比方說給你一定的資源,計算資源或者能源資源,你能做到多好?

可以更細一點。比方說我們把這個資源怎么分配?哪些分配在訓練上,哪些分配在推理上?我很早就做 AI,90 年代初就做過一個小實驗:如果我們有一定的投入在記憶上面,那么這個記憶能夠幫助推理多少?然后這個幫助,會不會變成反向的,比如記住了太多的噪音,反而干擾了推理?有沒有一個平衡點?這些問題今天還是適用的,是一個 Fundamental(基礎)的問題。

最近我也在想另外一個問題,大家學計算機的都上過理論課,有一個重要定理叫哥德爾不完備定理。大概意思是說一個系統、像我們一個大模型,它是不能自證清白的,必定有一些幻覺是不可能消滅掉的。那可能你給更多的資源,它會消滅得更多。科學問題就來了:多少資源能夠換取多少幻覺的降低?這是一個平衡點,特別像經濟學的風險和收益的平衡。所以我們也叫“無免費午餐定理”。這些東西今天特別適合數學界、算法界和工業界一起來做研究,這孕育著巨大的突破。

剛才唐杰老師也提到持續學習。我覺得持續學習是一個特別好的問題。它里面有一個時間的概念。在持續學習過程中,你會發現,比方說把不同的 Agent 串聯起來,每一個 Agent 都不能做到 100%,那么在 N 個以后,能力是按指數下降的。

怎么樣保證它不下降?我覺得人類是個樣本,比如說第一天是學習,第二天會在第一天的噪音的基礎上學習,這樣你的能力就會類似大模型,會下降。但是人類有一個方法來解決下降,就是睡覺

我建議大家看一本書叫《我們為什么睡覺》(Why We Sleep)。他說每天晚上睡覺其實是在清理噪音,使得第二天可以把準確率持續提升,不至于是錯誤率的疊加。這些理論研究孕育著一種新的計算模式。我們今天可能比較關注 Transformer、Agentic Computing,但是我覺得有必要去做一些新的探索。這是我回答的問題,工業界和學術界要拉齊。

李廣密(主持人):感謝楊強老師。唐老師,從外部感受上,智譜今天更像是走了 Anthropic 這條路線,Coding 非常強,榜單上也比較靠前,包括您剛才講的 Long Horizon 的長程 Agent。您對分化這個主題怎么看?

唐杰:我倒覺得回到一個最本質的問題。早期確實最本質還是基座模型、智能上界。2023 年那時候我們是第一個做出 Chat 的。當時第一個想法就是趕緊上線。當然后來國家有相關的統一規定,就等到八九月份大家一起來上。當大家一起來上的時候,我的第一個感受是十來個大模型都上來了,而且每一家用戶都沒有那么多。當然今天分化的更嚴重。

經過一年的思考,我覺得其實這個可能不是真的解決問題。我原來的第一個預判說它會替代搜索。到今天很多人在用模型替代搜索,但是并沒有替代谷歌。谷歌反而自己把自己的搜索革命了。從這個角度上,這一仗自從DeepSeek出來之后,我感覺已經結束了。

那 DeepSeek 出來之后,應該思考的是下一個Bet是什么?下一仗是什么?我覺得下一仗肯定是要讓 AI 做一件事情。但做這件事情是什么,確實可以 Bet 一下。那時候廣密還到我們那交流。后來我們團隊爭論好多晚上,最后你可以叫我們運氣吧,但另一方面我們也是 Bet,Bet 了 Coding。后來,我們就把所有的精力放在了 Coding 上。

話題二:下一個范式

李廣密(主持人):我覺得有 Bet 是一個特別有意思的。過去一年中國不僅是開源很強,而且大家有了自己的 Bet。接下來有一個第二個比較有意思的問題。預訓練走了三年,大家說走到了七八成的收益。RL 強化學習今天大家也都成為共識,可能走到了百分之四五十的空間。今天硅谷也都在討論接下來新一個范式,唐老師剛才也提到叫自主學習、自我學習。要不我們先從順雨開始。

你在 OpenAI 待過,對于下一個范式怎么思考? OpenAI 是一個為人類推進來前兩個范式的一家公司,對于第三個范式,從你的角度能給大家帶來一些分享嗎?

姚順雨:現在自主學習在硅谷非常熱門,在硅谷的大街小巷、咖啡館里,大家都在談論,幾乎形成共識。但根據我的觀察,每個人對這個的看法可能都不一樣。我講兩點:

第一,我覺得這個事情的 Bottleneck 其實不是方法論,而是數據或者說任務。當我們在談論自主學習的時候,到底是在什么場景下、基于什么獎勵函數去做?比如說,你在聊天時,AI 變得個性化是一種自主學習;寫代碼時,熟悉公司環境是一種自主學習;探索新的科學,在這個過程中,像博士一樣從完全不了解到成為領域專家,也是一種自主學習。每一種自主學習,它的挑戰或者說方法論,可能都不一樣。

第二,我不知道這是不是非共識,但這個事情其實已經在發生了。ChatGPT 利用用戶數據擬合聊天風格,使它的感覺越來越好,是不是一種自我學習?今天 Claude Code 已經寫了 Claude Code 這個項目 95% 的代碼,在幫它自己變得更好,這是不是一種自我學習?

我記得當時我們 2022-23 年做 SWE-agent(Software Agent)時,我去 AGI House 宣傳,第一頁 Introduction 的 Slide 就說 ASI 最重要的點是自主學習。今天的 AI 系統本質上都有兩部分:一個是 Neural Network(神經網絡/模型);一個是代碼庫:你怎么去用這個模型,是用來做推理,還是用來做 Agent。

我們看 Claude Code 這個系統,它本質上有兩個部分:一部分是 Opus 這個 Neural Network,另一部分是怎么樣去使用這個 Network 的一大堆相應的代碼。無論是 Kernel GPU,還是部署環境、前端。如果我們做 Software Agent,如果有一天它能自己去 Improve 自己的 Repo,那是不是就是一種 AGI?我覺得今天 Claude Code 已經在大規模做這個事情了,只是人們意識不到,或者局限在特定場景下。我覺得這個事情已經在發生了,可能更像是一個漸變,而不像一個突變。

李廣密(主持人):Follow 一個問題。有一些人對自主學習比較樂觀,覺得 26 年能看到信號。你覺得還需要哪些實際的突破?比如 Long Context,或者模型并行采樣?從你看來,你感覺,接下來還有哪些關鍵條件具備了,這個信號才會發生?

姚順雨:很多人說 26 年才能看到這些信號,但我覺得 25 年其實已經有一些信號了。比如 Cursor,他們的 Auto-complete Model 每幾個小時就會用最新的用戶數據去學習。包括新的 Composer Model,其實也是在使用這些真實環境下的數據去 Training。當然,大家覺得這些東西可能還沒有特別石破天驚,這是受限于他們沒有預訓練能力,效果不如 Opus,但我覺得這顯然已經是一個信號了。

我覺得最大的 Bottleneck 是想象力。對于強化學習或者推理,我們可以很容易想象,如果實現是個什么樣子,比如說 O1 在數學題上從 10 分變 80 分。但如果 26、27 年有一個范式發生,宣布實現了自我學習,我們應該用什么任務去驗證?是它變成了一個賺錢的交易系統,像 Trading Bench 的延伸?還是解決了科學問題?我們需要先想象到那個時候,Blog Post(宣發的文章)長什么樣。

李廣密(主持人):順雨,OpenAI 已經 Lead 了兩次范式創新了。如果 26、27 年有新范式,全球范圍內,你覺得哪家公司 Lead 這個創新范式的概率最大?

姚順雨:可能 OpenAI 概率還是更大。雖然因為它商業化等變化,創新基因被削弱,但我覺得它還是最有可能誕生新范式的地方。

李廣密(主持人):俊旸,你對下一個范式,對 2026 年有什么展開?

林俊旸:如果從更實際一點講,剛才講的范式還在早期。RL 的 Compute 還沒有 Scale 得那么充分,所以很多的潛力其實沒打出來,今天我們還看到了很多 Infra 問題在這里面發生。全球范圍內,類似這里面的問題也都還存在。

如果要說下一代范式,一個自主學習。之前聊到“人類不能讓 AI 變得更厲害”:你跟 AI 不斷進行交互,只會讓它上下文變長、變得越來越笨。Task-time Scaling 這件事情是不是真的能夠發生,我覺得還是真的挺值得思考的。能通過更多的 Token,讓自己變得更強,我覺得至少 O 系列,在一定程度上實現了這個事情。有沒有可能像 Anthropic 說的“干 30 個小時”,真的能干出很難的任務,我覺得今天大家做那種 AI Scientist 這個事情,其實還挺有意義的,是在挑戰一些很難的,甚至是做人類未曾做到的這些事情,有沒有可能通過 Task-time Scaling 來實現。那么從這個角度上來說,AI 肯定是需要自主進化的 ,但究竟你是不是要更新參數,這個見仁見智,可能大家都有不同的技術手段來實現這個事情。

我覺得還有第二個點是,AI 有沒有可能實現更強的主動性。就是說,環境可能就是我的輸入信號。比如說我現在這個 AI,必須得有人類去 Prompt 它,然后你才能夠啟動它。那有沒有可能環境就能 Prompt 它?它自己能自主思考,去做一些事情。

但這引發了一個新的問題,就是安全的問題。我非常擔心安全這個問題,其實不是很擔心今天它講一些不該說的話,最擔心的事情是它做一些不該做的事。就比如說,它今天主動產生一些想法,往這個會場里面扔一顆炸彈這種事情。那我們肯定是不希望這些不安全的事情發生。但就像培養小孩一樣,我們可能要給它注入一些正確的方向。但主動學習可能也是挺重要的一個范式。

李廣密(主持人):是的。俊旸又提了一個“主動性”,主動性其實也可能是 26 年非常關鍵的一個 Bet。

我再 Follow 俊旸一個問題:如果自主學習在 26 年看到信號,你感覺可能是在哪些任務上、做什么樣的任務會先看到?是“模型訓練模型”了,最強的模型可以提升自己了?還是說自動化的 AI 研究員了?你有期待在哪些地方先看到嗎?

林俊旸:我覺得自動化的 AI 研究員可能甚至都不是那么需要自主學習,我覺得可能很快“AI 訓 AI”這件事情就可以實現。我看我們的同學每天在干的這個事情,我都覺得 Claude Code 很快是可以把他們替代掉的。

但是,我覺得可能是更持續地理解用戶這件事情,比如說 Personalization**(個性化)其實還挺重要的。比如說過往我們在做推薦系統的時候,其實用戶的信息是持續輸入的,這會讓整個系統變得更強。雖然它的算法其實很簡單,但今天在 AI 的這個時代,它是不是能夠更懂你?就是你的這些信息的輸入,能不能成為最好……我們過去講 Copilot,但其實今天連 Copilot 都沒有實現,就是能不能真正成為我的 Copilot 的問題。

所以我覺得如果說自主學習的話,可能會是在跟人的交互上。比如說 Personalization 這一件事情上可能就能做到,但是以什么指標來進行衡量,我覺得稍微有點不太好說。因為在推薦的時代,Personalization 你做得越好,別人可能就點得越多、買得越多。但是在 AI 時代,覆蓋到人類生活的方方面面的時候,真正的 Personalization 的衡量指標是什么,我們其實不太知道。所以今天我感覺可能更大的技術挑戰是:我們今天的 Evaluation(評估)不知道該怎么做。這個可能是我們更值得研究的問題。

李廣密(主持人):俊旸,因為你說到了主動,包括個性化,你感覺如果實現“記憶”這個點,26 年能看到技術的大突破性的跨越嗎?

林俊旸:我個人觀點是,大量技術的所謂“突破性”其實都是一些觀測問題,它其實都是線性發展的,只是人類對它的感受非常強烈而已。包括像 ChatGPT 的出現,對于我們做大模型人來說,其實就是線性的增長。

現在大家都在做 Memory 這個事情。你說技術方案對還是不對呢?我覺得很多方案也沒有什么對錯之分。但是做出來的效果,至少我拿我們自己獻個丑:我們自己的 Memory 看起來好像知道我過去干了什么,但只是記起來過去的事情,每次都會叫一遍我的名字,其實并不顯得你很聰明。

但你的 Memory 有沒有可能到某一個臨界點的時候,讓人覺得說,你結合你的 Memory 真的能夠像生活當中的人一樣,就過去大家講電影《Her》,它真的很像人,理解你的 Memory 可能就是在那一下,人類的感受就覺得突然間迸發。那可能就是那個時刻。

我覺得多多少少也需要一年的時間。很多時候其實我覺得技術也沒有發展那么快,只是大家比較卷,覺得每天都有新的東西,但其實技術就是在線性發展,只是我們可能是在觀測的角度處于一個指數上升的階段。比如說 Coding 的能力一點點提升,可能就能帶來很多的生產價值,大家可能就覺得 AI 發展得很快。但從技術進展上來說,可能我們就多干了一點點事情。每天看我們自己做的這個事情都還真的挺土的,解的那些 Bug 都不好意思拿出來跟大家講,非常的丑陋。

如果這樣做了,我們都已經能夠做到這樣的成績的話,那我覺得可能未來算法和 Infra 結合得更好的話,可能更加大有可為。

李廣密(主持人):多謝。楊強老師。

楊強:我一直以來是做聯邦學習。聯邦學習的主要思想是“多個中心,大家協作”。

我現在越來越多地看到,很多本地資源不足,但是本地的數據又有很多隱私和安全的要求。所以我們可以想象,現在大模型的能力越來越強,這種通用性大模型和本地的這種特殊性的小模型,或者是領域專家的模型,如何協作?

我覺得這種協作變得越來越可能。像美國,我看到 Zoom,就是黃學東他們做的叫 Federated AI 的 AI 系統,他做了一個很大的基座,這個基座大家都可以插進來。然后他就可以在一個 Decentralized(去中心化)的狀態下,能夠既保護隱私又能夠和通用大模型有效地溝通協作。

我覺得這種開源模式特別好,一個是知識的開源,一個是 Code 方面的開源。所以,我覺得尤其在像醫療、金融這樣的場景下,會越來越多看到這樣的現象發生。

李廣密(主持人):多謝楊強老師。唐老師。

唐杰:我其實對今年會有比較大的范式革新挺 Positive 的。我倒不說太細,因為那幾個點我都……就像我剛才講的,包括持續學習,還有 Memory,甚至模型架構,甚至多模態,我覺得都有可能出現新的范式的變革。

但我覺得有一個大的趨勢,我來說一下為什么會產生這樣的一個范式。我覺得原來其實是工業界跑得遠遠快于學術界。我記得在去年還有前年的時候,回到清華跟好多老師聊天說能不能做大模型,很多老師是第一沒卡...不是沒卡,是卡的數量幾乎為零。工業界是有 1 萬片,學校是 0 片或者 1 片,倍數是 1 萬倍。

但是到現在,很多學校已經有很多卡了,而且很多老師已經開始做了很多大模型的相關研究,包括硅谷那邊有很多老師都開始做甚至模型架構、持續學習這些相關研究。所以它已經不是一個……原來我們總覺得工業界在 Dominate(主導)這些,其實今天我覺得在 2025 年底到 2026 年初的時候,這一現象不大存在了。可能還有 10 倍的差,這里 1 萬片那里 1000 片,但是它已經孵化出種子了。我覺得在學術界它有這個創新的基因,有這個可能性了,這是第一個。

第二個,我覺得一個創新的出現它一定是某個事情有大量的投入,并且它的 Efficiency 變成為瓶頸了。現在在整個大模型里面,投入已經巨大,但是 Efficiency 并不高。也就是我們繼續 Scaling,你說有沒有收益呢?肯定是有收益的。比如說原來我們 Data,從 2025 年初可能 10 個 T 的數據,現在 30 個 T,甚至我們可以 Scaling 到 100 個 T。但 100 個 T 你 Scaling 上去以后,你的收益有多少?還有你的計算 Cost 得有多少?這就變成一個問題了。你不創新,這可能變成你花掉了 10 個億、20 個億,但是收益很小,就不值得了。

另外一方面,對于新的智能創新,假如我們每一次都要重訓一個基座,再重訓很多 RL。像 24 年出來 RL 的時候,大家覺得我接著訓嘛,收益比較有。但到今天你再接著瘋狂去 RL,收益也是有的,但就沒有那么 *Significant,還是一個收益效率的問題。

所以我們未來也許可以定一個:一方面,我們既需要 Scaling Up——我剛才其實在臺上講了,“反正最笨的辦法就是 Scaling”,因為 Scaling 我們肯定有收益,這是典型的一個工程做法。Scaling 肯定會帶來智能上限的提升,毫無疑問你只要 Get 到 More Data。但第二個方法,我覺得應該定一個叫 Intelligence Efficiency,就是說智能的效率,我們獲得智能的效率,即用多少的投入能獲得智能的增量。如果我們能用更少的投入獲得增量,而且我們現在已經變成一個瓶頸了,假如能用更少的范式獲得同樣智能提升,這就是一個瓶頸式的事情。所以我是覺得 2026 年一定有這么一個范式發生。

當然,我們也是在 Bet,我們也在努力,我們希望這個發生在我們身上,但也不一定。

話題三:Agent戰略

李廣密(主持人):對,我跟唐老師一樣非常樂觀。因為其實每個領先的模型公司每年的計算量實際上是每年 Compound(復合增長)有 10 倍左右。大家手上的計算資源多了,人才也涌入得越來越多,大家手上卡片多、做的實驗多了,其實它就是一個實驗工程,有可能某個點就出來了。

剛剛唐老師也聊到一個怎么衡量智能水平的點。我覺得第三個我們可以一起聊一下 Agent 這個戰略。最近我跟很多研究員聊,大家都提到對 26 年還有一個很大的預期,說 Agent 今天可以在后臺比如推理 3~5 個小時,做人類 1~2 天的工作量;大家期待說 26 年可以做人類正常工作一周到兩周的工作量。

這也是一個非常大的變化,因為它不再只是一個工具——就是唐老師提的說只是一個 Chat,而是說真的在自動化你一整天甚至一周的任務流。那這樣的話其實,26 年有可能是 Agent 真的叫“創造經濟價值”的關鍵一年。

所以 Agent 這個問題我們可以展開聊一下。大家也是順雨剛才提的“垂直整合”嘛,既有模型又有 Agent 產品。包括我們看到硅谷的幾個公司也都從模型到 Agent 端到端都做了。

順雨,你花了很多時間做 Agent 研究,你對 26 年這個 Agent,比如 Long Horizon 的這種 Agent,真的能 Automate 人類一周到兩周的工作?這個對 Agent 的戰略,包括從模型公司的出發點會怎么思考這個問題?

姚順雨:我覺得還是像剛剛說的,在 To C 和 To B 可能不太一樣

目前看起來,To B 的情況是已經達到了一個在不斷上升的曲線,好像沒有要變慢的趨勢。Anthropic 這公司很有意思,它基本上不做什么創新,它就是覺得:模型預訓練變大了,然后老老實實把 RL 做好,只要預訓練不斷變大,后訓不斷把真實世界的任務做好,它就會越來越聰明,帶來越來越多價值。

我覺得 Anthropic 特別有意思的一點是,從某種程度來說,做 To B 其實所有的目標之間是更一致的。你的模型智能越高,解決的任務就越多;解決任務越多,在 To B 下帶來的收入就越大。這點就很好辦了。

那做 To C 的一個問題是,我們都知道 DAU 或者說產品的指標,其實和模型的智能很多時候是不相關的,甚至相反。我覺得這是 Anthropic 能夠聚焦另一個很重要原因:它只要真的把模型越做越好,收入就越來越高,所有事情全部都是非常 Aligned 的。

目前看起來我覺得生產力的 Agent 才剛剛開始。現在可能除了模型之外有兩個 Bottleneck:一個是環境問題,或者說 Deployment(部署)的問題。

我之前在 OpenAI 之前,在一個叫 Sierra 的公司實習過,這是一個 To B 的客服公司。我在 To B 公司工作過有很多收獲。最大的收獲是,我感覺即使今天模型不再變好,所有的模型訓練全部停止了,但是我們把這些模型部署到世界上各種各樣的公司,它可能能帶來今天的 10 倍或者 100 倍的收益,或者說可能對 GDP 能夠產生 5%~10% 的影響。但是今天我覺得它的影響還遠遠不到 1%。

第二點是教育非常重要。我觀察到現在人和人的差距在拉大,并不是說 AI 要替代人的工作,而是說會使用這些工具的人,在替代那些不會使用工具的人。就像當年電腦剛被發明出來,你轉身去學習編程,和你還在使用計算尺、算盤,那是巨大的差距。我覺得現在中國能做的一個最大的有意義的事情其實就是更好的教育,教大家怎么更好地去使用像 Claude Code 或者 ChatGPT 這樣的產品。當然 Claude Code 可能在中國用不了,但是我們可以用 Kimi 或者智譜這樣國產的模型。

李廣密(主持人):多謝順雨。俊旸,對 Agent 的想法,包括因為千問也有一個生態,千問自己做 Agent 以及扶持生態的通用 Agent,你也可以展開講講。

林俊旸:這里涉及一個產品哲學的問題。當然 Manus 確實很成功,但是“套殼”是不是一個未來,這本身也是個話題。我覺得今天到這個 Timing,我其實比較同意你的觀點,叫“模型即產品”。

我跟 TML 的人聊,他們叫 "Research as a Product"。其實我挺喜歡這個事情。包括我看 OpenAI,挺多 Researcher 自己能夠成為產品經理 End-to-End 地把這個東西做起來。今天我們自己內部的 Researcher 都想做更多面向真實世界的東西。

我其實愿意相信接下來的 Agent 是可以做到剛才所說的事情,而且跟剛才所提的 Self-evolution(自我進化)以及 Active Learning(主動學習)都有比較強烈的關系。比如它能干這么長時間,它其實自己就得在過程當中進化,并且它還要決定去干什么東西,因為它收到的指令是一個非常 General 的任務。所以我們現在 Agent 其實已經開始越來越變得是那種“托管式”的 Agent,而不是說我要不斷跟你來來回回交互的那種形式。

從這個角度上來說,它對模型的要求其實是很高的,模型就是 Agent,Agent 就是這個產品本身。如果他們都是一體化的話,那么今天做基礎模型本身其實也就是在做這個產品。如果不斷提升模型能力的上限,包括 Task-time Scaling 能做上去的話,確實能夠做到這個事情。

但我覺得還有一個點是跟環境交互有關系,我們現在交互的環境還不是很復雜,都還是電腦的環境。我有朋友是做跟 AI for Science 比較相關的。比如今天你干 AlphaFold 這一個事情,其實做出來還沒到那一步,比如制藥,你就算用今天 AI,可能不一定幫到你那么多。因為你要去做濕實驗,要做這些事情才能得到反饋。

有沒有可能我們未來 AI 能夠環境復雜到可能是真實的人類世界的環境,指揮機器人去做濕實驗,去加快效率?否則按照現在人類的效率,其實非常低。我們甚至還要雇傭很多外包在實驗環境里面去做實驗。如果能達到這一個點,可能才是我想象當中 Agent 能夠做人類很長時間的活,而不是說僅僅是在電腦當中寫個文件。

這些東西我覺得可能今年很快就可以完成。但我覺得接下來三年到五年的時間,可能這個事情會更加有意思。那這個的話可能又要跟具身智能結合在一起。

李廣密(主持人):我想 Follow 俊旸一個尖銳點的問題:從你的角度看來,通用的 Agent 這個機會是創業者的嗎?還是說模型公司是一個時間問題,總會把通用 Agent 做好?

林俊旸:我不能因為我做基礎模型,我就去做創業導師,我做不了這個事情。那我只能借成功人士 Peak(Manus 的 CTO)說的話,他說:做通用 Agent 最有意思的事情是長尾,反而是更值得關注的事情,或者是說今天 AI 更大的魅力是在長尾。

如果是馬太效應,頭部的這個東西其實挺容易解決的。當年做推薦的時候,我們看到推薦非常集中在頭部商品。但我們想把尾部推過去,但我當時做就非常遭殃。我作為一個干 NLP 和多模態的人,碰到推薦系統,去干解馬太效應,那基本上是奔著死路去的。

但我覺得今天的所謂 AGI 其實就在解這個問題,你做通用 Agent 是能不能把長尾的問題給解決。今天我一個用戶,我真的尋遍各處都找不到能夠幫我解這個問題的。但就在那一刻,我感受到了 AI 的能力,全世界任何一個角落,我尋遍各處都找不到,但是你卻能幫我解。可能這就是 AI 最大的魅力。

所以你說要不要去做通用的 Agent?我覺得見仁見智。如果你覺得你是一個“套殼高手”,套的可以比模型公司做得更好,我覺得可以去做。但如果你沒有這個信心,這個事情可能是留給模型公司做“模型即產品”的時候,因為他們遇到問題的時候,其實我只要訓一訓模型,我只要燒一燒卡,這個問題可能就解決了。所以見仁見智。

李廣密(主持人):其實解決長尾的問題,模型公司算力加數據好像解決起來也挺快的,對吧?

林俊旸今天 RL 最有意思的地方,我覺得是我們發現修問題比以前容易了。以前修問題很難。我舉一個 B 端客戶的情況,他們說我們自己要做 SFT,你能不能告訴我通用數據怎么配比?每次我們都很頭痛。然后我們覺得對方不太會做 SFT,他那個數據非常垃圾,但他可能覺得非常有用。

那今天有了 RL 之后,你可能真的只要很小的一個數據點,甚至不需要標注,只要有 Query,有 Reward,這個東西稍微訓一訓,合并起來其實也非常容易。那可能是今天技術的魅力。

李廣密(主持人):多謝俊旸,來,楊強老師。

楊強:我覺得 Agent 出現應該有四個階段。
看一個,是目標的定義,是由人為定義的還是自動定義的?
第二個,是說規劃,就是中間的 Action,規劃也可以由人來定義,也可以由 AI 自動定義。

所以這樣就自然地分為四個階段了。我覺得我們現在在一個非常初級的階段,就是目標也是人定義的,規劃也是人做的。所以現在的這些 Agent 的 Definition 系統,基本上是一個更高級的 Very High-level Programming Language。

但我預料未來會出現一個大模型觀察人的工作,尤其是把人的 Process Data 給使用起來。最后目標也可以是大模型來定義,規劃也可以由大模型定義。所以,Agent 應該是由大模型內生的一個 Native 的系統。

李廣密(主持人):多謝楊老師。唐老師。

唐杰:我覺得確實有幾個因素決定了 Agent 未來的走勢。

第一,Agent 本身有沒有解決人類的事情,這個事情是不是有價值的,價值有多大。比如原來的 GPTs 出來,也做了很多 Agent。那個時候你會發現 Agent 都很簡單,最后發現 Prompt 就解決了。那些大部分 Agent 慢慢就死掉了。所以第一個是解決這個事情有多大價值,能不能幫到人。

第二,做這個事情的 Cost 有多大。如果 Cost 特別大,那也是一個問題。剛才俊旸也說了,也許我調用一個 API 就能解決。但反過來,假如調個 API 就能解決,那么這個 API 本身可能覺得這件事情價值很大的時候,它就會把它做進去。這是個矛盾,基座和應用永遠是個矛盾。

最后一個維度,是做應用的速度。如果你說我有個時間窗,我能夠拉開半年的時間窗,迅速把應用滿足了,半年以后,要么迭代,要么怎么著,反正能往前走。說白了大模型時代到現在,更多的是在拼速度、拼時間。

也許一個決策是正確,就像你剛才說也許我們 Bet 代碼正確了,那也許我們就會在這方面走得更遠一點。但也許 Bet 失敗了以后就半年,半年就沒了。所以今年我們只是在 Coding、在 Agent 這塊我們 Bet 了一點點,現在我們 Coding 調用量都還不錯。所以我覺得更多也是一個 Bet 吧,做 Agent 可能未來也是一個 Bet。

話題四:中國AI的未來

李廣密(主持人):多謝。因為過去模型公司既要追通用能力,優先級上就沒有花那么多精力去探索。其實通用能力追上來之后,我們也更多的期待 26 年智譜、千問有更多自己的 Claude Code 時刻和 Manus 時刻。我覺得這是非常值得去預期的。

第四個問題,也是最后一個問題,我覺得比較有意思。因為這個活動、這個時間點,更多值得去展望未來。

我其實挺想問大家一個問題:在三年和五年以后,全球最領先的 AI 公司是一個中國團隊的概率有多大?我們從今天的跟隨者變成未來的引領者,這個文化包括關鍵條件,到底是還有哪些需要做好的?

順雨,因為你是經歷過硅谷跟中國兩個體感的,你對這個概率的判斷和需要哪些關鍵條件的判斷是怎么樣的?

姚順雨:我覺得概率還挺高的。我還是挺樂觀的,因為目前看起來,任何一個事情,一旦被發現出來,在中國都會很快 Catch up 或者復現,然后在很多局部去做到更好 。包括之前制造業、電動車這樣的例子已經不斷在發生。

我覺得可能幾個比較關鍵的點,一個可能是中國的光刻機到底能不能突破。如果最終算力變成了 Bottleneck,我們能不能解決這個算力問題?目前看起來我們有很好的電力優勢,有很好的基礎設施優勢。可能主要的瓶頸就是產能,包括光刻機以及軟件生態。這個問題解決了會是個很大的幫助。

另一個問題就是,除了 To C 之外能不能有更成熟或者更好的 To B 的市場,或者有沒有機會在國際的商業環境去競爭。今天我們看到很多做生產力或者做 To B 的模型,還是會誕生在美國,因為支付意愿更強,To B 的文化更好。中國國內做這個事情很難,所以大家都會選擇出海或者做國際化。

但我覺得還有更重要的是主觀上的概念。我最近跟很多人聊天,直觀的感受是:中國其實有非常多非常強的人才。任何一個事情,只要被證明能做出來,很多人都會非常積極地去嘗試,并且想要甚至做得更好。

但好像,今天中國想要突破新的范式或者做非常冒險事情的人,可能還不夠多。這里面可能有經濟環境、商業環境、文化的因素。但是如果增加一點的話,主觀上能不能有更多有創業精神或者冒險精神的人,真的想要去做前沿探索或者新的范式突破的事情。

因為目前來看,一個范式一旦被發生,我們可以用很少的卡、很高的效率去 Catch up 或者甚至局部做得更好。但是,我們到底能不能去引領新的范式?我覺得這可能是今天中國唯一要解決的、某種程度上唯一要解決的問題。因為其他所有事情,無論是商業、產品設計還是這種 Catch up 做工程,我們都已經某種程度上比美國做得更好。

李廣密(主持人):我再 Follow 順雨一個問題:你對中國的 Lab 里面的研究文化有什么要呼吁的嗎?你也感受過 OpenAI 或者灣區 DeepMind 的研究文化,中國跟美國有什么差異?這個研究文化對作為一個 AI Native 的公司有哪些根本性的影響?

姚順雨:我覺得每一個地方的研究文化都很不一樣,美國不同實驗室之間的區別可能比中美之間的區別還要大。在中國也一樣,我個人覺得有兩點吧:

第一,在中國大家還是更喜歡做更安全的事情。比如今天預訓練已經被證明可以做出來了。這事情其實也非常難做,有很多技術問題要解決。但是只要一旦被證明能做出來,我們都很有信心幾個月或者一段時間內就把這個東西搞清楚。但是如果今天要讓一個人去探索一個比如長期記憶或者持續學習,大家不知道怎么做,能不能做起來。那這個我覺得還是比較困難。

當然,也不只是大家更喜歡做確定性的事情。很重要一點是,文化的積累以及整體的認知其實是一個需要時間沉淀的事情。可能在 OpenAI 做 RL 這事情,可能是 22 年就開始做了。國內可能是 23 年開始做,對這個東西的理解會有差異。或者說,中國 RL 好像沒有 Scale up 得這么大。我覺得很多是時間問題。當你積累的文化或者底蘊更深,潛移默化地會影響人的做事方式。

第二,我覺得在中國大家對于刷榜或者數字會看得更重一些。這一點上,像海外 Anthropic 就會做得比較好。包括 DeepSeek 做得也比較好的一點是,他們可能沒有那么關注榜單的數字,可能會更注重:第一什么是正確的事情,第二是什么是你自己能體驗出來好還是不好的

我覺得這挺有意思的。你看,Claude 模型可能在很多編程或者軟件工程榜單上也不是最高的,但是大家都知道這個東西是最好用的。我覺得還是需要大家能夠走出榜單的束縛,去堅持自己覺得什么是正確的、或者什么是好的。

李廣密(主持人):多謝。俊旸,你來聊聊中國贏下的概率和條件

林俊旸:你這個問題本身是一個危險的問題。理論上這個場合是不可以潑冷水的。但是,如果從概率上來說,我想說一下我感受到的中美差異。

比如美國的 Compute,可能整體比我們大 1~2 個數量級。但是我看到不管是 OpenAI 還是 Anthropic,他們大量的 Compute 其實只是投入到下一代的 Research 當中去。我們今天相對來說捉襟見肘,光交付可能就已經占據了絕大部分的 Compute,這會是一個比較大的差異。

這可能是歷史以來的問題:創新是發生在有錢的人手里,還是窮人的手里?

窮人不是沒有機會,因為我們覺得這些“富哥”真的很浪費卡,他們 Ablation(消融實驗)這么多東西,可能訓了很多也沒什么用。但今天窮的話,你會想,比如所謂的算法 Infra 聯合優化這個事情。其實如果你真的很富的話,你真的沒有什么動力去做這個事情。

我覺得可能更進一步,剛才順雨也提到光刻機的問題,未來有可能還有一個點是,如果從軟硬結合的角度,是不是真的有可能 End-to-End 地做出來?比如我們下一代的模型結構和芯片,其實都有可能是一起把它給做出來的。

我特別記得我在 21 年的時候,當時我們在做大模型。阿里做了芯片,來找我說:能不能預測一下三年之后這個模型是不是 Transformer?三年之后模型是不是多模態?為什么是三年呢?他說我們需要三年的時間才能流片。我當時回答是:三年之后,我在不在阿里巴巴,我都不知道。但最后我今天還在阿里巴巴,然后他果然還是 Transformer,還是多模態,我就非常懊悔為什么當時沒有去催他去做。

但當時我們的交流其實非常“雞同鴨講”,他講了一大堆我不懂,我講了他不知道我們在做什么,就錯過了機會。但這個機會有沒有可能再來一次?我們雖然是一群窮人,但是不是有可能窮則生變?創新的機會可能發生在這里。

但我覺得可能我們需要改變的是教育。我感覺,比如我屬于 90 年代靠前一些的,順雨屬于 90 年代靠后一些的,團隊里面好多 00 后,我感覺大家冒險精神變得越來越強。美國人天然有非常強烈的冒險精神,典型的例子是當時電動車剛出來,甚至天棚漏水、開車可能會意外身亡的情況下,依然有很多富豪愿意做這個事情。但在中國,富豪們是不會去干這個事情的,大家會做一些很安全的事情。

那今天,大家的冒險精神開始變得更好,中國的營商環境也在變得更好,我覺得是有可能帶來創新的。概率沒那么大,但真的有可能。

李廣密(主持人):如果看一個數字呢?

林俊旸:你是說百分之多少?

李廣密(主持人):對,三年到五年后中國最領先的那個公司是一家中國公司的概率。

林俊旸我覺得 Below 20% 吧,我覺得 20% 已經非常樂觀了,因為這里真的有很多歷史積淀的原因。

李廣密(主持人):我再 Follow 一個問題,你內心的那個 Gap 變大的恐懼感強嗎?有的地方在追上來,有的地方算力又在拉大。

林俊旸:今天你干這一行就不能恐懼,必須得有非常 Chill 的心態。從我們的心態上來說,能干這行已經非常不錯了,能夠做大模型這件事情已經非常幸運了。

我覺得還是看你的初心是什么。剛才順雨提到一個點,你的模型可能不一定那么強,在 C 端里邊其實是 OK 的。那我可能轉換成另外一個角度思考:我們的模型為人類社會帶來什么樣的價值? 只要我去相信我這個東西能夠為人類社會帶來充分的價值,能夠幫助人類,他就算不是最強的,我也愿意接受。

李廣密(主持人):多謝俊旸。楊老師,您經歷過很多 AI 的周期,也看過很多中國 AI 公司變成世界最強,您的判斷?

楊強:回顧一下互聯網的發展,一開始也是從美國開始,但是中國很快就趕上,而且應用像微信就是世界第一的。我想 AI 是一個 Enabling 的技術,它并不是一個終端的產品。但是我們中國有很多的聰明才智會把這個產品發揮到極致,不管是 To B 還是 To C。但我可能更看好 To C,因為百花齊放,中國人集思廣益。

但是 To B 可能有一些具體的限制,像付費意愿、企業文化等等,這些可能也在改變。但是我最近也特別觀察一些商業方面,比如美國有一個公司叫 Palantir,他的一個理念是:現在不管 AI 發展到什么階段,我總是能在 AI 里面發現一些好的東西應用在企業上。中間肯定有 Gap,我們要給它彌合。

它有一個辦法叫“本體”,用本體的方法。其實我觀察了一下,大概的思想就是我們以前做的遷移學習,把一個 General 的 Solution 應用到一個具體的實踐當中,用一個本體來做一個知識的遷移。這個方法非常巧妙。它是通過一種工程的方法,叫前端工程師 FDE(Forward Deployed Engineer)來解決的。

不管怎么樣,我覺得像這種就非常值得我們學習。我覺得中國的企業像 AI Native 的公司應該發展出這樣的一些 To B 的 Solution 來。我相信會的。所以,我覺得 To C 肯定是百花齊放的,To B 可能也會很快地跟上來。

李廣密(主持人):多謝楊老師。唐老師。

唐杰:首先我覺得確實也要承認,在中美,無論從研究,尤其是企業界的 AI Lab,是有差距的,這是第一個。

但我覺得未來中國慢慢變得越來越好,尤其是 90 后、00 后這一代起來,真的遠遠好過之前。我有一次在 YOCSEF 的一個會上說過一句話:我們這一代是最不幸的。為什么呢?你看我們上一代還在呢,我們現在還在繼續工作,還沒出頭之日。然后很不幸的下一代已經出來了,世界已經交給下一代了,把我們這一代無縫給跳過了。其實開玩笑的。

但我覺得最有意思的是,可能未來中國也許的機會:

第一,一群聰明人真的敢做特別冒險的事。我覺得現在是有的,00 后、90 后這一代,包括俊旸、Kimi、順雨,都是愿意而且非常敢冒風險做這樣大冒險的事。

第二,我覺得確實環境要更好一些。無論從國家的環境,比如大企業和小企業之間競爭,創業企業之間的問題,包括我們的營商環境。像剛才俊旸說的,還要做交付。我覺得把環境 Build 得更好,讓一群聰明人又敢于冒險的聰明人有更多的時間去做這種創新的事情。比如讓俊旸這樣的人有更多時間做創新。這是第二個,也許是我們政府包括國家可以來幫忙改善的事情。

第三,回到我們每個人身上,就是能不能堅持。我們能不能愿意在一條路上,敢做、敢冒險,而且環境也還不錯?我覺得環境肯定不會是最好的,永遠不要想著環境是最好的。如果我覺得我們恰恰可能也是幸運吧,我們在經歷一個環境從也許原來沒那么好慢慢變得更好的一個時代。我們是經歷者,也許就是這個財富收獲最多的人。如果我們笨笨地堅持,也許走到最后的就是我們,感謝大家。

結語

李廣密(主持人):感謝唐老師。所以我們也很想呼吁,應該有更多的資源資金投入到中國的 AGI 行業。有更多的算力,讓更多的 AI 年輕研究員“搓卡”,可能搓個三五年,中國也有 3~5 個自己的 Ilya,對吧?這是我們未來 3-5 年很期待的

非常感謝大家!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
法護峨眉 綠美山川

法護峨眉 綠美山川

封面新聞
2026-03-20 18:47:02
82歲老人抽了52年煙,臨終前說了一句話,我在病房口站了十分鐘

82歲老人抽了52年煙,臨終前說了一句話,我在病房口站了十分鐘

千秋文化
2026-03-18 20:35:26
江西情侶分手引爆全網!男生怒曬2.8萬PPT,連私密記錄都公開了

江西情侶分手引爆全網!男生怒曬2.8萬PPT,連私密記錄都公開了

行者聊官
2026-03-19 16:44:44
玉昆4-0大勝泰山,喬迪一針見血點評比賽原因

玉昆4-0大勝泰山,喬迪一針見血點評比賽原因

民哥臺球解說
2026-03-22 01:38:34
吃完香椿炒雞蛋后,男子多器官衰竭!這起悲劇,給所有人敲響警鐘

吃完香椿炒雞蛋后,男子多器官衰竭!這起悲劇,給所有人敲響警鐘

DrX說
2026-03-20 14:00:07
男按摩師揭秘:很多女顧客需要的并不是按摩,更需要的是我!

男按摩師揭秘:很多女顧客需要的并不是按摩,更需要的是我!

千秋歷史
2026-03-18 21:12:02
98歲祖母離世!多年不來往的娘家來了十幾個人,網友:娘死等舅來

98歲祖母離世!多年不來往的娘家來了十幾個人,網友:娘死等舅來

火山詩話
2026-03-21 10:20:37
清華大學今年起陸續出版61冊思政課教學用書

清華大學今年起陸續出版61冊思政課教學用書

中國青年報
2026-03-19 21:27:08
2013年,7名美艷少婦自愿與禿頭大爺發生關系,警方調查:不簡單

2013年,7名美艷少婦自愿與禿頭大爺發生關系,警方調查:不簡單

談史論天地
2026-02-26 08:29:54
藍月槍手上演巔峰對決,英聯杯決賽雙方首次為聯賽前兩名球隊

藍月槍手上演巔峰對決,英聯杯決賽雙方首次為聯賽前兩名球隊

懂球帝
2026-03-22 05:53:18
10萬億!中國將成為全球,乃至人類歷史上,第一個“電力王國”

10萬億!中國將成為全球,乃至人類歷史上,第一個“電力王國”

有范又有料
2026-03-21 15:32:11
名門千金海清:坐擁9500平大院,給歐豪下跪,兒子被稱小谷愛凌

名門千金海清:坐擁9500平大院,給歐豪下跪,兒子被稱小谷愛凌

邊城少爺
2026-03-21 15:28:36
徹底炸鍋!伊朗馬里萬市民點火封路,硬剛革命衛隊與巴斯基民兵

徹底炸鍋!伊朗馬里萬市民點火封路,硬剛革命衛隊與巴斯基民兵

老馬拉車莫少裝
2026-03-21 14:08:22
交通運輸部檢查指導組在陜西明察暗訪發現客運車輛違規夾帶危險物品

交通運輸部檢查指導組在陜西明察暗訪發現客運車輛違規夾帶危險物品

界面新聞
2026-03-20 09:34:03
好歹具備不錯的投射能力!火箭也不應該一直將他摁在板凳上?

好歹具備不錯的投射能力!火箭也不應該一直將他摁在板凳上?

稻谷與小麥
2026-03-22 02:19:45
劉燁的基因太強大了,兒子太像他了,諾一是中法混血兒,很帥

劉燁的基因太強大了,兒子太像他了,諾一是中法混血兒,很帥

喜歡歷史的阿繁
2026-03-21 14:29:01
阿里利潤暴跌66%,到底發生了什么?

阿里利潤暴跌66%,到底發生了什么?

大佬灼見
2026-03-20 11:51:01
新加坡媒體:中國外交發生變化,放棄了和平解決中美問題的想法

新加坡媒體:中國外交發生變化,放棄了和平解決中美問題的想法

李子櫥
2026-03-18 14:10:37
第3金,張展碩400自戰勝世界紀錄保持者奪冠,成績歷史前三

第3金,張展碩400自戰勝世界紀錄保持者奪冠,成績歷史前三

真理是我親戚
2026-03-21 21:42:00
卷巨額遺產出逃英國,給楊振寧戴綠帽子,翁帆身上的謠言有多離譜

卷巨額遺產出逃英國,給楊振寧戴綠帽子,翁帆身上的謠言有多離譜

娛說瑜悅
2026-03-17 14:34:49
2026-03-22 06:36:49
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
337文章數 49關注度
往期回顧 全部

科技要聞

宇樹招股書拆解,人形機器人出貨量第一!

頭條要聞

伊朗導彈擊中以色列核設施附近 大范圍爆炸視頻公布

頭條要聞

伊朗導彈擊中以色列核設施附近 大范圍爆炸視頻公布

體育要聞

誰在決定字母哥未來?

娛樂要聞

田栩寧終于涼了?出軌風波影響惡劣

財經要聞

通脹警報拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態度原創

手機
親子
旅游
本地
公開課

手機要聞

終端市場集體喊“漲” 手機面板持續走“跌”

親子要聞

帶娃寶媽用什么素顏霜,快速提氣色不用卸妝?

旅游要聞

【花Young貴陽】春日限定!十里河灘海棠花盛開引客來

本地新聞

春色滿城關不住|紹興春日頂流,這片櫻花海藏不住了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版