337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

楊植麟、張鵬、羅福莉等齊聚一堂,他們關(guān)于OpenClaw的觀點(diǎn)值得一聽(tīng)。

0
分享至

今天是2026中關(guān)村論壇的人工智能主題日。

我也定了個(gè)一早的鬧鐘準(zhǔn)時(shí)起來(lái)看。


這個(gè)活動(dòng)海淀已經(jīng)辦了第三年,但今年的議程密度確實(shí)有點(diǎn)夸張。

一上午塞進(jìn)了開(kāi)源聯(lián)盟成立、主權(quán)大模型白皮書(shū)發(fā)布、北京市人工智能協(xié)會(huì)揭牌,外加兩場(chǎng)圓桌。

大模型和具身智能各一場(chǎng)。嘉賓陣容從Eclipse基金會(huì)到智譜、小米MiMo、無(wú)問(wèn)芯穹,再到一眾具身智能公司的創(chuàng)始人,幾乎把當(dāng)下AI產(chǎn)業(yè)鏈上最活躍的角色都拉到了同一個(gè)舞臺(tái)上。

在我看來(lái),信息密度最高的,還是第一場(chǎng)小龍蝦與AI開(kāi)源圓桌。


這場(chǎng)圓桌由楊植麟主持,嘉賓是智譜的張鵬、無(wú)問(wèn)芯穹的夏立雪、小米MiMo的羅福莉,還有港大的黃超。

從模型層到算力基礎(chǔ)設(shè)施層再到Agent應(yīng)用層,剛好覆蓋了當(dāng)下AI產(chǎn)業(yè)鏈的幾個(gè)關(guān)鍵環(huán)節(jié)。

張鵬解釋了智譜GLM5 Turbo提價(jià)的邏輯,模型從聊天轉(zhuǎn)向干活,完成任務(wù)消耗的token量可能是簡(jiǎn)單問(wèn)答的十倍甚至百倍,提價(jià)本質(zhì)上是在回歸商業(yè)價(jià)值。

羅福莉談了中國(guó)團(tuán)隊(duì)在模型結(jié)構(gòu)創(chuàng)新上的優(yōu)勢(shì),尤其是長(zhǎng)上下文架構(gòu)和推理效率。

黃超拆解了Agent在planning、memory、skill三個(gè)維度上的技術(shù)痛點(diǎn)。

最后讓每人用一個(gè)詞總結(jié)未來(lái)12個(gè)月的趨勢(shì),黃超說(shuō)的是 生態(tài) ,羅福莉說(shuō)的是 自進(jìn)化 ,夏立雪說(shuō)的是 可持續(xù)token ,而張鵬直接點(diǎn)了一個(gè)最樸素的問(wèn)題: 算力

幾位嘉賓的圓桌對(duì)話,干貨含量極高,幾乎沒(méi)有什么客套和PR話術(shù),聊的都是非常實(shí)在的問(wèn)題。

所以,我也把這場(chǎng)圓桌的內(nèi)容做了一個(gè)完整的文字整理,分享給大家。

【圓桌對(duì)話-人類校對(duì)版】

楊植麟(主持人) :很榮幸今天能邀請(qǐng)到各位重磅的嘉賓,各位的背景覆蓋了不同的層面,從模型層到底層的算力層,再到上面的Agent層。很高興今天能和大家一起探討,主要的關(guān)鍵詞是開(kāi)源和Agent。我們從第一個(gè)問(wèn)題開(kāi)始,這個(gè)問(wèn)題是給所有人的。現(xiàn)在OpenClaw是最流行的產(chǎn)品,大家在日常使用OpenClaw或類似產(chǎn)品的過(guò)程中,覺(jué)得最有想象力或者印象最深刻的是什么?從技術(shù)角度來(lái)看,如何看待今天OpenClaw和相關(guān)Agent的演進(jìn)?我們先從張鵬這邊開(kāi)始。

張鵬 :好,首先感謝植麟的邀請(qǐng),也感謝主辦方給這次機(jī)會(huì)跟大家交流。其實(shí)我很早就開(kāi)始自己玩這個(gè)東西了,當(dāng)時(shí)還不叫OpenClaw,最早叫Claude Bot。畢竟我是程序員出身,折騰這些東西有一些自己的體驗(yàn)。我覺(jué)得它帶給大家最大的突破點(diǎn),在于這件事情不再是程序員或者極客們的專利,普通人也可以比較方便地使用頂尖模型的能力,尤其是在編程和智能體方面。所以到現(xiàn)在為止,我在跟大家交流的過(guò)程中,更愿意把OpenClaw這件事稱作一個(gè)腳手架,它提供的是一種可能性。在模型的基礎(chǔ)之上搭起一個(gè)牢固、方便又靈活的腳手架,大家可以按照自己的意愿去使用底層模型提供的很多新奇的東西。原來(lái)自己的一些想法,受限于不會(huì)寫(xiě)代碼或者缺乏某些技能,今天終于可以通過(guò)很簡(jiǎn)單的交流就把它完成。這對(duì)我來(lái)說(shuō)是一個(gè)非常大的沖擊,讓我重新認(rèn)識(shí)了這件事情。

夏立雪 :我最開(kāi)始用OpenClaw的時(shí)候其實(shí)不太適應(yīng),因?yàn)槲伊?xí)慣于和大模型聊天的那種交流方式,結(jié)果發(fā)現(xiàn)OpenClaw反應(yīng)好像比較慢。但后來(lái)我意識(shí)到一個(gè)關(guān)鍵的不同,它不是一個(gè)聊天機(jī)器人,而是一個(gè)能夠幫我完成大型任務(wù)的助手。當(dāng)我開(kāi)始給它提交更復(fù)雜的任務(wù)之后,發(fā)現(xiàn)它其實(shí)能做得很好。這件事給我一個(gè)很大的感觸,就是AI從最開(kāi)始按token聊天,到現(xiàn)在能夠作為一個(gè)Agent幫你完成任務(wù),對(duì)整個(gè)AI的想象力空間做了一個(gè)很大的提升。但與此同時(shí),它對(duì)整個(gè)系統(tǒng)的能力要求也變得很高,這也是我一開(kāi)始用會(huì)覺(jué)得卡頓的原因。

作為基礎(chǔ)設(shè)施層的廠商,我看到OpenClaw為整個(gè)AI后續(xù)的大型系統(tǒng)和生態(tài)帶來(lái)了更多機(jī)遇和挑戰(zhàn),因?yàn)楝F(xiàn)在所有能用到的資源,想要支撐起這樣一個(gè)快速增長(zhǎng)的時(shí)代是不夠的。就拿我們公司來(lái)說(shuō),從一月底開(kāi)始,基本上每?jī)芍躷oken用量就翻一番,到現(xiàn)在已經(jīng)翻了十倍。上次見(jiàn)到這種速度,還是當(dāng)年3G時(shí)代手機(jī)流量增長(zhǎng)的那種感覺(jué)。現(xiàn)在的token用量,就像當(dāng)年每個(gè)月只有一百兆手機(jī)流量的那個(gè)時(shí)代一樣,所有資源都需要更好的優(yōu)化和整合,讓每一個(gè)人都能把OpenClaw這樣的AI能力用起來(lái)。所以作為基礎(chǔ)設(shè)施領(lǐng)域的從業(yè)者,我對(duì)這個(gè)時(shí)代非常激動(dòng),認(rèn)為其中有很多值得去探索和嘗試的優(yōu)化空間。

羅福莉 :我把OpenClaw視為Agent框架上一個(gè)非常革命性和顛覆性的事件。雖然我知道身邊深度使用編程工具的人,第一選擇可能還是Claude Code,但我相信只有用過(guò)OpenClaw的人才能獨(dú)特地感受到,這個(gè)框架在設(shè)計(jì)上有很多地方是領(lǐng)先于Claude Code的,包括最近Claude Code的很多更新,其實(shí)都是在向OpenClaw靠近。對(duì)我自己來(lái)說(shuō),OpenClaw這個(gè)框架帶來(lái)更多的是一種隨時(shí)隨地的想象力延伸。Claude Code可能最開(kāi)始只能在桌面上延展創(chuàng)意,但在OpenClaw里我可以隨時(shí)隨地延展想法。

我后來(lái)發(fā)現(xiàn),OpenClaw核心價(jià)值在于兩點(diǎn):第一是它開(kāi)源,開(kāi)源對(duì)整個(gè)社區(qū)深度參與、持續(xù)改進(jìn)Agent框架是一個(gè)非常重要的前置條件。第二,像OpenClaw這樣的Agent框架,它很大的價(jià)值在于把國(guó)內(nèi)水平接近但略遜于閉源模型的這一賽道上的模型上限拉得非常高,在絕大部分場(chǎng)景里任務(wù)完成度已經(jīng)非常接近Claude最新的模型。同時(shí)它又通過(guò)Harness系統(tǒng)或者Skills體系等諸多設(shè)計(jì),把下限保證得非常好。從基座大模型的角度來(lái)說(shuō),它保證了下限,同時(shí)也拉升了上限。此外,我認(rèn)為它給整個(gè)社區(qū)帶來(lái)的更大價(jià)值,是點(diǎn)燃了大家對(duì)模型之外的那一層的熱情,讓大家發(fā)現(xiàn)Agent這一層有非常多的想象力和空間可以發(fā)揮。這也讓社區(qū)里越來(lái)越多除研究員以外的人參與到AGI的變革當(dāng)中,更多人接觸到更強(qiáng)的Agent框架,一定程度上在替代自己重復(fù)性的工作,釋放時(shí)間去做更有想象力的事情。

黃超 :從交互模式上來(lái)講,我覺(jué)得OpenClaw這次爆火,首先是因?yàn)榻o大家一種更有活人感的感覺(jué)。我們其實(shí)做Agent也有一兩年了,但之前包括Cursor、Claude Code這些Agent,大家感受到的更多是一種工具感。OpenClaw第一次以IM軟件嵌入的交互方式,讓大家更有一種活人感,更接近于自己想象中的個(gè)人賈維斯那樣的概念,這是交互模式上的突破。另外它給大家?guī)?lái)的一個(gè)啟發(fā)是,Agent Loop這種非常簡(jiǎn)單但高效的框架,再次被證明是行之有效的。同時(shí)它也讓我們重新思考,究竟是需要一個(gè)all-in-one的非常強(qiáng)大的智能體幫我們做很多事情,還是需要一個(gè)像輕量級(jí)操作系統(tǒng)或腳手架一樣的小管家。OpenClaw的答案是,通過(guò)這樣一個(gè)輕量級(jí)的操作系統(tǒng)生態(tài),去撬動(dòng)整個(gè)生態(tài)里所有的工具。隨著Skills和Harness這些機(jī)制的普及,越來(lái)越多的人可以設(shè)計(jì)面向OpenClaw這類系統(tǒng)的應(yīng)用,賦能各行各業(yè)。這與整個(gè)開(kāi)源生態(tài)天然結(jié)合得非常緊密,我覺(jué)得這兩點(diǎn)是它帶給我們最大的啟發(fā)。

楊植麟(主持人) :順著這個(gè)話題,剛才一直在討論OpenClaw。想問(wèn)一下張鵬,看到最近智譜也發(fā)布了新的GLM5 Turbo模型,我理解在Agent能力上也做了很大的增強(qiáng),能不能給大家介紹一下這個(gè)新模型和其他模型的不同之處?另外我們也觀察到有一個(gè)提價(jià)的策略,這反映了什么樣的市場(chǎng)信號(hào)?

張鵬 :這是個(gè)很好的問(wèn)題。前兩天我們確實(shí)緊急做了一波更新,這其實(shí)是我們整個(gè)發(fā)展路線中的一個(gè)階段,提前把它放出來(lái)了。這件事最主要的目的,是從原來(lái)簡(jiǎn)單的對(duì)話轉(zhuǎn)向真正的干活。正如各位剛才說(shuō)的,OpenClaw真的讓大家覺(jué)得大模型不再只是聊天,而是能幫我干活。但干活背后對(duì)能力的要求是非常高的,它需要自主進(jìn)行長(zhǎng)程任務(wù)規(guī)劃,不斷壓縮上下文、debug、處理多模態(tài)信息等等,這和傳統(tǒng)面向?qū)υ挼耐ㄓ媚P偷囊笥泻艽蟮牟煌K訥LM5 Turbo在這方面做了專門(mén)的加強(qiáng),尤其是長(zhǎng)程任務(wù)如何能夠持續(xù)自主loop而不中斷,這里做了很多工作。

另外,大家也提到了token消耗的問(wèn)題。讓一個(gè)聰明的模型去完成復(fù)雜任務(wù),token消耗量是非常巨大的,可能一般人體會(huì)不到,只會(huì)看到賬單上的錢(qián)在不停地往下掉。所以我們?cè)谶@方面也做了優(yōu)化,面臨復(fù)雜任務(wù)時(shí)用更高效的token效率來(lái)完成。模型架構(gòu)上本質(zhì)還是多任務(wù)協(xié)同的通用架構(gòu),只是在能力上做了一些偏向性的加強(qiáng)。至于提價(jià)這件事,其實(shí)也很順暢地能跟大家解釋。現(xiàn)在不再是簡(jiǎn)單的一問(wèn)一答,背后的思考鏈路很長(zhǎng),還要通過(guò)寫(xiě)代碼的方式跟底層基礎(chǔ)設(shè)施打交道、隨時(shí)debug和糾錯(cuò)。完成一個(gè)任務(wù)需要的token量,可能是原來(lái)回答一個(gè)簡(jiǎn)單問(wèn)題的十倍甚至百倍。模型變得更大,推理成本相應(yīng)提高,所以我們把價(jià)格回歸到正常的商業(yè)價(jià)值上。長(zhǎng)期靠低價(jià)競(jìng)爭(zhēng)不利于整個(gè)行業(yè)發(fā)展,這樣才能持續(xù)在商業(yè)化路徑上形成良性閉環(huán),不斷優(yōu)化模型能力,持續(xù)給大家提供更好的模型和相應(yīng)的服務(wù)。

楊植麟(主持人) :非常好的分享。現(xiàn)在開(kāi)源模型和推理算力已經(jīng)開(kāi)始形成一個(gè)生態(tài),各種開(kāi)源模型可以在不同的推理算力上為用戶提供更多價(jià)值。隨著token量的報(bào)價(jià)變化,我們可能也正在從訓(xùn)練時(shí)代逐漸進(jìn)入推理時(shí)代。想請(qǐng)教一下立雪,從infra的層面來(lái)看,推理時(shí)代對(duì)于無(wú)問(wèn)芯穹意味著什么?

夏立雪 :我們是一家誕生在AI時(shí)代的基礎(chǔ)設(shè)施廠商,現(xiàn)在在為Kimi、智譜提供服務(wù),也在跟MiniMax合作,幫助大家更高效地用好我們這個(gè)token工廠。我們也在和很多高校、科研院所合作,所以一直都在思考一個(gè)問(wèn)題:AGI時(shí)代所需要的基礎(chǔ)設(shè)施,究竟應(yīng)該是什么樣的?我們?cè)趺茨軌蛞徊讲降卦谶@個(gè)過(guò)程中去實(shí)現(xiàn)它、推演它。

我們已經(jīng)做好了充分的準(zhǔn)備,也看清了短期、中期、長(zhǎng)期不同階段需要解決的問(wèn)題。當(dāng)前最緊迫的問(wèn)題,就是像Claude這類模型帶動(dòng)的整個(gè)token量的暴增,對(duì)我們系統(tǒng)效率提出了更高的優(yōu)化需求,價(jià)格的增長(zhǎng)也是在這個(gè)需求壓力下的一種應(yīng)對(duì)方式。

我們一直以來(lái)都是從軟硬件打通的方式來(lái)布局和解決這個(gè)問(wèn)題。我們接入了幾乎所有種類的計(jì)算芯片,把國(guó)內(nèi)十幾種芯片和幾十個(gè)不同的算力集群統(tǒng)一連接起來(lái)。這樣,當(dāng)資源不足時(shí),我們能做到兩件事:第一,把能用的資源都用起來(lái);第二,讓每一個(gè)算力都用在刀刃上,發(fā)揮出最大的轉(zhuǎn)化效率。所以當(dāng)前階段我們要解決的核心問(wèn)題,就是如何打造一個(gè)更高效的token工廠。為此我們做了很多優(yōu)化,包括讓模型與硬件在顯存等方面實(shí)現(xiàn)最優(yōu)適配,也在探索在最新的模型結(jié)構(gòu)和硬件結(jié)構(gòu)下能否產(chǎn)生更深度的化學(xué)反應(yīng)。

不過(guò),解決當(dāng)前的效率問(wèn)題,我們只是打造了一個(gè)標(biāo)準(zhǔn)化的token工廠。面向Agent時(shí)代,這還遠(yuǎn)遠(yuǎn)不夠。就像剛才說(shuō)的,Agent更像一個(gè)人,你可以交給他一項(xiàng)任務(wù)。我堅(jiān)定地認(rèn)為,當(dāng)前云計(jì)算時(shí)代的很多基礎(chǔ)設(shè)施,是為服務(wù)程序、服務(wù)人類工程師而設(shè)計(jì)的,而不是為AI設(shè)計(jì)的。現(xiàn)在的狀態(tài)有點(diǎn)像:我們搭了一套基礎(chǔ)設(shè)施,上面留了一個(gè)為人類工程師設(shè)計(jì)的接口,然后在這上面再包一層去接入Agent。這種方式實(shí)際上是用人類操作的能力邊界,限制了Agent的發(fā)揮空間。

舉個(gè)例子,Agent能夠在秒級(jí)甚至毫秒級(jí)思考并發(fā)起任務(wù),但我們之前的底層K8S這些能力并沒(méi)有為此做好準(zhǔn)備,因?yàn)槿祟惏l(fā)起任務(wù)大概是分鐘級(jí)別的。所以我們需要進(jìn)一步構(gòu)建我們稱之為Agentic Infra的能力,打造一個(gè)更智慧化的算力投放工廠。這是無(wú)問(wèn)芯穹現(xiàn)在正在做的事情。

從更長(zhǎng)遠(yuǎn)的未來(lái)來(lái)看,真正AGI時(shí)代到來(lái)的時(shí)候,我們認(rèn)為連基礎(chǔ)設(shè)施本身都應(yīng)該是一個(gè)智能體,應(yīng)該能夠自我進(jìn)化、自我迭代,形成一個(gè)自主的組織。相當(dāng)于有一個(gè)CEO,這個(gè)CEO是一個(gè)Agent,比如一個(gè)Claude在管理整個(gè)基礎(chǔ)設(shè)施,根據(jù)AI客戶的需求自己提需求、迭代自己的基礎(chǔ)設(shè)施。只有AI與AI之間才能更好地形成耦合。所以我們也在做一些讓Agent與Agent之間更好通信的事情,比如cache to cache這樣的復(fù)制能力。

我們一直認(rèn)為,基礎(chǔ)設(shè)施與AI的發(fā)展不應(yīng)該是隔離的狀態(tài),而應(yīng)該產(chǎn)生非常豐富的化學(xué)反應(yīng)。這才是真正的軟硬協(xié)同,真正的算法與基礎(chǔ)設(shè)施協(xié)同。這也是無(wú)問(wèn)芯穹一直想實(shí)現(xiàn)的使命。

楊植麟(主持人) :接下來(lái)想問(wèn)問(wèn)福莉。小米最近發(fā)布了新的模型,也開(kāi)源了一些背后的技術(shù),我覺(jué)得對(duì)社區(qū)做出了很大的貢獻(xiàn)。想請(qǐng)問(wèn)一下,小米在做大模型方面有什么獨(dú)特的優(yōu)勢(shì)?

羅福 :我想先把這個(gè)問(wèn)題稍微拓展一下,不只聊小米的優(yōu)勢(shì),而是聊聊中國(guó)做大模型的團(tuán)隊(duì)在這件事上的優(yōu)勢(shì),我覺(jué)得這個(gè)話題有更廣泛的價(jià)值。

大概兩年前,我就觀察到中國(guó)的基座大模型團(tuán)隊(duì)已經(jīng)開(kāi)始了一個(gè)非常好的突破。這個(gè)突破是:在有限算力的條件下,尤其是在互聯(lián)帶寬受限的情況下,如何突破這些低端算力的限制,并由此催生了一些看似是為效率妥協(xié)的模型結(jié)構(gòu)創(chuàng)新,比如DeepSeek v2、v3系列的細(xì)粒度MoE等等。但我們后來(lái)能看到,這些創(chuàng)新引發(fā)的是一場(chǎng)變革,也就是在算力一定的條件下,如何發(fā)揮出最高的智能水平。我覺(jué)得DeepSeek給了國(guó)內(nèi)所有技術(shù)大模型團(tuán)隊(duì)一份勇氣和信心。

雖然今天我們自己的國(guó)產(chǎn)芯片,無(wú)論是推理芯片還是訓(xùn)練芯片,已經(jīng)不再像以前那樣受到嚴(yán)重限制,但我們能看到,正是那些限制催生了我們對(duì)更高訓(xùn)練效率、更低推理成本的模型結(jié)構(gòu)的全新探索。比如最近出現(xiàn)的hybrid sparse或linear attention結(jié)構(gòu),有DSA、NSA,Kimi有KSA,小米也有面向下一代結(jié)構(gòu)的high sparse架構(gòu)。這區(qū)別于MiMo這一代結(jié)構(gòu),是我們面向Agent時(shí)代去思考的,如何在Agent時(shí)代做出更好的模型結(jié)構(gòu)創(chuàng)新。

我為什么認(rèn)為結(jié)構(gòu)創(chuàng)新如此重要?因?yàn)槲覀儎偛帕牡搅薼ong context這個(gè)話題。如果大家真實(shí)地去用OpenClaw就會(huì)發(fā)現(xiàn),越用越好用,越用越聰明。它的前提是推理的context足夠長(zhǎng)。long context是一個(gè)談?wù)摿撕芫玫脑掝},但真正能做到在超長(zhǎng)context下表現(xiàn)強(qiáng)勁、推理成本足夠低的模型,其實(shí)并不多。很多模型不是做不到百萬(wàn)甚至千萬(wàn)token的context,而是推理成本太高、速度太慢。只有當(dāng)你能在百萬(wàn)甚至千萬(wàn)context下做到成本夠低、速度夠快,才會(huì)有真正高生產(chǎn)力價(jià)值的任務(wù)被交給這個(gè)模型,從而激發(fā)模型在long context場(chǎng)景下完成更高復(fù)雜度的任務(wù)。我們可能需要在這樣千萬(wàn)甚至億級(jí)context的規(guī)模下,才能實(shí)現(xiàn)模型的自迭代。所謂模型的自迭代,就是它可以在復(fù)雜的環(huán)境里依靠超長(zhǎng)context完成對(duì)自我的進(jìn)化,這個(gè)進(jìn)化可能是對(duì)Agent框架本身的,也可能是對(duì)模型參數(shù)本身的,因?yàn)槲覀冋J(rèn)為long context本身就是對(duì)參數(shù)的一種進(jìn)化。

所以,怎么實(shí)現(xiàn)long context efficient的架構(gòu),以及在推理側(cè)做到long context efficient,是一個(gè)全方位的競(jìng)爭(zhēng)。這是我們大約一年前就開(kāi)始探索的問(wèn)題。而如今,怎么在真實(shí)的長(zhǎng)程任務(wù)上實(shí)現(xiàn)穩(wěn)定性和高上限的效果,是我們現(xiàn)在在持續(xù)迭代的創(chuàng)新方向。我們?cè)谒伎既绾螛?gòu)造更有效的學(xué)習(xí)算法,如何采集到真實(shí)的、在百萬(wàn)乃至千萬(wàn)上下文里具有長(zhǎng)距依賴的文本,以及結(jié)合復(fù)雜環(huán)境產(chǎn)生的trajectory,這是我們正在經(jīng)歷的事情。

但我能看到更長(zhǎng)期的事情是,大模型本身在飛速進(jìn)步,加上Agent框架的加持,推理需求已經(jīng)在過(guò)去一段時(shí)間內(nèi)增長(zhǎng)了近十倍。那今年整個(gè)token的增長(zhǎng)會(huì)不會(huì)達(dá)到百倍?這又將我們帶入另一個(gè)維度的競(jìng)爭(zhēng),那就是算力,推理芯片,乃至往下到能源層面。這是我對(duì)這個(gè)問(wèn)題的判斷,也期待從大家身上學(xué)到更多。

楊植麟(主持人) :非常有insight的分享。下面想問(wèn)一下黃超,因?yàn)槟阋查_(kāi)發(fā)了一些非常有影響力的agent項(xiàng)目,包括nano bot,在社區(qū)里也有很多粉絲。想問(wèn)一下,從agent的harness或者說(shuō)應(yīng)用層面,接下來(lái)你覺(jué)得有哪些技術(shù)方向是比較重要、大家需要去關(guān)注的?

黃超 :感謝。我覺(jué)得首先可以從agent的幾個(gè)關(guān)鍵技術(shù)模塊來(lái)拆解,包括planning、memory和tool use。

從planning來(lái)講,現(xiàn)在面向長(zhǎng)鏈路任務(wù)或者非常復(fù)雜上下文的場(chǎng)景,比如說(shuō)五百步甚至更長(zhǎng)的任務(wù),很多模型不一定能做好planning,我覺(jué)得本質(zhì)上是模型不具備這方面的隱性知識(shí),尤其是在一些復(fù)雜垂直領(lǐng)域。未來(lái)可能需要把各類復(fù)雜任務(wù)的知識(shí)固化到模型里,這是一個(gè)方向。當(dāng)然,skill和harness這種機(jī)制,在一定程度上也是在緩解planning層面的錯(cuò)誤,因?yàn)樗峁┝吮容^高質(zhì)量的skill,本質(zhì)上是在幫助模型去完成一些較難的task。

關(guān)于memory,我的感受是它永遠(yuǎn)存在信息壓縮不準(zhǔn)確、召回不準(zhǔn)的問(wèn)題。當(dāng)整個(gè)長(zhǎng)鏈路任務(wù)和復(fù)雜場(chǎng)景展開(kāi)時(shí),memory會(huì)急劇膨脹,這對(duì)整個(gè)memory架構(gòu)造成很大壓力。目前包括各類agent框架基本上都采用最簡(jiǎn)單的文件系統(tǒng)、Markdown格式來(lái)做memory,通過(guò)文件共享來(lái)協(xié)作。我覺(jué)得未來(lái)memory應(yīng)該走向分層設(shè)計(jì),并且需要解決通用性的問(wèn)題,因?yàn)閏oding場(chǎng)景、deep research場(chǎng)景、多媒體場(chǎng)景的數(shù)據(jù)模態(tài)差異很大,如何對(duì)這些memory做好檢索索引、提升效率,這永遠(yuǎn)是一個(gè)trade off。

另外,現(xiàn)在agent框架讓大家創(chuàng)建agent的門(mén)檻大幅降低,未來(lái)可能不止一個(gè)agent,我也看到有些產(chǎn)品推出了Agent Swarm這樣的機(jī)制,相當(dāng)于每個(gè)人會(huì)擁有一群龍蝦。一群龍蝦相比一個(gè)龍蝦,上下文的暴增是可以想象的,這對(duì)memory帶來(lái)的壓力非常大。如何管理一群龍蝦帶來(lái)的上下文,目前還沒(méi)有很好的機(jī)制,尤其是在復(fù)雜coding、科研發(fā)現(xiàn)這類場(chǎng)景下,對(duì)模型和整個(gè)agent架構(gòu)都是不小的挑戰(zhàn)。

關(guān)于tool use,當(dāng)年MCP存在的問(wèn)題,比如質(zhì)量沒(méi)有保障、存在安全隱患,現(xiàn)在在skill里依然存在。目前看似有很多skill,但高質(zhì)量的skill其實(shí)比較少,低質(zhì)量的skill會(huì)嚴(yán)重影響agent完成任務(wù)的完成度。另外skill也存在惡意注入的風(fēng)險(xiǎn)。所以我覺(jué)得tool use這塊可能需要整個(gè)社區(qū)共同努力,把skill生態(tài)發(fā)展得更好,甚至探索如何在執(zhí)行過(guò)程中進(jìn)化出新的skill。以上這些,是我認(rèn)為當(dāng)下agent在planning、memory、skill三個(gè)維度上存在的痛點(diǎn),以及未來(lái)潛在的方向。

楊植麟(主持人) :可以看到剛才兩位嘉賓從不同視角討論了同一個(gè)問(wèn)題,隨著任務(wù)復(fù)雜度增加,上下文會(huì)急劇膨脹。從模型層面可以去提升原生的上下文處理能力,從agent harness層面,則是通過(guò)planning、memory,包括multi-agent的harness,在模型能力一定的情況下支持更復(fù)雜的任務(wù)。我覺(jué)得這兩個(gè)方向接下來(lái)會(huì)有更多的化學(xué)反應(yīng),共同提升完成復(fù)雜任務(wù)的能力上限。

那最后我們來(lái)一個(gè)開(kāi)放式展望,請(qǐng)各位用一個(gè)詞來(lái)描述接下來(lái)十二個(gè)月大模型發(fā)展的趨勢(shì)以及你的期望。這次我們先從黃超開(kāi)始。

黃超 :十二個(gè)月在AI領(lǐng)域看起來(lái)好遙遠(yuǎn),真的不知道十二個(gè)月之后會(huì)發(fā)展成什么樣子。

楊植麟(主持人) :這里原來(lái)寫(xiě)的是五年,我給改成十二個(gè)月了。

黃超 :對(duì),我這邊的關(guān)鍵詞應(yīng)該是生態(tài)。未來(lái)agent要真正從個(gè)人助手轉(zhuǎn)化為打工人,這一步很重要。現(xiàn)在大家玩agent很多時(shí)候還停留在新鮮感階段,覺(jué)得好玩,但未來(lái)真正要讓agent沉淀下來(lái),成為大家真正的搬磚工具,或者說(shuō)真正的co-worker。這需要整個(gè)生態(tài)的共同努力,把所有相關(guān)的技術(shù)探索和模型技術(shù)都開(kāi)源出來(lái),不管是模型迭代、skill平臺(tái)迭代還是各類工具,都需要面向agent打造更好的生態(tài)。

從我自己的感受來(lái)說(shuō),未來(lái)的很多軟件可能不再是面向人類的。人類需要GUI,但很多軟件可能會(huì)是面向agent原生設(shè)計(jì)的,人類只會(huì)去使用讓自己快樂(lè)的GUI,其他的交給agent。所以現(xiàn)在整個(gè)生態(tài)從GUI、MCP又轉(zhuǎn)向了CLI這樣的模式。我覺(jué)得需要整個(gè)生態(tài)把不管是軟件系統(tǒng)、數(shù)據(jù)還是各種技術(shù),都變成Agent Native的模式,這樣才能讓整個(gè)agent的發(fā)展更加豐富。

羅福莉 :我覺(jué)得把這個(gè)問(wèn)題縮小到一年非常有意義,因?yàn)槲迥赀@個(gè)時(shí)間跨度,從我心目中對(duì)AGI的定義來(lái)看,我覺(jué)得已經(jīng)實(shí)現(xiàn)了。所以如果要用一個(gè)詞來(lái)描述接下來(lái)一年AGI歷程里最關(guān)鍵的事情,我認(rèn)為會(huì)是自進(jìn)化。這個(gè)詞雖然聽(tīng)起來(lái)有點(diǎn)玄幻,過(guò)去一年大家也多次提到,但我最近才對(duì)它有了更深的體會(huì),也對(duì)如何具體落地這件事有了更務(wù)實(shí)可行的方案。

借助非常強(qiáng)大的模型,我們?cè)谶^(guò)去chat范式下其實(shí)根本沒(méi)有發(fā)揮出預(yù)訓(xùn)練模型的上限,而這個(gè)上限現(xiàn)在被agent框架激活了。我們現(xiàn)在觸到了一個(gè)現(xiàn)象,當(dāng)模型執(zhí)行更長(zhǎng)時(shí)間的任務(wù)時(shí),它可以自己去學(xué)習(xí)和進(jìn)化。一個(gè)很簡(jiǎn)單的嘗試是,在現(xiàn)有的agent框架里疊加一個(gè)可以verify的條件約束,再設(shè)置一個(gè)loop,讓模型持續(xù)迭代優(yōu)化目標(biāo),我們就能發(fā)現(xiàn)模型會(huì)持續(xù)拿出更好的方案。這種自進(jìn)化現(xiàn)在已經(jīng)能跑一兩天了,國(guó)內(nèi)的模型基本上能支撐,當(dāng)然和任務(wù)難度有關(guān)。我們發(fā)現(xiàn)在一些科學(xué)研究上,比如去探索更好的模型結(jié)構(gòu),因?yàn)橛性u(píng)估標(biāo)準(zhǔn),比如更低的PPL,在這類目標(biāo)明確的任務(wù)上,模型已經(jīng)能自主運(yùn)行和執(zhí)行兩三天了。

從我的角度看,自進(jìn)化是唯一能創(chuàng)造出新東西的地方,它不是去替代我們?nèi)祟惉F(xiàn)有的生產(chǎn)力,而是像頂尖科學(xué)家一樣去探索這個(gè)世界上還沒(méi)有的東西。一年前我會(huì)覺(jué)得這個(gè)時(shí)間歷程需要三到五年,但就在最近,我覺(jué)得這個(gè)時(shí)間線應(yīng)該縮短到一兩年,大模型疊加一個(gè)非常強(qiáng)的自進(jìn)化agent框架,至少能實(shí)現(xiàn)對(duì)科學(xué)研究的指數(shù)級(jí)加速。我們組內(nèi)做大模型研究的同學(xué),workflow高度不確定且需要大量創(chuàng)造力,但借助頂尖模型,基本上已經(jīng)能把我們自己的研究效率加速近十倍了。我很期待這樣的范式輻射到更廣泛的學(xué)科和領(lǐng)域。

夏立雪 :我的關(guān)鍵詞叫可持續(xù)token。我看到整個(gè)AI的發(fā)展仍然處于長(zhǎng)期持續(xù)的過(guò)程中,我們也希望它能有長(zhǎng)久的生命力。從基礎(chǔ)設(shè)施的視角來(lái)看,我們面臨的一個(gè)很大問(wèn)題是資源終究是有限的,就像當(dāng)年我們講可持續(xù)發(fā)展一樣。我們作為一個(gè)token工廠,能否給大家提供持續(xù)穩(wěn)定、大規(guī)模可用的token,讓頂尖的模型真正能夠繼續(xù)服務(wù)更多的下游,是我們看到的一個(gè)非常重要的問(wèn)題。

所以我們現(xiàn)在需要把視角放寬到整個(gè)生態(tài),從最早的能源到算力,再到token,最終轉(zhuǎn)換成GDP,讓這條鏈路能夠進(jìn)行持續(xù)的經(jīng)濟(jì)化迭代。我們不只是把國(guó)內(nèi)的算力用起來(lái),也在把這些能力輸出到海外,讓全球的資源能夠打通整合。所以我認(rèn)為可持續(xù)這個(gè)詞,也包含了我們想把中國(guó)特色的token經(jīng)濟(jì)學(xué)做起來(lái)的愿望。過(guò)去那個(gè)時(shí)代叫Made in China,我們把低價(jià)的制造能力轉(zhuǎn)化成好的商品輸出到全球。現(xiàn)在我們想做的有點(diǎn)像AI Made in China,把中國(guó)在能源上的優(yōu)勢(shì),通過(guò)token工廠可持續(xù)地轉(zhuǎn)化為優(yōu)質(zhì)的token輸出到全球,成為世界的token工廠。這是我希望在今年看到的,中國(guó)為世界人工智能帶來(lái)的價(jià)值。

張鵬 :我就簡(jiǎn)短一點(diǎn),大家都在仰望星空,我就落地一點(diǎn)。未來(lái)十二個(gè)月面臨的最大問(wèn)題,我覺(jué)得可能就是算力。剛才也說(shuō)了,所有的技術(shù),包括智能體框架,讓很多人創(chuàng)造力爆發(fā)、效率提升十倍,但前提條件是大家用得起、用得起來(lái)。不能因?yàn)樗懔Σ粔颍粋€(gè)問(wèn)題提出去讓它思考半天都得不到答案,這肯定不行。也正是因?yàn)檫@樣的原因,我們很多研究進(jìn)展和想要做的事情其實(shí)都受阻了。前兩年記得中關(guān)村論壇有人提過(guò)這么一句話,叫沒(méi)卡沒(méi)感情,談卡傷感情。今天又回到了這個(gè)處境,但情況又不一樣了,我們現(xiàn)在轉(zhuǎn)向推理階段,是因?yàn)樾枨笳娴脑诒l(fā),十倍百倍地爆發(fā)。剛才也說(shuō)到過(guò)去增長(zhǎng)了十倍,背后其實(shí)是一百倍的需求,還有大量的需求沒(méi)有被滿足,這需要大家一起來(lái)想辦法。

楊植麟(主持人) :好,感謝各位的精彩分享,謝謝大家。

最后,這兩天海淀五道口的AI原點(diǎn)社區(qū)也在舉辦原點(diǎn)Party Nights活動(dòng),有興趣的可以去玩玩,說(shuō)不定咱們還能一起面?zhèn)€基。

以上,既然看到這里了,如果覺(jué)得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見(jiàn)。

>/ 作者:卡茲克,tashi

>/ 投稿或爆料,請(qǐng)聯(lián)系郵箱:wzglyay@virxact.com

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
銀行信貸部老同學(xué)揭秘“房?jī)r(jià)跌不跌已經(jīng)不重要了…”

銀行信貸部老同學(xué)揭秘“房?jī)r(jià)跌不跌已經(jīng)不重要了…”

慧翔百科
2026-04-01 09:02:03
普京下最后通牒:澤連斯基今天必須撤出頓巴斯

普京下最后通牒:澤連斯基今天必須撤出頓巴斯

桂系007
2026-04-01 23:22:32
2026年 “純電已死,混動(dòng)為王” 純電車企只剩兩家了

2026年 “純電已死,混動(dòng)為王” 純電車企只剩兩家了

小怪吃美食
2026-04-01 13:05:42
油價(jià)大漲1.01元/升后,4月7日油價(jià)或繼續(xù)上漲,預(yù)計(jì)上調(diào)190元/噸

油價(jià)大漲1.01元/升后,4月7日油價(jià)或繼續(xù)上漲,預(yù)計(jì)上調(diào)190元/噸

油價(jià)早知道
2026-04-01 11:17:47
4月1日全國(guó)天眼全覆蓋!8大開(kāi)車陋習(xí)嚴(yán)查,扣分罰款早知道

4月1日全國(guó)天眼全覆蓋!8大開(kāi)車陋習(xí)嚴(yán)查,扣分罰款早知道

復(fù)轉(zhuǎn)這些年
2026-03-31 19:41:26
熱刺官宣46歲名帥上任!薪水1200萬(wàn)歐+僅輸瓜帥 若降級(jí)可自由離隊(duì)

熱刺官宣46歲名帥上任!薪水1200萬(wàn)歐+僅輸瓜帥 若降級(jí)可自由離隊(duì)

我愛(ài)英超
2026-04-02 06:52:12
中國(guó)大使參加摩洛哥國(guó)王宴會(huì),士兵闖入開(kāi)槍掃射,眾人倒在血泊中

中國(guó)大使參加摩洛哥國(guó)王宴會(huì),士兵闖入開(kāi)槍掃射,眾人倒在血泊中

百年歷史老號(hào)
2024-04-02 19:37:39
伊朗總統(tǒng):若條件滿足,伊朗有“必然的意愿”結(jié)束戰(zhàn)爭(zhēng)

伊朗總統(tǒng):若條件滿足,伊朗有“必然的意愿”結(jié)束戰(zhàn)爭(zhēng)

參考消息
2026-04-01 14:31:31
連休6天!第一批春假大軍出門(mén)了,門(mén)票、車票“秒光”

連休6天!第一批春假大軍出門(mén)了,門(mén)票、車票“秒光”

成都商報(bào)教育報(bào)道
2026-04-01 22:34:09
太炸裂!日本一對(duì)小學(xué)老師校內(nèi)“激戰(zhàn)”十幾次,尺度大到令人窒息...網(wǎng)友的評(píng)論亮了

太炸裂!日本一對(duì)小學(xué)老師校內(nèi)“激戰(zhàn)”十幾次,尺度大到令人窒息...網(wǎng)友的評(píng)論亮了

今日日本
2026-04-01 14:49:49
美議員連夜竄臺(tái),大陸果斷甩出王牌,鄭麗文救兵已到,島內(nèi)要變天

美議員連夜竄臺(tái),大陸果斷甩出王牌,鄭麗文救兵已到,島內(nèi)要變天

興史興談
2026-04-01 06:04:03
老板娘問(wèn)我她腿粗不粗?我該怎么回答?

老板娘問(wèn)我她腿粗不粗?我該怎么回答?

太急張三瘋
2026-04-02 06:10:56
一個(gè)被窩睡不出兩種人!宋寧峰再曝炸裂發(fā)言,高露梅婷無(wú)辜躺槍

一個(gè)被窩睡不出兩種人!宋寧峰再曝炸裂發(fā)言,高露梅婷無(wú)辜躺槍

天天熱點(diǎn)見(jiàn)聞
2026-04-01 16:16:12
不打伊朗了?特朗普通告全世界,戰(zhàn)爭(zhēng)費(fèi)由22國(guó)承擔(dān),一共5萬(wàn)億

不打伊朗了?特朗普通告全世界,戰(zhàn)爭(zhēng)費(fèi)由22國(guó)承擔(dān),一共5萬(wàn)億

顧史
2026-04-02 04:37:16
連3屆無(wú)緣世界杯 意大利眾將崩潰痛哭 賽前慶祝遭打臉 黃健翔吐槽

連3屆無(wú)緣世界杯 意大利眾將崩潰痛哭 賽前慶祝遭打臉 黃健翔吐槽

我愛(ài)英超
2026-04-01 06:49:42
3月銷量“慘案”:長(zhǎng)城汽車,已被“四座大山”壓成第二梯隊(duì)?

3月銷量“慘案”:長(zhǎng)城汽車,已被“四座大山”壓成第二梯隊(duì)?

音樂(lè)時(shí)光的娛樂(lè)
2026-04-02 04:55:30
中年群體猝死事件刷屏!網(wǎng)友建議:別再裸睡,萬(wàn)一猝死太不體面

中年群體猝死事件刷屏!網(wǎng)友建議:別再裸睡,萬(wàn)一猝死太不體面

火山詩(shī)話
2026-04-01 13:23:12
“在你來(lái)之前我們就已經(jīng)是冠軍了”,直播間標(biāo)題被指內(nèi)涵張雪機(jī)車,凱越機(jī)車道歉:是為了回應(yīng)惡意言論,從未否定張雪曾是凱越的靈魂

“在你來(lái)之前我們就已經(jīng)是冠軍了”,直播間標(biāo)題被指內(nèi)涵張雪機(jī)車,凱越機(jī)車道歉:是為了回應(yīng)惡意言論,從未否定張雪曾是凱越的靈魂

極目新聞
2026-04-01 20:23:53
皇馬巴薩21世紀(jì)最佳陣容發(fā)布!皇馬到底哪里不如巴薩?

皇馬巴薩21世紀(jì)最佳陣容發(fā)布!皇馬到底哪里不如巴薩?

體壇八點(diǎn)半的那些事兒
2026-04-01 21:01:26
19歲女生被困柬埔寨,綁匪正臉照曝光,網(wǎng)友放話:你的下場(chǎng)會(huì)很慘

19歲女生被困柬埔寨,綁匪正臉照曝光,網(wǎng)友放話:你的下場(chǎng)會(huì)很慘

央小北
2026-04-01 02:35:51
2026-04-02 07:39:00
數(shù)字生命卡茲克 incentive-icons
數(shù)字生命卡茲克
反復(fù)橫跳于不同的AI領(lǐng)域,努力分享一些很酷的AI干貨
488文章數(shù) 612關(guān)注度
往期回顧 全部

科技要聞

一條Claude Code 源代碼的社會(huì)性死亡

頭條要聞

與美澳合謀之后 高市又想與法國(guó)制定計(jì)劃擺脫對(duì)華依賴

頭條要聞

與美澳合謀之后 高市又想與法國(guó)制定計(jì)劃擺脫對(duì)華依賴

體育要聞

NBA擴(kuò)軍,和籃球無(wú)關(guān)?

娛樂(lè)要聞

張婉婷已決定離婚 找律師討論婚變事宜

財(cái)經(jīng)要聞

電商售械三水光針 機(jī)構(gòu)倒貨or假貨猖獗?

汽車要聞

三電可靠 用料下本 百萬(wàn)公里的蔚來(lái)ES6 拆開(kāi)看

態(tài)度原創(chuàng)

時(shí)尚
教育
旅游
親子
軍事航空

襯衫當(dāng)外套,好時(shí)髦

教育要聞

漫畫(huà)類作文難在你看不透畫(huà)面背后的信息

旅游要聞

激發(fā)銀發(fā)旅游市場(chǎng)活力有何妙招?從“無(wú)差別服務(wù)”到“精準(zhǔn)分層服務(wù)”

親子要聞

大家說(shuō)上班的媽媽顯年輕,而全職寶媽易顯老,是這樣嗎?

軍事要聞

伊朗自殺無(wú)人機(jī)突進(jìn) 逼退林肯號(hào)航母

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版