今天是2026中關(guān)村論壇的人工智能主題日。
我也定了個(gè)一早的鬧鐘準(zhǔn)時(shí)起來(lái)看。
![]()
這個(gè)活動(dòng)海淀已經(jīng)辦了第三年,但今年的議程密度確實(shí)有點(diǎn)夸張。
一上午塞進(jìn)了開(kāi)源聯(lián)盟成立、主權(quán)大模型白皮書(shū)發(fā)布、北京市人工智能協(xié)會(huì)揭牌,外加兩場(chǎng)圓桌。
大模型和具身智能各一場(chǎng)。嘉賓陣容從Eclipse基金會(huì)到智譜、小米MiMo、無(wú)問(wèn)芯穹,再到一眾具身智能公司的創(chuàng)始人,幾乎把當(dāng)下AI產(chǎn)業(yè)鏈上最活躍的角色都拉到了同一個(gè)舞臺(tái)上。
在我看來(lái),信息密度最高的,還是第一場(chǎng)小龍蝦與AI開(kāi)源圓桌。
![]()
這場(chǎng)圓桌由楊植麟主持,嘉賓是智譜的張鵬、無(wú)問(wèn)芯穹的夏立雪、小米MiMo的羅福莉,還有港大的黃超。
從模型層到算力基礎(chǔ)設(shè)施層再到Agent應(yīng)用層,剛好覆蓋了當(dāng)下AI產(chǎn)業(yè)鏈的幾個(gè)關(guān)鍵環(huán)節(jié)。
張鵬解釋了智譜GLM5 Turbo提價(jià)的邏輯,模型從聊天轉(zhuǎn)向干活,完成任務(wù)消耗的token量可能是簡(jiǎn)單問(wèn)答的十倍甚至百倍,提價(jià)本質(zhì)上是在回歸商業(yè)價(jià)值。
羅福莉談了中國(guó)團(tuán)隊(duì)在模型結(jié)構(gòu)創(chuàng)新上的優(yōu)勢(shì),尤其是長(zhǎng)上下文架構(gòu)和推理效率。
黃超拆解了Agent在planning、memory、skill三個(gè)維度上的技術(shù)痛點(diǎn)。
最后讓每人用一個(gè)詞總結(jié)未來(lái)12個(gè)月的趨勢(shì),黃超說(shuō)的是 生態(tài) ,羅福莉說(shuō)的是 自進(jìn)化 ,夏立雪說(shuō)的是 可持續(xù)token ,而張鵬直接點(diǎn)了一個(gè)最樸素的問(wèn)題: 算力 。
幾位嘉賓的圓桌對(duì)話,干貨含量極高,幾乎沒(méi)有什么客套和PR話術(shù),聊的都是非常實(shí)在的問(wèn)題。
所以,我也把這場(chǎng)圓桌的內(nèi)容做了一個(gè)完整的文字整理,分享給大家。
【圓桌對(duì)話-人類校對(duì)版】
楊植麟(主持人) :很榮幸今天能邀請(qǐng)到各位重磅的嘉賓,各位的背景覆蓋了不同的層面,從模型層到底層的算力層,再到上面的Agent層。很高興今天能和大家一起探討,主要的關(guān)鍵詞是開(kāi)源和Agent。我們從第一個(gè)問(wèn)題開(kāi)始,這個(gè)問(wèn)題是給所有人的。現(xiàn)在OpenClaw是最流行的產(chǎn)品,大家在日常使用OpenClaw或類似產(chǎn)品的過(guò)程中,覺(jué)得最有想象力或者印象最深刻的是什么?從技術(shù)角度來(lái)看,如何看待今天OpenClaw和相關(guān)Agent的演進(jìn)?我們先從張鵬這邊開(kāi)始。
張鵬 :好,首先感謝植麟的邀請(qǐng),也感謝主辦方給這次機(jī)會(huì)跟大家交流。其實(shí)我很早就開(kāi)始自己玩這個(gè)東西了,當(dāng)時(shí)還不叫OpenClaw,最早叫Claude Bot。畢竟我是程序員出身,折騰這些東西有一些自己的體驗(yàn)。我覺(jué)得它帶給大家最大的突破點(diǎn),在于這件事情不再是程序員或者極客們的專利,普通人也可以比較方便地使用頂尖模型的能力,尤其是在編程和智能體方面。所以到現(xiàn)在為止,我在跟大家交流的過(guò)程中,更愿意把OpenClaw這件事稱作一個(gè)腳手架,它提供的是一種可能性。在模型的基礎(chǔ)之上搭起一個(gè)牢固、方便又靈活的腳手架,大家可以按照自己的意愿去使用底層模型提供的很多新奇的東西。原來(lái)自己的一些想法,受限于不會(huì)寫(xiě)代碼或者缺乏某些技能,今天終于可以通過(guò)很簡(jiǎn)單的交流就把它完成。這對(duì)我來(lái)說(shuō)是一個(gè)非常大的沖擊,讓我重新認(rèn)識(shí)了這件事情。
夏立雪 :我最開(kāi)始用OpenClaw的時(shí)候其實(shí)不太適應(yīng),因?yàn)槲伊?xí)慣于和大模型聊天的那種交流方式,結(jié)果發(fā)現(xiàn)OpenClaw反應(yīng)好像比較慢。但后來(lái)我意識(shí)到一個(gè)關(guān)鍵的不同,它不是一個(gè)聊天機(jī)器人,而是一個(gè)能夠幫我完成大型任務(wù)的助手。當(dāng)我開(kāi)始給它提交更復(fù)雜的任務(wù)之后,發(fā)現(xiàn)它其實(shí)能做得很好。這件事給我一個(gè)很大的感觸,就是AI從最開(kāi)始按token聊天,到現(xiàn)在能夠作為一個(gè)Agent幫你完成任務(wù),對(duì)整個(gè)AI的想象力空間做了一個(gè)很大的提升。但與此同時(shí),它對(duì)整個(gè)系統(tǒng)的能力要求也變得很高,這也是我一開(kāi)始用會(huì)覺(jué)得卡頓的原因。
作為基礎(chǔ)設(shè)施層的廠商,我看到OpenClaw為整個(gè)AI后續(xù)的大型系統(tǒng)和生態(tài)帶來(lái)了更多機(jī)遇和挑戰(zhàn),因?yàn)楝F(xiàn)在所有能用到的資源,想要支撐起這樣一個(gè)快速增長(zhǎng)的時(shí)代是不夠的。就拿我們公司來(lái)說(shuō),從一月底開(kāi)始,基本上每?jī)芍躷oken用量就翻一番,到現(xiàn)在已經(jīng)翻了十倍。上次見(jiàn)到這種速度,還是當(dāng)年3G時(shí)代手機(jī)流量增長(zhǎng)的那種感覺(jué)。現(xiàn)在的token用量,就像當(dāng)年每個(gè)月只有一百兆手機(jī)流量的那個(gè)時(shí)代一樣,所有資源都需要更好的優(yōu)化和整合,讓每一個(gè)人都能把OpenClaw這樣的AI能力用起來(lái)。所以作為基礎(chǔ)設(shè)施領(lǐng)域的從業(yè)者,我對(duì)這個(gè)時(shí)代非常激動(dòng),認(rèn)為其中有很多值得去探索和嘗試的優(yōu)化空間。
羅福莉 :我把OpenClaw視為Agent框架上一個(gè)非常革命性和顛覆性的事件。雖然我知道身邊深度使用編程工具的人,第一選擇可能還是Claude Code,但我相信只有用過(guò)OpenClaw的人才能獨(dú)特地感受到,這個(gè)框架在設(shè)計(jì)上有很多地方是領(lǐng)先于Claude Code的,包括最近Claude Code的很多更新,其實(shí)都是在向OpenClaw靠近。對(duì)我自己來(lái)說(shuō),OpenClaw這個(gè)框架帶來(lái)更多的是一種隨時(shí)隨地的想象力延伸。Claude Code可能最開(kāi)始只能在桌面上延展創(chuàng)意,但在OpenClaw里我可以隨時(shí)隨地延展想法。
我后來(lái)發(fā)現(xiàn),OpenClaw核心價(jià)值在于兩點(diǎn):第一是它開(kāi)源,開(kāi)源對(duì)整個(gè)社區(qū)深度參與、持續(xù)改進(jìn)Agent框架是一個(gè)非常重要的前置條件。第二,像OpenClaw這樣的Agent框架,它很大的價(jià)值在于把國(guó)內(nèi)水平接近但略遜于閉源模型的這一賽道上的模型上限拉得非常高,在絕大部分場(chǎng)景里任務(wù)完成度已經(jīng)非常接近Claude最新的模型。同時(shí)它又通過(guò)Harness系統(tǒng)或者Skills體系等諸多設(shè)計(jì),把下限保證得非常好。從基座大模型的角度來(lái)說(shuō),它保證了下限,同時(shí)也拉升了上限。此外,我認(rèn)為它給整個(gè)社區(qū)帶來(lái)的更大價(jià)值,是點(diǎn)燃了大家對(duì)模型之外的那一層的熱情,讓大家發(fā)現(xiàn)Agent這一層有非常多的想象力和空間可以發(fā)揮。這也讓社區(qū)里越來(lái)越多除研究員以外的人參與到AGI的變革當(dāng)中,更多人接觸到更強(qiáng)的Agent框架,一定程度上在替代自己重復(fù)性的工作,釋放時(shí)間去做更有想象力的事情。
黃超 :從交互模式上來(lái)講,我覺(jué)得OpenClaw這次爆火,首先是因?yàn)榻o大家一種更有活人感的感覺(jué)。我們其實(shí)做Agent也有一兩年了,但之前包括Cursor、Claude Code這些Agent,大家感受到的更多是一種工具感。OpenClaw第一次以IM軟件嵌入的交互方式,讓大家更有一種活人感,更接近于自己想象中的個(gè)人賈維斯那樣的概念,這是交互模式上的突破。另外它給大家?guī)?lái)的一個(gè)啟發(fā)是,Agent Loop這種非常簡(jiǎn)單但高效的框架,再次被證明是行之有效的。同時(shí)它也讓我們重新思考,究竟是需要一個(gè)all-in-one的非常強(qiáng)大的智能體幫我們做很多事情,還是需要一個(gè)像輕量級(jí)操作系統(tǒng)或腳手架一樣的小管家。OpenClaw的答案是,通過(guò)這樣一個(gè)輕量級(jí)的操作系統(tǒng)生態(tài),去撬動(dòng)整個(gè)生態(tài)里所有的工具。隨著Skills和Harness這些機(jī)制的普及,越來(lái)越多的人可以設(shè)計(jì)面向OpenClaw這類系統(tǒng)的應(yīng)用,賦能各行各業(yè)。這與整個(gè)開(kāi)源生態(tài)天然結(jié)合得非常緊密,我覺(jué)得這兩點(diǎn)是它帶給我們最大的啟發(fā)。
楊植麟(主持人) :順著這個(gè)話題,剛才一直在討論OpenClaw。想問(wèn)一下張鵬,看到最近智譜也發(fā)布了新的GLM5 Turbo模型,我理解在Agent能力上也做了很大的增強(qiáng),能不能給大家介紹一下這個(gè)新模型和其他模型的不同之處?另外我們也觀察到有一個(gè)提價(jià)的策略,這反映了什么樣的市場(chǎng)信號(hào)?
張鵬 :這是個(gè)很好的問(wèn)題。前兩天我們確實(shí)緊急做了一波更新,這其實(shí)是我們整個(gè)發(fā)展路線中的一個(gè)階段,提前把它放出來(lái)了。這件事最主要的目的,是從原來(lái)簡(jiǎn)單的對(duì)話轉(zhuǎn)向真正的干活。正如各位剛才說(shuō)的,OpenClaw真的讓大家覺(jué)得大模型不再只是聊天,而是能幫我干活。但干活背后對(duì)能力的要求是非常高的,它需要自主進(jìn)行長(zhǎng)程任務(wù)規(guī)劃,不斷壓縮上下文、debug、處理多模態(tài)信息等等,這和傳統(tǒng)面向?qū)υ挼耐ㄓ媚P偷囊笥泻艽蟮牟煌K訥LM5 Turbo在這方面做了專門(mén)的加強(qiáng),尤其是長(zhǎng)程任務(wù)如何能夠持續(xù)自主loop而不中斷,這里做了很多工作。
另外,大家也提到了token消耗的問(wèn)題。讓一個(gè)聰明的模型去完成復(fù)雜任務(wù),token消耗量是非常巨大的,可能一般人體會(huì)不到,只會(huì)看到賬單上的錢(qián)在不停地往下掉。所以我們?cè)谶@方面也做了優(yōu)化,面臨復(fù)雜任務(wù)時(shí)用更高效的token效率來(lái)完成。模型架構(gòu)上本質(zhì)還是多任務(wù)協(xié)同的通用架構(gòu),只是在能力上做了一些偏向性的加強(qiáng)。至于提價(jià)這件事,其實(shí)也很順暢地能跟大家解釋。現(xiàn)在不再是簡(jiǎn)單的一問(wèn)一答,背后的思考鏈路很長(zhǎng),還要通過(guò)寫(xiě)代碼的方式跟底層基礎(chǔ)設(shè)施打交道、隨時(shí)debug和糾錯(cuò)。完成一個(gè)任務(wù)需要的token量,可能是原來(lái)回答一個(gè)簡(jiǎn)單問(wèn)題的十倍甚至百倍。模型變得更大,推理成本相應(yīng)提高,所以我們把價(jià)格回歸到正常的商業(yè)價(jià)值上。長(zhǎng)期靠低價(jià)競(jìng)爭(zhēng)不利于整個(gè)行業(yè)發(fā)展,這樣才能持續(xù)在商業(yè)化路徑上形成良性閉環(huán),不斷優(yōu)化模型能力,持續(xù)給大家提供更好的模型和相應(yīng)的服務(wù)。
楊植麟(主持人) :非常好的分享。現(xiàn)在開(kāi)源模型和推理算力已經(jīng)開(kāi)始形成一個(gè)生態(tài),各種開(kāi)源模型可以在不同的推理算力上為用戶提供更多價(jià)值。隨著token量的報(bào)價(jià)變化,我們可能也正在從訓(xùn)練時(shí)代逐漸進(jìn)入推理時(shí)代。想請(qǐng)教一下立雪,從infra的層面來(lái)看,推理時(shí)代對(duì)于無(wú)問(wèn)芯穹意味著什么?
夏立雪 :我們是一家誕生在AI時(shí)代的基礎(chǔ)設(shè)施廠商,現(xiàn)在在為Kimi、智譜提供服務(wù),也在跟MiniMax合作,幫助大家更高效地用好我們這個(gè)token工廠。我們也在和很多高校、科研院所合作,所以一直都在思考一個(gè)問(wèn)題:AGI時(shí)代所需要的基礎(chǔ)設(shè)施,究竟應(yīng)該是什么樣的?我們?cè)趺茨軌蛞徊讲降卦谶@個(gè)過(guò)程中去實(shí)現(xiàn)它、推演它。
我們已經(jīng)做好了充分的準(zhǔn)備,也看清了短期、中期、長(zhǎng)期不同階段需要解決的問(wèn)題。當(dāng)前最緊迫的問(wèn)題,就是像Claude這類模型帶動(dòng)的整個(gè)token量的暴增,對(duì)我們系統(tǒng)效率提出了更高的優(yōu)化需求,價(jià)格的增長(zhǎng)也是在這個(gè)需求壓力下的一種應(yīng)對(duì)方式。
我們一直以來(lái)都是從軟硬件打通的方式來(lái)布局和解決這個(gè)問(wèn)題。我們接入了幾乎所有種類的計(jì)算芯片,把國(guó)內(nèi)十幾種芯片和幾十個(gè)不同的算力集群統(tǒng)一連接起來(lái)。這樣,當(dāng)資源不足時(shí),我們能做到兩件事:第一,把能用的資源都用起來(lái);第二,讓每一個(gè)算力都用在刀刃上,發(fā)揮出最大的轉(zhuǎn)化效率。所以當(dāng)前階段我們要解決的核心問(wèn)題,就是如何打造一個(gè)更高效的token工廠。為此我們做了很多優(yōu)化,包括讓模型與硬件在顯存等方面實(shí)現(xiàn)最優(yōu)適配,也在探索在最新的模型結(jié)構(gòu)和硬件結(jié)構(gòu)下能否產(chǎn)生更深度的化學(xué)反應(yīng)。
不過(guò),解決當(dāng)前的效率問(wèn)題,我們只是打造了一個(gè)標(biāo)準(zhǔn)化的token工廠。面向Agent時(shí)代,這還遠(yuǎn)遠(yuǎn)不夠。就像剛才說(shuō)的,Agent更像一個(gè)人,你可以交給他一項(xiàng)任務(wù)。我堅(jiān)定地認(rèn)為,當(dāng)前云計(jì)算時(shí)代的很多基礎(chǔ)設(shè)施,是為服務(wù)程序、服務(wù)人類工程師而設(shè)計(jì)的,而不是為AI設(shè)計(jì)的。現(xiàn)在的狀態(tài)有點(diǎn)像:我們搭了一套基礎(chǔ)設(shè)施,上面留了一個(gè)為人類工程師設(shè)計(jì)的接口,然后在這上面再包一層去接入Agent。這種方式實(shí)際上是用人類操作的能力邊界,限制了Agent的發(fā)揮空間。
舉個(gè)例子,Agent能夠在秒級(jí)甚至毫秒級(jí)思考并發(fā)起任務(wù),但我們之前的底層K8S這些能力并沒(méi)有為此做好準(zhǔn)備,因?yàn)槿祟惏l(fā)起任務(wù)大概是分鐘級(jí)別的。所以我們需要進(jìn)一步構(gòu)建我們稱之為Agentic Infra的能力,打造一個(gè)更智慧化的算力投放工廠。這是無(wú)問(wèn)芯穹現(xiàn)在正在做的事情。
從更長(zhǎng)遠(yuǎn)的未來(lái)來(lái)看,真正AGI時(shí)代到來(lái)的時(shí)候,我們認(rèn)為連基礎(chǔ)設(shè)施本身都應(yīng)該是一個(gè)智能體,應(yīng)該能夠自我進(jìn)化、自我迭代,形成一個(gè)自主的組織。相當(dāng)于有一個(gè)CEO,這個(gè)CEO是一個(gè)Agent,比如一個(gè)Claude在管理整個(gè)基礎(chǔ)設(shè)施,根據(jù)AI客戶的需求自己提需求、迭代自己的基礎(chǔ)設(shè)施。只有AI與AI之間才能更好地形成耦合。所以我們也在做一些讓Agent與Agent之間更好通信的事情,比如cache to cache這樣的復(fù)制能力。
我們一直認(rèn)為,基礎(chǔ)設(shè)施與AI的發(fā)展不應(yīng)該是隔離的狀態(tài),而應(yīng)該產(chǎn)生非常豐富的化學(xué)反應(yīng)。這才是真正的軟硬協(xié)同,真正的算法與基礎(chǔ)設(shè)施協(xié)同。這也是無(wú)問(wèn)芯穹一直想實(shí)現(xiàn)的使命。
楊植麟(主持人) :接下來(lái)想問(wèn)問(wèn)福莉。小米最近發(fā)布了新的模型,也開(kāi)源了一些背后的技術(shù),我覺(jué)得對(duì)社區(qū)做出了很大的貢獻(xiàn)。想請(qǐng)問(wèn)一下,小米在做大模型方面有什么獨(dú)特的優(yōu)勢(shì)?
羅福莉 :我想先把這個(gè)問(wèn)題稍微拓展一下,不只聊小米的優(yōu)勢(shì),而是聊聊中國(guó)做大模型的團(tuán)隊(duì)在這件事上的優(yōu)勢(shì),我覺(jué)得這個(gè)話題有更廣泛的價(jià)值。
大概兩年前,我就觀察到中國(guó)的基座大模型團(tuán)隊(duì)已經(jīng)開(kāi)始了一個(gè)非常好的突破。這個(gè)突破是:在有限算力的條件下,尤其是在互聯(lián)帶寬受限的情況下,如何突破這些低端算力的限制,并由此催生了一些看似是為效率妥協(xié)的模型結(jié)構(gòu)創(chuàng)新,比如DeepSeek v2、v3系列的細(xì)粒度MoE等等。但我們后來(lái)能看到,這些創(chuàng)新引發(fā)的是一場(chǎng)變革,也就是在算力一定的條件下,如何發(fā)揮出最高的智能水平。我覺(jué)得DeepSeek給了國(guó)內(nèi)所有技術(shù)大模型團(tuán)隊(duì)一份勇氣和信心。
雖然今天我們自己的國(guó)產(chǎn)芯片,無(wú)論是推理芯片還是訓(xùn)練芯片,已經(jīng)不再像以前那樣受到嚴(yán)重限制,但我們能看到,正是那些限制催生了我們對(duì)更高訓(xùn)練效率、更低推理成本的模型結(jié)構(gòu)的全新探索。比如最近出現(xiàn)的hybrid sparse或linear attention結(jié)構(gòu),有DSA、NSA,Kimi有KSA,小米也有面向下一代結(jié)構(gòu)的high sparse架構(gòu)。這區(qū)別于MiMo這一代結(jié)構(gòu),是我們面向Agent時(shí)代去思考的,如何在Agent時(shí)代做出更好的模型結(jié)構(gòu)創(chuàng)新。
我為什么認(rèn)為結(jié)構(gòu)創(chuàng)新如此重要?因?yàn)槲覀儎偛帕牡搅薼ong context這個(gè)話題。如果大家真實(shí)地去用OpenClaw就會(huì)發(fā)現(xiàn),越用越好用,越用越聰明。它的前提是推理的context足夠長(zhǎng)。long context是一個(gè)談?wù)摿撕芫玫脑掝},但真正能做到在超長(zhǎng)context下表現(xiàn)強(qiáng)勁、推理成本足夠低的模型,其實(shí)并不多。很多模型不是做不到百萬(wàn)甚至千萬(wàn)token的context,而是推理成本太高、速度太慢。只有當(dāng)你能在百萬(wàn)甚至千萬(wàn)context下做到成本夠低、速度夠快,才會(huì)有真正高生產(chǎn)力價(jià)值的任務(wù)被交給這個(gè)模型,從而激發(fā)模型在long context場(chǎng)景下完成更高復(fù)雜度的任務(wù)。我們可能需要在這樣千萬(wàn)甚至億級(jí)context的規(guī)模下,才能實(shí)現(xiàn)模型的自迭代。所謂模型的自迭代,就是它可以在復(fù)雜的環(huán)境里依靠超長(zhǎng)context完成對(duì)自我的進(jìn)化,這個(gè)進(jìn)化可能是對(duì)Agent框架本身的,也可能是對(duì)模型參數(shù)本身的,因?yàn)槲覀冋J(rèn)為long context本身就是對(duì)參數(shù)的一種進(jìn)化。
所以,怎么實(shí)現(xiàn)long context efficient的架構(gòu),以及在推理側(cè)做到long context efficient,是一個(gè)全方位的競(jìng)爭(zhēng)。這是我們大約一年前就開(kāi)始探索的問(wèn)題。而如今,怎么在真實(shí)的長(zhǎng)程任務(wù)上實(shí)現(xiàn)穩(wěn)定性和高上限的效果,是我們現(xiàn)在在持續(xù)迭代的創(chuàng)新方向。我們?cè)谒伎既绾螛?gòu)造更有效的學(xué)習(xí)算法,如何采集到真實(shí)的、在百萬(wàn)乃至千萬(wàn)上下文里具有長(zhǎng)距依賴的文本,以及結(jié)合復(fù)雜環(huán)境產(chǎn)生的trajectory,這是我們正在經(jīng)歷的事情。
但我能看到更長(zhǎng)期的事情是,大模型本身在飛速進(jìn)步,加上Agent框架的加持,推理需求已經(jīng)在過(guò)去一段時(shí)間內(nèi)增長(zhǎng)了近十倍。那今年整個(gè)token的增長(zhǎng)會(huì)不會(huì)達(dá)到百倍?這又將我們帶入另一個(gè)維度的競(jìng)爭(zhēng),那就是算力,推理芯片,乃至往下到能源層面。這是我對(duì)這個(gè)問(wèn)題的判斷,也期待從大家身上學(xué)到更多。
楊植麟(主持人) :非常有insight的分享。下面想問(wèn)一下黃超,因?yàn)槟阋查_(kāi)發(fā)了一些非常有影響力的agent項(xiàng)目,包括nano bot,在社區(qū)里也有很多粉絲。想問(wèn)一下,從agent的harness或者說(shuō)應(yīng)用層面,接下來(lái)你覺(jué)得有哪些技術(shù)方向是比較重要、大家需要去關(guān)注的?
黃超 :感謝。我覺(jué)得首先可以從agent的幾個(gè)關(guān)鍵技術(shù)模塊來(lái)拆解,包括planning、memory和tool use。
從planning來(lái)講,現(xiàn)在面向長(zhǎng)鏈路任務(wù)或者非常復(fù)雜上下文的場(chǎng)景,比如說(shuō)五百步甚至更長(zhǎng)的任務(wù),很多模型不一定能做好planning,我覺(jué)得本質(zhì)上是模型不具備這方面的隱性知識(shí),尤其是在一些復(fù)雜垂直領(lǐng)域。未來(lái)可能需要把各類復(fù)雜任務(wù)的知識(shí)固化到模型里,這是一個(gè)方向。當(dāng)然,skill和harness這種機(jī)制,在一定程度上也是在緩解planning層面的錯(cuò)誤,因?yàn)樗峁┝吮容^高質(zhì)量的skill,本質(zhì)上是在幫助模型去完成一些較難的task。
關(guān)于memory,我的感受是它永遠(yuǎn)存在信息壓縮不準(zhǔn)確、召回不準(zhǔn)的問(wèn)題。當(dāng)整個(gè)長(zhǎng)鏈路任務(wù)和復(fù)雜場(chǎng)景展開(kāi)時(shí),memory會(huì)急劇膨脹,這對(duì)整個(gè)memory架構(gòu)造成很大壓力。目前包括各類agent框架基本上都采用最簡(jiǎn)單的文件系統(tǒng)、Markdown格式來(lái)做memory,通過(guò)文件共享來(lái)協(xié)作。我覺(jué)得未來(lái)memory應(yīng)該走向分層設(shè)計(jì),并且需要解決通用性的問(wèn)題,因?yàn)閏oding場(chǎng)景、deep research場(chǎng)景、多媒體場(chǎng)景的數(shù)據(jù)模態(tài)差異很大,如何對(duì)這些memory做好檢索索引、提升效率,這永遠(yuǎn)是一個(gè)trade off。
另外,現(xiàn)在agent框架讓大家創(chuàng)建agent的門(mén)檻大幅降低,未來(lái)可能不止一個(gè)agent,我也看到有些產(chǎn)品推出了Agent Swarm這樣的機(jī)制,相當(dāng)于每個(gè)人會(huì)擁有一群龍蝦。一群龍蝦相比一個(gè)龍蝦,上下文的暴增是可以想象的,這對(duì)memory帶來(lái)的壓力非常大。如何管理一群龍蝦帶來(lái)的上下文,目前還沒(méi)有很好的機(jī)制,尤其是在復(fù)雜coding、科研發(fā)現(xiàn)這類場(chǎng)景下,對(duì)模型和整個(gè)agent架構(gòu)都是不小的挑戰(zhàn)。
關(guān)于tool use,當(dāng)年MCP存在的問(wèn)題,比如質(zhì)量沒(méi)有保障、存在安全隱患,現(xiàn)在在skill里依然存在。目前看似有很多skill,但高質(zhì)量的skill其實(shí)比較少,低質(zhì)量的skill會(huì)嚴(yán)重影響agent完成任務(wù)的完成度。另外skill也存在惡意注入的風(fēng)險(xiǎn)。所以我覺(jué)得tool use這塊可能需要整個(gè)社區(qū)共同努力,把skill生態(tài)發(fā)展得更好,甚至探索如何在執(zhí)行過(guò)程中進(jìn)化出新的skill。以上這些,是我認(rèn)為當(dāng)下agent在planning、memory、skill三個(gè)維度上存在的痛點(diǎn),以及未來(lái)潛在的方向。
楊植麟(主持人) :可以看到剛才兩位嘉賓從不同視角討論了同一個(gè)問(wèn)題,隨著任務(wù)復(fù)雜度增加,上下文會(huì)急劇膨脹。從模型層面可以去提升原生的上下文處理能力,從agent harness層面,則是通過(guò)planning、memory,包括multi-agent的harness,在模型能力一定的情況下支持更復(fù)雜的任務(wù)。我覺(jué)得這兩個(gè)方向接下來(lái)會(huì)有更多的化學(xué)反應(yīng),共同提升完成復(fù)雜任務(wù)的能力上限。
那最后我們來(lái)一個(gè)開(kāi)放式展望,請(qǐng)各位用一個(gè)詞來(lái)描述接下來(lái)十二個(gè)月大模型發(fā)展的趨勢(shì)以及你的期望。這次我們先從黃超開(kāi)始。
黃超 :十二個(gè)月在AI領(lǐng)域看起來(lái)好遙遠(yuǎn),真的不知道十二個(gè)月之后會(huì)發(fā)展成什么樣子。
楊植麟(主持人) :這里原來(lái)寫(xiě)的是五年,我給改成十二個(gè)月了。
黃超 :對(duì),我這邊的關(guān)鍵詞應(yīng)該是生態(tài)。未來(lái)agent要真正從個(gè)人助手轉(zhuǎn)化為打工人,這一步很重要。現(xiàn)在大家玩agent很多時(shí)候還停留在新鮮感階段,覺(jué)得好玩,但未來(lái)真正要讓agent沉淀下來(lái),成為大家真正的搬磚工具,或者說(shuō)真正的co-worker。這需要整個(gè)生態(tài)的共同努力,把所有相關(guān)的技術(shù)探索和模型技術(shù)都開(kāi)源出來(lái),不管是模型迭代、skill平臺(tái)迭代還是各類工具,都需要面向agent打造更好的生態(tài)。
從我自己的感受來(lái)說(shuō),未來(lái)的很多軟件可能不再是面向人類的。人類需要GUI,但很多軟件可能會(huì)是面向agent原生設(shè)計(jì)的,人類只會(huì)去使用讓自己快樂(lè)的GUI,其他的交給agent。所以現(xiàn)在整個(gè)生態(tài)從GUI、MCP又轉(zhuǎn)向了CLI這樣的模式。我覺(jué)得需要整個(gè)生態(tài)把不管是軟件系統(tǒng)、數(shù)據(jù)還是各種技術(shù),都變成Agent Native的模式,這樣才能讓整個(gè)agent的發(fā)展更加豐富。
羅福莉 :我覺(jué)得把這個(gè)問(wèn)題縮小到一年非常有意義,因?yàn)槲迥赀@個(gè)時(shí)間跨度,從我心目中對(duì)AGI的定義來(lái)看,我覺(jué)得已經(jīng)實(shí)現(xiàn)了。所以如果要用一個(gè)詞來(lái)描述接下來(lái)一年AGI歷程里最關(guān)鍵的事情,我認(rèn)為會(huì)是自進(jìn)化。這個(gè)詞雖然聽(tīng)起來(lái)有點(diǎn)玄幻,過(guò)去一年大家也多次提到,但我最近才對(duì)它有了更深的體會(huì),也對(duì)如何具體落地這件事有了更務(wù)實(shí)可行的方案。
借助非常強(qiáng)大的模型,我們?cè)谶^(guò)去chat范式下其實(shí)根本沒(méi)有發(fā)揮出預(yù)訓(xùn)練模型的上限,而這個(gè)上限現(xiàn)在被agent框架激活了。我們現(xiàn)在觸到了一個(gè)現(xiàn)象,當(dāng)模型執(zhí)行更長(zhǎng)時(shí)間的任務(wù)時(shí),它可以自己去學(xué)習(xí)和進(jìn)化。一個(gè)很簡(jiǎn)單的嘗試是,在現(xiàn)有的agent框架里疊加一個(gè)可以verify的條件約束,再設(shè)置一個(gè)loop,讓模型持續(xù)迭代優(yōu)化目標(biāo),我們就能發(fā)現(xiàn)模型會(huì)持續(xù)拿出更好的方案。這種自進(jìn)化現(xiàn)在已經(jīng)能跑一兩天了,國(guó)內(nèi)的模型基本上能支撐,當(dāng)然和任務(wù)難度有關(guān)。我們發(fā)現(xiàn)在一些科學(xué)研究上,比如去探索更好的模型結(jié)構(gòu),因?yàn)橛性u(píng)估標(biāo)準(zhǔn),比如更低的PPL,在這類目標(biāo)明確的任務(wù)上,模型已經(jīng)能自主運(yùn)行和執(zhí)行兩三天了。
從我的角度看,自進(jìn)化是唯一能創(chuàng)造出新東西的地方,它不是去替代我們?nèi)祟惉F(xiàn)有的生產(chǎn)力,而是像頂尖科學(xué)家一樣去探索這個(gè)世界上還沒(méi)有的東西。一年前我會(huì)覺(jué)得這個(gè)時(shí)間歷程需要三到五年,但就在最近,我覺(jué)得這個(gè)時(shí)間線應(yīng)該縮短到一兩年,大模型疊加一個(gè)非常強(qiáng)的自進(jìn)化agent框架,至少能實(shí)現(xiàn)對(duì)科學(xué)研究的指數(shù)級(jí)加速。我們組內(nèi)做大模型研究的同學(xué),workflow高度不確定且需要大量創(chuàng)造力,但借助頂尖模型,基本上已經(jīng)能把我們自己的研究效率加速近十倍了。我很期待這樣的范式輻射到更廣泛的學(xué)科和領(lǐng)域。
夏立雪 :我的關(guān)鍵詞叫可持續(xù)token。我看到整個(gè)AI的發(fā)展仍然處于長(zhǎng)期持續(xù)的過(guò)程中,我們也希望它能有長(zhǎng)久的生命力。從基礎(chǔ)設(shè)施的視角來(lái)看,我們面臨的一個(gè)很大問(wèn)題是資源終究是有限的,就像當(dāng)年我們講可持續(xù)發(fā)展一樣。我們作為一個(gè)token工廠,能否給大家提供持續(xù)穩(wěn)定、大規(guī)模可用的token,讓頂尖的模型真正能夠繼續(xù)服務(wù)更多的下游,是我們看到的一個(gè)非常重要的問(wèn)題。
所以我們現(xiàn)在需要把視角放寬到整個(gè)生態(tài),從最早的能源到算力,再到token,最終轉(zhuǎn)換成GDP,讓這條鏈路能夠進(jìn)行持續(xù)的經(jīng)濟(jì)化迭代。我們不只是把國(guó)內(nèi)的算力用起來(lái),也在把這些能力輸出到海外,讓全球的資源能夠打通整合。所以我認(rèn)為可持續(xù)這個(gè)詞,也包含了我們想把中國(guó)特色的token經(jīng)濟(jì)學(xué)做起來(lái)的愿望。過(guò)去那個(gè)時(shí)代叫Made in China,我們把低價(jià)的制造能力轉(zhuǎn)化成好的商品輸出到全球。現(xiàn)在我們想做的有點(diǎn)像AI Made in China,把中國(guó)在能源上的優(yōu)勢(shì),通過(guò)token工廠可持續(xù)地轉(zhuǎn)化為優(yōu)質(zhì)的token輸出到全球,成為世界的token工廠。這是我希望在今年看到的,中國(guó)為世界人工智能帶來(lái)的價(jià)值。
張鵬 :我就簡(jiǎn)短一點(diǎn),大家都在仰望星空,我就落地一點(diǎn)。未來(lái)十二個(gè)月面臨的最大問(wèn)題,我覺(jué)得可能就是算力。剛才也說(shuō)了,所有的技術(shù),包括智能體框架,讓很多人創(chuàng)造力爆發(fā)、效率提升十倍,但前提條件是大家用得起、用得起來(lái)。不能因?yàn)樗懔Σ粔颍粋€(gè)問(wèn)題提出去讓它思考半天都得不到答案,這肯定不行。也正是因?yàn)檫@樣的原因,我們很多研究進(jìn)展和想要做的事情其實(shí)都受阻了。前兩年記得中關(guān)村論壇有人提過(guò)這么一句話,叫沒(méi)卡沒(méi)感情,談卡傷感情。今天又回到了這個(gè)處境,但情況又不一樣了,我們現(xiàn)在轉(zhuǎn)向推理階段,是因?yàn)樾枨笳娴脑诒l(fā),十倍百倍地爆發(fā)。剛才也說(shuō)到過(guò)去增長(zhǎng)了十倍,背后其實(shí)是一百倍的需求,還有大量的需求沒(méi)有被滿足,這需要大家一起來(lái)想辦法。
楊植麟(主持人) :好,感謝各位的精彩分享,謝謝大家。
最后,這兩天海淀五道口的AI原點(diǎn)社區(qū)也在舉辦原點(diǎn)Party Nights活動(dòng),有興趣的可以去玩玩,說(shuō)不定咱們還能一起面?zhèn)€基。
以上,既然看到這里了,如果覺(jué)得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見(jiàn)。
>/ 作者:卡茲克,tashi
>/ 投稿或爆料,請(qǐng)聯(lián)系郵箱:wzglyay@virxact.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.