網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

楊植麟、張鵬、羅福莉等齊聚一堂，他們關(guān)于OpenClaw的觀點(diǎn)值得一聽(tīng)。

2026-03-27 14:25:52　來(lái)源: 數(shù)字生命卡茲克

天津舉報(bào)

分享至

今天是2026中關(guān)村論壇的人工智能主題日。

我也定了個(gè)一早的鬧鐘準(zhǔn)時(shí)起來(lái)看。

這個(gè)活動(dòng)海淀已經(jīng)辦了第三年，但今年的議程密度確實(shí)有點(diǎn)夸張。

一上午塞進(jìn)了開(kāi)源聯(lián)盟成立、主權(quán)大模型白皮書(shū)發(fā)布、北京市人工智能協(xié)會(huì)揭牌，外加兩場(chǎng)圓桌。

大模型和具身智能各一場(chǎng)。嘉賓陣容從Eclipse基金會(huì)到智譜、小米MiMo、無(wú)問(wèn)芯穹，再到一眾具身智能公司的創(chuàng)始人，幾乎把當(dāng)下AI產(chǎn)業(yè)鏈上最活躍的角色都拉到了同一個(gè)舞臺(tái)上。

在我看來(lái)，信息密度最高的，還是第一場(chǎng)小龍蝦與AI開(kāi)源圓桌。

這場(chǎng)圓桌由楊植麟主持，嘉賓是智譜的張鵬、無(wú)問(wèn)芯穹的夏立雪、小米MiMo的羅福莉，還有港大的黃超。

從模型層到算力基礎(chǔ)設(shè)施層再到Agent應(yīng)用層，剛好覆蓋了當(dāng)下AI產(chǎn)業(yè)鏈的幾個(gè)關(guān)鍵環(huán)節(jié)。

張鵬解釋了智譜GLM5 Turbo提價(jià)的邏輯，模型從聊天轉(zhuǎn)向干活，完成任務(wù)消耗的token量可能是簡(jiǎn)單問(wèn)答的十倍甚至百倍，提價(jià)本質(zhì)上是在回歸商業(yè)價(jià)值。

羅福莉談了中國(guó)團(tuán)隊(duì)在模型結(jié)構(gòu)創(chuàng)新上的優(yōu)勢(shì)，尤其是長(zhǎng)上下文架構(gòu)和推理效率。

黃超拆解了Agent在planning、memory、skill三個(gè)維度上的技術(shù)痛點(diǎn)。

最后讓每人用一個(gè)詞總結(jié)未來(lái)12個(gè)月的趨勢(shì)，黃超說(shuō)的是 生態(tài) ，羅福莉說(shuō)的是 自進(jìn)化 ，夏立雪說(shuō)的是 可持續(xù)token ，而張鵬直接點(diǎn)了一個(gè)最樸素的問(wèn)題：算力。

幾位嘉賓的圓桌對(duì)話，干貨含量極高，幾乎沒(méi)有什么客套和PR話術(shù)，聊的都是非常實(shí)在的問(wèn)題。

所以，我也把這場(chǎng)圓桌的內(nèi)容做了一個(gè)完整的文字整理，分享給大家。

【圓桌對(duì)話-人類校對(duì)版】

楊植麟（主持人） ：很榮幸今天能邀請(qǐng)到各位重磅的嘉賓，各位的背景覆蓋了不同的層面，從模型層到底層的算力層，再到上面的Agent層。很高興今天能和大家一起探討，主要的關(guān)鍵詞是開(kāi)源和Agent。我們從第一個(gè)問(wèn)題開(kāi)始，這個(gè)問(wèn)題是給所有人的。現(xiàn)在OpenClaw是最流行的產(chǎn)品，大家在日常使用OpenClaw或類似產(chǎn)品的過(guò)程中，覺(jué)得最有想象力或者印象最深刻的是什么？從技術(shù)角度來(lái)看，如何看待今天OpenClaw和相關(guān)Agent的演進(jìn)？我們先從張鵬這邊開(kāi)始。

張鵬：好，首先感謝植麟的邀請(qǐng)，也感謝主辦方給這次機(jī)會(huì)跟大家交流。其實(shí)我很早就開(kāi)始自己玩這個(gè)東西了，當(dāng)時(shí)還不叫OpenClaw，最早叫Claude Bot。畢竟我是程序員出身，折騰這些東西有一些自己的體驗(yàn)。我覺(jué)得它帶給大家最大的突破點(diǎn)，在于這件事情不再是程序員或者極客們的專利，普通人也可以比較方便地使用頂尖模型的能力，尤其是在編程和智能體方面。所以到現(xiàn)在為止，我在跟大家交流的過(guò)程中，更愿意把OpenClaw這件事稱作一個(gè)腳手架，它提供的是一種可能性。在模型的基礎(chǔ)之上搭起一個(gè)牢固、方便又靈活的腳手架，大家可以按照自己的意愿去使用底層模型提供的很多新奇的東西。原來(lái)自己的一些想法，受限于不會(huì)寫(xiě)代碼或者缺乏某些技能，今天終于可以通過(guò)很簡(jiǎn)單的交流就把它完成。這對(duì)我來(lái)說(shuō)是一個(gè)非常大的沖擊，讓我重新認(rèn)識(shí)了這件事情。

夏立雪 ：我最開(kāi)始用OpenClaw的時(shí)候其實(shí)不太適應(yīng)，因?yàn)槲伊?xí)慣于和大模型聊天的那種交流方式，結(jié)果發(fā)現(xiàn)OpenClaw反應(yīng)好像比較慢。但后來(lái)我意識(shí)到一個(gè)關(guān)鍵的不同，它不是一個(gè)聊天機(jī)器人，而是一個(gè)能夠幫我完成大型任務(wù)的助手。當(dāng)我開(kāi)始給它提交更復(fù)雜的任務(wù)之后，發(fā)現(xiàn)它其實(shí)能做得很好。這件事給我一個(gè)很大的感觸，就是AI從最開(kāi)始按token聊天，到現(xiàn)在能夠作為一個(gè)Agent幫你完成任務(wù)，對(duì)整個(gè)AI的想象力空間做了一個(gè)很大的提升。但與此同時(shí)，它對(duì)整個(gè)系統(tǒng)的能力要求也變得很高，這也是我一開(kāi)始用會(huì)覺(jué)得卡頓的原因。

作為基礎(chǔ)設(shè)施層的廠商，我看到OpenClaw為整個(gè)AI后續(xù)的大型系統(tǒng)和生態(tài)帶來(lái)了更多機(jī)遇和挑戰(zhàn)，因?yàn)楝F(xiàn)在所有能用到的資源，想要支撐起這樣一個(gè)快速增長(zhǎng)的時(shí)代是不夠的。就拿我們公司來(lái)說(shuō)，從一月底開(kāi)始，基本上每?jī)芍躷oken用量就翻一番，到現(xiàn)在已經(jīng)翻了十倍。上次見(jiàn)到這種速度，還是當(dāng)年3G時(shí)代手機(jī)流量增長(zhǎng)的那種感覺(jué)。現(xiàn)在的token用量，就像當(dāng)年每個(gè)月只有一百兆手機(jī)流量的那個(gè)時(shí)代一樣，所有資源都需要更好的優(yōu)化和整合，讓每一個(gè)人都能把OpenClaw這樣的AI能力用起來(lái)。所以作為基礎(chǔ)設(shè)施領(lǐng)域的從業(yè)者，我對(duì)這個(gè)時(shí)代非常激動(dòng)，認(rèn)為其中有很多值得去探索和嘗試的優(yōu)化空間。

羅福莉 ：我把OpenClaw視為Agent框架上一個(gè)非常革命性和顛覆性的事件。雖然我知道身邊深度使用編程工具的人，第一選擇可能還是Claude Code，但我相信只有用過(guò)OpenClaw的人才能獨(dú)特地感受到，這個(gè)框架在設(shè)計(jì)上有很多地方是領(lǐng)先于Claude Code的，包括最近Claude Code的很多更新，其實(shí)都是在向OpenClaw靠近。對(duì)我自己來(lái)說(shuō)，OpenClaw這個(gè)框架帶來(lái)更多的是一種隨時(shí)隨地的想象力延伸。Claude Code可能最開(kāi)始只能在桌面上延展創(chuàng)意，但在OpenClaw里我可以隨時(shí)隨地延展想法。

我后來(lái)發(fā)現(xiàn)，OpenClaw核心價(jià)值在于兩點(diǎn)：第一是它開(kāi)源，開(kāi)源對(duì)整個(gè)社區(qū)深度參與、持續(xù)改進(jìn)Agent框架是一個(gè)非常重要的前置條件。第二，像OpenClaw這樣的Agent框架，它很大的價(jià)值在于把國(guó)內(nèi)水平接近但略遜于閉源模型的這一賽道上的模型上限拉得非常高，在絕大部分場(chǎng)景里任務(wù)完成度已經(jīng)非常接近Claude最新的模型。同時(shí)它又通過(guò)Harness系統(tǒng)或者Skills體系等諸多設(shè)計(jì)，把下限保證得非常好。從基座大模型的角度來(lái)說(shuō)，它保證了下限，同時(shí)也拉升了上限。此外，我認(rèn)為它給整個(gè)社區(qū)帶來(lái)的更大價(jià)值，是點(diǎn)燃了大家對(duì)模型之外的那一層的熱情，讓大家發(fā)現(xiàn)Agent這一層有非常多的想象力和空間可以發(fā)揮。這也讓社區(qū)里越來(lái)越多除研究員以外的人參與到AGI的變革當(dāng)中，更多人接觸到更強(qiáng)的Agent框架，一定程度上在替代自己重復(fù)性的工作，釋放時(shí)間去做更有想象力的事情。

黃超：從交互模式上來(lái)講，我覺(jué)得OpenClaw這次爆火，首先是因?yàn)榻o大家一種更有活人感的感覺(jué)。我們其實(shí)做Agent也有一兩年了，但之前包括Cursor、Claude Code這些Agent，大家感受到的更多是一種工具感。OpenClaw第一次以IM軟件嵌入的交互方式，讓大家更有一種活人感，更接近于自己想象中的個(gè)人賈維斯那樣的概念，這是交互模式上的突破。另外它給大家?guī)?lái)的一個(gè)啟發(fā)是，Agent Loop這種非常簡(jiǎn)單但高效的框架，再次被證明是行之有效的。同時(shí)它也讓我們重新思考，究竟是需要一個(gè)all-in-one的非常強(qiáng)大的智能體幫我們做很多事情，還是需要一個(gè)像輕量級(jí)操作系統(tǒng)或腳手架一樣的小管家。OpenClaw的答案是，通過(guò)這樣一個(gè)輕量級(jí)的操作系統(tǒng)生態(tài)，去撬動(dòng)整個(gè)生態(tài)里所有的工具。隨著Skills和Harness這些機(jī)制的普及，越來(lái)越多的人可以設(shè)計(jì)面向OpenClaw這類系統(tǒng)的應(yīng)用，賦能各行各業(yè)。這與整個(gè)開(kāi)源生態(tài)天然結(jié)合得非常緊密，我覺(jué)得這兩點(diǎn)是它帶給我們最大的啟發(fā)。

楊植麟（主持人） ：順著這個(gè)話題，剛才一直在討論OpenClaw。想問(wèn)一下張鵬，看到最近智譜也發(fā)布了新的GLM5 Turbo模型，我理解在Agent能力上也做了很大的增強(qiáng)，能不能給大家介紹一下這個(gè)新模型和其他模型的不同之處？另外我們也觀察到有一個(gè)提價(jià)的策略，這反映了什么樣的市場(chǎng)信號(hào)？

張鵬：這是個(gè)很好的問(wèn)題。前兩天我們確實(shí)緊急做了一波更新，這其實(shí)是我們整個(gè)發(fā)展路線中的一個(gè)階段，提前把它放出來(lái)了。這件事最主要的目的，是從原來(lái)簡(jiǎn)單的對(duì)話轉(zhuǎn)向真正的干活。正如各位剛才說(shuō)的，OpenClaw真的讓大家覺(jué)得大模型不再只是聊天，而是能幫我干活。但干活背后對(duì)能力的要求是非常高的，它需要自主進(jìn)行長(zhǎng)程任務(wù)規(guī)劃，不斷壓縮上下文、debug、處理多模態(tài)信息等等，這和傳統(tǒng)面向?qū)υ挼耐ㄓ媚Ｐ偷囊笥泻艽蟮牟煌Ｋ訥LM5 Turbo在這方面做了專門(mén)的加強(qiáng)，尤其是長(zhǎng)程任務(wù)如何能夠持續(xù)自主loop而不中斷，這里做了很多工作。

另外，大家也提到了token消耗的問(wèn)題。讓一個(gè)聰明的模型去完成復(fù)雜任務(wù)，token消耗量是非常巨大的，可能一般人體會(huì)不到，只會(huì)看到賬單上的錢(qián)在不停地往下掉。所以我們?cè)谶@方面也做了優(yōu)化，面臨復(fù)雜任務(wù)時(shí)用更高效的token效率來(lái)完成。模型架構(gòu)上本質(zhì)還是多任務(wù)協(xié)同的通用架構(gòu)，只是在能力上做了一些偏向性的加強(qiáng)。至于提價(jià)這件事，其實(shí)也很順暢地能跟大家解釋。現(xiàn)在不再是簡(jiǎn)單的一問(wèn)一答，背后的思考鏈路很長(zhǎng)，還要通過(guò)寫(xiě)代碼的方式跟底層基礎(chǔ)設(shè)施打交道、隨時(shí)debug和糾錯(cuò)。完成一個(gè)任務(wù)需要的token量，可能是原來(lái)回答一個(gè)簡(jiǎn)單問(wèn)題的十倍甚至百倍。模型變得更大，推理成本相應(yīng)提高，所以我們把價(jià)格回歸到正常的商業(yè)價(jià)值上。長(zhǎng)期靠低價(jià)競(jìng)爭(zhēng)不利于整個(gè)行業(yè)發(fā)展，這樣才能持續(xù)在商業(yè)化路徑上形成良性閉環(huán)，不斷優(yōu)化模型能力，持續(xù)給大家提供更好的模型和相應(yīng)的服務(wù)。

楊植麟（主持人） ：非常好的分享。現(xiàn)在開(kāi)源模型和推理算力已經(jīng)開(kāi)始形成一個(gè)生態(tài)，各種開(kāi)源模型可以在不同的推理算力上為用戶提供更多價(jià)值。隨著token量的報(bào)價(jià)變化，我們可能也正在從訓(xùn)練時(shí)代逐漸進(jìn)入推理時(shí)代。想請(qǐng)教一下立雪，從infra的層面來(lái)看，推理時(shí)代對(duì)于無(wú)問(wèn)芯穹意味著什么？

夏立雪 ：我們是一家誕生在AI時(shí)代的基礎(chǔ)設(shè)施廠商，現(xiàn)在在為Kimi、智譜提供服務(wù)，也在跟MiniMax合作，幫助大家更高效地用好我們這個(gè)token工廠。我們也在和很多高校、科研院所合作，所以一直都在思考一個(gè)問(wèn)題：AGI時(shí)代所需要的基礎(chǔ)設(shè)施，究竟應(yīng)該是什么樣的？我們?cè)趺茨軌蛞徊讲降卦谶@個(gè)過(guò)程中去實(shí)現(xiàn)它、推演它。

我們已經(jīng)做好了充分的準(zhǔn)備，也看清了短期、中期、長(zhǎng)期不同階段需要解決的問(wèn)題。當(dāng)前最緊迫的問(wèn)題，就是像Claude這類模型帶動(dòng)的整個(gè)token量的暴增，對(duì)我們系統(tǒng)效率提出了更高的優(yōu)化需求，價(jià)格的增長(zhǎng)也是在這個(gè)需求壓力下的一種應(yīng)對(duì)方式。

我們一直以來(lái)都是從軟硬件打通的方式來(lái)布局和解決這個(gè)問(wèn)題。我們接入了幾乎所有種類的計(jì)算芯片，把國(guó)內(nèi)十幾種芯片和幾十個(gè)不同的算力集群統(tǒng)一連接起來(lái)。這樣，當(dāng)資源不足時(shí)，我們能做到兩件事：第一，把能用的資源都用起來(lái)；第二，讓每一個(gè)算力都用在刀刃上，發(fā)揮出最大的轉(zhuǎn)化效率。所以當(dāng)前階段我們要解決的核心問(wèn)題，就是如何打造一個(gè)更高效的token工廠。為此我們做了很多優(yōu)化，包括讓模型與硬件在顯存等方面實(shí)現(xiàn)最優(yōu)適配，也在探索在最新的模型結(jié)構(gòu)和硬件結(jié)構(gòu)下能否產(chǎn)生更深度的化學(xué)反應(yīng)。

不過(guò)，解決當(dāng)前的效率問(wèn)題，我們只是打造了一個(gè)標(biāo)準(zhǔn)化的token工廠。面向Agent時(shí)代，這還遠(yuǎn)遠(yuǎn)不夠。就像剛才說(shuō)的，Agent更像一個(gè)人，你可以交給他一項(xiàng)任務(wù)。我堅(jiān)定地認(rèn)為，當(dāng)前云計(jì)算時(shí)代的很多基礎(chǔ)設(shè)施，是為服務(wù)程序、服務(wù)人類工程師而設(shè)計(jì)的，而不是為AI設(shè)計(jì)的。現(xiàn)在的狀態(tài)有點(diǎn)像：我們搭了一套基礎(chǔ)設(shè)施，上面留了一個(gè)為人類工程師設(shè)計(jì)的接口，然后在這上面再包一層去接入Agent。這種方式實(shí)際上是用人類操作的能力邊界，限制了Agent的發(fā)揮空間。

舉個(gè)例子，Agent能夠在秒級(jí)甚至毫秒級(jí)思考并發(fā)起任務(wù)，但我們之前的底層K8S這些能力并沒(méi)有為此做好準(zhǔn)備，因?yàn)槿祟惏l(fā)起任務(wù)大概是分鐘級(jí)別的。所以我們需要進(jìn)一步構(gòu)建我們稱之為Agentic Infra的能力，打造一個(gè)更智慧化的算力投放工廠。這是無(wú)問(wèn)芯穹現(xiàn)在正在做的事情。

從更長(zhǎng)遠(yuǎn)的未來(lái)來(lái)看，真正AGI時(shí)代到來(lái)的時(shí)候，我們認(rèn)為連基礎(chǔ)設(shè)施本身都應(yīng)該是一個(gè)智能體，應(yīng)該能夠自我進(jìn)化、自我迭代，形成一個(gè)自主的組織。相當(dāng)于有一個(gè)CEO，這個(gè)CEO是一個(gè)Agent，比如一個(gè)Claude在管理整個(gè)基礎(chǔ)設(shè)施，根據(jù)AI客戶的需求自己提需求、迭代自己的基礎(chǔ)設(shè)施。只有AI與AI之間才能更好地形成耦合。所以我們也在做一些讓Agent與Agent之間更好通信的事情，比如cache to cache這樣的復(fù)制能力。

我們一直認(rèn)為，基礎(chǔ)設(shè)施與AI的發(fā)展不應(yīng)該是隔離的狀態(tài)，而應(yīng)該產(chǎn)生非常豐富的化學(xué)反應(yīng)。這才是真正的軟硬協(xié)同，真正的算法與基礎(chǔ)設(shè)施協(xié)同。這也是無(wú)問(wèn)芯穹一直想實(shí)現(xiàn)的使命。

楊植麟（主持人） ：接下來(lái)想問(wèn)問(wèn)福莉。小米最近發(fā)布了新的模型，也開(kāi)源了一些背后的技術(shù)，我覺(jué)得對(duì)社區(qū)做出了很大的貢獻(xiàn)。想請(qǐng)問(wèn)一下，小米在做大模型方面有什么獨(dú)特的優(yōu)勢(shì)？

羅福莉：我想先把這個(gè)問(wèn)題稍微拓展一下，不只聊小米的優(yōu)勢(shì)，而是聊聊中國(guó)做大模型的團(tuán)隊(duì)在這件事上的優(yōu)勢(shì)，我覺(jué)得這個(gè)話題有更廣泛的價(jià)值。

大概兩年前，我就觀察到中國(guó)的基座大模型團(tuán)隊(duì)已經(jīng)開(kāi)始了一個(gè)非常好的突破。這個(gè)突破是：在有限算力的條件下，尤其是在互聯(lián)帶寬受限的情況下，如何突破這些低端算力的限制，并由此催生了一些看似是為效率妥協(xié)的模型結(jié)構(gòu)創(chuàng)新，比如DeepSeek v2、v3系列的細(xì)粒度MoE等等。但我們后來(lái)能看到，這些創(chuàng)新引發(fā)的是一場(chǎng)變革，也就是在算力一定的條件下，如何發(fā)揮出最高的智能水平。我覺(jué)得DeepSeek給了國(guó)內(nèi)所有技術(shù)大模型團(tuán)隊(duì)一份勇氣和信心。

雖然今天我們自己的國(guó)產(chǎn)芯片，無(wú)論是推理芯片還是訓(xùn)練芯片，已經(jīng)不再像以前那樣受到嚴(yán)重限制，但我們能看到，正是那些限制催生了我們對(duì)更高訓(xùn)練效率、更低推理成本的模型結(jié)構(gòu)的全新探索。比如最近出現(xiàn)的hybrid sparse或linear attention結(jié)構(gòu)，有DSA、NSA，Kimi有KSA，小米也有面向下一代結(jié)構(gòu)的high sparse架構(gòu)。這區(qū)別于MiMo這一代結(jié)構(gòu)，是我們面向Agent時(shí)代去思考的，如何在Agent時(shí)代做出更好的模型結(jié)構(gòu)創(chuàng)新。

我為什么認(rèn)為結(jié)構(gòu)創(chuàng)新如此重要？因?yàn)槲覀儎偛帕牡搅薼ong context這個(gè)話題。如果大家真實(shí)地去用OpenClaw就會(huì)發(fā)現(xiàn)，越用越好用，越用越聰明。它的前提是推理的context足夠長(zhǎng)。long context是一個(gè)談?wù)摿撕芫玫脑掝}，但真正能做到在超長(zhǎng)context下表現(xiàn)強(qiáng)勁、推理成本足夠低的模型，其實(shí)并不多。很多模型不是做不到百萬(wàn)甚至千萬(wàn)token的context，而是推理成本太高、速度太慢。只有當(dāng)你能在百萬(wàn)甚至千萬(wàn)context下做到成本夠低、速度夠快，才會(huì)有真正高生產(chǎn)力價(jià)值的任務(wù)被交給這個(gè)模型，從而激發(fā)模型在long context場(chǎng)景下完成更高復(fù)雜度的任務(wù)。我們可能需要在這樣千萬(wàn)甚至億級(jí)context的規(guī)模下，才能實(shí)現(xiàn)模型的自迭代。所謂模型的自迭代，就是它可以在復(fù)雜的環(huán)境里依靠超長(zhǎng)context完成對(duì)自我的進(jìn)化，這個(gè)進(jìn)化可能是對(duì)Agent框架本身的，也可能是對(duì)模型參數(shù)本身的，因?yàn)槲覀冋J(rèn)為long context本身就是對(duì)參數(shù)的一種進(jìn)化。

所以，怎么實(shí)現(xiàn)long context efficient的架構(gòu)，以及在推理側(cè)做到long context efficient，是一個(gè)全方位的競(jìng)爭(zhēng)。這是我們大約一年前就開(kāi)始探索的問(wèn)題。而如今，怎么在真實(shí)的長(zhǎng)程任務(wù)上實(shí)現(xiàn)穩(wěn)定性和高上限的效果，是我們現(xiàn)在在持續(xù)迭代的創(chuàng)新方向。我們?cè)谒伎既绾螛?gòu)造更有效的學(xué)習(xí)算法，如何采集到真實(shí)的、在百萬(wàn)乃至千萬(wàn)上下文里具有長(zhǎng)距依賴的文本，以及結(jié)合復(fù)雜環(huán)境產(chǎn)生的trajectory，這是我們正在經(jīng)歷的事情。

但我能看到更長(zhǎng)期的事情是，大模型本身在飛速進(jìn)步，加上Agent框架的加持，推理需求已經(jīng)在過(guò)去一段時(shí)間內(nèi)增長(zhǎng)了近十倍。那今年整個(gè)token的增長(zhǎng)會(huì)不會(huì)達(dá)到百倍？這又將我們帶入另一個(gè)維度的競(jìng)爭(zhēng)，那就是算力，推理芯片，乃至往下到能源層面。這是我對(duì)這個(gè)問(wèn)題的判斷，也期待從大家身上學(xué)到更多。

楊植麟（主持人） ：非常有insight的分享。下面想問(wèn)一下黃超，因?yàn)槟阋查_(kāi)發(fā)了一些非常有影響力的agent項(xiàng)目，包括nano bot，在社區(qū)里也有很多粉絲。想問(wèn)一下，從agent的harness或者說(shuō)應(yīng)用層面，接下來(lái)你覺(jué)得有哪些技術(shù)方向是比較重要、大家需要去關(guān)注的？

黃超：感謝。我覺(jué)得首先可以從agent的幾個(gè)關(guān)鍵技術(shù)模塊來(lái)拆解，包括planning、memory和tool use。

從planning來(lái)講，現(xiàn)在面向長(zhǎng)鏈路任務(wù)或者非常復(fù)雜上下文的場(chǎng)景，比如說(shuō)五百步甚至更長(zhǎng)的任務(wù)，很多模型不一定能做好planning，我覺(jué)得本質(zhì)上是模型不具備這方面的隱性知識(shí)，尤其是在一些復(fù)雜垂直領(lǐng)域。未來(lái)可能需要把各類復(fù)雜任務(wù)的知識(shí)固化到模型里，這是一個(gè)方向。當(dāng)然，skill和harness這種機(jī)制，在一定程度上也是在緩解planning層面的錯(cuò)誤，因?yàn)樗峁┝吮容^高質(zhì)量的skill，本質(zhì)上是在幫助模型去完成一些較難的task。

關(guān)于memory，我的感受是它永遠(yuǎn)存在信息壓縮不準(zhǔn)確、召回不準(zhǔn)的問(wèn)題。當(dāng)整個(gè)長(zhǎng)鏈路任務(wù)和復(fù)雜場(chǎng)景展開(kāi)時(shí)，memory會(huì)急劇膨脹，這對(duì)整個(gè)memory架構(gòu)造成很大壓力。目前包括各類agent框架基本上都采用最簡(jiǎn)單的文件系統(tǒng)、Markdown格式來(lái)做memory，通過(guò)文件共享來(lái)協(xié)作。我覺(jué)得未來(lái)memory應(yīng)該走向分層設(shè)計(jì)，并且需要解決通用性的問(wèn)題，因?yàn)閏oding場(chǎng)景、deep research場(chǎng)景、多媒體場(chǎng)景的數(shù)據(jù)模態(tài)差異很大，如何對(duì)這些memory做好檢索索引、提升效率，這永遠(yuǎn)是一個(gè)trade off。

另外，現(xiàn)在agent框架讓大家創(chuàng)建agent的門(mén)檻大幅降低，未來(lái)可能不止一個(gè)agent，我也看到有些產(chǎn)品推出了Agent Swarm這樣的機(jī)制，相當(dāng)于每個(gè)人會(huì)擁有一群龍蝦。一群龍蝦相比一個(gè)龍蝦，上下文的暴增是可以想象的，這對(duì)memory帶來(lái)的壓力非常大。如何管理一群龍蝦帶來(lái)的上下文，目前還沒(méi)有很好的機(jī)制，尤其是在復(fù)雜coding、科研發(fā)現(xiàn)這類場(chǎng)景下，對(duì)模型和整個(gè)agent架構(gòu)都是不小的挑戰(zhàn)。

關(guān)于tool use，當(dāng)年MCP存在的問(wèn)題，比如質(zhì)量沒(méi)有保障、存在安全隱患，現(xiàn)在在skill里依然存在。目前看似有很多skill，但高質(zhì)量的skill其實(shí)比較少，低質(zhì)量的skill會(huì)嚴(yán)重影響agent完成任務(wù)的完成度。另外skill也存在惡意注入的風(fēng)險(xiǎn)。所以我覺(jué)得tool use這塊可能需要整個(gè)社區(qū)共同努力，把skill生態(tài)發(fā)展得更好，甚至探索如何在執(zhí)行過(guò)程中進(jìn)化出新的skill。以上這些，是我認(rèn)為當(dāng)下agent在planning、memory、skill三個(gè)維度上存在的痛點(diǎn)，以及未來(lái)潛在的方向。

楊植麟（主持人） ：可以看到剛才兩位嘉賓從不同視角討論了同一個(gè)問(wèn)題，隨著任務(wù)復(fù)雜度增加，上下文會(huì)急劇膨脹。從模型層面可以去提升原生的上下文處理能力，從agent harness層面，則是通過(guò)planning、memory，包括multi-agent的harness，在模型能力一定的情況下支持更復(fù)雜的任務(wù)。我覺(jué)得這兩個(gè)方向接下來(lái)會(huì)有更多的化學(xué)反應(yīng)，共同提升完成復(fù)雜任務(wù)的能力上限。

那最后我們來(lái)一個(gè)開(kāi)放式展望，請(qǐng)各位用一個(gè)詞來(lái)描述接下來(lái)十二個(gè)月大模型發(fā)展的趨勢(shì)以及你的期望。這次我們先從黃超開(kāi)始。

黃超：十二個(gè)月在AI領(lǐng)域看起來(lái)好遙遠(yuǎn)，真的不知道十二個(gè)月之后會(huì)發(fā)展成什么樣子。

楊植麟（主持人） ：這里原來(lái)寫(xiě)的是五年，我給改成十二個(gè)月了。

黃超：對(duì)，我這邊的關(guān)鍵詞應(yīng)該是生態(tài)。未來(lái)agent要真正從個(gè)人助手轉(zhuǎn)化為打工人，這一步很重要。現(xiàn)在大家玩agent很多時(shí)候還停留在新鮮感階段，覺(jué)得好玩，但未來(lái)真正要讓agent沉淀下來(lái)，成為大家真正的搬磚工具，或者說(shuō)真正的co-worker。這需要整個(gè)生態(tài)的共同努力，把所有相關(guān)的技術(shù)探索和模型技術(shù)都開(kāi)源出來(lái)，不管是模型迭代、skill平臺(tái)迭代還是各類工具，都需要面向agent打造更好的生態(tài)。

從我自己的感受來(lái)說(shuō)，未來(lái)的很多軟件可能不再是面向人類的。人類需要GUI，但很多軟件可能會(huì)是面向agent原生設(shè)計(jì)的，人類只會(huì)去使用讓自己快樂(lè)的GUI，其他的交給agent。所以現(xiàn)在整個(gè)生態(tài)從GUI、MCP又轉(zhuǎn)向了CLI這樣的模式。我覺(jué)得需要整個(gè)生態(tài)把不管是軟件系統(tǒng)、數(shù)據(jù)還是各種技術(shù)，都變成Agent Native的模式，這樣才能讓整個(gè)agent的發(fā)展更加豐富。

羅福莉 ：我覺(jué)得把這個(gè)問(wèn)題縮小到一年非常有意義，因?yàn)槲迥赀@個(gè)時(shí)間跨度，從我心目中對(duì)AGI的定義來(lái)看，我覺(jué)得已經(jīng)實(shí)現(xiàn)了。所以如果要用一個(gè)詞來(lái)描述接下來(lái)一年AGI歷程里最關(guān)鍵的事情，我認(rèn)為會(huì)是自進(jìn)化。這個(gè)詞雖然聽(tīng)起來(lái)有點(diǎn)玄幻，過(guò)去一年大家也多次提到，但我最近才對(duì)它有了更深的體會(huì)，也對(duì)如何具體落地這件事有了更務(wù)實(shí)可行的方案。

借助非常強(qiáng)大的模型，我們?cè)谶^(guò)去chat范式下其實(shí)根本沒(méi)有發(fā)揮出預(yù)訓(xùn)練模型的上限，而這個(gè)上限現(xiàn)在被agent框架激活了。我們現(xiàn)在觸到了一個(gè)現(xiàn)象，當(dāng)模型執(zhí)行更長(zhǎng)時(shí)間的任務(wù)時(shí)，它可以自己去學(xué)習(xí)和進(jìn)化。一個(gè)很簡(jiǎn)單的嘗試是，在現(xiàn)有的agent框架里疊加一個(gè)可以verify的條件約束，再設(shè)置一個(gè)loop，讓模型持續(xù)迭代優(yōu)化目標(biāo)，我們就能發(fā)現(xiàn)模型會(huì)持續(xù)拿出更好的方案。這種自進(jìn)化現(xiàn)在已經(jīng)能跑一兩天了，國(guó)內(nèi)的模型基本上能支撐，當(dāng)然和任務(wù)難度有關(guān)。我們發(fā)現(xiàn)在一些科學(xué)研究上，比如去探索更好的模型結(jié)構(gòu)，因?yàn)橛性u(píng)估標(biāo)準(zhǔn)，比如更低的PPL，在這類目標(biāo)明確的任務(wù)上，模型已經(jīng)能自主運(yùn)行和執(zhí)行兩三天了。

從我的角度看，自進(jìn)化是唯一能創(chuàng)造出新東西的地方，它不是去替代我們?nèi)祟惉F(xiàn)有的生產(chǎn)力，而是像頂尖科學(xué)家一樣去探索這個(gè)世界上還沒(méi)有的東西。一年前我會(huì)覺(jué)得這個(gè)時(shí)間歷程需要三到五年，但就在最近，我覺(jué)得這個(gè)時(shí)間線應(yīng)該縮短到一兩年，大模型疊加一個(gè)非常強(qiáng)的自進(jìn)化agent框架，至少能實(shí)現(xiàn)對(duì)科學(xué)研究的指數(shù)級(jí)加速。我們組內(nèi)做大模型研究的同學(xué)，workflow高度不確定且需要大量創(chuàng)造力，但借助頂尖模型，基本上已經(jīng)能把我們自己的研究效率加速近十倍了。我很期待這樣的范式輻射到更廣泛的學(xué)科和領(lǐng)域。

夏立雪 ：我的關(guān)鍵詞叫可持續(xù)token。我看到整個(gè)AI的發(fā)展仍然處于長(zhǎng)期持續(xù)的過(guò)程中，我們也希望它能有長(zhǎng)久的生命力。從基礎(chǔ)設(shè)施的視角來(lái)看，我們面臨的一個(gè)很大問(wèn)題是資源終究是有限的，就像當(dāng)年我們講可持續(xù)發(fā)展一樣。我們作為一個(gè)token工廠，能否給大家提供持續(xù)穩(wěn)定、大規(guī)模可用的token，讓頂尖的模型真正能夠繼續(xù)服務(wù)更多的下游，是我們看到的一個(gè)非常重要的問(wèn)題。

所以我們現(xiàn)在需要把視角放寬到整個(gè)生態(tài)，從最早的能源到算力，再到token，最終轉(zhuǎn)換成GDP，讓這條鏈路能夠進(jìn)行持續(xù)的經(jīng)濟(jì)化迭代。我們不只是把國(guó)內(nèi)的算力用起來(lái)，也在把這些能力輸出到海外，讓全球的資源能夠打通整合。所以我認(rèn)為可持續(xù)這個(gè)詞，也包含了我們想把中國(guó)特色的token經(jīng)濟(jì)學(xué)做起來(lái)的愿望。過(guò)去那個(gè)時(shí)代叫Made in China，我們把低價(jià)的制造能力轉(zhuǎn)化成好的商品輸出到全球。現(xiàn)在我們想做的有點(diǎn)像AI Made in China，把中國(guó)在能源上的優(yōu)勢(shì)，通過(guò)token工廠可持續(xù)地轉(zhuǎn)化為優(yōu)質(zhì)的token輸出到全球，成為世界的token工廠。這是我希望在今年看到的，中國(guó)為世界人工智能帶來(lái)的價(jià)值。

張鵬：我就簡(jiǎn)短一點(diǎn)，大家都在仰望星空，我就落地一點(diǎn)。未來(lái)十二個(gè)月面臨的最大問(wèn)題，我覺(jué)得可能就是算力。剛才也說(shuō)了，所有的技術(shù)，包括智能體框架，讓很多人創(chuàng)造力爆發(fā)、效率提升十倍，但前提條件是大家用得起、用得起來(lái)。不能因?yàn)樗懔Σ粔颍粋€(gè)問(wèn)題提出去讓它思考半天都得不到答案，這肯定不行。也正是因?yàn)檫@樣的原因，我們很多研究進(jìn)展和想要做的事情其實(shí)都受阻了。前兩年記得中關(guān)村論壇有人提過(guò)這么一句話，叫沒(méi)卡沒(méi)感情，談卡傷感情。今天又回到了這個(gè)處境，但情況又不一樣了，我們現(xiàn)在轉(zhuǎn)向推理階段，是因?yàn)樾枨笳娴脑诒l(fā)，十倍百倍地爆發(fā)。剛才也說(shuō)到過(guò)去增長(zhǎng)了十倍，背后其實(shí)是一百倍的需求，還有大量的需求沒(méi)有被滿足，這需要大家一起來(lái)想辦法。

楊植麟（主持人） ：好，感謝各位的精彩分享，謝謝大家。

最后，這兩天海淀五道口的AI原點(diǎn)社區(qū)也在舉辦原點(diǎn)Party Nights活動(dòng)，有興趣的可以去玩玩，說(shuō)不定咱們還能一起面?zhèn)€基。

以上，既然看到這里了，如果覺(jué)得不錯(cuò)，隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧，如果想第一時(shí)間收到推送，也可以給我個(gè)星標(biāo)?～謝謝你看我的文章，我們，下次再見(jiàn)。

>/ 作者：卡茲克，tashi

>/ 投稿或爆料，請(qǐng)聯(lián)系郵箱：wzglyay@virxact.com

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.