![]()
作者 | Sergio De Simone
譯者 | 張衛(wèi)濱
谷歌研究院通過對 180 種智能體配置進(jìn)行對照評估,試圖解答如何設(shè)計智能體系統(tǒng)以實(shí)現(xiàn)最優(yōu)性能的問題。研究團(tuán)隊由此得出了他們所稱的“AI 智能體系統(tǒng)首批定量擴(kuò)展原則”,結(jié)果表明,多智能體協(xié)同并不能穩(wěn)定提升效果,甚至可能降低性能。
研究作者稱,該研究對多個普遍認(rèn)可的觀點(diǎn)提出了挑戰(zhàn):
從業(yè)者往往依賴經(jīng)驗法則,例如,默認(rèn) “智能體越多越好”,認(rèn)為增加專用智能體會持續(xù)提升效果。
而他們認(rèn)為,這種優(yōu)勢僅適用于特定類型的任務(wù),因為增加更多智能體通常會觸及性能天花板,在某些情況下甚至?xí)p害性能。
該研究評估了五種架構(gòu),包括單智能體、獨(dú)立多智能體、集中調(diào)度、點(diǎn)對點(diǎn)以及混合系統(tǒng),他們發(fā)現(xiàn),可并行化任務(wù)(即工作可拆分為獨(dú)立的模塊)能從多智能體協(xié)同中顯著獲益。例如:
在金融推理等可并行化的任務(wù)中,集中式協(xié)同相比單智能體性能提升 80.9%。
反之,在 PlanCraft 這類順序推理的任務(wù)中,引入多智能體往往會導(dǎo)致效果變差:
我們測試的所有多智能體變體性能均下降 39%–70%。在這類場景下,通信開銷會割裂推理過程,導(dǎo)致實(shí)際任務(wù)沒有足夠的“認(rèn)知預(yù)算”。
該研究還指出了工具使用的瓶頸,也就是當(dāng)任務(wù)需要更多工具調(diào)用(如 API、網(wǎng)頁操作及其他外部資源)時,協(xié)同成本會上升。這些成本可能超過多智能體系統(tǒng)帶來的收益,并成為決定是否采用多智能體架構(gòu)的關(guān)鍵因素。
另一項值得注意的發(fā)現(xiàn)是,如果錯誤沒有被有約束地傳播,獨(dú)立智能體可能將錯誤放大約 17 倍。相比之下,集中式協(xié)同可將錯誤傳播限制在約 4.4 倍,因為調(diào)度器會在傳遞結(jié)果前對其進(jìn)行校驗和管理。
最后,研究人員還開發(fā)了一個預(yù)測模型,用于選擇合適的架構(gòu):
開發(fā)者無需猜測是使用集群智能體還是單個強(qiáng)大模型,而是可以根據(jù)任務(wù)特性做出有理論依據(jù)的工程決策,尤其是其順序依賴關(guān)系與工具密集度。
該模型對約 87% 的未見過的任務(wù)配置能正確識別最優(yōu)方案,決定系數(shù)(R2)達(dá)到了 0.513。
在 Hacker News 上針對谷歌這項研究的討論中,zkmon認(rèn)為該研究缺乏堅實(shí)的理論基礎(chǔ),沒有清晰解釋為何某些架構(gòu)會產(chǎn)生觀測到的差異。同樣,gopalv指出,雖然單智能體系統(tǒng)可能對錯誤不具備健壯性,但引入?yún)f(xié)調(diào)器未必是合適的解決方案:
我們發(fā)現(xiàn)調(diào)度器并非核心組件,核心是為每個動作配備專用評估器,在執(zhí)行結(jié)束時將結(jié)果、目標(biāo)與方法進(jìn)行匹配,并向調(diào)度器反饋目標(biāo)達(dá)成情況。
kioku則指出,通過使用協(xié)調(diào)器獲得的 8% 性能提升,可能不足以證明引入?yún)f(xié)同層所增加的復(fù)雜度與成本是合理的。
查看英文原文:
Google Explores Scaling Principles for Multi-agent Coordination(https://www.infoq.com/news/2026/02/google-agent-scaling-principles/)
聲明:本文由 InfoQ 翻譯,未經(jīng)許可禁止轉(zhuǎn)載。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.