谷歌研究院探索多智能體協(xié)調(diào)的擴(kuò)展原則

2026-03-10 13:34:47　來源: InfoQ

北京舉報

分享至

作者 | Sergio De Simone

譯者 | 張衛(wèi)濱

谷歌研究院通過對 180 種智能體配置進(jìn)行對照評估，試圖解答如何設(shè)計智能體系統(tǒng)以實(shí)現(xiàn)最優(yōu)性能的問題。研究團(tuán)隊由此得出了他們所稱的“AI 智能體系統(tǒng)首批定量擴(kuò)展原則”，結(jié)果表明，多智能體協(xié)同并不能穩(wěn)定提升效果，甚至可能降低性能。

研究作者稱，該研究對多個普遍認(rèn)可的觀點(diǎn)提出了挑戰(zhàn)：

從業(yè)者往往依賴經(jīng)驗法則，例如，默認(rèn) “智能體越多越好”，認(rèn)為增加專用智能體會持續(xù)提升效果。

而他們認(rèn)為，這種優(yōu)勢僅適用于特定類型的任務(wù)，因為增加更多智能體通常會觸及性能天花板，在某些情況下甚至?xí)p害性能。

該研究評估了五種架構(gòu)，包括單智能體、獨(dú)立多智能體、集中調(diào)度、點(diǎn)對點(diǎn)以及混合系統(tǒng)，他們發(fā)現(xiàn)，可并行化任務(wù)（即工作可拆分為獨(dú)立的模塊）能從多智能體協(xié)同中顯著獲益。例如：

在金融推理等可并行化的任務(wù)中，集中式協(xié)同相比單智能體性能提升 80.9%。

反之，在 PlanCraft 這類順序推理的任務(wù)中，引入多智能體往往會導(dǎo)致效果變差：

我們測試的所有多智能體變體性能均下降 39%–70%。在這類場景下，通信開銷會割裂推理過程，導(dǎo)致實(shí)際任務(wù)沒有足夠的“認(rèn)知預(yù)算”。

該研究還指出了工具使用的瓶頸，也就是當(dāng)任務(wù)需要更多工具調(diào)用（如 API、網(wǎng)頁操作及其他外部資源）時，協(xié)同成本會上升。這些成本可能超過多智能體系統(tǒng)帶來的收益，并成為決定是否采用多智能體架構(gòu)的關(guān)鍵因素。

另一項值得注意的發(fā)現(xiàn)是，如果錯誤沒有被有約束地傳播，獨(dú)立智能體可能將錯誤放大約 17 倍。相比之下，集中式協(xié)同可將錯誤傳播限制在約 4.4 倍，因為調(diào)度器會在傳遞結(jié)果前對其進(jìn)行校驗和管理。

最后，研究人員還開發(fā)了一個預(yù)測模型，用于選擇合適的架構(gòu)：

開發(fā)者無需猜測是使用集群智能體還是單個強(qiáng)大模型，而是可以根據(jù)任務(wù)特性做出有理論依據(jù)的工程決策，尤其是其順序依賴關(guān)系與工具密集度。

該模型對約 87% 的未見過的任務(wù)配置能正確識別最優(yōu)方案，決定系數(shù)（R2）達(dá)到了 0.513。

在 Hacker News 上針對谷歌這項研究的討論中，zkmon認(rèn)為該研究缺乏堅實(shí)的理論基礎(chǔ)，沒有清晰解釋為何某些架構(gòu)會產(chǎn)生觀測到的差異。同樣，gopalv指出，雖然單智能體系統(tǒng)可能對錯誤不具備健壯性，但引入?yún)f(xié)調(diào)器未必是合適的解決方案：

我們發(fā)現(xiàn)調(diào)度器并非核心組件，核心是為每個動作配備專用評估器，在執(zhí)行結(jié)束時將結(jié)果、目標(biāo)與方法進(jìn)行匹配，并向調(diào)度器反饋目標(biāo)達(dá)成情況。

kioku則指出，通過使用協(xié)調(diào)器獲得的 8% 性能提升，可能不足以證明引入?yún)f(xié)同層所增加的復(fù)雜度與成本是合理的。

查看英文原文：

Google Explores Scaling Principles for Multi-agent Coordination（https://www.infoq.com/news/2026/02/google-agent-scaling-principles/）

聲明：本文由 InfoQ 翻譯，未經(jīng)許可禁止轉(zhuǎn)載。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.