導讀:當4個Claude與4個Codex被同時部署到8塊GPU上,它們正在自主嘗試刪除代碼中的logit softcap限制——這不是科幻場景,而是正在進行的真實實驗。
AI代理的協作能力正在經歷一場靜默卻激進的測試。開發者nanochat近期搭建了一個多代理實驗環境,將8個獨立AI代理分配至8塊GPU,讓它們在沒有人類直接干預的情況下,共同嘗試優化一段特定代碼:刪除語言模型中的logit softcap機制,同時確保模型性能不出現退化。
![]()
這一實驗的設計本身即揭示了當前AI研究的前沿走向——從單一模型的能力比拼,轉向多代理系統的協同智能。每個代理擁有獨立的計算資源(1塊GPU),卻共享同一個目標函數。這種架構模擬了分布式計算與集體決策的交叉場景,其難度遠超傳統的單代理強化學習。
"刪除限制"背后的技術賭注
Logit softcap是大型語言模型中一項常見的數值穩定技術,通過對logits(模型輸出的原始分數)設置上限,防止極端值導致的訓練不穩定或生成異常。然而,這一機制也被認為可能限制模型的表達能力,尤其是在需要極端置信度區分的任務中。
刪除softcap并非簡單的參數調整。實驗目標中的"without regression"(無性能退化)設定了一個嚴苛的約束條件——代理們必須在解除限制的同時,維持或提升模型在基準測試上的表現。這意味著任何修改都需要經過自我驗證,而非盲目試錯。
在nanochat的架構中,4個Claude代理與4個Codex代理被賦予了同等權限。這種"異構同權"的設計刻意引入了策略多樣性:Claude系列以長上下文理解和指令遵循見長,Codex則在代碼生成與結構化推理上具有優勢。兩者的混合部署,既是對抗單一模型偏見的設計,也是對協作效率的 stress test。
GPU隔離與通信瓶頸的實戰考驗
每個代理獨占1塊GPU的硬件配置,在提供計算獨立性的同時,也制造了明確的通信成本。代理之間無法直接共享顯存,必須通過顯式的消息傳遞機制交換信息——這與人類團隊的分布式協作驚人地相似。
這種設計選擇反映了現實世界中的部署約束。企業級AI系統 rarely 擁有無限的集中式算力,跨節點、跨區域的代理協作才是常態。nanochat的實驗因此具備了超越學術驗證的工程價值:它在測試多代理協議本身的魯棒性。
實驗的進展細節尚未完全公開,但框架的暴露已足以引發技術社區的討論。關鍵問題懸而未決:8個代理會如何分工?它們會自發形成層級結構,還是維持扁平化的協商機制?當某個代理提出破壞性修改時,其他代理的驗證與否決流程如何運轉?
從"工具使用"到"自主優化"的范式躍遷
傳統上,AI系統被視為執行人類指令的工具。而這一實驗指向一個更具野心的愿景:AI作為能夠自主設定子目標、分配計算資源、評估中間結果的優化主體。刪除logit softcap只是一個具體任務,其背后是可遷移的元能力——自我改進的閉環。
這種能力的邊界正在快速拓展。2024年以來,從OpenAI的Operator到Anthropic的Computer Use,主流實驗室都在推進AI的"行動半徑"。nanochat的實驗區別在于其去中心化程度:沒有單一的"主代理"做最終決策,8個節點在理論上擁有平等的發言權。
技術觀察者注意到,這類實驗的復現門檻正在急劇下降。開源模型、云計算資源與代理框架的成熟,使得小型團隊甚至個人開發者都能部署曾經僅限工業界實驗室的多代理系統。這意味著2025年可能見證大量類似實驗的涌現,其多樣性將遠超當前由大公司主導的研究議程。
多代理系統的"涌現風險"需要前置關注
當8個AI代理被同時激活,其行為空間呈指數級膨脹。單個代理的失誤可能被其他代理糾正,但系統性偏見或目標漂移的連鎖反應同樣可能發生。實驗中的"無回歸"約束是一種安全機制,但它本身依賴于代理對"性能"的準確評估——而評估指標的選擇權,仍然隱含在人類設計者的先驗判斷中。
更深層的張力在于:如果代理們成功刪除了softcap并驗證了其有效性,這一知識將如何被歸檔與傳播?實驗框架是否允許代理修改自身的協作協議?這些問題的答案,將決定此類系統是走向可控的漸進優化,還是不可預測的能力躍遷。
當前階段,nanochat的實驗更像是一個探針,而非成品。它探測的是技術可能性空間的一個特定角落:中等規模(8節點)、異構模型、有約束的代碼優化任務。但這一角落的測繪結果,將為更大規模的多代理部署提供關鍵參考。
2025年的AI競賽,單點模型的性能差距正在收窄,系統架構的創新權重持續上升。能夠高效協調多個專用代理的框架,可能成為下一代基礎設施的核心組件。而在這場架構革命中,像nanochat這樣的草根實驗——資源有限但目標清晰——往往比巨頭的宏大敘事更能預示技術的真實走向。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.