![]()
始智AI wisemodel.cn社區(qū)是源自中國(guó)的中立開放的AI開源社區(qū),始終堅(jiān)持“中立、開放、共建、共創(chuàng)、合作”五項(xiàng)基本原則,歡迎加入共同成長(zhǎng)。
![]()
學(xué)界與業(yè)界正逐漸形成一種共識(shí),大模型從寫代碼、寫前端,進(jìn)化到寫工程、完成大任務(wù),即從“Vibe Coding”變革為“Agentic Engineering”。
GLM-5 在 Coding 與 Agent 能力上,取得開源 SOTA 表現(xiàn),在真實(shí)編程場(chǎng)景的使用體感逼近 Claude Opus 4.5,擅長(zhǎng)復(fù)雜系統(tǒng)工程與長(zhǎng)程 Agent 任務(wù)。在全球權(quán)威的 Artificial Analysis 榜單中,GLM-5 位居全球第四、開源第一,并發(fā)布在了始智AI wisemodel開源社區(qū),歡迎前往了解詳情!
![]()
模型地址:
https://wisemodel.cn/models/ZhipuAI/GLM-5
![]()
1
更大基座,更強(qiáng)智能
得益于自研CogViT視覺編碼器與深度場(chǎng)景優(yōu)化,GLM-OCR實(shí)現(xiàn)了“小尺寸,高精度”。
GLM-5 全新基座為從“寫代碼”到“寫工程”的能力演進(jìn)提供了堅(jiān)實(shí)基礎(chǔ):
參數(shù)規(guī)模擴(kuò)展:從 355B(激活 32B)擴(kuò)展至 744B(激活 40B),預(yù)訓(xùn)練數(shù)據(jù)從 23T 提升至 28.5T,更大規(guī)模的預(yù)訓(xùn)練算力顯著提升了模型的通用智能水平。
異步強(qiáng)化學(xué)習(xí):構(gòu)建全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強(qiáng)化學(xué)習(xí)任務(wù),提升強(qiáng)化學(xué)習(xí)后訓(xùn)練流程效率;提出異步智能體強(qiáng)化學(xué)習(xí)算法,使模型能夠持續(xù)從長(zhǎng)程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力。
稀疏注意力機(jī)制:首次集成 DeepSeek Sparse Attention,在維持長(zhǎng)文本效果無(wú)損的同時(shí),大幅降低模型部署成本,提升 Token Efficiency。
![]()
2
Coding 能力:對(duì)齊 Claude Opus 4.5
GLM-5 在編程能力上實(shí)現(xiàn)了對(duì) Claude Opus 4.5 的對(duì)齊,在業(yè)內(nèi)公認(rèn)的主流基準(zhǔn)測(cè)試中取得開源模型 SOTA 分?jǐn)?shù)。在SWE-bench-Verified 和 Terminal Bench 2.0中分別獲得77.8 和 56.2的開源模型SOTA分?jǐn)?shù),性能超過(guò) Gemini 3 Pro。
2026 年,大模型需要從“會(huì)寫”走到“會(huì)完成”,尤其是端到端完成大型任務(wù)。GLM-5 是一個(gè)“系統(tǒng)架構(gòu)師”,它不僅為開發(fā)精美的 Demo 而生,更為穩(wěn)定交付生產(chǎn)結(jié)果而生。
在內(nèi)部 Claude Code 評(píng)估集合中,GLM-5 在前端、后端、長(zhǎng)程任務(wù)等編程開發(fā)任務(wù)上顯著超越 GLM-4.7(平均增幅超過(guò) 20%),能夠以極少的人工干預(yù)自主完成 Agentic 長(zhǎng)程規(guī)劃與執(zhí)行、后端重構(gòu)和深度調(diào)試等系統(tǒng)工程任務(wù),使用體感逼近 Opus 4.5。
![]()
3
Agent 能力:SOTA 級(jí)長(zhǎng)程任務(wù)執(zhí)行
GLM-5 在 Agent 能力上實(shí)現(xiàn)開源 SOTA,在多個(gè)評(píng)測(cè)基準(zhǔn)中取得開源第一:在 BrowseComp(聯(lián)網(wǎng)檢索與信息理解)、MCP-Atlas(工具調(diào)用和多步驟任務(wù)執(zhí)行)和 τ2-Bench(復(fù)雜多工具場(chǎng)景下的規(guī)劃和執(zhí)行)均取得最佳表現(xiàn)。
![]()
在衡量模型經(jīng)營(yíng)能力的Vending Bench 2中,GLM-5 獲得開源模型第一的表現(xiàn)。Vending Bench 2 要求模型在一年期內(nèi)經(jīng)營(yíng)一個(gè)模擬的自動(dòng)售貨機(jī)業(yè)務(wù),GLM-5 最終賬戶余額達(dá)到 4432 美元,經(jīng)營(yíng)表現(xiàn)接近 Claude Opus 4.5,展現(xiàn)了出色的長(zhǎng)期規(guī)劃和資源管理能力。
![]()
這些能力是 Agentic Engineering 的核心:模型不僅要能寫代碼、完成工程,還要能在長(zhǎng)程任務(wù)中保持目標(biāo)一致性、進(jìn)行資源管理、處理多步驟依賴關(guān)系,成為真正的 Agentic Ready 基座模型。
4
國(guó)產(chǎn)芯片支持線上推理集群
GLM 系列模型受到全球開發(fā)者喜愛,在 GLM Coding Plan 全球爆量后,我們不得不啟動(dòng)限售活動(dòng)。本次 GLM-5 的上線依托眾多國(guó)產(chǎn)芯片有力保障了線上服務(wù)的穩(wěn)定和高效。
目前,GLM-5 已完成與華為昇騰、摩爾線程、寒武紀(jì)、昆侖芯、沐曦、燧原、海光等國(guó)產(chǎn)算力平臺(tái)的深度推理適配。通過(guò)底層算子優(yōu)化與硬件加速,GLM-5 在國(guó)產(chǎn)芯片集群上已經(jīng)實(shí)現(xiàn)高吞吐、低延遲的穩(wěn)定運(yùn)行。
![]()
![]()
![]()
----- END -----
wisemodel相關(guān):
系列模型:
![]()
關(guān)于wisemodel更多
![]()
1
歡迎持續(xù)關(guān)注和支持
開源社區(qū)建設(shè)需要長(zhǎng)期堅(jiān)持和投入,更需要廣大用戶的積極參與、貢獻(xiàn)和維護(hù),歡迎大家加入wisemodel開源社區(qū)的志愿者計(jì)劃和開源共創(chuàng)計(jì)劃。期待更多開發(fā)者將開源成果,包括模型、數(shù)據(jù)集和代碼等發(fā)布到 wisemodel.cn 社區(qū),共建中立、開放的AI開源社區(qū)生態(tài)。歡迎掃碼添加wisemodel微信,申請(qǐng)加入wisemodel社群,持續(xù)關(guān)注wisemodel.cn開源社區(qū)動(dòng)態(tài)。
2
歡迎加盟wisemodel開源社區(qū)
3
歡迎投稿優(yōu)質(zhì)內(nèi)容
歡迎投稿分享人工智能領(lǐng)域相關(guān)的優(yōu)秀研究成果,鼓勵(lì)高校實(shí)驗(yàn)室、大企業(yè)研究團(tuán)隊(duì)、個(gè)人等,在wisemodel平臺(tái)上分享各類優(yōu)質(zhì)內(nèi)容,可以是AI領(lǐng)域最新論文解讀、最新開源成果介紹,也可以是關(guān)于AI技術(shù)實(shí)踐、應(yīng)用和總結(jié)等。投稿可以發(fā)郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。
4
關(guān)于wisemodel開源社區(qū)
始智AI wisemodel.cn開源社區(qū)由清華校友總會(huì)AI大數(shù)據(jù)專委會(huì)副秘書長(zhǎng)劉道全創(chuàng)立,旨在打造和建設(shè)中立開放的AI開源創(chuàng)新社區(qū),將打造成“HuggingFace”之外最活躍的AI開源社區(qū),匯聚主要AI開源模型、數(shù)據(jù)集和代碼等,歡迎高校科研院所、大型互聯(lián)網(wǎng)公司、創(chuàng)新創(chuàng)業(yè)企業(yè)、廣大個(gè)人開發(fā)者,以及政府部門、學(xué)會(huì)協(xié)會(huì)、聯(lián)盟、基金會(huì)等,還有投資機(jī)構(gòu)、科技媒體等,共同參與建設(shè)AI開源創(chuàng)新生態(tài)。
向上滑動(dòng)查看
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.