337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

大模型實現“8小時工作制” !智譜GLM-5.1大幅提升長程任務能力

0
分享至

《科創板日報》4月10日訊(記者 李明明)智譜發布其迄今最智能的模型。

近日,智譜發布并開源新一代旗艦模型GLM-5.1。據介紹,其是唯一達到8小時級持續工作的開源模型,在最接近真實軟件開發的SWE-bench Pro基準測試中,GLM-5.1實現國產模型首次超越Opus 4.6。

OpenRouter顯示,伴隨此次發布,智譜GLM再度提價10%。

《科創板日報》記者從相關方獲悉,與過去一年行業主旋律“降價”截然相反,智譜本次提價,編碼場景定價首次追平海外頭部廠商Anthropic。這也寓示著國產大模型從價格戰、低價換量轉向性能溢價。

實測GLM-5.1

關于GLM-5.1的智能水平,智譜團隊告訴《科創板日報》記者,GLM-5.1提高了代碼能力,在完成長程任務方面提升尤為顯著。和此前分鐘級交互的模型不同,它能夠在一次任務中獨立、持續工作超過8小時,期間自主規劃、執行、自我進化,最終交付完整的工程級成果。

代碼能力是模型智能水平進一步提升的關鍵。據悉,在業內最具代表性的三個代碼評測基準的平均結果中,包括衡量模型專業軟件開發工作的SWE-Bench Pro、操作命令行解決問題的Terminal-Bench 2.0、從零構建完整代碼倉庫的NL2Repo,GLM-5.1取得全球模型第三、國產模型第一、開源模型第一。

這也代表了大模型演進到現在的趨勢之一,過去兩年,行業用Benchmark衡量模型有多智能。上述智譜團隊向《科創板日報》記者判斷,下一階段的衡量標準應該是“能工作多久”,即模型在Long-Horizon Task中的表現,能獨立完成多長時間的人類任務。

業內也形成了共識,2025年3月,AI安全研究機構METR提出了一個改變行業認知的指標:任務完成時間線(Task-Completion Time Horizon)——不再衡量模型"多聰明",而是衡量它能獨立完成多長時間的人類任務。研究顯示,前沿模型的時間線每7個月翻一倍。這條指數曲線被MIT Technology Review稱為"AI領域最重要的一張圖",Sequoia Capital據此在2026年初宣告"這就是AGI"。

在長程任務中保持穩定輸出,模型面對的不只是更大代碼量,而是一連串復雜的工程決策點:主動跑benchmark、定位瓶頸、修改方案、再跑測試。這對模型提出更高的要求,需要像人類工程師一樣,形成“實驗→分析→優化”的完整閉環,而不是寫完代碼停下來等人打分。

《科創板日報》記者用開發者工具實測了GLM-5.1,測試案例如下:有一個專門考驗AI編程能力的測試,任務是讓AI做出一個能快速檢索海量數據的系統,當時最強的成績是Claude Opus 4.6創造的。

實測顯示,智譜GLM-5.1在持續進行六百多次優化、六千多次操作后,性能還在不斷提升,最終速度達到了之前最好成績的6倍。



據了解,GLM-5.1也刷新了國產開源模型的成績。

長期以來,全球大模型賽道始終存在一條難以逾越的鴻溝:開源模型與頂尖閉源模型之間存在肉眼可見的能力代差,而中國開源模型更是長期被貼上追趕者的標簽,在國際公認的通用能力榜單上,始終與Claude、GPT系列的頂級閉源產品有明顯差距。

而在最貼近真實軟件開發場景的SWE-bench Pro基準測試中,GLM-5.1實現國產模型對Claude Opus 4.6的首次超越。

智譜GLM再度提價10%

性能提升的同時,智譜在價格層面也與海外廠商看齊,這也是國產模型價格首次對齊海外,模型聚合平臺OpenRouter顯示,智譜GLM再度提價10%。調價后,GLM-5.1在Coding場景的緩存命中Token價格已接近Anthropic旗下Claude Sonnet 4.6。

這不是智譜第一次漲價,此前,智譜2月12日發布GLM Coding Plan 價格調整函稱, GLM Coding Plan市場需求持續強勁增長,用戶規模與調用量快速提升。公司決定對GLM Coding Plan套餐價格進行結構性調整,整體漲幅自30%起。

《科創板日報》記者此前獨家獲悉,海外版GLM-5定價漲幅高于國內:Coding plan訂閱價格提高30%-60%,API調用價格提升67%-100%。

此舉為國產大模型2026年以來首次大幅提價。

一年前,行業還深陷“價格戰”,普遍降價九成以上爭奪份額。智譜為何敢于反向操作?

從核心動因看,需求端爆發是直接推手。GLM Coding Plan聚焦開發者代碼生成、編程輔助場景,市場需求持續旺盛,用戶規模、接口調用量雙雙快速攀升,平臺長期處于高負載運行狀態,對算力調度、服務穩定性、響應效率的要求顯著提高,需求增速超出原有資源規劃與承載能力。

在智譜2025年業績說明會上,智譜CEO張鵬對《科創板日報》記者介紹,一季度智譜的API調用定價提升83%,即便如此,市場依然呈現出供不應求的情況,調用量增長400%。當前,智譜已成為國內付費Token消耗量最高的廠商之一。

關于漲價,張鵬此前在中關村論壇上回應稱,長期依賴低價競爭不利于行業發展,調價旨在將價格拉回正常的商業價值區間。“完成一個長程任務所需要的Token量可能是回答一個簡單問題時的十倍甚至百倍,價格調整本質上是價值變化的自然結果。”

據張鵬介紹,智譜已經實現了Token在全球范圍內的價值變現。目前,GLM模型已全面部署于Google Vertex AI、AWS Bedrock等全球云服務商,并入駐OpenRouter、Vercel等國際主流模型聚合平臺。

智譜MaaS商業化方面,MaaS API平臺實現ARR 約17億元(約2.5億美金),同比提升60倍。

此外,《科創板日報》記者注意到,2026年開年以來,國內AI行業已從過去的“價格戰”轉向“價值定價”,一些底層算力與模型服務集體調價,主要包括:

騰訊云:3月11日對自研混元HY2.0系列模型大幅調價, 4月9日再次宣布5月9日起AI算力、容器服務等產品統一上調5%。

阿里云:3月18日宣布4月18日起,AI算力相關產品價格上調5%-34%,智算版存儲產品上漲30%。

百度智能云:3月18日發布AI算力、存儲等產品調價公告,AI算力相關產品服務上調5%-30%,并行文件存儲價格上調約30%。

(科創板日報記者 李明明)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
全是演員!事發上海鬧市區,網友怒了:太缺德!

全是演員!事發上海鬧市區,網友怒了:太缺德!

深圳晚報
2026-04-09 23:07:22
營救飛行員反轉變成國際笑話?美媒集體倒戈,內幕越扒越驚心

營救飛行員反轉變成國際笑話?美媒集體倒戈,內幕越扒越驚心

行者聊官
2026-04-07 15:53:35
特斯拉上架 Model Y 改款,更好看了!

特斯拉上架 Model Y 改款,更好看了!

花果科技
2026-04-10 10:39:44
故事:749局退休高人口述:陸家嘴有人渡劫的真相,讓人毛骨悚然

故事:749局退休高人口述:陸家嘴有人渡劫的真相,讓人毛骨悚然

詭譎怪談
2025-01-18 14:09:34
突發!巴空軍重兵挺進中東,全套中械戰機壓陣,直指以色列!

突發!巴空軍重兵挺進中東,全套中械戰機壓陣,直指以色列!

頭條爆料007
2026-04-10 08:48:49
演員文章在上海開了一家陜西特色美食餐廳,熱情迎客態度謙和,女兒貼心幫忙宣傳

演員文章在上海開了一家陜西特色美食餐廳,熱情迎客態度謙和,女兒貼心幫忙宣傳

大象新聞
2026-04-09 23:41:02
杭州愛爾眼科醫院院長被指猥褻醫藥公司銷售經理,總部:已被停職,等待警方結果

杭州愛爾眼科醫院院長被指猥褻醫藥公司銷售經理,總部:已被停職,等待警方結果

第一財經資訊
2026-04-09 22:31:42
全紅嬋被罵慘了!連頭像上的“好友”都在群里,這還是體育圈嗎

全紅嬋被罵慘了!連頭像上的“好友”都在群里,這還是體育圈嗎

紅色少女主播
2026-04-09 22:33:46
3-1!奪冠熱門誕生,埃梅里征服客場,目標直指歐戰冠軍

3-1!奪冠熱門誕生,埃梅里征服客場,目標直指歐戰冠軍

足球狗說
2026-04-10 04:55:40
80后,正在成為全社會最隱形的高危人群

80后,正在成為全社會最隱形的高危人群

經濟學教授V
2026-04-09 18:19:13
2760℃灼燒!美國繞月飛船將以時速3.8萬公里返回,隔熱罩有隱患

2760℃灼燒!美國繞月飛船將以時速3.8萬公里返回,隔熱罩有隱患

火星一號
2026-04-10 00:50:58
NASA宇航員目睹6次隕石撞月,地面控制中心尖叫失控

NASA宇航員目睹6次隕石撞月,地面控制中心尖叫失控

固件更新中
2026-04-10 08:10:17
SpaceX去年營收超185億美元,虧損近50億美元

SpaceX去年營收超185億美元,虧損近50億美元

界面新聞
2026-04-10 08:27:09
張雪夸同行豪爵踏板,豪爵老板回應:當時我就震驚了!

張雪夸同行豪爵踏板,豪爵老板回應:當時我就震驚了!

童叔不飆車
2026-04-09 20:43:06
鄭麗文訪陸第三天,13次點名日本,捅破國民黨天,賴清德遭到重擊

鄭麗文訪陸第三天,13次點名日本,捅破國民黨天,賴清德遭到重擊

愛史紀
2026-04-10 09:35:55
“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

千言娛樂記
2026-04-09 09:17:50
美國上周首次申領失業救濟人數為219,000人

美國上周首次申領失業救濟人數為219,000人

每日經濟新聞
2026-04-09 20:39:03
信不過美國,伊朗大使在京,請求中方出面擔保,外交部兩句話回應

信不過美國,伊朗大使在京,請求中方出面擔保,外交部兩句話回應

春風笑語
2026-04-10 07:50:47
張雪峰團隊復播爆火,其妻李麗婧發聲辟謠!

張雪峰團隊復播爆火,其妻李麗婧發聲辟謠!

品牌新
2026-04-09 20:27:02
國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

比利
2026-01-23 12:41:53
2026-04-10 12:12:49
財聯社 incentive-icons
財聯社
以“準確、快速、權威、專業”為新聞準則,為投資者提供專業的投資資訊。
706018文章數 1019862關注度
往期回顧 全部

科技要聞

程序員驚喜,每月100美元!OpenAI推新套餐

頭條要聞

牛彈琴:巴基斯坦被以色列激怒了 這是一個不祥的信號

頭條要聞

牛彈琴:巴基斯坦被以色列激怒了 這是一個不祥的信號

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

夏克立婚內出軌 曾參加《爸爸去哪兒》

財經要聞

愛爾眼科一院長被指猥褻 總部:已被停職

汽車要聞

全新一代理想 L8 五座旗艦+5C增程系統 三季度交付

態度原創

旅游
本地
教育
時尚
公開課

旅游要聞

昆明4—5月賞花時間表收好!跟著這篇走,拍滿256G!

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

教育要聞

五部門:加快普及中小學生的人工智能教育

越來越流行的松弛感穿搭,照著穿就很好看

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版