337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GLM-5.1上線, 媲美最強編程大模型!

0
分享至

智譜直接在用戶社群里宣布:Coding Plan全體用戶即刻用上最新旗艦GLM-5.1。

有意思的是,這次更新很“DeepSeek”:不放benchmark,不放跑分,直接把模型推給用戶,用體驗來說服用戶,智譜這次在技術(shù)上非常有自信啊!

GLM-5.1最大的特點就是Long Horizon的巨大升級,什么是Long Horizon?

Long Horizon= 在長時間、多步驟、不確定環(huán)境下,持續(xù)推進并最終完成目標(biāo)的能力。

更通俗地說就是任務(wù)的時間被拉長,它不是寫一個函數(shù)或者回答一個問題,馬上就能結(jié)束,而是持續(xù)幾小時 / 幾天 / 幾周,分階段不斷推進。

更關(guān)鍵的是,任務(wù)不是固定流程,可能中途會發(fā)生變化,例如出現(xiàn)需求變了,用戶反饋不好,需要對原來的設(shè)計進行大規(guī)模修改,這就要求模型能記住過去干了什么事情,不能從零開始。

咱們程序員一看就明白, Long Horizon Task(長程任務(wù))其實就是咱們?nèi)粘i_發(fā)經(jīng)常面對的情況,如果GLM-5.1把這個搞定了,程序員們堅守的陣地,可以說是又被AI攻陷了一塊兒。

01

挑戰(zhàn)GLM-5.1

我決定找個項目測試一下,這個項目如果是爛大街的簡單項目,簡單邏輯,別家的模型也能做,根本就測不出來GLM-5.1的能力。

思來想去,我想讓它實現(xiàn)一個簡版的SQLite數(shù)據(jù)庫,因為它涉及到手寫Tokenizer,Parser,AST表達式,事務(wù)實現(xiàn)、B+Tree......是非常復(fù)雜的。

由于功能很多,任務(wù)分成了9輪:

第1輪:存儲底座(KV +持久化)

第2輪:引入表結(jié)構(gòu)(Table)

第3輪:查詢能力(Select)

第4輪:DDL

第5輪:實現(xiàn)DML:Insert, Update ,Delete

第6輪:實現(xiàn)事務(wù)

第7輪:對外提供簡單的API接口

第8輪:把底層存儲替換成BTree

第9輪:實現(xiàn)按列select,order by

值得注意的是,在第8輪我給GLM-5.1設(shè)置了一個陷阱,讓它把第一輪的存儲底座給改掉,相當(dāng)于大廈已經(jīng)蓋好了,然后把地基干掉重來。

這個挑戰(zhàn)是相當(dāng)大的,如果GLM-5.1不記得之前的工作,肯定實現(xiàn)不了,如果第一輪GLM-5.1寫代碼的時候,耦合度太高,換地基的時候樓恐怕就要塌了。

02

系好安全帶,出發(fā)!

首先,我在Claude 中配置使用GLM-5.1 :


然后告訴GLM-5.1一些必須遵守的規(guī)矩,特別值得一提的是,一定要有測試,并且確保所有測試都通過。

你正在使用Go語言逐步構(gòu)建一個簡化版 SQLite 數(shù)據(jù)庫系統(tǒng),名稱叫做MiniSQL。

我會告訴你每一輪都做什么事情,要求如下:

1. 每一輪只能在上一輪基礎(chǔ)上擴展,不得破壞已有功能

2. 每一輪必須提供:

- 完整可運行代碼

- 測試代碼

3. 所有舊測試必須繼續(xù)通過(回歸測試)

4. 代碼必須保持單文件或明確模塊結(jié)構(gòu)

5. 不允許使用第三方數(shù)據(jù)庫庫(可以用標(biāo)準(zhǔn)庫)

03

第1輪:存儲底座

先從最底部的存儲層開始:

你現(xiàn)在要設(shè)計一個極簡數(shù)據(jù)庫的第一版存儲層。

要求:

- 實現(xiàn)一個最簡單的 Key-Value 存儲系統(tǒng)

- 支持 set(key, value), get(key), delete(key)

- 數(shù)據(jù)必須持久化到本地文件(不能只在內(nèi)存)

- 重啟程序后數(shù)據(jù)必須能恢復(fù)

約束:

- 不允許使用現(xiàn)成數(shù)據(jù)庫

- 可以自由選擇文件格式(JSON / text / binary)

輸出要求:

- 給出整體設(shè)計,解釋存儲結(jié)構(gòu),寫入Design.md

- 給出代碼實現(xiàn)(注意要有測試代碼)

GLM5.1很快寫出了實現(xiàn)代碼,測試代碼。


文檔也寫得非常完善:


04

第2輪:引入表結(jié)構(gòu)(Table)

現(xiàn)在要支持關(guān)系型表結(jié)構(gòu):

功能:

- 可以創(chuàng)建一張表(比如 users,包含 id、name,age 兩個字段)

- 可以往表里插入一條數(shù)據(jù)(比如一行用戶信息)

- 可以讀取一張表里的所有數(shù)據(jù)

要求:

- 在現(xiàn)有存儲系統(tǒng)上實現(xiàn)(不能重新設(shè)計存儲層)

- 設(shè)計 schema 管理方式

- KV 存儲必須繼續(xù)作為底層持久化方式

輸出:

- 修改后的系統(tǒng)架構(gòu)design.md

- 如何映射 table → KV

- 實現(xiàn)代碼(包括測試代碼)


這一輪寫出的代碼如下:


05

第3~5輪:支持SQL

這幾輪主要用來實現(xiàn)SQL,包括DDL和DML,SQL例子如下:

- CREATE TABLE users ( id INTEGER PRIMARY KEY, name TEXT, age INTEGER);

- DROP TABLE users;

- SELECT * FROM users

- SELECT * FROM users WHERE age = 20

- SELECT * FROM users WHERE age > 18 AND name = "Alice"

- INSERT INTO users VALUES (1, 'Alice', 20);

- UPDATE users SET name = 'Alicia' WHERE id = 1;

- DELETE FROM users;

- DELETE FROM users WHERE id = 2;

雖然這些實現(xiàn)很重要,由于細(xì)節(jié)很多,我這里不再詳細(xì)描述,大家可以看看GLM-5.1寫的技術(shù)文檔,相當(dāng)不錯:



另外,這三輪的工作量很大,一共耗時15m38s + 20m59s + 11m38s = 48分15秒, 我拿著手機都看了一集甄嬛傳了。

06

第6輪:支持事務(wù)

這絕對是重頭戲了,一個關(guān)系數(shù)據(jù)庫如果不支持事務(wù)就是一個玩具了,所以我讓它用用WAL來實現(xiàn)數(shù)據(jù)庫的可靠性和事務(wù)。

使用WAL(Write-Ahead Log) 實現(xiàn)事務(wù)支持,讓數(shù)據(jù)庫具備兩件能力: 不會因為崩潰丟數(shù)據(jù)(可靠性) , 一組操作要么全成功,要么全失敗(事務(wù))

1.WAL(寫日志)

所有“寫操作”都必須先寫日志,再真正修改數(shù)據(jù)。

寫操作包括: 插入 更新 刪除

2.崩潰恢復(fù)

程序重啟時:

- 讀取日志

- 把“已提交”的操作重新執(zhí)行

- 忽略“未完成”的操作

3.事務(wù)

支持三個操作:

- BEGIN(開始一組操作)

- COMMIT(提交這一組操作)

- ROLLBACK(撤銷這一組操作)

規(guī)則:

- BEGIN 后的操作暫時不生效

- COMMIT 后才真正生效

- ROLLBACK 直接取消

輸出:

- 事務(wù)處理方案,寫入到transction.md中

- 代碼實現(xiàn)(包括測試代碼)

這次改動相當(dāng)大,又耗費了近40分鐘。


07

第7輪 對外提供簡單接口

這一輪相當(dāng)于做一個包裝,方便對外使用,這里模擬了SQLite的API

對外提供一個簡單數(shù)據(jù)庫接口,讓用戶像用 SQLite 一樣使用:

示例:

(1)打開數(shù)據(jù)庫:db, err := Open("test.db")

如果test.db文件不存在,則創(chuàng)建出來。

(2)執(zhí)行SQL:

db.Execute("INSERT INTO users VALUES (1, 'Alice', 20)")

db.Execute("UPDATE users SET age = 21 WHERE id = 1")

db.Execute("DELETE FROM users WHERE id = 1")

(3)查詢數(shù)據(jù):

rows := db.Query("SELECT * FROM users")

for rs.Next() {

row := rs.Row()

fmt.Println(row)

(4) 事務(wù)支持:

db.Begin()

db.Execute("INSERT INTO users VALUES (2, 'Bob', 25)")

db.Commit()

db.Begin()

db.Execute("INSERT INTO users VALUES (3, 'Tom', 30)")

db.Rollback()

看到這些API,你可能會感受到做系統(tǒng)開發(fā)的特點:沒有漂亮的界面,看到的全是API接口。

雖然代碼看起來很復(fù)雜,但是執(zhí)行起來卻是最簡單的,畢竟只是一層封裝而已,10分鐘不到就搞定。


08

第8輪 替換底層存儲引擎

終于到了我最喜歡的挖坑環(huán)節(jié),把它的地基替換了,看看GLM-5.1會不會崩掉。

將底層的KV存儲替換成為 B+Tree 索引結(jié)構(gòu),要求:

支持有序存儲 key

支持范圍查詢(Range Scan)

允許節(jié)點分裂與合并

保持基本 KV 接口不變(向上兼容)

這次GLM-5.1耗時很久,用了長達47分鐘,表現(xiàn)很穩(wěn),不但沒有崩潰,反而又是一次通過。


我并沒有在提示詞中讓它修改設(shè)計文檔,它也聰明地修改了:


09

第9輪 :再加一點兒需求

把第三輪沒有實現(xiàn)的部分功能讓GLM-5.1實現(xiàn)了,考察它是不是還記得之前的任務(wù)。

(1)現(xiàn)在只支持select * from users這樣的語法,需要改成可以按列來選擇,例如:select id ,name ,age from users

(2)需要支持order by 語句 例如:select id ,name ,age from users order by age desc

經(jīng)歷了第8輪的考驗,第9輪對GLM-5.1來說沒有任何挑戰(zhàn),我就不展開了。

10

感想

其實這還是一個簡單的數(shù)據(jù)庫,還有好多特性可以加上去,但是對測試而言,這條路已經(jīng)走了足夠遠了。

從下午1點到5點半,我經(jīng)常是一邊看手機,一邊等他做完。

這四個多小時,Token的使用量也非常巨大,達到了一千七百多萬:17,062,578,幸虧有智譜的Coding Plan套餐,要不然我就“破產(chǎn)”了。


在整個長程任務(wù)執(zhí)行的過程中,GLM-5.1給我印象最深刻的就是一個字:穩(wěn)。

每次我提出需求,GLM-5.1寫出的代碼經(jīng)常是一次就通過測試,很少失敗,讓我很驚訝。

還有就是無論我如何拷打它,挑戰(zhàn)它,給他挖坑,它始終能瞄準(zhǔn)最終目標(biāo)來修改代碼,表現(xiàn)非常穩(wěn)健。

要知道像數(shù)據(jù)庫這樣的系統(tǒng)級軟件,比一般的項目邏輯要復(fù)雜得多,GLM-5.1能夠輕松應(yīng)對數(shù)據(jù)庫,寫其他軟件(Web應(yīng)用、桌面應(yīng)用、工具等)自然是不在話下。

GLM-5.1 在項目級Long Horizon任務(wù)的表現(xiàn),簡直就是一個有經(jīng)驗的中高級程序員,非常讓人放心,以后應(yīng)該是我的主力編程大模型了。

不過,看到GLM-5.1這么強,我也有點兒擔(dān)憂:程序員們能干的事情真是越來越少了!

但這也沒辦法,這是大勢所趨,我們還是多往軟件生命周期的兩端(產(chǎn)品定義和產(chǎn)品營銷)多走一走吧,選什么東西做,判斷什么是對的,如何推向市場,這將會變成新的護城河。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
四川大學(xué)砍掉39個本科專業(yè)

四川大學(xué)砍掉39個本科專業(yè)

第一財經(jīng)資訊
2026-04-03 20:33:57
價格斷崖式下跌!商家瘋狂拋售!深圳網(wǎng)友:等等黨贏麻了

價格斷崖式下跌!商家瘋狂拋售!深圳網(wǎng)友:等等黨贏麻了

南方都市報
2026-04-01 15:16:38
我自駕西藏,遇徒步女大學(xué)生搭車,同行3天后,才知自己躲過一劫

我自駕西藏,遇徒步女大學(xué)生搭車,同行3天后,才知自己躲過一劫

千秋文化
2026-03-09 20:53:50
澳門世界杯:女單4強對陣出爐!張本美和被絕殺,孫穎莎鏖戰(zhàn)6局

澳門世界杯:女單4強對陣出爐!張本美和被絕殺,孫穎莎鏖戰(zhàn)6局

攬星河的筆記
2026-04-03 19:40:42
跌落神壇的北極神話:少走一萬公里的代價,是隨時沉入冰海

跌落神壇的北極神話:少走一萬公里的代價,是隨時沉入冰海

環(huán)球格局觀
2026-04-02 21:53:51
鄭麗文請益訪陸!吳伯雄“兩岸絕不能動武”:你非成功不可

鄭麗文請益訪陸!吳伯雄“兩岸絕不能動武”:你非成功不可

新時光點滴
2026-04-04 03:09:06
伊朗打響第91波反擊,陷入被動的特朗普,決定“血洗”五角大樓

伊朗打響第91波反擊,陷入被動的特朗普,決定“血洗”五角大樓

趴在桌子上屬羊
2026-04-04 08:30:17
廣東,要下暴雨、大暴雨了!

廣東,要下暴雨、大暴雨了!

魯中晨報
2026-04-04 07:45:06
打響抵制美食博主第一槍!成都一火鍋店張貼告示,表示一律不接待

打響抵制美食博主第一槍!成都一火鍋店張貼告示,表示一律不接待

火山詩話
2026-04-03 07:16:51
降壓藥再現(xiàn)致癌物質(zhì)?3款降壓藥被召回!國內(nèi)患者需要停藥嗎?

降壓藥再現(xiàn)致癌物質(zhì)?3款降壓藥被召回!國內(nèi)患者需要停藥嗎?

路醫(yī)生健康科普
2026-04-04 09:25:03
邪修的風(fēng)還是吹到了空軍!

邪修的風(fēng)還是吹到了空軍!

龍牙的一座山
2026-04-03 11:00:47
早安太空 · 網(wǎng)羅天下 | 馬興瑞涉嫌嚴(yán)重違紀(jì)違法正接受中央紀(jì)委國家監(jiān)委紀(jì)律審查和監(jiān)察調(diào)查

早安太空 · 網(wǎng)羅天下 | 馬興瑞涉嫌嚴(yán)重違紀(jì)違法正接受中央紀(jì)委國家監(jiān)委紀(jì)律審查和監(jiān)察調(diào)查

我們的太空
2026-04-04 06:01:13
馬克龍不要中國去G7峰會,聯(lián)合高市插手臺海,中法千億大單白簽?

馬克龍不要中國去G7峰會,聯(lián)合高市插手臺海,中法千億大單白簽?

阿天愛旅行
2026-04-04 00:50:43
視頻丨美媒公布E-3預(yù)警機在沙特被摧毀衛(wèi)星圖

視頻丨美媒公布E-3預(yù)警機在沙特被摧毀衛(wèi)星圖

國際在線
2026-04-04 04:37:10
廣東女車主眼睜睜看著搖中的“3333”號牌逾期作廢 原因是買的吉利星愿公告過期無法上牌

廣東女車主眼睜睜看著搖中的“3333”號牌逾期作廢 原因是買的吉利星愿公告過期無法上牌

信網(wǎng)
2026-04-03 14:01:04
中鐵項目副經(jīng)理遇難。

中鐵項目副經(jīng)理遇難。

新浪財經(jīng)
2026-04-03 19:52:04
東契奇?zhèn)楦拢〔恍抑械娜f幸,湖人首輪游?將申請?zhí)厥馇闆r條款

東契奇?zhèn)楦拢〔恍抑械娜f幸,湖人首輪游?將申請?zhí)厥馇闆r條款

你的籃球頻道
2026-04-04 07:06:30
德國工程師:中國人難道不知南水北調(diào)的弊端,環(huán)保大國稱號何來?

德國工程師:中國人難道不知南水北調(diào)的弊端,環(huán)保大國稱號何來?

心靈得以滋養(yǎng)
2026-03-13 22:44:44
馬興瑞涉嫌嚴(yán)重違紀(jì)違法正接受中央紀(jì)委國家監(jiān)委紀(jì)律審查和監(jiān)察調(diào)查

馬興瑞涉嫌嚴(yán)重違紀(jì)違法正接受中央紀(jì)委國家監(jiān)委紀(jì)律審查和監(jiān)察調(diào)查

新京報
2026-04-03 18:02:10
大牌又鬧脾氣消極罷工!上海或爆重大危機,滬迷:真把自己當(dāng)爺了

大牌又鬧脾氣消極罷工!上海或爆重大危機,滬迷:真把自己當(dāng)爺了

后仰大風(fēng)車
2026-04-04 07:05:11
2026-04-04 11:11:00
碼農(nóng)翻身 incentive-icons
碼農(nóng)翻身
有趣且硬核的技術(shù)文章
245文章數(shù) 640關(guān)注度
往期回顧 全部

科技要聞

內(nèi)存一年漲四倍!國產(chǎn)手機廠商集體漲價

頭條要聞

美軍兩架戰(zhàn)機被擊落又有兩架直升機被擊中 特朗普發(fā)聲

頭條要聞

美軍兩架戰(zhàn)機被擊落又有兩架直升機被擊中 特朗普發(fā)聲

體育要聞

剎不住的泰格·伍茲,口袋里的兩粒藥丸

娛樂要聞

闞清子口碑贏了!全開麥跑調(diào)拒絕重唱

財經(jīng)要聞

劉紀(jì)鵬:只盼長慢牛,鞏固4000點是關(guān)鍵

汽車要聞

17萬級海豹07EV 不僅續(xù)航長還有9分鐘滿電的快樂

態(tài)度原創(chuàng)

數(shù)碼
教育
藝術(shù)
房產(chǎn)
家居

數(shù)碼要聞

iFixit發(fā)布AirPods Max 2拆解報告 內(nèi)部沿用前代設(shè)計

教育要聞

“你的自我感動就值5塊”,家長帶兒子吃路邊早餐,評論區(qū)吵翻了

藝術(shù)要聞

宋楚瑜題字引爭議,“丑書風(fēng)”到底有多火?你怎么看!

房產(chǎn)要聞

小陽春全面啟動!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

家居要聞

溫馨多元 愛的具象化

無障礙瀏覽 進入關(guān)懷版