AI范兒 · 今日速評
這一周的 AI 圈,劇情密度拉滿了。
上周二(3月31日),Claude Code 51 萬行源碼意外泄漏。周六(4月4日),Anthropic 正式封殺小龍蝦的訂閱接入。
今天,小龍蝦放出了 2026.4.5 版本,社區公認今年至今最大的一次更新。
記憶管理混亂和 token 消耗太高,一直是社區里被吐槽最多的兩個問題。特別是后面一個也是 Claude 封殺小龍蝦的核心原因之一。
這次更新,小龍蝦終于下定決心從這兩個痛點直接下手。
![]()
官方推文最后甩了一句話,三個短句,沒有抱怨、沒有控訴、沒有回頭看,只有一個態度:往前走。
Anthropic cut us off. GPT-5.4 got better. We moved on.
Anthropic 把我們切了。GPT-5.4 變強了。我們往前走了。
01小龍蝦學會"做夢"了。
聽起來很玄,但這可能是小龍蝦迄今為止最重要的一次進化。
先說說原來的記憶是怎么回事。
養過小龍蝦的人大概都體驗過這種痛苦:一覺醒來,小龍蝦突然失憶了。或者是,聊得好好的,過一會發現連前面的也不記得了。
聊得越久,它越像"注意力渙散",前面確認過的事后面又繞回來。
很多人以為是模型不夠聰明。
其實不是,是記憶機制的問題。
小龍蝦的記憶其實分三層:
小龍蝦的三層記憶結構 不可靠 最持久 工作記憶 當前會話歷史 維持本輪對話連續性,上下文窗口滿了就壓縮 默認每天凌晨4點重置 · 可配置空閑超時重置 · 可手動 /new 短期記憶 memory/YYYY-MM-DD.md 當天的"流水賬",今天+昨天自動加載,更早靠搜索召回 壓縮前自動刷寫 · 新會話自動提取 · Agent 隨時寫入 長期記憶 MEMORY.md 精煉后的持久信息:偏好、決策、項目狀態、關鍵事實 僅私聊自動加載 · 每次啟動都消耗上下文預算
第一層是工作記憶,就是當前這輪對話的歷史,保證它在同一段對話里能接著前文走。
但上下文窗口一滿就會被壓縮,壓縮之后細節可能丟失。而且會話默認每天凌晨4點自動重置,也可以手動輸入 /new 開新會話,或者配置空閑超時重置。
所以這層最不可靠,適合維持當前任務,不適合承擔長期保存。(這也是很多人發現一覺醒來小龍蝦失憶了的根本原因)
第二層是短期記憶,就是 memory/ 目錄下的每日筆記,相當于當天的"流水賬"。
它有三個寫入來源:對話壓縮前系統自動刷寫、新會話開啟時自動提取上一輪關鍵內容、Agent 自己隨時往里寫。
每次開啟對話,今天和昨天的筆記自動加載,更早的靠語義搜索召回。
第三層是長期記憶,也就是 MEMORY.md。存的是精煉過的持久信息:你的偏好、項目約定、重要決策。
每次私聊自動加載。它不是流水賬,而是經過篩選的長期知識。
這套系統看著挺完整,但實際用起來遠沒有你想的那么智能。
你以為它會自動把重要的東西記進 MEMORY.md?結果發現啥也沒記。
你以為記了就萬事大吉?結果三個月前說的"每周三開周會"和后來改的"每周四"同時存在,它也不知道該信哪個。
更麻煩的是,就算都記錄了,內容越堆越多,互相沖突、過時信息沒人清理。MEMORY.md 一旦膨脹,每個會話啟動都要消耗大量上下文預算,反而拖累整體響應質量。
記得越多,反應越慢,回答越差。
到后來很多人(包括我)都放棄了自動記憶,改成手動維護 MEMORY.md,或者干脆把重要的東西寫進 Skills 里。
本來應該是 AI 幫你記,結果變成了你幫 AI 記。
這次 v2026.4.5 更新里最重磅的功能,就是來解決這個問題的:Dreaming。它補上的是記憶系統最后一環:自動從流水賬里提煉精華,自動清理過期和矛盾的內容。
Dreaming 工作原理 每日筆記 memory/ 流水賬、冗余、矛盾 越積越多 Dreaming 整理 light 掃描 → REM 關聯 → deep 決策 六維度打分 · 全部達標才提拔 清矛盾 · 轉日期 · 刪過期 MEMORY.md 精煉后的長期記憶 干凈、準確、不臃腫 DREAMS.md 夢境日記
原理跟人的睡眠記憶機制很像:白天經歷了一大堆事,晚上大腦自動篩選,重要的固化成長期記憶,不重要的丟掉。小龍蝦現在也會"睡覺"了。
它在后臺綜合六個維度打分:頻率、相關度、話題多樣性、時間新鮮度、跨天重復度、概念豐富度。全部達標的才會被"提拔"到 MEMORY.md 里,不達標的自然淘汰。
矛盾的信息會被清理,"昨天"這種相對日期會被轉換成具體日期,已經刪掉的文件引用會被移除。
默認每天凌晨3點自動運行一次整理。內部分三個階段依次執行:先做輕度掃描(light),再做回顧和關聯(REM),最后由 deep 階段決定哪些信息值得寫入 MEMORY.md。
Light 輕度掃描篩選 REM 回顧關聯整理 Deep 寫入 MEMORY.md
只有 deep 階段才會真正修改你的長期記憶,前兩個階段只是篩選和準備。
這三個階段的命名借鑒了人類睡眠科學:Light 是淺睡期,大腦初步整理白天的信息;REM 是快速眼動期,也就是做夢的階段,大腦在回顧和建立關聯;Deep 是深度睡眠期,真正把重要記憶固化下來。小龍蝦的記憶整理,走的是同樣的路徑。
整理完還會生成一份 DREAMS.md,相當于"夢境日記",你可以看到它整理了什么。
以前 Dreaming 之后 → 只寫不清理 自動整理提煉 矛盾信息共存 沖突自動清理 越記越臃腫 定期瘦身淘汰 手動維護 MEMORY.md 后臺自動運行 吞噬上下文預算 保持精簡高效
其實這個思路,Claude Code 在3月下旬就做了:Auto Memory 負責記筆記,Auto Dream 負責整理筆記。
小龍蝦這次的 Dreaming 是同一方向的開源實現,但做了自己的設計:六維度加權打分、分階段整理、夢境日記可視化。
而上周 Claude Code 51萬行源碼意外泄漏,讓開源社區看到了 Auto Dream 完整的內部實現。
源碼泄漏6天后這個功能就上線了,時間線確實很緊湊。
想試試的話,在小龍蝦對話里輸入 /dreaming on 就能打開,用 /dreaming status 查看當前狀態。默認關閉。
另外, Dashboard里面也專門更新了一個“夢境”頁面。
![]()
02被嫌太費錢?那就學會省錢。
除了記憶混亂,小龍蝦被吐槽最多的另一個問題就是太費 token。
每次跟大模型對話,小龍蝦都會把系統提示、工具清單、歷史上下文一股腦全發過去。
哪怕這些內容跟上一輪完全一樣,也要重新發送、重新處理。工具清單還存在重復,排序每次都不一樣,導致緩存反復失效。
翻譯成人話:每次去醫院都要把身份證號、家庭住址、過往病史重新念一遍,哪怕你上周剛來過。
這也是 Anthropic 封殺小龍蝦的核心原因之一。Claude Code 的負責人 Boris Cherny 在宣布封殺時說得很直白:"我們的訂閱本來就不是按第三方工具的用量模式設計的,第三方工具沒有做緩存優化,我們很難可持續地支撐下去。"
但緊接著他又做了一件讓人意外的事:他自己提交了幾個 PR,專門幫小龍蝦改善 Claude 的緩存命中率。
![]()
小米大模型負責人 Fuli Luo 前兩天在 X 上也分析過:小龍蝦的調用方式確實太浪費 token,一個用戶的查詢實際產生的請求數量可能是 Claude Code 自家框架的好幾倍。
![]()
但她也說,被封殺的壓力反而會倒逼這些工具優化上下文管理、減少無效消耗。
這話剛剛說完,小龍蝦就交出了答卷。
這次更新大幅優化了 Prompt Caching:沒變的系統指令和上下文可以跨輪次復用,不用每次都重新處理。
去掉了重復的工具清單,MCP 工具排序做了確定性處理,避免順序變化導致緩存失效。還支持心跳保活,防止緩存過期后又要重新寫入。
現在醫院把你的檔案存起來了,直接說"我是上次那個"就行。不用每次都從頭念一遍。
對養蝦黨來說這是實實在在的好消息。不管你用 API 按量付費還是 OpenRouter,緩存優化意味著同樣的任務,以后燒的錢更少了。
03不只是做夢和省錢
這次更新遠不止這兩個功能。照著官方推文列一下:
v2026.4.5 其他重要更新 內置視頻 + 音樂生成 Runway · 通義萬相 · xAI Google Lyria · MiniMax 開箱即用,一句話生成 GPT-5.4 深度適配 原生支持 + 個性化配置 Claude 之后的新主力模型 結構化任務進度 復雜任務每步可視化 不用對著屏幕盲等了 控制面板 +12 種語言 簡體中文 · 繁體中文 等 新手入門門檻更低
內置視頻和音樂生成。上周我剛寫了怎么在小龍蝦里接入即夢和 LibTV 來用 Seedance 2.0 生成視頻,當時還要手動配置。這不,官方直接來了個內置集成,開箱就能用。
視頻支持 Runway、阿里通義萬相、xAI 等,音樂支持 Google Lyria 和 MiniMax。
結構化任務進度。以前讓小龍蝦執行復雜任務,你只能對著屏幕盲等,不知道它進行到哪一步了。現在每一步的進度、狀態都能看到。
控制面板支持12種新語言。包括簡體中文和繁體中文,新手入門的門檻又低了一截。
GPT-5.4 深度適配。加入了 GPT-5.4 的原生支持和個性化配置。結合官方那句"GPT-5.4 got better. We moved on.",方向很明確:被 Claude 趕走之后,GPT-5.4 成了新的主力模型。
04你封殺我,我進化給你看。
回頭看這一周的時間線:
3月31日 Claude Code 源碼泄漏 51萬行代碼、Auto Dream 實現細節全部公開 4月4日 Anthropic 正式封殺小龍蝦 訂閱額度不再覆蓋第三方工具 4月6日 小龍蝦發布今年最大更新 Dreaming + 緩存優化 + 視頻音樂 + GPT-5.4 適配
而且這次更新里,小龍蝦主動把 Claude 的訂閱接入方式從新用戶引導流程中移除了。
官方也承認了這條路走不通了,直接引導用戶去用 API 或者其他模型。
態度很明確:你不讓我蹭,那我就不蹭了。但我不會因此變弱,只會變強。
這個版本共有103位貢獻者參與。這就是開源社區的力量:一家公司可以封殺你的接入,但封不住103個人同時給你寫代碼。
![]()
上周我在文章里說過:小龍蝦還是那只小龍蝦,換個"飼料"就好了。現在看,它不只換了飼料,還順便進化了。
在 AI 這個行業里,封殺從來不是終點,而是進化的起點。
所以下次再看到什么"封殺""禁止""限制"的新聞,別急著恐慌。開源世界的回應速度,永遠比你想象的快。
你的小龍蝦更新了嗎?最期待哪個新功能?評論區聊聊你的體驗覺得有用 → 點個??在看轉給還不知道的朋友點個贊 告訴我你看完了關注「AI范兒」,下次更新第一時間收到
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.