網易首頁 > 網易號 > 正文申請入駐

剛被封殺兩天，小龍蝦就放出了今年最強大的更新！

2026-04-07 01:30:22　來源: AI范兒

上海舉報

分享至

AI范兒 · 今日速評

這一周的 AI 圈，劇情密度拉滿了。

上周二（3月31日），Claude Code 51 萬行源碼意外泄漏。周六（4月4日），Anthropic 正式封殺小龍蝦的訂閱接入。

今天，小龍蝦放出了 2026.4.5 版本，社區公認今年至今最大的一次更新。

記憶管理混亂和 token 消耗太高，一直是社區里被吐槽最多的兩個問題。特別是后面一個也是 Claude 封殺小龍蝦的核心原因之一。

這次更新，小龍蝦終于下定決心從這兩個痛點直接下手。

官方推文最后甩了一句話，三個短句，沒有抱怨、沒有控訴、沒有回頭看，只有一個態度：往前走。

Anthropic cut us off. GPT-5.4 got better. We moved on.

Anthropic 把我們切了。GPT-5.4 變強了。我們往前走了。

01小龍蝦學會"做夢"了。

聽起來很玄，但這可能是小龍蝦迄今為止最重要的一次進化。

先說說原來的記憶是怎么回事。

養過小龍蝦的人大概都體驗過這種痛苦：一覺醒來，小龍蝦突然失憶了。或者是，聊得好好的，過一會發現連前面的也不記得了。

聊得越久，它越像"注意力渙散"，前面確認過的事后面又繞回來。

很多人以為是模型不夠聰明。

其實不是，是記憶機制的問題。

小龍蝦的記憶其實分三層：

小龍蝦的三層記憶結構不可靠最持久工作記憶當前會話歷史維持本輪對話連續性，上下文窗口滿了就壓縮默認每天凌晨4點重置 · 可配置空閑超時重置 · 可手動 /new 短期記憶 memory/YYYY-MM-DD.md 當天的"流水賬"，今天+昨天自動加載，更早靠搜索召回壓縮前自動刷寫 · 新會話自動提取 · Agent 隨時寫入長期記憶 MEMORY.md 精煉后的持久信息：偏好、決策、項目狀態、關鍵事實僅私聊自動加載 · 每次啟動都消耗上下文預算

第一層是工作記憶，就是當前這輪對話的歷史，保證它在同一段對話里能接著前文走。

但上下文窗口一滿就會被壓縮，壓縮之后細節可能丟失。而且會話默認每天凌晨4點自動重置，也可以手動輸入 /new 開新會話，或者配置空閑超時重置。

所以這層最不可靠，適合維持當前任務，不適合承擔長期保存。（這也是很多人發現一覺醒來小龍蝦失憶了的根本原因）

第二層是短期記憶，就是 memory/ 目錄下的每日筆記，相當于當天的"流水賬"。

它有三個寫入來源：對話壓縮前系統自動刷寫、新會話開啟時自動提取上一輪關鍵內容、Agent 自己隨時往里寫。

每次開啟對話，今天和昨天的筆記自動加載，更早的靠語義搜索召回。

第三層是長期記憶，也就是 MEMORY.md。存的是精煉過的持久信息：你的偏好、項目約定、重要決策。

每次私聊自動加載。它不是流水賬，而是經過篩選的長期知識。

這套系統看著挺完整，但實際用起來遠沒有你想的那么智能。

你以為它會自動把重要的東西記進 MEMORY.md？結果發現啥也沒記。

你以為記了就萬事大吉？結果三個月前說的"每周三開周會"和后來改的"每周四"同時存在，它也不知道該信哪個。

更麻煩的是，就算都記錄了，內容越堆越多，互相沖突、過時信息沒人清理。MEMORY.md 一旦膨脹，每個會話啟動都要消耗大量上下文預算，反而拖累整體響應質量。

記得越多，反應越慢，回答越差。

到后來很多人（包括我）都放棄了自動記憶，改成手動維護 MEMORY.md，或者干脆把重要的東西寫進 Skills 里。

本來應該是 AI 幫你記，結果變成了你幫 AI 記。

這次 v2026.4.5 更新里最重磅的功能，就是來解決這個問題的：Dreaming。它補上的是記憶系統最后一環：自動從流水賬里提煉精華，自動清理過期和矛盾的內容。

Dreaming 工作原理每日筆記 memory/ 流水賬、冗余、矛盾越積越多 Dreaming 整理 light 掃描 → REM 關聯 → deep 決策六維度打分 · 全部達標才提拔清矛盾 · 轉日期 · 刪過期 MEMORY.md 精煉后的長期記憶干凈、準確、不臃腫 DREAMS.md 夢境日記

原理跟人的睡眠記憶機制很像：白天經歷了一大堆事，晚上大腦自動篩選，重要的固化成長期記憶，不重要的丟掉。小龍蝦現在也會"睡覺"了。

它在后臺綜合六個維度打分：頻率、相關度、話題多樣性、時間新鮮度、跨天重復度、概念豐富度。全部達標的才會被"提拔"到 MEMORY.md 里，不達標的自然淘汰。

矛盾的信息會被清理，"昨天"這種相對日期會被轉換成具體日期，已經刪掉的文件引用會被移除。

默認每天凌晨3點自動運行一次整理。內部分三個階段依次執行：先做輕度掃描（light），再做回顧和關聯（REM），最后由 deep 階段決定哪些信息值得寫入 MEMORY.md。

Light 輕度掃描篩選 REM 回顧關聯整理 Deep 寫入 MEMORY.md

只有 deep 階段才會真正修改你的長期記憶，前兩個階段只是篩選和準備。

這三個階段的命名借鑒了人類睡眠科學：Light 是淺睡期，大腦初步整理白天的信息；REM 是快速眼動期，也就是做夢的階段，大腦在回顧和建立關聯；Deep 是深度睡眠期，真正把重要記憶固化下來。小龍蝦的記憶整理，走的是同樣的路徑。

整理完還會生成一份 DREAMS.md，相當于"夢境日記"，你可以看到它整理了什么。

以前 Dreaming 之后 → 只寫不清理自動整理提煉矛盾信息共存沖突自動清理越記越臃腫定期瘦身淘汰手動維護 MEMORY.md 后臺自動運行吞噬上下文預算保持精簡高效

其實這個思路，Claude Code 在3月下旬就做了：Auto Memory 負責記筆記，Auto Dream 負責整理筆記。

小龍蝦這次的 Dreaming 是同一方向的開源實現，但做了自己的設計：六維度加權打分、分階段整理、夢境日記可視化。

而上周 Claude Code 51萬行源碼意外泄漏，讓開源社區看到了 Auto Dream 完整的內部實現。

源碼泄漏6天后這個功能就上線了，時間線確實很緊湊。

想試試的話，在小龍蝦對話里輸入 /dreaming on 就能打開，用 /dreaming status 查看當前狀態。默認關閉。

另外， Dashboard里面也專門更新了一個“夢境”頁面。

02被嫌太費錢？那就學會省錢。

除了記憶混亂，小龍蝦被吐槽最多的另一個問題就是太費 token。

每次跟大模型對話，小龍蝦都會把系統提示、工具清單、歷史上下文一股腦全發過去。

哪怕這些內容跟上一輪完全一樣，也要重新發送、重新處理。工具清單還存在重復，排序每次都不一樣，導致緩存反復失效。

翻譯成人話：每次去醫院都要把身份證號、家庭住址、過往病史重新念一遍，哪怕你上周剛來過。

這也是 Anthropic 封殺小龍蝦的核心原因之一。Claude Code 的負責人 Boris Cherny 在宣布封殺時說得很直白："我們的訂閱本來就不是按第三方工具的用量模式設計的，第三方工具沒有做緩存優化，我們很難可持續地支撐下去。"

但緊接著他又做了一件讓人意外的事：他自己提交了幾個 PR，專門幫小龍蝦改善 Claude 的緩存命中率。

小米大模型負責人 Fuli Luo 前兩天在 X 上也分析過：小龍蝦的調用方式確實太浪費 token，一個用戶的查詢實際產生的請求數量可能是 Claude Code 自家框架的好幾倍。

但她也說，被封殺的壓力反而會倒逼這些工具優化上下文管理、減少無效消耗。

這話剛剛說完，小龍蝦就交出了答卷。

這次更新大幅優化了 Prompt Caching：沒變的系統指令和上下文可以跨輪次復用，不用每次都重新處理。

去掉了重復的工具清單，MCP 工具排序做了確定性處理，避免順序變化導致緩存失效。還支持心跳保活，防止緩存過期后又要重新寫入。

現在醫院把你的檔案存起來了，直接說"我是上次那個"就行。不用每次都從頭念一遍。

對養蝦黨來說這是實實在在的好消息。不管你用 API 按量付費還是 OpenRouter，緩存優化意味著同樣的任務，以后燒的錢更少了。

03不只是做夢和省錢

這次更新遠不止這兩個功能。照著官方推文列一下：

v2026.4.5 其他重要更新內置視頻 + 音樂生成 Runway · 通義萬相 · xAI Google Lyria · MiniMax 開箱即用，一句話生成 GPT-5.4 深度適配原生支持 + 個性化配置 Claude 之后的新主力模型結構化任務進度復雜任務每步可視化不用對著屏幕盲等了控制面板 +12 種語言簡體中文 · 繁體中文等新手入門門檻更低

內置視頻和音樂生成。上周我剛寫了怎么在小龍蝦里接入即夢和 LibTV 來用 Seedance 2.0 生成視頻，當時還要手動配置。這不，官方直接來了個內置集成，開箱就能用。

視頻支持 Runway、阿里通義萬相、xAI 等，音樂支持 Google Lyria 和 MiniMax。

結構化任務進度。以前讓小龍蝦執行復雜任務，你只能對著屏幕盲等，不知道它進行到哪一步了。現在每一步的進度、狀態都能看到。

控制面板支持12種新語言。包括簡體中文和繁體中文，新手入門的門檻又低了一截。

GPT-5.4 深度適配。加入了 GPT-5.4 的原生支持和個性化配置。結合官方那句"GPT-5.4 got better. We moved on."，方向很明確：被 Claude 趕走之后，GPT-5.4 成了新的主力模型。

04你封殺我，我進化給你看。

回頭看這一周的時間線：

3月31日 Claude Code 源碼泄漏 51萬行代碼、Auto Dream 實現細節全部公開 4月4日 Anthropic 正式封殺小龍蝦訂閱額度不再覆蓋第三方工具 4月6日小龍蝦發布今年最大更新 Dreaming + 緩存優化 + 視頻音樂 + GPT-5.4 適配

而且這次更新里，小龍蝦主動把 Claude 的訂閱接入方式從新用戶引導流程中移除了。

官方也承認了這條路走不通了，直接引導用戶去用 API 或者其他模型。

態度很明確：你不讓我蹭，那我就不蹭了。但我不會因此變弱，只會變強。

這個版本共有103位貢獻者參與。這就是開源社區的力量：一家公司可以封殺你的接入，但封不住103個人同時給你寫代碼。

上周我在文章里說過：小龍蝦還是那只小龍蝦，換個"飼料"就好了。現在看，它不只換了飼料，還順便進化了。

在 AI 這個行業里，封殺從來不是終點，而是進化的起點。

所以下次再看到什么"封殺""禁止""限制"的新聞，別急著恐慌。開源世界的回應速度，永遠比你想象的快。

你的小龍蝦更新了嗎？最期待哪個新功能？評論區聊聊你的體驗覺得有用 → 點個??在看轉給還不知道的朋友點個贊告訴我你看完了關注「AI范兒」，下次更新第一時間收到

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.