337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

那個“愛馬仕”,想拯救“智障”小龍蝦

0
分享至

文|Lambda

編輯|曉靜

4月初,Hermes Agent 火了。這個名字直接讓人聯想到奢侈品牌愛馬仕,所以也被戲稱為“愛馬仕Agent”。

它由 Nous Research 在 2 月發布,定位是「The agent that grows with you」。核心賣點是一個閉環學習系統:Agent 完成復雜任務后,自動把經驗固化成 Skill,下次遇到類似任務直接復用,還能在使用過程中持續改進。Skill 自動生成、越用越強——這是 Agent 領域目前最有吸引力的敘事之一。

但這個敘事遮蔽了一個更基本的問題:Skill 真的是當前 Agent 落地的主要瓶頸嗎?


圖片由AI生成

01 Skill 很性感,但它可能不是最重要的問題

一個容易被忽略的事實是:目前公認體驗最好的編程 Agent 產品之一——Claude Code,它好用的基石并不是 Skill 的自動進化,而是背后大量扎實的 CLI 工具支撐。

用 GlobTool 找候選文件,用 GrepTool 定位相關代碼片段,用 FileReadTool 查看實現細節,用 LSPTool 做代碼符號跳轉和引用分析。每一個都是確定性的、零 token 消耗的原子操作。

但人們很少為這些工具寫故事。只要一提到 Agent 能自動生成 Skill、還能持續進化,整個行業立刻就興奮起來。

這個反差說明了一件事:CLI (命令行界面)不性感,不好講故事,但它才是 Agent 能力的真正地基。

地基不牢,Skill 再會長,也只是長在沙地上。

02 龍蝦最被人詬病的地方,Skill 自主進化解決不了

這件事放到 OpenClaw(俗稱‘龍蝦”) 身上會看得更清楚。

OpenClaw 最被人詬病的兩點,一是 token 消耗大、賬單吃不消,二是長時間工作穩定性差、經常失聯。乍一看是兩個問題;往下拆,會發現它們經常來自同一個源頭:Agent 在用劣質工具——比如脆弱的瀏覽器自動化——去完成本該由確定性工具完成的任務。

這類成本在社區里并非抽象的抱怨,而有大量具體案例。

Reddit 上有 OpenClaw 用戶提到,自己只是想自動化 X 賬號發帖,三次嘗試就花掉了 10 美元,任務還沒真正跑通。還有人在 r/automation 里直言,現在很多所謂的 AI Agent 瀏覽器控制,本質上只是「披著智能外衣的脆弱自動化」——問題不在模型有多笨,而在底層工具本身就不可靠。頁面一變、DOM 一改、按鈕狀態一抖,Agent 就只能一遍遍觀察、一遍遍重試、一遍遍重新規劃。

而這些「失敗但不致命」的試錯過程,并不會因為任務沒完成就免費——每一次觀察頁面、分析狀態、決定下一步,都在繼續消耗 token。

于是,穩定性問題和成本問題,其實是同一個問題的兩面:工具越脆弱,試錯越多;試錯越多,token 燒得越快;任務鏈越長,失聯和中斷的概率也越高。

從這個角度看,Skill 自主進化解決的是「怎么更聰明地使用一個工具」,但并沒有解決「好工具本身稀缺」的問題。Skill 可以讓 Agent 更熟練地駕馭一匹跛腳馬,但并不能把跛腳馬變成千里馬。

這才是今天很多 Agent 系統真正卡住的地方:不是 Skill 不夠強,而是底下能調度的高質量原子工具太少。

03 Skill 是對模型能力的補丁

Hermes 做的事情,本質上是把 Skill 的生成和優化自動化——讓 Agent 從經驗中蒸餾知識,不再需要人手寫。這確實解決了一個真實痛點。

但 Skill 本身有一個更深層的問題:它是自然語言驅動的,本質上是模型能力的延伸,或者說,是一種對模型能力的借貸。

現狀是,大量 Agent 在用 Skill 加上自主解題能力,完成本該由 CLI 完成的事情——比如以效率低下的瀏覽器自動化方案查一個股票價格、下載一張圖片、提交一個表單。代價很清楚:貴、慢、不穩定、調試難。

這里還有一個常見的認知誤區,可以叫做「Skill 可遷移幻覺」:很多人以為,用強模型寫出來的 Skill,可以無縫遷移給弱模型用。實際上不能。Skill 是自然語言指令,它對模型能力有隱性依賴;模型一換,行為就可能變。CLI 則不同——它是代碼:同樣的輸入,永遠給你同樣的輸出,不管底下跑的是什么模型。

二者的區別非常鮮明:

Skill 調試難,CLI 調試容易;

Skill 燒 token,CLI 近乎零消耗;

Skill 吃模型版本,CLI 不吃;

Skill 是語義層資產,CLI 是執行層資產。

如果把 Skill 當成核心積累方向,本質上是把賭注壓在模型能力的穩定性上。至少在當前階段,更值得積累的是高質量 CLI。

04 當工具和上下文足夠好時,Skill 的優先級會自然下降

上面的分析也能從 Anthropic 自己的產品經驗里得到印證。

Anthropic 的設計負責人、Cowork 產品的設計主導者 Jenny Wen 在近期訪談中提到一個細節:她個人其實不怎么用 Cowork 的 Skills 功能。原因不是她否定 Skill,而是她在 Cowork 里掛載了一個文件夾,里面有自己長期積累的個人筆記、一對一會議記錄、隨手想法和工作觀察。對她來說,Cowork 從這些材料里已經學到了足夠的信息,以至于她對 Skill 和 Memory 的需求都被顯著削弱了。

這并不是說 Skill 沒有價值,而是說:當上下文管理足夠好、底層工具足夠強時,Skill 的優先級會自然下降。

換言之,Hermes 所強調的 Skill 自主進化并不是錯,而是它解決的問題很可能沒有想象中那么基礎。

05 有一件事正在悄悄發生:CLI 的使用者,從人變成了 Agent

如果說 Skill 解決的是應用層的編排問題,那么更底層的變化發生在 CLI 上。

過去,CLI 是為人設計的。給人用的 CLI 可以有交互提示,可以容忍模糊輸出,也可以在文檔不全的時候靠用戶自己猜——因為人會停下來,會理解歧義,會重試,會去查文檔。

Agent 不一樣。

Agent 不睡覺,不容忍歧義,會并發,會在沒有預料到的時機無限重試。一個對人類來說「勉強能用」的 CLI,對 Agent 來說可能就是高頻事故源。

給 Agent 用的 CLI 必須滿足一組完全不同的要求:

一條命令只產出一個明確結果;

輸出是結構化的 JSON;

錯誤信息不僅告訴你哪里錯了,還要告訴 Agent 下一步該怎么辦;

長任務必須支持異步,不能讓 Agent 傻等;

接口天然支持冪等、重試和并發。

背后只有一句話:以前的軟件默認使用者要睡覺、會分心、有耐心;現在 Agent 不滿足這些前提。

一旦使用者從人變成 Agent,CLI 的設計哲學就需要從頭重寫。Agent 真正在乎的是 token 消耗、緩存命中率、幻覺控制、長程穩定性,而不是「這個命令看起來是否優雅」。

06 瀏覽器里能看到的,都值得被 CLI 化

有一個實驗很能說明問題:把 ChatGPT 的網頁版變成一個可以被 Agent 調用的 CLI。

做法并不神秘——通過 Chrome CDP 協議直接驅動瀏覽器,操作 DOM,填輸入框,點發送,等待文字出現,再把結果抓下來。因為復用了已有登錄態,行為上和人在瀏覽器里操作沒有本質區別。

這個實驗背后更大的洞察是:瀏覽器里能看到的,原則上都可以被 CLI 化。

不只是 ChatGPT——Gemini、音樂生成、視頻生成、股票圖表,只要能在瀏覽器里完成的流程,都可以被代碼重復執行,最后收斂成一條 Agent 可調用的命令。

一旦一個 Web 流程被 CLI 化,它就會從「需要 Agent 一步步盯著網頁試錯」的流程,變成「可并發、可異步、可冪等的原子操作」。原來要靠瀏覽器自動化消耗大量 token 才能完成的事,被壓縮成了一條命令、一個結構化結果。

某種意義上,這是一條很反直覺但非常現實的優化路徑:節省 token 的方法,不是少讓 Agent 干活,而是先燒一點 token,把高頻流程預制成 CLI。磨刀不誤砍柴工。

這個邏輯也不只適用于 Web。桌面應用和手機 App,本質上都可以被逐步 CLI 化,what you see is what can cli。目前已有不少開源項目在分別推進這三個方向,只是三者之間還沒有形成統一的設計語言和引起大家足夠的重視。

07 分層才是終態

Agent 的未來,除了模型本身的提升,更取決于如何處理好兩種邏輯:確定性邏輯語義邏輯

前者靠 CLI,后者靠 Skill 的自適應和進化。Hermes 解決的是后者,但前者才是今天很多系統真正缺的底座。

如果把 CLI 化推到極致,會出現一件很反直覺的事:一類流程完全固定的任務,Agent 只需要判斷任務類型、路由到對應 CLI、拿結果回來——這個過程理論上甚至不需要 LLM,幾個 if-else 就夠了。你甚至可以用代碼去模擬 LLM 的輸入輸出接口,零 token、零延遲,繼續復用現有的 Agent 調度機制,只在真正需要判斷的地方才調用真實模型。

這有點像 2026 年的一場「代碼的文藝復興」——人們開始重新發現,不是所有「看起來像智能」的問題都應該交給模型來解決。

終態的分工應該是三層:

CLI 層:確定性執行,零 token,可并發,易測試,不依賴任何模型;

Skill 層:上下文編排和經驗蒸餾,越用越強;

LLM 層:提供智能,做真正需要語義判斷的部分。

三層不是競爭關系,而是依賴關系。

今天很多系統的問題在于,它們跳過了 CLI 層,直接讓 Skill 和 LLM 去兜底。結果就是:系統又貴又慢,穩定性也差。正確的路徑應該是——開發者預制 CLI,上層應用自動管理 Skill,LLM 在 Skill 的輔助下使用 CLI 解決問題。

Hermes 的出現不是終點,而是一個信號:Skill 層的問題可能正在被解決,但下一個真正的戰場,在 CLI 層。

Web 端、PC 端、移動端,三大平臺系統性的 CLI 改造才剛剛開始。這可能才是今天 Agent 領域最值得做、也最不性感,但最關鍵的事情。

本文來自微信公眾號“騰訊科技”,作者:Lambda,36氪經授權發布。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
貝嫂洗掉全身紋身,致敬家人的都不留,三子證實:她嫌這些東西丑

貝嫂洗掉全身紋身,致敬家人的都不留,三子證實:她嫌這些東西丑

世界王室那些事
2026-04-11 10:30:06
日本可能也沒想到,高市早苗的愚蠢,竟“幫”中國解決了兩大問題

日本可能也沒想到,高市早苗的愚蠢,竟“幫”中國解決了兩大問題

杰絲聊古今
2026-04-11 16:16:08
以軍在教室開槍,打死正在上課的9歲加沙女孩

以軍在教室開槍,打死正在上課的9歲加沙女孩

瀟湘晨報
2026-04-10 14:59:14
鄭麗文對“和平統一”表態后,宋楚瑜發聲,郭正亮一句話亮了!

鄭麗文對“和平統一”表態后,宋楚瑜發聲,郭正亮一句話亮了!

達文西看世界
2026-04-11 10:47:38
涉嫌嚴重違紀違法,鮮雄被查

涉嫌嚴重違紀違法,鮮雄被查

都市快報橙柿互動
2026-04-09 21:07:21
53條中日航線3月取消全部航班

53條中日航線3月取消全部航班

每日經濟新聞
2026-04-10 13:01:04
岳西6歲女童遇害案持續發酵!網友:柳某的老公,真是躲過了一劫

岳西6歲女童遇害案持續發酵!網友:柳某的老公,真是躲過了一劫

火山詩話
2026-04-11 17:19:36
申花VS海港首發:4外援PK!張琳芃盧永濤登場 汪海健+高天意先發

申花VS海港首發:4外援PK!張琳芃盧永濤登場 汪海健+高天意先發

我愛英超
2026-04-11 18:25:06
6月1日起,包工頭徹底告別舞臺!建筑圈大洗牌,5000萬工人迎巨變

6月1日起,包工頭徹底告別舞臺!建筑圈大洗牌,5000萬工人迎巨變

普陀動物世界
2026-04-10 21:35:49
中東局勢突變!伊朗采購36架殲10,沙特花60億搶貨,老美徹底慌了

中東局勢突變!伊朗采購36架殲10,沙特花60億搶貨,老美徹底慌了

胖福的小木屋
2026-04-07 10:59:14
勝者為王!張雪辭職那年,嚴凱坦言:他很有可能會贏,但我不敢賭

勝者為王!張雪辭職那年,嚴凱坦言:他很有可能會贏,但我不敢賭

干史人
2026-04-10 22:30:03
武警部隊原副政委蔣金鏘將軍逝世,享年91歲

武警部隊原副政委蔣金鏘將軍逝世,享年91歲

澎湃新聞
2026-04-11 15:26:26
阿耳忒彌斯2號最終一搏:13分鐘穿越2760℃,時隔53年月球歸來大考

阿耳忒彌斯2號最終一搏:13分鐘穿越2760℃,時隔53年月球歸來大考

三體引力波
2026-04-11 01:02:06
什么事讓你瞬間感到毛骨悚然?網友:從此再沒見過她老公發脾氣

什么事讓你瞬間感到毛骨悚然?網友:從此再沒見過她老公發脾氣

另子維愛讀史
2026-03-10 23:08:46
“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

皓皓情感說
2026-04-10 22:54:59
鄭麗文通告全球!美專機落地臺灣,有事交代賴清德,大陸收到信號

鄭麗文通告全球!美專機落地臺灣,有事交代賴清德,大陸收到信號

朝子亥
2026-04-11 12:10:03
以色列法院恢復審判內塔尼亞胡涉嫌腐敗案

以色列法院恢復審判內塔尼亞胡涉嫌腐敗案

參考消息
2026-04-10 14:06:44
有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
陳光標回應送車風波:不認識張雪,“不管他叫張雪還是李雪”,只想向他致敬

陳光標回應送車風波:不認識張雪,“不管他叫張雪還是李雪”,只想向他致敬

齊魯壹點
2026-04-10 22:24:12
衡陽市人大常委會發布最新人事任免

衡陽市人大常委會發布最新人事任免

三湘都市報
2026-04-10 13:14:57
2026-04-11 18:48:49
36氪 incentive-icons
36氪
讓一部分人先看到未來
151127文章數 2848725關注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發文反思

頭條要聞

美專家:外交經驗幾乎為零的伊朗議長出場 是一種信號

頭條要聞

美專家:外交經驗幾乎為零的伊朗議長出場 是一種信號

體育要聞

換帥之后,他們從降級區沖到升級區

娛樂要聞

浪姐7淘汰 該走的沒走,不該走的走了

財經要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態度原創

本地
教育
藝術
公開課
軍事航空

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

教育要聞

砸了51萬,孩子也沒能進名校!法院判決:退錢

藝術要聞

王羲之《孝經》真跡出土,這是他為皇帝所寫

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗議長帶四名遇難兒童照片赴美伊談判

無障礙瀏覽 進入關懷版