網易首頁 > 網易號 > 正文申請入駐

斯坦福MIT天團出手！1美元養龍蝦，圖文視頻全包，打工人神外掛

2026-04-01 20:44:04　來源: 新智元

北京舉報

分享至

新智元報道

編輯：元宇

【新智元導讀】別人還在卷單點能力，Agnes已經把文本Agent、圖像、視頻和辦公自動化打包進開發者工具箱：1美元「養龍蝦」，外加圖像、視頻、PPT一條龍，給出的不是零散的能力點，而是一整套AI生產力。

近日，Agnes旗下核心模型矩陣正式上線Zenmux平臺（https://zenmux.ai/models?sort=newest），一口氣開放四款主力模型調用，覆蓋文本Agent與多模態生成兩大核心方向。

其中包括Claw系列的Agnes-1.5-Lite與Agnes-1.5-Pro，以及多模態方向的Agnes-Image-1.2與Agnes-Video-V1.2，直接把「文本+圖像+視頻」的整套能力打包上線。

更值得關注的是，上線首周模型調用量即快速攀升，已超過多家頭部模型公司同類產品表現，顯示出強勁的市場接受度與開發者活躍度，成為近期開發者側增長最為迅猛的一組模型組合之一。

Agnes模型矩陣在Zenmux正式上線

在行業普遍進入「性能+成本」雙重競爭階段的背景下，Agnes通過高性價比模型與完整工具鏈的組合，正在迅速打開開發者生態入口。

AgnesClaw

低至1美元的「養蝦」入門神器

在OpenClaw熱度持續攀升之際，Agnes將「Claw」接入自家App，AgnesClaw一鍵部署。

用戶通過訂閱會員（部分地區Starter新用戶最低可低至1美元/月）即可免費部署并使用AgnesClaw，同時解鎖平臺全部高級功能，性價比極高。

AgnesClaw的入口前置到首頁，用戶一鍵部署完成后，在對話框中切換至AgnesClaw模式，即可體驗「養龍蝦」，整體學習體驗成本極低。

AgnesClaw目前支持與Telegram綁定，后續接入更多平臺，提供定時任務、長期記憶和skills庫，包括Agnes預置常用skills（如PPT生成、表格處理、圖像/視頻生成、AI搜索、深度研究等）和開源skills。

部分AI應用由于底層模型能力的限制，可能存在無法安裝或流暢運行特定skill組件的問題。

而Agnes官方表示，AgnesClaw憑借自研的「龍蝦」基座模型與強大的工具調用適配能力，幾乎可以無縫安裝并使用絕大多數熱門skills。

用戶可以利用它創建定時任務、處理文件并整理為結構化文檔、實現辦公自動化等。

同時，AgnesClaw具備自我進化能力，通過上下文理解和記憶能力，在使用過程中能更好地理解用戶習慣，從而更有效地協助完成任務。

一鍵部署AgnesClaw

AgnesClaw的最大亮點在于自研的「龍蝦」基座模型，這是賦予Agnes版本「龍蝦」具備更強的理解力和skill適配能力的核心。

Agnes為用戶高性價比「養龍蝦」，專門推出了兩款不同參數規模基于LLM優化的Agent模型，分別是120B的Agnes-1.5-Pro模型和35B的Agnes-1.5-Lite模型。

PinchBench榜單中Agnes-1.5 系列模型在準確性維度表現突出

AgnesClaw定位「下一代極速多模態混合專家模型」，架構上融合了隱式MoE（Latent MoE）、Mamba-2狀態空間模型與原生多模態早融合技術，旨在同時解決超長上下文、高頻工具調用、復雜Multi-Agent協作三大痛點，打破傳統「規模-延遲-記憶」三元悖論。

根據全球權威「養蝦」AI評測榜單PinchBench，Agnes-1.5-Pro模型在準確性維度表現突出，已躋身榜單前列，成為開發者「最佳養蝦模型」選擇之一。

PinchBench榜單

Agnes-Image-1.2

開源第一，閉源第二

本次發布中，Agnes 20B全新圖像編輯模型Agnes-Image-1.2的表現超出預期。

根據官方公布的測試數據，該模型綜合評分達到4.25分（滿分5分），在閉源模型中僅次于NanoBananaPro的4.48分，超越了Seedream4.0和Seedream4.5，在開源模型中排名第一。

全新圖像模型綜合評分達到4.25分（滿分5分）

在單項指標上，Agnes-Image-1.2模型在人像維度提升尤為顯著，針對人像場景的定向微調有效增強了面部細節保真、局部編輯可控性以及與背景的自然融合能力，Portrait從3.98提升至4.30(+0.32)。

同時，Extract(2.47→3.05,+0.58)與Viewpoint(2.82→3.17,+0.35)也有進一步提升，表明模型在目標區域分離與結構/幾何穩定性方面更可靠，有助于復雜編輯任務的一致性表現。

完整模型家族

覆蓋多模態全鏈路

除了Agnes-1.5-Pro與Agnes-1.5-Lite兩款模型和Agnes-Image-1.2圖像編輯模型，Agnes這次還亮出了更加完整的模型矩陣，包括搜索與研究模型、AI Slides模型、圖片與視頻生成模型。

在圖片和視頻生成領域，Agnes構建了完整模型體系，包括圖像和視頻模型。除了之前介紹的Agnes-Image-1.2（20B）模型，Agnes另外還有一款19B的Agnes-Video-V1.2視頻生成模型。

據了解，Agnes-Video-V1.2可實現原生音畫同步生成，支持圖生視頻和特定風格/角色的生成，可適配多種業務場景。

該模型采用雙流音視頻Transformer架構，能在同一模型中同時生成音頻與視頻，從而實現人物口型、動作與聲音天然同步。模型經測試可在有限顯存環境下運行，方便企業級規模化部署和個人開發者的本地實驗。

在語言模型方面，Agnes針對自己的主推市場東南亞地區，推出了8B參數的東南亞小語種模型Agnes-SeaLLM，目前已成為該地區小語種理解與生成任務SOTA模型。

東南亞小語種模型Agnes-SeaLLM

在信息處理和研究能力方面，Agnes發布了Agnes-Search（30B）模型和面向復雜研究任務的Agnes-DeepResearch（30B）模型。

前者在內部測試中實現78.6%的推理成本下降，生成速度提升18.6%；后者測試引用準確率為100%，基準測試準確率平均提升14.3%。

在辦公自動化場景中，Agnes-Slides（30B）模型可以將網頁或文檔內容自動生成為PPT，通常1分鐘即可生成15—20頁演示文稿，平均生成成本低至約每頁幾美分。

模型后訓練為主

RLAF框架減少人工依賴

在底層訓練范式上，Agnes采用的是一整套連續演進的技術路徑：從CPT（continuous pre-training，持續預訓練）到PT（post-training，后訓練），再到以自建RL（reinforcement learning）為核心的強化階段，使模型能力可以持續迭代，而非一次性收斂。

更關鍵的是，他們把「進化」這件事，從模型層擴展到了Agent層。

在AgnesClaw體系中，Agent不僅調用skills，還可以在任務執行過程中通過反饋不斷優化自身策略，實現智能體與skills的協同自進化。

這意味著，系統能力不再完全依賴預訓練，而是在真實使用中持續變強。

支撐這套體系的，是一支高度國際化的研究團隊——成員來自斯坦福、伯克利、MIT、NUS、NTU，以及清華、浙大、南大、東大等頂尖高校，核心科研帶頭人包括來自微軟亞研院、英特爾研究院的首席科學家，以及高校教授與圖靈獎得主門下研究者。

他們提出了一套名為RLAF（Reinforcement Learning with Agentic Feedback）的帶智能反饋的新的強化學習框架，以減少對人工標注的依賴。該框架包含兩個自研核心組件：

DSPO（Dynamic-filter Sequence-level Policy Optimization）：動態過濾序列級策略優化算法。
官方數據顯示，在同規模模型對比中，相比DeepSeek Search-R1 (GRPO,7B)實現34.1%的性能提升。

UV（Universal Verifier）：通用驗證器，用智能評估器替換人工標注數據和人工定義的獎勵機制。

在RLAF框架中，多個AI Agent會對模型輸出進行自動評估，從邏輯一致性、事實準確性和任務完成度等多個維度生成反饋信號。

這種「AI訓練AI」的方式，可以減少大量人工標注，從而降低訓練成本并提升效率。

隨著AI行業進入新一輪競爭階段，成本效率正逐漸成為商業化成敗的關鍵因素。而此次登陸Zenmux（https://zenmux.ai/models?sort=newest），某種程度上也是Agnes一個關鍵分水嶺——

模型不再只是「榜單表現」，而是直接進入開發者真實調用與對比的第一線。

從上線一周的調用表現來看，這套Claw+多模態組合已經開始改寫一部分開發者的選擇。

當越來越多模型走向平臺化分發，真正能留下來的，或許不只是更強的參數規模，而是誰更便宜、誰更好用、誰更能被快速接入真實世界。

Agnes，顯然正在把答案往這個方向推。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

104人重寫底層，OpenClaw裝上「任務大腦」，連QQ機器人都能管

新智元 2026-04-01 18:30:07
2 跟貼 2
斯坦福、英偉達、新國立推出InfoTok，用信息論定義高效視頻分詞

機器之心Pro 2026-03-30 15:39:13
0 跟貼 0

源碼被開源，Claude Code之父回應了：純內部開發者手滑

機器之心Pro 2026-04-01 14:39:04
2 跟貼 2

AI再強，這些軟件仍不可替代

財天COVER 2026-04-01 18:23:10
0 跟貼 0
“龍蝦們”為什么還進不了企業現場?

虎嗅APP 2026-04-01 18:41:08
0 跟貼 0

JiuwenClaw助你一鍵養龍蝦-3

機器之心Pro 2026-03-12 17:18:07
0 跟貼 0

被奧特曼討厭的女記者：OpenAI內斗混亂，普通人正被AI帝國欺騙

DeepTech深科技 2026-04-01 21:03:56
0 跟貼 0
AI的看圖能力，可能是編出來的

虎嗅APP 2026-04-01 21:12:07
0 跟貼 0

全球最強推理引擎還快2倍，斯坦福、普林斯頓破解大模型串行魔咒

機器之心Pro 2026-04-01 15:02:48
0 跟貼 0
智能體卷王誕生！干活自動配結項報告，1.5張截圖就把事說清了

量子位 2026-01-10 14:38:21
0 跟貼 0
AI自主開發團隊崛起，一個月搞定傳統團隊數月工作量

DeepTech深科技 2026-04-01 21:07:59
0 跟貼 0
把8B模型塞進iPhone，這家公司讓AI速度起飛，功耗省掉80%

DeepTech深科技 2026-04-01 21:12:58
0 跟貼 0
不用一個字，MIT團隊讓細胞自動機教會了大模型推理

DeepTech深科技 2026-03-23 18:28:08
1 跟貼 1
MIT團隊給機器人裝上透視眼，藏在紙箱里的東西也能看見

DeepTech深科技 2026-03-24 14:52:33
0 跟貼 0
威斯康星大學3月論文：CPO不是升級選項，是200億美元押注

算力游俠 2026-04-01 10:21:56
0 跟貼 0
MIT新方法讓兩顆芯片共享唯一“指紋”，重寫硬件安全規則

DeepTech深科技 2026-02-25 17:32:10
0 跟貼 0
首次！OpenClaw又更新，直接合并QQ官方插件

機器之心Pro 2026-04-01 14:44:14
27 跟貼 27
模型飛機試飛，鏡頭一轉發現事不簡單，美女膽子太大了

說說搞笑說 2026-03-30 17:29:13
1 跟貼 1
DeepSeek又崩了公司暫無回應

第一財經 2026-03-31 17:35:28
13000 跟貼 13000
阿聯酋被指準備協助美國武力打通霍爾木茲海峽

證券時報網 2026-04-01 11:24:58
17286 跟貼 17286
日本部署導彈"瞄準中國" 美方提醒：中方反制還沒結束

澎湃新聞 2026-04-01 11:39:50
2512 跟貼 2512
龍蝦玩家從夯到拉五個級別，你在哪一層？

秋葉PPT 2026-04-01 19:39:15
1 跟貼 1
北京男子依靠養龍蝦實現36小時買房網友：我差的是銀子

快科技 2026-03-30 10:44:08
11 跟貼 11
蘿卜快跑道歉：武漢全域暫停服務，后續會持續進行優化；昨晚多車行駛中突然停車，多部門開展處置

魯中晨報 2026-04-01 16:21:19
91 跟貼 91
不會“養龍蝦”的旅行社，還能活多久？| TD內參

環球旅訊 2026-03-31 18:45:32
0 跟貼 0
呼蘭脫口秀189票晉級，文本功底驚人揭秘！

巨信瑞 2026-04-01 04:13:34
0 跟貼 0
1911 模型槍欣賞

飛翔大白鯨 2026-03-29 09:56:29
0 跟貼 0
10人意大利點球大戰不敵波黑，連續三屆無緣世界杯，主帥加圖索稱“感覺非常痛苦”；瑞典“絕殺”波蘭晉級，捷克時隔20年重返世界杯

極目新聞 2026-04-01 07:59:13
1892 跟貼 1892
大學生的人生抉擇，返鄉創業養龍蝦

財富基因007 2026-03-31 01:57:48
0 跟貼 0
頂級特工憑借兄弟的一句話，直接破解網頁賺了150萬

五娃看劇 2026-03-31 11:45:31
1 跟貼 1
計算機ETF國泰（512720）大漲超2.5%，AI Agent從技術驗證走向可落地的生產力應用形態

每日經濟新聞 2026-04-01 15:11:05
0 跟貼 0
告別繁瑣配置，橙獅體育推出"對話式"AI辦賽助手，體育行業的"Agent時代"初現雛形

美通社PRNewswire 2026-04-01 17:22:17
0 跟貼 0
清華團隊：1.5B 模型新基線！用「最笨」的 RL 配方達到頂尖性能

機器之心Pro 2025-11-13 14:56:23
0 跟貼 0
這小丫頭長大不得了，和哥哥吵架不計較，邏輯清晰，表達能力強

小信新鮮事 2026-04-01 01:56:04
0 跟貼 0
樹立和踐行正確政績觀學習教育中央第二指導組進駐山東見面會召開

閃電新聞 2026-04-01 18:45:44
21 跟貼 21
萌娃給老師打電話要求退園，語言表達能力強邏輯清晰，萌翻網友

俄羅斯安娜 2026-04-01 01:42:37
0 跟貼 0
張雪機車爆單創始人張雪火出圈：初中畢業用2萬創業

澎湃新聞 2026-04-01 01:42:14
2815 跟貼 2815
游客同里古鎮景區拍照遭商家驅趕搶奪手機，當地：對涉事商戶停業整改

都市快報橙柿互動 2026-04-01 10:59:51
452 跟貼 452
迷你汽油發動機模型

制造科技 2026-03-28 15:59:09
0 跟貼 0
指尖上的全自動風暴毛瑟M712速射型火力邏輯與機械傳奇

番茄肚腩 2026-04-01 15:28:19
1 跟貼 1

新智元

AI產業主平臺領航智能+時代

14869文章數 66735關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

親子

時尚

教育

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

斯坦福MIT天團出手！1美元養龍蝦，圖文視頻全包，打工人神外掛

甲骨文血洗3萬人，47人團隊僅留3人

凱越機車疑內涵張雪機車奪冠:在你來之前我們就是冠軍

凱越機車疑內涵張雪機車奪冠:在你來之前我們就是冠軍

NBA擴軍，和籃球無關？

宋寧峰人設崩塌！帶娃偷情+反向索賠

電商售械三水光針 機構倒貨or假貨猖獗?

三電可靠 用料下本 百萬公里的蔚來ES6 拆開看

態度原創

從學徒到世界冠軍，為什么說張雪的底氣在重慶？

孩子大點就“臭了”，難怪說是“臭小子”！

大牌必修課|| 為什么那些很會穿的人，都迷上了優雅運動風？

復試殘酷真相！淘汰率最高 91.7%！

電商售械三水光針機構倒貨or假貨猖獗?

三電可靠用料下本百萬公里的蔚來ES6 拆開看