337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

從經歷到知識:UIUC、清華PlugMem如何重構Agent記憶

0
分享至


新智元報道

編輯:LRST

【新智元導讀】現在的AI agent往往把長交互歷史直接存起來,但很難高效復用。最樸素的方法直接從「原始記憶」里檢索,但常常把模型淹沒在冗長、低價值的上下文里。PlugMem把經驗轉化為結構化、可復用的知識,并提出一個任務無關(task-agnostic)的統一記憶模塊,在多種Agent基準上提升性能,同時消耗更少。

隨著AI agent承擔越來越復雜的任務——長對話、多步推理、交互式網頁導航等——它們必須記住并復用過去的經驗。

但多數現有記憶系統更像「日志文件」:不斷累積原始交互軌跡,需要時再從中取出一些文本片段。時間一長,記憶會無限增長、噪聲增多,并迅速擠占agent的上下文窗口。

于是出現一個悖論:AI agent擁有前所未有的「記憶量」,卻依然難以有效使用。然而,對決策真正重要的內容,往往不是完整的交互記錄,而是從記錄中沉淀出的知識。

比如做商品推薦時,agent需要記住用戶偏好,而不是反復閱讀長對話;在新網站購物時,agent需要的是「如何搜索、篩選、下單」的通用策略,而不是重放自己看過的每一個頁面。

AI agent記憶問題的核心挑戰并非「存更多」,而是以能突出決策相關信息的方式組織記憶

UIUC、清華大學最新提出的AI agent的記憶方法PlugMem:一個任務無關、即插即用的記憶模塊,用來把智能體的原始經驗轉化為可復用知識。PlugMem不把記憶當作扁平文本來檢索,而是借鑒認知科學,將經驗結構化為以知識為中心的表示。


論文鏈接:https://arxiv.org/abs/2603.03296

代碼鏈接:https://github.com/TIMAN-group/PlugMem

認知科學通常區分三類記憶:對事件的回憶、對事實的知識、以及對技能/策略的掌握。事件提供背景,但有效決策依賴從事件中抽象出的事實與技能。這一視角啟發我們重新思考 AI agent 的記憶設計。

PlugMem將對話、文檔、網頁軌跡等異構交互記錄,轉化為結構化的知識單元:更緊湊、更可復用,并且與決策直接對齊。

PlugMem包含三個核心組件:

  1. Structuring(結構化) 將原始情景經驗標準化,并提取為兩類知識:命題式知識(facts)與處方式知識(skills、可復用技能/策略)。這些知識單元被組織為結構化的記憶圖。

  2. Retrieval(檢索) 不再檢索冗長文本塊,而是檢索與當前任務語義對齊的知識單元。高層概念與意圖(concepts / intents)作為「路由信號」,幫助快速定位最相關的內容。

  3. Reasoning(推理/壓縮) 把檢索到的知識進一步壓縮為簡潔、可直接用于當前任務的指引,再交給AI agent使用,從而更高效地利用上下文。


PlugMem將異構智能體經驗組織為知識中心的記憶圖,實現結構化檢索與推理。

PlugMem與傳統GraphRAG系統的關鍵差別在于「記憶訪問單元」。傳統方法通常索引文本chunk或實體;PlugMem以知識單元(命題與處方)作為基本構件。這樣的設計減少冗余、提升信息密度,并提高檢索精度。

一個能跨任務遷移的記憶模塊

很多記憶系統往往為特定基準精心定制:例如對話記憶、知識密集問答、網頁智能體等。這類任務特定記憶模塊在單一場景里可能表現很好,但換任務往往要重新設計。

PlugMem選擇了另一種方法:作為一個即插即用的通用記憶骨架,可以直接接到不同AI agent上,無需針對任務做專門修改。文中用同一個模塊、保持實現不變,在三個異構基準上評測:長程對話式問答、基于維基百科的多跳知識檢索、交互式網頁決策任務。

結果顯示:PlugMem在三種設置下都穩定提升了任務表現,超過了通用檢索方法與多種任務特定記憶設計。更重要的是,這些提升是在向AI agent上下文注入顯著更少記憶智元(token)的前提下實現的。

用「效用」衡量記憶

而不是用「大小」

只看任務準確率并不能反映記憶系統的關鍵能力:記憶模塊必須在「決策效用」和「上下文成本」之間權衡。

因此PlugMem工作中提出一個信息論指標,用來度量記憶系統每消耗一個智元(token),能帶來多少「決策相關的信息增益」。直觀地說:記憶模塊產生的記憶智元(token)能讓AI agent對正確行動更有把握多少?接著再按記憶長度做歸一化。

在效用–成本空間里,PlugMem穩定處于更有優勢的位置:更低智元(token)成本下獲得更高的決策效用。


在多種基準上,PlugMem在更小的記憶預算下提供更高的決策相關效用。

這些結果支持一個結論:把經驗轉化為知識,比直接檢索原始日志更緊湊、更有信息量。

超過任務特定設計

乍看之下,一個任務無關的記憶模塊能超過為某個基準量身定制的方法似乎有些反直覺。PlugMem的結果表明,決定性因素往往不是特定benchmark的啟發式技巧,而是對「決策相關知識抽取」的有效檢索。

沒有檢索,記憶只是靜態存儲;沒有結構化知識,檢索就缺乏精度。PlugMem將以下三件事拆開并協同:結構化決定「可被檢索的內容是什么」,檢索決定「記憶是否真的能幫助決策」,推理/壓縮確保「以更低成本被AI智能體利用」。

PlugMem也不試圖取代任務特定技巧。它更像一個通用記憶底座,上層依然可以疊加任務適配。實驗也顯示:在PlugMem之上再加入任務特定啟發式探索方法,往往還能進一步提升效果,二者具有互補性。

走向智能體的「可復用知識基礎設施」

當AI agent邁向更長程的自主能力,記憶需要從被動存儲走向成為主動的知識基礎設施:agents應當積累可遷移的事實與策略,讓知識跨任務、跨環境復用,緩解AI agents冷啟動問題,并支持更強的泛化。

PlugMem是朝這個方向邁出的一步。它以認知科學為設計啟發,將「知識」作為復用的基本單位,展示了任務無關記憶在效率與能力上同時可行。

更廣義地看,這項工作提示了一個視角轉變:與其追求檢索更多上下文,不如追求把經驗表示成天然可復用的形式。隨著智能體能力擴展,可擴展、可遷移的記憶系統將成為基礎設施;知識中心的記憶很可能是下一代智能體的重要基石。

參考資料:

https://arxiv.org/abs/2603.03296


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
炸! 20歲華人開車在美軍基地放炸彈后逃回中國! 姐姐毀滅證據被抓

炸! 20歲華人開車在美軍基地放炸彈后逃回中國! 姐姐毀滅證據被抓

北國向錫安
2026-03-27 09:00:38
張雪峰追悼會定于本周六,喪事從簡不搞排場,11歲女兒成全家心病

張雪峰追悼會定于本周六,喪事從簡不搞排場,11歲女兒成全家心病

未曾青梅
2026-03-26 22:48:49
杜月笙在河邊釣魚,遇到地痞要保護費,杜月笙:找你們老板過來

杜月笙在河邊釣魚,遇到地痞要保護費,杜月笙:找你們老板過來

千秋文化
2026-03-25 21:29:50
能讓美國的《紐約時報》報道,張雪峰也值了!也是史上留名了

能讓美國的《紐約時報》報道,張雪峰也值了!也是史上留名了

雪中風車
2026-03-28 05:34:46
“霍爾木茲決戰”,攤牌了

“霍爾木茲決戰”,攤牌了

中國新聞周刊
2026-03-27 20:31:04
胡塞要求美以停止侵略伊朗

胡塞要求美以停止侵略伊朗

財聯社
2026-03-28 09:14:06
鄭麗文來京時間確定,馬英九拒絕通話,大陸發出統一后安排

鄭麗文來京時間確定,馬英九拒絕通話,大陸發出統一后安排

聚焦幕后
2026-03-28 06:53:37
張雪峰女兒發聲悼念惹淚目,員工回應其二婚爆料,靈堂遺照已曝光

張雪峰女兒發聲悼念惹淚目,員工回應其二婚爆料,靈堂遺照已曝光

小徐講八卦
2026-03-28 06:21:26
霍爾木茲海峽停擺,浙江這位船商卻公開承諾:不加價!他說這是浙江人的契約精神

霍爾木茲海峽停擺,浙江這位船商卻公開承諾:不加價!他說這是浙江人的契約精神

都市快報橙柿互動
2026-03-28 00:20:22
江蘇一市紀委監委通報:張國光、顧峰、李軍、史肇源被查

江蘇一市紀委監委通報:張國光、顧峰、李軍、史肇源被查

揚子晚報
2026-03-28 08:07:08
宋喆出獄后現狀:縣城搬菜月入三千,前妻楊慧橫店開公司年入千萬

宋喆出獄后現狀:縣城搬菜月入三千,前妻楊慧橫店開公司年入千萬

一盅情懷
2026-03-26 14:47:59
虐心!伊朗男足手捧書包+含淚唱國歌:臂纏黑紗 悼念空襲遇難學生

虐心!伊朗男足手捧書包+含淚唱國歌:臂纏黑紗 悼念空襲遇難學生

風過鄉
2026-03-28 06:32:57
羅技中國致歉:感到震驚與痛心,完全理解并感同身受每一位玩家的失望與憤怒,將深刻檢討

羅技中國致歉:感到震驚與痛心,完全理解并感同身受每一位玩家的失望與憤怒,將深刻檢討

都市快報橙柿互動
2026-03-27 00:31:44
擁有30多個博士學位,李昌鈺談被稱為“當代福爾摩斯”:我不是神探是科學家,以華人身份感到驕傲

擁有30多個博士學位,李昌鈺談被稱為“當代福爾摩斯”:我不是神探是科學家,以華人身份感到驕傲

極目新聞
2026-03-28 08:40:33
中美俄石油儲量對比:俄800億桶,美國超700億桶,中國有多少?

中美俄石油儲量對比:俄800億桶,美國超700億桶,中國有多少?

福建平子
2026-03-27 11:27:57
很多人只看到了"老頭樂起訴小米"的荒誕感,卻沒看到雷軍不敢戀戰背后的“惶恐”

很多人只看到了"老頭樂起訴小米"的荒誕感,卻沒看到雷軍不敢戀戰背后的“惶恐”

新浪財經
2026-03-28 00:31:15
吉格斯:坎通納干啥弗格森都不罵他;曼聯有些教練團隊爛透了

吉格斯:坎通納干啥弗格森都不罵他;曼聯有些教練團隊爛透了

懂球帝
2026-03-28 05:45:32
暴跌95%,裁員5萬人,全球第二大車企爆大雷

暴跌95%,裁員5萬人,全球第二大車企爆大雷

蔣東文
2026-03-27 21:09:47
伊朗武裝部隊發言人:伊朗正在制定戰爭結束條件

伊朗武裝部隊發言人:伊朗正在制定戰爭結束條件

財聯社
2026-03-28 04:50:19
福特號士兵叛亂?士兵縱火真實目的曝光,44名美軍死亡只是開始

福特號士兵叛亂?士兵縱火真實目的曝光,44名美軍死亡只是開始

樂天閑聊
2026-03-28 04:13:06
2026-03-28 10:59:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
14829文章數 66720關注度
往期回顧 全部

科技要聞

遭中國學界"拉黑"后,這家AI頂會低頭道歉

頭條要聞

前大廠員工開"網絡賭場" 三個月吸金1900萬

頭條要聞

前大廠員工開"網絡賭場" 三個月吸金1900萬

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

范瑋琪加盟,官宣《浪姐7》遭全網抵制

財經要聞

我在小吃培訓機構學習“科技與狠活”

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

親子
時尚
本地
旅游
藝術

親子要聞

科學運動 助力提升女性生育力

推廣中獎名單-更新至2026年3月11日推廣

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

旅游要聞

解鎖五大春日新玩法 2026年重慶大足石刻國際旅游文化節4月啟幕

藝術要聞

華國鋒與耿飚的草書書信,你見過嗎?氣勢恢宏引發熱議!

無障礙瀏覽 進入關懷版