337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

模型編輯新范式,HSE實現大規模“安全洗腦”且能力反升

0
分享至


始智AI wisemodel.cn社區是源自中國的中立開放的AI開源社區。正在,歡迎加入共同成長。wisemodel推出邀請注冊獎勵活動,最高可得算力券+token包380元獎勵,歡迎參與和支持!

你是否想過,我們是如何“修正”大模型(LLM)的記憶的?這個過程叫做“模型編輯”(Model Editing)。它就像是給大模型“打補丁”或“更新記憶” ,比如告訴它一個新事實,或者糾正一個它的“幻覺”。

但一個核心問題是:你今天剛教會它“拜登是第46任總統”,明天它可能就忘了“特朗普是第45任”;你剛給它更新了最新的醫療知識,它在回答通用問題時就開始“胡言亂語”。對大模型進行持續的知識更新,是否必然導致“災難性遺忘”(catastrophic forgetting)?是不是模型一編輯,就必然“性能崩潰”(model collapse)?

來自國防科技大學 PDL的研究團隊,在發表于NeurIPS 2025 的最新論文中,從生物大腦中汲取靈感,給出了一個顛覆性的答案:給大模型裝上“海馬體”!

研究團隊受人腦海馬體處理記憶的“三突觸回路”啟發,提出了一種全新的類海馬體序列編輯(HSE)框架。該框架通過三大核心機制,徹底改變了模型編輯的“游戲規則”。當其他模型在連續編輯數百次后性能就“雪崩”至零時,HSE在連續編輯1000次后,通用能力不僅毫發無損,甚至還超越了原始模型!已上線始智AI-wisemodel開源社區,歡迎體驗。


代碼地址

https://wisemodel.cn/codes/SquareGroupsky/Hippocampal-like-Sequential-Editing

01.

揭秘HSE的“海馬體”三部曲

為什么大模型會遺忘?因為它們缺乏人腦的精妙機制。HSE框架則模擬了海馬體的三大法寶:

1.機制一:主動遺忘(Active Forgetting)

靈感來源:人腦會通過長時程抑制(LTD)機制主動忘記過時或沖突的信息。

HSE做法:引入“機器遺忘”(Machine Unlearning)策略。在學習新知識過程中,“主動忘記”那些即將過時的舊知識,為新記憶騰出“神經空間”,從根源上解決新舊沖突。


2.機制二:領域分離(Knowledge Separation)

靈感來源:海馬體的齒狀回(DG)具有“模式分離”(Pattern Separation)功能,能將相似的輸入信息映射到完全不同的神經元上,互不干擾。

HSE做法:使用“Fisher Information Matrix” (FIM)來指導參數更新。FIM能識別出對不同知識領域最重要的參數,在編輯時“精準控制”更新幅度,確保編輯“醫療知識”時,不會干擾到“藝術知識”,防止跨域干擾。


3.機制三:參數回放(Parameter Replay)

靈感來源:人腦在休息時,海馬體會“回放”(Replay)白天的經歷(SWRs),將短期記憶固化為長期記憶。

HSE做法:設計了一種高效的“參數回放”機制。它以一種輕量化的參數形式,不斷“鞏固”所有編輯過的歷史知識,最終推導出嚴謹的閉式解(closed-form solution),在數學上保證了長期記憶的穩定。


02.

為什么HSE在數學上更優?

這篇成果的亮點絕不僅在于“仿生”,更在于其堅實的理論貢獻:

1.更緊的泛化界(Tighter Generalization Bound):

研究者從數學上證明,其“主動遺忘”模塊(MAF Loss)相比傳統的交叉熵損失(CE Loss),能帶來更緊的泛化誤差上界(Corollary 1) 。


2.可證明的收斂性(Provable Convergence):

研究者證明了其“參數回放”模塊(LEM)的更新范數(Frobenius norm)是收斂的


3.AlphaEdit只是一個特例:

AlphaEdit 是模型編輯領域一個強力的基線。但HSE從理論上指出,AlphaEdit的知識正交化方法,在數學上只是HSE所提出的參數回放公式的一個特例。實驗也表明,HSE的效果顯著優于AlphaEdit 。


4.F-Norm洞察:

模型的抗編輯性論文還揭示了一個關鍵洞察:原始模型的F-NormFrobenius Norm)越大,模型越抗編輯。Llama3和Mistral的F-Norm遠小于GPT-J ,這導致它們對編輯更敏感,也更容易“崩潰” 。而HSE的LEM模塊,正是通過約束F-Norm的增長,才成功駕馭了這些敏感模型 。


03.

不僅沒遺忘,通用能力還變強了?

堅實的理論帶來了驚人的實驗效果。研究團隊在Llama3等多個主流模型上,進行了多達1000次的序列編輯實驗 。驚人現象出現了:

1.終結模型崩潰

在評估通用能力的GLUE基準測試上,現有的方法(如MEND、MEMIT、PRUNE)在經歷幾百次編輯后,性能無一例外地急劇下降至接近零,模型徹底“崩潰” 。


HSE框架,在經歷了1000次編輯后,性能曲線幾乎紋絲不動,甚至在使用ZsRE數據集編輯后,平均性能還提升了1.67%這意味著HSE不僅修復了知識,還順便提升了模型的通用理解能力。

2.編輯性能遙遙領先

在CounterFact和ZsRE兩個標準的模型編輯基準上,HSE的編輯效果也全面占優。與最佳基線相比,HSE泛化性上平均提升20.6%特異性上提升21.9%


3.解決真實世界難題

研究者還在三大實際應用中驗證了HSE的威力:

緩解幻覺:在HalluEdit數據集上,HSE在9個不同領域均能有效緩解模型幻覺。


醫療知識注入:成功為專業醫療大模型注入新大的醫療知識,且不破壞原有專業性。


減少社會偏見:在SafeEdit數據集上,HSE能有效“遺忘”有害和歧視性內容,顯著提升模型安全性 。


這項研究不再滿足于模型編輯的“小修小補”,而是從生物機制出發,首次提出了一套完整的、受海馬體啟發的序列編輯框架HSE 。

通過主動遺忘領域分離參數回放三大機制HSE在理論上被證明具有更緊的泛化界和更穩定的收斂性,在實踐中則首次實現在大規模序列編輯后,通用能力不降反升的驚人效果。這為大模型實現“終身學習”和“持續進化”提供了一條極具潛力的技術路徑。

----- END -----


wisemodel相關:

系列模型:

關于wisemodel更多

1

歡迎持續關注和支持

開源社區建設需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻和維護,歡迎大家加入wisemodel開源社區的志愿者計劃和開源共創計劃。期待更多開發者將開源成果,包括模型、數據集和代碼等發布到 wisemodel.cn 社區,共建中立、開放的AI開源社區生態。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續關注wisemodel.cn開源社區動態。

2

歡迎加盟wisemodel開源社區

始智AI wisemodel社區自2023年9月上線以來,逐漸成為影響力日益擴大的中立開放的AI開源社區,為了加快公司發展,我們長期需要技術、運營等人才加盟,技術側重在AI infra、后端開發,熟悉K8S、模型訓練和推理等技術, 以及熟悉開發者生態運營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn

3

歡迎投稿優質內容

歡迎投稿分享人工智能領域相關的優秀研究成果,鼓勵高校實驗室、大企業研究團隊、個人等,在wisemodel平臺上分享各類優質內容,可以是AI領域最新論文解讀、最新開源成果介紹,也可以是關于AI技術實踐、應用和總結等。投稿可以發郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關于wisemodel開源社區

始智AI wisemodel.cn開源社區由清華校友總會AI大數據專委會副秘書長劉道全創立,旨在打造和建設中立開放的AI開源創新社區,將打造成“HuggingFace”之外最活躍的AI開源社區,匯聚主要AI開源模型、數據集和代碼等,歡迎高校科研院所、大型互聯網公司、創新創業企業、廣大個人開發者,以及政府部門、學會協會、聯盟、基金會等,還有投資機構、科技媒體等,共同參與建設AI開源創新生態。

向上滑動查看

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
震驚!張雪峰助理萬霞竟是公司“001號員工”陪創業9年成最強搭檔

震驚!張雪峰助理萬霞竟是公司“001號員工”陪創業9年成最強搭檔

鄉野小珥
2026-03-26 21:28:25
費率0.3%,社保“第六險”來了,退休人員也要交

費率0.3%,社保“第六險”來了,退休人員也要交

財話連篇
2026-03-26 13:09:33
掛斷王毅電話后,伊朗向全球發出"照會",把小薩拉曼鼻子都氣歪了

掛斷王毅電話后,伊朗向全球發出"照會",把小薩拉曼鼻子都氣歪了

聞香閣
2026-03-25 22:48:26
調查發現:若50歲前沒患這4種疾病,以后患癌的幾率或微乎其微?

調查發現:若50歲前沒患這4種疾病,以后患癌的幾率或微乎其微?

醫學科普匯
2026-03-26 20:55:03
瘋爽被塘主追著求復合

瘋爽被塘主追著求復合

毒舌扒姨太
2026-03-26 22:44:25
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
震碎三觀!鄧兆尊節目自曝多人運動,交3個女友還能一碗水端平

震碎三觀!鄧兆尊節目自曝多人運動,交3個女友還能一碗水端平

橙星文娛
2026-03-26 09:20:10
陳云晚年首次披露:遵義會議上這兩個人死活不同意毛主席,吵得面紅耳赤

陳云晚年首次披露:遵義會議上這兩個人死活不同意毛主席,吵得面紅耳赤

老杉說歷史
2026-03-21 17:38:44
馬英九疑似患失智癥,臺律師:大陸已注意到,沒讓其擔任統一大使

馬英九疑似患失智癥,臺律師:大陸已注意到,沒讓其擔任統一大使

卷史
2026-03-26 20:08:36
我們看印度人是奇葩,印度人看我們也一樣?真相是我們想象的百倍

我們看印度人是奇葩,印度人看我們也一樣?真相是我們想象的百倍

番外行
2026-03-24 13:04:28
50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

Hi科普啦
2026-03-25 14:57:31
斬草除根!美以聯合空襲打擊伊朗伊斯法罕關鍵光電及導彈研究設施

斬草除根!美以聯合空襲打擊伊朗伊斯法罕關鍵光電及導彈研究設施

軍迷戰情室
2026-03-25 07:42:05
伊朗戰爭還將持續多久?據傳特朗普希望4-6周內終結戰事

伊朗戰爭還將持續多久?據傳特朗普希望4-6周內終結戰事

財聯社
2026-03-26 18:29:05
開源作者把5個免費賬號拼成1個無限額度,AI公司還沒反應過來

開源作者把5個免費賬號拼成1個無限額度,AI公司還沒反應過來

報錯免疫體
2026-03-26 12:07:59
有網友在大冰直播間看到彈幕稱張雪峰因心臟驟停離世,大冰隨即回應:我下午就已得知此事,心情十分沉重

有網友在大冰直播間看到彈幕稱張雪峰因心臟驟停離世,大冰隨即回應:我下午就已得知此事,心情十分沉重

畫夕
2026-03-26 01:20:12
巴蒂:馬拉多納離世時身邊沒有人,最后走得像條狗一樣

巴蒂:馬拉多納離世時身邊沒有人,最后走得像條狗一樣

懂球帝
2026-03-26 06:43:02
2-0晉級八強!中國女網15歲新星連續爆冷真猛:下一輪對決王曦雨

2-0晉級八強!中國女網15歲新星連續爆冷真猛:下一輪對決王曦雨

李喜林籃球絕殺
2026-03-26 17:04:26
中國移動官宣!4月30日起全國統一執行,事關所有手機號

中國移動官宣!4月30日起全國統一執行,事關所有手機號

Thurman在昆明
2026-03-26 13:35:46
看了新加坡媒體的披露,我才知道,中國已經沒必要向世界證明什么

看了新加坡媒體的披露,我才知道,中國已經沒必要向世界證明什么

觸摸史跡
2026-03-21 02:58:06
人類史上最高級零元購,榨干印度200年,留下45萬億天價賬單

人類史上最高級零元購,榨干印度200年,留下45萬億天價賬單

掠影后有感
2026-03-26 10:39:36
2026-03-27 00:40:49
wisemodel開源社區 incentive-icons
wisemodel開源社區
始智AI wisemodel.cn開源社區,打造中國版“huggingface”
466文章數 14關注度
往期回顧 全部

科技要聞

美團發布外賣大戰后成績單:虧損超200億

頭條要聞

張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發聲!稱姐姐受身邊人挑撥

財經要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

旅游
健康
親子
教育
房產

旅游要聞

老外為羊拿鐵扎堆魔都街頭 法國游客花式夸上海

轉頭就暈的耳石癥,能開車上班嗎?

親子要聞

看看把孩子嚇得哈哈哈

教育要聞

精準研判,提質增效丨我校召開2026屆畢業生就業工作研判會

房產要聞

突發,三亞又有大批征遷補償方案出爐!

無障礙瀏覽 進入關懷版