337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

DeepSeek論文發表16天后,國內團隊已經寫出了模型的「生物字典」

0
分享至


來源:AI思想會

【前言】AI 正以前所未有的速度發展,新的機遇不斷涌現,如果你希望:與技術專家、產品經理和創業者深度交流,一起探索 AI如何改變各行各業。歡迎在文末掃二維碼,加入「AI思想會」交流群,和一群志同道合的伙伴共同學習、思考、創造!

今年 1 月,DeepSeek 發布了一項名為 Engram(條件記憶)的技術,在大模型圈子里掀起不小波瀾。

它的核心思想很簡單:別讓模型死記硬背常識,直接給它一個「外掛記憶庫」。

具體做法是:把常見的 N-gram,比如「人工智能」、「光合作用」,預先存進一個哈希表,模型需要時查表即可,省下大量算力專注推理。

這個思路,能不能用在其他領域的模型訓推上?答案是:能,且效果驚人。

就在 Engram 論文(《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》)發布僅 16 天后,同樣 base 在杭州的一支研發團隊,推出Gengram(Genomic Engram)模塊,把「外掛字典」搬進了基因組世界。


  • 代碼鏈接: https://github.com/zhejianglab/Gengram

  • 模型鏈接: https://huggingface.co/ZhejiangLab/Gengram

  • 論文鏈接: https://github.com/zhejianglab/Gengram/tree/main/paper

傳統方法的困境:為每個堿基「重復造輪子」

當前,主流的基因組基礎模型(Genomic Foundation Models, GFMs),如 Deepmind 的 AlphaGenome 等,普遍采用一種叫「單堿基分詞」的策略,也就是把 DNA 序列拆成一個個單獨的字母(A/T/C/G)來處理。

這聽起來非常符合生物學邏輯,并且操作精度更高,然而代價也是巨大的。

首先是效率低下。要識別一個關鍵功能片段(比如啟動子或剪接位點),模型得靠多層注意力機制,從零開始「拼湊」出像「TATAAAA」這樣的經典堿基組合(Motif)。

其次是容易迷失。在動輒幾萬甚至幾十萬堿基的長序列中,模型常常「只見樹木,不見森林」,何況人類的基因組是一串長達 30 億字符的連續序列。

用更容易理解的方式來打個比方:人類學習「魑魅魍魎」時,一眼就能理解這是個成語。但傳統的基因組模型卻得先分析每個「鬼」字究竟是什么鬼…… 既要區分又要預測,最終結果就是既費力,又不準。

Gengram 是怎么工作的?

Gengram 的核心邏輯承襲自 Engram:將「靜態的 Motif 識別」與「動態的上下文推理」進行解耦處理

Gengram 預先構建了一個可微分的哈希表,存儲所有長度為 1 到 6 的 DNA 片段(稱為 k-mer,如「ATG」、「CGTA」)對應的語義向量。這些 k-mer 很多就是已知的生物學功能單元(比如轉錄因子結合位點),相當于給 AI 配了一本《基因組學實用短語手冊》。

與其他領域相比,DNA 只有 4 個字母(A/T/C/G)及少量未知堿基(N)構成,整個字符集極小。Gengram 無需承擔復雜的 Tokenizer 壓縮負擔,查表速度極快,幾乎不增加計算開銷。

事實上,由于功能重要性不同,并非所有 Motif 都需要這本「字典」的加持。為此,Gengram 引入了動態門控機制

模型可以結合上下文語境自主決定何時「查字典」:在遇到外顯子、啟動子等關鍵 Motif 區域時激活檢索功能;在通過非編碼背景區域時關閉檢索,依賴推理,優化資源。

經團隊測試,這個門控目前已經掌握了「什么時候該查詢參考資料,什么時候該獨立思考」的判斷能力。

小模塊,大提升

事實上,Gengram 只是一個僅約 2000 萬參數的輕量化插件,對于百億級規模的模型來說微不足道,但它帶來的性能提升卻令人振奮。

在 8k 和 32k 兩個上下文版本中,同等訓練設定下,應用了 Gengram 的模型幾乎在所有任務里領先未應用的版本。

其中,剪接位點預測 AUC 提升了16.1%(從 0.776 到 0.901),表觀遺傳預測任務(H3K36me3) AUC 提升了22.6%(從 0.656 到 0.804)。

這種跨越式的性能飛躍,賦予了模型驚人的數據杠桿效應。

在與多款主流 DNA 基礎模型的橫向測評中,集成 Gengram 的模型僅需極小規模的訓練數據,和較小的激活參數量,便能在核心任務上媲美乃至超越訓練數據規模領先其數十倍的公開模型,大幅提升了模型訓練的數據能效比。

同時,Gengram 展現出了卓越的通用適配能力,能夠跨越 Dense(稠密) 與 MoE(混合專家) 等不同模型架構實現無縫部署。

無論采用何種注意力機制變體,Gengram 均能在有效降低訓練損失的同時,顯著加速模型收斂。特別是針對 MoE 架構中專家負載失衡這一頑疾,Gengram 通過吸收局部高頻噪聲,顯著改善了專家負載均衡,實現了模型性能與架構效率的協同跨越。



跨稀疏度負載均衡:在 Top-2 / 128、64 和 32 專家配置下,使用與不使用 Gengram 模塊的負載均衡損失曲線對比,表明其在多種稀疏度設置下均能實現穩定性能。

此外,模型開始「涌現」出對 DNA 物理本質的理解。

當團隊為 Gengram 局部聚合窗口(Local Window Aggregation)測試窗口大小策略時,結果顯示:窗口大小參數設置為 21bp 時,其性能達到峰值

為什么偏偏是 21?

因為 DNA 雙螺旋結構每 10.5 個堿基旋轉一圈,而 21 個堿基正好對應兩個完整的螺旋周期。這意味著,每相隔 21bp 的堿基在物理空間上其實位于螺旋的同一側,具備相似的生化環境和特征。

換句話說,Gengram 在沒有學習過任何結構生物學知識的前提下,通過計算自己悟到了 DNA 序列信息和空間相位規律。



DNA 雙螺旋結構示意圖展示了 B 型 DNA 的結構參數,DNA 雙螺旋每 10.5 個堿基對旋轉一圈。



不同 Gengram 窗口大小下的驗證損失,由此選擇了 21 寬度的窗口

范式啟示:Gengram 為 AI 科學模型提供新探索路徑

Gengram 的成功,遠不止于解決基因組建模的特定難題。它更像一個精巧的概念驗證,為如何構建新一代懂科學的 AI 探索了一種新的模式。

從「暴力記憶」到「結構化知識外掛」:效率范式的轉變。傳統 AI 模型增強能力主要靠擴張參數與數據,本質是讓網絡更費力地「記住」 一切。Gengram 則將領域內確鑿的、結構化的先驗知識(如功能 Motif)做成一個輕量、可查詢的外部知識庫。這讓核心模型能從繁瑣的模式記憶中解脫,專注于更高級的上下文推理與組合創新。這預示著,未來科學基礎模型的架構,可能是「通用模型核心+多個領域專用插件」的協同形態。

「歸納偏置」注入:生物物理規律的「硬編碼」。通過將 B 型 DNA 雙螺旋每 10.5 個堿基完成一個旋轉周期(即約 21 bp 的雙圈周期)這一結構特性,顯式轉化為模型內部的局部窗口機制,Gengram 成功地將這種物理空間相位的周期性作為先驗知識注入模型,使其能夠捕捉特定相位的立體化學模式和蛋白質綁定偏好。

可解釋性的內生設計:讓 AI 的「思維過程」透明化。模型不再僅僅進行隱式的統計擬合,而是通過顯式的 Hash 查詢和門控記憶通路,在淺層即展現出對 TATA-box、poly (T) 等關鍵功能基元的高度敏感性,其內部殘差強度的峰值與基因組功能邊界精準對齊,實現了從「黑盒計算」向「具備生物學認知足跡」的演進。

解決長程依賴的新路徑:從局部最優到全局洞察。實驗證明,Gengram 使得僅在 8K 長度上訓練的模型,卻獲得了處理 32K 長序列的優異能力。這為基因調控元件預測、表觀遺傳學分析、跨物種進化分析以及復雜的多組學建模等復雜長序列問題,開辟了精細化局部感知驅動全局理解的新途徑。

Gengram 建立了一種將領域特有規律轉化為顯式架構約束的創新范式,證明了通過精細化的局部結構化感知可以有效彌補標稱上下文長度的局限,實現低成本且高效的長程依賴建模。

低調的 Genos Team 是啥背景?

盡管論文署名低調地使用了「Genos Team」,但從開源代碼庫的 Zhejianglab 和 BGI-HangzhouAI 能夠推斷出這支團隊的硬核背景:一家是坐落在杭州的專注于智能計算的新型研發機構之江實驗室,另一家是杭州華大生命科學研究院。

兩個團隊的融合,構建起「AI + 生命科學」的交叉創新壁壘,這是純 CS 團隊或純基因團隊無法比擬的優勢。

論文里的實驗,大多基于人類基因組基礎模型 Genos 實現,從可公開獲取的信息來看,Genos 多數指標都超越了目前的業界頂流 Evo-2

閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”

https://wx.zsxq.com/group/454854145828


未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊朗女足球員:澳方承諾給我們房子、車子和永居權,來說服我們留下

伊朗女足球員:澳方承諾給我們房子、車子和永居權,來說服我們留下

懂球帝
2026-03-30 13:45:07
張雪峰遺體轉運畫面流出!前妻和現任妻子現身,下屬向遺像三叩首

張雪峰遺體轉運畫面流出!前妻和現任妻子現身,下屬向遺像三叩首

博士觀察
2026-03-29 11:52:26
這就是張雪峰在蘇州的日常! 沒有排場!沒有架子!一輛電動車

這就是張雪峰在蘇州的日常! 沒有排場!沒有架子!一輛電動車

歲月有情1314
2026-03-30 13:51:45
捷豹路虎:以品牌重塑與戰略定力,開拓豪華新局

捷豹路虎:以品牌重塑與戰略定力,開拓豪華新局

汽車投訴網
2026-03-30 11:51:58
2025年營收3452億創新高 吉利汽車進階全球智能汽車新賽道

2025年營收3452億創新高 吉利汽車進階全球智能汽車新賽道

車回路轉
2026-03-20 16:32:09
65歲大爺的睿智養老:不雇保姆不住養老院,而是找個年輕老伴伺候

65歲大爺的睿智養老:不雇保姆不住養老院,而是找個年輕老伴伺候

烙任情感
2026-03-29 12:46:57
無緣世界杯!80歲老帥賽后氣暈+無法呼吸 緊急送醫已無法指揮比賽

無緣世界杯!80歲老帥賽后氣暈+無法呼吸 緊急送醫已無法指揮比賽

風過鄉
2026-03-30 08:24:19
2天2連冠 張雪機車讓對手們集體抱頭:為中國制造代言 舉國旗落淚

2天2連冠 張雪機車讓對手們集體抱頭:為中國制造代言 舉國旗落淚

風過鄉
2026-03-30 07:52:28
太原一建筑起火致3死23傷,目擊者:起火時建筑外立面燃燒脫落;附近居民:事故發生前曾提醒燒烤店,上方煙囪管道不安全

太原一建筑起火致3死23傷,目擊者:起火時建筑外立面燃燒脫落;附近居民:事故發生前曾提醒燒烤店,上方煙囪管道不安全

大風新聞
2026-03-30 15:05:24
1斤低至4.9元!豬肉價格持續“跳水”,養一頭要虧225元,行業預計下半年回暖

1斤低至4.9元!豬肉價格持續“跳水”,養一頭要虧225元,行業預計下半年回暖

紅星資本局
2026-03-29 20:10:11
重磅!我國臺辦正式宣布,鄭麗文訪問大陸行程確定,盧秀燕不裝了

重磅!我國臺辦正式宣布,鄭麗文訪問大陸行程確定,盧秀燕不裝了

DS北風
2026-03-30 11:58:08
一位女企業家的三件“傻事”

一位女企業家的三件“傻事”

吳曉波頻道
2026-03-27 08:32:56
伊朗:美軍撤離伊邊境鄰近地區,美多架預警機和加油機被擊落,多處倉庫被摧毀,未來更多高價值目標將被列入打擊名單

伊朗:美軍撤離伊邊境鄰近地區,美多架預警機和加油機被擊落,多處倉庫被摧毀,未來更多高價值目標將被列入打擊名單

魯中晨報
2026-03-30 07:09:20
25歲“天后”單依純終于走到今天這步,李健6年前的預言應驗了!

25歲“天后”單依純終于走到今天這步,李健6年前的預言應驗了!

八卦南風
2026-03-30 10:40:29
2500名美海軍陸戰隊抵近,德黑蘭為何威脅炸掉自己的“錢袋子”?

2500名美海軍陸戰隊抵近,德黑蘭為何威脅炸掉自己的“錢袋子”?

楓葉君評
2026-03-30 10:54:48
被驅逐的伊朗大使拒離境后被強行從館內拖出,頭部疑被打

被驅逐的伊朗大使拒離境后被強行從館內拖出,頭部疑被打

桂系007
2026-03-30 04:00:12
伊朗總統指責革命衛隊總司令,強調若不停火,伊朗經濟將崩潰

伊朗總統指責革命衛隊總司令,強調若不停火,伊朗經濟將崩潰

山河路口
2026-03-29 16:15:55
善惡有報!逼人民日報怒批、暗諷張雪峰,1300萬網紅終為荒唐買單

善惡有報!逼人民日報怒批、暗諷張雪峰,1300萬網紅終為荒唐買單

觀察鑒娛
2026-03-29 09:24:41
東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

談史論天地
2026-03-29 16:10:03
下周將啟程訪問大陸,鄭麗文:為兩岸和平穩定跨出成功第一步

下周將啟程訪問大陸,鄭麗文:為兩岸和平穩定跨出成功第一步

海峽導報社
2026-03-30 12:17:04
2026-03-30 16:00:49
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4616文章數 37441關注度
往期回顧 全部

科技要聞

DeepSeek性能異常問題已解決,服務恢復

頭條要聞

太原高樓起火致3死23傷 居民:曾提醒燒烤店不安全

頭條要聞

太原高樓起火致3死23傷 居民:曾提醒燒烤店不安全

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

油價沖擊,有些亞洲貨幣先扛不住了!

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

數碼
健康
教育
親子
軍事航空

數碼要聞

一個月下跌近30% 內存條價格為什么漲不動了?

干細胞抗衰4大誤區,90%的人都中招

教育要聞

“這媽是唐僧轉世吧?”福建媽媽皈依式教育火了,兒子再無叛逆期

親子要聞

女兒今天來找爸爸,讓女兒改口叫后媽

軍事要聞

第三艘航母出動數千名士兵抵達 美軍大舉增兵中東戰場

無障礙瀏覽 進入關懷版