![]()
認知神經科學前沿文獻分享
基本信息
Title:Reverse predictivity for bidirectional comparison of neural networks and biological brains
發表時間:2026-03-25
發表期刊:Nature Machine Intelligence
獲取原文:
1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
研究背景
過去十多年,視覺人工神經網絡(artificial neural networks, ANNs)常被拿來和靈長類視覺系統比較,尤其是獼猴下顳皮層(inferior temporal cortex, IT)這類與核心物體識別密切相關的腦區。常見評估指標是前向預測力(forward predictivity):用模型特征經線性回歸映射去預測神經反應,再用解釋方差百分比(percentage explained variance, %EV)衡量效果。
這篇論文指出,前向預測力本質上只檢驗一個方向:模型能否預測神經元;它并不回答神經活動能否反過來預測模型內部單元。如果一個模型在當前記錄分辨率和線性框架下確實接近 IT 表征,那么這種對應關系至少應表現出更強的雙向性。作者因此提出一個更保守的診斷問題:當很多模型的前向分數都接近平臺時,是否仍有大量模型維度其實不在 IT 可線性恢復的共享子空間內?
需要先劃清邊界。論文討論的是獼猴 IT 與視覺模型之間的表征對齊,不是整個視覺系統,也不是對人類全部高層視覺表征的直接判斷。反向預測力低,也不等于某種模型特征在生物腦中“根本不存在”;正文明確強調,它只表示這些維度在當前 IT 采樣和線性映射條件下不可恢復。
實驗設計與方法邏輯
作者基于已有的大規模獼猴 IT 記錄數據,比較多類視覺模型與 IT 的雙向線性對應關系。具體來說,先為每個模型選取與 IT 最對齊的高層表征層,用線性回歸計算從模型到神經元的前向預測力;再把方向反過來,用 IT 群體活動逐個預測模型單元激活,定義反向預測力(reverse predictivity),并以模型單元上的中位數 %EV 概括該模型的反向表現。
論文先用 DenseNet-161 和 VGG16 做直觀對照:兩者前向預測力非常接近,但內部單元對神經預測的貢獻模式不同。隨后,作者把比較擴展到 CNN、Transformer、自監督學習模型和對抗魯棒模型,并引入猴到猴映射作為經驗參照。如果同樣的線性雙向框架在腦到腦比較中更接近對稱,而在腦到模型比較中明顯失衡,那么這種不對稱更可能反映真實的表征錯配,而不是分析方法本身的產物。
為排除簡單解釋,作者還做了幾類驗證:包括將模型特征降維到與記錄神經元數量相當后重復分析、比較跨猴的一致性、考察最低反向預測力單元是否只是采樣不足造成,以及比較這些單元能否被模型內部其他單元預測。最后,他們按反向預測力把單元劃分為 common units 和 unique units,再比較這兩類單元對物體辨別行為簽名的預測一致性,檢驗其功能相關性。
核心發現
發現一:前向預測力接近的模型,內部與 IT 的共享程度仍可明顯不同
DenseNet-161 和 VGG16 對獼猴 IT 的前向預測力幾乎相當,正文報告的中位數分別約為 54% 和 53% %EV。僅看這個結果,很容易把它們都視為“差不多像腦”的模型。可一旦把單元層面的貢獻拆開,DenseNet-161 中持續參與神經預測的單元更多,VGG16 則有更多接近零貢獻的單元;進一步看反向預測力,DenseNet-161 也有更大范圍的模型單元能被 IT 活動線性預測,而 VGG16 的分布更偏向零。這說明,前向分數相近并不意味著模型內部與 IT 共享的表征子空間同樣接近;前向預測力會掩蓋這種隱藏差異。
![]()
![]()
Fig. 1 中,作者先展示了 DenseNet-161 與 VGG16 對 IT 神經元的前向 %EV 分布,以及兩者模型單元回歸權重的差異;Fig. 2c、2d 又把這兩個模型的前向與反向預測分布并排放在一起。幾張圖合起來說明:表面上都能預測 IT,但內部可被 IT“讀回來”的程度并不一樣,這正對應了“發現一”。發現二:腦到模型常常明顯不對稱,而猴到猴 IT 映射更接近對稱
在更大范圍的模型比較里,作者發現反向預測力整體顯著低于對應的前向預測力,而且跨模型時二者并不穩定正相關。換句話說,不少模型已經能較好預測 IT 神經反應,但 IT 并不能以相近程度恢復這些模型的內部單元。相比之下,猴到猴的 IT 映射在同樣線性框架下更接近 unity line,呈現更高雙向對稱性。這一對照支持作者的核心判斷:ANN 與獼猴 IT 之間存在真實的表征錯配,而不只是噪聲、采樣數量或特征維度差異帶來的表面現象。正文同時強調,這里說的是“當前線性框架下的錯配”,并不排除其他腦區、其他測量尺度或非線性關系。
![]()
![]()
Fig. 3 把多類模型的前向預測力和反向預測力放在同一坐標系里,模型點大多偏離 unity line,而綠色的猴到猴點更靠近對角線;Fig. 5a 顯示單元級反向預測力在兩只猴之間高度相關,Fig. 5c 則說明最難被 IT 預測的 unique units 仍可被模型內其他單元較好預測。這幾張圖一起支撐了“發現二”。發現三:反向預測力能篩出更接近 IT 共享子空間、也更具行為相關性的單元
作者進一步發現,IT 對齊層的特征數越多、有效維度(effective dimensionality)越高,反向預測力通常越低;而對抗魯棒訓練的模型,反向預測力往往更高,參數總量本身則不是顯著因素。更重要的是,按反向預測力篩出的 common units,在物體辨別行為簽名上,比 unique units 更能對齊其他模型以及猴和人的行為預測。這表明,反向預測力不只是一個“找不對稱”的幾何指標,也能幫助定位那些更接近 IT 共享表征、并與跨物種行為更相關的模型單元。不過這并不意味著 common units 就是大腦真實使用的全部表征;它只是在本文數據和分析框架下,更接近 IT 可共享的那部分子空間。
![]()
![]()
Fig. 4 展示了反向預測力與特征寬度、有效維度及對抗魯棒性的關系,說明哪些模型設計因素與隱藏錯配相關;Fig. 6 則比較了 common units 與 unique units 的行為一致性,顯示前者在跨模型、跨物種行為預測上更占優,這也對應了“發現三”。
總結
這篇論文不是在否定高分視覺模型,而是在提醒:前向預測力高,只能說明模型能預測獼猴 IT,不能直接推出模型內部也被 IT 充分覆蓋。作者提出的反向預測力顯示,許多高前向分模型仍含有 IT 難以線性恢復的 unique units;相對更“共同”的 common units,則與跨模型、跨物種行為更一致。結論目前限于獼猴 IT 與線性映射框架。
請打分
這篇剛剛登上Nature Machine Intelligence的研究,是否實至名歸?我們邀請您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評論區分享您的深度見解。
分享人:BQ
審核:PsyBrain 腦心前沿編輯部
你好,這里是「PsyBrain 腦心前沿」
專注追蹤全球認知神經科學的最尖端突破
視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級大刊
每日速遞「深度解讀」與「前沿快訊」
科研是一場探索未知的長跑,但你無需獨行。歡迎加入PsyBrain 學術社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。
點擊卡片進群,歡迎你的到來
一鍵關注,點亮星標 ? 前沿不走丟!
![]()
一鍵分享,讓更多人了解前沿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.