網易首頁 > 網易號 > 正文申請入駐

Nature Machine Intelligence | 模型與腦的雙向對照

2026-04-03 08:21:42　來源: PsyBrain腦心前沿

北京舉報

分享至

認知神經科學前沿文獻分享

基本信息

Title:Reverse predictivity for bidirectional comparison of neural networks and biological brains

發表時間:2026-03-25

發表期刊:Nature Machine Intelligence

獲取原文:

1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本

研究背景

過去十多年，視覺人工神經網絡（artificial neural networks, ANNs）常被拿來和靈長類視覺系統比較，尤其是獼猴下顳皮層（inferior temporal cortex, IT）這類與核心物體識別密切相關的腦區。常見評估指標是前向預測力（forward predictivity）：用模型特征經線性回歸映射去預測神經反應，再用解釋方差百分比（percentage explained variance, %EV）衡量效果。

這篇論文指出，前向預測力本質上只檢驗一個方向：模型能否預測神經元；它并不回答神經活動能否反過來預測模型內部單元。如果一個模型在當前記錄分辨率和線性框架下確實接近 IT 表征，那么這種對應關系至少應表現出更強的雙向性。作者因此提出一個更保守的診斷問題：當很多模型的前向分數都接近平臺時，是否仍有大量模型維度其實不在 IT 可線性恢復的共享子空間內？

需要先劃清邊界。論文討論的是獼猴 IT 與視覺模型之間的表征對齊，不是整個視覺系統，也不是對人類全部高層視覺表征的直接判斷。反向預測力低，也不等于某種模型特征在生物腦中“根本不存在”；正文明確強調，它只表示這些維度在當前 IT 采樣和線性映射條件下不可恢復。

實驗設計與方法邏輯

作者基于已有的大規模獼猴 IT 記錄數據，比較多類視覺模型與 IT 的雙向線性對應關系。具體來說，先為每個模型選取與 IT 最對齊的高層表征層，用線性回歸計算從模型到神經元的前向預測力；再把方向反過來，用 IT 群體活動逐個預測模型單元激活，定義反向預測力（reverse predictivity），并以模型單元上的中位數 %EV 概括該模型的反向表現。

論文先用 DenseNet-161 和 VGG16 做直觀對照：兩者前向預測力非常接近，但內部單元對神經預測的貢獻模式不同。隨后，作者把比較擴展到 CNN、Transformer、自監督學習模型和對抗魯棒模型，并引入猴到猴映射作為經驗參照。如果同樣的線性雙向框架在腦到腦比較中更接近對稱，而在腦到模型比較中明顯失衡，那么這種不對稱更可能反映真實的表征錯配，而不是分析方法本身的產物。

為排除簡單解釋，作者還做了幾類驗證：包括將模型特征降維到與記錄神經元數量相當后重復分析、比較跨猴的一致性、考察最低反向預測力單元是否只是采樣不足造成，以及比較這些單元能否被模型內部其他單元預測。最后，他們按反向預測力把單元劃分為 common units 和 unique units，再比較這兩類單元對物體辨別行為簽名的預測一致性，檢驗其功能相關性。

核心發現

發現一：前向預測力接近的模型，內部與 IT 的共享程度仍可明顯不同

DenseNet-161 和 VGG16 對獼猴 IT 的前向預測力幾乎相當，正文報告的中位數分別約為 54% 和 53% %EV。僅看這個結果，很容易把它們都視為“差不多像腦”的模型。可一旦把單元層面的貢獻拆開，DenseNet-161 中持續參與神經預測的單元更多，VGG16 則有更多接近零貢獻的單元；進一步看反向預測力，DenseNet-161 也有更大范圍的模型單元能被 IT 活動線性預測，而 VGG16 的分布更偏向零。這說明，前向分數相近并不意味著模型內部與 IT 共享的表征子空間同樣接近；前向預測力會掩蓋這種隱藏差異。

Fig. 1 中，作者先展示了 DenseNet-161 與 VGG16 對 IT 神經元的前向 %EV 分布，以及兩者模型單元回歸權重的差異；Fig. 2c、2d 又把這兩個模型的前向與反向預測分布并排放在一起。幾張圖合起來說明：表面上都能預測 IT，但內部可被 IT“讀回來”的程度并不一樣，這正對應了“發現一”。

發現二：腦到模型常常明顯不對稱，而猴到猴 IT 映射更接近對稱

在更大范圍的模型比較里，作者發現反向預測力整體顯著低于對應的前向預測力，而且跨模型時二者并不穩定正相關。換句話說，不少模型已經能較好預測 IT 神經反應，但 IT 并不能以相近程度恢復這些模型的內部單元。相比之下，猴到猴的 IT 映射在同樣線性框架下更接近 unity line，呈現更高雙向對稱性。這一對照支持作者的核心判斷：ANN 與獼猴 IT 之間存在真實的表征錯配，而不只是噪聲、采樣數量或特征維度差異帶來的表面現象。正文同時強調，這里說的是“當前線性框架下的錯配”，并不排除其他腦區、其他測量尺度或非線性關系。

Fig. 3 把多類模型的前向預測力和反向預測力放在同一坐標系里，模型點大多偏離 unity line，而綠色的猴到猴點更靠近對角線；Fig. 5a 顯示單元級反向預測力在兩只猴之間高度相關，Fig. 5c 則說明最難被 IT 預測的 unique units 仍可被模型內其他單元較好預測。這幾張圖一起支撐了“發現二”。

發現三：反向預測力能篩出更接近 IT 共享子空間、也更具行為相關性的單元

作者進一步發現，IT 對齊層的特征數越多、有效維度（effective dimensionality）越高，反向預測力通常越低；而對抗魯棒訓練的模型，反向預測力往往更高，參數總量本身則不是顯著因素。更重要的是，按反向預測力篩出的 common units，在物體辨別行為簽名上，比 unique units 更能對齊其他模型以及猴和人的行為預測。這表明，反向預測力不只是一個“找不對稱”的幾何指標，也能幫助定位那些更接近 IT 共享表征、并與跨物種行為更相關的模型單元。不過這并不意味著 common units 就是大腦真實使用的全部表征；它只是在本文數據和分析框架下，更接近 IT 可共享的那部分子空間。

Fig. 4 展示了反向預測力與特征寬度、有效維度及對抗魯棒性的關系，說明哪些模型設計因素與隱藏錯配相關；Fig. 6 則比較了 common units 與 unique units 的行為一致性，顯示前者在跨模型、跨物種行為預測上更占優，這也對應了“發現三”。

總結

這篇論文不是在否定高分視覺模型，而是在提醒：前向預測力高，只能說明模型能預測獼猴 IT，不能直接推出模型內部也被 IT 充分覆蓋。作者提出的反向預測力顯示，許多高前向分模型仍含有 IT 難以線性恢復的 unique units；相對更“共同”的 common units，則與跨模型、跨物種行為更一致。結論目前限于獼猴 IT 與線性映射框架。

請打分

這篇剛剛登上Nature Machine Intelligence的研究，是否實至名歸？我們邀請您作為“云審稿人”，一同品鑒。精讀全文后，歡迎在匿名投票中打分，并在評論區分享您的深度見解。

分享人：BQ

審核：PsyBrain 腦心前沿編輯部

你好，這里是「PsyBrain 腦心前沿」

專注追蹤全球認知神經科學的最尖端突破

視野直擊 Nature, Science, Cell 正刊及核心子刊與頂級大刊

每日速遞「深度解讀」與「前沿快訊」

科研是一場探索未知的長跑，但你無需獨行。歡迎加入PsyBrain 學術社群，和一群懂你的同行，共同丈量腦與心智的無垠前沿。

點擊卡片進群，歡迎你的到來

一鍵關注，點亮星標 ? 前沿不走丟！

一鍵分享，讓更多人了解前沿

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.