網易首頁 > 網易號 > 正文申請入駐

被譽為大統一的預測編碼，為什么是錯的？

2026-01-28 07:32:31　來源: 追問Nextquestion

上海舉報

分享至

在計算與認知神經科學的宏大圖景中，預測編碼（Predictive Coding）長期占據著顯赫的版圖。該理論認為，大腦的核心使命不僅在于感知，更在于不斷削減“預測誤差”。作為一種試圖統攝全局的框架，預測編碼曾被寄予厚望，人們期冀它能為大腦不同區域、不同模態的功能提供一個大一統的解釋。

然而，新出現的神經生理學證據，卻與這一正統理論格格不入。關于視覺這樣的抽象感知如何由感官刺激經大腦推演而成，另一種解釋框架正在崛起，即偏向競爭理論（BELIEF）。本文將首先基于前沿文獻[1]，梳理這兩大理論的交鋒，并指出為何偏向競爭理論提供了更為精準的解釋視角。

?Westerberg, Jacob A., and Pieter R. Roelfsema. "Hierarchical interactions between sensory cortices defy predictive coding." Trends in Cognitive Sciences (2025).https://www.cell.com/trends/cognitive-sciences/fulltext/S1364-6613(25)00271-2

在后半部分，本文將從感官數據擴展到更廣闊的領域，探討一項由50多位科學家通過開放社區協作完成的、關于將現有的實驗研究與預測處理的理論模型進行對比的綜述。這篇綜述強調，大腦或許并非固守單一策略，而是采用“模型集合”的方法，根據情境動態地調動不同的策略，這意味著，預測編碼可能只是大腦宏大策略庫中的一種。

為了研究大腦如何在多種策略中權衡，研究者設計了一項實驗，旨在測試預測機制如何隨著預測情境的變化而改變。這些實驗已于2025 年 4 月在艾倫研究所開展，并已記錄初步數據集，正構建起開放社區科研的典范。

大腦究竟是批評家還是激勵者？

1999年，Dana H. Ballard基于視覺信號處理[2]，首次提出預測編碼理論。在該理論的構想中，大腦層次分明：自上而下的反饋連接，從高階視覺皮層向低階區域傳遞著對神經活動的“預測”；而自下而上的連接，則負責傳遞預測與實際活動之間的“殘差誤差”。

?預測編碼編碼理論的動圖展示，代碼由Qwen3 Max生成

在預測編碼的視角下，高級腦區會生成關于每個時空點的預判，并將這些預判反饋至低級腦區。這些預測與傳入的感官信息相互比對，一旦吻合，由預測信息引發的神經活動便會被削弱；反之，那些違反預測的意外刺激，因未被抑制而顯得格外強烈。

這一理論之所以迷人，在于其廣泛的解釋力。從感覺、知覺到運動與認知，它似乎無所不包，且符合生物體節能的進化原則。這使得預測編碼成為了一種普遍適用的，對皮層功能予以解釋的理論。

另外，該理論還具有其現實意義，例如為理解精神疾病提供了新視角：精神分裂癥可能源于過強的先驗權重，導致基于內部模型喧賓奪主地主導了感知；抑郁癥可能與負性預期偏差和預測誤差處理異常相關；而孤獨癥譜系障礙，則可能涉及精確度加權失調，導致對感覺細節的過度關注。

與預測編碼理論相互競爭的偏向競爭理論，源自backward enhancement of limited information and inhibition of expected information in feedforward pathways，卻描繪了一幅截然不同的圖景。該理論認為，視野中的物體為了獲得大腦的表征，必須展開激烈的競爭。這種競爭在具有相似特征的視覺項之間最為激烈，因此具有獨特屬性的項會脫穎而出。當某一表征因其行為相關性被高級腦區“選中”時，這種選擇會導致相應的神經元放電頻率提高。

偏向競爭理論與預測編碼理論的差別在于，前者認為自上而下的連接會增強預測要出現內容的對應的腦區活動，而不是如后者想的那樣抑制它。

如果說預測編碼像是大腦中一位嚴苛的“批評家”：高層區域不斷對底層輸入指手畫腳，發出抑制信號，將那些意料之中的信息“壓制”下去，只允許意外信息（即預測誤差）向上匯報。

偏向競爭理論則更像是一位循循善誘的“導師”：高層區域對那些被注意或與任務相關的信息給予興奮性的反饋，增強其表征強度，而抑制主要發生在前饋通路和局部回路中，用于過濾冗余信息。

?圖1：左圖為預測編碼對的“大象出現在車流中”的神經機制解釋，高層腦區對車輛（可預測）發出抑制性反饋，使得大象（意外刺激）在底層活動中凸顯。右圖的偏向競爭理論強調：車輛之所以反應弱，是因為它們在局部前饋通路中被抑制；大象之所以強，是因為被注意選擇后獲得高層興奮性反饋增強。（來自[1]）

此外，兩者在神經機制的細節上也大相徑庭。預測編碼依賴高層到低層的抑制性投射（如通過抑制性神經元）；偏向競爭理論中抑制主要即時發生于橫向或前饋通路中，且適應過程跨越了從毫秒到數周的廣闊時間尺度。其反饋機制，始終是興奮性的，只為增強那些被選中的主角。

?圖2：預測編碼與偏向競爭理論中的興奮性及抑制性反饋對比，來自[1]

確定大腦究竟是采用“抑制性減法”還是“興奮性加法”作為核心策略，絕非僅是學術上的咬文嚼字。不同的理論透鏡將引導科學家以完全不同的方式審視數據。一個統一的理論框架能幫助我們剝離特例，直抵本質。當大量證據（如反饋連接主要起興奮作用、抑制多源于局部回路）更一致地指向偏向競爭理論時，固守預測編碼可能會導致對數據的誤讀，甚至迫使研究者不斷增加特設性的修正，而這會無疑會導致科研經費的浪費。

哪一種理論正確，不僅關乎真相，更具有現實意義。在對神經精神疾病的理解上，預測編碼認為精神分裂癥的幻覺可能與預測編碼錯誤（無法有效抑制由內部模型產生的預測）有關。但如果偏向競爭理論是正確的，那么問題可能出在興奮性反饋調節的失衡或前饋過濾機制的失效上。這將徹底改變藥物研發的方向。

在人工智能領域，預測編碼曾啟發了許多生成式模型（如預測下一個Token）。而偏向競爭理論則可能為注意力機制提供更堅實的神經科學基礎。它表明，一個高效的信息處理系統，不應試圖并行抑制所有預期輸入，而應學會將有限資源，用于選擇性增強最關鍵的信息。確認哪一種理論更接近真理，或許能引導我們設計出更高效、更接近人腦的AI架構。

大腦不符合預測編碼的4項實驗證據

為了在這場理論對決中分出高下，我們需要將目光投向那些精心設計的實驗現場。在這里，我們將通過四個經典的視覺案例，逐一審視預測編碼與偏向競爭理論的解釋力。

（1）視覺突顯：誰讓異類“鶴立雞群”？

如圖3A左所示，如果你面前的屏幕上布滿了密密麻麻的豎線，其中突兀地橫亙著一條橫線。你的目光會瞬間被它捕獲。這就是經典的“視覺突顯”現象（pop out）。

對此，預測編碼給出的劇本是：高層腦區迅速識別出“大多數是豎線”這一規律，于是向下發送抑制指令，壓制了底層對豎線的反應；而那條橫線因為是意外，未被抑制，從而在神經活動的背景中彈出。

然而，偏向競爭理論卻講述了一個更符合直覺的故事：豎線之間在局部發生了激烈的“側抑制”競爭，彼此消耗；而橫線因其特征獨特，沒有競爭對手，因此在前饋階段就已然勝出。高層的反饋并非在做減法，而是在你注意到橫線的那一刻，給予它額外的關注與增強。

當下的神經生理學證據，堅定地站在了偏向競爭理論這一邊——橫線的凸顯，源于底層的自發競爭，而非高層的刻意壓制。

?圖3：文本分割與突出顯示這兩個案例中，預測編碼和偏向競爭給予的不同解釋。來自[1]

(2) 路徑搜索：在混亂中尋找秩序

第二個案例關于“尋找連線”（圖3A右）。在一堆雜亂無章的隨機線條中，隱藏著一串朝向一致的線條，它們共同構成了一條連續的路徑。

按照預測編碼的邏輯，這條一致的路徑是“可預測的”，理應受到反饋抑制。但在V1和V4腦區的實際監測數據中，我們看到的卻是相反的景象：對應路徑的神經活動非但沒有減弱，反而被顯著增強了。

這與偏向競爭理論契合，當高層（如V4）檢測到路徑的一致性后，它像一位興奮的指揮官，向V1發回增強信號，點亮了構成路徑的每一個線條。即可預測的反饋，旨在增強預期的信息，而非抹殺它。

(3) 時間序列：是審美疲勞還是精準預測？

第三個例子轉移到了時間維度。當一個刺激反復出現（如 x-x-x-x），大腦的神經反應會逐漸減弱，這被稱為“重復抑制”。但如果序列中突然出現一個怪客（如 x-x-x-y），大腦對這個“奇異刺激”的反應會相對增強（圖4a）。

預測編碼將此解釋為高層的“預判抵消”：大腦學會了規律，會對即將出現的頻繁刺激x產生預測，并提前發送抑制信號抵消了頻繁刺激x的反應；而y因為出乎意料，逃過了抑制，從而引發了強烈的“預測誤差”信號，該信號也就得以完整上傳。

偏向競爭理論理論則認為，這種反應減弱純粹是前饋通路中的“生理疲勞”（即神經元適應性），與高層抑制無關。這種適應是局部和快速的。同時，高層腦區的反饋作用不是抑制，而是興奮性的，它只用于增強被注意或與任務相關的信息的表征。

為了區分神經系統究竟是如預測編碼解釋的那樣，是對熟悉信息變得適應了，還是在時間序列中學到了預測罕見信號，研究人員訓練猴子學習特定的配對（如看到A通常預示著B出現），并監測其顳下皮層（IT）的神經元活動。

決勝的關鍵在于時間。如果預測編碼是對的，那么當B被A預測時（序列A-B），高層的抑制反饋需要時間傳輸，那么對B的反應減弱應該出現在神經反應的較晚階段。

?預測和偏向競爭理論對重復出現的時間序列的兩種解釋的示例動圖，代碼來自Step2

然而，實際數據卻給了預測編碼一記重拳：對可預測刺激B的反應減弱，竟然從神經反應的第一個脈沖就開始了！這意味著，早在信號到達高層之前，底層的輸入本身就已經變弱了。這無可辯駁地支持了偏向競爭理論關于“前饋適應性”的解釋。大腦并非在做復雜的預測抑制，僅僅是底層的神經元“累了”。

如果這個A-B過渡在實驗中頻繁出現，那么負責檢測這種動態變化的神經元就會對它產生適應，導致對整個序列的反應效能降低。這種適應發生在前饋通路中，之前用預測編碼理論，給出的解釋是重復出現導致神經反應減弱。但另一個可能的解釋是，經過學習，配對刺激（A和B）的神經表征變得相似。因此，先呈現A會使神經元對表征相似的B產生更強的適應性反應減弱，而這正是中的橫向抑制。

(4) 持續性活動：為即將到來的主角“預熱”

第四項實驗關于工作記憶。研究人員訓練猴子從六個不同顏色的圓圈中（圖4 b），找出那個顏色獨特的“奇異項”并對其做出眼動反應。實驗的關鍵在于，這個獨特顏色在一次實驗內是保持不變的（例如，連續幾十次試次中，奇異項都是紅色），是可以被預測的。但在不同實驗之間奇異項會改變。

?圖4：時間預測任務中的實驗數據可用偏向競爭理論解釋，來自[1]

結果每次實驗中，面對相同任務的重復，猴子對目標（異常顏色）的反應時間會逐漸縮短。這表明，大腦學會了利用“目標顏色在短時間內是可預測的”這一時間規律來提升任務表現。

在每次實驗的后期，在搜索刺激出現之前，那些對當前實驗中目標顏色（如紅色）有選擇性反應的V4神經元，其放電率就已經開始升高。這被稱為“持續性活動”，是大腦主動將任務目標（紅色）維持在工作記憶中的體現。

而當異常的紅色圓塊出現后，這些已經“預熱”的神經元并沒有像預測編碼預言的那樣被抑制，而是在已有的高基線上進一步爆發。也就是說，對可預測的、重復出現的目標刺激，其神經反應是被顯著增強的，而不是被抑制。這一神經機制完美解釋了行為上的反應時縮短：預先的持續性活動為即將出現的目標做好了準備，使其一旦出現就能引發更強、更快的反應。

這一過程揭示了大腦處理信息的真實邏輯：低階區域（如V4）負責編碼特征，而高階區域則通過興奮性反饋，將“被注意”的特征模板（如紅色）投射回低階區域，選擇性地增強那些與任務匹配的神經元群體。自上而下的反饋，從來不是為了“抑制可預測項”，而是為了在嘈雜的世界中，為我們關注的事物打上一束聚光燈。而這正是偏向競爭理論的核心機制。

上述四項證據，從空間突顯到時間序列，從被動感知到主動搜尋，構建了一個高度一致的證據鏈。它們共同指向偏向競爭理論更可能是對的：在感知過程中，低級與高級腦區之間的對話，并非如預測編碼所言是“預測即抑制”的減法游戲。相反，高級區域的反饋傾向于增強那些被預測、被注意的表征；而神經反應的減弱，更多源于底層前饋通路在時空重復中的自然適應。這時只有被注意的刺激才能產生自上而下的預測，而在任何時刻，預測只能與一個感官刺激相匹配。

OpenScope 的科學實踐：

一次開放科學的實驗

至此，我們的討論仍局限于大腦皮層層級間的局部博弈。然而，要真正撼動預測編碼這一理論巨塔，我們需要更宏大的視野，以及一種全新的科研范式。

該研究來自Allen Institute創立的OpenScope，這是一個用于共享、高通量神經生理學實驗的平臺。OpenScope 借鑒了天文學和物理學等領域的大型觀測設施模式，開展由全球科學家提出的新的實驗項目。

OpenScope會從小鼠大腦的數萬個神經元中記錄數據，使用多探針 Neuropixels 記錄多區域雙光子鈣成像。生成的數據集隨后會與選定的研究團隊共享，他們進行自己提出的數據分析，之后這些數據將向更廣泛的科學界開放。

由于驗證預測編碼理論的需求在社區中呼聲極高，因此Allen Institute的研究者，在眾多科研人員之間創建了一個共享的 Google 文檔，開始構建對話框架，深入回顧預測處理的相關文獻，并每天投入數小時進行閱讀、總結和綜合分析。

從一開始，這篇綜述的結構就是將現有的實驗研究與預測編碼的理論模型進行對比，目的是確定檢驗這些理論所需的關鍵缺失數據。這份在線文檔在社交媒體上分享，邀請任何人提出意見、推薦論文或參與編寫，每個人都擁有完整的編輯權限。在一年的時間里，有超過 50 位科學家參與了這項工作。

真正的討論發生在 Google Docs 的評論中。一位新成員可能對某段文字提出質疑，引經據典；另一位遠在世界另一端的研究人員會回應，隨后便會出現長長的、深入的評論鏈，其精彩程度常常遠遠超出原始內容。研究者們在爭辯中彼此學習，許多人正是被這種激烈而尊重的異見所吸引，投身其中。在某些情況下，當某篇論文成為爭議焦點時，通訊作者本人常會被@進戰場，親自答疑解惑。

?圖5：一群分布于不同地區的科學家參與了這一研究

最終，開放社區貢獻了超過 1900 條評論。每一條評論都通過透明的共識流程被獨立解決。對許多人來說，這是一次獨特的體驗。通過這份共享文檔，加上每周的在線會議和面對面交流，當擁有合適工具和開放精神的分布式團隊后，研究者能夠以一種自然且有力的方式整合研究項目。

最終成果是ArXiv上的一篇綜述論文[4]，該綜述揭示了理論與實踐的差異，更指出大腦或許根本沒有唯一的預測算法。

盡管“預測下一個輸入”可能是皮層的基本能力，但正如生物學中許多復雜功能一樣，它并非源于單一的機制，而是由一組相互作用的策略拼湊而成。這篇綜述強調，大腦可能采用一種“模型集合”的方法，根據情境動態地調動不同的策略。

為了研究這些權衡，該綜述設計了一個實驗，旨在測試預測機制如何隨著預測情境的變化而改變。自從2025年4月，艾倫研究所已啟動實驗并記錄了初步數據集。分布式社區共同分析了結果，并不斷優化實驗設計。每周的會議錄像都被上傳至 YouTube，以便任何人都能隨時跟進。討論和文檔寫作也從Google文檔遷移到 GitHub。

如今，艾倫研究所正在源源不斷地生成新數據，而這個社區的大門始終敞開。無論你處于哪個層次，都有比以往更多的機會參與其中。

?圖6：從實驗到理論的雙向驗證過程，來自4

這種“開放科學”的范式，已證明其不僅適用于預測編碼，更可以輕松復制到系統神經科學的諸多未解之謎中。事實上，社區中的多位先驅已躍躍欲試，準備將這一模式推廣至其他領域。這一切的核心要素其實非常簡單，僅僅是擁有一個充滿熱情的科學家核心小組，以開放、尊重和透明的方式進行討論。

通過持續定量檢驗而不斷完善理論

那么，OpenScope 的實驗究竟準備如何驗證這一理論？如果說預測編碼的核心在于通過不斷生成對感官輸入的預測并與實際輸入比較，可利用預測誤差更新內部模型。那么實驗的關鍵，便是在可控的實驗室環境中，精準地誘導出這些“誤差”。主要方式有三：

1）在重復的標準刺激流中，隨機插入偏差刺激；

2）制造主動運動與感覺反饋之間的不一致（例如，小鼠奔跑時視覺流卻靜止）；

3）呈現違反時空預期的感官刺激。

回顧前文論及的四個實驗，我們不難發現這些策略的影子：前兩個實驗利用了“異類植入”，第三個實驗操縱了“時空預期”，而第四個實驗則觸及了眼動反應與感官反饋的微妙關系。

然而，OpenScope 這篇綜述的野心遠不止于此。它不只關注不同層級的神經元之間的反應，還從各個角度討論預測編碼理論。綜述考察了不同類型（興奮性或抑制性）的神經元在預測編碼中發揮的作用。特別是抑制性神經元，它們并非配角，而是通過精細調節興奮性活動，成為了預測處理中的關鍵關鍵角色。

另外，論文對樹突做了重新審視。神經元的樹突絕非僅僅是信號傳遞的被動電纜，而是具備獨立計算能力的亞細胞單元。頂端樹突像是天線，主要接收來自高級皮層的反饋（預測）信號，而基底樹突則扎根于底層，處理傳入的感覺輸入。

當天線接收到的預測與根部接收到的輸入匹配時，頂端樹突產生的去極化與基底樹突的興奮相互抵消，導致神經元放電減少（預測抑制）。反之，當兩者不匹配時，這種抵消機制失效，神經元便會爆發出增強的放電響應，這正是預測誤差在單細胞層面的物理實體。

這種樹突級預測編碼機制賦予了單個神經元驚人的能力，使其能獨自完成自上而下的預測與自下而上的證據比對，實現局部化的誤差計算。

?圖7：預測編碼研究的不同范圍，來自4

此外，跨物種數據的比較，發現嚙齒類與靈長類在預測處理機制上展現出顯著差異。靈長類擁有更深的皮層層級，可能支持更復雜的預測推理。而小鼠等模型生物則提供了細胞分辨率的研究窗口，揭示了預測處理的微觀基礎。

后記

本文梳理這兩項關于預測編碼的重磅研究，初衷并非為了證偽預測編碼，將其打入冷宮；而是希望指出，大腦這座生物學迷宮的運行方式之復雜，往往遠超單一機制的解釋范疇。

預測編碼理論在認知科學領域雖已占據顯赫版圖，但許多人對其仍缺乏全景式的認知，甚至將其奉為不可動搖的真理，而非有待驗證的假說。我們必須銘記：所有的理論都是對現實的某種抽象與降維。評估一個理論的生命力，不在于它是否完美無缺，而在于它能否指導實驗，能否在數據的激流中屹立不倒。正如文中圖6所示，理論與實驗應當構成一個閉環：理論指引實驗的方向，而實驗數據則作為反饋，無情地推動理論的修正、迭代，甚至替換。

此外，OpenScope 所展示的開放科學實踐，更是證明了科學不應是象牙塔里的孤芳自賞，而應該跨越國界、打破壁壘。

這不僅是一個關于大腦的故事，更是一個關于“我們如何研究大腦”的故事。我熱切地期待，類似的跨學科、跨國界的開放合作模式，能在國內的土壤中生根發芽。愿有更多充滿熱情的科研核心力量，能組織起這樣的協作，讓我們在探索未知的征途中，不再獨行。

[1] Westerberg, J. A., & Roelfsema, P. R. (2025). Hierarchical interactions between sensory cortices defy predictive coding. Trends in Cognitive Sciences. https://doi.org/10.1016/j.tics.2025.09.018

[2] Rao, R. P. N., & Ballard, D. H. (1999). Predictive coding in the visual cortex: A functional interpretation of some extra-classical receptive-field effects. Nature Neuroscience, 2(1), 79–87. https://doi.org/10.1038/4580

[3] Lecoq, J. (2025, November 12). A community-designed experiment tests open questions in predictive processing. The Transmitter: Neuroscience News and Perspectives. https://www.thetransmitter.org/open-neuroscience/community-designed-experiment-tests-open-questions-predictive-processing/

[4] Aizenbud, I., Audette, N., Auksztulewicz, R., Basiński, K., Bastos, A. M., Berry, M., Canales-Johnson, A., Choi, H., Clopath, C., Cohen, U., Costa, R. P., Filippo, D., Doronin, R., Errington, S. P., Gavornik, J. P., Gillon, C. J., Granier, A., Hamm, J. P., Hert?g, L., & Kennedy, H. (2025). Neural mechanisms of predictive processing: a collaborative community experiment through the OpenScope program. ArXiv.org. https://arxiv.org/abs/2504.09614

關于追問nextquestion

天橋腦科學研究院旗下科學媒體，旨在以科學追問為紐帶，深入探究人工智能與人類智能相互融合與促進，不斷探索科學的邊界。歡迎評論區留言，或后臺留言“社群”即可加入社群與我們互動。您也可以在后臺提問，我們將基于追問知識庫為你做出智能回復哦~

關于天橋腦科學研究院

天橋腦科學研究院（Tianqiao and Chrissy Chen Institute）是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一，圍繞全球化、跨學科和青年科學家三大重點，支持腦科學研究，造福人類。

Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室；與加州理工學院合作成立了加州理工天橋神經科學研究院。

Chen Institute建成了支持腦科學和人工智能領域研究的生態系統，項目遍布歐美、亞洲和大洋洲，包括、、、科研型臨床醫生獎勵計劃、、、科普視頻媒體「大圓鏡」等。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.