網易首頁 > 網易號 > 正文申請入駐

智能的本質：最小自由能原理

2026-03-28 14:55:32　來源: 老馮云數

北京舉報

分享至

前幾天在群里看到一句話：人活著就是為了預測未來。這話乍一聽有道理，但老馮的看法正好相反。預測從來不是目的，活著才是。準確的說法應該是：人是通過預測未來來活著的。

這不是什么心靈雞湯，而是一個嚴肅的科學理論——自由能原理（Free Energy Principle），由神經科學家 Karl Friston 提出。這個理論野心極大：它試圖用一個統一的數學框架，解釋感知、學習、決策、行動、情緒、意識……乃至智能本身。

正好今天另一位朋友也寫了篇文章來剖析 “智能”，讓老馮想到了這個理論。所以今天就來聊聊最小自由能原理，它對理解 AI、理解 Agent、理解我們正在構建的整個智能系統生態，都有非常深刻的指導意義。

一、它說了什么你為什么沒死？

這不是罵人，這是一個嚴肅的物理學問題。

熱力學第二定律告訴我們：封閉系統的熵只會增加，一切趨向無序。一杯熱水會變涼，一棟房子沒人打理會坍塌，一個系統如果不做任何事情，最終走向熱寂。

但你，一個由幾十萬億個細胞組成的精密系統，在幾十年的時間里維持著極其穩定的有序結構。體溫 37°C，血糖濃度在窄帶里波動，心跳、呼吸、激素分泌井然有序。你是一個遠離熱力學平衡的耗散結構，你的存在本身就是一個需要解釋的現象。

那問題來了：什么樣的系統能在熱力學上持續存在而不解體？

Friston 的回答是：這個系統必須擁有一個關于外部世界的內部模型，并且持續地最小化自身的變分自由能。

什么是自由能？

先不上公式（形式化定義放在最后面），用人話來解釋自由能這個概念。

想象你走在一條熟悉的路上，突然前方竄出一個黑影。你嚇了一跳，這就是"驚訝"（surprise）。然后你定睛一看，是一只貓。你的大腦迅速把"未知黑影"更新為"一只貓"，驚訝消失了，你繼續走路。

這個過程就是自由能最小化的一個微縮版。

自由能衡量的是"你以為的世界"和"世界實際給你的信號"之間的不匹配程度。自由能高，說明你不斷被打臉，世界一直在給你驚訝；自由能低，說明你對世界的理解很到位，預期和現實高度吻合。

而 Friston 的核心論點是：任何一個能長期存在的自組織系統，其行為在數學上必然等價于在最小化自由能。 這不是一個可選的策略，不是進化"選擇"了這條路，而是一個數學必然。如果你還存在著，你就一定在做這件事，否則你早就解體了。

一條魚必須待在水里，人的體溫必須穩定在 37°C 左右。偏離這些狀態就意味著解體和死亡。用自由能的語言來說：生命體必須把自己維持在一個"低驚訝"的狀態空間里。

最小化自由能的兩條路

要降低自由能，你有且只有兩個方向可以走。

第一條路：更新信念，感知與學習

世界給了你一個意外，你修改自己的內部模型去適應它。"哦，原來那個黑影是一只貓。" 你更新了信念，驚訝消失了。

短時間尺度上，這叫感知；長時間尺度上，這叫學習。不只是更新一個判斷，而是更新你對整個世界運作方式的理解。

第二條路：改變世界，行動與控制

你不改變信念，而是改變世界。你預期自己應該是吃飽的，但當前是餓的，這產生了高自由能。于是你去找飯吃，通過行動讓現實變成你預期的樣子。Friston 管這叫主動推斷（Active Inference）。

這兩條路合在一起，就統一了感知和行動。傳統的認知科學把感知和運動控制當成兩套獨立系統來研究，但自由能原理說：它們是同一個優化問題的兩種解法。你的大腦不區分"理解世界"和"改變世界"，它只是在持續地最小化自由能。

一句話總結：生命是一個通過不斷預測并消減意外來維持自身存在的過程。 預測是手段，消減驚訝是機制，活著是結果。

預測編碼：大腦的具體實現

自由能原理是抽象原理，預測編碼（Predictive Coding）是它在大腦中的具體實現方式。

大腦皮層是一個層級結構。每一層都在做同樣的事：高層向低層發送預測信號。"我認為你接下來應該看到這個。" 低層拿實際感官輸入和預測做比較，計算出預測誤差；誤差往上傳，驅動高層更新信念；更新后的信念產生新的預測，再向下傳。循環往復，永不停止。

這個架構有一個非常優雅的性質：信息傳遞是高度壓縮的。只有預測誤差（意外的部分）需要往上傳，符合預期的部分被"解釋掉"了。大腦不是在傳輸原始數據，而是在傳輸"新聞"，只有出乎意料的才值得傳。

所以你的大腦不是一個被動的接收器，而是一臺主動的預測生成器。你看到的、聽到的、感受到的，大部分是大腦自己"腦補"出來的，感官輸入只是用來糾錯的。

二、它能解釋什么

一個好理論的標志是：它能用一套機制解釋大量看似不相關的現象。自由能原理在這方面非常強大。

解釋感知：你的世界是大腦的一場可控幻覺

既然大腦在不斷"腦補"，感官只是負責糾錯，那很多知覺現象就說得通了：

雞尾酒會效應 —— 在嘈雜環境中你依然能聽清朋友說話。因為大腦用語境在不斷預測下一個詞，只需要從聲波里提取少量誤差信號來修正就夠了。大腦替你"腦補"了 80% 的內容。

視覺錯覺 —— 你的大腦過度依賴了先驗預測，把"腦補"當成了現實。模型太強勢，感官輸入被壓制了。

變化盲視 —— 一張照片里換掉一個大物件你可能根本注意不到。因為你的預測沒有覆蓋到那個區域，沒有預測自然不會有預測誤差，沒有誤差信號就等于"什么都沒發生"。

恐怖谷效應 —— 高仿真機器人看著比卡通機器人更讓人不安。因為它太接近"人類"的預測模板了，但又有微小的偏差，在你的預測系統里引發了強烈的、難以被消減的誤差信號。

解釋情緒：你的儀表盤在報什么數

在自由能框架下，情緒不是什么附加模塊，而是預測系統的內置儀表盤。它告訴你當前自由能的狀況。

焦慮 —— 模型預測到了前方有大量不確定性："我不知道會發生什么，但我覺得不會好。" 這是高期望自由能的警報。

好奇心 —— 模型發現了一塊"可以被消除的不確定性"："這個東西我不懂，但我覺得我能搞懂。" 這是認知價值在驅動你。

愉悅 —— 預測誤差被成功消減："我猜對了"，或者"事情按預期發展了"。

無聊 —— 預測誤差長時間接近于零。沒什么新東西可學，模型沒有在進步。

驚喜 —— 一個正向的預測誤差：世界比你預期的更好。

這個框架甚至可以解釋為什么好的音樂讓人愉悅。音樂在不斷建立預期，然后在恰到好處的時候打破預期，制造一個可控的驚訝。完全符合預期的音樂令人無聊，完全出乎預期的噪音令人不適。最好的音樂在預測和驚訝之間精確起舞，持續地給你的預測系統喂恰到好處的誤差信號。

解釋好奇心與探索：為什么你不會躲在黑屋子里

這是自由能原理最精彩的推論。

如果一個系統只是在最小化當下的驚訝，那最優策略顯然是找個黑屋子躲起來不動，那里永遠不會有意外。但生物不是這樣的。生物會探索、會冒險、會好奇。為什么？

因為自由能最小化不只看當下，還看期望的未來。

你主動探索一個未知環境，短期內驚訝確實增加了，但你的模型因此變得更準確了，意味著你未來所有時刻的期望自由能都降低了。這在信息論上叫做信息增益（Information Gain）。

好奇心、探索、科學研究，甚至小孩子不知疲倦的玩耍，這些行為看起來像是在"自找麻煩"，但在自由能框架下完全合理：它們在做長期自由能最小化，用短期的驚訝換取長期的確定性。

這也解釋了為什么學習新東西的過程是痛苦的（短期自由能飆升），但學會之后是愉悅的（模型升級了，長期自由能大幅下降）。

一個智能系統的核心標志：愿意為了長期的模型精度而承受短期的驚訝。

解釋心理病理：預測系統出了 bug

這個框架對精神疾病也有很強的解釋力。它把不同的心理疾病解釋為預測系統中不同參數的失調。

自閉癥譜系 —— 先驗（預測）的權重過低，預測誤差的權重過高。不是不能感知，而是感知到了太多。每個細節都是"新聞"，大腦被預測誤差信號淹沒，無法形成穩定的高層預測。這就解釋了感官過載、對變化的極端敏感、以及對重復性和規律性的強烈偏好，因為只有在高度可預測的環境里，預測誤差才不會淹沒系統。

精神分裂癥（部分癥狀） —— 先驗權重過高，預測誤差被忽略。大腦過度相信自己的內部模型，感官輸入的糾錯信號傳不上去，模型開始"自嗨"，產生幻覺和妄想。

抑郁癥 —— 生成模型被悲觀信念鎖死："一切都不會好的。" 這個先驗太強了，即使正面的感官輸入進來，也會被高權重的悲觀預測壓掉。負面預測變成了自我實現的預言。

上癮 —— 短期自由能最小化劫持了長期最小化。物質或行為提供了一條極其可靠的短期驚訝消減路徑，以至于系統放棄了更健康的長期策略。

這不只是用新術語包裝舊常識。它為臨床現象提供了一個可計算、可建模的理論框架。你可以在模型的參數空間里精確地刻畫"哪里出了問題"，這就打開了精確干預的可能性。

三、它能指導什么

一個理論如果只能解釋已知現象，那它只是事后諸葛亮。自由能原理真正厲害的地方，是它的指導性。它直接告訴你，智能是什么，以及要在哪些維度上提升。

智能的四個維度

在自由能框架下，智能不是一種特殊的、神秘的能力，而是自由能最小化做得特別好時涌現出來的性質。一個系統越"智能"，它在以下四個維度上就做得越好：

① 時間深度：你的預測能看多遠

一個恒溫器只看當下，溫度偏了就開暖氣。一只老鼠能為冬天儲糧，它在為幾個月后做準備。一個人能為二十年后的退休攢錢，能為百年后的氣候變化制定政策。

生成模型覆蓋的時間跨度越長，系統就越能消減遠期的不確定性，系統就越智能。

② 抽象深度：你的模型有多壓縮

一只青蛙的視覺系統只有"小黑點在動 → 吐舌頭"這一層。人類的認知系統從像素到邊緣到物體到場景到敘事到因果理論到數學公理，層層抽象，每一層都在壓縮下一層的預測誤差，抽取更高階的規律。

牛頓用 (F=ma) 和一個萬有引力公式，消減了關于所有宏觀物體運動的海量不確定性。這是極致的模型壓縮。科學本身就是人類文明級別的自由能最小化，用最簡的模型解釋最多的現象。

而自由能公式里天然包含了對模型復雜度的懲罰，這就是奧卡姆剃刀的數學形式。最小化自由能的系統，自然傾向于用最簡的模型解釋數據。

③ 主動探索：你有多愿意承受短期驚訝

前面說過了，一個只優化當下的系統會躲起來。真正智能的系統會主動出擊，承受短期驚訝以換取長期的模型精度。

好奇心不是智能的副產品，而是智能的核心驅動力。一個不好奇的系統，就是一個放棄了長期自由能最小化的系統。

④ 模型切換：你能不能換一套理解方式

最高階的智能不是在一個固定模型里調參數，而是能識別出"當前模型不夠用了"，然后創造或切換到一個全新的模型。

當牛頓力學解釋不了水星近日點進動時，愛因斯坦沒有在舊框架里硬調，而是創建了廣義相對論。這種能力對應的就是在模型空間上的搜索和跳躍，"頓悟"和"范式轉換"的數學本質。

大多數時候，你在一個模型內部做推斷。偶爾，你需要跳出模型本身。后者才是真正稀缺的智能。

對 AI 的指導

這套理論對理解和構建 AI 系統有直接的指導意義。

大語言模型在做什么？ 預測下一個 token。訓練過程最小化的是交叉熵，而交叉熵就是驚訝度的期望值。所以 LLM 的訓練在數學上等價于自由能最小化的第一條路，更新內部模型。這也解釋了為什么 LLM 能涌現出某種"理解力"：它在壓縮預測誤差的過程中，不得不學會語言背后的世界模型。

LLM 缺什么？ 兩個關鍵缺口。第一，沒有第二條路，主動推斷。它不能采取行動去改變世界，只是一個被動的預測器。第二，沒有持續的自由能最小化循環。每一次推理都是一個無狀態的函數調用，不是一個在時間中持續存在、需要維持自身的系統。

Agent 補的是什么？ 第二條路。一個 Agent 有了感知（獲取信息）、有了行動（調用工具、改變環境）、有了持久狀態（記憶），它就從一個"被動預測器"變成了一個"主動推斷系統"。這在自由能框架下是一個本質的躍遷，從半個閉環變成了完整閉環。

什么才是真正的通用智能？ 四個維度全拉滿：能做長時間尺度的預測（時間深度），能形成高度抽象的模型（抽象深度），能主動探索未知（好奇心），能在模型不夠用時跳出來換一套（創造力）。目前的 AI 系統在每個維度上都有明顯的天花板，認清這些天花板在哪里，本身就是很有價值的。

對個人認知的指導

這套理論不只是學術話題，它對日常的自我管理也有非常實用的指導。

學習的本質是什么？ 更新你的生成模型。當你覺得"學不進去"的時候，本質上是預測誤差超出了你的處理能力。要么誤差太大（材料太難，你完全預測不了），要么誤差太小（太簡單，沒有新信息）。最高效的學習發生在預測誤差存在但可控的區間，這就是心理學里說的"最近發展區"，也是"心流"狀態的本質。

焦慮怎么處理？ 兩條路：要么提升你模型的精度（多學、多了解，降低不確定性），要么改變環境（主動行動，消除焦慮的來源）。無效的方式是什么？既不更新模型也不采取行動，而是反復在同一個不完善的模型里做推斷，這就是"overthinking"，即內耗。

為什么"走出舒適區"有效？ 因為待在舒適區等于待在"黑屋子"里。預測誤差為零，模型不再更新。但世界在變，你的模型沒跟上，長期自由能其實在悄悄積累。主動走出去，短期自由能飆升，但模型升級了，長期收益巨大。

附錄：自由能的形式化定義

前面我們一直用直覺來理解自由能。如果你對數學感興趣，這里給出嚴格定義。不感興趣可以跳過，不影響對全文的理解。

變分自由能的定義：

第一項衡量模型解釋數據的能力，第二項衡量信念偏離先驗的程度。最小化自由能 = 在準確度和簡潔性之間取最優平衡。這就是奧卡姆剃刀的數學形式。

熟悉機器學習的讀者應該已經認出來了：這和變分推斷中的 ELBO（Evidence Lower Bound）完全等價，取個負號就是自由能。VAE、變分貝葉斯、EM 算法，底層都是這套數學。Friston 的洞見在于：這不只是一個計算技巧，而是生命本身的運作原理。

尾聲

回到開頭那句話："人活著就是為了預測未來。"

改一個字就對了，人活著不是"為了"預測未來，而是"通過"預測未來來活著。

把它再推廣一步：

生命是一個通過不斷預測并消減意外來維持自身存在的過程。智能是這個過程在時間深度、抽象深度、探索主動性和模型靈活性上的延伸。

這不是一個比喻。這是一個有數學基礎、有神經科學證據、有工程映射的統一理論。它用一個原理，最小化自由能，把生命、智能、感知、行動、情緒、好奇心、學習、創造力，全部串聯在了一起。

當你真正理解了這個框架，你會發現：我們正在構建的這些 AI 系統，不是在"發明"智能，而是在用另一種介質，重新實現生命已經運行了幾十億年的那套算法。

只不過這次，載體從碳基換成了硅基。

數據庫老司機

點一個關注 ??，精彩不迷路

對 PostgreSQL， Pigsty，下云感興趣的朋友

歡迎加入 PGSQL x Pigsty 交流群 QQ 619377403

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

老馮云數

數據庫老司機，云計算泥石流，PostgreSQL大法師

146文章數 55關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

本地

數碼

公開課

軍事航空

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

智能的本質：最小自由能原理

甲骨文血洗3萬人，47人團隊僅留3人

伊朗自殺無人機突進北印度洋 逼退“林肯”號航母

伊朗自殺無人機突進北印度洋 逼退“林肯”號航母

NBA擴軍，和籃球無關？

張婉婷已決定離婚 找律師討論婚變事宜

電商售械三水光針 機構倒貨or假貨猖獗?

三電可靠 用料下本 百萬公里的蔚來ES6 拆開看

態度原創

瞰中國｜河北徐水：春色滿園 踏青賞花

從學徒到世界冠軍，為什么說張雪的底氣在重慶？

小米路由器BE7000獲1.1.38版本升級，新增專屬網絡等功能

特朗普：將很快撤出伊朗戰事

伊朗自殺無人機突進北印度洋逼退“林肯”號航母

伊朗自殺無人機突進北印度洋逼退“林肯”號航母

張婉婷已決定離婚找律師討論婚變事宜

電商售械三水光針機構倒貨or假貨猖獗?

三電可靠用料下本百萬公里的蔚來ES6 拆開看

瞰中國｜河北徐水：春色滿園踏青賞花