網易首頁 > 網易號 > 正文申請入駐

世界上最有用的數學思維之一——貝葉斯定理大白話講解

2026-03-29 12:33:29　來源: 新浪財經

河北舉報

分享至

來源：市場資訊

（來源：圖靈人工智能）

轉自Python數智工坊，僅用于學術分享，如有侵權留言刪除

張三做了一次癌癥篩查，結果顯示陽性。

醫生告訴他，這個檢測的準確率高達99%。

張三當場崩潰，覺得自己大概率得了癌癥。

但如果我告訴你：張三真正患癌的概率，可能只有不到10%。

這不是在安慰他，這是數學。背后的邏輯，來自一個18世紀英國牧師的遺作——貝葉斯定理。

一、他是誰？一個從未見過自己最偉大作品出版的人

托馬斯·貝葉斯（Thomas Bayes），1702年生于英國，牧師出身，業余數學家。

他的一生默默無聞，既沒有大學教職，也沒有任何重要頭銜，在英國皇家學會的會員身份，據說還是朋友幫他爭來的。

1761年，貝葉斯去世，留下了一篇從未發表的手稿，甚至連他自己可能都不太確定這篇東西有沒有價值。

他的朋友理查德·普萊斯整理了這份遺稿，兩年后以貝葉斯的名義發表。文章幾乎沒有引起任何反響。

此后將近200年，這個定理被遺忘、被質疑、被主流數學界打壓。直到20世紀下半葉，隨著計算機的出現，它才重新被發現——并在短短幾十年內，徹底改變了統計學、人工智能、醫學診斷、搜索引擎……幾乎所有需要"在不確定中做決策"的領域。

一個牧師的遺作，遲到了200年，改變了世界。

二、貝葉斯定理在講什么？一句話的核心

在講公式之前，先記住這一句話：

當你獲得新證據時，你應該如何更新自己原有的判斷。

就這一句。

聽起來很簡單，但這句話背后隱藏著一種和我們日常直覺截然不同的思維方式。

三、一個故事：偵探破案

偵探老李接到一起案件：公司保險柜里的錢不見了，嫌疑人只有兩個：財務A和倉管B。

第一步：初始判斷

在沒有任何證據之前，兩人的嫌疑程度相當，老李初步估計A是嫌疑人的概率是50%。

這在貝葉斯語言里叫做先驗概率——在看到新證據之前，對某件事的初始判斷。

第二步：發現了新證據

調查發現，案發當晚A的門禁卡有異常刷卡記錄，而B的記錄完全正常。

老李要問兩個問題：

如果A真的是嫌疑人，他的門禁卡出現異常的概率有多高？—— 假設是80%
如果A不是嫌疑人，門禁卡也出現異常的概率有多高？—— 假設是20%（可能是系統故障）

第三步：更新判斷

貝葉斯定理把這些數字組合起來，告訴老李：在看到"門禁卡異常"這個證據之后，A是嫌疑人的概率是多少？

計算下來約為**80%**。

從50%升到了80%——證據讓懷疑更有分量了，但老李不會就此蓋棺定論，他還需要繼續收集證據。

如果接下來又發現A當天的通話記錄有異常，他會再做一次更新；如果又發現A有不在場證明，概率會往回調。

每一條新證據，都是一次更新。這就是貝葉斯定理的核心：用新證據，持續校準判斷。

四、公式長什么樣？換個寫法就懂了

貝葉斯定理的數學表達式是：

P(A|B) = P(B|A) × P(A) / P(B)

把故事里的話對應進來：

符號

意思

故事里的對應

P(A)

先驗概率：事件A本來發生的概率

A是嫌疑人的初始概率（50%）

P(B|A)

在A成立的前提下，看到證據B的概率

A是嫌疑人→門禁異常的概率（80%）

P(B)

證據B本身出現的概率（不管原因）

門禁異常這件事本身出現的概率

P(A|B)

后驗概率：看到證據B后，A成立的概率

看到門禁異常后，A是嫌疑人的概率

用大白話翻譯這個公式：

更新后的判斷= 證據對這個判斷的支持力度 × 原始判斷÷ 這個證據本身出現的概率

或者更口語地說：

新判斷 = 舊判斷 × 這個證據有多"指向"這個判斷

五、回到張三：癌癥篩查那個反直覺的結論

現在有了工具，回來解開開頭那個讓張三崩潰的問題。

已知條件：

某種癌癥在人群中的患病率：**1%**（100個人里約有1個患者）
檢測準確率：**99%**（真正患癌的人，99%會被檢出；沒患癌的人，99%顯示陰性）
張三的檢測結果：陽性

直覺告訴我們：準確率99%，陽性結果，那大概率是真的患癌了。

貝葉斯告訴我們：先等一下，把這件事放到10000個人里想一想。

10000人里參加篩查：├── 真正患癌：100人（患病率1%）│   ├── 檢測陽性：99人  ← 真陽性（被正確檢出）│   └── 檢測陰性：1人└── 沒有患癌：9900人├── 檢測陽性：99人  ← 假陽性（被誤報）└── 檢測陰性：9801人

所有檢測陽性的人：99 + 99 = 198人

其中真正患癌的：99人

所以張三檢測陽性，真正患癌的概率：99 ÷ 198 = 50%

而如果這種癌癥更罕見，患病率只有**0.1%（1000人里1個），那陽性之后真正患癌的概率只有約9%**。

準確率99%的檢測，陽性結果只有9%的可能是真的患癌——這不是數學魔術，這是真實的醫學統計現象，有個專有名詞叫**"假陽性悖論"，也稱"基礎率謬誤"**。

核心教訓：任何檢測結果，都必須結合"這個病本身有多罕見"來解讀，而不能只看準確率。

這也是為什么很多篩查分階段進行：初篩陽性→精確復查→再次更新概率判斷→最終確診。每多一條證據，判斷就更準一次。

六、貝葉斯思維，對普通人的三個實際用處

貝葉斯定理不只是數學公式，更是一種在不確定的世界里理性決策的思維框架。

用處一：不要被"一個證據"徹底翻盤

你對同事小王的印象一向不錯——工作認真，為人靠譜（先驗：他是個靠譜的人，90%）。

然后有人跟你說，小王在背后說了你的壞話（新證據）。

直覺反應：立刻把對他的信任清零，從此疏遠。

貝葉斯反應：先問兩個問題——這個消息來源可靠嗎？即使消息屬實，這一件事能否推翻你們多年相處積累的90%信任度？

證據會更新判斷，但更新的幅度，取決于證據的可靠程度和你的先驗有多強。一條二手傳言，不應該讓一段長期積累的判斷瞬間歸零。

貝葉斯不讓你無視證據，但也不允許你被單一證據綁架。

用處二：識破"以偏概全"的陷阱

新聞報道：某地有人因為吃外賣食物中毒。

很多人看完就開始恐慌，不敢點外賣了。

貝葉斯會問：這件事有多罕見？它改變了多少概率？

如果每天有1億個外賣訂單，出現1例食物中毒，概率是0.000001%。這條新聞會輕微更新你對外賣安全性的判斷——但更新幅度應該極小，而不是引發全面恐慌。

稀少的壞事之所以總上新聞，恰恰是因為它稀少。貝葉斯幫你把"新聞的顯著性"和"事件的真實概率"分開來看，避免被媒體的選擇性報道帶偏判斷。

用處三：做更好的決策，即使信息不完整

假設你在考慮投資一個創業項目。

你不可能100%確定它會成功，但貝葉斯給你一套清晰的決策框架：

先估基礎成功率（行業內同類早期項目的存活率，假設20%）—— 這是先驗
逐條收集證據，逐次更新：
- 創始人有成功退出經驗？概率上調
- 產品已有付費用戶？再上調
- 所在賽道競爭極度激烈？下調
- 核心團隊剛剛有人離職？再下調
最終你的判斷，不是來自某一個決定性信號，而是來自所有證據的綜合積累。
這才是理性決策的真實面目——不是"感覺對了就沖"，也不是"沒有百分百把握就不動"，而是基于現有證據給出當下最合理的判斷，并隨時準備更新。
七、貝葉斯改變了哪些領域？
貝葉斯定理已經深入滲透進現代世界的技術底層，你每天都在用，只是不知道。
垃圾郵件過濾看到"免費領取""點擊鏈接""恭喜中獎"這些詞，系統用貝葉斯不斷更新"這封郵件是垃圾郵件的概率"，超過閾值就進垃圾箱。這是最早被大規模落地的AI應用之一。
醫學診斷輔助醫生做鑒別診斷的過程，本質上就是貝葉斯推斷：根據癥狀（證據），不斷更新對各種疾病的概率判斷，最終鎖定最可能的診斷結論。
搜索引擎與推薦算法你輸入"蘋果"，搜索引擎要判斷你是想找蘋果手機還是蘋果水果——它綜合你的歷史行為、當前上下文、地理位置，用貝葉斯估計最可能的意圖。
大語言模型ChatGPT、Claude這類AI，底層的語言生成邏輯，本質上就是在不斷預測"下一個最可能出現的詞"——這是貝葉斯概率推斷的直接應用。
自動駕駛自動駕駛汽車用貝葉斯濾波持續融合攝像頭、雷達、激光雷達的傳感器數據，實時更新對周圍環境的感知和判斷，毫秒級做出行駛決策。
八、貝葉斯思維最難的地方：承認"我不確定"
貝葉斯定理有一個前提，是很多人心理上不愿意接受的：
你必須先給出一個初始概率——哪怕是估算的。
傳統的嚴謹觀念認為：沒有足夠數據，不能下結論，猜測是不科學的。
貝葉斯說：你永遠需要從某個起點出發。承認"我現在只有60%的把握"，比假裝"我沒有意見"要誠實得多，也有用得多。隨著證據積累，你的判斷會越來越準。
確定性不是判斷的前提，而是不斷積累證據之后的結果。
結語
一個18世紀的英國牧師，在去世前寫下了一篇關于概率的手稿。他不會知道，它會被寫進每一臺自動駕駛汽車的算法里、每一個垃圾郵件過濾器里、每一次醫學影像的圖像重建里。
貝葉斯定理的本質，是一種對世界更謙遜、也更理性的態度：
我不知道真相，但我會根據現有證據給出最好的判斷；當新的證據出現，我會更新判斷，而不是死守立場。
這不只是數學，這是面對不確定世界的生存哲學。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.