來源:市場資訊
(來源:圖靈人工智能)
![]()
轉自Python數智工坊,僅用于學術分享,如有侵權留言刪除
張三做了一次癌癥篩查,結果顯示陽性。
醫生告訴他,這個檢測的準確率高達99%。
張三當場崩潰,覺得自己大概率得了癌癥。
但如果我告訴你:張三真正患癌的概率,可能只有不到10%。
這不是在安慰他,這是數學。背后的邏輯,來自一個18世紀英國牧師的遺作——貝葉斯定理。
一、他是誰?一個從未見過自己最偉大作品出版的人
托馬斯·貝葉斯(Thomas Bayes),1702年生于英國,牧師出身,業余數學家。
他的一生默默無聞,既沒有大學教職,也沒有任何重要頭銜,在英國皇家學會的會員身份,據說還是朋友幫他爭來的。
1761年,貝葉斯去世,留下了一篇從未發表的手稿,甚至連他自己可能都不太確定這篇東西有沒有價值。
他的朋友理查德·普萊斯整理了這份遺稿,兩年后以貝葉斯的名義發表。文章幾乎沒有引起任何反響。
此后將近200年,這個定理被遺忘、被質疑、被主流數學界打壓。直到20世紀下半葉,隨著計算機的出現,它才重新被發現——并在短短幾十年內,徹底改變了統計學、人工智能、醫學診斷、搜索引擎……幾乎所有需要"在不確定中做決策"的領域。
一個牧師的遺作,遲到了200年,改變了世界。
二、貝葉斯定理在講什么?一句話的核心
在講公式之前,先記住這一句話:
當你獲得新證據時,你應該如何更新自己原有的判斷。
就這一句。
聽起來很簡單,但這句話背后隱藏著一種和我們日常直覺截然不同的思維方式。
三、一個故事:偵探破案
偵探老李接到一起案件:公司保險柜里的錢不見了,嫌疑人只有兩個:財務A和倉管B。
第一步:初始判斷
在沒有任何證據之前,兩人的嫌疑程度相當,老李初步估計A是嫌疑人的概率是50%。
這在貝葉斯語言里叫做先驗概率——在看到新證據之前,對某件事的初始判斷。
第二步:發現了新證據
調查發現,案發當晚A的門禁卡有異常刷卡記錄,而B的記錄完全正常。
老李要問兩個問題:
如果A真的是嫌疑人,他的門禁卡出現異常的概率有多高?—— 假設是80%
如果A不是嫌疑人,門禁卡也出現異常的概率有多高?—— 假設是20%(可能是系統故障)
第三步:更新判斷
貝葉斯定理把這些數字組合起來,告訴老李:在看到"門禁卡異常"這個證據之后,A是嫌疑人的概率是多少?
計算下來約為**80%**。
從50%升到了80%——證據讓懷疑更有分量了,但老李不會就此蓋棺定論,他還需要繼續收集證據。
如果接下來又發現A當天的通話記錄有異常,他會再做一次更新;如果又發現A有不在場證明,概率會往回調。
每一條新證據,都是一次更新。這就是貝葉斯定理的核心:用新證據,持續校準判斷。
四、公式長什么樣?換個寫法就懂了
貝葉斯定理的數學表達式是:
P(A|B) = P(B|A) × P(A) / P(B)把故事里的話對應進來:
符號
意思
故事里的對應
P(A)
先驗概率:事件A本來發生的概率
A是嫌疑人的初始概率(50%)
P(B|A)
在A成立的前提下,看到證據B的概率
A是嫌疑人→門禁異常的概率(80%)
P(B)
證據B本身出現的概率(不管原因)
門禁異常這件事本身出現的概率
P(A|B)
后驗概率:看到證據B后,A成立的概率
看到門禁異常后,A是嫌疑人的概率
用大白話翻譯這個公式:
更新后的判斷= 證據對這個判斷的支持力度 × 原始判斷÷ 這個證據本身出現的概率
或者更口語地說:
新判斷 = 舊判斷 × 這個證據有多"指向"這個判斷
五、回到張三:癌癥篩查那個反直覺的結論
現在有了工具,回來解開開頭那個讓張三崩潰的問題。
已知條件:
某種癌癥在人群中的患病率:**1%**(100個人里約有1個患者)
檢測準確率:**99%**(真正患癌的人,99%會被檢出;沒患癌的人,99%顯示陰性)
張三的檢測結果:陽性
直覺告訴我們:準確率99%,陽性結果,那大概率是真的患癌了。
貝葉斯告訴我們:先等一下,把這件事放到10000個人里想一想。
10000人里參加篩查:├── 真正患癌:100人(患病率1%)│ ├── 檢測陽性:99人 ← 真陽性(被正確檢出)│ └── 檢測陰性:1人└── 沒有患癌:9900人├── 檢測陽性:99人 ← 假陽性(被誤報)└── 檢測陰性:9801人所有檢測陽性的人:99 + 99 = 198人
其中真正患癌的:99人
所以張三檢測陽性,真正患癌的概率:99 ÷ 198 = 50%
而如果這種癌癥更罕見,患病率只有**0.1%(1000人里1個),那陽性之后真正患癌的概率只有約9%**。
準確率99%的檢測,陽性結果只有9%的可能是真的患癌——這不是數學魔術,這是真實的醫學統計現象,有個專有名詞叫**"假陽性悖論",也稱"基礎率謬誤"**。
核心教訓:任何檢測結果,都必須結合"這個病本身有多罕見"來解讀,而不能只看準確率。
這也是為什么很多篩查分階段進行:初篩陽性→精確復查→再次更新概率判斷→最終確診。每多一條證據,判斷就更準一次。
六、貝葉斯思維,對普通人的三個實際用處
貝葉斯定理不只是數學公式,更是一種在不確定的世界里理性決策的思維框架。
用處一:不要被"一個證據"徹底翻盤
你對同事小王的印象一向不錯——工作認真,為人靠譜(先驗:他是個靠譜的人,90%)。
然后有人跟你說,小王在背后說了你的壞話(新證據)。
直覺反應:立刻把對他的信任清零,從此疏遠。
貝葉斯反應:先問兩個問題——這個消息來源可靠嗎?即使消息屬實,這一件事能否推翻你們多年相處積累的90%信任度?
證據會更新判斷,但更新的幅度,取決于證據的可靠程度和你的先驗有多強。一條二手傳言,不應該讓一段長期積累的判斷瞬間歸零。
貝葉斯不讓你無視證據,但也不允許你被單一證據綁架。
用處二:識破"以偏概全"的陷阱
新聞報道:某地有人因為吃外賣食物中毒。
很多人看完就開始恐慌,不敢點外賣了。
貝葉斯會問:這件事有多罕見?它改變了多少概率?
如果每天有1億個外賣訂單,出現1例食物中毒,概率是0.000001%。這條新聞會輕微更新你對外賣安全性的判斷——但更新幅度應該極小,而不是引發全面恐慌。
稀少的壞事之所以總上新聞,恰恰是因為它稀少。 貝葉斯幫你把"新聞的顯著性"和"事件的真實概率"分開來看,避免被媒體的選擇性報道帶偏判斷。
用處三:做更好的決策,即使信息不完整
假設你在考慮投資一個創業項目。
你不可能100%確定它會成功,但貝葉斯給你一套清晰的決策框架:
先估基礎成功率(行業內同類早期項目的存活率,假設20%)—— 這是先驗
逐條收集證據,逐次更新:
創始人有成功退出經驗?概率上調
產品已有付費用戶?再上調
所在賽道競爭極度激烈?下調
核心團隊剛剛有人離職?再下調
最終你的判斷,不是來自某一個決定性信號,而是來自所有證據的綜合積累。
這才是理性決策的真實面目——不是"感覺對了就沖",也不是"沒有百分百把握就不動",而是基于現有證據給出當下最合理的判斷,并隨時準備更新。
七、貝葉斯改變了哪些領域?
貝葉斯定理已經深入滲透進現代世界的技術底層,你每天都在用,只是不知道。
垃圾郵件過濾看到"免費領取""點擊鏈接""恭喜中獎"這些詞,系統用貝葉斯不斷更新"這封郵件是垃圾郵件的概率",超過閾值就進垃圾箱。這是最早被大規模落地的AI應用之一。
醫學診斷輔助醫生做鑒別診斷的過程,本質上就是貝葉斯推斷:根據癥狀(證據),不斷更新對各種疾病的概率判斷,最終鎖定最可能的診斷結論。
搜索引擎與推薦算法你輸入"蘋果",搜索引擎要判斷你是想找蘋果手機還是蘋果水果——它綜合你的歷史行為、當前上下文、地理位置,用貝葉斯估計最可能的意圖。
大語言模型ChatGPT、Claude這類AI,底層的語言生成邏輯,本質上就是在不斷預測"下一個最可能出現的詞"——這是貝葉斯概率推斷的直接應用。
自動駕駛自動駕駛汽車用貝葉斯濾波持續融合攝像頭、雷達、激光雷達的傳感器數據,實時更新對周圍環境的感知和判斷,毫秒級做出行駛決策。
八、貝葉斯思維最難的地方:承認"我不確定"
貝葉斯定理有一個前提,是很多人心理上不愿意接受的:
你必須先給出一個初始概率——哪怕是估算的。
傳統的嚴謹觀念認為:沒有足夠數據,不能下結論,猜測是不科學的。
貝葉斯說:你永遠需要從某個起點出發。承認"我現在只有60%的把握",比假裝"我沒有意見"要誠實得多,也有用得多。隨著證據積累,你的判斷會越來越準。
確定性不是判斷的前提,而是不斷積累證據之后的結果。
結語
一個18世紀的英國牧師,在去世前寫下了一篇關于概率的手稿。他不會知道,它會被寫進每一臺自動駕駛汽車的算法里、每一個垃圾郵件過濾器里、每一次醫學影像的圖像重建里。
貝葉斯定理的本質,是一種對世界更謙遜、也更理性的態度:
我不知道真相,但我會根據現有證據給出最好的判斷;當新的證據出現,我會更新判斷,而不是死守立場。
這不只是數學,這是面對不確定世界的生存哲學。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.