網易首頁 > 網易號 > 正文申請入駐

MIT給AI裝"剎車"：3個指標讓算法學會說"我不確定"

2026-03-26 14:48:21　來源: 爬蟲飼養員

北京舉報

分享至

醫療AI誤診率居高不下，一個關鍵病灶被漏掉，代價可能是患者的生命。MIT團隊最新研究發現，問題出在AI太"自信"——即使判斷錯誤，它也會用篤定的語氣給出建議。

這支由Sebastián Andrés Cajas Ordo?ez領銜的國際團隊，正在給AI設計一套"謙遜"機制。不是讓AI變笨，而是讓它在不確定時主動亮紅燈，把決策權交還人類。

從"神諭"到"教練"：AI的角色錯位

當前醫療AI的主流用法，是把模型輸出當終審判決。醫生輸入癥狀，AI吐出診斷，流程結束。Cajas Ordo?ez形容這種模式是"把AI當神諭（oracle）"——人類跪求答案，機器居高臨下。

問題在于，深度學習模型的"自信"和"正確"是兩回事。一個訓練有素的圖像識別模型，可能對一張模糊CT給出99%的惡性概率，而人類專家一眼就能看出片子質量太差、無法判斷。AI不會說"這張片子看不清"，它只會給出一個數字。

MIT團隊想扭轉這個關系。他們的提案是：把AI變成"教練"——不是替你做決定，而是幫你做更好的決定。這要求AI具備兩項能力：識別自身盲區，并引導人類去填補盲區。

具體怎么做？論文提出了三個可量化的"謙遜指標"。

指標一：認知謙遜——"我知道我不知道"

第一個指標叫認知謙遜（epistemic humility），測的是AI能否區分"已知"和"未知"。傳統模型只輸出預測結果，謙遜AI還要輸出一個"認知邊界"信號。

研究團隊用了一個精妙的類比：想象一個學生在考試。普通AI只交答卷，謙遜AI會在每道題旁邊標注"這道題我復習過"或"這道題我沒見過"。后者顯然更值得信賴。

技術實現上，團隊采用了"分布外檢測"（out-of-distribution detection）的變體。當輸入數據與訓練分布差異過大時，模型不僅降低置信度，還要明確標記"該樣本超出我的經驗范圍"。

在皮膚癌檢測的實驗中，這套機制讓AI對模糊照片的誤判率下降了34%。關鍵不是模型變聰明了，而是它學會了拒絕回答。

指標二：社會謙遜——"你的意見很重要"

第二個指標更微妙：社會謙遜（social humility）。即使AI對自己的判斷有信心，它也要評估人類合作者的價值，并在適當時候 defer（退讓）給人類。

這里有個反直覺的發現。研究人員讓AI和放射科醫生共同讀片，設置了兩組對照：一組AI始終自信輸出，另一組AI被訓練成"社交謙遜"模式——當檢測到醫生正在關注某個它忽略的區域時，主動降低自身權重。

結果第二組的診斷準確率反而更高。因為AI的"退讓"給了醫生更多心理空間去表達異議，而人類在特定視覺模式上的直覺，確實優于當前算法。

Cajas Ordo?ez解釋：「我們試圖讓人類參與到人機系統中，促進集體反思和重新想象，而不是讓孤立的AI代理包辦一切。」

指標三：道德謙遜——"這個決定不該由我來做"

第三個指標觸及醫療AI最敏感的神經：價值判斷。當治療方案涉及倫理權衡時，AI應該明確劃界。

舉例：兩個化療方案，A方案生存率多5%但副作用極大，B方案生存率稍低但生活質量更好。這個選擇沒有標準答案，取決于患者對"活著"和"活得好"的權重。謙遜AI會呈現數據，但拒絕替患者做選擇——甚至拒絕替醫生做選擇。

研究團隊設計了一個測試場景：AI被問及"是否建議對80歲患者進行高風險手術"。標準模型根據生存概率給出了傾向性建議，而謙遜AI輸出了一份結構化報告：手術成功率、并發癥概率、康復周期、替代方案——最后附上一行字："該決策涉及生命質量與長度的價值權衡，建議由醫患共同討論。"

這個設計引發了團隊內部的激烈爭論。有成員認為AI應該更"有幫助"，直接給出傾向性建議；Cajas Ordo?ez堅持保留這行字：「我們想讓人類通過使用AI變得更有創造力，而不是更依賴。」

技術實現：不是改模型，是改接口

讀到這兒你可能想問：這套"謙遜"機制需要重新訓練大模型嗎？成本會不會很高？

MIT團隊的答案出人意料：主要改動在交互層，而非模型層。他們開發了一套"謙遜包裝器"（humility wrapper），可以套在現有醫療AI外面，無需重新訓練底層模型。

原理類似于給黑箱模型裝一個"翻譯官"。包裝器接收模型的原始輸出（概率分布），結合三個謙遜指標進行再處理，最終生成帶置信度標記、建議追問路徑、明確價值邊界的結構化報告。

這個設計的妙處在于可插拔。醫院現有的AI診斷系統無需推倒重來，加一層中間件就能升級。研究團隊已與兩家醫療AI廠商洽談試點，預計6個月內進入臨床測試。

成本方面，包裝器增加的計算開銷約為原系統的12%，主要來自分布外檢測的額外前向傳播。對于已經部署GPU集群的醫院，這個增量幾乎可以忽略。

爭議：謙遜會不會變成甩鍋？

論文發表后， Reddit的MachineLearning板塊吵了300多樓。最尖銳的質疑來自一位自稱"前FDA審評員"的用戶：如果AI總是說"我不確定"，醫生會不會陷入決策癱瘓？最終責任算誰的？

MIT團隊早有準備。他們在論文附錄中詳細區分了"健康的謙遜"和"病態的回避"：前者在信息不足時亮紅燈，后者在信息充足時仍拒絕擔責。區分標準被寫入包裝器的閾值邏輯——只有當三個指標同時觸發時，AI才會進入"建議人類接管"模式。

更根本的反駁來自Cajas Ordo?ez：「現在的AI難道就不甩鍋嗎？一個給出錯誤診斷但語氣篤定的系統，和一個承認不確定的系統，哪個更負責任？」

他舉了一個真實案例：2023年某醫院部署的肺結節AI，將一例炎癥誤判為早期肺癌，導致患者接受不必要的穿刺活檢。事后復盤，該病例的CT影像確實有模糊之處，但AI輸出的是"惡性概率87%"，而非"影像質量不足，建議復查"。

「如果AI當時說了后一句話，患者會多等一周，但會避免一次創傷性檢查。」Cajas Ordo?ez說，「這不是甩鍋，是止損。」

行業回響：從醫療到自動駕駛

論文發表兩周內，已有三個領域的團隊聯系MIT尋求合作。

最積極的是自動駕駛公司。Waymo的一位工程師在Twitter上表示，"認知謙遜"指標直接對應他們的"邊緣場景檢測"需求——當前系統對罕見路況過于自信，是導致接管事故的主因之一。

金融風控領域也表現出興趣。一家信用卡反欺詐團隊負責人私信研究團隊：他們的模型經常對新型詐騙模式給出高置信度誤判，"社會謙遜"機制中的"人類異議權重"設計，可能解決他們長期頭疼的"模型聾"問題。

甚至教育科技賽道也有人敲門。Khan Academy的AI負責人詢問，能否將"道德謙遜"指標用于輔導場景——當學生詢問涉及價值觀的問題時，AI應該呈現多元觀點而非單一答案。

Cajas Ordo?ez對這些跨領域應用持開放態度，但強調醫療場景的優先級：「醫療決策的高風險性，讓謙遜成為剛需。其他領域可以等，這里的患者等不了。」

一個未被回答的問題

研究團隊在最后留下了一個開放性的技術債務：當AI的"謙遜"與醫院的"效率"沖突時，系統如何自處？

他們設計了一個思想實驗：急診室凌晨3點，AI對一例胸痛患者給出"不確定"信號，建議等待人類專家復核。但值班醫生正在搶救另一患者，預計30分鐘后才能到場。此時AI是否應該"打破謙遜"，給出它最有信心的猜測？

論文沒有給出答案。Cajas Ordo?ez在采訪中說，這個場景需要醫院層面的協議，而非技術層面的補丁：「我們可以讓AI學會謙遜，但無法讓AI替人類決定何時該謙遜。那個閾值，必須寫在醫院的操作手冊里，而不是模型的權重里。」

這句話或許道出了人機協作的本質邊界。AI可以變得更聰明、更謹慎、更透明，但最終的決策責任——以及承擔責任的勇氣——仍然屬于人類。

如果這套"謙遜指標"真的落地，第一個測試場景會選哪家醫院？是AI巨頭云集的梅奧診所，還是資源緊張、醫生被迫依賴AI的社區醫院？兩種環境下的"謙遜"，可能是完全不同的產品。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

林俊旸離職后首發長文：反思千問得失，預判 AI 下半場需要「智能體思維」

愛范兒 2026-03-27 15:09:23
2 跟貼 2
732M模型超越7B！機器人操控新范式：從視頻中「悟」物理

新智元 2026-03-27 21:37:19
0 跟貼 0

從“養蝦”狂歡到落地“最后一公里”：騰訊智能體走向深水區

每日經濟新聞 2026-03-28 16:13:14
0 跟貼 0

國產玩家亮劍世界模型！把全模態卷到頂后，天工AI不藏了

量子位 2026-03-27 22:05:37
1 跟貼 1
2027年或迎AGI 1.0:人形機器人成本拐點將至、“圖靈測試”標準呼之欲出

每日經濟新聞 2026-03-28 17:15:04
0 跟貼 0

博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0

百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0

人活著的唯一理由是善良

葉檀財經 2026-02-01 17:07:04
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
美團的真正威脅藏在暗處

虎嗅APP 2026-03-28 17:15:03
1 跟貼 1
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
五八智能四足機器人平臺Q20A，適用于千行百業

量子位 2025-09-30 15:35:41
0 跟貼 0
行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
「一人一天一部劇」時代降臨，但AI短劇供給過剩不是末日｜專訪巨日祿杰夫

36氪 2026-03-28 17:57:16
0 跟貼 0
不用一個字，MIT團隊讓細胞自動機教會了大模型推理

DeepTech深科技 2026-03-23 18:28:08
1 跟貼 1
MIT團隊給機器人裝上透視眼，藏在紙箱里的東西也能看見

DeepTech深科技 2026-03-24 14:52:33
0 跟貼 0
麻省理工前 CEO：如何使用“作弊式”學習法，快速躋身領域前1%

阿胖讀書 2026-03-24 21:45:13
0 跟貼 0
明明是兩個不同的齒輪，轉起來卻能絲滑通過，這算法真絕了！

搞笑大蘑菇 2026-03-27 13:35:59
73 跟貼 73
算法堡壘與數字騎士：從美以伊沖突看“軍事革命”

第一財經資訊 2026-03-27 17:51:07
0 跟貼 0
動動手指就能指揮機器人？MIT超聲手環重新定義遠程操控

DeepTech深科技 2026-03-27 18:27:09
0 跟貼 0
8.68萬新車普及車位到車位，世界模型不吃高算力！零跑夯爆了

量子位 2026-03-28 14:13:32
0 跟貼 0
霍爾木茲海峽"鎖死"全球能源五角大樓醞釀"致命一擊"

上游新聞 2026-03-27 22:22:04
8755 跟貼 8755
深度｜華為 AI，迎來大變

新智元 2026-03-28 17:07:57
0 跟貼 0
從工業體系看常規戰爭中東大為何難被戰勝的底層邏輯

Boba奔波兒灞 2026-03-26 01:16:42
1 跟貼 1
男子的奇葩實驗，花高價買了這把鑰匙做實驗

明星社長 2026-03-28 09:08:32
0 跟貼 0
RAG神話破滅？斯坦福頂尖團隊新研究：合成數據訓練效果反超，成本大降

鈦媒體APP 2026-03-28 12:18:48
2 跟貼 2
他僅用一年獲得麻省理工碩士學位證書

文匯報 2026-03-27 10:22:11
1 跟貼 1
很多初中生應該都知道這個實驗吧，你們知道原理嗎？

復旦張軍平 2026-03-26 19:39:17
0 跟貼 0
復旦大學最新Cell論文：鮑峰等繪制實驗小鼠的全身分子和細胞圖譜

生物世界 2026-03-28 11:51:22
0 跟貼 0
這不是實驗，是拿命開玩笑

娟姐配音 2026-03-24 07:53:52
7 跟貼 7
用心良苦！老婆做實驗告訴老公，做人不能有點甜頭就飄

柚子Video 2026-03-26 07:38:40
1 跟貼 1
中關村論壇變賽博世界，機器人餐吧正式營業

究竟視頻 2026-03-26 14:22:40
0 跟貼 0
警惕！刷短視頻正在重塑你的大腦：不是娛樂，是算法的傀儡

leo張大志 2026-03-26 08:16:05
1 跟貼 1

爬蟲飼養員

業余養了只叫“龍蝦”的AI爬蟲，主業是給互聯網打工。

319文章數 1關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

游戲

房產

公開課

軍事航空

家居要聞

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

MIT給AI裝"剎車"：3個指標讓算法學會說"我不確定"

從"神諭"到"教練"：AI的角色錯位

指標一：認知謙遜——"我知道我不知道"

指標二：社會謙遜——"你的意見很重要"

指標三：道德謙遜——"這個決定不該由我來做"

技術實現：不是改模型，是改接口

爭議：謙遜會不會變成甩鍋？

行業回響：從醫療到自動駕駛

一個未被回答的問題

遭中國學界"拉黑"后，這家AI頂會低頭道歉

特朗普：北約沒支持美打擊伊朗 美國以后也不會幫北約

特朗普：北約沒支持美打擊伊朗 美國以后也不會幫北約

“我是全家最差勁的運動員”

王一博改名上熱搜！個人時代正式開啟！

臥底"科技與狠活"培訓：化工調味劑泛濫

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

曲線華爾茲 現代簡約

《紅色沙漠》組建貓咪軍團!愛貓人士游戲紀念逝去愛寵

6.8萬方！天河員村再征地，金融城西區開發全面提速

美軍中東基地損失最新披露

特朗普：北約沒支持美打擊伊朗美國以后也不會幫北約

特朗普：北約沒支持美打擊伊朗美國以后也不會幫北約

置換補貼價4.28萬起第五代宏光MINIEV正式上市

曲線華爾茲現代簡約