網易首頁 > 網易號 > 正文申請入駐

比起上市，王小川講了更多AI醫療的非共識

2026-01-15 18:47:21　來源: 光錐智能

北京舉報

分享至

文｜魏琳華

編｜王一粟

代碼過后，醫療有可能成為下一個AI落地應用鋪開規模的行業嗎？

這個答案似乎出現了一些端倪。從2026年開年到現在的15天，AI醫療已經有了不少矚目的動作，且均集中向C端試水。

1月8日，OpenAI推出了ChatGPT Health，允許用戶將Apple Health、Function等應用中的電子病歷和體征數據提供給AI，解答用戶的健康問題。

1月11日，Anthropic正式推出了Claude for Healthcare，也就是Claude的醫療版。它通過和初創公司合作，把用戶的醫療數據接入到模型中，從而讓模型為用戶提供健康咨詢服務。

集中的信號釋放出，2026年AI醫療的新趨勢——AI公司們正在嘗試將醫療服務開展到醫院場景之外。

作為大模型五小龍中唯一一家All in AI醫療的大模型公司，百川也有了新動作。1月13日，百川智能在北京舉辦了關于M3大模型發布的媒體溝通會，把自家的AI醫療新模型放了出來。官方數據中，這個模型在多項測試分數上超過了OpenAI的GPT-5.2。

拆解新模型的技術優勢之外，王小川還給出了很多非共識的觀點：他認為，技術是堅定的護城河，數據很關鍵，但不是最關鍵的一個；多模態是主戰場這個事情，他從第一天起就不認可，比起多模態，語言大模型才是智能的最高體現。

回顧去年，對王小川和百川智能最重要的一件事，就是明確了“用AI造醫生”的發展路線。用王小川的話說，做科研的第一步，就是要把模型做得足夠好，這就有了M1、M2到今天M3的迭代。

2026年，對百川是一個關鍵的節點，王小川分享，今年百川智能會有大動作，做AI硬件、C端產品。看起來，從大模型之外，百川的商業化敘事終于要落到具體的產品上。

但這對于百川也不是一場輕松的仗。會上，王小川透露目前百川賬上還有30億現金，結合之前累計50多億的融資，意味著百川在過往1年半時間里燒掉了20億左右。

透過百川，我們如何看待AI醫療過往和未來發生的事情，接下來這個賽道又會有哪些可能性？

實測M3大模型，嚴肅醫療和泛健康的區別在哪？

時隔4個多月，百川把自研大模型BaiChuan-M3端上了臺面。

從官方評測數據來看，比起M2追趕海外領先模型的情況，新開源的M3算是一個成功超越的標志。在幻覺、HealthBench（OpenAI建立的評測集）各項跑分結果上，它全面超越了OpenAI的GPT-5.2。

除了用數據印證新模型的智能之外，光錐智能實測了M3模型，和國內的螞蟻阿福做對比。結論是，在診斷結果的準確度上，兩者對大多數情況的判斷結果一致，且都能給出相似的癥狀猜測和檢查建議。

不過，在少部分情況下，M3的測試更接近真實就醫的判斷，阿福則在測試中更擅長追問，基本每次問問題都會要求用戶補充多次信息。

最明顯的一點感受是，M3能把病的來龍去脈講明白，而不是只停留在術語和結果判斷上。

在測試中，光錐智能以“為什么指標屬于重度貧血，但生活中只是感到輕度疲勞”作為案例詢問M3和阿福，想要找到對應的病癥，以及為什么個人體感上沒有影響的情況。

對此，阿福和M3在癥狀的判定上都沒有問題，認為最有可能的病癥是慢性、緩慢進展的貧血，并且開好了接下來要去醫院開的檢查項目。

在癥狀的說明上，M3在多個測試中都能給出更通俗易懂的解釋。

比起列對應的病癥、擺術語，下結論，M3多了一個解釋原因的部分。還以上述的貧血為例，M3用一般人更能看懂的方式打了個比方，好比高海拔地區缺氧時人體啟動的調整，貧血是用心臟代償、血液代償和組織代償完成了自身調整，同時提醒用戶它以“透支健康”為代價，闡述風險，提示用戶盡快就醫。

這個差異化的來源，翻閱百川發布M3當天上線的技術報告來看，一部分功勞要歸于百川自創的SCAN-bench評測體系。

百川提及，這個評測體系聯合150多位一線醫生共同搭建。它把就醫過程拆解成病史采集、輔助檢查和精準診療三個階段。一階段根據SCAN原則結構化、精準采集所需信息后，二階段輔助檢查補充臨床所需的檢查信息，最終把獲得的所有結果去整理成結論。這種動態、多輪的方式，讓模型能夠在給出結論的同時，把思路完整展示出來，從而讓用戶了解到更多信息。

另外一個是百川引用的醫療論文+自創算法。在測試中，每個病癥原因的解釋、對癥的標準判斷，M3基本都引用了1-3條論文文獻信息作印證。

在測試中，筆者以生理期延遲做測試，詢問是否需要就診，M3結合了一篇引用的論文，告訴筆者如果沒有出現一些特殊變化，偶爾一次只需要觀察即可。這個結論，和醫生給到的結論完全一致。

不過上述引用的論文并沒有直接給出相應的印證結論，只是給了對周期判斷的標準。所以整體下結論的準確，或許要歸功于分段強化學習。

可以簡單理解為，在只以結果做唯一結論的強化學習方式上，百川做了新的改良，把診斷拆成四個部分問診、鑒別診斷、實驗室檢測和最終診斷，分階段去做強化學習，每個階段的結論信息可以帶到下一個階段。針對醫療這類長時間問詢過程的任務，處理準確度也有所提升。

比較遺憾的地方是，M3在一些地方的追問明顯沒有螞蟻阿福更多。后者基本每一次的問題都會給2-3個連續追問、補充信息的環節。其實M3也有提示一些風險項，但螞蟻會把這類癥狀作為補充觀察的信息繼續詢問。結合一些針對不同問診人的建檔區分，其交互體驗上在C端表現更成熟。

上市、出海？比起這些，AI醫療今年的落地更值得期待

除了帶來新模型M3之外，王小川講了更多有意思的事情，既關乎百川自己的打法，也有今年AI醫療落地的新突破。

對于如何做AI醫療大模型，王小川講了許多“非共識”。

在主流模型路線上，王小川認為，醫療AI的主戰場從來都不是多模態，而是語言大模型。

“ 到目前為止，評判哪個公司的模型能力強，都是以符號、語言為基礎。比如Sora的可用性強，但不代表智力很高。”王小川說，“醫療的本質是推理，它并不是只是一個圖像問題。在現階段，影像報告最后還是變成文字進入模型。圖像是樹上掛的小葉子，不是主戰場。”

關于數據，王小川也不認為數據是訓練大模型最關鍵的一環。用他的原話來說，數據雖然也很重要，但在大模型行業沒有成功案例。他還認為，收集更多的用戶信息，也不意味著能夠靠數據“彎道超車”。

王小川舉了個例子：“Gemini和Claude沒有OpenAI那么多C端的用戶，依然做出了領先的模型，可見當前階段的優勢更多是在于技術。”

關于AI醫療領域，王小川分享了一個最重要的趨勢，也是我們現在在AI醫療領域看到的新趨勢，AI醫療將有更多機會誕生在醫院外的場景中。

“未來AI醫療巨大的增量會出現在院外。院內更多的是做手術，做執行，給人掛水的地方，我們并不鼓勵把場景放在院內，寫病歷、做質控，那些都不是未來的主流方向。”王小川說。

為什么會有這樣的判斷，從國內醫療環境出發，王小川提起了AI醫療的四個痛點：第一，好醫生不夠、供給不足；第二，醫患關系不夠平等，決策者是醫生，個人難以用常識去判斷這些決策；第三，海外和國內就醫環境的不同，前者每個家庭有專屬醫生；第四，醫學不夠發達，存在很多難以解決的問題。

開年新動作中，OpenAI的押注方向同樣選擇了C端，把個人用戶的醫療數據接入ChatGPT，讓AI幫助用戶提供健康服務。螞蟻阿福上線后，月活超過大量AI助手類產品，到現在3500萬MAU的突破，也說明了這個市場的可能性。

從AI醫療清一色先攻B端，到螞蟻阿福、OpenAI和百川，做C端也成了接下來值得關注的嘗試。

王小川也直言，百川目前的護城河是技術、場景和產品形態：

M3代表百川技術的能力體現，在場景切入上，百川的定位比市面上的泛健康類AI醫療產品更近一步，“至少能夠像家庭醫生一樣”。這個界限，又把控在不碰醫療紅線的基礎上，也就是不會做醫生真正該做的決策，而是輔助決策。落到具體產品上，百川今年計劃發布兩款C端產品，也在嘗試做和睡眠相關的AI硬件產品。

看起來，百川智能對自己的戰略正在一天比一天清晰，但最關鍵的問題是，決定生死的商業化路線，能夠跑通嗎？

在國內當前的付費環境下，C端變現本身就是一條風險更大的路，比如螞蟻阿福至今未收費，更多用戶是否愿意買單；對于比其他領域更看重準確性、輿論問題更明顯的醫療領域來說，C端付費路上也存在很多未知的風險。

想上市、有意愿出海的百川智能，能靠今年拿出的C端產品證明AI醫療商業化的潛力嗎？這個答案，或許接下來幾個月就能有新的解答。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.