![]()
文|魏琳華
編|王一粟
代碼過后,醫療有可能成為下一個AI落地應用鋪開規模的行業嗎?
這個答案似乎出現了一些端倪。從2026年開年到現在的15天,AI醫療已經有了不少矚目的動作,且均集中向C端試水。
1月8日,OpenAI推出了ChatGPT Health,允許用戶將Apple Health、Function等應用中的電子病歷和體征數據提供給AI,解答用戶的健康問題。
1月11日,Anthropic正式推出了Claude for Healthcare,也就是Claude的醫療版。它通過和初創公司合作,把用戶的醫療數據接入到模型中,從而讓模型為用戶提供健康咨詢服務。
集中的信號釋放出,2026年AI醫療的新趨勢——AI公司們正在嘗試將醫療服務開展到醫院場景之外。
作為大模型五小龍中唯一一家All in AI醫療的大模型公司,百川也有了新動作。1月13日,百川智能在北京舉辦了關于M3大模型發布的媒體溝通會,把自家的AI醫療新模型放了出來。官方數據中,這個模型在多項測試分數上超過了OpenAI的GPT-5.2。
拆解新模型的技術優勢之外,王小川還給出了很多非共識的觀點:他認為,技術是堅定的護城河,數據很關鍵,但不是最關鍵的一個;多模態是主戰場這個事情,他從第一天起就不認可,比起多模態,語言大模型才是智能的最高體現。
回顧去年,對王小川和百川智能最重要的一件事,就是明確了“用AI造醫生”的發展路線。用王小川的話說,做科研的第一步,就是要把模型做得足夠好,這就有了M1、M2到今天M3的迭代。
2026年,對百川是一個關鍵的節點,王小川分享,今年百川智能會有大動作,做AI硬件、C端產品。看起來,從大模型之外,百川的商業化敘事終于要落到具體的產品上。
但這對于百川也不是一場輕松的仗。會上,王小川透露目前百川賬上還有30億現金,結合之前累計50多億的融資,意味著百川在過往1年半時間里燒掉了20億左右。
透過百川,我們如何看待AI醫療過往和未來發生的事情,接下來這個賽道又會有哪些可能性?
實測M3大模型,嚴肅醫療和泛健康的區別在哪?
時隔4個多月,百川把自研大模型BaiChuan-M3端上了臺面。
從官方評測數據來看,比起M2追趕海外領先模型的情況,新開源的M3算是一個成功超越的標志。在幻覺、HealthBench(OpenAI建立的評測集)各項跑分結果上,它全面超越了OpenAI的GPT-5.2。
![]()
除了用數據印證新模型的智能之外,光錐智能實測了M3模型,和國內的螞蟻阿福做對比。結論是,在診斷結果的準確度上,兩者對大多數情況的判斷結果一致,且都能給出相似的癥狀猜測和檢查建議。
不過,在少部分情況下,M3的測試更接近真實就醫的判斷,阿福則在測試中更擅長追問,基本每次問問題都會要求用戶補充多次信息。
最明顯的一點感受是,M3能把病的來龍去脈講明白,而不是只停留在術語和結果判斷上。
在測試中,光錐智能以“為什么指標屬于重度貧血,但生活中只是感到輕度疲勞”作為案例詢問M3和阿福,想要找到對應的病癥,以及為什么個人體感上沒有影響的情況。
對此,阿福和M3在癥狀的判定上都沒有問題,認為最有可能的病癥是慢性、緩慢進展的貧血,并且開好了接下來要去醫院開的檢查項目。
![]()
在癥狀的說明上,M3在多個測試中都能給出更通俗易懂的解釋。
比起列對應的病癥、擺術語,下結論,M3多了一個解釋原因的部分。還以上述的貧血為例,M3用一般人更能看懂的方式打了個比方,好比高海拔地區缺氧時人體啟動的調整,貧血是用心臟代償、血液代償和組織代償完成了自身調整,同時提醒用戶它以“透支健康”為代價,闡述風險,提示用戶盡快就醫。
![]()
這個差異化的來源,翻閱百川發布M3當天上線的技術報告來看,一部分功勞要歸于百川自創的SCAN-bench評測體系。
百川提及,這個評測體系聯合150多位一線醫生共同搭建。它把就醫過程拆解成病史采集、輔助檢查和精準診療三個階段。一階段根據SCAN原則結構化、精準采集所需信息后,二階段輔助檢查補充臨床所需的檢查信息,最終把獲得的所有結果去整理成結論。這種動態、多輪的方式,讓模型能夠在給出結論的同時,把思路完整展示出來,從而讓用戶了解到更多信息。
![]()
另外一個是百川引用的醫療論文+自創算法。在測試中,每個病癥原因的解釋、對癥的標準判斷,M3基本都引用了1-3條論文文獻信息作印證。
在測試中,筆者以生理期延遲做測試,詢問是否需要就診,M3結合了一篇引用的論文,告訴筆者如果沒有出現一些特殊變化,偶爾一次只需要觀察即可。這個結論,和醫生給到的結論完全一致。
不過上述引用的論文并沒有直接給出相應的印證結論,只是給了對周期判斷的標準。所以整體下結論的準確,或許要歸功于分段強化學習。
可以簡單理解為,在只以結果做唯一結論的強化學習方式上,百川做了新的改良,把診斷拆成四個部分問診、鑒別診斷、實驗室檢測和最終診斷,分階段去做強化學習,每個階段的結論信息可以帶到下一個階段。針對醫療這類長時間問詢過程的任務,處理準確度也有所提升。
![]()
比較遺憾的地方是,M3在一些地方的追問明顯沒有螞蟻阿福更多。后者基本每一次的問題都會給2-3個連續追問、補充信息的環節。其實M3也有提示一些風險項,但螞蟻會把這類癥狀作為補充觀察的信息繼續詢問。結合一些針對不同問診人的建檔區分,其交互體驗上在C端表現更成熟。
上市、出海?比起這些,AI醫療今年的落地更值得期待
除了帶來新模型M3之外,王小川講了更多有意思的事情,既關乎百川自己的打法,也有今年AI醫療落地的新突破。
對于如何做AI醫療大模型,王小川講了許多“非共識”。
在主流模型路線上,王小川認為,醫療AI的主戰場從來都不是多模態,而是語言大模型。
“ 到目前為止,評判哪個公司的模型能力強,都是以符號、語言為基礎。比如Sora的可用性強,但不代表智力很高。”王小川說,“醫療的本質是推理,它并不是只是一個圖像問題。在現階段,影像報告最后還是變成文字進入模型。圖像是樹上掛的小葉子,不是主戰場。”
關于數據,王小川也不認為數據是訓練大模型最關鍵的一環。用他的原話來說,數據雖然也很重要,但在大模型行業沒有成功案例。他還認為,收集更多的用戶信息,也不意味著能夠靠數據“彎道超車”。
王小川舉了個例子:“Gemini和Claude沒有OpenAI那么多C端的用戶,依然做出了領先的模型,可見當前階段的優勢更多是在于技術。”
關于AI醫療領域,王小川分享了一個最重要的趨勢,也是我們現在在AI醫療領域看到的新趨勢,AI醫療將有更多機會誕生在醫院外的場景中。
“未來AI醫療巨大的增量會出現在院外。院內更多的是做手術,做執行,給人掛水的地方,我們并不鼓勵把場景放在院內,寫病歷、做質控,那些都不是未來的主流方向。”王小川說。
為什么會有這樣的判斷,從國內醫療環境出發,王小川提起了AI醫療的四個痛點:第一,好醫生不夠、供給不足;第二,醫患關系不夠平等,決策者是醫生,個人難以用常識去判斷這些決策;第三,海外和國內就醫環境的不同,前者每個家庭有專屬醫生;第四,醫學不夠發達,存在很多難以解決的問題。
開年新動作中,OpenAI的押注方向同樣選擇了C端,把個人用戶的醫療數據接入ChatGPT,讓AI幫助用戶提供健康服務。螞蟻阿福上線后,月活超過大量AI助手類產品,到現在3500萬MAU的突破,也說明了這個市場的可能性。
從AI醫療清一色先攻B端,到螞蟻阿福、OpenAI和百川,做C端也成了接下來值得關注的嘗試。
王小川也直言,百川目前的護城河是技術、場景和產品形態:
M3代表百川技術的能力體現,在場景切入上,百川的定位比市面上的泛健康類AI醫療產品更近一步,“至少能夠像家庭醫生一樣”。這個界限,又把控在不碰醫療紅線的基礎上,也就是不會做醫生真正該做的決策,而是輔助決策。落到具體產品上,百川今年計劃發布兩款C端產品,也在嘗試做和睡眠相關的AI硬件產品。
看起來,百川智能對自己的戰略正在一天比一天清晰,但最關鍵的問題是,決定生死的商業化路線,能夠跑通嗎?
在國內當前的付費環境下,C端變現本身就是一條風險更大的路,比如螞蟻阿福至今未收費,更多用戶是否愿意買單;對于比其他領域更看重準確性、輿論問題更明顯的醫療領域來說,C端付費路上也存在很多未知的風險。
想上市、有意愿出海的百川智能,能靠今年拿出的C端產品證明AI醫療商業化的潛力嗎?這個答案,或許接下來幾個月就能有新的解答。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.