網易首頁 > 網易號 > 正文申請入駐

該讓醫療垂類大模型，走出“試題”了

2024-06-28 17:48:04　來源: 億歐健談

北京舉報

分享至

“現階段，許多醫療垂類大模型就是偽命題，推理能力不行。”一位觀望大模型已久的醫療從業者玄彬（化名）發出了極為尖銳的批評。

在他看來，目前人工智能是靠scaling law涌現的，模型性能隨著模型規模、數據規模和算力規模等因素的增大而提升。只要還是Transformer，就不可能有垂類的機會。

過去兩年，為了追上生成式AI的熱潮，不少企業將開源大模型稍加“改造”后就冠以自有產品名，套牌、過度宣傳屢見不鮮，鋪天蓋地的榜單，各種評測熙熙攘攘。“大模型用不用不重要，先要擁有大模型。”思潮下，歷經井噴式的發展，也造就了醫療大模型圈里魚龍混雜、良莠不齊。

當通用大模型掀起了低價肉搏戰，從5元到1元，不斷擊穿大模型低價，巨頭們降價正酣。

醫療大模型雖在病歷書寫、診斷等細分領域展示出巨大潛力，但商業化路徑仍不清晰，行業仍在苦苦尋覓殺手級場景。

與此同時，技術不斷迭代，隨著OpenAI和 Mistral AI的助力，專家混合（MoE）一時間炙手可熱。這種混合模型，由多個子模型（即專家）組成，每個子模型都是一個局部模型，專門處理輸入空間的一個子集。簡而言之，它使用一個門控網絡來決定每個數據應該被哪個模型去訓練，從而減輕不同類型樣本之間的干擾。

天才黑客喬治?霍茲曾爆料，GPT-4其實是一個混合模型，采用了由8個專家模型組成的集成系統，每個專家模型都有2200億個參數。

2023年底，微軟首席科學家埃里克?霍爾維茨曾發布一項調研報告《The Power of Prompting》，他們研究發現，在相同的基準上，利用提示詞工程就能讓GPT-4的性能明顯優于專門針對醫療應用進行微調的領先模型。

“Medprompt研究表明，更深入地探索將通用模型轉化為專業模型的提示可能性，并將這些模型的優勢擴展到新領域和新應用，是非常有價值的。”埃里克·霍爾維茨欣喜寫道。

以上種種，使得醫療垂類大模型的質疑聲越來越響：醫療大模型是偽命題嗎？我們可以期待怎樣的醫療大模型？

衡量標準：忍受VS享受，要求VS需要

在和緩醫療CEO李宇看來，判斷大模型的應用是否成立，主要在于兩個點：一是對于用戶來說，大模型是忍受，還是享受；二是對于使用者而言，是要求還是需要。

“現在整個醫療行業都在尋找殺手級應用，找場景，其實很重要一點就在于找到強要求、強監管下的應用。”他闡述道，郵件和Office這種才叫殺手應用，發生在每天應用的工具中，具備非常高的便捷性。

縱覽目前的醫療大模型，多聚焦患者問診、醫生助手、藥物研發、健康科普等領域。李宇最看好的則是病歷質控系統以及DRG/DIP下，監管醫院的臨床診療行為和收費合理性的醫保控費應用。

“對于醫院至關緊要的，才會有大規模商業機會。”李宇認為，文字模型的殺手級應用應該還是在病歷相關的場景上，比如DRG要求的病案首頁等醫生極易出錯的地方，抓住了醫院端需求，并打通了業務場景，落地了才能有未來。

當大模型進入醫療領域之后，更多的資源應該探索如何尋找高頻且剛需的場景，如此才能誕生下一個超級應用的可能性。當享受與需要二者兼備，醫療大模型應用才能真正成立。

復旦大學中國研究院副研究員劉典曾在線下論壇中一針見血指出，行業的核心是數據和原有的工作流。只要大模型能很好解決這兩件事，且成本不高于原有方案，就不能說是偽命題。

換言之，只有在醫療領域真正實現“降本增效”，積累真實世界數據，才能稱得上醫療大模型。

要知道，大模型想要真正脫穎而出，幾方面能力至關重要：一是獲取最新知識能力，醫學知識是不斷更迭的，需要動態獲取最新的醫學知識；二是理解多模態數據，醫學影像、X光片，心電圖等；三是高級推理能力，大模型不能永遠只做“應試教育的高材生”，真正應用于醫療場景中，非常依賴模型的推理能力，畢竟好的醫生都是推理專家；四是長文本能力……

百模大戰盡管聽起來熱鬧，但是真正具備模型能力的仍是少數，畢竟大模型推理這類訪存密集型任務需要真金白銀的投入。財通證券曾經測算，支撐 GPT-3.5推理任務的A100數量或至少在5萬張左右。

“我覺得醫療垂直大模型不成立的原因就是它的推理能力會很弱，你不會希望一個熟讀各類醫學百科、疾病診療指南書籍的學生來當你的醫生。”玄彬堅定說道，雖然它是個專業的學生，但作為醫療場景應用，還是有些危險。

大模型的終局——通用還是垂直？

事實上，通用大模型與垂直大模型之爭從2024年初便備受關注。

一個理想的范式中，通用大模型以“百科全書式”的通用能力安身，垂直大模型以某一領域的專家立命，兩者融合共同構筑枝繁葉茂的大模型生態。然而，隨著AGI時代的到來，通用大模型完全能夠覆蓋各種垂直模型的業務場景，垂直模型存在的必要性便被質疑。

一位生物醫學工程博士在社交媒體撰文指出，目前一個很尷尬的事情：許多垂類大模型在他垂直領域里能力似乎沒有超過通用大模型。所謂垂類大模型，感覺就是用小部分已經用過的文本數據做復讀機一樣的訓練，用通用領域的性能下降換專業領域的sota。

判斷一個大模型夠不夠聰明，很重要的一點就是它能不能解決復雜問題。玄彬在過去一年多測試了許多醫療大模型，悲哀地發現，有時候醫療大模型宣稱“更懂醫療”，其實只是把醫療領域的俗稱與全稱對應一下。“比如甲減，你不翻譯成甲狀腺功能性減退，通用大模型就聽不懂了，而一些垂直模型所做的事情就是把這些俗稱對應一下。”

如果燒了幾億，只能培育出停留在“紙上談兵”里的人工智能，何嘗不是一種資源浪費？那么醫療垂類大模型存在的必然性在哪？答案就是落地部署、成本與數據。

在億歐大健康總裁高昂看來，從技術上面，垂直大模型或許是偽命題，但從產業角度講，其反而可能是現階段企業落地的主要方向。

縱覽如今的通用大模型，早已演變成巨頭們和明星創業者的賽場。阿里、騰訊、百度、科大訊飛、商湯自是不用多提，百川智能的王小川、智譜AI則由清華大學計算機系知識工程實驗室的技術成果轉化而來……

只有他們，或許才能付得起動輒一兩萬億訓練Token，以及訓練GPU集群的成本，扛得住如火如荼的降價潮。

居高不下的研發成本、GPT—4明珠在前，注定了垂直大模型或許才是國內企業真正落地所要走的路。

科技博主“Magic”的觀點一針見血，垂直大模型必然是存在的，且會長在通用模型之上，即將垂域知識融入到一個相對智能的通用模型之上，打造行業/領域的專有模型，并進行私有化部署，是To B業務未來非常重要的一條發展路徑。

在他看來，如果垂直大模型也變成算力跟數據的競爭，那么落地這條路可能又遙遙無期了，“你訓不完的模型，我等不起的業務啊。”

畢竟，企業的第一要務便是賺錢。從商業化落地來看，企業或許并不需要一個“全能”的通用大模型，而是更需要針對細分領域場景、解決實際問題的產業大模型。

“單純地追求大模型的規模與復雜度，并無實質性的意義。真正有價值的，是將這些技術應用于實際場景中，發掘出更大的商業機會。”百度創始人李彥宏的早前呼吁，意義在此時或許不言自明。

入局者別再為了搶奪大模型概念融資紅利，一哄而上，靜下心來明確企業定位，結合自家業務，找到適合自己的生存空間和發展路徑，健康有序的市場格局或許才能出現。

破局：先選擇應用場景，再定義應用

“場景和數據，是醫療大模型脫穎而出的關鍵。”李宇剖析道，功能是打動不了人的，場景才能打動人，解決某一場景的具體需求。

以智能監控為例，它可以完全替代人看，且完成人根本看不過來的量級，甚至比人看的效果好得多。在他看來，醫療大模型商業化如今動力不足的很大一部分原因，則是沒有完全打透的場景、沒有徹底替代人的工作、沒有完成人完成不了的工作。

李宇指出，B2B解決方案之間的PK，將不會把重點放在令人眼花繚亂的AI技術能力，而更關注這些技術層面的能力，將如何幫助企業用戶具備（或重新定義）更有價值的企業工作流程。

聚焦多場景覆蓋，也是不少醫療大模型企業的出發點。商湯醫療健康大模型“大醫”，覆蓋了健康管理、患者服務、臨床診療、醫學科研四大領域超過20個細分醫療場景；醫渡科技強調打造多任務引擎，可以同時解決多個任務，這使其在處理復雜多樣的臨床情況時具有更大的潛力……

究其原因，則是某個單一場景的大模型產品局限性更大，要實現在每個場景中的可用性并不容易，這需要深入理解場景的本質。另外一些企業則從自家業務出發，結合大模型特點，為原有產品作升級，實現對原有工作流的改造。

圓心科技的源泉大模型將每一個用戶設有標簽，管理服務會根據不同特性的人進行針對性關注患者藥物依從性、聯合用藥預以及疾病康復管理，通過大模型數字化應用為患者生成定制化疾病科普和藥品服務；全病程管理平臺微脈推出健康管理大模型Care AI，為醫院、醫生和微脈個案管理師提供全新的輔助工具；和緩醫療即將推出合成式人工智能健康Copilot服務，構建一種全新的AI+真人醫生復合服務工作流；左醫則把把知識圖譜和醫療大模型進行融合，實現智能自診、智能分診、智能預問診、智能用藥和智能隨訪五大功能。

“大家在維持原有場景的商業模式下做技術改進，雖然現在并不會有明顯溢價，但未來沒有AI的大概率要被淘汰。”李宇預判道。

場景端革新，或許是中國應用市場后來居上的傳統優勢，同時也具有反哺大模型能力的作用。場景服務下，大模型與人交互產生的數據，將成為未來技術迭代下的關鍵資產。細分的產業場景上，依靠交互數據，實現大模型自我優化和改進，提升輸出精度。

“大模型的場景落地，不止是一個IT硬件+軟件的服務，而是針對具體場景結果的交付，這個過程中還可能涉及使用者的運營與服務。”高昂言簡意賅，軟硬一體對于傳統行業客戶或許更“友好”，畢竟買了具體的實物，但硬件迭代周期過長，跟不上模型進步速度，需要一次吃透場景解決問題，生態圈的建立就顯得尤為重要。

在數據為制藥企業、醫院命脈的當下，私有化部署將是一條重要布局路徑。而放眼未來，與其說是算力、算法、數據的競爭，倒不如說是大模型生態的角逐。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.