![]()
“現階段,許多醫療垂類大模型就是偽命題,推理能力不行。”一位觀望大模型已久的醫療從業者玄彬(化名)發出了極為尖銳的批評。
在他看來,目前人工智能是靠scaling law涌現的,模型性能隨著模型規模、數據規模和算力規模等因素的增大而提升。只要還是Transformer,就不可能有垂類的機會。
過去兩年,為了追上生成式AI的熱潮,不少企業將開源大模型稍加“改造”后就冠以自有產品名,套牌、過度宣傳屢見不鮮,鋪天蓋地的榜單,各種評測熙熙攘攘。“大模型用不用不重要,先要擁有大模型。”思潮下,歷經井噴式的發展,也造就了醫療大模型圈里魚龍混雜、良莠不齊。
當通用大模型掀起了低價肉搏戰,從5元到1元,不斷擊穿大模型低價,巨頭們降價正酣。
醫療大模型雖在病歷書寫、診斷等細分領域展示出巨大潛力,但商業化路徑仍不清晰,行業仍在苦苦尋覓殺手級場景。
與此同時,技術不斷迭代,隨著OpenAI和 Mistral AI的助力,專家混合(MoE)一時間炙手可熱。這種混合模型,由多個子模型(即專家)組成,每個子模型都是一個局部模型,專門處理輸入空間的一個子集。簡而言之,它使用一個門控網絡來決定每個數據應該被哪個模型去訓練,從而減輕不同類型樣本之間的干擾。
天才黑客喬治?霍茲曾爆料,GPT-4其實是一個混合模型,采用了由8個專家模型組成的集成系統,每個專家模型都有2200億個參數。
2023年底,微軟首席科學家埃里克?霍爾維茨曾發布一項調研報告《The Power of Prompting》,他們研究發現,在相同的基準上,利用提示詞工程就能讓GPT-4的性能明顯優于專門針對醫療應用進行微調的領先模型。
“Medprompt研究表明,更深入地探索將通用模型轉化為專業模型的提示可能性,并將這些模型的優勢擴展到新領域和新應用,是非常有價值的。”埃里克·霍爾維茨欣喜寫道。
以上種種,使得醫療垂類大模型的質疑聲越來越響:醫療大模型是偽命題嗎?我們可以期待怎樣的醫療大模型?
衡量標準:忍受VS享受,要求VS需要
在和緩醫療CEO李宇看來,判斷大模型的應用是否成立,主要在于兩個點:一是對于用戶來說,大模型是忍受,還是享受;二是對于使用者而言,是要求還是需要。
“現在整個醫療行業都在尋找殺手級應用,找場景,其實很重要一點就在于找到強要求、強監管下的應用。”他闡述道,郵件和Office這種才叫殺手應用,發生在每天應用的工具中,具備非常高的便捷性。
縱覽目前的醫療大模型,多聚焦患者問診、醫生助手、藥物研發、健康科普等領域。李宇最看好的則是病歷質控系統以及DRG/DIP下,監管醫院的臨床診療行為和收費合理性的醫保控費應用。
“對于醫院至關緊要的,才會有大規模商業機會。”李宇認為,文字模型的殺手級應用應該還是在病歷相關的場景上,比如DRG要求的病案首頁等醫生極易出錯的地方,抓住了醫院端需求,并打通了業務場景,落地了才能有未來。
當大模型進入醫療領域之后,更多的資源應該探索如何尋找高頻且剛需的場景,如此才能誕生下一個超級應用的可能性。當享受與需要二者兼備,醫療大模型應用才能真正成立。
復旦大學中國研究院副研究員劉典曾在線下論壇中一針見血指出,行業的核心是數據和原有的工作流。只要大模型能很好解決這兩件事,且成本不高于原有方案,就不能說是偽命題。
換言之,只有在醫療領域真正實現“降本增效”,積累真實世界數據,才能稱得上醫療大模型。
要知道,大模型想要真正脫穎而出,幾方面能力至關重要:一是獲取最新知識能力,醫學知識是不斷更迭的,需要動態獲取最新的醫學知識;二是理解多模態數據,醫學影像、X光片,心電圖等;三是高級推理能力,大模型不能永遠只做“應試教育的高材生”,真正應用于醫療場景中,非常依賴模型的推理能力,畢竟好的醫生都是推理專家;四是長文本能力……
百模大戰盡管聽起來熱鬧,但是真正具備模型能力的仍是少數,畢竟大模型推理這類訪存密集型任務需要真金白銀的投入。財通證券曾經測算,支撐 GPT-3.5推理任務的A100數量或至少在5萬張左右。
“我覺得醫療垂直大模型不成立的原因就是它的推理能力會很弱,你不會希望一個熟讀各類醫學百科、疾病診療指南書籍的學生來當你的醫生。”玄彬堅定說道,雖然它是個專業的學生,但作為醫療場景應用,還是有些危險。
大模型的終局——通用還是垂直?
事實上,通用大模型與垂直大模型之爭從2024年初便備受關注。
一個理想的范式中,通用大模型以“百科全書式”的通用能力安身,垂直大模型以某一領域的專家立命,兩者融合共同構筑枝繁葉茂的大模型生態。然而,隨著AGI時代的到來,通用大模型完全能夠覆蓋各種垂直模型的業務場景,垂直模型存在的必要性便被質疑。
一位生物醫學工程博士在社交媒體撰文指出,目前一個很尷尬的事情:許多垂類大模型在他垂直領域里能力似乎沒有超過通用大模型。所謂垂類大模型,感覺就是用小部分已經用過的文本數據做復讀機一樣的訓練,用通用領域的性能下降換專業領域的sota。
判斷一個大模型夠不夠聰明,很重要的一點就是它能不能解決復雜問題。玄彬在過去一年多測試了許多醫療大模型,悲哀地發現,有時候醫療大模型宣稱“更懂醫療”,其實只是把醫療領域的俗稱與全稱對應一下。“比如甲減,你不翻譯成甲狀腺功能性減退,通用大模型就聽不懂了,而一些垂直模型所做的事情就是把這些俗稱對應一下。”
如果燒了幾億,只能培育出停留在“紙上談兵”里的人工智能,何嘗不是一種資源浪費?那么醫療垂類大模型存在的必然性在哪?答案就是落地部署、成本與數據。
在億歐大健康總裁高昂看來,從技術上面,垂直大模型或許是偽命題,但從產業角度講,其反而可能是現階段企業落地的主要方向。
縱覽如今的通用大模型,早已演變成巨頭們和明星創業者的賽場。阿里、騰訊、百度、科大訊飛、商湯自是不用多提,百川智能的王小川、智譜AI則由清華大學計算機系知識工程實驗室的技術成果轉化而來……
只有他們,或許才能付得起動輒一兩萬億訓練Token,以及訓練GPU集群的成本,扛得住如火如荼的降價潮。
居高不下的研發成本、GPT—4明珠在前,注定了垂直大模型或許才是國內企業真正落地所要走的路。
科技博主“Magic”的觀點一針見血,垂直大模型必然是存在的,且會長在通用模型之上,即將垂域知識融入到一個相對智能的通用模型之上,打造行業/領域的專有模型,并進行私有化部署,是To B業務未來非常重要的一條發展路徑。
在他看來,如果垂直大模型也變成算力跟數據的競爭,那么落地這條路可能又遙遙無期了,“你訓不完的模型,我等不起的業務啊。”
畢竟,企業的第一要務便是賺錢。從商業化落地來看,企業或許并不需要一個“全能”的通用大模型,而是更需要針對細分領域場景、解決實際問題的產業大模型。
“單純地追求大模型的規模與復雜度,并無實質性的意義。真正有價值的,是將這些技術應用于實際場景中,發掘出更大的商業機會。”百度創始人李彥宏的早前呼吁,意義在此時或許不言自明。
入局者別再為了搶奪大模型概念融資紅利,一哄而上,靜下心來明確企業定位,結合自家業務,找到適合自己的生存空間和發展路徑,健康有序的市場格局或許才能出現。
破局:先選擇應用場景,再定義應用
“場景和數據,是醫療大模型脫穎而出的關鍵。”李宇剖析道,功能是打動不了人的,場景才能打動人,解決某一場景的具體需求。
以智能監控為例,它可以完全替代人看,且完成人根本看不過來的量級,甚至比人看的效果好得多。在他看來,醫療大模型商業化如今動力不足的很大一部分原因,則是沒有完全打透的場景、沒有徹底替代人的工作、沒有完成人完成不了的工作。
李宇指出,B2B解決方案之間的PK,將不會把重點放在令人眼花繚亂的AI技術能力,而更關注這些技術層面的能力,將如何幫助企業用戶具備(或重新定義)更有價值的企業工作流程。
聚焦多場景覆蓋,也是不少醫療大模型企業的出發點。商湯醫療健康大模型“大醫”,覆蓋了健康管理、患者服務、臨床診療、醫學科研四大領域超過20個細分醫療場景;醫渡科技強調打造多任務引擎,可以同時解決多個任務,這使其在處理復雜多樣的臨床情況時具有更大的潛力……
究其原因,則是某個單一場景的大模型產品局限性更大,要實現在每個場景中的可用性并不容易,這需要深入理解場景的本質。另外一些企業則從自家業務出發,結合大模型特點,為原有產品作升級,實現對原有工作流的改造。
圓心科技的源泉大模型將每一個用戶設有標簽,管理服務會根據不同特性的人進行針對性關注患者藥物依從性、聯合用藥預以及疾病康復管理,通過大模型數字化應用為患者生成定制化疾病科普和藥品服務;全病程管理平臺微脈推出健康管理大模型Care AI,為醫院、醫生和微脈個案管理師提供全新的輔助工具;和緩醫療即將推出合成式人工智能健康Copilot服務,構建一種全新的AI+真人醫生復合服務工作流;左醫則把把知識圖譜和醫療大模型進行融合,實現智能自診、智能分診、智能預問診、智能用藥和智能隨訪五大功能。
“大家在維持原有場景的商業模式下做技術改進,雖然現在并不會有明顯溢價,但未來沒有AI的大概率要被淘汰。”李宇預判道。
場景端革新,或許是中國應用市場后來居上的傳統優勢,同時也具有反哺大模型能力的作用。場景服務下,大模型與人交互產生的數據,將成為未來技術迭代下的關鍵資產。細分的產業場景上,依靠交互數據,實現大模型自我優化和改進,提升輸出精度。
“大模型的場景落地,不止是一個IT硬件+軟件的服務,而是針對具體場景結果的交付,這個過程中還可能涉及使用者的運營與服務。”高昂言簡意賅,軟硬一體對于傳統行業客戶或許更“友好”,畢竟買了具體的實物,但硬件迭代周期過長,跟不上模型進步速度,需要一次吃透場景解決問題,生態圈的建立就顯得尤為重要。
在數據為制藥企業、醫院命脈的當下,私有化部署將是一條重要布局路徑。而放眼未來,與其說是算力、算法、數據的競爭,倒不如說是大模型生態的角逐。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.