你能想象AI像老醫生一樣"看懂"手術視頻嗎?
3月24日,中科院發布了"術影"手術視頻大模型,它用3658小時真實手術視頻訓練,學會了理解13種器官、6類手術任務,17項國際測試全部第一。
![]()
這和以前有什么不同?
以前AI只能"認圖"——告訴你畫面里有什么。現在AI能"理解"——知道醫生在做什么、器械怎么配合、操作規不規范。術影”基于V-JEPA架構,引入三項關鍵技術革新,讓AI首次學會“閱讀”手術視頻的動態敘事:
- 運動引導的隱空間預測:模型自動聚焦于關鍵運動信息和中高層語義,如器械與組織的精細交互、手術步驟的流暢銜接。
- 特征多樣性保持:訓練中強制保留特征多樣性,確保捕捉手術場景中的細微變化與異常。
- 模型穩定性保持:通過動態調整學習策略,保障長序列視頻理解中的穩定性。
這三重革新共同構成能夠理解手術行為背后意圖與邏輯的通用視覺感知底座,為手術AI的“GPT時刻”奠定技術基礎。
![]()
它能幫醫生做什么?
簡單說,就是成為醫生的"智能助手"。新手醫生可以跟著它學,老醫生可以用它復盤,醫院可以用它評估技術水平。
最重要的是,它已經開源了,全球醫療團隊都能免費用。
研發團隊說得很清楚:AI是來幫忙的,不是來取代醫生的。決策權永遠在醫生手里。
科技進步的意義,從來不是替代人類,而是讓人類做得更好。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.