![]()
撰文丨王聰
編輯丨王多魚
排版丨水成文
當前的虛擬藥物篩選研究,主要基于針對特定蛋白質靶點的對接或基于篩選數據訓練的人工智能(AI)和機器學習(ML)模型;很少有研究利用轉錄組學技術(特別是單細胞 RNA 測序)的進步所帶來的、用于表征疾病和細胞狀態的豐富轉錄組特征。
逆轉疾病相關轉錄組特征的藥物識別已被廣泛探索為發現“老藥新用”的一種策略,候選藥物應降低上調的疾病基因表達,并提高下調的疾病基因表達,從而恢復健康的轉錄表型。然而,這種方法僅限于數據庫中已有資料的化合物,不支持新型化合物的篩選和優化,從而限制了其在早期藥物發現中的廣泛應用。
2026 年 3 月 17 日,密歇根州立大學陳斌教授、李小鵬教授,密歇根大學周家雨教授等(邢婧、譚明典、孫夢瑩等人為論文共同第一作者),在國際頂尖學術期刊Cell上發表了題為:Deep-learning-based de novo discovery and design of therapeutics that reverse disease-associated transcriptional phenotypes 的研究論文,論文第一作者邢婧博士現為臨港實驗室青年研究員。
該研究開發了一種基于深度學習的藥物發現與設計平臺——GPS(基于化學結構的基因表達譜預測器),其以轉錄組特征為指導,對大型化合物庫進行篩選并優化先導分子。
通過“結構-基因-活性關系(SGAR)” ,研究團隊從轉錄組數據中揭示了藥物機制,并在多種疾病中評估了 GPS 的應用——在肝細胞癌中,研究團隊利用 GPS 平臺發現了兩個具有良好細胞選擇性和體內療效的獨特化合物系列。在特發性肺纖維化中,研究團隊利用 GPS 平臺確定了一個老藥新用和一個新型抗纖維化化合物。這些發現為基于人工智能的從頭發現和設計藥物開創了全新范式。
![]()
困境
肝癌,全球第六大常見癌癥、第三大癌癥死亡原因,每年奪走數十萬人的生命。盡管近年來免疫治療、靶向治療等新療法不斷涌現,但肝癌的治療選擇仍然有限,耐藥性、毒副作用等問題依然困擾著臨床醫生,肝癌患者的預后仍然有待提高。
特發性肺纖維化(IPF)則是一種棘手的肺部疾病。患者肺部逐漸形成疤痕組織,導致呼吸功能不可逆地下降,確診后患者的中位生存期僅約 3 年,且目前尚無根治方案。
傳統藥物研發模式通常需要 10-15 年,耗資數十億美元,成功率卻不足 10%。大多數失敗發生在臨床試驗階段,原因往往是藥物在人體內未能產生預期的治療效果,或出現不可接受的毒副作用。
突破
在這項最新研究中,來自密歇根州立大學、斯坦福大學和密歇根大學的研究團隊開發了一個以轉錄組學特征為指導的深度學習藥物發現平臺——GPS(基于化學結構的基因表達譜預測器),其能夠篩選大型化合物庫并優化先導分子。
這項研究的核心突破在于:GPS 平臺僅憑化合物的化學結構,就能預測它會對人體細胞的基因表達產生怎樣的影響。
研究團隊首先利用 LINCS 數據庫中海量的藥物-基因表達數據,訓練了一個深度學習模型。這個模型能夠“學習”化學結構與基因表達變化之間的復雜關系。
為了應對數據中的噪聲問題,研究團隊開發了穩健協同學習(RCL)框架,通過多個神經網絡相互協作,篩選出高質量的數據進行訓練,顯著提升了模型的預測準確性。
原理
GPS 平臺的工作流程可以概括為三個關鍵步驟——
第一步:預測基因表達。輸入任意化合物的化學結構,GPS 就能預測它會在細胞中引起哪些基因上調、哪些基因下調。研究團隊將預測范圍從最初的 978 個標志基因擴展到了 2198 個高置信度核心基因,覆蓋了細胞周期、轉錄調控、激酶信號等關鍵生物學過程。
第二步:計算“逆轉分數”。研究團隊為每種疾病構建了特征性的基因表達“簽名”——即疾病狀態下哪些基因異常高表達,哪些異常低表達。GPS 會計算每個化合物預測的表達譜與疾病簽名之間的匹配程度,給出一個 Z-RGES 分數。分數越負,表示該化合物越有可能逆轉疾病的基因表達模式,從而治療疾病。
第三步:優化與驗證。對于有潛力的化合物,研究團隊還開發了基于蒙特卡洛樹搜索的優化算法,能夠對化合物結構進行微調,在保持或提高活性的同時,改善其類藥性(例如水溶性、毒性等)。
驗證
研究團隊在兩類難治性疾病中驗證了 GPS 平臺的強大能力。
在肝細胞癌研究中,研究團隊對 ZINC 數據庫中近 700 萬個類藥化合物進行了虛擬篩選,從中發現了一個苗頭化合物,其對肝癌細胞系的 IC50 值約為 4μM,而對正常原代肝細胞沒有明顯毒性。
通過結構優化,將呋喃環替換為吸電子的三氟甲基苯后,得到了優化化合物 MSU-45302。該化合物對三種肝癌細胞系的 IC50 值達到亞微摩爾水平,活性強于肝癌的一線靶向藥索拉非尼。
更令人振奮的是,研究團隊還提出了 “結構-基因-活性關系(SGAR)” 的新概念,通過分析哪些化學結構特征與特定的基因表達變化相關,揭示了 MSU-45302 可能通過抑制 UHRF1 蛋白來發揮抗肝癌作用。UHRF1 在肝癌組織中廣泛高表達,是患者的不良預后標志物,這一發現也為肝癌精準治療提供了潛在新靶點。
在特發性肺纖維化(IPF)研究中,研究團隊創新性地整合了單細胞和 bulk RNA-seq 數據,構建了涵蓋上皮細胞、間充質細胞、免疫細胞等多種細胞類型的 IPF 特征圖譜。
通過 GPS 平臺,他們不僅發現了老藥Pyrithyldion(吡乙二酮,一種鎮定劑)能夠有效逆轉 IPF 相關的多細胞類型基因表達特征(效果與已獲 FDA 批準的尼達尼布相當),還從 Enamine HTS 庫中篩選出了全新化合物Drug 18,該化合物在多個患者樣本中能穩定降低 FN1、SMA、CTHRC1 等核心纖維化標志物的表達,為 IPF 治療提供了全新機制的候選分子。
![]()
意義
這項研究的突破性意義在于,它建立了一個從疾病機制挖掘到新藥設計的完整閉環。
傳統藥物發現要么依賴已知的蛋白靶點,要么基于有限的表型篩選數據。而 GPS 平臺直接從疾病的基因表達特征出發,“逆向工程”尋找能夠逆轉這些特征的化合物。
這種方法有幾個顯著優勢:首先,它不依賴于對疾病機制的完全了解,只要知道疾病狀態下的基因表達特征即可;其次,它能夠篩選海量化合物的虛擬庫,大大擴展了化學空間的探索范圍;第三,它能夠發現全新機制的化合物,甚至實現“老藥新用”。
隨著 GPS 等 AI 藥物發現平臺的成熟,未來藥物研發可能會變得更加高效、精準。醫生可以根據患者的個體化基因表達特征,快速篩選出最有可能有效的治療方案,真正實現個性化醫療。
對于肝癌患者來說,這意味著除了現有的免疫治療、靶向治療外,可能很快就會有全新機制、更高選擇性的藥物進入臨床。如今,肝癌治療正在從“活得久”向“無瘤生存”邁進,而 AI 設計的藥物可能會加速這一進程。
對于特發性肺纖維化(IPF)這類罕見疾病,傳統藥企往往因為市場小而研發動力不足。而 AI 平臺能夠大幅降低早期藥物發現的成本和風險,讓更多罕見病患者看到希望。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(26)00223-0
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.