設置星標★關注,從此你的世界多點科學~
大家 · 科技前沿
MASTERS
藥物研發,作為全球醫療保健體系的核心環節,承載著無數患者對健康與生命的渴望。然而,傳統藥物研發路徑猶如一場漫長而艱辛的馬拉松,不僅耗時費力,而且成功率極低。新藥從概念提出到最終上市,往往需要經歷10~15年的漫長周期,并伴隨著高達數十億美元的巨額投入。即便如此,臨床試驗階段的失敗率仍然居高不下,接近90%的候選藥物在這一階段折戟沉沙。
與此同時,全球范圍內對新藥的需求正在不斷增長。據世界衛生組織(WHO)發布的《國際疾病分類第11版》(ICD-11),目前人類已知的疾病總數已超過55000種。但令人憂心的是,其中只有約10000至 15000種疾病擁有明確的藥物治療方案,仍有數萬種疾病,尤其是罕見病和復雜疾病,至今尚無有效藥物可用。這不僅意味著大量患者仍在病痛中掙扎,也對現有的藥物研發體系提出了更高的要求。
然而,隨著人工智能(AI)技術的迅猛發展,制藥行業正迎來一場前所未有的技術革命。AI以其強大的數據處理能力、智能化的預測與決策,以及高效的自動化流程,正在逐步改變傳統藥物研發模式,開啟了一個全新的智能研發時代。AI的加入,不僅有望大幅縮短藥物開發周期、降低成本,還有望提升候選藥物的成功率,推動更多“無藥可醫”的疾病走向可治之路。
朱宸葭
上海科技大學2024級生物學碩士研究生
錢其洋
上海科技大學2024級生物學碩士研究生
白芳
上海科技大學免疫化學研究所、生命科學與技術學院研究員、博士生導師
藥物研發與基于計算機的虛擬藥物設計技術
藥物研發與基于計算機的虛擬藥物設計技術
你是否好奇,一顆小小的藥丸是如何精準“命中”我們體內的病灶的?這背后,其實是科學家在兩個龐大且復雜的“空間”中進行高難度“匹配游戲”(如圖1所示)——一個是我們身體內部的生物空間,另一個是潛在具有類藥性質的化合物分子空間。
![]()
圖1 藥物發現是穿越類藥分子“宇宙”以精準匹配疾病靶標生物空間發現匹配分子的過程
首先,來看生物空間。
我們人體由超過37萬億個細胞組成,而每個細胞里都裝著一份完整的基因“說明書”——大約2萬個蛋白編碼基因,這些基因控制著蛋白質的生成,而蛋白質則構成了各種“生命機器”,比如受體、酶、轉運體等。這些蛋白質構成了藥物的“靶點”,目前科學家認為潛在的藥物靶點可能超過3000~5000種,而在不同疾病狀態下,它們的功能和表達方式都可能發生巨大變化。因此,生物空間不僅數量龐大,而且結構復雜,動態多變。
再來看化合物分子空間,也就是我們可以設計、合成的所有可能藥物分子的集合。
根據科學家估算,在藥物常見的分子量范圍(小于500道爾頓)內,理論上可以存在的“藥物樣”小分子多達1060種——這是一個后面帶著60個零的天文數字!而目前全球已知的化合物數據庫(比如PubChem、ChEMBL等)中,記錄的化合物大約為1億種(108),只占了其中極小的一部分。
這就意味著,在數以億計的生物靶點變化中,科學家需要從一個近乎無限的化合物“宇宙”中找到一種能精確作用且安全有效的分子,就像從銀河系中尋找一顆特定形狀的沙粒。而傳統藥物研發(如圖2),往往靠大量實驗室篩選與試錯,不僅效率低下,而且耗資巨大。
![]()
圖2 美國藥物發現與研發過程概述
在藥物發現實驗室里,科學家像是在化合物海洋中打撈鑰匙。他們要找到能與特定疾病靶點(比如致病蛋白質)完美匹配并且對靶點準確調控的分子“鑰匙”,這項工作的難度不亞于大海撈針——據統計,往往需要10萬個化合物分子才能篩選出100個候選。更困難的是,這把分子鑰匙不僅要能打開“疾病之鎖”,還不能胡亂開啟其他健康細胞的“門鎖”,否則就會產生副作用。
經過初步篩選的幸運分子將進入“改造學校”。化學家需要改造分子結構使它既能在靶點的分子層面、細胞層面和動物層面的多級實驗中證實其療效,又確保其能被人體高效吸收代謝。這個過程往往需要合成檢測超過5000個類似物,才能得到一個令人滿意的分子。
但這只是萬里長征第一步。通過臨床前測試的分子才能獲得參加“畢業考”——I—III期的三個階段的臨床試驗的資格。在這個淘汰率驚人的考驗中,超90%的候選者將被淘汰:Ⅰ期測試在健康志愿者體內摸索安全劑量,Ⅱ期在小規模患者中驗證療效,Ⅲ期則要在數千名患者中接受雙盲試驗的嚴苛檢驗。成功率僅1/10的殘酷現實中,每一個被“退學”的候選者都意味著數億美元的研發資金化為泡影。
“分子沙盤”破解現代藥學密碼
你有沒有想過,科學家正通過游戲般的虛擬世界尋找攻克疾病的鑰匙?在這場沒有硝煙的分子戰爭中,被稱為“計算機輔助藥物設計”(CADD)的超級裝備已成為現代藥物科學家的秘密武器。
CADD技術利用計算機建立了分子世界的虛擬沙盤,沙盤中的每個原子都藏著破解疾病密碼的關鍵線索。通過數學和物理模型將藥物與靶點的作用抽象出來,建立分子變量與藥效等應變量之間的對應關系,以幫助篩選分子。當需要阻擊導致疾病的“壞蛋白質/基因”時,CADD會在數字世界模擬數百萬種藥物分子與靶點的結合效果,就像用超高精度顯微鏡觀察“鎖和鑰匙”的咬合過程。
這樣的沙盤推演可直接篩掉九成不合格候選者,使實驗室階段研發提速數倍。此外,CADD還能像3D建模師般“精修”分子結構:計算機通過量子力學計算并預測藥物入體后的代謝路線,指導化學家改變分子結構以減少副作用,或者靶向作用部位增強藥效。
不過,早期的CADD系統需要科學家提前設定“必要知識點”才能運轉。舉個形象的例子:就像完成拼圖時只能使用規定形狀的碎片,傳統CADD依賴事先設定的結構規則,如必須包含某些特定的化合物基團(稱為官能團),這種方式可能會錯過一些有望治療難治疾病的新奇分子結構。另外,現代藥物研發產生了海量數據,基于物理模型的傳統計算模擬方法的計算負荷已接近極限。
這種技術瓶頸背后,正蘊藏著科技突破的機遇。就像生命科學領域的發展史一樣,每當舊工具遭遇邊際效應,總會有革命性新技術破繭而出。
AI助力新藥研發:現代藥學的“超級大腦”
隨著科技發展,科學家迎來了一位超級助手——人工智能輔助藥物設計(AIDD)。
擁有超強學習能力的AI技術,除了在日常生活中為人們提供便利,也正在藥物研發領域掀起一場革命。AI不僅能像科學家一樣思考,還能處理海量的生物醫學數據,找到人眼無法發現的隱藏規律。
AIDD能在短時間內閱讀百萬份醫學文獻,記住數萬個蛋白質結構圖,還能找出它們之間細微的聯系,“隱式”建立變量與應變量之間的關系,從而無需科學家從海量數據或者超復雜體系中抽象變量和建立數學物理模型。它就像一位永不疲倦的“分子解碼師”,在龐大的生物醫學數據海洋中尋找開啟疾病之門的鑰匙。
與傳統的CADD相比,AIDD的特別之處在于它的自我進化能力。通過深度學習技術,AIDD可以從海量數據中自動發現規律,并且隨著新數據的加入不斷優化自己的算法,最終可以發現傳統方法難以察覺的線索。例如,AIDD可以通過分析成千上萬的基因數據和蛋白質結構,找到新的藥物靶點,或者設計出更精準的候選藥物分子。當然AI在藥物研發流程中的應用場景眾多,如圖3列舉所示。
![]()
圖3 AI在藥物研發中的應用場景舉例
AIDD在藥物研發中的應用舉例
藥物研發中的“靶向狙擊手”
在藥物研發這場與疾病的漫長博弈中,科學家首先要找到關鍵的戰場坐標——這就是“藥物靶點”。研究人員需要精準定位導致疾病的基因或蛋白質目標。傳統方法依賴海量實驗和資料庫檢索,效率低且容易遺漏關鍵信息。而AI賦予了這個過程革命性的突破。
AI能同時處理基因組和轉錄組等多組學數據、蛋白質三維結構、臨床試驗檔案等復雜數據,識別出數據中的潛藏模式,并且可通過推理,建立疾病、靶點與潛在藥物關系網絡,輔助快速定位關鍵靶點,并可能快速實現老藥新用。
目前,決策樹、隨機森林、支持向量機、Transformer等眾多機器學習和深度學習模型均已廣泛應用到了組學數據建模和靶點識別中。這種智能化的靶點定位技術,正在為帕金森病、糖尿病等復雜疾病打開新的治療突破口。在這張看不見的分子戰場地圖上,AI正以每秒萬億次的計算速度標定著人類健康的新坐標,為個性化精準醫療打開全新維度。
蛋白質結構預測的革命性突破
蛋白質不僅是生命的基本組成部分,還是藥物開發的關鍵,藥物研發中的疾病靶點多為功能紊亂蛋白質。正因如此科學家才會一直著迷于蛋白質的研究。而如今,一個名為AlphaFold的AI程序正在徹底改變我們理解蛋白質的方式。
AlphaFold是由DeepMind公司開發的一款人工智能程序,它的核心能力是精確預測蛋白質的三維結構。為什么這如此重要?因為蛋白質的結構決定了它的功能,而藥物開發通常依賴于藥物分子與蛋白質的特定區域結合。如果我們能準確地知道蛋白質的結構,就能更高效地設計藥物。
在過去,解析蛋白質結構是一項極其耗時且復雜的任務。科學家通常依賴X射線晶體學等傳統實驗方法,這些方法不僅需要大量的時間和資源,還對實驗條件有著極高的要求。然而,AlphaFold的出現徹底改變了這一局面。它能夠通過計算機模擬,在幾小時內預測出蛋白質的結構,大大加速研究進程。
可以說,AlphaFold不僅是AI技術的一次壯舉,更是生命科學領域的一次革命。它為藥物研發、疾病治療以及我們對生命的理解提供了全新的視角和強大的工具。通過精準預測蛋白質的三維結構,AlphaFold極大地縮短了從基因序列到功能解析的時間。
在第14屆蛋白質結構預測關鍵評估大賽(CASP14)中AlphaFold的中位數主鏈均方根偏差(RMSD,一種量化預測結構與實驗結構之間的偏差的評價指標,越小越好)為0.96 ?,而其他最佳方法的中位數主鏈RMSD為2.8 ?。這表明AlphaFold的預測結果與實驗結構之間的主鏈偏差非常小,接近實驗解析結構的精度水平。它讓我們能夠更深入地洞察生物分子的相互作用機制,從而設計出更有效的藥物,精準靶向疾病根源。
同時,基于AlphaFold對人類蛋白質組及20種其他物種蛋白質結構的預測,DeepMind與歐洲分子生物學實驗室(EMBL)合作構建了蛋白質結構數據庫——AlphaFold 數據庫。這一開放資源初始版本已收錄超過360000個預測結構,并計劃擴展至涵蓋UniRef90數據集中超過1億個代表性序列的結構,自上線以來,其訪問量迅速增長,已成為結構生物學、藥物設計和疾病研究等領域的寶貴數據資源。
這不僅加速了生命科學領域的突破性發現,更為系統解析蛋白質功能網絡、破解復雜疾病機制和合成生物學設計奠定了數據基礎,真正開啟了生命科學的新時代。
分子世界的設計師和“智能拼圖師”
當科學家鎖定疾病靶點后,就像拿到了犯罪分子的指紋,接下來需要打造專屬的“分子手銬”——這正是新藥研發的關鍵環節。在傳統的實驗室里,藥物化學家需要如同大海撈針般篩選成千上萬的化合物,整個過程耗時又費力。
AI技術讓這個過程變得高效。智能系統可以同時掃描數百萬種分子結構,通過分析它們的三維空間結構和化學特性,快速鎖定最可能完美匹配靶點的候選分子。這種強大的能力源于深度學習的突破——系統通過研究數據庫中的藥物分子,進而預測哪些分子能像鑰匙開鎖般精準對接靶點。
同時,在學習了靶點或相關配體的三維空間結構和化學特性后,利用AI技術還能進行“分子創作”,可以針對該靶點實現分子從頭設計生成。像設計師一樣,基于AI的分子設計技術實現在計算機中繪制出全新的藥物分子結構,并預測這些分子與靶點的結合效果,從而大大提高藥物分子設計的速度和精準度。這主要是依賴現在的人工智能生成式技術發展的分子生成新方法。
這類方法是指通過計算模型和算法,可在一定約束下,根據藥物靶點結構或者要求的藥效情況來設計和生成符合要求的新的分子結構。與傳統的基于計算的化合物篩選方法相比,分子生成的主要優勢在于其創新性和高效性。傳統方法通常依賴從已有的化合物庫中篩選出符合目標需求的分子,雖然有效,但其局限性在于只能探索已有結構,無法設計出全新的分子。而分子生成方法通過深度學習和優化算法,可以從頭設計全新的分子結構,拓展化合物庫的多樣性,極大地提高創新性和研發效率。
但是目前這種新生成的分子“落地”也存在一定的挑戰,作為全新結構,這類分子的合成路徑往往需要更多的探索和努力。
現有挑戰
盡管AI在藥物研發中展現出了極大的潛力,但這項技術的普及和應用仍然面臨著一系列挑戰。在未來,AI如何在藥物研發中繼續發揮作用,解決當前面臨的問題,是我們需要進一步思考和探討的。以下是目前AI在藥物研發中所面臨的主要挑戰,以及未來的發展方向。
現代藥物研發需要處理大量的高質量數據:基因序列就像生命密碼本,蛋白質結構類似立體拼圖,還有各類臨床試驗的觀察報告。目前這些數據來自不同實驗室、不同儀器,格式五花八門,有的像精心整理的手賬,有的卻像字跡潦草的草稿紙。更麻煩的是,有些關鍵數據可能根本未被記錄,就像缺失幾頁的偵探小說。
此外,在數據規模變大的同時,算力也得同步跟上。且藥物研發過程非常復雜,為了達到更好的效果,每一個步驟都應該有一個定制化的算法。
未來發展
未來可以通過進一步整合基因組、蛋白質組、臨床表型等多維度數據,構建更全面的疾病模型,進行個性化醫療。
想象一下,智能手表不僅能計步,還能通過你的心率曲線預測流感——這正是AI驅動的個性化醫療正在描繪的未來圖景。每個患者的基因身份證正在成為定制藥物的黃金密鑰,AI則化身解碼大師,將基因密碼翻譯成精準治療方案。每位患者的基因和自身情況都不相同,傳統療法就是在碰運氣。如今,AI能快速掃描成千上萬種藥物,有望通過基因比對推薦最適合病人的方案。
借助數字孿生與器官芯片,通過體外微生理系統模擬人體器官反應,縮小體內外差距。對于慢性病患者,AI變身為全天候健康管家。它會整合你的運動手環數據、生理指標、飲食記錄和睡眠質量,以此搭建個人健康模型。當模型發現血糖異常趨勢時,會發出提醒,并自動生成運動和食譜的建議,甚至與醫療機構合作,根據數據修改藥物方案。
未來醫療的最大突破或許在于預防。AI正在學習從人體各項指標的微妙波動中捕捉疾病萌芽,并嘗試提前化解危機。當這項技術成熟時,吃藥可能會變成手機系統升級:“叮!檢測到心血管有老化傾向,請點擊安裝預防型藥物程序。”
AI為藥物研發帶來新時代
人工智能正以驚人的速度改變藥物研發的各個方面。從靶點發現、分子設計到臨床試驗優化,AI的應用不僅大大提高了研發效率,降低了成本,還為藥物的精準設計和個性化治療提供了強有力的支持。雖然AI在藥物研發過程中仍面臨著數據質量、算法問題等挑戰,但隨著技術的不斷進步和各界的努力,這些問題有望得到解決。
我們有理由相信,藥物研發的新時代已經到來,這將為我們帶來更加健康、個性化的醫療體驗。
-本文刊載于《世界科學》雜志2026年第2期“大家·科技前沿”欄目;文章根據筆者在上海市科學技術普及志愿者協會主辦的“海上科普講壇”上的報告撰寫而成-
![]()
《世界科學》雜志版在售中 歡迎訂閱
月刊定價
15元/期
全年訂閱價
180元
點擊左側圖片或以下方訂閱方式選購
方式一:
掃描二維碼,“雜志鋪”訂閱有折扣~
方式二:
全國各地郵局訂閱 郵發代號:4-263
方式三:
機構訂閱,請撥打
021-53300839;
021-53300838
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.