![]()
導讀
在華盛頓大學實驗室的熒光顯微鏡下,人工設計的熒光素酶正穿透小鼠的深層組織,發出穿透力極強的生物熒光;
在多倫多的超級計算機中,算法正在解析單個細胞內的基因表達密碼;
而在倫敦的DeepMind總部,AlphaFold模型正在以前所未有的精度解構蛋白質的三維迷宮。
![]()
在2024年的諾貝爾化學獎頒獎典禮上,人工智能(AI)首次因其在生物學領域的突破性貢獻而登頂科學界的最高殿堂。David Baker、Demis Hassabis和John Jumper憑借AI驅動的蛋白質折疊與設計技術獲得榮耀。
由AI驅動的生物學革命正在發生......
齊 萱 | 編譯
01
榮獲諾獎的蛋白質折疊和設計
2024年,AlphaFold幫助科學家解決了蛋白質折疊和設計問題,讓David Baker和Demis Hassabis、John Jumper獲得了諾貝爾化學獎,如今全球生物學家都在借助人工智能預測蛋白質結構,并從頭設計新的蛋白質。
![]()
諾貝爾獎得主David Baker,利用深度學習模型創造出比天然蛋白更適合解決現代問題的全新蛋白質
我們回顧下蛋白質折疊和設計的歷史,當1994年首屆CASP競賽啟動時,蛋白質折疊預測領域還籠罩在‘序列決定結構’的迷霧中。科學家們在氨基酸序列與三維構象的黑暗中艱難前行。
1998年,David Baker團隊開發了用于蛋白質能量配置建模的Rosetta軟件,依賴物理能量計算,雖取得一定進展,但效率低下。2008年,科學家甚至轉向眾包模式,開發了游戲Foldit,讓全球玩家手動折疊蛋白質。
轉折來到2018年的CASP13會議上——DeepMind開發的AlphaFold以中位數90 ?的預測精度橫空出世,在CASP13競賽中以驚人的準確度擊敗所有傳統方法,相當于用計算鏡頭看清了蛋白質分子的"量子舞步"。
兩年后, AlphaFold2更是將預測精度提升至原子級別,宣告蛋白質折疊問題“基本解決”。
AlphaFold的成功絕非偶然。它基于超過10萬種已知蛋白質的結構數據,在深度神經網絡的34層矩陣中構建出進化規律與物理化學法則的交互圖譜。
這種“數據蒸餾”能力讓生物學家第一次擁有了“蛋白質X光機”,能夠以前所未有的速度破解生命的基本構件。
正如諾獎得主David Baker所言:“我們現在能設計自然界從未存在過的蛋白質,就像用樂高積木搭建全新功能的分子機器。”
02
AI設計全新蛋白質
AlphaFold的突破不僅在于“預測”,更在于“創造”。
![]()
人造蛋白質
Baker實驗室利用AI設計了超穩定熒光素酶,其亮度是天然酶的10倍,可用于深層組織成像。這類‘從頭設計蛋白質(de novo protein)’并非對自然的簡單模仿,而是通過算法探索從未存在過的分子構型,從而賦予蛋白質全新功能。
傳統蛋白質工程依賴試錯法,耗時數年;而AI能在幾天內生成數百萬種候選結構,并篩選出最優解。這種“計算優先”的策略正在重塑藥物設計、酶工程和生物材料領域。
例如輝瑞利用AI加速KRAS抑制劑開發,將原本需5000人年的工作量,壓縮至數月完成。
03
抗生素危機中的AI解藥
抗生素耐藥性危機迫在眉睫,而新藥研發卻陷入停滯。面對鮑曼不動桿菌(
Acinetobacter baumannii)等“超級細菌”,麥克馬斯特大學的Jon Stokes團隊開發了生成式AI模型SyntheMol。
這個“分子夢想家”通過強化學習,在虛擬化學空間中探索出能穿透細菌防御機制的全新化合物Halicin——一種對多重耐藥菌有效的非傳統抗生素,在體外實驗中展現出對多種耐藥菌株的強效抑制活性。
AI制藥的核心優勢在于打破人類思維定式,與傳統藥物發現動輒十年的周期不同,AI在短短幾個月內就生成了數十種候選分子。
傳統藥物設計受限于已知化學規則,而AI能發現反直覺的分子結構。這種“計算優先”的藥物研發模式正在重塑整個制藥工業。
例如Insilico Medicine利用AI設計的抗纖維化藥物,已進入臨床試驗階段,全程僅用18個月,成本降低90%。
04
人工神經網絡模擬人腦學習機制
受人腦啟發,人工神經網絡(ANNs)發展迅速,這是一種包含多層互聯節點(神經元)的機器學習模型,能夠處理復雜數據。
網絡中的每個節點通過加權輸入數據進行數學運算,并根據閾值決定是否將輸出傳遞至下一層。科學家使用已知數據集訓練ANN,使其通過對比預測結果與真實答案來優化精度。
訓練后的ANN可用于預測新數據集的結果。盡管存在局限性,但ANN能識別人類難以察覺的復雜數據模式,并自動執行繁瑣任務,為研究者節省了不少時間。
05
語言模型解碼大腦奧秘
研究人員開發出能通過腦部MRI圖像解讀思維的類ChatGPT語言模型。
得克薩斯大學奧斯汀分校的Alexander Huth團隊訓練出“讀心”模型,能通過fMRI數據重建受試者聽到的句子,同時也揭示了人腦功能的奧秘。模型顯示,即使MRI掃描僅顯示前額葉皮層活躍,大腦所有區域都在使用與意義相關的信息。
這項技術不僅為失語癥患者帶來希望,更揭示了大腦語義處理的分布式特征。雖然目前模型尚不能跨主體通用,但隨著準確性提升,專家建議對這類技術保持警惕。
06
AI預測單細胞基因表達
多倫多大學計算生物學家Bo Wang團隊開發的單細胞生成預訓練轉換器(scGPT),能比現有主流方法更有效地分析單細胞RNA測序數據。
該模型在預測基因擾動影響方面也表現出更高準確性。最初針對骨髓和免疫細胞訓練的scGPT,現已適配多種細胞類型分析,有望在近期解答重要生物學問題。
盡管AI在從腦科學研究到新型療法開發等生物學領域展現出巨大潛力,專家仍提醒需要謹慎使用,其成功有賴于專業知識的深度與廣度。
AI不僅是工具,更是新的“科研伙伴”——它能提出人類未曾設想的問題,并給出超越經驗的答案。
如Baker所言:“我們不再只是生命的觀察者,而是成為生命的設計師。”這場由AI驅動的生物學革命,終將重新定義生命新的可能性”。
參考資料
Artificial Intelligence in Biology: From Neural Networks to AlphaFold
https://www.the-scientist.com/artificial-intelligence-in-biology-from-artificial-neural-networks-to-alphafold-72435
青科沙龍線下活動|人工智能與生物醫學創新
Deep Science預印本
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.