![]()
![]()
斑馬魚跨膜蛋白81,圖片來源 歐洲生物信息研究所
潘 展 | 編譯
2020年11月末,DeepMind推出了具有變革意義的蛋白質(zhì)結(jié)構(gòu)預(yù)測工具AlphaFold2。莆一問世它便向世人展示了人工智能在推動科學(xué)進步方面的強大威力。
01
蛋白質(zhì)與AlphaFold
蛋白質(zhì)是大多數(shù)生理活動的承載者,它由長而獨特的氨基酸鏈組成,精確折疊成三維結(jié)構(gòu)。結(jié)構(gòu)基本定義了蛋白質(zhì)的功能,因此了解其結(jié)構(gòu)對于藥物發(fā)現(xiàn)和疾病理解至關(guān)重要。
如果蛋白質(zhì)折疊錯誤,輕則失去功能,重則直接導(dǎo)致疾病產(chǎn)生,如阿爾茨海默病和帕金森病等疾病。然而數(shù)十年來,確定這些結(jié)構(gòu)一直是一項艱巨的任務(wù)。
在2020年CASP 14蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽中,AlphaFold 2僅憑氨基酸序列就以驚人的準(zhǔn)確度預(yù)測了蛋白質(zhì)的結(jié)構(gòu),這一成就解決了一個生物學(xué)上50年重大挑戰(zhàn),被視為科學(xué)人工智能的真正誕生。
隨后,DeepMind與歐洲生物信息研究所(EMBL-EBI)合作推出了AlphaFold 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,并向全球免費開放,AlphaFold一舉成為全球科學(xué)工具。
2023年DeepMind進一步推出AlphaFold3,該模型可以預(yù)測生命中所有分子的結(jié)構(gòu)和相互作用——不僅是蛋白質(zhì),還有DNA、RNA和配體(構(gòu)成大多數(shù)藥物的小分子)。它還能生成整個分子復(fù)合物的關(guān)節(jié)三維結(jié)構(gòu),從而全面了解潛在藥物分子如何與其目標(biāo)蛋白結(jié)合,或蛋白質(zhì)如何與遺傳物質(zhì)相互作用。
如今,AlphaFold蛋白質(zhì)數(shù)據(jù)庫包括了超過2.4億個蛋白質(zhì)結(jié)構(gòu)的預(yù)測,實現(xiàn)了原本需要數(shù)億年實驗解決的問題。該數(shù)據(jù)庫已被190多個國家的300多萬名研究人員使用,其中包100多萬低收入和中等收入國家的用戶。超過30%的AlphaFold相關(guān)研究聚焦于更好地理解疾病,從而造福人類福祉。
02
加速科研進程
AlphaFold顯著提升了科學(xué)家新發(fā)現(xiàn)的速度。一項其影響力對比試驗顯示,使用 AlphaFold的研究人員向蛋白質(zhì)數(shù)據(jù)銀行(PDB,一個實驗性蛋白質(zhì)結(jié)構(gòu)模型數(shù)據(jù)庫)提交的蛋白質(zhì)結(jié)構(gòu)數(shù)量,比不使用AlphaFold的基準(zhǔn)組結(jié)構(gòu)生物學(xué)研究人員多約50%。
此外,與使用人工智能、結(jié)構(gòu)生物學(xué)及蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域其他前沿方法的研究人員相比,使用 AlphaFold2 的研究人員向 PDB 提交結(jié)構(gòu)的比例也更高。
![]()
蛋白質(zhì)提交量激增 圖片來源:《自然》雜志
根據(jù)《自然》雜志的介紹,維也納分子病理學(xué)研究所的生物化學(xué)家安德里亞?保利(Andrea Pauli)的經(jīng)歷很具代表性。在一項研究中,他借助AlphaFold找到了一條原本可能永遠無法找到的研究路徑。他在斑馬魚(Danio rerio)卵子研究中發(fā)現(xiàn)了一種名為Bouncer的蛋白質(zhì),這種蛋白質(zhì)對受精過程至關(guān)重要,但他始終難以弄清Bouncer蛋白是如何識別精子細胞的。恰在此時,AlphaFold2橫空出世,根據(jù)其預(yù)測顯示,一種名為Tmem81的蛋白質(zhì)能穩(wěn)定另外兩種精子蛋白形成的復(fù)合物,并為Bouncer蛋白創(chuàng)造一個結(jié)合位點。后續(xù)實驗證實了該工具的預(yù)測結(jié)果。“AlphaFold 加速了發(fā)現(xiàn)進程,” 保利說,“我們的每個項目都會用到它。”
保利在其論文中引用了《自然》雜志介紹AlphaFold2的文章,該篇文章的引用量目前已近4萬。此外,超過200000篇論文將AlphaFold 2的元素納入其方法論。這些數(shù)據(jù)足以證明AlphaFold對科學(xué)界的影響。
![]()
介紹AlphaFol的論文被引用量,圖片來源 《自然》雜志
截止目前,AlphaFold服務(wù)器已經(jīng)幫助全球數(shù)千名研究人員實現(xiàn)了超過800萬次結(jié)構(gòu)和相互作用的預(yù)測。它正在賦能全球非商業(yè)研究人員利用這項技術(shù),加速他們構(gòu)建和測試新假設(shè)的能力。
03
數(shù)字生物學(xué)的新紀(jì)元
AlphaFold2 能迅速產(chǎn)生影響,部分原因在于它的易獲取性,開源讓研究人員很快就能自行大規(guī)模運行這款軟件,并運用于多個領(lǐng)域。比如牛津大學(xué)團隊利用它預(yù)測瘧疾關(guān)鍵蛋白 Pfs48/45 的全長結(jié)構(gòu),為新型疫苗設(shè)計提供參考;馬耳他大學(xué)科學(xué)家通過它模擬罕見基因變異的蛋白質(zhì)結(jié)構(gòu),助力早發(fā)性家族性骨質(zhì)疏松癥的遺傳因素識別等。
同時,它還運用于追溯蛋白質(zhì)演化、優(yōu)化塑料降解酶等方面的研究。總之,AlphaFold已成為全球科研人員依賴的基礎(chǔ)工具。
![]()
AlphaFold助力抗癌新藥研究 圖片來源:歐洲生物信息研究所
其中,又以對藥物設(shè)計與篩選方面的影響最為突出。AlphaFold 3提供了前所未有的細胞視角,將推動藥物發(fā)現(xiàn)過程的轉(zhuǎn)變,并開啟“數(shù)字生物學(xué)”時代。
早在2021年,DeepMind就拆分成立了Isomorphic Labs,其核心目標(biāo)是借助人工智能革新藥物研發(fā)模式,其開發(fā)的藥物設(shè)計引擎覆蓋藥物發(fā)現(xiàn)全生命周期,能完成小分子設(shè)計、虛擬篩選、結(jié)構(gòu)優(yōu)化等可工程化的研發(fā)流程,可將藥物發(fā)現(xiàn)階段的成本削減 30 - 40%,周期縮短一年以上。目前,Isomorphic Labs已與多家大型藥企達成合作,合同金額已達數(shù)十億美元。
04
引領(lǐng)AI for Science潮流
AlphaFold 的成功,啟發(fā)了一系列相關(guān)模型的誕生,為人工智能在科學(xué)研究領(lǐng)域的應(yīng)用開辟了廣闊的道路。
AlphaGenome是一個全新的DNA序列模型,為解讀人類基因非編碼序列的功能提供了新的視角和工具。AlphaMissense則專注于預(yù)測人類基因組中錯義突變的致病性。它們可以利用人工智能評估導(dǎo)致疾病的基因突變。
AlphaProteo模型可以設(shè)計出新型高強度蛋白質(zhì)結(jié)合劑,靶向包括與癌癥和糖尿病相關(guān)的多種分子。這些模型正在加深我們對復(fù)雜疾病的理解,最終推動新療法的發(fā)展。
更重要的是,科學(xué)家正將AI賦能各學(xué)科,從核聚變、地球科學(xué)到整體科學(xué)發(fā)現(xiàn),追求下一個類似AlphaFold的突破。AlphaFold是這股潮流的引領(lǐng)者,必將在人類科學(xué)事業(yè)中留下濃重的一筆。
https://www.nature.com/articles/d41586-025-03886-9
https://deepmind.google/blog/alphafold-five-years-of-impact/
青科沙龍第179期 | Cell-RNA天然免疫與異種屏障
Deep Science預(yù)印本
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.