過(guò)去,科學(xué)家觀察研究細(xì)胞的工具很有限。
隨著技術(shù)進(jìn)步,科學(xué)家能同時(shí)拿到這些關(guān)于細(xì)胞的分子信息,例如DNA、轉(zhuǎn)錄組、蛋白質(zhì)豐度等。
然而,生物學(xué)數(shù)據(jù)的難點(diǎn)不僅在于獲取,還在于如何分析與解讀。
我們雖然看到了更全更多的信息,科學(xué)家卻經(jīng)常分不清哪些信息決定了細(xì)胞的功能。
近期,來(lái)自麻省理工、哈佛布羅德研究所及蘇黎世聯(lián)邦理工學(xué)院的研究團(tuán)隊(duì),推出了一款名為APOLLO的AI新框架。
這項(xiàng)研究為科學(xué)家提供了全新的視角:細(xì)胞行為的導(dǎo)航地圖,而不是一堆互不關(guān)聯(lián)的細(xì)胞數(shù)據(jù)。
這項(xiàng)研究于近日發(fā)表于《Nature Computational Science》上。
![]()
它有望為疾病診斷、藥物研發(fā)乃至合成生物學(xué)打開一扇新的大門。
正如第一作者zhang xinyi所言:“歸根結(jié)底,細(xì)胞只有一個(gè)底層狀態(tài)。通過(guò)更智能地整合所有觀測(cè)視角,我們終于能看清這個(gè)生命基本單元的真實(shí)面貌。”
![]()
細(xì)胞這個(gè)黑匣子,現(xiàn)在有了儀表盤
隨著工具、檢測(cè)手段的不斷發(fā)展,科學(xué)家們可以同時(shí)測(cè)量單個(gè)細(xì)胞的多種特征。
如基因表達(dá)、染色質(zhì)可及性、蛋白質(zhì)豐度,甚至細(xì)胞圖像等各種類型的數(shù)據(jù)。
這些數(shù)據(jù)就好像關(guān)于細(xì)胞這一基本生命單元的不同「信息拼圖」。
不過(guò),現(xiàn)有方法往往只能把所有信息整合在一起,就像一個(gè)混淆的黑匣子。
結(jié)果是,雖然看起來(lái)像是拼好了,但我們根本不知道到底是哪一塊拼圖決定了細(xì)胞的某個(gè)功能。
因?yàn)榧?xì)胞的結(jié)構(gòu)太復(fù)雜了,不同的拼圖塊里既有共享信息(比如反映細(xì)胞的身份),也有各自獨(dú)有信息(細(xì)胞形狀、代謝活動(dòng)、蛋白質(zhì)表達(dá))。
甚至于選擇哪一部分信息,對(duì)于科學(xué)家而言都是一個(gè)挑戰(zhàn)。
例如科學(xué)家很難知道,某個(gè)癌癥到底是因?yàn)榛蜃兞耍€是因?yàn)榈鞍踪|(zhì)堆積了,或者是兩者共同作用?
這種“混合信息”讓很多生物學(xué)謎題解不開。
為解決這一問(wèn)題,麻省理工學(xué)院和哈佛大學(xué)布羅德研究所以及蘇黎世聯(lián)邦理工學(xué)院保羅·謝勒研究所(PSI)的研究人員開發(fā)了一個(gè)名為APOLLO的AI驅(qū)動(dòng)的框架。
該研究能夠自動(dòng)地解耦多模態(tài)數(shù)據(jù)中「共享信息」與「模態(tài)特異性信息」。
換句話說(shuō),它就像一個(gè)高效的信息分揀系統(tǒng),能夠分揀出細(xì)胞狀態(tài)中哪些信息在不同測(cè)量方式間共享,哪些信息是特定測(cè)量類型獨(dú)有的。
![]()
該框架主要分為兩步訓(xùn)練策略:
1、潛在空間優(yōu)化:建立信息地圖
APOLLO先學(xué)習(xí)如何從原始數(shù)據(jù)中重建信息,就像小孩通過(guò)拼圖學(xué)習(xí)形狀匹配。系統(tǒng)通過(guò)反復(fù)試錯(cuò),逐漸構(gòu)建出信息的地圖。
2、推斷 :培養(yǎng)信息向?qū)?/strong>
一旦地圖繪制完成,APOLLO就訓(xùn)練專門的編碼器,能夠快速將新的檢測(cè)數(shù)據(jù)定位到正確的位置。
隨之而來(lái)的,不同于傳統(tǒng)模型,APOLLO讓這個(gè)過(guò)程變得透明,研究人員能夠清楚地看到:
哪些信息是不同檢測(cè)方法共享的
哪些信息是某種方法特有的
這些信息如何影響最終的細(xì)胞狀態(tài)
這對(duì)科學(xué)家而言是一個(gè)強(qiáng)大的工具。
![]()
驗(yàn)證與實(shí)際應(yīng)用
APOLLO 在多個(gè)真實(shí)數(shù)據(jù)集上表現(xiàn)出了強(qiáng)大的能力。
在配對(duì)測(cè)序數(shù)據(jù)任務(wù)中(SHARE-seq),它成功區(qū)分了由轉(zhuǎn)錄組和染色質(zhì)開放性共同捕獲的基因活動(dòng),以及僅由其中一種模態(tài)捕獲的活動(dòng)。
例如,共享空間主要包含轉(zhuǎn)錄調(diào)控因子,而RNA特異性空間包含細(xì)胞周期相關(guān)基因。
針對(duì)基因+蛋白質(zhì)(CITE-seq 數(shù)據(jù))分類中,團(tuán)隊(duì)把不同時(shí)間、不同機(jī)器做出來(lái)的實(shí)驗(yàn)數(shù)據(jù)混在一起,這會(huì)導(dǎo)致有很多噪音或批次效應(yīng)。
APOLLO 成功將細(xì)胞類型與批次效應(yīng)分離至共享空間與RNA 特異性空間,能把臟數(shù)據(jù)洗得很干凈。
那么,APOLLO有什么神奇應(yīng)用呢?
隨著單細(xì)胞技術(shù)的不斷發(fā)展,APOLLO這樣的方法將幫助我們?cè)诟顚哟紊侠斫馍膹?fù)雜性。
促進(jìn)精準(zhǔn)醫(yī)療
這項(xiàng)技術(shù)有望為個(gè)性化醫(yī)療提供了強(qiáng)大支持。醫(yī)生未來(lái)可能通過(guò)相對(duì)簡(jiǎn)單的檢測(cè),就能預(yù)測(cè)患者細(xì)胞更復(fù)雜的特征,為疾病診斷和治療提供更全面的信息。
發(fā)現(xiàn)疾病標(biāo)志物
在癌癥研究中,APOLLO有望幫助科學(xué)家區(qū)分哪些細(xì)胞特征是所有癌細(xì)胞共有的,哪些是特定類型癌癥特有的。
加速藥物研發(fā)
在藥物研發(fā)中,APOLLO可以幫助科學(xué)家更精確地理解藥物如何影響細(xì)胞的不同方面,加快新藥開發(fā)進(jìn)程。
用于合成生物
這一點(diǎn)至關(guān)重要,因?yàn)榫帉懟蚧芈泛苋菀祝軌蝾A(yù)測(cè)如何在染色質(zhì)、RNA、蛋白質(zhì)和形態(tài)結(jié)構(gòu)中發(fā)揮作用。
![]()
華人科學(xué)家一作
該研究的第一作者ZhangXinyi,是一位華人科學(xué)家,先后到加州大學(xué)伯克利分校和麻省理工學(xué)院求學(xué)。
![]()
2026年2月,她入職奧地利科學(xué)院AITHYRA研究所并建立課題組。
針對(duì)上述研究,她表示:“當(dāng)我們研究細(xì)胞時(shí),一次測(cè)量往往不夠,因此科學(xué)家們開發(fā)新技術(shù)來(lái)測(cè)量細(xì)胞的不同方面。雖然我們有多種觀察細(xì)胞的方式,但歸根結(jié)底,我們只有一個(gè)底層細(xì)胞狀態(tài)。通過(guò)更智能地將所有這些測(cè)量方式的信息整合在一起,我們可以更全面地了解細(xì)胞的狀態(tài)。”
這有助于科學(xué)家理解疾病機(jī)制,追蹤癌癥、阿爾茨海默病等神經(jīng)退行性疾病以及糖尿病等代謝疾病的進(jìn)展。
未來(lái),我們將看到更多理解與預(yù)測(cè)生物學(xué)預(yù)言的大模型,助力人類攻克各類疾病。
—The End—
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.