蛋白質(zhì)如何從一條無(wú)序的氨基酸鏈,折疊成精確的三維結(jié)構(gòu),這一直是結(jié)構(gòu)生物學(xué)的核心謎題。在這個(gè)過(guò)程中,會(huì)形成一些稍縱即逝的“中間狀態(tài)”,它們?nèi)缤瑧騽〉哪缓蟛逝牛m不登場(chǎng),卻決定了演出的成敗。捕捉這些中間態(tài)對(duì)理解蛋白質(zhì)功能及相關(guān)疾病至關(guān)重要,但實(shí)驗(yàn)手段難以捕獲,而分子動(dòng)力學(xué)模擬雖能生成海量原子運(yùn)動(dòng)數(shù)據(jù),傳統(tǒng)分析方法卻往往“先入為主”——先基于幾何結(jié)構(gòu)猜測(cè)狀態(tài),再分析其動(dòng)力學(xué)行為。這種“狀態(tài)中心”的范式可能導(dǎo)致動(dòng)力學(xué)信息的丟失,甚至掩蓋了真實(shí)的折疊路徑。
2026年3月6日,南開(kāi)大學(xué)化學(xué)學(xué)院的邵學(xué)廣教授/付浩浩副研究員/蔡文生教授等在《美國(guó)國(guó)家科學(xué)院院刊》(PNAS)上發(fā)表了題為《基于AI的條件轉(zhuǎn)移聚類(lèi)揭示蛋白質(zhì)折疊中隱藏的中間狀態(tài)》的研究論文。該團(tuán)隊(duì)提出了一種名為“條件轉(zhuǎn)移聚類(lèi)”的全新AI框架,開(kāi)創(chuàng)性地將分析視角從“狀態(tài)中心”轉(zhuǎn)向“動(dòng)力學(xué)中心”。這意味著,他們不再預(yù)先定義狀態(tài),而是先讓AI學(xué)習(xí)系統(tǒng)內(nèi)在的動(dòng)力學(xué)規(guī)律,再根據(jù)“動(dòng)力學(xué)隔離”的原則,讓蛋白質(zhì)的“狀態(tài)”本身從數(shù)據(jù)中自然浮現(xiàn)。
![]()
為了驗(yàn)證CTC的效果,研究人員首先在具有雙勢(shì)阱(圖A)和四勢(shì)阱(圖F)的簡(jiǎn)化模型上進(jìn)行測(cè)試。對(duì)于雙勢(shì)阱系統(tǒng),CTC通過(guò)分析軌跡隨時(shí)間變化的概率分布,精準(zhǔn)地識(shí)別出每次跨越能壘的“稀有事件”,并將軌跡劃分為不同片段(圖B)。通過(guò)計(jì)算片段間的轉(zhuǎn)移概率,系統(tǒng)自然地聚合成了兩個(gè)符合物理直覺(jué)的狀態(tài)(圖D-E)。在四勢(shì)阱系統(tǒng)中,通過(guò)調(diào)整觀測(cè)時(shí)間窗口(滯后時(shí)間),CTC成功捕捉到了動(dòng)力學(xué)層次:短窗口下,四個(gè)狀態(tài)清晰可辨;隨著窗口拉長(zhǎng),快速平衡的相鄰狀態(tài)逐漸合并,最終整個(gè)系統(tǒng)被視為一個(gè)整體(圖G-M),完美復(fù)現(xiàn)了自由能 landscape 的層級(jí)結(jié)構(gòu)。
隨后,CTC被應(yīng)用于DE Shaw研究所提供的12條蛋白質(zhì)折疊模擬軌跡。結(jié)果顯示,在傳統(tǒng)認(rèn)為“雙態(tài)”折疊的WW結(jié)構(gòu)域中,CTC成功解析出了兩個(gè)介于折疊與去折疊之間的中間態(tài)(a1, a2)。進(jìn)一步分析發(fā)現(xiàn),這些中間態(tài)雖然整體結(jié)構(gòu)接近天然態(tài),但在局部環(huán)區(qū)的二面角以及非天然接觸上存在特征性差異(圖A)。對(duì)于α/β蛋白NTL9,CTC識(shí)別出的四個(gè)狀態(tài)(圖B)中,兩個(gè)中間態(tài)(b1, b3)分別表現(xiàn)出C端或N端螺旋的部分形成,這與文獻(xiàn)中報(bào)道的中間體特征高度吻合。而在更復(fù)雜的蛋白G變體中,CTC甚至區(qū)分出了13個(gè)不同的構(gòu)象狀態(tài)(圖C),其中包含多個(gè)與理論計(jì)算預(yù)測(cè)完全吻合的、具有特定缺陷的“近天然態(tài)”,如螺旋不完整或β-片層錯(cuò)位。
![]()
為了量化CTC的優(yōu)勢(shì),研究者將其與傳統(tǒng)馬爾可夫模型及深度學(xué)習(xí)VAMPnets等方法進(jìn)行了對(duì)比。在2納秒的短滯后時(shí)間下,CTC在所有測(cè)試體系上都獲得了最高的“亞穩(wěn)性”分?jǐn)?shù),證明其能更有效地識(shí)別短暫的中間態(tài),減少邊界“往返”噪音的干擾。進(jìn)一步的Chapman-Kolmogorov檢驗(yàn)也證實(shí),CTC構(gòu)建的模型在2納秒的短時(shí)間尺度上就具備良好的馬爾可夫性,動(dòng)力學(xué)自洽性?xún)?yōu)異。
CTC不僅能“定格”狀態(tài),還能“抓拍”過(guò)渡態(tài)。在雙勢(shì)阱模型中,CTC準(zhǔn)確定位到了勢(shì)能面上的鞍點(diǎn)(圖A)。在蛋白質(zhì)體系中,通過(guò)分析狀態(tài)變化前后的“概率谷”區(qū)域,CTC識(shí)別出的過(guò)渡態(tài)結(jié)構(gòu)(圖E-G)恰好位于自由能壘的“山脊”之上(圖B-D)。這些結(jié)構(gòu)揭示了折疊過(guò)程中關(guān)鍵的成核事件,例如WW結(jié)構(gòu)域中N端或C端β-片層的優(yōu)先形成,為繪制完整的折疊路徑提供了關(guān)鍵坐標(biāo)。
基于識(shí)別的狀態(tài)和過(guò)渡態(tài),CTC最終繪制出定量的折疊“交通網(wǎng)絡(luò)圖”。對(duì)于WW結(jié)構(gòu)域,一條從去折疊態(tài)直達(dá)天然態(tài)的主干道(ΔG?=19.35 kJ/mol)主導(dǎo)了折疊過(guò)程(圖A)。而NTL9則存在競(jìng)爭(zhēng)路徑,通過(guò)中間態(tài)的“換乘”比直達(dá)路線更為高效(圖B)。對(duì)于蛋白G,CTC構(gòu)建了包含多條路徑的網(wǎng)絡(luò)(圖C),并計(jì)算發(fā)現(xiàn),從去折疊態(tài)出發(fā),經(jīng)由c4、c5、c9再到天然態(tài)的路徑是一系列能量障礙最低的“最優(yōu)選擇”,為理解復(fù)雜蛋白質(zhì)的折疊機(jī)制提供了前所未有的動(dòng)態(tài)藍(lán)圖。
READING
BioPeers
歡迎關(guān)注本公眾號(hào),所有內(nèi)容歡迎點(diǎn)贊,推薦??,評(píng)論,轉(zhuǎn)發(fā)~
如有錯(cuò)誤、遺漏、侵權(quán)或商務(wù)合作請(qǐng)私信小編~~
歡迎大家投稿課題組 研究進(jìn)展 、招聘及招生宣傳~
所有文章只為科普、科研服務(wù),無(wú)商業(yè)目的~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.