蛋白質是生命活動的主要承擔者,從催化化學反應到傳遞信號,幾乎所有的生物過程都離不開它們。然而,天然蛋白質往往難以滿足工業催化、生物醫藥等領域的嚴苛需求。傳統蛋白工程依賴定向進化等耗時費力的試錯實驗,而近年興起的AI設計雖能生成序列,卻常因計算模型與真實實驗環境存在巨大差距,導致“設計得出來,卻表達不出來或活性不夠”的窘境。如何讓AI不僅能“畫出”蛋白藍圖,更能“造出”真正好用的蛋白,成為該領域亟待突破的核心瓶頸。
2026年3月19日,騰訊AI for Life Sciences實驗室姚建華團隊在《Nature Communications》發表了題為“Functional protein design and enhancement with ontology reinforcement iteration”的研究論文。該研究提出名為ORI的閉環蛋白工程框架,通過結合本體條件生成與濕實驗反饋強化學習,成功設計出活性超天然溶菌酶百倍、耐85℃高溫及具備雙重酶活的人工蛋白,為功能性蛋白的理性設計提供了全新范式。
![]()
ORI框架由三大核心組件構成:蛋白設計智能體(PDA)將用戶的語言需求轉化為結構化本體提示,指導擁有30億參數的功能感知蛋白生成模型(PGM)產出候選序列。隨后,統一序列模型(USM)對生成蛋白的結構置信度與功能域進行快速篩選。通過這一流程,團隊發現生成蛋白與天然酶的序列相似性中位數為0.96,但序列與結構相似性之間僅呈微弱相關(r=0.072),這說明單純依賴序列相似性無法準確評估蛋白質量。經USM篩選后,候選序列中含目標功能域的比例從45.89%飆升至98.91%。在細胞無細胞表達系統中,隨機選取的100個溶菌酶候選蛋白中,有6個顯示出可檢測活性,其中TX-L6在pH7.5下的活性高達1598 U/mg,是天然蛋清溶菌酶的2.7倍。
為了進一步提升設計質量,團隊引入了基于濕實驗反饋的強化學習(RLWF)。他們將初次實驗獲得的表達與活性數據作為獎勵信號,迭代優化生成模型。結果顯示,優化后的模型生成蛋白的預測結構置信度(pLDDT)中位數從75提升至85。在三種不同功能家族的酶中,優化模型設計的蛋白表達水平均顯著提升,其中糖基水解酶家族的中位表達量從0.061 mg/ml增至0.168 mg/ml。更重要的是,隨機選取的20個優化后蛋白中,13個的溶菌酶活性超越了此前的高活性變體TX-L6,最優者TX-RL15的活性更是TX-L6的66倍,相較于天然酶實現了超過兩個數量級的提升。
![]()
在耐熱酶設計方面,ORI同樣展現出強大的可控性。團隊以熱穩定性較差的幾丁質酶為目標,通過在提示詞中指定目標熔融溫度,生成蛋白的預測耐熱性隨設定值升高呈系統性上升。實驗驗證中,20個預測耐溫超60℃的候選蛋白有9個具可測活性,其中變體TX-SC2在85℃孵育后仍保持全部活性,甚至在95℃仍殘留部分活性。相比之下,天然耐熱幾丁質酶在該溫度下已幾乎完全失活。
最令人矚目的當屬雙功能酶設計。ORI能夠利用統一框架同時優化溶菌酶與幾丁質酶兩種活性。在生成的426個高置信度雙功能候選蛋白中,25個經實驗確認為兼具雙重酶活。表現最優的TX-ME采用TIM桶狀折疊,其兩種酶的活性均顯著超越了天然雙功能酶Hevamine A,以及T4溶菌酶和GH18幾丁質酶這兩種單功能標桿。該結果證明了ORI能夠在單一序列中協調多個復雜功能目標,探索出超越自然進化的多功能解決方案。
READING
BioPeers
歡迎關注本公眾號,所有內容歡迎點贊,推薦??,評論,轉發~
如有錯誤、遺漏、侵權或商務合作請私信小編~~
歡迎大家投稿課題組 研究進展 、招聘及招生宣傳~
所有文章只為科普、科研服務,無商業目的~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.