抗生素的濫用導致病原菌出現耐藥性,特別是多重耐藥菌的出現對人類健康構成嚴重威脅。抑菌活性物質是一類能夠抑制病原菌生長繁殖或殺死病原菌的物質,如抗生素、抗菌肽、精油、多酚類物質等。同時,這類物質因具有廣泛的抗菌特性,能夠抑制多種導致食品腐敗的微生物以及可能引起疾病的病原體,有效緩解食品變質的過程。與傳統的化學防腐劑相比,這類化合物作為天然防腐劑,也具有更高的安全性。
傳統篩選抑菌物質的方法主要包括高通量實驗篩選和體內實驗。機器學習能夠對數據庫中數據信息進行提取和挖掘,以及分析和處理大數據樣本,識別高維變量空間中的復雜模式,從已知數據中進行獨立分析并準確預測,通過自動優化算法實現高通量篩選潛在的抗菌肽和生物活性化合物。有研究者應用神經網絡模型預測具有抗菌活性的分子,為篩選抗菌化合物提供了新方法。
湖北民族大學生物與食品工程學院的侯江霞、姜金輝和周志*等人對近些年機器學習在篩選抑菌物質方面的應用進行綜述,旨在為抗菌化合物的篩選工作提供建議,并為后續的篩選工作提供參考依據。
![]()
一 機器學習
機器學習是人工智能技術中一個重要的子領域,它是統計學和計算機科學的交叉學科,其目標是創建算法,指導機器如何訪問數據并利用數據來學習給定的任務。機器學習大致可以分為4 個子類型:監督學習、無監督學習、半監督學習和強化學習。監督學習屬于任務驅動式學習模式,人為預先設定輸出值,通過算法輔助學習,完成期望輸出指標;無監督學習屬于無任務驅動式學習模式,計算機可自我識別規則,對數據直接進行整合處理,自動輸出穩定模型;強化學習是由動物學習理論發展而來,算法通過環境的交互獎罰制度指導學習,在不斷試錯的過程中學習,得到期望值,整體過程類似于動物條件反射的建立。機器學習的過程主要依賴于算法的建立,機器學習算法種類較多,下文對其作詳細介紹。
二 機器學習算法
![]()
![]()
![]()
![]()
![]()
![]()
![]()
機器學習算法的選擇多種多樣,包括傳統的機器學習算法,如支持向量機、隨機森林、
K-最近鄰、邏輯回歸、線性回歸、樸素貝葉斯模型以及深度學習算法(如深度神經網絡、卷積神經網絡、循環神經網絡和長短期記憶)等(圖1)。
2.1 隨機森林
隨機森林是機器學習中一種廣泛使用的預測技術,它由多個決策樹模型組合而成,形成了一個強大的分類器。這些決策樹通過從輸入數據中隨機選擇樣本構建,每個樹都使用不同的隨機特征子集從而提高整體模型的準確性和魯棒性。這種方法利用了分類與回歸樹技術,通過集成多個弱預測模型增強其預測能力。
2.2
k-最近鄰
K-最近鄰算法是最簡單的有監督學習算法之一,可用于解決機器學習算法中的回歸和分類任務。
K表示
K個樣本,近鄰表示距離最近的樣本,所以
K最近鄰即
K個距離最近的樣本。其主要原理是通過對不同測試樣本之間的距離進行測量,而后尋找最為相近的
K個樣本進行分類,具有簡單、直觀、實用、分類準確的特點。其核心在于
K的選擇、距離度量、分類規則的確定。
2.3 支持向量機
支持向量機是用于解決線性可分和不可分問題的一種機器學習算法,由Cortes和Vapnik在1995年最先提出,主要用于解決二分類問題,其核心思想是將輸入向量通過線性變換映射到一個高維空間,并在其中尋找一個最優的分離超平面,從而實現對不同類別的樣本進行分類。與傳統的神經網絡不同,支持向量機是一種基于小樣本統計學習理論的算法,它遵循結構風險最小化的原則,能夠有效解決過擬合問題,在解決小樣本、高維以及非線性的模式識別任務時表現出顯著的優勢。該算法在類黃酮的定量構效關系(QSAR)分析領域展現出其適用性,例如有學者通過支持向量回歸模型研究20 種類黃酮的分子結構與其細胞抗氧化活性的QSAR,該QSAR模型在訓練集上相關系數為0.85,均方根誤差為0.090,在測試集上相關系數為0.61,均方根誤差為0.095,證明其具有良好的預測能力。
2.4 深度學習
深度學習是機器學習領域中的一個新的研究方向,其概念源于人工神經網絡的研究,其通過學習樣本數據的內在規律和表示層次,使機器能夠識別例如文字、圖像和聲音等數據。深度學習與機器學習的區別在于,機器學習必須進行手動提取特征并通過數據表示特征向量,在對特征數據進行特征提取后,使用機器學習模型解決實際問題。不同于過去人為干預提取數據的特征,深度學習通過計算機自動提取數據的特征。但兩種模型都需要通過學習不斷地優化模型的參數,最終使模型最優化,得到想要的結果。Veltri等開發了一個先進的深度神經網絡模型,該模型融合了嵌入層、卷積層、最大池化層以及長短期記憶層,能夠以超過98%的準確率識別出APD 3數據庫里對革蘭氏陽性或革蘭氏陰性細菌有效的抗菌肽。
三 不同抑菌物質的抗菌作用
3.1 抗生素
抗生素是一類具有抗菌活性的天然或半合成化合物,它們能夠抑制病原體的生長并干擾其正常發育過程。這些化合物主要來源于微生物(例如真菌、細菌和放線菌)以及某些高等動植物的代謝活動。目前,常見的抗生素主要包括
-內酰胺類、磺胺類、喹諾酮類、大環內酯類和四環素類等。這些化合物的作用機制主要包括抑制細菌細胞壁合成、與細菌細胞膜相互作用以改變細胞膜通透性、干擾細菌蛋白質合成以減少細胞存活必需的酶的合成,以及抑制細菌核酸的復制和轉錄。3.2 抗菌肽
![]()
抗菌肽天然存在于微生物、植物、無脊椎動物、兩棲動物和哺乳動物中。抗菌肽又稱宿主防御肽,它們構成了生物體抵御病原體入侵的第一道防線,是生物體先天免疫系統中重要的內源性防御分子之一,可有效抵御各種致病因子,對革蘭氏陽性菌、革蘭氏陰性菌、真菌和病毒等多種微生物都具有一定的抵抗作用。由于天然的抗菌功能和低耐藥性,抗菌肽被視為替代抗生素的潛在候選物質。根據作用位點的不同,可將抗菌肽的抗菌機制分為胞外機制和胞內機制(圖2)。
3.3 精油
![]()
植物精油與抗生素在調節動物腸道微生物種群組成方面呈現出相似的機理。相較于傳統的化學抗菌劑,天然植物提取物已被證明是新型抑菌劑的替代來源,植物精油憑借其廣譜抗菌活性、低毒性以及高利用率等顯著特點,在人體中表現出更佳的耐受性和更少的副作用。如圖3所示,精油的抗菌機制也比較復雜,其疏水性使精油中多種生物活性化學物質能夠輕易地穿透微生物細胞,進而引發微生物細胞結構和功能的顯著變化,由于其功能和作用機制的多樣性,可以避免引起微生物的耐藥性。
3.4 多酚
![]()
多酚結構具有一個或多個羥基的芳香環,已確定有8 000多種酚類結構,主要由黃酮、酚酸、醌、單寧和香豆素等物質組成,這些化合物廣泛分布在植物界的種子、樹皮、葉子、根和果實中。由于結構多樣復雜,多酚具有多種生物活性,如抗氧化、抗菌、抗炎等。植物多酚來源廣泛、種類繁多、結構復雜,其對于不同菌株的抑制作用機制尚不清晰,可能涉及多種因素共同作用。目前已知植物多酚抑菌機制的主要包括對微生物細胞結構的破壞、抑制生物大分子合成、影響微生物的能量代謝、抑制生物膜的形成(圖4)。
四 機器學習在抑菌物質研究中的應用
![]()
基于機器學習篩選潛在的抑菌物質是通過對抑菌物質的已知數據信息進行學習,然后進行歸納綜合或模型擬合后,找出抑菌物質的特點和規律,并將其推廣到未知抑菌物質數據從而進行預測的方法。機器學習在抑菌活性物質預測的流程如圖5所示,主要包括學習、預測和驗證3 個階段。
在學習階段,首先需要構建高質量的數據集,因為機器學習模型的精確度取決于訓練數據的質量。高質量、相關性強的數據集能提供豐富的特征信息和準確標簽,從而提升模型的預測能力和泛化性能。相反,存在偏差、噪聲或不完整的數據會導致模型學習錯誤模式,影響其實際應用表現。數據集通常來源于公開數據庫或已報道的文獻。收集到的數據需經過獨熱編碼、特征張量嵌入和Word2vec詞嵌入等方法轉換為機器學習可識別的格式,以構建抗菌化合物的特征參數或描述符,并設計分類算法進行學習和訓練。在預測階段,模型接收待測樣本并進行處理,最終生成預測結果。在驗證階段,通過評估分類器的準確率、計算效率以及算法的泛化性能等標準衡量其表現。通過細致優化分類器參數獲得準確且穩定的模型,從而在新數據上保持良好的預測性能。這一過程確保了模型在特定數據集上的準確性,同時增強了其在未見數據集上的穩定性。
4.1 機器學習在抗生素研究中的進展
機器學習作為化學信息學領域的重要組成部分,已成為抗生素發現和耐藥性檢測領域的重要推動力量。機器學習結合生物信息學分析能夠高效地篩選和識別新型抗生素分子,同時準確預測和檢測抗生素耐藥性基因,展現出其在抗生素研究中的巨大潛力。此外,機器學習在預測分子性質和活性方面較為廣泛。利用大規模化合物數據集進行訓練,機器學習算法能夠有效預測新型抗生素的物理化學性質,如溶解度、滲透性和毒性。在面對日益嚴峻的耐藥性問題時,通過機器學習算法,研究者能夠從海量的化合物庫中快速篩選出具有抗菌活性的分子,從而顯著提高實驗效率。Stokes等利用深度學習技術從大規模化合物庫中篩選了新型抗生素,其通過訓練深度神經網絡模型,成功預測并發現了Halicin這一具有廣譜抗菌活性的化合物。Halicin對多種耐藥菌株表現出抑菌活性,其能夠有效治療艱難梭菌和耐藥性鮑曼不動桿菌感染小鼠。此外,研究者還從ZINC15數據庫中篩選出其他8 種具有抗菌活性的化合物,這些化合物與已知抗生素的結構差異較大,研究表明該方法能夠發現具有獨特結構和抗菌機制的新型抗生素。在類似的研究中,Liu等利用深度學習技術篩選出針對鮑曼不動桿菌的新型抗生素abaucin,他們從7 684 種小分子化合物中篩選出480 種具有抗菌活性的化合物,并基于此數據訓練深度神經網絡模型。通過模型預測,abaucin被識別為具有廣譜抗菌活性的化合物,對多種耐藥菌株有效,并在小鼠模型中展現出良好的抗菌效果。Wong等利用可解釋的深度學習方法,對39 312 種化合物進行了篩選,構建并優化了圖神經網絡模型,用于預測化合物的抗生素活性和細胞毒性。經過模型評估后,該模型被應用于對12 076 365 種化合物的預測。通過t分布隨機鄰域嵌入可視化和子結構分析,研究者們發現了一類對金黃色葡萄球菌具有活性的新結構類化合物。其中一種結構類化合物對耐甲氧西林金黃色葡萄球菌和萬古霉素耐藥腸球菌表現出選擇性抑菌活性,能夠克服已知的耐藥機制,并在小鼠感染模型中顯示出良好的治療效果。
此外,機器學習與其他技術相結合,為抗生素的檢測提供了更靈敏、準確的方法。Skvortsova等將表面增強拉曼光譜(SERS)與機器學習相結合的方法,用于檢測細菌質粒中的
-內酰胺抗生素耐藥基因片段(blaTEM)。通過制備功能化的SERS基底,成功實現了對目標耐藥基因片段的特異性捕獲,即使在低濃度( 10 -7 mol/L)條件下也能通過SERS的細微變化實現高靈敏度檢測。為了進一步提高檢測的準確性和可靠性,研究者結合了主成分分析和邏輯回歸分類器構建了機器學習模型。在區分含有耐藥基因的樣本與對照樣本時,該模型的準確率、精確率和召回率均為99.7%。這一結果表明,機器學習不僅能夠處理復雜的光譜數據,還能顯著提高檢測效率。同時,該方法還簡化了檢測流程,減少了對復雜設備和專業技能的依賴。Yurtseven等結合機器學習和系統發育分析開發了一種新的抗生素耐藥性預測方法。通過引入系統發育相關的平行性評分,顯著提高了模型的預測性能,并成功識別了已知和新型的耐藥相關突變。這一研究強調了在抗生素耐藥性檢測中考慮細菌種群結構的重要性,并展示了機器學習在復雜生物數據分析中的應用潛力。越來越多的研究表明結合機器學習和其他先進技術可以顯著提升抗生素耐藥性檢測的準確性和效率。
4.2 機器學習在抗菌肽研究中的進展
![]()
傳統的篩選抗菌肽的方法依賴于從生物體內提取肽段,并通過一系列實驗技術進行鑒定和體外抗菌測試,鑒定出具有高效抗菌效能的抗菌肽。通過機器學習方法為抗菌肽的發現和應用提供了一種加速手段,它們通過分析氨基酸序列預測肽的抗菌活性,從而避免了復雜的合成和昂貴的體外實驗。這些方法的性能和可靠性依賴于訓練數據的質量,隨著各種抗菌肽的序列、結構、活性以及修飾等信息越來越多地被公開,研究者們對這些信息進行整合,建立了許多抗菌肽數據庫。表1展示了目前通用的抗菌肽數據庫及其相關信息。
機器學習在抗菌肽領域的應用主要體現在兩個方面:一方面是利用現有數據生成并設計出具有創新性的抗菌肽序列,另一方面則是從自然界已存在的生物分子序列中識別和篩選出具有抗菌潛力的肽段。機器學習通過這兩種途徑顯著提升了抗菌肽的發現效率。抗菌肽是一類具有抗菌活性的小分子肽,在抵抗多重耐藥病原體方面展現出巨大潛力。然而,傳統抗菌肽篩選方法受限于序列組合的復雜性,其篩選和功能鑒定效率亟待提升。多個研究團隊利用機器學習技術開發了不同的計算模型分析大規模的肽序列數據從而預測肽的活性和潛在的生物學功能。如Huang Junjie等開發了一個機器學習篩選流程,通過逐步細化的設計原則成功鑒定出了3 種六肽抗菌肽,這些抗菌肽對多種臨床分離的耐藥病原體顯示出強大的抑菌活性。在小鼠細菌性肺炎模型中,這些抗菌肽的氣霧劑配方展現出與青霉素相當的治療效果,其毒性低,并且不易引發藥物抗性。Santos-Júnior等預測了全球微生物組中近百萬種新的抗生素,并創建了包含863 498 個獨特抗菌肽的AMPSphere數據庫。該研究不僅通過體外實驗驗證了79 種合成肽的活性,其中63 種能夠有效針對病原體,還揭示了這些抗菌肽可能通過基因組片段化從較長序列中產生,這些發現為抗生素的篩選提供了新途徑。Ma Yue等結合長短期記憶網絡、注意力機制和BERT等多個自然語言處理神經網絡模型,從人類腸道微生物組數據中識別候選抗菌肽。在被確定為候選抗菌肽的2 349 個序列中,通過化學法合成了216 個,其中181 個顯示出抗菌活性。對11 種最有效的抗菌肽的進一步表征結果表明,它們對抗生素耐藥的革蘭氏陰性病原體具有很高的療效。Zhang Yu等結合了多種神經網絡算法開發了一種新型的抗菌肽預測模型——COMDEL,并通過特征提取和篩選過程,實現了94.8%的測試準確率和88%的實驗驗證準確率,他們還利用高通量篩選技術和定向進化策略,成功從食用作物和益生菌中篩選出具有抗菌活性的抗菌肽候選物。Fu Haoyi等開發了一個名為ACEP的深度學習模型。該模型能夠學習氨基酸嵌入模式,自動提取序列特征,并融合異構信息。通過引入氨基酸嵌入張量和設計新的深度神經網絡等技術創新,提高了抗菌肽識別的準確性和效率,并克服了深度學習模型的黑盒性質,增強了模型的可解釋性。van Oort等提出了一種基于生成對抗網絡的抗菌肽設計模型——AMPGAN v2,通過雙向條件生成對抗網絡,實現了對抗菌肽的定向生成。該研究通過結合多個數據庫構建的訓練集,利用條件向量控制生成過程,成功訓練出能夠產生具有高度多樣性和新穎性的抗菌肽候選物的模型。AMPGAN v2不僅在理化屬性上與已知抗菌肽保持高度相似,而且在響應條件向量變化方面表現出色,允許研究人員有效控制生成的肽序列特性。
機器學習技術在預測抗菌肽和抗菌劑的協同效應方面也顯示出巨大潛力,Olcay等運用多個監督機器學習模型準確預測了抗菌肽和抗菌劑的協同效應。他們發現,經過超參數優化的輕梯度提升機分類器在預測協同效應方面表現出最佳的測試準確率(76.92%)。特征重要性分析揭示了目標微生物種類、抗菌肽和抗菌劑的最小抑制濃度以及使用的抗菌劑是預測協同效應最重要的特征。這些研究表明,機器學習不僅能加速抗菌肽的發現過程,還能夠為抗菌肽的進一步研究和開發提供深入的見解。
4.3 機器學習在精油研究中的進展
許多研究人員在精油的研究中采用了機器學習,旨在減少體外實驗,并對實驗結果進行合理的預測。精油成分復雜,通常由數十至數百種化學成分組成,機器學習的應用不僅有助于分析這些成分并識別其特征性標志物,而且可以通過數據增強技術生成新的訓練樣本,從而增強模型對不同化學成分變化的適應性,提高模型的泛化能力。此外數據增強還有助于改善因數量不足或不平衡而導致的過擬合問題,能夠進一步提高模型的預測準確性和穩定性。Ragno等利用機器學習數據增強技術提升復雜混合物的QCAR,重點分析了61 種精油對小孢子菌屬的抑制活性,并通過數據增強技術構建了高性能的機器學習模型,識別了精油中關鍵化學成分的作用。
生物膜的形成是細菌引起抗生素耐藥性的關鍵過程,這一過程通常經歷5 個連續且動態的階段:初始附著、微生物群落的不可逆附著、生物膜結構的發育、成熟期穩定以及擴散階段。目前,機器學習已被用于分析精油對生物膜形成的影響,并通過探究精油成分與抗生物膜活性之間的潛在聯系,揭示精油中特定化學成分在抑制生物膜形成中的作用。Patsilinakos等分析了3 種不同植物在不同時期與提取時間所獲得的89 種精油的化學成分和它們對金黃色葡萄球菌及表皮葡萄球菌生物膜形成能力的影響,利用機器學習算法對精油化學成分和它們對特定菌株的抗生物膜活性進行了建模與分析,并通過特征重要性和偏依賴圖分析識別對生物膜生產有主要影響的化學成分。Artini等研究了地中海植物精油對銅綠假單胞菌生物膜形成的抑制作用,并應用機器學習算法對精油成分與其抗菌活性之間的關系進行了分類分析。研究結果表明,精油中的某些化學成分能夠抑制銅綠假單胞菌的生物膜形成,且這種作用可能受到多種成分的協同影響。Papa等研究了61 種精油對金黃色葡萄球菌生物膜形成的調節作用。通過氣相色譜-質譜分析精油的化學成分,并結合機器學習算法對精油成分與其抗菌活性之間的關系進行了建模和分析,該模型可以預測不同精油對金黃色葡萄球菌生物膜形成的抑制效果。
此外,精油的生物活性,如抗微生物、抗病毒和抗炎作用,也可以通過機器學習模型進行預測。這些模型能夠根據精油的化學組成預測其潛在的生物效應。Ragno等使用無監督機器學習從61 種精油中篩選出3 種(刺柏、樺木和錫蘭肉桂精油)對從囊性纖維化患者臨床分離的金黃色葡萄球菌和銅綠假單胞菌有顯著抗菌活性的精油。這些精油能有效抑制所有測試菌株生長,且抗菌效果不受菌株耐藥性影響。Sabatino等結合體外實驗數據與機器學習,開發出預測精油抗病毒活性及毒性的模型。他們從地中海植物中提取精油,通過氣相色譜-質譜分析其成分,并在Vero細胞系上測試其抗單純皰疹病毒-1效果。利用主成分分析和偏最小二乘判別分析算法,該模型成功區分了抗病毒和低毒性精油,識別了關鍵化學成分,并預測了5 種高效低毒的精油樣本。Daynac等利用人工神經網絡預測49 種精油對4 種病原體(金黃色葡萄球菌、大腸桿菌、白色念球菌、產氣莢膜梭菌)的抗菌性,研究發現人工神經網絡能夠以超過70%的準確率預測抗菌活性,并且能夠同時預測對2 種或3 種不同病原體的生物活性。
4.4 機器學習在多酚研究中的進展
多酚類化合物廣泛存在于自然界植物中,因其多樣的生物活性而備受關注。盡管機器學習技術在多酚研究領域的應用尚不廣泛,但在研究多酚的抗菌、抗病毒和抗氧化性方面,已經顯示出顯著的潛力和獨特的優勢。特別是在預測多酚的抗菌特性方面,QSAR模型作為一種藥物設計和發現中不可或缺的工具,通過建立分子描述符(性質)或指紋(官能團)的變化與化合物生物活性之間的關系,為快速評估新化學實體的生物活性提供了可能。Bouarab-Chibane等探究了35 種多酚類化合物對6 種食源性病原體和食品腐敗細菌的抗菌特性,并基于此建立了QSAR模型。這些模型基于多酚的理化性質,如親脂性、電子性質和電荷分布,成功預測了特定細菌(如大腸桿菌和鼠傷寒沙門氏菌)在暴露于多酚后的細菌負載差異。Kalinoski等通過結合數據驅動和實驗方法,開發了預測木質素衍生物抗菌特性的QSAR模型。利用機器學習算法和ChEMBL數據庫,構建了基于最小抑制濃度的模型,并發現對于枯草芽孢桿菌和大腸桿菌,特定的分子描述符(如脂肪族羧酸基團數量和芳香羥基數量)與抗菌活性密切相關。此外,通過實驗驗證的QSAR模型表明,木質素單體和二聚體對這兩種細菌具有不同程度的抗菌效果。Rout等利用機器學習和全原子分子動力學模擬開發天然多酚作為抗猴痘病毒包膜蛋白F13的抗病毒藥物。研究通過AlphaFold2數據庫預測F13的高質量蛋白質結構,并對57 種具有抗病毒活性的天然多酚進行了高通量虛擬篩選,結合分子動力學模擬分析了多酚與F13蛋白的相互作用模式。結果顯示,槲皮素和去甲氧基姜黃素等多酚表現出較高的結合親和力。
多酚的抗氧化活性主要取決于其結構,因此,許多研究人員也通過構建QSAR模型研究酚類化合物的抗氧化活性并解釋酚類化合物結構與其抗氧化活性之間的關系。由于酚類化合物的結構與抗氧化活性之間關系復雜,單一的線性模型難以充分反映結構參數對抗氧化活性的影響。研究人員通過引入多元線性回歸和人工神經網絡等機器學習算法,以提高QSAR模型的預測能力。Tian Xuezhi等通過結合機器學習輔助的QSAR模型和分子對接技術,從超過70 000 種食品化合物的數據庫中篩選潛在的多酚氧化酶抑制劑。通過實驗驗證了17 種結構多樣的化合物,發現其中16 種能在微摩爾濃度下抑制多酚氧化酶活性。Herath等利用機器學習算法結合快速表面傅里葉變換紅外光譜技術成功預測和分類了多酚類抗氧化劑,包括花青素、黃酮類和原花青素。通過對270 種全球不同顏色稻米品種進行生化分析和光譜掃描,優化了5 種機器學習模型,實現了93.5%~100%的高準確率預測。Shi Ying等利用支持向量回歸技術構建了一個QSAR模型,以預測75 種酚類化合物的Trolox等效抗氧化能力(TEAC)。該QSAR模型在訓練集上的預測能力通過留一法交叉驗證得到驗證,并與人工神經網絡和多元線性回歸模型相比較,結果顯示SVR模型在預測酚類化合物的TEAC時具有較高的準確性和穩定性,為抗氧化劑的設計和合成提供了一個有效的預測工具。這些研究表明,結合機器學習和QSAR模型的方法不僅能夠提高人們對多酚生物活性的理解,還能加速新型多酚衍生物的發現和開發。Tao Yaping等通過支持向量回歸建立了類黃酮分子結構與其細胞抗氧化活性之間的QSAR模型。使用分子平面性和從平面偏離的跨度等描述符量化分子特性,并通過訓練和測試數據集的分析,得到了高擬合度和良好的預測能力。此外,該研究通過密度泛函理論分析了不同糖基化修飾對抗氧化活性的影響,發現糖基化會通過降低酚羥基氫原子的反應性(鍵解離焓和電荷分布分析),減少抗氧化活性。該研究揭示了類黃酮結構特性與抗氧化性能的關系,為高效抗氧化類黃酮的設計與篩選提供了理論基礎。
五 結語
目前,機器學習技術在抗菌物質篩選領域展現出巨大的應用潛力和發展前景。隨著技術的不斷進步和算法的不斷優化,機器學習已成為加速抑菌物質發現、提升篩選效率及精確度的強有力工具。它不僅克服了傳統方法的局限性,通過分析大量的生物活性數據,能夠快速準確地預測和篩選出具有潛在抗菌活性的候選物質,也有助于降低實驗誤差和提高復現性。盡管機器學習技術在抗菌物質篩選中展現出巨大潛力,但該領域的研究和應用仍處于發展階段。為了實現更廣泛的應用,未來的研究工作可以朝以下幾個方向發展:1)為了提升機器學習模型在預測抑菌活性方面的性能,應擴展和豐富訓練數據集,以增強模型的泛化能力。這涉及到增加化學結構的多樣性和涵蓋更多類型的生物活性物質。盡管目前抗菌肽數據庫較為豐富,但多酚和精油這類化合物的數據庫卻相對匱乏。為了解決這些問題,需要收集更多的標準化數據,適當擴展訓練數據,并構建一個統一的抑菌活性物質的數據平臺,以便研究人員和機構能夠共享和訪問。2)許多機器學習模型,特別是深度學習模型,通常被視為“黑盒”,即難以解釋其內部決策過程。研究人員需要了解模型如何依據化學或生物特征做出預測,以便驗證其合理性,并為后續實驗提供指導。因此,開發可解釋的機器學習模型,揭示其內部工作機制,是提高模型可信度和應用價值的關鍵任務。3)鑒于機器學習模型在篩選抑菌活性物質時通常需要專業計算機人員的支持,這在一定程度上限制了其廣泛應用。未來可以開發更多專門的成套軟件包,這些軟件包將集成用戶友好的界面與自動化的模型訓練、優化和預測功能。通過提供直觀的操作和指導,研究人員即使在沒有深厚計算機背景的情況下,也能有效使用機器學習工具。
引文格式:
侯江霞, 姜金輝, 王琛鑫, 等. 基于機器學習的抑菌活性物質篩選研究進展[J]. 食品科學, 2025, 46(14): 366-375. DOI:10.7506/spkx1002-6630-20241130-213.
HOU Jiangxia, JIANG Jinhui, WANG Chenxin, et al. Research progress in the screening of antimicrobial substances based on machine learning[J]. Food Science, 2025, 46(14): 366-375. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-20241130-213.
實習編輯:俞逸嵐;責任編輯:張睿梅。點擊下方閱讀原文即可查看全文。圖片來源于文章原文及攝圖網
![]()
![]()
為匯聚全球智慧共探產業變革方向,搭建跨學科、跨國界的協同創新平臺,由北京食品科學研究院、中國肉類食品綜合研究中心、國家市場監督管理總局技術創新中心(動物替代蛋白)、中國食品雜志社《食品科學》雜志(EI收錄)、中國食品雜志社《Food Science and Human Wellness》雜志(SCI收錄)、中國食品雜志社《Journal of Future Foods》雜志(ESCI收錄)主辦,西南大學、 重慶市農業科學院、 重慶市農產品加工業技術創新聯盟、重慶工商大學、重慶三峽學院、西華大學、成都大學、四川旅游學院、北京聯合大學、 中國-匈牙利食品科學“一帶一路”聯合實驗室(籌) 共同主辦 的“ 第三屆大食物觀·未來食品科技創新國際研討會 ”, 將于2026年4月25-26日 (4月24日全天報到) 在中國 重慶召開。
長按或微信掃碼進行注冊
為系統提升我國食品營養與安全的科技創新策源能力,加速科技成果向現實生產力轉化,推動食品產業向綠色化、智能化、高端化轉型升級,由北京食品科學研究院、中國食品雜志社《食品科學》雜志(EI收錄)、中國食品雜志社《Food Science and Human Wellness》雜志(SCI收錄)、中國食品雜志社《Journal of Future Foods》雜志(ESCI收錄)主辦,合肥工業大學、安徽農業大學、安徽省食品行業協會、安徽大學、合肥大學、合肥師范學院、北京工商大學、中國科技大學附屬第一醫院臨床營養科、安徽糧食工程職業學院、安徽省農科院農產品加工研究所、安徽科技學院、皖西學院、黃山學院、滁州學院、蚌埠學院共同主辦的“第六屆食品科學與人類健康國際研討會”,將于 2026年8月15-16日(8月14日全天報到)在中國 安徽 合肥召開。
長按或微信掃碼進行注冊
會議招商招展
聯系人:楊紅;電話:010-83152138;手機:13522179918(微信同號)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.