從觀測時間序列數(shù)據(jù)中準(zhǔn)確識別因果關(guān)系,是生命科學(xué)、生態(tài)學(xué)、經(jīng)濟學(xué)以及人工智能等領(lǐng)域的核心科學(xué)問題。重構(gòu)復(fù)雜生物系統(tǒng)的因果網(wǎng)絡(luò),進一步揭示基因、蛋白質(zhì)和代謝物等組分之間的拓撲結(jié)構(gòu)與調(diào)控關(guān)系,對于理解生命活動的調(diào)控機制以及疾病發(fā)生發(fā)展的分子基礎(chǔ)具有重要意義。然而,由于生物系統(tǒng)內(nèi)在的復(fù)雜性以及未觀測混雜因素的廣泛存在,此類網(wǎng)絡(luò)的推斷面臨巨大困難。例如,在基因調(diào)控網(wǎng)絡(luò)中,未測量的遺傳因素或環(huán)境變異可能作為潛在的混雜因素,誘導(dǎo)基因之間產(chǎn)生虛假關(guān)聯(lián)。類似問題也出現(xiàn)在生態(tài)系統(tǒng)和經(jīng)濟系統(tǒng)中,例如生態(tài)系統(tǒng)中的氣候變化或市場中的政策沖擊,會在觀測變量之間產(chǎn)生一致波動。在這些領(lǐng)域中,未觀測的混雜因素雖然無法被直接測量,卻會影響觀測結(jié)果,導(dǎo)致估計偏差甚至錯誤的因果方向推斷。因此,一個基礎(chǔ)性挑戰(zhàn)隨之產(chǎn)生:如何區(qū)分真實因果關(guān)聯(lián)與由未觀測混雜因素誘導(dǎo)的虛假關(guān)聯(lián),并進一步重構(gòu)這些未觀測的混雜變量?
近日, 上海交通大學(xué) 數(shù)學(xué)科學(xué)學(xué)院 / 人工智能學(xué)院 陳洛南 團隊與西北工業(yè)大學(xué) 張紹武 團隊 等合作 在
IEEE Transactions on Pattern Analysis and Machine Intelligence
TPAMI在線發(fā)表題為 Dynamical Causality Under Latent Confounders for Biological Network Reconstruction 的研究成果。該研究 提出了一種新的動力學(xué)因果判別框架 : 未觀測混雜因素下的因果推斷 ( CIC ) , 能夠在存在未觀測混雜變因素的情況下,僅通過觀測時間序列數(shù)據(jù),準(zhǔn)確推斷變量之間的因果關(guān)聯(lián)、識別混雜效應(yīng),并重構(gòu)未觀測的混雜因素。
![]()
CIC 的核心在于提出了變量在延遲嵌入空間的正交分解定理。對任意一對變量(如 x 和 y ),將原始變量的時序數(shù)據(jù)轉(zhuǎn)換為延遲嵌入形式,即 X t -1 和 Y t ,并將其分解為公共子空間和私有子空間。若變量 x 到 y 之間存在因果,則根據(jù) Takens 延遲嵌入定理, X t -1 和 Y t 的公共子空間(或 Y t )可以完全重構(gòu) X t -1 ,若變量 x 到 y 之間不存在因果,則 Y t 無法重構(gòu) X t -1 。特別地,當(dāng)變量 x 和 y 之間不存在因果關(guān)聯(lián)且公共子空間非空時,變量 x 和 y 之間的未觀測混雜因素由公共子空間量化。該方法主要適用于以下場景:非線性動力學(xué)系統(tǒng)、變量具有不可分離性(耦合性)、存在未觀測的混雜因素。即便在存在大量未觀測混雜因素的高維復(fù)雜系統(tǒng)中, CIC 僅需兩個觀測變量即可實現(xiàn)有效的因果推斷,并重構(gòu)未觀測的混雜變量。這一突破顯著降低了對傳統(tǒng)因果假設(shè)的依賴,增強了在非線性動力系統(tǒng)中的因果推斷能力,也從理論上解決因果推斷中的不可分離性問題。
理論上, CIC 基于 Takens 的延遲嵌入提出了嵌入空間的正交分解定理,避免了對因果充分性假設(shè)的依賴;計算上,利用深度神經(jīng)網(wǎng)絡(luò)完成非線性變量表示與正交分解,從而在存在未觀測混雜因素的條件下,實現(xiàn)復(fù)雜因果場景下(反饋回路、多重混雜因素、非平穩(wěn)因果機制等)的因果推斷和混雜因素重構(gòu);在應(yīng)用中, CIC 在多種基準(zhǔn)系統(tǒng)和真實生物學(xué)數(shù)據(jù)上均表現(xiàn)出優(yōu)于現(xiàn)有方法的性能。
綜上所述,本研究為非線性動力學(xué)系統(tǒng)的因果推斷提供了新的思路,也為生物網(wǎng)絡(luò)重構(gòu)、疾病機制解析以及復(fù)雜系統(tǒng)建模等領(lǐng)域帶來了重要方法學(xué)突破。 該論文通訊作者為 上海交通大學(xué) 數(shù)學(xué)科學(xué)學(xué)院 / 人工智能學(xué)院 陳洛南 教授 與西北工業(yè)大學(xué) 張紹武 教授;第一作者為閆金鈴與張弛浩;研究人員還包括史際帆與黃偉填。
原文鏈接https://ieeexplore.ieee.org/document/11367338
制版人:十一
BioArt
Med
Plants
人才招聘
學(xué)術(shù)合作組織
(*排名不分先后)
![]()
轉(zhuǎn)載須知
【非原創(chuàng)文章】本文著作權(quán)歸文章作者所有,歡迎個人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權(quán)利,違者必究。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.