![]()
近年來蓬勃發展的空間轉錄組技術 成為了 疾病研究新的 顯微鏡 , 它們 能夠 將 組織切片 轉 化 為 基因地圖 的測量 。隨著技術 的發展帶來 高清的基因地圖,此類數據中高 稀疏 + 高維度 + 高通量的新特性給細胞和基因的解讀帶來了極大挑戰。 新的 算法 STHD 不再把基因地圖“馬賽克化”,而是 使用機器學習 處理 微米級別 像素背后的上萬個基因, 一次性 呈現幾百萬 個 高清 像素 的細胞類型地圖 , 由此可在 全轉錄組 層面更清晰地描繪細胞類型邊界與組織微環境結構,為腫瘤等復雜疾病樣本的機制研究與標志物發現提供高分辨率 研究工具。
近年來蓬勃發展的空間轉錄組技術給疾病研究帶來了新的手段, 它們 能夠在組織原有的結構之上測量多個基因在細胞里的位置和表達量 ,使組織研究 精細到 細胞和分子層面 。 以往 的 空間轉錄組 技術通常 需要平衡測量精度和基因數量。一般來說, 一類 以成像為原理的技術可以達到高清的亞細胞精度,但是只包含幾百到一千左右的基因,適合單細胞層面的細胞類型分類和特定分子的高清驗證; 另一類 以測序為原理的技術可以包含全基因組,但是每個測序單元 混合 多 種 細胞,適合組織層面和細胞群體的基因網絡研究。 目前 空間轉錄組學正迅速邁入 “ 亞細胞分辨率 + 高通量 轉錄組覆蓋 ” 的階段 ,代表性技術 包括 Stereo-seq,VisiumHD等 等 。 然 而,此類數據 中 高 稀疏 + 高維度 + 高通量的 新 特性給 空間細胞注釋等多個分析步驟 帶來了挑戰 。 例如, 目前 的 “ 先聚合 鄰近網格 、再去卷積 ” 的工作流程面臨 著 分辨率損失和算法擴展性 的 瓶 頸 ,而病理圖像驅動的細胞分割方法在復雜組織內無法處理致密細胞結構而且容易損失細胞核外信息。
最近,杜克大學張翼實驗室 在Genome?Biology發表 機器學習計算方法STHD: probabilistic cell typing of single Spots in whole Transcriptome spatial data with High Definition提出新的 解決方案。 不同于以往的網格 聚合方法 , STHD 整合單細胞 轉錄組作為 參考數據 集 , 在亞細胞尺度上直接 進行細胞 類型 的 概率 式 預測 , 適用于 VisiumHD 和 Stereo-seq 等微米級別分辨率技術 產生的 高 稀疏 + 高維度 數據。以 VisiumHD 為例, STHD 可以 在 2um 的亞細胞分辨率上輸出每個空間點的細胞標簽, 有效防止了在 其他方 法中的 細胞 分割困難或細胞 類型混雜與空間分辨率下降的問 題 。STHD結合梯度推導計算與patchlevel并行策略達成了高效計算,可以使用CPU在幾小時內完成對整個VisiumHD樣本內千萬spot的推斷;同時提供交互式STHDviewer,實現亞細胞尺度的組織可視化與后續空間差異分析。 STHD軟件已在 https://github.com/yi-zhang/STHD 開源 ,適用于多種組織類型 。
![]()
微米級別空間轉錄 數據 的 傳統 分析 方法 主要 依賴于 “ 網格聚合 + 去 卷積 ” 的 流程 ,即先將單個 稀疏 spot 聚合成 覆蓋更多轉錄本的 bin (網格) ,再對該 bin 中混合細胞類型進行分解。這種方法雖然解決了數據稀疏性,但 導致了 細胞類型混雜與空間分辨率下降的問題。 另外一類基于圖像的細胞分割方法在復雜組織內也面臨細胞分割的精度問題,且 不能處理復雜細胞形態。 S THD 采用 了逆 向 設計 :直接在原始 2×2?μm 分辨率的單個 spot 層面進行細胞類型推斷, 在初期跳過 binning 網格聚合 和細胞分割步驟, 直接在 高 分辨率 的原始基因計數上面進行計算, 避免混合效 應。 其 算法核心設計了 一個雙重目標函數:其一,基于泊松分布的似然函數對 spot 上每個基因的計數進行建模,參數 整合了 單細胞 參考 數 據中每個細胞類型的標準表達模型;其二,鄰域正則化項通過交叉熵衡量空間上相鄰 spot 的細胞類型概率分布相似性,這一平滑機制由 β 參數控制。這種設計兼顧統計建模精度,也增強空間連貫性 。 STHD 的 輸出結果 既包含每個 spot 的 細胞類型, 也給出后驗概率,便于識別邊界與模糊區。 在后續 分析 中, 這些 細胞標簽 可以 支 持 “cell type - stratified binning” , 即 在 binning 時只聚合 同類 細胞 , 從而 在提 升 深度的 同 時 避免細胞類型混淆, 最終 增強差異表達 基因 與細胞互作分析的準確 性。
![]()
圖一 STHD 機器學習算法
現有的 代 表性去卷積工具 ,如 RCTD , CARD , Cell2Location 等,可以在 Visium 等低精度空間轉錄數據中有效推測細胞類型 比 例 ,但在 此類 高精度稀疏數據下 容易因信號不足而失 準 。 作者設計了 高精度 的 空間 轉錄組 模擬數據 進行 測試, 發現 STHD 顯著提高了空間一致 性 , 分類準確性 和計算效率 ,精確度 達到 93.97% , AUC 分數 達到 99% 。 在真實 VisiumHD 數據中, S THD 的細胞標簽 能夠 精確對應 到 病理圖像 的 組織 結構和區域 , 并 且 每 種 細胞類型 的標 志 基因 呈現 特異性 表達 , 與 單細胞參考數據 的 高度一致 ,體現了細胞類型預測的精準度 。 而且,亞細胞 分辨率 使得 STHD 能夠發現腫瘤組織里相對稀有的 細胞 如免 疫 細胞,并且 能夠 劃分出細胞類型轉變的關鍵邊 界 位置。
在對結腸癌 VisiumHD 數據的 分析 中, 作者 首先 利用 公開 的人結直腸癌單細胞參考數據集( 37 萬 個細胞, 9 8? 個 細胞 亞型)構建參考表達 譜,輸出了 近九百萬 個 2um spot 的 細胞類型。這些微米層面的細胞類型標簽在宏觀上可以 區分出 組織里的 腫瘤上皮細胞、 隱窩 、 間質 、 不同類型腫瘤纖維細胞、 stemness 干性腫瘤細胞 區域、集結 的 免疫 細胞 等 結構 。 在微觀層面上 , STHD 可以 識別 組織中的微型 血管、單個免疫細胞、 SPP1+ 缺氧巨噬細胞簇、 T 細胞與髓系細胞互作 活躍區 、 特定細胞因子通訊熱點 區域 (如 CCL17/CCL19 ? CCR7 ) 等 腫瘤微環境中 的 關鍵結構和互 作 機制 ,為解析腫瘤免疫微環境提供了 極高 的分辨 率 。 這些自動預測的 細胞 標簽 還 可以 有效地 幫助差異表達基因的分析 。 以往空間轉錄組的差異基因分析受組織異質性大, 往往 區域之間的細胞豐度的變化和細胞表達的變化 都會影響差異基因分析 結果 。利用STHD細胞類型標簽 分析單一類型細胞空間差異表達時 , 能夠 發現邊緣的腫瘤細胞上調TNF-alpha通路,腫瘤內部的巨噬細胞上調SPP1 基因簇和hypoxia 缺氧 通路 。 在不同的免疫細胞互作活躍區,研究者發現 T 細胞與不同的細胞類型(如巨噬細胞和樹突狀細胞)發生互作,而且這些區域呈現出差異性地表達不同程度的腫瘤殺傷相關基因。基于后驗概率,研究者識別出細胞類型的交界前線( frontline ),并將距離交界約一個單細胞大小的區域定義為 near-frontline ;隨后在控制相同細胞對的條件下,將其與 far-frontline 進行比較。整合前線區域的轉錄本信息后,結果顯示,在 T- 巨噬細胞對和 T- 樹突狀細胞對中, near-frontline 區域均表現出更高的細胞通訊活性。具體而言, T- 巨噬細胞通訊主要由 CD74-IFNG 交互驅動,而 T- 樹突狀細胞通訊則由 CCL17/CCL19-CCR7 交互介導,提示成熟樹突狀細胞在 T 細胞免疫調控中發揮重要作用 。
圖三 結腸癌 VisiumHD 全樣本的亞細胞精度注釋和兩個 T- 髓系細胞免疫互作活躍區
STHD 適用于多種樣本與組織類型的細胞類型預測。在多個結直腸癌 VisiumHD 樣本中,作者觀察到這些樣本呈現出一致的腫瘤、基質和免疫細胞類型,并在其中一個樣本中發現特有的腫瘤三級淋巴結構,其內部包含生發中心 B 細胞和濾泡輔助性 CD4T 細胞,并表達相應的細胞因子 CXCL13 。 STHD 也適用于其他組織類型的 VisiumHD 和 Stereo-seq 數據的微米級注釋;結合相應組織的單細胞數據集, STHD 展示了 標注 的 小鼠小腸和腦組織,以及人類胰腺組織的細胞類型與結構。 STHD 軟件已在 https://github.com/yi-zhang/STHD 開源 。
原文鏈接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-025-03608-4
杜克大學張翼 課題組致力于機器學習和生物醫學數據的算法開發研究,以及腫瘤和免疫相關疾病的基因組大數據應用。 課題組 長期 招收博士后,博士生,助理研究員,科研實習生;歡迎對 AI+Bio 感興趣的計算生物學或交叉學科背景的同學聯系申請。
制版人:十一
BioArt
Med
Plants
人才招聘
學術合作組織
(*排名不分先后)
![]()
戰略合作伙伴
(*排名不分先后)
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.