7月31日,中國科學院深圳先進技術研究院合成生物學研究所胡政課題組與廈門大學數學科學學院周達課題組合作,在《自然-生物技術》(Nature Biotechnology)上,發表了題為PhyloVelo enhances transcriptomic velocity field mapping using monotonically expressed genes的研究論文,提出了新穎的單細胞分化軌跡推斷的算法框架,并命名為PhyloVelo。該方法通過聯合單細胞轉錄組數據和譜系示蹤數據,鑒定隨細胞分裂而表達量呈單調遞增或遞減的基因即單調表達基因,并利用演化方法估計單調基因的RNA轉錄變化速度,以構建單細胞轉錄組速度場(RNA velocity fields),實現對細胞分化軌跡的高精準推斷。
細胞分化和命運決定是生命的奧秘之一,也是生命科學領域的核心問題,揭示其規律和機制對于探索生命現象和促進醫學發展具有重要意義。然而,準確地追蹤細胞的動態分化軌跡并非易事,尤其是在疾病等干擾情況下的細胞命運轉換過程,存在較大的隨機性和難以預測性。當前,單細胞轉錄組測序(scRNA-seq)是研究細胞分化的強有力的技術,可以通過分析單個細胞的轉錄組狀態來推斷細胞分化的動態過程。尤其是基于信使RNA(mRNA)的剪切動力學而發展起來的RNA速度模型(RNA velocity),可預測單細胞轉錄組在“過去”或“未來”時間的狀態,是單細胞軌跡推斷的經典算法。然而,由于單細胞測序技術與mRNA轉錄/剪切動力學的高度復雜性,RNA速度模型在實際應用中常出現錯誤推斷或不穩健的問題。
本研究提出利用單細胞系統發育樹的枝長信息代替物理時間,聯合單細胞轉錄組數據,可以探究基因表達隨著枝長(即時間)的變化規律,特別是鑒定隨細胞分裂而表達量呈單調遞增或遞減的基因(即單調表達基因),其RNA變化速度可以利用分子演化模型進行定量估計,從而構建單細胞轉錄組速度場,實現對細胞分化軌跡的高精準推斷(圖1)。
PhyloVelo算法主要分為兩部分。第一步是單調表達基因(monotonically expressed gene,MEGs)的識別,利用單細胞轉錄組數據和細胞系統發育樹(cell phylogeny)信息,通過帶漂移的擴散過程模型(diffusion process)和零膨脹的負二項分布(ZINB)來估計每個基因在系統發育樹上各個時間點的表達水平;進而,利用表達水平估計值和對應系統發育樹時間的相關性,篩選出那些隨著譜系時間線性單調增加或減少的基因,即單調表達基因MEGs(圖1)。第二步是基因表達變化速度的估計,假設每個MEG的表達水平隨著時間的變化速率是恒定的,即擴散方程中的漂移系數是常數;通過最大似然估計,可以得到每個MEG的漂移系數,從而得到每個細胞的單調基因表達變化速度的向量;將這個向量映射到降維空間(tSNE, UMAP等)重建RNA速度場,可推斷每個細胞在過去一個單位時間(如一個細胞分裂或突變)的轉錄組狀態,即逆時間重建細胞分化軌跡(圖1)。
該研究在多種仿真數據和真實數據上對PhyloVelo算法的準確性和魯棒性進行了驗證。PhyloVelo都能夠高準確地推斷仿真數據中的線性、分叉和趨同等復雜分化結構,與真實分化軌跡高度一致(圖2)。此外,PhyloVelo還在小鼠早期胚胎發育中表現出優于RNA velocity的性能,能夠準確地識別出紅細胞系列中血液/內皮祖細胞作為最早期的細胞類型,且與細胞增殖能力呈強相關(圖3)。
除了小鼠胚胎發育外,PhyloVelo還準確解析了小鼠和人類的腫瘤演化、免疫細胞動態發育等其他生物過程中的復雜分化軌跡,并量化了細胞類型之間的狀態轉換概率。例如,在肺癌模型中,PhyloVelo揭示了癌細胞的逆向分化軌跡。在抗PD-1治療后的CD8+ T細胞中,PhyloVelo發現活化CD8+ T細胞的來源在免疫治療前后有明顯的變化,表明T細胞高度的命運可塑性。
總之,PhyloVelo是利用單細胞譜系和轉錄組數據重建細胞命運轉變的新方法,具有高度的準確性和魯棒性。PhyloVelo可以克服傳統RNA velocity方法的局限性,并可以發現隱藏在轉錄組數據中的“時鐘基因”,為揭示細胞分化的分子機制提供線索。PhyloVelo為研究生物發育和疾病進展提供了有力的工具,也為未來的單細胞譜系和轉錄組數據分析提供了新視角。為了方便使用,研究團隊在線發布了使用手冊和具體應用案例(詳見https://phylovelo.readthedocs.io/en/latest/)。
研究工作得到國家重點研發計劃、國家自然科學基金、廣東省杰出青年基金、中央高校基本科研專項資金、中國博士后基金和深圳合成生物學創新研究院等的支持。該研究由深圳先進院和廈門大學共同完成。

圖1.PhyloVelo算法框架示意圖

圖2.?PhyloVelo準確推斷仿真數據中的細胞分化軌跡

圖3.?PhyloVelo重構小鼠血液系統發育的細胞分化軌跡

圖4.?PhyloVelo使用手冊網站截圖
數據元件互聯互通實踐助力跨區域跨行業釋放數據價值推薦單位:中國電子信息產業集團有限公司申報單位:中電數據產業集團有限公司中電數據產業集團有限公司依托數據元件理論,基于國產自主軟硬件,融合大數據、人工智......
中國農業大學動物科學技術學院教授孫東曉團隊構建了覆蓋奶牛59種組織、179萬個細胞的多組織單細胞表達圖譜,為解析牛重要性狀遺傳調控機制、推進精準育種及探索人類疾病的牛模型研究提供了重要資源。9月5日,......
廈門大學教授史大林團隊基于在西北太平洋副熱帶流渦區開展的高分辨率觀測,定量分析了固氮生物群落的豐度、結構和固氮速率,進而應用廣義加性模型刻畫的優勢固氮藍藻的生態位特征預測了其在全球海洋的主要分布格局,......
在一個繁忙的火車站,監控攝像頭正全方位追蹤站臺的情況,乘客流量、軌道占用、衛生狀況……所有信息實時傳輸給中央人工智能(AI)系統。這個系統的任務是幫助調度列車,讓它們安全準點進站。然而,一旦有人惡意干......
得益于雙子葉模式植物擬南芥和單子葉模式植物水稻的遺傳學研究,植物發育生物學在過去40年取得了長足發展。植物分生組織(干細胞)的建立與維持機制、重要組織和器官的分化軌跡及其核心調控網絡已初步建立。這些基......
近日,中國科學院廣州生物醫藥與健康研究院研究員林達等報道了新開發的單細胞多組學技術——Uni-C。該方法可在一個細胞中同時解析基因組大尺度結構變異(如SV、CNV、ecDNA)、小尺度突變(SNP/I......
為推動地方數據集團創新發展,服務全國一體化數據市場培育建設,7月23日,國家數據局組織召開座談會。國家數據局黨組書記、局長劉烈宏出席會議并講話,局黨組成員、副局長沈竹林、夏冰、余英出席會議。局黨組成員......
記者楊舒從中國農業科學院生物技術研究所獲悉,該所作物耐逆性調控與改良創新團隊日前聯合國內外研究機構,構建了首個水稻的多器官單細胞多組學圖譜,系統解析了水稻不同細胞類型的功能及其對復雜性狀的調控作用,有......
隨著人工智能(AI)、自動化等技術的持續突破,利用傳感器進行數據采集與高速傳輸,并通過物聯網存儲海量數據,正持續推進智能化養殖業發展,逐漸成為推動豬育種向精準化、高效化、智能化轉型的核心驅動力。從整個......
作為當前生物醫學研究的前沿熱點領域,單細胞蛋白質組學通過在單細胞層面上探索蛋白質表達模式,精確揭示細胞異質性,為解碼生命過程和疾病發生機制提供了獨特視角,已成為賦能精準醫療和生物醫藥創新的關鍵技術,是......