多阶段单细胞转录数据的基因识别统计方法问世。 近日,西安交通大学公共卫生学院孙世权教授团队开发了一种高效灵活的非参数方法,用于检测多个时间点上的基因表达模式。该方法称为TDEseq,即时间序列scRNA-seq数据的时间差异表达基因,近日该成果发表于《基因组生物学》上。
TDEseq采用线性可加混合模型(LAMM)来拟合单个基因表达值和时间点的关系,通过引入形状约束的样条函数表征基因表达水平的时间序列动态变化过程检测具有特定表达模式的时间动态差异基因,引入随机效应项以控制样本间的异质性,并最终产生统计学上严格的p值。TDEseq不仅保证了更高的检验效力,也实现了更好的对错误发现率的控制,尤其是在处理样本异质性强的多样本scRNA-seq数据时。
TDEseq在癌细胞系药物响应、小鼠肝脏胚胎发育、肺腺癌进展过程、NK细胞相应SARS-CoV-2病毒感染等时间序列scRNA-seq数据中均展现出良好的性能。以小鼠肝脏胚胎发育为例,TDEseq识别的动态差异表达基因比tradeSeq多20%。TDEseq所识别的动态差异表达基因不仅具有明确的时间动态表达模式,且与肝脏胚胎发育过程呈强相关性。(来源:中国科学报 严涛)
相关论文信息:https://doi.org/10.1186/s13059-024-03237-3
作者:孙世权等 来源:《基因组生物学》