-
题名SDAEC算法在单细胞测序数据批次校正中的应用
- 1
-
-
作者
王文杰
李康
谢宏宇
-
机构
哈尔滨医科大学卫生统计学教研室
浙江大学医学院附属妇产科医院临床研究中心
-
出处
《中国卫生统计》
CSCD
北大核心
2024年第4期501-506,共6页
-
基金
国家自然科学基金(82003551)
浙江省自然科学基金(LTGY24H160008)。
-
文摘
目的 提出深度堆叠降噪自编码嵌套聚类(stacked denoising auto encoder embedded cluster, SDAEC)算法并用于单细胞mRNA测序(single cell mRNA sequence, scRNA-seq)数据的批次效应移除,对其移除批次效应性能进行评估。方法 基于单细胞数据具有高维度、高稀疏性及高度非线性误差特点,通过将单细胞Louvain聚类算法嵌入堆叠降噪自动编码器(stacked denoising auto encoder, SDAE)算法中,形成SDAEC算法,用于单细胞测序数据的批次效应移除。结合实际卵巢癌组织scRNA-seq数据,利用分布邻域嵌入(t-distributed stochastic neighbor embedding, tSNE)、 k最近邻批次效应检测(k-nearest-neighbor batch-effect test, kBET)、调整兰德系数(adjusted rand index, ARI)、标准化互信息(normalized mutual information, NMI)、平均轮廓宽度(average silhouette width, ASW)评价其移除批次效应性能。结果 利用SDAEC方法对scRNA-seq数据批次效应移除性能高于Combat、相互最近邻(mutual nearest neighbors, MNN)、分布匹配残差网络(maximum mean discrepancy distribution-matching residual networks, MMD-ResNet)和基于零膨胀负二项的方差提取法(zero-inflated negative binomial-based wanted variation extraction, ZINB-WaVE)。结论 SDAEC算法能够移除scRNA-seq数据的批次效应,提高scRNA-seq数据下游分析的有效性,具有实际应用价值。
-
关键词
深度堆叠降噪自编码嵌套聚类
单细胞测序
批次效应
卵巢癌
-
Keywords
Stacked denoising auto encoder embedded cluster
Single cell mRNA sequence
Batch effects
Ovarian cancer
-
分类号
R195.1
[医药卫生—卫生统计学]
-