社区结构是复杂网络的重要特征之一,社区发现对研究网络结构有重要的应用价值.k-均值等经典聚类算法是解决社区发现问题的一类基本方法.然而,在处理网络的高维矩阵时,使用这些经典聚类方法得到的社区往往不够准确.提出一种基于深度稀疏...社区结构是复杂网络的重要特征之一,社区发现对研究网络结构有重要的应用价值.k-均值等经典聚类算法是解决社区发现问题的一类基本方法.然而,在处理网络的高维矩阵时,使用这些经典聚类方法得到的社区往往不够准确.提出一种基于深度稀疏自动编码器的社区发现算法CoDDA(a community detection algorithm based on deep sparse autoencoder),尝试提高使用这些经典方法处理高维邻接矩阵进行社区发现的准确性.首先,提出基于跳数的处理方法,对稀疏的邻接矩阵进行优化处理,得到的相似度矩阵不仅能够反映网络拓扑结构中相连节点间的相似关系,同时还反映了不相连节点间的相似关系.然后,基于无监督深度学习方法构建深度稀疏自动编码器,对相似度矩阵进行特征提取,得到低维的特征矩阵.与邻接矩阵相比,特征矩阵对网络拓扑结构有更强的特征表达能力.最后,使用k-均值算法对低维特征矩阵聚类得到社区结构.实验结果显示:与6种典型的社区发现算法相比,CoDDA算法能够发现更准确的社区结构.同时,参数实验结果显示,CoDDA算法发现的社区结构比直接使用高维邻接矩阵的基本k-均值算法发现的社区结构更为准确.展开更多
单细胞RNA测序已成为研究生物学重要特征的强大高分辨率工具。然而,其测序条件苛刻,价格成本高昂。目前细胞类型反卷积能够很好地解决这些限制问题,SMCTD(Sparse Model Cell Type Deconvolution)使用稀疏自编码器优化TAPE(Tissue-AdaPti...单细胞RNA测序已成为研究生物学重要特征的强大高分辨率工具。然而,其测序条件苛刻,价格成本高昂。目前细胞类型反卷积能够很好地解决这些限制问题,SMCTD(Sparse Model Cell Type Deconvolution)使用稀疏自编码器优化TAPE(Tissue-AdaPtive autoEncoder),使其在直肠癌和PBMC模拟数据上预测细胞类型比列具有更高的灵敏度、准确性和整体性能,同时在预测细胞类型特异性基因表达上表现更优。展开更多
文摘社区结构是复杂网络的重要特征之一,社区发现对研究网络结构有重要的应用价值.k-均值等经典聚类算法是解决社区发现问题的一类基本方法.然而,在处理网络的高维矩阵时,使用这些经典聚类方法得到的社区往往不够准确.提出一种基于深度稀疏自动编码器的社区发现算法CoDDA(a community detection algorithm based on deep sparse autoencoder),尝试提高使用这些经典方法处理高维邻接矩阵进行社区发现的准确性.首先,提出基于跳数的处理方法,对稀疏的邻接矩阵进行优化处理,得到的相似度矩阵不仅能够反映网络拓扑结构中相连节点间的相似关系,同时还反映了不相连节点间的相似关系.然后,基于无监督深度学习方法构建深度稀疏自动编码器,对相似度矩阵进行特征提取,得到低维的特征矩阵.与邻接矩阵相比,特征矩阵对网络拓扑结构有更强的特征表达能力.最后,使用k-均值算法对低维特征矩阵聚类得到社区结构.实验结果显示:与6种典型的社区发现算法相比,CoDDA算法能够发现更准确的社区结构.同时,参数实验结果显示,CoDDA算法发现的社区结构比直接使用高维邻接矩阵的基本k-均值算法发现的社区结构更为准确.
文摘单细胞RNA测序已成为研究生物学重要特征的强大高分辨率工具。然而,其测序条件苛刻,价格成本高昂。目前细胞类型反卷积能够很好地解决这些限制问题,SMCTD(Sparse Model Cell Type Deconvolution)使用稀疏自编码器优化TAPE(Tissue-AdaPtive autoEncoder),使其在直肠癌和PBMC模拟数据上预测细胞类型比列具有更高的灵敏度、准确性和整体性能,同时在预测细胞类型特异性基因表达上表现更优。