为解决标签传播的社区检测算法容易产生怪物社区和不稳定社区划分的问题,以标签熵为基础,提出一种重叠社区检测算法LEKA(Label Entropy and K-shell Algorithm in overlapping community),综合考虑了标签初始化、标签更新和标签传播的...为解决标签传播的社区检测算法容易产生怪物社区和不稳定社区划分的问题,以标签熵为基础,提出一种重叠社区检测算法LEKA(Label Entropy and K-shell Algorithm in overlapping community),综合考虑了标签初始化、标签更新和标签传播的各个阶段。首先,利用K-shell算法对节点进行初始化以获取节点的层次信息;其次,依据标签熵升序依次更新节点标签,在选择标签时综合节点间的层次信息和节点间的影响,在存在多个候选标签的情况下基于节点标签权重进行选取。在真实网络数据集上的实验结果表明,LEKA在运行时间较短的情况下,重叠模块度EQ(ExtendQ)相较于OCKELP(Overlapping Community detection algorithm based on K-shell and label Entropy in Label Propagation)提高了2.3%~13.2%,具有较高的准确性和稳定性,更适合挖掘网络中的重叠社区结构。展开更多
目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上,但是,研究发现,现有的子图分布算法应用在图分类中,存在准确性不高的问题.本文构建了标签零模型,提出了索引算法BGLI(Build Graph Locat...目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上,但是,研究发现,现有的子图分布算法应用在图分类中,存在准确性不高的问题.本文构建了标签零模型,提出了索引算法BGLI(Build Graph Location Index)和子图分布ESGS(Estimate Sub Graph on Spark)算法.首先,标签零模型能同时考虑图的拓扑结构信息和图中顶点和边标签信息,增加图分类的特征,并证明和验证了标签零模型用于图分类的有效性.其次,在标签零模型基础上提出两个算法,一个是用于构建图索引的BGLI算法,另一个是在BGLI算法基础上提出的计算子图分布ESGS算法,降低时间复杂度,提高计算速度.最后,通过实验验证,基于标签零模型的ESGS算法提取的子图作为分类特征可以提高图分类的准确性.展开更多
文摘为解决标签传播的社区检测算法容易产生怪物社区和不稳定社区划分的问题,以标签熵为基础,提出一种重叠社区检测算法LEKA(Label Entropy and K-shell Algorithm in overlapping community),综合考虑了标签初始化、标签更新和标签传播的各个阶段。首先,利用K-shell算法对节点进行初始化以获取节点的层次信息;其次,依据标签熵升序依次更新节点标签,在选择标签时综合节点间的层次信息和节点间的影响,在存在多个候选标签的情况下基于节点标签权重进行选取。在真实网络数据集上的实验结果表明,LEKA在运行时间较短的情况下,重叠模块度EQ(ExtendQ)相较于OCKELP(Overlapping Community detection algorithm based on K-shell and label Entropy in Label Propagation)提高了2.3%~13.2%,具有较高的准确性和稳定性,更适合挖掘网络中的重叠社区结构。
文摘目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上,但是,研究发现,现有的子图分布算法应用在图分类中,存在准确性不高的问题.本文构建了标签零模型,提出了索引算法BGLI(Build Graph Location Index)和子图分布ESGS(Estimate Sub Graph on Spark)算法.首先,标签零模型能同时考虑图的拓扑结构信息和图中顶点和边标签信息,增加图分类的特征,并证明和验证了标签零模型用于图分类的有效性.其次,在标签零模型基础上提出两个算法,一个是用于构建图索引的BGLI算法,另一个是在BGLI算法基础上提出的计算子图分布ESGS算法,降低时间复杂度,提高计算速度.最后,通过实验验证,基于标签零模型的ESGS算法提取的子图作为分类特征可以提高图分类的准确性.