目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上,但是,研究发现,现有的子图分布算法应用在图分类中,存在准确性不高的问题.本文构建了标签零模型,提出了索引算法BGLI(Build Graph Locat...目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上,但是,研究发现,现有的子图分布算法应用在图分类中,存在准确性不高的问题.本文构建了标签零模型,提出了索引算法BGLI(Build Graph Location Index)和子图分布ESGS(Estimate Sub Graph on Spark)算法.首先,标签零模型能同时考虑图的拓扑结构信息和图中顶点和边标签信息,增加图分类的特征,并证明和验证了标签零模型用于图分类的有效性.其次,在标签零模型基础上提出两个算法,一个是用于构建图索引的BGLI算法,另一个是在BGLI算法基础上提出的计算子图分布ESGS算法,降低时间复杂度,提高计算速度.最后,通过实验验证,基于标签零模型的ESGS算法提取的子图作为分类特征可以提高图分类的准确性.展开更多
文摘目前,用于图分类的子图分布算法研究主要应用在生物和化学领域判断物质是否致癌、有毒等分类问题上,但是,研究发现,现有的子图分布算法应用在图分类中,存在准确性不高的问题.本文构建了标签零模型,提出了索引算法BGLI(Build Graph Location Index)和子图分布ESGS(Estimate Sub Graph on Spark)算法.首先,标签零模型能同时考虑图的拓扑结构信息和图中顶点和边标签信息,增加图分类的特征,并证明和验证了标签零模型用于图分类的有效性.其次,在标签零模型基础上提出两个算法,一个是用于构建图索引的BGLI算法,另一个是在BGLI算法基础上提出的计算子图分布ESGS算法,降低时间复杂度,提高计算速度.最后,通过实验验证,基于标签零模型的ESGS算法提取的子图作为分类特征可以提高图分类的准确性.