一种高效频繁子图挖掘算法被引量：35

An Efficient Frequent Subgraph Mining Algorithm

下载PDF

导出

摘要由于在频繁项集和频繁序列上取得的成功,数据挖掘技术正在着手解决结构化模式挖掘问题——频繁子图挖掘.诸如化学、生物学、计算机网络和WWW等应用技术都需要挖掘此类模式.提出了一种频繁子图挖掘的新算法.该算法通过对频繁子树的扩展,避免了图挖掘过程中高代价的计算过程.目前最好的频繁子图挖掘算法的时间复杂性是O(n3·2n),其中,n是图集中的频繁边数.提出算法的时间复杂性是O[2n·n2.5/logn],性能提高了O((1/2)n·logn)倍.实验结果也证实了这一理论分析. With the successful development of frequent item set and frequent sequence mining, the technology of data mining is natural to extend its way to solve the problem of structural pattern mining--Frequent subgraph mining. Frequent patterns are meaningful in many applications such as chemistry, biology, computer networks, and World-Wide Web. This paper proposes a new algorithm GraphGen for mining frequent subgraphs. GraphGen reduces the mining complexity through the extension of frequent subtree. For the best algorithm available, the complexity is O（n^3·2n）, n is the number of frequent edges in a graph dataset. The complexity of GraphGen is O（2^n n^25/logn）,which is improved O（/n- logn） times than the best one. Experimental results prove this theoretical analysis.

作者李先通李建中高宏

机构地区哈尔滨工业大学计算机科学与技术学院

出处《软件学报》 EI CSCD 北大核心 2007年第10期2469-2480,共12页 Journal of Software

基金 Supported by the National Natural Science Foundation of China under Grant Nos.60473075 60773063 (国家自然科学基金) the Key Program National Natural Science Foundation of China under Grant No.60533110 (国家自然科学基金重点项目) the National Basic Research Program of China under Grant No.2006CB303000 (国家重点基础研究发展计划(973)) the Program for New Century Excellent Talents in University (NCET) under Grant No.NCET-05-0333 (新世纪优秀人才支持计划)

关键词频繁模式挖掘子图同构子树同构频繁子树生成树 frequent pattern mining subgraph isomorphism subtree isomorphism frequent subgraph spanningtree

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献17

1Borgelt C, Berhold MR. Mining molecular fragments: Finding relevant substructures of molecules. In: Proc. of the ICDM 2002. 2002. http://www.wi-lab.condicdm02/
2Holder LB, Cook D J, Djoko S. Substructures discovery in the subdue system. In: Proc. of the AAAI'94 Workshop Knowledge Discovery in Databases. 1994. 169-180.
3Inokuchi A, Washio T, Okada T, Motoda H. Applying algebraic mining method of graph substructures to mutageniesis data analysis. In: Proc. of the PAKDD. 2000. http://www.informatik.nni-trier.de/-ley/db/conf/pakdd/pakdd2000.html
4Inokuchi A, Washio T, Okada T. An apriori-based algorithm for mining frequent substructures from graph data. In: Proc. of the PKDD 2000. LNAI 1910, 2000. 13-23. http://eric.univ-lyon2.fr/-pkdd2000/
5Kuramochi M, Karypis G. Frequent subgraph discovery. In: Proc. of the ICDM 2001. 2001. http://www.cs.york.ac.uk/arch/neural/ Conferences/ICDM2001 .html
6Yan Y, Han J. gSpan: Graph-Based substructure pattern mining. In: Proc. of the 2002 Int'l Conf. on Data Mining (ICDM 2002). Maebashi, 2002. http://www.wi-lab.com/icdm02/
7Washio T, Motoda H. State of the art of graph-based data mining. In: Proc. of the SIGKDD 2003. http://www.sigkdd.org/kdd2003/
8Yan X, Han J. CloseGraph: Mining closed frequent graph patterns. In: Proc. of the 9th ACM SIGKDD Int'l Conf. on Knowledge Discovery and Data Mining (KDD2003). Washington, 2003. http,://www.sigkdd.org/kdd2003/
9Han J, Wang W, Prins J. Efficient mining of frequent subgraphs in the presence of isomorphism. In: Proc. of the IEEE Int'l Conf. on Data Mining (ICDM 2003), 2003. http://www.cs.sjsu,edu/faculty/tylirdicdm2003_workshop.htm
10Jin R, Wang C, Polshakov D, Parthasarathy S, Agrawal G. Discovering frequent topological structures from graph datasets. In: Proc. of the KDD 2005. Chicago, 2005. 606-611. http://www.sigkdd.org/kdd2005/

同被引文献361

1鲁慧民,冯博琴,宋擒豹.频繁子图挖掘研究综述[J].微电子学与计算机,2009,26(3):156-161. 被引量：1
2赵作鹏,尹志民,王潜平,许新征,江海峰.一种改进的编辑距离算法及其在数据处理中的应用[J].计算机应用,2009,29(2):424-426. 被引量：51
3刘文剑,黄永强,常伟.A　Study　on　Modular　Fixture　Design　with　Intelligent　Selection　of　Elements　and　Interactive　Assembly[J].Journal of Harbin Institute of Technology(New Series),1996,3(4):45-48. 被引量：3
4连瑞琦,干戈,吕方.编译器的性能监控、分析和调试方案[J].计算机工程,2004,30(12):37-39. 被引量：2
5汪卫,周皓峰,袁晴晴,楼宇波,施伯乐.基于图论的频繁模式挖掘[J].计算机研究与发展,2005,42(2):230-235. 被引量：17
6朱耀祥,融亦鸣,朱剑,白勇,罗振璧.计算机辅助组合夹具设计系统的研究[J].机械工程学报,1994,30(5):40-46. 被引量：39
7颜跃进,李舟军,陈火旺.一种挖掘最大频繁项集的深度优先算法[J].计算机研究与发展,2005,42(3):462-467. 被引量：20
8谌志群,张国煊.文本挖掘研究进展[J].模式识别与人工智能,2005,18(1):65-74. 被引量：49
9李晓飞,马大玮,粘永健,孙晶菁.图像腐蚀和膨胀的算法研究[J].影像技术,2005,17(1):37-39. 被引量：39
10Jia-WeiHan,JianPei,Xi-FengYan.From Sequential Pattern Mining to Structured Pattern Mining： A Pattern-Growth Approach[J].Journal of Computer Science & Technology,2004,19(3):257-279. 被引量：18

引证文献35

1鲁慧民,冯博琴,宋擒豹.频繁子图挖掘研究综述[J].微电子学与计算机,2009,26(3):156-161. 被引量：1
2高琳,覃桂敏,周晓峰.图数据中频繁模式挖掘算法研究综述[J].电子学报,2008,36(8):1603-1609. 被引量：9
3吴甲,陈崚.一种快速的频繁子图挖掘算法[J].计算机应用,2008,28(10):2533-2536. 被引量：4
4付立东,赵永刚,邓福岐.二维非线性对流扩散方程求解程序优化[J].西安科技大学学报,2009,29(1):104-108.
5刘振,杨路明,彭佳扬.基于频繁模式树的频繁连通闭图集挖掘算法[J].计算机技术与发展,2009,19(5):37-40.
6李继腾,骆志刚,丁凡,田文颖,赵琦.最大频繁子图挖掘算法研究[J].计算机工程与科学,2009,31(12):67-70. 被引量：2
7周炜,郑建荣,颜建军.基于子图同构与事例匹配的装配体局部结构相似性分析[J].计算机辅助设计与图形学学报,2010,22(2):299-305. 被引量：10
8张硕,李建中,高宏,邹兆年.一种多到一子图同构检测方法[J].软件学报,2010,21(3):401-414. 被引量：7
9李海波,王元珍.一种基于前缀节点的频繁子图挖掘算法[J].计算机应用研究,2010,27(7):2476-2478.
10刘荣辉,郑建国,王翔.采用最小DFS的Deep Web结构化数据抽取[J].图书情报工作,2010,54(14):126-130.

二级引证文献102

1华顺刚,谢守广,刘斌,宋金龙.基于CAD模型参数和MHD度量的装配体检索研究[J].机械工程学报,2022,58(16):384-390. 被引量：1
2胡绵江,窦勇,倪时策,吴侃.一种面向加密算法共性子图的指令定制方法[J].计算机研究与发展,2012,49(S1):299-304. 被引量：2
3张含叶,刘海江.基于综合相似度的锂离子电池模块品种分类[J].中国工程机械学报,2015,13(3):277-282. 被引量：1
4桂赛银,陈移,戚富琴.情景教学法在手术室护理教学中的效果[J].医学研究杂志,2007,36(10):113-114. 被引量：8
5保颖怡.我国护理专业学生心理健康研究现状[J].岭南急诊医学杂志,2007,12(6):476-477. 被引量：5
6张硕,高宏,李建中,邹兆年.不确定图数据库中高效查询处理[J].计算机学报,2009,32(10):2066-2079. 被引量：24
7覃桂敏,高琳,呼加璐.生物网络模体发现算法研究综述[J].电子学报,2009,37(10):2258-2265. 被引量：7
8陶松桥,黄正东.基于属性邻接图匹配的装配体模型搜索方法[J].计算机辅助设计与图形学学报,2011,23(2):290-297. 被引量：15
9李先通,安实.基于频繁闭图的图包含查询算法[J].电子学报,2010,38(12):2937-2943. 被引量：1
10陈立宁,罗可.Apriori算法用于频繁子图挖掘的改进方法[J].计算机工程与应用,2011,47(10):113-117. 被引量：4

1郭鑫,黄云,颜一鸣,周清平.一种新的频繁子树增量式更新方法[J].计算机应用,2010,30(5):1300-1303.
2郭鑫,颜一鸣.一种动态云模型下树数据挖掘算法[J].小型微型计算机系统,2013,34(12):2749-2752. 被引量：8
3郑嵬.XML快速检测算法研究[J].北京信息科技大学学报（自然科学版）,2010,25(S2):57-60.
4张玉芳,李亦彦.结构化模式查询语言SPQL的实现[J].计算机科学,2006,33(B12):133-135.
5高宁,刘洋.基于B/S架构的可视化流程管理平台的设计与实现[J].计算机应用,2015,35(A02):178-180. 被引量：6
6王文焕,赵卓峰.关系数据库的关键词查询性能优化[J].计算机与数字工程,2012,40(11):18-20. 被引量：1
7刘永强.基于原型选择的图嵌入方法研究[J].电脑知识与技术（过刊）,2015,21(1X):172-175.
8何友全,方磊.医学影像计算机传输与处理[J].西南交通大学学报,2003,38(3):267-270. 被引量：6
9张志军,刘弘.上下文感知的移动社交网络推荐算法研究[J].模式识别与人工智能,2015,28(5):404-410. 被引量：6

软件学报

2007年第10期

浏览历史

内容加载中请稍等...

一种高效频繁子图挖掘算法被引量：35

参考文献17

同被引文献361

引证文献35

二级引证文献102

相关作者

相关机构

相关主题

浏览历史

一种高效频繁子图挖掘算法 被引量：35

参考文献17

同被引文献361

引证文献35

二级引证文献102

相关作者

相关机构

相关主题

浏览历史

一种高效频繁子图挖掘算法被引量：35