一种基于单事务项集组合的频繁项集挖掘算法被引量：4

Algorithm of Frequent Itemsets Mining Based on Single Transaction Itemsets Combination

下载PDF

导出

摘要 Apriori是挖掘频繁项集的基本算法,目前该算法及其优化变种都没有解决候选项及重复扫描事务数据库的问题。文章通过对Apriori及其优化算法的深入探究,提出了一种基于单事务组合项集的挖掘算法,该算法在一个事务内部对"数据项"进行组合,在事务数据库中对所有相同"项集"进行计数。不经过迭代过程,不产生候选项集,所有频繁项集的挖掘过程只需对事务数据库一次扫描,提高了频繁项集挖掘效率。 Apriori is a basic algorithm for frequent itemsets mining. At present, neither Neither Apriori nor its variations resolve some problems which is candidate item and scans transaction database repeatedly. This paper makes a profound research on Apriori and proposes a novel algorithm based on single transaction combination itemsets for mining. The algorithm combines data item to form an itemsets in one transaction database and counts the same itemsets in all transaction databases. Moreover, there is no iteration and candidate itemsets produced by the algorithm, and the mining process scans the traction database only one time, therefore, this algorithm is more effective.

作者曾波

机构地区重庆工商大学商务策划学院

出处《计算机科学》 CSCD 北大核心 2008年第1期196-197,226,共3页 Computer Science

基金重庆市自然科学基金(2006BA6015)重点资助项目

关键词频繁项集 APRIORI 单事务项集组合候选项 Frequent itemsets,Apriori, Single transaction itemsets combination, Candidate item

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1Park J S,Chen M S,Yu P S. An Effective Hash Based Algorithm for Mining Association Rules [R]. In: Proceedings of the 1995 ACM SIOMOD International Conference on Management of Data, San Jose,CA, 1995. 175-186.
2Agrawa 1R, Imielinski T, Swami A. Mining association rules between sets of items in large databases (C). In: Buneman P, Jaiodia S,eds. Proc. of the ACM SIGMOD Conf. on Management of Data (SIGMOD'93). New York: ACM Press, 1993. 207-216.
3Agrawa 1R, Srikant R. Fast algorithms for mining association rules in large databases. In: Bocca JB, Jarke M, Zaniolo C, eds. Proc. of the 20th Int'l Conf. on Very Large Data Bases. Santiago: Morgan Kaufmann, 1994. 478-499.
4Savasere A, Omiecianski E, Navathe S. An efficient algorithm forminin gas sociation rules in large databases.
5Toivonen-H. Sampling Large Databases for Association Rules. In: Proc of the 22nd Int'l Conf. on Very Large Data Bases. Mum bai, India, 1996. 134-145.
6Brin S, Motwani R, Ullman J D, Tsur S. Dynamic itemset counting and implication rules for market basket data. In: ACM SIGMOD International Conference on the Management of Data, May 1997. 255-264.
7Han Jiawei, Kamber M. Data Mining Concepts and Techniques, 2001. 225-244.
8黄传明.一种基于散列技术和事务压缩的关联规则挖掘算法[J].计算机工程,2003,29(22):117-118. 被引量：11
9马盈仓.挖掘关联规则中Apriori算法的改进[J].计算机应用与软件,2004,21(11):82-84. 被引量：24

二级参考文献5

1[1]Agrawal R, Imielinski T, Swami A. Mining Association Rules Between Sets of Items in Large Database. Washington, DC: In Proc. 1993 ACMSIGMOD Int. Conf. Management of Data, 1993-05:207-216
2[2]Park J S, Chen M S, Yu P S. An Effective Hash Based Algorithm for Mining Association Rules. San Jose, CA:In Proc. 1995 ACM-SIGMOD Int. Conf. Management of Data, 1995-05:175-186
3[3]Han J, Pei J, Yin Y. Mining Frequent Patterns Without Candidate Generation. Dallas,TX:In Proc.2000 ACM-SIGMOD Iht. Conf.Management of Data, 2000-05:1-12
4[4]Han J, Kambe M. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers Inc., 2001
5范明孟小峰.数据挖掘概念与技术[M].北京:机械工业出版社,2001..

共引文献33

1王娟勤,李书琴.关联规则挖掘在奶牛营养研究中的应用[J].西北农林科技大学学报（自然科学版）,2010,38(9):155-160. 被引量：1
2陈文庆,许棠.关联规则挖掘Apriori算法的改进与实现[J].微机发展,2005,15(8):155-157. 被引量：21
3骆嘉伟,王艳,杨涛,吴君浩.一种结合完全连接的改进Apriori算法[J].计算机应用,2006,26(5):1174-1177. 被引量：4
4严健.大声唱出来康佳D263体验[J].数字通信,2006,33(24):46-46.
5郭维,欧阳一鸣,郭骏.Web挖掘中基于交集算法发现用户频繁访问模式[J].合肥工业大学学报（自然科学版）,2006,29(12):1511-1515.
6欧阳一鸣,郭维,郭骏,孙超超.Web挖掘中基于GITC算法发现用户频繁访问模式[J].计算机工程与应用,2007,43(7):191-194. 被引量：1
7谢廷婷.频繁集挖掘算法研究[J].计算机与现代化,2007(3):60-63. 被引量：2
8何胜文,周绍梅,雷昌瑜,陈丽君.一种基于矩阵结构的快速关联规则挖掘算法[J].计算机与现代化,2007(7):3-5.
9何胜文,周绍梅,姚华.基于二叉树结构的关联挖掘算法[J].福建电脑,2007,23(9):76-77. 被引量：1
10陆觉民,郑宇.基于矩阵的数据挖掘技术在数字化图书馆中的应用[J].现代情报,2007,27(12):92-93. 被引量：5

同被引文献46

1易云飞,覃俊.关联规则挖掘技术在高校人才培养模式中的应用[J].中南民族大学学报（自然科学版）,2007,26(2):83-86. 被引量：4
2冯亚丽,伊三泉,吴凯,戴庆,王深宇.基于WEB的成绩管理信息系统的安全性策略[J].大庆石油学院学报,2004,28(6):77-78. 被引量：5
3衣治安,李楠,彭敏.数据挖掘方法在入侵检测系统中的应用[J].大庆石油学院学报,2006,30(1):76-78. 被引量：1
4朱其祥,徐勇,张林.基于改进Apriori算法的关联规则挖掘研究[J].计算机技术与发展,2006,16(7):102-104. 被引量：16
5胡钢锋,李德毅,陈桂生,韩明畅.一种网络化数据挖掘方法研究[J].微电子学与计算机,2006,23(9):126-128. 被引量：5
6徐岩,朱恒民.数据挖掘与数据库的集成方法[J].吉林大学学报（信息科学版）,2007,25(2):228-232. 被引量：7
7Han Jiawei,KamberM.数据挖掘:概念与技术[M].北京:机械工业出版社,2006.
8Mike Gunderloy, Joseph L Jorden,David W Tschanz.Mastering Microsoft SQL Server 2005 [M].北京:人民邮电出版社,2008:221-252,312-332.
9Jia Hu,Ning Ahong.Organizing multiple data source for developing intelligent e-business ports[J] .Data Mining and Knowledge Discovery,2006,12:127-150.
10Wang Yunsong, Evan F, Bollig Benjamin J, et al.Web-IS(integrated system):An overall view[J].Vis Geosci,2006,10:27-42.

引证文献4

1李广水,郑滔,宋丁全.面向服务数据挖掘的关键技术在.NET下的实现研究[J].计算机工程与设计,2009,30(20):4654-4657. 被引量：3
2李昊,周振华.基于数据挖掘的高校学生成绩预警系统[J].大庆石油学院学报,2011,35(4):91-95. 被引量：21
3刘丽峰.一种基于清洗关联规则的金融数据挖掘算法[J].微电子学与计算机,2012,29(5):174-177. 被引量：1
4胡维华,冯伟.基于分解事务矩阵的关联规则挖掘算法[J].计算机应用,2014,34(A02):113-116. 被引量：11

二级引证文献36

1罗国伟,郭信江,丘洁飞,邱韬奋.基于SOA的远程教育系统的研究与实现[J].中国教育信息化（高教职教）,2011(4):33-35.
2曾万里.基于数据挖掘的高职学生核心竞争力培养研究[J].软件（教育现代化）（电子版）,2012,2(6):91-91.
3李春秋,何军.基于数据挖掘技术的高校学生成绩管理研究[J].宿州学院学报,2013,28(2):79-82. 被引量：2
4张玮.基于数据挖掘的高校学生成绩预警系统设计[J].科技资讯,2013,11(6):23-23. 被引量：1
5叶福兰.基于数据挖掘的高校学生成绩预警状况分析[J].长春师范学院学报（自然科学版）,2013,32(5):45-49. 被引量：5
6马青霞,王智钢,李广水.基于RESTFUL的面向服务数据挖掘原型系统的设计与实现[J].计算机应用与软件,2014,31(2):41-43. 被引量：4
7倪雪华.用数据挖掘方法分析学生成绩的影响因素[J].电脑编程技巧与维护,2014(19):60-62. 被引量：1
8任伟建,于博文.基于矩阵约简的Apriori算法改进[J].计算机与现代化,2015(9):1-5. 被引量：7
9安建瑞,王海鹏,张龙波,金超,怀浩.一种基于MapReduce的压缩矩阵关联规则挖掘算法[J].重庆理工大学学报（自然科学）,2016,30(2):95-100. 被引量：5
10张伟科.一种改进的AprioriTid算法[J].沈阳工业大学学报,2016,38(3):314-318. 被引量：6

1高宏宾,潘谷,黄义明.基于频繁项集特性的Apriori算法的改进[J].计算机工程与设计,2007,28(10):2273-2275. 被引量：25
2周兴斌,迟殿委.一种Apriori算法的改进[J].南昌大学学报（工科版）,2008,30(2):184-187. 被引量：3
3潘怡,杜红燕.概念格在频繁模式挖掘中的应用研究[J].湖南科技大学学报（自然科学版）,2010,25(2):81-84.
4范平,梁家荣,李天志,巩建闽.基于二进制的关联规则挖掘算法[J].计算机应用研究,2007,24(8):79-80. 被引量：11
5王乐,冯林,王水.不产生候选项集的TOP-K高效用模式挖掘算法[J].计算机研究与发展,2015,52(2):445-455. 被引量：9
6崔双弥,张德生.一种改进的Inter-Apriori算法[J].计算机系统应用,2017,26(1):157-162. 被引量：2
7王乐,王水,陈波,董鹏.交集剪枝法挖掘最大频繁项集[J].计算机工程与应用,2009,45(13):156-159. 被引量：1
8徐健辉.生成频繁项集的逻辑“与”运算算法[J].计算机应用,2004,24(11):88-90. 被引量：5
9刘黎明,王水,王乐.基于迭代事务集与交集剪枝的最大频繁项集挖掘算法[J].南开大学学报（自然科学版）,2009,42(4):97-102. 被引量：3
10王乐,常艳芬,王水.基于模式增长的不确定数据的频繁模式挖掘算法[J].计算机应用,2015,35(7):1921-1926. 被引量：7

计算机科学

2008年第1期

浏览历史

内容加载中请稍等...

一种基于单事务项集组合的频繁项集挖掘算法被引量：4

参考文献9

二级参考文献5

共引文献33

同被引文献46

引证文献4

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

一种基于单事务项集组合的频繁项集挖掘算法 被引量：4

参考文献9

二级参考文献5

共引文献33

同被引文献46

引证文献4

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

一种基于单事务项集组合的频繁项集挖掘算法被引量：4