基于位存储Tid的CPU并行化Eclat算法被引量：2

CPU Parallelization Eclat Algorithm Based on Bit Storage Tid

下载PDF

导出

摘要 Eclat算法采用垂直数据表示方式且无需复杂的数据结构,然而在挖掘频繁项目集过程中,交集计数的生成方式造成内存大量消耗和挖掘效率下降。为此,在分析Eclat算法及其现有改进算法基础上,提出一种位存储事务标识(Tid)的CPU并行化Eclat算法。该算法使用二进制位形式存储项目的 Tid,将挖掘频繁项目集的任务分配到CPU各个线程,最大限度地提高CPU的运算性能。实验结果表明,该算法能在降低内存使用的同时,提高频繁项目集的挖掘效率。 The Eclat algorithm uses vertical data representation and does not require complex data structures.However,the intersection count generation mode causes a large amount of memory consumption and low mining efficiency in the process of mining frequent itemsets.Therefore,based on the analysis of Eclat algorithm and its existing improved algorithm,a CPU parallelization Eclat algorithm for bit storing Transaction identifier(Tid)is proposed.The algorithm uses the binary bit form to store the Tid of the project,and distributes the tasks of mining frequent itemsets to each thread of the CPU,maximizing the computing performance of the CPU.Experimental results show that the algorithm can improve the mining efficiency of frequent itemsets while reducing memory usage.

作者孙宗鑫张桂芸 SUN Zongxin;ZHANG Guiyun(College of Computer and Information Engineering,Tianjin Normal University,Tianjin 300387,China)

机构地区天津师范大学计算机与信息工程学院

出处《计算机工程》 CAS CSCD 北大核心 2018年第12期79-84,共6页 Computer Engineering

基金国家自然科学基金面上项目(61572358) 天津市自然科学基金面上项目(16JCYBJC23600)

关键词频繁项目集挖掘 Eclat算法位存储 CPU并行化存储优化 Frequent Itemset Mining(FIM) Eclat algorithm bit storage CPU parallelization storage optimization

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1熊忠阳,陈培恩,张玉芳.基于散列布尔矩阵的关联规则Eclat改进算法[J].计算机应用研究,2010,27(4):1323-1325. 被引量：18
2冯培恩,刘屿,邱清盈,李立新.提高Eclat算法效率的策略[J].浙江大学学报（工学版）,2013,47(2):223-230. 被引量：13
3张步忠,程玉胜,王则林.基于片上多核的频繁项集并行挖掘算法[J].计算机科学,2014,41(3):55-58. 被引量：3
4严健康,陈更生.基于CPU/GPU异构资源协同调度的改进H-Storm平台[J].计算机工程,2018,44(4):1-11. 被引量：7
5李丽娜,魏晓辉,李翔,王兴旺.流数据处理中负载突发感知的弹性资源分配[J].计算机学报,2018,41(10):2193-2208. 被引量：9

二级参考文献35

1吴恩华,柳有权.基于图形处理器(GPU)的通用计算[J].计算机辅助设计与图形学学报,2004,16(5):601-612. 被引量：227
2Jia-WeiHan,JianPei,Xi-FengYan.From Sequential Pattern Mining to Structured Pattern Mining： A Pattern-Growth Approach[J].Journal of Computer Science & Technology,2004,19(3):257-279. 被引量：18
3杜剑峰,李宏,陈松乔,陈建二.单调和反单调约束条件下关联规则的挖掘算法分析[J].计算机科学,2005,32(6):142-144. 被引量：3
4李敏,李春平.频繁模式挖掘算法分析和比较[J].计算机应用,2005,25(B12):166-171. 被引量：11
5AGRAWAL R, SRIKANT R. Fast Algorithms for min- ing association rules [C]// Proceedings of 20th Interna- tional Conference on Very Large Data Bases. Santiago, Chile: Morgankaufman, 1994:487 - 499.
6HAN J, PEI J, YIN Y. Mining frequent patterns with- out candidate generation [C]/// Proeeedlngs of the 2000 ACM Data. Dallas, United States: ACM, 2000:1-12.
7FENG Pei-en, ZHANG Hui, QIU Qing-ying, et al. PCAR: an efficient approach for mining association rules [C]/// Proceedings of the ICNC-FSKD 2008 Inter- national Conference on Fussy Systems and Knowledge Dis- covery. Jinan: IEEE, 2008:605-609.
8ZAKI M J. Scalable algorithms for association mining[J]. IEEE Transactions on Knowledge and Data Engi- neering, 2000,12(3) : 372- 390.
9ZAKI M J. Fast vertical mining using diffsets [R]. Technical Report 01-1, Troy, New York: Rensselaer Polytechnic Institute. 2001.
10HAN J, KAMBE M. Data mining: concepts and Tech- niques [M]. San Francisco, United States: Morgan Kaufmann Publishers Inc, 2001 : 231.

共引文献42

1傅向华,陈冬剑,王志强.基于倒排索引位运算的深度优先频繁项集挖掘[J].小型微型计算机系统,2012,33(8):1747-1751. 被引量：7
2冯培恩,刘屿,邱清盈,李立新.提高Eclat算法效率的策略[J].浙江大学学报（工学版）,2013,47(2):223-230. 被引量：13
3张岳,王洪国,邵增珍,赵建秀.基于先验位运算的频繁项集挖掘[J].计算机应用研究,2013,30(9):2610-2612. 被引量：4
4张步忠,程玉胜,王则林.基于片上多核的频繁项集并行挖掘算法[J].计算机科学,2014,41(3):55-58. 被引量：3
5易宗剑,彭月英,覃晓,唐涛.一种基于分治策略与位运算的频繁项集挖掘算法[J].广西师范学院学报（自然科学版）,2015,32(1):50-56.
6赵官宝,刘云.一种基于位表的有效频繁项集挖掘算法[J].山东大学学报（理学版）,2015,50(5):23-29. 被引量：4
7丁洁.基于云平台的矩阵式Apriori改进算法[J].信息技术,2015,39(9):162-165. 被引量：2
8李雪迪,郑彦.基于分布式倒排索引的频繁项集挖掘[J].计算机技术与发展,2016,26(3):101-104. 被引量：2
9王红梅,胡明,赵守峰.基于垂直格式的频繁项集挖掘分段算法[J].吉林大学学报（理学版）,2016,54(3):553-560. 被引量：2
10刘木林,朱庆华.基于Hadoop的关联规则挖掘算法研究——以Apriori算法为例[J].计算机技术与发展,2016,26(7):1-5. 被引量：18

同被引文献17

1DENG ZhiHong,WANG ZhongHui,JIANG JiaJian.A new algorithm for fast mining frequent itemsets using N-lists[J].Science China(Information Sciences),2012,55(9):2008-2030. 被引量：25
2陈兴蜀,张帅,童浩,崔晓靖.基于布尔矩阵和MapReduce的FP-Growth算法[J].华南理工大学学报（自然科学版）,2014,42(1):135-141. 被引量：22
3张春,汲磊举.基于MapReduce的Eclat改进算法研究与应用[J].北京交通大学学报,2016,40(3):1-6. 被引量：4
4李宏光,夏丽君.改进的FP-growth算法及其在TE过程故障诊断中的应用[J].北京工业大学学报,2016,42(5):697-706. 被引量：6
5宋杰,孙宗哲,毛克明,鲍玉斌,于戈.MapReduce大数据处理平台与算法研究进展[J].软件学报,2017,28(3):514-543. 被引量：96
6秦军,郝天曙,董倩倩.基于MapReduce的Apriori算法并行化改进[J].计算机技术与发展,2017,27(4):64-68. 被引量：11
7秦明,陈凯,刘银森,沈亚非.工业大数据集成应用综述[J].软件导刊,2017,16(7):210-212. 被引量：3
8程阳,章韵.基于MapReduce-HBase的Apriori算法的改进与研究[J].南京邮电大学学报（自然科学版）,2018,38(5):91-99. 被引量：6
9崔馨月,孙静宇.改进的Eclat算法研究与应用[J].计算机工程与设计,2018,39(4):1059-1063. 被引量：8
10肖文,胡娟,周晓峰.基于MapReduce计算模型的并行关联规则挖掘算法研究综述[J].计算机应用研究,2018,35(1):13-23. 被引量：47

引证文献2

1陈颖聪,李强,黄秋凤,林茂松.面向工业控制的分布式并行聚类关联规则算法研究[J].制造业自动化,2021,43(11):35-40. 被引量：1
2刘卫明,张弛,毛伊敏.采用N-list结构的混合并行频繁项集挖掘算法[J].计算机科学与探索,2022,16(1):120-136. 被引量：6

二级引证文献7

1陈榆,何慧敏,梁志胜,欧旭.基于MapReduce的健康大数据并行挖掘算法研究[J].现代电子技术,2023,46(12):79-83.
2钟松影.基于关联规则Apriori算法的纺织原料成本预警[J].计算机与现代化,2023(7):43-47.
3李嵘,郑庆红,王晓瑜.基于改进大数据频繁项集挖掘算法的中深层地热能供热潜力评估方法[J].微型电脑应用,2023,39(10):23-26. 被引量：1
4张阳,王瑞,吴贯锋,刘弘毅.基于N-list和DiffNodeset结构的频繁项集并行挖掘算法[J].计算机科学,2023,50(11):55-61.
5汪江,温炜.基于时域特征的电力感知数据频繁项查询[J].自动化仪表,2023,44(12):80-84.
6闫利霞,凌兴宏,尼洪涛.基于Apriori算法的混合型数据频繁项集挖掘算法[J].计算机仿真,2023,40(12):538-542. 被引量：2
7孙丽君.电炉企业异构网络共享数据跨级高效项集挖掘系统[J].工业加热,2024,53(3):55-58.

1刘端阳,郑江帆,沈国江,刘志.基于CUDA的k-means算法并行化研究[J].计算机科学,2018,45(11):292-297. 被引量：2
2马费成,赵一鸣.大数据环境对信息组织的影响[J].图书情报通讯,2017,0(2):3-8.
3张熙峰,田景文.基于遗传算法的机械臂逆运动学问题解决方案[J].计算机工程与应用,2017,53(22):150-156. 被引量：6
4吕世鑫,黄洁.基于剪枝优化与索引求交的改进Eclat算法[J].计算机科学与应用,2018,8(8):1195-1206. 被引量：1
5向安平,王荣江,王伟高,陈煜,方志海.尿流动力学指导经尿道前列腺电切治疗前列腺增生伴轻度逼尿肌收缩乏力的疗效分析[J].现代实用医学,2018,30(11):1491-1493. 被引量：3
6刘凯俊,彭攀,王新元.基于COTS器件的高费效比商业卫星计算机研究[J].计算机测量与控制,2018,26(11):213-217. 被引量：6
7赵向兵,张景安.集群环境下企业应用系统的关联规则算法研究[J].山西大同大学学报（自然科学版）,2018,34(6):31-33.
8陈术涛,沈志,王春联,胡奇.多核DSP与FPGA高速数据传输系统设计与实现[J].电子技术应用,2018,44(12):40-43. 被引量：19

计算机工程

2018年第12期

浏览历史

内容加载中请稍等...

基于位存储Tid的CPU并行化Eclat算法被引量：2

参考文献5

二级参考文献35

共引文献42

同被引文献17

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于位存储Tid的CPU并行化Eclat算法 被引量：2

参考文献5

二级参考文献35

共引文献42

同被引文献17

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于位存储Tid的CPU并行化Eclat算法被引量：2