MapReduce框架下改进Apriori算法的研究被引量：2

Research of Improved Apriori Algorithm under MapReduce Framework

下载PDF

导出

摘要 MapReduce是一种编程模型,这种模型编程简单,可以用于大规模数据集的并行计算。Apriori算法是一种发现频繁项集的基本算法,通过该算法,可以产生关联规则。针对Apriori的特点,研究了在MapReduce编程模型下,Apriori的实现方法。实验结果表明:该方法在对大数据集进行频繁项集挖掘时,可充分利用云计算的优势,从而能获得更好的时效性。 MapReduce is a programming model,which is simple,can be used for parallel computing of large-scale data sets. Apriori algorithm is a basic algorithm to discover frequent item sets,and association rules are generated from it. In view of the characteristics of Apriori,this paper analyzes the realization method of Apriori under MapReduce programming model. Experimental results show that the proposed method can make full use of the advantages of cloud computing in the frequent item sets mining on large data sets,having better effectiveness.

作者杨健兵

机构地区南通科技职业学院信息与智能工程学院

出处《长春大学学报》 2016年第12期40-43,114,共5页 Journal of Changchun University

关键词 APRIORI 数据挖掘关联规则 MAPREDUCE Apriori data mining association rule MapReduce

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1刘骞,陈明.基于改进的Map/Reduce及模式空间划分的数据挖掘[J].微电子学与计算机,2011,28(8):140-142. 被引量：4
2李建江,崔健,王聃,严林,黄义双.MapReduce并行编程模型研究综述[J].电子学报,2011,39(11):2635-2642. 被引量：187

二级参考文献48

1宁焕生,张瑜,刘芳丽,刘文明,渠慎丰.中国物联网信息服务系统研究[J].电子学报,2006,34(B12):2514-2517. 被引量：151
2Ng Andrew Y, Bradski Gary, Chu ChengTao. MapRe- duce for machine learning on multicore [R], NIPS, 2006.
3Dan Gillick, Arlo Faria, John DeNero. Map/Reduce: distributed computing for machine learning[R]. 2006.
4Dean Jeffrey, Ghemawat Sanjay. Map/Reduce.. simpli- fied data processing on large clustersEJ]. Communictions of the ACM, 2008, 51(1):107-113.
5J Dean,S Ghemawat.MapReduce:Simplified data processing on large clusters[J].Communications of the ACM,2008,51(1):107-113.
6J L Wagener.High performance fortran[J].Computer Standards & Interfaces,Elsevier,1996,18(4):371-377.
7W Gropp,E Lusk,et al.Using MPI:Portable Parallel Programming with the Message Passing Interface[M].Cambridge:MIT Press,1999.1-350.
8A Geist,A Beguelin,et al.PVM:Parallel Virtual Machine:A Users' Guide and Tutorial for Networked Parallel Computing[M].Cambridge:MIT Press,1995.1-299.
9A Verma,N Zea,et al.Breaking the mapreduce stage barrier .Proc of IEEE International Conference on Cluster Computing .Los Alamitos:IEEE Computer Society,2010.235-244.
10H C Yang,A Dasdan,et al.Map-Reduce-Merge:Simplified relational data processing .Proc of ACM SIGMOD International Conference on Management of Data .New York:ACM,2007.1029-1040.

共引文献187

1桂智明,向宇,李玉鉴.基于出租车轨迹的并行城市热点区域发现[J].华中科技大学学报（自然科学版）,2012,40(S1):187-190. 被引量：22
2亢丽芸,王效岳,白如江.MapReduce原理及其主要实现平台分析[J].现代图书情报技术,2012(2):60-67. 被引量：17
3应毅,顾问,叶传标.基于开源项目的高校私有云平台[J].现代教育技术,2012,22(12):99-102. 被引量：2
4李建敦,彭俊杰,张武.云存储中一种基于布局的虚拟磁盘节能调度方法[J].电子学报,2012,40(11):2247-2254. 被引量：10
5许丞,刘洪,谭良.Hadoop云平台的一种新的任务调度和监控机制[J].计算机科学,2013,40(1):112-117. 被引量：52
6应毅,任凯,刘正涛.基于云计算技术的数据挖掘[J].微电子学与计算机,2013,30(2):161-164. 被引量：20
7应毅,任凯,曹阳.基于改进的MapReduce模型的Web挖掘[J].科学技术与工程,2013,21(5):1205-1209. 被引量：10
8肖淇,秦云川,阳王东,李肯立.一种基于MapReduce的防火墙策略冲突并行化检测及消解模型[J].计算机科学,2013,40(3):50-54. 被引量：6
9赵青松,陈林,孙波,朱艳,姜海燕.基于Hadoop的云环境下作物生长模型算法的实现与测试[J].农业工程学报,2013,29(8):179-186. 被引量：11
10吴建军.网络舆情的云计算监测模式分析与实现[J].电讯技术,2013,53(4):476-481. 被引量：4

同被引文献25

1胡绿慧,任玉兰,何振林.基于划分和压缩数据库的改进Apriori算法[J].成都理工大学学报（自然科学版）,2015,42(1):110-114. 被引量：11
2刘经天,蒋文娟.基于改进关联规则算法的RN决策过程仿真[J].计算机仿真,2015,32(7):125-128. 被引量：1
3朱习军,陈亚楠,董国华.Apriori改进算法在哮喘病案数据挖掘中的应用[J].徐州工程学院学报（自然科学版）,2015,30(3):8-14. 被引量：6
4朱付保,白庆春,汤萌萌,朱颢东.基于改进Apriori算法的铁路轨道质量分析与评价[J].微电子学与计算机,2015,32(10):159-162. 被引量：5
5陈淡泊,仓一倩.基于Hadoop的改进apriori算法应用[J].微型电脑应用,2015,31(10):69-72. 被引量：2
6曾志勇,闫亚丽.面向XBRL的DC-Apriori挖掘算法研究[J].现代计算机（中旬刊）,2015(9):27-30. 被引量：1
7顾卫杰,王晓峰.基于改进Apriori算法的煤矿物联网规则系统研究[J].煤矿机械,2016,37(1):227-229. 被引量：7
8崔妍,包志强.关联规则挖掘综述[J].计算机应用研究,2016,33(2):330-334. 被引量：153
9曹莹,苗志刚.基于向量矩阵优化频繁项的改进Apriori算法[J].吉林大学学报（理学版）,2016,54(2):349-353. 被引量：19
10王玲,李树林,吴璐璐.基于定量关联规则树的分类及回归预测算法[J].工程科学学报,2016,38(6):886-892. 被引量：8

引证文献2

1齐娇娇.基于改进Apriori算法的运动员多属性训练数据挖掘模型构建及仿真[J].微型电脑应用,2018,34(12):137-139. 被引量：5
2杨磊.云计算环境下数据挖掘服务模式研究[J].内蒙古民族大学学报（自然科学版）,2018,33(5):383-389. 被引量：2

二级引证文献7

1景冰.大数据挖掘与云服务模式的构建[J].江西电力职业技术学院学报,2020,0(1):19-20. 被引量：1
2AnneHudsonJones.医学与文学的传统及创新[J].医学与哲学,2000,21(5):59-61. 被引量：12
3郑瑛.云计算数据中心节能调度算法改进研究[J].西南大学学报（自然科学版）,2019,41(12):135-142. 被引量：5
4王华满.基于数据挖掘技术的体育训练模式决策支持系统设计及应用[J].电子设计工程,2021,29(5):114-117. 被引量：3
5陈翠娟.基于关联分析的计算机软件数据挖掘技术[J].安阳师范学院学报,2021(2):28-31. 被引量：6
6董亮,阚新生,邓国如,徐杰,袁慧.短期电力负荷预测的时间序列数据深度挖掘模型设计[J].能源与环保,2021,43(6):207-212. 被引量：6
7王诗圆,申莹,赵永翼.基于Apriori算法关联规则推荐教学视频应用研究[J].数字通信世界,2019(3):181-181. 被引量：1

1杨杰明,吴启龙,曲朝阳,杨烁,阚中峰,高冶.MapReduce框架下基于抽样的分布式K-Means聚类算法[J].吉林大学学报（理学版）,2017,55(1):109-115. 被引量：6
2陈凤娟.基于MapReduce的关联规则挖掘[J].电脑与电信,2014(8):59-60.
3江雨燕,李平.基于PFP-Growth算法的海量频繁项集挖掘[J].计算机技术与发展,2013,23(9):63-65. 被引量：2
4李玲娟,张敏.云计算环境下关联规则挖掘算法的研究[J].计算机技术与发展,2011,21(2):43-46. 被引量：48
5廖勇.基于差分隐私的频繁项集挖掘研究综述[J].电子技术与软件工程,2016(3):197-198.
6何婧媛.MapReduce编程模型的研究与改进[J].民营科技,2016(8):79-79.
7孙莉.数据库和数据流频繁项集挖掘算法研究[J].现代机械,2007(5):54-57.
8陆丽婷.基于Hadoop的数字化校园设计与实现[J].软件导刊,2014,13(10):15-17. 被引量：1
9黄守明,张红莉.基于云计算模式下的Apriori算法研究[J].铜陵学院学报,2013,12(3):106-108. 被引量：1
10王博文.Hadoop环境下协同过滤算法的实现[J].科学中国人,2015(9Z):41-42.

长春大学学报

2016年第12期

浏览历史

内容加载中请稍等...

MapReduce框架下改进Apriori算法的研究被引量：2

参考文献2

二级参考文献48

共引文献187

同被引文献25

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

MapReduce框架下改进Apriori算法的研究 被引量：2

参考文献2

二级参考文献48

共引文献187

同被引文献25

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

MapReduce框架下改进Apriori算法的研究被引量：2