Hadoop集群公平调度算法的改进与实现被引量：6

Hadoop Cluster of Fair Scheduling Lgorithms to Improve and Achieve

下载PDF

导出

摘要 Hadoop作为MapReduce的开源实现被越来越多的企业使用。但是当Hadoop集群中出现较多的小作业时,使用其内置的调度算法就会降低整个系统的吞吐率[1]。该文针对这个不足,提出了基于公平调度的延时调度算法。通过设定一定的延时来保证数据的本地性,实验结果表明改进的调度算法可以提高整个系统的吞吐率。 Hadoop is increasingly using for enterprises as an open source implantation of MapReduce.But when Hadoop clusters occur more small job,using its built-in scheduling will reduce the overall system throughput.In this paper,put forward a delay scheduling algo rithm base on fair scheduling aiming at its defect.By setting a delay to ensure the local nature of the data.Experimental results show that the new scheduling algorithm can improve overall system throughput.

作者李鑫张鹏 LI Xin,ZHANG Peng（Xi’an University of Architecture and Technology,Xi’an 710055,China）

机构地区西安建筑科技大学

出处《电脑知识与技术》 2012年第1期166-168,191,共4页 Computer Knowledge and Technology

基金校基金资助（QN1106）测试环境由西安建筑科技大学艺术学院视觉传达实验室中省共建项目设备曙光服务器提供支持

关键词公平调度延时分配 MAPREDUCE HADOOP fair scheduling delay scheduling MapReduce Hadoop

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1陈全,邓倩妮.异构环境下自适应的Map-Reduce调度[J].计算机工程与科学,2009,31(A01):168-171. 被引量：21
2王凯,吴泉源,杨树强.一种多用户MapReduce集群的作业调度算法的设计与实现[J].计算机与现代化,2010(10):23-28. 被引量：22
3开华东,田琪.基于MapReduce集群的加权公平队列调度算法研究[J].电脑知识与技术,2011,7(3X):2129-2132. 被引量：4
4王峰.Hadoop集群作业的调度算法[J].程序员,2009(12):119-121. 被引量：14
5周锋,李旭伟.一种改进的MapReduce并行编程模型[J].科协论坛（下半月）,2009(2):65-66. 被引量：14
6Dean Jeffrey. MapReduee:simplified data processing on large clusters[C].Communications of the ACM, 2008:107-113 .
7Ranger C,Raghuraman R,Penmetsa A,et al. Evaluating Map Reduce for Multi-core and Muhiproeessor Systems[C].Pro-ceedings of the 13th Symposium on High-Performance Computer Architecture (HPCA). 2007:13-24.
8Apache. Apache hadoop .http://hadoop.apache.org/core/.
9孙广中,肖锋,熊曦.MapReduce模型的调度及容错机制研究[J].微电子学与计算机,2007,24(9):178-180. 被引量：26

二级参考文献41

1Vaquero L M, Rodero-Merino L, Caceres J, et al. A Break in the Clouds: Towards a Cloud DefinitionD]. ACM SIGCOMM Computer Communication Review, 2009, 39 ( 1 ) : 50- 55.
2Bryant R E. Data-Intensive Supercomputing: the Case for DISC[R]. CMU Technical Report CMU-CS-07-128, Department of Computer Science, Carnegie Mellon University, 2007.
3Dean J, Ghemawat S. MapReduce: Simplied Data Processing on Large Clusters[C]//Proc of OSDI '04,2004 : 137-150.
4Colbyranger, Raghuraman R, Penmetsa A. Evaluating MapReduce for Multi-Core and Multiprocessor Systems[C]//Proc of the IEEE 13th Int'l Syrup on High Performance Computer Architecture, 2007 : 13-24.
5Kruijf M D, Sankaralingam K. MapReduce for the Cell B. E. Architecture[-R]. Technical Report CS-TR-2007-1625, University of Wisconsin Computer Sciences University of Wisconsin, 2007.
6He B S, Fang W B, Luo Q, et al. Mars: A MapReduce Framework on Graphics Processors[C]//Proc of the 17th Int'l Conf on Parallel Architectures and Compilation Techniques, 2008 : 260-269.
7Apache Hadoop. Hadoop [EB/OL]. [2009-03-06]. http://hadoop, apache, org/.
8Yahoo. Yahoo! Hadoop Tutorial [EB/OL]. [2009-02-27]. http:// public, yahoo, com/gogate/hadoop-tutorial/start-tutorial, html.
9Ghemawat S, Gogioff H, Leung P T. The Google File System[C]//Proc of the 19th ACM Syrnp on Operating Systems Principles, 2003 : 29-43.
10Zaharia M, Konwinski A, Joseph A D. Improving MapReduce Performance in Heterogeneous Environments [C]//Proc of the 8th Usenix Syrup on Operating Systems Design and Implementation, 2008 : 29-42.

共引文献81

1曾理,王以群.Hadoop集群和单机数据处理的耗时对比实验[J].硅谷,2009,2(19):55-56. 被引量：9
2陈欢欢,刘宴兵.基于自适应调度的网格容错机制研究[J].微电子学与计算机,2010,27(2):145-148. 被引量：1
3多雪松,张晶,高强.基于Hadoop的海量数据管理系统[J].微计算机信息,2010,26(13):202-204. 被引量：27
4胡光民,周亮,柯立新.基于Hadoop的网络日志分析系统研究[J].电脑知识与技术,2010,6(8):6163-6164. 被引量：17
5李成华,张新访,金海,向文.MapReduce:新型的分布式并行计算编程模型[J].计算机工程与科学,2011,33(3):129-135. 被引量：111
6李远方,邓世昆,闻玉彪,韩月阳.Hadoop-MapReduce下的PageRank矩阵分块算法[J].计算机技术与发展,2011,21(8):6-9. 被引量：13
7李远方,贾时银,邓世昆,韩月阳.基于树结构的MapReduce模型[J].计算机技术与发展,2011,21(8):149-152. 被引量：9
8冷芳玲,鲍玉斌,高伟,于戈.基于MapReduce的数据聚集运算算法[J].中国科技论文在线,2011,6(7):469-475. 被引量：6
9顾宇,周良,丁秋林.基于优先级的Three-Queue调度算法研究[J].计算机科学,2011,38(B10):253-256. 被引量：4
10王锴,施水才,王涛,吕学强.基于MapReduce的术语权重计算方法研究[J].电信科学,2011,27(11):62-65. 被引量：1

同被引文献36

1周锋,李旭伟.一种改进的MapReduce并行编程模型[J].科协论坛（下半月）,2009(2):65-66. 被引量：14
2~ O' Hadoop W T. The Definitive Guide [ M ] [ S. 1. ] : Reilly, 2009 : 1 - 60.
3Apache Hadoop [ EB/OL]. [ 2015 - 05 - 15 ]. http ://hadoop. apache, org.
4Deb K, Beyer H G. Self-adaptive genetic algorithms with simulated binary crossover [ J ]. Evolutionary Computation, 2001,9 (2) : 137 -221.
5Dorigo M, Caro G D. Ant colony optimization a new meta-heuristic :proceedings of the 1999 Congress on Evolutionary Compu- tation, Washington D. C., July 6-9,1999 [ C ]. [ S. 1. ] : IEEE, 1999.
6Bonabeau E, Dorigo M, Theraulaz G. Swarm Intelligence : from natural to artificial system [ M ]. Oxford : Oxford University Press, 1999.
7Lammel R. Google' s MapReduce programming model-Revisited [ J ]. Science Computer Program, 2008,70 ( 1 ) :22 - 30.
8Lam C. Hadoop in Action E M]. Stamford:Manning Publications, 2010:86 - 110.
9梁根,郭小雪,秦勇.基于公平调度算法的分布式系统负载均衡研究[J].计算机工程与设计,2008,29(6):1362-1363. 被引量：4
10马肖燕,洪爵.多资源公平调度器在Hadoop中的实现[J].集成技术,2012,1(3):66-71. 被引量：3

引证文献6

1余庆檄.基于Hadoop的企业云存储技术探索[J].计算机光盘软件与应用,2013,16(4):166-167. 被引量：2
2杨浩,滕飞,李天瑞,李曌.Hadoop平台中空闲时间调度器的设计与实现[J].计算机工程与科学,2013,35(10):125-130. 被引量：6
3张连义,杜中军,李震.Hadoop平台公平调度算法研究与优化[J].计算机时代,2014(12):45-47. 被引量：1
4刘瑞祥,汤艳.基于Hadoop一种移动云计算本地化调度算法的研究[J].计算机应用与软件,2015,32(7):67-69. 被引量：1
5潘丹,甘宏.基于异构集群环境下Hadoop作业调度优化的研究[J].科技广场,2015(9):16-19. 被引量：1
6楼涛,杜文才,钟杰卓.基于混合蚁群遗传算法的Hadoop集群作业调度[J].海南大学学报（自然科学版）,2015,33(4):340-346. 被引量：6

二级引证文献17

1胡宇舟,范滨,顾学道,缪力.基于Hadoop的云计算在清分系统中的应用[J].电子世界,2014(13):16-17. 被引量：3
2李向.基于蚁群算法优化Hadoop平台计算效能方法[J].微型电脑应用,2018,34(12):140-143. 被引量：1
3陈智豪,侯为根,杨天明.遗传算法在最小steiner树问题中的应用[J].安庆师范学院学报（自然科学版）,2016,22(2):30-32. 被引量：1
4李曌,滕飞,李天瑞,杨浩.一种Hadoop中基于作业类别和截止时间的调度算法[J].计算机科学,2015,42(6):28-31. 被引量：5
5方小龙.探讨Hadoop的企业云存储技术[J].电脑知识与技术,2016,0(2):79-79. 被引量：1
6王研,张岩.基于Hadoop的云平台的实现与基准测试[J].沈阳师范大学学报（自然科学版）,2016,34(2):240-245. 被引量：6
7赵序光,张树东,严业平.Hadoop平台下自响应故障感知的检测技术研究实现[J].计算机测量与控制,2016,24(11):14-16. 被引量：2
8刘春燕,杨巍巍.云计算基于遗传粒子群算法的多目标任务调度[J].计算机技术与发展,2017,27(2):56-59. 被引量：12
9王丽红,夏魁良,金丹.求解Hadoop作业调度问题的混合遗传算法[J].齐齐哈尔大学学报（自然科学版）,2018,34(3):6-10.
10归雪梅.基于云计算的ERP财务模块实施策略[J].产业创新研究,2018(6):64-65.

1陈玉云,柳先辉,赵晓东.基于Hadoop平台资源调度策略的研究[J].电脑知识与技术,2012,8(7):4687-4690. 被引量：3
2张怡,陈福接.分布式多媒体应用级QoS协商算法[J].软件学报,2000,11(11):1472-1477.
3开华东,田琪.基于MapReduce集群的加权公平队列调度算法研究[J].电脑知识与技术,2011,7(3X):2129-2132. 被引量：4
4廖有清,许学东.路由器多端口公平调度算法与实现[J].微计算机信息,2006(12X):228-230. 被引量：3
5黄辰,戴彬,王芙蓉,张波.无线Mesh网中基于网络编码感知的分组公平调度机制[J].电子学报,2010,38(1):25-31.
6张敏,邱恭安,张士兵.基于优先公平调度的网络链路状态测量方法[J].数字技术与应用,2016,34(12):52-53.
7黎卫红,刘羽,芦奉良.面向多核的时间帧加权公平调度算法[J].桂林理工大学学报,2012,35(1):121-125. 被引量：1
8曹旭,张云华.Hadoop平台下计算模型中调度策略的研究[J].计算机应用与软件,2013,30(9):208-210. 被引量：5
9陈若飞,姜文红.Hadoop作业调度本地性的研究与优化[J].软件,2015,36(2):64-68. 被引量：5
10杨倩茹,黄梦醒,万兵.一种引入内存平衡的Hadoop平台作业调度算法[J].小型微型计算机系统,2014,35(12):2708-2712. 被引量：4

电脑知识与技术

2012年第1期

浏览历史

内容加载中请稍等...

Hadoop集群公平调度算法的改进与实现被引量：6

参考文献9

二级参考文献41

共引文献81

同被引文献36

引证文献6

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

Hadoop集群公平调度算法的改进与实现 被引量：6

参考文献9

二级参考文献41

共引文献81

同被引文献36

引证文献6

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

Hadoop集群公平调度算法的改进与实现被引量：6