基于Q学习的任务调度问题的改进研究被引量：3

Improvement of task scheduling based on Q-learning

下载PDF

导出

摘要论文针对协同工作中的任务调度问题,建立了相应的马尔可夫决策过程模型,在此基础上提出了一种改进的基于模拟退火的Q学习算法。该算法通过引入模拟退火,并结合贪婪策略,以及在状态空间上的筛选判断,显著地提高了收敛速度,缩短了执行时间。最后与其它文献中相关算法的对比分析,验证了本改进算法的高效性。 In this paper,a Markov Decision Process model is built to describe the problem of task scheduling in cooperative work,and a improved Q-learning algorithm based on Metropolis rule is present to solve the problem.In the algorithm,Metropolis rule combined with Greedy Strategy is introduced and a selection in state space is adopted,which accelerate the convergence,and shorten the running time.Finally,the algorithm is compared to some related algorithms of other papers,and the algorithm performance is analyzed as well,which indicates the efficiency of the improved Q-learning algorithm.

作者刘晓平杜琳石慧

机构地区合肥工业大学计算机与信息学院

出处《图学学报》 CSCD 北大核心 2012年第3期11-16,共6页 Journal of Graphics

基金国家自然科学基金资助项目(61070124) 合肥工业大学自主创新资助项目(2012HGZY0017)

关键词任务调度 Q学习强化学习模拟退火 task scheduling Q-learning reinforcement learning simulated annealing

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1冷晟,魏孝斌,王宁生.柔性工艺路线蚁群优化单元作业调度[J].机械科学与技术,2005,24(11):1268-1271. 被引量：5
2Xie Rong,Rus D,Stein C. Scheduling multi-task agents[A].2001.260-276.
3耿汝年,须文波.基于自适应选择遗传算法的任务调度与分配[J].计算机工程,2008,34(3):43-45. 被引量：13
4Deepa R,Srinivasan T,Miriam D D H. An efficient task scheduling technique in heterogeneoussystems using self-adaptive selection-based genetic algorithm[A].2006.343-348.
5Loukopoulos T,Lampsas P,Sigalas P. Improved genetic algorithms and list scheduling techniques for independent task scheduling in distributed systems[A].2007.67-74.
6Wei Yingzi,Zhao Mingyang. Composite rules selection using reinforcement learning for dynamic job-shop scheduling robotics[A].2004.1083-1088.
7Shah K,Kumar M. Distributed independent reinforcement learning (DIPL) approach to resource management in wireless sensor networks[A].2007.1-9.
8陈圣磊,吴慧中,肖亮,朱耀琴.协同设计任务调度的多步Q学习算法[J].计算机辅助设计与图形学学报,2007,19(3):398-402. 被引量：11
9Liu Xiaoping,Shi Hui,Lu Qiang. Visual task-driven based on task precedence graph for collaborative design[A].2007.246-251.
10王雪松,田西兰,程玉虎,易建强.基于协同最小二乘支持向量机的Q学习[J].自动化学报,2009,35(2):214-219. 被引量：20

二级参考文献60

1宋锦河.基于模拟退火算法的生产调度问题[J].长春工程学院学报（自然科学版）,2004,5(1):61-63. 被引量：10
2叶志伟,郑肇葆.蚁群算法中参数α、β、ρ设置的研究——以TSP问题为例[J].武汉大学学报（信息科学版）,2004,29(7):597-601. 被引量：155
3殷国富,罗阳,龙红能,成尔京.并行设计子任务调度的遗传算法原理与实现方法[J].计算机辅助设计与图形学学报,2004,16(8):1122-1126. 被引量：25
4余文芳,姜波.实时图案协同设计中冲突问题的研究[J].计算机辅助设计与图形学学报,2005,17(7):1588-1592. 被引量：4
5蔡良伟,李霞,张基宏.用带蚁群搜索的多种群遗传算法求解作业车间调度问题[J].信息与控制,2005,34(5):553-556. 被引量：11
6肖汉雄,陈次昌,齐冬梅.一种异构计算环境下基于复制的调度算法[J].计算机工程,2006,32(3):108-109. 被引量：4
7苏财茂,柯映林.面向协同设计的任务规划与解耦策略[J].计算机集成制造系统,2006,12(1):21-26. 被引量：25
8陈圣磊,吴慧中,韩祥兰,肖亮.一种多步Q强化学习方法[J].计算机科学,2006,33(3):147-150. 被引量：3
9高阳,胡景凯,王本年,王冬黎.基于CMAC网络强化学习的电梯群控调度[J].电子学报,2007,35(2):362-365. 被引量：13
10陈圣磊,吴慧中,肖亮,朱耀琴.协同设计任务调度的多步Q学习算法[J].计算机辅助设计与图形学学报,2007,19(3):398-402. 被引量：11

共引文献63

1陈学松,杨宜民.基于蚁群优化的模糊Sarsa学习算法[J].华中科技大学学报（自然科学版）,2011,39(S2):340-343.
2解玉凤,魏少军.实时周期任务的非占先式能耗感知调度[J].计算机辅助设计与图形学学报,2006,18(2):245-250. 被引量：5
3苗硕,马光思.基于并行遗传算法的对称多处理器任务调度策略研究[J].微电子学与计算机,2006,23(6):181-184.
4周欢伟,陈新度,陈新.面向大规模定制设计的并行设计方法研究及应用[J].机械设计与制造,2006(8):22-24. 被引量：1
5张瑞军,陈定方,杨琴.用改进的遗传算法解决ALB问题[J].计算机工程与设计,2006,27(20):3731-3733. 被引量：4
6陈圣磊,吴慧中,肖亮,朱耀琴.协同设计任务调度的多步Q学习算法[J].计算机辅助设计与图形学学报,2007,19(3):398-402. 被引量：11
7张金标,林云志,张红云.基于混合遗传算法产品并行开发活动规划的研究[J].轻工机械,2007,25(2):138-141. 被引量：7
8黄穗杰,杨建军.基于可选工艺规划的优化调度研究[J].新技术新工艺,2007(6):21-24. 被引量：1
9张金标.并行设计任务调度的遗传算法研究[J].机械工程师,2008(1):59-62. 被引量：6
10俞烽,廖文和,谢亚楠,郭宇.连续域蚁群算法在扩散工艺路线优选中的应用[J].计算机辅助设计与图形学学报,2008,20(7):952-956. 被引量：3

同被引文献21

1芦蓉,沈毅.一种改进的二维直方图的图像阈值分割方法[J].系统工程与电子技术,2004,26(10):1487-1490. 被引量：18
2谭优,王泽勇.图像阈值分割算法实用技术研究与比较[J].微计算机信息,2007(24):298-299. 被引量：45
3Richard S Sutton, Andrew G Barto. Reinforcement Learn- ing: An Introduction[ M]. MIT Press, 1998.
4Leslie Pack Kaelbling, Michael L Littman,Andrew W Moore. Reinforcement learning: A survey[J]. Journal of Artificial In- telligence Research, 1996,4( 1 ) :237-255.
5左国玉,张红卫,韩光胜.基于多智能体强化学习的新强化函数设计[J].控制工程,2009,16(2):239-242. 被引量：4
6朱颢东,钟勇.一种改进的模拟退火算法[J].计算机技术与发展,2009,19(6):32-35. 被引量：84
7林正春,王知衍,张艳青.最优进化图像阈值分割算法[J].计算机辅助设计与图形学学报,2010,22(7):1201-1206. 被引量：27
8姚明海,瞿心昱,李佳鹤,顾勤龙,汤丽平.基于ART2的Q学习算法研究[J].控制与决策,2011,26(2):227-232. 被引量：3
9张蕊,严壮志,刘玮.图像修复的格子波尔兹曼方法[J].电子测量技术,2011,34(3):46-48. 被引量：6
10杨恢先,王绪四,谢鹏鹤,冷爱莲,彭友.改进阈值与尺度间相关的小波红外图像去噪[J].自动化学报,2011,37(10):1167-1174. 被引量：70

引证文献3

1陈鹏.一种基于Q学习的图像阈值确定方法[J].计算机与现代化,2013(6):113-115. 被引量：1
2孟浩,霍如,郭倩影,黄韬,刘韵洁.基于机器学习的MEC随机任务迁移算法[J].北京邮电大学学报,2019,42(2):25-30. 被引量：9
3张家波,吕洁娜,甘臣权,张祖凡.一种基于强化学习的车联网边缘计算卸载策略[J].重庆邮电大学学报（自然科学版）,2022,34(3):525-534. 被引量：5

二级引证文献15

1薛宁,霍如,曾诗钦,汪硕,黄韬.基于DRL的MEC任务卸载与资源调度算法[J].北京邮电大学学报,2019,42(6):64-69. 被引量：6
2吕洁娜,张家波,张祖凡,甘臣权.移动边缘计算卸载策略综述[J].小型微型计算机系统,2020,41(9):1866-1877. 被引量：23
3王文礼,贾芝婷.边缘计算与云协同问题研究[J].河北省科学院学报,2020,37(4):9-14. 被引量：5
4杨天,杨军.移动边缘计算中的卸载决策与资源分配策略[J].计算机工程,2021,47(2):19-25. 被引量：12
5胡忠波,贾芝婷,王素贞.边缘计算关键技术分析及应用平台比较研究[J].河北省科学院学报,2021,38(5):41-49. 被引量：5
6张彦虎,鄢丽娟,马志愤,张彦军.一种适用于多任务多资源移动边缘计算环境下的改进粒子群算力卸载算法[J].计算机与现代化,2022(5):54-60. 被引量：3
7韩晓非,宋青芸,韩瑞寅,陈万琼.移动边缘计算卸载技术综述[J].电讯技术,2022,62(9):1368-1376. 被引量：7
8朱思峰,赵明阳,柴争义.边缘计算场景中基于粒子群优化算法的计算卸载[J].吉林大学学报（工学版）,2022,52(11):2698-2705. 被引量：6
9康宇,刘雅琼,赵彤雨,寿国础.AI算法在车联网通信与计算中的应用综述[J].电信科学,2023,39(1):1-19. 被引量：3
10杨子轩,张文柱,程鹏,谢书翰.基于混合果蝇算法的计算卸载方法[J].小型微型计算机系统,2023,44(6):1290-1296. 被引量：1

1尤树华,周谊成,王辉.基于神经网络的强化学习研究概述[J].电脑知识与技术,2012,8(10):6782-6786. 被引量：4
2耿少峰,王永恒,李仁发,张佳.主动式复杂事件处理方法的研究[J].通信学报,2016,37(9):111-120. 被引量：1
3张红霞,邹华,林荣恒,杨放春.基于马尔科夫决策过程的可适变业务流程建模及分析[J].电子与信息学报,2013,35(7):1760-1765. 被引量：3
4赵晨,王潇,张思宇,宋媛媛,曲芳.基于设备状态的维护策略研究[J].山东工业技术,2016(23):211-211.
5李瑛,毕义明.作战仿真中指挥Agent的实现[J].火力与指挥控制,2010,35(4):164-166. 被引量：5
6刘云,萧蕴诗,严隽薇.办公自动化环境下的GDSS模式研究[J].决策与决策支持系统,1996(1):34-41. 被引量：1
7李策.陆军合同作战指挥决策过程建模[J].计算机仿真,2007,24(7):1-4. 被引量：4
8朱仲英,翁小雄,杨剑波.智能决策支持系统结构设计方法探讨[J].微型电脑应用,1989(4):66-72.
9夏春蕊,王瑞,李晓娟,关永,张杰,魏洪兴.动态环境下基于概率模型检测的路径规划方法[J].计算机工程与应用,2016,52(12):5-11. 被引量：6
10戴伟辉,叶佳佳,李悝.基于MAS的高层管理团队决策过程分析[J].科学学研究,2006,24(4):575-580. 被引量：10

图学学报

2012年第3期

浏览历史

内容加载中请稍等...

基于Q学习的任务调度问题的改进研究被引量：3

参考文献14

二级参考文献60

共引文献63

同被引文献21

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于Q学习的任务调度问题的改进研究 被引量：3

参考文献14

二级参考文献60

共引文献63

同被引文献21

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于Q学习的任务调度问题的改进研究被引量：3