多头绒泡菌预处理的改进Q学习算法求解最短路径问题被引量：4

Physarum polycephalum algorithm based improved Q-learning for shortest path solution

导出

摘要针对最短路径问题中Q学习算法的初始搜索空间大、后期收敛不稳定的缺陷,提出多头绒泡菌预处理的改进Q学习算法(PPA-Q)。该算法引入网络预处理过程和自适应概率选择模型,利用多头绒泡菌进行网络预处理,减少算法前期的无用探索空间,再通过改进的模拟退火算法实现自适应概率选择模型,加强算法对优质路径的探索程度,增加算法初期解的多样性,同时在算法后期稳定逼近最优路径且不振荡。仿真结果表明,PPA-Q算法收敛到最优路径成功率为100%,高于经典蚁群(ACO)算法和Q(λ)算法的80%,其迭代次数分别低于Q学习算法57.2%、ACO算法32.9%和Q(λ)算法35.1%. To solve Q-learning algorithm’s drawbacks of large range of initial searching space and low convergence rate in latter stage in shortest path problem,a physarum polycephalum plgorithm based improved Q-learning( PPA-Q) is proposed. The improved algorithm puts forward pretreatments of network and adaptive choice model,and the effects of pretreatments of network reduce useless searching space in early stage by features of physarum polycehalum,the adaptive choice model enhances possibility of choosing high-quality path,increases diversity of solutions and converges to optimal result stably in latter stage through improved simulated annealing algorithm.Simulation results show that the success rate of the PPA-Q algorithm converges to the optimal path is 100%,which is higher than 80%of the ACO algorithm and Q( λ) algorithm,and the number of iterations is lower than 57. 2% of Q-learning,32. 9% of ACO algorithm and 35. 1% of Q( λ) algorithm.

作者马学森朱建谈杰唐昊周江涛 Ma Xuesen;Zhu Jian;Tan Jie;Tang Hao;Zhou Jiangtao(School of Computer and Information, Hefei University of Technology, Hefei 230009, China;Research Institute of Sanshui & Hefei University of Technology in Guangdong, Foshan 528000, China;School of Electrical and Automation Engineering, Hefei University of Technology, Hefei 230009, China;School of Mathematics, Hefei University of Technology, Hefei 230009, China)

机构地区合肥工业大学计算机与信息学院广东三水合肥工业大学研究院合肥工业大学电气与自动化工程学院合肥工业大学数学学院

出处《电子测量与仪器学报》 CSCD 北大核心 2019年第5期148-157,共10页 Journal of Electronic Measurement and Instrumentation

基金国家自然科学基金(61573126) 广东省科技发展专项基金(2017A010101001) 中央高校基本科研业务费专项基金(JZ2016HGBZ1032) 国家留学基金安徽省教育厅高等学校省级质量工程项目(2017JYXM0055) 合肥工业大学课程规划设计研究项目(119-033112)资助

关键词最短路径问题 Q学习多头绒泡菌模拟退火算法网络预处理自适应概率选择模型 shortest path problem Q-learning algorithm physarum polycephalum simulated annealing algorithm pretreatments ofnetwork adaptive choice model

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TN01 [电子电信—物理电子学]

引文网络
相关文献

参考文献11

1曹二保,赖明勇,聂凯.带时间窗的车辆路径问题的改进差分进化算法研究[J].系统仿真学报,2009,21(8):2420-2423. 被引量：8
2屈鸿,黄利伟,柯星.动态环境下基于改进蚁群算法的机器人路径规划研究[J].电子科技大学学报,2015,44(2):260-265. 被引量：74
3刘焕淋,李瑞艳,孔德谦,陈勇.基于多目标遗传算法优化弹性光网络的多路径保护机制[J].电子与信息学报,2016,38(9):2261-2267. 被引量：14
4马宪民,刘妮.自适应视野的人工鱼群算法求解最短路径问题[J].通信学报,2014,35(1):1-6. 被引量：44
5李荥,王芳,景栋盛,朱斐.一种基于Q学习的无线传感网络路由方法[J].计算技术与自动化,2017,36(2):155-160. 被引量：5
6张辰,喻剑,何良华.基于Q学习和动态权重的改进的区域交通信号控制方法[J].计算机科学,2016,43(8):171-176. 被引量：2
7王曌,胡立生.基于深度Q学习的工业机械臂路径规划方法[J].化工自动化及仪表,2018,45(2):141-145. 被引量：6
8于乃功,王琛,默凡凡,蔡建羡.基于Q学习算法和遗传算法的动态环境路径规划[J].北京工业大学学报,2017,43(7):1009-1016. 被引量：17
9刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：475
10刘玉欣,张自力,高超,钱涛,吴雨横.基于多头绒泡菌网络模型的蚁群算法优化[J].西南大学学报（自然科学版）,2014,36(9):182-187. 被引量：2

二级参考文献98

1邹彤,李宁,孙德宝.不确定车辆数的有时间窗车辆路径问题的遗传算法[J].系统工程理论与实践,2004,24(6):134-138. 被引量：41
2魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
3宋伟刚,张宏霞,佟玲.有时间窗约束非满载车辆调度问题的遗传算法[J].系统仿真学报,2005,17(11):2593-2597. 被引量：33
4李军.有时间窗的车辆路线安排问题的启发式算法[J].系统工程,1996,14(5):45-50. 被引量：56
5王雪梅,王义和.模拟退火算法与遗传算法的结合[J].计算机学报,1997,20(4):381-384. 被引量：123
6Dantzing G, Ramser J. The truck dispatching problem [J]. Management Science (S1526-5501), 1959, 10(6): 80-91.
7Savelsbergh M. Local search for routing problem with time windows [J]. Annals of Operations Research (S0254-5330), 1985, 16(4): 285-305.
8Store R. Differential evolution design of an ⅡR-filter [C]// Proceedings IEEE Conference Evolutionary Computation (S07803- 29023), Nagoya, Japan, 1996. USA: IEEE, 1996: 268-273.
9DE Home page [EB/OL]. (2007) [2007]. http://www.icsi.berkeley.edu/-storn/code.html.
10Potvin J Y, Bengio S. The vehicle routing problem with time windows-Part Ⅱ: Genetic search [J]. Informs Journal on Computing (S1091-9856), 1996, 8(2): 165-172.

共引文献680

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020(4):361-371. 被引量：3
2刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：46
3韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
4张磊,母亚双,潘泉.基于改进深度双Q网络的移动机器人路径规划算法[J].信息与控制,2024,53(3):365-376. 被引量：1
5李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：45
6周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：7
7李逊,李俊超,邓林忠,康旭云,欧启捷,劳恒辉.人工智能优化技术在钢筋混凝土结构的应用[J].建筑结构,2023,53(S02):1425-1430. 被引量：1
8王雪鉴,文永明,石晓荣,张宁宁,刘洁玺.多智能体多耦合任务混合式智能决策架构设计[J].航空学报,2023,44(S02):418-425.
9刘洋,李建军.深度确定性策略梯度算法优化[J].辽宁工程技术大学学报（自然科学版）,2020(6):545-549. 被引量：2
10蒋方庆,陈自力,高喜俊,王春峰,贺道坤.基于改进TD3算法的无人机决策研究[J].信息化研究,2023,49(3):36-42.

同被引文献27

1艾延廷,田博文,田晶,孙志航,王志.Morlet复小波频带优化及其在中介轴承故障诊断中的应用[J].航空动力学报,2020,35(1):153-161. 被引量：5
2陈海焱,陈金富,段献忠.含风电机组的配网无功优化[J].中国电机工程学报,2008,28(7):40-45. 被引量：112
3董雷,程卫东,杨以涵.含风电场的电力系统概率潮流计算[J].电网技术,2009,33(16):87-91. 被引量：84
4王昆,杨永钦,龙云亮,郭建炎.多刃峰环境无线电波传播预测的双向抛物方程法[J].电波科学学报,2011,26(6):1058-1064. 被引量：14
5王贵斌,赵俊华,文福拴,薛禹胜,辛建波.配电系统中电动汽车与可再生能源的随机协同调度[J].电力系统自动化,2012,36(19):22-29. 被引量：74
6孙立悦,赵晓晖,虢明.基于中断概率的协作通信中继选择与功率分配算法[J].通信学报,2013,34(10):84-91. 被引量：30
7徐俊俊,黄永红,王琪,陈晖,孙欣.基于自然选择粒子群算法的含DG接入的配电网无功优化[J].电测与仪表,2014,51(10):33-38. 被引量：40
8吴泓俭,雷霞,刘斌,芦杨,徐贵阳.基于遗传膜算法的含风电机组和电动汽车的配电网分时段动态重构[J].电工技术学报,2016,31(2):196-205. 被引量：29
9张战彬,段珺,石磊磊,韩胜峰,张俊,陈岩,刘延华.改善低压农网电压质量的分布式光伏电源优化配置方法[J].电力系统保护与控制,2016,44(22):129-135. 被引量：18
10Ru Wang,Jia Liu,Guopeng Zhang,Shuanghong Huang,Ming Yuan.Energy Efficient Power Allocation for Relay-Aided D2D Communications in 5G Networks[J].China Communications,2017,14(6):54-64. 被引量：13

引证文献4

1彭艺,张申,朱豪,李启骞.联合机器学习的D2D通信多中继选择机制[J].电子测量与仪器学报,2020,32(3):149-154. 被引量：8
2王登峰,胡浩,吴建德.基于SAE与深度Q网络的旋转机械故障诊断[J].组合机床与自动化加工技术,2021(4):40-44. 被引量：6
3杨劭炜.含新能源和电动汽车并网的配电网无功优化研究[J].电气自动化,2021,43(5):4-6. 被引量：4
4彭艺,付晓霞,刘煜恒,安浩杰.高原山区D2D网络能量效率优化算法研究[J].电子测量与仪器学报,2021,35(9):150-156. 被引量：4

二级引证文献22

1邱斌,王炜.基于无线携能的协作NOMA系统安全性能研究[J].电子测量技术,2022,45(10):26-32.
2王海东,谭国平,周思源.基于时延约束的D2D异构网络资源动态分配[J].电子测量技术,2020,43(17):130-136. 被引量：3
3张冉,常猛.一种基于信干比的最佳转发节点的选举算法[J].国外电子测量技术,2021,40(7):90-94. 被引量：3
4彭艺,付晓霞,刘煜恒,安浩杰.高原山区D2D网络能量效率优化算法研究[J].电子测量与仪器学报,2021,35(9):150-156. 被引量：4
5余阿东.基于深度字典学习的滚动轴承故障识别[J].机电工程,2022,39(2):231-237. 被引量：7
6李彬,郝一浩,祁兵,孙毅,陈宋宋.支撑虚拟电厂互动的信息通信关键技术研究展望[J].电网技术,2022,46(5):1761-1770. 被引量：24
7栾桂芬.基于人工智能技术的网络多节点通信系统设计[J].自动化技术与应用,2022,41(5):71-74. 被引量：4
8刘新鑫,牛元锋.粒子群优化算法对配电网无功的优化分析[J].通信电源技术,2022,39(2):21-23.
9杨柳,孙焱燚,王亿,张痛快.多RIS场景下节省发射功率的选择方案[J].电子测量技术,2022,45(8):161-167. 被引量：1
10周俊.基于量子遗传算法的特高压新能源电网动态无功优化[J].东北电力技术,2022,43(9):10-14. 被引量：3

1江厚民,李少波,王巾侠,边霄翔.ALPS-GA求解柔性作业车间调度问题[J].计算机仿真,2019,36(5):390-394. 被引量：5
2顾清华,孟倩倩,卢才武,马龙.露天矿多目标配矿模型与优化算法研究[J].矿业研究与开发,2019,39(2):16-21. 被引量：7
3程浩.创新是企业进化的最优路径[J].时代人物,2019,0(6):156-157.
4孙鹏,孙若莹,刘滨翔.基于Double-DQN的平衡类游戏改善[J].电子设计工程,2019,27(14):112-116. 被引量：1
5胡浍冕,于修成.基于双向搜索策略的改进蚁群路径规划算法[J].农业装备与车辆工程,2019,57(7):9-12. 被引量：8
6孙娴.关于旅行商问题的数学模型[J].科学技术创新,2019(17):19-20. 被引量：1
7孙伟.浅谈初中语文口语训练中古诗词朗诵所带来的影响[J].课外语文,2019,0(19):28-28.
8魏天,周维俊,王科,马田田.基于傅里叶定律的微分方程对高温防护服的优化研究[J].喀什大学学报,2019,40(3):28-31. 被引量：4
9唐昊,杨羊,戴飞,谭琦.基于RBF-Q学习的多品种CSPS系统前视距离控制[J].控制与决策,2019,34(7):1456-1462. 被引量：1
10黄婷婷,朱海燕,杨聚芬.基于前景理论的轨道交通乘客路径选择模型[J].都市快轨交通,2019,32(2):59-63. 被引量：9

电子测量与仪器学报

2019年第5期

浏览历史

内容加载中请稍等...

多头绒泡菌预处理的改进Q学习算法求解最短路径问题被引量：4

参考文献11

二级参考文献98

共引文献680

同被引文献27

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

多头绒泡菌预处理的改进Q学习算法求解最短路径问题 被引量：4

参考文献11

二级参考文献98

共引文献680

同被引文献27

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

多头绒泡菌预处理的改进Q学习算法求解最短路径问题被引量：4