基于Q学习的智能交通信号灯优化被引量：6

Optimization of Intelligent Traffic Light Based on Q-learning

下载PDF

导出

摘要利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经过卷积网络层进行特征提取,以捕捉更精确、完整的交叉口信息。分别基于相位切换策略和马尔科夫决策过程型(Markov decision process,MDP)动作策略,利用SUMO交通仿真软件进行模拟训练。结果表明,与传统的定时定序信号灯控制策略相比,相位切换策略下车辆的平均等待时间减少了约45%,而MDP动作策略下减少了约78%。 The D3QN model developed by Q-learning was used to realize traffic signal control agents.The model used the state set of discrete traffic state encoding to extract the features of the two-dimensional position velocity matrix of vehicles at intersections through convolution network layer,so as to capture more accurate and complete intersection information.Based on phase switching strategy and Markov decision process(MDP)action strategy,the SUMO traffic simulation software was used for simulation training.The experimental results showed that the average vehicle waiting time under the phase switching strategy was reduced by about 45%and the MDP action strategy was reduced by about 78%compared with the traditional timing and sequencing signal control strategy.

作者宋国治苏鹏博刘畅陈玉格 SONG Guozhi;SU Pengbo;LIU Chang;CHEN Yuge(School of Computer Science and Technology,Tiangong University,Tianjin 300387,China)

机构地区天津工业大学计算机科学与技术学院

出处《郑州大学学报（理学版）》 CAS 北大核心 2022年第5期57-63,共7页 Journal of Zhengzhou University:Natural Science Edition

基金国家自然科学基金项目(61972456)。

关键词自适应交通信号控制 Q学习相位切换马尔科夫决策过程 adaptive traffic signal control Q-learning phase switching Markov decision process

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1Li Li,Yisheng Lv,Fei-Yue Wang.Traffic Signal Timing via Deep Reinforcement Learning[J].IEEE/CAA Journal of Automatica Sinica,2016,3(3):247-254. 被引量：71
2赖建辉.基于D3QN的交通信号控制策略[J].计算机科学,2019,46(S11):117-121. 被引量：8

二级参考文献3

1王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：333
2王飞跃.平行控制:数据驱动的计算控制方法[J].自动化学报,2013,39(4):293-302. 被引量：131
3Li Li,Yisheng Lv,Fei-Yue Wang.Traffic Signal Timing via Deep Reinforcement Learning[J].IEEE/CAA Journal of Automatica Sinica,2016,3(3):247-254. 被引量：71

共引文献75

1吕宜生,王飞跃,张宇,张晓东.虚实互动的平行城市:基本框架、方法与应用[J].智能科学与技术学报,2019,1(3):311-317. 被引量：15
2吕宜生,陈圆圆,金峻臣,李镇江,叶佩军,朱凤华.平行交通:虚实互动的智能交通管理与控制[J].智能科学与技术学报,2019,1(1):21-33. 被引量：29
3夏新海.多Agent强化学习下的城市路网自适应交通信号协调配时决策研究综述[J].交通运输研究,2017,3(2):17-23. 被引量：2
4刘昕,王晓,张卫山,汪建基,王飞跃.平行数据:从大数据到数据智能[J].模式识别与人工智能,2017,30(8):673-681. 被引量：40
5莫红,郝学新.时变论域下红绿灯配时的语言动力学分析[J].自动化学报,2017,43(12):2202-2212. 被引量：5
6Gang Bao,Yuanyuan Chen,Siyu Wen,Zhicen Lai.Stability Analysis for Memristive Recurrent Neural Network and Its Application to Associative Memory[J].自动化学报,2017,43(12):2244-2252. 被引量：2
7陈希亮,曹雷,何明,李晨溪,徐志雄.深度逆向强化学习研究综述[J].计算机工程与应用,2018,54(5):24-35. 被引量：19
8殷林飞,余涛.基于深度Q学习的强鲁棒性智能发电控制器设计[J].电力自动化设备,2018,38(5):12-19. 被引量：14
9夏新海.交互协调强化学习下的城市交通信号配时决策[J].计算机工程与应用,2018,54(11):265-270. 被引量：3
10Chen Lv,Dongpu Cao,Yifan Zhao,Daniel J. Auger,Mark Sullman,Huaji Wang,Laura Millen Dutka,Lee Skrypchuk,Alexandros Mouzakitis.Analysis of Autopilot Disengagements Occurring During Autonomous Vehicle Testing[J].IEEE/CAA Journal of Automatica Sinica,2018,5(1):58-68. 被引量：20

同被引文献36

1徐宗亮.智能交通信号灯配时策略研究[J].中文科技期刊数据库（文摘版）工程技术,2023(4):10-12. 被引量：1
2朱旭东.基于车流量的自适应智能交通信号灯控制算法[J].电子世界,2019(4):100-103. 被引量：6
3王兆艳,乔枫,孙昊琛,ALEXANDER T.Fashakin.交通信号控制方法综述[J].现代交通技术,2019,16(3):75-79. 被引量：8
4刘皓,吕宜生.基于深度强化学习的单路口交通信号控制[J].交通工程,2020,20(2):54-59. 被引量：6
5王涛,罗敏娜,王娜,崔黎黎.基于Q学习的有限时间随机线性二次最优控制[J].沈阳师范大学学报（自然科学版）,2020,38(3):207-213. 被引量：1
6白静静,任安虎,李珊.基于SARSA学习的单交叉口配时优化仿真与设计[J].国外电子测量技术,2020,39(6):76-80. 被引量：3
7范久臣,孙雪梅.基于AMESim的起重机回转冲击问题的研究与改进[J].机床与液压,2020,48(20):14-17. 被引量：7
8刘志,曹诗鹏,沈阳,杨曦.基于改进深度强化学习方法的单交叉口信号控制[J].计算机科学,2020,47(12):226-232. 被引量：16
9贾彦峰,曲大义,韩乐潍,林璐,洪家乐.基于线轴结合的过饱和交叉口群信号实时优化方法[J].科学技术与工程,2020,20(36):15114-15120. 被引量：2
10李振龙,张靖思,刘钦,邢冠仰.基于改进Q学习的双周期干线信号协调控制方法[J].科学技术与工程,2021,21(29):12744-12750. 被引量：4

引证文献6

1宋太龙,贺玉龙,刘钦.基于深度强化学习的大型活动关键交叉口信号控制[J].科学技术与工程,2023,23(22):9694-9701. 被引量：1
2臧其亮,李顺,王洋.基于Q学习的汽车起重机回转冲击抑制方法[J].工程技术研究,2023,8(11):87-89.
3丁波,郁舒兰.基于智能导航和交通信号灯优化设计的城市智慧交通系统构建研究[J].软件,2023,44(9):101-103. 被引量：2
4王婷.智能交通信号灯动态控制优势与方法研究[J].运输经理世界,2024(11):62-64.
5苏港,叶宝林,姚青,陈滨,张一嘉.基于改进多智能体Nash Q Learning的交通信号协调控制[J].软件工程,2024,27(10):43-49.
6孙涛.基于边缘计算的交叉口信号自动控制[J].通化师范学院学报,2024,45(10):10-14.

二级引证文献3

1田文,王鑫苗,马源.智慧交通背景下交通流量监测技术的风险评估与管理分析[J].人民公交,2024(8):120-122.
2董伟.智慧交通系统中关于道路交通事故处理方面的应用[J].模具制造,2024,24(9):142-144.
3苏港,叶宝林,姚青,陈滨,张一嘉.基于改进多智能体Nash Q Learning的交通信号协调控制[J].软件工程,2024,27(10):43-49.

1夏新海,许伦辉,杨景山,彭智敏.信号交叉口相位间谈判博弈协调控制[J].公路交通科技,2022,39(4):131-139. 被引量：1
2褚艳红,周明磊,董士帆,王琛琛,王彬.一种基于磁链偏差矢量的多模式调制切换策略[J].中国电机工程学报,2022,42(11):4162-4169. 被引量：3
3陈骁.基于多智能体深度强化学习的大规模交通信号灯控制模型研究[J].工业仪表与自动化装置,2022(4):85-90. 被引量：2
4李康丽,冯波,王华忠.基于高维多属性决策过程的复杂地表初至波识别与走时检测方法[J].石油物探,2022,61(4):599-608. 被引量：1
5Sichen Li,Weihao Hu,Di Cao,Tomislav Dragicevic,Qi Huang,Zhe Chen,Frede Blaabjerg.Electric Vehicle Charging Management Based on Deep Reinforcement Learning[J].Journal of Modern Power Systems and Clean Energy,2022,10(3):719-730. 被引量：6
6陈程,顾庆福.交通仿真在白云国际机场第二航站区的设计应用[J].城市道桥与防洪,2022(7):48-51. 被引量：1
7Munatel Mohammed,Abdelkrim Haqiq.Dynamic resource allocation for service in mobile cloud computing with Markov modulated arrivals[J].International Journal of Modeling, Simulation, and Scientific Computing,2021,12(5):97-117.
8Eman K.Elsayed,Asmaa K.Elsayed,Kamal A.Eldahshan.Deep Reinforcement Learning-Based Job Shop Scheduling of Smart Manufacturing[J].Computers, Materials & Continua,2022(12):5103-5120. 被引量：1
9Jian Dong,Haixin Wang,Junyou Yang,Liu Gao,Kang Wang,Xiran Zhou.Low Carbon Economic Dispatch of Integrated Energy System Considering Power Supply Reliability and Integrated Demand Response[J].Computer Modeling in Engineering & Sciences,2022(7):319-340.

郑州大学学报（理学版）

2022年第5期

浏览历史

内容加载中请稍等...

基于Q学习的智能交通信号灯优化被引量：6

参考文献2

二级参考文献3

共引文献75

同被引文献36

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Q学习的智能交通信号灯优化 被引量：6

参考文献2

二级参考文献3

共引文献75

同被引文献36

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Q学习的智能交通信号灯优化被引量：6