智能网联交通环境下基于Q学习的路径规划被引量：1

Trajectory Planning in Intelligent Connected Transportation Based on Q-learning

下载PDF

导出

摘要强化学习是人工智能领域常见的一种学习范式,强化学习通过不断地与环境进行交互来使得整体行动收益达到最大化。智能网联交通是未来智能交通的发展趋势,通过智能的路侧设施,可为智能网联汽车提供独特的鸟瞰视角输入。为研究强化学习在智能网联交通环境下对路径规划的作用,将智能网联交通环境提供的鸟瞰视角作为输入,使用Canny方法将俯视交通环境中的道路形状进行特征提取,简化成网格显示,从而把复杂的路径规划问题转换成简单的基于表格的求解问题。使用Q学习这种经典的off-policy强化学习方法,对智能网联汽车进行多交叉口路径规划。研究发现,Q学习在多至9个宫格的情况下,仍具有快速的收敛性和可靠的成功率。 Reinforcement learning is a common learning learning paradigm in artificial intelligence.Reinforcement learning is being used by an agent to maximize the gain via trial-and-error interactions with the environment.Meanwhile,intelligent connected transportation is the future trend of intelligent transportation systems,it can provide a unique bird's-eye view input for intelligent connected vehicle via smart infrastructure.In order to explore the feasibility of reinforcement learning based trajectory planning in intelligent connected environment,takes the benefit of a bird's-eye view traffic environment enabled by intelligent connected transportation.The Canny algorithm was used to extract the road edge feature from bird's-eye view and to transfer the view to a simplified grid world.The complex trajectory planning problem is then transferred to a simplified table-based problem.Furthermore,the Q-learning method,which is one type of classical off-policy reinforcement learning algorithm,is applied in the network trajectory planning.The findings showed that the proposed method can achieve fast convergence and high success likelihood in the scenario whose network can reach up to 9 blocks.

作者黄罗毅马万经王玲 HUANG Luoyi;MA Wanjing;WANG Ling(Key Laboratory of Road and Traffc Engineering of the Ministry of Education,Tongji University,Shanghai 201804,China;Bosch Automotive Products(Suzhou)Co.,Ltd,Suzhou 215025,China)

机构地区同济大学道路与交通工程教育部重点实验室博世汽车部件(苏州)有限公司

出处《交通与运输》 2022年第4期63-67,共5页 Traffic & Transportation

基金上海市科技创新行动计划项目(19DZ1209004) 上海市青年科技英才扬帆计划(19YF1451300)。

关键词智能网联交通路径规划强化学习鸟瞰视角 Q学习 Intelligent connected transportation Trajectory planning Reinforcement learning Bird's-eye view Q-learning

分类号 U491 [交通运输工程—交通运输规划与管理]

引文网络
相关文献

参考文献2

1张荣霞,武长旭,孙同超,赵增顺.深度强化学习及在路径规划中的研究进展[J].计算机工程与应用,2021,57(19):44-56. 被引量：27
2王鼎新.基于改进Q-learning算法的AGV路径规划[J].电子设计工程,2021,29(4):7-10. 被引量：14

二级参考文献31

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：46
2杨娜,李汉舟.服务机器人导航技术研究进展[J].机电工程,2015,32(12):1641-1648. 被引量：18
3许川佩,吕莹,黄喜军,莫玮.基于粒子群算法的数字微流控芯片在线测试路径优化[J].电子测量与仪器学报,2017,31(8):1192-1199. 被引量：9
4董培方,张志安,梅新虎,朱朔.引入势场及陷阱搜索的强化学习路径规划算法[J].计算机工程与应用,2018,54(16):129-134. 被引量：16
5曾纪钧,梁哲恒.监督式强化学习在路径规划中的应用研究[J].计算机应用与软件,2018,35(10):185-188. 被引量：7
6刘志荣,姜树海.基于强化学习的移动机器人路径规划研究综述[J].制造业自动化,2019,41(3):90-92. 被引量：16
7刘建伟,高峰,罗雄麟.基于值函数和策略梯度的深度强化学习综述[J].计算机学报,2019,42(6):1406-1438. 被引量：132
8董瑶,葛莹莹,郭鸿湧,董永峰,杨琛.基于深度强化学习的移动机器人路径规划[J].计算机工程与应用,2019,55(13):15-19. 被引量：28
9毛晨悦,吴鹏勇.基于人工势场法的无人机路径规划避障算法[J].电子科技,2019,32(7):65-70. 被引量：29
10刘全,闫岩,朱斐,吴文,张琳琳.一种带探索噪音的深度循环Q网络[J].计算机学报,2019,42(7):1588-1604. 被引量：11

共引文献39

1邓修朋,崔建明,李敏,张小军,宋戈.深度强化学习在机器人路径规划中的应用[J].电子测量技术,2023,46(6):1-8. 被引量：4
2许伦辉,林世城.基于分治思想的扫地机器人全覆盖路径规划算法研究[J].广西师范大学学报（自然科学版）,2021,39(6):54-62. 被引量：6
3段洁利,王昭锐,叶磊,杨洲.水果采摘机械臂运动规划研究进展与发展趋势[J].智能化农业装备学报（中英文）,2021,2(2):7-17. 被引量：7
4于会群,王意乐,黄贻海.多AGV的路径规划与任务调度研究[J].上海电力大学学报,2022,38(1):89-93. 被引量：10
5田茹,曹茂永,马凤英,纪鹏.基于改进A*算法的农用无人机路径规划[J].现代电子技术,2022,45(4):182-186. 被引量：4
6贺雪梅,匡胤,杨志鹏,杨亚乔.基于深度强化学习的AGV智能导航系统设计[J].计算机应用研究,2022,39(5):1501-1504. 被引量：8
7赵国庆,徐君明,刘爱东.降低方差的深度确定性策略梯度算法[J].兵工自动化,2022,41(6):41-46. 被引量：2
8秦昌礼,张华强,刘林,陈雨,苏庆华.一种基于改进PSO-PIO算法的AGV路径规划方法[J].哈尔滨理工大学学报,2022,27(3):82-89. 被引量：10
9郁洲,毕敬,苑海涛.基于改进DQN算法的复杂海战场路径规划方法[J].智能科学与技术学报,2022,4(3):418-425. 被引量：3
10柯杰龙,张羽,朱朋辉,黄炽坤,吴可廷.基于改进Q⁃learning算法的输电线路拟声驱鸟策略研究[J].南京信息工程大学学报（自然科学版）,2022,14(5):579-586. 被引量：1

同被引文献9

1于连波,曹品钊,石亮,连捷,王东.基于改进冲突搜索的多智能体路径规划算法[J].航空学报,2023,44(S01):101-113. 被引量：3
2黄进,黄宗文,凌子燕.多智能体寻路系统在计算机游戏上的应用[J].电脑知识与技术,2012,8(5):3159-3164. 被引量：6
3付梦家,游晓明.多机器人系统及其路径规划方法综述[J].软件导刊,2017,16(1):177-179. 被引量：6
4泰应鹏,邢科新,林叶贵,张文安.多AGV路径规划方法研究[J].计算机科学,2017,44(B11):84-87. 被引量：43
5刘庆周,吴锋.多智能体路径规划研究进展[J].计算机工程,2020,46(4):1-10. 被引量：21
6郭昆仑,朱瑾.基于多智能体系统的自动化码头多AGV无冲突路径规划[J].制造业自动化,2021,43(8):83-89. 被引量：7
7邓子杰,曾传华,柴李,申航宇.灾害情况下基于改进蚁群算法的救援车辆路径优化[J].公路与汽运,2022(4):33-38. 被引量：4
8刘志飞,曹雷,赖俊,陈希亮,陈英.多智能体路径规划综述[J].计算机工程与应用,2022,58(20):43-62. 被引量：13
9王腾达,WU Wenjun,YANG Feng,SUN Teng,GAO Qiang.A greedy path planning algorithm based on pre-path-planning and real-time-conflict for multiple automated guided vehicles in large-scale outdoor scenarios[J].High Technology Letters,2023,29(3):279-287. 被引量：2

引证文献1

1吴文君,王腾达,孙阳,高强.多智能体路径规划技术研究综述[J].北京工业大学学报,2024,50(10):1263-1272.

1王新华,李广超,王本海,刘晨光,王浩溟,李向锋.电子认证在V2X车联网安全中的应用[J].信息安全研究,2022,8(5):500-505. 被引量：5
2徐文龙,侯明.基于HED与Canny方法融合的孔类零件边缘检测方法[J].制造业自动化,2022,44(5):111-113. 被引量：3
3郭蓬,王梦丹,杨建森,陈美奇,蔡聪,许扬眉.车路协同下的基于S函数的交叉口平滑车速引导方法[J].汽车电器,2022(7):4-6. 被引量：1
4谭远良,吕佑龙,左丽玲,张洁.基于强化学习的航天产品装配线投产排序研究[J].组合机床与自动化加工技术,2022(7):160-164. 被引量：1
5熊文华,胡少鹏,王佩,张杰华.车路协同下路侧交通设施体系及道路分级研究[J].公路,2022,67(6):218-222. 被引量：3

交通与运输

2022年第4期

浏览历史

内容加载中请稍等...

智能网联交通环境下基于Q学习的路径规划被引量：1

参考文献2

二级参考文献31

共引文献39

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

智能网联交通环境下基于Q学习的路径规划 被引量：1

参考文献2

二级参考文献31

共引文献39

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

智能网联交通环境下基于Q学习的路径规划被引量：1