检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

移动机器人路径规划强化学习的初始化被引量：26: 1; 作者宋勇李贻斌李彩虹《控制理论与应用》 EI CAS CSCD 北大核心 2012年第12期1623-1628,共6页; 针对现有机器人路径规划强化学习算法收敛速度慢的问题,提出了一种基于人工势能场的移动机器人强化学习初始化方法.将机器人工作环境虚拟化为一个人工势能场,利用先验知识确定场中每点的势能值,它代表最优策略可获得的最大累积回报.例... 展开更多; 关键词移动机器人强化学习人工势能场路径规划 q值初始化; 下载PDF 职称材料

用于移动机器人路径规划的改进强化学习算法: 2; 作者张威初泽源 +1 位作者杨玉涛王伟《中国民航大学学报》 CAS 2024年第5期59-65,共7页; 针对传统Q-learning算法规划出的路径存在平滑度差、收敛速度慢以及学习效率低的问题,本文提出一种用于移动机器人路径规划的改进Q-learning算法。首先,考虑障碍物密度及起始点相对位置来选择动作集,以加快Q-learning算法的收敛速度;其... 展开更多; 关键词强化学习路径规划启发式奖励函数 q值初始化; 下载PDF 职称材料

引入势场及陷阱搜索的强化学习路径规划算法被引量：16: 3; 作者董培方张志安 +1 位作者梅新虎朱朔《计算机工程与应用》 CSCD 北大核心 2018年第16期129-134,共6页; 移动机器人在复杂环境中移动难以得到较优的路径,基于马尔可夫过程的Q学习(Q-learning)算法能通过试错学习取得较优的路径,但这种方法收敛速度慢,迭代次数多,且试错方式无法应用于真实的环境中。在Q-learning算法中加入引力势场作为初... 展开更多; 关键词路径规划强化学习人工势场陷阱搜索 q值初始化; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部