期刊文献+

基于半马尔可夫对策的多机器人分层强化学习 被引量:6

Multi-robot hierarchical reinforcement learning based on semi-Markov games
原文传递
导出
摘要 在多智能体分层强化学习研究成果的基础上,考虑多机器人系统经常面临的通信困难问题(如水下环境),提出一种基于半马尔可夫对策的多机器人分层强化学习方法,通过引入对策论方法解决通信困难情况下多机器人学习问题。仿真实验结果表明了该方法的有效性。 Following previous work and considering the multi-robot systems with communication failure(e.g.in an underwater environment),a multi-robot hierarchical reinforcement learning approach based on semi-Markov games was proposed. The game theory was employed in this approach.Simulation experimental results showed that the proposed approach was effective on multi-robot learning with communication failure.
出处 《山东大学学报(工学版)》 CAS 北大核心 2010年第4期1-7,共7页 Journal of Shandong University(Engineering Science)
基金 国家自然科学基金资助项目(60975071) 教育部博士点基金资助项目(20092304120013) 中央高校基本科研业务费资助项目(HEUCFZ1010 HEUCF100604)
关键词 半马尔可夫对策 多机器人 分层强化学习 semi-Markov game multi-robot hierarchical reinforcement learning
  • 相关文献

参考文献18

  • 1张彦,关胜晓.完全未知环境下机器人探索路径策略与仿真[J].计算机仿真,2008,25(2):199-202. 被引量:3
  • 2NILSSON N. Shakey the robot[ R]. Menlo Park, USA: AI Center, SRI International, 1984.
  • 3BROOKS R. A Robust layered control system for a mobile robot[ J]. IEEE Journal of Robotics and Automation, 1986, 2(1) :14-23.
  • 4CONNELL J. SSS: a hybrid architecture applied to robot navigation[ C]//ICRA, Piscataway. USA: IEEE, 1992 : 2719 -2724.
  • 5张汝波,顾国昌,杨歌,郭轶尊.具有学习能力的智能机器人体系结构研究[J].华中科技大学学报(自然科学版),2004,32(S1):58-60. 被引量:4
  • 6高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量:268
  • 7BARTO A G, MAHADEVAN S. Recent advances in hierarchical reinforcement learning [J].Discrete Event Dynamic Systems : Theory and Applications, 2003,13 (4) : 41-77.
  • 8SUTTON R S, PRECUP D, SINGH S P. Between MDPs and semi-MDPs: a framework for temporal abstraction in reinforcement learning [ J ]. Artificial Intelligence, 1999, 112(1-2) : 181-211.
  • 9PARR R. Hierarchical control and learning for Markov decision processes [ D ]. Berkeley, USA: University of California, 1998.
  • 10DIEFFERICH T G. Hierarchical reinforcement learning with the MAXQ value function decomposition [ J ]. Journal of Artficial Intelligence Research, 2000,13( 1 ) :227-303.

二级参考文献54

共引文献278

同被引文献154

引证文献6

二级引证文献34

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部