-
题名一种基于HAMs体系的层次分解方法
- 1
-
-
作者
杜小勤
李庆华
韩建军
-
机构
华中科技大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2008年第4期653-658,共6页
-
基金
国家自然科学基金面上项目(60503048)资助
-
文摘
在HAMs框架中引入策略耦合SMDPs的观点,定义了HAM-可分解概念,并明确了HAM机、HAM-可分解及策略耦合SMDPs这三者之间的关系,证明了HAM框架适合解决策略耦合SMDPs问题.在此基础上,针对一类具有有向无环图形式的策略耦合SMDPs问题,提出一种层次分解方法,并给出一个判断层次分解有效性的条件.最后使用一个典型的实验来说明该方法的特点.
-
关键词
层次强化学习
层次抽象机
策略耦合SMDPs
-
Keywords
hierarchical reinforcement learning
hierarchies of abstract machines
policy-coupled semi-Markov decision processes
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名HAMs体系中的同态变换方法研究
被引量:1
- 2
-
-
作者
杜小勤
李庆华
韩建军
-
机构
华中科技大学计算机科学与技术学院
国家高性能计算中心(武汉)
-
出处
《小型微型计算机系统》
CSCD
北大核心
2008年第11期2074-2082,共9页
-
基金
国家自然科学基金面上项目(60503048)资助
-
文摘
HAMs体系的一个主要问题是:它的状态空间是由机器状态与环境状态共同生成的联合状态空间,而基于子过程的状态抽象方法也不能完全解决这个问题.本文对此进行了详细的分析,并从策略耦合SMDPs的观点分析与描述了HAMs模型,提出一系列基于HAMs的同态变换的形式化定义及证明了几个较为实用的定理,表明同态变换方法可以有效地解决这一问题.在此基础上,总结了应用同态变换进行状态抽象的几个重要的观点.并使用本文提出的方法对一个典型的实例进行了分析与验证.
-
关键词
层次强化学习
层次抽象机
同态变换
-
Keywords
hierarchical reinforcement learning
hierarchies of abstract machines
homomorphism
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于HAMs的行为设计方法
- 3
-
-
作者
杜小勤
李庆华
韩建军
-
机构
华中科技大学计算机科学与技术学院
-
出处
《计算机仿真》
CSCD
2008年第3期327-331,共5页
-
文摘
在游戏领域,层次有限状态机是一种传统的行为设计方法,已经得到了广泛的应用。但是,这种行为设计方法缺乏效率,因为它需要游戏设计者提供每一个执行细节。文中为解决行为设计的效率问题进行了初步的研究:将层次强化学习方法HAMs应用到行为设计中,并且在实际的Quake2游戏平台上进行了仿真实验。初步的实验结果表明,该方法可以提高行为设计效率。另外,将该方法与基于平坦式强化学习的行为设计方法做了一个对比,表明该方法具有更快的收敛速度。
-
关键词
非玩家角色
层次强化学习
层次抽象机
行为建模
-
Keywords
Non - player characters
Hierarchical reinforcement learning
Hierarchies of abstract machines
Behavior modeling
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-