MDP 中非时齐折扣模型向时齐折扣模型的转化问题

Transformation from Nonstationary Discounted Markov Decision Processes to Stationary Discounted Markov Decision Processes

下载PDF

导出

摘要在状态和行动集均可数，报酬函数有界条件下，建立起非时齐折扣ＭＤＰ的对应时齐折扣ＭＤＰ模型，并证明两者等价从而把非时齐折扣ＭＤＰ问题转化为一个与之等价的时齐折扣ＭＤＰ问题，使时齐折扣ＭＤＰ的结果对非时齐情况也成立鉴于时齐折扣模型的讨论比较充分，这就带来了非时齐折扣模型的完满结论。 This paper is concentrated on the study of transformation for nonstationary discounted Markov decision processes Hera, the state spaces and cation spaces are countable, and the reward functions are bounded Through the transformation of models from nonstationary to stationary, a specially structured stationary discounted MDP is worked out Thus the intrinisic relationship between the two models is provided and they are proven equivalent Accordingly, the results about ε optimal policies and optimal policies in the stationary discounted can be applied to the nonstationary discounted MDP

作者张继红谭兴华王跃宏

机构地区昆明理工大学基础部新疆有色金属工业学校云南工业大学

出处《昆明工学院学报》 1997年第6期30-36,共7页

关键词非时齐折扣MDP 时齐折扣MDP 模型转化 nonstationary discounted MDP stationary discounted MDP transformation of models (S t, ε)optimal policy optimal policy ε optimal policy

分类号 O221 [理学—运筹学与控制论]

引文网络
相关文献

参考文献1

1张昇,郭世贞.无界报酬非时齐折扣马氏决策模型[J].应用数学学报,1990,13(3):314-323. 被引量：2

二级参考文献2

1郭世贞.折扣马氏决策规划的方差最小最优策略问题[J]应用数学学报,1987(02).
2郭世贞.折扣目标马氏决策的最优策略问题[J]经济数学,1984(00).

共引文献1

1许永龙.机器更新决策规划中的强最优问题[J].天津师大学报（自然科学版）,1994,14(4):14-19.

1查清哲,龚良宗.牵连物体上升过程中加速度如何变化[J].物理教师,2013,34(7):63-63. 被引量：4
2李成福.折扣MDP非ε-最优策略的检验准则[J].数学理论与应用,1999,19(4):135-136.
3陈峥.二步马氏折扣模型的最优策略[J].青岛海洋大学学报（自然科学版）,1993,23(1):130-134. 被引量：1
4林元烈,林建星.离散时间MDP矩最优模型——折扣依赖于历史的情形[J].应用概率统计,1992,8(1):27-34.
5邱德华.半马氏MDP平均模型[J].衡阳师专学报,1998,19(3):1-7.
6贾让成.字典序下的折扣多目标半马氏决策模型[J].西安电子科技大学学报,1989,16(2):55-63.
7金治明,王勇献.一类扩散过程的最优停止[J].国防科技大学学报,1999,21(5):98-102. 被引量：1
8伍从斌.无界报酬折扣半马氏决策模型矩最优策略的结构[J].云南大学学报（自然科学版）,1990,12(4):299-306. 被引量：1
9伍从斌.无界报酬折扣半马氏决策模型矩最优策略的存在性[J].云南大学学报（自然科学版）,1991,13(3):199-206.
10何彦力.关于函数曲线的渐近线概念的探讨[J].江苏广播电视大学学报,2007,18(5):59-60.

昆明工学院学报

1997年第6期

浏览历史

内容加载中请稍等...

MDP 中非时齐折扣模型向时齐折扣模型的转化问题

参考文献1

二级参考文献2

共引文献1

相关作者

相关机构

相关主题

浏览历史