本文将基于模型的策略迭代方法推广到了分布式时滞系统的线性二次最优控制问题(LQR)的求解,证明了由该迭代方法得到的性能指标是递减的,且控制器收敛于最优控制器。This paper extends the model-based policy iteration method to the ...本文将基于模型的策略迭代方法推广到了分布式时滞系统的线性二次最优控制问题(LQR)的求解,证明了由该迭代方法得到的性能指标是递减的,且控制器收敛于最优控制器。This paper extends the model-based policy iteration method to the solution of the Linear Quadratic Regulator (LQR) problem for distributed delayed systems. It is demonstrated that the performance criterion obtained through this iterative method is monotonically decreasing, and the controller converges to the optimal controller.展开更多
本文旨在研究随机系数下随机微分方程的线性二次最优控制问题.本文从闭环最优控制/策略存在的必要性条件的角度开展研究.若闭环最优控制/策略存在,得到其显示反馈表示、带伪逆运算的倒向随机Riccati方程的适定性及不同系数间满足的一些...本文旨在研究随机系数下随机微分方程的线性二次最优控制问题.本文从闭环最优控制/策略存在的必要性条件的角度开展研究.若闭环最优控制/策略存在,得到其显示反馈表示、带伪逆运算的倒向随机Riccati方程的适定性及不同系数间满足的一些本质性条件.此处结论本质地推广和改进了文[Ait Rami M,Moore J,Zhou X.Indefinite stochastic linear quadratic control and generalized differential Riccati equation[J].SIAM J Control Optim,2001,40:1296-1311;Sun J,Yong J.Linear quadratic stochastic differential games:open-loop and closed-loop saddle points[J].SIAM J Control Optim,2014,52:4082-4121;Lü Q,Wang T,Zhang X.Characterization of optimal feedback for stochastic linear quadratic control problems,Probab Uncertain Quant Risk,2017,2:11,DOI 10.1186/s41546-017-0022-7]的相应结论.此外,本文得到了一个关于倒向随机Riccati方程和二阶伴随方程两类方程适应解之间的微妙关系.注意到,这一结论在现有文献中首次出现.最后,本文讨论了在均值方差对冲问题中的应用.展开更多
文摘本文将基于模型的策略迭代方法推广到了分布式时滞系统的线性二次最优控制问题(LQR)的求解,证明了由该迭代方法得到的性能指标是递减的,且控制器收敛于最优控制器。This paper extends the model-based policy iteration method to the solution of the Linear Quadratic Regulator (LQR) problem for distributed delayed systems. It is demonstrated that the performance criterion obtained through this iterative method is monotonically decreasing, and the controller converges to the optimal controller.
文摘本文旨在研究随机系数下随机微分方程的线性二次最优控制问题.本文从闭环最优控制/策略存在的必要性条件的角度开展研究.若闭环最优控制/策略存在,得到其显示反馈表示、带伪逆运算的倒向随机Riccati方程的适定性及不同系数间满足的一些本质性条件.此处结论本质地推广和改进了文[Ait Rami M,Moore J,Zhou X.Indefinite stochastic linear quadratic control and generalized differential Riccati equation[J].SIAM J Control Optim,2001,40:1296-1311;Sun J,Yong J.Linear quadratic stochastic differential games:open-loop and closed-loop saddle points[J].SIAM J Control Optim,2014,52:4082-4121;Lü Q,Wang T,Zhang X.Characterization of optimal feedback for stochastic linear quadratic control problems,Probab Uncertain Quant Risk,2017,2:11,DOI 10.1186/s41546-017-0022-7]的相应结论.此外,本文得到了一个关于倒向随机Riccati方程和二阶伴随方程两类方程适应解之间的微妙关系.注意到,这一结论在现有文献中首次出现.最后,本文讨论了在均值方差对冲问题中的应用.