基于多人零和博弈的模块化机器人系统近似最优控制

Approximate optimal control for Modular Robot Manipulators based on multiplayer zero-sum game

下载PDF

导出

摘要提出一种基于多人零和博弈的模块化机器人(Modular Robot Manipulators, MRMs)系统近似最优控制方法。建立了具有交联耦合(Interconnected Dynamic Couplings, IDC)的模块化机器人系统动力学模型。将机器人系统的控制律和IDC效应作为零和博弈的参与者,MRM系统的最优跟踪控制问题转化为多人零和博弈问题。根据自适应动态规划(Adaptive Dynamic Programming, ADP)算法,通过建立评判神经网络求解哈密顿-雅克比-埃塞克斯(Hamilton-Jacobi-Issacs, HJI)方程,推导出最优控制律。基于李雅普诺夫定理,证明了闭环机器人系统是渐近稳定的,最后通过实验验证了所提控制方法的有效性。 An approximate optimal control method for Modular Robot Manipulators(MRMs)systems based on multiplayer zero-sum game is proposed.A modular robot system dynamic model with Interconnected Dynamic Couplings(IDC)is developed.The control law and IDC effect are regarded as players in zero-sum game.The approximate optimal tracking control problem of the MRM system can be transformed into a multiplayer zero-sum game.According to the Adaptive Dynamic Programming(ADP)algorithm,the Hamilton-Jacobi-Issacs(HJI)equation can be solved by establishing critic neural network and then the approximate optimal control policy can be derived.Based on the Lyapunov theorem,the closed-loop robotic system is proved to be asymptotic stable.Finally,experiments are conducted to verify the effectiveness of the proposed method.

作者董博朱新野马冰安天骄 DONG Bo;ZHU Xinye;MA Bing;AN Tianjiao(School of Electrical&Electronic Engineering,Changchun University of Technology,Changchun 130012,China)

机构地区长春工业大学电气与电子工程学院

出处《长春工业大学学报》 CAS 2024年第2期114-124,共11页 Journal of Changchun University of Technology

基金国家自然科学基金项目(62173047) 吉林省科技发展计划项目(20220201038GX) 吉林省教育厅“十三五”科学计划项目(JJKH20220689KJ)。

关键词自适应动态规划模块化机器人多人零和博弈最优控制 ADP(Adaptive Dynamic Programming) MRMs(Modular Robot Manipulators) multiplayer zero-sum game optimal control

分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1王翀,王天和,安天骄,董博.基于自适应力矩估计的模块化机器人系统阻抗控制[J].长春工业大学学报,2023,44(5):405-415. 被引量：2
2董博,王悦西,安天骄,刘富,李元春.面向人机物理交互的谐波传动式模块化机器人系统分散积分滑模控制[J].长春工业大学学报,2022,43(4):392-403. 被引量：2

二级参考文献5

1刘富,安毅,董博,李元春.基于ADP的可重构机械臂能耗保代价分散最优控制[J].吉林大学学报（工学版）,2020,50(1):342-350. 被引量：5
2董博,刘克平,李元春.动态约束下可重构模块机器人分散强化学习最优控制[J].吉林大学学报（工学版）,2014,44(5):1375-1384. 被引量：5
3董博,刘克平,李元春.受动态约束的谐波传动式可重构模块机器人分散积分滑模控制[J].控制与决策,2016,31(3):441-447. 被引量：13
4张立建,胡瑞钦,易旺民.基于六维力传感器的工业机器人末端负载受力感知研究[J].自动化学报,2017,43(3):439-447. 被引量：42
5Flavio Moreira,Anthony Abundis,Michael Aguirre,Justin Castillo,Pranav A. Bhounsule.An Inchworm-inspired Robot Based on Modular Body, Electronics and Passive Friction Pads Performing the Two-anchor Crawl Gait[J].Journal of Bionic Engineering,2018,15(5):820-826. 被引量：4

共引文献1

1马冰,张航伟,潘强,安天骄,张振国.面向未知空间的模块化机器人最优位置-力控制研究[J].长春工业大学学报,2024,45(2):104-113.

1陈亮.全球化浪潮下我们需要怎样的新型研究型大学[J].教育发展研究,2024,44(11):36-39.
2邵梦晗,胡海峰,潘豪,宋征宇,李竞元,黄聪,钟鸿豪.一种运载火箭弹性自主辨识与自适应控制方法[J].宇航学报,2023,44(12):1916-1924.
3天下[J].三联生活周刊,2023(19):10-15.
4马冰,张航伟,潘强,安天骄,张振国.面向未知空间的模块化机器人最优位置-力控制研究[J].长春工业大学学报,2024,45(2):104-113.
5高小丽,黄雅文.话语-历史分析法视角下的美国国防话语分析——以2022年《美国国防战略报告》为例[J].外语研究,2024,41(4):44-49. 被引量：2
6一月奇闻[J].发现,2023(19):33-34.
7岳远达,宓玲,陈川.基于预定义时间收敛的容噪零化神经网络求解时变Sylvester方程[J].聊城大学学报（自然科学版）,2024,37(4):33-42.
8张玲,赵卢艳.一元多线论下的中国式现代化的三重超越[J].石家庄学院学报,2024,26(4):15-22.
9Lei Guan,Jun Yao.Dynamic Couplingand Cooperative Control for Multi-paralleled Doubly Fed Induction Generator Wind Farms during Symmetrical Low Voltage Ride-through in a Weak Grid[J].Protection and Control of Modern Power Systems,2024,9(3):112-125.
10刘增合.晚清外销财政管控中的部省博弈[J].高等学校文科学术文摘,2024,41(5):82-83.

长春工业大学学报

2024年第2期

浏览历史

内容加载中请稍等...

基于多人零和博弈的模块化机器人系统近似最优控制

参考文献2

二级参考文献5

共引文献1

相关作者

相关机构

相关主题

浏览历史