基于线性时序逻辑的智能体不确定行为规划被引量：5

Probabilistic action planning based on linear temporal logic

导出

摘要随着人们对智能体需求的提高,智能体的活动不再局限于简单环境与单一任务,面向复杂的应用场景,智能体需要具备自主完成决策与执行的能力.本文研究了面向线性时序逻辑描述下的复杂任务智能体的不确定行为规划问题,同时考虑任务成功率与任务执行成本,这里不确定性因素包括智能体行为与环境属性,任务描述由软、硬约束两部分表达.文中应用形式化方法中模型检测的思想确定智能体行为选择策略,其中应用马尔可夫决策过程构建智能体个体与集群模型,应用双层自动机模型构建任务模型,设计智能体-任务网络模型表征约束条件并通过一耦合线性规划完成策略求解,并通过数值仿真测试对上述方法进行了验证.结果表明含软、硬约束的复杂任务约束可被满足,求解所得最优策略使智能体按约束强度完成任务,且可通过调节惩罚因子控制网络模型的松弛程度调整生成的控制策略. With the increase of people’s demand for agents, the activities of agents are no longer limited to simple environment and task format.Facing complex application scenarios, agents need to be able to make decisions and execute them autonomously. This paper studies the probabilistic action planning considering complex task constraints described by linear temporal logic. At the same time, the success rate and cost of task are both considered. The uncertain factors include agent behavior and environment attributes, and the task description is expressed by soft and hard constraints. The strategy of agent is generated here applying model checking in formal method. Single-and multi-agent model is established using Markov decision process, while task model is established using doublelayer automata. Then, agent-task network model is designed to describe the constraints and the control strategy is solved through a coupled linear programming. The method above is verified through numerical simulation. The results show that the complex task constraints in the form of soft and hard constraints can be satisfied. The optimal strategy enable the agent to complete the task according to the constraint strength, and the control strategy can be adjusted by controlling the relaxation degree of control network model relevant to the penalty factor.

作者陈仲瑶方浩 CHEN ZhongYao;FANG Hao(School of Automation,Beijing Institute of Technology,Beijing 100081,China)

机构地区北京理工大学自动化学院

出处《中国科学：技术科学》 EI CSCD 北大核心 2020年第5期516-525,共10页 Scientia Sinica(Technologica)

基金深圳机器人基础研究中心项目国家自然科学基金(编号:U1913602) 重大国际(地区)合作研究项目、国家自然科学基金(批准号:61720106011,61873033,61903035) 鹏城实验室和智能机器人与系统高精尖创新中心资助。

关键词线性时序逻辑不确定行为规划双层自动机软、硬任务约束 linear temporal logic probabilistic action planning double-layer automata soft/hard constraint

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] O221 [理学—运筹学与控制论]

引文网络
相关文献

参考文献2

1张永顺,王殿龙,阮晓燕,姜生元,卢杰.肠道内多胶囊机器人的控制策略[J].中国科学：技术科学,2011,41(11):1551-1560. 被引量：6
2庄严,顾明伟,王伟,于海洋.基于自主运动状态估计及信息交互的多移动机器人协作定位[J].中国科学：信息科学,2010,40(10):1351-1362. 被引量：4

二级参考文献18

1ZHANG YongShun,YUE Ming,GUO DongMing,WANG DianLong,YU HongHai,JIANG ShengYuan,ZHANG XueWen.Characteristics of spatial magnetic torque of an intestine capsule micro robot with a variable diameter[J].Science China(Technological Sciences),2009,52(7):2079-2086. 被引量：2
2裘祖干.一类微极流体四边形阶梯轴承的精确解[J].润滑与密封,1989,14(2):13-20. 被引量：3
3简小云,梅涛,汪小华.胶囊内窥镜机器人的外磁场驱动方法[J].机器人,2005,27(4):367-372. 被引量：24
4Dieter Fox,Wolfram Burgard,Hannes Kruppa,Sebastian Thrun.A Probabilistic Approach to Collaborative Multi-Robot Localization[J]. Autonomous Robots . 2000 (3)
5Rekleitis I M,Dudek G,Milios E E.Multi-robot cooperative localization:a study of trade-obetween eciency and accuracy. Proc IEEE Int Conf on Intelligent Robot and Systems . 2002
6Nerurkar E D,Roumeliotis S I,Martinelli A.Distributed maximum a posteriori estimation for multi-robot cooperative localization. Proc IEEE Int Conf on Robotics and Automation . 2009
7Bengtsson O,Baerveldt A J.Robot localization based on scan-matching-estimating the covariance matrix for the IDC algorithm. Robot Autonom Syst . 2003
8Andrew Howard,Maja J Mataric,Gaurav S Sukhatme.Mobile sensor network deployment using potential fields: A distributed, scalable solution to the area coverage problem. Proceedings of the 6th International Symposiumon Distributed Autonomous Robotic Systems(DARS02) . 2002
9M.Vachiller,A.Adan,V.Feliu,C.Cerrada,Facultad de Ciencias.Well structured robot position control strategy for position based visual servoing. Proceedings of the 2001 IEEE international Conference on Robotics & Automation . May21-262001
10S.I.Roumeliotis,G.A.Bekey."Distributed multirobot localization,". IEEE Transactions on Robotics and Automation . 2002

共引文献8

1王越超,刘金国.无人系统的自主性评价方法[J].科学通报,2012,57(15):1290-1299. 被引量：32
2张文辉,叶晓平.参数突变自由漂浮空间机器人神经集成控制[J].中国科学：信息科学,2012,42(11):1435-1444. 被引量：3
3张永顺,王娜,杜春雨,孙颖,王殿龙.胶囊机器人弯曲环境内万向旋转磁矢量控制原理[J].中国科学：技术科学,2013,43(3):274-282. 被引量：1
4周东健,张兴国,李成浩.多机器人系统协同作业技术发展近况与前景[J].机电技术,2013,36(6):146-150. 被引量：9
5汪露,江滨.大肠癌筛查方法研究进展[J].辽宁中医药大学学报,2014,16(5):236-239. 被引量：8
6华承昊,窦丽华,方浩.多机器人最大熵博弈协同定位算法[J].国防科技大学学报,2014,36(2):192-198. 被引量：6
7黄捷,李帮银,陈宇韬,邓宏彬,李东方.基于区块链的群机器人数据完整性与隐私性保护[J].无人系统技术,2022,5(4):96-108. 被引量：4
8黄捷,李帮银,李东方.基于群体机器人多目标的区块链安全控制架构及算法[J].无人系统技术,2024,7(1):59-68.

同被引文献42

1刘科科,王丹辉,郑学欣,郭静.基于活动行为特征的APT攻击检测方法研究[J].中国电子科学研究院学报,2019,14(1):86-92. 被引量：8
2王健,王一凡.基于STM32的空调与窗户联动自动控制系统设计[J].电子设计工程,2019,27(3):115-118. 被引量：5
3马晓星,刘譞哲,谢冰,余萍,张天,卜磊,李宣东.软件开发方法发展回顾与展望[J].软件学报,2019,30(1):3-21. 被引量：29
4王戟,詹乃军,冯新宇,刘志明.形式化方法概貌[J].软件学报,2019,30(1):33-61. 被引量：85
5徐喜梅,何成龙,黄大庆,徐诚.基于多点约束的微小型无人机自主定位技术[J].电光与控制,2019,26(5):49-54. 被引量：6
6张清霞,彭传薇,刘琛玺,李富强,蔡丽璇,贺美林.基于二维码的门诊应急系统设计与应用[J].中国数字医学,2019,14(4):57-59. 被引量：8
7韩金,单征,赵炳麟,孙文杰.基于软件基因的Android恶意软件检测与分类[J].计算机应用研究,2019,36(6):1813-1818. 被引量：9
8王晓明,胡鑫,宋辉,姬晓文,袁多丽.基于多网融合的电力应急通信系统设计[J].信息技术,2019,43(6):60-63. 被引量：11
9胡建伟,车欣,周漫,崔艳鹏.基于高斯混合模型的增量聚类方法识别恶意软件家族[J].通信学报,2019,40(6):148-159. 被引量：7
10董海燕,杜晓冬,杜奕智,翁志远.基于蚁群算法的智能型疏散指示系统的设计[J].控制工程,2019,26(6):1126-1132. 被引量：6

引证文献5

1刘明,闫井超,文炜,洪东亮.基于复杂逻辑约束的自主应急联动系统设计[J].电子设计工程,2022,30(2):138-141. 被引量：1
2熊英乔,邱芬.恶意软件攻击行为的时序逻辑建模分析[J].计算机仿真,2022,39(6):430-433.
3庞飞,唐六华,谢小赋,郝尧.可信运行控制软件形式化设计与验证[J].信息技术,2022,46(10):76-84. 被引量：1
4田畅,朱化杰,杨妍,石忠佼,刘志杰.基于信号时序逻辑的轮式移动机器人路径规划和漏斗控制设计[J].控制与信息技术,2022(6):50-55. 被引量：2
5王海南.基于PLC控制的煤矿识别卡自动装配产线设计[J].科学技术创新,2024(8):13-16.

二级引证文献4

1柳满昌,李红双,王征.基于全局定位系统的球类训练场工作机器人设计[J].机械设计,2023,40(S01):35-39. 被引量：1
2刘栋,王东辉.基于RT-Thread的可信软件栈的设计和实现[J].电子设计工程,2024,32(2):51-55.
3谭燕,吴刘仓.无需精确初始误差的纯反馈系统实用预设时间保性能控制设计[J].系统科学与数学,2024,44(1):45-59. 被引量：1
4肖伟,马开德,刘钊.基于矿鸿软总线的综采工作面三机联动控制方法[J].电子设计工程,2024,32(21):80-84.

1晓枪老王.世界名枪印象(7)——AK步枪(2)[J].兵器知识,2020,0(6):42-47.
2梅小霞,刘文飞,云子轩,杨思奋.保全阴道黏膜的阴道紧缩术治疗阴道松弛的临床效果[J].中国当代医药,2020,27(15):97-99. 被引量：1
3赵永柱,黎卫东,唐斌,梅峰,卢文达.面向期限感知分布式矩阵相乘的高效存储方案[J].计算机应用,2020,40(2):311-315. 被引量：1
4赵倩倩,赵均,徐祖华,陈曦,邵之江,秦海中.空分装置群的设备启停及变负荷调度策略[J].华东理工大学学报（自然科学版）,2020,46(1):84-91. 被引量：5
5肖星星,张阳,黄海宁,张扬帆.基于MDP的分簇水声网络TDMA协议[J].网络新媒体技术,2019,8(6):48-54.
6宋爱香,马冲.基于强化学习的图书内容推荐策略研究与应用[J].情报探索,2020,0(1):9-15. 被引量：1
7夏金,孙宏波,孙立民.基于强化学习的生产再决策问题[J].计算机集成制造系统,2019,25(11):2935-2942. 被引量：5
8赵谦,史凌云.融合细胞自动机的坩埚单层气泡计数方法研究[J].计算机仿真,2020,37(5):429-433.
9崔俊文,刘自红,石磊,刘福强,乐玉.基于分层学习的四足机器人运动自适应控制模型[J].计算机测量与控制,2020,28(1):105-110. 被引量：4
10马娇.内隐学习指导下的小学语文写作教学策略研究[J].新作文（教研）,2020(7):0136-0137.

中国科学：技术科学

2020年第5期

浏览历史

内容加载中请稍等...

基于线性时序逻辑的智能体不确定行为规划被引量：5

参考文献2

二级参考文献18

共引文献8

同被引文献42

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于线性时序逻辑的智能体不确定行为规划 被引量：5

参考文献2

二级参考文献18

共引文献8

同被引文献42

引证文献5

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于线性时序逻辑的智能体不确定行为规划被引量：5