一种基于对策论的多Agent协作方法被引量：2

A Multi-Agent Cooperated Method Based on Game Theory

下载PDF

导出

摘要针对带有时间约束的、可以动态加入到环境中的复杂任务,建立了一种基于对策论的任务协作模型,该模型至少存在一个纯策略Nash平衡解.给出了一种任务协作方法,该方法中Agent能够根据自身的局部信息进行行为选择,并利用虚拟行动学习方法确保Agent快速学习到一个纯策略Nash平衡,仿真实验结果表明该方法与Chapman和刘的方法同等有效. For the complex tasks with time constraints,which can dynamically be added to environment,a task coordination model based on game theory has been established,which has at least one pure Nash equilibrium.A task cooperation method has been proposed,which makes agent choose its behavior according to the local information and ensure that agent learns a pure strategy Nash Equilibrium quickly by using fictitious play learning method.Simulation results show that this method is as effective as Chapman and Liu＇s methods.

作者陶雪丽赵晓焱李思嘉

机构地区河南师范大学计算机与信息工程学院河南师范大学物理与电子工程学院

出处《河南师范大学学报（自然科学版）》 CAS 北大核心 2013年第4期158-161,共4页 Journal of Henan Normal University(Natural Science Edition)

基金河南省重点科技攻关项目(102102210179 102102210176 122102210086) 河南省教育厅自然基金项目(13A520530)

关键词 MAS 协作对策论 NASH均衡虚拟行动 MAS cooperation game theory nash equilibrium fictitious play

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1Shehory O, Kraus S. Methods of task allocation via agent coalition formation[J]. Artificial Intelligence, 1998,101 (1/2) :165-200.
2Stroupe Ashley, Huntsberger Terry, Okon Avi. AghazariaHrand n and Robinson Matthew. Behavior-Based Multi-Robot Collaboration for Autonomous Construction Tasks[C]. Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems, Edmon- ton, 2005.
3Kalra N, Martinoli A. A Comparative Study of Market-Based and Threshold-Based Task Allocation[C]. Proceedings of the International Symposium on Distributed Autonomous Robotic Systems (DRAS), Minneapolis,2006.
4Sarne D, Kraus S. Solving the Auction-Based Task Allocation Problem in an Open Environment[C]. Cambridge: MIT Press,2005:164- 169.
5Liu S H, Zhang Y. Multi-robot task allocation based on swarm intelligence[J]. Journal of Jilin University,2010,40 (1) :123-129.
6Marden J R, Arslan G, Shamma J S. Cooperative Control and Potential Games[J]. IEEE Transactions on Systems, Man and Cybernet- ics. Part B: Cybernetics,2009,39(6) : 1393-1407.
7Parag C, Pendharkar. Game Theoretical Applications for Multi-Agent Systems[J]. Expert Systems with Applications, 2012,39 (1) : 273- 279.
8施锡全.博弈论[M].上海:上海财经大学出版社,2000..
9Chapman A C, Micillo R A, Kota R,et al. Decentralised Dynamic Task Allocation: A Practical Game-Theoretic Approach[C]. Proc 8th Int Conf on Autonomous Agents and Multi-Agent Systems (AAMAS-09), Budapest,2009.
10Mostaph Zbakh, Mohamed Dafir EL Kettani. A Task Allocation Algorithm for Distributed Systems[J]. Jounnal of Theoretical and Ap- plication Information Technology, 2011,33 ( 1 ) : 15-21.

二级参考文献17

1袁爱进,曹立明,王小平.一种基于博弈论的多Agent交互模型[J].计算机工程,2005,31(6):50-51. 被引量：10
2高志军,颜国正,丁国清.基于网络的多Agent协作环境下的任务分配[J].计算机工程,2005,31(10):19-21. 被引量：14
3王国权,徐竞青,于海斌.一种多智能体系统任务竞争模型及算法研究[J].信息与控制,2005,34(4):434-438. 被引量：4
4柳林,季秀才,郑志强.基于市场法及能力分类的多机器人任务分配方法[J].机器人,2006,28(3):337-343. 被引量：22
5KARTIK S, RAM MURTHY C S. Task Allocation Algorithms for Maximizing Reliability of Distributed Computing Systems [J]. IEEE Transactions on Computers, 1997, 46 (6) : 719-724.
6BOTELHO S C, ALAMI R M. A Scheme for Multi-Robot Cooperation Through Negotiated Task Allocation and Achievement [C] //Proceedings of the 1999 IEEE International Conference on Robotics & Automation. Piscataway, NJ, USA: IEEE, 1999: 1234-1239.
7MENON S. Effective Reformulations for Task Allocation in Distributed Systems with a Large Number of CommunicatiIng Tasks [J]. IEEE Transactions on Knowledge and Data Engineering, 2004, 16 (12) : 1497-1508.
8BRIAN P GERKEY, MAJA J MATARI C. A Formal Analysis and Taxonomy of Task Allocation in Muhi-Robot Systems [ J]. The International Journal of Robotics Research, 2004, 23 (9) : 939-954.
9PARKER L E. Alliance an Architecture for Fault tolerant Multi Robot Cooperation [ J ]. IEEE Transactions on Robotics and Automation, 1998 , 14 (2): 220-240.
10WERGER B, MATARIC M J. Broadcast of Local Eligibility: Behavior Based Control for Strongly Cooperative Multi-Robot Teams [C] //Proceedings of Autonomous Agents. Barcelona, Spain: [s. n. ], 2000: 21-22.

共引文献17

1刘青秀,贾云鹏.论高等教育中供求双方权利和义务的不对等[J].江苏高教,2004(4):17-19. 被引量：4
2章文光.跨国公司在华投资“研发中心”与我国政府的竞合博弈分析[J].北京行政学院学报,2007(6):51-54. 被引量：3
3黎波,李磊民.博弈论的足球机器人进攻策略研究[J].计算机工程与应用,2011,47(30):224-226. 被引量：4
4肖权,孔峰,谢广明.基于动态角色的多机器鱼协作顶球研究[J].机械设计,2012,29(7):24-28. 被引量：1
5陶雪丽,郑延斌.基于能力及任务需求的多Agent任务分配方法[J].计算机应用与软件,2012,29(11):181-184. 被引量：4
6郑延斌,陶雪丽.基于对策论的团队计算机生成角色任务分配方法[J].计算机应用,2013,33(3):793-795.
7陶雪丽,郑延斌.多Agent层次任务分配方法[J].计算机工程与设计,2013,34(5):1797-1801. 被引量：2
8周东健,张兴国,李成浩.多机器人系统协同作业技术发展近况与前景[J].机电技术,2013,36(6):146-150. 被引量：9
9李吉亮,张瑞丽,杨坤伟.基于合数高阶剩余类的公平硬币抛掷协议[J].计算机技术与发展,2014,24(1):140-142.
10郑延斌,陶雪丽,段领玉,李波.基于博弈论及惩罚机制的多Agent协作控制算法[J].河南师范大学学报（自然科学版）,2015,43(6):146-151. 被引量：2

同被引文献17

1李光敏.基于.NET和ArcIMS的农用地定级信息发布系统设计与研究[J].国土资源遥感,2008,20(2):109-111. 被引量：2
2谢瑞,肖海红.基于GIS的配电网拓扑算法的研究与实现[J].河南师范大学学报（自然科学版）,2010,38(2):45-48. 被引量：7
3高晓蓉,徐丹,雷瑛.基于Flex和REST服务的WebGIS系统开发——以陇西县地理空间信息应用系统为例[J].遥感技术与应用,2011,26(1):123-128. 被引量：21
4李振兴,尹项根,张哲,邓星,刘颖彤.广域保护多Agent系统动态协作机制[J].电力系统保护与控制,2012,40(3):36-40. 被引量：7
5王轶,周迅,周伟,李飞.基于WebGIS的离散时序空间数据动态可视化研究[J].国土资源遥感,2012,24(2):143-147. 被引量：3
6蒋伟进,张莲梅,史德嘉.复杂自适应系统的MAS动态协作任务求解时序逻辑模型[J].系统工程理论与实践,2012,32(6):1305-1313. 被引量：7
7李影洁,朱秀丽.一种新的基于Agent流程建模方法[J].河南师范大学学报（自然科学版）,2012,40(3):62-65. 被引量：2
8裴芳,张洁,郝丽波.基于Z形式化规范的多Agent协作模型研究[J].火力与指挥控制,2012,37(7):61-65. 被引量：2
9郑炎,李龙腾,刘春晓,葛玉,张满.多Agent协作可交互的远程视频会议系统的实现[J].电视技术,2013,37(1):144-146. 被引量：3
10唐贤伦,李亚楠,樊峥.未知环境中多Agent自主协作规划策略[J].系统工程与电子技术,2013,35(2):345-349. 被引量：6

引证文献2

1肖文雅,尚艳玲.一种基于多Agent的有效负载均衡的WebGIS体系模型[J].河南师范大学学报（自然科学版）,2015,43(4):151-156. 被引量：1
2殷凡,牛丽.基于进化算法优化的多Agent系统协作模型[J].科技通报,2015,31(11):207-210.

二级引证文献1

1郑延斌,樊文鑫,韩梦云,陶雪丽.基于博弈论及Q学习的多Agent协作追捕算法[J].计算机应用,2020,40(6):1613-1620. 被引量：5

1郑延斌,陶雪丽.基于对策论的团队计算机生成角色任务分配方法[J].计算机应用,2013,33(3):793-795.
2梁树杰,鲁恩名.基于协同进化算法的网络控制系统性能与安全性最优折中技术研究[J].计算机应用研究,2015,32(3):855-859.
3宋梅萍,顾国昌,张国印,刘海波.一般和博弈中的合作多agent学习[J].控制理论与应用,2007,24(2):317-321. 被引量：7
4李治军,姜守旭.一种缩短下载时间优先的自适应BitTorrent激励协议[J].计算机学报,2012,35(7):1498-1509.
5岳晓宁,井元伟,王竞波.理想状态下网络非线性交叉干扰激励价控策略[J].控制与决策,2007,22(1):16-20.
6刘漳辉,陈昆龙,郭文忠.多感知范围无线传感器网络中一种分布式目标覆盖算法[J].传感技术学报,2014,27(8):1112-1119. 被引量：5
7杨萍,梁杰.巡线机器人在人造环境中的博弈行为研究[J].科学技术与工程,2006,6(24):3931-3933.
8张虹,邱玉辉.一个基于对策论的协商模型[J].南京大学学报（自然科学版）,2001,37(2):159-164. 被引量：5
9岳晓宁,井元伟,张秀华.多用户非线性网络系统各优先级价差分析[J].东北大学学报（自然科学版）,2005,26(3):205-208.
10王晋东,余定坤,张恒巍,王娜,陈宇.基于不完全信息攻防博弈的最优防御策略选取方法[J].小型微型计算机系统,2015,36(10):2345-2348. 被引量：6

河南师范大学学报（自然科学版）

2013年第4期

浏览历史

内容加载中请稍等...

一种基于对策论的多Agent协作方法被引量：2

参考文献11

二级参考文献17

共引文献17

同被引文献17

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于对策论的多Agent协作方法 被引量：2

参考文献11

二级参考文献17

共引文献17

同被引文献17

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于对策论的多Agent协作方法被引量：2