期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
多智能体系统能控性研究进展 被引量:22
1
作者 关永强 纪志坚 +1 位作者 张霖 王龙 《控制理论与应用》 EI CAS CSCD 北大核心 2015年第4期421-431,共11页
能控性问题是多智能体协调控制领域中一个基本又十分重要的研究课题.本文对多智能体系统能控性问题的研究现状进行综述.介绍了多智能体能控性领域的基本问题和特点,并结合智能体自身动力学与邻居交互协议,从拓扑结构角度对该领域当前的... 能控性问题是多智能体协调控制领域中一个基本又十分重要的研究课题.本文对多智能体系统能控性问题的研究现状进行综述.介绍了多智能体能控性领域的基本问题和特点,并结合智能体自身动力学与邻居交互协议,从拓扑结构角度对该领域当前的研究热点和前沿进行分析阐述.进一步,对结构能控性的研究成果进行归纳总结,并对能观测性、可镇定性和复杂网络能控性等相关问题进行阐述.最后给出了仍需解决的问题和可能的研究方向. 展开更多
关键词 多智能体系统 能控性 邻居信息交互 领航者-跟随者结构
下载PDF
多智能体博弈、学习与控制 被引量:9
2
作者 王龙 黄锋 《自动化学报》 EI CAS CSCD 北大核心 2023年第3期580-613,共34页
近年来,人工智能(Artificial intelligence,AI)技术在棋牌游戏、计算机视觉、自然语言处理和蛋白质结构解析与预测等研究领域取得了众多突破性进展,传统学科之间的固有壁垒正在被逐步打破,多学科深度交叉融合的态势变得越发明显.作为现... 近年来,人工智能(Artificial intelligence,AI)技术在棋牌游戏、计算机视觉、自然语言处理和蛋白质结构解析与预测等研究领域取得了众多突破性进展,传统学科之间的固有壁垒正在被逐步打破,多学科深度交叉融合的态势变得越发明显.作为现代智能科学的三个重要组成部分,博弈论、多智能体学习与控制论自诞生之初就逐渐展现出一种“你中有我,我中有你”的关联关系.特别地,近年来在AI技术的促进作用下,这三者间的交叉研究成果正呈现出一种井喷式增长的态势.为及时反映这一学术动态和趋势,本文对这三者的异同、联系以及最新的研究进展进行了系统梳理.首先,介绍了作为纽带连接这三者的四种基本博弈形式,进而论述了对应于这四种基本博弈形式的多智能体学习方法;然后,按照不同的专题,梳理了这三者交叉研究的最新进展;最后,对这一新兴交叉研究领域进行了总结与展望. 展开更多
关键词 博弈论 多智能体学习 控制论 强化学习 人工智能
下载PDF
多智能体系统的事件驱动控制 被引量:12
3
作者 张志强 王龙 《控制理论与应用》 EI CAS CSCD 北大核心 2018年第8期1051-1065,共15页
近年来事件驱动控制发展迅速,并引起了多智能体系统领域研究者的极大关注.本文对基于事件驱动控制的多智能体系统的研究现状进行综述.从智能体动力学角度,分别对这个领域的一些代表性成果和研究方法进行了归纳总结.进一步,论述了边事件... 近年来事件驱动控制发展迅速,并引起了多智能体系统领域研究者的极大关注.本文对基于事件驱动控制的多智能体系统的研究现状进行综述.从智能体动力学角度,分别对这个领域的一些代表性成果和研究方法进行了归纳总结.进一步,论述了边事件驱动控制策略下的多智能体系统的研究成果.随后,利用一类新型事件驱动控制来探讨多智能体系统的一致性问题.最后,给出了尚未解决的问题和未来值得关注的研究方向. 展开更多
关键词 多智能体系统 事件驱动控制 一致性 Zeno行为
下载PDF
多输入多输出系统在凸多面体摄动模式下H_∞鲁棒性能
4
作者 耿志勇 黄琳 《控制理论与应用》 EI CAS CSCD 北大核心 2000年第5期678-682,共5页
研究了多输入多输出混合摄动系统的加权H∞ 范数的检验问题 ,对象族的分子为多仿射凸多面体多项式族 ,当分母为乘积形式的多仿射凸多面体多项式族时 ,给出了棱边检验结果 ,当对象族的分母多项式族为区间多项式族或菱形多项式族时 。
关键词 H∝范数 多输入多输出系统 凸多面体 鲁棒性
下载PDF
基于ARM的海底大地电磁信号采集系统主控模块改进 被引量:2
5
作者 王启宁 杜刚 姜景捷 《电子技术应用》 北大核心 2005年第1期17-18,21,共3页
对现有海底大地电磁信号采集系统的主控模块进行了改进。采用AT91m40800为主控单元,通过移植嵌入式实时操作系统μC/OS-Ⅱ进行任务管理,并扩展了ISA总线、串行接口和网络接口。概要介绍了改进方案的设计思路、μC/OS-Ⅱ的移植以及ARM对... 对现有海底大地电磁信号采集系统的主控模块进行了改进。采用AT91m40800为主控单元,通过移植嵌入式实时操作系统μC/OS-Ⅱ进行任务管理,并扩展了ISA总线、串行接口和网络接口。概要介绍了改进方案的设计思路、μC/OS-Ⅱ的移植以及ARM对外围器件的扩展,并通过ISA总线仿真了系统时序效果。 展开更多
关键词 主控模块 ARM 海底大地电磁 μC/OS-Ⅱ ISA总线 采集系统 任务管理 磁信号 网络接口 器件
下载PDF
博弈收益控制研究进展 被引量:1
6
作者 王龙 陈芳 陈星如 《中国科学:信息科学》 CSCD 北大核心 2023年第4期623-646,共24页
在博弈论中,单个个体控制全部个体的收益通常被认为是不可能的.一个例外是20世纪末在重复囚徒困境中提出的均衡器策略:使用这种策略的个体可以将对手的收益设置为由收益函数所决定的某个区间内的任意值.十余年后发现的零行列式策略通过... 在博弈论中,单个个体控制全部个体的收益通常被认为是不可能的.一个例外是20世纪末在重复囚徒困境中提出的均衡器策略:使用这种策略的个体可以将对手的收益设置为由收益函数所决定的某个区间内的任意值.十余年后发现的零行列式策略通过单方面设置个体收益的线性关系,将该结果一般化.在此基础上,关于博弈收益控制的研究取得了一系列成果.本文概述了博弈收益控制的研究现状;介绍了单次博弈和重复博弈中的收益控制技术;从收益控制的基本概念、能控制的收益关系、收益控制策略的形式和收益控制策略的演化特性等方面总结了博弈中收益控制的主要进展和成果;并讨论了博弈收益控制的未来发展趋势. 展开更多
关键词 博弈论 收益控制 零行列式策略 演化博弈论 策略设计
原文传递
共演化博弈中的反馈机制 被引量:18
7
作者 王龙 吴特 张艳玲 《控制理论与应用》 EI CAS CSCD 北大核心 2014年第7期823-836,共14页
本文研究共演化动力学在合作演化中的作用.系统的状态由个体的策略决定.系统状态与个体的属性共同演化,形成一种反馈机制.特别是当个体能够根据博弈的结果调整社会关系时,这种调整势必影响未来的博弈.这种反馈机制在适当的时间尺度下,... 本文研究共演化动力学在合作演化中的作用.系统的状态由个体的策略决定.系统状态与个体的属性共同演化,形成一种反馈机制.特别是当个体能够根据博弈的结果调整社会关系时,这种调整势必影响未来的博弈.这种反馈机制在适当的时间尺度下,总是能够促进合作.首先,分析了个体策略与群组属性共演化的情形,在基于个体选择的层面上,结合溯祖理论和演化集合论,给出了区域性利他行为涌现的条件.其次,给出了结构群体中策略选择的参数判据,将两策略判据和适应动力学结合起来,发现通过调整与收益矩阵无关的参数可以实现性能控制.最后,研究了不同的角色分配方案在最后通牒博弈中对公平行为演化的影响,发现当个体的先行者优势或所配置的资源依赖于先前分配结果时,公平的分配方案及对公平的要求得以建立.共演化这种反馈机制在用博弈论解决编队控制、资源配置方案设计等实际问题时显示出广泛的应用前景. 展开更多
关键词 反馈机制 演化动力学 溯祖理论 机制设计 通牒博弈
下载PDF
分布式优化的多智能体方法 被引量:18
8
作者 王龙 卢开红 关永强 《控制理论与应用》 EI CAS CSCD 北大核心 2019年第11期1820-1833,共14页
分布式优化作为分布式协调控制领域中的一个基本而重要的研究课题,近年来,不同领域的众多学者对其产生了广泛的研究兴趣.本文总结归纳了分布式优化的研究现状和近期的研究成果,重点对离线分布式优化和在线分布式优化进行了阐述,并从算... 分布式优化作为分布式协调控制领域中的一个基本而重要的研究课题,近年来,不同领域的众多学者对其产生了广泛的研究兴趣.本文总结归纳了分布式优化的研究现状和近期的研究成果,重点对离线分布式优化和在线分布式优化进行了阐述,并从算法设计和收敛性分析这两个角度进行了剖析.特别地,针对一类混合均衡问题,本文介绍了一类分布式求解算法.最后,阐述了当前尚未解决的问题和未来的研究方向. 展开更多
关键词 多智能体系统 分布式优化 协调控制
下载PDF
回顾与联想
9
作者 黄琳 《控制理论与应用》 EI CAS CSCD 北大核心 2004年第6期850-850,共1页
关键词 《控制理论与应用》 书评
下载PDF
激励机制下合作行为的演化动力学 被引量:8
10
作者 高世萍 武斌 +1 位作者 杜金铭 王龙 《控制理论与应用》 EI CAS CSCD 北大核心 2018年第5期627-636,共10页
探索复杂系统中控制自私个体合作演化的激励机制,是国际系统与控制等诸多领域关注的重要科学问题.研究者曾探讨了引入惩罚机制对系统中个体合作的促进作用.但实际中,惩罚者可能会受到奖励的正激励,以及被惩罚个体报复的负激励影响.本文... 探索复杂系统中控制自私个体合作演化的激励机制,是国际系统与控制等诸多领域关注的重要科学问题.研究者曾探讨了引入惩罚机制对系统中个体合作的促进作用.但实际中,惩罚者可能会受到奖励的正激励,以及被惩罚个体报复的负激励影响.本文基于演化博弈论分别研究分散式和集中式惩罚机制下的合作演化,重点关注对惩罚行为施加不同的激励作用对系统演化的影响.研究发现,当系统中存在对惩罚行为的负激励时,分散式惩罚机制对合作行为的促进作用被完全抑制;然而集中式惩罚机制却依然可以促进合作行为的涌现.另一方面,对惩罚行为的正激励可以有效地抵制负激励的负面影响,从而使合作涌现.特别地,在采用集中式激励的大规模种群中,合作行为和惩罚行为能够在自然选择意义下占优.激励机制的研究对于复杂系统优化调度与配置、群体机器人协同控制等实际问题具有重要的理论意义和应用价值. 展开更多
关键词 演化博弈论 合作行为 激励机制
下载PDF
多智能体协调控制的演化博弈方法 被引量:18
11
作者 王龙 杜金铭 《系统科学与数学》 CSCD 北大核心 2016年第3期302-318,共17页
提出一种基于演化博弈理论的多智能体系统协调控制方法.在所建立的数学模型框架中智能体根据其自身的利益,通过局部交互,在博弈竞争中学习,自主调整其行为.根据系统整体性能的要求,通过选择合适的博弈类型、设计适宜的收益计算方法、更... 提出一种基于演化博弈理论的多智能体系统协调控制方法.在所建立的数学模型框架中智能体根据其自身的利益,通过局部交互,在博弈竞争中学习,自主调整其行为.根据系统整体性能的要求,通过选择合适的博弈类型、设计适宜的收益计算方法、更新进化规则等,实现对多智能体系统的控制.在演化过程中,无需指定某些特定个体的具体动力学行为,只需通过种群的自适应进化即可实现整体目标.以分工合作问题为例,详细解析所提出的控制方法,通过理论分析和仿真验证该方法可以实现多智能体系统的自适应协调控制. 展开更多
关键词 演化博弈理论 多智能体系统 协调控制.
原文传递
复杂动态网络上的传播行为分析 献给清华大学郑大钟教授 被引量:8
12
作者 王龙 武斌 +2 位作者 杜金铭 魏钰婷 周达 《中国科学:信息科学》 CSCD 北大核心 2020年第11期1714-1731,共18页
随着网络科学的兴起,网络上的传播动力学引起了控制论、博弈论、系统科学、人工智能、社会学、经济学、生物学、心理学、物理学、数学和计算机科学等领域的共同关注.虽然网络上的不同传播行为具有各自的传播规律,但其传播特征总是依赖... 随着网络科学的兴起,网络上的传播动力学引起了控制论、博弈论、系统科学、人工智能、社会学、经济学、生物学、心理学、物理学、数学和计算机科学等领域的共同关注.虽然网络上的不同传播行为具有各自的传播规律,但其传播特征总是依赖于网络结构.在实际的复杂网络化系统中,个体间的交互范围不断变化,因此,理解复杂动态网络上的传播行为需要考虑传播动力学与网络演化动力学的耦合.针对当前动态网络上的传播动力学研究主要采用Monte Carlo仿真、缺乏系统理论方法的问题,我们提出随机网络拓扑更新规则,证明该规则为可逆Markov链,并给出其稳态分布,从理论上分析动态网络上的传播动力学.利用该方法,本文以合作演化、疾病传播、疫苗接种为例,给出传播行为分析,揭示动态网络上的演化博弈策略传播行为与疾病传播行为的共性与区别,有望为复杂动态网络上的传播动力学分析提供统一的理论框架. 展开更多
关键词 传播行为 动态网络 演化博弈动力学 疾病传播动力学
原文传递
系统族的鲁棒镇定 被引量:1
13
作者 王恩平 黄琳 耿志勇 《科学通报》 EI CAS CSCD 北大核心 1999年第24期2619-2623,共5页
研究了系统族的鲁棒镇定问题 ,在标称系统分子和分母都存在参数摄动的情况下 ,得到了系统族存在鲁棒控制器的一个以摄动多项式向量的范数所满足的不等式的形式给出的充分条件 ,据此可给出镇定该系统族的控制器集合 .
关键词 系统族 鲁棒镇定 鲁棒控制器 线性矩阵不等式
原文传递
多智能体系统的性能优化 被引量:6
14
作者 马婧瑛 郑元世 王龙 《系统科学与数学》 CSCD 北大核心 2015年第3期270-286,共17页
探讨多智能体系统的性能优化及相关问题.多智能体系统性能优化问题是指给定性能评价指标,设计分布式协议或者在某类分布式协议下优化通信拓扑的边权重或设计通信拓扑图,使系统以最优的性能完成既定任务.按性能指标的评价对象,可将多智... 探讨多智能体系统的性能优化及相关问题.多智能体系统性能优化问题是指给定性能评价指标,设计分布式协议或者在某类分布式协议下优化通信拓扑的边权重或设计通信拓扑图,使系统以最优的性能完成既定任务.按性能指标的评价对象,可将多智能体系统性能优化问题分为基于系统整体性能的优化和基于个体性能的优化.文章首先针对系统整体性能优化问题,分别介绍了多智能体系统的快速一致性问题和综合最优控制问题;并基于线性二次型最优控制理论,得到领航者——跟随者多智能体系统达到一致的最优拓扑是星拓扑.其次,对个体性能优化问题,介绍了利用博弈论研究这一问题的相关成果;并基于零和博弈,得到存在两个竞争性领航者的多智能体系统最优拓扑的判别条件.最后,对这一领域的未来发展趋势做出了一些展望. 展开更多
关键词 多智能体系统 最优控制 有限时间一致性 博弈
原文传递
时序网络控制 被引量:3
15
作者 李阿明 王龙 《系统科学与数学》 CSCD 北大核心 2019年第2期184-202,共19页
近年来,网络科学的发展为探究复杂系统动力学提供了有效方法.复杂网络控制的研究,为我们通过外部输入控制系统状态的演化提供了新的思路.针对时序网络控制这一新的研究方向,文章首先介绍了其可控性方面相关研究现状.其次,文章梳理了在... 近年来,网络科学的发展为探究复杂系统动力学提供了有效方法.复杂网络控制的研究,为我们通过外部输入控制系统状态的演化提供了新的思路.针对时序网络控制这一新的研究方向,文章首先介绍了其可控性方面相关研究现状.其次,文章梳理了在实现系统最优控制时所需考虑的控制能量及控制轨迹等相关研究结果.最后总结了该领域仍需解决的重要问题并展望了未来研究方向. 展开更多
关键词 时序网络 复杂系统 控制 能量 轨迹
原文传递
演化博弈与自组织合作 被引量:16
16
作者 王龙 伏锋 +2 位作者 陈小杰 楚天广 谢广明 《系统科学与数学》 CSCD 北大核心 2007年第3期330-343,共14页
主要研究复杂网络上的演化博弈,首先研究具有社团结构的无标度网络上的演化囚徒困境博弈及Newman-Watts小世界网络中异质性对合作演化的影响,然后考察了在不同合作者和作弊者初始分布配置情况下,不同的初始比例条件对合作水平的影响,且... 主要研究复杂网络上的演化博弈,首先研究具有社团结构的无标度网络上的演化囚徒困境博弈及Newman-Watts小世界网络中异质性对合作演化的影响,然后考察了在不同合作者和作弊者初始分布配置情况下,不同的初始比例条件对合作水平的影响,且在社会网络上研究了雪堆博弈中的合作演化,进一步地,讨论了网络拓扑和博弈动力学的共同演化问题和网络上演化囚徒困境中的强化学习问题,最后给出了复杂网络上演化博弈论的未来发展方向与应用前景。 展开更多
关键词 群体行为 合作 演化博弈论 复杂网络 囚徒困境博弈 雪堆博弈 强化学习 自组织 拓扑 动力学
原文传递
社会网络上的观念动力学 被引量:21
17
作者 王龙 田野 杜金铭 《中国科学:信息科学》 CSCD 北大核心 2018年第1期3-23,共21页
观念动力学是近年来国际系统与控制科学领域的研究热点之一,旨在从动态系统的角度研究社会网络中观念和行为的演化.本文概述了观念动力学的研究现状和发展趋势.首先介绍了观念动力学领域的基本问题和模型.然后结合多智能体系统的相关结... 观念动力学是近年来国际系统与控制科学领域的研究热点之一,旨在从动态系统的角度研究社会网络中观念和行为的演化.本文概述了观念动力学的研究现状和发展趋势.首先介绍了观念动力学领域的基本问题和模型.然后结合多智能体系统的相关结果,分别从个体性质、个体交互方式和个体决策过程3个方面论述了观念动力学的主要研究成果.最后,对该领域的未来发展方向作出展望. 展开更多
关键词 观念动力学 社会网络 多智能体系统 复杂网络 博弈
原文传递
合作演化中的反馈机制 被引量:16
18
作者 王龙 丛睿 李昆 《中国科学:信息科学》 CSCD 2014年第12期1495-1514,共20页
生物和社会等复杂系统中合作行为演化的解释是一个长期悬而未决的重要基本问题,演化博弈理论为合作行为的研究提供了有效的理论框架.代价惩罚,作为博弈中促进合作行为的手段,近年来得到广泛关注与研究.本文首先介绍了合作与演化博弈的... 生物和社会等复杂系统中合作行为演化的解释是一个长期悬而未决的重要基本问题,演化博弈理论为合作行为的研究提供了有效的理论框架.代价惩罚,作为博弈中促进合作行为的手段,近年来得到广泛关注与研究.本文首先介绍了合作与演化博弈的基本概念,综述了代价惩罚相关的实验和理论方面的研究结果,包括惩罚的演化、惩罚对合作的促进、惩罚的负面效应.研究了惩罚的回避对演化动力学产生的影响,以及机构性惩罚与奖励对合作演化的作用,最后总结了惩罚研究目前存在的问题以及可能的研究方向. 展开更多
关键词 博弈 演化动力学 合作 惩罚 奖励 反馈
原文传递
严格正实域的完整刻画和鲁棒严格正实综合方法 被引量:2
19
作者 王龙 郁文生 《中国科学(E辑)》 CSCD 1999年第6期532-545,共14页
引入弱严格正实域的概念 ,讨论了弱严格正实域的性质 ,利用多项式完全判别系统 ,给出系数空间中传递函数严格正实域和弱严格正实域的完整刻画 ,提出一种新的切实可行的系统鲁棒严格正实综合设计方法 .该方法对低阶稳定的区间多项式集或... 引入弱严格正实域的概念 ,讨论了弱严格正实域的性质 ,利用多项式完全判别系统 ,给出系数空间中传递函数严格正实域和弱严格正实域的完整刻画 ,提出一种新的切实可行的系统鲁棒严格正实综合设计方法 .该方法对低阶稳定的区间多项式集或低阶稳定的多项式线段集来说 ,所得条件是充分必要的 ,对于高阶的情形也是十分有效的 ,并用实例说明该方法的有效性 . 展开更多
关键词 控制系统 不确定性 鲁棒综合 严格正实域
原文传递
线性二次二人Stackelberg博弈均衡点求解:一种Q学习方法
20
作者 李曼 秦家虎 王龙 《中国科学:信息科学》 CSCD 北大核心 2022年第6期1083-1097,共15页
近年来,Stackelberg博弈被广泛用于解决信息物理系统安全控制、智能电网能源管理等问题.已有的Stackelberg均衡点求解方法大多需要已知系统模型信息,而在实际应用中模型信息通常难以精确获取,这在一定程度上限制了相关理论研究成果的应... 近年来,Stackelberg博弈被广泛用于解决信息物理系统安全控制、智能电网能源管理等问题.已有的Stackelberg均衡点求解方法大多需要已知系统模型信息,而在实际应用中模型信息通常难以精确获取,这在一定程度上限制了相关理论研究成果的应用.鉴于此,本文研究了不基于系统模型的Stackelberg博弈均衡点的求解方法.具体地,本文考虑线性二次二人Stackelberg博弈,其中博弈状态演化满足线性方程,且成本函数为二次形式.博弈的两个参与者为能够预测另一个体可能响应的个体(即领导者),和根据领导者策略作出最优响应的个体(即跟随者).因为本文考虑线性形式的状态演化和二次形式的成本函数,且领导者先于跟随者采取行动,故领导者和跟随者的决策问题可建模为两层的线性二次型最优控制问题.本文按照从跟随者到领导者的原则,基于动态规划原理推导出最优控制策略.该策略被证明恰好为Stackelberg均衡策略,但其计算需使用系统模型信息.基于此策略,本文提出一种基于执行器–评价器(actor-critic)结构的Q学习算法,解决了系统动力学模型未知情况下线性二次二人Stackelberg博弈均衡点求解问题.此外,本文理论证明了所提算法能够保证系统状态、执行网络和评价网络权重估计误差一致最终有界,并通过数值仿真实验说明基于Q学习算法所得控制策略能够使系统状态稳定,且估计控制策略下的成本函数偏离均衡策略下的成本函数的幅度较小. 展开更多
关键词 线性二次二人Stackelberg博弈 最优控制 模型未知 执行器–评价器结构 Q学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部