控制与决策  2020, Vol. 35 Issue (8): 2029-2036  
0

引用本文 [复制中英文]

杨春曦, 张净, 韩光松, 朱杰. 基于矩形波控制的多智能体系统静态多一致性与收敛性能优化[J]. 控制与决策, 2020, 35(8): 2029-2036.
[复制中文]
YANG Chun-xi, ZHANG Jing, HAN Guang-song, ZHU Jie. Stationary multi-consensus and convergence performance optimization of multi-agent systems via rectangular wave controller[J]. Control and Decision, 2020, 35(8): 2029-2036. DOI: 10.13195/j.kzyjc.2018.1492.
[复制英文]

基金项目

国家自然科学基金项目(61364002, 61273026)

作者简介

杨春曦(1976-), 男, 教授, 博士, 从事网络控制系统、分布式滤波与融合等研究, E-mail: ycx2003@163.com;
张净(1994-), 女, 硕士生, 从事多智能体系统多一致性的研究, E-mail: zhangjing5752@163.com;
韩光松(1984-), 男, 讲师, 博士, 从事多智能体系统、指挥控制等研究, E-mail: hanguangsong@163.com;
朱杰(1992-), 男, 硕士生, 从事分布式滤波与融合的研究, E-mail: kmustzj@163.com

通讯作者

韩光松. E-mail: hanguangsong@163.com

文章历史

收稿日期:2018-10-31
修回日期:2019-02-13
基于矩形波控制的多智能体系统静态多一致性与收敛性能优化
杨春曦 1, 张净 1, 韩光松 2, 朱杰 1     
1. 昆明理工大学 化学工程学院,昆明 650500;
2. 中国人民解放军国防大学 联合作战学院,石家庄 050084
摘要:研究多智能体系统静态多一致性及其收敛性能优化问题.首先, 设计控制作用时间可调的矩形波控制协议, 基于赫尔维茨稳定性判据得到系统多一致的充要条件; 然后, 以系统谱半径最小为优化指标, 采用二分法设计具有快速多一致性特点的参数优化算法; 最后, 通过数值仿真验证所提出的矩形波控制协议的有效性.仿真结果表明, 只要矩形波控制协议中的参数选择适当, 多智能体系统不仅能够实现多一致性, 而且能够大幅度提高系统多一致性收敛速度.
关键词多智能体系统    多一致性    矩形波控制    收敛性能优化    
Stationary multi-consensus and convergence performance optimization of multi-agent systems via rectangular wave controller
YANG Chun-xi 1, ZHANG Jing 1, HAN Guang-song 2, ZHU Jie 1     
1. Faculty of Chemical Engineering, Kunming University of Science and Technology, Kunming 650500, China;
2. Joint Operations College, PLA National Defense University, Shijiazhuang 050084, China
Abstract: Stationary multi-consensus and convergence performance optimization of multi-agent systems via rectangular wave controller are studied. Firstly, a rectangular wave control protocol is designed with adjustable action time, and a necessary and sufficient condition of multi-consensus problem is given based on Hurwitz stability criterion. Then, a parameter optimization algorithm is designed for the faster multi-consensus convergence rate via the dichotomy, and the minimum spectral radius of the multi-agent system is taken as the optimal index in the algorithm. Finally, a numerical simulation is given to show the effectiveness of the rectangular wave control protocol proposed in this paper. These results show that if the suitable parameters of the rectangular wave control protocol are given, the multi-agent systems not only can achieve stationary multi-consensus, but also can improve the convergence rate greatly.
Keywords: multi-agent systems    multi-consensus    rectangular wave control    convergence performance optimization    
0 引言

多智能体系统由大量个体特性简单的智能体组成, 智能体之间通过信息交互和协调, 可以完成单个智能体无法完成的复杂任务, 而一致性问题是多智能体系统协同性研究的基础[1-5].在导弹编队协同突防[6]、协同多目标任务规划[7-8]和外部环境突变等实际应用中, 由于存在多个任务或多种突发情况等事件, 通过多智能体系统的一致性协同只能应对其中一个事件, 而多智能体系统的多协同性却可以同时处理完成多个复杂事件.因此, 近些年针对多智能体系统的多协同性研究受到了学术界的广泛关注.

有关多一致性的研究主要包括多智能体系统的多一致收敛性及其性能优化问题两个方面.针对多一致收敛性, 主要研究包括有向、无向、固定与切换通信拓扑的多智能体系统的多一致性[9], 同构或异构多智能体系统的多一致性[10-13], 有无时延的多智能体系统的多一致性[9, 11], 离散或连续时间的多智能体系统的多一致性[12, 14], 低阶与高阶或整数阶与分数阶多智能体系统的多一致性[15], 采用周期采样[16]、脉冲控制[17]、矩形波控制[18]多智能体系统的多一致性等. Chen等[13]针对半异构多智能体系统和异构多智能体系统的分簇一致性问题, 分别设计了控制协议, 揭示了智能体如何面对集群内耦合和集群间耦合的影响, 并实现了多一致性. Yu等[9]通过引入一个双树形变换, 得到了一个降阶系统, 研究了具有拓扑切换和通信延迟的多智能体系统的分组一致性问题, 其通信拓扑是在有限的几种拓扑间任意切换, 且考虑了通信延迟.韩光松[17]研究了基于位置采样数据的多智能体系统的脉冲多一致性问题, 设计了针对二阶多智能体系统, 可以达到静态和动态多一致性分布式脉冲控制协议, 得到了多智能体系统在该协议下达到多一致的充要条件.针对多一致性性能优化的研究主要针对能量节约, Ma等[14]和Hu等[19]利用事件驱动控制来考虑多智能体系统的多一致性能量消耗的优化问题.

文献[18]中, Han等研究了基于矩形波控制的二阶线性离散多智能体系统的多一致性问题.然而, 该控制协议的执行时间与控制强度成反比, 且当控制执行时间分别为零或最大时, 该控制协议分别等价为脉冲控制协议和采样周期控制协议.考虑到若该协议的控制执行时间过小, 会导致控制强度过大, 此时可近似为脉冲控制, 则智能体的状态在采样时刻会发生跳变.在一些实际系统中智能体的一些状态不能突然跳变, 故该方法存在一定缺陷.

鉴于在战场侦察与评估、多目标快速跟踪、多目标快速估计等实时性要求较强的应用领域, 多一致性快速收敛有着较好的应用前景.本文基于二阶线性离散多智能体系统, 设计一种使得二阶多智能体系统达到静态多一致的分布式矩形波控制协议, 以解决控制协议难于实践应用的问题, 并推导出系统达到静态多一致时控制参数需要满足的充要条件, 最后基于二分法设计多一致性收敛性能的优化算法.

1 预备知识与问题描述 1.1 预备知识

本文所用的集合: C为复数集合, Rn × nn × n的实矩阵集合, N为自然数集合.

1.1.1 代数图理论

代数图理论[20]是研究多智能体网络的一个重要工具.将每个智能体看作一个节点, 各节点之间的通信看作边, 这些边是有向或无向的, 节点之间的信息交换过程可以用有向图或无向图表示.

本文采用有向图G={V, E, A}描述多智能体网络的通信拓扑, 其中V={1, 2, ..., n}表示n个节点的集合; EV× V表示边集合, 从智能体j到智能体i的信息传输通道可以用有向图G的一条边eij=(j, i)∈ E来表示; A=[aij]∈Rn × n为非负邻接矩阵, 表示节点之间的连接关系, 当且仅当eijE时, aij>0(ij), 否则aij=0.定义Ni={jV:(j, i)∈ E}为节点i的入邻居集合.

对于多智能体系统的有向通信拓扑图G, 可以采用拉普拉斯矩阵L = [lij] ∈ Rn × n来描述, 其中L = D - A, 对角矩阵D=diag[d11, ..., dnn]为图G的度矩阵, A = [aij] ∈ Rn × n为图G的非负邻接矩阵, 则拉普拉斯矩阵L的元素可以表示为

1.1.2 相关定义及引理

为方便问题的描述与分析, 下面首先给出相关的定义及引理.

定义1  假设多智能体网络G={V, E, A}包含有m个子网络Gk={Vk, Ek, Ak}, 2≤mn, k=1, 2, ..., m, 其中VkV, EkE.矩阵A由代表子网络的分块矩阵Ak构成, 当且仅当∀ Vk ≠∅, = V, 且对于任意kk'都有VkVk' =∅时, 称多智能体网络G={V, E, A}由m个子网络和网络内部及网络之间的边集合构成.

引理1[21]  设矩阵, A11, A12, A21, A22Rn × n.若矩阵A11A12A21A22相互可以两两交换, 则det (A) = det (A11A22 - A12A21).

引理2[18] 设a, bC, 当且仅当方程(r2 + ar + b)z2 + 2(r2 - b)z + r2 - ar + b = 0的所有根均分布在左半平面内时, 方程s2 + as + b = 0的所有根均分布在半径为r的圆内.

引理3[22] 设存在4个标量m, n, p, qC构成的多项式Q(z) = z2 + (m + ni)z + p + qi, 当且仅当m > 0且mnq + m2p - q2 > 0时, Q(z)是赫尔维茨稳定.

1.2 问题描述

考虑满足二阶线性离散动力学方程的多智能体系统

(1)

其中: x(tl)、v(tl)、u(tl)分别表示智能体在t= tl时刻的位置、速度和控制输入, 智能体在采样时刻进行通信, 采样周期h = tl + 1 - tl是一个固定不变的正常数.

为了描述多智能体系统达到多一致状态, 假设智能体i所在的子网络为Gi, Gi=Gj表示智能体i和智能体j在同一个子网络中, GiGj则表示智能体i和智能体j在两个不同的子网络中, 作如下定义.

定义2  对于任意状态初始值, 各子网络都满足

则子网络内均达到一致状态.在此基础上, 若多智能体系统(1)都满足

则系统达到静态多一致.

为定性描述不同智能体之间的关系, 文献[17]引入智能调节因子ζij来描述智能体j对智能体i的影响, 而各智能体之间存在合作、竞争或弃权3种关系.若Gi=Gj, 则智能体i和智能体j只存在合作关系; 若GiGj, 则智能体i和智能体j存在竞争、合作或弃权关系.当多智能体系统增加了智能调节因子后, 由于网络的拓扑关系不完全满足拉普拉斯矩阵, 为便于矩形波控制协议的描述, 定义了一个关系矩阵用于表示具有智能调节因子的多智能体系统的网络拓扑关系.

定义3[17]  关系矩阵L=[lij] ∈ Rn × n中的元素可表示为

关系矩阵L的分块阵表示为

其中LijRni × nj.

为使多智能体系统(1)达到静态多一致, 设计下面的分布式矩形波控制协议:

(2)

其中: lN, 矩形波控制执行时间为σ∈ (0, h], 加权因子为a ∈ (0, 1).

将式(2)代入(1), 则多智能体系统可以表示为

(3)
(4)
(5)

将式(3)~ (5)改写为矩阵形式, 则有

(6)
(7)

将式(6)代入(7), 得到两个相邻时间段多智能体系统的线性离散动态方程

(8)

其中闭环状态矩阵

2 主要结果

下面考虑多智能体系统(1)能够达到静态多一致的稳定条件和实现快速多一致性的定理和算法.

2.1 静态多一致性

定理1  对于给定的关系矩阵L和采样周期h, 矩形波控制执行时间σ ∈ (0, h], 加权因子a∈(0, 1), 设λi表示矩阵L的第i个特征值.矩阵Γm个特征值1, 其他特征值分布在单位圆内, 当且仅当矩阵Lm个特征值0, 非0特征值具有正实部时, 系统控制参数σa满足

(9)
(10)

其中: H = σ2| λi|2, I = σ Re(λi), J = 4[Im(λi)]2.在矩形波控制协议(2)的作用下, 多智能体系统(1)达到静态多一致.

证明  根据引理1计算得到矩阵Γ的特征多项式

因此, 特征方程det (sI2n - Γ) = 0的根满足

(11)

λi = 0时, 有s1 = 1, s2 = 1 - σ +σ a, 若使Γ的特征值分布在单位圆内, 则|s2| < 1, 得

λi ≠ 0时, 寻找矩阵Γ的特征值分布在单位圆内的充要条件.根据引理2对式(11)进行双线性变换s=(z + 1)/(z - 1), 可得方程

(12)

将式(12)整理为一个以z为变量的二阶方程,则

(13)

根据引理3, 对照式(13)可得

Qi(z)是赫尔维茨稳定的, 当且仅当满足

(14)
(15)

由式(14)可得Re(λi) > 0, 整理式(15)可得

(16)

H = σ2| λi|2, I = σ Re(λi), J=4[Im(λi)]2, 当且仅当矩阵L的非0特征值具有正实部时, 对于一个较小的权值a(该权值通常小于0.5), 可近似忽略该权值的高阶项, 则式(16)简化为

基于引理3, 当式(9)与(10)同时满足时, Qi(z)是赫尔维茨稳定的, 即多智能体系统(1)达到静态多一致.

由线性系统理论可知, 谱半径r ∈ (0, 1]不仅与系统的稳定性有关, 还会影响到系统的动、稳态性能.为进一步提高系统的收敛速度, 将定理2中的谱半径r看作一个变量, 当极点分布的谱半径r < 1时, 满足条件的所有闭环极点不仅能使得系统渐近稳定, 而且还具有1 -r的稳定裕度.于是, 得到定理2所示的性能优化定理.

定理2  对于给定的关系矩阵L和采样周期h, 矩形波控制执行时间σ∈(0, h], 加权因子a∈ (0, 1), 谱半径r ∈ (0, 1), 当且仅当系统控制参数σa满足

(17)
(18)

其中

在矩形波控制协议(2)的作用下, 多智能体系统(1)必能达到静态多一致, 且具有1 -r的稳定裕度.

证明  根据引理1计算得到矩阵Γ的特征多项式(11).考虑当λi ≠ 0时, 寻找矩阵Γ的特征值分布在单位圆内的充要条件.根据引理2对式(11)进行双线性变换, 其中r ∈ (0, 1), 可得

当且仅当方程

的所有根分布在左半平面内时, 矩阵Γ的特征值分布在半径为r的圆内.定义

(19)

其中

αβεγηθ代入式(19)可得

(20)

分离出式(19)中λi的虚部和实部, 则式(20)为

(21)

将式(18)中的BWSFY代入式(21), 可得

(22)

应用引理3, 得到

因此, Qi(z)是赫尔维茨稳定的, 当且仅当满足

(23)
(24)

由于W>0, 式(23)和(24)可分别简化为式(17)和(18).当式(17)和(18)同时满足时, Qi(z)是赫尔维茨稳定的, 多智能体系统(1)不仅达到静态多一致, 且具有1 -r的稳定裕度.

2.2 多一致性收敛性能优化

由线性系统理论可知, 极点分布的圆半径越小, 离散系统的闭环极点映射在s域中的所对应闭环极点距离虚轴越远, 系统的收敛速度越快.给定关系矩阵L和采样周期h, 矩形波控制执行时间σ ∈ (0, h], 加权因子a∈ (0, 1), 如果能够找到使得式(17)和(18)同时成立的最小谱半径r*, 则求得的σ *a*为快速多一致性收敛的次优化参数.因此, 多智能体系统(1)的收敛性能优化可以转化为如下问题:

考虑到r ∈ (0, 1], 因此, 采用能快速解决具有单个最小值的离散变量优化问题的二分法寻优, 进而找到具有次优收敛性能的多智能体系统多一致性控制参数.

算法1  基于二分法的谱半径寻优算法的具体运算步骤如下.

step 1:给定h的上限为hmax和关系矩阵L.首先求出L的特征值λi, i = 1, 2, ..., n, 然后设定其它3个参数的初始范围, 其中σ ∈ (0, min(h, 2/(1 -a))], a ∈ (0, 1)和h ∈ (0.1, hmax).这里取a的迭代步长为0.01; h的迭代步长为0.1; σ的迭代步长为0.1;谱半径r的初始上限为rmax = 1, 初始下限为rmin = 0.

step 2:判断谱半径r的最大值与最小值的差值是否满足条件rmax - rmin > Δ r, 如条件满足则继续step 3, 否则转移到step 6.

step 3:将λiahσ代入式(16)和(17), 计算所选择的控制参数是否满足赫尔维茨稳定条件.

step 4:若满足赫尔维茨稳定条件, 则该r值大于最小谱半径, 令rmax=r, r=(rmax + rmin)/2, 然后返回step 3.

step 5:如果所取的控制参数不满足赫尔维茨稳定条件, 则说明该r值已经小于其最小值, 令rmin = r, r =(rmax+rmin)/2, 然后返回step 3.

step 6:若条件rmax - rmin > Δ r不成立, 则程序停止运行, 并记录下当前的谱半径r及对应的ahσ值.当前r即为最小谱半径, 而相应的控制参数即为使得系统收敛速度次优的优化参数.

注1  不等式rmax - rmin > Δ r为是否终止程序运行的判别条件, 其中Δ r为给定常数, 表示谱半径的寻优精度, 这里取Δ r=0.000 1.

3 数值仿真

例1  考虑一个由5个智能体节点组成的多智能体系统[18], 该系统是由两个子网络构成的通信拓扑:子网络1包括智能体1、2、3, 子网络2包括智能体4、5.相应的关系邻接矩阵A和关系矩阵L如下所示:

经过计算, 可以得到矩阵L的特征值分别为

基于二分法的谱半径寻优, 根据快速多一致性参数优化步骤, 得到最小谱半径为r = 0.549 3.浅色大区域表示r = 1, h = 2.5时aσ的可行域; 而深色小区域表示h不变, r = 0.549 3时aσ的可行区域, 如图 1所示.

图 1 aσ的可行域

设定初始状态向量x(0) = [4, -3, 4, -3, 5]T, v(0) = [-2, -4, -3, 1, 0]T, 从图 1中浅色大区域选择满足多一致性条件的非优化参数a = 0.07和σ = 0.3, 其静态矩形波多一致的状态轨线如图 2所示.

图 2 非优化参数时5个智能体的状态轨线

图 1中深色小区域选择满足多一致性条件且谱半径较小的优化参数a=0.14和σ = 1.81, 初始条件不变, 多智能体收敛结果如图 3所示.可见系统的位置向量和速度向量均在20 s左右达到静态多一致.

图 3 优化参数时5个智能体的状态轨线

比较图 2图 3可知, 在相同的初始条件下, 选取非优化参数时系统的收敛速度小于同等条件下优化参数情况下的收敛速度, 表明基于二分法的多一致性收敛性能优化算法是有效的, 可以大幅度提高系统达到多一致的收敛速度.

图 4是文献[18]在取与图 3相同优化参数条件下的多一致状态轨线.比较图 4图 3可知, 在分布式矩形波控制协议(2)作用下, 采用优化参数的多智能体系统的收敛速度较快, 说明本文设计的分布式矩形波控制协议具有较好的快速性能.

图 4 相同条件下5个智能体的状态轨线
4 结论

本文研究了多智能体系统的静态多一致与系统收敛性能优化问题.设计了多智能体系统达到静态多一致的分布式矩形波控制协议, 将多智能体系统的静态多一致问题转化成离散线性系统的稳定性问题, 并推导出系统达到静态多一致时控制参数需要满足的充要条件.将多智能体系统的快速多一致性优化问题转化为离散线性系统的谱半径寻优问题, 并基于二分法设计出能找到最小谱半径的优化算法, 实现了多智能体系统快速多一致性的优化.

参考文献
[1]
Feng Y Z, Xu S Y, Lewis F L, et al. Consensus of heterogeneous first-and second-order multi-agent systems with directed communication topologies[J]. International Journal of Robust and Nonlinear Control, 2015, 25(3): 362-375. DOI:10.1002/rnc.3090
[2]
Hu B, Guan Z H, Jiang X W, et al. On consensus performance of nonlinear multi-agent systems with hybrid control[J]. Journal of the Franklin Institute, 2016, 353(13): 3133-3150. DOI:10.1016/j.jfranklin.2016.05.010
[3]
Yoon M G. Consensus of adaptive multi-agent systems[J]. Systems and Control Letters, 2017, 102: 9-14. DOI:10.1016/j.sysconle.2016.12.006
[4]
王伟, 刘付显, 徐浩. 基于记忆状态的多智能体系统快速分组一致性[J]. 控制与决策, 2017, 32(3): 535-540.
(Wang W, Liu F X, Xu H. Fast group consensus of multi-agent systems based on memory states[J]. Control and Decision, 2017, 32(3): 535-540.)
[5]
黄红伟, 黄天民, 吴胜. 事件触发机制下的二阶多智能体系统的一致性[J]. 控制与决策, 2017, 32(12): 2261-2267.
(Huang H W, Huang T M, Wu S. Event-triggered consensus control of second-order multi-agent systems[J]. Control and Decision, 2017, 32(12): 2261-2267.)
[6]
王芳.导弹编队协同突防-攻击一体化队形优化设计及最优控制研究[D].哈尔滨: 哈尔滨工业大学航天学院, 2016.
(Wang F. Research on formation optimal design and optimal control for integrative penetration and attack of missile formation cooperation[D]. Harbin: School of Astronautics, Harbin Institute of Technology, 2016.)
[7]
苏菲.动态环境下多UCAV分布式在线协同任务规划技术研究[D].长沙: 国防科学技术大学系统工程学院, 2013.
(Su F. Research on distributed online cooperative mission planning for multiple unmanned combat aerial vehicles in dynamic environment[D]. Changsha: School of Systems Engineering, National University of Defense Technology, 2013.)
[8]
刘安焘.多UCAV在线协同任务分配技术研究[D].西安: 西安电子科技大学计算机学院, 2015.
(Liu A T. A study of online collaborative task allocation technology for multiple unmanned combat aerial vehicles[D]. Xi'an: School of Computing, Xidian University, 2015.)
[9]
Yu J Y, Wang L. Group consensus in multi-agent systems with switching topologies and communication delays[J]. Systems and Control Letters, 2010, 59(6): 340-348. DOI:10.1016/j.sysconle.2010.03.009
[10]
Hu H X, Yu W, Xuan Q, et al. Group consensus for heterogeneous multi-agent systems with parametric uncertainties[J]. Neurocomputing, 2014, 142(1): 383-392.
[11]
Wen G G, Yu Y G, Peng Z X, et al. Dynamical group consensus of heterogenous multi-agent systems with input time delays[J]. Neurocomputing, 2016, 175: 278-286. DOI:10.1016/j.neucom.2015.10.060
[12]
Feng Y Z, Zheng W X. Group consensus control for discrete-time heterogeneous first-and second-order multi-agent systems[J]. IET Control Theory and Applications, 2018, 12(6): 753-760. DOI:10.1049/iet-cta.2017.0728
[13]
Chen K R, Wang J W, Zhang Y, et al. Cluster consensus of heterogeneous linear multi-agent systems[J]. IET Control Theory and Applications, 2018, 12(11): 1533-1542. DOI:10.1049/iet-cta.2017.1244
[14]
Ma H W, Wang D, Liu D R, et al. Continuous-time group consensus using distributed event-triggered control[C]. The 7th International Conference on Advanced Computational Intelligence. Mount Wuyi: IEEE, 2015: 174-178.
[15]
陈洁.复杂多自主体网络的多协同分析与控制设计[D].武汉: 华中科技大学自动化学院, 2015.
(Chen J. Analysis and design on multi-collaboration of complex multi-agent networks[D]. Wuhan: School of Automation, Huazhong University of Science and Technology, 2015.)
[16]
Yu J Y, Yu M, Hu J P, et al. Group consensus in multi-agent systems with sampled data[C]. Proc of the 32nd Chinese Control Conf. Xi'an: IEEE, 2013: 7168-7172.
[17]
韩光松.多智能体系统的多一致性与多跟踪性研究[D].武汉: 华中科技大学自动化学院, 2015.
(Han G S. On multi-consensus and multi-tracking of mulit-agent systems[D]. Wuhan: School of Automation, Huazhong University of Science and Technology, 2015.)
[18]
Han G S, Guan Z H, Li J, et al. Multi-consensus of multi-agent networks via a rectangular impulsive approach[J]. Systems and Control Letters, 2015, 76: 28-34. DOI:10.1016/j.sysconle.2014.11.010
[19]
Hu B, Guan Z H, Jiang X W, et al. Event-driven multi-consensus of multi-agent networks with repulsive links[J]. Information Sciences, 2016, 373: 110-123. DOI:10.1016/j.ins.2016.08.079
[20]
Bigges N. Algebraic graph theory[M]. 2nd ed. Cambridge: Cambridge University, 1993: 1-12.
[21]
Kovacs I, Silver D S. Determinants of commuting-block matrices[J]. American Mathematical Monthly, 1999, 106(10): 950-952. DOI:10.1080/00029890.1999.12005145
[22]
Parks P C, Hahn V. Stability theory[M]. New Jersey: Prentice-Hall, 1993: 55-58.