动态多目标完全分布式定时定点包围编队控制
doi: 10.11887/j.issn.1001-2486.24120039
薛皓亮1 , 赵宇1 , 刘恩博1 , 张栋2
1. 西北工业大学自动化学院, 陕西 西安 710129
2. 西北工业大学航天学院, 陕西 西安 710129
基金项目: 国家自然科学基金资助项目(62422315,62573348,52472417) ; 陕西省自然科学基础研究计划基金资助项目(2025JC-YBMS-667) ; 西北工业大学翱翔人才与团队计划基金资助项目(25GH02010366) ; 西北工业大学硕士研究生实践创新能力培育基金资助项目(PF2025070)
Dynamic multi-target fully distributed control for specified-time-area surrounding formation
XUE Haoliang1 , ZHAO Yu1 , LIU Enbo1 , ZHANG Dong2
1. School of Automation, Northwestern Polytechnical University, Xi′an 710129 , China
2. School of Astronautics, Northwestern Polytechnical University, Xi′an 710129 , China
摘要
针对多智能体系统执行包围动态多目标任务过程中编队向量无法完全分布式给出且任务完成时间不确定的问题,提出基于中心位置估计器与包围半径估计器的定时定点包围编队算法。采用动态平均一致性算法设计的中心位置估计器能使每个智能体获得多个动态目标位置的几何中心,通过动态最大一致性算法设计的包围半径估计器能够使每个智能体以分布式方式实时估计出含有最佳包围半径的编队向量。引入“整体规划,分段控制”的思想,同时考虑空间与时间两个维度,在此框架下实现定时定点包围编队。基于代数图论与李雅普诺夫函数证明估计器与控制器在指定时间下可以实现零稳态编队误差。通过数值仿真验证了算法的有效性与准确性。
Abstract
Addressing the challenges of incompletely distributed formation vector determination and uncertain task completion times in multi-agent systems performing dynamic multi-target encirclement tasks, a specified-time-area surrounding formation control algorithm based on the center position estimator and surrounding radius estimator was proposed. The central position estimator designed using the dynamic average consensus algorithm enabled each agent to obtain the geometric center of multiple dynamic target positions. The surrounding radius estimator, designed using a dynamic maximum consensus algorithm, enabled each agent to estimate formation vector with optimal encirclement radius in real-time through a distributed approach. Integrating the concept of "holistic planning and segmented control", the study considered both spatial and temporal dimensions, achieving specified-time-area surrounding formation under the framework. The ability to achieve zero steady-state formation error within a specified time was proven using algebraic graph theory and Lyapunov function theory. Simulation experiments validate the effectiveness and accuracy of the algorithm.
近年来,随着计算机技术、通信技术和自动化技术的飞速发展,多智能体系统协同控制[1-3]通过个体间局部信息交互的方式来完成复杂任务已成为现实,因其分布式控制方式的显著优势吸引了大量学者研究。
包围编队控制作为其中一个热点方向,旨在控制多智能体系统以预期构型对目标实现空间位置上的包围。该问题在多个领域均表现出较大的应用前景。在畜牧业中,可以将成本昂贵的牧羊犬替换为机器人执行放牧任务[4],保证羊群始终在机器人所形成的包围圈内;在森林火灾中,可以派遣多量无人车包围火场[5],根据火势变化实时调整包围大小以构建隔离带。尤其在国防军事领域,包围编队问题更是有着举足轻重的地位。比如:在武装车护送友方辎重车时[6],武装车集群将不携带武器的辎重车集群包围在队形中心,能有效防止其受到攻击;在无人机集群作战中[7],我方无人机集群根据敌方无人机集群位置与构型完成包围后再进行火力打击,能够有效减少战损。因此,研究包围编队问题无疑具有广阔的应用前景。
目前已有大量文献研究了包围编队问题。其中,文献[8]通过循环跟踪策略设计了一种分布式控制协议,实现了在三维空间中对单一静态目标的围捕;文献[9]进一步考虑目标的动态特性,提出了一种分布式非线性控制器,实现了无须全局位置信息的编队跟踪。注意到上述文献中被包围目标为单一目标,因此以目标位置作为包围中心对多智能体系统来说是已知确定的信息。面对现实中更为普遍的多目标集群时,不同位置的目标都会对包围中心产生一定影响且彼此矛盾,每个智能体只能获得个体目标位置信息,包围中心位置对智能体集群来说是未知不确定的信息。
为解决上述难点,实现对多目标集群的包围编队,文献[10]将智能体能获取目标位置的几何中心作为一个重要假设,在满足该假设时,通过一致性算法设计去中心化的位置估计器来估计静态多目标几何中心,并在无向拓扑下设计出一阶积分器系统的包围编队算法。在此基础上,文献[11]则针对动态多目标,采用动态平均一致性算法设计分布式中心位置估计器,在有限时间内估计出编队中心并完成包围编队。文献[12]同样利用动态平均一致性算法设计中心位置估计器,同时引入事件触发机制,在降低系统通信频率的基础上实现了单层和多层包围编队。值得注意的是,上述文献处理多目标包围编队问题时均需设计中心位置估计器以解决不同目标对包围中心产生的矛盾,一致性算法或动态平均一致性算法[13-15]在其中起到了关键性作用。
从时间维度上考虑,已有文献[16-17]基于李雅普诺夫函数有限时间稳定性理论设计分布式估计器估计目标几何中心,同时设计有限时间控制协议在有限时间内实现圆形包围编队,算法收敛速度与精度相比渐近结果大大提高。进一步地,文献[18-19]基于固定时间稳定性理论将多智能体系统编队问题做到了固定时间收敛,在明确的固定时间内能够完成包围编队任务。然而包围编队问题的应用场景大都偏向军事作战,因此对包围编队构型的形成时间应当有更加精确的要求,但很少有文献在实现包围编队时能同时保证定时与定点。以无人机包围打击为例:只有在我方无人机集群完成对目标的包围后才能同时打击目标,若应用上述文献算法,指挥官很难准确给定包围形成的具体时刻,只能估计出一个大致时间,这不仅会增加指挥难度,更容易贻误战机。
注意到大量编队相关文献[16-22]中,编队向量都是提前由某一站在全局视角的角色以集中式方式发放,该角色扮演了指挥官的作用,通常只能通过远距离观察或经验给出一个不准确的包围半径,基于该半径得到的编队向量不仅不够精确,而且不是一种真正意义上的分布式自主编队。同时以该方式获得的包围半径通常是固定不变的,无法根据目标构型实时调整以使最终的包围半径最适合执行后续任务。如图1所示,黄色三角形为中心位置,最初给定的包围半径虽然可以包围目标集群,但目标集群发现智能体集群后必然会做出反应,可能会派出图中红色圈中机动性最强的目标逃离包围圈。如果包围半径可以实时调整,就可以避免这种情况,实现实时包围从而保证最终能成功打击。
1固定包围半径导致的不足
Fig.1Inadequacies resulting from fixed surrounding radius
基于现有研究中存在的不足,本文通过动态平均一致性算法设计中心位置估计器,考虑对更为复杂的动态多目标集群进行包围;同时采用动态最大一致性算法设计包围半径估计器,保证每个智能体以完全分布式方式获得实时最佳的包围半径,从而避免部分目标在包围过程中逃离。引入“整体规划,分段控制”框架,以特定采样序列离散上述两种估计器,使其在指定时间准确收敛。最后通过庞特里亚金极大值原理耦合时间与空间两个维度,设计指定时间下的控制器,最终实现对动态多目标的定时定点包围编队。
1 图论定义及问题描述
1.1 图论
本文用G={vε}表示智能体之间的信息交互拓扑,其中v ={1,2,···,N}表示点的集合,ε v×v则表示边的集合,分别用VLVF表示目标与智能体的集合;用A=aijRn×n表示智能体之间的邻接矩阵,如果智能体i能获得智能体j的相应信息,即满足(ji)∈ε,则aij=1,反之aij=0。i号智能体邻居集合用Bi={ijVF:(ji)∈ε}表示,定义Bi0=Bi∪{i}。智能体之间的度矩阵表示为D=diag{d1d2,···,dN},接着定义D~=diagd-1d-2d-N=D+IN,同时拉普拉斯矩阵定义为L=D-A。定义bii号智能体所能探索到的目标数目。
1.2 系统模型
考虑目标与智能体模型如下:
q ˙ i ( t ) = p i ( t ) , i ν L x ˙ i ( t ) = u i ( t ) + d i ( t ) , i ν F
(1)
其中:xitRnqitRn分别表示智能体与目标的位置信息;uitRn表示智能体的控制输入。ditRn表示智能体的有界扰动:ditd-pitRn表示目标速度。
假设1G={vε}为无向连通图且每个智能体仅能探索到一个对应序号目标的位置信息。
假设2 目标的速度信号有界,即pitp-
1.3 研究问题
定义esit=xit-cit-hit为智能体i的最终编队误差,其中cit=1Nj=1N qjt为目标集群中心位置,hit)为每个智能体的编队向量。则动态多目标定时定点包围编队控制问题可定义为:
定义1 对于系统(1),如果智能体集群对任意预先给定的时间T均有
limtkT =esi(t)=0
(2)
则称系统(1)实现了定时定点包围编队控制。
为实现上述控制目标,引入必要引理如下:
引理1[23] 满足假设1条件下,由于bi=1,定义矩阵Q~=IN-D~+IN-1L+IN,则该矩阵所有特征值均在单位圆内。
2 定时定点包围编队算法设计
2.1 整体思路
本文提出的算法通过为每个智能体设计中心位置估计器与包围半径估计器获得合适的包围中心及包围半径,将二者实时输入控制器实现定时定点包围编队。
控制器的设计通过引入“整体规划,分段控制”的思想实现,其中整体规划指每个智能体通过分布式方式依据当前信息规划自身下一时刻状态,将此状态条件称为终端条件。通过整体规划实现空间维度上的定点编队。分段控制过程中则引入时域映射法实现定时控制目的,将预先给定时间段[0,T)分解为大量离散时间段[t0t1],[t1t2],···。在该序列下最终采样时刻满足limk tk=T。本文选择采样时间序列如下:
t 0 = 0 t k + 1 = t k + δ k δ k = T k ( k + 1 )
(3)
最终以庞特里亚金极大值原理在时间约束条件下驱使智能体状态达到每个时间段的终端条件,实现定时定点包围编队控制目标。
2.2 控制器设计
控制器采用上述“整体规划,分段控制”框架,设计流程如下:
选取t∈[tktk+1]时系统的代价函数:
Jk(t)=tktk+1 12i=1N uiT(t)ui(t)dt
(4)
每个智能体终端约束条件设计如下:
xitk+1=1d~i+1j=1N aijxitk-xjtk-h^itk+h^jtk-c^itk+c^jtk+xitk-c^itk-h^itk+tktk+1 di(τ)dτ
(5)
式中:c^itkh^itk分别为i号智能体中心位置估计器和获得包围半径估计器输出值后的最佳编队向量。对式(4)构造对应哈密顿函数:
Hk(t)=i=1N 12uiT(t)ui(t)+i=1N h~iT(t)ui(t)+di(t)
(6)
其中:h~it为协态变量。代价函数式(4)最小值必要条件与最优极值条件分别如下:
x ˙ i ( t ) = H k ( t ) h ~ i ( t ) = u i ( t ) + d i ( t ) h ~ ˙ i ( t ) = H k ( t ) x i ( t ) = 0
(7)
Hk(t)ui(t)=ui(t)+h~i(t)=0
(8)
因此控制信号uit=-h~it为不变量,同时对状态x˙ittktk+1进行积分,可得:
xitk+1=xitk-h~itk+1-tk+tktk+1 di(τ)dτ
(9)
考虑终端约束条件式(5),定时定点包围编队控制器求解如下:
ui(t)=-h~i(t)=-1δkd~i+1j=1N aijxitk-xjtk-h^itk+h^jtk-c^itk+c^jtk+xitk-c^itk-h^itk
(10)
采用同样的方式设计中心位置估计器:
c^i(t)=-βδk-1j=1N aijc^itk-c^jtk-αδk-1c^itk-qitk-αδk-1vitk+δk-1qitk+1-qitk
(11)
式中:vitk+1=vitk+βj=1N aijc^itk-c^jtk为辅助变量,初始化时要求i=1N vi0=0; αβ均为正参数。
通过将动态最大一致性算法引入式(3)中时间序列可得包围半径估计器:
h ^ i ( t ) = Y R ^ i t k cos 2 π ( i 1 ) N R ^ i t k sin 2 π ( i 1 ) N R ^ i t k = max r i t k , R ^ j t k 1 μ , j B i 0
(12)
其中:ritk=qitk-c^itk2表示智能体itk时刻探索到的目标位置与中心位置估计器输出之间的距离,该信号在每个时刻的变化大小显然有上界并满足ritk-ritk-1Λ; R^it为包围半径估计器对距离包围中心最远目标与包围中心之间距离Rmaxt)的估计值;μΛ为固定参数用来克服最大距离信号降低时无法跟踪的情况;Y≥1用来适当扩张包围圈大小。
备注1 在传统的包围编队方法中,由于缺乏包围半径估计器的设计,系统需要采用集中式控制策略,对所有智能体统一分配固定的包围半径。相比之下,本文提出的上述包围半径估计器无须依赖任何全局信息,能够使每个智能体以完全分布式的方式实时估计出当前时刻的最优包围半径。这种分布式获取包围半径的机制显著提升了系统的灵活性、自主性以及鲁棒性。
3 有效性证明
为证明所提算法的有效性,给出定理如下:
定理1 在假设1与假设2成立条件下,对于多智能体系统(1),如果参数满足0<α<2,0<β<1N-1,则利用基于中心位置估计器(11)与包围半径估计器(12)的分布式控制器(10),可以实现动态多目标定时定点包围编队控制。
证明:证明过程分为三步,分别证明中心位置估计器、包围半径估计器以及控制器可以在预先给定时间T实现零稳态误差。
第一步:定义ecit=c^it-1Nj=1N qjt为中心位置估计器输出的编队中心误差,则第一步需要证明下式成立:
limtT =eci(t)=0
(13)
定义V~tk=Vtk-α-1ZnΔQtk-ZnQtkEctk=ecitkivFVtk=vitkiνFΔqitk=qitk+1-qitkΔQtk=ΔqitkiνF,其中ZN=IN-1N1N1NT。对中心位置估计器(11),从tk-1tk积分并以矩阵形式构造误差系统得:
EctkV~tk=ΩEctk-1V~tk-1+0n×nα-1InZn(1-α)ΔQtk-1-ΔQtk
(14)
式中,Ω=1-αIN-βL-αINβLIN。做如下线性变换:
E^ctkV^tk=T2T1EctkV~tk
(15)
式中,T1=IN0NININT2=T3T0N0NT3TT3=f Ff=1N1NFRN×N-1同时满足fTF=0N-1以及FTF=IN-1。考虑式 (14)和式 (15) 可得:
E^ctkV^tk=Ω¯E^ctk-1V^tk-1+0nα-1T3TZn(1-α)ΔQtk-1-ΔQtk
(16)
式中,Ω¯=T3TIN-βLT3-αIN0N1-αIN不难发现,Ω-是分块上三角矩阵,在假设 1成立的条件下,其特征值为 N个 1-α1-βλiLivL。当参数 αβ同时满足0<α<2,0<β<1N-1时,矩阵Ω-所有特征值除一个在单位圆上外其余均位于单位圆内(盖尔圆盘定理)。将式(16)中向量按照E^ctk=E^cltkE^c[2N]TtNTV^tk=V^1tkV^[2N]TtkT方式拆开可得:
E^c1tkV^1tk=ΨE^c1t0V^1t0
(17)
E^c[2,N]tkV^[2,N]tk=Ψ^E^c[2,N]t0V^[2,N]t0+E
(18)
其中:Ψ^=W~k-αs=0k-1 W~s1-αk-1-s0N-11-αkIN-1Ξ=s=0k-1 W~sFTΔQtk-1-s-1-αk-1-sΔQt0-α-1FTΔQtk-1-αkΔQt0Ψ=1-αs=0k-1 1-αk-1-s01-αk。同时可以得到矩阵W~=IN-1-βFTLF所有特征值均小于 1,系统稳定。对式(15)进行逆变换可得:
Ectk=1-αs=0k-1 (1-α)k-1-sffEct0-αs=0k-1 (1-α)k-1-sfffV~t0+FW~kFTEct0-Fαs=0k-1 (1-α)k-1-sW~sFTEct0+V~t0+α-1ΔQt0+Fs=0k-1 W~sFTΔQtk-1-s
(19)
V~tk=-1-αs=0k-1 (1-α) k-1-sffTEct0+αs=0k-1 (1-α) k-1-sffTV~t0-FWkFTEct0+Fαs=0k-1 (1-α) k-1-sW~sFTEct0+
V~t0+α-1ΔQt0+(1-α)kffT+FFTEct0+V~t0+α-1FFTΔQt0-Fs=0k-1 W~sFTΔQtk-1-s-α-1FFTΔQtk
(20)
为证明能够在预先给定时间T实现零稳态误差,对式(19)与式(20)进行逐项分析。
1)通过|1-α|<1可以扩展算出limk [1-αs=0k-1 1-αk-1-s=limk 1-αk=0因此可以得到Ectk)和V~tk的第一项为零。
2)通过ffTZN=0NfTVt0=0可以得到ffTV~t0=ffTVt0=0,结合等式limk αs=0k-1 1-αk-1-s=1,可推出EctkV~tk的第二项为零。
3)由于limk W~klimk ρW~kIN=0N其中ρW~表示矩阵谱半径,所以Ectk)和V~tk的第三项为零。
4)定义ρW~τ<1EctkV~tk)的第四项具体分析如下:
5)依据limk 1-αk=0可得:当 k→ ∞ 时,V~tk的第五项也趋于零。
6)针对Ectk的第五项和V~tk的第六项,ΔQtk-1-s=Q˙σtk-s-tk-1-sp-δk-s1N其中σ∈[tk-stk-1-s]且q˙的上界为,令δk=Tkk+1则:
limk s=0k-1 W~sΔQtk-1-slimk s=0k-1 ρ (W~) sδk-sp-1Nlimk s=0k-1 τsTk-sp-1N0N
7)V~tk的第七项:由于步长趋于零,则limk ΔQk=0N
综上分析,可得系统在预先给定时间T时的误差满足limtT ecit=0limtT v~it=0即离散时刻中心位置估计器(13)可实现零稳态误差。通过对式(11)从tk-1t积分,连续状态的误差可得:
eci(t)=t-tk-1tk-tk-1-βj=1N aijecitk-1-ecjtk-1+(1-α)ecitk-1-αv~itk-1+2Δqitk-1-1Ni=1N Δqitk-1-1Ni=1N qi(t)+1Ni=1N qitk-1
(21)
k→∞时,δk→0,因此Δqitk)→0,式(21)可放缩为:
limtT eci(t)βρ(L)ecitk-1+(1+α)ecitk-1+αv~itk-1=0
(22)
表明了连续时刻中心位置估计器误差同样为零,即证明了中心位置估计器的有效性。
第二步:包围半径估计器输出误差仅由R^itRmaxt)之间的误差决定,定义每个智能体包围半径估计器误差为erit=R^it-Rmaxt所有智能体中最大误差为ert=maxeritiνF。若该误差可以在 tT时实现零稳态误差,则包围半径估计器可以准确估计含有最佳包围半径的编队向量,即满足:
limtT =h^i(t)-hi(t)=0
(23)
对任意k>0,i号智能体在tk时刻的距离信号ritk)若满足ritk)=Rmaxtk),则
R^itk=ritk=Rmaxtk
(24)
此时erit)=0,对i号智能体所有邻居j号智能体来说R^jtk+1=Rmaxtk-μ考虑产生最大误差的极端情况时,i号智能体的距离信号增加,即
R^itk+1=Rmaxtk+1Rmaxtk+Λ
(25)
j号智能体的包围半径估计器误差为:
eijtk+1(μ+Λ)δk
(26)
假设智能体拓扑图中与i号智能体间隔最远的智能体序号为z,它们间隔路径长度记作ζ,同样考虑产生最大误差的极端情况,智能体z估计的包围半径误差依据上述方式递推可得:
erztk+ζ(μ+Λ)w=kk+ζ-1 δw
(27)
定义整个智能体网络拓扑中距离最远的两个智能体之间的路径长度为ζ-,则所有智能体包围半径估计器的最大误差可放缩为:
ertk+ζ-=maxeritk+ζ-(μ+Λ)w=kk+ζ--1 δw
(28)
tkT时,k→∞,δk→0,因此当采用式(3)的时间序列时,上述误差可进一步放缩:
ertk=ertk+ζ-(μ+Λ)w=kk+ζ--1 δw=0
(29)
由此证明式(23)成立,即证明了包围半径估计器的有效性。
第三步:定义exit=xit-h^it-c^it为控制器误差,第三步需证明下式成立:
limtT =exi(t)=0
(30)
将控制器式(10)代入系统(1)中,从tkt积分并结合exit)的定义可得:
xi(t)=-t-tktk+1-tkdi+1jBi aijexitk-exjtk+exitk+xitk+tkt di(τ)dτ
(31)
Ext=exitiνFXt=xitiνFH^t=h^itivFC^t=c^itivFDt=ditivF。考虑误差矩阵形式可得:
Ex(t)=X(t)-H^(t)-C^(t)=-t-tktk+1-tkD~+IN-1L+ININExtk+Extk+tkt D(τ)dτ-E(t)
(32)
式中,Et=H^t+C^t-H^tk-C^tk代入t=tk+1可得
Extk+1=IN-D~+IN-1L+ININExtk+tktk+1 D(τ)dτ-Etk+1
(33)
由引理 1可得矩阵Q~=IN-D~+IN-1L+IN所有特征值均在单位圆内,同时当 tkT时,tk+1tk=0,考虑到ditd-因此tktk+1 Dτdτ=0 和 Etk+1)=0均成立,从而证明limtkT Extk=0。进一步地,连续时间误差满足:
limtT Ex(t)Q~INExtk+tktk+1 D(τ)dτ-Etk+1=0
(34)
因此表明式 (30)成立。综合上述分析,式(23)和式 (13)均成立,即编队误差满足式(2),证明了本文提出算法可以在预先给定时间 T使得所有智能体实现定时定点包围编队。
备注 2 在理想情况下,若不考虑智能体控制器输出信号上界限制,智能体在任意初始位置分布下均能实现定时定点的包围编队任务,但在实际应用中,由于智能体控制器输出信号往往有上界,因此本文所提“定时定点”包围编队算法的指定时间存在下界,该下界主要受以下因素影响: ①智能体控制输出上界;②智能体与目标的初始位置之差。其具体的关系分析在数值仿真部分进行相应的说明。
备注 3 在实际应用中,为避免 tT时本文算法理论上出现的无限采样问题,可选择较小的采样间隔在 tT时切换为等间隔采样,切换采样方式带来的编队误差是极小可忽略的。
备注 4 在实际应用中,本文算法共需对 αβμY四个参数进行设置,其中 αβ仅要求满足定理 1中给出的限制条件,即可在任意任务需求与环境条件下实现包围编队,其余参数则要求 μΛY≥1,参数 μ的取值可根据目标的速度上界和时间序列进行估计,参数 Y的取值则需考虑具体任务对包围圈大小的要求。
备注 5 相比大多相关研究,本文算法的优势主要体现在以下三点:①算法收敛时间可根据任务需求提前指定且指定时刻控制精度可实现零误差;②包围半径可根据目标构型实时调整;③包围半径能以分布式方式获取。
备注 6 在三维空间包围问题中,当智能体数目较多时,本文所提算法的包围性能与二维空间下的包围性能一致,此时需将包围半径估计器式(12)调整为:
h^i(t)=YR^itk1-zi2cos2πiεgold R^itk1-zi2sin2πiεgold R^itkzi
(35)
式中:zi=2i-1Na-1εgold =5-22为黄金分割比, Na为智能体总数。此时每个智能体将以斐波那契网格的形式均匀覆盖在包围球的表面。当智能体数目较少时,若将包围半径估计器输出值作为智能体所形成几何体的外接球半径,则会使部分特殊位置目标无法被包围而导致包围性能下降,此时可适当扩大参数 Y以提升包围性能。若将包围半径估计器输出值作为智能体形成的几何体的内切球半径,则能够避免上述情况,当共有 8个智能体时,将式(12)调整为:
h^i(t)=Y2R^itkcosπ(2i-1)42R^itksinπ(2i-1)4R^itk,i=1,2,3,4
(36)
h^j(t)=Y2R^jtkcosπ(2j-9)42R^jtksinπ(2j-9)4-R^jtk,j=5,6,7,8
(37)
此时所有智能体将以正方体构型包围目标。
4 数值仿真
在本节中,考虑 6个动力学为一阶积分器类型的智能体与目标组成的系统,在二维空间下对本文所提定时定点包围编队算法进行数值仿真。智能体与目标间的通信拓扑如图2所示。
2智能体与目标间的通信拓扑结构
Fig.2Communication topology between agents and targets
目标的运动轨迹如下:
q1(t)=10t+5,11t2+10Tq2(t)=8t+10,t2+30Tq3(t)=9t+10,12t2+20Tq4(t)=11t+5,t2+15Tq5(t)=12t+5,13t2+25Tq6(t)=10t+10,t2+25T
(38)
智能体初始位置设置为:x1(0)=(15,2)Tx2(0)=(20,4)Tx3(0)=(25,6)Tx4(0)=(30,8)Tx5(0)=(35,10)Tx6(0)=(40,12)T。每个智能体扰动均为:dit)=(sint,sintTivF。部分参数设置为α=1,β=0.1,μ=0.02,T=5 s,其余参数依照算法要求常规设置,仿真时长为8 s。
由于xy两个坐标轴相对解耦,故仅以x轴误差为例说明算法的有效性。图3展示了编队中心误差随时间变化曲线,可以观察出,在T=5 s时中心位置估计器能够准确估计编队中心。图4展示了包围半径误差的变化曲线,同样表明了在T=5 s时包围半径估计器可以准确估计最佳包围半径。图5展示了最终编队误差的变化曲线,说明了本文所设计的算法能够在提前预定时刻实现定时定点包围编队。图6中展示了二维空间下6个智能体包围6个目标的轨迹示意图,进一步直观地验证了本文算法的有效性。
3智能体编队中心误差
Fig.3Formation center errors of agents
4智能体包围半径误差
Fig.4Surrounding radius errors of agents
5智能体定时定点包围编队误差
Fig.5The specified-time-area surrounding formation errors of agents
6智能体与目标总体轨迹
Fig.6Overall trajectory of agents and targets
最后,用所有智能体与目标位置作差后形成列向量的二范数描述智能体与目标初始位置之差,图7图8分别展示了在T=5 s与T=8 s时智能体与目标初始位置之差和控制输入上界间的关系,两幅图均表明在指定时间T固定的前提下,智能体与目标初始位置越远,控制输出上界越大。值得注意的是,指定时间的改变会影响目标的实时动态与最终位置,由于目标的动态往往是不确定的,因此在控制器输出上界确定的条件下,指定时间、控制器输出上界和初始位置差三者间并非简单的函数关系,彼此会相互影响。
7T=5 s时初始位置之差与控制输出上界关系
Fig.7Relationship between the difference in initial position and the upper bound of control output at T=5 s
8T=8 s时初始位置之差与控制输出上界关系
Fig.8Relationship between the difference in initial position and the upper bound of control output at T=8 s
5 结论
随着科技的不断进步,集群作战逐渐成为现代战争中至关重要的一环。本文在此背景下针对动态多目标的定时定点包围编队问题,提出了一种基于中心位置估计器与包围半径估计器的定时定点控制方法。主要贡献有以下三点:
1)基于动态平均一致性算法设计中心位置估计器,实现了对多个动态目标中心位置的精确估计,解决了不同目标对中心位置彼此影响产生的矛盾。
2)基于动态最大一致性算法设计包围半径估计器,实现了对包围半径的实时更新,确保所有目标不会在包围完成前逃离,同时含有最佳包围半径的编队向量由每个智能体以完全分布式方式估计,实现了真正意义上的自主包围编队。
3)引入“整体规划,分段控制”的思想,设计上述两种估计器以及控制器,基于庞特里亚金极大值原理耦合空间与时间维度信息,保证了任意预先给定时间都能实现定时定点包围编队。
1固定包围半径导致的不足
Fig.1Inadequacies resulting from fixed surrounding radius
2智能体与目标间的通信拓扑结构
Fig.2Communication topology between agents and targets
3智能体编队中心误差
Fig.3Formation center errors of agents
4智能体包围半径误差
Fig.4Surrounding radius errors of agents
5智能体定时定点包围编队误差
Fig.5The specified-time-area surrounding formation errors of agents
6智能体与目标总体轨迹
Fig.6Overall trajectory of agents and targets
7T=5 s时初始位置之差与控制输出上界关系
Fig.7Relationship between the difference in initial position and the upper bound of control output at T=5 s
8T=8 s时初始位置之差与控制输出上界关系
Fig.8Relationship between the difference in initial position and the upper bound of control output at T=8 s
ZHI Y Y, ZHAO Z S, QI M C. Event-triggered finite-time consensus control of leader-follower multi-agent systems with unknown velocities[J]. Transactions of the Institute of Measurement and Control,2023,45(13):2515-2525.
YAO Q J. Fixed-time output feedback stabilization of a class of high-order planar nonlinear systems[J]. International Journal of Robust and Nonlinear Control,2022,32(11):6574-6585.
曾志文. 非线性、量化和结构约束的多智能体协同控制研究[D]. 长沙: 国防科学技术大学,2017.ZENG Z W. Multi-agent coordination control with nonlinear dynamics,quantized communication and structure-constraint[D]. Changsha: National University of Defense Technology,2017.(in Chinese)
LIEN J M, BAYAZIT O B, SOWELL R T,et al. Shepherding behaviors[C]//Proceedings of IEEE International Conference on Robotics and Automation. IEEE,2004:4159-4164.
KARMA S, ZORBA E, PALLIS G C,et al. Use of unmanned vehicles in search and rescue operations in forest fires:advantages and limitations observed in a field trial[J]. International Journal of Disaster Risk Reduction,2015,13:307-312.
LAN Y, LIN Z Y, CAO M,et al. A distributed reconfigurable control law for escorting and patrolling missions using teams of unicycles[C]//Proceedings of the 49th IEEE Conference on Decision and Control(CDC),2010:5456-5461.
李富良, 胡荣, 韩康, 等. 无人机集群在空降作战中的运用[J]. 国防科技,2019,40(1):31-34. LI F L, HU R, HAN K,et al. Thoughts on the application of UAV swarm in the airborne operation[J]. National Defense Science & Technology,2019,40(1):31-34.(in Chinese)
KIM T H, SUGIE T. Cooperative control for target-capturing task based on a cyclic pursuit strategy[J]. Automatica,2007,43(8):1426-1431.
LIU T F, JIANG Z P. Distributed formation control of nonholonomic mobile robots without global position measurements[J]. Automatica,2013,49(2):592-600.
CHEN F, REN W, CAO Y C. Surrounding control in cooperative agent networks[J]. Systems & Control Letters,2010,59(11):704-712.
MA D, SUN Y C. Finite-time circle surrounding control for multi-agent systems[J]. International Journal of Control Automation and Systems,2017,15(4):1536-1543.
XU B W, ZHANG H T, DING Y,et al. Event-triggered surrounding formation control of multiagent systems for multiple dynamic targets[J]. IEEE Transactions on Control of Network Systems,2023,10(2):752-764.
KIA S S, CORTÉS J, MARTINEZ S. Dynamic average consensus under limited control authority and privacy requirements[J]. International Journal of Robust and Nonlinear Control,2015,25(13):1941-1966.
ZHAO Y, XIAN C X, WEN G H,et al. Design of distributed event-triggered average tracking algorithms for homogeneous and heterogeneous multiagent systems[J]. IEEE Transactions on Automatic Control,2022,67(3):1269-1284.
ZHOU Y, LIU Y F, XIAN C X,et al. Appointed-time dynamic average consensus:a holistic planning and multi-step control framework[J]. IEEE Transactions on Circuits and Systems Ⅱ-Express Briefs,2023,70(7):2595-2599.
LU X Q, LU R Q, CHEN S H,et al. Finite-time distributed tracking control for multi-agent systems with a virtual leader[J]. IEEE Transactions on Circuits and Systems Ⅰ-Regular Papers,2013,60(2):352-362.
ZHANG L, LI Z G, GAO P. Finite-time surrounding control of multi-agent systems with multiple targets[C]//Proceedings of the 2019 IEEE 8th Data Driven Control and Learning Systems Conference(DDCLS),2019:231-236.
CHENG W L, ZHANG K, JIANG B. Distributed adaptive fixed-time fault-tolerant formation control for heterogeneous multiagent systems with a leader of unknown input[J]. IEEE Transactions on Cybernetics,2023,53(11):7285-7294.
MIAO Q Y, ZHANG K, JIANG B. Fixed-time collision-free fault-tolerant formation control of multi-UAVs under actuator faults[J]. IEEE Transactions on Cybernetics,2024,54(6):3679-3691.
SU L F, HUA Y Z, DONG X W,et al. Distributed asynchronous constrained output formation optimal tracking for multiagent systems with intermittent communications[J]. IEEE Transactions on Cybernetics,2024,54(11):6792-6804.
WANG Q, HUA Y Z, DONG X W,et al. Finite-time time-varying formation tracking for heterogeneous nonlinear multiagent systems using adaptive output regulation[J]. IEEE Transactions on Cybernetics,2024,54(4):2460-2471.
HUA Y Z, DONG X W, HU G Q,et al. Distributed time-varying output formation tracking for heterogeneous linear multiagent systems with a nonautonomous leader of unknown input[J]. IEEE Transactions on Automatic Control,2019,64(10):4292-4299.
LIU Y F, ZHAO Y. Specified-time containment tracking for multi-agent systems:an optimal control approach[C]//Proceedings of 2017 29th Chinese Control And Decision Conference(CCDC),2017:2530-2534.