摘要
针对高轨高价值目标护卫问题,提出了一种基于可达域覆盖的多航天器协同护卫策略。从相对运动视角对协同护卫任务进行了描述,并将威胁源多脉冲机动可达域问题建模为凸优化问题求解。在滚动优化框架下,根据动态更新的威胁源终端可达域,设计协同护卫平面及护卫点,以此为终端位置约束构建多航天器协同轨迹规划模型,生成相应护卫轨迹。仿真结果表明,所提出的可达域分析方法能够快速计算威胁源终端可达域,协同护卫策略在多个场景下均能有效阻止威胁源,且护卫成功率随护卫航天器机动能力增强而增大。
Abstract
Aiming at guarding high-orbit high-value targets, a multi-spacecraft cooperative guard strategy based on reachable domain coverage was proposed. The cooperative guard mission was described from the perspective of relative motion, and the multi-pulse reachable domain of the threat was modeled as a convex optimization problem. In the framework of receding optimization, the guard planes and points were designed based on the dynamically updated terminal reachable domain of threat, and a multi-spacecraft cooperative trajectory planning model was constructed with the guard points as terminal position constraints, the corresponding guard trajectories were generated. Simulation results show that the proposed method can quickly calculate the terminal reachable domain of the threat. The cooperative guard strategy can effectively prevent the threat in multiple scenarios, and the guard success rate increases with the enhancement of the maneuvering ability of the guard spacecraft.
高轨航天器在卫星通信、预警监视、空间环境监测和未知天体探测等诸多领域发挥着不可替代的作用[1]。 “地球同步轨道空间态势感知计划”和“局部空间自主导航与制导试验”等项目相继开展[2],在提高空间接近与操控技术自主性和可靠性的同时,也对高轨航天器的安全运行造成了潜在的威胁。
为应对近距离操控的潜在威胁,众多学者从航天器轨道追逃博弈视角进行了研究[3-5]。基于微分对策理论将连续推力轨道追逃问题描述为双人零和博弈问题,并通过极大值原理将其转化为两点边值问题,进而采用优化算法求解追踪器和逃逸器的最优控制策略,制导策略的时效性是其中一项关键指标[6-7]。然而,受限于机动能力和任务需求,位于高轨的大型通信卫星、导航卫星等高价值目标不适宜进行大范围轨道机动,可选用多颗伴飞航天器实施协同护卫。
协同护卫由防空反导领域的协同拦截概念发展而来,指防御方在信息融合的基础上发射多枚拦截弹防御来袭目标,以摧毁或阻止对方进入既定空域[8]。在多弹协同拦截中,动态任务分配和协同制导律设计是两大难点。胡建以拦截器协同拦截概率为优化目标,提出融合贪婪算法的改进遗传算法,设计一种分布式多拦截器目标分配方法,仿真表明该算法具有通信量小、计算速度快、可拓展性强等优点[9]。针对多个低速拦截弹拦截高超声速目标拦截问题,Liu等设计了一种三维自适应滑模协同制导控制律,通过与传统的比例导引法对比验证算法的有效性和优越性[10]。Zhai等针对在信息对称和不对称条件下的机动目标拦截问题,提出一种基于相对距离、相对速度和剩余飞行时间的微分对策协同制导律[11]。王龙等基于区域覆盖建立多飞行器协同拦截模型,针对同时拦截和分时拦截两类典型场景分别设计协同拦截制导率,对拦截所需飞行器数量、中末交班时飞行器位置散布和拦截时间间隔等参数做出优化[12-13]。由于轨道动力学模型和机动能力的不同,防空领域的协同拦截策略难以直接应用于轨道追逃博弈问题。现有文献对航天器轨道追逃问题的研究多基于连续推力假设,且对多航天器协同护卫策略的研究较少。本文借鉴导弹拦截领域区域覆盖的思想,在快速预测威胁源终端可达域的基础上,利用多个护卫航天器覆盖威胁源的终端可达域,并在滚动优化的框架下更新护卫航天器的控制策略,以提高护卫成功率。
首先,从相对运动视角对协同护卫任务进行了描述。其次,将威胁源多脉冲机动可达域问题建模为凸优化问题求解。然后,在滚动优化的框架下,根据动态更新的威胁源终端可达域设计护卫点,以此为终端位置约束生成护卫轨迹。最后,基于数值仿真验证威胁源终端可达域计算方法和多航天器协同护卫策略的有效性,并给出多航天器的有效防御区域。
1 问题描述
航天器相对运动通常在如图1所示的Hill坐标系中表示,坐标轴原点位于主航天器质心处,x轴与主航天器的地心矢径方向一致,y轴在轨道面内指向运动方向,z轴由右手法则确定。

图1Hill坐标系示意图
Fig.1Diagram of Hill coordinate system
当主航天器位于近圆轨道,且两航天器间的距离远小于主航天器的轨道半径时,从航天器在Hill坐标系中的相对运动方程可简化为Clohessy-Wiltshire方程,即
(1)
其中,n为主航天器平均轨道角速度,为从航天器的相对状态,a=[ax,ay,az]T为控制加速度。若初始相对状态中的长期项为零,从航天器可绕主航天器进行闭环周期性绕飞,且无须额外消耗燃料[14],即
(2)
基于上述绕飞轨道特性,可在目标航天器周围部署多个小型护卫航天器执行巡视、护卫的任务,如图2所示。受限于护卫航天器的机动能力和感知能力,当威胁源逼近我方高轨高价值目标数千米范围内时,多个护卫航天器会展开协同护卫,阻止威胁源的近距离绕飞、悬停等操作。

图2多航天器协同护卫场景
Fig.2Cooperative guard scenario of multi-spacecraft
护卫航天器的防御距离Rd和避碰距离Rcol如图3所示。若威胁源与护卫航天器间距离小于等于Rd,则认为威胁源已进入护卫航天器的防御范围内,护卫航天器成功阻止威胁源,即
(3)
式中,,Xg和Xw分别表示护卫航天器和威胁源的相对状态。

图3防御距离Rd和避碰距离Rcol
Fig.3Defense domain Rd and collision avoidance domain Rcol
为避免航天器间发生碰撞,护卫航天器与目标航天器以及其他护卫航天器间的距离大于避碰距离Rcol。
(4)
其中:i,j=1,2,···,Ns且i≠j,Ns为护卫航天器数量; Xt为目标航天器的相对状态。
2 威胁源终端可达域计算方法
由于威胁源具备机动能力,且无法事先获取其机动策略,目标航天器可根据观测的威胁源相对状态,估算威胁源在终端时刻的相对可达域,为护卫航天器的护卫点设计提供参考。
假设威胁源采用脉冲推力,推力大小和方向可调,且两次脉冲间隔时间为Timp,则单次脉冲产生的速度增量可表示为
(5)
式中:Δv∈[0,Δvmax]为脉冲速度大小;α,β∈[0,2π]分别为控制力在轨道面内和面外的夹角。给定一组控制量,则威胁源在N步机动后的相对状态可表示为
(6)
式中,Xw0为威胁源初始相对状态,Φ和Φv为相对状态和相对速度转移矩阵。
求解威胁源在N步机动后终端可达域最直接的思路是基于蒙特卡罗采样法对每一步的控制量Δvi进行采样,再利用轨道外推得到威胁源的终端位置。所有采样点终端位置的集合记为威胁源的N步机动后的终端可达域D(tN,t0)。
(7)
式中,m为蒙特卡罗采样点个数。基于蒙特卡罗法的求解策略思路简单,但随着机动步数增多,计算量呈指数增长,计算效率较低,且需占用大量内存,难以应用于计算资源和能耗有限的空间环境。
若将脉冲机动当作一种控制偏差,威胁源的终端可达域可基于协方差分析法近似为空间椭球[15],并由椭球球心re=[xe,ye,ze]T和半轴长度a、b、c表征。
(8)
式中,re=CΦ(tN,t0)Xt0是威胁源无控状态下的终端相对位置。因此,求解威胁源的终端可达域可转化为求解三个半轴长度。
威胁源终端位置在三个坐标轴方向的投影长度Ji可表示为
(9)
式中,i∈{x,y,z},ni为三个坐标轴方向的单位法向量,rf=CXw(tf)为威胁源终端位置。终端可达域示意如图4所示,Jx取最大值时对应的取值为椭球半轴a。同理,b=max Jy,c=max Jz。

图4终端可达域示意图
Fig.4Diagram of terminal reachable domain
综合考虑动力学方程、初始边界条件和控制饱和约束,威胁源的终端可达域求解可建模为离散形式的轨迹规划问题。
(10)
式中,k=0,1,···,N-1表示离散步数。在上述轨迹优化问题中,目标函数和不等式约束为凸函数,等式约束为仿射函数,可进一步转化为凸优化问题,并利用凸优化算法进行求解。凸优化问题的局部最优解即全局最优解,且求解时不需要提供初值,可避免传统非线性优化算法易陷入局部最优解的不足。
3 多航天器协同护卫策略
在给定警戒时间内,若目标航天器位于威胁源的可达域内,则护卫航天器将展开协同护卫机动。在相同的初始状态和机动条件下,若t0<<tN,则威胁源在时刻的相对位置是中的一个点,即。根据威胁源终端可达域的定义,是中所有状态点经过N-N1次机动后的位置的集合,因此。
据此,随着时间推移和剩余机动步数的减少,威胁源在tN时刻的相对可达域逐渐变小。若仅依据初始状态估计威胁源的终端可达域,则需要较多的护卫航天器才能覆盖威胁源的终端可达域,会造成航天器燃料浪费和寿命缩减。在滚动时域优化框架下,目标航天器在每个离散时刻根据更新的威胁源信息,为每个护卫航天器设计护卫点。护卫航天器根据更新的终端边界条件求解开环最优控制问题,并将生成的最优控制序列中的第一步作为实际控制输入作用于动力学系统。滚动时域优化是通过更新的状态信息反复求解最优控制策略,以减小环境不确定性对控制结果的影响,这也是其与传统优化方法的本质区别。
在确定威胁源的终端可达域后,定义垂直于目标航天器到威胁源连线且经过相对可达域中点的平面为护卫平面,如图5所示。护卫平面与终端可达椭球的截面的最大半径为Rp。护卫航天器的防御距离在护卫平面上的投影为半径为Rd的圆形,则多星协同防御问题可以转化为多圆覆盖问题。

图5护卫平面示意图
Fig.5Diagram of guard plane
以三个护卫航天器场景为例,如图6所示,红色三角形和蓝色圆点分别表示护卫平面中点和护卫点。当时,护卫航天器协同防御面积无法完全覆盖护卫平面,则令护卫点等相位地分布在半径为Rd的圆周上,使得协同防御面积较大。当时,三个护卫航天器的协同防御面积能完全覆盖护卫平面,则护卫点在半径为的圆周上等相位排列。
多航天器协同护卫过程需要考虑空间协同、时间协同以及星间避碰约束。空间协同体现在护卫点的选取上,使得护卫航天器的协同护卫面积尽量大。时间协同体现在多个护卫航天器需同时抵达预设的护卫点。星间避碰约束包括护卫航天器间避碰约束以及护卫航天器与目标航天器间避碰约束。综上,护卫航天器的协同轨迹规划问题可表述为

图6护卫点分布
Fig.6Distribution of guard points
(11)
式中:i,j=1,2,···,Ns且i≠j;Xgi(k)、rgi(k)和Δvi(k)分别表示第i个护卫航天器在第k步的相对状态、相对位置和速度增量, k=0,···,N-1; N为护卫航天器离散步数;Xgi0和Pgi为第i个护卫航天器初始相对状态和护卫点的相对位置; 为护卫航天器的最大速度增量。式(11)中第五项约束为护卫航天器间避碰约束,第六项约束为护卫航天器与目标航天器间避碰约束。完整的多航天器协同护卫流程如图7所示,其中tw为目标航天器预警时间。
4 数值仿真
4.1 威胁源终端可达域仿真
假设参考航天器位于地球同步轨道,威胁源的初始相对状态为Xw0=[945.45 m,4 162.15 m,0 m,1.44 m/s,-2.71 m/s,0 m/s]T。单次脉冲最大速度增量为2 m/s,脉冲间隔时间为100 s,分别采用蒙特卡罗法和凸优化法计算多脉冲航天器相对可达域。每次机动在Δv、α和β的取值范围内均匀取20个点,则单次机动需要计算203=8 000个采样点。仿真计算机处理器主频和运行内存分别为1.1 GHz和16 GB。仿真结果如表1和图8所示。

图7多航天器协同护卫流程图
Fig.7Flowchart of multi-spacecraft cooperative guard
表1中参数a、b和c分别表示可达域椭球的半轴参数。由表1可知,蒙特卡罗法和凸优化法在不同机动次数下解得的相对可达域参数相近。图8中蓝点是蒙特卡罗法采样生成的威胁源终端位置点,红色椭球为凸优化法解得的终端可达椭球。图8直观地展示了基于凸优化法生成的相对可达域能有效包络所有蒙特卡罗采样点。
蒙特卡罗法的计算量随机动次数的增加而急剧增大,当机动次数大于等于3时,当前仿真配置因计算机内存不足而计算失败。凸优化法的计算次数不随机动次数的增加而增加,且计算时间都略大于1 s,计算效率较高。综上所述,凸优化法能以较高的计算效率快速求解航天器多脉冲机动的终端可达域。
表1蒙特卡罗法和凸优化仿真结果
Tab.1 Simulation results of Monte Carlo and convex optimization


图8两脉冲机动的终端可达域
Fig.8Terminal reachable domain of two-pulse maneuvering
4.2 多航天器协同护卫仿真
假设威胁源初始相对状态Xw0=[2 000 m,-5 000 m,0 m,0 m/s,0 m/s,0 m/s]T,期望终端状态Xwf=[1 000 m,0 m,0 m,0 m/s,-0.15 m/s,0 m/s]T,进入目标航天器的绕飞轨道。目标航天器预警时间tw=500 s,威胁源单次脉冲最大速度增量Δvmax=2 m/s,脉冲间隔时间Timp=50 s。三个护卫航天器等相位地排列在半短轴为500 m的绕飞轨道上,且与目标航天器轨道共面。护卫航天器单次脉冲最大速度增量为1 m/s,防御距离Rd=200 m,航天器间避碰距离Rcol=50 m。
威胁源的机动轨迹如图9中红色直线所示,红点表示每个离散时刻威胁源的相对位置,图中由大到小、由浅到深的红色三维椭球表示威胁源在不同离散时刻的终端时的相对可达域。由图9可知,随着时间推移和机动步数的减小,威胁源的终端可达域逐渐减小。在机动过程中,护卫航天器无法提前获取威胁源的机动策略,是通过计算威胁源的终端可达域设计护卫点进行协同护卫机动。

图9威胁源机动轨迹与终端可达域
Fig.9Maneuvering trajectory and terminal reachable domain of threat
在t=200 s时,威胁源和护卫航天器的相对位置如图10所示,红色椭球和蓝色椭球分别表示威胁源和护卫航天器在t=500 s时的相对可达域。蓝色实线圆球表示三个护卫航天器在t=500 s时的预期协同防御区域。由图10可知,三个护卫航天器向威胁源抵近方向机动。但此时威胁源的终端可达域较大,三个护卫航天器组成的防御区无法有效覆盖威胁源的相对可达域。
t=404 s时三航天器协同护卫场景如图11所示。由图11可知,威胁源在t=404 s时进入护卫航天器的防御圆球内,表示护卫航天器成功阻止威胁源。此外,威胁源在t=437 s时将进入左侧护卫航天器的防御范围内。上述仿真表明,在当前仿真场景中,在护卫航天器机动能力较弱的条件下能对威胁源进行有效防御。

图10t=200 s时三航天器协同护卫场景
Fig.10Cooperative guard scenario of three spacecraft at t=200 s
在威胁源的初始和终端相对状态不变的情况下,为威胁源设计多条可行的机动轨迹,其他仿真参数不变。仿真结果如图12所示,蓝色的拦截点表示在威胁源进入护卫航天器防御距离时对应的相对位置。当威胁源采用图12中红线所示的不同机动轨迹接近目标航天器时,护卫航天器均能有效阻止威胁源。

图11t=404 s时三航天器协同护卫场景
Fig.11Cooperative guard scenario of three spacecraft at t=404 s

图12威胁源沿不同轨迹接近目标航天器
Fig.12Threat approaches target spacecraft along different trajectories
针对威胁源从不同初始位置接近目标航天器的场景,在威胁源机动能力强于护卫航天器的条件下验证协同护卫策略的有效性。在半径为5 km的圆球表面均匀取81个点作为威胁源的初始位置,威胁源以燃料最优策略接近目标航天器,威胁源和护卫航天器的最大速度增量分别为2 m/s和1 m/s,其他仿真参数保持不变。仿真结果如图13所示,蓝色的拦截点表示威胁源被护卫航天器拦截时的相对位置,当威胁源从不同位置接近目标航天器时,护卫航天器均能有效阻止威胁源。
为进一步验证多航天器协同护卫策略的有效性,在目标航天器2 km的范围内均匀生成4 032个采样点,其中1 344个采样点位于威胁源的可达域内,如图14所示。威胁源采用燃料最优策略机动至每个采样点,护卫航天器在最大速度增量取不同值条件下开展协同护卫仿真,护卫航天器的有效护卫区域如图15所示。

图13威胁源从不同位置接近目标航天器
Fig.13Threat approaches target spacecraft from different positions

图14威胁源可达采样点分布
Fig.14Distribution of threat reachable points

图15护卫航天器在不同最大速度增量下的护卫区域
Fig.15Guard area of guard spacecraft at different maximum speed increments
护卫航天器最大速度增量为1 m/s、1.5 m/s和2 m/s时,分别可防御1 086、1 202和1 236个采样点,对应的护卫成功率分别为80.80%、89.43%和91.96%。由此可见,随着机动能力的增强,护卫航天器的护卫区域和护卫成功率逐渐增大。
5 结论
针对高轨航天器护卫问题,本文提出了一种基于可达域覆盖的多航天器协同护卫策略。将威胁源多脉冲机动可达域问题建模为凸优化问题求解,仿真表明凸优化法计算效率优于蒙特卡罗法,能快速计算威胁源的终端可达域。在滚动优化的框架下,根据动态更新的威胁源终端可达域设计护卫点并生成控制序列,多航天器协同护卫策略在多个仿真场景下均能有效阻止威胁源,且护卫成功率随护卫航天器机动能力增强而增大。