摘要
为了使异构多无人机协同测绘系统具备面对动态环境的决策能力,在离线任务规划模型和结果的基础上进行动态场景算法应用推广,提出了一种改进分层分布式任务规划框架。其中,基于预规划航迹的任务估值方法考虑了全局成本,估值结果通过受限通信的局部拍卖算法同步更新,避免了任务冲突与局部最优;基于滚动时域预测控制的航迹联合修正方法,满足动态测绘和避障的要求。通过数值仿真在多场景下验证了规划算法的适用性和可靠性。
Abstract
Based on the offline mission planning model and results for the application of dynamic scenario algorithms, an improved hierarchical distributed mission planning framework was proposed to give the heterogeneous multi-UAV (unmanned aerial vehicle) collaborative mapping system the decision-making capability to face the dynamic environment. Among these, the mission valuation method based on pre-planned trajectory took the global cost into account, and the valuation results were updated synchronously by the local auction algorithm with restricted communication, avoiding the mission conflict and local optimum. The joint correction method of trajectory based on rolling time-domain predictive control satisfied the requirements of dynamic mapping and obstacle avoidance. Through numerical simulation in a variety of circumstances, the applicability and dependability of the planning algorithm were confirmed.
Keywords
近20年来,无人机单机技术突破日新月异,航空测绘技术朝着智能、自主化的方向蓬勃发展。但是目前各类测绘平台(旋翼无人机、固定翼无人机、有人机等)仍然处于独立运行各自为战的状态,而单机难以满足大航程、高效率任务的要求。相比之下,多无人机系统执行快速响应测绘任务具有显著的优势。
决策与任务规划系统是实现多无人机自主协同的关键部分。在以往的集中式任务规划研究中,地面站基于对现有环境、任务要求、无人机的有限资源等信息的理解和建模,通过搜索或优化的方式寻找全局最优的任务执行序列,取得了丰硕的成果[1]。在问题建模上,任务规划被广泛描述为协作多任务分配问题[2](cooperative multiple task allocation problem,CMTAP),对异构无人机的运动和作战能力、有限载荷性能和作战资源[3-5]、任务要求多样性[6-7]以及任务环境复杂性[8-9]等系统资源和任务约束进行建模。在算法求解上,最优化方法(如混合整数线性规划器[10]、分支界定法[11])、群智能和启发式方法被应用于不同规模和复杂度的问题模型中,如蚁群系统[12]、遗传算法[13]、粒子群优化[14-15]等。
由于测绘需求、资源可用性和路线特征的差异,这些模型不适合用于协同测绘任务。在先前的工作中,提出了一个完整的算法框架以描述并求解集中式协同测绘任务规划问题[16]。但是,集中式的决策规划方式虽能对模型进行全局优化,但仍存在通信网络易受干扰、计算复杂度高、实时性不足等问题。为了提高机上自主规划能力和面对动态环境的鲁棒性,在线分布式规划方法被广泛研究。文献[17]基于传统市场拍卖算法提出了一种迭代验证策略,在减少机载计算和通信资源信息量的同时,降低了任务分配和路径规划之间的信息耦合影响。文献[18]基于遗传算法提出分布式框架,用于解决耦合任务分配和航迹规划一体化问题。值得注意的是,态势感知的一致性在分布式规划中非常重要,它保证了多无人机对局部任务规划结果的认同。文献[19]结合信息一致协调方法和拍卖算法的特点,采用一套均等规则完成决策,但其未考虑任务空间的动态性和不确定性。文献[20-22]针对文献[19]的算法提出了不同的假设条件,如动态任务空间特征和任务约束(任务收益变化、执行时间窗口约束)等。
以往的大多数研究中,完全分布式的规划模型被广泛考虑。与之不同的是,对于测绘应用而言,预规划的结果值得被信任并可作为机上重规划的前置条件[16]。因此,本文设计协同测绘异构多无人机在线分布式任务规划方法。结合预规划信息进行在线规划,提出基于预规划航迹的任务估值方法,通过分布式分配方法同步更新航迹;同时提出基于滚动时域预测控制的航迹联合修正方法,确保无人机系统在动态环境的安全性。通过仿真验证所提出的在线分布式规划算法对异构资源、多元任务、复杂场景等问题的适用性,实现多无人机系统在三维空间下对多场景测绘任务的快速响应。
1 协同测绘问题描述
1.1 场景及系统建模
在测绘任务中,假设测绘区域中存在若干个潜在区域目标,航测系统基于异构参数化指标满足不同子区域的测绘任务需求和资源要求,并对所有区域完成覆盖测绘。同时,异构集群基于通信和感知约束更新协同规划指令,对发现的实际目标进行贴近探测,最小化系统资源消耗或时间成本,并确保无人机的安全,任务场景示意如图1,据此,建立以下假设以分析系统分配和航迹规划模型:
1)每个任务最多需要一台无人机执行;
2)在预规划中,不考虑无人机航迹安全约束。
图1多无人机协同测绘示意图
Fig.1Multi-UAV collaborative mapping schematic
区域潜在目标集。T={T1,T2,···,Tj,···,}代表NT个潜在区域目标的集合,表示子区域潜在目标在相对坐标系下的二维坐标。
异构无人机集。U={U1,U2,···,Ui,···,}代表NU台异构无人机的集合,表示无人机在相对坐标系下的起始三维坐标和三轴姿态,Vi表示无人机的飞行速度,表示无人机的感知范围,表示无人机的通信范围,表示无人机的安全范围。图2表示传感器有效范围的二维示意图,无人机只能获取感知半径内的障碍物预测信息,以及通信半径内的友邻携带信息,同时需要保证其余目标不进入安全半径内。
图2传感器有效范围
Fig.2Effective range of the sensor
无人机运动学模型。假设无人机Ui在tk时刻的状态为Xi,k={μi,k,},μi,k为Ui在tk时刻的三维坐标{xi,k,yi,k,zi,k},为Ui在tk时刻的航向角和俯仰角{φi,k,ωi,k},定义无人机的简化运动学模型z:
(1)
其中为最大转弯率,为最大俯仰率。
1.2 基于迭代优化的预先任务规划
基于群智能迭代优化方法的预先任务规划算法流程如图3所示。方案的优化由优化器、仿真器和任务调度模块之间的交互来控制。其中优化器针对任务分配问题,基于遗传算法生成一组新的种群(任务序列),并在有限迭代次数内不断更新进化。任务调度模块基于异构无人机系统能力和任务需求,对所有新产生的种群个体的模块(绿色虚线部分)进行满足约束的判断和冲突调解,并返回一组可行的任务序列。在这个过程中,所有种群个体将在仿真器中,完成与测绘任务区域的交互(蓝色实线部分)。异构无人机在子区域中航线敷设,输出航迹规划结果并作为任务序列适应度评估的依据[16]。
图3预先任务规划算法框架
Fig.3Pre-planning algorithm framework
2 预先与动态结合的分布式任务规划
2.1 分层分布式任务规划系统框架
在分布式规划系统中,每个决策个体仅依靠具有范围限制的传感器和通信设备获取环境信息,并维护局部地图,基于各单体携带的独立规划模块参与任务空间的决策与规划。经典的任务规划框架由高层次的任务分配层和低层次的路径规划层串联而成。然而,在分布式规划中,由于个体对环境态势感知的差异以及优化目标的构造差异,任务规划的结果往往是次优的“短视”解。尤其是对于受限通信范围下的协作多任务分配问题,无人机对其他无人机的规划结果和状态的预测信息是未知的,甚至将产生冲突解,同时影响规划的最优性和鲁棒性。
因此,本文针对受限通信的协同航测系统,设计改进分层分布式任务规划框架,如图4所示。每个无人机的任务规划模块由前处理层、分布式任务分配层、后处理层组成。在前处理层,引入预规划任务序列和航迹输出结果作为公共任务信息,基于预规划航迹和多元的环境更新信息(目标发现、友邻状态通信、环境威胁感知),设计前处理层,估算任务流动对全局态势的影响,估值结果在无人机的通信局域网间进行投标和拍卖,并在后处理层同步更新航迹。然后将规划结果交付轨迹优化层,以应对动态更新的环境信息和集群运动状态。
图4分层分布式任务规划系统框架
Fig.4Framework of hierarchical distributed mission planning system
2.2 基于预规划航迹的分布式任务规划
2.2.1 改进前处理方法
(1)定义规划航迹属性
测绘子区域作为一个面目标,其敷设航线被视为一个任务整体,任何多余的任务更新和机动都将对航测的分辨率、覆盖率和重叠率产生负面影响,增加航测系统的工作量。为了保证飞行和成像过程中的质量,首先对预规划航迹进行属性定义,如图5所示。
πi表示无人机Ui的规划航迹,其中红色实线表示导航路径,即无人机前往任务子区域的航迹控制点对;绿色实线表示测绘路径,无人机在敷设航线控制点中执行区域探测;黄色实线表示机动路径,即无人机在两条相邻航线间进行机动转向的航路控制点对。每条路径由两个航点组成,称为一条航线。将πi改写为式(2),其中πi,k表示tk时刻的规划航迹点集合,Ak表示任务的索引,lk表示航线的索引,sk表示航点的索引。
图5规划航迹定义及规划解的表示
Fig.5Definition of planned path and representation of planned solution
(2)
如图5中所示,当tk=0时,πi,k=0(1,1)表示当前所处航线,πi,k=0(1,1,1)表示当前航点,πi,k=0(1,1,2)为下一时刻执行航点,πi,k=0(2,1)为下一任务的第一条航线,πi,k=0(2,2)表示下一任务的第二条航线。
在分布式任务分配中,所有无人机间任务交易都将子区域的敷设航线视为任务整体,即基于无人机当前所处的航迹位置及属性,待交易的任务只能被插入到所有剩余的导航路径中进行任务估价,如图6所示。
图6待交易任务估值方法
Fig.6Valuation method for tradable tasks
(2)基于预规划航迹的任务估价
前处理层的主要工作是用低复方法预估任务交易的收益与代价。建立无人机所有可能路线的飞行成本估计矩阵。对于无人机Ui而言,其飞行成本矩阵估计矩阵Fi如式(3)所示:

(3)
其中,Ni为预规划的任务数量,Dm表示待交易任务,表示Ui在从当前位置到达任务m1的导航路径中插入待交易任务Dm所计算获得的最终飞行时间。表示Ui在从任务m1到任务m2的导航路径中插入待交易任务Dm所计算获得的最终飞行时间。m1,m2∈{0,1,···,Ni},m1,m2=0表示无人机出发点。
飞行成本估计由式(4)获得,由额外飞行时间E和全局规划时间P组成。表示Ui中任务流入所产生的航程时间与原导航路径时间的额外飞行时间,Pi表示无人机规划解剩余时间R(πi,k)/Vi和之前已经消耗的时间之和。R表示Ui执行任务的欧氏距离。
(4)
矩阵Fi的左下部分是一个对称矩阵,*表示对称项元素,并且当m1到m2的导航路径不属于πi,k时,=+∞,同理当Ui从当前位置到m1的导航路径不属于πi,k时,=+∞。
传统的市场拍卖通常基于待交易任务个体的收益和代价进行估值,而仅对当前任务进行考虑往往是“短视”的。本文提出的任务估值方法基于Ui自身的全局规划时间R(πi,k)/Vi+,建立对动态任务的出价函数,如式(5),这种利用预规划信息的出价方式将使最终整个系统的规划方案收敛至任务执行效率最高的方案。并且利用已知的预规划任务序列和其对应的航迹πi,k计算全局规划时间,并不额外增加算法计算复杂度,不影响算法的实时性。
(5)
式中,表示Ui对待交易任务Dm的出价,min()表示选择造成最小的导航路径作为任务插入位置(因为同Pi对于同一无人机的每个插入位置的值一致,用于与其他无人机交易的最终飞行时间比较)。
2.2.2 局部任务拍卖与同步
本文基于拍卖算法解决分布式任务分配问题。无人机将循环执行任务规划系统,与通信范围内无人机进行出价、竞拍,并同步更新市场价值。无人机Ui对待插入任务Dm的裁判公式如式(6)所示:
(6)
式中:为Ui已知的局部市场价;为裁判价值,当>0时,竞价成功。在分布式的框架中,更新的一致性是确保裁判策略有效性的关键,经过多轮的无人机投标和裁判后,多无人机最终将收敛形成同一分配方案。
为了解决由于局部通信所造成的任务持有冲突,本文设计受限通信下的局部拍卖算法,无人机Ui在发现目标Dm的同时对其出价,更新局部市场价并加入任务序列σi,等待后处理模块对其进行修正。Ui只对通信范围内的其他无人机Ul所持有的任务序列σl进行出价,相似地,更新市场价和交易双方的任务序列。无人机出价和更新算法伪代码如算法1。
算法1 受限通信下的局部拍卖算法
Alg.1 Local auction algorithm under restricted communication
在后处理模块,对于加入任务序列的新任务Dm,若=0,则表明该任务被Ui发现但并不满足执行约束,Dm将被持有直到与其他无人机进行交易。若≠0,则以任务估值的导航路径插入位置,使用拓展的Dubins3D模型同步更新规划航迹πi,k(Ak,lk,sk)。
同理,对于Ui任务序列中被交易的任务,将被交易任务相邻的任务节点的起止航点进行航迹平滑。
2.3 实时航迹优化
由于环境信息及集群运动状态均随着测绘过程动态变化,无人机需要不断对规划航迹进行重规划,以满足动态测绘和避障等需求。因此,无人机的路径规划是一个在线动态优化问题。本文采用滚动时域预测控制对无人机的搜索路径进行实时规划。
2.3.1 滚动时域预测控制
滚动时域预测控制基于无人机运动学模型(1)获得无人机Ui在采样时刻[tk,tk+M]的航迹序列在三维环境Ωi,k下的效益,使用模型预测来求解有限时域内开环控制的局部最优解,其中三维环境信息Ωi,k包括障碍物信息Oi,k和友邻通信无人机的规划航迹等。基于问题描述中的运动学模型,离散化控制量序列为,建立无人机效益函数Ji,k,通过模型预测求解最优控制序列,则轨迹优化问题表示为:
(7)
约束于:
(8)
式(7)中最优控制序列的第一步用作运动控制的输入,生成下一时刻状态并更新环境信息。式(8)表示当前时刻的状态由上一时刻的状态和动作决定,z(·)表示无人机运动学模型。
在最大转弯率和最大俯仰率的约束下,建立异构系统三维路径预测模型。在有限时域[tk,tk+M]内,Ui所有可能状态的集合为表示第l条预测路径,其对应控制点集合。其中nl为预测路径数量,数量满足nl=(nφ×nω)M,nφ和nω分别表示转弯率和俯仰率控制量的离散数量。
2.3.2 路径需求分析
任务规划层输出航迹,对无人机轨迹优化主要包括以下优化目标:①区域覆盖;②环境避障和机间避撞;③减少飞行机动。因此总体效益函数为:
(9)
(10)
(11)
(12)
式(9)中分别对应Ui在k时刻第l条预测路径的三个优化目标的效益函数;χ1,χ2,χ3>0,表示效益函数的权重。式(10)将下一航段控制点的坐标πi,k(Ak,lk,sk)视为吸引源,距离越近,吸引力越小。式(11)将环境障碍和友邻位置视为排斥源,ni,k,o、ni,k,c分别为障碍物和通信无人机的数量,距离越近,排斥力越大。式(12)对两个相邻时刻无人机控制量的改变加以惩罚。KA、KB、KC为增益系数,εA、 εB为决定势场影响范围。
2.3.3 航迹联合修正
在任务规划层输出的平滑轨迹,是基于Dubins3D方法的无障碍路径[23],而面对动态更新的环境,为了满足上述优化目标,需要结合路径预测优化结果对平滑航迹进行联合修正,如算法2所示。首先基于环境和友邻航迹预测信息,判断Ui在k时刻所处的航线πi,k(1,1)的安全性,若不安全,则使用最优状态序列的第一步替换整条航线,并以该状态为新起点,生成前往下一任务航迹段起点的平滑轨迹并加入πi,k(1,1),直至航迹满足安全性约束。对于Judge_safe(·)函数,用于判断无人机规划航迹是否与障碍物和友邻碰撞。
算法2 航迹联合修正
Alg.2 Joint trajectory correction
3 仿真实验及分析
在本节中,通过数值模拟,对所提出的预先与动态结合的异构无人机分布式任务规划算法进行多场景验证。测试在Python3.10环境中运行,运行在一台配备Intel(R)Core(TM)2 Duo CPU E7500 2.93 GHz和4 GB RAM的PC上。
仿真在一个4 km×3 km的任务场景中进行,4台无人机和12个潜在区域目标作为预规划的输入信息。假设测绘区域中存在若干个重点目标和环境信息,其信息对于无人机是未知的,需要无人机基于机载传感器沿预规划航迹进行分布式决策,完成对区域的全覆盖,对重点目标的探测和贴近测量,对环境威胁的规避等。
图7显示了仿真场景一中异构无人机系统任务的不同时刻的飞行轨迹及区域覆盖、环境感知情况(图中有色圆形表示障碍物,有色星型表示地面重点目标)。tk=180 s时,U2发现首个重要目标并对其进行估值;tk=335 s时,U1感知到环境障碍物,并通过航迹联合修正进行规避;tk=605 s时,U3首次对重点目标进行贴近测量;tk=1 430 s,所有无人机陆续完成任务并返程。其实时覆盖率如图7中所示。
图7无人机实时飞行轨迹及区域覆盖情况
Fig.7UAVs′ real-time flight trajectory and area coverage
图8显示了三个随机仿真场景的任务分配甘特图,环境中分别存在6个重点目标、9个重点目标和12个重点目标。甘特图红色部分表示无人机的导航路径时间,绿色部分表示无人机的测绘路径时间,蓝色部分表示对重点目标贴近测量的时间。本节通过随机生成无人机起始位置、预规划区域潜在目标的位置、环境中未知重要目标的信息,以验证规划算法在多场景下的适用性。多场景的仿真结果表明,分布式算法对于各类场景应用的适用性良好,无人机能基于对环境的感知和局部信息动态地进行决策,规划结果无冲突,并且分配的结果符合最大化测绘效率的总体目标,重要目标将被分配给时间更充裕的无人机进行贴近测量。
图8随机仿真场景算法规划结果
Fig.8Algorithm planning results of stochastic simulation scenarios
同时,分析各无人机与环境最近障碍物的距离相对于安全半径Rs的距离,如图9和图10所示,红色虚线表示无人机的安全距离,其他颜色实线表示无人机在tk时刻与障碍物的最小距离d。在无航迹联合修正的动态规划中,U1、U2、U3平滑航迹与最近障碍物的距离小于安全距离,最小值为35.9 m。而应用航迹联合修正的规划算法中,其值始终大于Rs,最小值为122.7 m。并且结合上述可视化仿真结果可以得到,本文提出的基于滚动时域预测的航迹联合修正策略是有效的。
图9无人机与障碍物的最小距离(无航迹联合修正)
Fig.9The minimum distance between UAVs and obstacles (without joint trajectory correction)
图10无人机与障碍物的最小距离(航迹联合修正)
Fig.10The minimum distance between UAVs and obstacles (with joint trajectory correction)
如2.2.1节所述,本文提出的前处理方法使无人机系统可以基于预规划信息完成任务估值。与传统市场拍卖方法对比(表1),本文算法由于综合考虑了全局规划信息,能使无人机系统更快完成所有任务,以改进传统市场拍卖方法“短视”的不足。
4 结论
本文针对应急测绘任务场景,将异构无人机协同测绘预先任务规划的工作拓展到三维实时任务规划中,研究预先与动态结合的分布式规划方法,以提高系统在未知环境下的实时性和可靠性,将主要工作和贡献总结如下:
表1本文算法与传统市场拍卖方法对比
Tab.1Comparison between the algorithm in this article and traditional market auction methods
1)设计基于预规划航迹的前处理任务估值及相应的后处理航迹平滑方法,针对测绘任务效率最大化这一优化目标,提出的前处理方法通过航迹属性分类、全局时间成本估算和约束条件满足来构建目标函数。相比于传统的分布式市场方法“短视”的特点,结合预规划信息的任务分配更符合全局要求。
2)设计受限通信下的局部拍卖算法,以对无人机间持有的动态任务进行无冲突的重分配与规划,以保证全局信息更新的一致性。
3)提出一种基于滚动时域预测控制的航迹联合修正算法,基于环境势场和机动成本预测并优化无人机的飞行轨迹,将其规划轨迹进行联合修正,以最终实现无人机的安全飞行。
通过多场景的数值仿真证明,提出的分布式规划算法能在保证静态规划要求的前提下,适应多种随机场景的动态任务规划,获得效果良好的任务分配结果。同时,对比了联合修正航迹和无联合修正航迹与障碍物的最小距离,也验证了该策略的有效性。




