摘要
针对搜索水中动态目标问题,提出一种基于改进头脑风暴优化(brain storm optimization, BSO)算法的多自主式水下航行器(autonomous underwater vehicle, AUV)协同搜索方法。该方法采用基于马尔可夫过程的运动预测目标存在概率,联合探测信息与预测信息更新目标存在概率。AUV间共享目标存在概率、环境不确定度、协调信息素等信息,各自利用滚动优化策略规划搜索路径。对该方法进行了有效性和鲁棒性的仿真验证。仿真结果表明,该方法能搜索到不同运动模式的水中动态目标,搜索效果优于随机算法、遍历算法等传统算法和BSO智能算法,且对AUV的不同初始出发位置不敏感,提高了战术使用的灵活性。
Abstract
A cooperative search method of multiple AUV (autonomous underwater vehicle) on the basis of improved BSO (brain storm optimization) algorithm was proposed to search underwater moving targets. The target motion was predicted on the basis of Markov process, both the detection information and prediction information were used to update the target existence probability. AUVs shared the target existence probability, environmental uncertainty, and the coordination of pheromones, then planed the search path by rolling optimization strategy. The effectiveness and robustness of the proposed method were verified by simulation. The simulation results show that the method can search moving targets under different motion patterns, the search effect is better than the random algorithm, traversal algorithm and BSO algorithm, it is not sensitive to different initial departure positions of AUVs, improving the flexibility of tactical use.
自主式水下航行器(autonomous underwater vehicle,AUV)是水下无人作战体系的重要组成部分,具有造价低、自主性强、活动范围广且隐蔽性好的优点,可用于情报侦察、海域巡逻、水声通信、水雷对抗、反潜、布雷等军事领域。相比于单个AUV作业,多AUV协同作业有以下优势:一是多AUV协同工作,总体作业效率远高于单体作业效率;二是影响单个AUV作业的因素较多,通常是由于敌方火力威胁、海洋环境影响、自身故障等因素而导致任务失败,因此选用多AUV协同作业,通过配合、补位等操作可降低单个AUV失效带来的影响;三是单个AUV体积一般较小,难以同时配置各种高性能装备,如高精度探测传感器、高性能战斗部和高能动力舱等,若拥有不同能力的AUV组成集群,冗余配置、能力互补,可以相互支援、相互补充。
水中协同搜索的目标包括静态目标与动态目标,静态目标如沉底水雷、海底应答器等,动态目标如潜艇、鱼雷、无人潜航器(unmanned underwater vehicle,UUV)等。成功搜索到目标是执行相关任务的前提。
从搜索方法的可扩展性和适用性角度,智能体集群路径规划搜索方法主要有仿生学方法(蚁群算法、鱼群算法、鸽群算法、粒子群算法、萤火虫算法、头脑风暴算法等)、人工势场法、几何学方法、经典搜索法和进化学习方法五类。其中仿生学方法是一类最适用于智能体集群路径规划的方法,一直是群体智能领域的研究热点[11]。因此,针对搜索水下动态目标问题,本文提出一种基于改进头脑风暴优化(brain storm optimization,BSO)算法的多AUV协同搜索水中动态目标的仿生学方法,通过运动预测保证目标运动后概率图的准确性,通过构造人工势场避免AUV间碰撞与资源浪费,通过异步决策解决信息交互延时问题。
1 搜索模型
1.1 问题描述
假设有NT个运动目标(如潜艇、UUV等)存在任务区域内,当通过某些方式获取目标的相关信息(如战场态势信息、地形信息等)时,不可避免地存在信息误差以及目标运动导致的误差可信度下降等情况。因此,指派NU个AUV进入任务区域,通过AUV携带的搜索设备进行探测,可以有效降低这些因素的影响,从而获取准确的目标信息。
AUV常见的探测设备包括主/被动探测声呐、合成孔径声呐、测深侧扫声呐和先进摄像设备等。中等AUV在良好水文条件下主动探测声呐的作用距离不小于2 000 m。将所在的任务区域进行栅格化,固定每个栅格长宽(小于探测声呐的作用距离),将任务区域划分为Lx×Ly个栅格。假设每个栅格内最多只有一个目标,由于栅格长宽均小于AUV探测声呐的作用距离,因此AUV进入栅格后通过探测设备即可确认当前所在栅格有无目标。如图1所示,采用八链码方向Ψ∈{0,1,2,3,4,5,6,7}表示每个决策时刻AUV可能的运动方向。
AUV机动约束设定为:运动方向为“左航、直航、右航”三种状态,偏航角增量Δψ分别用“-1、0、1”表示。

图1AUV 运动方向示意图
Fig.1Schematic diagram of AUV directions
1.2 运动预测
由于目标是运动的,当前时刻的目标存在概率于下一时刻而言,可信度不高,因此采用基于马尔可夫过程的目标运动预测目标存在概率,然后联合探测信息与预测信息更新目标存在概率,保证目标存在概率的可信度。
假设目标的位置在x和y方向上是独立的,目标在tk时刻的位置是(xk,yk),在tk+1时刻的位置是(xk+1,yk+1),其中tk+1-tk=s·Δt=ΔT,Δt为时间步长,s为tk与tk+1时刻之间的时间步长个数。假定每个时间步长内目标运动加速度是恒定的,即服从一个以ξ为方差的高斯白噪声序列εn。
因此,tk时刻目标的位置和速度可以通过数学归纳法获得。首先考虑第i个时间步长目标的速度与位置,如式(1)~(4)所示。
(1)
(2)
(3)
(4)
其中,εxi、εyi分别是ti时刻目标在x和y方向上的加速度。
令i分别等于k·s、(k-1)·s,由式(1)可推导出tk、tk-1时刻目标在x方向上的速度:
(5)
(6)
两式相减,得到目标速度递归表达式:
(7)
同理可得目标在x方向上的位置递归式:
(8)
显然,目标当前时刻的运动速度和方向决定下一时刻的位置。目标在tk-1时刻的位置是(xk-1,yk-1),经过ΔT后目标将可能位于的点形成一个以(xk-1,yk-1)为圆心、为半径的圆,可以认为这些点服从一个以σ2为方差,在x和y方向上以μx、μy为均值的高斯分布。其中,为估计运动速度。
根据式(7)、式(8)可以推导出随机变量xk的均值和方差:
(9)
(10)
引入估计运动速度,式(9)可推导为:
(11)
同理可得变量yk的均值μy。由此可以计算转移概率密度函数:
(12)
假设目标在tk-1时刻位于栅格(l,w),则在tk时刻,目标移动到栅格(i,j)的概率为:
(13)
式中,(xk-1,yk-1)=(Xl,w,Yl,w),(Xl,w,Yl,w)、(Xi,j,Yi,j)分别是栅格(l,w)、(i,j)的中心,Lx、Ly分别为栅格的长度与宽度。
根据式(14)可对目标转移概率P{(i,j)(l,w)}进行归一化。
(14)
tk时刻栅格(i,j)存在目标的概率为:
(15)
式中,pl,w(k-1)是tk-1时刻栅格(l,w)存在目标的概率,根据传感器探测情况更新确定。
1.3.1 目标存在概率
目标存在概率pi,j表征目标在栅格(i,j)可能存在的概率。pi,j根据贝叶斯准则更新:
(16)
式中:探测概率pd表示栅格存在目标并成功被搜索到的概率;虚警概率pf表示栅格中无目标但被搜索到的概率;b表征AUV搜索情况——b=1表示搜索到目标,b=0表示未搜索到目标。
1.3.2 环境不确定度
环境不确定度qi,j(k)∈[0,1]表示AUV对栅格(i,j)中环境信息的掌握程度。qi,j更新公式:
(17)
式中,环境不确定度递减因子τ∈[0,1]。
1.3.3 协调信息素
协调信息素构造出人工势场,减少AUV间产生的资源浪费与碰撞。AUV之间的协调信息素存在差异,数据来源于其他AUV最优决策栅格的集合N与其他AUV下一可行栅格的集合F。集合N表示由其他AUV在当前所知信息下,连续搜索NP步能获得最大收益的系列栅格组成;集合F由其他AUV从当前位置经“左航、直航、右航”后到达的栅格组成。协调信息素计算公式:
(18)
式中:di,j表示当前AUV在栅格(i,j)的协调信息素;H和L分别表示较大和较小的协调信息素。
2 决策过程
为了减小优化规模和缩短优化时间,采用分布式结构,将整个AUV系统的全局优化问题转化为各AUV子系统的局部优化问题。参考文献[12],综合考虑多个子目标(目标存在概率收益J1、环境掌握程度收益J2和协同代价J3),各个子目标函数表示如下:
(19)
(20)
(21)
其中,R表示AUV按预测搜索路径航行时经过的栅格的集合。
基于上述子目标函数,制定总目标函数:
(22)
式中:k1、k2、k3是子目标函数的影响系数;M为充分大的正数,保证目标函数为正函数。
采用基于全局最优和差分变异的头脑风暴优化(global-best difference-mutation brain storm optimization,GDBSO)算法[13]优化目标函数。GDBSO具有优化效率高、可靠性较强、收敛速度快等特点,具备快速获取优化成本低、优化质量高的最优决策的能力。GDBSO算法流程如图2所示,其中pre表示取代操作执行概率,pb表示选择1个类后该类中心概率,p1表示选择2个类后该2类中心概率,p2表示通过1个类选择个体的概率。
分布式多AUV协同搜索水中动态目标的算法步骤参见文献[12]。
AUV之间交互的信息包括最优决策与搜索情况、根据搜索情况更新目标存在概率、最优决策更新环境协调信息素和不确定度。实际上,信息并不能实时交互,一方面,信息通过水声传播,需要一定传播时间,这一方面的时间一般较短,影响不大;另一方面AUV自身获取信息需要一定时间,时间根据实际情况各不相同,一般长于水声传播时间。k时刻搜索当前栅格,接收到其他AUV在k-1时刻发出的信息,调整更新自身搜索图,根据以上信息给出决策并发送搜索情况和最优决策。由于AUV决策的依据为上一时刻的信息,因此,允许信息交互存在一定延时。

图2GDBSO 算法的基本流程
Fig.2Basic flow chart of GDBSO algorithm
3 仿真研究
首先分别搜索三种不同运动模式的动态目标,观察目标运动模式改变对搜索效果的影响,以验证基于GDBSO的协同搜索方法对动态目标的有效性。然后,分别使用随机算法、遍历算法、原始BSO算法[14]与GDBSO算法规划协同搜索路径,对比搜索结果,以验证所提方法的优越性。最后,改变AUV初始位置,探究提出的协同搜索算法对AUV不同的出发位置是否敏感,以验证方法的鲁棒性。
设置时间步长Δt=1 min,时间步长数s=3,目标运动加速度服从以ξ=2.86×10-2为方差的高斯白噪声序列。初始不确定度均设置为0.5,其余参数设置参考文献[12]。任务区域设定为20 km×20 km的海域,均匀划分为20×20的栅格。根据先验信息,动态目标可能出现的重点区域如图3所示,其中,黑色区域为重点区域,重点区域的初始目标存在概率设置为0.2,其余区域设置为0.01。

图3目标运动重点区域示意图
Fig.3Schematic of moving targets focus areas
3.1 目标运动模式影响
显然,目标运动模式在实际中不是唯一的,而算法搜索效果不能因为目标运动模式不同而产生较大差异。本小节以搜索作螺旋运动、圆周运动以及基于维纳过程的马尔可夫运动(布朗运动)等三种不同运动模式的动态目标,验证提出的协同搜索方法对于动态目标的有效性。
螺旋运动的运动轨迹是阿基米德螺旋线,运动学方程表达式:
(23)
式中:r和θ为运动目标在极坐标下的极径和极角;a和b为实数,控制螺旋线形状。
布朗运动的数学模型为维纳过程,其状态转移函数为:
(24)
式中,为布朗运动在单位时间内的方差。
目标运动参数设置如表1所示。在任务区域设置10个动态目标,使用4艘AUV搜索100步,初始航向均为0。为减少仿真实验过程中存在的偶然误差,对三种运动模式的目标均独立仿真50次。
独立仿真50次的统计结果如图4所示,对于不同运动模式的动态目标,平均寻得目标数量基本相同,可见提出的协同搜索算法能有效搜索不同运动模式的动态目标。
表1目标运动参数
Tab.1 Target moving parameters


图4目标运动模式的影响
Fig.4The impact of target moving models
3.2 不同算法效果比较
在任务区域设置10个动态目标,其中3个目标作圆周运动、4个目标作螺旋运动、3个目标作布朗运动,分别利用随机算法、遍历算法、BSO算法和GDBSO算法来规划协同搜索路径,算法参数设置参考文献[12]。每组仿真独立运行50次,统计结果如表2所示。
表2不同搜索算法平均寻得目标数量
Tab.2 Average number of found target based on different algorithms

遍历算法、BSO算法、GDBSO算法在其中一次仿真中的规划搜索路径示意图如图5所示,寻得目标数量变化曲线如图6所示。可见,基于GDBSO的协同搜索算法相比于遍历算法和BSO算法,能在相同的时间内搜索到更多的目标,再次验证了该方法的有效性与可行性。
图5不同算法规划协同搜索路径示意图
Fig.5Schematic diagram of collaborative search paths by different algorithms

图6寻得目标数量变化曲线
Fig.6Variation curve of found target numbers
3.3 集群出发位置影响
由于战场态势千变万化,敌我位置分布也可能随之不同,我方AUV集群初始出发位置不尽相同,但算法的实际搜索效果不能因出发位置不同而产生较大差异,因此本节研究所提算法对AUV出发位置的敏感程度。
仿真共设置四种4艘AUV的初始出发位置,各自坐标如表3所示。
表34艘AUV初始出发位置坐标
Tab.3 Different start positions of 4 AUVs

每种出发位置均独立仿真50次,四种不同出发位置下所对应的平均寻得目标数量分别为7.78、7.94、7.58、7.62,可见所提出的基于GDBSO的协同搜索动态目标算法的搜索效果受集群不同的初始出发位置的影响不大,平均寻得目标数量对AUV集群的初始出发位置不敏感,提高了AUV集群在实际使用中的灵活性。
4 结论
针对分布式多AUV协同搜索场景,提出了一种基于GDBSO的动态目标搜索方法。该方法基于马尔可夫运动模型推导出目标转移概率,以此对目标存在概率进行预测更新,保证目标运动后存在概率的准确性。AUV间通过共享目标存在概率、环境不确定度、协调信息素等信息,各自利用滚动优化策略规划搜索路径。仿真结果表明,该方法能搜索到不同运动模式的动态目标,搜索效果优于随机算法、遍历算法等传统算法和BSO智能算法,且对AUV不同的出发位置不敏感,充分说明了该方法具有工程实用性和较强鲁棒性。但在研究中未考虑AUV的能耗和洋流约束等影响问题;对三种目标运动模式中采用的目标运动参数与实际海洋中目标的运动(特别是多种运动的复合运动)参数有差别,有待进一步深入研究。