摘要
针对现有分选算法或多或少存在依赖先验信息或者难以适应多功能雷达的情况,提出基于偏联系数集对势的雷达信号多站融合分选算法。从数学领域的集对分析中引入偏联系数参数建立聚类模型,在此基础上通过多站协同方式,利用到达时间差参数对聚类结果进行决策级融合。经过实测数据及仿真验证,在无须任何先验信息的情况下,该算法可适应搜索捕获跟踪等多功能雷达体制,实现雷达脉冲信号的精确聚类与融合,在干扰脉冲比例不高于60%的情况下,分选正确率达97%以上。
Abstract
Aiming at the situation that the existing sorting algorithms were more or less dependent on prior information or difficult to adapt to multi-function radar, a multi-station fusion sorting algorithm based on set pair potential of partial coefficients was presented. The partial connection number parameter was introduced from the set pair analysis in the mathematical field to establish a clustering model. On this basis, the decision level fusion of clustering results was carried out by using the arrival time difference parameter in the multi-station cooperation mode. The actual measurement data and simulation results show that the algorithm can adapt to multi-functional radar systems such as search, acquisition and tracking,and realize the accurate clustering and fusion of radar pulse signals without any prior information. The sorting success rate is more than 97% in case of the jamming pulse ratio is lower than 60%.
雷达信号分选,也称雷达脉冲信号去交错,是指从时频空各域存在交错的脉冲流中将所属各部雷达的脉冲序列区分的技术[1]。雷达信号分选是电子侦察的关键步骤,只有从高密度的脉冲流中准确分离出雷达脉冲信号,才能顺利地进行后续的信号处理以及对战场态势进行正确的评估。当前接收机处理后打包的脉冲描述字(pulse description words,PDW)主要包括载频、脉宽、方位角、脉幅、脉冲到达时间以及脉内调制方式等参数[2],其中通常采用载频、脉宽、方位角以及到达时间四维参数进行分选工作。
分选算法的发展经历了从基于脉冲重复间隔(pulse repetition interval,PRI)脉间调制变化特征、脉内调制特征,再到引入机器学习的方法。目前基于机器学习的无监督聚类预分选,搭配基于脉间调制PRI变化特征的主分选方法的算法模型符合实际缺乏先验信息的战场环境,被广泛应用于工程中。典型无监督预分选算法主要包括五大类:划分聚类法、层次聚类法、网格聚类法[3]、密度聚类法[4]以及模糊聚类法[5]。其中划分聚类法的K-means算法具有计算量小的优势,常用于雷达信号分选工程的预分选部分,但需要自行设定聚类容差且容易陷入局部最优解;层次聚类、密度聚类以及模糊聚类法都存在计算复杂度高且聚类效果与预定义参数相关等问题,应用环境有限;网格聚类法则对自行设定的密度阈值等参数敏感,面对未知雷达易出现“漏批”现象。
针对以上聚类算法存在的问题,引入集对分析中的偏联系数(partial connection number,PCN)决策理论[6]与多站时差融合理论[7],提出了一种雷达信号多站融合分选方法,该方法在无须阈值门限等先验参数实现聚类的同时,可针对搜索捕获跟踪等多功能雷达[8]体制以及信道化技术[9]可能导致的大带宽信号过度分割、兔耳效应等冗余脉冲问题进行校验解决。
首先将各观测站接收的PDW数据在主站进行整合,并基于观测站位置分布信息确定时差窗,对各站接收脉冲进行时差匹配获取到达时间差(time difference of arrival,TDOA)参数。在此基础上对各站接收数据进行预处理,实现低密度样本点标记以及潜在聚类中心的获取。然后以偏联系数集对势作为聚类依据,将样本归入集对势值最大的聚类堆,并基于TDOA参数对聚类结果作决策级融合,给出融合后的结果。
1 算法流程
算法主体包括观测站间脉冲流数据整合与脉冲时差匹配,站内PDW数据预处理,基于偏联系数集对势的特征参数决策模型建立以及基于TDOA作聚类结果校验等,分选流程如图1所示。

图1基于偏联系数集对势分选融合算法示意图
Fig.1Schematic diagram of partial connection number collection potential sorting and fusion algorithm
1)主站与各子观测站接收雷达辐射源脉冲信息,在主站内进行脉冲流数据整合以及站间脉冲时差窗匹配。
2)各站内数据进行基于局部异常因子(local outlier factor,LOF)的离群点检测,去除离群点后进行基于最大距离积法的聚类中心搜索。
3)将样本与聚类中心进行建立偏联系数集对势决策模型,将样本归入对应集对势最大的聚类中心。
4)遍历各聚类堆,基于脉冲TDOA参数进行校验。
2 脉冲描述字预处理
2.1 局部异常因子[10]检测算法
分选算法中的PDW离群点主要来源于数据测量误差以及空间中存在的各类干扰,去除离群点有利于减少算法后续的计算量,同时可以提高算法精度。
2.1.1 局部可达密度
点o的局部可达密度,即点o的第k距离邻域内点pi到点o平均可达距离的倒数,用于表征点o所处空间的局部密度。当点o和周围邻域点属于同一簇时,分母可达距离参数减小,分子点o的第k邻域点数增大,使局部可达密度计算结果高于离群点。
(1)
其中:lrd(o)表示局部可达密度;Nk(o)表示点o的第k距离邻域,即距离点o第k距离内所有点;dreach_distancek(o,pi)表示点o到点pi的可达距离,取点o的第k邻近距离与o和pi之间真实距离的最大值。
2.1.2 局部离群因子
局部离群因子,即点o邻域点的局部可达密度和点o的局部可达密度之比的平均值。若比值接近为1,说明点o和邻域点密度相差不大,大概率属于同一簇;比值越小于1,说明点o密度高于邻域点,点o为密集点;比值越大于1,说明点o密度小于邻域点密度,可能是异常点。
(2)
2.2 最大距离积法确定聚类中心
为了完善聚类中心选择建立起集对势决策模型,提出最大距离积法[11],更好地稀疏化初始聚类中心,其基本思想如下:
步骤1:在集合D中随机选择一个样本作为初始聚类中心Q1。
步骤2:找到集合D中与Q1欧氏距离最大的样本值作为新的聚类中心Q2。
步骤3:计算集合D中每个样本Xi到已有聚类中心Qi的距离乘积,取乘积最大值对应的样本作为新聚类中心Qk,即满足max(d(Xi,Q1)×d(Xi,Q2)×···×d(Xi,Qk-1))的样本值Xi,Xi∈D。
步骤4:重复步骤3,直到满足新聚类中心Qn和已有某聚类中心Qk欧氏距离小于阈值。
步骤5:聚类中心初始化完成。
3 偏联系数集对势与多站融合分选
3.1 偏联系数决策理论
3.1.1 联系数理论
联系数是数学领域集对分析中的一种数学分析工具,其形式为U=A+Bi+Cj,其中A、B、C为非负实数,j=-1,i∈[-1,1]。联系范数N设定为N=a+b+c,取则有
(3)
式中,a,b,c∈[0,1],a+b+c=1,a称为同一度,b称为差异度,c称为对立度。
设存在样本集合P以及聚类中心集合O,同一度取a=Pi/Oi,表征两集合的同一程度;对立度取c=(-OiPi-1)/( -1),代表两集合元素之间的对立程度,i表示样本及聚类中心集合的第i个特征。
3.1.2 偏联系数决策模型
偏联系数[12]是在联系数理论的基础上,提出的一类用来表征样本发展趋势的伴随函数。可以利用相应的势序准则,构建决策模型,主要思想如下:
步骤1:基于样本数据建立决策矩阵。
步骤2:将决策矩阵转化为联系数形式。
步骤3:计算矩阵加权平均联系数。
步骤4:基于集对势大小对决策方案进行排序。
对于联系数μ=a+bi+cj,c≠0,同一度与对立度的比值称集对势,表示为Shi(H)。Shi(H)越大,表明样本向该决策方向发展趋势越大,决策方案越优,即样本应归入该聚类中心。
3.2 多站时差融合理论
通过建立多站时差融合系统,利用同一辐射源发射的脉冲到达子观测站与到达主站时差相同的特点,对各站接收脉冲在不同观测站的TDOA进行匹配计算,可作为融合校验的依据。
时差匹配的关键是在各个观测站中将同一脉冲对应的序号找出,建立对应关系并提取参数计算TDOA,该部分涉及时差窗[13]的选取策略。时差窗参数选取和辐射源自身参数无关,仅与各观测站间距离以及空间布局相关,因而满足实际环境非合作方辐射源信号分选要求。
以单个子观测站为例,将主站和对应子观测站接收的脉冲进行时差配对获取脉冲TDOA参数,匹配方法如图2所示。当匹配到虚假脉冲时,可利用载频、脉宽等各脉冲描述字参数进行匹配,确定匹配脉冲对与真实时差,时差匹配算法的整体流程如下:
步骤1:以主站作为基准站,建立多站时差融合系统,根据站间距建立时差窗,对主站和子观测站接收的脉冲信号进行匹配,得到各有效脉冲在不同站的TDOA,当时差窗内同时匹配到子站多个脉冲时,根据脉冲脉宽、载频、方位角等特征参数进行匹配,匹配系数为:
(4)
式中:代表主站接收信号特征参数矩阵;为第i个子观测站接收脉冲特征参数矩阵,n={0,1,···,N-1},N为脉冲个数;X为对角矩阵表征特征参数的置信权重。
步骤2:各观测站内脉冲基于偏联系数集对势决策模型聚类得到若干组聚类结果,提取聚类结果TDOA参数作融合校验,将满足校验条件的聚类结果进行决策级融合,实现跨信道冗余脉冲去除以及解决多功能雷达误分割问题。

图2脉冲到达时间差匹配原理图
Fig.2Schematic diagram of pulse TDOA matching
步骤3:针对各观测站中脉宽小于0.1 μs的窄脉冲信号进行兔耳校验。
步骤3:针对各观测站中脉宽小于0.1 μs的窄脉冲信号进行兔耳校验。
步骤4:遍历各观测站内全部聚类结果,完成基于TDOA的融合校验以及冗余脉冲去除。
4 实验与性能分析
4.1 局部离群因子检测仿真
本节验证了局部异常因子检测算法,仿真参数邻近距离维数k设置为10,分别在单辐射源和三辐射源条件下进行基于LOF检测算法,脉冲个数设置为500。LOF参数的计算过程遵从式(1)、式(2)。
检测效果如图3所示,图中LOF值为该样本邻域点局部可达密度平均值与该样本点局部可达密度的比值。从图中可以看出,本算法可以有效地检测出LOF值远高于1的低密度潜在噪声点,为后续基于偏联系数集对势无参数聚类算法降低计算量。

图3LOF离群点检测仿真效果图
Fig.3Simulation effect of LOF outlier detection
4.2 偏联系数单站决策模型与已有算法聚类效果比较
为了验证基于偏联系数集对势建立决策模型聚类的优越性,在实验室环境设置三部辐射源,经过接收机测频、脉宽以及角度分析后保存实测数据文件,分别经过K-means、主导集密度聚类DSets-DBSCAN[14](dominant sets-density-based spatial clustering of applications with noise)以及偏联系数集对势决策模型三种聚类方法,验证聚类性能。
三部辐射源参数设置如图4标记所示,包含两部固定特征参数以及一部随机捷变频辐射源参数。运行结果见表1。

图4实测脉冲数据三维分布图
Fig.4Three dimensional distribution chart of measured pulse data
表1辐射源设置及算法运行结果
Tab.1 Radiation source setting and algorithm operation results

图5对以上三种方法进行了聚类效果对比,由聚类结果可得,K-means算法出现了过度分割现象,同时算法本身局部最优的局限导致出现了两组特征参数非常接近的聚类结果。DSets-DBSCAN和偏联系数集对势决策模型聚类都实现了有效信号的准确聚类,其中频点跳变辐射源取其中一个跳频点参数,其余频点均归入该类。但从运算时间上看,偏联系数集对势决策方法运算时间仅不到DSets-DBSCAN的1/10,即本文算法在实现精确分选的同时,运算时间接近于K-means,具备一定的工程应用价值。

图5聚类效果对比
Fig.5Comparison of clustering effect
4.3 偏联系数多站模型与已有算法性能比较
为了评估本算法在高干扰脉冲比例条件下的分选性能,图6给出了在不含多功能雷达体制、大带宽信号过度分割等冗余信号条件下,仿真混合信号分别结合PCN集对势多站时差融合算法、DSets-DBSCAN、主导D-S证据理论[15](DSets-dempster shafer,DSets-DS)以及K-means 算法在不同干扰脉冲比例条件下的结果对比。图6中,纵坐标为100次蒙特卡罗仿真分选准确率平均值。

图6改进算法与其他算法分选性能比较
Fig.6Comparison of sorting performance between improved algorithm and other algorithms
从图6中可以看出,随着干扰脉冲比例的增大,四种算法分选性能都有所下降,其中本文算法与DSets-DBSCAN算法表现相对较好。K-means算法聚类结果受先验阈值影响且可能得到局部最优解,聚类性能最差;DSets-DS算法聚类及融合性能同样受预设参数影响且计算量大,很难适应无先验信息且对实时性要求高的实际战场环境;DSets-DBSCAN算法通过DSets-histeq生成球形聚类簇传递给DBSCAN作为Eps参数来源,实现无参数聚类,算法受虚假脉冲比例影响较小但计算时间复杂度较高;本文算法通过引入偏联系数决策理论中的决策势概念,表征样本向中心的发展趋势实现聚类判断,在精度和DSets-DBSCAN算法相近的同时运算速度更快,在干扰脉冲比例不高于60%的情况下,算法正确率在97%以上。
4.4 聚类结果时差融合
本节验证了多站时差融合算法对搜索跟踪多功能雷达体制、兔耳脉冲及大带宽信号跨信道过度分割情况的适应性。设定七部辐射源参数如表2所示,其中含两部大带宽、三部窄脉宽、一部多功能辐射源。接收站布局为一个主站搭配两个副站共二级TDOA,干扰脉冲比例50%,辐射源聚类结果如表3所示。
表2仿真参数设置
Tab.2 Simulation parameter setting

表3辐射源聚类结果
Tab.3 Radiation source clustering results

图7对多站时差融合算法以及K-means算法进行了聚类效果对比,由仿真结果可得,K-means算法难以适应大带宽信号跨信道的过度分割现象,将辐射源1所属脉冲聚类为两堆;面对多功能雷达难以确定是同一部雷达的不同工作状态亦或是若干部不同雷达,将辐射源5分为5、6两聚类堆;面对兔耳信号与窄脉冲的区分问题只能选择卡脉宽策略,辐射源3跨信道分割部分由于脉宽过窄被错误地作为兔耳脉冲去除;由于K-means本身取局部最优的局限性,出现了多维特征参数均相近的若干组聚类堆。结合多站时差融合理论的偏联系数集对势分选方法利用到达时间差参数对站内聚类结果进行融合校验,在无须先验阈值的情况下实现了精确聚类与融合。

图7融合算法与传统K-means算法聚类效果比较
Fig.7Comparison of clustering effect between fusion algorithm and K-means algorithm
5 结论
传统聚类算法性能受阈值等先验信息的影响很大,本文提出了一种基于偏联系数集对势的多站融合分选方法,该方法通过表征样本与聚类中心的发展趋势大小实现无参数聚类,并基于多站时差参数对聚类结果作决策级融合,更加贴合实际战场中无先验参数、辐射源存在多种工作模式的场景模型。经实测数据及仿真验证,本文算法相较于传统聚类算法准确度更高、无须先验阈值设定且运算速度较快,同时可以适应大带宽信号过度分割、兔耳脉冲以及搜索跟踪等多功能雷达体制。在干扰脉冲比例不高于60%时,算法正确率达97%以上。