摘要
目前应用于辐射源识别的卷积神经网络对时序同相正交(in-phase and quadrature-phase,IQ)信号的处理有两种方式:一种方式是将其变换为图像,另一种方式是提取IQ时序数据的浅层特征。前一种方式会导致算法计算量大,而后一种方式会导致识别准确率低。针对上述问题,提出一种多尺度特征提取与特征选择网络。该网络以IQ信号为输入,经多尺度特征提取网络提取IQ信号的浅层特征和多尺度特征,采用特征选择网络降低多尺度特征的数据维度,通过自适应线性整流单元实现特征增强,使用单个全连接层对辐射源进行分类。在FIT/CorteXlab射频指纹识别数据集上,与ORACLE、CNN-DLRF和IQCNet对比实验表明,所提网络在一定程度上提高了识别准确率,降低了计算量。
Abstract
Convolutional neural networks currently applied to radiation source identification process the time-series IQ( in-phase and quadrature-phase) signals in two ways: one way transforms them into images, and the other way extracts shallow features of the IQ time-series data. The former way leads to a large computational effort of the algorithm, while the latter way leads to a low accuracy of the recognition rate. To address the above problems, a multi-scale feature extraction and feature selection network was proposed. After inputting the IQ signal, the shallow and multi-scale features of the IQ signal were extracted by the multi-scale feature extraction network. Then the data dimension of multi-scale features was reduced by the feature selection network. Feature enhancement was achieved by the adaptive linear rectification unit, and a single fully connected layer was used to classify the radiation source. Comparison experiments with ORACLE, CNN-DLRF and IQCNet on the FIT/CorteXlab radio frequency fingerprint recognition dataset show that the proposed network improves the recognition accuracy and reduces the computational effort to some extent.
在现代战争中,通过分析截获的辐射源脉冲信号对不同的辐射源进行分类识别,是电子对抗、电子情报和电子保障措施的关键环节。对辐射源类型的正确识别是判断辐射源发射设备型号和功能的基础[1]。然而,随着信息化技术和新型装备不断革新,辐射源信号的密度和复杂度大大提高,传统基于特征参数的辐射源识别方法已经不能适用于辐射源识别。
随着大数据和人工智能技术的发展,深度学习凭借着可以实现不同层次的特征表示和知识抽象[2]的特点,已成功应用于计算机视觉[3-5]、辐射源识别[6-11]、通信信号识别[12-13]等领域。其中,在辐射源识别领域,Qian等[14]将神经网络与基于稀疏表示的分类结合,根据网络层的深度将提取的特征分为浅层和深层特征。该方法通过增加网络的深度来提高识别准确率,导致网络参数量较大;并且网络中没有对特征进行进一步的分析,造成了特征冗余的问题。周鑫等[15]通过离散傅里叶变换(discrete Fourier transform,DFT)将时序数据从时域转换到频域,再借助图像处理技术,将多次DFT结果拼接为二维频谱瀑布图,最后利用卷积神经网络对这些二维频谱图进行分类识别。虽然此方法通过将时序数据转化为频谱图,从图像角度提升了数据的可识别性,但其多次转换过程中计算量较大。崔天舒等[16]提出了一种以时序同相正交(in-phase and quadrature-phase,IQ)数据作为网络输入,通过卷积神经网络提取信号中的相关特征和时域特征,实现分类识别的方法。该网络虽然提高了信息的利用率,减小了计算量,但未充分提取IQ信号的多尺度深层特征。Sankhe等[17]提出发射器特征是设备的硬件固有的,通过提取这些固有特征来提高样本识别准确率。该方法在人为引入硬件损伤后对16个通用软件无线电外设(universal software radio peripheral,USRP)设备的识别准确率可以达到99.5%,然而,如果不人为引入硬件损伤其识别准确率仅为35.96%,这种方法的识别准确率过于依赖设备内部的硬件损伤,通用性不高。Merchant等[18]指出符合相同标准的无线发射器在每次传输中都会产生独特的、可重复的签名,这些签名可以作为设备识别和验证的样本特征。所提方法利用每次传输的误差信号作为特征输入卷积神经网络(convolutional neural network,CNN),获取了更高的识别率。但误差信号的数据维度较高,导致网络的参数量庞大,计算速度慢。
针对上述问题,本文提出一种基于多尺度特征提取与特征选择网络(multi-scale feature extraction and feature selection network,MSFESNet)的辐射源识别方法。该方法利用多个膨胀卷积提取I路、Q路和IQ两路融合信号的多尺度特征信息,并且借鉴SKNet(selective kernel network)的非线性融合方法,对多尺度特征信息进行选择和融合,在提取IQ信号更多特征的同时降低了网络参数量。
1 问题分析
本文针对通信辐射源,所使用的数据集为FIT/CorteXlab射频指纹识别数据集,该数据集的调制类型均为正交相移键控(quadrature phase shift keying,QPSK),其时域波形和频域波形分别如图1和图2所示。
上述数据集采用了IQ交替存储方式。在处理IQ信号的时候,有两种常见的方法:一种是将IQ信号进行域变换,将其转换为图像数据再输入神经网络进行训练,但是这种方法计算量大,识别率低;另一种是直接利用卷积网络提取IQ信号的特征,免去了域变换操作,计算量较小,但是大多数使用单一卷积核的单分支卷积网络,只能提取固定尺度的特征,因此存在识别准确率低的问题。

图1QPSK信号的时域波形
Fig.1Time domain waveform of a QPSK signal

图2QPSK信号的频域波形
Fig.2Frequency domain waveform of a QPSK signal
针对上述问题,本文提出了一种名为MSFESNet的方法,该方法采用多分支、多卷积核的方式提取IQ信号中不同尺度的特征,并将这些不同尺度的特征进行非线性融合以减少计算量。最终,使用该方法可以达到网络计算量小、特征利用率高以及识别准确率高的效果。
2 多尺度特征提取与特征选择网络设计
2.1 整体网络结构设计
当前,辐射源识别网络通常由多个单一卷积核的卷积层组成。如果卷积层数较少,则可能无法有效地区分不同辐射源信号之间的差异;而如果增加卷积层数,则会导致网络计算量大的问题。
为解决上述问题,本文受Inception网络和SKNet网络启发设计了多尺度特征提取与特征选择网络。该网络是一个多分支结构网络,每个分支由常规卷积或膨胀卷积构成,以提取辐射源信号中的不同尺度特征。这样可以在不增加网络深度的情况下,使网络可以学习多尺度特征。然后,对提取出的多尺度特征进行非线性特征融合(特征选择操作),以将多维特征数据转换为单维特征数据,从而减少网络计算量。MSFESNet的整体结构如图3所示。
从图3可以看出,该网络主要分为特征提取层、特征选择层和分类层三部分。其中,一维卷积(16,3,1)表示使用通道数为16、卷积核大小为3、步长为1的一维卷积。

图3MSFESNet整体结构
Fig.3MSFESNet overall structure
2.2 特征提取层结构设计
特征提取层将特征提取分为两步,依次提取数据的浅层特征和多尺度特征。利用一维卷积层(one-dimensional convolutional layer,Conv1d)分别提取I路数据、Q路数据和IQ特征数据的浅层特征,多个卷积层间采用最大池化(max-pooling)来减小数据维度;然后将提取到的浅层特征分别输入多尺度特征提取网络,以提取数据的多尺度特征,即深层特征;最后将浅层特征与深层特征使用拼接函数(contact)进行首尾连接,提高特征利用率。多尺度特征提取网络(multi-scale feature extraction network,MSFENet)是特征提取层的核心网络。
该网络是在Inception v2[19]模块的基础结构上将部分常规一维卷积替换为一维膨胀卷积,使用常规一维卷积提取数据中的浅层特征,一维膨胀卷积提取数据中的多尺度特征,提高网络的特征提取能力。MSFENet结构如图4所示。
图4中一维卷积(16,3,1,1)表示使用通道数为16、卷积核大小为3、步长为1、膨胀率为1的一维卷积。其余的部分,如一维卷积(16,3,1,2)、一维卷积(16,3,1,5)等操作与一维卷积(16,3,1,1)同理。

图4多尺度特征提取网络
Fig.4Multi-scale feature extraction network
2.3 特征选择层结构设计
在特征选择层,首先利用特征选择网络对特征提取层提取到的多尺度特征进行特征选择与特征融合。经过特征选择层可以大大降低特征数据的维度,以便减少后续网络的计算量,从而提高网络的计算速度。多尺度特征选择网络(multi-scale feature selection network,MSFSNet)是特征选择层的核心网络,其是借鉴SKNet的非线性聚合方法设计的。多尺度特征选择网络如图5所示。

图5多尺度特征选择网络
Fig.5Multi-scale feature selection network
从图5可知,网络首先将多维特征数据按位相加,再通过一维全局平均池化层(one-dimensional average pooling layer,AvgPool1d-1)、全连接层和Softmax激活函数计算出每个特征在整体特征中的比例系数,最后将比例系数乘以对应的原始特征得到新的特征。
2.4 分类层结构设计
在分类层中,首先采用自适应参数化修正线性单元(adaptively parametric rectifier linear unit,APReLU)替换线性整流函数ReLU,该操作会计算出每个样本特征的权重系数,将权重系数乘以对应的样本特征,可以对样本特征进行特征增强。
然后采用平展层(flatten)将多维特征压平成一维,使用全连接层(dense)将学到的“分布式特征表示”映射到样本标记空间。最后采用Softmax激活函数将多个神经元的输出映射到(0,1)区间内对样本进行识别。
3 对比实验
3.1 对比网络选择
本文设计了单一尺度特征提取和特征选择网络(single-scale feature extraction and feature selection network,SFESNet),该网络将多尺度特征提取网络中卷积层的膨胀率设置为1,其余部分与MSFESNet完全相同,所以SFESNet不具有提取数据中多尺度特征的能力。通过MSFESNet与SFESNet在相同数据集上的对比实验,验证MSFESNet中多尺度特征提取网络可以有效地提高识别准确率。表1是MSFESNet的网络结构,数据输入尺寸为600×3。
表1MSFESNet网络结构
Tab.1 MSFESNet network structure

本文选取网络深度、卷积核大小和通道数不同的IQ卷积神经网络[16](convolutional neural network structure based on IQ correlation features,IQCNet)、ORACLE[17](optimized radio classification through convolutional neural networks)、CNN-DLRF[18](deep learning for RF device fingerprinting in cognitive communication networks)、长短期记忆(long short-term memory,LSTM)网络 [20]、CLSTM[21](convolutional neural network long short-term memory)与MSFESNet在相同数据集上进行实验,以验证MSFESNet可以在一定程度上提高识别准确率,降低计算量。
3.2 数据集
对比实验所使用的数据集为FIT/CorteXlab实验室通过22台通用软件无线电外设产生的射频指纹识别数据集。22台设备中,21台作为发射机,1台作为接收机,接收机的接收频段为433 MHz,接收机采样速率为5 MSample/s。该数据集由3种数据传输形式和2种信号发射方式组成。3种数据传输形式分别是:数据序列固定不变,通过QPSK调制的固定数据,称为固定包;数据序列随机变化,通过QPSK调制的随机数据,称为随机包;数据序列为噪声,且没有经过调制的随机噪声数据,成为噪声包。2种信号发射方式分别是:通过固定信号幅度模拟发射机发射功率固定的普通模式;发射机不移动的情况下,改变信号幅度的变功率模式,其模拟的功率变换范围为20 dB[16]。
由上述描述可知,可通过固定功率和改变功率发送固定包、随机包、噪声包获取6种不同场景的实验数据集。采集数据的过程中,分别控制21台发射机周期地发送不同信号,每个周期发送600个IQ数据点,1台接收机接收相应的信号,并对接收的信号进行编号存储[18]。
本文所使用数据集的数据形式为复数。因为本文所设计的网络只能处理实数数据,所以对该数据集进行预处理操作。首先使用MATLAB读取FIT/CorteXlab射频指纹识别数据集;然后将数据中的I、Q分别取出,这时I、Q数据为实数数据;最后将I、Q数据进行运算(i、q为I、Q数据中的对应数据点),得到IQ数据, IQ数据包含了调制信号的能量信息。
考虑到I、Q数据中分别含有各自的幅度和相位信息,而IQ数据中含有调制信号的能量信息,所以将预处理后的I、Q、IQ作为网络输入,这样操作可以使网络学习到更加丰富的特征,以提高辐射源识别准确率。
3.3 评估方法
采用识别准确率对网络模型的泛化性能进行评估。对于分类问题,根据真实值和预测值的结果,可以将整个样本集分为真正例(true positive,TP)、伪正例(false positive,FP)、真反例(true negative,TN)和伪反例(false negative,FN)。识别准确率定义为:
(1)
其中:TP表示实际为正例、判定也为正例的次数,即表示判定为正例且判定正确的次数; FP表示实际为负例却判定为正例的次数,即表示判定为正例但判断错误的次数;TN表示实际为负例、判定也为负例的次数,即表示判定为负例且判定正确的次数;FN表示实际为正例却判定为负例的次数,即表示判定为负例但判断错误的次数。
3.4 实验流程
整体实验采用多次随机实验取平均值的方法获得最终识别准确率。单次实验流程为:首先将数据集打乱,使数据集变得无序。将数据集进行乱序处理后,将其中的70%作为训练集、10%作为验证集、20%作为测试集。使用训练集中的样本对网络进行训练,每训练完一轮则使用验证集中的样本进行验证,选择验证结果最好的网络参数作为最终的网络参数。最后使用测试集对训练好的网络进行测试,以测试集上的识别准确率作为最终的识别准确率。多次实验中,网络第40轮训练时的损失值都会趋于平稳,因此文中所有实验的训练轮次都设置为40,实验流程如图6所示。

图6单次实验流程
Fig.6Single experiment flowchart
3.5 实验条件
所有实验所用计算机的操作系统为Ubuntu18.04.4 LTS,内存为128 GB,CPU为Intel i7-9700k CPU @ 3.60 GHz,GPU为NVIDIA GeForce RTX 2080Ti,CUDA版本为10.1,编程语言为Python 3.7,深度学习框架为tensorflow2.3。
在训练前对数据集进行乱序处理,每次训练数据大小为1 024;损失函数为交叉熵,优化器为自适应矩估计(adaptive moment estimation,Adam)。学习率采用可变学习率,当损失函数的计算结果再训练3轮后仍保持不变,则修改学习率为原来的0.7倍,初始学习率设置为0.001。
交叉嫡损失函数定义如下:
(2)
式中,x表示样本,y表示真实标签,N表示样本总数,表示预测的结果。
3.6 识别准确率
相对于其他网络结构,MSFESNet最大的特点是具有多尺度特征提取网络可以提取数据的多尺度特征。
首先选取具有多尺度特征提取网络的MSFESNet和不具有多尺度特征提取网络的SFESNet进行比较验证,网络的输入数据为长度为600的时间序列,分别是固定包、随机包、噪声包、变功率固定包、变功率随机包、变功率噪声包。实验结果如图7所示。

图7多尺度特征提取网络对识别准确率的影响
Fig.7Influence of multi-scale feature extraction network on recognition accuracy
由图7可知,在6种场景下,MSFESNet和SFESNet在相同数据上表现出来的趋势是一致的。但是从图中可以很明显地看出MSFESNet在数据集上的平均识别准确率高于SFESNet。其中MSFESNet在6种场景下的平均识别准确率为94.71%,而SFESNet的平均识别准确率为89.6%,前者比后者高5.11%,证明多尺度特征提取网络有利于提高识别准确率。
图8展示了MSFESNet与IQCNet(8,32,3)、ORACLE、CNN-DLRF、LSTM、CLSTM对比网络在6种场景下的识别准确率。由图8可知:MSFESNet的平均识别准确率最高。在6种场景下,MSFESNet、ORACLE、CNN-DLRF、IQCNet(8,32,3)、LSTM、CLSTM的平均识别准确率分别为94.71%、61.71%、72.09%、91.67%、91.76%、93.13%,MSFESNet的平均识别率相对后5者分别高33%、22.62%、3.04%、2.95%、1.58%。可以看出:与ORACLE、CNN-DLRF、IQCNet(8,32,3)、LSTM、CLSTM相比,本文所提网络在识别准确率方面有一定的优势。

图8MSFESNet与对比网络识别准确率的比较
Fig.8Recognition accuracy comparison between MSFESNet and contrast network
3.7 计算复杂度
本文所提网络由一维卷积构成,因此网络的计算时间复杂度可以表示为:
(3)
式中,D表示网络所具有的卷积层数,Ml表示第l个卷积层输出特征图的长度,Kl表示第l个卷积层的边长(卷积核的大小)。
以本文所设计的网络为例,因为在文中将辐射源识别网络划分为特征提取层、特征选择层、分类层三个部分进行叙述,所以分析计算复杂度依然按照这三个部分进行分析。特征提取层(多分支结构)中的2个分支为单个卷积层,另外2个分支堆叠了2个卷积层,其中每个卷积层的特征图长度、卷积核数都是1 200、3,因此特征提取部分的计算复杂度为Tfe=6×1 200×3=21 600。特征选择层有6个单个卷积层,每个卷积层的特征图长度、卷积核数都是1 200、1,同上计算出特征选择部分的计算复杂度为 Tfs=7 200。分类层由4个卷积层堆叠构成,4个卷积层的特征图长度、卷积核数都是1 200、3,同上可得,分类层的计算复杂度为Tc=14 400。
综上可知,本文所设计的网络计算复杂度为Ttotal=Tfe+Tfs+Tc=43 200。使用相同方式计算其他对比网络的计算复杂度,如表2所示。
表2网络模型计算复杂度
Tab.2 Network model calculation complexity

由表2可知,与其他网络相比,本文所设计的MSFESNet具有最低的计算复杂度。除此之外,本文在相同的软硬件平台上使用相同数据对所有网络进行了训练。不同网络的模型参数数量与训练时间如表3所示。
表3网络模型参数数量及训练时间
Tab.3 Network model parameters and training time

从表3中可以看出,本文所提网络与其他网络相比,在相同的软硬件平台上对同一数据进行一轮训练所需的时间是最少的,仅需136 s。
4 结论
本文提出基于多尺度特征提取与特征选择网络的辐射源识别方法。该方法通过多尺度特征提取网络提取辐射源信号中的浅层特征和多尺度特征,再通过特征选择网络对浅层特征和多尺度特征进行降维和特征选择操作,这样既可以充分利用辐射源信号的浅层特征和多尺度特征,提高辐射源识别准确率,又能降低网络参数数量、减小网络运算时间。