基于迁移深度学习的雷达信号分选识别

人工智能技术与咨询

来源：《软件学报》，作者王功明等

摘要: 针对当前雷达信号分选识别算法普遍存在的低信噪比下识别能力差、特征参数提取困难、分类器模型参数复杂等问题，提出了一种基于时频分析、深度学习和迁移学习融合模型的雷达信号自动分选识别算法。首先通过引入的多重同步压缩变换得到雷达信号的时频图像，然后利用灰度化、维纳滤波、双三次插值法和归一化等手段对时频图像进行预处理，最后基于迁移学习的方法，以GoogLeNet和ResNet模型为基础完成了对雷达信号的离线训练和在线识别。仿真结果表明，在信噪比为−6 dB时，该算法对9种雷达信号(CW, LFM, NLFM, BPSK, MPSK, Costas, LFM/BPSK, LFM/FSK, BPSK/FSK)的整体平均识别率可达93.4%，较常规人工提取算法具有更好的抗噪性和泛化能力。

1. 引言

近年来，随着雷达技术的快速发展，以低截获概率(Low Probability Interception, LPI)雷达为代表的各种新体制雷达在战场上得到了广泛的应用。战场电磁环境变得日益复杂、信号类型变化多样，使得传统依靠五大常规参数：载频(Carrier Frequency, CF)、脉冲宽度(Pulse Width, PW)、脉冲幅度(Pulse Amplitude, PA)、到达时间(Time of Arrival, TOA)和到达角(Direction of Arrival, DOA)组成的脉冲描述字(Pulse Description Word, PDW)已经难以满足雷达信号分选识别的实际需要 [1] [2] 。考虑到新体制雷达信号往往包含丰富的脉内信息，基于脉内信息的雷达信号分选识别算法逐步成为了研究热点。

基于脉内信息的雷达信号分选识别的关键在于特征提取和分类器设计。经过多年的不断研究，学者们陆续提出了时频分析、模糊函数、高阶统计量及变换域分析等方法。文献 [3] 通过Choi-Williams分布得到信号的时频图像，进一步提取出时频图像的奇异值熵和信号频谱的分形维数特征，最后使用基于支持向量机(Support Vector Machine, SVM)的分类器完成了对8种雷达信号的识别，在信噪比大于等于1 dB时，整体平均识别率达到95%；文献 [4] 提出一种基于模糊函数主脊切面特征的方法，构建出由主脊方向、切面重心和惯性半径组成的特征向量，所提取特征较好地反映了不同信号波形的差异，同时具备较好的抗噪性；文献 [5] 采用直接法得到雷达信号的双谱估计，基于广义维数(Generalized Dimension, GD)方法从双谱对角切片(Bispectra Diagonal Slice, BDS)中提取出3个区分度大的特征q值作为特征参数用于信号的识别，在信噪比为0 dB时对4种雷达信号的整体识别率为92.2%。这些都可以归纳为人工特征提取结合机器学习的方法，人工特征虽然具有计算简单、设计灵活、意义明确等优点，但也存在以下几个问题：一是表述能力有限。人工设计的特征往往比较简单固定，只能描述某一部分的信息，在处理复杂问题时容易遇到精度上的瓶颈；二是特征通用性不足。针对不同问题往往需要设计不同的特征，在处理新问题时某些特征的效果会大打折扣，需要反复验证其有效性；三是维数灾难。为了提升算法的精度，会提取各种各样的特征，当维数增加到一定程度后，增加特征维度反而会引起精度的下降。

随着深度学习理论的不断发展，鉴于它在计算机视觉中优异的模型泛化能力，学者们将深度学习引入到了雷达信号分选识别领域，利用各种成熟的深度学习网络模型自动提取信号的潜在特征，并取得了良好的应用效果 [6] - [11] 。文献 [12] 引入一种新的核函数构建Cohen类时频分布得到雷达信号的时频图，经过维纳滤波、双线性插值、灰度化等处理后送入CNN网络实现了对12种雷达信号(LFM, SFM, 2FSK, 4FSK, DLFM, EQFM, MLFM, BPSK, Frank, MP, LFM-BPSK, 2FSK-BPSK)的自动识别，在信噪比为−6 dB时，整体平均识别率达到96.1%；文献 [13] 提出了一种包含两个独立的卷积神经网络(Convolutional Neural Network, CNN)和赫尔曼网络(Herman Neural Network, ENN)的混合分类器模型，该算法信噪比大于等于−2 dB时对12种雷达信号(BPSK, LFM, Costas, Frank, P1-P4, T1-T4)的整体识别率达到94.5%。但与传统机器学习相比，深度学习对数据有非常严重的依赖，需要大量的样本数据学习潜在的特征，而且不能有效地应用于新的任务。在雷达信号分选识别等特殊领域，往往难以获得大量、高质量的训练样本。迁移学习通过使用现有的知识或模型来解决不同但相关领域的问题，为机器学习和深度学习提供了一个新的思路 [14] 。基于迁移学习的深度神经网络模型不用从零开始训练，而只需要在预训练网络模型的基础上对新的样本进行训练，然后进行网络参数微调，就可以方便快捷地达到满意的识别效果。文献 [15] 基于改进核函数的Cohen类分布得到雷达信号的时频图像，使用预训练自编码器(Stacked Auto Encoder, SAE)和AlexNet结构的卷积神经网络(Convolutional Neural Network, CNN)混合模型，通过迁移学习的方法完成了对12种雷达信号(Costas, LFM, NLFM, BPSK, P1-P4和T1-T4)的识别，在信噪比大于等于−6 dB时，平均识别率达到95.5%，尽管这些算法取得了良好的识别效果，但仍然存在一些问题：1) 模型复杂、训练时间长；2) 低信噪比下识别效果不佳；3) 对复合调制类型雷达信号关注较少等。

因此，本文结合时频分析、深度学习和迁移学习理论，提出了一种基于迁移深度学习的雷达信号分选识别算法。该算法先通过引入多重同步压缩变换(Multi-synchrosqueezing Transform, MSST)得到雷达信号的时频图像，然后对时频图像进行灰度化、维纳滤波、双三次插值法和归一化预处理，运用迁移学习的思想，分别基于GoogLeNet和ResNet两种预训练神经网络模型对时频图像进行离线训练，最后实现了对9种雷达信号的在线识别。

2. 基于时频分析的信号预处理

2.1. 雷达脉内调制信号模型

雷达信号的脉内特征包括脉内有意调制特征和脉内无意调制特征。无意调制特征又称为指纹特征，一般是人为误差产生或者雷达发射机硬件固有的非理想特性产生的固有特征，可用于辐射源个体识别(Specific Emitter Identification, SEI)。有意调制特征雷达波形设计者为了实现某种特定的功能，人为地加入了一些调制特征，包括幅度调制、频率调制、相位调制以及两种或两种以上的混合调制特征等 [16] [17] 。本文主要针对脉内有意调制特征展开研究，对指纹特征暂不做分析。

宽带接收机侦收到的雷达信号一般由信号和高斯白噪声两部分组成，其信号模型可描述为

y(t)=s(t)+n(t)=Aejϕ(t)+n(t)y(t)=s(t)+n(t)=Aejϕ(t)+n(t)(1)

式中， s(t)s(t) 表示雷达信号， n(t)n(t) 表示高斯白噪声。A表示信号的幅值，假设为1。 ϕ(t)ϕ(t) 表示信号的瞬时相位。9种雷达信号的调制类型分别为：常规信号(Conventional Wareform, CW)、线性调频信号(Linear Frequency Modulation, LFM)、非线性调频信号(Nonlinear Frequency Modulation, NLFM)、二相编码信号(Binary Phase Shift Keying, BPSK)、多相编码信号(Multi-Phase Shift Keying, MPSK)、Costas编码信号以及LFM/BPSK、LFM/FSK和BPSK/FSK复合调制信号。

2.2. 多重同步压缩变换(MSST)

雷达信号作为一种非平稳信号，包含丰富的时频域信息。典型的时频分析方法有：短时傅里叶变换(Short-time Fourier Transform, STFT)、小波变换(Wavelet Transform, WT)、魏格纳-威利分布(Wigner-Vill Distribution, WVD)以及Cohen类时频分布等。其中STFT属于线性变换，在实际应用中存在窗函数选择困难的缺陷；WVD属于二次型变换，在处理多分量复杂信号时不可避免地会产生交叉项干扰；而Choi-Williams分布属于Cohen类的一种，可以较好的抑制交叉项的干扰，但也无法完全消除交叉项。

MSST是一种对STFT多次执行同步压缩后处理的改进算法，由Yu Gang等人于2018年首次提出 [18] ，具有较高的时频聚集性，并且不会产生交叉项干扰，较CWD具有一定优越性。

信号的短时傅里叶变换(Short-time Fourier Transform，STFT)定义为

G(t,w)=∫+∞−∞g(u−t)s(u)e−jw(u−t)duG(t,w)=∫−∞+∞g(u−t)s(u)e−jw(u−t)du(2)

式中 g(u)g(u) 为窗函数。

选取信号模型为

s(u)=A(u)ejφ(u)s(u)=A(u)ejφ(u)(3)

其中 A(u)A(u) 、 φ(u)φ(u) 分别表示信号的幅度和相位。

幅度和相位的一阶泰勒级数展开式分别为

{A(u)=A(t)φ(u)=φ(t)+φ′(t)(u−t){A(u)=A(t)φ(u)=φ(t)+φ′(t)(u−t)(4)

信号 s(u)s(u) 可以表示为

s(u)=A(t)ej(φ(t)+φ′(t)(u−t))s(u)=A(t)ej(φ(t)+φ′(t)(u−t))(5)

于是，信号 s(u)s(u) 的短时傅里叶变换(STFT)时频谱可表示为

G(t,w)=∫+∞−∞g(u−t)A(t)ej(φ(t)+φ′(t)(u−t))e−jw(u−t)du=A(t)ejφ(t)∫+∞−∞g(u−t)ej(φ′(t)(u−t))−jw(u−t)d(u−t)=A(t)ejφ(t)gˆ(w−φ′(t))G(t,w)=∫−∞+∞g(u−t)A(t)ej(φ(t)+φ′(t)(u−t))e−jw(u−t)du=A(t)ejφ(t)∫−∞+∞g(u−t)ej(φ′(t)(u−t))−jw(u−t)d(u−t)=A(t)ejφ(t)g^(w−φ′(t))(6)

对上式求偏导，有

∂tG(t,w)=∂t(A(t)ejφ(t)gˆ(w−φ′(t)))=A(t)ejφ(t)gˆ(w−φ′(t))jφ′(t)=G(t,w)jφ′(t)∂tG(t,w)=∂t(A(t)ejφ(t)g^(w−φ′(t)))=A(t)ejφ(t)g^(w−φ′(t))jφ′(t)=G(t,w)jφ′(t)(7)

当 G(t,w)≠0G(t,w)≠0 时，瞬时频率估计 wˆ(t,w)w^(t,w) 可表示为

wˆ(t,w)=∂tG(t,w)jG(t,w)w^(t,w)=∂tG(t,w)jG(t,w)(8)

再对时频谱执行同步压缩处理(Synchrosqueezing Transformation, SST)，可表示为

Ts(t,η)=∫+∞−∞G(t,w)δ(η−wˆ(t,w))dwTs(t,η)=∫−∞+∞G(t,w)δ(η−w^(t,w))dw(9)

通过执行SST，可以从频率方向压缩STFT的结果，进而提高时频谱的能量聚集程度。

对得到的时频谱继续执行SST，有

Ts[2](t,η)=∫+∞−∞Ts[1](t,w)δ(η−wˆ(t,w))dwTs[3](t,η)=∫+∞−∞Ts[2](t,w)δ(η−wˆ(t,w))dw ⋮Ts[N](t,η)=∫+∞−∞Ts[N−1](t,w)δ(η−wˆ(t,w))dwTs[2](t,η)=∫−∞+∞Ts[1](t,w)δ(η−w^(t,w))dwTs[3](t,η)=∫−∞+∞Ts[2](t,w)δ(η−w^(t,w))dw ⋮Ts[N](t,η)=∫−∞+∞Ts[N−1](t,w)δ(η−w^(t,w))dw(10)

图1给出了6种典型雷达信号和3种复合调制信号在信噪比为8 dB时的MSST时频图像。

2.3. 时频图像预处理

为了减少噪声对时频图像的不利影响，以及得到满足分类器输入要求的时频图像，需要首先对原始时频图像进行预处理，具体的预处理流程如下。

Step1：将时频分布原始图像转换为灰度图像；

Step2：采用维纳自适应滤波器去除灰度图像的噪声点，对图像进行增强处理；

(a) CW(b) LFM(c) NLFM(d) BPSK(e) MPSK(f) Costas(g) LFM/BPSK(h) LFM/FSK(i) BPSK/FSK

Figure 1. Nine kinds of radar signals’ MSST time-frequencyimagewhen SNR = 8 dB

图1. 信噪比为8 dB时9种雷达信号的MSST时频图像

Step3：运用双三次插值法将时频图像大小调整为224 × 224，使所有信号的时频图像尺寸大小保持一致并减小数据量；

Step4：最后利用最大最小值法对图像进行归一化处理。

图2是Costas信号在信噪比为0 dB下的时频图像预处理流程。经过上述图像处理以后，在最大程度地保留信号完整信息的同时基本去除了噪声和冗余信息。

Figure 2. Preprocessing of time-frequencyimage

图2. 时频图像预处理

3. 迁移深度学习

3.1. 典型预训练深度神经网络模型

3.1.1. GoogLeNet网络

GoogLeNet是由Google公司提出一种卷积神经网络模型，曾在2014年的ILSVRC分类任务比赛中荣获冠军。其参数数量仅为AlexNet的1/12，但精度却远远超过AlexNet。GoogLeNet的主要创新主要有两点：一是用全局平均池化层替换掉了最后的全连接层，从而减轻了过拟合并且模型训练的速度更快；二是借鉴Networkin Network (NIN)的思想设计了Inception结构，该结构能够在不显著加大计算负担的前提下，更好地利用网络中的计算资源，增加网络的深度和宽度。

一个简单的Inception结构如图3(a)所示。它由3组尺寸不同的卷积核及一个最大池化单元构成，通过并行地处理来自上一层的输入图像，然后对结果依据通道进行融合拼接。

在执行卷积运算中，假如输入图像的通道数过多，就会耗费大量的运算资源，卷积核的参数数量也会过多，此时就需要对数据进行降维处理。图3(b)为加上降维功能的Inception模块。该模块对除1 × 1卷积之外的所有卷积和池化操作均使用了1 × 1卷积运算进行降维，从而减少了图像的通道数。

采用了Inception的GoogLeNet模型深度共有22层，其网络结构如表1所示。

其中，“#3 × 3 reduce”，“#5 × 5 reduce”表示在3 × 3、5 × 5卷积操作前使用1 × 1卷积的数量。输入图像为224 × 224 × 3，并且经过了零均值化的预处理操作，所有降维层都采用了ReLU非线性激活函数。

3.1.2. ResNet网络

从经验来看，网络的深度对模型的性能尤为重要，更深层次的网络有助于提取更加复杂的特征，当模型更深时取得的效果也就越好。但研究表明，深度网络出现了退化问题：随着网络深度的不断增加，训练的准确率趋于饱和，甚至出现了下降趋势。为了解决该退化问题，一种称为ResNet的新型卷积神经网络模型由微软亚洲研究院何凯明团队提出，它以3.6%的错误率赢得了2015年的ILSVRC分类比赛。其主要创新是提出了残差模块(Residual Block)，有效解决了网络深度增加所引起的梯度消失和退化问题，残差模块的结构如图4所示。

(a) 一个简单的Inception模块(b) 具有降维功能的Inception模块

Figure 3. Inceptionmodulation

图3. Inception模块

Type	Patchsize/Stride	Outputsize	Depth	#1 × 1	#3 × 3 reduce	#3 × 3	#5 × 5 reduce	#5 × 5	Poolproj	Params
Input		224 × 224 × 3
Convolution	7 × 7/2	112 × 112 × 64	1							2.7 K
Max pool	3 × 3/2	56 × 56 × 64	0
Convolution	3 × 3/1	56 × 56 × 192	2		64	192				112 K
Max pool	3 × 3/2	28 × 28 × 192	0
Inception (3a)		28 × 28 × 256	2	64	96	128	16	32	32	159 K
Inception (3b)		28 × 28 × 480	2	128	128	192	32	96	64	380 K
Max pool	3 × 3/2	14 × 14 × 480	0
Inception (4a)		14 × 14 × 512	2	192	96	208	16	48	64	364 K
Inception (4b)		14 × 14 × 512	2	160	112	224	24	64	64	437 K
Inception (4c)		14 × 14 × 512	2	128	128	256	24	64	64	463 K
Inception (4d)		14 × 14 × 528	2	112	114	288	32	64	64	580 K
Inception (4e)		14 × 14 × 832	2	256	160	320	32	128	128	840 K
Max pool	3 × 3/2	7 × 7 × 832	0
Inception (5a)		7 × 7 × 832	2	256	160	320	32	128	128	1072 K
Inception (5a)		7 × 7 × 1024	2	384	192	384	48	128	128	1388 K
Avg pool	7 × 7/1	1 × 1 × 1024	0
Dropout (40%)		1 × 1 × 1024	0
Linear		1 × 1 × 1000	1							1000 K
Softmax		1 × 1 × 1000	0

Table 1. Thestructure of GoogLeNet

表1. GoogLeNet网络结构

Figure 4. Residual block

图4. 残差模块

一个残差模块可以表示为

yi=F(xi,Wi)+h(xi)xi+1=f(yi)yi=F(xi,Wi)+h(xi)xi+1=f(yi)(11)

其中 xixi 和 xi+1xi+1 分别表示第i个残差块的输入和输出， F(x,Wi)F(x,Wi) 表示学习到的残差， h(xi)=xih(xi)=xi 表示恒等映射，f为ReLU激活函数。采用残差模块的ResNet网络共有5种不同的深度，其网络结构如表2所示。

类型	输出维度	18-层	34-层	50-层	101-层	152-层
conv1	112 × 112	7 × 7 , 64, stride 2
Conv2_x	56 × 56	3 × 3 , max pool, stride 2
Conv2_x	56 × 56	[ 3 × 3 , 64 3 × 3 , 64 ] × 2	[ 3 × 3 , 64 3 × 3 , 64 ] × 3	[ 1 × 1 , 64 3 × 3 , 64 1 × 1 , 256 ] × 3	[ 1 × 1 , 64 3 × 3 , 64 1 × 1 , 256 ] × 3	[ 1 × 1 , 64 3 × 3 , 64 1 × 1 , 256 ] × 3
Conv3_x	28 × 28	[ 3 × 3 , 128 3 × 3 , 128 ] × 2	[ 3 × 3 , 128 3 × 3 , 128 ] × 4	[ 1 × 1 , 128 3 × 3 , 128 1 × 1 , 512 ] × 4	[ 1 × 1 , 128 3 × 3 , 128 1 × 1 , 512 ] × 4	[ 1 × 1 , 128 3 × 3 , 128 1 × 1 , 512 ] × 8
Conv4_x	14 × 14	[ 3 × 3 , 256 3 × 3 , 256 ] × 2	[ 3 × 3 , 256 3 × 3 , 256 ] × 6	[ 1 × 1 , 256 3 × 3 , 256 1 × 1 , 1024 ] × 6	[ 1 × 1 , 256 3 × 3 , 256 1 × 1 , 1024 ] × 23	[ 1 × 1 , 256 3 × 3 , 256 1 × 1 , 1024 ] × 36
Conv5_x	7 × 7	[ 3 × 3 , 512 3 × 3 , 512 ] × 2	[ 3 × 3 , 512 3 × 3 , 512 ] × 3	[ 1 × 1 , 512 3 × 3 , 512 1 × 1 , 2048 ] × 3	[ 1 × 1 , 512 3 × 3 , 512 1 × 1 , 2048 ] × 3	[ 1 × 1 , 512 3 × 3 , 512 1 × 1 , 2048 ] × 3
	1 × 1	average pool, 1000-d fc, softmax
FLOPs		1.8 × 10 9	3.6 × 10 9	3.8 × 10 9	7.6 × 10 9	11.3 × 10 9

Table 2. The structure of ResNet

表2. ResNet网络结构

其中网络的深度分别为18，34，50，101，152，它们都是先经过一个7 × 7的卷积层，再连接一个最大池化操作，然后进行堆叠残差块，各网络中残差模块的数量依次为8，16，33，50。最后通常在网络的后端连接一个全局平均池化，从而有效防止过拟合，使输入输出的空间变换更具有鲁棒性。

3.2. 迁移深度学习

2005年，美国国防高级研究计划局(DARPA)信息处理技术办公室(IPTO)给迁移学习确定了一个新的定义：一个系统能够将从先前的任务中学到的知识和能力应用到新任务中解决问题。在这个定义中，迁移学习旨在从一个或多个源任务中提取知识，从而运用到目标任务 [19] 。

具体的讲：给定源域 DSDS 和学习任务 TSTS ，一个目标域 DTDT 和学习任务 TTTT 。迁移学习旨在将从 DSDS 和 TSTS 中学习到的知识帮助提升 DTDT 中目标预测函数 fT(.)fT(.) 的学习，其中 DS≠DTDS≠DT 或 TS≠TTTS≠TT ，多数情况下 DSDS 要大于 DTDT 的尺寸， NS≫NTNS≫NT 。

GoogLeNet和ResNet作为成熟的预训练网络，已经对超过一百万个图像进行了训练，学习到了丰富的特征，借助于迁移学习，将预训练好的成熟网络作为训练的初始值，基于它学习新的任务，通过网络微调(Fine-Tune)的方式就可以较少的训练样本快速地将已学习的特征迁移到新的任务中，从而有效解决了雷达信号样本构建难和训练耗时长的问题。

3.3. 基于迁移深度学习的雷达信号分选识别算法流程

本文构建的基于迁移深度学习的雷达信号分选识别算法的系统结构框图如图5所示。

Figure 5. Theframeworkoftransferreddeep learning system

图5. 迁移深度学习系统结构框图

具体步骤如下：

Step1：利用MATLAB软件产生雷达信号数据集；

Step2：基于MSST得到雷达信号的时频图像矩阵，并对时频图像进行灰度化、自适应维纳滤波、双三次插值缩放、归一化等预处理操作，生成尺寸为224 × 224的图像数据集；

Step3：加载预训练网络(GoogLeNet或ResNet)，利用迁移学习的方法，保持预训练网络的参数不变，替换掉最后一个可学习层和分类层，构建特征迁移模块；

Step4：通过图层复制将图像数据集转换为224 × 224 × 3的RGB图像，经过数据增强处理后构建样本集，其中80%用于训练，10%用于测试，10%用于验证；

Step5：将训练集和验证集送入网络进行迁移学习训练，迭代6次，得到最终训练模型TraindedNet；

Step6：利用训练后的模型TrainedNet对测试集进行识别，得到识别结果。

4. 仿真与分析

4.1. 仿真条件

本文对9种雷达信号进行分选识别，由于不同雷达信号具有不同的参数，为方便描述，采用基于采样频率 fsfs 的均匀分布 U(.)U(.) 统一表示，例如 U(1/8,1/4)U(1/8,1/4) 表示参数范围 [fs/8,fs/8][fs/8,fs/8] 在之间的随机数。详细的参数设置如表3所示，统一取采样频率 fs=64 MHzfs=64 MHz ，脉冲宽度 T=16 μsT=16 μs 。

雷达信号	仿真参数	取值范围
CW	载波频率 f c	U ( 1 / 8 , 1 / 4 )
LFM,NLFM	初始频率 f 0	U ( 1 / 16 , 1 / 8 )
LFM,NLFM	带宽B	U ( 1 / 16 , 1 / 8 )
BPSK	Barker码长度L	{ 5 , 7 , 11 , 13 }
BPSK	载波频率 f c	U ( 1 / 8 , 1 / 4 )
MPSK	Frank码步进频率M	{ 4 , 8 }
MPSK	载波频率 f c	U ( 1 / 8 , 1 / 4 )
Costas	跳频序列	[ 3 , 2 , 6 , 4 , 5 , 1 ] [ 5 , 4 , 6 , 2 , 3 , 1 ] [ 2 , 4 , 8 , 5 , 10 , 9 , 7 , 3 , 6 , 1 ]
Costas	基准频率 f min	U ( 1 / 24 , 1 / 20 )
LFM/BPSK	基准频率 f min	U ( 1 / 24 , 1 / 20 )
	带宽	U ( 1 / 16 , 1 / 8 )
	Barker码长L	{ 5 , 7 , 11 , 13 }
LFM/4FSK	基准频率 f min	U ( 1 / 24 , 1 / 20 )
LFM/4FSK	子码带宽 B c	U ( 1 / 20 , 1 / 10 )
BPSK/4FSK	Barker码长度L	{ 5 , 7 , 11 , 13 }
BPSK/4FSK	基准频率 f min	U ( 1 / 24 , 1 / 20 )

Table 3. Parameter setting

表3. 参数设置

4.2. 不同信噪比识别准确率实验

考虑雷达信号受高斯白噪声的影响，信噪比取−6~+14 dB，步长为2 dB。每个信噪比下每种信号各产生100组数据，基于多重同步压缩变换(MSST)得到信号的时频图像，并经预处理后生成224 × 224的灰度图像，最后转换为224 × 224 × 3的RGB图像(其中3是颜色通道数，可通过复制图层解决)用于构建样本集。其中80%用于训练，10%用于测试，10%用于验证。

加载新的训练样本集，分别基于GoogLeNet和ResNet重新进行训练，对部分网络参数进行微调，利用迁移学习训练后的网络模型对9种雷达信号进行分选识别，得到不同信噪比下基于两种CNN模型迁移深度学习的识别准确率结果如图6所示。

从图6仿真结果可知，两种模型下基于迁移深度学习的识别算法在信噪比大于−4 dB时，对9种雷达信号的识别准确率均达到90%以上；在信噪比大于0 dB时，9种雷达信号的识别准确率均达到了100%，证明了基于迁移深度学习实现对雷达信号自动分选识别的算法具有较高的抗噪声性能和泛化能力。

(a) 基于GoogLeNet迁移学习(b) 基于ResNet迁移学习

Figure 6. The recognition accuracy of nine kinds of radar signal under different SNR

图6. 不同信噪比下9种雷达信号的识别准确率

4.3. 抗混淆性能分析

为了进一步验证模型识别的准确性，分别基于GoogLeNet和ResNet迁移学习得到测试样本的混淆矩阵结果，如图7所示。

从混淆矩阵可以看出，ResNet模型的平均识别准确率更高，对9种雷达信号的平均识别率达到了99.51%，高于GoogLeNet模型约0.14%。结果表明经过图像预处理后得到的MSST时频图像能够较完整地反映雷达信号的有效信息，基于迁移深度学习模型自动提取的特征信息更加地精细，识别的准确性更高。

(a) 基于GoogLeNet(b) 基于ResNet

Figure 7. The confusionmatrixoftestsample

图7. 测试样本混淆矩阵

4.4. 算法对比

为进一步分析基于迁移深度学习算法的性能，下面将本文算法与文献 [12] 和 [13] 算法进行比较。两种算法对9种雷达信号的识别率曲线如图8所示。

由图8可以看出，本文提出的算法整体平均识别率明显优于文献 [12] 和 [13] 算法。在信噪比为时−6 dB时，采用改进Cohen类分布和CNN模型的文献 [12] 算法识别率为82.5%，这是由于该算法使用了过多的去噪图像预处理，损失了大量细节信息，并且所用的改进Cohen类时频分布对复合调制信号的处理能力

(a) 整体(b) LFM(c) CW(d) NLFM(e) BPSK(f) MPSK(g) Costas(h) LFM/BPSK(i) LFM/FSK(j) BPSK/FSK

Figure 8. The comparison between this paper and reference [8] [9]

图8. 算法性能对比

较差；采用人工提取特征的文献 [13] 算法的整体平均识别率仅能达到65.1%，这是由于该算法采用人工提取的特征容易受到噪声的影响，同时该算法未对复合调制信号进行研究；而本文基于GoogLeNet和ResNet迁移深度学习的算法在信噪比低于−6 dB时整体平均识别率仍然可以达到93.4%。在更高信噪比下，对9种雷达信号的识别率普遍优于其他两种算法。这是因为，该算法基于MSST时频分布和迁移深度学习自动挖掘的时频域高维特征表征能力更强，模型的抗噪性和泛化能力更为优秀，同时较常规的深度学习模型算法计算量更小，有助于工程上的实现。

5. 结论

本文提出了一种基于时频分析、深度学习和迁移学习的融合模型，并应用于雷达信号的自动分选识别中。该算法引入了多重同步压缩变换(MSST)得到信号的时频图像，然后利用灰度化、维纳滤波、双三次插值法和归一化等手段对时频图像进行预处理操作，最后基于迁移深度学习的方法，以两种预训练模型(GoogLeNet和ResNet)对时频图像样本进行重新离线训练，通过网络参数微调得到了新的融合模型，可以实现对9种雷达信号的自动识别。仿真结果表明，该算法模型简单、计算量小，在信噪比为−6 dB时，对9种雷达信号的识别率可达93.4%，具有较高的抗噪声性能和泛化能力。