团队科研成果分享-32

admin 2024年3月22日14:53:55评论2 views字数 5868阅读19分33秒阅读模式

团队科研成果分享-32

团队科研成果分享  

2024.03.18-2024.03.24

标题: Data Augmentation and Individual Identification Method for Emitters Using Contour Stella Image Mapping

期刊: IEEE Transactions on Cognitive Communications and Networking,2024

作者: Guangjie Han, Weitao Wang, Zhengwei Xu, Aohan Li

分享人: 河海大学——王伟弢

01

研究背景

BACKGROUND

研究背景

在无线通信网络(Wireless Communication Networks, WCN)中,众多设备相互连接,这对WCN的安全性提出了挑战。辐射源个体识别(Specific Emitter Identification, SEI)技术被认为是确保WCN安全性的关键技术,它在抵御网络攻击和增强系统安全方面发挥着至关重要的作用。当前基于深度学习(Deep Learning, DL)的SEI方法在训练过程中依赖于大量的标签数据,然而,在真实的无线通信情况下获取标签数据非常困难且不切实际,难以满足应用需求。为了解决这个问题,本文提出了一种基于等势星座图数据增强(Data Augmentation of Contour Stella Image, CSIDA)的小样本SEI方法。该方法通过将信号转换成等势星座图来可视化数据特征,并利用带局部鉴别器的生成对抗网络(PGAN)进行数据增强。通过结构相似性计算筛选出高质量的生成图像,最后使用ResNet提取特征进行训练和测试。所提方法在只有5个样本的情况下达到了85%的识别精度,展现了其在小样本SEI任务中的优越性。

02

关键技术

TECHNOLOGY

关键技术

A.等势星座图

在通信领域,一维序列信号通常被转换成二维图像,这种做法有多个优势:易于直观展示信号特征,利用图像处理技术提取丰富特征,以及通过数据压缩减少存储需求。特别是,在分析星座图以提取I/Q信号特征时,这种方法尤为重要。CSI图像通过将水平轴定义为信号的“I”分量,垂直轴定义为“Q”分量,来表示信号的幅度和相位偏移。为了提高星座图的鲁棒性并准确反映点密度,开发了一种新型的CSI数据可视化方法。它通过使用滑动窗口计算星座图不同区域的样本点数量,并根据点密度对星座图进行颜色编码,从而有效地将一维信号转换为具有统计意义的二维图像,并可视化点密度的变化。

B.生成对抗网络

在传统的GAN中,存在两个主要组成部分:生成器G和鉴别器D。生成器G被训练来学习真实数据的分布P_x,并生成与真实数据分布非常相似的生成数据G(z)。同时,鉴别器D被训练来对输入数据进行分类,它分别学习真实数据和生成数据的分布P_x和P_G(z),从而对输入执行二分类,以区分真实数据x和生成数据G(z)。当鉴别器不能可靠地区分真实数据和生成数据时,GAN网络达到了纳什均衡的最优状态。

与仅将损失函数作为通过梯度下降优化网络的指标的传统神经网络不同,GAN将损失函数视为一个基本组成部分。GAN通过生成器和判别器的对抗学习过程,实现生成器和判别器的共同训练,并最终达到纳什均衡状态。对抗损失函数作为GAN的目标函数,对实现这一均衡状态至关重要。这种独特的方法区别于其他神经网络,并且使得GAN能够生成高质量的数据,实现数据增强。

该方法的创新和贡献如下:

1)提出了一种基于CSI-DA的新型小样本SEI模型。通过将信号数据转换为CSI,有效地解决了针对一维序列数据,基于GAN的数据增强方法效果有限的问题。此外,局部判别器模块的引入进一步提升了生成数据的质量。

2)使用基于结构相似性的图像相似度计算方法来筛选生成的图像,从而提高了图像增强数据集的质量。此外,为了应对训练过程中梯度消失和爆炸的问题,将残差连接集成到神经网络架构中。

3)使用开源辐射源数据集评估了所提方法的性能。通过分析实验结果,我们得出了所提方法相比目前最先进的小样本SEI方法的优势。

03

算法介绍

ALGORITHMS

算法介绍

团队科研成果分享-32

图1 基于CSI-DA的小样本SEI模型框架

在本节中,我们详细介绍了所提出的小样本SEI模型和CSI-DA方法。该框架的示意图展示在图1中,包括四个步骤。首先,将原始I/Q信号转换为CSI,然后,使用提出的PGAN方法对转换后的CSI进行数据增强,以解决无线通信网络标签数据不足的问题。随后,基于图像相似度计算,根据与原始样本的相似度来筛选生成图像。最后,将增强后的图像数据集输入到ResNet中进行特征提取和分类。

(1)I/Q信号可视化

在提出的CSI-DA方法中,使用I/Q信号作为输入数据。单一信号可以被表示为一个I载波和一个Q载波,其中Q载波通过将I载波旋转90°来获得:

团队科研成果分享-32

其中A和φ分别表示幅度和频率。为了简化分析公式并使信号处理过程直接明了,I/Q信号中的个体信号符号通常表达为独立的I和Q分量。尽管位移效应导致相位变化,信号的I和Q分量仍然保持相关。

所提出的CSI-DA方法旨在通过将输入的I/Q信号转换为CSI(使用方程式(5))来捕捉信号的深层统计特性。引入一个尺寸为W×H的矩形窗口是这一转换的关键,其中W对应宽度,H对应高度。为了表示窗口在复数域平面上包含的样本点数,本文引入了一个点密度度量,表示为ρ_(W,H)(i,j),其中矩形窗口中心点在复数域坐标的位置为(x, y)。通过标准化点数并获得点密度的值,CSI可以表示信号复数分量的空间分布。高密度区域用黄色表示,表明点的集中度更高。中等密度区域用绿色表示,而低密度区域用蓝色表示。这种颜色编码的可视化过程使得星座图中不同点密度区域之间能够清晰区分。CSI的整个生成过程如图2所示。

团队科研成果分享-32

图2 等势星座图生成过程

本文提出的方法将I/Q信号波形转换为具有丰富统计意义的CSI。这一转换以图像数据的形式代表原始信号波形中的深层统计信息。在通信环境中存在噪声的情况下,CSI能表示细粒度特征,考虑了重叠的样本点,同时保留了信号的统计属性。另外,CSI在颜色方面还包含了更丰富的特征集。因此,深度神经网络的训练可以基于CSI中呈现的图像轮廓和颜色,促进了更全面的学习过程。

(2)数据增强 

在CSI中,不同辐射源的区分特征主要存在于样本点的轮廓分布和颜色分布中。传统的GAN生成的图像无法有效捕捉这些细节,并且其生成过程通常展示出一定程度的随机性。因此,传统GAN的局限性可能导致在生成的CSI中丢失重要的数据特征,最终降低后续的特征提取和分类性能。为了解决这个问题,本文提出了PGAN方法进行数据增强。通过PGAN,本文提出的方法可以生成与真实信号数据高度相似的样本,从而增强了深度学习可用数据集。

团队科研成果分享-32

图3 局部判别器框架

为了解决传统GAN生成图像质量不高,造成信号特征丢失的问题,CSI-DA方法引入了局部判别器架构,如图3所示。局部判别器评估特定区域内每个N×N块像素是否是生成器生成的图像。它仅考虑感受野内的N×N块像素,为图像中的每个块像素区域生成局部判别器的判别结果。然后将所有N×N块像素区域的判别结果进行平均化以获得判别器的最终输出。

为了解决传统GAN在捕获整体结构和局域细节方面的局限性,CSI-DA结合了局部和全局判别器结构。在这两个判别器分别更新之后,生成器随后考虑到来自两个鉴别器的累积总体损失进行更新。这种方法既能捕捉图像的整体轮廓,也能保留图像的局域细节。

团队科研成果分享-32

图4 PGAN框架

本研究采用了PGAN来生成CSI数据,以扩展小样本SEI域的样本集。具体而言,随机噪声通过生成器转化为CSI数据集,再经过全局和局部判别器的评估,产生全局和局部损失,共同构成PGAN的损失函数,用于优化生成器。此外,为提高生成样本的质量,引入了结构相似性计算筛选机制,剔除质量低的样本,保留与真实数据特征空间分布相似的图像。这一过程涉及对生成图像的亮度、对比度和结构信息的评估,采用高斯加权函数以增强对噪声和失真的鲁棒性。结果是,高质量的生成CSI数据集更紧密地匹配真实样本分布。CSI-DA方法通过这种方式解决了小样本问题,提高了模型的泛化能力及在特定环境下的识别准确性和鲁棒性。

(3)特征提取和分类

团队科研成果分享-32

图5 残差模块

本文对经过数据增强后的CSI数据集进行特征提取和分类。为此,构建了一个神经网络模型,其中包含了残差块,每个残差块包括两个关键组成部分:恒等映射和残差映射,如图5所示。

为了构建多层残差网络,将多个残差块堆叠在一起,实现深度神经网络模型的创建,能够捕获CSI中的深层特征。在网络架构中,池化层被用来缩小特征图的空间分辨率,而步长卷积层被用来减少特征图的维度。集成恒等映射促进了特征信息的直接传输,而残差映射的使用使网络能够提取输入与输出之间具有区分度的特征。这种设计缓解了梯度消失和爆炸的问题,使神经网络更易于训练,特别是在构建更深的网络模型时。因此,实现了更准确和鲁棒的识别。

04

实验结果

EXPERIMENTS

实验结果

(1)实验设置

本文评估了使用NJUPT-RFF数据集的性能,该数据集含有从7个VSG250设备收集的310-410个RF信号样本。信号通过VSG250信号生成器和BB60C频谱分析仪在实验室条件下生成并收集。研究比较了所提方法与三种先进的小样本SEI方法(DMEL、CRCN-AT和DAFS)的性能。这些方法分别采用特征嵌入、类重构与对抗训练、以及数据增强技术。为确保公平比较,每个辐射源设备用5个样本训练模型,并选取50个样本进行测试,以评估模型的泛化能力。信号样本由200,000个样本点组成,实验的具体参数设置见表1。

表1 实验参数设置

团队科研成果分享-32

(2)与目前最先进的小样本SEI方法的对比结果

团队科研成果分享-32

图6 与目前最先进的小样本SEI方法的对比实验结果

本实验评估了CSI-DA方法在小样本SEI任务中的表现,并与其他小样本SEI方法(如DAFS、CRCN-AT和DMEL)比较。CSI-DA通过利用CSI的深层统计特性和PGAN生成新样本,显著提高了数据集的准确率(超85%),远超其他方法(约70%、60%和不足60%)。相较于直接处理信号的方法,CSI-DA采用高性能分类算法,并将信号转换为二维图像,有效提取数据特征,即使在样本数量有限的情况下,也能接近模型性能的理论上限(超95%)。

(3)复杂度分析

表2 算法复杂度分析

团队科研成果分享-32

本研究分析了所提方法与对比方法的复杂度,包括参数数量和FLOPs。CSI-DA和CRCN-AT模型因集成对抗学习,涉及生成器、鉴别器等多个子模型,导致高参数量和FLOPs,需更多计算资源。这种设计在处理高维数据时增加了计算成本,特别是CSI-DA中的PGAN和CRCN-AT的类重构过程。相比之下,DAFS通过简单的数据操作减少了计算需求,DMEL依赖于预训练而非特定的数据增强模块,也显示出较低的参数和FLOPs。虽然CSI-DA的计算资源需求较高,但其在小样本场景下提供了更高准确性和模型泛化能力,对于高精度需求场合是有效的解决方案。

(4)数据增强性能分析

团队科研成果分享-32

图7 局部判别器性能分析

本实验对比了PGAN和传统GAN生成的CSI对分类任务的影响,以未增强数据的分类结果为基准。结果显示,PGAN生成的CSI在分类准确率上达到85%以上,明显优于传统GAN的75%。传统GAN在提升分类性能方面未显著改善。这表明PGAN生成的CSI因其更高的细节捕获和质量,能够提高SEI分类的准确性,突出了PGAN在生成高质量CSI方面的优势。

团队科研成果分享-32

图8 数据筛选性能分析

本文还比较了数据筛选前后CSI的分类准确性,通过分析实验结果(如图8所示),我们发现数据筛选后的CSI数据集在图像分类任务中表现出了更好的性能。具体来说,与数据过滤前的数据集的分类结果相比,过滤后的数据集在准确性表现上约提高了1-2%。此外,过滤后的数据集还显示出了更好的泛化能力和稳定性,表明其适用于SEI应用。

团队科研成果分享-32

图9 不同增强样本数的识别精度

本文通过一系列实验探讨了增强样本数量对小样本SEI识别精度的影响,结果表明,添加增强样本可提高识别精度,且识别精度随增强样本数量增加而提高,直至达到一个阈值,证实了数据增强方法的有效性。此外,研究还比较了AlexNet、DenseNet、GoogleNet、Inception和ResNet等五个图像分类网络在固定原始样本和不同数量增强样本条件下的性能,以评估数据增强方法对不同网络的影响。这为提高小样本SEI分类准确性提供了有价值的见解。

团队科研成果分享-32团队科研成果分享-32团队科研成果分享-32

    图10 40个增强样本的识别结果   图11 20个增强样本的识别结果   图12 没有增强样本的识别结果

上述结果展示了不同图像分类网络对CSI的分类性能,并考虑了不同数量的增加样本。显然,随着增加样本数量的增加,分类网络的性能在一定程度上得到了改善,这一发现为所提数据增强方法的有效性提供了验证。在进行比较的5个网络中,ResNet在加入增强样本后展示了最佳的分类性能。这一结果突出了ResNet对增强样本的出色的特征提取能力,取得了更好的分类效果,这也证实了在CNN中引入残差连接的有效性。

05

总结

CONCLUSION

总结

为了应对WCN场景中标签样本数据收集困难,限制了基于DL的SEI模型性能这一挑战,本研究提出了一种基于CSI-DA的小样本SEI方法。所提方法通过将原始I/Q信号转换成CSI以获得丰富的特征信息,解决了针对一维信号设计的神经网络识别性能差和欠拟合的问题。通过PGAN生成新的CSI样本,实现了数据增强,提升模型泛化能力。然后使用结构相似性计算筛选生成的样本,并随后使用ResNet进行特征提取和分类。实验结果展示了所提方法在小样本SEI任务中超越目前最先进小样本SEI模型。在开源数据集上进行的实验证实了所提方法在识别精度方面取得了显著改进。本研究为SEI领域的发展做出了贡献,有效地解决了有限标签数据样本带来的挑战。此外,在低信噪比环境下,本文提出的小样本SEI方法表现出不足的识别性能。这是由于噪声干扰以及图像转换效率低下,CSI不能再准确地代表原始信号的统计特性,这影响了后续数据增强、筛选和识别的性能。我们将在未来的工作中解决这个问题。

END

团队科研成果分享-32

扫描二维码关注我们

==河海大学网络与安全实验室==

微信搜索:Hohai_Network

联系QQ:1084561742

责任编辑:何宇

原文始发于微信公众号(网络与安全实验室):团队科研成果分享-32

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年3月22日14:53:55
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   团队科研成果分享-32https://cn-sec.com/archives/2594640.html

发表评论

匿名网友 填写信息