动机
在信息安全日益重要的背景下,密码技术在保护通信内容方面发挥着越来越关键的作用。莫尔斯电码作为一种历史悠久且有效的加密方法,已被广泛应用于电报通信及多个领域。然而,在莫尔斯电码图像的传输过程中,由于噪声和失真等因素,导致分类精度受到影响,从而使得图像的全面识别变得困难。
目前的研究方法主要集中于处理单一类型噪声对莫尔斯电码图像的分类,而未能充分考虑到噪声污染可能造成的多种情况。这一现状催生了对更为灵活的分类方法的需求,以确保在多样化噪声环境下的高效准确的图像分类。
为了解决上述问题,研究者们提出了一种创新的双阶段方法,即噪声适应网络(NANet),旨在提高莫尔斯电码图像分类的准确性与鲁棒性。具体来说,该方法首先在干净图像上进行训练,然后通过提取未受噪声影响的重要信息,对嘈杂图像进行自适应处理。第一阶段引入了一个类似U-Net的网络结构,旨在学习特征并消除噪声;第二阶段则通过深度卷积神经网络进行分类。通过在第一阶段利用去噪模块,NANet在后续分类阶段实现了显著的精度提升与稳定性。
本研究的创新之处在于,构建了一个多噪声的莫尔斯电码图像数据集,包含了清晰图像与三种类型的噪声污染图像,为评估噪声对图像分类干扰提供了全面的基础。此外,研究还首次实现了在不同噪声环境下对莫尔斯电码图像的分类,为今后的相关研究提供了新的思路和方法。
图1. NANet在莫尔斯电码图像分类中的结构特征,包括U-Net-like子网络、编码器、解码器和分类器。
方法
本文提出了一种名为“噪声适应网络”(NANet)的方法,用于摩尔斯编码图像分类,该方法由两个阶段组成。第一阶段采用适应性自编码器进行噪声减少,第二阶段使用扩展卷积神经网络进行分类。
自适应自编码器
自适应自编码器通过不同的编码和解码阶段来增强特征表达和空间细节捕捉,旨在提高网络识别关键特征的能力并理解空间复杂性。编码阶段逐步通过卷积和池化层提取高级特征,采用双卷积的方法来防止过拟合并增强泛化能力。跳跃连接有助于信息流动和特征融合,而最大池化在下采样时保持细节并减少噪声影响。在上采样过程中,转置卷积提高了细节清晰度,最后的卷积层保持图像特性,生成高保真度的去噪图像。
精细分类器
细粒度分类器是架构中的关键部分,包含九个层级。在前六层中,执行初步的卷积操作、ReLU激活和最大池化,后面三个全连接层增强对去噪图像的理解和分类。引入三种不同的卷积核规模(11x11、5x5和三个3x3)以提高对多样化图像变体的适应性。在全连接层之前,应用自适应平均池化以增强泛化能力并为后续处理准备特征。每个全连接层有2048个神经元,将卷积特征转化为类别得分,并集成的 dropout 层有效地对抗过拟合,以促进更好的泛化和性能稳定性。
损失函数
模型采用混合误差训练,同时处理重构误差和分类损失。自适应自编码器重构输入数据,以最小化与原始数据的差异,使用均方误差(MSELoss)函数,在优化过程中优先考虑较大的错误,从而提高准确性和保真度。数学表达如下:
其中 表示真实数据, 表示预测数据, 代表总样本数。
分类损失使用交叉熵损失函数计算如下:
其中 表示样本数量, 表示类别数量, 表示第 个样本在第 类别的真实标签, 表示第 个样本在第 类别的预测概率。本研究的训练使用重构误差和分类损失的总和,计算如下:
框架图
图1. NANet用于摩尔斯编码图像分类的框架,包含编码器、解码器和分类器的 U-Net 类子网络。
实验
实验使用了Python 3.7.15和PyTorch 1.9.1,采用随机旋转技术以增强数据集的多样性。优化过程中采用Adam优化器,学习率固定为0.0001,同时输入图像标准化为224x224以提高Nvidia 1080 GPU的计算效率。训练过程中每个批次包含8张图像,训练总共进行了300个周期,模型评估基于准确率、精度、召回率和F1分数,以全面评估分类效果。
数据集
本研究集中于摩尔斯代码图像分类,采用矩形和圆形分别表示长划和点。数据集中包含1040张图像,每个字母(共26个)有40张母线摩尔斯代码图像,所有图像以512x512像素的统一分辨率展示。为了评估所提方法的鲁棒性,针对三种噪声类型(均匀噪声、高斯噪声及盐和胡椒噪声)进行性能测试。图2展示了字母’A’的摩尔斯代码图像该数据集的视觉多样性。
图2. 干净数据集示例(a)、均匀噪声数据集(b)、高斯噪声数据集(c)和盐和胡椒噪声数据集(d)对应字母A的图像。
与最先进方法的性能比较
为了确保客观性,分类网络和我们的NANet都在相同设置下进行训练。在干净摩尔斯代码数据集上训练并在四种图像类型上测试,每种类型各测试10张图像。表1到表3展示了我们的模型在分类干净数据集方面的优越性,并且在对不同类型的噪声具有很强的抗干扰能力,表现优于现有的网络模型。网络的CAM可视化(见图3)强调了图像分类中重要区域的重要性,无论输入图像的噪声级别如何。
表1. 在均匀噪声摩尔斯代码数据集上的测试结果
表2. 在高斯噪声摩尔斯代码数据集上的测试结果
表3. 在盐和胡椒噪声摩尔斯代码数据集上的测试结果
图3. VGG16及我们的模型在四个数据集(干净、均匀噪声、高斯噪声和盐与胡椒噪声数据集)上的CAM可视化,按顺序从上到下展示。
消融实验
为了验证自适应自编码器的有效性,进行了五个代表性模型的消融实验。在使用自适应自编码器生成的去噪特征图作为输入后,训练了五个基线模型,并在四个数据集上进行了测试。表4的结果显示,经过自适应自编码器的去噪后,在各种噪声数据集上测试准确性普遍提升。这反映出自编码器在适应噪声以及改善其他分类模型的泛化能力方面的有效性。
表4. 经过自适应去噪编码器去噪的模型在四种数据集上的测试准确率(%),分别展示仅用基准模型训练(左)与训练前用编码器去噪(右)的比较。盐表示盐和胡椒数据集。
结论
本论文提出了一种新的两阶段方法,用于分类噪声污染的莫尔斯电码图像。该方法在第一阶段采用一个类似于U-Net的子网络进行去噪,在第二阶段使用深度卷积神经网络进行分类。与VGG和MobileNet等先进方法相比,噪声适应网络(NANet)在三种噪声污染的莫尔斯电码图像上展示了更高的分类准确性和鲁棒性。未来的研究将探讨该方法在其他计算机视觉任务中的有效性,比如目标检测和实例分割。