学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 理工论文 基于MTF-DFT的小型残差网络轴承故障诊断论文

基于MTF-DFT的小型残差网络轴承故障诊断论文

0

2024-06-01 10:39:45    来源:    作者:zhoudanni

摘要:针对传统的一维振动信号在噪声环境下故障特征信息表现不够明显以及特征辨识性差、抗噪能力不强等问题,提出一种融合马尔可夫转移场的傅里叶变换特征提取方法和加入注意力机制的小型残差网络滚动轴承故障诊断模型。利用MTF保留信号之间的时间特性和DFT变换对于图像良好的抗噪性能,将一维轴承振动信号转换为二维灰度特征图,之后输入加入注意力机制的小型残差网络ResNet网络中进行故障特征提取,并引入通道注意力模块和空间注意力模块实现特征的自适应加权,经过softmax分类实现故障分类。采用凯斯西储大学轴承数据对模型进行验证

  摘要:针对传统的一维振动信号在噪声环境下故障特征信息表现不够明显以及特征辨识性差、抗噪能力不强等问题,提出一种融合马尔可夫转移场的傅里叶变换特征提取方法和加入注意力机制的小型残差网络滚动轴承故障诊断模型。利用MTF保留信号之间的时间特性和DFT变换对于图像良好的抗噪性能,将一维轴承振动信号转换为二维灰度特征图,之后输入加入注意力机制的小型残差网络ResNet网络中进行故障特征提取,并引入通道注意力模块和空间注意力模块实现特征的自适应加权,经过softmax分类实现故障分类。采用凯斯西储大学轴承数据对模型进行验证,并对模型的抗噪性能进行分析。结果表明,该模型准确率达到99.66%。并且在信噪比为-3 dB的情况下,模型的准确率仍能达到60.29%。

  关键词:轴承故障诊断,注意力机制,马尔可夫转移场,傅里叶变换

  0引言

  滚动轴承在现代工业生产中被广泛应用,其性能的好坏对工业生产有着重要的影响[1]。在实际的生产运行过程中,复杂恶劣的生产环境导致其损坏率较高,如何精确提取轴承故障特征从而实现轴承故障诊断成为该领域研究的重点和难点。

  随着人工智能技术的发展,深度学习越来越受到学者的青睐,深度学习在交通、医疗、电商等领域都已取得了丰硕的成果[2]。在故障诊断中,振动序列通常用于表征故障特征,现如今,随着数据量和计算量的不断增加,一些研究者提出将一维时间序列转化为二维图像,从更深层次挖掘振动序列的特征[3-5]。田科位等[6]采用改进深度残差网络对滚动轴承进行端到端的故障诊断。

  张玺君等[7]将注意力机制与多尺度卷积神经网络方法(MACNN)相融合,在提取不同尺度的特征时利用通道注意力自适应地选择包含故障特征的通道来提高模型的抗噪能力,抑制噪声的影响。关可铭等[8]提出一种改进卷积神经网络轴承故障诊断方法,利用局部均值分解(LMD),提高多变量时间序列的诊断效率。Wang等[9]基于自适应深度卷积神经网络进行自动特征学习适应不同信号特征,最终实现轴承故障诊断,并采用基于T分布的随机近邻嵌入可视化查看每一层网络的特征分布情况。

  基于上述分析,本文提出一种融合马尔可夫转移场的傅里叶变换和小型残差网络的滚动轴承故障诊断模型(Markov Transition Field Discrete Fourier Transform and ResNet,MFT-DFT-ResNet)。首先,将一维振动序列经过归一化;再利用马尔可夫转移场考虑时间相关性的特点和傅里叶变换的滤波特性将一维信号转换为二维特征图;最后利用小型ResNet网络实现故障分类。

  1基本理论

  1.1马尔可夫转移场

  马尔可夫转移场(Markov Transition Field,MTF)是一种基于时间序列数据的分析方法,主要用于分析和描述时间序列数据之间的转移行为和统计特征。MTF的基本思想是将一维时间序列转化为二维矩阵,通过矩阵的行和列分别表示两个不同时间点的状态,然后统计这两个时间点之间状态的转移概率和转移概率的变化,得到一组用于描述时间序列特征的统计特征[10]。

  通过反正切函数将一维振动序列数据进行归一化,将序列中大于等于0的数据映射到[0,1],序列中小于等于0的数据映射到[-1,0],这样振动序列的所有数据都被映射[-1,1]中[11],得到时间序列数组X={X1,X2,…,Xi,…,Xn}(0<i≤n)将时间序列数组X分为Q个部分并使得时间序列中的每个Xi映射到分位数qi(0<i≤n)。然后,沿着时间轴运用一阶马尔可夫链计算qi之间的转移概率并构造一个Q×Q的马尔可夫转移矩阵W,其表达式如式(1)所示:

image.png

  式(2)中wij反映了xt位于分位数qi时,分位数qj可能成为下一个时刻的状态概率,i,j∈[1,Q]且Q=n。

  到马尔可夫转移矩阵对时间序列X的分布不敏锐[12],造成矩阵W中部分信息缺失。为了克服这一缺点,在矩阵W中的基础上注重时间因素以及位置信息的影响,按照振动点的顺序来扩展矩阵W得到矩阵M。矩阵M如式(3)所示:

image.png

  式中:m ij为分位数qi和qj的转移概率。

  由于时间序列从分位数qi转移到分位数qj的概率不同,所以在特征图中的像素点也不同,进而经过MTF转化所得到的二维特征图具有时间相关性[13]。

  MTF可以将一维振动时间序列转化为二维图像,具有如下优点:(1)MTF既能保留原始信号的时间依赖性,又能保留其频率特征;(2)对图像旋转、缩放、平移不敏感,MTF方法的特征矩阵是基于图像空间结构计算的,不受图像旋转、缩放、平移等操作的影响,方便后续进行数据增强处理;(3)MTF只需要计算像素值序列的状态转移概率矩阵,计算量较小[14]。

  1.2傅里叶变换

  在图像处理中,傅里叶变换(Fourier Transform)可以将图像转换为频域表示,用来进行图像降噪、图像增强等处理[15]。图像的傅里叶变换指的是将图像中的像素值转换为频域表示,可以更好地表现图像的特征。假设一个M×N的二维灰度图像f(x,y),其中x,y分别表示图像的水平和垂直坐标,根据傅里叶变换的定义,可以将f(x,y)的傅里叶变换F(x,y)表示为:

image.png

  其中频域系统是以u(u∈[1,M-1])、v(v∈[1,M-1])表示F(u,v),而空间域系统则是用变量x,y表示f(x,y)。

  灰度图通常以像素的形式存在,为了处理离散的图像,通常采用离散傅里叶变换(Discrete Fourier Transform,DFT)将图像转换为频域表示,从而更好地分析和处理图像的特征和结构[16]。离散傅里叶变换如下:

image.png

  
       振动序列的MTF图进行二维的傅里叶变换可以提取图像的频率信息,去除信号中的干扰和噪声,保留MTF的时间依赖性和频率特征,提高信号的质量。

  1.3注意力模块

  注意力机制较多应用于计算机视觉,通过对输入部分给予不同的权重,使得模型将更多的注意力放在对结果影响较大的输入上,达到优化模型的效果[17]。本文将卷积注意力模块(Convolutional Block Attention Module,CBAM)引入到小型残差网络中进行结合,以提高模型的故障识别精度。CBAM往往由通道注意力模块(Channel Attention Module,CAM)和空间注意力模块(Spartial Attention Module,SAM)组成[18]。

  CAM模块的作用是加权不同通道,提高网络对通道的敏感性。CAM模块先将原来的通道数进行压缩,然后再将通道数扩张,经过ReLU激活函数和Sigmoid激活函数得到CAM的输出结果[19]。CAM模块的结构如图1所示。

image.png

  SAM模块则关注目标的位置信息,SAM模块通过学习每个空间位置的重要性对输入特征图的空间维度进行加权,从而提高网络对不同空间位置的敏感性[20]。SAM通过一个卷积层将特征图映射到低维空间,在低维空间上应用注意力机制,得到加权后的特征图。SAM模块的结构如图2所示。

image.png

  2故障诊断模型

  2.1诊断模型基本结构

  本文提出了一种融合马尔可夫转移场的傅里叶变换和小型残差网络模型,图3为网络结构示意图。首先将一维轴承振动信号经过反正切归一化处理,将数据映射到[-1,1]范围内,然后转化为MTF灰度特征图,保留时间序列相关特征;然后将MTF灰度特征图经过DFT变换成64×64×1的特征图作为输入图片,经过4层卷积池化单元输出尺寸为15×15,加入通道注意力机制和空间注意力机制,对128维通道进行加权,最后经过softmax层将故障类型与输出建立映射关系。

image.png

  2.2模型基本参数

  本文模型训练过程中部分参数及其取值如表2所示。

  加入dropout项可以随机舍弃训练过程中的参数以防止过拟合,加入L2正则化项可以同时限制模型的复杂度和提高模型的泛化能力。

image.png

  3实验研究与分析

  3.1实验数据介绍

  本文实验数据选取CWRU公开轴承数据[21]。选取6205-2RS JEM SKF型号的DE驱动端轴承数据,电机转速为1797 r/min,电机载荷为0,在此条件下,选取3种故障直径:0.117 8 mm、0.355 6 mm、0.533 4 mm。

  在所选取的实验数据集中,共9组故障数据和一组正常数据,每组数据有12万个采样点。信号片段通过滑窗函数截取,采用重叠采样方法进行数据增强。窗口大小为2048,步长为400。截取信号经过反正切归一化后进行MTF转换,得到每个窗口的MTF二维特征图。然后将这些二维特征图按时间顺序排列,形成一个具有时间相关性的MTF二维特征图,然后经过DFT变换转化64×64的输入特征图。其中特征图个数共300个,按照8∶2的比例划分训练集和测试集。数据集划分和故障种类标签如表2所示。

image.png

  3.2实验验证

  应用本文提出的MTF-DFT方法,将10类故障数据转化为二维特征图如图4所示。由图可知经过傅里叶变换后可以通过灰度变化剧烈程度看出信号频率的高低,而图像中的噪声信号往往是高频信号,可以将振动信号和噪声信号通过MTF-DFT方法区分开。

image.png

  准确率随迭代次数的变化曲线如图5所示,从图中得知模型大概在20次开始收敛,且最终准确率可以达到99.66%。将训练好的模型进行测试集验证,为了全面分析模型对每种故障类型的识别效果,使用混淆矩阵对实验结果进行展示[22]。测试集的混淆矩阵如图6所示,有个别样本分类错误,但每一类故障基本可以被准确区分开。

image.png

  为进一步分析模型对不同故障数据特征的学习能力,运用t-随机近邻嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)降维算法将数据投影到二维空间中,对网络分类后的特征数据进行可视化,t-SNE结果如图7所示,可以发现模型具有较好的分类和特征提取能力,轴承故障分类得到基本实现。

  3.3对比实验

  为了验证本文模型的有效性,设置其他6组常用的编码方式和分类模型。其中常用的将时间序列转化为图像的方式有:格拉姆角场变换(Gramian Angular Field,GAF)、短时傅里叶变换(Short Time Fourier Transform,STFT)等,常用的分类模型有支持向量机模型(SVM)、一维卷积神经网络(1DCNN)等。将本文提出的MTF-DFT-ResNet模型、二维ResNet模型与STFT-CNN模型、SVM模型、1DCNN模型、GAF-ResNet模型进行比较。采用灰度图像作为输入。对比结果如图8所示。从图中的对比结果可以看出不经过处理的GAF编码方式要明显低于其他的编码方式,经过傅里叶变换的MTF编码方式的准确率要明显高于普通MTF灰度图编码方式的准确率,说明傅里叶变换能够有效表现经过MTF变换的特征图的特征,从而验证了本文所提方法的有效性。在加入注意力模块后的ResNet模型准确率有所上升。同时,传统的机器学习模型SVM和1DCNN模型不如二维图像分类模型的效果好。

image.png

  3.4模型的抗噪性能试验

  噪声在电机实际工况中不可避免,因此模型在噪声环境下的性能分析是必要的[23]。加性高斯白噪声是一种模拟实际环境噪声的方法,信噪比(Signal-to-Noise Ratio,SNR)表示信号与噪声比值,以分贝(dB)为单位。SNR越大,信号中的噪声越小,否则相反[24]。信噪比的定义如公式(6):

image.png

  式中:x为信号的采样值;n为噪声信号;Psingal和Pnoise分别为信号和噪声的功率。

  推导可得噪声n

image.png

  式中:N为原始噪声信号长度。

  为了验证本文提出的方法的抗噪性能,本文对原始数据进行加性高斯白噪声的实验,将原始数据分布加入6组信噪比为[-6,9]的噪声。采用MTF-DFT-ResNet模型、二维ResNet模型,1DCNN模型和MTF-ResNet模型进行抗噪实验对比。结果表明在没有注意力机制的情况下模型的抗噪能力较弱,经过傅里叶变换后的MTF-ResNet模型的抗噪能力较强,这是由于在图像中振动信号通常表现为低频成分,傅里叶变换可以充当滤波器的角色,将高频信号和低频信号区别开,使得信号的特征更为明显[25],但是在高噪声环境下,信号的原本特征会产生较大的变化,形成信号失真,不利于模型的分类处理。通过对比MTF-ResNet和1DCNN模型在低噪声环境下的抗噪性,说明MTF能够更好地保留一维信号的特征,更适应神经网络模型的分类。噪声环境下模型准确率对比如图9所示。

image.png

  4结束语

  本文提出了一种MFT-DFT-ResNet轴承故障诊断方法,并将特征图输入带有注意力机制的小型ResNet网络中进行故障分类,进行相关实验,得到以下结论。

  (1)不同故障直径的故障数据和正常状态的轴承振动信号的MTF-DFT编码图像有明显的不同,故障特征较为明显。

  (2)经过MTF-DFT变换的轴承序列有着良好的故障分类性能和抗噪性能。在无噪声条件下,模型的准确率能达到99.66%,同时,在信噪比为-3 dB的情况下,模型的准确率仍能达到60.29%。

  (3)本模型的优势在于利用MTF-DFT将一维振动信号转化为二维特征图后,模型的抗噪性能得到明显的提升,同时在MTF的基础上进行傅里叶变换能够充分保留故障信息,过滤高频信息。同时,加入注意力机制后的模型实现了对特征自适应加权,能够进一步提升模型的性能,完成故障诊断任务。

  参考文献:

  [1]封成东,李玥,封成智.基于VMD样本熵和改进极限学习机的滚动轴承故障诊断[J].甘肃农业大学学报,2023,58(2):215-225.

  [2]Guo S,Yang T,Gao W,et al.A novel fault diagnosis method for rotating machinery based on a convolutional neural network[J].Sensors,2018,18(5):1429.

  [3]Alex Krizhevsky,Ilya Sutskever,Geoffrey E.Hinton.ImageNet classification with deep convolutional neural networks[J].Communications of the ACM,2017,60(6):84-90.

  [4]Noda K,Yamaguchi Y,Nakadai K,et al.Audio-visual speech recognition using deep learning[J].Applied Intelligence,2015,42(4):722-737.

  [5]Young T,Hazarika D,Poria S,et al.Recent trends in deep learning based natural language processing[J].IEEE Computational Intelligence Magazine,2018,13(3):55-75.

  [6]田科位,董绍江,姜保军,等.基于改进深度残差网络的轴承故障诊断方法[J].振动与冲击,2021,40(20):247.

  [7]张玺君,尚继洋,余光杰,等.基于注意力的多尺度卷积神经网络轴承故障诊断[J/OL].吉林大学学报(工学版):1-10

  [2023-04-227].http://kns.cnki.net/kcms/detail/22.1341.T.20230407.1503.006.html.

  [8]关可铭,杜兵,李金峰,等.基于LMD和改进CNN的轴承故障诊断方法[J].制造业自动化,2023,45(1):216-220.

  [9]Fuan W,Hongkai J,Haidong S,et al.An adaptive deep convolutional neural network for rolling bearing fault diagnosis[J].Measurement Science and Technology,2017,28(9):095005.

  [10]Wang M,Wang W,Zhang X,et al.A New Fault Diagnosis of Rolling Bearing Based on Markov Transition Field and CNN[J].Entropy,2022,24(6):751.

  [11]姜家国,郭曼利.基于MTF和DenseNet的滚动轴承故障诊断方法[J].工矿自动化,2022,48(09):63-68.

  [12]Wang Z,Oates T.Spatially Encoding Temporal Correlations to Classify Temporal Data Using Convolutional Neural Networks[EB/OL].arXiv Preprint,2015:arXiv.1509.07481.

  [13]雷春丽,焦孟萱,马淑珍,等.基于MTF-SPCNN的小样本滚动轴承变工况故障诊断方法[J/OL].北京航空航天大学学报:1-15[2023-04-27].DOI:10.13700/j.bh.1001-5965.2022.0927.

  [14]赵志宏,李春秀,窦广鉴,等.基于MTF-CNN的轴承故障诊断研究[J].振动与冲击,2023,42(2):126-131.

  [15]Kaushik A K.A Novel Approach for Digital Watermarking of an Image Using DFT[J].International Journal of Electronics&Computer Science Engineering,2012,1(1):35-41.

  [16]k I.its icr,sig,in(o901-907.

  [17]占可,王寅杰,董路南,等.基于改进格拉姆角场和注意力的滚动轴承故障诊断[J/OL].轴承:1-8[2023-04-27].http://kns.cnki.net/kcms/detail/41.1148.TH.20230112.1507.003.Html.

  [18]陈森楸,刘文波,张弓.嵌入双尺度分离式卷积块注意力模块的口罩人脸姿态分类[J].中国图象图形学报,2022,27(4):1125-1136.

  [19]Pang B.Classification of images using EfficientNet CNN model with convolutional block attention module(CBAM)and spatial group-wise enhance module(SGE)[C]//International Conference on Image,Signal Processing,and Pattern Recognition(ISPP 2022).SPIE,2022,12247:34-41.

  [20]Rehman Ullah Khan,Woei Sheng Wong,Insaf Ullah,Fahad Algarni,Muhammad Inam Ul Haq,Mohamad Hardyman bin Barawi,Muhammad Asghar Khan.Evaluating the Efficiency of CBAM-Resnet Using Malaysian Sign Language[J].Computers,Materials&Continua,2022,71(2):2755-2772.

  [21]Case Western Reserve University,Bearing Data Center(Seeded Fault Test Data)[EB/OL].(2013-08-16)[2017-01-02].https://engineering.case.edu/bearingdatacenter/welcome.

  [22]Yan Jialin,Kan Jiangming,Luo Haifeng.Rolling Bearing Fault Diagnosis Based on Markov Transition Field and Residual Network[J].Sensors,2022,22(10):3936.

  [23]张辉,戈宝军,韩斌,等.基于GAF-CapsNet的电机轴承故障诊断方法[J].电工技术学报,2023,38(10):2675-2685.

  [24]Wang S,Zhuang C,Geng Y,et al.Fault location method based on edge detection for low SNR traveling waves[J].Electric Power Systems Research,2021,201:107505.

  [25]李玥玥,刘万平,黄东.融合多头注意力机制的图像降噪网络模型[J].计算机科学,2023,50(S2):326-333.