学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 理工论文 基于CNN-LSTM的轨道车辆轮对运行状态识别方法研究论文

基于CNN-LSTM的轨道车辆轮对运行状态识别方法研究论文

33

2023-09-20 16:49:32    来源:    作者:yeyuankang

摘要:轨道车辆的轮对运行实时状态是评价车辆运行安全性及轮对导向控制的关键信息,针对轨道车辆在运行过程中轮对横移、摇头角实时状态直接测量成本高、难度大等问题,提出了一种基于卷积神经网络(CNN)内嵌长短记忆(LSTM)网络的轮对运动状态识别及预测方法。以轮对横向加速度、轮对摇头角加速度、一系悬挂位移量等易测信号构成特征集,通过CNN对时序信号进行多维度空间特征提取并输入到LSTM中捕获时序特征,最后通过全连接层输出轮对横移及摇头角的预测值,结合车辆运行的实际工况特点,对预测模型的泛化性及鲁棒性进行检验。仿真结果表

  摘要:轨道车辆的轮对运行实时状态是评价车辆运行安全性及轮对导向控制的关键信息,针对轨道车辆在运行过程中轮对横移、摇头角实时状态直接测量成本高、难度大等问题,提出了一种基于卷积神经网络(CNN)内嵌长短记忆(LSTM)网络的轮对运动状态识别及预测方法。以轮对横向加速度、轮对摇头角加速度、一系悬挂位移量等易测信号构成特征集,通过CNN对时序信号进行多维度空间特征提取并输入到LSTM中捕获时序特征,最后通过全连接层输出轮对横移及摇头角的预测值,结合车辆运行的实际工况特点,对预测模型的泛化性及鲁棒性进行检验。仿真结果表明:相较于传统的单LSTM识别模型,CNN-LSTM模型能有效降低轮对运动状态的识别误差,且在不同运行工况以及车辆物理参数变化的情况下,该模型具有高鲁棒性,能够保持较高的预测精度。

  关键词:轨道车辆;轮对运动状态;状态识别;卷积神经网络;长短时记忆网络

  Abstract:The real-time running state of wheelset of rail vehicles is the key information to evaluate running safety of vehicle and the wheelset guidance control.Aiming at the problems of high cost and difficulty in direct measurement of wheelset lateral movement and yaw angle parameters of rail vehicles during operation,a method of wheelset state recognition based on convolution neural network(CNN)embedded long and short term memory(LSTM)network was proposed.The feature set was composed of easy-to-measure signals such as the lateral acceleration of the rail vehicle wheel set,the angular acceleration of the wheel set shaking head,and the primary suspension displacement.The multi-dimensional spatial feature extraction of the time series signal was carried out through CNN and input to LSTM to capture the time series feature.Finally,the predicted values of the wheel set lateral displacement and shaking head angle were output through the full connection layer,and the generalization and robustness of the prediction model were tested in combination with the actual operating conditions of the vehicle.The results show that compared with the traditional single LSTM recognition model,the CNN-LSTM model can effectively reduce the recognition error of the wheel set motion state,and the model can still maintain high prediction accuracy under different conditions and when the vehicle physical parameters change.

  Key words:rail vehicle;running state of rail wheelset;state recognition;convolutional neural network;long short-term memory network

  0引言

  随着轨道交通的不断发展,轨道车辆的走行部实时状态监测逐渐成为研究的热点[1]。其中,轮对运动状态的实时测量是实现轨道车辆导向控制及提高运行安全性的一个重要前提[2-3],但是由于轮轨接触关系复杂、传感器布置困难、对于检测的准确度与速度要求较高等原因,长期以来尚未提出有效的监测方式。

  轮对运动状态的测量方法包括直接测量法和间接估计法。直接测量法通过在运行车辆上布置多种视觉类传感器,通过轮轨上的一些特征量在传感器视野中的实时变化来计算轮对相对于轨道的运动状态。马增强[4]提出了基于双目视觉的车轮姿态提取的位移检测方法,由两相机所在坐标的对应关系恢复出车轮两个端面中心的空间坐标信息,由车轮轴线空间位置间接得到轮轨接触场景利用当前时刻车轮中心轴线坐标与初始时刻比较,计算车轮相对轨道的横移量、垂移量、摇头角位移量等参数。宋子彬[5]根据相机物像空间几何成像模型建立车轮运动中轮缘角度与图像中椭圆短轴变化关系,实现对三维空间中轮缘位置和角度信息的采样与记录,并证明了轮缘几何特性与车轮偏转角度之间单一映射关系,将轮轨冲角小的检测转化为椭圆短轴长度特征的检测。杨淑芬等[6]建立了以DSP为核心的轮轨接触点硬件和软件检测系统,通过对轮轨图像进行预处理、边缘检测、形态学处理以及边缘链接得到轮轨边缘的轮廓,最终实现轮

  轨接触点位置的在线连续测量。钟莎[7]提出了一种基于摄像机与激光源结合的轮轨相对横移检测方法,通过计算激光点在轨道图像上的坐标变换来计算轮对相对轨道的横移。上述方法均使用相机拍摄轮轨图像来识别轮对运动状态,难以迅速适应复杂的车辆运行明暗环境,且图像数据计算度较高,难以保证实时性。

  因此,国内外许多学者也提出了一些间接的轮对运动状态求解方法。Pérez,J[8]采用卡尔曼滤波器,通过横移加速度和摇头角速度估计轮对横移量、横移速度、摇头角,并据此提出了3种控制策略,分别基于轮对横移量、摇头力矩和摇头角实现了转向架的主动导向。Pear⁃son,JT[9]建立了高速列车转向架的稳定性主动控制系统,采用卡尔曼滤波器,通过轮对横移加速度和摇头角速度估计轮对横移量、横移速度和摇头角,仿真比较了经典控制策略和最优控制策略。徐子峻[10]针对转臂式定位转向架和导柱式定位转向架,建立了轮对平衡方程,利用轴箱加速度、一系位移、轴箱应变,计算得出了轮对位移,通过Simpack仿真实验、整车滚动台试验验证了可行性和准确性。孙效杰等[11]基于独立旋转车轮模型,采用降维观测器和高阶滑模观测器,通过轮对摇头速度和横移加速度,估计了轮对横移量、冲角、转速差。Alex⁃ander Keck[12]等基于独立旋转车轮设置了多种传感器组合的状态量,采用了扩展卡尔曼滤波器对轮对横移、冲角进行了估计,并在1∶5试验车上进行了验证。张弛[13]基于轮对动力学模型,通过轴箱加速度、轮对侧滚角速度和一系相对位移,实现对轮对横移量的状态估计。上述研究均基于物理模型,在建模时对一些复杂的非线性系统进行了简化,导致识别精度降低,识别效果不佳,而且在物理模型基础上通过算法迭代计算时往往有赖于一些既定参数的准确设置,识别条件较为苛刻。

  近年来随着计算机水平的提高以及车辆系统感知能力的增强,基于数据驱动的车辆走行部状态监测模型得到越来越多的研究[14-15]。张卜等[16]建立了BP-LSTM组合式脱轨系数的网络模型,较准确地预测除了脱轨系数的变化趋势。方明宽等[17]提出了一种基于经验模态分解和LSTM的模型对高速列车横向蛇形失稳进行预测。但是目前在轮对运行状态方面的数据驱动模型研究较为有限。

  本文提出一种卷积神经网络(Convolutional Neural Networks,CNN)内嵌长短时记忆网络(Long Short-Term Memory,LSTM)的轮对运动状态识别方法。卷积神经网络的局部特征学习能力可以有效提取信号的特征;长短时记忆网络是循环神经网络(Recurrent Neural Net⁃work,RNN)的改进学习算法,在时序信号处理领域有良好的应用效果,而LSTM能够学习到时序数据的长期依赖关系,两者的结合大大增强了多维时序数据的特征提取能力。该方法以轮对横向加速度、摇头角加速度等信息构建的多维时序数据集作为输入,通过CNN提取多维信息特征,然后通过LSTM学习特征在时序维度上的信息,最后通过全连接层输出轮对横移量和摇头角的预测结果。

  1卷积神经网络及长短时记忆网络基本原理

  1.1卷积神经网络

  卷积神经网络是一类卷积计算且具有深度结构的前馈神经网络,基本架构如图1所示。

截图20230920163847.png

  1.2长短时记忆网络LSTM

  LSTM是RNN的改进学习算法,通过增加Input、Forget、Output 3种门结构使循环神经网络记忆历史有效信息并选择忘记不重要的信息,一定程度上解决了时序数据的长期依赖问题。

  如图2所示,假定输入序列为(x 1,x2,x3,…,xt)时,隐含层状态为为(h 1,h2,h3,,ht),则时刻t有:

截图20230920163948.png

  式中:ft、it、Ot分别为Forget、Input、Output 3种门结构的输出信息;ht-1为前一时刻隐藏层的输出信息;ht为当前时刻隐藏层的输出;Ct-1、Ct分别为长时记忆链上一时刻和当前时刻的历史记忆信息;为用于更新长时记忆链的特征单元;Wf、Wi、Wc、Wo分别为不同连接层的权重矩阵;bf、bi、bc、bo为不同连接层的偏置;sigmod和tanh为两种激活函数。

截图20230920164027.png

  从以上3个“门”对数据的处理后得到的长时记忆链保证了一些特征信息从网络的一个步骤传递到下一个步骤,这种链状架构展示了时序数据之间的密切相关性,所以LSTM网络对时序信号的预测具有良好的效果。

  2轮对运动状态识别模型

  本文搭建识别模型的流程如图3所示,将多源传感器信息经过预处理、特征选择后保留特征明显的传感器数据子集,轮对的横移与摇头角作为标签数据,以此构成多时间步输入——单时间步输出的样本集,用来训练基于CNN-LSTM的轮对运动状态识别模型。此模型组合了卷积神经网络和长短记忆网络,充分提取了多通道时序信号蕴含的特征信息。采用RMSE、R2等指标来评价该模型的识别精度,并用不同工况的测试样本集对模型的泛化能力进行检验,在此过程中不断优化模型参数得到最终预测模型。

截图20230920164055.png

  2.1数据处理与特征选择

  由于多源传感器数据的量纲不同、数量级相差巨大,如果将传感器数据直接输入到网络模型中进行训练,将导致误差无法沿着最短梯度方向下降,使训练模型的精度下降,甚至无法完成模型训练。因此对数据进行标准化处理,计算公式为:

  在车辆上布置加速度计、位移传感器、激光传感器、陀螺仪等装置,采集多通道的车辆信号,每一种传感器数据为数据样本的一种特征。由于传感器能够采集多种车辆状态信息,为了减轻模型训练的维度灾难,减小冗余特征导致的模型过拟合,需要从采集到的传感器数据中选取相关性较大的特征,剔除无关或者相关性较小的特征,本文采用过滤法从多源传感器中选择与标签数据相关性最强的传感信息。

  2.2样本集构造

  将经过特征选择后的多源传感器时序数据作为样本集,每一时刻的轮对横移量和摇头角作为一个样本的训练标签,当前时刻前后共n个时间步的轴箱振动相应、车体姿态、一系悬挂伸缩量等m个参数作为网络模型的输入特征,以此构造出m×n的输入——两标签输出的样本模型。相比于常用的多通道单时间步特征输入、单时间步标签输出的样本构造方法,本文的构造样本集方法充分考虑了单个时刻传感器测量数据损坏、车辆系统不同部件间的相应输出存在相位差等情况。

  2.3网络模型的设计

  本文将CNN和LSTM融合改进用以轮对运动状态的识别研究,其网络结构如图4所示,采用8×10的滑动窗口对样本集进行滑动取样,滑动步长为1,取样得到的8个通道10个时间步的数据作为网络的单个样本输入,网络输出为该10个时间步中间时刻的轮对运动状态,包括轮对横移和轮对摇头角。通过以上方法,可将8×1 500的样本集划分成1 491组8×10的样本片段,对样本片段进行两次卷积、最大池化的操作进行局部特征提取,卷积核分别为[2,1],[1,1],激活函数采用ReLU,卷积深度分别为8和64,卷积核池化操作padding模式均设置为same。将变换后的特征数据输入到LSTM中,提取时序维度的信息,LSTM层中隐含单元数设置为256,为了减小模型产生过拟合的风险,Dropout率设置为0.3,最后经过全连接层输出轮对横移量和轮对摇头角。

截图20230920164223.png

  3案例分析

  3.1模型训练

  本文以某轨道车辆为例对所提轮对运动状态识别算法进行验证,基于Simpack在多种工况下进行仿真,并构造出仿真数据集。结合实际工程情况下车辆各位置传感器布置与测量的可行性与便捷性,初步选取车辆运行过程中的状态参数,经过特征选取,去除相关性较弱的特征参数,最终保留8个与轮对运行状态相关性较强且实际工程中易于测量的特征量作为,如表1所示特征输入%1~%8。轮对的横移与摇头作为模型的输出,如表1中的y1、y2。实际工程运用中,轮对横向加速度、车体横向加速度可由分别布置在轴箱和车体上的加速度传感器测得,轮对摇头角速度、侧滚角速度、点头角速度和车体的摇头角速度可由陀螺仪测得,一系横向及纵向位移可由线位移传感器测得。

截图20230920164301.png

  原始数据是在时速30 m/s的匀速直线工况下测得,横向及垂向不平顺均设置为美国五级谱,信号的采样频率为100 Hz。在此仿真实验工况下,提取表1所示的8个车辆状态参数作为特征输入,并将轮对横移与轮对摇头角作为标签数据,得到用于预测模型训练的数据集。

  为了验证本文所提的识别方法的有效性,将常用的LSTM预测模型与之对比,在训练过程中,两种模型的训练误差的变化情况如图5所示。

截图20230920164313.png

  使用相同训练集的情况下,本文提出的CNN-LSTM多时间步模型在最后一个训练周期训练集的RMSE值达到0.005 5,相较于传统的单一LSTM模型的RMSE值0.015 4降低64.3%,充分证明本文多时间步样本前处理方式和CNN的使用能够有效提取多维传感信息的局部特征,避免了单一时刻异常数据对预测模型的负面影响。

  利用测试集对模型预测性能进行验证,图6展示了测试集的实际轮对横移与摇头角与各个模型预测值的对比结果,该测试集为该工况下车辆连续运行15 s内的数据,采样频率为100 Hz,共1 500条样本数据。

截图20230920164329.png

  各模型对于测试集横移量及摇头角预测结果的RMSE和R2指标如表2所示。从图和表能够可知,本文中CNN-LSTM模型相比于传统的单一LSTM模型,横移量和摇头角的预测结果精度均得到显著提高,其中,横移量的测试集预测结果RMSE达到0.0017,相较于LSTM模型降低41.7%,R2值达到了0.859 2,相较于LSTM模型提升186.0%;摇头角横移量的测试集预测结果RMSE达到0.000 318 2,相较于LSTM模型降低36.9%,R2值达到了0.925 5,相较于LSTM模型提升50.7%。

截图20230920164508.png

  3.2多工况预测性能评价

  在直线30 km/h的行驶工况下,本文模型对轮对的横移量和摇头角识别效果优异,现考究在其他运行工况下该模型预测性能的优劣,分别设置运行工况如表3所示。

截图20230920164518.png

  其中:曲线工况线路设置为直线→过渡曲线→曲线→过渡曲线→直线→过渡曲线→曲线→过渡曲线→直线的“S”形曲线线路特点。在曲线工况下,着重考察车辆在曲线中、曲线转直线阶段该预测模型的准确性。

  设置与前文训练集工况相同的轨道不平顺激励及采样频率,上述表2中的9个工况的轮对运行状态预测结果如图7~9所示。

截图20230920164535.png

截图20230920164602.png

截图20230920164614.png

  由图7~9和表4可知,本文提出的预测模型在不同运行速度及不同半径工况下对于轮对运行状态均能准确地进行识别,对横移和摇头角的预测R2值均在0.9以上,RMSE指标均在0.52以下,识别精度高,即使在曲线工况下车辆行驶到曲线过渡段也具有优秀的识别效果。因此本文的预测模型能够适用于不同工况,具备很强的泛化性能。

  3.3模型鲁棒性能评估

  在车辆实际运行过程中,车辆的一些物理参数往往会随着运行里程的增加发生改变,这可能导致在理想车辆参数情况下,预测性能优异的轮对运行状态识别模型在车辆参数可能发生改变的实际应用中预测效果变差。因此,需要验证本文中建立的轮对运动状态识别模型在某些车辆参数发生改变的情况下,仍然具有比较优异的预测性能。

  车辆轮对的运行状态与踏面自身廓形、轮轨接触状态、一系悬挂等参数有关。其中,踏面廓形、轮轨间摩擦因数、一系悬挂刚度随着运行里程增多、运行环境改变,较容易发生改变。因此,本文选取以上参数作为车辆模型的变化参数来考察本文预测模型的鲁棒性能。

  以速度V=30 m/s直线工况为例,原车辆模型中踏面廓形为S1002型踏面、轮轨间摩擦因数为0.35、一系悬挂纵向刚度为25 MN/m,分别将上述参数进行修改为踏面廓形为LM型磨耗形踏面、摩擦因数为0.2、一系悬挂刚度15 MN/m,将新模型在同工况下进行仿真得到一组数据集来验证原预测模型的鲁棒性。

  图10为改变车辆参数后轮对横移和摇头角的预测结果。通过计算得到横移预测结果的RMSE值为0.405 5,R2为0.922 5,摇头角预测结果的RMSE值为0.304 3,R2为0.949 6,相比于原数据集的预测结果精度略有降低,但是仍然具有较高的识别精度,由此可见,本文提出的模型具有优异的鲁棒性,能够很好地适用于车辆状态参数发生变化的情况下的载荷识别。

截图20230920164624.png

  4结束语

  本文提出了一种融合卷积神经网络和长短时记忆网络的轮对运行状态识别模型及预测方法,该模型首先将实际工程中易测得的状态参数信号进行卷积运算,充分提取多维度信号的局部特征,将卷积后的多时间多维度特征集合输入到LSTM网络中学习各特征在时间维度的有效信息,最后通过全连接层输出预测结果。本文将所提识别模型与LSTM模型预测结果进行了对比分析,结果表明,相比于传统的LSTM网络模型,CNN-LSTM网络的结合大大地增强了对多维度时序数据的特征提取能力,多时间步输入单时间步输出的样本集构造方法充分考虑了传感器信号在单个时刻损坏、传感器信号之间存在的相位差等情况,能够大大提高模型的预测精度。同时,考虑车辆实际运行过程中涉及到的多工况及车辆物理参数发生改变的情况,对本文模型进行泛化性及鲁棒性仿真验证,结果表明,模型在直线、曲线、曲线过渡段等线路工况下均具备较高的预测精度,当车辆的部分物理参数发生改变后,模型的预测精度虽然有所下降,但是仍然维持在较高水平。

  参考文献:

  [1]赵心颖,李翔飞,王宇.城轨车辆车载轨道几何参数检测系统的研制[J].机电工程技术,2023,52(4):257-261.

  [2]肖新标.复杂环境状态下高速列车脱轨机理研究[D].成都:西南交通大学,2013.

  [3]李呈祥.高速列车运行横移及侧滚姿态主动控制研究[D].北京:北京交通大学,2014.

  [4]宋子彬,王永胜,马增强,等.一种基于车载相机的车轮位移检测新方法[J].石家庄铁道大学学报(自然科学版),2018,31(4):30-35.

  [5]宋子彬.基于数字图像处理的轮轨冲角检测方法研究[D].石家庄:石家庄铁道大学,2018.

  [6]杨淑芬.轮轨接触点位置图像检测方法研究[D].成都:西南交通大学,2009.

  [7]钟莎,王永胜,宋子彬,等.基于相机垂直拍摄的机车轮轨相对横移检测系统[J].石家庄铁道大学学报(自然科学版),2016,29(3):81-86

  [8]PÉREZ J,BUSTURIA J M,GOODALL R M.Control strategies for active steering of bogie-based railway vehicles[C]//IFAC Pro⁃ceedings Volumes,2000,33(26):277-282.

  [9]PEARSON J T,GOODALL R M,MEI T X,et al.Active stability control strategies for a high speed bogie[J].Control Engineering Practice,2004,12(11):1381-1391.

  [10]孙效杰,杨俊起.轨道车辆轮对状态与线路特征的估计[J].西南交通大学学报,2017,52(3):600-606.

  [11]杨哲,陆正刚,张矿岩,等.独立旋转车轮有轨电车μ综合导向控制[J].同济大学学报(自然科学版),2017,45(11):688-693.

  [12]ALEXANDER K,CHRISTOPH S,THOMAS M,et al.Estimat⁃ing the wheel lateral position of a mechatronic railway running gear with nonlinear wheel-rail geometry[J].Mechatronics,2021,73:102457.

  [13]张驰.基于轮对运行状态的轮轨力间接测量研究[D].上海:同济大学,2020.

  [14]史华东.基于信息融合的轨道车辆门系统故障诊断与健康评估[D].南京:南京航空航天大学,2021.

  [15]周佳玉.基于混合效应模型的轨道车辆车轮退化建模与剩余寿命预测[D].北京:北京交通大学,2019.

  [16]张卜,刘怡伶,张文静.基于BP-LSTM网络的列车脱轨系数预测[J].农业装备与车辆工程,2022,60(7):52-56.

  [17]方明宽,宁静,陈春俊.高速列车横向蛇行失稳的EEMD-CNN-LSTM预测方法[J].中国测试,2021,47(7):79-83.