学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 理工论文 基于K-Means的铁路货运车辆异物识别方法论文

基于K-Means的铁路货运车辆异物识别方法论文

10

2023-08-04 08:55:49    来源:    作者:xiaodi

摘要:铁路货运车辆车身携带异物容易造成重大安全隐患,出发前必须对车辆外观进行严格检查。采用深度学习方法对异物进行智能识别对提高货检工作效率具有重要意义。针对铁路货运车辆安全检测中异物识别准确率低、漏检率高等问题,以ResNet-50为基本特征提取网络,

  摘要:铁路货运车辆车身携带异物容易造成重大安全隐患,出发前必须对车辆外观进行严格检查。采用深度学习方法对异物进行智能识别对提高货检工作效率具有重要意义。针对铁路货运车辆安全检测中异物识别准确率低、漏检率高等问题,以ResNet-50为基本特征提取网络,引入K-Means算法,构建了一种以交并比(Intersection over Union,IoU)为度量的锚框聚类算法,采用自建的异常目标数据集进行了实验测试,结果发现,与传统Faster RCNN相比,改进后的算法有效地增强了深度网络模型的目标特征提取能力,提高了复杂背景下铁路货运车辆异物的识别定位精度,异物的识别漏检率降低21.3%,模型具有较强的泛化能力,对异常目标精确定位研究具有一定的参考价值。

  关键词:铁路;车箱;异物;Faster RCNN;ResNet-50;K-Means

  0引言

  铁路运输对于国民经济发展和满足人民生活需要发挥着重要作用,确保铁路运输安全对社会稳定和发展具有重要意义。铁路货运车辆车身携带异物容易对铁路运输安全构成重大安全隐患。因此,对铁路货运车辆车身的异物做到早发现、早处理就显得至关重要。

  目前,对于构成铁路运输安全隐患的车身异物主要包括车体趴人、编织袋、塑料袋、塑料水瓶等,这些异物具有目标小、形状不规则的特点,传统的人工巡检对于这些异物的检查往往存在劳动强度大、易漏检等问题,而目前采用深度学习对异物进行识别的方法中,针对RCNN和SPP-Net[1]的缺点问题,Girshick等[2]提出了Fast RCNN目标检测框架,在池化层取消了max Pooling操作,采用RoI Pooling进行替换,这种改进方式使得在输入层不需要对图像进行分割或者是重定义目标图像尺寸;在相同的环境配置下,Fast RCNN能够实现训练检测器的同时训练边界框回归器,Fast RCNN除了对候选区域提取的过程,其检测过程已经接近于One-Stage[3]的目标检测框架,特别是在网络模型的最后一层全连接层采用SVD进行了矩阵分离使得模型的计算速度得到了进一步的提高;mAP已经从Fast RCNN的58.5%提高到了70%,Fast RCNN的目标检测速度比RCNN提高了近200倍;虽然Fast RCNN对RCNN和SPP-Net的缺点进行了改进,融合了两者的优点,但是其效率仍旧受到候选区域提取过程的限制;Faster RCNN[4]算法在Fast RCNN的基础上引入RPN网络(Region-Proposal Network),显著缩短了Proposal的提取时间[5],实现了较高目标检测精度。

image.png

  铁路货检作业中对铁路货运车辆车箱异物的检测有较高的要求,需要在复杂的铁路车箱作为背景的情况下将车箱内的异物进行准确地识别。采用深度学习的方式,应用Faster-RCNN网络模型能够对铁路货运车辆车箱异物特征进行提取,由于不同类型货运列车车箱异物的图像尺寸差异较大,该模型对较大目标的检测效果较好,而尺寸较小的车箱异物检测效果较差[6]。因此,本文基C,N提出了基于交并比(Intersection over Union,IoU)[7]的K-Means聚类算法[8],预设了原始锚框尺寸,降低了铁路货运车辆异常目标检测中的漏检率,提高了检测精度。

  1铁路货运车辆异物识别算法改进

  1.1 Faster-RCNN网络模型

  Faster-RCNN网络模型如图1所示。首先,从自建铁路货运车辆车箱数据集中选择正负样本,用于Faster-RCNN训练和测试。其次,以VGG网络模型对图像进行特征提取,RPN将对将特征提取作为输入进行训练,直至训练网络达到收敛状态。再根据Faster-RCNN训练过程中的损失函数对网络模型进行微调,得到最终的检测模型。最后,进行车辆异常目标检测,得到车辆异常目标的类概率。框架中提到的ROI(感兴趣区域)是指目标候选框。在RPN阶段,无限数量的锚框被穷举生成,然后使用真实的目标矩形框训练这些锚框。然后从锚框中寻找感兴趣区域(ROI),并使用ROI在下一个训练阶段训练ROI Head,最后生成预测目标框。

image.png

  1.2特征提取网络选择

  与原始特征提取层ZF[9]和VGG[10]相比,ResNet-50[11]具有更深的网络层次,可以提取更深、更抽象的目标特征。ResNet-50中的剩余结构有助于解决网络加深时梯度分散、梯度爆炸和网络性能改善不明显的问题。选择ResNet-50作为基本特征提取网络。ResNet50网络结构如表1所示。

image.png

  在表1中,两个数字相乘表示卷积核的大小,下面的数字表示卷积核的数量。以conv1为例,7×7表示卷积核的大小为7×7,64表示卷积核的个数。矩阵表示剩余块,矩阵中的数字表示剩余块的组成。以conv3为例。

  conv3由4个剩余块组成,每个剩余块由128个1×1卷积核、128个3×3卷积核和512个1×1卷积组成。它由乘积核组成,其中第一剩余块中3×3卷积核的步长为2,其余的都为1。

  1.3基于K-Means的异物候选框预设

  K-Means算法是一种聚类算法。它可以有效地处理漏检和误检等实际问题。然而,由于K-Means采用欧氏距离进行衡量,会使得聚类簇中目标框较大,从而产生较大的误差。因此,本文提出了一种新的聚类算法,即以交并比(Intersection over Union,IoU)[12]作为度量标准,它可以用来衡量铁路货运车辆异常目标数据集外接矩形的长宽比,更准确地实现聚合,从而提高检测效率,减少误差,提升检测精度。通过观察和比较,可以找到最优的聚合簇数量。

image.png

  式(1)~(2)中:D(b,m)为预测框b与聚类中心p之间的距离;IoU为预测框b与聚类中心p的交并比;bpre为预测框;bgro为实际框。

  根据式(1)可以看出,IoU值越大,从预设框m到聚类中心p的间距就越小。

  铁路货运车辆异物候选框预设具体步骤如下:

  第一步,初始锚框可以随机抽取k个铁路货运车辆异常目标的外接矩形框;

  第二步,通过IoU作为度量,将每辆铁路货车的异常目标外接矩形分配给与它最接近的初始锚框,从而得到k个聚类簇;

  第三步,计算每个簇中铁路货运车辆异常目标外接矩形框的宽度和长度的平均值,以此来更新初始锚框,最终确定簇中心的锚框;

  第四步,反复执行第2步和第3步,直至锚框不再变化,从而获得的平均IoU随聚类中心k的变化趋势,如图2所示;

  第五步,再根据变化曲线和elbow方法[13],可以准确地计算出k值。

image.png

  上述第五步中采用的elbow方法的基本原理为当选取的k值对应的平均IoU与前后选取的k1、k2值对应的平均IoU发生明显的斜率变化,此时选取的k值可以确定是真实聚类数。从图2中可以看出,k值为2~3之间的IoU平均值曲线斜率最大,k值为3~4之间的IoU平均值曲线斜率较小,则曲线在k值为3处曲线的斜率发生了最明显的变化,通过结合elbow方法和图2进行分析,铁路货运车辆异物的真实聚类数k值为3。

  经过K-Means聚类算法的处理,本文将铁路货运车辆异常目标类型的数据集分为3个聚类簇,每个簇都包含不同的锚框尺寸和长宽比,其中包括趴人、稻草、瓶罐、塑料袋和编织袋等。这些聚类簇可以有效地覆盖不同类型的异常目标,从而更好地满足不同类型的铁路货运车辆异常目标检测的需求。每个聚类中心基本尺寸从(128,256,512)调整为(64,128,256),以更好地满足铁路货运车辆的异常目标尺寸,这样可以有效地提高分类效率,从而达到最佳的分类效果。此外,为了更好地满足不同尺寸的目标,聚类中心的长宽比也被调整为(72:90,128:130,314:258),即(0.8,0.98,1.22)。经过精心研究,最终确定了9个不同大小和尺寸的锚框,它们分别是(57,74)、(64,65)、(72,59)、(117,141)、(128,131)、(145,110)、(224,295)、(255,256)、(282,228),每个尺度都有3种不同的长宽比。

  根据图3可以看出3种类型的铁路货运车辆的原始锚框与预设锚框的对比效果:(a)~(c)表示敞车内有塑料袋、编织袋和车体趴人的原始锚框对异常目标的示意图,而(d)~(f)则表示敞车内有塑料袋、编织袋和车体趴人的预设锚框对异常目标的示意图。根据图3可知,原算法的候选框在提取铁路货运车辆异物时会覆盖大量背景物,而经过算法改进后,预设锚框更加适用于铁路货运车辆异物的尺寸,从而提高了提取效率和准确性。

image.png

image.png

  根据图4可知,原始锚框和预设锚框的尺寸有所不同。黄色锚框的基本尺寸为64,而蓝色锚框的基本尺度则为128,这分别代表了敞车内有塑料袋和编织袋的情况。此外,红色锚框的基本尺度为256,这可以用来覆盖更大尺寸的类似车体趴人情况。通过将铁路货运车辆异常目标的尺寸与类型进行聚类,可以将大小相同但类型不同的异物归类到同一聚类簇中,从而使用相同尺寸的锚框来实现有效的分类。

image.png

  2实验与分析

  2.1数据集和实验环境

  本实验使用的CPU型号是Intel®Xeon®Gold 5218 CPU 2.3GHz。GPU采用的是Nvidia Tesla V100 SXM2 16 GB×4,操作系统采用的是Ubuntu 20.04 LTS,深度学习框架使用PyTorch1.7.1来构建卷积神经网络模型。实验数据集来自中铁南昌局集团有限公司向塘西特等编组站,数据集采用的是2K全彩线扫描相机对通过货运列车进行动态扫描成像,并按节自动分割成单节车厢图像,实验中的数据集包含10 000张无异物以及有异物的铁路货运车辆图像。
  2.2评价指标

  本文从特征提取网络和目标锚框这两方面对Faster RCNN深度网络模型进行改进,为了对改进后的网络模型的异常目标识别效果进行评估,将采用如下的深度学习中的3类评价指标。

  (1)平均精度均值mAP(Mean Average Precision)计算公式如式(3)所示:

image.png

  式中:p(r)为利用精确率为纵轴和召回率为横轴的点所画的PR曲线[14]。

  (2)精确率P(Precision)的计算公式如式(4)所示:

image.png

  式中:TP为识别测试结果中正确识别异常目标为正样本数量;FP为错误识别的异常目标为正样本数量。

  (3)漏检率M(Missing Alarm)是遗漏提取的铁路货运车辆异常目标占总识别数量的比例,计算公式如式(5)所示:

image.png

  式中:TP为识别测试结果中正确识别异常目标为正样本数量;FN为错误识别异常目标为负样本的数量。

  2.3实验结果与分析

  2.3.1训练损失函数

  为比较算法的有效性,本文基于构建的铁路货运车辆图像数据集分别在F_VGG16算法、F_ResNet50算法以及F_K_ResNet50算法上进行了实验。图5所示为F_VGG16算法、F_ResNet50算法以及F_K_ResNet50算法3种算法模型对铁路货运车辆异常目标数据集进行训练时的损失函数值loss的变化曲线。从图中可以看出3种算法模型在训练后期的损失函数值在小幅震荡中都得到了收敛。相较于F_VGG16算法、F_ResNet50算法两种算法模型,F_K_ResNet50算法的训练损失函数一直保持在最低水平并在训练12 000次后保持在0.2附近。

image.png

  2.3.2算法检验及比较

  为了验证本文所设计的基于ResNet50作为主干网络以及基于K-Means的锚框预设算法Faster-RCNN模型在铁路货运车辆车箱异物中的识别效果,该实验使用了3种不同的检测算法。最初使用VGG16作为特征提取层的Faster RCNN方法称为F_VGG16。以ResNet50为特征提取层,采用了连接模式中更快的RCNN方法,称为F_ResNet50。在F_ResNet50方法的基础上将基于交并比为度量的K-Means算法称为F_K_ResNet50。在车箱异物的检测识别过程中,对模型性能影响会产生较大影响的参数值为阈值N、batch_size,为了消除两个变量参数对测试实验的影响,设置阈值N=0.6、batch_size=128,实现控制变量来判断模型性能的目的。如表2~表4所示。

  图6所示为3种网络模型的3种评价标准的评价结果条形图,从图中可以清晰地看出F_K_ResNet50网络模型的平均精确度均值相对于其他两类网络模型的平均精确度均值更高,达到了87.9%。F_VGG16算法的识别平均精确度均值最低,其表现出的预测识别效果不佳。与此相比,F_VGG16的漏检率最高,说明该方法在铁路货运车辆异物目标识别中漏检最多。在F_ResNet50和F_K_ResNet50算法的识别结果中,F_K_ResNet50网络模型的漏检率更低,相较于前者降低了5.8%。综上,F_K_ResNet50从平均精确度均值、准确率、漏检率3个方面评价标准都优于F_VGG16及F_ResNet50网络模型。

image.png

  3结束语

  铁路货运车辆车身携带异物对于铁路运输具有重大安全隐患,针对铁路货运车辆安全检测过程中车箱异物尺寸不一致而导致的识别准确率低问题,以ResNet50为基本特征提取网络,引入了以交并比(IoU)为度量的K-Means聚类算法。

  在自建铁路货运车辆图像数据集上比较了不同实验方法的交叉验证结果,本文提出的算法mAP为87.9%,具有更好的检测性能。同时,比较了3种算法在图像背景复杂区域的检测结果。可以看出,本文提出的算法具有较强的抗干扰能力和良好的鲁棒性。

  在未来的发展中,将继续深入研究利用深度学习技术实现大规模铁路货运车辆图像铁路货运车辆车箱异物的快速定位。

  参考文献:

  [1]Nowozin S.Optimal Decisions from Probabilistic Models:The In‐tersection-over-Union Case[C].2014 IEEE Conference on Com‐puter Vision and Pattern Recognition(CVPR).IEEE,2014.

  [2]Chen Z Y,Liao I Y.Improved Fast R-CNN with Fusion of Opti‐cal and 3D Data for Robust Palm Tree Detection in High Resolu‐tion UAV Images[J].EJournal Publishing,2020(1):122-127.

  [3]Dai D,Wang C,Xia S,et al.One-Stage Deep Edge Detection Based on Dense-Scale Feature Fusion and Pixel-Level Imbal‐ance Learning[J].2022(3).

  [4]Salvador A,Giro-I-Nieto X,Marques F,et al.Faster R-CNN Features for Instance Search[J].DeepVision Workshop at CVPR 2016,2016.

  [5]杨薇,王洪元,张继,等.一种基于Faster-RCNN的车辆实时检测改进算法[J].南京大学学报(自然科学),2019,55(2):231-237.

  [6]Wang H,Kembhavi A,Farhadi A,et al.ELASTIC:Improving CNNs with Dynamic Scaling Policies[J].2018.

  [7]Nowozin S.Optimal Decisions from Probabilistic Models:The In‐tersection-over-Union Case[C].2014 IEEE Conference on Com‐puter Vision and Pattern Recognition(CVPR).IEEE,2014.

  [8]Huang Z.Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values[J].Data Mining and Knowledge Discovery,1998,2(3):283-304.

  [9]Fu L,Feng Y,Majeed Y,et al.Kiwifruit detection in field images using Faster R-CNN with ZFNet[J].IFAC-Papers On Line,2018,51(17):45-50.

  [10]Wang L.Places205-VGGNet Models for Scene Recognition[J].Computer ence,2015.

  [11]He K,Zhang X,Ren S,et al.Deep Residual Learning for Im‐age Recognition[C]//IEEE Conference on Computer Vision and Pattern Recognition.IEEE,2016.

  [12]Nowozin S.Optimal Decisions from Probabilistic Models:The Intersection-over-Union Case[C].2014 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).IEEE,2014.

  [13]Saputra D M,Saputra D,Oswari L D.Effect of Distance Metrics in Determining K-Value in K-Means Clustering Using Elbow and Silhouette Method[C].Sriwijaya International Conference on Information Technology and Its Applications(SICONIAN 2019).2020.

  [14]彭博,姬然.基于容差PR曲线的路面裂缝识别算法性能评价机制[J].重庆交通大学学报:自然科学版,2017,36(7):7.

  [15]郭玉,周晓坤.铁路快捷货运列车产品需求分析与设计指标研究[J].机电工程技术,2019,48(9):38-39.

  [16]齐显军,陈雪平,黎业演.一种基于机器视觉的全自动灯检机图像采集系统[J].机电工程技术,2012,41(7):5-7.

  [17]郭吉安.基于视频智能监控的铁路货检作业模式优化探讨[J].铁道货运,2019,37(3):1-4.

  [18]Zhao Ri,Liu Na.Low-resolution gamma-ray spectrum analysis using comprehensive training set and deep ResNet architecture[J].Nuclear Inst.and Methods in Physics Research,A,2023,1050.

  [19]周忠超,李应斌,张晓云,等.基于K-means聚类算法的信号场强定位方法研究[J].中国无线电,2022(12):29-31.

  [20]黄进红,周根娇,喻泽峰,等.基于复值损失函数的并行MRI的深度重建[J].南方医科大学学报,2022,42(12):1755-1764.