学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 理工论文 基于深度可分离与重参数化的轻量化目标检测模型论文

基于深度可分离与重参数化的轻量化目标检测模型论文

1

2025-07-30 17:18:31    来源:    作者:xuling

摘要:为解决铁路轨道扣件检测模型轻量化部署问题,以YOLOX-s模型为基准,提出一种基于深度可分离卷积的特征金字塔,实现颈部网络结构的轻量化特征融合,提升模型轻量化后的特征提取能力。

  摘要:为解决铁路轨道扣件检测模型轻量化部署问题,以YOLOX-s模型为基准,提出一种基于深度可分离卷积的特征金字塔,实现颈部网络结构的轻量化特征融合,提升模型轻量化后的特征提取能力。针对YOLOX架构中解耦头产生的更多参数量与计算开销,引入深度可分离卷积,简化解耦头的参数量,并使用重参数化卷积达成检测头的精确度优化,平衡模型参数轻量化造成的精确度损失。实验表明,针对铁路轨道扣件检测问题,相较于基准模型,该方法降低了22.26%的参数量和31.3%的浮点数计算量,精确度保持在原有水平。基于深度可分离与重参数化的轻量化目标检测模型有效降低了模型参数,为部署在铁路在线检测轻型设备上提供一种可行方法。


  关键词:模型轻量化;铁路轨道扣件检测;深度可分离卷积;模型重参数化


  0引言


  交通在线检测是监测交通基础设施、保障交通安全的重要手段,基于图像大数据的在轨实时检测系统研究对构建轨道画像、发布实时预警具有重要意义。基于图像大数据的在轨实时检测系统主要由摄像头和处理器组成,摄像头往往需要更多的存储空间用于图像与视频数据的存储,嵌入式处理器处理能力有限,搭载检测算法则不宜体量过大。但是摄像头通常设置于高处或相对隐蔽的角落,待检测目标往往具有体型较小、光线不足、目标不清晰等特点从而不利于检测。因此检测效果往往依赖于检测设备所搭载的模型具有的高水平检测性能,上述检测需求则是依赖于更高分辨率的特征图对目标进行匹配。


  模型轻量化方面,何雨等[1]在YOLOv5s网络的基础上引入ShuffleNet v2[2]特征提取机制来实现网络的轻量化,同时采用加权双向特征金字塔BiFPN[3]和边框回归损失EIoU[4]获取特征信息更为丰富的特征图。任丰仪等[5]采用YOLOv4模型网络作为主要参考模型,使用Mo⁃bileNet[6]替换主干网络。结果显示参数量只有原模型的一半,但速度FPS提升了26.48,精度mAP下降了0.52%。马宏兴等[7]基于YOLOv5s结合深度可分离卷积进行轻量化设计,减少38%的存储开销,但存在对特征提取能力的限制,存在降低检测准确率的风险。张磊等基于改进YOLOv5s的目标检测算法,在颈部网络部分,采用DWConv替换普通卷积,实现参数量下降14.2%,浮点数计算量下降7.6%,算法网络模型大小下降12.5%[8]。张泽冰等[9]针对检测分支,将深度可分离卷积和金字塔卷积替代普通卷积以进行轻量化改进[10]。杨锦辉等[11]提出多分支空洞卷积结构RFB-Bottleneck来提升PANET的特征提取能力,引入GhostConv卷积减少模型参数量,实现参数量下降27.78%。章芮宁等[12]利用深度可分离卷积进一步降低计算复杂度,压缩模型大小。魏希来等[13]减少其网络层数,提高了网络推断速度。秦梓竣等[14]针对人们摔倒后可能出现意识模糊无法呼救易产生二次伤害的问题,研究开发了一款可通过实时检测摄像头画面内容人物。上述一些方法虽然实现了参数量降低,但是未能考虑主干网络的替换对特征提取能力的影响,精度随参数降低而降低。


  模型速度和精度方面,刘欣对YOLOv3[15]和YO⁃LOv3-SPP[16]实现在网络模型参数量基本不变的情况下,获得4倍检测速度的提升以及75%计算量的减少。改进后的YOLO模型还可以在相同的图像尺寸作为输入的情况下获得更大的批处理量[17]。该方法未能实现参数量方面的简化,在设备存储空间有限时,参数量63.00 M的YOLOv3也会面临使用受限的问题。Gao Chao等[18]提出了卷积掩蔽分布估计自动编码器模型,该模型采用Rep⁃Conv结构,增强了模型获取数据特征的能力,从而提高了精度。同时,增加了基于深度可分离的多层感知器结构,减少了模型参数的数量。RepConv是基于模型重参数化设计的卷积层,该结构可以通过增加特征通道、弱化噪声和增强特征提取能力来稳定地提高模型的推理能力,用于轻量化模型设计中,能够在一定程度上平衡模型因追求参数减少而出现的性能减弱。


  综上,针对体量较大的模型进行轻量化设计,需在保证较高的检测准确度条件下,尽可能地降低模型的参数量,通常会基于轻量化卷积实现。以YOLO架构为例,主体共分为骨干、颈部以及检测头3个部分,需要分别考虑轻量化卷积对不同结构的影响。目前相关研究人员常忽略轻量化卷积对特征提取能力的限制影响,在更广泛的图像数据应用场景下,难免发生精度下降的情况。据此,本文主要从颈部结构与检测头着手,在实现模型参数量下降的情况下,保持计算精度和速度的相对稳定。


  1轻量化模型构建


  为实现模型的高精确度检测,本文将基于YOLOX架构进行模型设计。


  1.1基于深度可分离卷积的特征金字塔


  深度可分离卷积[6]具有快捷连接和残差优化两大优势,最早用于MobileNetV1[6]中,如图1所示,深度可分离卷积的深度指的是输入特征图的通道数,故又称为通道可分离卷积。在MobileNetV1中,将一个标准的卷积分解为一个深度卷积和一个卷积核大小为1×1的点卷积。深度卷积将每个卷积核应用到每一个通道,而1×1卷积用来组合通道卷积的输出卷积核个数等于输入通道数,卷积核通道数为1,即对有效特征层的每个通道进行独立的卷积且卷积核通道数为1。通过对各通道进行独立卷积以小幅下降准确率为代价实现运算量缩小。

参考文献:


  [1]何雨,田军委,张震,等.YOLOv5目标检测的轻量化研究[J].计算机工程与应用,2023,59(1):92-99.


  HE Y,TIAN J W,ZHANG Z,et al.Lightweight research of YO⁃LOv5 target detection[J].Computer Engineering and Applications,2023,59(1):92-99.


  [2]MA N,ZHANG X,ZHENG H T,et al.ShuffleNet V2:Practical Guidelines for Efficient CNN Architecture Design[C]//European Conference on Computer Vision(ECCV).2018:122-138.


  [3]TAN M,PANG R,LE Q V.EfficientDet:Scalable and Efficient Ob⁃ject Detection[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).2020:10778-10787.


  [4]ZHANG Y F,REN W,ZHANG Z.Focal and efficient IOU loss for accurate bounding box regression[J].Neurocomputing,2022,506:146-157.


  [5]任丰仪,裴信彪,乔正,等.融合CBAM的YOLOv4轻量化检测方法[J].小型微型计算机系统,2023,44(5):1008-1014.


  REN F Y,PEI X B,QIAO Z,et al.YOLOv4 lightweight detection method based on CBAM[J].Journal of Chinese Computer Systems,2023,44(5):1008-1014.


  [6]HOWARD A G,ZHU M,CHEN B.Mobilenets:Efficient convolu⁃tional neural networks for mobile vision applications[J].arXiv pre⁃print arXiv:1704,04861,2017.


  [7]马宏兴,董凯兵,王英菲,等.基于改进YOLO v5s的轻量化植物识别模型研究[J].农业机械学报,2023,54(8):267-276.


  MA H X,DONG K B,WANG Y F,et al.Lightweight plant recogni⁃tion model based on improved YOLO v5s[J].Transactions of the Chinese Society for Agricultural Machinery,2023,54(8):267-276.


  [8]张磊,李熙尉,燕倩如,等.基于改进YOLOv5s的综采工作面人员检测算法[J].中国安全科学学报,2023,33(7):82-89.


  ZHANG L,LI X W,YAN Q R,et al.Personnel detection algorithm in fully mechanized coal face based on improved YOLOv5s[J].China Safety Science Journal,2023,33(7):82-89.


  [9]DUTA I C,LIU L,ZHU F,et al.Pyramidal Convolution:Rethinking Convolutional Neural Networks for Visual Recognition[J].arXiv preprint arXiv:2006,11538,2020.


  [10]张泽冰,张冬妍,娄蕴祎,等.改进YOLOv4的野生菌视觉检测方法[J].计算机工程与应用,2023,59(20):228-236.


  ZHANG Z B,ZHANG D Y,LOU Y Y,et al.Improved yolov4 visu⁃al detection method for wild bacteria[J].Computer Engineering and Applications,2023,59(20):228-236.


  [11]杨锦辉,李鸿,杜芸彦,等.基于改进YOLOv5s的轻量化目标检测算法[J].电光与控制,2023,30(2):24-30.


  YANG J H,LI H,DU Y Y,et al.A lightweight object detection al⁃gorithm based on improved YOLOv5s[J].Electronics Optics&Control,2023,30(2):24-30.


  [12]章芮宁,闫坤,叶进.轻量化YOLO-v7的数显仪表检测及读数[J].计算机工程与应用,2024,60(8):192-201.


  ZHANG R N,YAN K,YE J.Lightweight YOLO-v7 for digital strumentation detection and reading[J].Computer Engineering and Applications,2024,60(8):192-201.


  [13]魏希来,孙海江,刘培勋,等.一种改进的基于深度学习的小目标检测方法[J].机电工程技术,20245(4):125-128.


  WEI X L,SUN H J,LIU P X,et al.An improved deep learning-based approach for small object detection[J].Mechanical&Elec⁃trical Engineering Technology,2024,53(4):125-128.


  [14]秦梓竣,邓君,陈坤豪,等.基于YOLO目标检测的摔倒报警系统[J].机电工程技术,2024,53(1):224-227.


  QIN Z J,DENG J,CHEN K H,et al.Fall detection and alarm sys⁃tem based on YOLO target detection[J].Mechanical&Electrical Engineering Technology,2024,53(1):224-227.


  [15]REDMON J,FARHADI A.YOLOv3:An Incremental Improve⁃ment[J].arXiv preprint arXiv:1804,02767,2018.


  [16]HE K,ZHANG X,REN S,et al.Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition[C]//European Conference on Computer Vision(ECCV).2014:346-361.


  [17]刘欣.基于YOLO网络的轻量化研究及应用[D].武汉:湖北工业大学,2022.


  [18]GAO C,YU J,HE Z,et al.ConvMADE:Convolution Makes Cardi⁃nality Estimation Stronger[J].IEEE Access,2023,11:98005-98015.


  [19]DING X,ZHANG X,MA N,et al.RepVGG:Making VGG-style ConvNets Great Again[C]//Proceedings of the IEEE/CVF Confer⁃ence on Computer Vision and Pattern Recognition

(CVPR).2021:13733-13742.


  [20]IOFFE S,SZEGEDY C.Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift[C]//Inter⁃national conference on machine learning(PMLR).2015:448-456.


  [21]GE Z,LIU S,WANG F,et al.YOLOX:Exceeding YOLO Series in 2021[J].arXiv preprint arXiv:2017.08430,2021.


  [22]REN S,HE K,GIRSHICK R,et al.Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(6):1137-1149.


  [23]WANG C Y,BOCHKOVSKIY A,LIAO H Y M.YOLOv7:Train⁃able bag-of-freebies sets new state-of-the-art for real-time ob⁃ject detectors[J].arXiv preprint arXiv:2207.02696,2022.