基于机器学习的金属制品表面瑕疵检测研究论文

2025-02-07 15:06:50 来源: 作者:dingchenxi
摘要:在碳中和越来越受全球共识后,铝制品在新能源所扮演的角色越来越重要。在工业应用,其表面瑕疵直接影响产品质量和使用寿命。传统的瑕疵检测方法依赖人工检查,效率低且容易受到主观因素的影响。
摘要:在碳中和越来越受全球共识后,铝制品在新能源所扮演的角色越来越重要。在工业应用,其表面瑕疵直接影响产品质量和使用寿命。传统的瑕疵检测方法依赖人工检查,效率低且容易受到主观因素的影响。为提升铝制品瑕疵检测的准确性和效率,本研究提出了一种基于改进版的AlxNet卷积神经网络(CNN)进行图像分类,构建了一个包含50000张铝制品表面图像的数据集,通过AlxNet网络从图像中提取特征并进行分类。实验结果显示,该方法在检测不同瑕疵类型时的分类准确率超过85%,显著优于传统人工检查。本研究表明,基于深度学习的AlxNet模型在铝制品瑕疵检测中具有较高的准确性和可靠性,可以有效支持工业生产中的质量控制。所提方法不仅提升了检测效率,也为铝制品质量管理提供了一种新的技术手段。
关键词:机器学习;铝制品;瑕疵检测;图像分类
新能源行业的发展对铝的需求量急剧上升,但是产品缺乏差异化、质量不一等问题是行业发展的瓶颈。在铝制品的工业生产过程中,铝制品的质量直接影响到其性能和耐用性。因此,铝制品的瑕疵检测在生产线上具有重要意义。铝制品常见的瑕疵包括表面划痕、凹坑、腐蚀等。这些瑕疵不仅会影响铝制品的外观,还可能影响其机械性能和耐用性,从而影响最终产品的使用寿命和安全性。
传统上,铝制品的瑕疵检测主要依赖人工检查,虽然可以识别各种类型的瑕疵,但其效率低、劳动强度大且容易受到检查人员的主观因素影响。随着机器学习技术的发展,卷积神经网络在图像识别领域取得了显著进展。近年来,研究者们开始探索基于机器学习的瑕疵检测方法,这些方法能够自动学习和提取图像中的特征,从而有效地识别和分类各种类型的瑕疵。这种方法相较于传统的检测技术,具有更高的准确性和更强的适应能力,可以更好地满足现代工业生产对高效、准确瑕疵检测的需求。在产品线的质量控制过程中,采用机器视觉和智能检测技术能够有效识别产品表面的缺陷,从而在工业流水线的质检环节实现自动化,具有重要的意义。
随着机器学习技术的发展,卷积神经网络(CNN)在图像识别领域取得了显著进展。近年来,研究者们开始探索基于深度学习的瑕疵检测方法,这些方法能够自动学习和提取图像中的特征,从而有效地识别和分类各种类型的瑕疵。这种方法相较于传统的检测技术,具有更高的准确性和更强的适应能力,可以更好地满足现代工业生产对高效、准确瑕疵检测的需求。
缺陷检测任务通常包括分割、分类和检测三种形式,分割涉及对图像中的每个像素进行分类。王森等研究结合了小波边缘检测与多尺度结构化森林,从而提升了表面裂纹的分割精度;张芳等则利用语义分割网络(U-Net)实现了对纳米颗粒的自动分割。分类是常见的缺陷检测任务,Zhang等通过统计方法和光谱测量提取了钢带缺陷的特征向量,并基于支持向量机构建了在线分类系统;王理顺等则利用深度卷积网络GoogLeNet训练缺陷分类模型,并设计了织物缺陷的在线分类算法。检测则是对图像中的缺陷进行定位与分类,通常较为复杂。常海涛等基于目标检测框架Faster RCNN实现了工业CT图像的缺陷检测;Liong等则利用实例分割框架Mask RCNN搭建了一个用于皮革自动缺陷检测与分割的系统。
AlxNet网络凭借其卓越的特征提取能力、高效的数据处理性能和优化的计算资源利用,成为铝制品瑕疵检测中的理想选择。相较于传统的检测方法,AlxNet能够更准确、更高效地识别和分类各种铝制品瑕疵,满足现代工业生产对检测技术的高要求。
1铝制品缺陷检测方法
AlxNet是一种卷积神经网络(CNN)架构,用于图像分类和特征提取任务。不同于传统的深度学习模型,AlxNet通过多层卷积和池化操作能够在图像中捕捉丰富的特征,从而实现高效的分类和检测。AlxNet因其在处理图像时的高精度和高效率而受到广泛关注。其核心思想是通过逐层卷积和池化提取特征,并通过全连接层进行分类预测。
AlxNet的主要优势在于其深层网络结构和批量归一化技术,这些技术使得模型能够更好地处理复杂的图像数据。具体而言,AlxNet通过多层卷积操作和激活函数ReLU提供了强大的特征表达能力,同时通过批量归一化提高了训练过程的稳定性。通过这种设计,AlxNet能够有效地进行高精度的图像分类,并且在面对图像中的各种缺陷特征时表现出色。AlxNet能够通过其深层卷积网络准确提取铝制品表面的细微特征,从而识别出各种缺陷,如划痕、凹陷或污点。此外其多层卷积结构能够捕捉到不同尺度的特征,使得检测精度得到显著提升。由于AlxNet在设计时引入了批量归一化和激活函数ReLU,其特征提取过程相对高效。这使得在处理大规模铝制品图像时,模型能够快速地完成特征提取,并进行准确分类。
综上所述,基于AlxNet的铝制品缺陷检测系统能够在较短的时间内完成高精度的缺陷检测,适用于工业生产中对铝制品表面质量的实时监控和评估。
1.1铝制品表面瑕疵数据收集及预处理
(1)瑕疵数据集获取。本研究中的铝制品表面瑕疵数据集一部分是来自于三明某企业在一段时间段实际生产的图片数据,在此基础上增加天池算法比赛提供的开源铝制品缺陷图片。图片中包含一钟或多种瑕疵。从瑕疵图片中对瑕疵的种类进行归类,数据集共包含10类缺陷,分别为不导电、擦花、横条压凹、桔皮、漏底、碰伤、起坑、涂层开裂、漆泡和脏点。
(2)数据扩增。对于铝制品表面瑕疵检测问题,这些数据样本数量是远远不够的,有可能导致模型无法达到最优性能。考虑到数据量较少,将数据进行了扩增,在扩增方式上包括翻转,旋转等。本文挑选了其中800张数据,并通过数据增强方法最终生成了约5000张训练样本。1.2 AlxNet网络结构
AlxNet是一种深度卷积神经网络,最初由Alex Krizhevsky和他的同事在2012年的ImageNet竞赛中提出。这一网络架构是现代卷积神经网络(CNN)的一个重要里程碑,它在计算机视觉领域取得了显著的成功。AlxNet的结构主要由卷积层、全连接层、归一化层、池化层等组成。
1.2.1 conv1阶段
输入数据:227x227×3,卷积核:11×11×3;步长:4;数量(也就是输出个数):96。卷积后数据:55×55×96(原图N×N,卷积核大小n×n,卷积步长大于1为k,输出维度是(N-n)/k+1),relu1后的数据:55×55×96。Max pool1的核:3×3,步长:2,Max pool1后的数据:27×27×96,norm1:local_size=5(LRN(Local Response Normalization)局部响应归一化)。最后的输出:27×27×96。
AlexNet模型通过引入ReLU激活函数,优化了传统的Sigmoid和Tanh函数,从而提高了计算效率。此外,该模型还创新性地引入了局部响应归一化(LRN),这一机制模仿了生物学中神经元的侧抑制现象,即激活的神经元能够抑制其周围神经元的活动。此外,采用重叠池化技术,通过在池化过程中允许部分像素重叠,增加了模型对局部特征的捕捉能力。池化核大小是n×n,步长是k,如果k=n,则是正常池化,如果k<n,则是重叠池化。官方文档中说明,重叠池化的运用减少了top-5和top-1错误率的0.4%和0.3%。重叠池化有避免过拟合的作用。
1.2.2 conv2阶段
输入数据:27×27×96,卷积核:5×5;步长:1;数量(也就是输出个数):256卷积后数据:27×27×256(做了Same padding(相同补白),使得卷积后图像大小不变。)relu2后的数据:27×27×256,Max pool2的核:3×3,步长:2Max pool2后的数据:13×13×256((27-3)/2+1=13),norm2:local_size=5(LRN(Local Response Normalization)局部响应归一化)。最后的输出:13×13×256,在AlexNet的conv2中使用了same padding,保持了卷积后图像的宽高不缩小。
1.2.3 conv3阶段
输入数据:13×13×256,卷积核:3×3;步长:1;数量(也就是输出个数):384,卷积后数据:13×13×384(做了Same padding(相同补白),使得卷积后图像大小不变。)relu3后的数据:13×13×384,最后的输出:13×13×384。
1.2.4 conv4阶段
输入数据:13×13×384,卷积核:3×3;步长:1;数量(也就是输出个数):384,卷积后数据:13×13×384(做了Same padding(相同补白),使得卷积后图像大小不变。),relu4后的数据:13×13×384。最后的输出:13×13×384。
1.2.5 conv5阶段
输入数据:13×13×384,卷积核:3×3;步长:1;数量(也就是输出个数):256卷积后数据:13×13×256(做了Same padding(相同补白),使得卷积后图像大小不变。),relu5后的数据:13×13×256,Max pool5的核:3×3,步长:2Max pool2后的数据:6×6×256((13-3)/2+1=6),最后的输出:6×6×256。
1.2.6 fc6阶段
输入数据:6×6×256,全连接输出:4096×1relu6后的数据:4096×1,drop out6后数据:4096×1。最后的输出:4096×1。
AlexNet在fc6全连接层引入了drop out的功能。dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率(一般是50%,这种情况下随机生成的网络结构最多)将其暂时从网络中丢弃(保留其权值),不再对前向和反向传输的数据响应。
1.2.7 fc7阶段
输入数据:4096×1全连接输出:4096×1,relu7后的数据:4096×1drop out7后数据:4096×1,最后的输出:4096×1。
1.2.8 c8阶段
输入数据:4096×1,全连接输出:1000,fc8输出一千种分类的概率。
1.3模型性能和评价指标
在图像分类中,精确率衡量模型对预测类别的准确性,即预测为某类别的样本中有多少实际属于该类别;召回率衡量模型识别实际正样本的能力,即实际属于某类别的样本中有多少被正确识别;PR曲线展示精确率和召回率在不同阈值下的权衡,尤其适用于类别不平衡的情况;帧率则影响实时图像处理的流畅性和效率,尤其在需要快速响应的应用中至关重要。
2实验及过程分析
在实验过程中,AlexNet网络的训练情况通过损失曲线的变化得到了详细观察,从实验数据可以看出,在训练初期(前10个epoch左右),训练损失和测试损失都出现了较大的波动。这可能是由于模型在最初的阶段尚未找到较好的参数,参数更新较大,导致损失值剧烈波动。训练损失整体上呈现出下降的趋势,表明模型在训练集上学习到了有效的特征,逐渐拟合训练数据。然而,测试损失在初期也随之下降,但在大约20个epoch之后开始出现波动甚至上升,这可能是过拟合的迹象。模型在训练集上表现良好,但在测试集上无法很好地泛化,说明模型开始记忆训练数据中的噪声或特定模式,导致在测试集上的表现变差。测试损失在20个epoch之后的波动较大,并没有像训练损失一样稳步下降。这种现象通常是由于模型的泛化能力不足,可能与数据的复杂性、模型的复杂度、数据集是否平衡等因素有关。
训练完成后,评估指标的变化提供了模型性能的初步估计,详细的记录了训练过程中的训练集和测试集上的精度,最后的精度达到了85%左右,在训练的最初几个epoch中,训练集和测试集的精度都从较高的值开始,并且急剧下降,尤其是在前10个epoch内。这种情况通常发生在使用预训练模型的情况下。预训练模型的初始权重是从其他任务中获得的,因此在初期阶段,模型在新任务(铝制品缺陷检测)上的表现会出现较大的不稳定性,因为它需要适应新的数据分布和特征。
在大约10个epoch后,训练集和测试集的精度逐渐回升,并在30个epoch左右达到稳定。这个阶段表明模型逐渐从数据中学习到了相关特征,并对训练集和测试集的表现都有所提升。测试集和训练集的精度曲线紧密跟随,表明模型在两者上的表现相似,没有明显的过拟合或欠拟合现象。
从30个epoch开始,训练和测试的精度曲线开始出现一些小幅度的波动。训练精度虽然略高于测试精度,但两者之间的差异并不算太大。波动可能是因为训练数据的复杂性或不平衡,导致模型在一些batch上的表现不稳定。此外,测试集的波动表明模型在面对新数据时表现不太稳定,因此,可能需要更多的正则化或数据增强措施来提升泛化能力。这些指标表明,经过优化后的AlexNet在铝制品瑕疵检测任务中表现出了较好的识别能力。为了更直观地验证模型的实际效果,实验在多组铝制品瑕疵图像上进行了检测。实验结果显示了基于AlexNet训练后的瑕疵检测结果,模型成功识别了瑕疵的类别,证明其在实际应用中的有效性和可靠性。该研究为铝制品的自动化质量检测提供了一种有力的技术支持,具有显著的实际应用潜力。
3结语
面对变化多端的市场环境,企业面临着严峻挑战。在这样的背景下,确保产品的品质和提升运营效率成为了企业战胜危机的关键所在。本文使用AlexNet网络对铝制品瑕疵进行分类,成功地提升了对铝制品表面缺陷的识别精度。研究展示了机器学习技术在工业检测领域的强大潜力,尤其是在复杂的视觉任务中表现出的高效性和准确性。实验结果表明,改进后的AlexNet能够有效处理大规模铝制品图像数据,并在多种缺陷类型的识别上都取得了显著进展。这项工作不仅为铝制品的质量控制提供了新的技术解决方案,也为相关领域的研究人员提供了有价值的参考。然而,文章可以进一步扩展实验条件,包括构建机器视觉系统,在不同环境光照和生产条件下的性能测试,以验证模型的泛化能力。总体而言,本文的贡献在于将深度学习应用于实际工业问题,为铝制品瑕疵检测提供了新的视角和方法。福建省自然科学基金资助项目2020J01326。
