基于改进 ResNet-50 架构的试卷分数识别系统论文
2026-03-26 15:51:53 来源: 作者:xuling
摘要:纸质试卷是高校教学档案的核心部分,目前其合分工作主要依赖人工完成,效率低且容易出错。
摘要:纸质试卷是高校教学档案的核心部分,目前其合分工作主要依赖人工完成,效率低且容易出错。为此,本文基于树莓派设计并实现了一套试卷手写分数自动识别系统,首先,实时采集试卷图像,利用色彩特征定位并裁剪出分数区域;其次,对剪切图像进行分数区域提取和形态学处理,完成手写数字分割;再次,通过归一化处理提升图片质量,并基于ResNet-50构建手写数字识别网络,实现分数信息的准确提取;最后,借助PyQt5开发人机交互界面,完成分数的自动识别与求和计算。实验结果表明,系统识别准确率高达99.52%,识别速度快,可以较大程度提高试卷合分统计速度并减轻教师工作量,具有较广阔的应用前景。
关键词:试卷分数识别;深度学习;手写数字识别
0引言
试卷是高校教学档案管理的核心对象,是高校接受专业评估、合格评估和审核评估等各类教学评估的重要依据[1]。随着高校规模逐步扩大,学生人数逐渐增加,教师在学期末试卷阅卷的工作量越来越繁重。一方面,人工批改方式需要投入大量精力,长时间作业容易导致视觉疲劳,造成批改错误;另一方面,在阅卷过程中,由于试题数量庞大、试卷题型多样,若依赖心算进行各题分数累加,容易出现多算或少算的情况,而使用计算器则操作繁琐、效率较低[2]。如今,深度学习技术逐步崛起,借助卷积神经网络进行手写数字识别的技术已趋于成熟[3]。王洪申和李昌德[4]通过对试卷截取、图像归一化、采用LeNet-5网络实现识别,修改该网络的batch、learning rate、epoch和权重数量等参数,提高了识别效果,正确率达93.20%。王耀宗和张易诚等人[5]利用YOLO目标检测分值框进行定位,并引入膨胀卷积、调整边框损失函数、提高收敛速度,基于ResNet卷积神经网络对分数进行识别,分数的识别准确率为99.2%。
1本文设计思路
本文以纸质试卷分数识别作为研究切入载体,设计一款基于树莓派的试卷分数识别系统,算法流程如图1所示。

(1)利用摄像头实时采集试卷图像进行预处理,基于颜色特征识别方法对试卷分数栏进行初步定位与裁剪;(2)采用阈值分割和形态学对裁剪后的分数栏图像处理,完成手写体分数分割,为分数识别提供高质量的单个数字图像;(3)对截取分数进行归一化处理,保持数字基本形态特征不变的同时,完成尺寸统一;(4)采用改进的ResNet-50网络结构,在MNIST数据集上完成数字识别模型的训练,利用该模型完成分数识别;(5)利用PyQt5开发图形界面,该系统支持试卷分数的自动识别,并可对识别出的分数进行累加求和。
2预处理
2.1试卷分割
本文开发了一种基于颜色特征的试卷图像分割算法,用于自动剪切手写数字分数。该技术通过颜色空间分析分割出红色笔迹区域,并将其进行二值化处理,最终得到以孤立数字为前景的目标图像,便于后续的识别任务。然而,实际试卷图像中常存在干扰信息(分数下方可能出现其他红色干扰信息),因此在后续图像预处理前需先进行有效分割以消除这些干扰。
2.2图像增强
本研究所处理的试卷图像在实际采集过程中往往受多种因素影响,包括环境光照变化、成像设备分辨率不足以及书写笔墨浓淡差异等,图像质量下降。因此,在进行后续图像分析之前,利用高斯平滑滤波加权平均计算,使得处理后的像素值不仅取决于自身,还受到周围像素的影响。加权系数由高斯函数确定,距离中心像素越近的像素权重越大,从而在平滑噪声的同时较好地保留图像的边缘和细节信息。
3手写数字分割
3.1基于HSV的阈值分割
本研究基于HSV颜色空间理论,通过分析试卷手写体分数的红色特征,建立了H、S、V三分量的阈值范围,实现了分数区域的精准提取。该方法将RGB图像转换至HSV空间后,利用预设阈值进行二值化处理,有效克服了光照变化的影响。实验结果显示分割效果良好,完整保留了数字结构特征。
该方法的核心优势在于HSV空间将色彩信息解耦,通过精确设定红色特征的阈值范围,不仅准确提取了手写分数,还能有效过滤其他干扰信息。
3.2形态学处理
针对手写体分数区域存在的孤立噪声点的问题,本论文采用形态学处理方法进行优化。基于数学集合理论的形态学操作主要包括腐蚀、膨胀、开运算和闭运算四种基本方法,重点采用腐蚀操作去除离散噪声点,配合膨胀操作连接断裂笔划,在保持数字主要形态特征不变的前提下,既有效消除了干扰噪声,又修复了断裂字符,显著提升了图像质量,为后续识别任务提供了更完整、准确的输入数据。
3.3手写体数字分割
在完成分数区域提取和形态学去噪处理后,提出了一种有效的数字分割方法。首先,通过形态学膨胀操作将相邻数字像素连接成整体;其次,基于轮廓检测技术,依据面积特征筛选有效数字区域并生成最小外接矩形,实现单个分数的准确定位与分割。该方法融合形态学处理和轮廓分析技术,成功解决了手写数字粘连和定位问题,为后续识别任务提供了高质量的单个数字图像。
4手写数字归一化
针对手写体数字存在的外形差异和尺寸不统一问题,本研究提出采用归一化处理提升识别准确率。由于手写数字样本已通过前期处理转化为干净的二值图像且无明显形变,本文选用计算效率高、效果均衡的双线性插值法进行尺寸归一化,为后续的数字识别建立了统一的特征分析基础。本文手写数字归一化如图2所示,实手写数字分割提取字符区域形态学处理分割单元格验表明,这种归一化处理方法在保证处理效率的同时,能较好地保留数字的结构特征,有助于提高识别系统的鲁棒性。

5手写体数字识别
手写体数字识别是试卷分数自动识别系统的核心技术,本课题创新性地设计了基于ResNet残差网络的识别模型。针对实际应用中存在的书写模糊、涂改等挑战性问题,研究提出了一套完整的解决方案:通过ResNet网络提取深层特征实现高精度识别,引入后处理算法对网络输出结果进行优化校正。
本研究采用ResNet-50作为手写数字识别的核心网络架构,其创新性地改进了基础残差结构。相较于ResNet-34采用的两层标准残差块,ResNet-50引入了三层瓶颈设计,该结构通过1×1、3×3、1×1的卷积层组合实现特征维度的智能变换:首个1×1卷积降维减少计算量,中间3×3卷积进行空间特征提取,末个1×1卷积恢复特征维度。这种设计在保证特征表达能力的同时,显著降低了模型参数量和计算复杂度,使深层网络的训练更加高效稳定。
网络架构采用224×224尺寸的手写数字图像作为输入,其处理流程可分为四个关键阶段:首先,输入图像通过包含64个7×7卷积核的初始卷积层进行底层特征提取,生成初步的Feature map;其次,该特征图经过3×3最大池化层进行空间下采样;再次,系统采用四阶段残差模块进行深度特征学习,每个阶段包含多个改进的瓶颈残差块;最后,网络通过全局平均池化和全连接层输出分类结果。这种层级式设计实现了从局部到全局的特征抽象:初始大尺寸卷积核(7×7)有效捕捉笔画级特征,四阶段残差结构逐步提取字符结构特征,而最大池化操作在保持特征不变性的同时降低计算复杂度。
6上位机设计
本研究实现的试卷分数自动识别系统提供了完整的教学评估解决方案,利用PyQt5开发的上位机系统调用摄像头识别试卷,通过算法识别分数,并将其保存到数据库中。
7实验结果分析
为验证本算法的有效性,本研究在标准Mnist手写数字数据库上进行了对比实验。如表1所示,与ResNet卷积神经网络算法相比,本算法在识别准确率、处理速度等关键指标上均表现出显著优势。实验结果表明,本文提出的基于改进ResNet-50架构的识别方法,结合创新的后处理机制,不仅有效克服了传统方法对书写变异的敏感性,在计算效率方面也取得了突破性提升,为试卷分数自动识别系统的实际应用提供了可靠的技术保障。

8结语
(1)高效准确的识别性能:本文提出的基于改进ResNet-50的试卷分数识别系统在MNIST数据集上达到99.52%的识别准确率,实际试卷测试中平均准确率超过99%,显著优于传统方法。(2)完整的处理流程:通过HSV颜色分割、形态学去噪、数字归一化等关键技术,有效解决了光照干扰、书写变异和噪声问题,为深度学习模型提供了高质量的输入数据。(3)实用的系统设计:结合PyQt5开发的用户界面支持摄像头输入,并实现分数自动统计与分析功能,大幅提升了教师阅卷效率,减轻了人工负担。(4)教育数字化应用价值:该系统为纸质试卷信息化提供了可行方案,适用于高校课程考核、教学评估等场景,具有推广潜力。未来可进一步优化复杂背景下的鲁棒性,并扩展多题型支持功能。
参考文献
[1]何苗.基于深度学习的试卷分数识别系统[D].哈尔滨:哈尔滨师范大学,2023.
[2]郑继燕.基于CNN的手写数字识别与试卷管理系统设计[D].北京:北京邮电大学,2020.
[3]张文,王意,刘天宇.基于卷积神经网络CNN的手写数字识别算法研究[J].电脑知识与技术,2023,19(35):27-29.
[4]王洪申,李昌德.基于LeNet-5的试卷手写分数无分割识别方法[J].计算机仿真,2023,40(2):459-465.
[5]王耀宗,张易诚,康宇哲,等.基于改进卷积神经网络的图像数字识别方法研究[J].软件工程,2023,26(8):35-39+57.