学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 理工论文 基于计算机视觉的开放大学在线考试防作弊系统论文

基于计算机视觉的开放大学在线考试防作弊系统论文

1

2026-03-30 17:21:41    来源:    作者:xuling

摘要:为解决开放大学大规模在线考试人工监考成本高、覆盖面不足等痛点,本文提出了一种融合人脸微表情识别与视线追踪的在线防作弊系统。

  摘要:为解决开放大学大规模在线考试人工监考成本高、覆盖面不足等痛点,本文提出了一种融合人脸微表情识别与视线追踪的在线防作弊系统。系统以OpenCV+Dlib实现实时人脸检测与68点特征标定,采用ResNet50微表情网络捕捉异常情绪,并结合基于3D眼模型的视线估计模块计算注视向量。实验结果表明,本方案满足开放大学“标准化考场建设”低成本、高并发、易部署需求。

  关键词:开放大学;在线考试;防作弊;计算机视觉;视线追踪;微表情

  0引言

  开放大学作为全民终身学习的重要平台,每年在线考试超1200万人次,如此庞大的考务需求使得传统依赖人工的监考方式面临严峻挑战,不仅人力资源投入巨大、执行标准难以做到全国一致,更无法满足广大偏远地区及农村教学点的实际需求。有鉴于此,探索依托计算机视觉技术的智能化监考方案既顺应了教育数字化的发展趋势,也为破解大规模在线考试监管难题提供了切实可行的技术路径。该项研究兼具理论创新价值与实践应用前景[1]。

  1存在的问题

  当前技术体系中存在的挑战具体表现为以下四个层面。

  其一,在微表情实时解析领域,系统承载能力与响应时效性尚存在显著短板。具体而言,现有架构仍难以稳定实现百人级同步通道、单帧处理耗时低于0.006秒的高并发低延迟目标,导致在密集人流场景下容易出现算力过载与识别帧率骤降的现象。

  其二,基于RGB光学传感器的目光定位方案,其三维眼球建模精度在大规模在线测评场景下暴露出明显局限。当前三维眼部数学模型的鲁棒性不足以支撑万级用户同时在线、持续数小时的考试监考需求,尤其在复杂光照与姿态变化条件下,模型泛化能力急剧衰减,眼动轨迹重建失败率呈指数级攀升。

  其三,端到端直接回归算法的工程化部署面临双重困境:一方面,此类方法对图形处理器算力依赖过重,导致在边缘计算节点(如考点现场服务器)上推理延迟普遍超过25毫秒,远超实时交互容忍阈值;另一方面,当考生头部转动幅度超出30度立体角或佩戴屈光矫正镜片时,视线落点预测偏差会扩大至8个像素单位以上,严重影响作弊行为判定的准确性。

  其四,图像采集终端的硬件异构性引发的域迁移问题日益突出。特别是在城乡数字鸿沟背景下,部分农村地区仍在使用720P低清网络摄像头,其信噪比与纹理细节的劣化会使算法误差率额外增加约两成,这种由设备差距带来的性能衰减成为阻碍该技术在全国范围内规模化落地的关键制约因素[2]。

  2系统架构与核心模块设计

  针对开放大学大规模在线考核场景的特殊性,本研究设计并实现了一种分层式技术框架,以应对瞬时访问量激增、资源投入限制及日常管理便捷性等多重要求。该方案创新性地将系统划分为终端接入层、边缘处理层与云端核心层三个层级,形成协同工作机制,如图1所示。

  终端层学生仅需一台配备720P/30fps摄像头的Windows或macOS电脑,浏览器通过WebRTC采集原始视频流,利用H.264软编在2Mbps带宽内稳定传输。边缘层以Docker容器形式部署在考场机房的GTX1660Ti推理节点,单机100路并发,延迟小于120ms;采用gRPC与终端保持心跳,断线5s内自动重连。云端层PostgreSQL14分区表存储异常日志,并通过TimescaleDB插件实现秒级聚合查询;前端Vue3+ECharts实时大屏展示异常轨迹[3]。以下分四个子模块详述关键技术实现。
       2.1人脸检测与对齐

  人脸检测阶段先用OpenCV-DNN加载Caffe-ResNet-SSD(300×300,NMS=0.4),置信小于0.9即提示调光并降帧至15 fps;1280×720下单帧3.2 ms。随后,Dlib 68点对齐最大人脸,仿射后两眼距80像素输出224×224 RGB对齐图,若yaw/pitch/roll任一角度超过20°,则标记为“姿态异常”并权重减半。

  2.2微表情识别

  以ImageNet预训练ResNet50为骨干、冻结layer1-3并在layer4后插入CBAM(通道+空间注意力)实现7类微表情识别;训练数据由CAS(ME)2的255段微表情视频加上1.2万段自采考试场景构成,经TV-L1光流16帧(步长2)、光流扰动、帧率抖动20-40 fps及±5%随机裁剪扩增后,以AdamW(lr=1e-4)训练30 epoch,TensorRT FP16优化后batch=4,单帧6ms、1.4GB显存即可在GTX1660Ti边缘节点承载100路并发。

  2.3视线估计

  Dlib取左右眼各6瞳孔点,结合3D姿态建立局部坐标。EPnP求解旋转矩阵R,将局部z轴[0,0,1]T映射到相机坐标得v=R·[0,0,1]T。通过屏幕标定矩阵M(4×3)将v映射为屏幕坐标(sx,sy),标定误差<0.8cm;双眼夹角>10°选置信高者。采用1DKalman滤波(Q=1e-4,R=0.01)平滑注视点后,RMSE自4.3cm降至2.1cm。

  2.4异常行为检测框架(ABDF)

  2.4.1作弊模式

  P1频繁低头:头部俯仰角连续3帧>25°;

  P2视线偏移:注视点与屏幕中心距离>30%屏幕对角线;

  P3异常情绪:微表情“厌恶”+“恐惧”概率之和>0.7;

  P4人脸消失:连续3s未检测到人脸;

  P5多人脸:同一帧出现≥2张置信度>0.8的人脸。
       2.4.2多模态融合

  Score=0.30·norm(P1)+0.25·norm(P2)+0.25·norm(P3)+0.20·max(norm(P4),norm(P5)),norm(x)∈[0,1]为归一化后的异常强度,θ=0.65时误报率3.1%。

  2.4.3实时策略

  以3s滑动窗口、0.5s步长持续监测;当Score≥0.65,边缘节点即刻缓存前后各5s视频,生成320×240JPEG缩略图,经HTTPS秒级上传云端;云端异步将事件推送到教师监控大屏,同时写入PostgreSQL分区表exam_alert_{YYYYMMDD},实现低延迟、可追溯的异常告警闭环[4]。

  3实验与结果

  在某地市开放大学期末考试中开展实地验证,累计8472名考生、12183场次、约6TB视频数据。

  3.1数据集构建与标注

  随机抽取8000场为实验数据,其中作弊正样本1350场,负样本6650场。所有视频按7∶1.5∶1.5比例划分为训练集、验证集和测试集。

  3.2评价指标

  R(召回率)、FPR(误报率)、HSR(监考人力节约率)及系统延迟。

  HSR=(人工监考所需工时−实际人工复核工时)/人工监考所需工时×100%

  3.3结果分析(表1)

  系统成功召回1278例作弊中的1211例,误报仅37例,F1达到0.928。

  本文联合94.7%3.1%微表情+视线+ABDF

  (1)优化后,单机100路平均延迟118ms,GPU占用1.4GB、CPU38%、内存5.1GB,符合在线考试延迟200ms交互要求;断网重连成功率99.4%,最长耗时2.8s。

  (2)本次考试需487名监考教师,实际仅需18名教师进行异常复核,HSR=82%。边缘节点硬件投入1.2万元/节点,预计2.3个学期收回成本,显著降低成本。

  (3)教师日均复核47min,缩短73%,体验显著提升。

  4结语

  针对开放大学体系下的大规模在线评测场景,本文聚焦其成本控制、质量保障与可扩展性等核心诉求,创新性地构建并实证检验了一套融合微表情解析与眼动轨迹追踪的智能化无人值守监考架构。该研究成功攻克了两大技术壁垒:其一,基于算法优化与数据增强策略,该微表情辨识模型应对真实考场环境中弱光照条件、头部大幅度偏转等复杂工况的泛化性能与鲁棒性得到了显著提升;其二,设计了基于域适应与自监督学习的RGB视频流视线估计框架,有效缓解了传统方法依赖特定硬件、跨设备泛化能力弱以及前期标定流程繁琐、耗时等问题。这一研究成果不仅为开放大学标准化数字考场的规模化部署提供了兼具经济性、可靠性与操作便捷性的技术解决方案,更形成了一套可跨平台移植、多场景复用的方法论体系,对推动远程教育诚信体系的智能化升级具有重要的示范意义与实践价值。

参考文献

  [1]孙震丹,胡星.基于全景智能的分散型网络考试防作弊系统设计研究[J].中国教育信息化,2021(5):39-45.

  [2]陈立仲.基于微服务架构的防作弊在线考试系统的设计与实现[D].北京:首都经济贸易大学,2022.

  [3]王峥嵘.基于教学测试系统的防作弊功能的研究[J].现代信息科技,2022,6(17):41-44.

  [4]齐悦,谢泰,沙琨,等.基于大数据的在线防作弊招聘考试系统的分析与设计[J].科学技术创新,2021(28):77-79.