学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 英语论文 大学英语四级考试成绩数据挖掘及对教学的启示论文

大学英语四级考试成绩数据挖掘及对教学的启示论文

15

2023-12-17 13:24:56    来源:    作者:xieshijia

摘要:将数据挖掘应用到大学英语教学的一些环节,可以较客观地发现一些隐藏的联系和规律,更有效地组织教与学。对2019级非英语专业本科生的三次大学英语四级考试成绩做描述性统计和相关性分析,结果表明:学生第一学期四级考试成绩与高考英语成绩为强正相关,与之后考试相关性递减;总成绩与阅读、听力两个分项成绩为极强正相关,与写译分项成绩为强正相关;听力理解题型得分率最低。文章对教与学提出了几点建议。

  摘要:将数据挖掘应用到大学英语教学的一些环节,可以较客观地发现一些隐藏的联系和规律,更有效地组织教与学。对2019级非英语专业本科生的三次大学英语四级考试成绩做描述性统计和相关性分析,结果表明:学生第一学期四级考试成绩与高考英语成绩为强正相关,与之后考试相关性递减;总成绩与阅读、听力两个分项成绩为极强正相关,与写译分项成绩为强正相关;听力理解题型得分率最低。文章对教与学提出了几点建议。

  关键词:高考英语成绩;大学英语四级考试;相关性;分项成绩

  Abstract:Applying data mining in college English teaching can help to discover some hidden connections and laws,which benefit effective teaching and learning.Quantitative statistics and correlation analysis were made on the scores of college entrance examination and college English Test 4 of the non-English major undergraduates graduated in 2022.It's found that the college entrance examination results is highly positive correlated with the first CET4 re-sults,with a decreasing correlation with the second and third CET4.There is a strong correlation between students'total scores and the scores of each single part of the exam paper,namely,reading and listening comprehension with a highest degree,writing and translation with a relatively lower degree.Students'performance in CET4 listening needs to be improved.Some suggestions are made to improve students'English level and teaching effect.

  Key words:college entrance examination English score;CET4;correlation;sub-score

  一、引言

  数据挖掘是从大量、不完全、模糊、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘技术包括分类规则、关联规则、聚类规则等挖掘方法[1]。数据挖掘应用于教育领域,引起越来越多的关注。美国学校管理者协会携手学校网络联合会以及全球性的信息技术研究和咨询公司共同实施了名为“Closing the Gap:Turning Data into Action”(缩小差距:数据转化为行动)的项目,旨在促进学校对学生信息系统和学习管理系统中大数据的使用。美国教育部在2012年10月发布了《通过教育数据挖掘和学习分析促进教与学》[2]。

  相关性分析是检验两个或多个变量之间是否存在相关关系以及关系的方向、形态和关系的密切程度。文章对高考英语成绩与大学英语四级(CET4)成绩进行相关性分析,旨在利用松散耦合的成绩数据发现隐藏的规律和联系,找出一些有价值的信息,进而对课程、教学进行实时调整。选择该数据的原因在于:高考是我国公认的标准化考试,具有较高的信度和效度;大学英语等级考试是教育部主管高等教育司主持的全国性的教学考试,目的在于考查学生英语知识掌握的程度与综合运用能力,能够反映大学英语教学效果和学生的英语水平,在测试考生的英语听、说、读、写等能力上与高考有较强的延续性[3]。

  高考英语成绩对CET4成绩的影响如何?三个分项成绩与总成绩的相关度如何?未通过组的短板在哪个方面?文章对此三个问题进行研究和探讨。

  二、研究方法

  (一)研究对象

  北方某高校2019级非外语专业本科生。

  (二)研究数据和研究方法

  基础数据是高考英语成绩,三次CET4成绩,包括2019年12月第一次考试(CET4-1),2020年9月第二次考试(CET4-2,因新冠疫情考试从6月延期至9月),2020年12月第三次考试(CET4-3)。前期同类研究多为抽样数据,本研究数据未做抽样,减少了抽样可能导致的偏差,故分析结果有较高的信度。

  使用Python中Pandas库的Pearson相关性分析方法。

  三、总成绩描述性统计结果

  本研究对象所在学校对学生报考CET4没有年级和学期限制,考试成绩与毕业证、学位证不挂钩,学生自愿报考,每次参加考试的人数不同。三次有效数据分别为3330、2267、2568行,共8183行,统计结果如表1。

81d1da7e1ba142629967fea196c73e0e.jpg

  如表1所示,学生入学后三次CET4通过人数与参加考试人数之比分别为24%,12%,11%,成绩均值为386,372,364,有较大的提升空间,而且成绩分散度较高。

  四、相关性分析

  (一)CET4总成绩与高考英语成绩相关性分析

  对三次CET4成绩与高考英语成绩作相关性分析,结果如表2。

Dingtalk_20230924195625.jpg

  相关性系数取值范围[-1,1],越接近1或-1则相关度越强,越接近0则相关度越弱。相关性系数绝对值处于:①0.8~1.0极强相关,②0.6~0.8强相关,③0.4~0.6中等程度相关,④0.2~0.4弱相关,⑤0.0~0.2极弱相关或无相关。由表2可知,高考与三次CET4-1成绩的Pearson相关系数分别为0.626(强相关)、0.423(中等程度相关)、0.288(弱相关)。可以得出结论:CET4成绩与高考成绩的相关程度随时间推移递减。

  表2显示,高考英语成绩对CET4-1预测效度最高,建议高中英语基础较好的同学,在大学第一学期一鼓作气;高中英语基础较差的同学,应树立信心,踏实、持续地努力。同时,教师在第一学期利用学生已有的英语知识“趁热打铁”,及时指导四级备考,提高学生过级率,提高学生对大学英语学习的积极性,继而也为学生后续学习、考研、英文文献阅读、对外文化学术交流等奠定一定的基础。

  (二)CET4总成绩与分项成绩相关性分析

  现CET4总成绩710分,包括听力理解、阅读理解、写作和翻译三个分项成绩,分值比例各为35%(249分),35%(249分)和30%(213分)。分别对三次CET4总成绩和分项成绩进行统计和相关性分析,其中,得分率的算法是将该题型的考试平均得分和该题型的满分相除,结果如表3。

Dingtalk_20230924195817.jpg

Dingtalk_20231217131950.jpg

  表3显示了三次CET4分项成绩的几个基本统计量以及与总成绩的Pearson相关系数。根据表中数据计算可知,听力理解、阅读理解、写作和翻译分项成绩的标准差平均值为23,25和16,平均得分率是:听力49%,阅读51%,写译58%。各分项成绩中,阅读理解题型的得分最为分散,推测原因,或与学生词汇量差异有关,普通高中毕业生的英语词汇量在2500至3000,而CET4考试大纲要求的词汇量在4500以上,基础差的学生入学后没有及时扩充足够的词汇量,导致考试中阅读理解困难。写译部分的标准差最小且得分率最高,说明在该部分题型上学生得分相对集中且掌握较好。分析原因,第一,多数教师对这部分题型的辅导较多;第二,社会培训机构和网上的“冲刺”辅导讲座通常主讲这部分题型,学生对答题技巧和规则了解较多;第三,这部分是主观题型,写作选用考生熟悉的题材,考生可以凭借文化背景、社会经历等弥补词汇、语法的不足;翻译部分为汉译英,考生常会使用上义词、下义词、同近义词等基本技巧,基本完成中心思想、观点态度或特定信息的书面表达。写译得分率高,以上是基于经验的归因分析,文章后面会谈到另一个基于数据的原因分析。

  根据表3数据也可知,三个分项成绩与总成绩均为极强相关或强相关,从三次考试平均情况来看,总成绩与分项成绩相关度从高到低为:总成绩—阅读成绩0.807,总成绩—听力成绩0.757,总成绩—写译成绩0.686。

  “如果想通过CET4,听力题(或阅读、写作、翻译题)最少要得多少分呢?”这是学生常问的一个问题。通过以上相关性分析和表3的单项成绩统计,下面尝试回答这个问题。

  一方面,三个题型不可放弃任何一个,参加三次考试的全体样本中有单科成绩为0分者共18人,他们的总成绩在[221,289]区间,与及格线相去甚远。

  另一方面,如某单项成绩很低,只有另外两项都达到及格或中等水平才可能通过。将总样本分为通过组和未通过组两组,三次考试中所有通过者的单项成绩最低值为听力95,阅读118,写译103,折算为百分制相当于38分,47分,48分,这并不意味某位考生各项都不及格就可以通过。例如,CET4-3中,听力成绩最低者96(相当于39分),其阅读成绩179(相当于72分),同时写译成绩159(相当于75分),总分才达到434(相当于61分)。其他两个单项获得最低分的学生也类似。某单项极低却总分通过属于小概率事件,也可能是某个题型在考场发挥失常所致,学生不能抱有侥幸心理,更不能作为英语学习的最高目标。

  要正确看待CET4,它是检测学生阶段性学习效果、衡量英语综合应用能力的手段之一,利用过级考试增强英语学习动机,不能有通过就万事大吉的心理。如前面相关性分析,三个单项成绩与总成绩的相关度极强或强,对总成绩都有重要影响。未通过四级考试的原因通常不是某单项因素导致,而是各项水平都需要提升。以CET4-1为例,未通过组与通过组的成绩差距在三个分项都较为显著,听力和阅读的差距更大,如图1所示。

Dingtalk_20231217132036.jpg

  既然三个单项成绩对CET4总成绩的影响程度不分伯仲,那“四级该怎么准备?”也是学生常问的一个问题,一言以蔽之,就是用功,因为功不唐捐。但是对专业课任务重、英语基础较差、英语学习动机不足的学生,有诸多困难,从哪项突破更能有效提升整体水平呢?

  (三)CET4单项成绩间相关性分析

  对单项成绩两两间相关性分析,结果显示,各单项成绩两两间均呈正相关,阅读—写译的相关度最高,为0.434(中等程度相关);阅读—听力为0.359,听力—写译为0.332,都属于弱相关。这一结果与广为接受的阅读和写作是相关过程的假设是一致的。更好的作家往往是更好的读者,更好的作家往往比较差的作家阅读更多,更好的读者往往比

  差的读者写出更成熟的语法。

  分析了高考英语成绩和各单项成绩的相关性,高考—写译、高考—阅读属于中等程度相关,系数为0.522、0.490,高考—听力成绩属于弱相关,系数为0.344。

  由此可以得出:学生入学时的英语基础和CET4写译成绩相关度最高,与听力成绩相关度最小,同时写译—阅读相关度最高,阅读和听力对总成绩的影响高于写译。而听力对两组学生而言,都是得分率最低的题型,是考试的难点所在。因此,对英语基础较好的学生群体,可以预测写译和阅读成绩,从难点突破———加强提高听力水平;而对英语基础较差的学生群体,从重点突破带动整体提升———可首先注意提高阅读水平,“以读促写”,并快速扩充词汇量为阅读和听力的提高打牢基础。

  五、结论与建议

  对CET4成绩数据进行挖掘和分析,得出三个结论。

  结论1高考英语成绩与第一学期CET4的相关度为强相关,与之后考试的相关度递减。

  结论2 CET4阅读、听力、写译三个单项成绩与总成绩为极强相关,或为强相关,学习中不可偏废。

  结论3高考成绩与CET4写译分项成绩的相关度较高,阅读—写译较阅读—听力、听力—写译的相关度更高,而无论英语基础好与差,听力得分率最低,故可以有针对性地制定备考策略和学习计划。

  CET4考试要求与教育部《大学英语课程教学要求》[4]相契合,笔者不认同“随着越来越多大学生对四、六级考试的盲目追逐,我国大学英语课程目标逐渐走向僵化”这样的因果关系。相反,CET4促进了教学大纲在大学英语教学中的贯彻落实,使学校领导重视大学英语课程,从而保证了大学英语基础阶段的课堂教学,激发了教师和学生的积极性[5]。我们要正确认识CET4考试与大英课程教学目标、与学生后续教育的关系。

  CET4试题内容涉及中国传统文化、跨文化知识、科教等多种主题,选取适当内容作为补充素材不失为课程思政建设和跨文化思辨能力培养的一个好办法。“理解中国、联接中外、沟通世界”“用英语讲好中国故事,向世界传递中华文化”是当代中国外语人的光荣职责和使命。CET4的翻译题型,要求考生用英语表述中国文化,也与时代使命相契合。

  “数据驱动学校,分析变革教育”的大数据时代已经来临[2],在大学英语教学中利用数据挖掘和分析可以优化学生学习路径,促进学习反思,使“数据服务”教育模式融入“经验式”教学模式。文章只是数据挖掘的基础运用,更多更深入的数据挖掘技术、方法和机制值得我们在未来大学英语教学中展开研究。

  

参考文献:

  [1]毛国君,段立娟,王实,等.数据挖掘原理与算法[M].北京:清华大学出版社,2005.

  [2]徐鹏,王以宁,刘艳华,等.大数据视角分析学习变革———美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013,31(6):11-17.

  [3]陈卓,于鹏.高考英语成绩与大学英语四、六级成绩的实证研究[J].海外英语,2019(12):113-115.

  [4]教育部高等教育司.大学英语课程教学要求[Z].北京:高等教育出版社,2004.

  [5]辜向东.大学英语课堂教学的特征———兼论大学英语四、六级考试对课堂教学的影响[J].西安外国语大学学报,2007(4):39-45.