学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 教育论文 挑战与回应:基于学科任务完成质量的等级评分方法论文

挑战与回应:基于学科任务完成质量的等级评分方法论文

4

2025-03-17 14:41:22    来源:    作者:xujingjing

摘要:核心素养立意的新课标给考试评价实践带来了不可忽视的挑战,在学生面对的情境、任务难度与广度、所运用的知识范围均给定的前提下,如何科学地评定学生的核心素养发展水平成为评分环节不得不回应的重大问题。鉴于传统的评分方式无法回答好这一新问题,根据合一性原则,以实践为基础,基于学科任务完成质量的等级评分方法是回应新挑战和新问题的行之有效的方法。

  摘要:核心素养立意的新课标给考试评价实践带来了不可忽视的挑战,在学生面对的情境、任务难度与广度、所运用的知识范围均给定的前提下,如何科学地评定学生的核心素养发展水平成为评分环节不得不回应的重大问题。鉴于传统的评分方式无法回答好这一新问题,根据合一性原则,以实践为基础,基于学科任务完成质量的等级评分方法是回应新挑战和新问题的行之有效的方法。

  关键词:传统评分方式合一性原则学科任务完成质量等级评分方法

  考试如何评分在很大程度上决定着教师如何教学,如果继续采取传统评分方式评定学生的作答结果,会导致核心素养立意的整个基础教育改革功亏一篑。评分方式改革可被视为基础教育课程和考试评价改革的“最后一公里”,但其仍然是基础教育理论与实践研究的薄弱点。本文旨在回应新课标为考试评价实践带来的挑战,初步构建起基于学科任务完成质量的评分量表技术。

  一、新课标对评分提出的新挑战与回应的基本思路

  评分是对学生作答结果的评定,它是对学生学习成绩的衡量。虽然如今的教学实践中反对“唯分数”论,但只要分数还作为衡量学生学习结果的重要指标和中高考录取的重要依据,评分就依然是师生持续关注的焦点。新一轮基础教育课程改革就给评分实践带来了新挑战。

  1.新课标对评分提出的新挑战

  在新一轮基础教育课程改革中,新课标以核心素养作为立德树人的抓手,构建基于课程(学科)核心素养立意的教育教学体系。在新课标中,依次存在三个与核心素养有关的水平表:核心素养学段特征表、基于核心素养的学段目标表、基于核心素养的学业质量标准表,三者之间有着鲜明的区别。

  核心素养学段特征表反映该学段对应核心素养的典型特征,它可能是外显化的关键行为表现特征,也可能是对内隐特征的陈述。

  基于核心素养的学段目标表是指经过该学段学习后期望学生达到的核心素养表现特征。如果说核心素养学段特征表是对平均事实的刻画,那么学段目标表则是一种预期,是一种可能的状态。

  基于核心素养的学业质量标准表则以整合的方式描述了经过课程学习后核心素养的综合外显表现,它与学段目标表相似,依然是一种预期,是一种期望的可能状态。

  三者之间的直观区别在于核心素养学段特征表与基于核心素养的学段目标表是依据核心素养分条进行陈述的,而学业质量标准表则要对课程内容和核心素养进行整合,即一条行为表现可能对应着多条核心素养。基于三者的内涵,整合与非整合、期望与事实、内隐与外显才是理解三者区别的重要维度。

  然而,三者之间又有着颇多相似之处。三者均指向核心素养和学生核心素养发展水平,且三者区分核心素养发展水平的维度也相同,各门课程(学科)均从以下几个维度区分核心素养的水平层级。其一,学科必备知识综合运用的广度:核心素养发展水平越高的学生,其对学科知识的综合运用能力越强;其二,情境的复杂(新颖或不良结构)程度:核心素养发展水平越高的学生,其越能够应对更复杂(新颖或不良结构)的情境;其三,所完成的学科任务的难度与广度:核心素养发展水平越高的学生,其越能够完成更高难度或范围更广泛的学科任务。

  上述三个衡量核心素养发展的水平表给考试评价的实际操作带来挑战。在一场纸笔测试中,只要全体学生同做同一套试卷、同一道试题,就一定意味着上述三个变量不再是变化的量,而是一个固定的常数,因为知识综合运用的广度、情境的复杂(新颖或不良结构)程度、学科任务的难度和广度都是给定的,这就为教师提出了一个其不得不回答的现实问题:在大家均完成同一道试题(即上述变量固定不变)的情况下,如何判定学生核心素养发展水平的高低?这个问题是新课标带给考试评价实践的新问题,也是评分环节必须解决的关键挑战。

  2.构建良好评分方法的基本前提—合一性原则

  在学生面对的情境、任务难度与广度、所运用的知识范围均给定的条件下,如何科学评定学生的核心素养发展水平?要回答好这个问题,测评者需要明确新的评分方法必须满足的基本前提条件。

  构建良好评分方法是为了对学生的应答进行科学合理的评判,这也反映了测评者对考试评价的立场、价值和目标追求,构建新的良好的评分方法必须满足合一性原则。所谓合一性原则是指命题的理念、原则与评分的理念、原则必须保持一致。基于合一性原则,新课标的评分方法必须满足以下两条基本要求:一是坚持核心素养立意。新一轮基础教育课程改革倡导考试命题的核心素养立意,因此,新的评分方法必须基于学生的核心素养发展水平评定学生的应答表现,而不能基于传统的学科知识掌握的程度对学生加以判断。二是坚持学科任务导向。按照新课标的核心素养测评框架,考试评价要以学科任务为核心,融真实情境、学科内容于一体,从而诱导出核心素养的关键行为表现,因此,既然学生完成的是学科任务,那么评分的对象就必须是学科任务本身,而不能是别的对象。

  传统评分方法主要有三种:采点评分法、布鲁姆认知目标分类评分法、SOLO分类评价法。但无论哪一种评分方法均不满足合一性原则。根据合一性原则,采点评分法是典型的学科知识立意。而在核心素养立意的考试评价体系中,如果评分依然坚持学科知识立意,那么,实际引导课堂教学的依然是学科知识立意,忽视学生的思维发展与实际问题解决能力的培养。布鲁姆认知目标分类评分法以任务的类型来评判学业质量水平的高低,强调不同任务之间有着水平质性的差异,忽视了同一任务在水平上的质性差异,即“应用”也存在着素养高的应用和素养低的应用之分。此外,“评价”这一任务也不一定比“理解”更高级。因此,这种评定方法并不适合回应新课标带来的评分挑战,因为这一挑战需要解决的是在同一个问题情境或同一个任务中的素养等级划分问题。SOLO分类评价法在新课标背景下的不足之处在于,它的评定维度较为单一,其对学生学业成就的评定侧重于知识理解与运用维度,未能综合考虑多方面因素评定素养发展水平。此外,SOLO分类法试图用同一套标准涵盖千差万别的任务,而在实际问题的解决过程中,学生需要完成不同的任务,这些任务的性质差异较大,很难用同一套标准衡量不同任务下素养水平的高低。这就意味着测评者必须根据合一性原则构建新的良好的评分方法,以回应新课标带来的评分挑战。

  二、构建基于学科任务完成质量的等价评分方法

  基于上述分析,与核心素养测评框架一致的评分变量只能是学科任务的完成质量,考生从完成学科任务始,以学科任务的完成质量终,其保持了前后的一致性,充分体现了合一性原则。

  1.构建基于学科任务完成质量的等级评分量表框架

  正如上文所说的,在新课标中,衡量学生核心素养发展水平的变量有三个:情境、任务广度和难度、知识综合运用程度,即:N=f(X、Y、Z),N代表核心素养发展水平,X、Y、Z依次代表衡量核心素养发展水平的变量。在评分环节,X、Y、Z均为给定条件,故而必须在函数中引入新的变量H作为评分变量,而这个H只能是学科任务的完成质量。

  学科任务完成的质量如何,不能依据教师的主观意愿加以判断,而需要基于事物本身的属性加以判断,必须从该任务的内在构成要素出发。任何一种任务都会有一系列基本的要素,只要找出这些要素单元,将它们作为任务完成质量的评价维度,从而对学生在这些要素单元上的行为表现作出准确的评定,则能够对学生在完成这项具体任务时的总体质量实现合理评定。

  虽然具体、实际的任务种类较多,但基于相同的学科本质,评价者应将本质相同、性质相近的任务和具体的学科任务进行归纳合并,进而将学科任务分成若干基本任务。因此,基于学科任务完成质量的评分方法的基本评分量表框架见表1。

image.png

  针对不同的学科任务,教师要制订不同的等级评分量表。一般来说,制订该量表主要有三个步骤:一是确定衡量每一项任务完成质量的维度;二是编制每个维度在每个水平层级的评价量表;三是对量表进行测试与修改。量表的编制过程是确定任务质量评价维度及其水平层级划分的过程。编制高质量的等级评分量表,既要依靠评价者以往的经验,也要依靠同行间的交流与科学的实证研究,它是一个不断循环、不断修正、不断完善的过程。

  从表1的评分量表框架可以看出,这种与新课标命题具有合一性的评分方法具有以下鲜明特点:其一,它的评分基本框架不再是笼统的统一标准,而是一类任务对应一个评分标准;其二,不同任务之间不再具有素养的层级高低之分,素养或能力的层级高低之分是基于同一任务的;其三,这种评分方式强调基于对学生的应答表现进行整体性判断,以此判断学生的真实问题解决能力和思维发展水平。

  基于学科任务完成质量的等级评分方法是本研究在新课标研制过程中发明的评分方法,也经受了实践的检验。在实践过程中,这一方法有以下三个难点问题:一是如何合理划分学科任务,二是如何合理确定每一项任务的质量评价维度,三是如何对每个维度进行质性的水平分层。这些问题的解决需要教师经验的积累,更需要实证研究的补充。

  2.基于学科任务完成质量的等级评分量表的学科示范

  下文以高中思想政治学科为例,展示基于学科任务完成质量的等级评分量表的具体应用情况。

  思想政治课程是一门涵盖哲学、逻辑学、文化理论、经济学、管理学、政治学、法学等多个人文科学与社会科学的综合性学科课程,旨在引导公民的正确政治方向和提升公民的社会参与能力。根据这门课程的培养目标、育人价值与课程内容的性质,从马克思主义的“认识世界、改造世界”出发,可以将认知操作任务分为十项:①对理论的内容、含义、特征、表现进行陈述和阐释;②对事物、现象、问题的特征、内容及表现进行描述和比较;③对理论、事物、现象、问题进行分类;④对理论、事物、现象的本质与意义、价值、功能进行分析、辨识和评价;⑤对要素、事物、概念、价值之间的关系进行辨识和辨析;⑥发现事物、现象、问题的原因以及不同变量之间的关系,以进行解释;⑦运用理论、实证材料对已有理论和自主探究结论进行论证和检验;⑧对不同观点、立场、利益进行判断、辩护和批判;⑨对行为、事物、现象、问题的后果或影响进行分析和预测;⑩设计方案,对不同方案的结果(如有利之处和不利之处)进行比较、评估并进行选择。在此基础上,本研究将普通高中思想政治学科的学科任务归纳为四方面:描述与分类、解释与论证、预测与选择、辨析与评价。

  描述与分类是指能够按照某个维度,对真实社会生活情境中事物或问题的性质、特征、表现进行描述,对它们进行比较和分类。它主要回答“是什么”的问题。

  解释与论证是指运用学科技能与方法,分析真实社会生活情境中的事物或问题的原因,探究不同变量之间的关系;运用理论和实证材料对探究结论进行合乎逻辑与科学要求的论证和检验。它主要回答“为什么”的问题。

  预测与选择是指结合具体的社会生活情境,运用科学的方法和原理对行为、问题的结果或影响进行分析与预测;根据约束条件和决策目标设计出合理可行的方案;比较不同方案的优劣、利弊并作出合理选择。它主要回答“怎样做”的问题。

  辨析与评价是指结合具体的社会生活情境,根据某个维度对事物的作用、价值与功能进行分析和评价,辨识事物之间的关系;合理运用相关理论和方法,对不同观点与立场、不同利益诉求进行辨析、辩护与辩驳。它主要回答“应该怎样做”的问题。

  在此基础上,本研究将同一任务下的学业质量水平分为四个层级,第1级代表最低水平层级,第4级代表最高水平层级。具体的评价指标体系见表2。

image.png

image.png

  下面以一道高考试题(2018年高考文科综合全国I卷第38题)为例加以说明。

  阅读材料,完成下列要求。

  近年来,随着经济进一步发展和国家全民健身战略的不断推进,国内掀起了马拉松热。2011年中国马拉松赛事仅有22场,2017年增长到1100场。据预测,2020年中国马拉松赛事将达1900场。

  马拉松赛事的参与人数多、涉及领域广。2017年参加马拉松比赛的人次超过500万,覆盖全国234个城市,赛事带动安保、保健、住宿、餐饮、旅行、体育文化等服务业的发展。据测算,2017年全国马拉松主办方的直接营业收入超过270亿元,主办城市的间接收入超过1350亿元。

  结合材料,运用经济知识分析近年来我国马拉松热的驱动因素。

  这道题所涉及的学科基本任务为“解释与论证”,根据关于这一任务完成质量的评价指标,可设计具体的等级评分量表(见表3)。

image.png

  三、结语

  本文提供的基于学科任务完成质量的等级评分量表技术具有较高的理论价值,它能够有效地解决新课标带来的评分挑战,即使学生在面对同一情境、同一任务、同一难度的试题以及调动相同的知识范围的情况下,也能对不同学生的学业成就进行客观评价。同时,这种评分方法又经过了实践检验,适合推广到其他学科。

  [1]陈友芳,朱明光.核心素养本位的思想政治学科学业质量评价的策略与指标[J].中国考试,2016(10):32-37,57.

  [2]陈友芳.普通高中思想政治学业质量标准教学操作性转化的策略研究[J].课程·教材·教法,2023,43(11):74-79.