在线研讨
高中语文学习表现性评价与测试分析 2025-09-23
网站类目:在线研讨

江苏省中小学教学研究课题

(2021)年度第(十四)期


课题名称: 高中语文学习表现性评价与测试分析

课题编号: 2021JY14-CSFX-ZB23

课题类别(重点、立项) 重点自筹

课题主持人: 张清、刘生权

工作单位:江阴市山观高级中学、江阴市教师发展中心

组织结题单位: 江苏省中小学教学研究室

结题日期: 2025319

江苏省中小学教学研究室

O二一年制

一、课题主持人

姓名

张清

联系方式

13961632708

职务(职称)

副校长(正高级教师)

刘生权

13915313120

主任(正高级教师)

二、核心组成员(不含主持人)

序号

职务、职称

工作单位

对课题的主要贡献

1

王达星

研训员、高级教师

江阴市教师发展中心

报告撰写成成果展示

2

沈庆波

研训员、高级教师

江阴市教师发展中心

实验设计与理论框架构建

3

夏海燕

高级教师

江苏省江阴长泾中学

实验设计与实施

4

高洁

一级教师

江阴市山观高级中学

实验实施与成果展示

5

任春霞

一级教师

江阴市山观高级中学

实验实施与成果展示

6

卞雅

一级教师

江阴市山观高级中学

实验实施与成果展示

7

范丙军

正高级教师

江苏省南菁高级中学

文献综述与理论框架构建

8

赵钰

高级教师

江阴市山观高级中学

实验实施与成果展示

9

周丽芳

高级教师

江阴市山观高级中学

实验设计与实施

10

丁丽霞

高级教师

江阴市山观高级中学

实验设计与实施

11

张永澄

高级教师

江阴市山观高级中学

实验设计与实施

12

许夏

高级教师

江阴市第一中学

数据收集与分析

13

郑仲明

高级教师

江阴市第二中学

数据收集与分析

14

任少冬

高级教师

江阴市山观高级中学

实验实施与成果展示

注:《结题证书》核心组成员一栏只填除主持人之外前五名



三、成果简要说明

(包含成果主件、附件目录,论著、论文请注明出版单位)

一、《高中语文学习表现性评价与测试分析》结题研究报告(成果摘要)

(一)理论成果

1.凝聚核心观点

新修订的普通高中语文课程方案强调了核心素养作为育人目标的重要地位。在基于核心素养的课程改革背景下,教育评价亟待超越传统纸笔测试,推进表现性评价。表现性评价不仅能检测素养,更重要的是能促进素养的养成。其促进素养养成的功能主要通过创造在真实情境中解决问题的机会、引起学生的积极投入与主动建构、支持学生的自我调节学习来实现。设计促进素养养成的表现性评价包括三个步骤,分别是确定与课程标准匹配的素养目标并将其具体化;设计能够引发素养的表现性任务;开发基于学习进阶的评分规则。而在实施的过程中,需要将表现性评价嵌入课程与教学,确保学生深度卷入评价全过程,收集并充分利用学生素养表现信息来促进教与学。

2.厘清表现种类

格兰特·威金斯在《教育性评价》一书中列举了智力表现的三种类型口头的、书面的与展示的。《普通高中语文课程标准》明确三类语文实践活动“阅读与鉴赏”“表达与交流”“梳理与探究”。课题组把两者结合,厘清了“表现”的种类大致如下表:

语文实践活动与表现种类

阅读与鉴赏

表达与交流

梳理与探究

口头的

能用于朗读、复述、回答问题、发声思维、口头报告较难观察深度学习

能广泛运用如背诵、讨论、演讲、辩论、劝告、报告

口头报告梳理与探究的过程与成果较难观察深度的学习

书面的

能用于找出信息、填空文本、写出新的文本任务设计得当则能观察深度学习

能广泛运用如文类写作、创意写作与新媒体写作

能广泛运用,如计划、总结、日志、小论文、研究报告

展示的

能用于创造性阅读与鉴赏实现阅读与成果的形式转换如演剧、制作导图

需依托其他活动而展开,如图表、海报、电子媒介或艺术的表现媒介

以档案袋、表演、模型、各种媒介呈现过程与成果,但受限于相关技能

3.提炼核心要素

评价是基于证据的推理,任何评价都需要借助任务(题目/表现性任务)引出证据(答案/表现)。表现性评价核心要素可以从“评价八问”入手(见右图):

主体:谁来评?评价的主体,包括但不限于学生、教师、家长。

用户:谁需要使用评价?用户包括但不限于学生、教师、家长。

目标:为什么要进行评价?每次评价,都要有清晰可行的目标,当评价镶嵌于教学时,评价目标也是教学目标。

任务:借助什么载体引发表现?广义的任务,包括用于获得选择反应的题目,也包括用于获得建构反应的表现性任务。

工具:用什么工具来评价表现?不同的评价任务(题目/表现性任务),会使用不同的工具,如判断题、选择题是选择性反应评价的工具。

证据:学生完成任务(题目/表现性任务)有怎样的反应(答案/表现)?这些反应便是推断学生知能掌握、意义理解或迁移水平的证据。表现性评价要获得怎样的建构反应证据,取决于目标的指引和任务的要求。

过程:评价要经过怎样的流程?不同的评价,其命制或设计、实施、分析与统计等等,均有其不同的流程要求。

结果:评价结果如何处理?不同的评价,其呈现、反馈方式有其特殊性,如选择性反应的结果是简单的对错,而建构反应则没有那么简单。

“评价八问”即评价的八个元素。依据表现性评价的特质——适宜评价高阶认知,可以推知表现性评价的“核心要素”处于横线之上:

◆目标:预期学习者应达成的学习结果,应指向那些开放复杂的、需要持久理解的、整合多种智能的表现性目标。

◆表现性任务:设置尽可能基于真实情境的复杂性任务,以引出指向表现性目标的成果、作品或表现(过程和结果)。

◆工具:测查学生成果、作品或表现(过程和结果)的手段,包括核查表、表现清单和评分规则,而非二元对错的评分方式。

与选择性反应评价相比,表现性评价的“证据”“过程”“结果”(上图处于横线之下)有其不同的呈现,但相对于“核心要素”,这些都是非核心的。

(说明:表现性任务在三核心要素中,是连接表现性目标和测量工具的纽带,其功能成为关键。课题组以《促进学习的课堂评价》为蓝本,拟定了“一项好任务的特征”,特征见《中期研究报告》)

4.梳理评价类型

构建“三维评价模型”(目标、过程、结果),明确语文核心素养与表现性评价的映射关系,制定的课堂表现性评价的四种类型(见下表):

课堂表现性评价类型

简答式

独立式

单元嵌入式

复杂项目

预期学习结果的数量

一个到两个

多个具体学科的预期学习结果

有说服力的一整套具体学科的预期学习结果

复杂且整合的一整套预期学习结果和深度学习目标

在学生完成的过程中教师的教学所提供的支持程度

仅限于澄清

仅限于澄清、促导

整合了教学、促导、反馈

整合了教学、促导、反馈、指导

学生回应的规定性(是否有标准答案)

固定/收敛的

收敛的

适度发散的

发散的

学生选择程度

通常几乎没有选择

选择有限

选择的维度体现在内容和回应形式上

学生选择的机会通常非常丰富

大致的持续时间

一节课的一部分时间

一到两节课

多节课或多天

多周或一学期

简答式表现性评估的目的,是让学生在教师的有限指导下,展示对于一到两个预期学习结果的熟练程度;其形式只允许学生进行收敛性的选择,而且通常只需要几分钟就能完成。由于重点突出、结构有效,它可以用来快速测量离散的预期学习结果,同时激发高阶思维。又由于评估的目标数量有限,所以它往往是在一堂课中对学生学习进行形成性评估的有效手段。

作为评估复杂的预期学习结果的手段,独立式表现性评估,通常涉及多个目标,在一或两节课内完成的(最常见的是一节课完成),学生的选择程度往往仅限于回答内容,而不是回答的形式或过程。一种最常见的独立式表现性评估是限时写作,它可能有一个单独的写作提示,旨在挖掘内容知识的深度,需要高阶思维,并要求熟练掌握书面交流的模式。另一种独立式表现性评估的形式是口头表达,当推理的口头表达是预期的学习结果时,口头表达的使用就显得尤为重要。

单元嵌入式表现性评估的特点是,在一个教学单元内进行,因此被称为单元嵌入式。它的目的是促使学生展示一套有说服力的预期学习结果,即一套复杂但连贯的知识和特定学科的技能,并在一段较长的时间(无论是几天甚至一周或更长时间)内应用。由于预期学习结果的复杂性和这种任务的扩展性,往往需要将教学融入到表现性评估中去,教师在有限的时间内点拨和促进学生的工作,甚至可以提供纠正性反馈。

复杂项目的设计是为了让学生参与到要求他们利用多学科的不同知识和技能的任务中。它也特别适合提供一些更广泛的教育目标的证据,例如批判性思维、创造性解决问题、有效的沟通和建设性的合作,也就是深度学习。复杂项目的一个特点是,学生在项目进行过程中有相当程度的自主权。学生可以选择自己的主题,甚至选择自己追求项目的目的。学生有很大的自由度来决定开展项目的方式和过程。

(二)‌实践性成果

1.形成操作流程

在中期研究成果以始为终,确定目标-设计任务,确规则-实施任务,观察测量-反馈结果,反思效度”四环节表现性评价样态的基础上,课题组经过进一步探索与实践,结合文献检索与分析,参考教学设计迪克·凯瑞恩模型,综合多家论述和我们的实践经验,构定位于高中语文核心养的养成,形成表现性评价的设计与实施流程(见右图)

本流程图隐含了若干理念:一是倡导“基于课程标准的语文教学”,而非基于教科书的教学;二是学习目标源自课程标准,教学是由目标引导的系列学习过程;三是评价设计,应先于教学活动设计(逆向设计);四是实现教学与评价是的整合,将评价镶嵌于教学之中。

2.开发评价工具

表现性评价工具,就是用以测查学生成果或表现的手段。用于表现性评价的工具,包括核查表、表现清单和评分规则(如下图),它们是表现性准则具体化的结果。

核查表又称检核表,是最简单的表现性评分工具。它通常会列出某件成果或某种表现所必须具备的项目(维度、指标、要素),使用时只对项目做“有/无”或“是/否”的判断。它使用简单方便,最适用于基础的表现性技能获得情况。不过它只适用于仅需结论性意见,不能提供针对不同水平的详细说明。

表现清单也称等级量表,是比核查表要稍微精细一点的表现性评价工具。它列出要评价的各个项目、内容和分值,为学生完成任务、教师的指导评分提供指南,而不同分值设置为赋分提供了多种选择。有的表现清单不出现分值,而以“优秀、良好、一般”或“1、2、3”或“A、B、C”的等级或水平。但表现清单的不足就是缺乏对不同表现性水平的详细说明,不同使用者对同一表现或成果,评分评等将会有很大的差异,评价信度就无法得到保证。

评分规则是对表现性任务或成果的评价,是对其完成情况所作的详细的说明与规定。评分规则详细描述了各评分点的规定,并在布置“表现性任务”时一并告知学生,学生在完成任务时,就会利用评分规则检查自己的任务完成情况。对于复杂的表现性任务或成果的评价,评分规则是表现性评价最好的工具。

一般说来,能开发评分规则就能开发核查表、表现清单。如何开发评分规则?课题组经过实践,要制作评分规则 ,就要在注以下几个要素:

1)三种路径

Ⅰ.演绎的方法:自上而下。基本步骤为:

·确定评分的维度(要素/指标)与等级(水平):

·选择评分规则的类型(整体-分项、通用-专用、阶段性-发展性);

·描述各维度不同等级的表现特征;

·为每个质量等级配置表现样例,第一个水平至少两个;

·试用,完善评分规则。

此方法,最适合有较好专业理论素养的个人或团队使用。开发的评分规则,具有较好的连贯性与一致性,但在实用性与可行性上或有欠缺。

Ⅱ.归纳的方法:自下而上。其基本步骤为:

·选取有代表性的学生作业为样例;

·把选出的学生作业分成不同的水平组,并说明分组的依据;

·把分组依据总结为表现的“维度”或重要方面;

·给每个维度下一个客观的定义;

·找出与每个维度的各个评分点相对应的学生表现做样例;

·不断改进评分规则。

此方法经常被用于评价新手(教师、学生)的培训。它可能需要比较长的时间,但对于评分规则的理解与运用,付出时间是值得的。其短处是评分规则在专业学理上易偏于一隅,整体性、连贯性与一致性可能欠缺。

Ⅲ.综合的方法。综合的方法,就是上述两条路径的综合运用:

·查阅在要评定的技能或知识方面很成功的那些人的著作。这会让你对专家和新手的差别有所认识,反过来也会使你发现那些区分不同水平的最重要的因素。(自上而下)

·索取、借用和直接使用现有的评分规则,别人对表现的不同水平的看法会给你灵感。(借鉴)

·选取有代表性的学生作业并把它们分成不同的水平组。说明你分组的依据。这有助于你对不同表现水平的标准有更清晰的认识。(自下而上)

·评定那些被选为样例的学生作业。争取在不同的评分者之间达成一致意见。(样例度评,完善评分细则)

综合的方法,各取演绎、归纳之长,又去彼此之短。

2)维度(要素、指标)的厘定

评分规则要评价的是复杂的技能或成果表现,复杂就意味着不能只从某一个方面去观察评价。维度呈现的是评价对象的核心表现。最重要的路径从语文课程标准导出评价维度,同时还要考虑这些要求:一是彼此区别,即各维度之间能清晰地加以区别;二是共同指向,即所有维度相加能描述对象;三是均被利用,即每个维度都能被用于描述不同水平;四是用户理解,即师生对维度的理解一致;五是维度数量最好不超过5个,其排序也要合逻辑,便于用户理解与实际操作。

3)等级或分值

一个评分规则,设置几个等级(水平)为好?这没有定则,关键是能满足对评价对象的所有不同水平的区分。大多数评分规则使用的是3~6个等级。等级(水平)的命名有多种方式,可以是数字(1、2、3)、字母(A、B、C)或文字(低、中、高)。文字的,又有多种选择:合格、良好、优秀;基础、达标、高级;新手、学徒、高手

附件:

  • 阅读(0)
上一篇: 春日研修兴味长,课题启思收获丰 | 下一篇: 没有了