1 教育部基础教育课程研究曲阜师范大学中心,曲阜 273165;
2 华东师范大学课程与教学研究所,上海 200062
基金项目:本文受教育部“新世纪优秀人才支持计划”、教育部人文社会科学研究青年基金项目(07JC880007)资助
学生学业成就监测是新课程改革的重大研究课题。义务教育阶段新课程全面实施已经4年,检验新课程实施效果已经是迫在眉睫的重大课题,而学生学业成就监测无疑是有效途径之一。中小学生对新课程的适应性如何,其学业成就究竟怎样,等问题亟需澄清。其中,如何开发学业成就评价的整体框架、如何全面客观地评价学生的学业成就,是引起高度关切的社会话题,更是充满挑战性的专业技术问题。本文在研究三大国际性学生评价项目最新进展的基础上,以义务教育阶段的科学领域为例,针对以上问题进行了初步探讨。
一、科学学业成就评价的国际经验
国际学生评估项目(Program for International Student Assessment, PISA)、国际数学与科学趋势研究(Trends in International Mathematics and Science Study, TIMSS)、美国国家教育进展评估(National Assessment of Educational Progress, NAEP)是国际知名的学生评价体系,在运行机制、评价项目、报告形式等方面各具特色,前两者更是因参与范围广、技术含量高、跨国比较性强受到专业研究人员与社会公众关注。PISA是经济合作与发展组织(Organisation for Economic Co-operation and Development, OECD)成员国合作项目,目的是评价15岁学生为终身学习者与建设性公民的准备情况;TIMSS是国际教育成就评价协会(International Association for the Evaluation of Educational Achievement, IEA)组织的数学与科学学习趋势的全球性研究;NAEP则是美国国家教育数据中心(National Center for Education Statistics, NCES)负责运行的全国性评价系统,旨在通过监测学业成就趋势来衡量全国教育目标的达成与否。
(一) 评估体系的整体设计
PISA、TIMSS的评价内容由国际专家合作确定并可以进行跨国比较,NAEP的最大不同是对于全国实践的调适性;PISA对于“课程产出”与科学素养的更多关注是其最大特点,NAEP、TIMSS则关注与学校课程密切相关的学业成就。三大评估体系在评价内容、认知过程、评价框架术语、试题内容、试题形式等方面均有明显差异。①
表 1
表 1 三大评估体系的整体比较②
|
相同点 |
不同点 |
| PISA |
TIMSS |
NAEP |
| 评价目的 |
判断学习结果 |
判断为成人生活(真实世界)做准备所需的基本素养的国际情况;基本素养来源于学科课程,更来自于校外学习。 |
判断数理学科达到课程目标国际情况;评价框架由各国学科内容、教育、测量专家联合开发。 |
判断全国基础教育目标达成度;评价框架与基准由NAGB建立,并集中了政府、教育、商业、公共领域的集体智慧。 |
| 评价对象 |
基础教育阶段学生;取样 |
取样标准是年龄:15岁3个月-16岁2个月;以学校为单位 |
取样标准是年级:4、8年级;以班级为单位 |
取样标准是年级:4、8、12年级;以州、地区为单位 |
| 评价内容 |
数学、科学、背景信息 |
评价阅读素养;有可供选择的模块 |
学校、教师、课程、课堂活动、学生等信息 |
全科(学术性) |
| 评价范围 |
比较研究 |
主要是OECD国家 |
全球 |
美国(分为国家评估、州评估、实验地区评估) |
| 评价周期 |
循环、可纵横比较 |
3年一次、始于2000年;侧重于一种素养 |
4年一次、始于1995年 |
国家评估(数学、阅读2年一次;科学、美国历史4年一次) |
| 评价类型 |
纸笔测试 |
|
30分钟的计算机交互性作业 |
|
| 报告形式 |
内容包括评价准备、设计、过程与结果 |
数学、科学、阅读素养合起来报告,结论主要基于OECD国家 |
数学、科学分年级报告,结论基于所有参与国家 |
分科报告、以地区为单位 |
|
表 1 三大评估体系的整体比较②
|
(二) 科学评估框架
评估框架大都遵照“课程内容+认知水平”的二维设计,但对内容维度、认知水平的具体规定不同;为判断学生为真实生活世界所做准备情况,PISA还特别设计了情境维度,而TIMSS中也设计了科学探究维度。
(三) 题型与题量
三大评估体系基本都根据学生反应类型把题型分为选择——建构反应。这与根据学生认知水平(见表 2中的“认知过程维度”)的类型划分从不同侧面诠释了试题编制蓝图。
表 2
表 2 三大评估体系的科学评估框架比较③
|
PISA |
TIMSS |
NAEP |
| 内容维度 |
知识(Scientific knowledge): 1.物质系统 2.生态系统 3.地球和空间系统 4.科技系统 |
内容领域(Content Domains): 1.物质科学(物理、化学) 2.生命科学 3.地球科学 |
科学内容(Science Content): 1.物理科学 2.生命科学 3.地球与空间科学 |
| 认知过程维度 |
能力(Scientific competencies): 1.识别科学问题 2.科学地解释现象 3.使用科学证据 |
认知领域(Cognitive Domains): 1.知道knowing 2.应用applying 3.推理reasoning |
科学实践(Science Practice): 1.识别科学原理 2.应用科学原理 3.实施科学探究 4.进行技术设计 |
| 情境维度 |
情境(context):和个人、社会、全球有关的健康、资源、环境、危机、科技前沿有关的情境 |
TIMSS设有科学探究 |
|
| 注:与TIMSS2003不同,TIMSS2007中4、8年级的内容领域并不完全相同,这里为表述方便使然,详见表 6。TIMSS2003中的认知领域为Factual Knowledge, Conceptual Understanding, Reasoning and Analysis。NAEP科学实践的四个维度分别对应于四个层次认知要求:“知道是什么”(knowing that)、“知道为什么”(knowing why)、“知道怎么样”(knowing how)、“知道何时何地应用知识”(knowing when and where to apply knowledge),学生要表现出相应认知行为所应该调动的知识类型依次也分为四种:“陈述性知识”(declarative knowledge)、“图式知识”(schematic knowledge)、“程序性知识”(procedural knowledge)、“策略性知识”(strategic knowledge)。 |
|
表 2 三大评估体系的科学评估框架比较③
|
表 6
表 6 TIMSS2007不同内容领域中的目标百分比⑦
| 内容领域 |
4年级 |
生命科学 |
45 |
| 物质科学 |
35 |
| 地球科学 |
20 |
| 8年级 |
生物 |
35 |
| 化学 |
20 |
| 物理 |
25 |
| 地球科学 |
20 |
|
表 6 TIMSS2007不同内容领域中的目标百分比⑦
|
表 3
表 3 NAEP和PISA不同题型的题目数量和百分比④
|
多项选择题 |
简答题 |
扩展的开放性回答 |
| 要求证明的开放性回答 |
具有多种答案的开放性回答 |
|
百分比 |
题目数量 |
百分题 |
题目数量 |
百分比 |
题目数量 |
百分比 |
题目数量 |
| NAEP |
50 |
98 |
7 |
13 |
22 |
43 |
21 |
41 |
| PISA |
60 |
21 |
17 |
6 |
6 |
2 |
17 |
6 |
|
表 3 NAEP和PISA不同题型的题目数量和百分比④
|
表 4
表 4 不同科学领域内NAEP与PISA试题的题目数量和百分比⑤
|
NAEP(195道题目) |
PISA(35道题目) |
| 百分比 |
题目数量 |
百分比 |
题目数量 |
| 地球科学 |
土壤 |
18 |
35 |
3 |
1 |
| 水 |
3 |
6 |
9 |
3 |
| 空气 |
6 |
11 |
29 |
10 |
| 地球空间 |
5 |
10 |
11 |
4 |
| 合计 |
32 |
62 |
43 |
15 |
| 物理科学 |
物质及其转化 |
14 |
27 |
17 |
6 |
| 能量及其转化 |
7 |
13 |
9 |
3 |
| 运动 |
12 |
24 |
14 |
5 |
| 合计 |
33 |
64 |
37 |
13 |
| 生命科学 |
变化和进化 |
14 |
20 |
3 |
1 |
| 细胞及其作用 |
10 |
7 |
9 |
3 |
| 有机体 |
12 |
20 |
17 |
6 |
| 生态学 |
10 |
24 |
6 |
2 |
| 合计 |
35 |
69 |
34 |
12 |
| 注:表格中百分比和题量总计不一定等于总数。因为NAEP和TIMSS-R的小部分题目及PISA的许多题目,可能不止归入一个主题或次主题,有的题目也可能不属于其中的任何一种。例如,在同一主题内,一道题目可以划分为2个不同的次主题,这时,这道题在次主题内按2次计算,但在主题内则按1次计算(原文作者)。 |
|
表 4 不同科学领域内NAEP与PISA试题的题目数量和百分比⑤
|
表 5
表 5 TIMSS2007不同认知领域中的目标百分比⑥
| 认知领域 |
百分比 |
| 4年级 |
8年级 |
| 知道(Knowing) |
40 |
30 |
| 应用(applying) |
35 |
35 |
| 推理(reasoning) |
25 |
35 |
|
表 5 TIMSS2007不同认知领域中的目标百分比⑥
|
下面以TIMSS2007技术报告为例,重点说明不同题型、不同内容领域、不同认知水平的试题在整个科学评估系统中的分配情况(表 7、8、9)。
表 7
表 7 TIMSS2007科学评估中不同类型试题的题量与分数分布情况⑧
| 试题类型 |
试题数量 |
| 新题目(2007新增) |
老题目(2003保留) |
总数 |
总分数 |
分数的百分比 |
| 4年级 |
多项选择题 |
53 |
40 |
93 |
93 |
48% |
| 建构型题目 |
45 |
36 |
81 |
101 |
52 |
| 总数 |
98 |
76 |
174 |
194 |
100% |
| 8年级 |
多项选择题 |
56 |
51 |
107 |
107 |
45% |
| 建构型题目 |
64 |
43 |
107 |
133 |
55 |
| 总数 |
120 |
94 |
214 |
240 |
100% |
|
表 7 TIMSS2007科学评估中不同类型试题的题量与分数分布情况⑧
|
表 8
表 8 TIMSS2007科学评估4年级不同内容领域中各种试题的题量分布情况⑨
| 内容领域 |
多项选择题 |
建构型试题 |
总数 |
| 生命科学 |
42 |
32 |
74 |
| 物质科学 |
35 |
29 |
64 |
| 地球科学 |
16 |
20 |
36 |
| 总数 |
93 |
81 |
174 |
|
表 8 TIMSS2007科学评估4年级不同内容领域中各种试题的题量分布情况⑨
|
表 9
表 9 TIMSS2007科学评估4年级内容领域与科学探究中不同认知水平试题的分数分布情况⑩
| 内容领域 |
认知领域 |
总分 |
分数比例 |
科学探究的分数 |
| 知道 |
应用 |
推理 |
| 生命科学 |
41 |
31 |
13 |
85 |
44% |
3 |
| 物质科学 |
24 |
23 |
20 |
67 |
35% |
24 |
| 地球科学 |
24 |
14 |
4 |
42 |
21% |
6 |
| 总分 |
89 |
68 |
37 |
194 |
|
33 |
| 分数比例 |
46% |
35% |
19% |
|
|
17% |
| 注:表 5是规划比例,表 9是实际比例。内容领域规划分别是45%、35%、20%,实际为44%、35%、21%;认知领域规划分别是40%、35、25%,实际为46%、35%、19。可以看出,除了在推理水平上相差较大(6&)外,规划与实际差别不大。 |
|
表 9 TIMSS2007科学评估4年级内容领域与科学探究中不同认知水平试题的分数分布情况⑩
|
(四) 三大评价项目科学评估的经验
1.评估框架的研制与发布
由独立的专业评价机构组织,评估框架汇集了大量测量专家、学科专家、课程专家、一线教师等的集体智慧;提前公布评估框架,广泛征求广大研究者的专业建议,为评估框架修订预留足够空间;同时期待社会公众的积极反馈,应对社会问责。NAEP2009科学评估框架于2006年初颁布,预留3年时间,TIMSS2011框架于2009年9月颁布。反观我国义务教育科学课程学业成就评价框架几乎是未经公示就直接进入实测阶段,这不能不说是对国际惯例的忽视。
2.重视认知发展、教育测量与评价理论的指导
重视认知心理学的支撑作用,积极吸收认知目标分类的研究成果;测量专家高度参与评价框架开发,在与学科内容专家、课程专家、有经验的一线教师的合作中,为学业成就监测框架的开发提供专业支持。
3.评估框架开发技术
从“课程内容+认知水平”2个维度开发评价框架,注重学习内容与学习目标水平的交叉;能更好地设计评估框架、指导试题编制实践,更能为课堂教学提供新思路。PISA更是增加了情境维度,从三维视角来开发科学评估框架。
4.评价技术与方法革新
引进新型评价手段,如计算机交互性作业等,注重与传统纸笔测试相结合;编制新型试题,如开放型试题、建构型试题等,重视高级思维能力培养与评价。
5.评价样例开发与反馈信息收集
大量开发评价试题样例并提前公布,使将要参加评价的师生等有足够的了解与应对时间;杜绝了“防教师”、“防学生”的评价偏执倾向;同时可以收集更多的反馈信息,以便及时调整评价工具。
6.学业成就比较与解释的多样化途径
采取“纸笔测验+问卷调查”,注重背景信息调查;探寻不同背景的学生群体之间学业成就差异解释的别样路径,也能为不同亚群体的相关分析与比较研究提供研究视角。
二、义务教育科学学业成就评价开发的整体设想
(一) 框架设计理念
科学教育的宗旨是培养学生的全面科学素养。《全日制义务教育科学(3~6年级)、(7~9年级)课程标准(实验稿)》、义务教育阶段的分科科学课程标准是开发4、8年级科学学业成就评价框架的依据。现行各科国家课程标准中,对学生通过完成规定的课程、教学内容和活动所应获得的学习成果等未明确描述。既没有对学生的学习行为进行具体描述,同时也没有制定出与行为目标相对应的表现水平标准,因而不能直接将课程目标用来作为学生学业评价(特别是纸笔考试)的测量目标。而制定相应科目的学业成就评价标准,是对课程标准的进一步补充和完善,同时会进一步促进课程标准、教学评价的完善。
不但要评估学生对双基的掌握情况,还要评估其实际问题解决能力以及终生学习所必需的知识与技能。因此,测评体系制定与工具开发时,应把基础知识技能和有关STS情境问题融合起来。我国提出STS教育理念由来已久,但STS情境具体涵盖哪些方面还没有明确阐述,如何把知识和情景结合也没有参考标准,目前考试题目依然根本没有走出“重知识、轻能力”、“从书本来到书本中去”的模式。可以参考PISA2006科学评估经验设置问题情境。
表 10
表 10 PISA科学评估中的问题情境⑪
|
个人的(个人、家庭和同伴) |
社会的(社区) |
全球性的(全世界的生活) |
| 健康 |
维持健康、事故和营养 |
控制疾病、社会传染食物选择和社会健康 |
流行病和传染病的传播 |
| 自然资源 |
个人物质和能量的消费 |
维持人口、生活质量、安全、生产和食物分配和能量供应 |
可再生和不可再生资源、自然系统、人口增长和物种可持续利用 |
| 环境 |
环境友好行为、物质的利用和处理 |
人口分布、废物处理环境影响和当地气候 |
生物多样性、生态平衡、人口控制、土壤的再生和流失 |
| 危害 |
自然和人类导致的关于建房的决定 |
快速变化(地震、恶劣气候)、慢而渐进的变化(海岸侵蚀、地表下降)危险评估 |
其后的变化和现代战争的影响 |
| 科学和科技前沿 |
科学解释自然现象、基于科学的业余爱好、运动和娱乐、音乐和个人技术的兴趣 |
新型物质、设备和过程、基因修改、武器技术和运输 |
物种灭绝、空间探索、宇宙的起源和结构 |
|
表 10 PISA科学评估中的问题情境⑪
|
(二) 整体评价框架
义务教育阶段科学学业成就评价是大规模的外部评价。应针对全国范围内义务教育阶段关键学年的学生进行取样,获取他们在科学课程中的整体学习情况,从而给国家科学教育提供决策参考。整体框架初步设想如下:
表 11
表 11 义务教育阶段科学学业成就评价框架设想
| 评估目的 |
外部评价,了解义务教育阶段学生的基本科学素养,为改进新课程科学教育提供反馈、为教育决策提供支撑 |
| 组织者 |
权威专业评价机构组织,学科专家、测量与评价专家、课程专家、教学专家与一线教师共同开发 |
| 评估对象 |
义务教育阶段全体4、8年级学生 |
| 评估周期 |
每三年一次,每次以生命科学、物质科学、地球宇宙与空间科学其中一门为重点评估内容 |
| 评估方法 |
纸笔测验+实践考查+调查问卷 |
| 抽样方法 |
分层抽样(抽样层级与顺序:目标群体限定、国家样本、省直辖市样本、地市样本、学校样本) |
| 报告形式 |
分科、以地区为单位(不排名),对历年评估结果进行比较研究,也可与所参加其它国际评价项目的结果比较 |
| 注:实践考查主要评价学生的实验操作能力、设计能力、科学探究能力、问题解决能力等;调查问卷主要收集2方面信息,一是背景信息,包括性别、年级、课程、教师、所在地区、学校类别、家长受教育程度、家庭收入情况等,二是科学基本素养调查,包括科学兴趣、科学态度等。 |
|
表 11 义务教育阶段科学学业成就评价框架设想
|
义务教育学生科学学业成就评价可由独立的权威性专业机构来组织。由于我国人口众多,不可能对每一个八年级学生都进行测评,所以宜采用分层抽样的方法。进行评价的目的不是对学生个体成绩进行比较,也不是对学校进行排名,而是把评价对象作为一个群体或亚群体(具有相似背景的学生可以划为一个亚群体)进行全面评估,为国家提供描述性信息,作为课程决策的科学依据。评估方法除了进行传统的笔试之外,还可以借鉴NAEP进行实践考查,借鉴PISA进行背景问卷调查,以全面了解影响学生学业成就的因素。而进行周期性评估可以进行横向和纵向比较,发现不足之处,进而改善课程与教学。
(三) 评价维度
综合评价框架开发的国际经验,根据布卢姆认知目标分类及修订版以及其它教育目标分类研究成果,结合我国理化生、科学课程等初高中课程标准中的目标水平,确定过程维度;并把它分为认知过程、技能习得、情感养成3个二级维度,又分别限定了二级维度的不同学习水平。根据《全日制义务教育科学(3~6年级)、(7~9年级)课程标准(实验稿)》确定内容维度,也可进一步开发二级、三级维度。
表 12
表 12 科学学业成就评价的维度
|
内容维度 |
| 生命科学 |
物质科学 |
地球、宇宙和空间科学 |
科学探究 |
科学、技术与社会的关系 |
| 过程维度 |
认知过程 |
记忆 |
|
|
|
|
|
| 理解 |
|
|
|
|
|
| 应用 |
|
|
|
|
|
| 分析 |
|
|
|
|
|
| 评价 |
|
|
|
|
|
| 创造 |
|
|
|
|
|
| 技能习得 |
模仿 |
|
|
|
|
|
| 独立操作 |
|
|
|
|
|
| 掌握 |
|
|
|
|
|
| 迁移 |
|
|
|
|
|
| 情感养成 |
感受 |
|
|
|
|
|
| 认同 |
|
|
|
|
|
| 形成 |
|
|
|
|
|
| 表现 |
|
|
|
|
|
|
表 12 科学学业成就评价的维度
|
三、科学学业成就评价的试题编制
(一) 试题编制模型的开发
根据Gale H. Roid与Thomas M. Haladyna的学习目标与试题模型,结合布卢姆认知目标修订版,可以初步开发出三维试题编制模型(图 2,仅以认知领域展示)。三个维度分别是内容维度、过程维度、反应类型维度。⑫其中,内容维度可以参照不同的学科课程标准进行细化(也可参考布卢姆认知目标修订版分为事实性、概念性、程序性、元认知知识;Roid等分为了事实、概念、原理),根据试题答案的产生方式把反应类型分为选择与建构反应,而认知过程维度则分为记忆、理解、应用、分析、评价、创造等6种水平。
三维模型的使用方法如下:任取空间一点M(Xn, Yn, Zn),就代表某一道试题。其中Xn代表该试题对应的内容标准,Yn代表该试题所对应的认知水平,Zn则代表该试题的类型。
布卢姆认知目标分类学建立于心理学领域内,这也决定了其局限性:通过不可观察的智力过程(intelligence processes)的形式来表述学习目标,而不是通过给学习者呈现的可观察的任务特征来表述。Seddon的研究也显示了,大约只有35.5%的研究者认为布卢姆认知目标分类学能够很好地用以对题目类型进行划分,而其余大部分被调查者都觉得,布卢姆认知目标分类方法很难在命题实践中直接运用。⑬其次,布卢姆认知目标分类主要用于题目的回顾性分析,题目一旦编制完成,可以运用目标分类学对题目进行分类。但并未给测验与试题编制者提供更多指南,帮助他们去选择内容、以及把内容转化为测量各种思维的试题。三维模型在一定程度上可以克服其局限性。
(二) 试题编制框架与细则开发
课程开发中有三个核心关键词,即“课程标准”、“表现标准”、“评价标准”。这三个关键词涉及的一个核心问题就是:如何从国家层面的“课程标准”演化到学生学习层面的“表现标准”,再如何由学生学习层面的“表现标准”丰富为指导评价实践的“评价标准。⑭
1.试题编制框架
2.试题编制细则
试题编制可以分为5个步骤:确定评价内容、确定认知要求、开发表现期望、细化表现期望、编制具体试题。第一步是从横向上确定评价的广度,即评价什么;第二步是从纵向上确定评价的深度,即评价到什么水平;第三步是根据纵横的广度与深度两个维度交叉,制定出具体的二维矩阵,梳理出评价标准;第四步是根据评价标准,来细化评价标准的层次(等级)与赋分情况,并给出案例;第五步就是根据细化后的评价标准来编制试题。
3.不同认知过程水平的样例开发
表 13
表 13 不同水平的认知过程案例⑮
| 维度及次类目 |
解释或案例 |
| 认知过程维度 |
记忆(remember) |
识别(recognizing):判断是否一致或相似。如,判断酸雨成因、物种类别。 回忆(recalling):根据指令,从长时记忆中提取信息。如,写出二氧化碳的电子式。 |
| 理解(understand) |
解释(interpreting):将一种表征形式转化为另一种表征形式。如,图画到文字(看图作文、科学实验装置解释)、数字到文字(数学解释)。 举例(exemplifying):识别某个一般原理或概念的特征并能据此选择或建构例子。如,知道氧化还原反应总伴随着化合价的变化,并据此能在几个化学反应中找出哪些属于氧化还原反应或能举例。 分类(classifying):区分出某事物(事例)属于某一类别(或概念、原理)。如判断某一化学反应既属于氧化还原反应又属于化合反应。 总结(summarizing):从所给具体信息中抽象概括出一般主题。如,把几个化学反应归于同一类别。 推断(inferring):从一系列事例中发现模式。如,归纳出一组数据的代表式、归纳出一系列化学反应的相同点。 比较(comparing):查明两个或两个以上的客体、事件、观念、问题和情境等之间的异异同。如,电路与管子中的水流、宏观运动物体与核外电子运动。 说明(explaining):能够建模或运用因果模式。如,运用欧姆定律说明当电路中增加一节电池时电流速度有何变化。 |
| 应用(apply) |
执行(executing):执行一套程序,解决熟悉的任务。如,根据牛顿第一运动定律解题。 实施(implementing):选择与运用一个程序完成不熟悉的任务,学生必须理解所遇的问题类型和程序的应用范围。如,选择最经济的金融套餐来购买一辆汽车等“开放性问题”。 |
| 分析(analyze) |
区分(differentiating):根据适当性或重要性来辨析某整体结构中的各个部分,它与“比较”不同。如,在水果这一背景下区分苹果与橘子、在化合物背景下区分甲烷与硫酸铜。 组织(organizing):鉴别材料或情境的成分并识别它们是如何组成一个内在一致的结构。如,学会按四部分结构(假设、方法、数据、结论)来分析研究报告。 归属(attributing):确定交流材料中的观点、价值和意图等。如,确定一篇关于人类学习的论文是行为主义者还是认知心理学家撰写的。 |
| 评价(evaluate) |
核查(checking):检查某操作或产品的内在一致性或谬误。如,判断科技论文中的结论是否真正建立在数据的基础上。 评判(critiquing):根据外部准则或标准来判断某操作或产品。如,根据酸雨的可能后果及其社会成本来判断酸雨的是非区直。 |
| 创造(create) |
生成(generating):表征问题与提出符合特定标准的假设或可能路途。如,解释某一化学实验现象的可能原因、建造一个高效防火的建筑需要考虑的设计因素。 计划(planning):开发出一个问题解决方案。如,设计一套实验室制取硫酸的工艺程序。 贯彻(producing):执行计划来解决既定问题。如,自行设计工艺来进行实验室制取硫酸。 |
| 注:限于篇幅只提供了样例开发思路,可据此进一步开发出测试同一内容与目标水平的不同类型的例题,以及评分标准等。 |
|
表 13 不同水平的认知过程案例⑮
|
(三) 试题质量保障工具开发
1.表现标准开发
以《全日制义务教育化学课程标准(实验稿)》中“认识燃烧的条件及防火灭火的措施”的课程内容为例,可以开发出如下的表现标准(学业成就评价标准)。
表 14
表 14 内容标准界定与表现标准开发
| 内容标准 |
表现标准(内容标准与认知水平的二维交叉;笔者根据初中化学课程标准编制) |
| 五(一)2:认识燃烧的条件及防火灭火的措施。 |
①知识与技能维度。燃烧条件:物质本身是可燃物、温度达到着火点、与氧气接触;灭火原理 ②过程与方法维度。高级思维水平:从各种事实中提取信息与分析信息、综合学科内容(信息)、评价解决方案等;问题解决能力:对救火、灭火、防火等具体问题及一般问题的应对能力 ③情感态度价值观维度。学生的社会认知目标:基本的社会安全常识与火灾自救知识 |
|
表 14 内容标准界定与表现标准开发
|
2.试题编制实例
柳州市融水县鼓楼屯全部是连片式木质房屋,今年4月3日下午发生120年未遇的特大火灾。请回答下列问题(柳州2006中考):
(1) 发现火势较大,有蔓延的可能,应马上打什么电话号码报火警?
(2) 如果你是救火现场指挥者,从灭火的原理考虑,应将灭火人员至少分成两支队伍开展工作,布置他们做什么?并请解释原因。
(3) 如果你被困在火灾区里,应采取哪些自救措施?请说出其中两点。
(4) 如果你是灾后重建的设计者,重建房屋时,为防止再次发生特大火灾,应注意的问题之一是什么?
3.基于课程标准的试题分析工具
评估文本(试题编制指南、试卷与试题等)必须与国家课程标准相匹配,这样才能保证学业成就评价是基于课程标准的测查。⑯遵循“课程目标+目标要求”设计了试题分析二维工具。其中,“课程目标”维度主要参照《全日制义务教育科学(3~6年级)、(7~9年级)课程标准(实验稿)》(其它学科亦然)关于三维目标的规定;而“目标要求”主要参照《全日制义务教育化学课程标准(实验稿)》(物理课标类似)对学生学习目标的行为限定。
表 15
表 15 基于课程标准的试题质量判断
|
目标要求(学习结果的复杂性水平) |
| 认知性学习目标 |
技能性学习目标 |
体验性学习目标 |
| 知道/记住/说出/列举/找到 |
认识/了解/看懂/识别/能表示 |
理解/解释/说明/区分/判断 |
|
|
| 课程目标 |
知识与技能 |
1:知道/说出 2:记住3:列举 |
3:了解 |
2:解释 4:判断 |
|
|
| 过程与方法 |
|
|
2:问题解决 4:问题解决 |
|
|
| 情感态度价值观 |
|
|
|
| 注:阴影部分为课程目标与目标要求重合区域,其中填写文字为认知领域与三维课程目标重合区域。1、2等为题号,下同。 |
|
表 15 基于课程标准的试题质量判断
|
4.基于布卢姆认知目标的试题分析工具
对于某题目M,其反应类型是确定的(当然也可以编制成其它题型),若M对应了多种类型的知识(x)与多个水平的认知过程(y),则该题表示为M(x, y)。如2(2, 3)、4(3, 2)。
表 16
表 16 基于布卢姆认知目标分类修订的试题质量判断
| 知识维度 |
认知过程维度 |
| 记忆 |
理解 |
应用 |
分析 |
评价 |
创造 |
| 事实性知识 |
1:识别119火警 2:回忆灭火原理 |
|
1:拨打报警电话 3:火灾自救措施 |
|
|
|
| 概念性知识 |
|
|
|
|
|
4:设计方案 |
| 程序性知识 |
|
2:解释分组缘由 |
2:应用灭火原理 |
4:应用原理分析、评价方案 |
|
| 元认知知识 |
|
|
|
|
4:认知监控 |
|
|
表 16 基于布卢姆认知目标分类修订的试题质量判断
|
对比我国《全日制义务教育化学课程标准(实验稿)》对认知性学习目标三级水平规定,以及布卢姆认知过程维度6级水平规定,可以看出:第一,认知性学习目标的最高水平横跨了从“理解”到“判断”5个行为动词,这对应了布卢姆认知过程维度的“理解”、“应用”、“分析”、“评价”的4个水平。第二,而布卢姆认知目标分类的“创造”水平,则很难在初中化学课程标准中找到相应的认知性学习目标(但《普通高中化学课程标准(实验)》中有“设计”、“解决”等认知性学习目标)。