文章快速检索     高级检索
  华东师范大学学报(教育科学版)  2013, Vol. 31 Issue (2): 36-41  
0

引用本文  

杨九诠. 综合素质评价的困境与出路. 华东师范大学学报(教育科学版), 2013, 31(2): 36-41.
Yang Jiuquan. The Challenge and Solutions of the Development on Whole-Person Quality Assessment. Journal of East China Normal University (Educational Sciences), 2013, 31(2): 36-41.
综合素质评价的困境与出路
杨九诠     
中国教育科学研究院,北京 100875
摘要:“综合素质评价”是新世纪基础教育课程改革尤其是新课改语境下中高考改革的重要内容。但实施以来,总体上不尽如人意。其困境在于:政策文本中,“综合素质评价”概念的内涵和功能尚处在犹豫未决状态,从而造成了羸弱而尴尬的局面;生存发展的条件严重不足;尚未进入真正的教育评价领域,缺乏属于自己的评价理论和方法等。评价出路在于:进一步加大政策研究和制度建设的力度;以高考制度改革为矛盾的主要方面,营构综合素质评价健康可持续发展的基础环境;将综合素质评价归置到表现性评价范畴,以“个性”与“发展”为取向,以质性评价为方法,建立与综合素质评价属性、价值与功能相适应的评价体系、机制和文化。
关键词综合素质评价    政策    生态位    表现性评价    
The Challenge and Solutions of the Development on Whole-Person Quality Assessment
Yang Jiuquan

“综合素质评价”是新世纪基础教育课程改革尤其是新课改语境下中高考改革的重要内容。但实施以来,总体上不尽如人意。与中高考“软挂钩”“假挂钩”的现象普遍存在。“综合素质评价”如何走出困境,真正发挥其预期的“支起一柄伞撑起一片天”的突破性作用,进一步深化课程改革、推进素质教育,是亟待解决的重要议题。

一、政策检视:尚处于愿景状态和探索初阶

“综合素质评价”,首先是教育政策术语,其作为教育评价概念以及教育实践的一方面,均衍生于此。2002年,教育部颁布了《关于积极推进中小学评价与考试制度改革的通知》(教基[2002]26号),第一次提出“基础性发展目标”的概念,并分“道德品质”“公民素养”“学习能力”“交流与合作能力”“运动与健康”“审美与表现”6个方面作了具体表述。综合素质评价政策的出台,直接与新世纪基础教育课程改革相关联。《国家基础教育课程改革实验区2004年初中毕业考试与普通高中招生制度改革的指导意见》(教基厅[2004]2号),要求加强“初中毕业生综合素质评价”,指出:“综合素质评价的内容应以《通知》中提出的道德品质、公民素养、学习能力、交流与合作、运动与健康、审美与表现等六个方面的基础性发展目标为基本依据。”由此看来,“综合素质评价”与“基础性发展目标”差不多就是一回事了。这是国家文件第一次提出“综合素质评价”的概念。《关于做好2007年普通高等学校招生工作的通知》(教学[2007]1号)专就新课程实验省份提出“要逐步建立并完善高中学业水平考试和综合素质评价制度”。《关于2007年高等学校自主选拔录取改革试点工作的通知》(教学厅[2006]11号)在要求考生提供相关材料时特别注明:“高中新课程实验省区应提供高中学生综合素质评价材料。”《关于普通高中新课程省份深化高校招生考试改革的指导意见》(教学[2008]4号)要求:“建立和完善对普通高中学生的综合评价制度,并逐步纳入高校招生选拔评价体系。”在文件涉及新课程实验地区之前,一般用“综合性的评价”、“综合评价”等概念,甚至像“教学[2007]1号”文件中,对非新课程实验地区提出的是“综合素质的考查”,而对新课程实验地区则提出“综合素质评价”,可见对“综合素质评价”这一概念的慎用或者说惜用。这说明政策对这一概念有着基于新课程改革语境的内涵和价值的诉求和期待。

但是,政策层面的综合素质评价理念尚处在愿景形态和初步探索阶段。其一,其内容一直处在不断补弱和补缺的过程中。2007年以来,出台了八份文件,要求将初中体育成绩、志愿服务活动、实验操作考核、“体育、艺术2+1项目”、中小学社会实践活动、每天一小时校园体育活动、学雷锋活动等计入综合素质评价中。前后通览这八份文件之间的关系,并非计划性的“按部就班”,而是比较随机的“即时应景”。其二,其评价方式采用的基本是与之并没有紧密效度关联的等第鉴定方法,甚至可以说还是传统的操行等第的形式;也因此政策将综合素质评价工作主要赋予为班主任的职责和任务,人们也容易将“德育与综合素质评价”合并考虑。所以如此,是因为综合素质普遍地内容条目化,评价表格化。显然,条目不能深刻反映学生综合素质的内涵,表格不能准确反映学生综合素质的水平;综合素质的丰富性被单一化,生动性被刻板化,深刻性被浅表化。其三,其概念表述犹豫不定。如“高中阶段课程成绩、学业水平考试和综合素质评价情况,以及获奖、特长等证明及写实性材料”,将“获奖、特长等证明及写实性材料”区别在“综合素质评价”之外显然是有问题的,而同年的另一份文件就有“综合素质写实”的表述,基础教育司2007年编制的《基础课程改革实验区中考改革情况调查问卷》也将获奖励情况纳入综合素质评价的主要内容。将“课程成绩、学业水平考试”和“综合素质评价”并列区分是适宜的,但从全国情况看,地方政策基本上都是将日常学习评价、学业水平考试一并放到综合素质评价中,并将成绩转换为等级合并入“综合素质评价表”。这是一个值得思考的现象。综合素质总体偏软,难以实实在在把握,将学科成绩纳入其中,就像是给本来偏软的综合素质衬上了“硬”里子,似乎增加了可操作性。然而,综合素质评价与学科成绩,在理论依据、政策要求和实践操作中属于不同品类的评价,两者打成一个包裹,看似填充了“硬料”,其实从本来的政策要求和期许看,综合素质评价反倒因此失真了。所以如此,可能的原因之一是将政策中的“学习能力”混同于“学业成就”或“学业水平”了,这其实是存在较大差异的不同概念。原因之二是利于“算总账”以便于招生录取工作。但是,真正的综合素质评价那一块区分度不大,实际用于招生工作解释和使用的还是学业成绩那一块。另外,学业考试是大规模标准化考试,如果将综合素质评价合并其中,就招生工作对结果的解释和使用来说,实际上就赋予综合素质评价以大规模标准化考试的实质和功能,这既不符合综合素质评价本身的特质和属性,也不符合政策对综合素质评价原本的期待。

从政策层面看,综合素质评价尚处在“气血未定”的状态。但是,政策作为顶层设置,是指令性或指导性的,必须具有必要的“硬度”。这就造成了综合素质评价以“气血未定”之身而使“气血方刚”之力的羸弱而尴尬的局面。但是我们认为,基于教育改革和课程改革的迫切需要,还是应该抱持“有胜于无”的态度,予以理解、支持和不断探索。也应该看到,国家层面这几年一直关注于此,《教育部基础教育二司2012年工作要点》提出:“推进评价制度改革。启动中小学教育质量综合评价改革试点,探索建立包括品德素养、学业水平、身心健康、学习兴趣、学业负担等因素构成的中小学教育质量绿色评价指标体系,扭转长期以来单一以学生学业成绩衡量学生发展、以升学率评价教育质量的现状,引导政府、社会和学校树立科学的教育质量观和正确的政绩观。”这是值得期待的一项重要也是重大的工作。

二、生态位营构:建设健康发展的基础环境

从实际情况看,综合素质评价与招生之间普遍存在着“假挂钩”“软挂钩”现象,究其因由,非常复杂。我们这里引入“生态位”的概念。生态位(ecological niche),又称小生境或生态龛位,是指一个种群在生态系统中可持续生存的最小环境。基于综合素质评价“生态位”的结构性要素,我们可以也应该作如下努力和期许,不断优化综合素质评价的基础环境。

其一,加大高考改革力度。首先强调高考,是因为就综合素质评价的生态位来说,高考在其小生境的相关要素中处于矛盾主要方面,起着控制和引导作用。教育部召开的1998年中考语文考试改革试点工作总结会议就提出“如何正视高考对中考的影响”的问题。事实也是这样,在“应试教育”语境中,中考不得不附庸于高考,成为由高考统率的“应试教育”体系中的重要一环。高考改革不到位,综合素质评价要形成整体性、系统性的突破,几乎是不可能的。令人欣慰的是,《教育规划纲要》专章对考试招生制度改革制定了规划。《国家教育事业发展第十二个五年规划》在第十一条“改革考试招生制度”中更加具体指出:“推进高等学校考试招生制度改革……将高中学业水平考试和综合素质评价有机纳入高等学校招生选拔工作。”《教育部2012年工作要点》已将“研究高考改革重大问题,制定发布改革方案”列为重要任务。我们认为,改革的方向应该是加大普通高校自主招生的力度。现在自主招生试点高校本就有限,且自主招生名额也只放到5%。统一招生制度,必然依赖基于常模的大规模标准化考试,综合素质评价只能处理为最基本的“入闱”条件,而当差不多人人可以“入闱”时综合素质评价的价值和作用也就差不多给消解殆尽了。政策要求自主招生高校要“结合办学目标和专业特色”积极探索多元化评价方法,“着力完善高校自身的综合评价体系”。只有招生的需求个性化、标准多样化,综合素质评价才有可能发挥自己独特的优势。而高校招生制度的改革,对整个基础教育阶段综合素质评价将会实质性地发挥一以贯通的关键作用。

其二,普通高中特色化建设对中高考改革及综合素质评价起着关键作用。《教育规划纲要》要求“推动普通高中多样化发展”“鼓励普通高中办出特色”。我们期待普通高中多样化发展、特色化建设发展到一个较高的水平,使中高考招生的单一标准逐步转为差异性标准,使单向选拔逐步转为双向选择。当前普通高中普遍存在“千校一面”“万人一面”的突出问题。从生态位的观点看,这一突出问题,主要是受制于高考的统一同时更是单一的考试及招生的标准和方式。我们相信,普通高中多样化发展、特色化建设,必然能够推进人才培养模式多样化,满足不同潜质学生的发展需要;到这个时候,综合素质评价的价值、地位、功能,也就凸显出来了,从而一方面推进普通高中多样化发展、特色化建设,一方面满足普通高中和普通高校招生制度改革的需求。

其三,职业教育大力发展达到一定的水平,也能够直接推动中高考改革,直接促进综合素质评价形成突破、健康发展。职业教育,尤其是中职中专,与中考有着直接的关系,是中考生态位的极为重要的关联性要素。中职中专,是学生完成义务教育阶段学习之后重要的分流方向。然而,中考与中职中专招生构成的是负相关关系,也就是所谓的“中考失利的出路:可选职业高中, 中专技校”。中考的综合素质评价,到了中职中专,连“入闱”的“软挂钩”都不必了,直接就是不挂钩了。中职中专,在社会的普遍看待中,主要还不是重要的教育类型,更像是高中教育的一个层次——相对于普通高中来说的次一级层次。如果职业教育取得全面的高质量的发展,真正成为与普通高中地位比肩的重要的教育类型,进而能够与普通高中一道参与构建与中考学生之间的选拔-选择的双向关系,那么,综合素质评价的天地将会更加广阔——须知,职业教育因其自身优势,人才培养目标和模式更加丰富,不宜过度依赖常模考试反而更加适宜彰显特长个性的综合素质评价。

三、评价学界定:归置于表现性评价范畴

“综合素质评价是一种‘表现性评价’。”这一归类非常必要,从而将综合素质评价归置于严格的教育评价的某一类别。现实运用中,综合素质评价显得过于粗简,往往是在“道德品质”等六个维度下分别列出若干指标,对每一个指标给出A、B、C、D的等级。说白了,给出的也只能是“印象分”。总的看来,综合素质评价的功能和价值没有能够很好地发挥出来。甚至可以说,现实中综合素质评价与招生工作的“软挂钩”,倒也是与其实际效能相匹配的策略;因为综合素质评价确乎缺乏属于自己的“硬度”,在这样的情形下,“软挂钩”事实上降低了政策实施的难度和风险,当然综合素质评价应有的功能和价值也就因此而大大缺损和贬损。关于表现性评价的介绍和讨论已经很多,这里不再赘言。我们这里基于表现性评价,简要讨论中考和高考改革中综合素质评价的功能和作用以及综合素质评价的方法。

(一) 综合素质评价的功能和作用

基于中高考改革的要求,综合素质评价应发挥“两张筛子”的功能和作用。

第一张筛子,指向群体,看的是筛子筛下的部分,更倾向“基础性发展目标”的“基础性”,依据相对统一性的指标,以基本过关为要求,从而成为中考录取“入闱”的初始门槛之一。现行综合素质评价的功能和作用,基本上属于这张筛子,也可以说基本上局限于这张筛子。这张筛子,因为要经过网眼的过滤,倾向于标准性,适合大规模,强调效度的同时也强调信度。要尽可能确保效度和信度,编织网眼的指标体系的内容和结构就显得尤为重要。应该说,现行各地“基础性发展目标”的维度及其指标基本上能够满足这一要求。但为什么还是不能那么取信于人呢?原因是:其一是缺乏过程性呈现。过程性呈现需要成长记录的描述,而成长记录的描述需要兼及日常表现和关键事件表现,只有这样,给出的等级才是表现性评价,而不只是笼而统之的“印象分”。其二是普遍受到学业成绩“晕轮效应”的影响。由于学业成绩在中高考中事实上的主导作用,综合素质的等级评定总是受到学业成绩的影响,也就是“印象分”的“印象”往往源于学业成绩。其三是人们习惯用学业成绩评价方式来要求综合素质评价。学业成绩评价与综合素质评价的内容、目标、标准以及功能和作用有很大区别,但在“应试教育”影响下,人们往往只相信学业成绩的分数。其四是少了另一张筛子,大大削弱了综合素质评价的功能和作用,甚至给人们可有可无的感觉。

第二张筛子,指向个体,看的是筛子里留下的部分,更倾向“基础性发展目标”的“发展”,注重个性和潜质。个性和潜质往往别出于标准之外,也就无所谓常模,所以只关注效度不关注信度。筛子里留下的,不是“比”出来的,而是“逸”出来的——“比”,总得有标准可依,而“逸”透出的则是别致新颖、意料之外的意味,让人想到“逸品”“逸趣”“逸闻”这类词;“比”对选择者来说,主要是从旁观看你们比试,而“逸”对选择者来说,既是主动探寻又是不期而遇,是捕获和对话。每位学生都是“这一个”,人类的“不确定性”的本质赋予了他不可复制的独特性,他的志趣相对其他人可能是“逸趣”,他的所作所为相对其他人可能是“逸闻”——成长记录袋法强调轶事亦即逸闻的记载,正是期待于此。但是在“应试教育”语境中,标准化成为教育的体制性特征,驱赶学生乖乖就范,成为模具化的“标准件”;在这样的语境中,无有“逸品”的存身之所,不符合“标准件”要求的“逸品”极有可能被判为“次品”甚至“废品”。在“优异”一词中,我们往往只关注“优”而不关注“异”,但没有“异”的同质化了的“优”,不是真正的“优”;而综合素质评价的重要的功能和价值之一就在于在“异”中求“优”。但是,现在可供第二张筛子来品鉴的学生在真实情境下的问题解决、任务完成、能力倾向、特长展示、才华表现等等综合素质的事例和成果太少了。我们也注意到,有些地方注意到这样的事例和成果的收集,并且也对招生主体开放,但老实说,真正为招生主体所援引品鉴的并不多。一方面,政策所期待的“可信可用”的综合素质的事例、成果和成长记录仍然是稀缺品;另一方面,还没有找到第二张筛子,或者说,还没有掌握第二张筛子的筛法,这就致使即便有了“可信可用”的材料,也难以派上用场。第二张筛子和筛法,就是下文要讨论的质性评价的方法。

(二) 综合素质的评价方法

我们认为第二张筛子是综合素质评价的主调。综合素质评价,追求的是一种去信度的效度,它强调在“这一个”和“这一次”中把握效度。这样的效度,不能说没有预设,这个预设就是学校的“办学目标”和“自身的综合评价体系”。但是,生成性可能更是其显要的特征,在两相遭遇的情境中彼此形成的某种对话,才是综合素质评价迷人与更富价值的地方。我们可以将综合素质评价的方法界定为质性评价。质性评价,是具有方法论意义和价值的方法,它指向学生表现的最深层、最真实的特质,应该是最具效度的。质性评价的难度在于相对定量评价来说,缺乏信度的保障。我们认为,对综合素质评价来说这似乎不成其为问题。信度,以同一律为支撑,而综合素质评价更倾向多样性;在综合素质评价这里,强调信度往往会付出牺牲效度的代价,“对谁都一样”的信度不能构成综合素质评价的支撑性条件。质性评价代表着某种范式的转换:评价功能,由甄别转向发展;评价手段,在定性与定量结合的同时更加注重定性对定量的引导和整合;评价内容,基于问题的情境性和学生表现的真实性,注重综合评价和关注个体差异并且视个体差异为综合素质重要的构成质料;评价目标,从看过去转向看未来,注重终结性评价与形成性评价相结合并更加注重后者;评价主体,主体及其立场与利益多样化、多元化,平等与民主、冲突与妥协成为质性评价的一般机制和文化基础。

基于中高考改革的综合素质评价,首先,是指向个性的,评价方法需要有“多种量器”。美国教育评价专家艾斯纳指出:“在评定的新方式中,学生将不仅有机会对所学的东西构建他们自己的反应方式,他们也将有机会选择公布他们所学知识的方式。”因此,单一的量器要么显得无法招架,要么削峰填谷一概而论,“公平”地将“不公平”施于每一位“这一个”的学生,在赢得信度的同时丢失了效度。所谓“多种量器”,就是面对学生的作品、成果以及其他成长记录,或者与学生的直接对话中,遇长度显优者则用尺寸,遇重量显优者则用磅秤,桃红柳绿各得其宜,鸟飞鱼跃各得其所。其次,评价是指向发展的,评价者应该有发现“潜力股”的法眼,政策多次强调对“潜质”的考查,旨意即在于此。考察学生综合素质的发展性,要善于从具体内容抽象出智力、能力倾向、行为习惯、成就动机、人格结构等这样的形式性的东西,基于未来发展,研判形式性之结构稳定与否、形式性之势能强劲与否、形式性之指向健康与否以及新异与否。如果说指向个性是寻找各种鲜美的果实,指向发展则是寻找各种具有生长力的优良种子。再次,我们愿意将综合素质评价视为一场教育评价的美的历程,在这里评价指向主体间心智和心性的交集。因为没有明确标准的规限,学生相对比较自由地展示着自己,评价者则可以带着偏好去期待和遭遇——这样的偏好可以是出于学校的办学风格、特色和发展需要,也可以出于评价者的个人倾向。评价将可能在“黄金有价”与“玉无价”的张力中进行——“黄金有价”是基于一定的公约数,具有预设性;“玉无价”则表现为个人心理,具有生成性,是一时难有凿凿之言可以证明却有切切之心可以表白的对人才的敬惜与喜爱。“黄金有价”倾向于第一张筛子,“玉无价”倾向于第二张筛子。当然,这只是一种“方便说法”。综合素质评价是一个整体,两者总是结合在一起,构成了“张力场”;并且“黄金有价”总是寓于“玉无价”之中,而不是反之,也正因之综合素质评价呈现出人性特征。第四代评估认为“调查者是人,无法摆脱他们的人性”,“成功地获得对人与人间相互作用的深入了解”是评估的最终准则。“玉无价”最终也会形成“成交价”,但是它因为缺乏严格的“客观”标准,无从“标价”,必须在反复的“议价”过程达成最终的一致,这个过程乃是对话的过程,是解释学的过程。

这样看来,综合素质评价似乎费时费力,如果将中高考视为教育的公共治理行为,那么治理的成本确乎太高了。但我们相信,“真实性源于评价什么是最重要的,而非评价什么是最方便的”。低成本获得低效益甚至负效益,我们仍然可以说成本是高的。如果处理得法,看上去是综合素质评价的成本,同时有可能就是综合素质评价的效益。我们期待,高一级学校应建立适合自身的综合素质评价的体系、机制和制度,并动员更多教师参与到综合素质评价中。众多教师的参加,一方面在保持个体偏好的价值的同时,形成偏好的对话-融合、冲突-和解的生态场,提升偏好参与评价的效度;另一方面,使招生工作成为促进学校专业建设、多样化发展、教师成长, 以及促进学生全面发展的重要机会,有力推进学校育人模式、课程体系、教学方法和学习方式的变革。

关于积极推进中小学评价与考试制度改革的通知(教基[2002]26号)。
关于做好2006年普通高等学校招生工作的通知(教学[2006]2号)。
中共中央国务院关于加强青少年体育增强青少年体质的意见(中发[2007]7号),关于做好2008年初中毕业升学体育考试工作的通知(教体艺司函[2008]12号),关于深入推进学生志愿服务活动的意见(教思政[2009]9号),关于印发《中小学实验室规程》的通知(教基二[2009]11号),关于在义务教育阶段中小学实施"体育、艺术2+1项目"的通知(教体艺厅[2011]4号),关于联合相关部委利用社会资源开展中小学社会实践的通知(教基一[2011]2号),关于印发《切实保证中小学生每天一小时校园体育活动的规定》的通知(教体艺[2011]2号),关于印发《教育系统深入开展学雷锋活动实施方案》的通知(教党[2012]5号)。
关于印发《中小学班主任工作规定》的通知(教基一[2009]12号)。
关于召开中国教育学会第19次全国学术年会暨素质教育评价论坛的通知(学会[2006]15号)。
关于做好2012年高等学校自主选拔录取试点工作的通知(教学厅[2011]10号)。
关于深入实施高校招生阳光工程的意见(教学[2011]9号)。
全国中考语文考试改革试点工作总结综述,《中国教育报》1999年4月27日。
关于做好2008年普通高等学校招生工作的通知(教学[2008]3号)。
关于做好2012年高等学校自主选拔录取试点工作的通知(教学厅[2011]10号)。
http://edu.online.sh.cn/education/gb/content/2010-06/30/content_3582406.htm
李雁冰:《论综合素质评价的本质》,《教育发展研究》2011年第24期。
[德]米切尔·兰德曼著:《哲学人类学》,阎嘉译,贵阳:贵州人民出版社,2006年,第7页。
教育部关于普通高中新课程省份深化高校招生考试改革的指导意见(教学[2008]4号)。
[美]埃利奥特·W.艾斯纳著:《教育想象——学校课程设计与评价》, 李雁冰译, 北京:教育科学出版社,2008年,第216页。
关于做好2012年高等学校自主选拔录取试点工作的通知(教学厅[2011]10号)。
[美]埃贡·G·古贝、伊冯娜·S·林肯著:《第四代评估》,秦霖、蒋燕玲等译,北京:中国人民大学出版社,2008年,第55页。
[美]埃贡·G·古贝、伊冯娜·S·林肯著:《第四代评估》,秦霖、蒋燕玲等译,北京:中国人民大学出版社,2008年,第55页。
[澳]科林·马什著:《理解课程的关键概念》, 徐佳、吴刚平译, 北京:教育科学出版社,2009年第65页。