教育评价是指在一定
教育价值观的指导下,依据确立的
教育目标,通过使用一定的技术和方法,对所实施的各种教育活动、教育过程和教育结果进行科学判定的过程。纵观教育评价理论与实践的历史发展,一般认为大致经历了古代的传统考试、近现代的科学测试和当代的
科学评价三个不同时期。因此,教育评价来源于古代学校对学生的
学力检验,但是,教育
评价系统的理论和方法的形成则直接来源于20 世纪初兴起的一种以追求考查教育效果的
客观性为目的的
教育测验运动。
概念定义
教学评价是以
教学目标为依据,按照科学的标准,运用一切有效的技术手段,对
教学过程及结果进行测量,并给予
价值判断的过程。
教学评价:是对教学
工作质量所作的测量、分析和评定。它包括:对学生学业成绩的评价,对教师
教学质量的评价和进行
课程评价。
发展变革
教育测量的研究取得了一系列的成果,在考试的定量化、客观化与标准化方面,取得了重要的进展。强调以量化的方法对学生学习状况进行测量。然而,当时的考试与测验只要求学生记诵教材的知识内容,较为片面。无法真正反映学生的
学习过程。
布卢姆为主的教育家,提出了对教育目标进行评价的问题,由美国
教育学家斯克里文(Scriven,M.)、斯塔克(Stake,R.E.)和开洛洛(
Kellogg个体发展 20世纪30年代以来兴起的现代教育评价主要有这几方面的特点:
1. 评价目的转变。早期的教育评价主要为了“选拔适合教育的儿童”,而现代教育评价的目的则更注重“创造适合儿童的教育”,即由重视鉴定转向更加重视改进教与学,以最大限度地形成教育目标;
2. 评价对象的扩展。早期教育评价对象主要是教学领域,集中在对学生的学习成绩的评定上,以此为基础对
教学计划和课程编制的优劣得失作出判断,现代教育评价的对象扩展到了所有教育领域,宏观和微观教育活动的一切方面皆可作为评价对象;
3. 评价结果形式的革新。早期教育评价既重视以数量的形式表示评价结果,也重视用语言描述的形式表示评价结果,还重视以数量和描述相结合的形式表示评价结果;
4. 强调评价对象的参与。早期教育评价把评价对象看作只是被动地接受评价,现代教育评价则把评价对象看作是评价的主体,强调评价对象自我评价的重要性,并引导评价对象参与从指定评价方案到取得评价结果的全过程上,强调评价对象对评价结果的认同。
迄今为止,人类教育评价走过了这样一条历史途径:从观察、测量到测量与质性研究并重,并给出诊断和意义以及价值判断。教育评价的发展大致经历了测量、描述、判断、建构和综合等阶段。
第一代教育评价叫测量。测量是获取教育数据的有效可靠方法,主要追求测量与
测量结果的标准化、客观化,主要是
测量技术与手段大量应用(
真分数理论与技术的应用)。
第二代教育评价是描述。描述是对测量所得数据进行事实还原,再解释学生学习达成教育目标的程度,主要以教育
目标理论或
概化理论为应用,对每一次测验与考试的结果进行描述或
描述性分析。这种“双基”测验与考试,正是导致“应试”的技术源头。
第三代教育评价叫判断。描述对于目标而言,具有统一性,而学生是多元化的、个性化的,所以在判断学生价值上就出现了冲突。追求学生认知的多元化,就导致了必须以多元化的价值标准来判定学生发展。在此背景下,根据测量所得的事实判断学生发展情况、以能力倾向判断学生发展的
项目反应理论产生。对于这类评价来说,制定价值
判断标准尤为重要。
20世纪80年代,第四代教育评价——“建构”时代开始了,主要研究教育建构过程、方法和特征,认知诊断理论和多维项目反应理论成为这个时期教育
评价研究和应用的主流。认知诊断理论以“
知识结构+
认知结构+
思维模型”为基础,对认知的形成过程做出诊断和判断,即对教育的过去进行诊断和判断。多维项目反应理论则是对多重
显性能力测量并对学生的未来发展做出诊断与预测,即对教育未来进行诊断和判断。
2020年10月,中共中央 国务院印发《
深化新时代教育评价改革总体方案》,教育评价事关
教育发展方向,有什么样的评价指挥棒,就有什么样的办学导向。为深入贯彻落实习近平总书记关于教育的重要论述和
全国教育大会精神,完善立德树人体制机制,扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,提高教育治理能力和水平,加快推进
教育现代化、建设教育强国、办好人民满意的教育,制定方案,并发出通知,要求各地区各部门结合实际认真贯彻落实。包括:总体要求、重点任务和组织实施三大方面。
评价类型
依据评价标准,可分为
相对评价、
绝对评价和个体
内差异评价、
常模参照评价与
标准参照评价;依据评价的功能,可分为诊断性评价、
形成性评价、
终结性评价;依据评价对象的范畴,可分为整体评价和单项评价、群体评价和个体评价;依据评价学校的级次,可分为高等
学校评价、中等学校评价、初等学校评价;依据评价学校的类别,可分为职业学校评价、专业学校评价、师范学校评价、特殊教育学校评价;依据评价主体的身份,可分为自我评价与他人评价;依据是否采用数学方法,可分为量化评价与非量化评价等。
诊断性评价指对评价对象的现实状况及存在的问题、产生的原因所进行的价值判断。在
教学活动过程中进行的诊断性评价,其主要目的是分析原因,以便对症下药采取相应的改进手段。良好的诊断评价有助于教师把学生适当地分置在
教学顺序中,正确找出妨碍学生学习的原因,从而保证教与学的成功。
形成性评价指对正在进行的教育活动作出的价值判断,也称
过程性评价,其特点是通过及时揭示问题、及时反馈以促进工作的改进。形成性评价一般以反馈调控和改进完善为主要目的。如对教学过程开展形成性评价,往往是通过诊断教学方案、计划、过程、进展情况和存在问题,并及时反馈,及时改进、调控、校正,以达到提高教学质量的目的。我国将形成性评价运用扩展到整个学校教育领域,控制学习
工作过程,及时或
定期检查学校各项计划的执行情况,分析工作上的问题,及时加以改进。
总结性评价指对评价对象一定时期内的全面状况所进行的价值判断,也称终结性评价,总结性评价旨在对教育活动作出总结性的结论,甄别优劣,鉴定分等,为各级决策人员提供参考依据。这种评价注重对教育活动的结果作总体分析,提供
描述性信息,关心对效率的陈述,并强调自身的效果。其特点是在学习或教学活动后,就学习或教学的效率,对学生、教师或课程编制者作出价值判断。评价者一般应独立于计划
实施者及协助者,以保证对评价对象持客观态度,得出可靠的结论。
(二)常模参照评价与标准参照评价
在教育评价中,由于评价基准不同,解释也就不同,常将它们分为目标参照评价和常模参照评价,又称绝对评价和相对评价。
目标参照评价,又称绝对评价,它是指以预先设定的、期待的教育目标为评价基准,来衡量评价对象到达完满程度的一种评价。有人也称它为标准参照评价。在学校以学生为教育对象的测定中,关心的是每一个学生的发展,因此也叫做到达度评价,学校中教学评价多属于此类。
常模参照
标准评价,又称相对评价,它是指在某一个集团中(班级、学校、地区、国家),以这个集团的平均状况为基准,评价每个被评对象在这个集团中所处的相对位置的一种教育评价。它的客观性很强,并已经经过近百年的发展,有一套测量和
统计方法,它适用于
选拔性考试。它是以
正态分布的理论为基础,所表示的是学生之间的比较,而与教育目标无很大直接的关系。一般大型的
标准化考试、升学考试、
心理测试,以及各种竞赛性考试等属于此类评价。
如果是用测验来进行上述两种评价,那么这两种
评价方式又称为
常模参照测验和
标准参照测验。这两种测验的主要差异在于解释分数的方法不同。
常模参照测验,是指参照常模群体的水平解释分数的测验。常模群体可以是一个特别选定的团体,也可以是被测者所在群体本身。常模群体的平均分数(或
百分数等)一般可以反映它的水平,称为常模。以常模为
参照点,将被测个人的成绩与常模比较,并把比较的结果所反映出来的差异数量化,参照常模解释分数,便于个体间的比较和选拔工作的进行。
标准参照测验,它是指依据某种特定操作标准可以直接解释测量结果的测验。操作标准一般可以通过界定个体所应该完成的任务确定。对标准参照测验来说,它的分数解释是以界定良好的任务或行为领域为基础的,是与预先设计的特定标准相对照所确定的,有了这个条件,我们便可以从较少的有
代表性的测验题目的反反应情况,推断出
被试的真实水平。用目标表示领域,并且题目是该领域中行为的有代表性样本,这时的
目标参照测验就是标准参照测验。标准参照测验主要用于鉴定的目的。
量化评价顾名思义主要是一种数量化的评价,它主要运用统计与测量的方法,对被评价的资料信息进行数字化处理;质性评价主要是在描述的基础上进行评判,通常表现为书面的“鉴定”或“评语”。一般来讲,书面的评语通常比简单的分数或等级更清晰地传达出被评价者的优点与缺点,但这种评价方法不够精确,且主观性较强。
评价定义
评价是一种价值判断的活动,是对客体满足主体需要程度的判断。教育评价是对教育活动满足社会与
个体需要的程度做出判断的活动。是对教育活动现实的(已经取得的)或潜在的(还未取得,但可能取得的)价值做出判断,以期达到教育
价值增值的过程。
从人们对教育评价的观点来看,可以将教育评价视为根据一定的
教育价值观或教育目标,运用可行的科学手段,通过系统地搜集信息资料和分析整理,对教育活动、教育过程和教育结果进行价值判断,从而不断自我完善和为
教育决策提供依据的过程。这是一般定义,它适用于对普通教育领域里各种教育现象进行价值阐述。其特点主要有:教育评价是一个过程,是一种有一定程序和系统活动过程;教育评价以一定教育目标或一定教育价值观为依据;教育评价以对评价对象的功能、状态和效果进行价值判断为核心;教育评价以
科学的评价方法、技术为手段;教育评价最终目的在于不断完善评价对象行为,提高教育质量,为教育决策服务。
根据这一定义,进行教育评价的一般步骤是:1. 确定分析评价目标,指定
评价方案,做好评价的准备工作;2. 选择评价开始时间,搜集评价对象信息,并加以整理;3. 分析评价信息形成评价结论;4. 根据评价结果,提出改善评价对象行为,达到预期目标。
在研究评价时,我们要注意评价、评估和测量(Evaluation、Assessment、Measurement)的区别。评价、评估和测量所共同者为测验。它们常常(但不总是)使用测验,然而它们当众没有一个与测验同义,并且这三个过程各自所要求的测验种类可能也不同。
测量指“将一数字表示的量指派于.......”这一定义适用于大多数的教育情景,许多智慧能力或教育方面其他的量只能间接地测量。这样的测验典型地用来测量这样的量,如这里水平、在不同情境中应用一原理的能力、习得或遗忘的材料有多少。测量很少是为测量而测量的,它可以包括在一项评估或评价之中,但是更宜将它看作为一种基本的研究步骤。
评估这个术语应当尽可能地专用于人。它包括的活动主要有:分等第(正式的和非正式的)、考察、鉴定等等。我们可以评估学习在特定科目上所取得的成就,可以评估应试者从事特定职业的
能力倾向,可以评估教师的从教能力,等等。
人们一般把“教育评价”这个术语专用于计划课程和各组组织变量这样的
抽象实体。这一用法含有对某事物的重要性或价值作估量的意思,这通常涉及到与其他的方案、课程或组织模式
作比较。正像可以将评估描述为是大多数教育工作者所做的一种例行活动一样,评价是主要从事
研究和发展工作的人们所进行的一项活动。
评价目的
(1)管理人员为教育提供了人力和财力,他们想知道究竟他们的计划是否顺利进行,唯一的途径是了解学生在课程学习中实施的情况如何。如果评价的结果与他们所期待的不同的话,他们就要
调整计划,以便日后能更好地完成任务。
(2)教师把管理人员的计划付之实施,他们想知道在教学过程中已做了些什么,下一步该做什么;学生已经掌握的或能做的东西;不知道或不能做的东西。如果想计划顺利地进行,很大程度上得看教师能否最终实现计划的表现。
(3)没有人会比家长更想知道自己的孩子在学校学得怎么样。家长不能看见学生在课堂上的表现,他们得从学校和教师对孩子的表现的反馈中做出评价。
(4)最后是──学生想知道他们完成任务的情况,知道他们今后该怎么做,从自己的成功中获得信心和满足感。
评价功能
(一)导向、监督功能
教育评价意义之一就是通过评价手段得出
实证性发现和诊断性意见,能够为区域
教育质量的提升、教育行政部门制定政策、改进工作提供数据支持和科学参考及有效监督。
鉴定是教育评价最根本最主要的功能,鉴定的目的在于检验教育工作和教学成果,从而为提高教育质量、完善
教育管理系统、规范教学秩序、加强对
教育工作者的
专业培训等提供依据。
(三)诊断、激励功能
对学生在学业、综合素质、发展潜能等方面的现状、矛盾和问题进行诊断,分析原因,“对症下药”。
评价原则
教育评价原则是教育评价规律的反映,是教育评价活动成功与否的主要因素之一,对教育评价活动具有普遍的指导意义,教育评价原则是以对教育评价过程基本规律的主观反映为基础而做出的,是教育评价主要经验的总结和概括,具有主观和客观双重属性,其客观性主要体现在违背或偏离了教育评价过程中的
客观规律,教育评价的原则就是不能有效地规范、约束和指导教育评价活动,其主观性则体现在按照评价者的评价要求、主要意图、评价活动的历史局限和主体水平的局限等,因而原则的概括和应用都带有主观性。
(一)效用评价
效用评价指对某种
教育行为、方式具有的效力和作用所进行的价值判断。在效用评价中,将教育行为或方式看作一种商品或服务,评价的是它在特定时期内满足人的需要的能力。效用本身与受教育对象的感受,与社会价值没有必然联系,它注重的是一定教育
行为方式下,教育对象或群体发生的变化程度。教育对象发生的变化被赋予价值观,就有正效用与
负效用之分。教育行为及方式的效用是其
客观存在的属性,但会因人、因时、因地而异。同一教育行为对不同教育对象,其效用是不可比的。同一教育行为在不同时期或不同地点,其效用也可能不同。效用可以分为确定情况下的效用和不确定情况下的效用。评价前者时只考虑确定因素,而不考虑随机因素;评价后者时不仅考虑确定因素,也考虑随机因素。
评价方法按是否采用
数学方法分类可以分为定性评价与定量评价。定量评价是指采用定量计算的方法,即手机数据资料,用一定的
数学模型或数学方法,采取统计处理手段进行的评价。定性评价是指不通过定量计算的方法,而是采用定性描述、解释的方法作出的价值判断。但定性评价也必须有评价的标准和依据,也必须在取得有关资料的基础上作出科学判断。
人们对于教育评价中的
数量化方法越来越重视了。在教育评价中排斥数量化的方法是不对的。但是,如果过分强调数量化方法也是不对的。第一,数量化方法固然很需要,也很重要,但它并不是进行教育评价的唯一方法。如果认为教育评价必须都数量化,很多教育现象由于不能数量化,因而会有许多教育现象会被排斥在评价范围之外,这样对教育的发展是不利的。第二,过分强调数量化的人往往误认为用数量化方法进行评价最客观、最准确,但实际上用数量化方法并不能排除评价工作中的主观因素的影响。从累计分数法中,我们可以看出,尽管采用了数量化方法,而在实际评价中把教育问题转化成数学问题时,或者是对用数学方法导出结果进行解释时都难免掺杂主观因素。那种认为只要运用了数学方法就是实现了客观化的想法是幼稚的。数量化方法与非数量化方法各有所长,也各有所短。因此,在评价工作中,不宜提倡一种方法而抛弃另一种方法。
静态评价是对评价对象目标到达程度的评价,其特点是不考虑原有状态和发展趋势,只考虑评价对象在特定时空范围内的现实状况。它有利于
横向比较,有利于强化
竞争机制,但无法进行
纵向比较。动态评价是根据
动态原理提出的进行教育评价活动的行为法则。其基本要求是教育评价过程中要注意对评价对象的历史情况、
发展水平及发展趋势进行评价,并研究其对一定
社会需要的敏感程度和响应能力。另外,评价的目的、内容、标准、方式应随时间的变化而逐步改进,评价的结论也应根据教育活动、
教学水平的发展而不断修正。动态评价的使用有利于指导、激发被评价对象的进取精神,明确前进方向,有利于激发评价对象的进取精神,但无法进行横向比较。只有将静态评价与动态评价结合起来,才能相互补充,避免出现
相对主义现象。
他人评价指评价对象自身以外任何客体实施的评价,也叫“外部评价”。它包括除“自我评价”以外的所有评价。如社会评价、领导评价、
同行评价、行政评价、学生评价等。他人评价有以下特点:客观性强,用他人的新角度审视同一事物可以避免主观片面性;真实性强,可避免对自己评价过低或者评价过高;要求严格,参与评价和组织评价的人员都不是清楚自己的身份与职责,因而能够比较认真负责地完成评价工作。他人评价的主要缺点是在组织实施的过程中耗费的人力与财力都比较多,因而不宜频繁进行。
自我评价,指评价主体自己依据评价原理对照一定的评价标准
主动评价自身的评价类型。广义的自我评价包括教师对自己工作的总结,部门负责人对本部门工作所做的自我检查。狭义的自我评价特指那些严格按照与他人评价相同的标准所进行的评价。自我评价收到普遍欢迎,并且的到广泛应该是由于它具备了以下一些特征:不受时间和场合的限制,简便易行;省时,省力,耗资较少;可在较长时间内
连续操作,机动灵活。自我评价的实施有利于激发被评价者的积极性,但客观性不足,因而自我评价极少独立使用。自我评价一般在他人评价之前,或者穿插在他人评价中进行,用以证实或者完善他人评价的结果。对于规模比较大的评价活动,通常的做法是先进行自我评价, 在此基础上再组织适当规模的他人评价,综合发挥两类评价各自的优势,最大限度弥补二者之不足,以求达到尽可能理想的效果。
衡量标准
教育评价的对象不外乎学生和教师,无论是对学生的发展进行评价,还是对教师的教育教学工作进行评价,都涉及“评什么”的问题。对良好的教育评价而言,确定“评什么”是首要的,它涉及有关教育目的、目标等方面的
价值定位;至于“如何评”,只是一个技术或方法问题,同确定教育的目的、目标相比,它的重要性是第二位的。以学生发展评价为例,回答“评什么”的问题,实际上也就是要回答教育的目标指向或定位问题。根据美国学者
布鲁姆的意见,
教育目标领域涉及“认知”、“
情感”、和“
动作技能”三大领域。在
认知领域,布鲁姆将教育的目标划分为知识、理解、运用、分析、综合与评价六个层次,后来安德森等人对布鲁姆的认知教育
目标分类体系进行了修改,新的分类体系的主要特征是将认知目标分为两个维度:一个是“知识”,另一个是“
认知过程”。安德森将“知识”按从具体到抽象分为四类,即事实、概念、程序和
元认知;将“认知过程”按从低级到高级分为六个水平,即记忆、理解、应用、分析、评价和创造。从这里可以看出,如果要对学生的发展进行全面的、综合的评价,就不能只针对认识领域的目标进行评价,还必须关注学生在社会情感方面的发展。即便是只针对认识领域的目标进行评价,也不能只针对低层次的认知目标进行评价,忽视对高层次思维技能或深层理解进行评价。总而言之,好的教育评价要求评价者首先要对教育的根本目的或目标有正确、深入的了解,以防漏掉那些主要的、基本的、重要的评价对象。比如,若对教师的教育工作进行评价,只评价学生书本
知识掌握得如何,不看学生
智力发展得怎样;只看学生考分的高低,不看学生人格、
个性发展是否健全,像这样的教育评价只能对教育的发展起误导作用。
(二)评价的方法与手段应是科学的、合理的、可行的
当我们确定了要评价什么时,接下来就要考虑评价的方法与手段是否科学合理的问题。所谓评价方法与手段的科学性,主要是指评价采用的方法、手段是否真正能够检测出评价者所要检测的东西。换句话说,评价的方法与手段必须与评价的对象或内容相适应,评价的对象或内容不一样,需要采取的评价方法与手段也会跟着不一样。比如,若要对学生的交往技能、
操作技能、
运动技能、
社会性发展等进行评价,采用笔纸测验就显得不太合适;要对学生高层次的思维技能(如分析、评价、创造等)或者解决真实情境中的真实问题的表现进行评价,采用填空题、
选择题(含
判断题)、
匹配题等测验题型就显得不太合适。此外,
评价标准是否与评价的任务和目的具有内在的、理性的关联,各个评价标准之间是否具有内在的逻辑一致性,各个评价
指标权重大小的分配是否合理,所有这些都涉及评价的方法与手段的科学性与合理性问题。至于评价方法与手段的可行性问题,也
不容忽视。
任何评价如果要有效的话,都必须以事实为依据,以“标准”为准绳,尽量减少评价者个人主观因素或外界因素对评价的干扰与影响,防止评价者把自己的个人偏见带入评价过程。在这里,仅以评价偏见的客服为例,来谈谈评价的
公正性与
客观性问题。“评价偏见”是指某些评价者由于性别、种族、
社会经济地位、
宗教信仰或其他特征,在评价中受到冒犯或不公平的对待。“这个测验不公平”,说的就是评价偏见。
评价不仅仅是一种技术活动,更是一种人文活动。好的评价必须符合
教育专业的伦理准则,不论是评价的方法、手段、程序,还是评价的标准,都必须是正当的、合法的,符合有关教育的伦理准则。比如,评价标准的制定应基于民主的程序;标准一旦确立后,就应当始终如一地加以执行;搜集评价信息的方式应是正当的,对评价结果的利用也应当是正当的、合法的,避免给当事人造成伤害,等等。
好的教育评价应能促进和激励学生更多、更好地投入学习,帮助教师不断地反思和改进其教学,促进教师在专业上不断地得到成长与进步。以学生发展评价为例,好的教育评价应以促进学生发展为目的。比如,在评分中充分考虑学生的努力与进步程度,将那些在考试中取得明显进步或进步最大的学生姓名单独张榜公布,予以表彰或奖励;采用灵活、弹性的“延时评分”以取代一次性评分(即当教师发现学生作业中的错误时,暂不评分,将作业返还学生,让学生自己去发现并纠正作业中的错误,直到正确无误或学生自己满意时才给予最后的评分;或者教师先用铅笔记下第一次作业的评分,允许学生将错误多的作业重做一遍,然后用新的评分取代原始评分);引导学生参与评价标准的制定,学会对自己的作品进行
自我评价,不断提高自我评价的技能,等等。上面列举的这类评价措施,都对学生的发展具有正面的引导与激励作用。
评价主体
个体评价
(2)个体对他人他事的评价个体对自身以外的其他客体的评价,是个体对他人它事的评价。例如,学生对教师的评价就是属于这一类型。
社会评价
是指从一定社会的角度来考察和评定现象的
社会价值,判断现象对社会的作用之善恶、美丑、功过及其程度。
评价模式
教育评价的模式是相对固定的评价程序,它是在一定的理论指导下对教育评价的基本范围、内容、过程和程序的规定。西方教育评价的模式一般都有较大的适用范围。不但可以广泛地用于
学生评价,在实践中也被广泛地运用于课程与教学
方案评价等各个方面。
教学评价的主要有以下三种模式:
泰勒模式
泰勒模式诞生于上世纪30年代,
泰勒泰勒原理课程编制的原理。泰勒评价模式的评价步骤包括以下几个方面:
(1)确定教育方案的目标;
(2)根据行为和内容对每个目标加以定义;
(3)确定应用目标的情景;
(4)确定应用目标情景的途径;
(5)设计取得记录的途径;
(6)决定评定方式;
CIPP模式
CIPP模式诞生于本世纪60年代。有人对泰勒评价模式提出疑问,认为,如果评价以目标为中心、依据,那么,目标的
合理性又根据什么去判断?教育除了活动要达到预期的目标外,还会产生各种非预期的效应、效果,这些非预期的效果等要不要进行评价?……。在西方,有一种
教育流派认为,教育乃是个人自我实现的过程,用统一的
目标模式去统一
个人的自由发展,去评价教育、教学的结果,从根本上是不可以接受的。因此,他们对泰勒模式更为丰满。1966年斯塔弗比姆首创了CIPP评价模式。这是由背景(context)评价、输入(
input)评价、过程(process)评价和成果(product)评价这四种评价组成的一种
综合评价模式。
传统弊端
从传统评价的特点、未来教育评价
发展趋势和教育评价科学化要求来看,传统评价的弊端突出表现以下几点。
教育评价的指标体系是将评价所依据的有关教育目标逐步分解成各级指标而形成的一个系统化的具有联系的指标群。教育评价就是通过观察测量被评对象具体的
外化的行为指标并进行价值判断的过程。因此,设计出一个比较有效、简明、科学的指标系统,将直接影响着评价结果的科学性和
可信性。然而,由于教育活动所涉及的多是
精神产品,在大多数情况下教育评价要将不可直接观察的事物转化为可观察事物的一种替代物,然后才能进行评价。由于指标和我们真正要评价的属性并非必然一致,因此就必须存在评价的效度问题。往往是评价并没有得到真正想评价的东西,而我们得到的并非我们想要评价的。
教育评价既存在着由于指标体系不够科学而导致的评价的信度、效度不高这一现象,同时也存在有些评价内容由于人们还没有找到一个
直接测量这种
信息量的
科学方法,从而使人们回避对这些因素的测评,加之
评价指标过于抽象,操作性差、造成评价结论的
主观性等问题,影响了教育评价的科学性。科学的教育评价需要科学的
评价指标体系,而建立科学的评价指标体系的难度是很大的。因为教育评价的对象主要是人的活动,评价对象的特殊性、复杂性决定了教育评价的困难性,这在某种程度上也是评价指标体系不够科学的一个重要原因。
教育评价发,许多方面由于人们极端化的最求而走向它的反面。不仅无助于促进学生的健康发展,而且还阻碍、肢解着学生的发展,使学校教师、学生成为评价的“奴隶”。因为评价片面强调知识的价值,忽视学生的主体价值,导致学生的畸形发展。最明显的表现就是教育评价在有些国家尤其是
发展中国家,已演变成纯粹的
升学考试的分数竞争,而根本不顾及作为
学习成果的现实所达到的能力、学习的全面考核,评价被限制在测定记忆、理解有关知识为中心的极其狭隘的领域。而且在许多情况下这种极端片面、狭隘的评价结果不仅被视为整体
学力的代表,甚至还被看成是学生
个人价值的代表。因此,越来越多的学校为了得到能在外观上反映出来的更为理想的评价结果,甚至不惜牺牲有助于学生发展的活动,而只将教学与学习限制在狭小范围之内。最能说明这一问题的现象就是在升学竞争中,无论教师还是学生都只重视同提高升学考试分数这个表有关系的课程的学习,至于与升学考试无关的课程、活动则被忽视。不仅如此,即使升学考试科目的学习也是偏重知识的
理解记忆以及单纯的运用,而忽视这些科目本来的
认知能力、情感态度、
价值观念的综合培养。所以在这种情况下,即使制定了比较均衡的课程学习计划,但实际的教学与学习活动也会在升学考试的压力下失去平衡。
(三)教育评价的目的、功能极端狭隘化
教育评价的根本目的在于促进教育工作的改进和教育质量的提高,评价不是为了证明,而是为了改进。然而,由于人们在教育评价的过程中极端强化
终结性评价,相对忽视
形成性评价、
诊断性评价,从而在多数场合下教育评价最终只能起到各种意义上的分等划类的作用,造成了不是为了教育的评价,而是为了评价的
教育现象。在实践中表现为把考试、测验、分数作为评价的主要工具,评价的功能被窄化到仅仅是对被评对象作出某种资格证明,如选拔评优、分级排名次等,忽视了评价的诊断、调节功能和教育、改进功能。评价主要被用来鉴定、区分学生、选拔适合教育
教学模式的学生,而不是创造适合学生发展的教育教学。可见,教育评价的畸形发展已从根本上束缚了
学校教育,成为奴化教师和学生的异己力量,不从根本上改变这种状况,教育评价很难发挥积极的促进作用。
评价要求
1、 明确多次评价的目的和评价对象,以解决评价的
方向性问题。2、 明确每次评价的内容,评价的具体目标。3、 明确为评价而准备的条件。4、 对评价资料进行客观、科学的判断。