0144《教育测量与评价》2018年6月期末考试指导
发布时间:2023-11-17 11:11:25浏览次数:250144《教育测量与评价》2018 年 6 月期末考试指导一、考试说明(一)考试说明满分为 100 分,考试时间为 90 分钟,考试形式为闭卷。(二)包含的题型及各题型相应的答题技巧1. 填空题答题技巧:答题时需要在空白处填写准确的课程知识点。2. 判断题答题技巧:只有对、错之分,判断错误不能得分。一般题目错误处较为明显,遇到不易判断的题目时 ,注意从细节处去判断。3. 选择题答题技巧:选择与题干相匹配的答案。可以考虑排除法等选择技巧。4. 简答题答题技巧:答出讲义与课件中的重要知识点要点即可。5. 论述题答题技巧:答题时注意结合相关的知识点,首先找到题目对应的知识点,再阐述自己的认识,然后围绕此观点从几方面展开论述,阐述对某一问题的认识和看法,需要比较详细的展开论述。二、复习重点内容第一章 教育测量与评价的学科发展1. 测量的要素测量的量具、测量的单位和测量的参照点,是测量的三个基本要素或三个基本条件。2. 教育测量和教育评价教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。教育评价:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。教育评价一般分为诊断性评价、形成性评价、终结性评价,其中后两种评价应用比较广泛。3.教育评价的特点教育评价的特点包含如下几个共同的要点:第一,强调以教育目标为标准的价值判断过程。第二,强调用多种方法(测量和非测量)系统收集资料与信息。第三,教育评价的内容既可以是教育计划,也可以是课程;既可以是学生的学习结果,也可以是某种教育现象、教学活动、教育目的或教育程序。第四,强调为学生发展和教育决策服务。4.教育测量与教育评价的联系与区别教育测量和教育评价既有各自相对独立的发展空间,也有许多相互交叉、逐步融合的领地。具体而言 ,两者的联系表现在教育测量是教育评价的基础,教育评价则包括了教育测量两方面。但是教育测量与教育评价也存在一定的区别,主要表现为:(1)教育测量定量地描述所要实现的教育目标或目标实现的程度,而教育评价是对教育活动、教育系统工作情况进行的价值判断;(2)教育测量是对测量标准的参与回应,而教育评价则是对评价标准的参与回应;(3)教育测量是定量的表述,而教育评价是定性的表述;(4)教育测量结果以多或少的数量表示,而教育评价则以合理、不合理、适当、不适当,好、不好、优、劣等表示。
点的描述,补充和完善内容并组织答题语言。(一)填空题1、量具 测量单位2、随机性 模糊性3、形成性评价 终结性评价4、评价内容的全面性 评价类型的多样性5、对学习支持与服务系统6、主观性试题 客观性试题7、思维能力 想象能力8、成果评价 教学行为评价 素质评价9、网络教学支撑系统10、综合性 复杂性(二)判断题1、(×) 2、(√) 3、(×) 4、(√) 5、(√) 6、(×)(三)选择题1、B 2、A 3、C(四)简答题1、如何确定测验的题型?【答题要点】说明测验的两种题型,并对题型适用的教学目标做解释,最后说明确定测验的根据。测验题目是测验的基本构成元素,题目编制恰当与否直接关系到整个测验的质量。只有正确地掌握不同类型试题的测试功能及命题方法,才能根据考试的目的和要求,正确地选择合适的题型并编制出高质量的试题,组成高质量的测验试卷。根据被试作答的范围和评分方法不同,测验题目可分为主观性试题和客观性试题。客观性试题具有评分客观的特点,它有确定的正确答案,不同评分者各自独立评分,所得结果基本上是相同的。客观性试题一般适用于测量知识的掌握、理解、应用、分析几个层次的教学目标。客观性试题的答案明确,作答简便,因而在限定的时间内测验可以包含足够数量的试题,能保证对知识内容的覆盖。主观性试题主要包括论述题、操作题和作文题等。它们适合于测量较高层次的教学目标,尤其是适合于测量综合、评价等目标层次。主观性试题鼓励被试积极地组织所学的资料,表达自己的观点。被试在作答时,耗费的时间较长,在限定的时间内,试题数量不可能太多,对知识的覆盖面较小。由于没有明确统一的标准答案,评分易受评阅者的主观因素影响,因而误差较大。确定测验题型时,首先,要根据学科类型和测验目的选择使用主观性或者客观性试题;第二,要根据测验考察的教学目标选择题型;第三,要根据被试的特点选择题型。2、列举提高测验信度的几种方法。【答题要点】从以下 7 个方面做说明:提高测验信度的方法有:1.适当增加测验题目的数量 2.测验的难度要适中 3.测验的内容应尽量同质 4 测验的程序应统一 5.测验的时间要充分 6.评分要尽量做到客观化、减少评分误差 7.应试者参加测验的动机水平、积极性、疲劳程度也会影响测验分数,从而影响信度。引起应试者参加测验的强烈动机,提高其积极性,使其保持旺盛的精力,都对提高测验信度有一定作用。3、简述教育评价的特点,并以学生评价为例论述教育评价的原则。【答题要点】说明教育评价的 4 个特点,并阐述现代学生评价的原则的定义,说明学生评价的 4 个原则。教育评价的特点包含如下几个共同的要点:第一,强调以教育目标为标准的价值判断过程。第二,强调用多种方法(测量和非测量)系统收集资料与信息。第三,教育评价的内容既可以是教育计划,也可以是课程;既可以是学生的学习结果,也可以是某种教育现象、教学活动、教育目的或教育程序。第四,强调为学生发展和教育决策服务。
现代学生评价的原则,是在现代教育评价观指导下对评价工作者的要求;评价的基本步骤则是根据这一评价观提出的操作程序。掌握现代教育评价的原则与步骤,对正确地开展评价具有重要意义。学生评价的基本原则有: 1.发展性原则。学生评价要围绕学生的发展,为学生的发展服务,这是发展性原则的核心思想。2.全面性原则。学生评价要紧扣教育目标,全面地反映教育目标。学生评价不全面,必然会把学校教育引向片面。3.明确性原则。评价的目的要明确,评价的要求也要明确,这是明确性原则的基本涵义。4.过程性原则。学生评价作为促进学生发展的工具,要贯穿学生学习活动的全过程。要充分利用定位性评价、形成性评价、诊断性评价与总结性评价的不同功能,在学生学习的各个过程提供各种不同类型的评价服务。4、人格的主要内容有哪些?【答题要点】回答人格的主要内容即可,不需详细描述。人格即指人与社会性联系最为密切的心理特质的总和。人格特征可以是外在的,也可以是隐藏在内部的。人格的形成是由先天的遗传因素和后天的环境和教育因素相互作用的结果。人格是在先天遗传因素的自然基础上形成和发展的,又主要由个体的生活史所决定,它受社会历史条件的影响。人格有其不同的侧面,通常包括:气质、性格、适应性、兴趣、态度等,所以说人格很重要的方面是自我与现实之间的和谐,以及自我和理想的自我之间的和谐。5、经典智力观与传统智力测验之间的联系与区别是什么?【答题要点】回答智力、智力测验的定义,简要说明两者的联系和区别即可。智力的定义多种多样,但有两点是共同的:首先,都认为智力是一种能力。其次,都认为智力是与认识活动有关的能力,换言之,智力是直接影响认识活动的效率,使认识活动任务得以顺利完成的心理特征。由于对智力的不同理解,导致了不同的智力结构理论。智力测验是对人的智力的一种客观的、标准化的测量。它以一组标准刺激物引起被试的反应,根据这些客观反应来度量被试的智力高低。可以说,传统的智力测验实际上是经典智力观的具体构想,在不同的智力观指导下编制的智力测验也不相同。任何一个智力测验都只可能测出某种智力观所认为的智力因素,被试在某个测验上的智商分数最多反映了他在该测验所提出的智力结构因素上的优劣。另一方面,相同的智力观也可以由不同的智力测验展现出来。所以,智力观和智力测验既有联系又有区别,正确理解两者的关系有利于我们合理地认识和解释智力测验的结果。(三)论述题1、列举课程方案评价的主要模式,并做简单的评述。【答题要点】对课程方案评价模式的几种模式作说明,适当评述即可。课程评价模式包括泰勒模式、CIPP 模式与目的游离模式、梅特费赛尔模式、CSE 评价模式、反对者模式、应答模式、消费者导向模式、自然探究模式等。2、题目反应理论在哪些方面超越了经典测验理论?【答题要点】说明题目反应理论的主要观点,然后从参数的稳定性、能力的比较、平行副本难实现、缺乏预测力、测量标准误 5 个方面做具体的比较阐述。说明:本考试指导只适用于 201803 学期 6 月期末考试使用,包括正考和重修。指导中的章节知识点涵盖考试所有内容,给出的习题为考试类型题,习题答案要点只作为参考,详见课程讲义或课程 ppt。在复习中有任何问题请到课程答疑区咨询。祝大家考试顺利!
5. 教育测量与评价的学科地位和作用教育测量与评价科学理论不仅在教育教学及教育管理等实际工作中具有重要的应用价值,而且在社会各个领域的人才选拔与评价过程中也有广泛而重要的应用。(1)教育测量与评价是现代教育科学研究的三大领域之一。(2)教育测量与评价在教育改革中具有重要作用,在教育系统中对实现教育目标起着十分重要的作用。(3)教育测量与评价是教师的专业素养和能力。教育测量与评价的知识是教师必备的专业知识修养;评价学生的能力是教师职业能力的重要组成部分。在教育教学过程中,科学运用教育测量与评价的有关技术方法,是所有成功教学的基础。第二章 教育测量与评价的类型和功能1. 教育测量与评价的类型(1)按测评在教学中运用的时机分类:形成性测量与评价、诊断性测量与评价、终结性测量与评价。(2)按解释测评结果时的参照点分类:常模参照测量与评价、标准参照测量与评价、潜力参照测量与评价。2. 教育测量与评价的功能(1)实现教育判断的功能 教育测量与评价的最基本、最原始、最现实、最普遍的功能,就是实现教育判断。它包括测量评定的功能、事实判断的功能、价值判断的功能、问题诊断的功能、区分选拔的功能等。(2)改进教师教学的功能教育测量与评价能够通过下面几点,充分发挥改进教师教学的功能 了解学生的起点行为; 作为改进教学的参考; 作为补救教与学的依据; 确保教学目标的达到(3)促进学生学习的功能教育测量与评价具有促进学生学习的功能,其主要体现在:激励学生的学习动机、帮助学生的记忆和促进迁移、促进学生自我评价。(4)行使教育管理的功能教育测量与评价具有教育管理的功能,主要是:对教师的管理、对目标的管理、对过程的管理。第三章 教育测量与评价的质量特性1. 衡量测验质量的四个指标衡量测验质量的四个指标分别是信度、效度、难度和区分度。信度(reliability) 简单地说就是测量结果的可信程度,指的是测量结果的稳定性程度,记为 rxx。估算测验的信度有三种方法:重测信度、复本信度、同质性信度。效度是指测量结果的准确性和有效性的程度,亦即测量是否达到了预期的目的。每当进行教育、心理之类的间接测量的时候,必须考虑是否测量到了所要测量的东西,在多大程度上测量到了这些东西。也就是说,必须考虑测量的效度问题。在效度和信度之间,首先要重点保证是高效度,因为,高效度必然高信度;反之,则不然。特别是对于教育测量而言,效度问题显得更为重要。效度分为三大类:内容效度、效标关联效度和结构效度。效标关联效度又可分为同时效度和预测效度。同时效度是指测验与当前效标之间的关联程度;预测效度是指测验与将来的效标之间的关联程度,是衡量推论有效性最全面的指标。难度是指测验的难易程度。在教育测量中,某测验的难度一般是用正确解答该测验题的人数与参与测验的学生数的比值来刻画的。测验题目的难度必须根据测验的目的确定和评价。难度是试题对学生知识和
能力水平的适合程度的指标,是由参与测量的被试群体的整体水平决定的。区分度,又叫鉴别力,是指测验对考生实际水平的区分程度,用符号 D 表示。具有良好区分度的测验,实际水平高的应该得高分,实际水平低的应得低分。它是评价试题质量,筛选试题的主要指标与依据。2. 信度的估算方法根据统计学的基本原理,估算测验的信度有三种方法:重测信度、复本信度和同质性信度。重测信度也叫稳定性系数,它指的就是用同一量表(测验或评价表)对同一组被试施测两次所得结果的一致程度,其大小等于同一组被试在两次测验上所得分数的相关系数。复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。3. 提高测验信度的方法(1)适当增加测验题目的数量;(2)测验的难度要适中(测验的难度适中,能使测验的信度达到最大,也能使测验的区分度达到最大,所以,必须使测验的难度适中);(3)测验的内容应尽量同质; (4)测验的程序应统一;(5)测验的时间要充分; (6)评分要尽量做到客观化、减少评分误差;(7)应试者参加测验的动机水平、积极性、疲劳程度也会影响测验分数,从而影响信度。引起应试者参加测验的强烈动机,提高其积极性,使其保持旺盛的精力,都对提高测验信度有一定作用。4. 难度(1)难度对测验的影响:影响测验分数的分布状态、影响测验的鉴别能力。第四章 编制教育测验的一般原理与方法1. 确定测验题型测验题目是测验的基本构成元素,题目编制恰当与否直接关系到整个测验的质量。只有正确地掌握不同类型试题的测试功能及命题方法,才能根据考试的目的和要求,正确地选择合适的题型并编制出高质量的试题,组成高质量的测验试卷。根据被试作答的范围和评分方法不同,测验题目可分为主观性试题和客观性试题。客观性试题具有评分客观的特点,它有确定的正确答案,不同评分者各自独立评分,所得结果基本上是相同的。客观性试题一般适用于测量知识的掌握、理解、应用、分析几个层次的教学目标。客观性试题的答案明确,作答简便,但是它所能考查的内容具有一定的局限性,因而在限定的时间内测验可以包含足够数量的试题,能保证对知识内容的覆盖。主观性试题主要包括论述题、操作题和作文题等。它们适合于测量较高层次的教学目标,尤其是适合于测量综合、评价等目标层次。主观性试题鼓励被试积极地组织所学的资料,表达自己的观点。被试在作答时,耗费的时间较长,在限定的时间内,试题数量不可能太多,对知识的覆盖面较小。由于没有明确统一的标准答案,评分易受评阅者的主观因素影响,因而误差较大。确定测验题型时,首先,要根据学科类型和测验目的选择使用主观性或者客观性试题;第二,要根据测验考察的教学目标选择题型;第三,要根据被试的特点选择题型。2. 布卢姆的教育目标分类按照布卢姆的教育目标分类方法,教育目标一般分为认知领域、情感领域和动作技能领域。3. 布卢姆的认知领域的目标分类布卢姆将认知领域的目标分为六个类别,按照由低级到高级的难易程度形成一种递进的等级关系,前一类别是后一类别的基础,后一类别又涵盖了前面的类别。(1) 知识/知道。这是最低等级的认知目标。此处的知识是指对具体事物和普遍原理的回忆,对方法和过程的回忆,或者对一种模式、结构或框架的回忆。(2)领会。这是最低层次的理解,指个人把某种材料与其他材料联系起来,也不必弄清它的最充分的含义,便知道正在交流什么,并能够运用正在交流的这种材料和观点。(3)运用。运用是指将抽象概念用于特定、具体的情境。这些抽象的概念,可能是以一般的观念、程
序的规则或概括化的方法等形式表现出来的,也可能是那些必须记住、能够专门运用的原理、观念和理论。(4) 分析。分析是指把材料分解成各个组成部分,弄清各部分之间的相互关系及其构成的方式,以指出那些用来传递意义或确定交流结果的技术和手段。(5) 综合。综合是指将各种要素和组成部分组合起来,以形成一个整体。它是对各种要素和组成部分等进行加工的过程,是一个用这种方式将它们组合起来,以构成一种原先不那么清楚的模式或结构的过程。(6) 评价。评价是指为了某种目的,对观念、作品、答案、方法和资料的价值及符合准则的程度作定量和定性的判断。准则既可以是内在证据,如逻辑上的准确性、一致性等,也可以是外部准则,如根据挑选或回忆出来的相应领域的最高标准等。第五章 教育测验的常模及其建立方法1. 教育测量数据的特点教育测量的数据,本质上不同于物理测量的数据,不能直接套用相应于物理测量数据的方法:(1)教育科学研究中绝大部分数据属于等级变量;(2)教育测量的多数数据从本质上说是主观的;(3)教育测量的数据还具有随机性;(4)教育测量的数据也具有模糊性。2. 常模参照测验与标准参照测验在教育与心理测验中,可依据解释测验分数的参照点不同,把测验分成常模参照测验和标准参照测验。即参照测验的常模,对测验的分数进行解释与评价的测验,称为常模参照测验;参照测验的“标准”,对测验的分数进行解释与评价的测验,称为标准参照测验。3. 年级当量年级当量通常用两位数表示,第一位为年,第二位为月。假定学生张甲四年级中期的算术、语文、阅读、外语四门学科成就测验的年级当量如下:算术 5.5,语文 5.0,阅读 6.0,外语 4.5。从以上各科的年级当量值中得知:张甲算术的成就超过平均水平一年,语文的成就超过平均水平半年,阅读的成就超过平均水平一年半,而外语的成就恰好位于平均水平上。第六章 教育测验的标准及其建立方法1. 教育测验标准的含义教育测验的“标准”指的是教育测验的成就标准,它对于编制标准参照测验以及解释标准参照测验的分数具有重要的意义。2. 常模参照测验与标准参照测验教育与心理测验可以按分数解释的参照体系分成常模参照测验与标准参照测验。第七章 制定教育评价表的一般方法和步骤1. 教育评价表教育评价表是根据教育教学的特性编制而成的,它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成。它是进行教育测量与评价的工具,为了使评价的结果更为可靠,需要对教育评价表进行更深入的研究。2. 教育评价表的构成要素(1)评价指标:就是根据评价的目标,由评价指标的设计者分解出来的,能够反映评价对象某方面本质特征的具体化、行为化的主要因素,是对评价对象进行价值判断的依据。(2)指标权重:就是表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这个数值就叫做对应指标的权数,或叫做权重。(3)评价标准:衡量评价对象达到评价指标要求的尺度,是由强度和频率、标号、标度三个要素构成。3. 制定教育评价表需要遵循的原则
教育评价表是根据教育教学的特性编制而成的,它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成。它是进行教育测量与评价的工具,为了使评价的结果更为可靠,制定教育评价表应遵循以下的原则:(1)科学性与导向性原则 (2)完备性与独立性原则 (3)发展性与整体性原则(4)操作性与可测性原则 (5)可行性与可比性原则 (6)超前性和持续性原则第八章 学生评价1. 学生评价概述 学生评价的类型(1)定位性评价:又称安置性评价、预备性评价,主要是在特定的教学活动之前,判断学生的前期准备。在这种评价里面要解决的问题是学生是否已经掌握了参加预定活动所需要的知识和技能,在多大程度上已经达到教学目标,学生的兴趣等基本情况等等。(2)形成性评价:主要是指不断地反映学生学习成功或者是失败的信息,特别注重强化学生学习的成功之处,显示学生学习过程中需要改进的具体的错误。(3)诊断性评价:诊断性评价对学生的学习进行进一步的评价,对于学习中错误的深层诊断。(4)总结性评价:在某个期末教师对学生的测验和评价。对教学目标达到程度的判断,同时也提供教学目标适当性和教学策略有效性的信息。2. 现代学生评价的特点(1)强调了评价功能的形成性现代教育评价的目的中强调参与和推动教育的发展。现代的学生评价,主要是用来诊断问题,改进教育,其目的则是创造适合儿童的教育。对评价形成性功能的重视又反过来是现代教育评价发展的一个重要动因。(2)重视评价内容的全面性教育工作者要求评价须全面地反映教育目标,对学生认知、情感以及动作技能的发展做出全面的评价,以促进学生的全面发展。因而,评价活动对教育活动能提供更大的帮助。(3)重视评价类型的多样性根据现代教育的需要,现代教育评价注意为教育提供全方位的服务,逐步地发展了包括定位性评价、形成性评价、诊断性评价在内的多种评价。这种多样性的评价,在学校教育的不同阶段提供不同的评价服务,使得评价在推动教育的发展中能起到越来越大的作用。3. 学生评价原则现代学生评价的原则,是在现代教育评价观指导下对评价工作者的要求;评价的基本步骤则是根据这一评价观提出的操作程序。掌握现代教育评价的原则与步骤,对正确地开展评价具有重要意义。(1)发展性原则:学生评价要围绕学生的发展,为学生的发展服务,这是发展性原则的核心思想。(2)全面性原则:学生评价要紧扣教育目标,全面地反映教育目标。学生评价不全面,必然会把学校教育引向片面。(3)明确性原则:评价的目的要明确,评价的要求也要明确,这是明确性原则的基本涵义。(4)过程性原则:学生评价作为促进学生发展的工具,要贯穿学生学习活动的全过程。要充分利用定位性评价、形成性评价、诊断性评价与总结性评价的不同功能,在学生学习的各个过程提供各种不同类型的评价服务。4. 人格人格即指人与社会性联系最为密切的心理特质的总和。人格特征可以是外在的,也可以是隐藏在内部的。人格的形成是由先天的遗传因素和后天的环境和教育因素相互作用的结果。人格是在先天遗传因素的自然基础上形成和发展的,又主要由个体的生活史所决定,它受社会历史条件的影响。人格有其不同的侧面,通常包括:气质、性格、适应性、兴趣、态度等,所以说人格很重要的方面是自我与现实之间的和谐,以及自我和理想的自我之间的和谐。
5. 在现代社会中,具有健康人格的学生具有的特征:在现代社会中,青少年学生所具有的健康人格应是:能客观地认识自我和外部世界;情感和态度上是开放的;对所承担的学习和其他活动有胜任感;充分发挥自己潜能;对父母、朋友有显示爱的能力;有安全感;喜欢创造;有能力管理自己的生活;有责任感等。6. 智力测验对人的智力进行客观的标准化的测量。它是通过一组标准的刺激物引起被试的反应,根据这些反应来度量被试的智力高低。这种标准的刺激物称为量表。不能完全根据智力测验的分数来看待一个人的智力水平。分数仅仅是一个参照,还要经过多方面的综合,在使用这个分数时要慎重。7. 经典智力观与传统智力测验之间的联系与区别智力的定义多种多样,但有两点是共同的:首先,都认为智力是一种能力。其次,都认为智力是与认识活动有关的能力,换言之,智力是直接影响认识活动的效率,使认识活动任务得以顺利完成的心理特征。由于对智力的不同理解,导致了不同的智力结构理论。智力测验是对人的智力的一种客观的、标准化的测量。它以一组标准刺激物引起被试的反应,根据这些客观反应来度量被试的智力高低。可以说,传统的智力测验实际上是经典智力观的具体构想,在不同的智力观指导下编制的智力测验也不相同。任何一个智力测验都只可能测出某种智力观所认为的智力因素,被试在某个测验上的智商分数最多反映了他在该测验所提出的智力结构因素上的优劣。另一方面,相同的智力观也可以由不同的智力测验展现出来。所以,智力观和智力测验既有联系又有区别,正确理解两者的关系有利于我们合理地认识和解释智力测验的结果。8.认知过程基本能力认知过程涉及心理过程的全部范围,其中最基本的四种能力分别是观察能力、记忆能力、思维能力和想象能力。第九章 教师评价1. 教师评价的模式(1)教师职责评价模式;(2)教师认知发展评价模式;(3)教师活动评价模式2. 教师评价的种类目前教师评价主要有三种类型:成果评价、教学行为评价、素质评价。第十章 课程方案评价1. 课程方案评价的内容(1)课程计划的评价;(2)学科教学大纲的评价;(3)教材的评价教材是教学大纲的具体化,因此,对教材的评价核心是教材与教学大纲的一致性、科学性与可读性。2. 课程方案评价的基本模式课程评价模式包括泰勒模式、CIPP 模式与目的游离模式、梅特费赛尔模式、CSE 评价模式等。(1) 梅特费赛尔模式 梅特费赛尔模式是由美国学者在 60 年代后期提出的一种模式。这一模式在泰勒模式基础上加以补充与完善,本质上仍然是一种目标评价的模式,然而,它更强调了课程评价的持续性与课程的全面整体效果。从梅特菲赛尔模式的八个步骤来看,这一模式是以目标为中心的,但是它强调了全体成员的参与、目标的宽泛性与对课程效果的持续观察,这就使它在泰勒模式的基础上有了进步。(2)CSE 评价模式CSE 评价模式是一种与 CIPP 最为接近的评价模式。CSE 即美国洛杉矶加利福尼亚大学评价中心(Center for Study of Evaluation)的简称。CSE 评价包括四个步骤:需要评定、方案计划、形成性评价、总结性评价。
(3) 反对者模式反对者模式(adversary model)是欧文斯(Owens,T.)等人在 70 年代中叶提出的。它是一种为了揭示方案正、反两方面长短得失,而采取准法律过程评委会审议形式的评价模式。反对者模式十分重视听取关于教育方案和教育活动的争议意见,尤其是反对者的意见,这对各方面的情况能得到充分的反映提供保证。一般地说,这一评价的基本特点是它充分反映了各类人员“多元的”价值认识,是依靠人们直觉与经验的评价。 (4) 应答模式应答模式(responsive model)是由斯塔克(Stake,R.E.)首先提出,再由他人进一步发展而形成的。应答评价是通过评价者与同教育活动有关的各种人员接触,了解他们的愿望,然后把它同实际活动进行比较,对教育决策或立案做出修改,对大多数人的愿望做出应答,以使教育能满足各种人的需要。与泰勒模式相比,应答模式强调了“多元现实性”和价值观念的发散性。和斯克里文的观点一样,斯塔克认为,评价经验的内在价值比评价难以捉摸的收益有时更有意义。在方法上,它注重与科学主义相对的自然主义方法,强调了非正式的观察、交往、描述性的定性分析方法。 (5) 消费者导向模式消费者导向模式(consumer-oriented evaluation)是由斯克里文提出的。这里的“消费者”可以是教育活动的参与者或受教育者。根据斯克里文的观点,评价是对事物的价值和优缺点所作的系统判断,而非只测量事物或决定目标是否达成。评价者不应接受制订者提供的目标,而是要判断所达成的目标是否对消费者的利益有贡献。评价者须从消费者的观点来确认真正的成果,以及这一成果的价值。这一评价模式与泰勒模式、CIPP 模式的最大区别就在于:它做出评价结论的依据不是方案制订者的目标,而是活动参与者的意图。西方的评论家认为,这是一种较为民主的评价模式。(6) 自然探究模式我国台湾有些学者认为,自然探究模式(natural inquiry model)是课程评价的“新典范”。它是建立在现象学、解释学、日语言分析以及符号互动论基础之上的评价模式。自然探究模式认为人所生活的世界,是由人、事、时、地、物不断交织变化而成的世界,它构成了“意义之网”。格巴(Guba,E.)等人将这一观点归纳成了五点假设。作为一种评价模式,自然探究具有以下 14 个特点:自然情景的研究、以人为研究工具、重视隐约的知识、采取质的研究方法、以归纳法处理有关资料、据实理论的研究取向、逐步形成的研究设计、暂时性的研究结果、个案式的深度分析、暂时性的推论与应用、由“焦点’’决定研究领域、非约定俗成的效标。在评价资料收集上,自然探究广泛地采用了人类学的相互作用与非相互作用的资料收集法,这也是它的一个重要特点。此外,在西方现代教育评价理论中,还有医疗模式、费用一效果分析模式、分析软件包模式、EPIC 模式、CEMREL 模式以及爱特金森模式等等。第十一章 教学工作评价1. 网络教学评价网络教学评价具有传统教学评价的所有因素,而且还包括特有的对学习支持与服务系统的评价,具有评价及时、评价对象广泛、针对性强等特点。网络教学评价模型包括学生、教师、学习资料、网络教学支撑系统、学习支持与服务系统五大方面的评价,每一个方面都包括若干评价子项。2. 发展性教学评价的基本认识(1)教师唱主角的课不是好课 (2)面面俱到的课不是好课 (3)没有教师教学机智的课不是好课 (4)只是“教教材”,没“用教材教”的课不是好课 (5)中评不中用的课不是好课
3. 教学工作评价应该注意的问题在教学工作评价中,首先涉及的当是教学工作量与教学工作质的关系问题,如何合理地将两者综合评价,难度相当大。所谓教学工作量,是指教学工作中所付出的劳动量,它大多表现在工作过程中,如教师出勤率,备课所付出的时间,教学时数,评改作业和课外辅导学生人次数和时间,学科实践活动人次数和付出的时间,命题考试评卷所付出的时间,以及完成其他教学任务所付出的劳动时间。所谓教学工作质,是指教师完成教学工作的好坏或优劣程度,它既反映在教学工作过程中,也反映在教学工作的结果上,即反映在工作质量与工作效果上。由于教学工作量和工作质难以精确评价,一般只作大体估计和模糊描述。在教学工作评价中,注重教学工作量和工作质的分析评价的同时,还要考察教师工作的态度、自觉性、积极性等评价的隐性内容(这些内容也是影响教师工作过程和效果的中介变量),综合分析与教学工作量和工作质密切相关的各种因素,令教学评价逐步迈向科学化。其次,要注意好教学评价中他人评价和自我评价的关系问题。他人评价是一种外部的显性的评价,它通过外人对教师教学工作进行明显的(或看得见的众所周知的)统计分析或文字描述,可给教师教学工作进行“写真”。自我评价的过程有时是内隐性的,它通过思想内部的“反省”、“自查”、“检讨”、“总结”、“自判”等方式来进行;但有时也具有外显性,如给自己的教学工作评分,或写出自评报告,给自己的思想品德写出自我鉴定,等等。由于评价结果与被评者的荣誉或利益息息相关,加上许多人都有其不诚实的思想因素,因而自评往往不如他评结果可靠。总之,他人评价与自我评价各自有其独特的功能,它们的局限性可以互补。开展教学评价应将他人评价与自我评价有机地结合起来。第十二章 学校办学评价1. 学校办学评价的特点(1)地区性 (2)综合性 (3)复杂性第十三章 现代教育测量与评价的发展趋势1. 题目反应理论在哪些方面超越了经典测验理论?题目反应理论认为,一个人的行为举止就好像处于自身某些心理品质的定量控制之中,可以通过一组题目定量地估计个体在每一种特质上的位置。反之,可用所估计到的特质的量去预测和解释个体在相应情境中将会产生的行为反应。与经典测验理论相比,题目反应理论在以下方面取得突破。第一,参数比较稳定。经典测验理论使用的题目分析法所得的题目统计量数受样本的抽样影响较大。而题目反应理论的方法具有局部独立和参数独立等特点,题目参数估计是独立于被试样本和题目样本,因而后者的参数比较稳定。第二,能力的比较。经典测验理论对被试能力间的比较只能在相同的测验或平行复本的情况下进行。而题目反应理论是自适性测验或电脑自适应测验,它的处理较方便且灵活。第三,平行复本难实现。经典测验理论最基本的概念是测验的信度。而信度的设定来自平行复本的假设。但事实上平行测验是很难达到的,被试不可能在两次测验中得到完全相同的结果。影响测验结果的因素很多,如遗忘、学习新知识技能、动机及焦虑程度等。经典测验理论常依赖平行复本的假设,所以研究者在现实实施中只能接受下限的信度估计或具偏差的信度估计。第四,缺乏预测力。经典测验理论无法预测被试在一个新的测验中可能的表现。而题目反应理论使用概率的观念来表示被试能力与项目的关系表示具有某种能力的被试答对某题的概率 P。第五,测量标准误。经典测验理论是假定所有被试的测量标准误都是相等的。事实上,不难发现,不同能力组表现在测验上的稳定性是不同的。如施测几个复本,可能高能力组比中能力组稳定性高。良好的测验模式应能针对某一测验得分或被试能力进行精确的估计,不同的得分或能力有其不同的概率误差,而非统一的测量标准误。除此之外,经典测验理论在测验的设计、偏误题的认定、测验的等值问题上还没有得到满意的解决。
三、重点习题(一)填空题1、测量的要素包括 、 和参照点。2、与物理测量不同,教育测量数据大多数属于等级变量,是主观的,具有 和 。3、教育评价一般分为诊断性评价、 和 ,其中后两种评价应用比较广泛。4、现代学生评价更加强调了评价功能的形成性、 和 ,属于发展性评价。5、网络教学评价具有传统教学评价的所有因素,而且还包括特有的 评价,具有评价及时、评价对象广泛、针对性强等特点。6、学绩测验中的题目类型很多,根据被试作答的范围和评分方法不同,一般分为 和 两大类。7、认知过程涉及心理过程的全部范围,其中最基本的四种能力分别是观察能力、记忆能力、 和 。8、目前教师评价主要有以下类型: 、 和 。9、网络教学评价模型包括学生、教师、学习资料、 和学习支持与服务系统。10、学校办学水平评价具有地区性、 和 等三个主要特点。(二)判断题( )1、效度最重要特征是内容上的涵盖。( )2、测验题目的难度必须根据测验的目的确定和评价。( )3、某学生在数学考试中得了 90 分,在语文测验中取得 85 分,所以说这位同学的数学比语文好。( )4、客观题的评分标准客观、具体,但是它所能考查的内容具有一定的局限性。( )5、正确使用测验结果的关键是要认识到教育测量与评价的有限性。( )6、一个五年级的学生获得的年级当量为 6.2,表明其表现超前预期水平 6 个月零 2 周。(三)选择题( )1、仔细分析,下面哪一种效度是衡量推论有效性最全面的指标? A.内容效度 B.预测效度 C.同时效度 D.结构效度( )2、设你是一位教师,你想要提高学生较高层次的思维能力,那么下面分类的哪个领域是你最关心的?A.认知领域 B.情感领域 C.运动技能领域( )3、在教学开始之前,为了摸清学生现有的水平和个别差异,了解学生对新学习的准备情况,教师常常进行A.形成性评价 B.总结性评价 C.安置性评价 D.诊断性评价(四)简答题1、如何确定测验的题型?2、列举提高测验信度的几种方法。3、简述教育评价的特点,并以学生评价为例论述教育评价的原则。4、人格的主要内容有哪些?5、经典智力观与传统智力测验之间的联系与区别是什么?(五)论述题1、列举课程方案评价的主要模式,并做简单的评述。2、题目反应理论在哪些方面超越了经典测验理论?四、重点习题参考答案(答案仅供参考)说明:本部分内容只给出了重点习题答题要点,学习者需要在此基础上,结合教材中对题目相关知识