教育测量与评价详解

合集下载

教育测量与评价第二讲

对教育测量学的建设与发展做出了巨大贡献。
24
❖ (1)任何现象只要是存在的总有数量 ❖ 这个原则是由美国心理学家桑代克(E.L.
Thorndike) 提出的。他说：“凡物的存在必有其数量。”人的心理现象虽然看不见，摸不着，但它是客观存在的现实，是脑这块高级物质的属性，它也有数量的差异。 ❖ 例如，人的智力有高低之分，学生的学习成绩有优劣之别。这高低之间、优劣之间，存在着程度的不同。所谓程度不同，就是数量的不同。
9
❖ 在数学上，函数就是把某一集合中的事物分派到另一集合事物之上的规则。可以说，任何测量都呈现函数关系，而任何函数关系都是建立一种顺序配对的集合。
❖ 一般来说，具体且稳定的事物属性，如性别、身高、体重等，其测量的规则就易于建立和使用;抽象且易变的事物属性，如人的智力、知识、技能、人格、态度等心理属性，其测量规则就难以制定和使用。
测量的事物属性的不同，有时并不需要让数的各种特性同时具备。当然，能多具备一些更好，因为测量中运用数的效果，确实也与这些数所包括的特性多少相关联。
7
❖ 假如我们能用数合理地描述事物的属性，并且在允许的条件下，对数进行运算，我们就可以通过运算的结果，对所要测量的属性进行推测。如果事物的属性和数的系统之间，在性质上或形式上存在着高度的类似性，我们就可以用数来描述事物的真实情况。
10
（二）四种测量量表
❖ 量表一般称为测量工具。 ❖ 1、名称量表—（类别量表）最低水平的一
种量表 ❖ 它只是用数字表明事物的类别或性质不同而
已，没有任何数量大小的意义，不能作数量化分析，也不能将之进行加减乘除运算。 ❖ 即属于同一类的事物用同一个数字表示，属于另一类的事物用另一个数字表示。用来描述各类事物的数字仅仅是事物的名称：它只具有相同与不同的特性，没有数量大小的含义。用这类数字表示的量表叫名称量表。

教育测量与评价

（6）若答案是数字，应指明单位和数字的精确程度。
3.填空题类型
（1）简释题就是通常的名词解释题，要求被试用简单，明了的词语将名词或概念解释清楚。
（2）直接问答题就是让被试对所提出的问题进行解答。例如，“文化大革命”的实质是什么？
（3）列举题就是要求被试根据要求范围列举出事或物，并略作说明。例如，请列出教育测验中常见的选择题型。
简答
制定教育评价表的方法
(1)确定教育评价的对象和目标
(2)初拟评价指标
(3)筛选评价指标
(4)确定评价指标权重
第六章、教育测验的常模及其建立方法
名词解释
1、常模：它是指一个有代表性的样组在某种测验上的表现情况，或者说，是一个与被试同类的团体在相同测验上得分的分布情况与结构模式。
填空
测验的常模可分成两类，一是发展常模，二是组内常模。
第一章、教育测量与评价的学科发展
填空
用数字对事物在量上的规定性予以确定，就需要有一个测量或计算的起点，这个起点叫参照点。
量表，指的是确定了测量单位和参照点并具有取值系统的测量工具。
泰勒指出
英国剑桥大学直到1720年才开始使用笔试。20世纪初，在桑代克的影响下
名词解释
教育测量：就是针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。
2为了帮助学生达到教育目标，应当提供什么学习经验，即怎样帮助学生学习预期的东西。
3怎样组织学习经验，以使这些经验的累计效果最大，即怎样的学习顺序和学习经验的整体计划会有助于学生内化他们所学之物，并将其应用于适当的环境。
4怎样评价方案效果，即随后采取什么步骤，以不断检查期望的学习活动所发生的变化。
美国的“八年研究”对传统的教育测验提出的一些批评

教育测量与评价的基本理论

教育测量与评价的基本理论教育测量与评价是指对教育活动进行系统观察、衡量和评估的过程，通过对学习者、教学内容和教学环境的测量，用于了解教育目标的达成情况、教学质量的提高与改进以及教育政策的制定和调整。

它是教育领域中的重要理论和实践，为教育决策提供科学依据。

1.测量理论：测量理论是教育测量与评价的基础，它研究如何将可量化的教育目标转化为能被测量的指标。

测量理论主要包括传统测量理论和现代测量理论两个方面。

传统测量理论强调测验的可靠性和效度，可靠性是指一个测验在确定条件下能得到相似结果的程度，效度是指测验能否真实地反映被测对象的特征或能力。

传统测量理论通过统计方法对测试结果进行分析，包括计算信度系数、相关系数等。

现代测量理论强调以潜在变量为中心，认为教育目标不同于一般的观测指标，而是通过观测指标的背后的潜在变量来描述的。

现代测量理论包括因素分析、结构方程模型等方法，能够更准确地描述教育目标和评价对象之间的关系。

2.评价理论：评价理论是研究如何对测量结果进行综合和判断的理论体系。

评价理论主要包括定性评价和定量评价两个方面。

定性评价注重对教育活动进行质性分析，通过观察、访谈、文献分析等方法获取和理解相关信息，从而对教育活动进行综合评价。

定性评价强调了对于教育过程的深入了解和真实反映。

定量评价注重对教育活动进行数量分析，通过数据收集和统计分析来评估教育活动的效果。

定量评价通过数值化的方法对数据进行处理和解释，能够进行更加准确的比较和判断。

3.教育测量与评价模型：斯兰贝格模型是对教学质量进行综合评价的模型，它将教育目标、教学过程和学生学习效果三个方面的指标进行综合评价，从而得出教学质量的综合评定。

塔伦斯模型是对教师教学能力进行评价的模型，它将教师的知识和技能、教学过程和学生学习结果三个方面的指标进行评价，从而得出教师教学能力的评估结果。

布鲁姆分类模型是对学习者学习效果进行评价的模型，它将学习者的认知、情感和技能等方面的指标进行评价，从而得出学习者的学习效果。

教育测量与评价

1、阐述教育价值、教育价值观的概念及类型并阐明教育价值、教育价值观、教育评价三者的关系教育价值：教育价值指作为客体的教育现象的属性与主体需要之间的关系，是教育活动对于主体的效用。

按照教育与主体关系的不同划分，教育价值包括两个方面：从教育与人的关系来说，教育对促进人的发展需要的满足称为教育的内在价值，从教育与政治社会的关系来说，教育对社会需要的符合和满足称为教育的工具性价值，教育符合并促进社会的发展是以教育培养社会需要的人为出发点和归宿的。

教育价值观：教育价值观是个体（个体或社会）对教育价值关系的概括性认识。

或者说，是主体对各种各样的教育价值孰重孰轻所做的认识与排序。

教育价值观的类型：本体价值观：个体本位工具教育价值观：社会本位教育评价：是按照一定的教育价值标准，通过系统收集有关信息，对教育活动诸因素满足社会发展和个体发展需要的程度做出判断的活动。

教育价值、教育价值观、教育评价三者的关系（仅做参考）教育价值与教育价值观：教育价值就是教育作为一种实践活动满足主体的需要和效用关系，教育价值观即“从价值的角度看教育”。

教育作为一个有意识的活动，其必然体现施教者的价值意识，也即施教者对教育的价值期望。

所以教育价值并不仅是一个事实系列，而更是一个认识系列。

教育价值作为关系范畴是客观的，但教育价值取向作为认识范畴不是绝对和固定不变的而是相对和变化的。

在教育的过程中由于主体的不同，对教育价值实现的期待也是不同的，教育过程实际上存在着四个主体及其教育形式：政府作为主体的学校教育、受教育者的相关人（父母）作为主体的家庭教育、受教育的个体（学生）作为主体的自我教育、还有一个重要的泛化主体———社会意识作为主体的社会教育，这四个主体的教育价值观构成了左右教育价值客观存在的至关重要的因素。

学校教育价值的实现和实现的程度是不同主体教育价值观相互博弈、相互作用的结果。

当不同主体的教育价值取向同质并合拍时，学校教育价值的实现就会顺畅，否则，学校教育价值的实现必然会遭遇“观念阻滞”而实现困难。

教育测量与评价解答

测量的三要素1，参照点：为测定事物的量，事先确定的计量起点2，单位：实施测量必须有统一的单位3，量表：有单位和参照点的数字连续体，是测量的工具。

教育测量的特点测量结果的间接性和推断性测量对象的模糊性和测量误差的不可避免性测量量表的多样性和结果的相对抽象性教育评价的功能1、诊断功能2、改进与形成性功能3、区分优良和分等鉴定功能4、激励功能5、导向功能教育评价与教育测量联系：教育测量是教育评价的基础，教育测量是对教育进行量的测定，所获得的结果是教育评价所需信息的主要的、可靠的来源，是对教育的状态和价值进行客观判断的前提；教育测量的结果只有通过教育评价这个环节才能获得实际意义，否则便成了一堆抽象而枯燥的数字。

区别：着眼点不同：教育测量：为了取得数据；教育评价：要分析解释，对教育价值作出判断。

特点不同：教育测量：纯客观的过程，具有客观性特点；教育评价：具有客观性与主体性相结合特点。

复杂程度不同：教育测量：对教育数量化的描述，关心量的获得，活动较为单一；教育评价：着眼于事物质的判定，含定性与定量分析，活动是多重的。

教育测量与评价的类别按测量与评价在教学中运用的时机分类1、形成性测量与评价：如中小学单元测验2、诊断性测量与评价3、终结性测量与评价：如期末考试2、按解释测量结果或评价结果时的参照点分类常模参照测量与评价标准（目标）参照测量与评价潜力参照测量与评价3、按测量与评价被试行为表现的性质分类最佳行为测量与评价：如教学后的考试、升学考试典型行为测量与评价：如人格测量、态度测量4、按测量与评价的内容分类智力测量与评价能力倾向测量与评价成就测量与评价人格测量与评价5、按测量对象分类个别测量与评价团体测量与评价6、按测验材料分类文字测验非文字测验教育测量之父：桑代克教育评价之父：泰勒教育评价产生的标志是“八年研究”（1933-1940）信度：指测量结果的稳定性或可靠性程度采用不同的方法来计算相关系数，就会得到不同类型的信度指标：重测信度、复本信度、分半信度、同质性信度、评分者信度。

教学测量与评价

一、基本知识和概念1. 教育测量的三个基本要素是测量的量具、测量的单位、测量的参照点。

2.信度和效度：信度指的是测量结果的稳定性和可靠的程度，亦即测量的结果是否真实、客观地反映了考生的实际水平。

效度是指测量的有效程度，也即一个测验或量表实际能测出其所要测量的特性的程度。

3.效标关联效度：是指测验分数预测我们所关心的外在行为的准确程度。

4.评分者信度:指的是多个评分者给同一批人的答卷进行评分的一致性程度5.区分度：区分度是项目对受测者心理特质的区分能力的指标，它反映了项目鉴别好、坏受测者的能力程度，也在一定程度上反映了测验项目的有效性。

5.难度值（P）与难度成反比。

难度值越小，难度越大。

P=答对该题的人数/ 被试人数6. 教育评价是以教育目标为标准的价值判断过程。

7. 形成性评价和终结性评价：在学生评价中，形成性评价主要在于不断地反馈学生学习成功或失败的信息。

它特别注重强化学生的成功之处，显示学生学习过程中需要改进的具体的学习错误。

终结性评价是对教学目标达到程度的判断，同时也是提供教学目标适当性与教学策略有效性的信息。

8. 相对评价和绝对评价：相对评价是在被评对象的集合总体中选取一个或若干个对象作为基准，其余对象与基准进行比较的评价。

在相对评价中，个体的评价结果往往依赖于其它个体的表现。

绝对评价是将被评对象与被评对象集合外的客观标准进行比较以判断达标程度的评价。

9.百分等级：是把学生的原始分数放在该学生所在群体的成绩中进行比较，一确定该生的成绩在群体中的相对地位。

假如某学生在期中语文统考中卷面分数为75分，又知该生所在年级中有80％的学生成绩低于75分，我们可以表达该生的百分等级为80。

10. 标准参照测验与常模参照测验按测验的参照标准，测验可分为常模参照测验和标准参照测验。

所谓常模就是测验团体的平均水平。

常模参照测验以鉴别、区分学生为目的，依据反映个别差异的实际分数分布对测验结果进行解释。

标准参照测验：所谓标准，就是独立于测验的一套外在的预先规定的某种标准。

ch01教育测量与评价概述

–从教育背景、投入、过程、效果等各方面的人和物 –各有关的活动与现象
12
教育评价的含义
泰勒：教育评价过程在本质上是确定课程和教学大纲实现教育目
标的程度的过程。
布卢姆：评价而是系统收集证据用以确定学习者实际上是否发生
了某些变化，确定学生个体变化的数量或程度。
克龙巴赫：收集和使用教育信息以对某个教育项目进行决策。
教育评价即：……
• 根据一定的标准（教育目标的达成与否） • 运用可行的方法（测量、非测量、系统收集资料信息的方法） • 对教育的要素、过程和效果（教育计划、课程、学习结果、教育现象、教学活动、教育目标或程序） • 进行价值评判的活动（为学生发展、教育决策等）
11
教育评价的含义
–进行教育评价的基准：正确的教育价值观
单位：实施测量必须有统一的单位
具有明确的意义，即：大家对同一个单位的理解一致测量过程中单位“距离”的不变性，即：单位的实际价值处处相同
量具：测量工具
具有准确性具备操作的简约性教育测量工具：试卷测试题重视命题的研究量表：根据测量目的所设计的测试项目和赋值规则
Ch1
教育测量与评价概述
1
主要内容
第一节第二节第三节
教育测量与评价的含义教育测量与评价的发展历史教育测量与评价的主要类型与功能
2
第一节教育测量与评价的含义一、教育测量的含义
测量：含义、要素、类型、量表教育测量：含义、特点
3
测量的含义
斯蒂文斯（Stevens，1946）：根据法则给客体或事件
主要评价/鉴定人的发展状况，还是主要为促进人的发
展而评价？
如果是为促进人的发展而评价，就不一定非得评价人的发展，而且很可能就不能评价人的发展，而应当评价为促进发展而展开的课程、教学或其它组织变量如果是为促进（而非鉴定）发展而评价，评价就应当指向过程，而不是简单指向教育者事先预设的目标或终点的事态

教育测量与评价

目录分析
这一章重点探讨了学生评价的各个方面，包括学生知识技能的评估、情感态度价值观的评价以及学生综合素质的评价等。通过科学的评价，可以更好地了解学生的学习状况和需求，为进一步的教学提供依据。
目录分析
这一章通过具体的案例分析，展示了教育测量在实践中的应用。这些案例涵盖了不同领域和层次的教育，有助于读者更好地理解和应用教育测量的知识。
这一章重点介绍了教育评价的各种方法和技术，如量表评价法、观察法、问卷调查法等。通过了解这些方法和技术，读者可以更好地选择适合的评价工具来评估学生的学习成果。
目录分析
这一章主要讨论了课程评价和教师评价的相关内容，包括课程目标的制定、课程实施的评价以及教师教学质量的评估等。这些内容对于提高教学质量和优化课程设计具有指导意义。
阅读感受
阅读这本书还让我认识到教育测量与评价的重要性和必要性。教育测量与评价不仅可以帮助我们了解学生的学习状况和表现，还可以帮助我们评估自己的教学效果和水平。通过教育测量与评价，我们还可以发现自己的不足和缺点，及时进行反思和改进。因此，教育测量与评价是教育教学过程中必不可少的一部分，它可以帮助我们更好地实现教学目标和提高教育质量。
目录分析
这一章对教育评价的未来发展趋势进行了展望，包括评价理念的更新、评价技术的创新以及跨学科领域的融合等。通过了解这些趋势，读者可以把握教育评价的发展方向，为进一步的研究和实践提供指导。
目录分析
通过对《教育测量与评价》这本书的目录分析，我们可以看到其内容涵盖了教育测量与评价的基本概念、原理、方法和技术以及应用案例等多个方面。这本书不仅为读者提供了丰富的理论知识，还通过具体的案例展示了教育测量的实际应用价值。因此，对于从事教育领域的工作者、研究者以及学生来说，《教育测量与评价》是一本非常有价值的参考书籍。

教育测量与评价

第一章、教育测量与评价的学科发展教育测量与评价一.教育测量1、测量:根据法则给事物赋予数量。

(史蒂文斯)测量：客观事物及其属性；所依据的规则或方法；数量化的结果。

2、教育测量：广义：对于教育领域内的事物或现象，根据一定的客观标准，作缜密地考核，并依据一定的规则将考核的结果予以数量的描述。

第一，测量是对事物数量特征的获得。

而教育评价则是对教育现象客体的价值进行判断。

第二，教育测量是一种纯客观的过程，其突出特点是客观性。

而教育评价则具有两种属性，即客观性和主观性第三，测量的任务是对事物的量的认识，而评价作为一种认识活动，是人的意识对实践活动及其结果的综合反映，它反映的是活动的过程和终点，又是新的实践活动的起点。

教育测量与评价的产生与发展过程：一.教育测量的产生1904年以前（教育测量的萌芽期）中国的科举制（隋炀帝大业二年，公元606年）科举制的特征：逐级考核、制度完备、考场严格、命题规范科举制的考核方法：口试、贴经、墨义、策间、诗赋产生在中国、发展在西方美国贺拉斯曼1845年将“笔试”引入美国英国费舍在1864年《作业量表集》美国赖斯在1897年的《拼字实验》1904—1915年教育测量的开拓期：美国桑代克的巨着《精神与社会测量导论》问世。

标志着以科学理论为指1、教育评价产生的社会背景：1929—1933年席卷美国、波及全球的经济大萧条社会与教育危机四起生产过剩、工厂倒闭、工人下岗学校因经济不景气，部分学校关闭，有些学校的班级减少。

整个社会和教育皆处于反省之中1930年美国有25%的失业，青年近乎100%找不到工作，1910年14—17岁的青年17%上大学，而到1930年上升到51%。

有相当一部分人上高中并不想上大学，而当时的美国高中设课就是为了上大学服务的，为此中学设课与失业青年的需求就产生了尖锐的矛盾2、教育评价的起源：美国进步主义联盟负责人艾钦于1933—1940年领导了中学课程改革实验研究，其中课程评价委员会由俄亥俄州的州立大学教授泰勒主持，这就是美国教育历史上着名的“八年研究”，也是教育评价问世的开始。

教育测量与评价

教育测量与评价教育测量与评价教育测量和评价是教育领域的重要内容之一，其核心是为了帮助教育实践者获得有关学生学习成果的反馈信息。

通过测量和评价，教育工作者可以更加有效地了解学生的学习情况，及时调整教学策略，实现最大的教学效果。

教育测量教育测量是获得关于学生学习成果的量化或定性信息的过程。

教育测量包括两个方面，即测验和问卷调查。

测验是一种主要的教育测量工具，可以用来测试学生的知识、技能和态度等方面的学习成果。

问卷调查是另一种常见的教育测量方式，可以用来收集学生的反馈信息，如学生的学习体验和感受等。

教育测量有许多优点。

首先，教育测量可以提供关于学生学习成果的客观信息。

其次，教育测量可以帮助教师更好地了解学生的学习成果，及时调整教学策略，提高教学效果。

此外，教育测量还可以为教育决策提供有用的信息，如制定教学计划和制定政策等。

教育测量也存在一些限制。

首先，教育测量可能会存在误差，如测量工具的不准确性和学生答题时的心理状态等因素。

其次，教育测量不能完全覆盖学生的整体学习情况。

最后，教育测量的结果也可能会被误解或误用。

教育评价教育评价是对学生学习成果进行审查、判断和评估的过程。

教育评价的目的是为了了解学生的学习成果，在此基础上提出改进建议以及未来的学习指导。

教育评价通常包括两种形式，即内部评价和外部评价。

内部评价由教师和学校内部进行，目的是为了了解教学效果，及时调整教育教学策略。

外部评价由外部专家进行，如政府和教育机构等，其目的是为了衡量学校或学生的学习成果。

教育评价有许多优点。

首先，教育评价可以帮助学校更好地了解学生的学习成果，评估教学效果，并采取相应的措施来提高教学质量。

其次，教育评价可以为学生提供针对性的服务和指导，帮助他们更好地学习。

最后，教育评价还可以为教育决策提供有用的信息。

教育评价也存在一些限制。

首先，教育评价结果可能会被误解或被用于不正当的用途。

其次，评价工具可能存在不准确性的问题，如评价工具的标准不明确或不公正等。

教师资格证的教育测量与评价重点解析

教师资格证的教育测量与评价重点解析教师资格证是评价和认定教师专业水平的一项重要证书，它是对教师教育能力的权威评价。

而教育测量与评价则是评估教师专业能力和学生学习成果的重要工具和方法。

本文将从教育测量与评价的概念、教师资格证中测量与评价的目的和方法、以及教育测量与评价在教师培养中的应用等方面进行重点解析。

一、教育测量与评价的概念教育测量与评价是以科学的、系统的方法来收集、分析和解释与教育相关的各种数据，从而对教育过程和教育结果进行评估和判断的一门学科。

它旨在通过量化和分析来获得客观的教育信息，为决策者提供科学依据，帮助改进教育质量和教学效果。

二、教师资格证中测量与评价的目的和方法教师资格证的核心目的是为了评估教师的专业能力和教学水平，以保证教师的专业素质符合教学要求。

为了实现这个目的，教师资格证的测量与评价需要使用多种方法和工具，包括考试、观察和评估等。

1. 考试教师资格证考试是评价教师专业能力的主要方式。

这种考试通常包括笔试和面试两个环节，通过考察教师的学科知识、教育理论和教学技能等方面来评估其专业水平。

考试的内容涵盖了教师所教授的学科知识和相应的教学方法，考试结果直接影响着教师是否能够取得资格证书。

2. 观察观察是评价教师教学行为和教学效果的重要方法。

通过对教师的教学过程进行观察，可以获取教师的教学技能、师德师风以及学生对教学的反应等信息。

观察一般分为课堂观察和教学设计观察两种形式，通过对教师的表现和教学设计的分析来评价教师的教学能力和教学质量。

3. 评估评估是对教师教学成果和学生学习成果进行系统分析和判断的过程。

它可以通过考试成绩、学生作品、教学评价等方式来评价教师的教育效果。

评估的目的是为了提供改进教学的建议和指导，帮助教师提升自己的教学水平。

三、教育测量与评价在教师培养中的应用教师培养过程中，教育测量与评价在各个环节起着至关重要的作用。

1. 招生选拔教育测量与评价可以作为教师招生选拔的重要依据。

教育测量与评价(简答题和名词解释)

教育测量与评价（简答题部分）什么是表现性评价：一种性质的评定方法新型的更加直接的考察学生综合运用的知识、解决实际问题能力的方法，在促进学生发展和改进教学方面有显著作用表现性评价 1优点：有助于测查学生综合运用所学知识解决实际问题的能力优化教学过程，使学生的能力尽可能得到发展激发学生的学习动机，为终身学习打基础注重知识技能的整合与综合运用复杂的任务表现教学性评价与教学活动有密切的联系2缺点：信度问题效度问题实用性问题耗时过多不能评价所有类型的学习目标高利害评使用表现性评价就要十分谨慎品德测试的意义：有利于学生思想上的自我教育和学校德育工作的顺利进行激励先进和鞭策后进有利于学生德育管理德育和行为科学研究的重要手段品德测评的类型：诊断性形成性总结性品德测评的基本要求：外显行为测评和道德认识测评相结合单项测评和整体测评相结合定向性测评和定量测评相结合测评指标体系确立的依据：社会的需要德育大纲德育结构学生年龄特征测评基本要求：重视指标体系的开放性教育性处理好普遍性和特殊性的关系稳定性和发展性的关系统一性的灵活性的关系品德测评的方法、运用：定时考核（学生成绩测量）问卷测评（问卷或量表测试）项目评分（设置一些测试的项目，给予一定的分数，对学生的思想和行为表现进行测量）情景测验（设计情景，展开活动）社会关系测量（通过学生回答，来了解学生的人际关系）意向测评法（Q技术、和语义分析）行为观测法（有目的有计划的考察学生思想行为）教师评价的特点：是一个活动过程，一个特殊的连续活动，包括一系列的方法和步骤有目的有计划的活动过程根本目的在于形成价值判断，进而做出选择评价者与被评价者是同一的教师评价的主体：行政部门、学校、教师参评（教育行政部门依法对教育人力支援进行管理对教师的考核人工作进行指导和督导有助于提高教师的信度与效度）学生参评（是教学过程中的主体，直接承受着教师教学效能的影响）家长参评（家长是教育的投资方，间接的把学生的意见反馈给教师的有效手段）教师自评的意义：鼓励教师积极主动的进入评价角色增加教师评价的信度自我评价其实是教师自我反思、自我教育、激发内在动因的过程和自我提高的过程教育评价的模式:实证范式评价（行为目标评价操作主意模式）人文范式（发展性评价模式自主性评价模式团体性评价模式教师校本）教师评价程序：确定目的确定评价者制定指标体系确定评价方式评价过程的实施指标体系的构成：素质评价指标（教师实施教育教学的基础）职责评价指标（实施教育教学的关键）绩效评价指标（最终目标教师评价过程：教师自我评价和学校评价教师评价主要工具：工作评估报告（1工作评估报告表：教师个人资料评价专家资料目的评定签字2评估具体内容3观察、总结）教师评价案例：日本1教师与校长、教导主任会面，确定自己的教学目标、教学方向，并就完成程度做自我评价2教导主任做第一次评估，校长通过观摩教师授课进行最终评估3评估综合评估过程中参考家长和学生的意见。

教育测量与评价

3、折半信度（分半信度）
• 就是将测验分半，再求被试在每一半测验上所得分数的相关系数。 • 首先根据内容、形式、题数、平均数、标准差、难度、测题间相关以及分布形态相等的原则，将试题分成两半，或者将从易到难排列的测题，按照测题序号，奇数测题为一组，偶数测题为一组，分成两半； • 然后计算每个被试在两个分半测验分数的积差相关系数，再用斯皮尔曼—布朗公式加以校正。 • 斯皮尔曼—布朗公式为
教育测量与评价
海南师范学院教育系
黄秀兰
第一章教育测评概述
• • • • • • • 一、教育测量（一）测量的定义测量是根据法则给事物分派数字。（史蒂文斯）测量这一定义包含了三个要素： 1、法则——给事物的属性分派数字的依据 2、事物属性——测量的对象或目标 3、数字——描述事物属性的符号
（二）四种测量量表
2、教育评价与教学评价
• 联系： • 教学评价是以教学为对象的教育评价，只是教育评价的一个方面，用逻辑学术语讲，教育评价是一个上位概念，而教学评价仅是一个下位概念。 • 区别： • 教育评价的范围比教学评价要广得多，它不仅关注教学评价，还有学校管理评价、教师评价、学生评价、课程评价、总务评价等等。
例三
• 对初中一年级学生进行地理成绩测验，每答对1题得1分，答错1பைடு நூலகம் 得0分，其测验结果如下表，试估计该测验的折半信度？ • 学生序号题序 • 1 2 3 4 5 6 • 1 1 0 0 0 0 0 • 2 0 0 0 1 0 0 • 3 1 0 1 0 0 0 • 4 1 1 0 0 1 0 • 5 1 0 0 1 0 0 • 6 1 1 1 0 1 1 • 7 1 1 1 1 0 1 • 8 1 1 0 1 1 0 • 9 0 1 1 0 0 1 • 10 1 1 1 1 1 1

教育测量与评价_

教育测量与评价_教育测量与评价是教育学中的重要分支领域之一，主要研究针对学生的学习情况和学业成绩进行量化的方法和工具，以及对学生学习情况进行评价的方法和标准。

下面将重点从测量方法、评价方法和评价标准三个方面进行探讨。

一、测量方法1.主观测量方法：主观测量方法主要依靠人的主观判断和评价，例如教师的评价、学生的自评等。

这种方法的优点是能够全面了解学生的学习情况，但由于主观因素的介入，可能存在一定的不客观性。

2.客观测量方法：客观测量方法主要采用定量的数据进行测量，例如考试成绩、实验数据等。

这种方法的优点是数据具有客观性和可比性，但忽略了学生个体差异的因素。

3.综合测量方法：综合测量方法主要采用主客观相结合的方式进行测量，例如学科考试、问卷调查等。

这种方法既能够考察学生的知识和能力水平，又能够考虑到学生的个体差异。

二、评价方法1.绝对评价方法：绝对评价方法主要将学生的学习情况与一定的标准进行比较，评价学生的学习成绩是否达到了一定的水平。

这种方法的优点是评价结果具有客观性，但缺点是可能会忽略学生的进步和个体差异。

2.相对评价方法：相对评价方法主要将学生的学习情况与其他学生进行比较，评价学生的学习成绩在整体中的位置。

这种方法的优点是能够反映学生的优势和劣势，但缺点是评价结果可能受到其他学生水平的影响。

3.格式评价方法：格式评价方法主要通过考试、测验、作业等标准化的方式对学生进行评价。

这种方法的优点是评价结果具有可比性和客观性，但缺点是忽略了学生的其他能力和素质。

三、评价标准1.知识与理解：评价学生对所学知识的掌握程度和对基本概念的理解能力。

2.运用与分析：评价学生的运用所学知识解决实际问题的能力和对问题进行分析和归纳的能力。

3.创新与批判：评价学生的创新思维和批判思考的能力，包括学生对问题进行提问和反思的能力。

4.合作与沟通：评价学生的合作和沟通能力，包括学生与他人合作解决问题和表达自己观点的能力。

5.情感与态度：评价学生的情感与态度，包括学生对学习的兴趣和积极性、对教师和同学的尊重等。

教育教学工作的教育测量与评价

目的：客观、准确地测量学生的学习情况和能力
问卷调查法
目的：收集教育测量数据，了解教育效果
设计问卷：明确目标，设计合适的问题
发放问卷：选择合适的人群，确保样本代表性
数据分析：对收集到的数据进行处理和分析，得出结论
观察法与作品分析法
作品分析法的优点：全面、深入、有创意
观察法的优点：直接、真实、客观
作品分析法：通过分析学生的作品（如作文、绘画、手工等）来收集数据
诊断功能：帮助教师了解学生的学习情况，发现问题，及时调整教学策略
激励功能：通过评价结果，激发学生的学习积极性和自信心
反馈功能：向教师和学生提供关于教学效果的反馈信息，以便改进教学
导向功能：引导教师和学生关注重要的教学目标和内容，提高教学质量
教育评价的类型
诊断性评价：了解学生的学习状况，发现问题，改进教学
添加标题
设计评价方案与工具
添加标题
确定评价目标：明确评价的目的和意义
添加标题
设计评价指标：根据评价目标，制定具体的评价指标
添加标题
选择评价方法：根据评价指标，选择合适的评价方法
添加标题
制定评价标准：根据评价方法和指标，制定评价标准
添加标题
设计评价工具：根据评价标准，设计相应的评价工具
添加标题
实施评价：按照评价方案和工具，进行评价活动
综合化：综合运用多种教育测量方法，提高测量的全面性和准确性
实时化：实时收集学生的学习数据，及时调整教育测量策略
个性化：根据学生的学习特点和需求，提供个性化的教育测量方案
THANK YOU
汇报人：
05
分析数据：对收集到的数据进行分析和解释
06
反馈与改进：根据评价结果进行反馈和改进

教育测量与评价

教育测量与评价一、引言教育测量与评价是教育领域中的重要议题之一。

测量与评价在教育中有着广泛的应用，包括学生学习成绩的评价、教师教学效果的评价、教育机构的评价等。

教育测量与评价是一个复杂的体系，包括了测量理论、测试设计、评分与解释、教育统计学等多个方面的内容。

本文主要是对教育测量与评价进行系统的介绍，包括测量理论中的信度与效度，测试设计与评分与解释，以及教育统计学中的基本概念和数据分析技术。

通过本文，读者可以了解到教育测量与评价的基本概念，以及如何应用这些概念来进行实际的教育测量与评价工作。

二、测量理论测量理论是教育测量与评价领域中的核心内容。

它主要涉及到测量的信度与效度问题。

1. 信度信度是指测量结果的稳定程度或一致性。

在教育测量中，信度是指同一测试在不同时间或不同测量环境中所得到的结果之间的稳定性或一致性。

信度越高，说明测量结果的稳定性越高，我们就越能够信任这个测试结果。

常用的测量信度指标主要包括重测信度（test-retest reliability）、平行测试信度（parallel forms reliability）和内部一致性信度（internal consistency reliability）等。

2. 效度效度是指测量结果的有效程度或准确性。

在教育测量中，效度是指测试结果与被测试者实际表现之间的关联程度。

效度越高，说明测试结果与实际表现之间的关联程度越高，我们就越能够相信这个测试结果。

常用的测量效度指标主要包括内容效度（content validity）、判别效度（discriminant validity）和相关效度（concurrent validity）等。

三、测试设计测试设计是教育测量与评价的重要组成部分。

它主要包括测试目的、测试格式、测试内容、测试难度和测试质量等方面的设计。

1. 测试目的测试目的是测试设计的第一步。

在设计测试时，我们需要明确测试的目的。

测试目的可以是诊断性的、评估性的、选举性的或预测性的等。

教育测量与评价详解

·判断学生发展个体差异，维护正常教育秩序
3.对学校的管理
建立对学校教育评价制度和办学状态信息监测制度，实现宏观管理
4.对教育过程的管理
利用教育测量评价，及时全面的掌握教育各种情况，发现教育中存在问题，对教学任务完成数量和质量进行控制
5.对教育目标和质量的管理
·通过对现状与目标之间的差距进行判断，有效促进被测量与评价对象不断接近预期目标 ·为学校指明办学方向、为教和水平进行监测控制
三、促进学生学习的功能
1.明确目标，增加学习动力
·有测试和考试就有压力和目标、 ·由事先公布的考试和评价方案，使学生明确学习内容和努力方向如：高考根据教育部公布的考试大纲，学生重点学习大纲内容 ·测量和评价可以将学生学习情况反馈给学生
2.了解自我，改变学习方案
如：
期中考试成绩公布后，小明发现自己数学某一章节的知识点略显陌生，运用不太娴熟，导致数学考试成绩不理想
小明通过自我了解反思，调整了学习方案，下一次月考，小明数学成绩有了明显提高
四、行使教育管理的功能
1.对教师的管理
·教师资格评定 ·教师教学艺术水平评定 ·教师管理水平评定 ·教师个性评定专业知识教学能力班级管理教师资格和教学艺术水平
2.对学生的管理
·教育测量具有一定的导向性和威慑性 ·对学生进行规划和“束缚”
2.事实判断的功能
·个人素质和努力程度不同，其学习情况和发展情况不同
·利用测量和非测量等方法系统收集资料，对被测对象的某种属性、行为表现作出符合事实的判断
·教育工作者可以作出相应的合理的教育决策和判断
3.价值判断的功能
·把事实判断的结果联系外部的某种价值体系或标准，再对事物或人的属性作出价值分析、判断和描述 ·价值判断往往建立在事实判断基础上，但事实判断较为写实，价值判断往往具有社会性

教育测量与评价第一章

单位
–理想测量单位的条件： (1)具有确定的意义； (2)
具有相等的价值，即等距，它是进行加减运算的必要条件。
测量的结果是用数字来表示，这样在同一个属性上，如和长度上，不同的物体所得到的数字不同，比如有的是160cm，有的是170cm…… 这些不同的数字可以组成一个连续的序列，这个序列就叫量表。有了量表，我们就可以看个体在量表中所处的地位，从而得到这个人的身高。同样，我们有了智力量表，就可以根据个体在智力量表中的分数，可以知道它的智力水平的高低。
教育测量与评价
导入课程
量体温、称体重这类活动有什么共同特点？
– 都有一定的对象：量体温的对象是人的体内温度属
性；称体重的对象是人的重量属性。 – 最终都用数字来表示结果。如身高是160cm，体重是50kg。 – 都要采用一定法则编制的工具，量体温是采用热胀冷缩的原理做成的体温计进行，称体重是采用杠杆原理做成的秤进行。 – 包含上述事物、数字和法则三个主要元素的活动就是测量活动。
– 蓬勃兴起阶段：1864-1940年。
• 1864年，费舍《量表集》，客观标准化测量萌芽。 • 1897年，莱斯的拼字测验。 • 1882年，高尔顿和皮尔逊教育测验的统计方法。1905年，比内-西蒙智力量表。
• 20世纪20年代，美国教育测验运动蓬勃发展。三个阶段：①开拓期（1904-1915年），卡特尔与桑代克《精神与社会测验学导论》，标志着教育测验运动的开始；②兴盛期（1915-1930年），发展了学力测验、智力测验和人格测验等不同性质的测验；③批判期（1930-1940），教育测量运动逐步过渡到教育评价时期。
（三）测量量表
定义
数字连续体。
– 指具有一定参照点和单位的事物特征数量化的

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

测量的三要素
1，参照点：为测定事物的量，事先确定的计量起点2，单位：实施测量必须有统一的单位
3，量表：有单位和参照点的数字连续体，是测量的工具。

教育测量的特点
测量结果的间接性和推断性
测量对象的模糊性和测量误差的不可避免性
测量量表的多样性和结果的相对抽象性
教育评价的功能
1、诊断功能
2、改进与形成性功能
3、区分优良和分等鉴定功能
4、激励功能
5、导向功能
教育评价与教育测量
联系：
教育测量是教育评价的基础，教育测量是对教育进行量的测定，所获得的结果是教育评价所需信息的主要的、可靠的来源，是对教育的状态和价值进行客观判断的前提；
教育测量的结果只有通过教育评价这个环节才能获得实际意义，否则便成了一堆抽象而枯燥的数字。

区别：
着眼点不同：教育测量：为了取得数据；
教育评价：要分析解释，对教育价值作出判断。

特点不同：教育测量：纯客观的过程，具有客观性特点；
教育评价：具有客观性与主体性相结合特点。

复杂程度不同：教育测量：对教育数量化的描述，关心量的获得，活动较为单一；
教育评价：着眼于事物质的判定，含定性与定量分析，活动是多重的。

教育测量与评价的类别
按测量与评价在教学中运用的时机分类
1、形成性测量与评价：如中小学单元测验
2、诊断性测量与评价
3、终结性测量与评价：如期末考试
2、按解释测量结果或评价结果时的参照点分类
常模参照测量与评价
标准（目标）参照测量与评价
潜力参照测量与评价
3、按测量与评价被试行为表现的性质分类
最佳行为测量与评价：如教学后的考试、升学考试典型行为测量与评价：如人格测量、态度测量
4、按测量与评价的内容分类
智力测量与评价
能力倾向测量与评价
成就测量与评价
人格测量与评价
5、按测量对象分类
个别测量与评价
团体测量与评价
6、按测验材料分类
文字测验
非文字测验
教育测量之父：桑代克
教育评价之父：泰勒
教育评价产生的标志是“八年研究”（1933-1940）
信度：指测量结果的稳定性或可靠性程度
采用不同的方法来计算相关系数，就会得到不同类型的信度指标：重测信度、复本信度、分半信度、同质性信度、评分者信度。

重测信度
——指同一个量表对同一组被试施测两次所得结果的一致性程度。

重测信度与时间间隔：两次测量之间的间隔时间不同，重测信度也不同。

间隔时间太短，存在记忆效应；间隔时间太长，影响测
量的干扰因素增加。

一般而言，时间间隔越长，信度系
数越低。

适宜的间隔时间因测验性质、被试特点而异。

信度的取值范围为[0，1]，当信度值较大时，说明前后两次测量结果比较一致；
分半信度：将测验分半，再求被试在每一半测验上所得分数的相关系数。

首先根据内容、形式、题数、平均数、标准差、难度、测题间相关以及分布形态相等的原则，将试题分成两半，或者将从易到难排列的测题，按照测题序号，奇数测题为一组，偶数测题为一组，分成两半；
然后计算每个被试在两个分半测验分数的相关系数，再用斯皮尔曼—布朗公式加以校正
效度：指测量结果的准确性和有效性的程度。

也可以说是测量是否达到了预期的目的
根据测量目标的不同，对测量工具进行效度验证的方法主要有三种：内容效度（基于所测内容的效度验证方法；指测验题目样本对应测内容及行为领域的代表性程度。

如果是教学情境下的成就测验，那么其内容效度就是看测验题目样本能体现教学目标与教材要求的程度。

）结构效度（基于所测心理结构的效度验证方法；测验对于人的心理特性或理论概念测量到的程度。

通常用某种操作来定义，并用测验来测量）
准则关联效度（基于效标关联性的效度验证方法；是以测验分数和效
标之间的相关系数来表示测验效度高低的方法。

）
提高测量效度的方法：控制系统误差
精心编制测验量表
扩充样本的容量和代表性
合理处理效度和信度的关系
妥善组织测验
适当增加测验长度
难度的计算：客观题难度的计算
P=R/N（R为答对该试题人数，N为参加测验总人数）
难度分析
▪进行难度分析的主要目的是为了筛选题目。

（1）测验题目难度水平的确定
▪测验题目难度水平的适当与否，取决于测验的目的、性质和题目的形成。

▪当P值接近于0或接近于1时，即被试在该题上全部答对或全部答错，则该题无法提供个体的信息。

而只当P值接近于0.50
时，题目才能把被试做最大的程度的区分。

但在实际工作中，
若每一题的难度值均为0.50，那么此测验很可能只能区分出好
与差两种极端被试的差异，却不能对各种被试作更精确的区分。

因此，一般各题的难度可在0.50±0.20之间。

区分度的意义
▪题目区分度——就是题目区别被试水平的能力的量度，常记为D。

▪如一道题，学业水平、实际能力都较高的考生都答对了；而学业水平、实际能力都较低的考生都答错了，则可认为该题目有
好的区分度。

▪区分度（D）的取值范围介于- 1.00∽+1.00之间，值越大，区分度的效果越佳。

▪区分度D>0为正区分，D<0为负区分，D=0为零区分
区分度的计算：高低分组法:客观性试题D=PH-PL
▪主观题: D=（XH-XL）/N（H-L）
▪XH为高分组得分总数
▪XL为低分组得分总数
▪H为该道题的最高分
▪L为该道题的最低分
N为应试总人数的27%
教育测量分数的整理和分析
编制频数分布表;求组中值;求全距;求组数;求组限;画频数分布曲线图
求全距:全距＝最大数－最小数
定组数
求组距:组距≈（全距＋1）/组数
定组限（分组的界限）:（0-5，5-10，）
求组中值:组中值＝（上限＋下限）/2
分析频数曲线图:
1、常态分布
⏹即成绩中等的多，优秀和差的少，俗称“中间大，两头小”。

学生的学业成绩呈常态分布，表明能正确、客观地反映学生真实的知识程度和能力水平。

这是因为学生智力及其差异，一般是呈常态分配的；另外，教学大纲的制定、教材的编写、考试命题都是从大多数中等程度学生的实际出发，为大多数中等水平的学生经过努力能接受的。

2、正偏态分布
⏹即低分人数很多，高分人数很少。

学生的学业成绩呈正偏态分
布，表明测试难度过大，考试要求过高，超越大纲和教材的要
求；或者学生的基础差，应调整试题的难度或教学进度。

3、负偏态分布
⏹即高分人数很多，低分人数很少。

学生的学业成绩呈负偏态分
布，表明测试较易，考试要求低于大纲或教材要求；或学生的
基础好，应加大试题的难度和教学的进度。

4、驼峰型分布
⏹即低分高分人数很多，中分人数很少。

学生的学业成绩呈驼峰
型分布，表明试题难度过大和过小的题较多，中等难度的太少；
或表明学生基础相差悬殊，好的和差的学生多，中等程度的学
生较少。

⏹5、平波型分布
⏹即中低高分人数差不多。

学生的学业成绩呈平波型分布，表明
大中小几种难度的试题比较接近，或学生的基础相差不大，试
题区分度低，需要提高区分度。

⏹6、陡峭型分布
⏹即中分人数很多，低高分人数极少。

学生的学业成绩呈陡峭型
分布，表明难度中等的试题比例过大，缺乏区分度或学生的基
础相差不大，要提高试题的区分度。

⏹原始分数的不足:
⏹原始分数——又称观测分数，是观测直接所得、未经任何加工
的数据。

⏹原始分数没有普遍意义，而且不等距。

⏹原始分数的参照点不同
Ø 学生各次考试所得的成绩不具有可比性
Ø 不同学科的成绩不具有可比性
Ø 不同学科的成绩不具有可加性
百分等级——指在常模样本中低于这个分数的人数百分比值
有的测验效度系数达到0.35即已符合要求，有的却要达到0.65~0.77才能被认为是有效的测验
中小学教师日常礼仪评价表。