教育测量与评价

合集下载

教育测量与评价专业的就业方向

教育测量与评价专业是一个既重要又具有挑战性的领域，在许多不同的领域中都有着广泛的应用。

学生在选择这个专业之后，需要对将来的就业方向有清晰的认识。

以下将对教育测量与评价专业的就业方向进行详细的探讨和分析。

一、教育测量与评价专业的就业方向1. 教育机构教育测量与评价专业的毕业生在教育机构中有着广泛的就业机会。

他们可以在中小学、高等学府和教育研究方面工作。

在这些机构里，他们可以参与教育评估、课程设计和学校管理等方面的工作，为教育改革和发展做出贡献。

2. 政府部门政府部门也是教育测量与评价专业毕业生的就业主要出路之一。

他们可以在教育部门、统计局及其他相关部门从事教育政策研究、数据分析、综合评价等工作，为政府决策提供专业的数据支持。

3. 教育科研机构教育科研机构也是教育测量与评价专业毕业生的主要就业方向之一。

在这些机构中，他们可以进行教育测量方法研究、评价工具开发、教育统计分析等工作，为教育研究领域做出贡献。

4. 教育科技公司随着教育科技的发展，教育测量与评价专业的毕业生可以进入教育科技公司从事教育数据分析、上线教育评价、教育产品研发等工作，为教育科技行业的发展提供专业支持。

5. 自由职业教育测量与评价专业的毕业生也可以选择从事自由职业，如教育培训、交流顾问等工作，为不同的教育机构和个人提供专业的测量与评价服务。

他们可以利用自己的专业知识和技能，开展教育测量与评价的实践工作。

二、发展趋势和就业前景随着教育事业的不断发展和教育改革的深入推进，教育测量与评价专业的就业前景越来越广阔。

教育测量与评价专业的毕业生具备丰富的教育测量理论和实践经验，能够熟练运用统计分析工具和评价方法，在教育管理、政策研究、教育科研和教育科技等领域中有着广阔的发展空间。

随着大数据和人工智能技术的发展，教育数据分析和教育评价成为了热门的研究方向和就业领域。

教育测量与评价专业的毕业生可以利用自己的专业知识和技能，参与教育大数据分析、个性化教育评价、智能教育系统开发等工作，为教育领域的创新与发展贡献力量。

教育测量与评价第二讲

对教育测量学的建设与发展做出了巨大贡献。
24
❖ (1)任何现象只要是存在的总有数量 ❖ 这个原则是由美国心理学家桑代克(E.L.
Thorndike) 提出的。他说：“凡物的存在必有其数量。”人的心理现象虽然看不见，摸不着，但它是客观存在的现实，是脑这块高级物质的属性，它也有数量的差异。 ❖ 例如，人的智力有高低之分，学生的学习成绩有优劣之别。这高低之间、优劣之间，存在着程度的不同。所谓程度不同，就是数量的不同。
9
❖ 在数学上，函数就是把某一集合中的事物分派到另一集合事物之上的规则。可以说，任何测量都呈现函数关系，而任何函数关系都是建立一种顺序配对的集合。
❖ 一般来说，具体且稳定的事物属性，如性别、身高、体重等，其测量的规则就易于建立和使用;抽象且易变的事物属性，如人的智力、知识、技能、人格、态度等心理属性，其测量规则就难以制定和使用。
测量的事物属性的不同，有时并不需要让数的各种特性同时具备。当然，能多具备一些更好，因为测量中运用数的效果，确实也与这些数所包括的特性多少相关联。
7
❖ 假如我们能用数合理地描述事物的属性，并且在允许的条件下，对数进行运算，我们就可以通过运算的结果，对所要测量的属性进行推测。如果事物的属性和数的系统之间，在性质上或形式上存在着高度的类似性，我们就可以用数来描述事物的真实情况。
10
（二）四种测量量表
❖ 量表一般称为测量工具。 ❖ 1、名称量表—（类别量表）最低水平的一
种量表 ❖ 它只是用数字表明事物的类别或性质不同而
已，没有任何数量大小的意义，不能作数量化分析，也不能将之进行加减乘除运算。 ❖ 即属于同一类的事物用同一个数字表示，属于另一类的事物用另一个数字表示。用来描述各类事物的数字仅仅是事物的名称：它只具有相同与不同的特性，没有数量大小的含义。用这类数字表示的量表叫名称量表。

教育测量与评价

教育测量与评价（简答题部分）什么是表现性评价：一种性质的评定方法新型的更加直接的考察学生综合运用的知识、解决实际问题能力的方法，在促进学生发展和改进教学方面有显着作用表现性评价 1优点：有助于测查学生综合运用所学知识解决实际问题的能力优化教学过程，使学生的能力尽可能得到发展激发学生的学习动机，为终身学习打基础注重知识技能的整合与综合运用复杂的任务表现教学性评价与教学活动有密切的联系2缺点：信度问题效度问题实用性问题耗时过多不能评价所有类型的学习目标高利害评使用表现性评价就要十分谨慎品德测试的意义：有利于学生思想上的自我教育和学校德育工作的顺利进行激励先进和鞭策后进有利于学生德育管理德育和行为科学研究的重要手段品德测评的类型：诊断性形成性总结性品德测评的基本要求：外显行为测评和道德认识测评相结合单项测评和整体测评相结合定向性测评和定量测评相结合测评指标体系确立的依据：社会的需要德育大纲德育结构学生年龄特征测评基本要求：重视指标体系的开放性教育性处理好普遍性和特殊性的关系稳定性和发展性的关系统一性的灵活性的关系品德测评的方法、运用：定时考核（学生成绩测量）问卷测评（问卷或量表测试）项目评分（设置一些测试的项目，给予一定的分数，对学生的思想和行为表现进行测量）情景测验（设计情景，展开活动）社会关系测量（通过学生回答，来了解学生的人际关系）意向测评法（Q技术、和语义分析）行为观测法（有目的有计划的考察学生思想行为）教师评价的特点：是一个活动过程，一个特殊的连续活动，包括一系列的方法和步骤有目的有计划的活动过程根本目的在于形成价值判断，进而做出选择评价者与被评价者是同一的教师评价的主体：行政部门、学校、教师参评（教育行政部门依法对教育人力支援进行管理对教师的考核人工作进行指导和督导有助于提高教师的信度与效度）学生参评（是教学过程中的主体，直接承受着教师教学效能的影响）家长参评（家长是教育的投资方，间接的把学生的意见反馈给教师的有效手段）教师自评的意义：鼓励教师积极主动的进入评价角色增加教师评价的信度自我评价其实是教师自我反思、自我教育、激发内在动因的过程和自我提高的过程教育评价的模式:实证范式评价（行为目标评价操作主意模式）人文范式（发展性评价模式自主性评价模式团体性评价模式教师校本）教师评价程序：确定目的确定评价者制定指标体系确定评价方式评价过程的实施指标体系的构成：素质评价指标（教师实施教育教学的基础）职责评价指标（实施教育教学的关键）绩效评价指标（最终目标教师评价过程：教师自我评价和学校评价教师评价主要工具：工作评估报告（1工作评估报告表：教师个人资料评价专家资料目的评定签字2评估具体内容3观察、总结）教师评价案例：日本1教师与校长、教导主任会面，确定自己的教学目标、教学方向，并就完成程度做自我评价2教导主任做第一次评估，校长通过观摩教师授课进行最终评估3评估综合评估过程中参考家长和学生的意见。

教育测量与评价的基本理论

教育测量与评价的基本理论教育测量与评价是指对教育活动进行系统观察、衡量和评估的过程，通过对学习者、教学内容和教学环境的测量，用于了解教育目标的达成情况、教学质量的提高与改进以及教育政策的制定和调整。

它是教育领域中的重要理论和实践，为教育决策提供科学依据。

1.测量理论：测量理论是教育测量与评价的基础，它研究如何将可量化的教育目标转化为能被测量的指标。

测量理论主要包括传统测量理论和现代测量理论两个方面。

传统测量理论强调测验的可靠性和效度，可靠性是指一个测验在确定条件下能得到相似结果的程度，效度是指测验能否真实地反映被测对象的特征或能力。

传统测量理论通过统计方法对测试结果进行分析，包括计算信度系数、相关系数等。

现代测量理论强调以潜在变量为中心，认为教育目标不同于一般的观测指标，而是通过观测指标的背后的潜在变量来描述的。

现代测量理论包括因素分析、结构方程模型等方法，能够更准确地描述教育目标和评价对象之间的关系。

2.评价理论：评价理论是研究如何对测量结果进行综合和判断的理论体系。

评价理论主要包括定性评价和定量评价两个方面。

定性评价注重对教育活动进行质性分析，通过观察、访谈、文献分析等方法获取和理解相关信息，从而对教育活动进行综合评价。

定性评价强调了对于教育过程的深入了解和真实反映。

定量评价注重对教育活动进行数量分析，通过数据收集和统计分析来评估教育活动的效果。

定量评价通过数值化的方法对数据进行处理和解释，能够进行更加准确的比较和判断。

3.教育测量与评价模型：斯兰贝格模型是对教学质量进行综合评价的模型，它将教育目标、教学过程和学生学习效果三个方面的指标进行综合评价，从而得出教学质量的综合评定。

塔伦斯模型是对教师教学能力进行评价的模型，它将教师的知识和技能、教学过程和学生学习结果三个方面的指标进行评价，从而得出教师教学能力的评估结果。

布鲁姆分类模型是对学习者学习效果进行评价的模型，它将学习者的认知、情感和技能等方面的指标进行评价，从而得出学习者的学习效果。

《教育测量与评价》习题与答案

《教育测量与评价》习题与答案（解答仅供参考）一、名词解释1. 教育测量：教育测量是指运用科学的方法和标准，对学习者在知识、技能、态度、情感等方面的发展水平或学业成就进行量化测定的过程。

2. 信度：信度是评价测量工具稳定性和一致性的指标，反映的是同一份测验或者不同时间重复同一测验所得结果的一致程度。

高信度意味着测量结果具有较高的可靠性。

3. 效度：效度是指测量工具能够准确测出其所要测量内容的程度，即测量结果与实际要考察的目标之间的符合程度。

它是评价测量工具质量的最重要指标之一。

4. 标准参照评价：标准参照评价是一种基于预先设定的标准或目标来进行评价的方式，主要关注个体是否达到了特定的学习标准或发展目标，而不是将个体之间的表现进行比较。

5. 形式效度：形式效度是指测量工具在形式上是否与预定的测量目的和理论构想相一致，包括题目的编制、题目难度分布、题目类型的选择等是否恰当合理。

二、填空题1. 教育评价的核心任务是对教育活动的______进行价值判断。

答案：质量和效果。

2. 常见的教育测量方法有纸笔测验、观察法、访谈法和______等。

答案：项目反应理论（IRT）。

3. 评价学生的认知发展时，皮亚杰的认知发展阶段理论是一种常用的______。

答案：内容效度依据。

4. 教育评价中，______是指评价系统对所有被评价对象公平对待的程度。

答案：评价的公正性。

5. 在进行教育测量时，为了确保分数的稳定性，我们通常会通过计算______来评估测量工具的质量。

答案：信度系数。

三、单项选择题1. 下列哪种评价方式主要关注学生在学习过程中的进步与成长？（）A. 形成性评价B. 总结性评价C. 配置性评价D. 标准参照评价答案：A2. 在教育测量中，若一个测验的信度系数为0.85，这意味着该测验的可靠性（）。

A. 较低B. 一般C. 较高D. 不确定答案：C3. 关于效度，下列说法错误的是（）。

A. 效度反映的是测量工具能否准确测出所要测量内容的程度B. 内容效度是指测验题目对整个待测内容范围的代表性程度C. 结构效度只能通过实证方法验证D. 同一测验的效度是固定不变的，不受被试者群体变化的影响答案：D4. 下列关于项目难度和区分度的说法正确的是（）。

第二章教育测量与评价的类型与功能

请查询相关资料:
英语四级、六级考试分数计算方式；高考分数计算方式；
潜力参照测量与评价：是将被试实际水平与其自身潜在水平（潜力）进行比较，以评价被试有没有充分发挥自身潜力为目的。比如动态评价法。
（三）按照测量与评价被试行为表现的性质
最佳行为测量与评价；典型行为测量与评价；
（二）按照对测量结果解释的参照点
常模参照测量与评价：将被试水平与测验常模进行比较，以评价被试在团体中的相对地位的一种测量与评价类型。比如平均分的相对比较方法、英语46级考试分数和高考分数。
标准参照测量与评价：将被试的表现与既定的教育目标或行为标准相比较，以评价被试在多大程度上达到该标准。比如正确百分数、得分百分数、英国GCSE（中等教育普通证书）考试。可以独立描述学生的成绩。
1.激励学生的学习动机； 2.帮助学生的记忆和促进迁移； 3.促进学生自我评价；
（四）行使教育管理的功能
1.对教师的管理； 2.对目标的管理； 3.对过程的管理；
（一）实现教育判断的功能
1.测量评定的功能； 2.事实判断的功能； 3.价值判断的功能； 4.问题诊断的功能； 5.区分选拔功能；
（二）改进教师教学的功能
1.了解学生的起点行为； 2.作为改进教学的参考； 3.作为补救教与学的依据； 4.确保教学目标的达到；
（三）促进学生学习的功能
第二章教育测量与评价的类型和功能
一、教育测量与评价的主要类型
（一）按照其在教学中运用的时机
形成性测量与评价：在教育过程中经常实施的，在性质上相当于现在的中小学单元测试。
诊断性测量与评价：对经常表现出学习困难的学生开展测量与评价，其目的是对个人的问题行为及其原因进行诊断。

教育测量与评价(简答题和名词解释)

教育测量与评价（简答题部分）什么是表现性评价：一种性质的评定方法新型的更加直接的考察学生综合运用的知识、解决实际问题能力的方法，在促进学生发展和改进教学方面有显著作用表现性评价 1优点：有助于测查学生综合运用所学知识解决实际问题的能力优化教学过程，使学生的能力尽可能得到发展激发学生的学习动机，为终身学习打基础注重知识技能的整合与综合运用复杂的任务表现教学性评价与教学活动有密切的联系2缺点：信度问题效度问题实用性问题耗时过多不能评价所有类型的学习目标高利害评使用表现性评价就要十分谨慎品德测试的意义：有利于学生思想上的自我教育和学校德育工作的顺利进行激励先进和鞭策后进有利于学生德育管理德育和行为科学研究的重要手段品德测评的类型：诊断性形成性总结性品德测评的基本要求：外显行为测评和道德认识测评相结合单项测评和整体测评相结合定向性测评和定量测评相结合测评指标体系确立的依据：社会的需要德育大纲德育结构学生年龄特征测评基本要求：重视指标体系的开放性教育性处理好普遍性和特殊性的关系稳定性和发展性的关系统一性的灵活性的关系品德测评的方法、运用：定时考核（学生成绩测量）问卷测评（问卷或量表测试）项目评分（设置一些测试的项目，给予一定的分数，对学生的思想和行为表现进行测量）情景测验（设计情景，展开活动）社会关系测量（通过学生回答，来了解学生的人际关系）意向测评法（Q技术、和语义分析）行为观测法（有目的有计划的考察学生思想行为）教师评价的特点：是一个活动过程，一个特殊的连续活动，包括一系列的方法和步骤有目的有计划的活动过程根本目的在于形成价值判断，进而做出选择评价者与被评价者是同一的教师评价的主体：行政部门、学校、教师参评（教育行政部门依法对教育人力支援进行管理对教师的考核人工作进行指导和督导有助于提高教师的信度与效度）学生参评（是教学过程中的主体，直接承受着教师教学效能的影响）家长参评（家长是教育的投资方，间接的把学生的意见反馈给教师的有效手段）教师自评的意义：鼓励教师积极主动的进入评价角色增加教师评价的信度自我评价其实是教师自我反思、自我教育、激发内在动因的过程和自我提高的过程教育评价的模式:实证范式评价（行为目标评价操作主意模式）人文范式（发展性评价模式自主性评价模式团体性评价模式教师校本）教师评价程序：确定目的确定评价者制定指标体系确定评价方式评价过程的实施指标体系的构成：素质评价指标（教师实施教育教学的基础）职责评价指标（实施教育教学的关键）绩效评价指标（最终目标教师评价过程：教师自我评价和学校评价教师评价主要工具：工作评估报告（1工作评估报告表：教师个人资料评价专家资料目的评定签字2评估具体内容3观察、总结）教师评价案例：日本1教师与校长、教导主任会面，确定自己的教学目标、教学方向，并就完成程度做自我评价2教导主任做第一次评估，校长通过观摩教师授课进行最终评估3评估综合评估过程中参考家长和学生的意见。

《教育测量与评价》教案

《教育测量与评价》教案教案：教育测量与评价一、教学目标1.知识目标：了解教育测量与评价的基本概念和原理；2.能力目标：掌握测量工具的选用和使用方法；3.情感目标：培养学生对教育测量与评价的兴趣和积极参与的态度。

二、教学内容1.教育测量的定义和作用；2.测量工具的种类和使用方法；3.教育评价的方法和步骤。

三、教学过程1.激发学生兴趣（5分钟）教师可以从生活中的实例和案例入手，引导学生思考教育测量和评价对于教育发展的作用，并与学生进行互动交流。

2.知识讲授（20分钟）教师通过PPT或黑板板书，介绍教育测量的定义和作用，帮助学生建立正确的认识和认知。

3.测量工具的介绍（30分钟）教师介绍不同种类的测量工具，如问卷调查、观察记录、测试等，并讲解它们的使用方法和注意事项。

同时，教师还可结合实际情况和案例，让学生了解不同测量工具的适用范围和应用场景。

4.实践操作（30分钟）学生进行实践操作，选取一个具体的教育问题，使用合适的测量工具进行测量和评价，并对结果进行分析和解读。

教师可以组织学生进行小组讨论，共同探讨问题和解决方案。

5.教育评价的方法和步骤（20分钟）教师介绍教育评价的常用方法和评价步骤，如定性评价、定量评价、自我评价等，并分析其优缺点。

教师还可通过案例分析，让学生了解教育评价的实际操作过程。

6.总结和反思（10分钟）教师对整堂课进行总结和反思，复习教育测量与评价的重要概念和方法，并鼓励学生提出问题和展开讨论。

四、教学资源1.课件或PPT；2.黑板和粉笔；3.实践操作的教学材料和测量工具。

五、教学评价1.学生的参与度：通过学生的提问、回答问题和小组讨论来考察学生的参与度；2.实践操作的结果：根据学生的实际操作和分析报告，评价学生对于测量工具和评价方法的掌握程度；3.课堂测验或作业：根据课堂所学和相关教材，布置适当的测验或作业，检验学生对知识的理解和应用能力。

六、教学反思本节课注重理论和实践相结合，通过教师的讲解和学生的操作实践，使学生能够真正了解教育测量与评价的基本概念和方法。

教育测量与评价

第一章、教育测量与评价的学科发展教育测量与评价一.教育测量1、测量:根据法则给事物赋予数量。

(史蒂文斯)测量：客观事物及其属性；所依据的规则或方法；数量化的结果。

2、教育测量：广义：对于教育领域内的事物或现象，根据一定的客观标准，作缜密地考核，并依据一定的规则将考核的结果予以数量的描述。

第一，测量是对事物数量特征的获得。

而教育评价则是对教育现象客体的价值进行判断。

第二，教育测量是一种纯客观的过程，其突出特点是客观性。

而教育评价则具有两种属性，即客观性和主观性第三，测量的任务是对事物的量的认识，而评价作为一种认识活动，是人的意识对实践活动及其结果的综合反映，它反映的是活动的过程和终点，又是新的实践活动的起点。

教育测量与评价的产生与发展过程：一.教育测量的产生1904年以前（教育测量的萌芽期）中国的科举制（隋炀帝大业二年，公元606年）科举制的特征：逐级考核、制度完备、考场严格、命题规范科举制的考核方法：口试、贴经、墨义、策间、诗赋产生在中国、发展在西方美国贺拉斯曼1845年将“笔试”引入美国英国费舍在1864年《作业量表集》美国赖斯在1897年的《拼字实验》1904—1915年教育测量的开拓期：美国桑代克的巨着《精神与社会测量导论》问世。

标志着以科学理论为指1、教育评价产生的社会背景：1929—1933年席卷美国、波及全球的经济大萧条社会与教育危机四起生产过剩、工厂倒闭、工人下岗学校因经济不景气，部分学校关闭，有些学校的班级减少。

整个社会和教育皆处于反省之中1930年美国有25%的失业，青年近乎100%找不到工作，1910年14—17岁的青年17%上大学，而到1930年上升到51%。

有相当一部分人上高中并不想上大学，而当时的美国高中设课就是为了上大学服务的，为此中学设课与失业青年的需求就产生了尖锐的矛盾2、教育评价的起源：美国进步主义联盟负责人艾钦于1933—1940年领导了中学课程改革实验研究，其中课程评价委员会由俄亥俄州的州立大学教授泰勒主持，这就是美国教育历史上着名的“八年研究”，也是教育评价问世的开始。

教育测量与评价

教育测量与评价教育测量与评价教育测量和评价是教育领域的重要内容之一，其核心是为了帮助教育实践者获得有关学生学习成果的反馈信息。

通过测量和评价，教育工作者可以更加有效地了解学生的学习情况，及时调整教学策略，实现最大的教学效果。

教育测量教育测量是获得关于学生学习成果的量化或定性信息的过程。

教育测量包括两个方面，即测验和问卷调查。

测验是一种主要的教育测量工具，可以用来测试学生的知识、技能和态度等方面的学习成果。

问卷调查是另一种常见的教育测量方式，可以用来收集学生的反馈信息，如学生的学习体验和感受等。

教育测量有许多优点。

首先，教育测量可以提供关于学生学习成果的客观信息。

其次，教育测量可以帮助教师更好地了解学生的学习成果，及时调整教学策略，提高教学效果。

此外，教育测量还可以为教育决策提供有用的信息，如制定教学计划和制定政策等。

教育测量也存在一些限制。

首先，教育测量可能会存在误差，如测量工具的不准确性和学生答题时的心理状态等因素。

其次，教育测量不能完全覆盖学生的整体学习情况。

最后，教育测量的结果也可能会被误解或误用。

教育评价教育评价是对学生学习成果进行审查、判断和评估的过程。

教育评价的目的是为了了解学生的学习成果，在此基础上提出改进建议以及未来的学习指导。

教育评价通常包括两种形式，即内部评价和外部评价。

内部评价由教师和学校内部进行，目的是为了了解教学效果，及时调整教育教学策略。

外部评价由外部专家进行，如政府和教育机构等，其目的是为了衡量学校或学生的学习成果。

教育评价有许多优点。

首先，教育评价可以帮助学校更好地了解学生的学习成果，评估教学效果，并采取相应的措施来提高教学质量。

其次，教育评价可以为学生提供针对性的服务和指导，帮助他们更好地学习。

最后，教育评价还可以为教育决策提供有用的信息。

教育评价也存在一些限制。

首先，教育评价结果可能会被误解或被用于不正当的用途。

其次，评价工具可能存在不准确性的问题，如评价工具的标准不明确或不公正等。

教育测量与评价

教育测量与评价1、广义上来说，测量是根据法则给事物分派数据。

它的三个特征：法则、事物、数字。

2、测量的三个要素：单位、参照点、量表。

3、量表从低到高排练的四种量表水平：类别量表水平、顺序量表、等距量表、比率量表。

4、教育测量的定义：根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。

它主要包括对学生的内在精神的属性的测量。

5、教育测量对对象的复杂性：首先它是内在的，不能直接测量；其次它是多变的；有些主客观因素也会影响测量的结果。

6、评价是根据某种价值观对事物及其属性进行判断、衡量。

7、哲学史上三种价值观：客观主义价值观；主观主义价值观；辩证唯物主义价值观。

8、教育评价是根据一定的教育价值观或教育目标，运用可用的科学手段，通过系统地收集信息、分析解释、对教育现象进行价值判断，从而为不断优化教育和教育决策提供依据的过程。

9、教育评价与教育测量的关系：教育测量不是教育评价，但是两者有一定的联系，教育测量是教育评价获得数据资料的重要手段，测量师评价的依据，评价是测量的具体体现。

两者又是有区别的，测量关心的是数量的多少，评价关心的是价值的高低，测量是一种纯客观的过程，评价带着主观性，是主观估计和客观测量的统一，测量是一种单一的活动，评价是一种综合的活动。

10、教育评价的种类：根据评价的对象和范围不同，可以分为宏观、中观、微观教育评价；根据评价的时间和作用的不同，可以分为诊断性、形成性和总结性评价；根据评价的准基不同，可以分为相对评价和绝对评价；根据评价的性质不同，可以分为需要性、可行性和配置型评价；根据评价的主体性不同，可以分为自我评价和他人评价。

11、在教育、教学活动开始之前，为使计划更有效地实施而进行的预测性、摸底性评价是诊断性评价。

12、形成性评价指在教育、教学活动计划实施的过程中，对计划、方案执行情况进行的评价。

13、总结性评价指某一教育、教学活动项目，是告一段落或完成以后进行的评价。

14、教育测量的历史知识：①《学记》记载中国在西周实行了教育考评；②1702年英国剑桥大学首先用笔试代替口试；③1845年美国在初等教育中以笔试代替口试；④1864年英国费舍收集学生成绩样本汇成《量表集》开启了标准化测量的萌芽；⑤1897年莱斯的拼字测验推动教育测验的发展；⑥冯特的测量方法和高尔顿的统计方法对教育测量产生重大影响；⑦1905年法国比纳-西蒙智力量表具有经典型⑧1904年美国的桑代克为教育测量之父，其名言：“凡是存在的东西都有数量，凡是有数量的东西都可以测量”。

教育测量与评价[精选多篇]

教育测量与评价[精选多篇]第一篇: 教育测量与评价第一章1.什么是评价？什么是教育评价？答: 评价是指主体按照一定的标准对客体的价值进行判断的过程。

标准是指主体根据自己的价值观以及事物发展的规律形成的对客体发展变化的一种期望, 是判断客体的属性及发展变化达到主体期望的尺度, 是主体对客体价值判断的依据。

陈玉琨：教育评价就是按照一定的价值标准和教育目标, 借助各种方法系统地收集资料信息, 对学生的发展变化及其影响学生变化的各种要素进行价值分析和价值判断, 并为教育决策提供依据的过程。

沈玉顺：教育评价是指通过系统地采集和分析信息, 对教育活动满足预期需要的程度作出判断, 以期达到教育价值增值的过程。

2.什么是发展性教育评价？答：发展性教育评价是一种以促进教育活动价值增值为目的, 着重于教育对象和教育事业发展的目标、条件、进程以及策略方法的建设性评价。

3.简述发展性教育评价的一般过程。

答: ㈠准备阶段⒈明确需要评价的问题⒉确定评价的目的⒊确定评价对象与评价内容⒋确定信息的搜集范围与分析的方法㈡搜集、分析信息阶段;㈢帮助评价对象制定改进方案;㈣再评价阶段4.比较教育评价和教育测量, 教育督导的联系与区别？答: 、教育测量与评价的关系关系: 教育测量就是指根据一定的理论、规则, 运用一定的测量工具对教育现象进行数量化描述的过程。

教育评价是对教育现象状态和价值的判断, 这一判断是以对评价对象的客观描述为前提的, 没有对评价对象的客观描述, 就不会有对评价对象价值的客观判断教育测量是教育评价的基础, 教育评价要在教育测量所获得的客观信息的基础上进行, 同时, 教育测量的结果要通过评价才能获得实际意义区别: （教育测量与评价的）第一, 测量是对事物数量特征的获得, 纯属于对事物客观存在真理性的认识。

而教育评价则是对教育现象客体的价值进行判断, 是对教育现象的价值关系的认识。

第二, 教育测量是一种纯客观的过程, 其突出特点是客观性。

教育测量与评价_

教育测量与评价_教育测量与评价是教育学中的重要分支领域之一，主要研究针对学生的学习情况和学业成绩进行量化的方法和工具，以及对学生学习情况进行评价的方法和标准。

下面将重点从测量方法、评价方法和评价标准三个方面进行探讨。

一、测量方法1.主观测量方法：主观测量方法主要依靠人的主观判断和评价，例如教师的评价、学生的自评等。

这种方法的优点是能够全面了解学生的学习情况，但由于主观因素的介入，可能存在一定的不客观性。

2.客观测量方法：客观测量方法主要采用定量的数据进行测量，例如考试成绩、实验数据等。

这种方法的优点是数据具有客观性和可比性，但忽略了学生个体差异的因素。

3.综合测量方法：综合测量方法主要采用主客观相结合的方式进行测量，例如学科考试、问卷调查等。

这种方法既能够考察学生的知识和能力水平，又能够考虑到学生的个体差异。

二、评价方法1.绝对评价方法：绝对评价方法主要将学生的学习情况与一定的标准进行比较，评价学生的学习成绩是否达到了一定的水平。

这种方法的优点是评价结果具有客观性，但缺点是可能会忽略学生的进步和个体差异。

2.相对评价方法：相对评价方法主要将学生的学习情况与其他学生进行比较，评价学生的学习成绩在整体中的位置。

这种方法的优点是能够反映学生的优势和劣势，但缺点是评价结果可能受到其他学生水平的影响。

3.格式评价方法：格式评价方法主要通过考试、测验、作业等标准化的方式对学生进行评价。

这种方法的优点是评价结果具有可比性和客观性，但缺点是忽略了学生的其他能力和素质。

三、评价标准1.知识与理解：评价学生对所学知识的掌握程度和对基本概念的理解能力。

2.运用与分析：评价学生的运用所学知识解决实际问题的能力和对问题进行分析和归纳的能力。

3.创新与批判：评价学生的创新思维和批判思考的能力，包括学生对问题进行提问和反思的能力。

4.合作与沟通：评价学生的合作和沟通能力，包括学生与他人合作解决问题和表达自己观点的能力。

5.情感与态度：评价学生的情感与态度，包括学生对学习的兴趣和积极性、对教师和同学的尊重等。

教育测量与评价黄光扬

教育测量与评价黄光扬一、概念理解：2题，10分1、测量：测量是按照某种规律，用数据来描述观察到的现象，即对事物作出量化描述。

测量是对非量化实物的量化过程。

2、教育测量：就是针对学校教育影响下学生各面的开展，侧重从量的规定上予以确定和描述的过程。

教育测量是为了了解学生的开展，关注学校的教学效果，反应关于课堂教与学两面信息的测量活动。

3、评价：泛指衡量、判断人物或事物的价值。

评价活动的过程是对人物或事物的价值进行分析、衡量和判断的过程。

4、教育评价：是对教育活动满足社会与个体需要的程度做出判断的活动。

是对教育活动现实的〔已经取得的〕或潜在的〔还未取得，但可能取得的〕价值做出判断，以期到达教育价值增值的过程。

5、教育测量与教育评价的关系：教育测量与教育评价既有区别又有联系：区别：教育测量是针对教育效果或者针对学生各面的开展予以测量和描述的过程，旨在获得有一定说服力的数量事实，是一种以量化为主要特征的事实判断。

而教育评价是根据一定的标准，对教育事物或现象进行系统地调查，以获取足够多的资料事实。

教育评价的根本特征是做出价值判断，而教育测量的完结不一定都要做出价值判断。

联系：教育测量可以为教育评价提供价值判断的根本数量事实，教育测量是教育评价的根底；而教育评价是教育测量过程的延续，是对教育测量结果的解释与运用，并朝着价值判断与释放功能的向开展。

Word 文档6、标准化考试：也称标准化测验。

是指由测量专家格按照测验编制程序而编成的一种测验。

通常具有一定的编制程序，包括试题的抽样，难度、区分度指标分析，明确的施测指导语和施测程序，计分标准，常模以及信效度等指标资料。

标准化考试一般包括命题标准化、施测过程标准化、评分标准化和分数报告与解释标准化等四个环节。

7、教育评价表的编制步骤、原那么、要素：步骤：〔1〕、确定教育评价的对象和目标；〔2〕、初拟评价指标；〔3〕、筛选评价指标〔经验法调查统计法等〕；〔4〕、确定评价指标权重〔关键特征调查法、两两比拟法、专家评判平均法、倍数比拟法等〕；〔5〕、设计教育评价标准；〔6〕、整合、修改与完善教育评价表等。

教育教学工作的教育测量与评价

目的：客观、准确地测量学生的学习情况和能力
问卷调查法
目的：收集教育测量数据，了解教育效果
设计问卷：明确目标，设计合适的问题
发放问卷：选择合适的人群，确保样本代表性
数据分析：对收集到的数据进行处理和分析，得出结论
观察法与作品分析法
作品分析法的优点：全面、深入、有创意
观察法的优点：直接、真实、客观
作品分析法：通过分析学生的作品（如作文、绘画、手工等）来收集数据
诊断功能：帮助教师了解学生的学习情况，发现问题，及时调整教学策略
激励功能：通过评价结果，激发学生的学习积极性和自信心
反馈功能：向教师和学生提供关于教学效果的反馈信息，以便改进教学
导向功能：引导教师和学生关注重要的教学目标和内容，提高教学质量
教育评价的类型
诊断性评价：了解学生的学习状况，发现问题，改进教学
添加标题
设计评价方案与工具
添加标题
确定评价目标：明确评价的目的和意义
添加标题
设计评价指标：根据评价目标，制定具体的评价指标
添加标题
选择评价方法：根据评价指标，选择合适的评价方法
添加标题
制定评价标准：根据评价方法和指标，制定评价标准
添加标题
设计评价工具：根据评价标准，设计相应的评价工具
添加标题
实施评价：按照评价方案和工具，进行评价活动
综合化：综合运用多种教育测量方法，提高测量的全面性和准确性
实时化：实时收集学生的学习数据，及时调整教育测量策略
个性化：根据学生的学习特点和需求，提供个性化的教育测量方案
THANK YOU
汇报人：
05
分析数据：对收集到的数据进行分析和解释
06
反馈与改进：根据评价结果进行反馈和改进

第二章-教育测量与评价的类型和功能

二是综合成就测验，旨在测量与评价被试在多个学科或综合学科上学习成就。
（4）人格测量与评价（个性测量与评价）：人格测量与评价的目的在于测量与评价被试的人格心理特征，诸如气质、性格、兴趣、态度、动机、适应性等方面的心理特征。
用于人格测量与评价的量具主要分为两类：一类是自陈人格问卷；另一类是投射测验。
教育测量与评价的类型（七）
按测量与评价量具有的标准化程度分类，教育测量与评价可分为：
（2）非标准化测量与评价：非标准化测量与评价的测验编制相对自由，没有严格按照测验编制程序进行。教师自编测验常由教师依照自己的教学需要和教学目标而自行编制的测验，是一种非标准化测验。
按被试行为表现的性质分类
教育测量与评价的类型（六）
按测量与评价的材料（测验材料）分类，教育测量与评价可分为：
（1）文字测量与评价（文字测验、纸笔测验）：文字测量与评价的测验内容是以文字的形式表现的，被试也用文字作答的一种测量与评价的方式。对于不同教育背景的被试，这种测量与评价的有效性将受到一定程度的影响。
教育测量与评价的类型（六）
——格朗兰德
检查、考核、评估和监督等方面的作用，通过对教师、目标和过程等方面管理来行使其教育管理的功能。
对教育目标和质量的管理对教育过程的管理对学校的管理对教师的管理对学生的管理
思考题
学校教师自编课堂成就测验发挥了哪些功能？哪些功能没有发挥？如何更好地发挥这些功能？
“评价的主要目的是改进学习和教学，所以评价结果的其它用途，都是第二位或补充性的”。
按解释测量结果或评价结果时的参照点分类，教育测量与评价可分为：
（1）常模参照测量与评价：常模参照测量与评价是将被试水平与测验常模相比较，以评价被试在团体中的相对地位的一种测量与评价类型。

教育测量与评价

教育测量与评价一、引言教育测量与评价是教育领域中的重要议题之一。

测量与评价在教育中有着广泛的应用，包括学生学习成绩的评价、教师教学效果的评价、教育机构的评价等。

教育测量与评价是一个复杂的体系，包括了测量理论、测试设计、评分与解释、教育统计学等多个方面的内容。

本文主要是对教育测量与评价进行系统的介绍，包括测量理论中的信度与效度，测试设计与评分与解释，以及教育统计学中的基本概念和数据分析技术。

通过本文，读者可以了解到教育测量与评价的基本概念，以及如何应用这些概念来进行实际的教育测量与评价工作。

二、测量理论测量理论是教育测量与评价领域中的核心内容。

它主要涉及到测量的信度与效度问题。

1. 信度信度是指测量结果的稳定程度或一致性。

在教育测量中，信度是指同一测试在不同时间或不同测量环境中所得到的结果之间的稳定性或一致性。

信度越高，说明测量结果的稳定性越高，我们就越能够信任这个测试结果。

常用的测量信度指标主要包括重测信度（test-retest reliability）、平行测试信度（parallel forms reliability）和内部一致性信度（internal consistency reliability）等。

2. 效度效度是指测量结果的有效程度或准确性。

在教育测量中，效度是指测试结果与被测试者实际表现之间的关联程度。

效度越高，说明测试结果与实际表现之间的关联程度越高，我们就越能够相信这个测试结果。

常用的测量效度指标主要包括内容效度（content validity）、判别效度（discriminant validity）和相关效度（concurrent validity）等。

三、测试设计测试设计是教育测量与评价的重要组成部分。

它主要包括测试目的、测试格式、测试内容、测试难度和测试质量等方面的设计。

1. 测试目的测试目的是测试设计的第一步。

在设计测试时，我们需要明确测试的目的。

测试目的可以是诊断性的、评估性的、选举性的或预测性的等。

教育测量与评价的分类

教育测量与评价的分类
1. 诊断性测量与评价，就像医生给病人做全面检查一样。

比如说，老师在新学期开始对学生进行基础知识的测验，这就是为了诊断出学生们哪些地方掌握得好，哪些地方还比较薄弱呀，这样才能更好地开展教学呢！
2. 形成性测量与评价，这不就是像建造房子时不断查看进度和质量嘛！比如在课堂上做一些小测试或者小组活动的评价，随时了解学生的学习进展，及时调整教学方法，多重要呀！
3. 终结性测量与评价，哎呀，这个就好像一场比赛结束后要颁奖一样嘛！像期末考试就是很典型的终结性评价呀，它可以看出学生这一整个阶段的学习成果呢！
4. 常模参照测量与评价，这不就是把自己和大家比嘛！比如说各种竞赛，就是看你在众多人中处于什么水平位置，是不是很有挑战性呢？
5. 标准参照测量与评价，就如同有一把明确的尺子来衡量。

像考驾照时，规定的那些合格标准，达到了就是通过，多直接呀！
6. 个体内差异测量与评价，这就像是看自己比起以前有没有进步呀！像是一个学生这次考试比上次有进步，这就是看到了他自己内部的差异变化呢，多有意思！
我觉得教育测量与评价的这些分类都超级重要，它们从不同角度帮助我们了解学生的学习情况，让教育变得更加有针对性和有效呀！。

教育测量与评价

教育测量与评价第一章教育测量和评价的学科发展第一节教育测量和评价的概念一、教育测量（一）测量1.定义：指按照一定的规则给事物（属性）来指派数字（符号）的活动过程。

2.三要素：A、事物（属性）——测量活动的目标、对象B、规则（法则）——进行教育活动最关键的因素良好规则的条件：符合客观规律、利于操作C、数字（符号）——量的表现量的限制：具有区别性、等级性、等距性、可加性作用：表示属性的特征、可以推测事物的属性（二）教育测量1.广义定义：指对于教育领域内的事物或现象，根据一定的客观标准做缜密的考核并依据一定的规则，将考核的结果予以数量的描述。

2.狭义定义：指对学生某些学科，经过学习和训练之后所获得的知识技能的测量。

还可称为成就测量、学科测量或学业成绩测量。

（三）教育测量的特征（四）教育测量工具1.测验：适用场合较广，评断无所谓正误。

2.考试：适用场合较窄，有正误判断，较为正规。

二、教育评价（一）价值1.定义：指个体及其属性同主体的需要相协调、相一致或想接近。

2.要素：A、个体及其属性——讨论价值的前提和基础B、主体的需要——对价值进行衡量的决定性因素、价值评判的核心（二）教育价值1.定义：在教育社会活动或现象当中，个体及其属性同主体的需要相协调、相一致或想接近。

2.教育价值系统表现形式：个体价值、社会价值、工具价值、目的价值、直接价值、间接价值、经济价值等等。

其中基础、核心是个体价值和社会价值。

（三）评价（主体按照一定的标准对客体价值进行评判）（四）教育评价1.典型观点A、注重效果美国教育学家泰勒B、注重资料（信息）的获得美国教育学家克龙巴赫和斯塔弗尔比姆C、注重方法中国张秀理和日本长谷川容2.课程定义三、教育评价和测量的关系1.联系：教育测量是教育评价的基础教育测量的结果要通过教育评价才能获得实际意义2.区别：第二节教育测量与评价的产生和发展一、教育测量的产生（一）教育测量的萌芽期（1904年以前）1.最早的考试制度（中国，公元606年，隋炀帝）特征：采取逐级考核方式、考场纪律严格、命题规范、阅卷制度合理、科举考核方法丰富考试方法：口试、笔试（包括贴经、墨义、策问和诗赋）制度缺陷：考试内容不全面、不客观2.教育测量运动（美国，19C）A、贺拉斯曼：被称为“公共教育之父”，是美国19C教育学家，最早提出建立公立学校，后产生广泛、深远影响，兴起“公立学校运动”，1845年把笔试应用到中、小学教育中。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《经典测量理论、项目反应理论、概化理论的理论观点和相互比较》学院：传媒学院班级：教育技术学姓名：赵欣学号： 201111045202014.03经典测量理论、概化理论及项目反应理论的理论观点和相互比较摘要:目前,心理测量领域中主要存在三大理论派别,即经典测验理论(CTT) ,概化理论( GT)和项目反应理论( IRT) ,前两者同属于随机抽样理论,GT是对CTT的扩展和改进,是现代心理测量界最有影响的理论之一。

关键词:概化理论经典测验理论项目反应理论心理与教育测量理论的发展经历了两个时期:50 年代之前只有真分数理论起作用,称为经典测验理论阶段;50 年代至今,除经典测验理论外,还有项目反映理论、概化理论等,可称为多种理论并存阶段。

经典测验理论在测验发展中有着特殊的地位,它既是历史上的第一个测验理论,也是测验的最一般、最基本的理论,并且目前仍具有很强的生命力,应用极为广泛。

现代测验理论大多是在经典测验理论的研究基础上,针对它在某各方面存在的问题发展起来的。

如项目反映理论,就是为了克服经典测验理论中题目参数等指标的变异性发展起来的;概化理论是针对经典测验理论的信度问题发展起来的。

在目前这个多种理论并存阶段,我们应该看到各种理论都有其合理之处,同时也各有其局限性。

一、经典测验理论、概化理论与项目反应理论的主要内容一般将测量理论分为经典测量理论、概化理论和项目反应理论三大类，或称三种理论模型。

人们将以真分数理论(True Score Theory)•为核心理论假设的测量理论及其方法体系，统称为经典测验理论(Classical Test Theory，CTT)，•也称真分数理论。

经典测验理论是心理学研究者所熟悉的,其基本思想是把测验的得分看作真分数和误差分数的线性组合,可归结为如下简单数学模型:X= T+ E ,其中X是观测分数,T是真分数,E是误差分数。

传统信度效度项目分析的原理与方法均建立在这一模型之上。

概化理论又称为概括力理论或拓广理论,它将因素试验设计及其分析、方差分量模型等统计工具应用到教育与心理测量学,对经典测验理论中的一个重要概念———信度进行了推广,即结合测量的情境关系对经典测验理论给出的笼统的误差进行探查和分解,辨明误差的不同来源,并且在一定范围内变动测量的情境,考查这种变动引起的误差的相对变化,从而达到对误差方差进行控制,提高测验“信度”的目的。

项目反应理论虽然在国外发展很快,但在国内研究不多,因此对多数心理学工作者来说是比较陌生的。

其基本思想与心理学中关于潜在特质的一般理论有关。

项目反应理论假设被试对测验的反应受某种心理特质支配,于是我们就可对这种特质进行界定,然后据此估计出该被试这种特质的分数,并根据其高低来预测、解释被试对项目或测验的反应。

因此项目反映理论主要用于建立各种与数据拟合的模型,以此确定被试的潜在特质值和他们对于项目的反应之间的关系。

二、经典测验理论与概化理论之比较概化理论是经典测验理论的拓广,并且受到方差分析法将误差进行分解的启发。

因此,概化理论与经典测量理论的最大差别在于前者在测量误差控制方面比后者更深入。

与其他的测量一样,心理与教育测量中形成误差的原因是多种多样的。

有由测试环境与被试心理不稳而引起的误差,有由于评分员标准不一引起的误差,还有由于试题性质不一造成的误差等等。

经典测验理论对测验误差作出的重大贡献是给出了测验原始分数(X) 等于真分数(T)与测验误差( E)之和的线性模型,还给出了测验信度的概念,即测验信度系数等于真分数方差在观测分数方差中所占的比例,于是测验信度系数成了测验误差的另一种度量形式。

然而,经典测验理论给出的线性模型是粗糙的,对测试误差的形成没有进行更深入的研究,故不可能区分如上所述的各种各样不同的误差。

有时,只能撇开其他误差而只考虑其中一种误差。

这是经典测验理论误差估计的薄弱之处。

概化理论则认为可以根据引起误差的原因将E进行分解,将总误差的构成剖析清楚,并且可以给出多种信度。

但是,经典测验理论的局限性在概化理论中仅有个别的得到了一些改善,而大多数还依然存在。

原因在于概化理论与经典测验理论同属于随机抽样理论,概化理论并未改良经典测量理论的微观结构,也就是没有改良经典理论的项目参数系统。

概化理论只是更多地从整个测验的宏观结构及其与外部测验条件的关系上作了深入的计量分析。

因此,经典理论在其自身框架下的一些主要局限性依然存在。

三、经典测量理论与项目反应理论之比较经典测验理论经过长期的发展,仍存在许多无法克服的技术问题。

在此背景下,项目反映理论产生了。

这里就经典测验理论的缺点,结合项目反映理论的解决方法,对两者进行比较。

首先,经典测验理论所得的项目统计量受样本的抽样变动影响大。

即项目统计量依赖于测验所实施的被试样组,经典测验理论中项目统计量主要是项目难度( P 值) 和项目鉴别力(D 值) 。

项目难度P = R/ N 代表答对该项目的被试比率。

如果抽取的样本中,能力高的被试多,那么R值就高,P值也随之增高;若抽取的样本中,能力低的被试多,R值就会降低。

在以D值为项目鉴别力的项目分析中,如果样本同质,那么被试能力高低差不多,高分组与低分组答对项目的比例就会相差无几,D 值就小;若样本异质,D值就会大。

以相关系数为鉴别力也是一样的情况。

由此可见,抽样变动是经典测验理论无法解决的问题。

项目反映理论可以解决这一问题,它采用局部独立性假设的方法。

因为每个项目都各自有一条项目特征曲线,其项目参数固定,不需要根据抽样计算答对率来计算项目参数。

因此针对曲线的横轴———能力水平上的某点,被试有一相应的答对概率。

此外,在项目反应理论中测验的题目参数具有跨群体不变性。

也就是说,在项目反映理论中,即使抽取不同被试样组,估计出的项目参数仍然是相对不变的,因此就可以用任何能力的一组被试的数据估计参数,这些估计值无疑就能运用于其他被试组,包括全部被试。

项目反应理论的这一优良性质为建设大型题库,编制各种测验提供了方便。

第二,经典测验理论中,被试测验分数依赖于项目的难度,使得进行不同测验的被试难以比较。

不同测验测量同一种心理特质时会得到不同测验分数,项目难度高,被试测验分数就低。

为了解决这一问题,经典测验理论要求所有被试都实施相同的测验项目,才能对测验结果进行比较,或者利用相同测验或平行复本测验被试。

但是一般成就测验和能力测验适用于中等能力的被试,对能力特别高或特别低的被试就不太精确了。

因此需要有适合不同能力被试的测验。

这就回到了问题的源头———适合不同能力的测验,势必项目难度不同。

这样,被试的能力仍然难以比较。

为此,项目反映理论提出了适性测验、测验等化来解决这一困难。

适性测验是根据每个被试的不同水平,对不同被试实施不同的测验项目,并使这些项目的难度和被试的水平相适应。

其方法是先给被试呈现一道中等难度的项目,根据被试的反应情况,再从题库中选择下一个题目呈现给被试。

在这种情况下,被试能力就很容易比较了。

适性测验的另一个优点是,能力高的被试不会要求回答低难度的项目,于是增加了挑战性,而能力低的被试又不会由于要求回答高难度的项目而失去了信心。

经典测验理论尽管也有等值化方法,但是过于依赖于被试样组。

因此,它在公平性、对称性和不变性方面都存在严重的困难。

项目反映理论则不同,因为它具有参数不变性的优点,只要测验数据和模型是拟合的,就能克服上述困难。

因为项目参数在同一量表上,同一被试的能力估计值不变。

第三,经典测验理论中经常用到的平行测验假设是不可能实现的。

经典测验理论在平行测验的假设下估计测验信度、测量标准误,以及达到预期信度所需要的测验长度。

事实上,平行测验是不可能实现的,即使是同一组测验项目对同一组考生施测,因为遗忘、动机、焦虑程度、新知识与新技能获得的影响,也不可能达到完全平行的程度。

项目反应理论就不存在这个问题,因为它完全没有必要用到平行测验这一概念。

第四,经典测验理论无法预测被试在一个新测验项目上的正确反应概率,这一正确反应概率在适性测验中是十分重要的。

更为重要的是,在实际工作中往往要对这一概率进行估计,以使编制的测验与被试的能力水平相适应。

项目反映理论的项目特征曲线就明确表示出被试能力与项目的关系。

只要已知被试的能力值,就可预测出它们可能达对某个项目的概率。

这在某些入学考试中用处较大。

第五,经典测验理论假设所有被试的测量标准误都相同,这是不太可能的。

因为不同能力组在测验上的稳定性有不同。

一方面,让能力低的被试参加一个较难的测验时,由于猜测性,其测验误差肯定比高能力被试参加该测验时的测验误差大。

另一方面,再进行一次平行测验,就会发现低能力组被试成绩变动大,所以其测量标准误差也大。

所以经典测验理论的等测量标准误差也是一个不小的缺点。

良好的测验模式应能针对某一测验得分或被试能力进行精确的估计,不同的得分或能力有其不同的测量标准误差。

项目反应理论就无此假设,它采用信息函数来说明这一问题。

项目信息函数是将反映项目特征的难度\ 区分度和猜测参数合而为一,它反映各个项目对不同能力水平被试所能提供信息的多少,信息量大,测量标准误差小。

第六,实际应用中,经典测量理论也存在一些问题。

它无法向测验编制者提供各项目及测验在其分数量表上具有最大区分能力的位置。

比如高考要设定录取分数线,该点具有最大的区分能力,但经典测量理论却无法确定这一分界点。

项目反映理论却可以根据一定的被试能力,综合测验中各项目的特征曲线,利用计算机程序确定临界点。

另外,经典测量理论在对项目偏差、测验等值的研究上,使用方法不尽如人意,项目反映理论却有了较好的解决方法(在前面几点中已有论述,此处不再重复) 。

此外,经典测验理论认为项目难度P是非等距的,因此,要转化成等距量表,这样就提高了计算复杂性;更主要的是项目统计量的计算中,仍然未考虑到“不等距”的这一面:比如以分组法计算P值,是高分组通过的比率与低分组通过的比率的平均数,此处就用到的加法和除法,而事实上不等距数据是不能进行四则运算的。

应该说这是项目统计量普遍存在的问题之一。

在项目反映理论中直接用项目参数代替了项目统计量,就不再受这些问题的困扰了。

综上所述,经典测验理论与项目反映理论相比较,存在一些显而易见的缺点。

造成这些缺点的原因是多方面的:首先是理论基础不牢固;其次在于弱假设,弱假设固然可以扩大应用范围,但因其限制条件减少,测量误差较大。

但是,虽然项目反映理论具有很大的优势,它也有自身的不足: (1)由于其理论假设建立在较深奥的数学基础之上,所以普遍性上有一定的难度; (2)由于项目反映理论从测量模型的理论框架来讲,多采用1 \ 0 计分资料的单维模型,故造成其应用上的严重局限; (3)由于受到苛刻的假设限制,必须要有大样本进行配合,否则精确性不高; (4)项目反映理论至今对经典测验理论许多研究领域未能给出什么新的观点与方法,或作出进一步的解释; (5)在应用过程中多以先进的电脑科技作为辅助。

教育测量与评价

教育测量与评价专业的就业方向

教育测量与评价第二讲

教育测量与评价

教育测量与评价的基本理论

《教育测量与评价》习题与答案

第二章 教育测量与评价的类型与功能

教育测量与评价(简答题和名词解释)

《教育测量与评价》教案

教育测量与评价

教育测量与评价

教育测量与评价

教育测量与评价[精选多篇]

教育测量与评价_

教育测量与评价黄光扬

教育教学工作的教育测量与评价

第二章-教育测量与评价的类型和功能

教育测量与评价

教育测量与评价的分类

教育测量与评价

第二章教育测量与评价的类型与功能