第二章教育测量的质量指标2

合集下载

第一讲 数学教育测量与评价概述

第一讲 数学教育测量与评价概述
9
(三)什么是教育测量
• 教育测量就是依据一定的法则,对教育 活动中的某一现象给予数量化的描述。
• 思考: • 心理属性是否也可以客观地进行测量呢?
10
两个理论基础
• “凡物的存在必有其数量”(桑代克) • “凡有数量的东西都可以测量”(麦柯
尔)
11
教育测量的特点
• 测量结果的间接性和推断性 • 测量对象的复杂性和模糊性 • 测量目的的针对性 • 度量单位的相对性
5
• 4. 教学用书和主要参考书目:
• 教学用书:魏立平著 教育科研中的数学方法 中国科学技术出版社,2001年8月第1版
• 主要参考书目: • [1] 田万海等著 数学教学测量与评估 上海教
育出版社,1995年12月第1版 • [2] 王孝玲编著 教育统计学,华东师范大学出
版社,2001年7月第1版 • [3] 王孝玲编著 教育测量 华东师范大学出版
蒂文斯) • 测量这一定义包含了三个要素: • 1、法则—给事物的属性分派数字的依据 • 2、事物属性—-测量的对象或目标 • 3、数字—描述事物属性的符号
8
(二)四种测量量表
• 量表一般称为测量工具。 • 1、名称量表—(类别量表)最低水平的一种量表 • 它只是用数字表明事物的类别或性质不同而已,没有任何数量大
也就是说,一个好的测量工具,只要遵守操作 规则,其结果就不应随工具的使用者或使用时 间等方面的变化而发生较大的变化。 • 必须从以下两个方面去理解测量的信度: • 信度指实测值(X)和真值(T)相差的程度; • 信度指两次重复测量或等值测量之间的关联程 度。

第一章 教育测量与评价概述

第一章 教育测量与评价概述
6
思考
• 心理属性是否也可以客观地进行测量呢? • 你所了解和运用过的教育测量有哪些?
7
教育测量的特点
• 测量结果的间接性和推断性; • 测量对象的模糊性和测量误差的不可避 免性; • 测量目的的针对性 • 度量单位的相对性
8
二、什么是教育评价
• 思考: • 当你看到这个问题时,或者说,当你听 到教育评价这个词时,你最先想到的是 什么?
24
(二)教育评价的发展
• 1.现代教育评价的产生 • 教育评价产生于上世纪30年代美国经济 大萧条时期,大量青年进入高中,他们 的需求与当时中学课程现状之间的矛盾, 引发对美国中学课程改革的运动。 • 教育评价产生的标志是“八年研究”。 • 泰勒提出了教育评价的概念,且提出了 以教育目标为核心的教育评价理论,泰 勒被称为“教育评价鼻祖”。
20
• 其次:中国科举制度的世界地位 • 科举考试始于隋,兴盛完备于唐,废于 清末,是我国实行时间最长的一种选士 制度,对我国乃至于对世界的考试制度 有重要的影响。 • 科举制是通过分科考试来选取人才,采 用口试、贴经、墨义、策问、诗赋等方 法测试考生。
2.产生阶段
• 18世纪以前的西方各国,由于学校尚未 普及,学校考试主要是口试。 • 1720年,英国剑桥大学首先以笔试替代 口试,开西方学校考试笔试之先河。 • 1845年,美国初等学校普及,学生人数 激增,对毕业生一一口试已不可能,于 是,美贺拉斯曼于1847年引进笔试,取 代口试。

教育测量与评价课件(2)(第二章 教育测量与评价的类型和功能)

教育测量与评价课件(2)(第二章 教育测量与评价的类型和功能)
Βιβλιοθήκη Baidu
教育测量与评价的类型(二)
按解释测量结果或评价结果时的参照点分类,教育测量与评价可分为: (1)常模参照测量与评价:常模参照测量与评价是将被试水平与测验
常模相比较,以评价被试在团体中的相对地位的一种测量与评价类型。
(2)标准参照测量与评价(目标参照测量与评价):标准参照测量与 评价是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在 多大程度上达到该标准。 (3)潜力参照测量与评价:潜力参照测量与评价是将被试实际水平与 其自身潜在水平(潜力)相比较,以评价被试有无充分发挥自身潜力为目 的。在强调人性化、动态化和个别化的现代教育测评潮流下,潜力参照测 量与评价理应发挥更大的作用。
教育测量与评价的功能
(1)实现教育判断的功能 教育测量与评价的最基本、最原始、最现实、最普遍的功能,就是实 现教育判断,具体来说就是实现测量评定、事实判断、价值判断、问题诊 断和区分选拔等功能。 (2)改进教师教学的功能 通过教育测量与评价的结果,教师能够了解学生的起点行为,作为改 进教学、补救教与学的依据,确保教学目标的达到,从而充分发挥其改进 教师教学的功能。 (3)促进学生学习的功能 教育测量与评价具有激励学生的学习动机、帮助学生的记忆和促进迁 移、促进学生自我评价等促进学生学习的功能。 (4)行使教育管理的功能 教育测量与评价具有控制、指挥、导向、计划、检查、考核、评估和 监督等方面的作用,通过对教师、目标和过程等方面管理来行使其教育管 理的功能。

教学测量与评价

教学测量与评价

第一章 教育测评概述(一)测量的定义测量是根据法则给事物分派数字。(史蒂文斯)一、教育测量测量这一定义包含了三个要素:1、法则——给事物的属性分派数字的依据2、事物属性——测量的对象或目标3、数字——描述事物属性的符号(二)四种测量量表量表一般称为测量工具。1、名称量表—(类别量表)最低水平的一种量表它只是用数字表明事物的类别或性质不同而已,没有任何数量大小的意义,不能作数量化分析,也不能将之进行加减乘除运算。2、等级量表—(顺序量表)用来描述各个类别的数字,不仅具有区分性,而且还具有等级性(或顺序性),因此,量表上的数字之间能表示事物大小的位次关系,但不具有等距性和可加性,也不能进行加减乘除运算。3、等距量表—量表上的数值不仅具有区分性、等级性,还有等距性,这类量表上的数值只能作加减运算,不能作乘除运算。4、比率量表—最高水平的量表有相等单位和绝对零点,量表数值可以进行加减乘除的四则运算。(三)什么是教育测量教育测量就是依据一定的法则,对教育活动中的某一现象给予数量化的描述。思考:心理属性是否也可以客观地进行测量呢?两个理论基础“凡物的存在必有其数量”(桑代克)“凡有数量的东西都可以测量”(麦柯尔)教育测量的特点测量结果的间接性和推断性测量对象的复杂性和模糊性测量目的的针对性度量单位的相对性什么是教育评价思考:当你看到这个问题时,或者说,当你听到教育评价这个词时,你最先想到的是什么?实验结果:依人数的多少排列:师范生:A、测验 B、等级 C、成绩 D、不公平 E、判断任课教师:A、测验 B、测量 C、等级 D、成绩责任制 E、对个人秘密的侵犯(一)教育评价的界定1、教育评价就是教育测验2、教育评价是一种专业判断3、教育评价是把实际表现与理想目标相比较的活动4、教育评价是系统收集资料,为决策提供依据的活动教育评价:教育评价是根据一定的教育目标,运用可行的科学手段,通过系统地收集信息资料和分析整理,对教育活动、教育过程和教育结果进行价值判断,从而为教育决策提供依据的过程。(二)教育评价的特征1、教育评价=事实判断+价值判断2、教育评价是对教育过程及其结果的评价3、教育评价必须以教育目标为基准4、教育评价是评价者与被评价者的双边合作活动三)在区别上理解教育评价1、教育评价与教育测量联系:教育测量是教

教育测量的质量指标

教育测量的质量指标

教育测量的质量指标

引言

教育测量是评估学生学习成果和教学效果的重要手段。通过对学生的能力、知识、技能等方面进行测量,可以了解他们的学习状况以及教学的有效性。然而,要确保教育测量的质量,需要依据一系列的指标进行评价和监控。本文将介绍教育测量的质量指标,并讨论其意义和应用。

1. 可靠性

可靠性是指测量工具在重复使用中能够得到相似结果的程度。一个可靠的测量工具应该在不同的时间、不同的场合和不同的评估者之间产生一致的结果。常用的衡量可靠性的指标包括内部一致性、重测信度和等价性。

内部一致性(Cronbach’s Alpha)

内部一致性是指测量工具中各项指标之间相互关联的程度。通过计算各项指标的相关系数,可以评估测量工具内部一致性的高低。一般来说,Cronbach’s Alpha系数在0.7以上被认为是可接受的,越接近1表示内部一致性越高。

重测信度(Test-Retest Reliability)

重测信度是指在不同时间进行相同测量的结果之间的相关性。通过将同一测量工具在两个不同时间点进行测试,并计算其相关系数,可以评估测量工具的重测信度。一般来说,相关系数应该大于0.7才被认为是可靠的。

等价性(Parallel Forms Reliability)

等价性是指在不同测量工具中相同或类似的项目之间的一致性。通过将不同但具有相似性质的测量工具同时应用于被测对象,并计算其

相关系数,可以评估测量工具的等价性。一般来说,相关系数应该大

于0.7才被认为是等价的。

2. 效度

效度是指测量工具能够准确地衡量所要测量的内容的程度。一个有

教育测量与评价1

教育测量与评价1

C、教育测量的深入发展
• 教育测量量表的编制突破了过去单一答案的求 同思维题,发展到有了求异思维题和论文题; • 教育测量范围由过去偏重于学生学习成绩的测 量,发展到涉及课程设计、教材、教育改革方 案等的测量; • 教育测量由过去单一的常模参照性测验模式, 发展到常模参照性测验与目标参照性测验相结 合的模式; • 教育测量本身的理论研究与技术开发更加深入 与完善。
二、什么是教育评价
• 思考: • 当你看到这个问题时,或者说,当你听 到教育评价这个词时,你最先想到的是 什么?
实验结果:依人数的多少排列:
• 师范生: • A、测验 B、等级 C、成绩 D、不公平 E、判断 • 任课教师: • A、测验 B、测量 C、等级 D、成绩责任制 E、对个人秘密的侵犯
(三)什么是教育测量
• 教育测量就是依据一定的法则,对教育 活动中的某一现象给予数量化的描述。 • 思考: • 心理属性是否也可以客观地进行测量呢?
两个理论基础
• “凡物的存在必有其数量”(桑代克)
• “凡有数量的东西都可以测量”(麦柯 尔)
教育测量的特点
• • • • 测量结果的间接性和推断性 测量对象的复杂性和模糊性 测量目的的针对性 度量单位的相对性
(2)西方教育测量的发展
•源自文库A、教育测量的诞生 • 18世纪以前的西方各国,由于学校尚未 普及,学校考试主要是口试。 • 1720年,英国剑桥大学首先以笔试替代 口试,开西方学校考试笔试之先河。 • 1845年,美国初等学校普及,学生人数 激增,对毕业生一一口试已不可能,于 是,美贺拉斯曼于1847年引进笔试,取 代口试。

第二节 教育测量的质量指标2(效度)

第二节 教育测量的质量指标2(效度)
• 估计内容效度的方法:
估计内容效度的方法:
(1)逻辑分析的方法。其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。 (2)统计分析法。从同一个教学内容总体中抽取两套 独立的平行测验,用这两个测验来测同一批被试,求其 相关。若相关高,表明测验内容效度较高;若相关低, 表示测验的内容效度较低。 采用求统计量的公式进行计算,其公式有以下三种形式: 内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。 内容效度不适合用于能力倾向和人格测验。
第二节 效度
一、效度的概念 二、效度的统计学原理及其与信度的关系 三、效度的估计 四、提高效度的方法
一、效度的概念
• 效度(Validity)是指测量结果的准确性和有效 性的程度,亦即测量是否达到了预期的目的。 • 第一,效度是一个相对的概念。 –1.测量的效度始终是对一定的测量目的而言的。 –2.测量的效度是相对于测量的结果而言的。 • 第二,一种测验的效度只是高或低的问题。 • 第三,在教育测量中,效度问题比在其他领域的 测量中更为重要。
是期末测验各人得分的人得分平均数是期末测验中对题数的标准差是刚入学的测验各题答预测效度前者对后者有一定的学习成绩有较高的相关体几何间想像力测验成绩与立相关系数较大表明空22032203适用于两个变量就其实际含义而言是等距或等比数据它们服从正态分布其中一列人为地划分为两类
第二章

教育测量与评价

教育测量与评价

2、教育评价与教学评价
• 联系: • 教学评价是以教学为wenku.baidu.com象的教育评价,只是教
育评价的一个方面,用逻辑学术语讲,教育评 价是一个上位概念,而教学评价仅是一个下位 概念。 • 区别: • 教育评价的范围比教学评价要广得多,它不仅 关注教学评价,还有学校管理评价、教师评价、 学生评价、课程评价、总务评价等等。
量运动的反思与批判。 • 教育评价产生的标志是“八年研究”。 • 泰勒提出了教育评价的概念,且提出了
以教育目标为核心的教育评价理论,泰 勒被称为“教育评价鼻祖”。
2、现代教育评价的发展阶段
• 初步发展时期(1930—1958年) • 这一阶段教育评价仍然受泰勒模式的影
响,注重教育目标的研究; • 迅速发展时期(1958—1972年) • 这一阶段泰勒模式受到挑战,出现了不
(二)信度的估计方法
• 1、重复信度(再测信度)
• 指的是同一个量表对同一组被试施测两 次所得结果的一致性程度。
• 其大小等于同一组被试在两次测验上所 得分数的相关系数,一般采用皮尔逊积 差相关的公式来计算。
例一
• 用一个算术四则的速度测验12个小学生, 得分记为X,为了考察测量结果的可靠性, 于3个月后再测一次,得分记为Y,问测 验结果是否可靠?
• 2、两个复本测验有可能在某种程度上测量了 不同的性质,这就会低估测验的信度;

《教育测量与评价》复习资料

《教育测量与评价》复习资料

《教育测量与评价》复习资料

教育测量与评价

第⼀章教育测评概述

第⼀节教育测量概述

⼀、什么是测量

(⼀)测量的定义

⼀般认为,测量是根据法则给事物分派数字。具体来说,是指根据⼀定的法则和程序,对事物或现象在数量上的规定性加以描述和确定的过程。

这⾥包含了测量应有的三个特性:

1、法则。

2、事物。

3、数字。

(⼆)测量的三要素

1、单位。

2、参照点。

3、量表。

⼆、什么是教育测量

(⼀)教育测量的定义

教育测量是根据测量学的原理和⽅法对教育现象及其属性从量的规定性上予以确定和描述的过程。

(⼆)教育测量的特点

1、测量结果的间接性。

2、度量单位的相对性。

3、测量对象的复杂性。

4、测量⽬的的针对性。

第⼆节教育评价概述

⼀、什么是评价

评价就是根据某种价值观对事物及其属性进⾏判断、衡量,或者说是衡量、判断⼈或事物的价值。

⼆、什么是教育评价

教育评价是根据⼀定的价值观或价值标准,运⽤可⾏的科学⼿段(包括测量或⾮测量),通过系统地搜集信息、分析解释,对教育现象进⾏价值判断,从⽽为不断优化教育和教育决策提供依据的过程。

三、教育评价与教育测量的关系

测量是依据⼀定的法则和程序,对事物或现象在数量上的规定性加以描述和确定的过程;评价是泛指根据⼀定的观念和标准衡量、判断⼈物或事物的价值。测量的结果只有通过评价的解释才能揭⽰其实际意义。测量是依据,评价是测量的具体体现。测量关⼼的是数量的多少,评价关⼼的是价值的⾼低;测量是纯客观的,评价带有主观性;测量是⼀种单⼀的活动,评价则是⼀种综合的活动。

教育测量就是借助⼀定的⼯具,给教育现象赋值,来获取评价对象数量的⽅法。教育测量是教育评价获得数据资料的重要⼿段。教育测量可以为教育评价提供价值判断的基本数量事实,是教育评价的基础;教育评价是教育测量过程的延续,是对教育测量结果的解释与应⽤。

第2章教育测量与评价的基本原理

第2章教育测量与评价的基本原理
等间距:对象的能力水平差异相等时,赋予的数值 的差异也相等
绝对零点:测量对象完全没有所测量的能力时,赋 予其数值为零
教育测量及其数据类型
心理学家史蒂文斯(S.Stevens)根 据测量的精确程度,将测量量表从低 到高划分为称名量表、顺序量表、等 距量表和比率量表。相应地,由这四 种量表获得的数据又分别称为称名量 表数据、序量表数据、等距量表数据 和比率量表数据。
教育评价资料搜集的方法
文献研究的具体步骤有: (1)分类:文献研究的基本作法是编录,即根
据文献呈现出来的内容按特定的概念框架对文献 作分类记录。
(2)抽样:评价者从各个历史时期、各种类型 文献中,选取具有代表性、典型性的文献进行分 析研究。
(3)进行分析研究:根据文献资料的性质和评 价的要求进行内容分析或统计数据分析
教育评价资料分析的方法
统计分析法:通过数学的方法去分析和 比较教育评价资料。它通常用于对测量 资料的分析。
模糊综合评价法 :模糊综合评价法是把 模糊数学应用于教育评价而形成的一种 方法。
教学大纲在实现教育目标的程度的过 程。”“是一种确定行为发生实际变化的程度 的过程。” 我国学者认为,“教育评价是按照一定社会和 教育性质、教育方针和政策,所确立的教育目 标、对所实施的各种教育活动的效果、完成教 育任务的情况以及学生成绩和发展水平进行科 学判定的过程。”
教育评价及其标准

教育测量与评价(期末复习重点)

教育测量与评价(期末复习重点)

3.1、Baidu Nhomakorabea质信度之分半信度
• 就是将测验分半,被试在每一半测验上所得分 数的相关系数。反映了2半题目间的一致性。 • 分半的方法很多,如,按题号奇偶,按难度、 按题目内容。无论如何分半,都要在分开后做微 调,最终目的是分成对等的两半。如果做不到对 等,就不适合求分半信度。 • 在实际运用中,由于题目一般是按难度大小 排列,采用奇偶分半可以使两半测验的题目在难 度上基本相等,因此常被采纳。
• 2、对10名应试者先进行某种测验X,隔 适当时间后(半年),再进行内容、范围、 难度类似的第二次测验Y,试求测验的复 本信度? • 应试者 1 2 3 4 5 6 7 8 9 10 • X 9 10 10 6 10 8 4 8 9 4 • Y 4 9 7 9 4 3 5 3 2 4
• 3、有一个由100题构成的量表施行于10 个高三学生(分数见下表)。测验一次后, 学生即毕业离校,现怎样评价测验结果的 信度? • 学生序号 1 2 3 4 5 6 7 8 9 10 • 奇X 38 37 38 41 40 36 38 39 40 35 • 偶Y 37 37 36 39 39 34 38 39 39 36
缺点:
• 1、编制两个完全相等的测验是很困难的,如 果两个复本过份相似,则变成再测形式,而过分 不相似,又使等值的条件不存在; • 2、两个复本测验有可能在某种程度上测量了 不同的性质,这就会低估测验的信度;(因内容 造成的误差)。 • 3、被试同时接受性质相似的两个测验,可能 减少完成测验的积极性; • 4、虽然两个复本测验的题目材料不同,但被 试一旦掌握了解题的某一模式,就能触类旁通, 有可能失去复本的意义。

教育测量的质量指标

教育测量的质量指标

第二章教育测量的质量指标

第一节信度

第二节效度

第三节难度

第四节区分度

一、信度的概念

信度指的是测量结果的稳定性或可靠的程度。也就是测量结果是否真实、客观地反映了考生的实际水平。具体而言,可以从以下三方面来理解测量的信度。

(一)信度指实测值与真值相差的程度

测量的目的之一,就是希望通过测量得到的实测值能够接近事物的真实值。由于各种原因,实测值一般不会完全等于真实值,两者之差称为测量误差。测量误差越小,测量的信度就越高。用一个等式表示如下:

x = T + E

式中,x表示实测值,T表示真值,E表示误差。但测量的真实值是未知的,因此,误差也就无法求出来。当然,可以把很

多次测量的实测值的平均值作为真实值的近似值,但这在实践上不具有可操作性。所以,根据这种理解,无法求出信度的大小。

(二)信度指统计量与参数之间的接近程度

统计量和参数是统计学中的两个基本概念。统计量是指样本上的各种数字特征(如样本的平均数、标准差等),参数是总体上的各种数字特征(如总体的平均数、标准差等)。统计量越接近参数,这个统计量的可靠性就越高,因此,信度就越高。要知道统计量对参数的接近程度,可以对参数进行区间估计。这种方法对估计真分数也很有用的。但这种理解也无法计算出信度。

(三)信度指两次重复测量或等值测量之间的关联程度

如果对同一对象进行两次重复测量或者等值测量以后,计算两次测量的相关系数,相关系数越高,说明测量的信度就越高;反之,就越低。对于信度的这种理解,有利于信度的计算。但重复测量会受到被测对象的经验、知识增长等因素的影响,等值测量又较难编制,因此,采用这种方法计算信度时,也是有误差的。

教育测量与评价全套讲义课件

教育测量与评价全套讲义课件

(二பைடு நூலகம்教育评价的特征
• 1、教育评价=事实判断+价值判断 • 2、教育评价是对教育过程及其结果的评
价 • 3、教育评价必须以教育目标为基准 • 4、教育评价是评价者与被评价者的双边
合作活动
(三)在区别上理解教育评价
• 1、教育评价与教育测量 • 联系: • 教育测量是教育评价的基础,教育测量是对教育进行量的测定,
1通过心理调控可以使教育评价的准备更加合理充分2通过心理调控可以保证教育评价活动的实施得以顺利进行更好地完成各环节的任务3通过心理调控可以使评价的功能得以全面发挥圆满实现评价的目的二评价者心理与调控1准备过程的心理现象角色心理心理定势新奇感时尚效应和期望效应2施评过程的心理现象自尊心理首因效应近因效应晕轮效应参照效应理想效应时序效应成见效应宽大效应和附和权威心理3结果处理过程的心理现象类群效应从众心理逆反心理本位心理和模式效应2评价者心理的调控3通过心理换位使评价者自觉进行调控4通过完善规章制度加以调控三被评价者心理与调控1被评价者自我评价心理现象自我认可疑惧心理和被审心理2受评过程心理现象应付心理迎合心理和自卫心理3结果反馈心理现象敏感心理护短心理嫉妒心理和对评价进行评价心自我评价不但是评价过程的必要环节而且自我评价对评价结果有着相当大的影响需要了解被评价者自我评价形成
• 2、两次测验之间的时间间隔要适宜。应 由测验的性质、测题类型、测题数量和 被试特点所决定;

教育测量与评价

教育测量与评价

2、复本信度
• 指的是两个平等的测验测量同一批被试 所得结果的一致性程度。 • 其大小等于同一批被试在两个复本测验 上所得分数的相关系数。 • 所谓复本测验是指在性质、内容、题型、 题数、难度等方面都一致(或相等)的 两份或多份测验。
例二
• 以A、B两型英语复本测验对初中三年级10个 学生施测,为避免由测验施测顺序所造成的误 差,其中5个学生先做A型测验,休息15分钟后, 再做B型测验;而另5个学生先做B型测验,休 息15分钟后,再做A型测验。10个学生A型测 验结果记为X,B型测验结果记为Y,其测验的 复本信度如何? • 学生序号 1 2 3 4 5 6 7 8 9 10 • X 19 19 18 17 16 15 15 14 13 12 • Y 20 17 18 18 17 15 13 15 12 12
C、教育测量的深入发展
• 教育测量量表的编制突破了过去单一答案的求 同思维题,发展到有了求异思维题和论文题; • 教育测量范围由过去偏重于学生学习成绩的测 量,发展到涉及课程设计、教材、教育改革方 案等的测量; • 教育测量由过去单一的常模参照性测验模式, 发展到常模参照性测验与目标参照性测验相结 合的模式; • 教育测量本身的理论研究与技术开发更加深入 与完善。
(三)什么是教育测量
• 教育测量就是依据一定的法则,对教育 活动中的某一现象给予数量化的描述。 • 思考: • 心理属性是否也可以客观地进行测量呢?

第三章 教育测量与评价的质量特性

第三章 教育测量与评价的质量特性
2 ( X ) X 2 N .
( Y ) 2 Y N
2

例:10名中学生身高与体重的测量结果,问身高 与体重的关系如何?
X2 28900 29929 25600 24025 29929 35344 31684 33489 32400 27225 298525 Y2 2500 2025 2209 1936 2500 2809 2500 2401 2704 2025 23609 XY 8500 7785 7520 6820 8650 9964 8900 8967 9360 7425 83891
2
标准差:即方差的平方根,用S或SD表示。
S S2
2 ( X X )
N
二、相关及相关系数
(一)什么是相关 1.事物之间的相互关系 因果关系 共变关系 相关关系
2.相关的类别
正相关 负相关 零相关,即无相关

(二)相关系数
是两例变量间相关程度的数字表现形式,或者说 是用来表示相关关系强度的指标。 常用r表示。 相关系数的取值范围:-1≤r≤1
第三章 教育测量与评价的质 量特性
内蒙古师范大学教育科学学院 2012年11月12日 296957701
第一节 教育测量与评价中常用的统计参数

一、平均数和标准差 平均数
X

Xi
Xi

现代教育教育测量

现代教育教育测量

教育测量与评价要点

第一章 教育评价概述

一、基本概念

1. 测量:根据法则给事物分派数字,法则为标准,事物为对象,数字为结果。P3

2. 教育测量:根据测量学的基本原理和方法对教育现象及其属性进行数量化得研究过程,教育测量具有间

接性。P6

3.评价:根据某种价值观对于物质其属性进行判断、衡量,评价的本意是评论货物的价格。P9

4. 教育评价:根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地搜索信息、分析解释,

对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据过程。P11

二、基本知识

1. 测量的三个要素:单位(如米、克,教育测量的单位不能直接加减乘除);参照点(计算的起点,有绝

对零点和相零点);量表(测量工具)。P5

2. 量表的四种类别:类别量表、顺序量表、等距量表、比率量表。P6

3. 教育测量的特点:①测量结果的间接性;②度量单位的相对性(数据要转换);③测量对象的复杂性;

④测量目的的针对性。P6

4. 哲学史上三种价值观:①客观主义价值观;②主观主义价值观;③辩证唯物主义价值观。P9

5. 国外学者关于教育评价的观点:①泰勒:确定教育目标;②克龙巴赫:为决策提供信息;③斯克里文和

豪斯:对优缺点和价值的评估;④大桥正飞夫:对行为产生变化的价值判断。P10

6. 教育测量的历史知识:

① 《学记》记载中国在西周实行了教育考评;

② 科举制(606-1905)具有代表性;

③ 1702年英国剑桥大学首先用笔试代替口试;

④ 1845年美国在初等教育中以笔试代替口试;

⑤ 1864年英国费舍收集学生成绩样本汇成《量表集》开启了标准化测量的萌芽;

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。
内容效度不适合用于能力倾向和人格测验。
PPT文档演模板
第二章教育测量的质量指标2
(二)效标关联效度
• 又可称为经验效度或统计效度,是以测验分数和 效标之间的相关系数来表示测验效度的高低的。
• 效标就是足以显示测验所欲测量的特性的变量或 足以显示测验所欲预测的特性的变量。它是用来 检验测验效度的外在的、客观的标准和尺度。
估计内容效度的方法:
(1)逻辑分析的方法。其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。
(2)统计分析法。从同一个教学内容总体中抽取两套 独立的平行测验,用这两个测验来测同一批被试,求其 相关。若相关高,表明测验内容效度较高;若相关低, 表示测验的内容效度较低。
采用求统计量的公式进行计算,其公式有以下三种形式:
PPT文档演模板
第二章教育测量的质量指标2
三、效度的估计
• 效度估计就是多方寻找证据来证明一个测 验的有效性程度的过程。
• 1974年美国心理学会发行的《教育和心 理测量的标准》一书将效度分为三大类: 内容效度、效标关联效度和结构效度。
PPT文档演模板
第二章教育测量的质量指标2
(一)内容效度(Content validity)
• 例如:人的创造力可以分解为人的思维流畅性、灵活 性和创造性三大特性,并根据这三大特性编制测验, 若有足够的证据来证明该测验确实可以测到这些特性, 则认为该测验是个结构效度较高的创造力测验。
PPT文档演模板
第二章教育测量的质量指标2
(1)结构效度的特点
• 结构效度的大小完全取决于事先假定的心理特 质理论,一旦人们对同一种心理特质有着不同 的定义或假设,则会使得关于特质测验的结构 效度的研究结果无法比较。
• 结构效度是指一个测量能实际测量出理论上的构想或 心理特性的程度。它的目的在于从心理学的理论观点 就测验的结果加以解释和探讨。
• 这里的结构的含义是心理学理论所涉及的抽象而属假 设性的概念、构想、特性或变量,如智力、焦虑、机 械能力倾向、成就、动机等。
• 结构效度主要用于智力测验、人格测验等一些心理测 验方面。
• 为了证明这个论点,他们让刚入高中的103名学生作10道 题,测量其空间想像力。为避免知道了某些学生的刚入高中 时的成绩影响以后考试的评分,试卷暂不评阅。立体几何学 完后,进行考试,按得分多少把成绩分为五等(A、B、C、D、 E)分别得5、4、3、2、1分。这时才评阅入学时的试卷,统 计出期末得5、4、3、2、1分者在入学测验中分别答对1道题 至10道题的人数(见表2-1)。
峰对称分布,当然样本并不一定要正态。
• ③必须是成对的数据,而且每对数据之间是相互独立的,即各 自互不影响,本条件是难以检验的。
• ④两个变量之间呈线性关系。一般用描绘散点图的方式来观察, 最好是先各自转化为Z分数,单位会统一些。
PPT文档演模板
第二章教育测量的质量指标2
•例:
• 某中学数学教研组的教师积多年的教学法经验,认为刚 入高中的学生学习立体几何感到困难的主要原因是空间想像 力弱。
PPT文档演模板
第二章教育测量的质量指标2
•解:(1)设期末考试的等第为y,空间想像力测 验答对的题数为x,列出二重交叉次数分布表:
X(答对的题数) 1 2 3 4 5 6 7 8 9 10
Y A5
1 3 10 5 4 2 25
所B 4
1 6 8 8 4 31
31
评 的 等
C D
3 2
2459831 1 13211
PPT文档演模板
第二章教育测量的质量指标2
PPT文档演模板
第二章教育测量的质量指标2
2、效度与信度的关系
•根据公式(2-2)和(2-3),可将效度与信度的 关系图解于后:
σV2
σI2
σE2
•高效度、高信度
σV2
σI2
σE2
•低效度、高信度
σV2
σI2
σE2
•低效度、低信度
•根据分析,可得结论如下:1)高信度是高效度的必要条 件,而非充分条件。2)效度系数不会大于信度系数的 平方根。可以用下式表示:
• 基本计算公式:
• 例:有一位教师自编了一套测验题,用来预测学生 一年后的某科成绩,自编测验按百分制评分,一年 后考试评分只把学生分为及格者和不及格者。试就 所获资料估计自编测验的预测效度。
• 解:1)把两次测验成绩成对排列:
被试者
1 2 3 4 5 6 7 8 9 10 11 12 13 14
• 又称合理效度或逻辑程度,是指测验内容 或行为取样的代表性和适当程度;即测验 的内容范围、材料与所要测量的内容范围、 教育目标是否相符合;测验中测题所引起 的行为是否是所要测量的属性的明确反应; 测验的结果是否是一个有代表性的行为样 本。
• 估计内容效度的方法:
PPT文档演模板
第二章教育测量的质量指标2
第二章教育测量的质量 指标2
PPT文档演模板
2020/12/10
第二章教育测量的质量指标2
第二节 效度
一、效度的概念 二、效度的统计学原理及其与信度的关系 三、效度的估计 四、提高效度的方法
PPT文档演模板
第二章教育测量的质量指标2
一、效度的概念
• 效度(Validity)是指测量结果的准确性和有效
的各种因素是否成立。
PPT文档演模板
第二章教育测量的质量指标2
(3)结构效度的估计
• A、因素分析法 • 其目的是把一些具有错综复杂关系的因素归结
为数量较少的几个综合因素或称共同因素,并 以此测验所测之特质对测验分数作出解释。 • B、多元特质多重方法矩阵法 • 是由肯贝尔和菲斯克1959年提出的最受欢迎的 一种结构效度的评估方法。 • 这种方法的设想:若采用两种方法以上的方法 去测量两种以上的特质,那么这些测量结果之 间可以形成一个多元特质多重方法矩阵。
PPT文档演模板
第二章教育测量的质量指标2
二、效度的统计学原理及其与信度的关系 1、效度的统计学原理
在实际测量中,影响效度的主要因素是系统误差。 因而在讨论效度时,还必须把真分数方差分解为两 个部分,一是潜在真分数方差(σV2),另一部分 是系统误差分数方差(σI2) ,它与由随机误差引 起的变异(σE2)不同。
480
48wenku.baidu.com
0.300 0.462 0.562 0.720 0.837 0.911 0.954
0.400 0.496 0.548 0.619 0.668 0.679 0.713
PPT文档演模板
第二章教育测量的质量指标2
第三节 难度及其计算
• 一、难度的概念
• 难度是指测量试题的难易程度。 • 一个题目的难度大小,除了所测的内
容本身的难易程度有关以外,还与测 验的编制技术和被试的知识经验有关。 • 这就是说测验的难度具有相对性,正 因为此,必须让试题通过实践来对难 度作出检验。
PPT文档演模板
第二章教育测量的质量指标2
二、难度的计算
• (一)计算难度的基本公式 • 1、客观题难度的计算
•P表示难度指标,N表示参加考试的总 人数,R表示答对某道客观题的人数。
二列相关
• 适用于两个变量就其实际含义而言是 等距或等比数据,它们服从正态分布, 其中一列人为地划分为两类。
PPT文档演模板
第二章教育测量的质量指标2
点二列相关
• 适用于一列数据为等距或等比且总体服从正态分布(实 际上只需要单峰对称分布,如T分布),另一列变量是 按事物的性质划分为两类的变量,也可以是一个双峰分 布,人为划分为两类,如文盲与非文盲。这种相关系数 多用于测验中评价题目的区分度。对选择题、判断题在 整个测量中作用作出判断。
• 效标关联效度又可分为同时效度和预测效度。
(用全国高考的成绩作为效标来检验高中毕业生会考的 成绩,计算两者之间的相关系数就是会考的同时效度; 而用大学一年级的成绩作为效标来检验高考的成绩,计 算两者的相关系数就是高考的预测效度。)
• 估计效标关联效度可采用积差相关、二列相关或 点二列相关、四格相关和多元相关系数等计算各 种相关系数。
1、控制系统误差 2、精心编制量表 3、妥善组织测验 4、扩充样本的容量和代表性 5、合理处理效度和信度的关系 6、适当增加测验的长度
PPT文档演模板
第二章教育测量的质量指标2
表2.1 测验长度与信度和效度的关系
题数 与原测验题数之比 信度系数 效度系数
10
1
20
2
30
3
60
6
120
12
140
14
PPT文档演模板
第二章教育测量的质量指标2
1、用积差相关系数的方法估计效度
• 积差相关,是计算两个变量线性相关的一种方法,由英国统计 学家皮尔逊提出,因此也称为皮尔逊(Pearson)相关。要使用 积差相关必须同时具备如下几个条件:
• ①两个变量都是由测量获得的连续性数据,即等距或等比数据。 • ②两个变量的总体都呈正态分布,或接近正态分布,至少是单
一、效度的概念
• 这是因为:
• ⑴教育测量的对象大多是精神现象,只能通过对其 具有可测性的外部表现(如语言或动作等)的测量, 以间接认识其心理活动、心理特征或知识水平等。
• ⑵学生的心理活动、心理特征与其外部表现之间, 一般仅具有相关关系而无函数关系,外部行为并不 能准确无误地反映某种心理状态。
• ⑶教育测量的对象不是物而是有主观能动性的人。 人能有意识地调节自己的外部行为,掩盖自己的内 心活动,这就增加了认识其精神现象的难度。
•例4:60人参加考试,某题满分为12分,正确得 分累积是480分,求该题难度?
PPT文档演模板
第二章教育测量的质量指标2
(二)用极端分组法计算试题的难度
• 1、用极端分组法计算客观题的难度 • 具体步骤如下: • 1)先按测验总分的高低,按由高到低的顺序依次排
自编测验 67 10 20 44 60 43 61 10 26 23 30 18 35 23 的成绩(X)
一年后考 1 1 1 0 0 1 1 0 1 0 0 1 1 1 试成绩(Y)
•2)计算出二列相关公式所需统计量:
PPT文档演模板
第二章教育测量的质量指标2
(三)结构效度(Construct validity)
•2、主观题难度的计算
PPT文档演模板
第二章教育测量的质量指标2
二、难度的计算
•例1:在100个学生中,答对第一题的30人,答对 第二题的60人,求第一、二道题的难度?比较这 两道题谁比谁难?
•例2:某道论述题满分12分,所有考生在这道题 上的平均得分为3.6分,求该题的难度?
•例3:语文测验第五题最高得分为12分,这道题 考生的平均得分是8.5分,求该题难度?
• 当实际测量的资料无法证实我们的理论假设时, 并不一定就表明该测验结构效度高。因为还有 可能出现理论假设不成立,或者该实验设计不 能对该假设作适当的检查等情况,这就使得结 构效度的获取更为困难。
PPT文档演模板
第二章教育测量的质量指标2
(2)建立结构效度的步骤
• A、提出理论假设; • B、根据假定结构拟定测题,编制测验; • C、以测验结果为根据来验证假设结构中
性的程度,亦即测量是否达到了预期的目的。 • 第一,效度是一个相对的概念。
– 1.测量的效度始终是对一定的测量目的而言的。 – 2.测量的效度是相对于测量的结果而言的。 • 第二,一种测验的效度只是高或低的问题。 • 第三,在教育测量中,效度问题比在其他领域的 测量中更为重要。
PPT文档演模板
第二章教育测量的质量指标2
32 9
级E1 1 1 2 1 1
6
合计
PPT文档演模板
2 4 10 14 20 20 17 9 5 2 103
第二章教育测量的质量指标2
•(2)用积差相关系数公式计算效度系数:
PPT文档演模板
第二章教育测量的质量指标2
PPT文档演模板
第二章教育测量的质量指标2
PPT文档演模板
第二章教育测量的质量指标2
• 就现有资料,用什么方法可以判断教师们的意见是否正 确?
PPT文档演模板
第二章教育测量的质量指标2
•表2-1:
(答对的题数) 1 2 3 4 5 6 7 8 9 10
A5
所B 4
评 的 等
C D
3 2
级E 1
1 3 10 5 4 2 1 6 8 8 4 31 2459831 1 13211 11211
PPT文档演模板
第二章教育测量的质量指标2
四、提高效度的方法
• (一)各种效度系数的要求 • (二)影响效度的因素
– 测验的构成(要素) – 测验实施方面(过程) – 被试主观状态方面 – 估计效度所依循的效标 – 样本方面
PPT文档演模板
第二章教育测量的质量指标2
四、提高效度的方法
• (三)提高效度的方法:
相关文档
最新文档