第七章 教育测量法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究对象的某一种属性的顺序排列出等第次序。
如:根据学生的测验成绩排出名次,成绩最好的为1,
成绩次之为2,再次之为3,依次类推。
又如,对于生活水平,我们可以给出四个等级:贫困、
温饱、小康、富裕。
8
二、测量工具——量表
(三)等距量表(间距量表)
是具有相等的单位,但没有绝对零点的量表。
等距量表的数量单位之间的间距是相等的。
第七章
教育测量法
第一节 教育测量概述
第二节 教育测量的质量指标
第三节 教育测量法的实施
1
第一节 教育测量概述
一、教育测量法的特点 二、测量工具——量表 三、教育测量的类型
2
一、教育测量法的特点
(一)测量与教育测量的含义
所谓测量,就是“按照一定的规则为事物的属性、特征赋
值”。 教育测量就是根据某种规则或尺度,以数量化的形式描述教
●
提高测验信度的方法
1.信度系数(以相关系数表示)以多大为宜
信度系数必须和求得信度系数的环境条件(测验的用途 以及测验的内容和条件)相联系。
就测验的内容来说,标准学业成绩测验要求信度系数在 0.90以上,常达到0.95。标准智力测验的信度系数应达到 0.85以上。个性测验和兴趣测验的信度系数一般应达 0.7∽0.80。 2. 影响测验信度的因素
5
二、测量工具——量表
测量需要有测量的工具,测量的工具应具有 单位和参照点,并且有表示量数的方法,我 们把这种工具称之为量表。如,尺是度量长 度的量表,血压计是测量血压高低的量表,
智力测验是测量智商高低的量表。
量表的类型:称名量表、顺序量表、等距量 表、比率量表。
6
二、测量工具——量表
(一)称名量表(类别量表) 是根据事物的某一特点,对事物属性进行分
育现象或教育对象的某种属性。
通俗地说,就是根据一定的规则,给事物分派数字。1、2、 3、4、5这些数字本身是没有数量或质量意义的,只是个符 号。当我们规定1代表学业成绩的最低等级“不及格”;2代 表“及格”;3代表“中等”;4代表“良好”;5代表“优
秀”,这时1、2、3、4、5才具有实际意义,数字按规则被
试题同质性信度
r信 k k 1 (1 i
2
2
)
教师自编测验 的信度指标范 围为0.7以上。
σ2i:每道试题方差; Σ2:全卷方差; k :试卷中试题数目
24
● 信度系数的类型
1. 2. 3. 4. 5.
稳定性系数 等值性系数 内部一致性系数 论文式测验的信度系数 评分者信度
19
信度
信度(reliability):指的是测量结果的稳
定性和可靠的程度,亦即测量的结果是否真 实、客观地反映了受测者的实际水平。
具体而言,可以从以下三方面来理解测量的
信度:
1.信度指实测值和真值相差的程度 2.信度指统计量与参数之间的接近程度 3.信度指两次重复测验或等值测验之间的关联程度
验、韦克斯勒儿童智力测验量表(WISC-CR)、瑞文推理
测验等。
14
三、教育测量的类型
3.能力倾向测验
测被试潜在的某种能力,以了解其发展的可能性,预测个
人能力发展倾向。如音乐、美术、体育、创造力、想象力、 记忆力等方面的能力倾向测验。
4.人格测验
测被试的需要、动机、兴趣、态度、气质、性格、人际关
统计学中估计事物或现象间数量变动的一致性, 主要采用相关分析的方法,即计算出两种变量的 相关系数(rxy)。 在使用相关系数表示信度的高低时,相关系数可 称为信度系数(coefficient of reliability)。 它是对相同应试者的同一特性的两次测量分数的 相关系数,是测量结果的一致性的指标。
如:温度摄氏30度至32度与摄氏18度至20度的温差是
相等的,都是相差2度。三个儿童在智商测验中分别得 分105、110、115,在智商测验分数体系中,分数差距
是相等的。等距量表在学校教育系统运用广泛,一般将
百分制评分看作等距量表。
9
二、测量工具——量表
(四)比率量表(等比量表)
除了具有类别、顺序、等距量表的特征外,还有一
题、选取有代表性的样本进行试测;根据数量化指标筛选测验题目; 鉴定整个测验的信度和效度;建立常模、确定指导语、时限和施测
条件;规定评分标准、分数转换和解释方法等。标准化测验所获得
的测量结果比较客观、可靠、应用范围较广,一般测量调查应尽可
12
能选用标准化的测验工具。
三、教育测量的类型
2.非标准化测量(教师自编测量)
指一个主试能同时对许多被试进行的测量。
团体测量节省人力与时间,在短时间内能收集到大量的资料,效率
18 较高,但被试的反应不容易控制,并且测量效果不及个别测量可靠。
第二节 教育测量的质量指标
衡量教育测量的质量,可采用四个指标: 信度 主要对整个测量而言。 效度 难度 主要对测量的项目而言。 区分度
个具有实际意义的绝对零点。
零点是指测量的起点或参照点。有些零点是人定的,称
相对零点,如摄氏零度,这里零度并不意味着没有一点 温度,而是以人定的冰点为参照标准。像学生的考试成 绩、智商的0分都是相对零点。有些零点具有实际意义, 称绝对零点。如年龄、身高、经费开支等都有绝对零点, 0岁、0米、0元中的“零”都表示真实的“无”,表示 一点都没有。
23
信度
含义 种类 公式 指标范围
即测试的稳定 性和和可靠程 度,信度是反 映测量中随机 误差大小的指 标。包括重测 信度、复本信 度、同质性信 度。
重测信度:同一测 验对同组被试先后 两次施测所得结果 的一致性程度; 复本信度:两平行 测验对同组被试施 测所得结果的一致 性程度; 同质性信度:测验 内部所有题目间的 一致性程度。
13
三、教育测量的类型
(二)根据测量的内容分类:学业成就测验、智力测验、能
力倾向测验、人格测验等。
1.学业成就测验
测被试经某种形式的学习或训练后对知识、技能的掌握程
度或熟练水平。如识字量、阅读、算术测验等,成就测验
可以是学科成就测验或综合成就测验。 2.智力测验
测被试的智力高低,其结果常以智商(IQ)来表示,此类 测验比较多,其中比较著名的有:斯坦福——比纳智力测
2. 信度指统计量与参数之间的接近程度
统计量是指样本上的各种数字特征。(如样本平均数、
标准差等);参数是总体上的各种数字特征(如总体平 均数、标准差等)。
在统计学中,统计量越接近参数,这个统计量的可靠源自文库
性越高。而要知道统计量与参数的接近程度,可以对参 数进行区间估计。
22
3. 信度指两次重复测验或等值测验之间的关联程度
数学成绩测量的标 准分数。 高度、温度
11
比率量表
三、教育测量的类型
(一)根据测量的标准化程度分类:标准化测量、非标准化测 量
1.标准化测量
由专家学者或专门机构采用系统的科学程序编制的、在测验实施过 程、评分手续、分数的解释上具有统一标准的,并对测验误差做了 严格控制。
编制和施测有一套标准程序。测验编制包括确定测验目的、科学命
25
● 信度对于教育测量的意义
1.信度是任何一种测量的必要条件。因为教育测量 的对象主要是精神现象,所测量的特性不易把握, 为了能真实地反应测验对象的某种特点,需要更加 注意测量的信度,从而正确地判断测量结果的价值。 2.信度高的教育测量,能给教师和教育工作的领导 者提供可靠的信息,为他们的教育预测和决策提供 依据。 3.信度高的教育测量,能使教师对学生的评价变得 客观和可靠,也使学生对自己的认识更符合实际情 况,从而有助于改进教与学的方法。 26 4.信度高的教育测量,有助于提高教师的工作效率。
以进行。
一、教育测量法的特点
(三)教育测量的特点
教育测量的基本特点就是根据一定的法则,
以测验为工具对研究对象进行测试,从而获得数量
化的结果,并通过进一步分析获得相关结论。
教育测量可以把抽象、概括的理论研究成果 (如群体发展的平均指标、一般特征、理论学说等) 转化为反映个体发展水平、教育发展状况的方便工 具,并提供可靠的数据。
系等人格心理特征,较为著名的有明尼苏达多相个性测验
(MMPI)、艾森克人格问卷(EPQ-R)、卡特尔16项人格因 素测验(16PF)等。
15
三、教育测量的类型
(三)根据测量结果的评价标准分为:常模参照测验、目标参照测验。
1.常模参照测验
常模参照测验是一种衡量被试相对水平的测验,是将被试的测验成绩 与同类对象在同一测验上的平均分(常模)相比较,从而解释分数,
17
三、教育测量的类型
(四)根据同时受测的人数分类:个别测量、团体测量
1.个别测量
指主试与被试一对一进行的测量(一个主试在同一时间内, 只测验一个被试)。
个别测量的可靠性比较高,主试能有效地观察控制被试的行为反应,
但个别测量费时费力,短时间内难以获得大量的资料,并且对主试 的要求较高。
2.团体测量
赋予了意义。
3
一、教育测量法的特点
(二)测量的要素 (1)测量客体。指测量的对象。测量的客体可以是人,
也可以是教育研究中的事物或现象。
(2)测量内容。指测量客体的属性和特征。测量内容可 以是外显的,如学生的性别、年龄、身高、体重等,也
可以是内隐的,如学习兴趣、动机、态度、价值观等。
(3)测量规则。指测量的法则或方法。也就是说,要构 建一套如何分派数字或符号的准则,按准则对测量内容 进行规范化、标准化的操作。 (4)测量工具。指测量的指标体系。没有工具,测量难 4
类,用名称或数字来代表事物或性质,是给事物
进行简单归类的一种量表形式。
如:男生为1,女生为2 喜欢语文的学生为1,喜欢数学的学生为2
称名量表测量的结果不能运算,但可以做统计分析(如计算百分比、 列联相关、卡方检验)
7
二、测量工具——量表
(二)顺序量表(等级量表) 只有等级顺序而无等距的单位和绝对零点,只是按
确定被试在总体中的相对位置的测验方法。
常模参照测验要有常模对照表。常模有地区性常模和全国性常模,地 区性常模只适用于特定的区域,如在城市获得的常模就不一定适用于 农村或边远地区,而全国性常模适用于全国所有的同类个体。如,儿 童的身高、体重就有全国性常模,中国儿童发展量表(3-6岁)就有 全国性常模。只要我们将个体实际测量的数据与常模一对照,就可以 知道个体所处的地位。
16
三、教育测量的类型
2.目标参照测验
又称标准参照测验,是衡量被试实际水平的测验,将被试
在测验上的分数与事先制定好的某种标准进行比较,看被
试是否达到了目标规定的要求。
目标参照测验的特点是依据标准,判断被试的达标程度,
而不是将被试的成绩与他人成绩做比较。如,英语水平测
试、毕业考试、动作技能测试、体育达标测试等。
20
1.信度指实测值和真值相差的程度
x=T+E E=x-T
(公式1-1) (公式1-2)
x表示实测值,T表示真值(是未知的,可以把多次测量的实测值的平均值作为
真值的近似值),E表示误差。
试比较以下两次测量结果(只进行一次)的信度:
用尺子量100cm高的一个儿童,得到1cm的绝对误差;量185cm高的一位 运动员,也得得到1cm的绝对误差。 要比较两种测量结果的信度,一定要看误差分数(E)对于真分数(T) 所占的百分数是多少。这个百分数表示该实得分数(x)的相对误差。 其计算式如下: 相对误差=E/T×100% 公式(1-3) 把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得: 相对误差(甲)=1/100×100%=1% 相对误差(乙)=1/185×100%=0.54% 21 据此,度量乙的信度要比度量甲的信度高。
指测量的编制和实施不按标准程序进行的测量,通常由教
师或研究人员自编的、为临时测量所用的简单测量。如课
堂测验、考试、等级评定量表等。
这些测量是教师根据教学目标和自己的教学经验编制而成,
它通常与日常教学工作紧密联系;测验内容与教材内容、
教学进度一致;难易程度由教师把握;针对性较强。编制 省时、省力、灵活、方便。不足之处在于测验的客观性和 标准化程度不如标准化测验,测验的实施和记分也不甚严 格。
10
上述四种量表的比较:
量表
称名量表
条件
无顺序的测量,只是指 出有两个或多个范畴。
是有顺序有测量,在于 指出所测量的范畴的不 同并能够按一定的顺序 排列。
例子
中学的类型:公立、 私立、职业、普通 等。
字母的排列系统、 学习态度。
顺序量表
等距量表
有顺序的测量,在量表 中表现为数量上的等距 变化 含有绝对或真正的零点 和统一的单位。