教育统计与测量-测验分数的解释与应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常模以可分为发展常模与组内常模两大类。发 展常模又有年龄常模与年级常模之别,组内常 模又有百分等级常模与标准分数常模之别。
年龄常模
发展常模就是某类个体正常发展进程各特定阶段的一 般水平;有了它,人们就可拿被试的发展程度去跟个 体正常发展的进程作比较,看看被试的实有水平跟 个 体正常发展进程的什么阶段相当。法国心理学家比纳 (Binet),最早建立了智力测验的年龄常模。
比纳经过深入研究,提出用一批各年龄组儿童 大多数人(大约为被试样组中该年龄儿童的 80%)都能通过的项目,来代表该年龄组的智 力水平。也就是说,6岁儿童的大多数能通过 的项目,就划归6岁年龄组;8岁儿童的大多数 能通过的项目,就划归8岁年龄组。因为智力 是随年龄增长而提高的,于是8岁组的项目自 然就要比7岁和6岁组的难。
比纳在实际抽样调查研究基础上,按通过率来 确定项目难度并选定代表各年龄智力水平的恰 当项目,用这种方法来建立年龄常模。
比纳式的智力测验,每个年龄组有4个或6个测验项目, 整个测验就由这些项目从易到难排列组成。儿童接受 测验后,其智力年龄当然跟他最后能通过哪个年龄组 的项目有关。
比如某8周岁儿童,7岁及以下年龄组项目全能通过,8 岁组通过了5个项目(假定每年龄组项目为6个),9岁 组通过了3个,10岁组通过了2个,11岁组通过了1个, 12岁组以上所有项目都不能通过。这样,一年有12个 月,每年龄组有6个项目,于是每个项目可视为代表2 个月“智龄”。
7*12+5*2+3*2+2*2+1*2=106(月)=8岁又10个月
后来,人们为了使被试测值跟正常发展水平比较后结果 能更好地加以量化,提出了智商的概念。智商就是被试 的智力年龄对生理年龄的比。就前例即:
智商(IQ)
智力年龄 生理年龄
100
源自文库
106
/(8*12) *100
110
年级常模
例如,我们想了解某个学生英语阅读达到了哪 个年级水平,我们首先必须知道每个年级学生 英语阅读的普通水平,这需要通过建立英语年 级常模。
这种通过拿被试测值跟 应有标准作比较来确定 其意义的分数,就叫绝对评分分数。
所以,教育测量的分数,可以分为两类,即相 对评分分数与绝对评分分数。
作为绝对评分参照物的应用“标准”,是要通过明确 界定才能建立起来的。就学业成就验验来说,就要明 确界定应该包含哪些方面的知识与技能,对这些知识 与技能应掌握到什么程度。
同时,还要按照这种规定,实际编制出能体能这些要 求的测验,即所编测验,其项目要能覆盖知识与技能 的所有这些方面,且数量足够,难度恰当,真正能测 到应用的掌握程度。
最后,要还提出测验上代表合格水平的通过百分比。 如通过60%(我国习惯),或通过75%或80%(欧美 常如此定),或通过100%(如中学生体育锻炼标准)。
其次,要用拟定建立常模的测验,采用规范化 施测手续与方法对标准化样组(常模组)中的 所有被试,施测该测验,以便恰当而准确地收 集到所有这些被试在该测验上的实际测值。
最后,对收集到的全部资料进行统计分析处理, 真正把握被试样组在该测验上的普遍水平或水 平分布状况。也就是说,实际地建立起该测验 常模来。
测验分数的解释与应用
分数与常模
分数的种类与含义
通过测量获得的、描述测量对象身心特性水平 的数字就是分数。在测量工具上直接得到的测 值,叫原始分数。
比如,语文考试卷面分85,数学竞赛卷面分93等 等,就是原始分数。
单纯的原始分数,没有其他解释资料相配合, 其意义是不明确的,甚至可以说是无意义的。
所以,原始分数的意义必须要跟一定的参照物比 较,才能真正明确起来。
原始分数意义的参照物大体有两类:
一是其他被试的测值,即其他被试在所测特性 上的普遍水平或水平分布状态;
这种通过被试间相互比较而确定意义的分数就 叫相对评分分数。当我们平常说,某少年英语 成绩不错,“在全年级冒尖”,或说某学生听 力成绩太差,“全班倒数第二”,这都是相对 评价的例子。
什么是常模
相对评分的参照物或者说是参照体系,就是所 谓“测验常模”,简称“常模”,即指一定人 群在测验所测特性上的普遍水平或水平分布状 况。测验总是用来测量人的某种身心特性的, 如身体素质、智力、人格特点和学科上的学业 成就等。
常模建立的步骤
要针对某特定人群团体建立起某具体测验上的 常模,就要进行一系列的严肃认真的实际研究 工作。首先,就要科学抽样,从清楚而明确地 定义的“特定人群”总体中,抽取到容量足够 地大、并有代表性的被试样组。这种被试样组 就叫标准化样组或常模组。
那如何来建立呢?如何抽样,如何建立测验?
年级常模曲线
组内常模
组内常模 是解释被试原始分数的参照体系,即 被试所属那类群体的人在所测特性上测验取值 (也就是分数)的分布状况。拿被试分数跟这 种分数分布状况作对比,就能揭示出被试在其 所属那类群体中的相对地位。
但是有时取得被试所属那类群体的所有人的测 验分数,事实上不可能,因而,就只能从中抽 取一个代表性样组(即常模组),然后将拟建 立常模的测验对其施测,求得这一代表性样组 (常模组)中所有人的分数分布状况。
心理学已经证明,人的智力从出生起是随着年龄的增 长而逐渐成熟的。因此一个儿童智力的实有水平,如 果跟正常儿童智力发展进程中他所在年龄的一般水平 相当,那么这个儿童就具有正常的智力发展水平;如 果他相当于更高年龄儿童的智力水平,他就属于智力 发展优秀的儿童;如果他相当于更低年龄儿童的智力 水平,他就属于智力发展落后的儿童。总之,就是要 拿智力测验上的测值即原始分数去与个体智力发展正 常进程的各个年龄水平作比较,看看相当于哪个年龄 的水平,这样来确定被试的智力年龄。那用什么来具 体代表正常个体发展进程中各年龄的智力水平呢?
二是社会在所测特性上的客观要求,即被试在 所测特性上发展应该达到的程度标准。
例如,要测试大家有没有达到课程大纲对英语 专业大一学生所要求的写作水平,此时得到的 分数是要与一个标准相比较,达到了就是“合 格”,如未达到就是“不合格”。这里,全然 不管其他被试在同一测验上所得测值如何,他 们达标与否丝毫不影响该被试测验分数意义的 确定。
年龄常模
发展常模就是某类个体正常发展进程各特定阶段的一 般水平;有了它,人们就可拿被试的发展程度去跟个 体正常发展的进程作比较,看看被试的实有水平跟 个 体正常发展进程的什么阶段相当。法国心理学家比纳 (Binet),最早建立了智力测验的年龄常模。
比纳经过深入研究,提出用一批各年龄组儿童 大多数人(大约为被试样组中该年龄儿童的 80%)都能通过的项目,来代表该年龄组的智 力水平。也就是说,6岁儿童的大多数能通过 的项目,就划归6岁年龄组;8岁儿童的大多数 能通过的项目,就划归8岁年龄组。因为智力 是随年龄增长而提高的,于是8岁组的项目自 然就要比7岁和6岁组的难。
比纳在实际抽样调查研究基础上,按通过率来 确定项目难度并选定代表各年龄智力水平的恰 当项目,用这种方法来建立年龄常模。
比纳式的智力测验,每个年龄组有4个或6个测验项目, 整个测验就由这些项目从易到难排列组成。儿童接受 测验后,其智力年龄当然跟他最后能通过哪个年龄组 的项目有关。
比如某8周岁儿童,7岁及以下年龄组项目全能通过,8 岁组通过了5个项目(假定每年龄组项目为6个),9岁 组通过了3个,10岁组通过了2个,11岁组通过了1个, 12岁组以上所有项目都不能通过。这样,一年有12个 月,每年龄组有6个项目,于是每个项目可视为代表2 个月“智龄”。
7*12+5*2+3*2+2*2+1*2=106(月)=8岁又10个月
后来,人们为了使被试测值跟正常发展水平比较后结果 能更好地加以量化,提出了智商的概念。智商就是被试 的智力年龄对生理年龄的比。就前例即:
智商(IQ)
智力年龄 生理年龄
100
源自文库
106
/(8*12) *100
110
年级常模
例如,我们想了解某个学生英语阅读达到了哪 个年级水平,我们首先必须知道每个年级学生 英语阅读的普通水平,这需要通过建立英语年 级常模。
这种通过拿被试测值跟 应有标准作比较来确定 其意义的分数,就叫绝对评分分数。
所以,教育测量的分数,可以分为两类,即相 对评分分数与绝对评分分数。
作为绝对评分参照物的应用“标准”,是要通过明确 界定才能建立起来的。就学业成就验验来说,就要明 确界定应该包含哪些方面的知识与技能,对这些知识 与技能应掌握到什么程度。
同时,还要按照这种规定,实际编制出能体能这些要 求的测验,即所编测验,其项目要能覆盖知识与技能 的所有这些方面,且数量足够,难度恰当,真正能测 到应用的掌握程度。
最后,要还提出测验上代表合格水平的通过百分比。 如通过60%(我国习惯),或通过75%或80%(欧美 常如此定),或通过100%(如中学生体育锻炼标准)。
其次,要用拟定建立常模的测验,采用规范化 施测手续与方法对标准化样组(常模组)中的 所有被试,施测该测验,以便恰当而准确地收 集到所有这些被试在该测验上的实际测值。
最后,对收集到的全部资料进行统计分析处理, 真正把握被试样组在该测验上的普遍水平或水 平分布状况。也就是说,实际地建立起该测验 常模来。
测验分数的解释与应用
分数与常模
分数的种类与含义
通过测量获得的、描述测量对象身心特性水平 的数字就是分数。在测量工具上直接得到的测 值,叫原始分数。
比如,语文考试卷面分85,数学竞赛卷面分93等 等,就是原始分数。
单纯的原始分数,没有其他解释资料相配合, 其意义是不明确的,甚至可以说是无意义的。
所以,原始分数的意义必须要跟一定的参照物比 较,才能真正明确起来。
原始分数意义的参照物大体有两类:
一是其他被试的测值,即其他被试在所测特性 上的普遍水平或水平分布状态;
这种通过被试间相互比较而确定意义的分数就 叫相对评分分数。当我们平常说,某少年英语 成绩不错,“在全年级冒尖”,或说某学生听 力成绩太差,“全班倒数第二”,这都是相对 评价的例子。
什么是常模
相对评分的参照物或者说是参照体系,就是所 谓“测验常模”,简称“常模”,即指一定人 群在测验所测特性上的普遍水平或水平分布状 况。测验总是用来测量人的某种身心特性的, 如身体素质、智力、人格特点和学科上的学业 成就等。
常模建立的步骤
要针对某特定人群团体建立起某具体测验上的 常模,就要进行一系列的严肃认真的实际研究 工作。首先,就要科学抽样,从清楚而明确地 定义的“特定人群”总体中,抽取到容量足够 地大、并有代表性的被试样组。这种被试样组 就叫标准化样组或常模组。
那如何来建立呢?如何抽样,如何建立测验?
年级常模曲线
组内常模
组内常模 是解释被试原始分数的参照体系,即 被试所属那类群体的人在所测特性上测验取值 (也就是分数)的分布状况。拿被试分数跟这 种分数分布状况作对比,就能揭示出被试在其 所属那类群体中的相对地位。
但是有时取得被试所属那类群体的所有人的测 验分数,事实上不可能,因而,就只能从中抽 取一个代表性样组(即常模组),然后将拟建 立常模的测验对其施测,求得这一代表性样组 (常模组)中所有人的分数分布状况。
心理学已经证明,人的智力从出生起是随着年龄的增 长而逐渐成熟的。因此一个儿童智力的实有水平,如 果跟正常儿童智力发展进程中他所在年龄的一般水平 相当,那么这个儿童就具有正常的智力发展水平;如 果他相当于更高年龄儿童的智力水平,他就属于智力 发展优秀的儿童;如果他相当于更低年龄儿童的智力 水平,他就属于智力发展落后的儿童。总之,就是要 拿智力测验上的测值即原始分数去与个体智力发展正 常进程的各个年龄水平作比较,看看相当于哪个年龄 的水平,这样来确定被试的智力年龄。那用什么来具 体代表正常个体发展进程中各年龄的智力水平呢?
二是社会在所测特性上的客观要求,即被试在 所测特性上发展应该达到的程度标准。
例如,要测试大家有没有达到课程大纲对英语 专业大一学生所要求的写作水平,此时得到的 分数是要与一个标准相比较,达到了就是“合 格”,如未达到就是“不合格”。这里,全然 不管其他被试在同一测验上所得测值如何,他 们达标与否丝毫不影响该被试测验分数意义的 确定。