心理与教育测量第七章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 3、导出分数定义:
– 导出分数是在原始分数基础上按照一定的规则 经过统计处理获得的具有明确的参照点和单位, 可以表明个体在团体中相对地位的分数。
• 4、常见导出分数:
– 百分等级;标准分数;标准九分数。
二、百分等级分数
• 1、定义:
• 2、计算:
– 在一个群体的测验分数中,得分低于这个分数 的人数的百分比。通常用 P 表示。
• 注意:标准分数分布不等于标准正态分布!
– 所有原始分数转化为Z分数之后,Z分数的平均 数都为0,标准差为1。因此,可用于横向比较 和具有可加性。Z分数的分布范围在[-3,3]之 间,约占全体的99.73%。
• 正态化的标准分数
– 正态化的原因:由于不同测验的原始分数不一 定呈正态分布,因此直接根据标准分数进行比 较时,实际上所包含的百分等级并不相同,因 此比较的结果并不准确。
第三节 常模编制
• 概述 • 常模分数的类型 • 常模的表示方法
一、常模的概述
• 常模的定义
– 常模是根据标准化样本的测验分数经过统计处 理而建立的具有参照点和单位的测验量表。
• 常模的意义
– 有了测验常模,被试可以据自己在测验上的得 分查得对应的常模,常模分数,进而可以确定 自己在团体中的相对地位,从而获得一定意义。 – 原始分数转换为常模分数之后,不同测验的分 数可以相加。
四、标准分数的变式
• 需要变式的原因
– 标准分数或正态化标准分数存在负号和小数点,为了 去掉负号,和小数点(使单位变小),需要进行线性 变换。变换后变式具有同标准分数同样的性质。
• 常见的变式
– – – – ① T分数 ② CEEB分 ③ 韦氏IQ ④ EPT分 T=10*Z+50 CEEB=100*Z+500 IQ=15*Z+100 EPT=20*Z+90
– 3、测验或预测源组合
• 作某一决策时,将几个测验或预测源得分进行组合。
• 分数合成中的问题
– 1、合成的方法是什么?
• 牵涉到合成的目的,各部分分数间的关系,能否替 代,能否补偿。
– 2、合成分数的评价标准是什么?
• 一般用效标分数。
– 3、参加组合的总分用多少,用哪些?
• 在效果相同情况下,用最少分数,用最有效分数参 加合成,可逐步增加。
R
– 通式(适用分组和未分组资料):
• 其中N表示被试样本人数,X表示某被试的原始分 数,L表示被试所在组的组实下限,Fb表示被试所 在组的下一组累积人数。i表示被试所在组的组距。
举例
• 从某地抽取了高三学生的代表性样组施以 数学测验(全卷满分为120),所得分数整理 列表如下表。若甲生110分,乙生100分, 丙生70分,试求他们的百分等级。
一、原始分数与导出分数
• 1、原始分数定义
– 被试接受测验后,根据测验记分标准与被试反 应所计算的测验分数称为原始分数。
• 2、原始分数性质:
– 原始分数是被试正确作答的记录,其参照系为 测验内容全体,不能表明被试个体在全体被试 中的相对地位。 – 原始分数属于顺序量表上的分数,没有固定的 参照点和相等的单位,因此也无法作横向比较。 即比较来自不同测验上的分数。
举例
• 某被试在一次由50人参加的成绩测验中得 80分,排名第九,则该生成绩的百分等级 为多少?
• 3、评价:
– 优点:
• 相对地位量数,可横向比较,意义明确,计算简单。 不受原始分数分布形态的影响。
– 缺点:
• ① 顺序量表,无相等测量单位,不可计算差值。 • ② 在分数疏松区间反应迟钝,在分数密集处反应过 分敏感。 • ③ 随参照团体的变化百分等级会发生变化。
五、标准九分数
• 定义:
– 标准九分是将原始分数分成九个部分的标准分 数系统。
• 原始分数转换为标准九分的方法
– 若原始分数呈正态分布,则以0.5个标准差为单 位,将正态曲线下的横轴分为九段,最高一端 为9分,最低一端为5分,除两端(1分,9分) 外,每段均有半个标准差宽。如下表和图所示。
标准九的分布特点
– ③ 标准加权
• 各部分分数转换为标准分后再分别乘上关系权数。
– ③ 标准加权
• 各部分分数转换为标准分后再分别乘上关系权数。 通式:
Z总= Wi Zi
• 加权系数的确定方法:①抽象推理,从某些理论要 求出发加以推定;②统计方法,常用主成分分析的 第一主成分作权数。
(三)多重回归
• 条件
– 需要测量结果对预测效标作出估计。 – 预测源与效标之间存在线性关系,所测特质具有补偿 性。 – 预测源和效标资料都能获得,并且是连续性资料。
• 皮亚杰的守恒概念发展顺序:
– 5岁质量守恒-6岁重量守恒-7岁容量守恒。
2、智力年龄
• 首先在1908年比内-西蒙智力量表中使用。 指一个人在年龄量表上所得的分数。 • 智龄的计算方法
– 方法一:将题目分到各个年龄组,每个题目代 表一定的年龄,通过被试通过各个年龄组项目 的总数从而得到智力年龄。实际中采用基础年 龄+附加月份。 – 方法二:将被试的原始分数同每个年龄组的平 均分数进行比较,从而求得智力年龄。
(一)发展常模
• 年龄量表
– 发展顺序量表
• 将个体的行为表现与不同年龄的人的行为平均表现 进行比较,确定其行为处于哪个年龄阶段。
– 智力年龄
• 将个体在的分数与不同年龄的人在同样测验上的平 均分数进行比较,确定其智力年龄处于哪个年龄阶 段。
• 年级当量
– 将个体的教育成就分数与不同年级的人的平均 分数进行比较,确定其教育成就处于哪个年级 水平。
标准十分
• 定义:
– 标准九分是将原始分数分成十个部分的标准分 数系统。
• 原始分数转换为标准十分的方法
– 也是以0.5个标准差为单位,与标准九不同的是, 它将正态曲线下的横轴分为十段。如下表和下 图所示。
正态Z分数与标准十的转换方法
正态Z分数 z<-2.0 -2.0≤Z<-1.5 -1.5≤Z<-1.0 -1.0≤Z<-0.5 -0.5≤Z<0.0 0.0 ≤Z<0.5 0.5≤Z<1.0 1.0≤Z<1.5 1.5≤Z<2.0 Z≥2.0 合计 标准等级 总体中的百分比 1 2.3% 2 4.4% 3 9.2% 4 15.0% 5 19.1% 6 19.1% 7 15.0% 8 9.2% 9 4.4% 10 2.3% — 100%
• 计算公式
• 使用方法:
– 先采用简单相关最大的变量,再依次加入偏相关最大 的变量,直到R2增加不大时为止。
(四)多重划分
• 各部分分数不具备代偿功能时,第2种和第3种方 法均不可使用,改用它法。 • 多重划分是一种方法,即在每一总分测验上都有 一个取舍选择,只有同时通过所有总分选择才最 终成功。如研究生考试的2条分数线。 • 为节约起见,可采用连续选择法,即每作测验选 择一次,未入选的不再参加下轮测试。排序时一 种方法是将最有效选择测验放前面。另一种是将 省时省力放前面。(高考)
• 常模的编制步骤:
– ① 确定有关的比较团体,即常模团体; – ② 对常模团体施测,获得该团体成员的测验分 数; – ③ 将常模团体测验分数转化为某种导出分数。 这个导出分数也叫常模分数。
• 常模团体的选择
– 常模团体的定义:
• 由具体有某种共同特征的人所组成的群体。实际中 常指它的一个有充分代表性的样本。同一测验可有 多个不同的常模团体。 • 任何一个测验都有许多常模团体,在制定常模时首 先要确定常模团体,在解释时也要考虑常模团体的 组成。 • 对测验编制者而言,常模团体的选择必须能够代表 该总体,常模团体的选择包括确定一般总体、确定 目标总体、确定样本。
Baidu Nhomakorabea
三、标准分数
• 定义
– 以标准差为单位的离均差。以Z表示,又称为Z 分数。
• 计算

z
x

• Z分数的性质
– 是以一批分数的平均数为参照点,以标准差为 单位的等距量表。
• 正负号表示位于平均数之上或之下,绝对值表示与 平均数的距离。
– 将原始分数转化为标准分数,是线性转换,不 改变原有分数的性质和分布。
二、分数合成的方法
• • • • 临床诊断——直觉合成 加权求和合成 多重回归 多重划分
(一)临床诊断——直觉合成
• ① 方法:
– 凭直觉和经验分析各分测验的关系和重要性综合决策。 如医生诊断病情、指导考生填报高考志愿。
• ② 评价:
– 优点:高度综合性;针对性强。 – 缺点:缺乏精确量化分析;带有主观偏面性。
1、发展顺序量表
• 它是最直观的发展常模。指明了多大年龄 的人应具备何种能力或行为。 • 它最早的范例是葛塞尔发展程序表
– 如婴儿的感觉运动发展是这样:4周,能控制 眼睛运动,去追随一个对象看;16周,能使头 保持平衡;28周,能用手抓握东西并玩弄它; 40周,能控制躯干、坐立或爬行;52周,能控 制腿脚运动、站立和行走。
– 于是将所有的原始分数的分布都转换到标准正 态分布上,根据正态分布上所对应的Z值进行 比较。 – 具体的计算为:据原始分数分布求出百分等级 分数 PR ,在标准正态分布表中根据 PR 查到对 应的Z分数。如下图所示。 – 正态化标准分数的评价:可以比较分布形态不 同的Z分数。
思考
• 如何检验原始分数的分数为正态分布?
标准十的分布特点
六、几种导出分数的相互关系
第二节
• 分数合成的意义 • 分数合成的方法
分数合成
一、分数合成的意义
• 分数合成的种类
– 1、项目组合
• 将测验下所有项目分数合成得到测验总分。合成方 法有简单合成和加权合成两种。
– 2、分测验或分量表组合
• 一个总测验下有若干个分测验或分量表,将各分测 验分数合成为一个总测验分。
• ③要求:
– 需要研究者(或操作者)受过专门训练,并且具有丰 富的经验。
(二)加权求和合成
• 条件
– 在各部分分数可同时获得,相互间有代偿作用 时用加权合成。
• 方法
– ① 单位加权——简单相加:
• 方法简单,权数是各部分分数的标准差比。
– ② 等量加权:
• 各部分分数分别转为标准分数,再简单相加,各部 分分数地位平等。
心理与教育测量
主讲:邓稳根(博士) 赣南师范学院教育科学学院 E-Mail: dwengen@163.com
第七章 测验常模
• 分数转换 • 分数合成 • 常模编制
第一节 分数转换
• • • • • • • 原始分数与导出分数 百分等级分数 标准分数 标准分数的变式 标准九分 标准十分 几种导出分数之间的关系
– 组内常模
• 将个体成绩与所在群体内的成员成绩进行比较,从 而确定个体在群体内的相对地位。 • 组内常模通常有百分等级常模和标准分常模两种。
• 个体常模
– 将个体的心理特质测验分数与其其他属性进行 比较,看其心理特质水平是否与其他属性的发 展相符合。 – 常用的个体常模有各种商数,例如比率智商、 教育商数、成就商数等。
• ④样本大小要适当。太大,人财物力不够;太小, 代表性不够。此外,要考虑到总体的大小;群体的 同质性;测验结果的精确度。一般来说,样本不得 小于30或100。全国性常模需取样2000-3000人。 • ⑤常模数据应是近时的,时间太长了要修订。 • ⑥注意一般常模与特殊常模的结合。
• 常模团体的被试取样方法:遵循随机原则。 具体的随机抽样方法有以下几种。
– 简单随机取样 – 等距取样:也叫系统取样。 – 分组取样 – 分层取样:这是确定常模团体的最常用方法。
二、常模的类型
• 群体常模 • 个体常模
• 群体常模
– 组间常模:也叫发展常模。
• 将个体的成绩与各种发展水平的人的平均成绩进行 比较,从而确定个体处于哪个发展阶段。 • 组间常模通常有发展顺序量表、智力年龄、年级当 量(或年级量表)。
分数组 116-120 111-115 106-110
人数 2 17 23
分数组 86-90 81-85 76-80
人数 31 24 11
101-105 96-100
91-95
37 53
40
71-75 66-70
61-65
6 4
2
– 特式(适用于未整理的原始资料,且没有相同 的原始分数):
• 其中R为某被试的原始分数在所测人群中从高到低 的排名,N为所测人群的总人数。
• 对测验的使用者而言,要考虑的问题是现有的常模 团体哪一个最合适。 • 无论是测验的编制者还是使用者,主要关心的是常 模团体的成员。
– 确定常模团体的注意事项
• ①群体构成的界限必须有明确的内涵和外延。 • ②必须是所测群体的一个代表性样本,要由随机抽 样产生。 • ③取样过程必须明确且有详尽的描述,避免使用者 误用。
相关文档
最新文档