测验分数的解释

合集下载

9. 测验分数的解释

9. 测验分数的解释

幻灯片1第九讲测验分数的解释幻灯片2本章主要内容:9.1 参照常模的分数9.2 参照标准的分数9.3 测验分数的解释幻灯片3●从测验中直接获得的分数,称为原始分数,它是通过将被试的反应与标准答案相比较而获得的。

原始分数本身并不具有多大的意义,必须与一定的参照体系作比较,才能显示其意义。

●例:语文85分,游泳第3名。

●确定原始分数意义的参照体系有两类:●⑴其他被试的分数,即其他被试在所测特质上的一般水平。

●⑵社会在所测特质上的客观要求,即被试在所测特质上发展应该达到的标准。

幻灯片4●第一种称为参照常模的分数解释。

参照常模的分数解释方法是将被试的分数和常模团体测验分数进行比较来解释的,并且主要以个人在常模团体中所处的相对位置来说明。

●第二种是参照标准的分数解释。

参照标准的分数解释方法是用被试测验分数与应有的标准作比较来确定被试测验分数的意义。

凡达到要求的标准,就是“合格”或“达标”;未达到要求的标准,就是“不合格”或“未达标”,它全然不管其他被试在同一测验上的分数如何。

幻灯片59.1 参照常模的分数●参照常模的分数解释是把被试的测验分数与具有某种特征的人所组成的有关团体的一般水平作比较,以确定被试在该团体内的相对位置。

●用来比较的参照团体称常模团体(n o r m g r o u p),常模团体的分数分布叫常模,它是我们解释测验分数的基础。

●9.1.1常模团体的性质●9.1.2确定常模团体的注意事项●9.1.3常模幻灯片69.1.1 常模团体的性质●常模团体是由具有某种共同特征的人所组成的一个群体,或是该群体的一个样本。

●从测验的编制者来说,确定常模团体的问题就是确定所编制的测验将来用于什么总体。

所选定的常模团体必须能够代表该总体。

●例如,测验是用来评价高中毕业生的学业成就,则常模团体应包括全体高中毕业生,或是能足够代表该总体的一个样本,由于大部分的测验要用于各种不同团体,所以大部分测验都有不止一个常模团体。

教育统计与测量-测验分数的解释与应用

教育统计与测量-测验分数的解释与应用

年级常模曲线
组内常模
组内常模 是解释被试原始分数的参照体系,即
被试所属那类群体的人在所测特性上测验取值 (也就是分数)的分布状况。拿被试分数跟这 种分数分布状况作对比,就能揭示出被试在其 所属那类群体中的相对地位。 但是有时取得被试所属那类群体的所有人的测 验分数,事实上不可能,因而,就只能从中抽 取一个代表性样组(即常模组),然后将拟建 立常模的测验对其施测,求得这一代表性样组 (常模组)中所有人的分数分布状况。
所以,原始分数的意义必须要跟一定的参照物比 较,才能真正明确起来。
原始分数意义的参照物大体有两类: 一是其他被试的测值,即其他被试在所测特性
上的普遍水平或水平分布状态;

这种通过被试间相互比较而确定意义的分数就 叫相对评分分数。当我们平常说,某少年英语 成绩不错,“在全年级冒尖”,或说某学生听 力成绩太差,“全班倒数第二”,这都是相对 评价的例子。
算第五十百分等级所对应的百分位数。 再求第25百分等级所对应的百分位数。
求取某原始分数的百分等级
假定已知某小学五年级
学生拼写测验成绩为47 PR f X Lb Fb 100 N i 分,要求在52名学生组 成的常模组上的百分等 级。 PR=[2×(47-44.5) ÷5+45] ×(100 ÷52) =88.46 即为第八十八百分等级
一个容量足够大的代表性样组,即建立起常模组 对该代表性样组按应有规范施测该测验,获得代表性 样组中每一被试的测验分数,即得到常模团体的测验 分数组。 求取常模团体测验分数组的平均数与标准差,求取从3.000到3.000这一区间上若干个点的标准分数(Z值) 跟测验原始分数的对照表,就得到了标准分数常模表。 以后对任何被试的测验原始分数,就可从表上查出其 对应的Z值,从而再按Z值解释其在常模团体中的位置。 当然我们也可利用常模团体测验分数组的平均数与标 准差,求取被试测验分数的Z值,这样来了解其在常模 团体中的相对地位。

心理测验的分数解释

心理测验的分数解释

心理测验的分数解释xx年xx月xx日contents •心理测验简介•心理测验的分数体系•心理测验的分数解读•心理测验的分数应用•心理测验的未来发展•心理测验的局限性及挑战目录01心理测验简介心理测验是一种基于心理学原理和方法,通过个体在特定任务或行为上的表现,评估其心理特质、能力、兴趣、需求、性格特征等心理特征的工具。

心理测验的目的是为了了解个体的心理差异以及不同心理特质之间的相互关系,为教育、职业、健康等领域提供参考。

心理测验的定义根据测验目的可以分为教育测验、职业测验、临床测验等;根据测验对象可以分为个别测验和团体测验;根据测验形式可以分为纸笔测验、计算机测验、操作测验等。

心理测验的分类心理测验的作用了解个体的心理特征通过心理测验可以了解个体的兴趣、性格、价值观等方面的特征,为个人发展提供指导。

评估个体能力心理测验可以评估个体的智力、职业能力、学业成绩等方面的能力水平,为教育、职业发展提供参考。

诊断个体问题心理测验可以辅助临床医生诊断个体的心理问题,如情绪障碍、精神疾病等,为治疗和康复提供帮助。

02心理测验的分数体系心理测验的原始分数是指受试者在各个测验题目上的得分,未经任何转换或计算,仅能反映受试者在某个特定领域的表现或能力。

分数的含义将原始分数转换为标准分数,可以使得不同测验和不同受试者之间的分数具有可比性。

标准分数通常采用平均数为0,标准差为1的分布。

百分位数是表示受试者在全体受试者中的相对位置,通常以百分数的形式表示。

百分位数可以反映受试者在某一心理特质上的相对位置,如智力、学业成绩等。

原始分数标准分数百分位数分数的计算方法加法对于一些采用原始分数的测验,如多重人格调查表(MMPI),可以通过简单的加法计算总分。

要点一要点二加权平均数对于一些需要将不同题目或不同方面的表现综合成一个单一分数的测验,可以采用加权平均数的方法。

加权平均数是根据每个题目或方面的权重不同,计算出来的平均分数。

测验分数的解释

测验分数的解释


年级当量存在的不足是:
1.各个年级的科目不同,年级常模仅适 用于公共开设的科目。 2.假设一个四年级学生在测验中获得年 级当量是6.9,这并不意味他掌握了六 年级所教的内容。 3.同一被试在不同领域得到的相同的年 级当量并不表明同等的能力水平。
二、百分位常模

百分等级(perceptile rank) 百分位数(perceptile) 四分位数(quartile) 十分位数(deciles)

样本分布均匀,抽样误差较小 有系统误差,随机性较差 与简单随机抽样结合使用

不足


改进

(三)分组抽样(整群抽样)

以“群”为单位抽样 特点

组织形式简便易行,不会打乱学校或单位的正常秩序 样本分布不均匀,抽样误差较大 适当扩大样本容量,减小抽样误差 与分层抽样法或其他方法配合使用

不足

相 似 性 数字广度 词 合 汇 计
第二节 常模的类型
一、发展常模(年龄量表)
根据特质的平均表现所制成的量表。
年级 当量 发展顺序常模
智力 年龄
(一)发展顺序常模
在婴幼儿行为发展观察中建立的量表 (正常、超前、滞后)
发展变化与 年龄相联系
葛塞尔(1947)婴儿早期行为发展顺序 量表(按月份显示儿童在运动水平、 适应性、语言、社会性等方群体的构成必须明确

性别、年龄、教育水平、职业、社经地位 等

2、必须是所测群体的代表性样本 3、样本大小适当

一般标准:最低不少于30或100。 全国常模:一般2000~3000。 4、时空性和新近性

代表性样本抽取——智力测验
第1层 年龄 性别 地域 民族 职业 城乡 教育 第2层 各年龄阶段 各性别组 各地区 各民族 各类职业 城市和乡村 教育水平 要 求 16~64 各年龄组男女人数相等 西部、中部、东部… 白人、黑人、西班牙… 工程师、教师、管理者… 5000人以上为城市 高中、大学、硕士…

常模参照测验分数解释

常模参照测验分数解释

常模参照测验分数解释
常模参照测验主要用于将个体的得分与一组参照人群的得分进行比较,以解释个体在被测特质上的表现。

常模参照测验的结果通常以百分位数或标准分(z分数、T分数等)的形式给出。

百分位数解释:百分位数表示一个得分在参照人群中所占的百分比。

比如,一个人的测验得分为80百分位数,意味着这个
人在测试人群中的得分超过80%的人。

较高的百分位数表示
个体在被测特质上的表现较好。

标准分数解释:标准分数是将个体的得分转化为以均值为0、
标准差为1的标准单位的分数。

通过标准分数,可以比较不同测验或不同人群之间的得分。

一般情况下,标准分数在-2至
+2之间被认为是正常范围,超过该范围可能意味着个体在该
特质上表现异常。

此外,常模参照测验的得分解释还可以与标准化人群进行比较,以评估个体在整个人口中的得分情况。

常见的标准化人群有代表性人口样本和特定人群(如年龄、性别、教育水平特定的群体)。

需要注意的是,常模参照测验只提供了个体得分的相对位置,而不直接提供个体的绝对水平。

因此,解释测验结果时需要综合考虑个体的背景信息、测试的可靠性和有效性等因素。

教育统计与测量-测验分数的解释与应用

教育统计与测量-测验分数的解释与应用
二是社会在所测特性上的客观要求,即被试在 所测特性上发展应该达到的程度标准。
例如,要测试大家有没有达到课程大纲对英语 专业大一学生所要求的写作水平,此时得到的 分数是要与一个标准相比较,达到了就是“合 格”,如未达到就是“不合格”。这里,全然 不管其他被试在同一测验上所得测值如何,他 们达标与否丝毫不影响该被试测验分数意义的 确定。
这种通过拿被试测值跟 应有标准作比较来确定 其意义的分数,就叫绝对评分分数。
所以,教育测量的分数,可以分为两类,即相 对评分分数与绝对评分分数。
作为绝对评分参照物的应用“标准”,是要通过明确 界定才能建立起来的。就学业成就验验来说,就要明 确界定应该包含哪些方面的知识与技能,对这些知识 与技能应掌握到什么程度。
所以,原始分数的意义必须要跟一定的参照物比 较,才能真正明确起来。
原始分数意义的参照物大体有两类:
一是其他被试的测值,即其他被试在所测特性 上的普遍水平或水平分布状态;
这种通过被试间相互比较而确定意义的分数就 叫相对评分分数。当我们平常说,某少年英语 成绩不错,“在全年级冒尖”,或说某学生听 力成绩太差,“全班倒数第二”,这都是相对 评价的例子。
那如何来建立呢?如何抽样,如何建立测验?源自年级常模曲线组内常模
组内常模 是解释被试原始分数的参照体系,即 被试所属那类群体的人在所测特性上测验取值 (也就是分数)的分布状况。拿被试分数跟这 种分数分布状况作对比,就能揭示出被试在其 所属那类群体中的相对地位。
但是有时取得被试所属那类群体的所有人的测 验分数,事实上不可能,因而,就只能从中抽 取一个代表性样组(即常模组),然后将拟建 立常模的测验对其施测,求得这一代表性样组 (常模组)中所有人的分数分布状况。
比纳在实际抽样调查研究基础上,按通过率来 确定项目难度并选定代表各年龄智力水平的恰 当项目,用这种方法来建立年龄常模。

心理测验的分数解释

心理测验的分数解释

由于Z分数中经常出现小数点和负数,而且 单位过大,计算和使用很不方便,所以常用下 式将它转换成另一种形式: ‘
Z’=A+BZ
(2)常态化的标准分数
标准九、离差智商。 T分数是在MMPI量表中采用的。T分数的计 T=50+1OZ 50 算公式为:T=50+1OZ。这是以50为平均数, 以10为标准差来表示的。 标准九的全称是标准化九级分制。它是第二 次世界大战期间,在美国空军中发展起来的用 于选拔飞行员的一个九级标准分数量表。标准 九的最高分为9分,最低分为1分,实际上它是 以5为平均数,以2为标准差的标准分数。
(4)等级评定量表
在某些情况下,我们感兴趣的不是人们是否 掌握了某种知识,而是一个人完成某种过程或 生产出某种产品的技能。对于各种技能,是不 是能用回答问题来确定其掌握和熟练水平的, 通常,我们采用等级评定量表来报告一种活动 的熟练水平或一种产品的质量。为了使评定尽 可能客观,需要对各种等级定出标准。譬如, 要评价学生的书法,就需要从正确性、清楚性、 美观性等方面区分出不同的水平,对每种水平 都定出标准样本,并做出详细说明。将每个学 生的书法与标准样本比较,与哪个水平的样本 最相近,便得到哪个等级。
掌握分数以“通过——失败”这种二分法记分会失掉一些 信息。因此,有时我们需要对被试的掌握程度作进一步的细 分,了解被试的掌握程度。最简单的指标就是正确百分数, 即被试答对题目的百分比。
(3)内容标准分数
内容标准分数是把内容分数与常模分 数结合起来使用。在编制内容标准量表 时,不但要确定内容、范围,还要详细 说明每一种水平“典型”任务正确回答 和不正确回答的问题类型。这样,将一 个人的测验分数与此种量表对照,便既 能指出它正确反应的百分比,又能指出 它的成绩达到了哪种人的水平,以及它 能解决哪一类问题。

第七章 测验分数的解释与应用

第七章 测验分数的解释与应用

按照行为发生的一定顺序来判断发展的正常 与否

皮亚杰量表
用特定的任务来揭示儿童发展处于哪个阶段

格塞尔发展顺序量表 格塞尔认为,婴幼儿的行为系统的建立是一个有次序 的过程,反映了神经系统的不断成长和功能的分化, 因而可以把每个成熟阶段的行为模式作为智能诊断的 依据。
4周 不能控制 头部,仰 卧姿势左 右不对称 16周 28周 40周 可独坐, 爬行,扶 着物件站 立 52周 搀一手 行走, 摇摆 颈可竖直, 扶起独 头微摇动, 坐,身 体前倾 仰卧姿势 左右对称

2、年级当量(grade equivalents)

即年级常模,用年级代替年龄,指把学生的
测验成绩与各年级学生的平均成绩比较,看他
相当于几年级的水平。

年级常模的单位通常为10个月间隔。如5年级 的分布为5.0到5.9,5.0表示五年级的初始水 平,5.5则表示五年级中期的平均成绩。
3、 发展顺序量表(ordinal scales)
缺点: 单位不等,尤其在分配的两个极端 只具有顺序性,属于顺序量表,不能做加减乘 除运算,无法通知来说明不同被试之间分数差 异的数量 两个不同样本中的百分等级不能相互比较
2、标准分数
什么是标准分数? 有哪些特点? 如何计算?


标准分数又称Z分数,这是等距量表中最常用
的一ent referenced score) 内容参照又叫范围参照,是看被试对指定 范围中的内容和技能掌握得如何。 内容参照分数特别适用于计算机辅助教学 以及利用程序教材自我掌握进度的学习 内容参照分数主要用于成就测验以及能确 定出可接受的最低标准的资格测验
在编制内容参照测验和对此各测验分数做 解释时有两个主要步骤: 一是确定测验所包含的知识或技能的范围 二是编造一个能报道测验成绩的量表

测验的评分记分以及对测验分数的解释

测验的评分记分以及对测验分数的解释

此阶段主试需要用记分板比照记分键(标准答案)来获得被试测验的原始分数,并在此基础上进行原始分数的转换(关于此内容下一章会作详细论述),以便于对被试的测验分数作出解释。

测验分数的解释主要涉及两个问题,即解释测验分数的意义以及如何将测验分数的意义告诉受测者。

(1)在解释测验分数的意义时,应遵循一些基本原则:
①主试应充分了解测验的性质与功能;
②对导致测验结果的原因的解释应慎重,谨防片面极端;
③必须充分估计测验的常模和效度的局限性;
④解释分数应参考其他有关资料;
⑤对测验分数应以“一段分数”来解释,而不应以“特定的数值”来解释;
⑥对来自不同测验的分数不能直接加以比较。

如果要比较,必须将二者放在统一的量表上;
(2)在将测验分数的意义告之受测者时,也应遵循一些基本原则:
①使用当事人所理解的语言;
②要保证当事人知道这个测验测量或预测什么,但并不需要作详细的技术性解释;
③如果分数是以常模为参考的,就要使当事人知道自己是在和什么团体在进行比较;
④要使当事人认识到分数只是一个估计;
⑤要使当事人知道如何运用他的分数;
⑥要考虑测验分数将给受测者带来什么影响;
⑦测验结果应向无关的人员保密;
⑧对低分者的解释应谨慎小心;
⑨报告测验分数时应设法了解当事人的心理感受,并采取适当的措施加以引导;。

19 测验分数的解释与组合-年级常模与年龄常模

19 测验分数的解释与组合-年级常模与年龄常模
主要内容
一、原始分数与导出分数 二、常模和标准化样本 三、常模与基于常模的解释 四、标准与基于标准的解释 五、测验分数的组合
常模是常模团体在测验上的一般作为水平与分数分布,一
般参数为平均数和标准差; 常模主要有两种形式:
组间常模,与一系列年龄组、年级组的平均分数相对照,看其分 数相当于哪个年龄、年级;反映了不同受测团体在测验反应上有 什么不同,这样就可以把受测者归入某个团体;
年级常模
首先,选择一系列有代表性的年级样 本进行测验; 然后,确定各年级组原始分数的平均 数;
补充年级常模,使其连续;
年级常模
容易理解,特别适合解释成就测验;
年级常模的团体也容易确定;
年级常模假定所测技能随年龄而有系统 的变化,但事实并非总是如此; 年级常模只适用于各年级都开设的学科;
年龄常模
Байду номын сангаас
年龄常模
年龄常模的基本要素
• 一套能区分不同年龄组的题目;
• 一个由各年龄被试组成的常模样本; • 一个常模表,表明答对哪些题或得多少 分该归入哪个年龄的对照表;
年龄常模
容易理解;
智龄的单位并非随年龄保持不变,往往 随着年龄的增加而缩小;
智龄只表示儿童心理发展的绝对水平, 不能表明其聪明程度;
年龄常模
常模团体中,各年龄组在测验上的得分;以年龄常模 为标准去说明测验成绩的导出分数,也称为心理年龄、 智力年龄。
1908年修订的比奈-西蒙量表最早使用智龄
斯坦福-比奈量表出现后,智龄开始盛行
年龄常模
在年龄量表中,题目被划入各个年龄 水平。
标准化样组中大多数7岁孩子能够通过的 题目被划入7岁组,大多数8岁孩子能够通 过的题目被划入8岁组; 以此类推;

06测验分数的意义与解释

06测验分数的意义与解释
内容参照又称范围参照,领域参照。
指衡量被试对指定范围中的知识或技能
掌握如何。 主要适用范围:成就测验,资格测验。
1.掌握分数(mastery score)
标准九(stanine)

标准化九级分制 标准九=5+2Z,即平均数为5,标准差为2
标准九分 9 8 7 6 5 4 本段面积(%) 4 7 12 17 20 17 累加面积(%) 100 96 89 77 60 40 段中值与平均 数的距离() >2.0 1.5 1.0 0.5 0 0.5
返回
3.顺序量表(ordinal scales)

用于鉴别儿童在具体行为机能的发展中所达到的阶段。 盖塞尔发展程序表:按月份显示儿童在运动、适应性、 语言、社会性等方面的大致发展水平。
4周
不能控制 头部,仰 卧姿势左 右不对称
16周
颈可竖直, 头微摇动, 仰卧姿势左 右对称
28周
40周
52周
扶起独坐, 可独坐,爬 身体前倾 行,扶着物 件站立
返回
常态化的标准分数

大多数常模参照测验的编制者都假设测验对 象总体的水平呈正态分布,但在实践中获取 的样组测验分数并非都呈正态分布。 为了更好地解释被试个体分数在团体中的相 对位置,能对各分测验的分数进行综合,测 验编制者常常把测验分数转换为正态分布的 标准分数。

常模原始分数的正态性检验

正态性检验
标准九的分布特点
返回
正态Z分数与标准十的转换方法
正态Z分数 z<-2.0 -2.0≤Z<-1.5 -1.5≤Z<-1.0 -1.0≤Z<-0.5 -0.5≤Z<0.0 0.0 ≤Z<0.5 0.5≤Z<1.0 1.0≤Z<1.5 1.5≤Z<2.0 Z≥2.0 合计 标准等级 总体中的百分比 1 2.3% 2 4.4% 3 9.2% 4 15.0% 5 19.1% 6 19.1% 7 15.0% 8 9.2% 9 4.4% 10 2.3% 100% —

心理测验的分数解释

心理测验的分数解释
认知能力
包括智力、注意力、记忆等方面的 表现。
情绪与社交能力
如情绪稳定性、自我调节能力、社 会交往能力等。
人格特质
如内向与外向、责任感、开放性等 。
心理健康状况
反映被试者的焦虑、抑郁、精神症 状等方面的情况。
结合其他资料进行综合分析
临床观察
结合被试者的行为表现、言语Hale Waihona Puke 达等信息进行分析。其他测验结果
人际关系
心理测验可以帮助个体更好地了解自己和他人的 性格特点、沟通风格等,为改善人际关系提供指 导。
THANK YOU.
心理测验的结果应基于被试者的实际 情况和行为,避免主观臆断和先入为 主的偏见。
要点三
保密原则
心理测验的内容和结果应严格保密, 不得随意泄露或向无关人员透露。
编制心理测验的步骤
• 确定测验目的:明确心理测验的目标和用途,如能力评估、职业规划等。 • 选取样本:根据测验目的,选择合适的样本群体,如学生、职场新人等。 • 制定项目:根据样本特点,制定适合的测验项目,包括题目、指导语、评分标准等。 • 修订项目:对制定的测验项目进行试测和修订,确保项目的有效性和可靠性。 • 标准化施测:对样本进行标准化的施测,确保测验的客观性和准确性。 • 数据分析:对测验结果进行统计分析,包括描述统计和因素分析等。 • 制定解释指南:根据测验结果和样本特点,制定解释指南,包括分数的解释、应用建议等。
2023
心理测验的分数解释
目 录
• 心理测验概述 • 心理测验的编制与修订 • 心理测验的施测与评分 • 心理测验的结果分析 • 心理测验的误差与控制 • 心理测验的发展趋势与应用前景
01
心理测验概述
心理测验的定义

心理测验常模与测验分数的解释

心理测验常模与测验分数的解释
PR为百分等级,R为排名顺序的序号,N为 被试总人数。
例2:某被试在一次有50人参加的测验中得 80分,排名第9,则该生成绩的百分等级为 多少?
例1:下表是某班智力测验的分数分布,请计 算原始分数为40~45的百分等级。
分组区间 55~60
50~55 45~50 40~45 35~40 30~35 25~30 20~25
2.剖析图(Profiles) 剖析图是将一套测验中几个分测验分数在一张图上呈
现出来,以便更直观地比较被试在几个分测验上的表 现,并对其在整个测验上的表现得出一个整体的印象。 如,韦氏儿童智力测验剖析图(见word文档)或P131 图7-3 一些著名的人格测验,如MMPI、16PF等都在测验手册 上说明剖析图的制作方法。
线性转换标准分数的性质:
1. 标准分数的分布的平均数为0,标准差为1;
2.Z分数有正负之分,正表示大于平均数,负 表示小于平均数。表示离开平均数多少个标准 差。
3.是等距量表,能进行四则运算。
4. 其分布形状与原始分数相同,结果没有丝 毫失真。
5.假如原始分数的分布为常态,则Z分数的范 围大致是-3~3。
前所编制的常模可能不再适合,因此常模必须 定期地修订,并尽可能采用新近的常模。 6.要将一般常模和特殊常模结合起来
常用的具体抽取方式有抽签法和随机数字法。
1.抽签:把总体中的每一个个体编上号并作出签,充 分混合后从中随机抽取一部分,这部分签所对应的个 体就组成一个样本。
2.随机数字表
用随机数字表来抽取数字。
3.美国大学入学考试委员会使用的标准分数: CEEB分数:
CEEB 500100Z
20- 12
32
26
0.26 -0.64

22 测验分数的解释与组合-测验分数的组合

22 测验分数的解释与组合-测验分数的组合

各个预测源都有单 独的可以确定的最 低标准时,一般采 用连续栅栏法。
每个受测者不必要都接受所有测验,只有通过第一个测验的 人才进行下一个测验。
分数合成
几个预测源没有确 定的最低标准,各 个测验的分数又可 以同时获得时,一 般采用综合分段。
各个预测源都有单 独的可以确定的最 低标准时,一般采 用连续栅栏法。
几个预测源没有确 定的最低标准,各 个测验的分数又可 以同时获得时,一 般采用综合分段。
各个预测源都有单 独的可以确定的最 低标准时,一般采 用连续栅栏法。
将几个预测源分数与效标的关系进行综合考虑,在保证合成 分数的效度最高的情况下,分别确定出每个预测源的最佳分 数线。
分数合成
几个预测源没有确 定的最低标准,各 个测验的分数又可 以同时获得时,一 般采用综合分段。
词汇
理解
.87

-.05
-.13
.06
.06
.00
.07
知识
词的推理 积木设计
.71
.73 -.06
-.08
.09 -.13
.11
-.07 .06
-.06
-.01 .07
图画概念
矩阵推理 图形填充 数字广度
.16
-.03 .32 .00
.40
.64 .60 -.03
.06
.19 -.26 .67
1. 2.
重要的测验放在前面; 简便易行的测验放在前面。
分数合成
各个预测源对效标的预测作用不同; 同时,各个测验之间可以互相代偿;
y a b1 x1 b2 x2 bn xn
分数合成
R1 R2 R3
y a b1x1 y a b1 x1 b2 x2

特殊儿童测验分数的解释—内容参照分数与结果参照分数

特殊儿童测验分数的解释—内容参照分数与结果参照分数
P0 = (A + D) / (A + B + C + D)
分数分界点的科学确定是评估测验分 类一致性的前提,报告标准参照测验 的分类一致性信度时,必须同时提供 测验的分数分界点,以及测验长度等 资料。
方差分析法:荷伊特信度
MS人:被试均方,MS人、题:交互 作用
内容效度 命题细目表 专家评定
Angoff方法:由专家直接判断处于临界水平的被 试在某测验的每一题目正确作答的可能性(记为Pi), 设每一题的满分为Fi,则该测验的分数分界点λ = ΣFiPi Angoff方法在实际运用中较多。
效标组预测法
临界组法:由专家判定和选择一组 正处于临界水平的被试,将测验施测 于该组被试,计算他们在测验上的平 均成绩。(抽象、主观)
效标关联效度 决策效度(预测源测验,效标测验)
结构效度目前关注不多
标准参照测验的分数解释
如何确定分界点: 专家判定法
Nedelsky方法:由专家来判断处于临界水平的被 试在每一题上有能力排除的错误选择项,从而计算 其正确回答的可能性,再求出每一题上正确回答的 可能性之和,即为测验分数分界点。
标准参照测验
标准参照测验:又称目标参照测验,当一个 测验是以某一明确界定的内容范围为基础编 制而成,并且其分数是参照该内容范围所要 求的绝对标准进行解释。
作用:了解个体在所规定的测量内容上的行 为水平,因此其出发点是个体本身的绝对水 平,而不再是个体间的水平差异。
标准参照测验的题目分析
内容范围的确定:双向细目表 内容效度分析:专家评定 难度、区分度分析: 预测试
前分析:通过率,大多数情况下作为区分度分析 的基础
区分度分析:
难度差值
掌握组-未掌握组鉴别指数D = PA – PB 个人获得指数DIG:前测中错误回答某项目而 在后测中能够正确回答的被试人数比例

特殊儿童测验分数的解释—测验分数的解释内容

特殊儿童测验分数的解释—测验分数的解释内容
复习:如果一个分数既有信度,也有效度, 那么,这个分数又代表什么意义呢?
一个分数的解释要看它是否达到了目的。 如果用在选拔中就需要和团体比较; 如果用在考核中就需要和效标比较。 如果用在诊断中就需要综合考虑了。
同学好!上课前我们来复习下旧知识。
测验分数的意义
团体 名次
百分 位数
标准 分数
发展 量表
正确 百分数
意义:表示在测验中答对题目的百分比。
计算: 正确百分数=答对题目分数/总题目分数х100
正确百分数就是被试答对题目的百分比。
三. 解释考核内容对测试者未来的影响

三. 解释考核内容对测试者未来的影响
效标 分数
意义:表示获得某分数的应试者达到某种效标水平 的可能性。
计算: 效标分数=该分数与效标的相关系数
指令生分数线 (2013年)
襄阳四中 襄阳五中 襄阳四中 襄阳五中 襄阳四中 襄阳五中 襄阳四中 襄阳五中 襄阳四中 襄阳五中
567.5分 564.3分 541.3分 543.2分 551.1分 556.2分 551分 551分 550分 530.8分
584分 580.1分 576.7分 576.7分 581.6分 585分 578.5分 578.5分 581.7分 577.9分
计算
百分位数=8X100/50 =16 百分等级=100-16=84 答:他的成绩百分位是16%, 超过84%的人。
条件:需要知道总体人数。 缺点:样本很小时误差很大。
把比较的团体数量固定下来,名次的意义就更加准确了,可比性更强。
典型误用
百分 位数
我和班上 一半女生 在恋爱!
这样?
还是这样? 哈哈!都不是。班上就2名女生。

心理测验分数的处理与解释

心理测验分数的处理与解释

2.3

多重回归
多重回归就是研究一种事物或现象与其他多种 事物或现象在数量上相互联系和相互制约的统 计方法。 基本方程式为: Y=a十b1Xl十b2X2十…十bnXn 只有当预测源与效标间存在线性关系时才是适 合的


2.4

多重划分
适用于所测特质之间是不能互相补偿 在整个测验实施时,是把所有组成这一测 验的分测验按一定顺序排列起来逐一实施。 只有通过了前一次测验,才能继续实施后 一个测验。由于成功的被试必须过一连串 测验的栅栏,所以这种方法也叫作“连续 栅栏”。
第七章 心理测验分数的处 理与解释
心理测量学
第一节

心理测验分数的合成
一﹒分数合成的种类
项目的组合
分测验或量表的组合 测验或预测源的组合
二.

分数合成的方法
临床诊断——直觉合成 加权求和合成 多重回归 多重划分
2.1 临床诊断-直觉合成

根据直觉的经验,主观地将各种因素加权;而获得结论 或预测的方法叫作临床诊断。 临床诊断法的优点是:
解释测验分数的意义遵循基本原则:



主试应充分了解测验的性质与功能。 对导致测验结果的原因的解释应慎重,谨防片面极 端。 必须充分估计测验的常模和效度的局限性。 解释分数应参考其他有关资料。 对测验分数应以“一段分数”来解释,而不应以 “特定的数值”来解释。 对来自不同测验的分数不能直接加以比较。

百分位数的变式: 四分位数 十分位数


百分等级的优点
容易计算,容易解释
对于各种被试和各种测验普遍适用 不受原始分数状态的影响
百分等级量数的主要缺点

单位不等
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 标准分数的适用条件
• 只有在原始分数服从正态分布的情况下,Z才具 有解释意义。
• 如果现实中观测分数X不服从正态分布怎么呢? 需进行正态化处理,再建立标准分数常模。主 要步骤如下: 1. 根据常模团体的测验分数次数分布表,建立 起原始分数的百分等级。 2. 利用正态分布表,查找与百分等级对应的标 准分数Z。
2. 标准分数Z的单位是相等的,其零点是相对的,因 此,不同科目的Z分数具有较好的可比性和可加性。
3. 标准分数Z本身是关于原始分数X的一种线性变换, 因此,Z分数不改变原始分数的分布状态,这句话 是否正确?
4. 一般情况下,标准分数Z的取值范围在-3到3之间, Z分数的意义可以用正态分布曲线下的面积比例做 出最好的解释。
3. 1994年,在总结试点经验的基础上,为加大标准分数制度的 推广力度,国家教委又颁布了新文件。
4. 1997年,标准分数制度推广到广东、海南、陕西、山东、福 建等7个省份。
5. 国家教委提出,将标准分数制度推广到全国30个省份,但至 今未实现。
• 甲乙丙丁四人在某次语文考试中分别获得了72 分,60分,48分,90分,而全体学生的语文平 均成绩为60分,标准差为12分,那么这四个人 的标准分数为多少?
• 常模参照测量是将被试水平与测验常模相 比较,以评价被试在团体中的相对低位的 一种测量类型。也就是说,常模参照测量 与评价对学生学习成就的解释,是采用了 相对的观点。
• 强调
1. 常模团体,指的是在建立测验常模过程中实际受 测被试样组,他们代表着一个有明确定义的人群。
2. 测验总是用来测量人的某种身心特性的,如学科 知识、记忆能力、智力人格等。所以常模往往是 这些身心特性的常模。如智力常模、记忆超模、 数学成绩常模等。
3. 测验常模总是针对某种人群的常模。例如:小学 四年级语文阅读理解水平测验常模,限定了该常 模使用对象是小学四年级。
制定常模的过程
• 获取一个有代表性的常模团体 • 常模资料的统计描述 • 导出分数
测验常模的主要类型
常模
发展常模 组内常模
年级常模 年龄常模 百分等级常模 标准分数常模
• 发展常模:某类个体正常发展过程中各个特定 阶段的一般水平。有了它,我们就可以把某个 被试的发展程度与该类群体正常发展水平进行 比较。
• 根据测验分数的参照点
常模参照测验
标准参照测验
测验
常模的定义
• 常模:又称测验常模,是指一个有代表性 的样组在某种测验上的表现情况,或者说, 是一个与被试同类的团体在相同测验上得 分的分布情况和结构模型。
• 常模:某年级、某年龄或具有某种共同性 质的被试团体在某一测验上实际达到的平 均水平。
• 常模是一个相对数量,而不是一种绝对的、 永久的、固定不变的标准。
12月
5月
72
74
77
81
82
85
百分等级常模
• 百分等级量表 将标准化样本中同一个年级或同一个年龄组的
被试,在某个测验上所得的分数分成100个等级, 每个百分等级表示其相应的测验分数在该年级或 该年龄组被试中所占的地位,即低于这个分数的 人数百分比。 • 百分位数
与百分等级相对应的原始分数称为百分位数。
• 为此,人们设计了许多解释测验分数的方 法。其中,参照测验的常模资料对被试的 测验结果进行解释与评价是常用的方法之 一。
原始分数与导出分数
• 原始分数 根据测验的记分标准,对被试的测验结果所 计算出的测 验分数称为原始分数。 • 导出分数 经过统计整理过的,具有一定参照点和单位的,可以相互 比较的分数。有了导出分数,我们才可以对测验结果做出 有意义的解释。
标准分数在高考中的应用
• 标准化考试包括: 1. 命题标准化 2. 考务管理标准化 3. 评语试卷标准化 4. 分数解释和应用标准化
发展历程
1. 国家教委考试中心自1985年开始组织力量进行研究,并在广 东省首先开展了标准化考试试点研究。
2. 1989年,国家教委考试字001号文件《普通高等学校招生全国 统一考试标准化实施规则》中正式提出,将标准分数制度的建 立作为标准化考试改革第二阶段的主要任务。
表 3. 百分等级量表对测验成绩的普遍水平不够敏感,
其可靠性较差
标准分数
Байду номын сангаас
• 优点
1. Z分数的单位是等距的。
2. 如果不同考试的分布形态很近似,不同Z分数 是可以相互比较的。
3. 不同测验的Z分数可以相加求和。
• 其它标准分数
常见的标准分数
• 正确认识标准分数
1. 任何一批原始分数,转化为Z分数后,这批Z分数的 平均值为?,标准差为?Z大于0,表示?Z小于0 表示?
• 组内常模:关于一个与被试同类的群体,在某 种测验所测特性上的一般表现水平的常模资料, 可以反映每一个个体在其同类群体中的相对位 置。
年龄常模
• 如果人的某些能力特性,在不同年龄组间变化 显著,那么我们就以为不同年龄组建立一个有 意义的常模。比如,智力。
• 年龄常模的描述方法 取平均值作为指标 用一组题目作为指标
测验量表与常模
问题
140千克货物的重量恰好是某君70千克体重的两 倍。
无论给测验记时还是给球赛记时,8分钟是24分 钟的1/3。
一个学生物理测验60分,数学测验120分,能否 说明数学能力是物理能力的2倍?
• 要正确地解释、评价与使用测验的分数, 还必须把测验的原始分数同可资参照的数 据与行为标准进行比较,才会显示分数的 含义。
科目 语文 数学 英语 物理 化学
原始分数 112 88 110 98 120
百分等级 96.5 52.7 92.1 92.0 94.6
问题
❓百分等级量尺是否具有相等的单位? 换句话说,每一个等级差异是否意 味着成就与能力的相等差异?
百分等级量表的优缺点
• 缺点 1. 百分等级的单位距离不相等 2. 百分等级属于四种测验量表中的等级或位次量
年级常模
• 所谓年级常模,就是不同年级学生在某种测验 上的正常的一般的表现水平。这样可用某年级 学生在该测验上的平均分和相应的年级当量之 间的对应关系来描述某一测验的年级常模。
• 三年级到八年级阅读测验分数平均数
年级 3 4 5
原始分平均数
12月
5月
33
42
45
57
59
64
年级 6 7 8
原始分平均数
相关文档
最新文档