第五章 区分度

合集下载

《心理测量学》复习思考题答案

《心理测量学》复习思考题答案

(0076)《心理测量学》复习思考题答案第一章心理测量概述一、解释1.测量:按照一定法则给事物指派数字。

2.心理测验:实质上是行为样本的客观的和标准化的测量。

3.量表:具有参照点和单位的用以测量某种事物以确定其数量的连续体。

二、填空1./2.无论是物理特性的测量,还是精神特性的测量,都必须具有(参照点)和(单位)两个要素。

3.量表可以分为(类别量表)、(等级量表)、(等距量表)和(比率量表)四级水平。

4.要求被试按平时的习惯作出反应而无正确答案的测验称为(典型行为测验)。

5.以预先确定的教学内容为标准,考查被试对于指定的教学目标中的内容或技能掌握程度的测验称为(目标参照测验)。

三、单项选择1.心理测量的参照点是(①)。

①人定零点②绝对零点③人定零点和绝对零点④不能确定2. 一般而言,心理测验的分数属于(②)。

①类别量表②等级量表③等距量表④比率量表3.狭义的心理测量是指以(②)为工具的测量。

]①调查②测验③实验④口试四、判断分析1.心理测量主要用于对人的精神特性的直接测量。

(×)分析:人的心理行为变化无法直接测出,只能通过个人在活动中(具体讲就是对测验题目)的反应来间接推断人的某种精神特性的状况。

2.由于心理测量属于等级量表,因而在应用中只能使用等级量表适用的统计方法。

(×)分析:虽然心理测量属于等级量表,但在应用时可以采取变通的方式:①假设量表上的单位是相等或近似相等,其前提是常态分布的假设;②把测验分数转换到一个有相等单位的量表上,即把原始分数转换成标准分数。

这样就可以使用等距量表的统计方法。

3,在对心理测验进行区分时,应主要看编制者的目的和测验的实际内容。

(√)分析:由于测验的编制者给要测量的特性所下的操作性定义不同,因而区分测验时不能只看测验的名称,而应主要看编制者的目的和测验的实际内容。

五、简答1.心理测量的特点是什么&答案要点:①心理测量没有绝对零点,只有人定零点。

测验的项目分析

测验的项目分析

一般情况下,取上下25%~33%均可。
样本少时,可以取50% 注意: 由于计算机的方便使用,可以上下50%作为划分高低组的 标准,或者多分几组,对区分度和难度作详细分析。因为 只取上下两端,只利用了一部分资料,浪费了很多信息, 有可能得出错误结论。
(二)相关法(项目-总分相关)
1.点二列相关 Xp-Xq rpb= √pq St
如果所有被试都未回答某个题目,说明该题……
如果选择各个选项的人数几乎相等,说明该题……
二、速度测验的项目分析
对前面部分的测验项目,难度和区分度都…… 对后面部分的测验项目,难度和区分度都……
三、标准参照测验的项目分析
在标准参照测验中,无须考虑项目的难度和区分度,只要项 目的内容很重要就行。
A B C
0.50
0.00


能力

难度不同的3个项目的ICC
1.00 率 概 的 目 项 答 回 确 正
ቤተ መጻሕፍቲ ባይዱ
A B
0.50
0.00
C D
低 中 能力 高
多项选择中每个选项的ICC
三、区分度与难度的关系
难度(P) 1.00 0.90 区分度(D) 0 0.20
0.80
0.70 0.60 0.50 0.40
第五章 测验的项目分析
项目分析包括定性分析和定量分析。定性分析包括考虑 内容效度、题目编写的恰当性和有效性等;定量分析主要是 指题目难度和区分度的测量。 对项目进行筛选和修订,可以提高测验的信度和效度。
第一节 测验的难度
一、难度(difficulty)的意义
难度,指项目的难易程度。
在最高作为测验中,称为“难度”,而在典型作为测验 中,则指“通俗性”。两者都是指在总体中,能够正确或确 切回答某项目的人数。

17 项目分析-区分度

17 项目分析-区分度

back
2. 相关法
以项目分数与效标分数或测验总分的相关作为 项目区分度的指标。
back
3. 测验结构分析
因素分析,删除或修改因子负荷低的项目。 因子ቤተ መጻሕፍቲ ባይዱ荷在0.4及以上,表示区分度达标。
back
鉴别指数(D) 0.40 以上 0.30~0.39 0.20~0.29 0.19 以下 很好 良好,修改后会更佳 尚可,但需修改 差,必须淘汰 项目评价
• 区分度与难度有密切关系
D 的最大值与项目难度的关系
项目通过率(P) 1.00 0.90 0.70 0.60 0.50 0.40 0.30 0.10 0.00 D 的最大值 0.00 0.20 0.60 0.80 1.00 0.80 0.60 0.20 0.00
项目分析
二、项目区分度
1.区分度的定义 2.区分度的估计方法
1. 区分度的定义
• 项目区分度(item discrimination)是指测验项目对于所测 量的心理属性的鉴别能力和区分程度,也称鉴别力。
back
2. 区分度的估计方法
1) 鉴别指数法 2) 相关法 3) 测验结构分析
back
1)鉴别指数法
比较测验总分高和总分低的两组被试在项目通过率上 的差别
D Ph PL
• 例如:某高中物理测验,高分组在第5题上的通过率为 0.75,低分组的通过率为0.35,则该项目的鉴别指数为: • D=0.75-0.35=0.40
• 续上 • 1965年,美国测验专家伊贝尔(L. Ebel)根据长期的经验提 出用鉴别指数评价项目性能的标准,如下表所示。

第五章 测试与测试理论

第五章 测试与测试理论

例如, 、 两组各有 位学生参加同一次语文测验, 两组各有6位学生参加同一次语文测验 例如,A、B两组各有 位学生参加同一次语文测验, A组的分数为 、85、75、65、55、45,B组的分 组的分数为95、 、 、 、 、 , 组的分 组的分数为 数为73、72、71、69、68、67。这两组的平均数 数为 、 、 、 、 、 。 都是70, 组的标准差为18.71分,B组的标准差 都是 ,但A组的标准差为 组的标准差为 分 组的标准差 ),说 为2.37分(此数据是在统计软件中运行获得),说 分 此数据是在统计软件中运行获得), 组学生之间的差距要比B组学生之间的差距大 明A组学生之间的差距要比 组学生之间的差距大 组学生之间的差距要比 得多。 得多。
举例 例如,一次测验的考生人数为 例如,一次测验的考生人数为100人,按考试成绩取前面 人 按考试成绩取前面27 人和后面27人构成高分组和低分组 人构成高分组和低分组。 人和后面 人构成高分组和低分组。 第一题, 无论是高分组或是低分组无一人选择, 第一题,选项 C无论是高分组或是低分组无一人选择,说明 无论是高分组或是低分组无一人选择 C对该试题没有贡献,应予修改或删除。对选项 A,高分组 对该试题没有贡献, 对该试题没有贡献 应予修改或删除。 , 和低分组几乎有相同的选择,说明该选项有意义含糊之处, 和低分组几乎有相同的选择,说明该选项有意义含糊之处, 也需要修改。本题的难度和区分度比较合适。 也需要修改。本题的难度和区分度比较合适。 第二题,高分组和低分组对正确选项选择的人数一样多,区 第二题,高分组和低分组对正确选项选择的人数一样多, 分度为0,四个错误选项也具有同等的迷惑力。 分度为 ,四个错误选项也具有同等的迷惑力。这很可能是 因为题目的编制不当,因此需要进一步修改。 因为题目的编制不当,因此需要进一步修改。 第三题,低分组的答对人数反比高分组的答对人数多, 第三题,低分组的答对人数反比高分组的答对人数多,区分 度出现负值,这样的题要么删掉,要么重新编制。 度出现负值,这样的题要么删掉,要么重新编制。 第四题,高分组的学生有 %以上的学生答错, 第四题,高分组的学生有80%以上的学生答错,低分组的无 一人答对,可见题太难。 一人答对,可见题太难。而且答错者较多地集中在选项 C上, 上 说明选项的迷惑力太强了。 说明选项的迷惑力太强了。

最新心理咨询师考试(二级)认证重点知识总结大纲第五章

最新心理咨询师考试(二级)认证重点知识总结大纲第五章

心理咨询师考试(二级)认证重点知识总结大纲第五章
第五章心理测量学知识
一、教学方法:
(1)以基本概念教学为主,强调各指标的表示方法及之间关系。

(2)本章节对心理测验技能有较强的指导意义,讲课时应着重加强二者之间的联系。

二、教学内容:
(1)心理测量学概述
(2)测验的常模(重点掌握)
(3)测验的信度(掌握)
(4)测验的效度(理解)
(5)测验的难度(识记)
(6)测验的区分度(识记)
(7)测验编制的一般程序(识记)
(8)心理测验的使用(重点掌握)
三、教学目标:
心理测验是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。

心理测验作为一种技术手段在临床诊断、判定疗效及咨询与治疗中都有广泛应用。

本章内容讲述的是心理测验的基本概念、原理和使用原则。

本章教学目标为:
(1)掌握心理测量学的基本概念。

(2)掌握心理测验使用的注意事项。

区分度计算公式

区分度计算公式

区分度计算公式
(最新版)
目录
1.区分度的定义与重要性
2.区分度的计算公式
3.区分度的应用实例
正文
一、区分度的定义与重要性
区分度(Discriminant)是评价指标体系中一个重要的指标,它主要用于衡量测试或评估工具对于不同水平被试者的区分能力。

区分度与难度、通过率等指标共同构成了评价指标体系的核心内容。

在知识类测试中,区分度对于选拔和鉴别具有重要意义。

二、区分度的计算公式
区分度的计算公式为:D=PH-PL
其中,D 表示区分度;PH 表示高分组的通过率,即得分高的被试者
通过的比例;PL 表示低分组的通过率,即得分低的被试者通过的比例。

三、区分度的应用实例
以一场语文考试为例,我们可以通过计算区分度来评估该考试的选拔效果。

假设高分组的通过率为 0.8,低分组的通过率为 0.3,则区分度
D=0.8-0.3=0.5。

这意味着该考试对于不同水平的被试者具有较好的区分
能力。

在选拔过程中,区分度可以帮助我们筛选出具有潜力的人才,并为教育资源分配提供依据。

总结来说,区分度作为评价指标体系中的一个重要组成部分,对于衡量测试或评估工具的选拔和鉴别效果具有重要意义。

量化评价法

量化评价法
中包含欲测特质的信息量的程度.
重点问题
▪ 量化评价方法的概念 ▪ 信度和效度的概念与测量 ▪ 进行量化评价的具体方法及其运用 ▪ 各种量化评价方法的异同 ▪ 借助统计分析软件对数据进行统计
第一节 量化评价法概述
▪ 一、量化评价的方法论来源
4元素分析原则
1经验证实原则
5还原论
实证科学 2客观主义原则
第二节 测验法
一、主要的测验类型 ▪ 诊断性测验 ▪ 成绩测验 ▪ 学能学习能力测验
第二节 测验法
二、测验的信度与效度
▪ 测验的信度:测验是否有价值,就必须考察测验的 质量,包括它的稳定性、可靠性,即在同样条件下 重复测量,其结果的一致性.
▪ 信度的测量: 1.分半split-half信度 2.内部一致性α系数 3.重测信度test-retest methods 4.复本信度alternate-form reliability
参加测验的总人数之比值来表示.
R P = ——
N 式中,P为试题的难度,R为正确回答客观题目的人数,N为参加
测验的总人数.
三、测验的项目分析——难度与区分度
一项目的难度 2.难度的计算 2主观题的难度的计算. 主观题的难度等于该题考生所得分数的平均值与该题应得的
满分之比.以Pi表示试题的难度,
其计算公式是:
第四节 实验法
二、准实验研究 一准实验研究的特点:准实验研究是介于真实验研究和
非实验研究之间的研究,对无关变量的控制比非实验研究 严格,但是不如真实验研究对无关变量的控制得严格,通常 没有对被试随机抽样,可以设计控制组,但是实验组和控制 组的背景条件不能保证相同.
二举例分析
第五节 其他量化评价方法
1.信度和效度分别指什么 如何检验测验的信 度与效度

第五章__测验的项目分析之区分度

第五章__测验的项目分析之区分度

4.积差相关
• 对于论文式测验题目,因得分具有连续性,
在被试团体较大时,可以认为项目分数服 从正态分布。可将项目得分与效标分数求 积差相关系数以得到项目的区分度。
三、区分度与难度的关系
表2
项目通过率(P) 1.00 0.90 0.70 0.60 0.50 0.40 0.30 0.10 0.00
D的最大值与项目难度的关系
X p Xq rpb pq St – r :点二列相关系数;
pb


:答对该题的被试在总分上(或效标分数上)的 X平均得分; p – :答错该题的被试在总分上(或效标分数上)的 X平均得分; q – St:全体被试的总分(或效标分数)的标准差; – P:为答对该题的人数百分比;q:答错该题的人数 百分比,q=1-p。
表 题目鉴别指数与评价价标 鉴别指数D 题目评价 0.40以上 很好
0.30-0.39 0.20-0.29 0.19以下
良好、修改会更好 尚可、仍需修改 差、必须淘汰
• • • • • •
2.极端组的划分 27%规则 一般情况下,取上下25%~33%均可。 样本少时,可以取50% 注意: 由于计算机的方便使用,可以上下50%作为划分高 低组的标准,或者多分几组,对区分度和难度作 详细分析。因为只取上下两端,只利用了一部分 资料,浪费了很多信息,有可能得出错误结论。
过率。
•例如:高分组在某一项目的通过率为0.75,低分
组的通过率为0.35,则该项目的鉴别指数是多少?
• 例,某高中物理测验,被试共18人,高分
组和低分组各取总人数的27%,则两组各 为5人,第五题高分组5人全部答对,低分 组只有1人答对,计算该题的鉴别指数。
D值是鉴别项目测量有效性的指标,D值越高,项目 越有效。1965年,美国测验专家R.L.Ebel根据长期 经验提出用鉴别指数评价题目性能的标准如下表所 示。

命题技术之区分度与信度、效度的控制

命题技术之区分度与信度、效度的控制

命题技术之区分度与信度、效度的控制我们先看看某省某学科重要考试统计的区分度。

按照区分度标准(测量学家伊贝尔认为:0.4 以上为优良题, 0.3-0.39 为良好题,0.2-0.29 为一般题, 0.2 以下为劣题,区分度为负数,说明试题或答案有问题,意味着优秀学生做不出来,差的学生却乱猜出正确答案)衡量,该试卷各小题区分度不高,尽管试题的平均分、难度都比较正常,但从区分度来评判,竟然没有一道好题,差不多都是劣题。

什么情况下区分度才高呢?难度过高,答对的人少,大部分人得分低;难度过低,答对的人多,分数分布在高分端。

一般情况,过难或过易的题目都不能很好地区分不同水平的个体。

因此,当难度为中等时,区分度最高。

但上表并没有体现这一规律,我们简单地以区分度一个指标判断试题的优劣,其实是不恰当的。

区分度受三个因素的影响:一是抽查样本大小,如果样本太小,可能会导致相关系数不稳定;二是试题的难度,如果试题难度过大或过小,都可能导致试题的区分度降低;三是试题本身是否有质量问题,如题干表述的不明确,题干存在某种给考生提示的线索或其他技术性错误。

如果排除以上三个因素,区分度还是低,表明学校教学或考生复习方面可能存在某些问题,比如过难的题攻不下来,或者是容易题粗心大意,暴露出教学难点没有突破、基础不扎实的毛病。

在大班额的教学模式下,教师平均使力,眼里只有平均分,学校评价只看平均分,不追求区分度。

这种非常现实的观念与做法,直接影响着试卷的区分度。

像高考这样的考试,选拔功能强,必须考虑试卷的区分度。

如果把考生分高中低三个档,为了区分出层次,让高水平的学生进双一流大学,让中等水平的进中等学校,让第三层次的学生考入专科学校。

鉴于考生能力分布呈正态分布,因此试卷难度分布也应呈正态分布,即难、中、易按比例(3:7:1)分布。

但像奥赛、奖学金考试这个竞赛性考试,都是优秀学生在角逐,对区分度的要求更高,难题比例要大于中等层次的题。

普通学校出月考题,检测的目的地主要是看看学生的基础是否扎实,对区分度的要求相对不高,建议多出难度适中的题目;但对于一些优质学校,最差一个都能考上重点大学的好学校,目标是放在争夺状元、省前10名、前20名、前50名,争的是上600分人数。

《应用多元分析》第三版(第五章 判别分析)

《应用多元分析》第三版(第五章  判别分析)
❖ 本章介绍三种常用的判别分析方法:距离判别、贝 叶斯(Bayes)判别和费希尔(Fisher)判别。
§5.2 距离判别
❖ 一、两组距离判别 ❖ 二、多组距离判别
一、两组距离判别
❖ 设组π1和π2的均值分别为μ1和μ2,协差阵分别为Σ1和 Σ2(Σ1,Σ2>0) ,x是一个新样品(p维),现欲判断它 来自哪一组。
25
1.01
0.4
26
1.45
0.26
27
1.56
0.67
28
0.71
0.28
29
1.5
0.71
30
1.37
0.4
31
1.37
0.34
32
1.42 0.43
33
0.33
0.18
34
1.31
0.25
35
2.15
0.7
36
1.19
0.66
37
1.88
0.27
38
1.99
0.38
39
1.51
0.42
40
1.68
❖ 1. Σ1=Σ2=Σ时的判别 ❖ 2. Σ1≠Σ2时的判别
1. Σ1=Σ2=Σ时的判别
❖ 判别规则:
x x
1 2
, ,
若d 2 x,1 d 2 x, 2 若d 2 x,1 d 2 x, 2

令W
x
a
x
μ
,其中
μ
1 2
μ1
μ2

a Σ 1 μ1 μ2 ,则上述判别规则可简化为
x x
1, 2,
若W x 0 若W x 0
❖ 称W(x)为两组距离判别的(线性)判别函数,称a为

测验项目的区分度

测验项目的区分度

优化测验项目的内容和形式
01
内容全面
形式多样
02
03
强调应用能力
测验项目应涵盖教材的各个方面, 以确保全面评估学生的知识掌握 程度。
采用多种题型和形式,如选择题、 填空题、简答题、论述题等,以 提高测验项目的区分度。
测验项目应注重考察学生的应用 能力和问题解决能力,以区分学 生的实际能力水平。
增加测验项目的数量和多样性
职业发展的指导
区分度分析不仅可以帮助企业评估员 工的能力水平,还可以为员工提供个 性化的职业发展指导。
VS
通过区分度分析,员工可以了解自己 在工作中的优势和不足,进而制定适 合自己的职业发展规划,提高个人职 业竞争力。
THANKS FOR WATCHING
感谢您的观看
01
02
03
数量充足
提供足够数量的测验项目, 以确保能够全面评估学生 的知识掌握程度和能力水 平。
多样性丰富
测验项目应涵盖不同的知 识点和技能点,以增加区 分度。
随机组合
采用随机组合的方式,将 多个测验项目组合成一份 试卷,以提高区分度。
05 区分度在教育评估中的应 用
学生成绩的评定与反馈
区分度可以用来衡量学生在测验中的 表现,通过比较学生在不同测验项目 上的得分,可以了解学生对知识的掌 握程度和技能水平。
03 影响区分度的因素
测验项目的难度
难度过高
如果测验项目的难度过高,大部 分被试可能无法正确回答,导致 区分度较低。
难度过低
如果测验项目的难度过低,大部 分被试都能正确回答,区分度同 样会较低。
难度适中
只有当测验项目的难度适中,能 够区分出被试能力水平的差异时, 区分度才会较高。

心理测量复习资料

心理测量复习资料

心理测量第一章:心理测量的历史1、中国古代心理测量的方法P(7)(一)观察法(二)访谈法(三)自然实验法(四)个案调查法2、心理测验产生的社会背景和对个体差异的研究P(9)背景:心理测验最初产生的原因是,在西方一些国家完成工业革命后,对劳动力的需要急剧增加。

工厂需要童工和低能儿,因此要有适当的工具和手段以便有效识别,人们对精神异常者和智力落后者的同等不良待遇,人们要对他们进行区别,也需要建立一种客观的分类标准和鉴别方法。

对个体差异的研究:天文学的一个事件。

第二章:心理测量概述1、测量的定义P(23)测量就是根据一定的法则用数字对事物加以确定。

2、测量的要素P(24)参照点:计算事物的量的起点。

参照点有两种:一种是绝对零点。

另一种是人为指定的参照点。

心理测量中的参照点是人定的,从该点起计算的数值不能以“倍数”的方式解释。

单位:理想的单位需要具备两个条件:一是有确定的意义,即同一单位在大家看来意义是相同的,不允许有不同的解释。

而是有相等的价值。

也就是说,第一单位与第二单位间的距离等于第二单位与第三单位间的距离。

3、测量的量表:要测量某个事物,必须有一个定有单位和参照点的连续体,将要测量的每个事物放在这个连续体的适当位置上,看他距离参照点的远近,以此得到一个测量值,这个连续体就叫量表(measurement),即测量的量表是指在进行测量时体现了测量规则的连续体。

命名量表:类别量表或称名量表,它是量表中测量水平最低的一种,只是用数字来代表事物或把事物归类,没有任何数量的意义,只起着标志事物的作用,因而没有序列性、等距性和可加性。

顺序量表:等级量表,其测量水平比命名量表高,指明类别的大小或含有某种属性的多少,它所适用的统计方法有中位数、百分位数、斯皮尔曼等级相关和肯德尔和谐系数等,但不能做加、减、乘、除运算。

顺序量表具有区分性和序列性,但不具有等距性,也没有可加性。

等距量表:等距量表不仅有大小关系,而且有相等的单位。

心理测量—测验的项目分析

心理测量—测验的项目分析

第二节 区分度
一、什么是区分度 区分度又叫鉴别力,指测验项目对被试
间心理品质差异水平的区分程度。 评价测验项目的区分度高低依赖于对被
试水平的准确测量,一般称为效标分数。 测验项目区分度的效标分数一般使用的 是测验总分,又称内部效标。
二、项目区分度的计算方法
1.极端分组法(项目鉴别指数)
D=PH-PL D:项目鉴别指数 PH:高分组通过率 PL:低分组通过率
123 4
5.面对工作时,有力不从心的感觉。 1 2 3 4
6.工作时感到心灰意冷。
123 4
从未 很少 有时 经常 如此 如此 如此 如此
7.觉得自己推行工作的方式不适当。 1 2 3 4
8.想暂时休息一阵子或另调其他职务。 1 2 3 4
9.只要努力就能得到好的结果。
123 4
10.我能肯定这份工作的价值。
2.
P PH PL
P:难度
2
PH:在一题目上高分组的通过率 PL:在一题目上低分组的通过率
例:在100名学生中,高分组与低分组各有27 人。其中高分组答对第一题的有20人,低分 组答对第一题的有10人。试问该题的难度是 多少?
PH
20 27
0.74
10 PH 27 0.37
P 0.74 0.37 0.56 2
D值为0称为无区分,表示项目与被试 心理特质水平无关。
D值为负值称为消极区分。-1表示项 目与被试心理水平相反。
对区分度值的评价(R.L.Ebel,1965)
0.40以上:非常优良 0.30—0.39:良好 0.20—0.29:尚可,需修改 0.19以下:劣,必须淘汰
2.方差法 计算被试在项目得分的方差。方差越大,表

心理与教育测量学重点总结

心理与教育测量学重点总结
3.提高测量信度的方法有哪些?(学会计算提高测验长度提高测验信度) 答:①适当增加测验的长度;②控制题目的难度分布,使其处于中等水平;③努
力提高每道题目的区分度;④选取适当的被试团体,努力提高测试在各个同 质亚团体上的信度;⑤规范施测程序,统一施测环境,严格控制误差。
第五章 测量效度
掌握概念: 1.效度:指一个测验所能测量到其想要测量的心理特质的程度。 2.表面效度:指测验的表面看起来与其所测验内容之间的一致性程度。 3.内容效度:指测验所能测量到的心理特质的内容与其想要测量的心理特质的内
5.影响效度的因素有哪些? 答:①测验本身:a.测题中所用的词汇或句型不能太难;
b.测题的指导语应该清楚; c.测题中不能提供额外线索; d.测题的难易顺序编制要合理; e.选择题的正确答案不能有明显的组型; f.测题的难度要适当; g.测题数目要适当; ②测验的实施:a.指导语标准化;
b.排除意外干扰; c.按照标准化的程序进行客观评分; ③所选校标的性质; ④测验的信度。
2.简述心理测验的基本条件。 答:标准化测验的技术指标有常模、信度和效度。
(1)常模:指某种心理测验在某一人群中测查结果的标准量数,即可比较的 标准。常模形式有:均数、标准分(如 Z 分、离差智商、T 分)、百分位、划 界分等。常模的制定要通过标准化的取样过程,样本的代表性要好。 (2)效度:指测验结果的有效和真实性,即某种测验测查到所要测查内容的 程度效度高是心理测验的充分必要条件。有内容关联效度、效标关联效度和结 构关联效度。 (3)信度:指测验分数反复测量的可靠性,反映测量误差。有分半信度、重 测信度和α系数等。
2.验证内容效度的方法有哪些? 答:①逻辑分析法;②克伦巴赫估计法;③再测法。
3.验证结构效度的方法有哪些? 答:①测验内方法:a.内容效度法;b.口语报告法;c.相关分析法;

第五章心理测量工具的评价指标

第五章心理测量工具的评价指标

第五章心理测量工具的评价指标正如任何一个测量工具一样,心理测量工具也有它自身的评价指标。

在心理测量学中,信度、效度、项目区分度和有效的常模都是检验心理测量工具是否具有可靠性、有效性、鉴别性、可比性等良好测量特征的技术指标。

因此,了解相关技术指标的内涵和计算方法对于从事心理测量的人力资源管理部门工作人员来说具有重大意义。

第一节心理测量的信度在进行心理测量时,最重要的心理测量学指标之一就是信度(reliability)。

任何一项好的测量都必须有良好的信度,这是人事测评的中心问题,同时它也是标准化测评的一项基本要求和原则。

一、信度的定义信度指的是测量数据和结果的一致性或可靠性程度,它用于分析测量工具测量的前后一致性水平,并以这种一致性的程度来判断测量工具或测量方法的可靠性。

也就是说使用的测评工具可以稳定地测到它所要测量的事物的程度。

我们在选择和使用测评工具或方法时,信度必须是考虑的重要问题。

测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致,信度除受测验工具本身的影响外,亦受很多其它因素的干扰,如所测量的被试样本特征等。

因此没有一份测验是完全可靠的,信度只是一种程度上大小的差别而已。

一致性高的测量工具是指同一群人接受性质相同内容相同的测验测量后,在各结果间显示出的较强的正相关。

稳定性高的测量工具则是指同一批被试在不同的时间接受同样的测验时,结果间的差异很小。

二、信度与误差在进行心理测量时,信度指的是测验分数未受测量误差(errors of measurement)影响的程度。

测量误差指由与测量目的无关的因素产生的不准确或不一致的效应。

测量误差愈小,测量结果愈可靠;换言之,如果测量的结果能反应受试者真实的特征,而不因其他因素而影响测验结果,那么这个测验所测量的结果是可靠的。

测量误差通常包括两种不同类型的误差,即系统误差和随机误差。

系统误差是由与测量目的无关的因素引起的一种恒定而有规律的效应,它稳定地存在于每一次测量中,此时虽然每次的测量值具有一致性,但不正确。

第五章、心理测验的技术指标

第五章、心理测验的技术指标

统计平均值
统计平均值:为了表示一组数 据的规律性,需要计算出一 些能够反映这组数据的统计 特征的数字。我们把它们称 为统计平均值。最常用的统 计平均值是平均数和标准差。
(一)、平均数(M):反映一组数据 的集中趋势。 计算公式是M=(∑Xi)/N 例1:有几组观测数据,请分别计算它 们的平均数? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;
最常见的常模表示方法有两种:标准分 数和百分位数。 标准分数是在原始分的基础上按照一定 的规则转化过来的,它反映了原始分数 在分数总体中的相对位置。 百分位系统,又称百分制,它是将一组测 验分数分成100等分。一个百分位数反 映在标准团体中高于和低于某个分数的 人数比例。例如,不管实际的得分是多 少,如果某人在测验中的得分为80百分 位数,那就意味着高于这个分数的人只 有20%,他处于80%人的最前端。
1.测验题目不能反应要测量的特 征.
2. 实施过程偏离了标准化的程 序. 3. 被试不如实回答.
2、效度的类别
类别 解释说明:
指测验项目所涉及的内容对欲测内容范围的代 表性程度。或者说所测内容对要测内容范围取 样的代表性。 构想效度表示一个测验是否达到了对某一理论 概念或特质的测量。如果一个人格测验测得的 结果与该测验所依据的人格理论或假设相符合, 那么,我们说该测验具有较高的构想效度。 预测效度又称效标关联效度,是指一个测验对 我们所感兴趣的行为能够预测到什么程度。在 这里,被预测的行为是检验测验效度的标准,简 称效标。
(二)、标准差(S):标准差就是一 组数据离平均数的平均距离。反映一组 数据的分散程度。 计算公式:S=√∑(Xi-M)2/N 例1:有几组观测数据,请分别计算它 们的标准差? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;

应用多元分析第五章 判 别 分 析

应用多元分析第五章 判  别  分  析
判别规则为 由于
2
( 1 2 )
业经营状况的指标有:
资金利润率=利润总额/资金占用总额 劳动生产率=总产值/职工平均人数 产品净值率=净产值/总产值 三个指标的均值向量和协方差矩阵如下。现有 二个企业,观测值分别为 (7.8,39.1,9.6)和(8.1,34.2,6.9),
问这两个企业应该属于哪一类?
均值向量 变量 资金利润率 劳动生产率 产品净值率 优秀 一般 13.5 40.7 10.7 5.4 29.8 6.2 68.39 40.24 21.41 协方差矩阵 40.24 54.58 11.67 21.41 11.67 7.90
2
pp
(二)两个总体距离判别法
1、 1 2 先考虑两个总体的情况,设有两个协差阵相同 的p维总体,对给定的样本x,判别一个样本x到底是 来自哪一个总体,一个最直观的想法是计算x到两个 总体的距离。故我们用马氏距离来给定判别规则, 有:
x 1 , 如d x, 1 d x, 2 , 2 2 x 2 , 如d x, 2 d x, 1
1
pp
1 11 d 2 ( x, G ) ( x - μ)
1
22

(x - μ) 1 pp
p
x1 1
11
2
x2 2
22
2
x
p
计划学时: 4学时 教学课型: 理论课 教学目的与要求:理解判别分析的概念;掌握判别分析的基 本原理;掌握距离判别的基本原理与方法. 教学重点:距离判别 教学难点:多总体、协方差阵不等的距离判别 教学方法、手段与媒介:根据教材用多媒体课件课堂讲授 教学过程与内容:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

r
N XY X Y N X ( X )
2 2
N Y 2 ( Y ) 2
2.点二列相关系数 • 测验的一个变量为连续变量,另一个变量为真 正的二分变量时,用点二列相关系数表示区分 度。 • 查“相关系数临界值表”,根据df=n-2和显著 性水平α=0.05或α=0.01,进行检验。大于临界 值,差异显著,区分度达到显著水平。
35
2.主观性试题区分度的计算公式:
– 说明:
XH XL D N ( H L)
»XH:高分组所得总分;XL:低分组所得总 分;H:该题最高分;L:该题最低分;N: 考生总人数的25%
主观性试题区分度的计算(P115):
– 步骤:
»按测验总分由高到低排序; »分别确定测验总分的25%、25%作为高 低分组; »列出试题分析表;
第五讲 区分度度 内容: 1.区分度的概念 2.区分度的计算 3.区分度对测验的影响
一、区分度的概念
• 区分度指测验题目对考生实际水平的区分程度或鉴别能 力。
• 如一道题,学业水平、实际能力都较高的考生都答对了 ;而学业水平、实际能力都较低的考生都答错了,则可 认为该题目有好的区分度。
• 区分度也叫鉴别力,是测验项目分析的重要内容,是评 价项目质量和筛选项目的主要指标与依据。
很好
良好,修改会更好 尚可,仍需修改 差,必须淘汰
(二)区分度与难度的关系
– 试题的区分度与难度有密切关系。
– 试题难度过大或过小,其区分度都较低。
– 要保证试题具有理想的区分度,保持0.3<p<0.7 ,最好达到0.4<p<0.6。 – 调整难度是提高试题区分度的重要方法。
难度 1.00 0.7 0.50 0.30 0.10 0.00
提高区分度的方法
• 1、使题目的难度适中,使整个考试难度适中 • 题目的难度适中可使区分度达到最大值,因此 ,使难度适中是提高区分度的重要方法。 • 2、着重考察复杂的学习结果 • 使高能学生得高分或低能学生得低分,使分数 尽量分布在整个分数量尺上。 • 3、掌握区分度的评价标准。
谢 谢 大 家!
• 学生 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 • 测验 65 70 31 49 80 50 35 10 81 69 78 55 77 90 42 • 第一题 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0
3.二列相关系数
• 测验总分和项目分数均为连续变量,其中一 个变量人为地分成两个类别(二分变量), 用二列相关系数表示试题的区分度,计算公 式如下:
高试题的区分度的方法来达成。
二、区分度的计算 • 根据试题类型和测验数据特征使用不同的 方法
(一)极端分组 1.客观性试题区分度的计算
D = PH- PL • 公式中,D为区分度,PH高分组通过率,PL低分组 通过率。
客观性试题区分度的计算步骤
• • • • • • 按测验总分由高到低排序; 确定高分组和低分组,各取27%; 分别求出这两组被试通过试题的百分比; 数据代入公式 D = PH- PL 公式中,D为区分度,PH高分组通过率,PL低分 组通过率。
计算方法: ø相关以符号rø表示,其计算公式为
r
a b(a c)(b d )(c d )
Y1 Y2
b d
ad bc
式中:a、b、c、d分别表示四格表中的实际 次数,如表所示。

a+b c+d
X1 X2
a c

a+c
b+d
• 检验Φ相关系数rΦ的显著性需要将r值转换为χ2值 。 • 转换公式:χ2 = N rΦ2 • N为考生总人数 • 查χ2值表检验,四格表自由度df=(2-1)(2-1) =1。 • 取显著性水平α=0.05或α=0.01。
区分度 0.00 0.60 1.00 0.60 0.20 0.00
(三)区分度与信度的关系
• 测验的信度与项目的区分度有关密切关系。
• 由试题的区分度可以估计测验的信度。
• 整个测验中各题的区分度D值的平均数越大,测验 的信度就越高。
D的平均值 0.1225 0.16 0.20 0.30 0.40 0.50
• 具有良好区分度的测验,实际水平高的应该得高分,实 际水平低的应该得低分。
• 区分度(D)的取值范围介于- 1.00—+1.00之 间,值越大,区分度的效果越佳。 • 区分度D>0为正区分,D<0为负区分,D=0为 零区分 – D越高时,试题的质量越好
区分度
题目评价
0.40以上
0.30~0.39 0.20~0.29 0.19以下
极端组的划分 27%规则 一般情况下,取上下25%~33%均可。 样本少时,可以取50% 注意:
由于计算机的方便使用,可以上下50%作为划分高低组的 标准,或者多分几组,对区分度和难度作详细分析。因 为只取上下两端,只利用了一部分资料,浪费了很多信 息,有可能得出错误结论。
• 例:有道试题,高分组有70%学生通过,低分组有 30%的学生通过;而另一道题,高分组有40%学生通 过,低分组有70%学生通过,求两题的各自区分度? • D1=0.7-0.3=0.4 • D2=0.4-0.7=-0.3 • 例 :一次历史考试中,在100名学生中,高低分组各 有27人,其中高分组答对第一题的有20人,低分组答 对第一题的有5人,求这道题的区分度? • D=20/27-5/27=15/27=0.55
• 测验的总分属于连续变量,测验项目为连续变量或二 分变量。
• 具体方法:积差相关、点二列相关、二列相关、Φ相
关、项目效度分析
1.积差相关法
• 被试(考生)的试题得分和总分都属于连续变量 时使用。此时必须保证试题具有较高的信度。 • 计算出项目分数X和总分Y的相关系数后,查“相 关系数临界值表”,根据df=n-2和显著性水平 α=0.05或α=0.01,进行检验。大于临界值,差异 显著,区分度达到显著水平。
在语文测验上的总分以作文题得分情况如上表,作文得分在37分以上 否则不合格,试计算作文题的区分度。
• 例:已知一测验中某选择题的通过率为 0.5,答对者的测验总分平均为76分,答 错者的测验总分平均为63分,全体被试 20人总分的标准差为16,求该题的区分 度?
4.Φ相关系数 如果测验中的两个变量都是二分变量,则可 用Φ相关系数来表示项目的区分度。 • 一般总分用合格、不合格分类,试题用通 过、未通过分类。
考取 通过
未通过
未考取
13
5
7
20
有45名考生,考取大学的人数和某题上 通过的人数如上表。若以升学为效标, 此题对学生是否有区分能力?
项目效度分析法
• 项目效度分析法与内部一致性的分析方法一样。 只不过内部一致性的分析方法是分析测验中所包 含的试题是否与整个测验协调一致,而项目效度 分析法是了解被试对某一试题的反应与外在效标 之间的关系。 • 项目效度分析也是采用相关法分析,计算方法与 计算内部一致性的分析方法相同。只是不取测验 总分计算相关,而是以外在效标分数来计算,其 关键是确定好效标。
»将数据带入以上公式加以计算例:有100名考生参加主观性试题测验,按高低各占总 人数的25%分组。其中第4题得分统计如下
X 12 10 高 分 组 8
f 10 6 4
fX
X 12 低 分 组 10 8
f 0 4 6
fX
6
4
3
2
6
4
5
10
• (二)相关法
• 大规模标准化测验中,采用相关法分析项目的内部一 致性,以项目分数与效标分数的相关系数作为项目区 分度的指标,相关越高,区分能力越好。
rb
X p Xq St
_
_
pq Y
• p为类别1的百分比,q为类别2的百分比,Y为 正态分布下p的曲线高度(查正态分布表<曲线 下的面积P与纵高Y对应表>),St为全体考生 测验得分的标准差。
• 。
检验二列相关系数的显著性用下列公式
Z r b 1 Y pq N
• 检验二列相关系数的显著性需要将r值转换 为Z值。取α=0.01水平。 • N为总人数。
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2 94 72 65 22 76 83 80 75 76 73 62 91 47 74 81 88 62 58
7 55 27 22 10 35 42 46 39 40 41 38 52 21 39 42 48 29 27
合 合 不 不 不 不 合 合 合 合 合 合 合 不 合 合 合 不 不 格 格 合 合 合 合 格 格 格 格 格 格 格 合 格 格 格 合 合 格 格 格 格 格 格 格
rpb
X p Xq St
_
_
pq
• rpb为点二列相关系数,X p为考生答对某题的平均得分 ,X q为考生答错某题的平均得分,p为答对某题人数占 全体考生人数之比,q为答错某题人数占全体考生人数 之比,q=1—p ,St为全体考生测验得分的标准差。
• 例:15个学生在数学测验中得分记录如下 ,计算数学测验中第一题的区分度?
信度 0.00 0.42 0.63 0.84 0.915 0.949
• 1、D值平均数与信度的关系表由艾伯尔于 1962年发表。假定全部试题(100道试题) 的难度均为0.5时所预测的信度系数。 • 2、测验信度随区分度的提高而增长,且信
度增长的速度较区分度增长为快。
• 3、要想达到理想的测验信度,可以通过提
相关文档
最新文档