信度与效度PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
下或两组不同评价材料的评定结果之间的相关系数
(rxx) 。
信度系数越大,则说明该测量或评定方法的可靠性越 强,反之,则可靠性弱。
简单地说信度就是指测量数据和结论的可 靠性程度,也就是说测量工具能否稳定地 测量到它要测量的事项的程度。
4
我们可以举例说明信度的问题:如果想知道 某人的体重,我们可以叫两个人来估计,一 个人的估计为150镑,另一个人的估计为300 镑,那么我们就可以认为,叫别人来估计体 重是非常不可信的方法。如果用磅秤 ,连续 测量两次的结果都是相同的,因而我们可以 说,在测量体重方面,用磅秤的方法要比叫 人来估计更可信。我们可以用信度系数来表 示信度的大小。
现代人员测评理论与实务
电 话: E-mail:
1
第四讲 人员测评技术之 测评信度与效度
2
本讲内容
测评信度及检验
1、测评信度及检验 2、测评效度及检验
3
5.1测评信度及检验
5.1 测评效度的概念
1、信度概念:测评结果的前后一致性。又称可靠性程度。 2、信度系数:用一样本在两种不同时间、不同情景条件
等值信度的实施技巧:为了抵消测评先后顺序效应,一 般要求有一半人先用A型量表进行测定,然后再用B型量 表进行测定;另一半人则先用B型,再用A型。二者间隔 时间要求保持在最短时距内。其范围为几分钟到几小时。
12
5.1.3影响信度的因素
主体
客体
13
影响信度的主体的因素
不严格按照规定实施测验、 制造紧张气氛、 给予特别协助、 评分主观
19
二、题目的数量
一般说来,在一个测验中增加同质的题目, 可以使信度提高。即测验越长,信度越高。这是 因为测验加长,加大了分数分布的范围,可能改 进项目取样的代表性,从而能更好地反映受测者 的真实水平。即测验的项目越多,在每个项目上 的随机误差就可以互相抵消。
20
增加测验长度的效果可以用斯皮尔曼—布朗公式 来计算:
rxx’=Krxx/[1+(K-1)rxx]
式中,K为改变后的长度与原来长度之比,rxx为 原测验的信度,rxx’为测验长度是原来的K倍时的信度 估计。一般来说,题目数量对相关系数的影响是递增
的。如表所示
6
信度系数要达到多高才可以接受呢?
一般能力与学绩测验的信度系数在0.90 以 上;人格测验的信度系数通常在0.80 以上。 当 rxx <0.70时,不能用测验对个人作评价,也不 能在团体间作比较;当 rxx ≥0.70时,可用于 团体间比较; 当rxx ≥ 0.85 时,可用于鉴别个 人。
7
为何要进行信度的衡量?
我们知道在进行测量时,误差是难免的,这就 使得真实值和测量值之间是不可能完全一致。 我们可以这样来表示真实值和测量值之间的关 系。 X=T+B+E T表示真实值,B表示偏差即系统误差,E表示 测量误差即随机误差。由于系统误差很难分解, 因而有些书中的分解式将系统误差包括在真实 值之中,因而X可以简单地概括为X=T+E
8
5.1.2测评信度的分类
(一) 重测信度 又称稳定性信度,它用于分析两次间隔一定时间的评定或测定结 果之间的相关关系。这种方法通常是重复同样的测量来检验信度 信度系数可以用相关系数来表示。假如我们第一次测量时的观测 值是X,第二次的观测值是Y,那么重测信度就等于X与Y的相关系 数。
但重复测量时,我们要注意两次测量的时间间隔要恰当。如果时 间间隔太久,可能会发一些变故,影响到被调查者的态度,那么 前后的测量就会有很大的差异。
5
对信度系数要注意三点:
第一,在不同情况下,对不同样本,采用不 同方法会得到不同的信度系数,因此一个测验可 能不止一个信度系数;
第二,信度系数只是对测量分数不一致程度 的估计,并没有指出不一致的原因;
第三,获得较高的信度系数并不是心理测量 追求的最终目的,它只是迈向目标的一步,是使 测验有效的一个必要条件。
10
5.1.2测评信度的分类
(三)等值信度(复本信度)
等值信度是指以两个平行型的测评量表在最短时距 内施行两次所的结果的相关系数来评估的。
什么是平行型量表:
内容、形式和长度相同,难度(即有相同的平均数) 和差异程度(相同的标准差)也相同。
A型量表
最短时距
B型量表
相关系数为等值信度 11
5.1.2测评信度的分类
16Fra Baidu bibliotek
误差变异越大,信度越低。除前面谈到的几种误 差来源外,还有以下几个因素会影响信度系数的大小:
一、被试样本(分数分布范围) (一)团体的异质性
信度系数受分数的分布范围(全距)的影响,而 分数范围与被试团体的异质程度有关。一个团体越异 质,其分数范围越大,信度系数也就越高。相反,相 对同质的团体分数则较为均匀。如图所示:
9
5.1.2测评信度的分类
(二)折半信度 通常是在无副本且不准备重测的情况下,我们就用折半信度来计 算信度系数。 举例来说,如果有一份问卷,其中有十个问题涉及到女性歧视现 象。利用折半信度时,可将是个问题随机分成两组,每组有五个 问题,然后根据每组的测量结果来计算两组的相关系数,就 是折半信度,Rhh。但整个问卷的信度需要用校正公式来得到: Rxx=2Rhh/(1+Rhh)
17
图中大方框显示的是一个较大的异质团体在 两次施测中的分数分布,显然有很高的正相关.在 小方框中显示的是一个高度同质的亚团体,两次 分数几乎呈随机变化,相关接近于零.
18
(二)团体的平均水平 对于不同的团体,题目具有不同的难度。每个题目 在难度上的微小差异积累起来便会影响信度。 例如,同一量表对不同年龄,不同IQ水平的被试, 信度则不尽相同。 因此,我们在编制测验量表,抽选被试时,往往 要考虑选取不同层次的被试,以使得测验团体呈异质 性,从而使得信度提高。反之,当需要同质团体的信 度时,就应该尽量选取同一层次的被试。
14
来自客体的影响因素:
被试方面: 身心健康状况、动机、注意力、持久性、求胜 心、作答态度等均随时在变化中 测验内容方面: 试题取样不当、内部一致性较低、题数过少、题 意模糊等 施测环境方面: 施测现场条件,如通风、温度、光线、噪音、桌面好坏、 空间的阔窄等
15
另外几个重要的影响因素:
一、分数分布范围 二、测验长度 三、测验的难度 四、间隔时间
(rxx) 。
信度系数越大,则说明该测量或评定方法的可靠性越 强,反之,则可靠性弱。
简单地说信度就是指测量数据和结论的可 靠性程度,也就是说测量工具能否稳定地 测量到它要测量的事项的程度。
4
我们可以举例说明信度的问题:如果想知道 某人的体重,我们可以叫两个人来估计,一 个人的估计为150镑,另一个人的估计为300 镑,那么我们就可以认为,叫别人来估计体 重是非常不可信的方法。如果用磅秤 ,连续 测量两次的结果都是相同的,因而我们可以 说,在测量体重方面,用磅秤的方法要比叫 人来估计更可信。我们可以用信度系数来表 示信度的大小。
现代人员测评理论与实务
电 话: E-mail:
1
第四讲 人员测评技术之 测评信度与效度
2
本讲内容
测评信度及检验
1、测评信度及检验 2、测评效度及检验
3
5.1测评信度及检验
5.1 测评效度的概念
1、信度概念:测评结果的前后一致性。又称可靠性程度。 2、信度系数:用一样本在两种不同时间、不同情景条件
等值信度的实施技巧:为了抵消测评先后顺序效应,一 般要求有一半人先用A型量表进行测定,然后再用B型量 表进行测定;另一半人则先用B型,再用A型。二者间隔 时间要求保持在最短时距内。其范围为几分钟到几小时。
12
5.1.3影响信度的因素
主体
客体
13
影响信度的主体的因素
不严格按照规定实施测验、 制造紧张气氛、 给予特别协助、 评分主观
19
二、题目的数量
一般说来,在一个测验中增加同质的题目, 可以使信度提高。即测验越长,信度越高。这是 因为测验加长,加大了分数分布的范围,可能改 进项目取样的代表性,从而能更好地反映受测者 的真实水平。即测验的项目越多,在每个项目上 的随机误差就可以互相抵消。
20
增加测验长度的效果可以用斯皮尔曼—布朗公式 来计算:
rxx’=Krxx/[1+(K-1)rxx]
式中,K为改变后的长度与原来长度之比,rxx为 原测验的信度,rxx’为测验长度是原来的K倍时的信度 估计。一般来说,题目数量对相关系数的影响是递增
的。如表所示
6
信度系数要达到多高才可以接受呢?
一般能力与学绩测验的信度系数在0.90 以 上;人格测验的信度系数通常在0.80 以上。 当 rxx <0.70时,不能用测验对个人作评价,也不 能在团体间作比较;当 rxx ≥0.70时,可用于 团体间比较; 当rxx ≥ 0.85 时,可用于鉴别个 人。
7
为何要进行信度的衡量?
我们知道在进行测量时,误差是难免的,这就 使得真实值和测量值之间是不可能完全一致。 我们可以这样来表示真实值和测量值之间的关 系。 X=T+B+E T表示真实值,B表示偏差即系统误差,E表示 测量误差即随机误差。由于系统误差很难分解, 因而有些书中的分解式将系统误差包括在真实 值之中,因而X可以简单地概括为X=T+E
8
5.1.2测评信度的分类
(一) 重测信度 又称稳定性信度,它用于分析两次间隔一定时间的评定或测定结 果之间的相关关系。这种方法通常是重复同样的测量来检验信度 信度系数可以用相关系数来表示。假如我们第一次测量时的观测 值是X,第二次的观测值是Y,那么重测信度就等于X与Y的相关系 数。
但重复测量时,我们要注意两次测量的时间间隔要恰当。如果时 间间隔太久,可能会发一些变故,影响到被调查者的态度,那么 前后的测量就会有很大的差异。
5
对信度系数要注意三点:
第一,在不同情况下,对不同样本,采用不 同方法会得到不同的信度系数,因此一个测验可 能不止一个信度系数;
第二,信度系数只是对测量分数不一致程度 的估计,并没有指出不一致的原因;
第三,获得较高的信度系数并不是心理测量 追求的最终目的,它只是迈向目标的一步,是使 测验有效的一个必要条件。
10
5.1.2测评信度的分类
(三)等值信度(复本信度)
等值信度是指以两个平行型的测评量表在最短时距 内施行两次所的结果的相关系数来评估的。
什么是平行型量表:
内容、形式和长度相同,难度(即有相同的平均数) 和差异程度(相同的标准差)也相同。
A型量表
最短时距
B型量表
相关系数为等值信度 11
5.1.2测评信度的分类
16Fra Baidu bibliotek
误差变异越大,信度越低。除前面谈到的几种误 差来源外,还有以下几个因素会影响信度系数的大小:
一、被试样本(分数分布范围) (一)团体的异质性
信度系数受分数的分布范围(全距)的影响,而 分数范围与被试团体的异质程度有关。一个团体越异 质,其分数范围越大,信度系数也就越高。相反,相 对同质的团体分数则较为均匀。如图所示:
9
5.1.2测评信度的分类
(二)折半信度 通常是在无副本且不准备重测的情况下,我们就用折半信度来计 算信度系数。 举例来说,如果有一份问卷,其中有十个问题涉及到女性歧视现 象。利用折半信度时,可将是个问题随机分成两组,每组有五个 问题,然后根据每组的测量结果来计算两组的相关系数,就 是折半信度,Rhh。但整个问卷的信度需要用校正公式来得到: Rxx=2Rhh/(1+Rhh)
17
图中大方框显示的是一个较大的异质团体在 两次施测中的分数分布,显然有很高的正相关.在 小方框中显示的是一个高度同质的亚团体,两次 分数几乎呈随机变化,相关接近于零.
18
(二)团体的平均水平 对于不同的团体,题目具有不同的难度。每个题目 在难度上的微小差异积累起来便会影响信度。 例如,同一量表对不同年龄,不同IQ水平的被试, 信度则不尽相同。 因此,我们在编制测验量表,抽选被试时,往往 要考虑选取不同层次的被试,以使得测验团体呈异质 性,从而使得信度提高。反之,当需要同质团体的信 度时,就应该尽量选取同一层次的被试。
14
来自客体的影响因素:
被试方面: 身心健康状况、动机、注意力、持久性、求胜 心、作答态度等均随时在变化中 测验内容方面: 试题取样不当、内部一致性较低、题数过少、题 意模糊等 施测环境方面: 施测现场条件,如通风、温度、光线、噪音、桌面好坏、 空间的阔窄等
15
另外几个重要的影响因素:
一、分数分布范围 二、测验长度 三、测验的难度 四、间隔时间