第四章 测量信度
第四章 心理测验的信度与效度

27
2、确定信度可以接受的水平
SE Sx 1 rxx
(公式5-4)
式中SE表示测量的标准误,即误差分布的标准差; Sx表示一次测量分数的标准差;rxx表示信度系数。
32
我们可以用测量的标准误来估计个人测验的真分数 的大小。
如果选用95%的可靠性水平(置信水平),即显著 性水平(a值)为.05,Z ,2 真分数有95%的可能落入 X ±1.96SE ,即X ±1.96 SE的范围之内,也可以 写成X-1.96SE T X+1.96 SE,SE则用公式5 -4代入。或有5%的可能落入这范围之外。这实际 上也表明了再测时分数改变的可能范围。
被试有条件接受两个测验。
17
(三)内部一致性信度
1、定义:
反映的是题目之间的关系,表示测验能够测量相同内容 或特质的程度。
2、方法:
(1)分半信度: 通常是先把一份测验按题目的奇偶顺序或其它方法分 成两个尽可能平行的半份测验,然后计算两半之间的 相关,即得到分半信度系数。
18
ABCDE FGH I J X1 16 15 13 13 11 10 10 9 8 7 X2 15 16 14 12 10 9 11 8 6 7
2、注意事项: 所测量的心理特性必须是稳定的。 遗忘和练习的效果基本上是相互抵消的。 在两次施测的间隔时期内,被试在所要测验的心理特 质方面没有获得的更多的学习和训练。 易受练习和记忆的影响,两次测试的时间间隔要适当, 一般是2~4周较宜,间隔时间最好不超过6个月。
第四章心理测量的信度

第四章心理测量的信度一、单项选择题。
1.当代信度理论的大部分要点是()。
(4.1.63)A斯皮尔曼 B皮尔逊 C桑代克 D库德2.重测信度的大小等于同一组被试在两次测验上所得分数的()。
(4.2.67)A.克伦巴赫α系数B.皮尔逊积差相关系数C.肯德尔和谐系数D.肯德尔W系数3.关于重测信度说法正确的是()。
(4.2.67)A.每一种信度系数都能说明信度B.重测信度高,说明分数受被试状况和测验情境变化的影响小C.所有的测验都可以计算重测信度D.重测信度不仅反映了随机误差的影响,也反映了被试心理特点的长期变化4.关于重测信度下列说法正确的是()。
(4.2.67)A每一种信度系数都能说明信度。
B重测信度高,说明分数受被试状态和测验情境变化的影响小。
C所有的测验都可以计算重测信度。
D重测信度不仅反映了随机误差的影响,也反映了被试心理特点的长期变化。
5.关于重测信度下列说法不正确的是()。
(4.2.69)A任何一个测验都可能有不止一个再测信度系数。
B一份完备的测验应有很多重测系数,分别与不同的测验间隔时间相对应。
C重测相关很低意味着测验不可信。
D重测相关很低可能是被试被研究的特性发生了改变。
6.等值性系数取决于平行测验的得分之间的相关,且两次测验的时间间隔极短,所以若等值性系数偏低肯定是由于()造成的。
( 4.2.71)A.学生自身变化B.题目取样不同C.主试的反应D.测试环境变化7.分半信度只适用于()。
(4.2.7 4)A.难度测验B.速度测验C.=非标准化测验D.成就测验8.同质性信度是指测验的()的一致性程度。
(4.2.74)A.题目内容B.题目形式C.所有题目间D.各维度题目9.下列估计信度的方法需施测2次的是()。
(4.2.80)A.分半信度 B.同质性信度C.评分者信度D.再测信度10.下列哪项不是影响信度的因素()。
(4.3.82)A.样本团体平均水平B.题目数量C.系统误差D.施测情境11.人格测验的信度应达()以上。
第四章测量信度

第四章 测量信度一、填空题1、 根据一组被试在 两个平行或两个复本 测验上的得分计算的相关系数即为复本信度。
2、各种估计信度的方法都是对测验的一致性进行估计,但由于误差来源不同,它们研究的侧面各不相同,说明的是信度的不同方面。
其中,再测信度可用来估计________________________,复本信度可用来估计_________________,等值稳定性系数可用来估计_______________________,内部一致性系数可用来估计测验跨项目或两个分测验之间的一致性,评分者信度可用来估计测验跨评分者的一致性。
3、用同一个测验,对同一组被试前后施测两次,对两次测验分数求相关,其相关系数就叫 重测信度 。
4、一般认为经过训练的成对评分者之间的一致性达 0.90 以上,评分才是客观的。
5、再测信度又叫__________。
6、增加测验长度对信度产生的效果可用XXXX KK r K Kr r )1(1-+=公式来计算。
7、利用两平行形式测验测查同一批被试所得的两批观察分数,求其间的相关系数,跟____一样,也可求得测验的信度系数。
这种用平行形式相关求得的信度系数,因为特别强调两测验形式的____,所以又叫____。
8、复本信度又叫( )系数。
二、单项选择题信度的定义1、如果某测验的信度系数为0.80,那么该测验中真分数造成的变异占( A )A 80%B 20%C 64%D 36%2、信度之于效度正如(B )。
A 准确性之于一致性B 一致性之于准确性C 偏差数之于常模D 常模之于偏差数3、在能力测验中,代表测验量表的稳定性和一致性的指标是( C )。
(华南师大2001研) A 效度B 区分度C 信度D 难度4、信度指的是测量的( C )。
A 正确性B 针对性C 一致性D 有效性5、信度指数的( B )就是信度系数。
7、关于信度的指标正确的是( C )。
A 信度系数,即实得分数方差与真分数的方差的比值B 信度指数即是信度系数C 测量标准误与信度呈负相关D 测量标准误与信度呈正相关(相似题目)关于信度的指标,说法错误的是( D )。
心理测量 第4章 心理与教育测量的信度

两个测验必须在项目的内容、形式、数量、难易、 时限、指导语等方面相同或相似; 两次测验的时间间隔要适当;
尽管复本信度的估计方法避免了再测法的 缺点,应用范围较广,但它本身也有一定的局 限性:
复本法只能减少而不能完全排除练习和记忆的影响; 对于许多测验来说,建立复本是相当困难的; 由于第二个测验只改变了题目的内容,已经掌握解 题原则,可以很容易迁移到同类问题中去。
2 K为测验题目数,Si2 为某一题目分数的变异数,Sx 为测验 总分的变异数
采用SPSS计算信度
数 据 库
同 质 性 信 度 计 算 方 式
结果
输入40题
结果
评分者信度
标准化测验一般都有较为严格的评分程序。
对于客观性试题来讲,评分所引起的误差是可 以忽略不计的,但是对于一些主观题来讲,评 分者之间的变异是产生误差的重要原因之一。
测验的信度。
根据统计学里讲的区间估计的方法,
我们可以得知:个人在每次测量中所得分
数X有95%的可能性在真分数加减1.96个
标准误的范围内,即
X 1.96SE T X 1.96SE
两种测验分数的比较 来自不同测验的原始分数是无法直接 比较的,只有参照统一团体的平均分数, 将它们转换成相同尺度的标准分数(如T分 数或Z分数),才能进行比较。为了说明个 人在两种测验上的差异,我们可以用差异 标准误来检验其差异的显著性,其公式:
信度是测量过程中随机误差大小的反应 信度可以用来解释个体测验分数的意义 信度可以帮助不同测验分数之间进行比较
一个测验有多个信度估计值,因而误差估计值也有 多个,我们在实际工作中要注意选择最适合某一特 殊情况的信度估计来解决问题。
第四章 测验信度作业

第四章测量信度一、单选题1.速度测验的信度应以( c )取得。
dA.奇偶法 B.筛选法 C.反应时法 D.重测法2.在其他条件均等的情况下,测验长度和信度之间的关系是( d )。
bA.测验越长,信度越低B.测验越长,信度越高C.没有关系D.上述说法都不正确3.计算一项测验的分半信度最常用的方法是比较( b )。
A.测验的前半部分与后半部分的得分。
B.奇数项目与偶数项目的得分。
C.将测验随机分为两部分,比较这两部分的得分。
.D.上述方法都可以。
4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少?( b )A. 0.50B. 0.67C. 0.80D. 1.05.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )?A.减小,趋向于零。
B.只要趋向于1.0,它就会要么增大,要么减小。
C.增大,趋向于测验的标准差。
D.增大,逼近无限大。
6.再测信度所考虑的误差来源是(d )所带来的随机影响。
A.形式的不同B.题目的不同C.考生的不同D.时间的不同7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。
A.肯德尔和谐系数B.等级相关系数C.皮尔逊积差相关系数D.克伦巴赫α系数8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。
A.信度B.效度C.难度D.区分度9.信度只受(d )的影响。
bA .系统误差 B.随机误差 C.恒定效应 D.概化理论10.复本信度又称等值性系数。
它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。
复本信度反映的是测验在( c )上的等值性。
dA.时间B.题目C.评分D.内容11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。
这个相关系数就代表了( d )内容取样的一致程度。
第4章 测量的信度与效度

实得分数的方差等于真分数的方差与误差方差之和。
调研人员应运用所掌握的统计知识,分析其是属于系统 误差还是属于随机误差。 系统误差会使调查结果有误,所以应尽量避免。 随机误差可通过提高样本代表性、增大样本量来减少。
信度一般规定是:真分数的方差在总体方差中所占的比 重,即信度系数:
当题目间的相关系数越大时,α系数也会越大。 当题目数目n越多时,S
2 H
n 值越大, 越接近于0, 2 SH n 1
2 S i
越接近于1,故α系数也会越接近于1。
要做信度分析须先检查每个题目是否都是同方向的,即 都是正面问法,反向问题需要做处理后才可以加入分析。
在计算α系数时,应该注意有些调查量表测量的内容包 含几个领域,这时宜分别计算各个领域的α系数。 克朗巴哈α系数适用于项目多重计分的测验数据或问卷 数据,可以用该系数测量Likert量表的信度。 在基础研究中,信度至少应达到0.8才可接受; 在探索性研究中,信度只要达到0.7就可以接受; 在旅游调查测量实践中,信度只要达到0.6即可接受。 α系数通常与量表题目数量有关,题目数量越多,α系 数就越大。
理想(甚佳,信度 佳(信度高) 很高) 非常理想(信度非 非常理想(甚佳, 常好) 信度很高)
二、克朗巴哈 α系数的手工计算
以一份有8个题项的量表为例,8个题项均为正向题, 受试样本数有6位,采用Likert 5点量表填答,获得调查 结果如下表:
题号 样本
量表试题
01 5 5 5 5 5 4 02 1 1 2 1 1 1 03 2 2 2 2 2 1 04 5 4 5 5 5 5 05 2 3 3 3 3 3 06 5 5 5 5 5 4 07 4 5 5 5 5 4 08 3 2 2 3 2 2 总分 27 27 29 29 28 24
第四章 测量信度

分析结果
信度类型 重测复本 分半信度 rXX 0.70 0.80 误差源 时间、内容 内容取样 误差的方差
两者之差
评分者信度 0.92
总误差方差 真分数方差
时间取样
评分者差异
1-0.70=0.3 1-0.80=0.2 0.3-0.2=0.1 1- 0.92=0.08 0.2+0.1+0.08=0.38 1-0.38=0.62
二、信度的统计定义
2 T rXX 信度是被试团体真分数方差与实得分数方差之比:2 X
T2
X2
E2
E2
T2
X2
信度是被试团体真分数与实得分数相关系数的平方:
2 rXX TX
rXX XX
理论定义
操作定义
信度是一个测验X(A卷)与它的任意一个平行测验 (B卷)的相关系数。
分析
散点图 计算
散点图
低
整段范围
高
样本团体平均能力水平的影响
团体平均水平太高或太低,使测验分数的分 布变窄,低估测量的信度
典型测验的信度高低水平
测验类型 成套成就测验 学术能力测验 成套倾向性测验 客观人格测验 兴趣问卷 态度量表 低 .66 .56 .26 .46 .42 .47 中 .92 .90 .88 .85 .84 .79 高 .98 .97 .96 .97 .93 .98
各种信度反映的误差来源比较
信度类型 重测信度 等值性系数 等值稳定性系数 分半信度 同质性信度 评分者信度 误差来源 时间 内容 时间和内容 内容 内容 评分者之间的差异
心理测量 第四章 测量信度

例题
• 在一次测验中有一学生得80分,这是否反 映了他们的真实水平?如果再测一次他的 分数将改变多少?已知该次测验的标准差 为5,信度系数为0.84。 • 首先计算SE: • SE= 5 √ (1-0.84) =2 • T=80 1.96 2 = 76.08~83.92 • 我们可以说该学生的真正分数有95%的可 能性落在76与84分之间。
2.信度可以帮助进行不同测验分数 的比较
• 来自不同测验的原始分数是无法直接比较 的,而必须将它们转换成相同尺度的标准 分数才能进行比较。 • 例:某班期末考试,张生语文、数学的成 绩转换成T分数(平均数为50、标准差为10) 分别为65和70,由此我们可以知道张生的 数学比语文考得稍好些,但二者差异是否 有意义,仍不清楚。
• 由于SX2=ST2+SE2, • 所以信度还可表示为: • XX=(SX2-SE2)/ SX2=1- SE2/ SX2 • 信度在1(完全可信)与0(不可信)之间
• 由于真分数的变异数是不能直接测量的,因此信 度是一个理论上构想的概念,由于我们无法得到 测验的真正信度,我们只能用一些指标对它进行 估计。
二、复本信度
• 1.含义与计算 • 任何测验都只是所有可能题目中的一份取 样,所以可能编制许多平行的等值测验, 叫做复本。 • 复本信度(alternate-form reliability)就是 指用两个复本测验测量同一批被试所得结 果的一致性程度。 • 其大小等于同一批被试在两个复本测验上 所得分数的积差相关系数。
三、分半信度
• 分半信度(split-half reliability)指的是将一个测 验分成对等的两半,根据所有被试在这两半测验 上所得分数的一致性程度。 • 分半信度系数可以和等值性系数一样解释。因为 这两半测验基本上相当于最短时距施测的两个平 行的复本,由于只需要对一个测验进行一次施测, 考察的是两半题目之间的一致性,所以这种信度 系数有时也被称为内部一致系数。 • 虽然分半信度也可当作内部一致性的测量,但我 们将归类为等值的特例,与其它等值性测量唯一 不同之处是在测验施测后才分成两个。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差相等时
rxxLeabharlann 2rhh 1 rhh弗拉南根公式 卢尤公式
方差不等时
(二)同质信度
同质性 题目间的内部一致性
克龙巴赫 系数
各类 题型
类型 库-理信度
0、1 题型
K-R20 难度不同
k-R21 难度相近
四、评分者信度
含义 评分者评分的一致性
2评分者
rXY
rρ
方法
2个以上者 肯德尔和谐系数
真分数与实得分数相关的解释 信度系数和指数
②复本信度:两个平行测验测量同一批被试 所得结果的一致性程度。
③分半信度:将一个测验分成对等两半后, 所有被试在这两半上所得分数的一致性程度。
④同质性信度:指测验内部所有题目间的一
致性程度,也叫内部一致性系数。
KR20
⑤评分者信度
KR21
系数
一、重测信度
含义
程序
误差
同一测验
同组对象
前后测2次 相关系数
二、信度的作用
信度是测量过程中所存在的随机误 差大小的反映(评价测验好坏)
标准化学绩或能力测验 0.9以上 人格测验 0.8以上 教师自编学绩测验 0.6以上
信度可以用来解释个人测验分数的意义——测 量标准误(用区间估计来表示真分数的范围)
理论上:用一个测验对一个人测无数次,实测值的标 准差即为标准误
试问: 1)真分数的方差是多少? 2)各种信度的误差是多少?
分析结果
信度类型 重测复本
rXX 0.70
分半信度 0.80
两者之差
误差源 时间、内容
内容取样
时间取样
误差的方差
1-0.70=0.3 1-0.80=0.2 0.3-0.2=0.1
评分者信度 0.92
总误差方差 真分数方差
评分者差异
1- 0.92=0.08 0.2+0.1+0.08=0.38 1-0.38=0.62
造作上:用一组被试两次施测的结果之间的差异来表 示,差异的分布为标准误
SE SX 1 rXX
例题
某智力测验的信度为0.95,标准差为15,某儿 童得分为120分,试估计真分数的范围。
SE=3.35 120-1.96*3.35 120+1.96*3.35
信度可以帮助进行不同测验分数的比较(一个人在 不同测验上的得分是否有显著差异)
测验B1
等值稳定性系数
测验A1
合适时距
测验B1
等值性系数
含义
两等值测验 最短时间内 对同组对象 施测结果r
程序
A卷
最 短 时 距
等值
B卷
性
误差
内容 取样
评价
优点
代表性增强,信度更准 避免练习、记忆效应
不足
编制复本难 影响积极性
触类旁通 顺序效应
等值稳定性系数
含义
两等值测验 一定时间内 对同组对象 施测结果r
一致性百分比法
(两次测验合格人数+两次测验不合格人数)/测验总人数
第三节 提高测验信度的方法
一、影响测量信度的因素
典型测验的信度高低水平
测验类型
成套成就测验 学术能力测验 成套倾向性测验 客观人格测验
兴趣问卷 态度量表
低中
高
.66 .92 .98 .56 .90 .97 .26 .88 .96 .46 .85 .97 .42 .84 .93 .47 .79 .98
各种信度反映的误差来源比较
信度类型
重测信度 等值性系数 等值稳定性系数
不同测验的原始分不能直接比较
转换成相同尺度的标准分数(Z分数或T分数)
求标准误
求Z值
SEd S 2 rXX rYY
Z
Z1 Z2
1* 2 rXX rYY
测验分数的比较与平均数差 异显著性检验是一回事吗?
第二节 信度的估计方法
信度的估计方法
①重测信度:用同一个量表对同一组被试施 测两次结果的一致性程度。
直接解释
信度系数 决定系数
间接解释
rXX
∵ r2XT = ST²/SX² =rXX ∴ rXX为各方差的百分比
rXX=0.90
S2X分为 各S2E和S2T
∵误差源不同 信度估计法不同
间接解释范例
例2-13:设有两平等的创造力测验
(A和B)。现: 1)间隔两月施测100人,其信度为0.70; 2)两卷分半信度校正值为0.80; 3)第2个评分者随机抽50份,信度0.92;
A卷
时间
一
定 时 距
太短 练习效应 记忆效应
太长 身心变化
稳定 性
A卷
评价
优点
省力、省时 测量属性相同 提供随时间变化的资料
不足
时间间隔长短 被试的积极性
适用范围 所测心理特质稳定
运动技能 速度
二、复本信度
两个平行测验测量同一批被试所得结果的一致性 程度。(积差相关)
等值性系数 测验A1
最短时距
三、内部一致性信度
含义
测验 各题间 一致性
题目 一致
性
是否测量 类型 同一特性
同质性 信度
内容 取样
分半 信度
(一)分半信度
将一个测验分成对等两半后,所有被试在这两半 上所得分数的一致性程度。
只能测一次或没有副本的情况下使用 要把题目分成对等的两半(分半的方法不同,结
果不同)
公式
斯皮尔曼 -布朗公式
程序
A卷
一 定 时 距
误差
内容取样 时间
等值性
B卷
稳定性
等值稳定性系数
反映题目间的差别、两次实测时的情境、被试 特质水平方面的差异。
两个测验要具有更高的等值性 测验的时距要根据问题性质和测量目的来定 经费的问题 报告结果时,应报告间隔的时间
等值稳定性系数与重测、等值性系数 谁得估计更严格,为何?
分半信度 同质性信度 评分者信度
误差来源
时间 内容 时间和内容 内容 内容 评分者之间的差异
注意问题
以上方法仅适用于常模参照测验 目标参照测验要以概化理论为基础进行处理
以上方法仅适用于难度测验 速度测验的信度问题
目标参照测验的信度
前期目标预测测验和后期目标检测测验的比较 (第二次达标的人在第一次测试中达标的比例)
二、信度的统计定义
信度是被试团体真分数方差与实得分数方差之rX比X :TX22
T2
2 E
2 X
2 T
2 E
2 X
信度是被试团体真分数与实得分数相关系数的平方:
rXX XX
rXX
2 TX
理论定义
操作定义
信度是一个测验X(A卷)与它的任意一个平行测验 (B卷)的相关系数。
两组测验分数之间的相关
第一节 信度概述
一、信度的定义(reliability)
信度是指测量结果的稳定性程度。(测量结果的可 靠性程度。可信度。)
信度就是测验在测量它所测东西的一致性。或者说, 就是同一测验先后测同一对象时所得分数的一致性。
信度系数是表示测量结果的稳定性程度的指标。记 为:
信度系数r的XX 值域:[0,1]