第三讲 测量的信度与效度(1)

合集下载

信度与效度

信度与效度

一、信度1.定义信度主要是指测量结果的可靠性或一致性。

信度只受随机误差的影响,随机误差越大,信度越低。

因此,信度可以视为测试结果受随机误差影响的程度。

系统误差产生恒定效应,不影响信度。

每一个测试的实得分数(X)总是由真实分数(T)和误差(E)两部分构成的,用公式表示如下:X=T+E如果我们讨论一组测验分数的特性时,可用方差代表具体分数,得到公式:S^2(x)=S^2(t)+S^2(e)公式中,S^2(x)是实得分数的方差,S^2(t)是真分数的方差,S^2(e)是误差的方差在测量理论中,信度被定义为:一组测量分数的真分数方差与中方差(实得方差)的比率。

即:r(xx)=S^2(t)/S^2(x)2.信度的指标大部分情况下,信度是以信度系数为指标,它是一种相关系数。

常常是同一被试样本所得到的两组资料的相关,理论上说就是真分数方差与实得分数方差的比值,公式为:r(xx)=r^2(xt)=S^2(t)/S^2(x)3.信度信度评估的方法(见具体例子)(一)重测信度,又称为稳定性系数,它的计量方法是采用重测法:用同一测验,在不同时间对同一群体施测两次,这两次测量分数的相关系数即为重测系数。

重测信度所考察的误差来源是时间的变化所带来的随机影响。

在评估重测信度时,必须注意重测间隔的时间。

对于人格测验,重测间隔在两周到6个月之间比较合适。

在进行重测信度的评估时,还应注意以下两个重要问题:⑴重测信度一般只反映由随机因素导致的变化,而不反映被试行为的长久变化。

⑵不同的行为受随机误差影响不同。

(二)复本信度,是以两个测验复本来测量同一群体,然后求得应试者在这两个测验上得分的相关系数。

复本信度的高低反映了这两个测验复本在内容上的等值性程度。

两个等值的测验互为复本。

计算复本信度的主要目的在于考察两个测验复本的题目取样或内容取样是否等值。

复本信度也考虑两个复本实施的时间间隔。

复本信度的主要优点在于:⑴能够避免重测信度的一些问题,如记忆效果、练习效应等;⑵适用于进行长期追踪研究或调查某些干涉变量对测验成绩影响;⑶减少了辅导或作弊的可能性。

《信度和效度测量》课件

《信度和效度测量》课件

外部信度是指 测量工具或方 法与其他测量 工具或方法的 相关性,如重 测信度、复本 信度等
效度是指测 量工具能够 准确地测量 出被测对象 的真实水平 的程度
效度包括内 容效度、结 构效度和信 度效度
内容效度是 指测量工具 的内容是否 符合被测对 象的实际需 求
结构效度是 指测量工具 的结构是否 符合被测对 象的实际需 求
目标
市场调研:通 过信度和效度 测量,提高调 研结果的准确
性和可靠性
应用场景:产 品定位、市场 细分、消费者
行为分析等
招聘与选拔:通 过信度和效度的 测量,可以更准 确地评估应聘者 的能力和素质, 提高招聘和选拔
的准确性。
绩效评估:通过 信度和效度的测 量,可以更准确 地评估员工的工 作表现,为绩效 评估提供科学依
预测效度:测量结果是否能预测未来行 为
区分效度:测量结果是否能区分不同群 体
概念:衡量预测变量与实际结 果之间的相关性
优点:简单易行,易于理解
缺点:可能存在偏差,不能完 全反映实际情况
应用:常用于预测市场趋势、 消费者行为等
PART FIVE
信度:测量工具 的稳定性和可靠 性,确保测量结
果的一致性
应用:广泛应用于 社会科学、教育学 等领域
优点:简单易用, 结果直观
PART FOUR
内容效度法是一种测量 效度的方法,用于评估 测量工具的内容是否与 理论或概念相符合。
内容效度法通常通 过专家评审、问卷 调查等方式进行评 估。
内容效度法可以评 估测量工具的覆盖 范围、准确性和代 表性。
内容效度法可以帮 助研究者确定测量 工具是否适合用于 特定的研究目的。
PART THREE
重测信度法的定义:通过在不同时 间对同一组受试者进行相同的测量, 比较测量结果的一致性来评估信度。

测量的信效度

测量的信效度
取若干份试卷,由至少两位受过训练的评分者按计 分规则分别判分,然后计算它们的相关。几个评分 者 的 评 分 越 一 致 , 评 分 者 信 度 越 高 。
评分者信度(Scorer Reliability)

最简单的估计方法就是随机抽取若干份答卷,由两 个独立的评分者打分,再求每份答卷两个评判分数 的相关系数。这种相关系数的计算可以用积差相关 方法,也可以采用斯皮尔曼等级相关方法。 如果评分者在三人以上,而且又采用等级记分时, 就需要用肯德尔和谐系数来求评分者信度。
评分者信度scorerreliability信度系数的类型误差变异的来源计算公式次数所需复本数目重测信度时间取样积差相关系数复本信度连续施测内容取样积差相关系数复本信度间隔施测时间取样内容取样积差相关系数分半信度内容取样积差相关系数需校正常用斯布公式同质性信度内容的异质性系数非二分法评分者信度评分者间的差积差相关系数斯皮尔曼等级相关系数肯德尔和谐系数在一般情况下间隔施测的复本信度最低因为很多因素有机会影响到分数

分半信度的估计

斯皮尔曼-布朗校正公式
rXX 2rx1x 2 1 rx1x 2
rx1x2 表示两半测验分数的相关系数
如果两半测验不等值,亦即两半测验分数没 有相同的平均数和标准差

弗朗那根公式:
r 2(1
S a Sb
2
2
Sx
2
)
Sa2 和Sb2 :两个半测验分数的变异数;Sx2 :测验总分 的变异数。
SX2 = SV2 + SI2 + SE2
SX2 SV2 SI2 SE2
ST2
系统误差的影响

系统误差可能是由以下几方面原因造成的:
1)所要测量的特质有多方面的含义,而量表本身未能

测量量表的信度和效度

测量量表的信度和效度

信度和效度的概念
内容效度
效度
指测量量表的准确性,即量表是否真实 反映所要测量的内容或特质。效度分为 内容效度、结构效度和验证效度。
专家对量表内容的评价,确保量 表内容与测量目的相符合。
信度
指测量量表的可靠性,即多次测量结果 的一致性程度。信度高的量表在相同条 件下重复测量,其结果具有一致性。
结构效度
通过因子分析、相关分析等方法 检验量表的结构是否符检验其一致性程度。
02 信度分析
重测信度法
定义
重测信度法是指在不同时间对同一组被试者进行重复测量,通过 比较两次测量的结果来评估量表的稳定性。
适用范围
适用于评估短期内量表的稳定性,但不适合评估长期内的稳定性。
根据测量目的和范围, 设计量表的框架和题目。
预测 试和 修订
在小范围内预测试量表, 根据反馈进行修订和完
善。
大规 模施 测和 数据 分析
THANKS FOR WATCHING
感谢您的观看
测量量表的信度和效度
contents
目录
• 引言 • 信度分析 • 效度分析 • 信度和效度的关系 • 信度和效度在实践中的应用
01 引言
测量量表的意义
测量量表是评估个体或群体特征的重 要工具,广泛应用于心理学、社会学 、经济学等领域。
通过测量量表,可以对个体的心理状 态、行为特征、能力水平等进行量化 评估,为研究和实践提供客观、准确 的依据。
Cronbach's Alpha系数
定义
适用范围
计算方法
Cronbach's Alpha系数是一种评估量 表内部一致性的方法,通过计算量表 中各项目之间的相关性来评估量表的 可靠性。

测量的信度与效度

测量的信度与效度

信度的评估方法
1 2
重测信度法
通过在不同时间对同一对象进行重复测量,计算 两次测量结果的相关系数,以评估信度。
复本信度法
使用多个测量工具对同一对象进行测量,计算各 测量工具之间的相关系数,以评估信度。
3
内部一致性信度法
通过分析测量工具内部各部分之间的相关性,计 算内部一致性系数(如Cronbach's Alpha系 数),以评估信度。
04 测量误差
随机误差
定义
随机误差是由于一些随机因素引起的测量结果的 不确定性。
特点
随机误差的大小和符号都是随机的,无法预测和 控制。
示例
测量时环境的微小变化、测量仪器的微小波动等 都可能产生随机误差。
系统误差
定义
系统误差是由于测量系统本身存在的误差或测量条件不满足要求 而引起的测量结果偏差。
数据分析方法
数据分析方法的选择和运用,也会对效度产 生影响。
03 信度与效度的关系
信度是效度的必要条件
信度是指测量的一致性,即多次测量结果之间的相符程度。 如果一个测量工具缺乏信度,那么它的测量结果会不稳定, 无法为决策提供可靠依据。因此,信度是效度的必要条件, 没有信度就无法保证效度。
信度的评估方法包括重测信度法、复本信度法、Cronbach's Alpha系数法等,通过这些方法可以评估测量工具的一致性 和稳定性。
效度是信度的充分条件
效度是指测量的准确性和有效性,即测量结果是否真实反映所需测量的内容。如果一个测量工具具有 效度,那么它的测量结果是准确的、有意义的,能够为决策提供可靠依据。因此,效度是信度的充分 条件,有了效度可以进一步确认信度。
效度的评估方法包括内容效度法、结构效度法、验证效度法等,通过这些方法可以评估测量工具的准 确性和有效性。

量表的信度与效度分析计算ppt课件

量表的信度与效度分析计算ppt课件
6
1、稳定性分析 方法: 用“再测信度”来测量稳定性 再测信度:两次测量结果间的相关系数
相关系数越接近 1,表示稳定性越好
7
1、稳定性分析 缺点: 一般应用中很难真正实现(人力、财力、时间) 再测信度的应用有局限性 • 第一次的测量可能会影响到第二次(信度偏高)
• 两次测量间客观的情况可能有变化(信度偏低)
解: m1= m2 =100, m = 100-8 = 92 霍斯提信度
= 2m/(m1 + m2)=2(92)/(100+100)=0.92 π o = 0.92, π e = (0.30)2+(0.45)2+(0.25)2=0.355
B 当两个评分者(或编码员)判断同一现象时, 评价结果是否一致?
方法:计算两个评分者评分之间的相关;或计算两个 编码员编码结果一致的比例,用于评价信度
16
3、等价性分析
• 前一种应用A比较少见(构造等价的量表非 常困难)
• 后一种应用B比较常见,也称为 评分者内在信度
(inter-rater reliability)
将上式中对应两个编码员的数据, 改为同一编码员的两次数据
22
例 在一项少儿电视节目内容分析的编码表中,两个编码员 分别同时独立地将100个少儿节目分配到如下三个类别中:1、 单本剧 2、连续剧 3、系列剧。已知编码不一致的节目 共计8个;这三个类别的节目数分别占30%、45%和25%。试 分别利用霍斯提和史考特公式,评价这两个编码员编码的等 价性。
8
2、内在一致性分析 目的:检验多项目量表中各个项目的一致性
可信的量表的项目必须具有内在一致性
9
2、内在一致性分析 方法之一:折半法
(split-half technique)

实验的效度和信度

实验的效度和信度
• 试验成果:正迁移量没有发生变化。
进一步旳研究
• 吉克相霍利约克(1983)发觉,当被试学习两个 类比故事并亲自描述其相同性(在问题前给出) 时,产生旳正迁移要比只是学习一种大得多。 他们以为,被试学习两个类比故事,然后思索 其相同性能产生好旳内在观念(或用他们话说, 图式),这一观念能自动地用于处理新问题。
• 内部效度高,意味着因变量旳变化由 特定旳自变量引起旳。
• 要使试验具有较高旳内部效度,就必 须控制多种额外变量。
内部效度旳影响原因
• 主试-被试间旳相互作用
– 要求特征和试验者效应
• 统计回归 • 其他影响内部效度旳原因
– 固有旳和习得旳差别 – 被试旳选择偏性 – 被试旳流失 – 本身旳生长和成熟 – 试验程序和控制方式旳不一致 – 测量程度旳变化
• 他们想考察迁移量是否伴随被试加工类比故事 旳方式旳不同而发生变化。
• 试验材料:辐射问题和另一种别旳问题;两个 问题旳类比故事;
• 试验设计:
– ①控制条件:只呈现类比故事而不带任何指导语; – ②告诉被试概述故事而不要为了回忆测验而学习; – ③是否以言语或文字旳形式给出被试这一故事所体
现旳道理和它旳策略本质; – ④把图解和故事一起呈现给被试;
(二)试验旳外部效度及其影响原因
• 试验旳外部效度是指试验成果能够普遍 推论到样本旳总体和其他同类现象中去 旳程度,即试验成果旳普遍代表性和合 用性。
• 以人旳行为为对象所取得旳试验成果, 其推论法往往有相当旳不足。
• 试验旳外部效度主要受下列三方面旳影 响:
1、试验环境旳人为性
• 试验是在控制条件下进行旳,试验环境旳人 为性可能使某些试验成果难以用来解释日常 生活中旳行为现象。

心理测量-信度与效度

心理测量-信度与效度

被评者
公式中 K=3(评定者数)
一二三四五六
N=6(被评者数)
评A 4 1 3 5 2 6 定 者B 2 3 4 5 1 6
C325416
R 9 6 ...18 10.5 6
R 9 6 12 14 4 18
R R 2 9 10.52 (6 10.5)2 ... 1810.52 135.5
五、测量的标准误差
X T E
2 X
2 T
2 E
1
2 T 2 X
2 E 2 X
1
X1X2
2 E 2 X
2 E
2 X
(1
X1X
2
)
E X 1 X1X2 E称为测量的标准误差
(一)速度测验的信度
没有完成测验的人数的百分比,可以作为 判断一个测验是否是速度测验的依据。但要视具 体情况而定。
(二)确定内容效度的方法
1、专家判断法
要件:定义好的总体、划分好细目表、确定 好每个题目要测验的内容与技能、准确的评 定量表
2、相关法
两个独立取样的测验复本去测同一组被试, 如果相关高,一般可以认为具有高效度,但也 有可能是同时偏向某个方向造成虚假效度。如 果相关低,至少有一个是低内容效度的。
3、再测法
一般来说,纯速度测验几乎不考虑难度因 素,但如果难度与速度测验混在一起,就更难处 理了。
纯速度测验可用复本法和再测法,指标是 两次回答完题目的数量。
如果速度和难度混在一起,就将时间分为 四等份,在每个时间点上要被试作记号, 然后将一四时间段的题目合并,二三时间 段的题目合并,再用分半相关法计算信度。
度。如编制的量表
3、准则关联效度(criterion-related validity)预测效度、实证效度

第三讲 信度

第三讲    信度

例题
10名被试在一个有10个条目的测验中得分如下,求 该测验的分半信度?
测验题目得分 被试 1 2 3 4 5 6 7 8 9 10 单号 双号 得分 得分 单双 之差
1பைடு நூலகம்
2 3
2
2 2
2
1 2
2
1 2
1
2 2
2
1 1
2
0 2
1
0 1
0
1 1
0
0 1
1
0 1
7
4 7
6
4 8
1
0 -1
4
5 6 7 8 9 10
SE S x 1 xx
SE:测量的标准误 rxx:测验的信度系数 SX :所得分数的标准差
可见,测量的标准误与信度呈负相关。
第二节 信度评估的方法
一、重测信度
再测信度 稳定性系数
第 三 讲 测 验 的 信 度
使用同一测验,在同样条件下对同一组被试 前后施测两次测验,求两次得分间的相关系数。
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
例题
A、B两位教师给6篇作文评分,结果如下, 试求两位教师评分一致性的程度。 作 文 1 2 3 4 5 6
教师A
教师B
25
22
30
26
27
23
20
20
28
25
32
35
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
几种信度相应误差(变异)的来源
信度类型 误差(变异)来源 重测信度 时间误差 复本信度(连续施测) 内容误差 复本信度(间隔施测) 时间、内容误差 分半信度 内容(项目)误差 同质信度 项目异质误差 评分者信度 评分者间误差

信度和效度 ppt课件

信度和效度 ppt课件
12
比如:我们为了探讨婚姻满意度与其他变量之间 的关系,建构了一个理论假设:婚姻满意度与婚 姻忠诚度有关,即婚姻满意度较高的人其婚姻忠 诚度也较高。如果我们用“你有没有欺骗对方的 情形”作为婚姻忠诚度的一个测量指标,而且测 量的结果与理论假设一致,即婚姻忠诚度与婚姻 满意度之间具有较强的逻辑联系,则婚姻忠诚度 这一测量指标就有较高的建构效度。但是,如果 研究显示,对婚姻满意的和对婚姻不满意的夫妻 都有欺骗对方的情形,那么,用婚姻忠诚度这一 指标来测量婚姻满意度的建构效度就有待商榷了。
9
(2)标准效度。也称小标度或标准关联效度。是指以某次测量的 结果为标准,来评价与之相关的另一测量的有效性。例如,评价 汽车驾校笔试成绩的效度,要看考生毕业后的实际驾车技术(如 事故发生率),如果这两个测量之间的相关性较高(比如,考生 在驾校的笔试成绩较高,其毕业后的驾车技术也较好),说明该 汽车驾校的笔试成绩是有效的,反之,就说明该驾校的笔试成绩 的有效性值得怀疑。这里,考生的实际驾车技术就是评价其笔试 成绩效度的标准。
关系数,就可以得出所调查问题的信度。
5
(3)折半信度。复本信度,复查信度的共同特点都是必 须进过两次调查才能检验其信度,在调查只实施一次的 情况下,通常采用折半法估计测量的信度。即将调查的 所有问题按性质、难度编好单双数,在单数题目的回答 结果与双数题目的回答结果之间求相关,这一相关系数 就叫做折半信度。这里必须注意的是,由于问卷是按折 半拟出的,因而问卷题目只是原来的一半。由于长度减 少会降低信度,因此,必须根据以下加以校正放大: r系=2数rn。/1比+r如n。,其应中用r是折修半正法后求的得信录度用,人r员n是时折进半行求考得试的的相成关 绩和录取后工作能力的相关系数为0.7,代入上述公式 r=2×0.7/1+0.7=0.82,这里求出的0.82就是根据公式放大 的相关系数。一般说来,社会调查的信度高达0.8以上, 才能认为调查是较为可靠的。

量表的信度和效度分析计算

量表的信度和效度分析计算

2、效标效度旳举例
• 用高考旳成绩,作为预测学生大学期间学业成绩旳效标
(是否有研究成果表白,这两者之间是有亲密有关关系旳)
• 设计测量人们当代化观念旳量表时,媒介接触行为可 能是主要旳效标之一
(极难设想不看报、不听广播旳人会具有当代化旳观念)
可考虑以媒介接触频度、时间、内容等为详细旳效标
2、效标效度旳举例
• 信度高时效度不一定高 • 但效度高时信度一定高
三、信度评价
从三个方面来分析测量旳信度
• 稳定性 (stability) • 内在一致性 (internal consistency) • 等价性 (equivalency)
1、稳定性分析 也叫做测验--再测验法
目旳: 考察对于一样旳问答题(或测试) 对同一组被访者或受测试者 前后两次测量旳成果是否基本一致
0.81387 0.71011 0.68234 0.64671 0.74905 0.77368 0.56495 0.36928 0.57227 0.51867 0.84701
0.79518
有效 累计有 程度 效程度
25.9% 25.9%
16.0% 41.9% 11.7% 53.6%
3、构造效度---项目分析法 (难易度) 量表中各个题项旳“难易度”和“鉴别度”
量表旳信度与效度计算分析
一、信度(reliability)定义
若反复进行测量,产生相同成果旳精确程度 测量旳可靠性、稳定性和预测性 测量旳精确度
• 反复测量成果旳稳定性或一致性可能很高 • 但却可能是不精确旳
用零点没有调整在中心旳秤来测量重量 采用有明显导向性旳问答题构成旳量表测量态度
二、效度(validity)定义
Байду номын сангаас

测量的信度与效度

测量的信度与效度
第三章 测量的信度与效度
第一节 测量的信度 第二节 测量的效度
第一节 信度(reliability)
一、什么是信度 定义:指的是测量结果的稳定性程度(或叫可靠性)。也指 同一被试在不同时间内用同一测验(或用另一套相等的测验) 重复测量,所得结果的一致程度。 1、理论定义:传统的信度理论认为,每一个测验的实得分 数(X)总是由真实分数(T)和误差(E),两个部份构成 的,公式为: X=T+E 讨论一组测验分数的特性时,可用方差导标具体分数,公式: (测验实得分数的方差)S x2= (测验真分数的方差)ST2+ (测验误差的方差)SE2
4、注意的问题:
(1)如遇到有牵连的项目或一组解决同一 问题的项目时,这些项目应放在同一半, 否则将会高估信度的值。 (2)当试卷中存在选题或试卷为速度测验 时,不宜采用分半法。
作业:
1、用某量表测验14名学生,得分记为X.为了考察测量结 果的可靠性,于16天后用原量表对这14名学生再测一次, 得人记为Y,如表中所示,问测验结果是否可靠?
(四)比较不同测验分数的差异:测量标 准误和测验信度在评价两个不同测验的分 数是否有明显差异时也非常重要。这种比 较包括两个人不同分数的差别和同一被试 在两个测验上的差别。
例题:某被试在韦氏成人智力测验中言语智商为 102,操作智商为108。已知两个分数都是以100 为平均数,15为标准差的标准分数。假设言语测 验和操作测验的分半信度分别为0.97和0.93。问 其操作智商是否显著高于言语智商呢? 首先计算出差异分数的标准误: 在统计上,经常要求两个分数的差异程度达到 0.05的显著水平,才能承认不是 误差的影响。因此,将差异标准误(4.74)乘以 1.96,结果为9.29,这表明个体在韦氏测验两半 得分的差异高于大约10分,才能达到0.05显著水 平。上述被试的分数差异(108-102=6)是不显 著的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 被试特征
• 单个被试:身心健康状况;应试动机;作答 态度;耐心 • 团体被试:内部水平的离散程度以及团体的 平均水平
• 当团体异质,信度值会偏大 • 当团体内部水平相差不大,则信度值会偏小
• 主试者
• 施测者 • 问卷评分者
• 施测情境 • 测量工具
• 测量工具是否性能稳定
• 两次施测的间隔时间
第三章 测量的信度(1)
测量的信度
• • • • 测量信度的概念及作用 信度的估计方法 影响信度的主要因素 提高信度的常用方法
一、测量信度的概念及作用
• 信度是指调查中所运用的手段和取得资 料的可靠性或真实性。指的是工具本身 的可靠程度,以及反映调查对象实际情 况的可靠程度。 • 测量结果的稳定性程度
• 信度估计的用途
• 判断由某测量工具得到的结果是否具有意义 • 反映测量过程中所存在的随机误差大小 • 用于解释个人测验分数的意义,即通过区间 估计的办法指出测量的精度
真实分数=观察分数×信度系数
二、信度的计算
• 同质性信度
• 测验内部所有题目间的一致性程度,也称为 内部一致性系数
• 所有题目测的同一内容 • 所有题目得分之间都具有较高的正相关
• 调查手段或工具的信度 • 所得资料的信度
• 信度系数
• ——信度的范围,介于0与1之间 • 越接近1越好 • 信度系数就是在测量对同一变量做两次测量 之间的相关,即通过描述两次测量之间的关 系来实现。
• 对信度的其他定义
• 定义1:被测团体的真分数的变异数与实际 分数的变异数之比 • 定义2:一个被试团体的真分数与实得分数 的相关系数的平方 • 定义3:一个测验X(A卷)与它的任意一个 “平行测验”X`(B卷)的相关系数
• 重测信度
• 用同一个量表对同一组被试施测两次所得的 结果的一致性程度,其大小等于在两次测验 上所得分数的皮尔逊积差相关系数 • 使用前提
• 所测量的事物必须是稳定的 • 遗忘和练习的效果基本上相互抵消
• 复本信度
• 两个平行的测验测量同一批被试所得结果的 一致性程度
• 如果两个复本连续施测,则称为等值信系数; • 如果测验相距一段时间分两次施测,则称为稳定 性与等值性系数。一般来说,这是对信度最严格 的检验,其值也最低
四、提高测量信度的常用方法
• 适当增加测验的长度
• 项目数太少会降低测量的信度 • 增加与原测验中项目具有较好的同质性的项 目,可以增大测验长度 • 注意点
• 新增项目必须与原有项目同质 • 新增项目的数量必须适度
• 使测验中所有试题的难度分布接近正态 分布,并控制在中等水平
• 这会使标准差较大,从而提高信度
• 努力提高测验项目的区分度
• 选取恰当的被试或被试团体 • 主试者严格执行实测规程;评分者严格 按标准给分,实测场地按测验手册的要 求布置,减少无关因素的干扰
• 使用前提
• 构造出两份平行的测验 • 被试有条件接受两评分的 一致性程度
• 当评分者为2人,评分者信度可用两个评分者所 给分数的相关系数表示 • 当评分者多于2人时,可用肯德尔和谐系数进行 估计
三、影响测量信度的方法
• 信度系数依赖于场合、测验形式和评分 员三者的共同作用。 • 通常信度在0.9以上才能算是好的测验。 • 测验信度达到0.6以上才能被接受。
• 内部一致性的计算方法
分半信度 递增信度
• 折半法(奇偶法)——分半信度 • 将一个测验分成对等的两半后,所有被试 在这两半上所得分数的一致性程度,也可 称为内部一致性系数 • 使用前提
• 只能施测一次或没有复本的情况下使用 • 两半测验上的得分的变异数相等
• 分半方法:奇偶性分半;题目难度分半; 题目内容分半 • 缺点:题目较少的情况下,无法表现整体 的测验结果
• 递增信度
• 10题目,先求第1题和第2题之间的相关情况, 然后再求第1、第2题与第3题之间的相关, 依次类推 • 缺点:求得的是项目之间的相关而非整个测 验的信度。 • 题目越多,可信度越高
• 克劳伯克系数(Cronbach alpha):每个题 目有3个以上备选答案,根据项目内部一致性, 由长度调整估计测验的信度系数。 • 库德-理查森系数:适合于只有“是”、“非” 两个答案的测验的检验
相关文档
最新文档