第三讲 测验的信度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(三)解释个人分数的意义 其一是估计真实分数的范围; 其二是了解实得分数再测时可能的变化情形。 这就是测量标准误的应用。
结合p353公式和事例讲解
(四) 比较不同测验分数的差异
信度在评价两个不同测验的分数是否有明显差异时起着非常 重要的作用。
两个不同测验的分数: ①两个人不同分数的差别 ②同一被试在两个测验上的差别。 这就是差异分数的标准误问题 计算公式:
当多个评分者评定多个对象,并以等级法记分时,可 采用肯德尔和谐系数作为评分者信度的估计。
三、信度的意义(信度与测验分数的解释) (一)解释真实分数与实得分数的相关 (二)确定信度可以接受的水平 (三)解释个人分数的意义 (四)比较不同测验分数的差异
(一)解释真实分数与实得分数的相关 信度系数可以解释为总的方差中有多少比例是 由真实分数的方差决定的,也就是测验的总变异 (总方差)中真分数造成的变异占百分之几。 例如, rxx =0.90时,即实得分数中有90%
(四)同质性信度(homogeneity reliability)
重测信度和复本信度主要是考察测验跨时间 的一致性(稳定性)和跨形式的一致性 (等值性)。内部一致性信度系数主要反 应的是题目之间的关系,表示测验能够测 量相同内容或特质的程度。 如,EPQ人格测验的各项目之间的同质程 度。
同质性信度(homogeneity reliability) 1.同质性信度的概念:同质性信度又称内部一致性信 度。指测验的所有题目间性质的一致性,即测得是 同一种心理特质或行为。 2.采集数据的方法:施测一次测验,算出所有测题的 得分,求出各题目间的相关。 当各个测题的得分有较高的正相关时,不论题目 的内容和形式如何,则测验为同质的。相反,即使 所有题目看起来好象测量同一特质,但相关很低或 为负相关时,则测验为异质的。 3.最常看到的同质信度是克伦巴赫(Cronbach)a 系数。
(一)重测信度(test-retest reliability)
1.重测信度概念,也称稳定性系数,主要针对时 间变量。 2.采集数据的方法:对同一组被试间隔一定的时 间重复测试一次,求两次得分间的相关系数。
3.时间间隔的确定:一般为2~4周,最好不要超 过6个月。
(二)复本信度
1.复本信度概念,也称等值性系数,误差来源是题目 取样偏差。(A本与B本) 2.数据收集的方法:被试施测两个内容等值但题目不 同的测验,求两次得分间的相关系数。在计算复本 信度时,应该有半数的被试先作A本再作B本,另一 半被试先作B本再作A本,由此可以抵消施测顺序的 效应。
影响信度的因素
(一) 样本特征 1.样本团体异质性的影响 团体异质程度(水平差异程度)与分数的分布有关,一个团体越异质, 其分数分布的范围也就越大,信度系数也就越高. 2.样本团体平均能力水平的影响
(二) 测验长度
测验的长度,即测验的数量,也是影响信度的一个因素.
1.测验越长测题取样或内容取样越有代表性。 如:题目范围广泛. 2.测验越长被试的猜测因素影响就越小。即题目上 的随机误差会相互抵消. 注意点:测验的长度也要适度(引起被试的疲劳和反 感也会降低信度). 通过增加题目提高信度的方法(参考p355): 计算公式:k=rkk(1-rxx) ∕rxx(1-rkk) 注:k为改变后的量表长度与原来长度之比 rxx为原测验的信度;rkk为欲提高测验信度。
SEd =S
2-rXX -ryy
Baidu Nhomakorabea
注:S 代表两个测验使用的标准差 rxx与ryy代表两个测验的分半信度
※统计学上,一般要求两个分数的差异程度达到0.05的显著水平,才能
承认不是误差的影响。
即,两个测验的得分差异高于SEd×1.96,才能达到0.05 显著水平(参考p353) 。

(一) 样本特征 (二) 测验长度 (三) 测验难度 (四) 时间间隔
第一,实得分数(X)是真实分数(T)和误差(E)之和。
X=T+E 第二, X=T+E转换为方差表示: S2X= S2T+ S2E
第三,信度被定义为:一组测量分数的真分数方差与 总方差(实得分数的方差)的比率。
rxx= S2T/S2X
第四,真实分数的转换: S2T= S2X- S2E 第五,
rxx= 1-S2E/S2X
的变异是真实分数造成的,误差造成的只占 10%。 rxx =1时,表示没有测量误差。 值得注意的是,信度系数的分布是 0.00~1.00的正数范围,表示信度缺乏~ 完全可信。
(二) 确定信度可以接受的水平(参考p352) 1.当rxx<0.70时,测验不能用于对个人作 出评价或预测,而且不能作团体比较; 当0.70≤rxx<0.85时,可用于团体比较; 当rxx≥0.85时,才能用来鉴别或预测个 人成绩或作为。 2.新编的测验信度应过于原有的同类测验 或相似测验.
(五)评分者信度(scorer reliability)
1.评分者信度的概念:用于测量不同评分者之间的误差。
2.采集数据的方法:主要他评量表。随机抽取若干份测验卷, 由两位评分者按评分标准分别给分,然后再根据每份测验 卷的两个分数计算相关,即得评分者信度。 一般要求在成对的受过训练的评分者之间平均一致性 达0.90以上,才认为评分是客观的。
(二)信度的指标 信度的指标通常3种表示方法 1.信度系数 信度是以信度系数为指标,是一种相关系数.常 常是同一被试样本所得的两组资料的相关,即真 实分数方差与实得分数的方差的比值. rXX=r2XT=S2T/S2X
2.信度指数 信度指数(rXT)是真分数标准差与实得分数标准差 的比值。 rXT=ST/SX
信度指数(rXT)的平方就是信度系数r2XT。
3.测量标准误 测量误差分布的标准差,即为测量的标准误。 公式为:
SE=S X 1 -rXX
注:SE为测量的标准误, SX是所得分数的标准差, rxx为测验的信度系数
测量的标准误越小,信度越高,反之亦然.

信度评估的方法
(一) 重测信度 (二) 复本信度 (三) 分半信度 (四)内部一致性信度 (五) 评分者信度
(三) 测验难度 难度与信度不存在简单的对应关系。如果 因为难度过大或过小,造成分数范围缩小, 可使信度降低。
(四) 时间间隔 再测法求信度,间隔时间越短信度系数越 大;间隔时间越久,信度系数越低。
第三讲 测验的信度
主要内容 一 二 三 四 信度的概念 信度评估的方法 信度的意义 影响信度的因素

信度的概念
(一) 信度的定义 信度是指同一被试在不同时间内用同一测 验(或用另一套相等的测验)重复测量, 所得结果的一致程度,即一个测验的稳定 性、一致性。 在测量理论中,信度被定义为:一组测量 分数的真分数方差与总方差(实得分数的 方差)的比率。
3.重测复本信度:在不同的时间里施测两个等值的测 验(复本),得到的相关就是重测复本信度,也称 稳定等值系数。
(三)分半信度(split-half reliability)
1.分半信度及计算:在测验实施后将测验按 奇、偶数分为等值的两半,并分别计算每 位被试在两半测验上的得分,求出这两半 分数的相关系数。 2.分半法经常会低估信度,必须修正,借以 估计整个测验的信度。 分半信度的校正公式:rxx=2rhh/(1+rhh) 注: rxx 为测验在原长度时的相关系数 rhh为一半分数的相关系数
相关文档
最新文档