第五章 经典测验理论——信度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四、估算信度系数的方法
大多采用克伦巴赫( 大多采用克伦巴赫( Cronbach)系数或 系数来 )系数或α系数来 表示,因为很多测验都是无所谓对错的多选题目, 表示,因为很多测验都是无所谓对错的多选题目, 如人格测验、 如人格测验、态度测验等
有些量表是测量单一心理特质的,比如抑郁量表、 有些量表是测量单一心理特质的,比如抑郁量表、 焦虑量表,可计算全量表的α系数 系数; 焦虑量表,可计算全量表的 系数;有些量表由多 种分量表构成,分别测量不同的心理特质和内容, 种分量表构成,分别测量不同的心理特质和内容, 如16PF、韦氏智力量表,应计算各分量表的 系 、韦氏智力量表,应计算各分量表的α系 无需全量表的。 数,无需全量表的。
四、估算信度系数的方法
在数据达不到这一要求时(方差不齐性) 在数据达不到这一要求时 方差不齐性) 方差不齐性 卢仑/卢龙 卢龙Rulon公式: 公式: 卢仑 卢龙 公式 rXX=1-Sd2/ Sx2 = - 弗朗那根Flanagan公式: 公式: 弗朗那根 公式 rXX=2[1-( -(Sa2+ Sb2)/ Sx2] = -( )
三、估算信度系数的意义
1、信度系数也可反映测量中随机误差的大小 、 2、确定测验是否可以接受 、 rXX=1.00,理想化的 = , 能力和成就测验(最佳行为测验), ),应 能力和成就测验(最佳行为测验),应0.90以上 以上 人格、兴趣、态度(典型行为测验) 人格、兴趣、态度(典型行为测验)应0.80-0.85 - 当rXX<0.70,不能用,或扔,或重编题目 < ,不能用,或扔, 当rXX≥0.70,可用于团体间的比较 , 当rXX≥0.85时,可用于鉴别个人 时 3、可更加精确解释个人分数,在多大程度是可信的 、可更加精确解释个人分数,
四、估算信度系数的方法
b、同质性信度 、 (homogeneity reliability) ) 同质性信度主要反映测验能够测量相同 内容或特质的程度, 内容或特质的程度,或者说所有测验题 目得分之间的一致性。 目得分之间的一致性。
四、估算信度系数的方法
Kuder-Richardson库德-理查森公式,适合 库德-理查森公式, 库德 0、1计分德,就是是非题 计分德, 、 计分德 K-R20 - 当题目难度接近时, 当题目难度接近时,每个项目德通过率应基 本相等, 本相等,我们就不用逐个题目计算通过率 K-R21 - 难度:某题目上, 难度:某题目上,答对人数和总人数的百分比
2、复本信度 平行测验信度 parallel form reliability 对一组被试用两个复本测验( 对一组被试用两个复本测验(平行测 施测,计算积差相关系数, 验)施测,计算积差相关系数,就是复 本信度。 本信度。
ຫໍສະໝຸດ Baidu
四、估算信度系数的方法
复本信度的估计可分为两种情况: 复本信度的估计可分为两种情况: a. 即刻施测或连续施测:其相关系 即刻施测或连续施测: 数大小只反映两个复本测验的题目 差异所带来的变异情况。 差异所带来的变异情况。这种情况 下,复本信度称为等值性系数
四、估算信度系数的方法
4、评分者信度 、 主观题时要考虑评分者信度。 主观题时要考虑评分者信度。 如果是两个评分者, 如果是两个评分者,计算积差或等 级相关系数。 级相关系数。 如果是多个评分者, 如果是多个评分者,需计算 Kendal肯德尔和谐系数 肯德尔和谐系数
五、影响信度的因素
1、被试团体 、 样本团体越异质(差异大), ),信度系数越高 样本团体越异质(差异大),信度系数越高 2、测验的难度 、 太难,被试只能猜测,做随机反应了, 太难,被试只能猜测,做随机反应了,测验 分数主要取决于随机的误差, 分数主要取决于随机的误差,那么信度就趋 尽零,太容易了,分数很接近, 尽零,太容易了,分数很接近,同样会降低 信度,所以通常的难度是中等水平0.5 信度,所以通常的难度是中等水平
分半之后, 分半之后,每半测验的题目只相当于原测验 的1/2,也就是说,样本数少了一半。这样, ,也就是说,样本数少了一半。这样, 测验结果更不稳定(信度偏小,需要修正) 测验结果更不稳定(信度偏小,需要修正) 斯皮尔曼-布朗( 斯皮尔曼-布朗( Spearman-Brown)公 公 式:rXX=2rhh /1+rhh = + Spearman-Brown公式要求:两半测验的 公式要求: 公式要求 方差相等。 方差 检验,方差齐性检验, 方差F检验 方差相等。(方差 检验,方差齐性检验,就 是方差是不是一致) 是方差是不是一致
四、估算信度系数的方法
估计重测信度时,应注意以下几点: 估计重测信度时,应注意以下几点: 重测时间间隔 重测信度应用于不太容易受重复因素影响 的测验, 的测验,所测量的心理特性必须是稳定的 两次实测的间隔期, 两次实测的间隔期,被试所测得的心理特 质方面没有获得过学习和训练 注意提高被试的积极性
四、估算信度系数的方法
五、影响信度的因素
3、测验的长度 、 一般说来,测验题目越多, 一般说来,测验题目越多,就是样本越 测验结果越稳定,信度越大。 多,测验结果越稳定,信度越大。 但实际上编制量表要权衡,题目越大, 但实际上编制量表要权衡,题目越大, 测验越费时,测验成本越大,不经济。 测验越费时,测验成本越大,不经济。 而且,测验越长,被试越疲劳, 而且,测验越长,被试越疲劳,越不愿 合作,也可能降低信度。 合作,也可能降低信度。
四、估算信度系数的方法
b. 间隔一段时期进行第二次施测: 间隔一段时期进行第二次施测: 其相关系数既反映测验形式上的变 也反映时间上的变化, 化,也反映时间上的变化,这种相 关系数称为稳定性与等值性系数。 关系数称为稳定性与等值性系数。 从数值上, 从数值上,稳定性与等值性系数应 既小于稳定性系数, 既小于稳定性系数,又小于等值性 系数。 系数。
四、估算信度系数的方法
3、内部一致性系数 、 a、分半信度:实施一次测验后,将 、分半信度:实施一次测验后, 测验分为等值的两半, 测验分为等值的两半,分别计算被 试在两半测验上的得分, 试在两半测验上的得分,再计算其 相关系数。 相关系数。此相关系数就代表了两 半测验在内容取样上的一致性程度
四、估算信度系数的方法
二、信度的历史
德莫维尔: 德莫维尔:取样误差 皮尔逊: 皮尔逊:积差相关 斯皮尔曼: 两事物间联系的证据及其测量》 斯皮尔曼: 《两事物间联系的证据及其测量》 提出信度理论的大部分概念 桑代克: 桑代克: 第一本心理测量学著作 心理与社会测量理论导论》 《心理与社会测量理论导论》 库德-理查森 库德- 克伦巴赫
测验应有一个合理的长度。 测验应有一个合理的长度。 实际上, 实际上,Spearman-Brown公式的通用 公式的通用 形式是这样的: 形式是这样的: rxx=nrhh /1+( -1)rhh +(n- ) = +( 其中n为测验题目增加或缩减的倍数 为测验题目增加或缩减的倍数, 其中 为测验题目增加或缩减的倍数,rxx 是现有测验的长度。 是现有测验的长度。
四、估算信度系数的方法
1、重测信度(test-retest reliability) 、重测信度( ) 再测信度(稳定性系数) 再测信度(稳定性系数) 用同一测验, 用同一测验,对同一组被试进行前后两次 施测,所得相关系数就叫重测信度。 施测,所得相关系数就叫重测信度。重测 信度反映测验跨时间的稳定性,又称为稳 信度反映测验跨时间的稳定性, 定性系数。 定性系数。 公式: 公式:皮尔逊积差相关
要计算分半信度, 要计算分半信度,首先遇到的问题是 如何分半, 如何分半,直接分成前后两个部分是 不可取的,因为前后量部分项目( 不可取的,因为前后量部分项目(题 在类型和难度上都有所不同, 目)在类型和难度上都有所不同,而 且会受到受练习效应或疲劳等因素的 影响, 影响,通常采用奇偶分半法
四、估算信度系数的方法
一、什么是信度? 什么是信度?
信度( 信度(Reliability)是指测量结果的一致性或 ) 稳定性。 稳定性。信度的大小用信度系数来表示 定义1:一被测团体的真分数变异数(方差) 定义 :一被测团体的真分数变异数(方差) 与观察分数的变异数之比。 与观察分数的变异数之比。 定义2: 定义 :一被测团体的真分数与观察分数的 相关系数的平方。 相关系数的平方。 定义3:一个测验X与其平行测验 的相关 定义 :一个测验 与其平行测验X’的相关 与其平行测验 系数。 系数。
相关文档
最新文档