心理测量的理论基础 2测量的信度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
库德-理查逊公式20( R20) 库德-理查逊公式20(K-R20) 库德-理查逊公式21( R21) 库德-理查逊公式21(K-R21) 只适用于0 只适用于0,1计分的测验。 克朗巴赫α 克朗巴赫α系数( Cronbach α) α) 适用于多重计分的测验。 霍伊特信度(C.Hoyt) 霍伊特信度(C.Hoyt) 将测验总方差分为:人之间的差异,项目之 间的差异,人与项目之间的差异。
重测信度的误差来源: 测验本身:测验所得的特性的本身就不稳 测验本身:测验所得的特性的本身就不稳 定。 受测者:成熟、知识的发展、练习因素、 受测者:成熟、知识的发展、练习因素、 记忆效果。重测的信度会随着时间的增长 而逐渐减小。重测间隔时间不应该超过6 而逐渐减小。重测间隔时间不应该超过6个 月。 偶发因素:记忆错误、情绪波动、健康状 偶发因素:记忆错误、情绪波动、健康状 况、动机等。
只需要施测一次,不需要平行测验,节省 时间和人力。 测验要求醒目的同质行,对于项目异质的 测验,如人格测验就不能使用。
评分者信度( reliability) 评分者信度(scorer reliability) 指的是多个评分者给同一批人的测验进行 评分的一致性程度。 当评分者人数为2 当评分者人数为2时,评分者信度等于两个 评分者给同一批被试的答卷所给分数的相 关系数(积差相关或等级相关)。 当评分者人数多于2 当评分者人数多于2个时,评分者信度可用 肯德尔和谐系数进行估计。其公式为:
复本信度(alternatereliability) 复本信度(alternate-form reliability) 指的是两个平行的测验测量同一批被试所得结果的一致性 程度,其大小等于同一批被试在两个复本测验上所得分数 的皮尔逊积差相关系数。 使用条件: 使用条件: ①要造出2份或2 ①要造出2份或2份以上的真正平行测验,平行测验就是不 同题目测同样的内容而且所测结果的平均值和标准差都相 同的两个测验。Leabharlann Baidu平行测验(或等值测验): 相同数目的项目。 相同的项目表述方式。 相同的项目内容类型。 相同的项目难度水平和范围。 相同的指导语、时限、例题、型式以及测验所有的其他方 面。 ②受测者要有条件接受两个测验,这往往取决于时间、经 费等多方面的问题。
重测信度(testreliability) 重测信度(test-retest reliability) 是指用同一个量表对同一组被试施测两次所得结 果的一致性程度, 果的一致性程度,其大小等于同一组被试在两次 测验上所得分数的皮尔逊积差相关系数。 测验上所得分数的皮尔逊积差相关系数。 使用条件: 使用条件: 所测量的心理特性必须是稳定的。 ①所测量的心理特性必须是稳定的。 遗忘和练习的效果基本上相互抵消。 ②遗忘和练习的效果基本上相互抵消。 在两次施测的间隔时期内, ③在两次施测的间隔时期内,受测者在索要测查 的心理特质方面没有获得更多的学习和训练。 的心理特质方面没有获得更多的学习和训练。 适用于不大受重测影响的测验, 适用于不大受重测影响的测验,如感觉辨别和运 动测验。 动测验。
分半信度(splitreliability) 分半信度(split-half reliability) 指的是将一个测验分成对等两半后,所有被试在两半 上所得分数的一致性程度。有时也称为内部一致性系 数。 分半信度的计算方法和复本信度的计算方法类似,只 不过被试在两半测验上的分的相关系数只是半个测验 的信度,还必须用斯皮尔曼-布朗公式矫正(p151) 的信度,还必须用斯皮尔曼-布朗公式矫正(p151)。 由于将一个测验分成两半的方法很多(如:按题号的 奇偶性分半、按题目的难度分半、或按题目的内容分 半等),所以同一个测验通常会有多个分半信度。 使用条件 ①分半行都通常是在只能施测一次或没有复本的情况 ①分半行都通常是在只能施测一次或没有复本的情况 下使用。 ②在使用斯皮尔曼②在使用斯皮尔曼-布朗公式时要求全体被试在两半 测验上得分的变异数要相等。当一个测验无法分成对 等的两半时,分半信度不宜使用。
分半信度是求内部一致性系数的一种粗略 方法。但因分半方法多种多样,所以结果 不太稳定,因此有人建议:计算所得出可 不太稳定,因此有人建议:计算所得出可 能的分半信度,并用其平均值来作为内部 一致性的估计值。然而这种办法过于麻烦, 一致性的估计值。然而这种办法过于麻烦, 因为所有可能的分半信度的数目是一个天 文数字,计算机都拿它头疼。于是有人依 据此原理推导出了十分方便的库德据此原理推导出了十分方便的库德-查理逊 (Kuder-Richardson)公式和a系数 Kuder-Richardson)公式和a (Cronbach)p153-p154。 Cronbach)p153-p154。
心理测量的理论基础 测量的信度
程 诚
二 测量的信度
信度(reliability) 信度(reliability): 测量结果的稳定性程度。信度这一概念是 测量结果的稳定性程度。信度这一概念是 计算各个分数的测量误差的基础,据此我 们能够预测各个分数受到无关因素或未知 因素的偶然因素的影响而可能发生的波动 范围。 信度与真分数理论的联系: 真分数是不变的,变化的是误差分数,能 够较好的控制误差,就能保证测量观测分 数的稳定性,就能获得较高的信度。
同质性信度( reliability) 同质性信度(homogeneity reliability) 也叫做内部一致性系数,是指测验内部所有 题目间的一致性程度。 题目间的一致性含有两层意思: ①指所有题目都测的是同一种心理特质, ②指所有题目得分之间都具有较高的正相关。 同质性信度就是一个测验所测内容或特质的 同质性信度就是一个测验所测内容或特质的 相同程度。 相同程度。 测量单一特性是同质性高的必要条件,而非 充分条件。同质性高才是测验测得单一特质 的充分条件。
复本信度的误差来源: 主要来源是两种测验是否平行或等值。 受测者同样会受到练习的影响。测验的中 一些同等原理的项目会存在正迁移。例如 推理类的项目。 要在满足两种测验平行和减弱受测者受练 习影响这两个方面的同时,编制平行测验 显得困难重重。 复本信度会受到重测信度的误差和复本信 度的误差的双重影响。 受测者的一些情绪、动机、以及测验情境 的变化也会影响到复本信度。
信度的作用: 信度的作用: 1.信度是测量过程中所存在的随机误差大小 1.信度是测量过程中所存在的随机误差大小 的反应。 2.信度可以用来解释个人测验分数的意义。 2.信度可以用来解释个人测验分数的意义。 3.信度可以帮助进行不同测验分数的比较。 3.信度可以帮助进行不同测验分数的比较。
估计信度的方法 重测信度(testreliability): 重测信度(test-retest reliability): 估计测验中跨时间的一致性 复本信度(alternatereliability): 复本信度(alternate-form reliability): 估计测验中跨形式的一致性 分半信度(splitreliability): 分半信度(split-half reliability): 估计测验中两个分半项目的一致性 同质性信度( reliability) 同质性信度(homogeneity reliability) 估计测验跨项目的一致性 评分者信度( reliability): 评分者信度(scorer reliability): 估计测验跨评分者的一致性
影响信度系数的因素 分数分布范围的影响 测验长度的影响 测验难度的影响 提高信度的方法 1.适当增加测验的题目数量。 1.适当增加测验的题目数量。 2.使测验中所有的试题的难度都接近正态分布,并 2.使测验中所有的试题的难度都接近正态分布,并 控制在中等水平。 3.努力提高测验试题的区分度。 3.努力提高测验试题的区分度。 4.选取适当的受测群体,提高此次测验在各同质性 4.选取适当的受测群体,提高此次测验在各同质性 较强的亚群体上的信度。 5.主测者严格执行实测规程,评分者严格按标准给 5.主测者严格执行实测规程,评分者严格按标准给 分,实测场地按测验手册的要求进行布置,较少无 关因素的干扰。