第九章 信度分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)复本信度
·根据一组被试在两个平行(等值)测验上的得分计算 根据一组被试在两个平行(等值) 根据一组被试在两个平行 的相关数。 的相关数。因为它反映的是两个测验之间的等值程 因此又叫等值性系数。 度,因此又叫等值性系数。 ·采用此法一定要注意: 采用此法一定要注意: 采用此法一定要注意 两个测验必须在项目的内容、形式、数量、难易、 ①两个测验必须在项目的内容、形式、数量、难易、 时限、 时限、指导语等方面相同或相似 ②两次测验的时间间隔要适当 ·复本信度的局限: 复本信度的局限: 复本信度的局限 ①复本法只能减少而不能完全排除练习和记忆的影响 对于许多测验来说, ②对于许多测验来说,建立复本是相对困难的
(四)同质性信度
·同质性也称内部一致性,指的是测验内部所有 同质性也称内部一致性, 同质性也称内部一致性 题目间的一致性。 题目间的一致性。 1、测量同质性的基本公式 库德—理查逊公式 估计测验的信度, 理查逊公式: 2、库德 理查逊公式:估计测验的信度,估 计同质性信度 ·适用于答对一题得分,答错无分 适用于答对一题得分, 适用于答对一题得分 3、克伦巴赫系数 ·适用于项目多重记分的测验 适用于项目多重记分的测验
三、信度系数的应用
(一)评价测验 ·信度系数是衡量测验好坏的一个重要技术指标 信度系数是衡量测验好坏的一个重要技术指标 ·一般能力与成就测验的信度系数常在0.90以上 一般能力与成就测验的信度系数常在0.90 一般能力与成就测验的信度系数常在0.90以上 ·性格、兴趣、态度等人格测验的信度系数通常在0.80性格、 0.80性格 兴趣、态度等人格测验的信度系数通常在0.80 0.85之间 0.85之间 (二)解释分数 1、个人测验分数的误差 ·个人在两次测验中分数的差异就是测量误差,据此可得 个人在两次测验中分数的差异就是测量误差, 个人在两次测验中分数的差异就是测量误差 出一个误差分数的分布, 出一个误差分数的分布,这个分布的标准差就是测量的 标准差,它是测量误差大小的指标。 标准差,它是测量误差大小的指标。 2、两种测验分数的比较 ·来自不同测验的原始分数是无法直接比较的,只有参照 来自不同测验的原始分数是无法直接比较的, 来自不同测验的原始分数是无法直接比较的 同一团体的平均分数, 同一团体的平均分数,将它们转换成相同尺度的标准分 才能进行比较。 数,才能进行比较。
(五)评分者信度
·评分者之间的变异是产生误差的重要原因之一 评分者之间的变异是产生误差的重要原因之一 ·考察评分者信度的方法是随机抽取部分试卷, 考察评分者信度的方法是随机抽取部分试卷, 考察评分者信度的方法是随机抽取部分试卷 由两个或多个评分者独立按评分标准打分, 由两个或多个评分者独立按评分标准打分,然 后求其间的相关。如果是两个评分者, 后求其间的相关。如果是两个评分者,则采用 积差相关或等级相关的方法, 积差相关或等级相关的方法,一般认为结果训 练的成对评分者之间的一致性达到0.90以上, 0.90以上 练的成对评分者之间的一致性达到0.90以上, 评分才是客观的。 评分才是客观的。如果是多个评分者则采用和 谐系数来估计信度。 谐系数来估计信度。
利用SPSS进行信度分析 利用SPSS进行信度分析 SPSS
SPSS中 在SPSS中,专门用来进行测验信度分析的模块为 Scale下的 下的Reliability Analysis。 Scale下的Reliability Analysis。 Cronbach Alpha,Analyze-->Scale-->Reliability Alpha,Analyze-->Scale-->Reliability -->Scale-analysis,statistics选 for下 analysis,statistics选descriptives for下Scale deleted。出结果中,如果Cronbach if item deleted。出结果中,如果Cronbach Alpha>=0.8那么不用删掉任何题项 结果足够好。 那么不用删掉任何题项, Alpha>=0.8那么不用删掉任何题项,结果足够好。如 Alpha<0.8,看指标Alpha 果Cronbach Alpha<0.8,看指标Alpha if item deleted(指如果把对应的题项杀掉,Alpha可提高或 deleted(指如果把对应的题项杀掉,Alpha可提高或 降低为此值),把题项杀掉, Alpha>=0.8, ),把题项杀掉 降低为此值),把题项杀掉,使Alpha>=0.8,便不用 再杀。Alpha值的最低要求>=0.7。 Alpha<0, 值的最低要求>=0.7 再杀。Alpha值的最低要求>=0.7。若Alpha<0,说明 该反转的题项没反转,检查题项,将其反转。 该反转的题项没反转,检查题项,将其反转。
重测信度或再测信度: 重测信度或再测信度: 直接求前后两次问卷回收回来的对应的 相同题项的相关系数,要求: 相同题项的相关系数,要求:显著相关 (p<=0.05)且系数>=0.5, 且系数>=0.5 (p<=0.05)且系数>=0.5,勉强可接受 (p<=0.05)系数>=0.3。 系数>=0.3 (p<=0.05)系数>=0.3。
一评价测验信度系数是衡量测验好坏的一个重要技术指标一般能力与成就测验的信度系数常在090以上性格兴趣态度等人格测验的信度系数通常在080085之间二解释分数1个人测验分数的误差个人在两次测验中分数的差异就是测量误差据此可得出一个误差分数的分布这个分布的标准差就是测量的标准差它是测量误差大小的指标
第九章
·采用此法时应注意以下几个问题: 采用此法时应注意以下几个问题: 采用此法时应注意以下几个问题 ①两次测验的时间间隔要恰当 ②再测法适用于速度测验或人格测验,而 再测法适用于速度测验或人格测验, 不适用于难度测验 ③应注意提高被试的积极性 ·用再测法估计信度的优点:能提供测验结 用再测法估计信度的优点: 用再测法估计信度的优点 果是否随时间而变化的资料, 果是否随时间而变化的资料,可作为预 测被试将来行为的依据。 测被试将来行为的依据。 ·缺点是:易受练习和记忆的影响。 缺点是: 缺点是
信度分析
一、什么是信度
通常把测量结果的可靠性称之 为信度, 为信度,即测量结果的一致性或 可信性程度,在测量学中, 可信性程度,在测量学中,信度 被定义为, 被定义为,一组测量分数的真变 异数与总变异数(实得变异数) 异数与总变异数(实得变异数) 的比率。 的比率。
二、估计信度的方法
(一)再测信度 ·用同一个测验,对同一组被试前后两次施测, 用同一个测验, 用同一个测验 对同一组被试前后两次施测, 两次测验分数所得的相关系数为再测信度 ·因为它能反映两次测验结果有无变动,也就是 因为它能反映两次测验结果有无变动, 因为它能反映两次测验结果有无变动 测验分数的稳定程度, 测验分数的稳定程度,故又称稳定性系数 ·计算再测信度应满足一下几个假设: 计算再测信度应满足一下几个假设: 计的 ②遗忘与练习的效果相同 ③两次施测期间被试的学习效果没有差别
五、信度指标
用信度系数来表示信度的大小。信度系数越大, 用信度系数来表示信度的大小。信度系数越大,表 明测量的可信程度越大。 明测量的可信程度越大。究竟信度系数要多少才算 有高的信度。学者DeVellis(1991)认为,0.60~ DeVellis(1991)认为 有高的信度。学者DeVellis(1991)认为,0.60~ 0.65(最好不要);0.65~0.70(最小可接受值); );0.65 0.65(最好不要);0.65~0.70(最小可接受值); 0.70~0.80(相当好);0.80~0.90(非常好)。 );0.80 0.70~0.80(相当好);0.80~0.90(非常好)。 由此,一份信度系数好的量表或问卷,最好在0.80 由此,一份信度系数好的量表或问卷,最好在0.80 以上,0.70至0.80之间还算是可以接受的范围 之间还算是可以接受的范围; 以上,0.70至0.80之间还算是可以接受的范围;分 量表最好在0.70以上,0.60至0.70之间可以接受 0.70以上 之间可以接受。 量表最好在0.70以上,0.60至0.70之间可以接受。 若分量表的内部一致性系数在0.60 0.60以下或者总量表 若分量表的内部一致性系数在0.60以下或者总量表 的信度系数在0.80以下, 0.80以下 的信度系数在0.80以下,应考虑重新修订量表或增 删题项。 删题项。
四、影响信度的因素
(一)被试的样本 ·团体的异质程度与分类的分布有关,一个团体越 团体的异质程度与分类的分布有关, 团体的异质程度与分类的分布有关 是异质,其分数分布的范围也就越大, 是异质,其分数分布的范围也就越大,信度系数 就越高。 就越高。 ·信度系数不仅受样本团体的异质程度的影响,也 信度系数不仅受样本团体的异质程度的影响, 信度系数不仅受样本团体的异质程度的影响 受样本团体平均水平的影响。 受样本团体平均水平的影响。因为对于不同水平 的团体,项目具有不同的难度,每个项目在难度 的团体,项目具有不同的难度, 上的变化累积起来便会影响信度。 上的变化累积起来便会影响信度。这种影响不能 用统计公式来推估,只能从经验中发现。 用统计公式来推估,只能从经验中发现。
(三)分半信度
实施测验, 按正常的程序 实施测验,然后将全部项目分成 相等的两半, 相等的两半,根据各人在这两半测验的分数计 算其相关系数 斯皮尔曼—布朗校正公式 布朗校正公式, 斯皮尔曼 布朗校正公式,弗朗那根估计信度 公式。 公式。 使用奇偶分半法一定要注意两个问题: 使用奇偶分半法一定要注意两个问题: ①如遇到有牵连的项目或一组解决同一问题的项 目时,这些项目应放在同一半,否则将会高估 目时,这些项目应放在同一半, 信度的值 ②当试卷中存在任选题或试卷为速度测试时不宜 采用分半法
(二)测验的长度 ·一般来说,测验越长,信度值越高。因为: 一般来说, 一般来说 测验越长,信度值越高。因为: 测验加长,可能改进项目取样的代表性, ①测验加长,可能改进项目取样的代表性,从而能更 好地反映受测者的真实水平 测验的项目越多, ②测验的项目越多,在每个项目上的随机误差就可以 互相抵消 (三)测验的难度 ·测验的难度与信度没有直接对应关系,但当测验太难 测验的难度与信度没有直接对应关系, 测验的难度与信度没有直接对应关系 或太易时,则分数的范围就会缩小,从而降低信度。 或太易时,则分数的范围就会缩小,从而降低信度。 显然只有当测验难度水平可以使测验分数的分布分 为最大时,测验的信度才会最高, 为最大时,测验的信度才会最高,通常这个难度水 平为0.50 0.50。 平为0.50。 ·当题目过难时,被试可能凭猜测作答,从而也会降低 当题目过难时, 当题目过难时 被试可能凭猜测作答, 信度。 信度。