研究工具性能的测定

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

重测信度
R值越大说明测量工具稳定,被试的 值越大说明测量工具稳定, 值越大说明测量工具稳定 特质受被试的状态和环境变化的影响 较小。 较小。 短期内使用较好。 短期内使用较好。 例如:睡眠质量受工作压力、 例如:睡眠质量受工作压力、家庭事 件、环境等因素影响 自尊量表》 《自尊量表》?
重测信度法具体方法如下: 重测信度法具体方法如下结果 两个平行的测验测量同一批被试所得结果 平行 的一致性程度。 的一致性程度。 复本测验必须在题目内容、数量、形式、 复本测验必须在题目内容、数量、形式、 难度、区分度、指导语、时限、 难度、区分度、指导语、时限、以及所用 的例题、 的例题、公式和测验等其他方面都相同或 相似。 相似。 记忆效应小,但迁移效应大、顺序效应大。 记忆效应小,但迁移效应大、顺序效应大。 常用于方法学研究与教育方面: 常用于方法学研究与教育方面:如学生对 知识的掌握情况。 知识的掌握情况。
克朗巴哈a 克朗巴哈a系数评价举例
例13 对50位研究生进行健康状况抽查。调查问卷设计 50位研究生进行健康状况抽查。调查问卷设计 了如下7 了如下7个问题。 X1---对自己健康的满意程度 X1---对自己健康的满意程度 X2---是否注意调养身体 X2---是否注意调养身体 X3---身体有不适或不舒服感觉 X3---身体有不适或不舒服感觉 X4---有生病的感觉 X4---有生病的感觉 X5---有紧张情绪和压力感 X5---有紧张情绪和压力感 X6---晚间休息感到不能很快入睡 X6---晚间休息感到不能很快入睡 X7---吃饭有时觉得胃口不好 X7---吃饭有时觉得胃口不好 每个问题的回答从好到差按4个等级记分(分别赋值1 每个问题的回答从好到差按4个等级记分(分别赋值1、 2、3、4)。调查结果如表2,试计算克朗巴哈a系数。 )。调查结果如表2,试计算克朗巴哈a系数。
折半信度注意事项
需要测验项目的奇偶项的难度, 需要测验项目的奇偶项的难度,内容 等特征相似, 等特征相似,并不是所有的测验都能 计算折半信度。 计算折半信度。 整个问卷的信度不是在折半信度上乘 就可以了, 以2就可以了,而需要采用校正公式来 就可以了 求的。 求的。 Spearman-Brown公式: 公式: 公式 rxx=2rhh/(1+rhh) (
5、评分者信度
评分者信度是指不同评分者对同一批 人的答卷进行评定时的一致性程度。 人的答卷进行评定时的一致性程度。 评分者信度 (interrater reliability)是 是 在测量工具的标准化程度较低的情况 下,不同评分者的评分标准也会影响 到测量的信度。 到测量的信度。 常用与观察法测量对象时。例如: 常用与观察法测量对象时。例如:护 理技能操作考试采用的评分表
折半信度
可了解测验的内部一致性, 可了解测验的内部一致性,也叫内部 内部一致性 一致性系数。 一致性系数。 如何分成对等的两半: 如何分成对等的两半:可按题号的奇 偶性、题目的难度、题目的内容、 偶性、题目的难度、题目的内容、前 后顺序分半。 后顺序分半。 题目多,题分少,比较均匀时分半。 题目多,题分少,比较均匀时分半。
信度系数
大部分信度指标都以相关系数( 来表示 来表示, 大部分信度指标都以相关系数 r )来表示, 即用同一样本所得到的两组资料的相关系数 作为测量一致性的指标,称为信度系数 称为信度系数。 作为测量一致性的指标 称为信度系数。 它在所测对象实得分数的差异中有多大的 比例是由测量对象本身的差别决定的, 比例是由测量对象本身的差别决定的,信度 系数高表明测量的一致性程度高,测量的误差 系数高表明测量的一致性程度高 测量的误差 少一般来说 r ≥ 0.70就可认为该测量是达到 就可认为该测量是达到 了足够的信度. 了足够的信度
①选择样本总数1/10的重测对象,先进行第一次测试。 ②隔一段时间(间隔以可能忘却上次测验内容为宜)以后进行重测。 ③然后计算两次测试结果的相关系数。如用领导潜能量表测量10名护理人 员,一周后再次测评,两次测试结果如表2所示,计算其重测信度。
表2 领导潜能量表重测结果 研究对象
1 2 3 4 5 6 7 8 9
4、内部一致性信度
内部一致性信度 (internal consistent reliability) ) 内部一致性信度是目前比较流行而且 效果较好的信度评定方法, 效果较好的信度评定方法,它从测量 构思层次化入手, 构思层次化入手,使测量项目形成一 定的内部结构, 定的内部结构,并以内部结构的一致 性程度,对测量信度作出评定。 性程度,对测量信度作出评定。
小结
在计算量表的信度时, 在计算量表的信度时,应首先用随机抽样的方法 选择样本量的1/10 或者至少10 20例 1/10, 10~ 选择样本量的1/10,或者至少10~20例样本进行 量表的信度测定。对于一个公认的好量表信度值 量表的信度测定。对于一个公认的好量表信度值 0.80,而对于一个新发展的量表, 至少应达到 0.80,而对于一个新发展的量表,信 度0.70即可接受。 0.70即可接受。 即可接受 任何一个量表在应用前均应作信度的测定, 任何一个量表在应用前均应作信度的测定,当信 度不够理想时,则需要对量表进行完善和修改。 度不够理想时,则需要对量表进行完善和修改。 介绍量表时, 介绍量表时,最重要的是要报告出量表信度计算 方法和信度值,以使同行判断量表的性能, 方法和信度值,以使同行判断量表的性能,并根 据自己研究的内容和特点进行选用。 据自己研究的内容和特点进行选用。
2、复本信度
复本信度(Alternate-forms Reliability): 复本信度 : 复本是相对于原本而言的,它使原本的复制 复本是相对于原本而言的 它使原本的复制 对一项调查的问题,让被调查者接受问 品,对一项调查的问题 让被调查者接受问 卷测量, 卷测量,并同时接受这份问卷的复本的调 然后根据调查结果计算其相关系数, 查,然后根据调查结果计算其相关系数,就 然后根据调查结果计算其相关系数 得出了复本信度, 得出了复本信度,复本信度类似于考试的 A,B卷,它是根据同一目的编制出两套测 卷 量工具一测验同一主题现象。 量工具一测验同一主题现象。
影响信度的因素
被试方面 主试方面 施测的情境方面 测量工具方面 测量时间间隔问题
提高测量信度的方法
增加测量长度 选取同质群体 严格评判标准 作答时间宽裕 控制误差:环境因素等 控制误差: 当然,编制一份信度高的问卷, 当然,编制一份信度高的问卷, 更关键在于问卷的内容合理。 更关键在于问卷的内容合理。
k 2 ∑s i k α= 1 − i =1 2 k −1 sT
表示量表中的项目( K—表示量表中的项目(题目)总数 表示量表中的项目 题目) 表示所有被试对象在第i Si2——表示所有被试对象在第i项目上得分的方 差 ST2——表示所有被试分数的方差 1, i= 1,2,3,·· ·· ··,k ,
信度的计算类型
信度通常以相关系数表示, 信度通常以相关系数表示,由于测量 中误差变异的来源有所不同,所以, 中误差变异的来源有所不同,所以, 各种信度系数分别说明信度的不同层 面而具有不同的意义。 面而具有不同的意义。人们一般是从 不同方面来检查和评估调查资料的信 在实际应用中,信度 信度(也可以说是信 度,在实际应用中 信度 也可以说是信 度系数)有如下类型 有如下类型: 度系数 有如下类型:
3、折半信度
折半信度( 折半信度 Split-half Reliability):在 : 无复本且不准备重测的情况下, 无复本且不准备重测的情况下,通常 采用折半法一估计信度, 采用折半法一估计信度,折半法是将 调查来的结果按题目的单双分成两半 计分, 计分,再根据各个人的这两部分的总 分计算其相关系数,就得到折半信度。 分计算其相关系数,就得到折半信度。
研究工具性能的测定
护理系 李鸿艳
教学目标
掌握信度的概念。 掌握信度的概念。 熟悉计算信度的方法。 熟悉计算信度的方法。 掌握效度的概念。 掌握效度的概念。 熟悉测量效度的方法。 熟悉测量效度的方法。 了解国外量表的翻译步骤。 了解国外量表的翻译步骤。
一、信度
信度(Reliability)是指测量数据 资料 是指测量数据(资料 信度 是指测量数据 资料) 可靠性程度 即测量工具能否稳定 程度,即测量工具能否稳定地 的可靠性程度 即测量工具能否稳定地 测量到它要测量的事项的程度. 测量到它要测量的事项的程度 信度是指同一或相似母体工具重复进 行调查或测验,其所得结果间的一致性 其所得结果 行调查或测验 其所得结果间的一致性 的程度. 的程度 信度的特征:稳定性、内在一致性、 信度的特征:稳定性、内在一致性、 等同性。 等同性。
内部一致性信度
内部一致性信度主要有两种:库德 内部一致性信度主要有两种:库德— 理查森的公式20(简称KR20)和克 理查森的公式 (简称 ) 劳伯克( 系数。 劳伯克(Cronbach)的α系数。 ) 系数 Cronbach’α系数是目前应用最广泛的 系数是目前应用最广泛的 信度指标。 信度指标。 两者测量所有项目间的平均相关程度 同质性信度) (同质性信度) 。
内部一致性
组成研究工具的各项目之间的同质性或内 在相关性,内在相关性越大或同质性越好, 在相关性,内在相关性越大或同质性越好, 说明组成研究工具的各项目都在一致地测 量同一个问题或指标,内部一致性越好, 量同一个问题或指标,内部一致性越好, 信度越高。 信度越高。
优点为应用方便,且最大程度地克服了重测所带来的 优点为应用方便, 一系列问题。 一系列问题。 局限性在于由于折半方法很多,不同折半方法可以得 局限性在于由于折半方法很多, 到不同的信度值, 到不同的信度值,研究者可能会不断改变折半方法以 期得到较高的信度值。 期得到较高的信度值。
复本信度注意事项
两测验必须平行(内容一致、 两测验必须平行(内容一致、平均分 标准差一致) 标准差一致) 信度高可直接下结论, 信度高可直接下结论,但信度低则不 可能是其中一个测验信度低。 然,可能是其中一个测验信度低。 消除顺序效应:一半人先A卷后做 卷后做B卷 消除顺序效应:一半人先 卷后做 卷, 另一半人相反。 另一半人相反。
克朗巴哈α系数(Chronbach‘ 克朗巴哈α系数(Chronbach‘s α coefficient ):是量表所 有可能的项目划分方法的得到的分半信度系数的平均值。系数的 一个重要特性是值会随着量表项目的增加而增加。 α系数是目前最常用的信度系数。一般认为α系数应该达到 系数是目前最常用的信度系数。一般认为α 0.7以上,有的学者认为应该达到0.9以上。这个指标可以处理任 0.7以上,有的学者认为应该达到0.9以上。这个指标可以处理任 何测验的内部一致性系数的计算问题。
1、重测信度
重测信度(Test-retest Reliability )是 重测信度 是 同一种试验(量表) 同一组被试, 用同一种试验(量表)对同一组被试, 前后测验两次, 前后测验两次,再根据被试者两次测 验分数计算其相关系数, 验分数计算其相关系数,即得出重测 信度,这是一种最普遍,最常用的信度 信度,这是一种最普遍 最常用的信度 检查方法。 检查方法。
第一次测评
55 49 78 37 44 50 58 62 48
第二次测评
57 46 74 35 46 56 55 66 50 63
10 67 经过相关分析,该量表的重测信度为r=0.95
注意事项
前后两次测量相隔的时间必须适度 遗忘和练习效应抵消时) 最适宜的 (遗忘和练习效应抵消时),最适宜的 相隔时间随测量的目的和性质而异。 相隔时间随测量的目的和性质而异。 当研究工具用于评估性质相对稳定的 问题,如个性、价值观等, 问题,如个性、价值观等,可用于重 测信度来表示研究工作的信度。 测信度来表示研究工作的信度。 测量环境的一致性也是关键因素, 测量环境的一致性也是关键因素,以 减少外来因素的干扰。 减少外来因素的干扰。
相关文档
最新文档