研究工具性能的测定

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

重测信度
R值越大说明测量工具稳定，被试的值越大说明测量工具稳定，值越大说明测量工具稳定特质受被试的状态和环境变化的影响较小。较小。短期内使用较好。短期内使用较好。例如：睡眠质量受工作压力、例如：睡眠质量受工作压力、家庭事件、环境等因素影响自尊量表》《自尊量表》？
重测信度法具体方法如下：重测信度法具体方法如下结果两个平行的测验测量同一批被试所得结果平行的一致性程度。的一致性程度。复本测验必须在题目内容、数量、形式、复本测验必须在题目内容、数量、形式、难度、区分度、指导语、时限、难度、区分度、指导语、时限、以及所用的例题、的例题、公式和测验等其他方面都相同或相似。相似。记忆效应小，但迁移效应大、顺序效应大。记忆效应小，但迁移效应大、顺序效应大。常用于方法学研究与教育方面：常用于方法学研究与教育方面：如学生对知识的掌握情况。知识的掌握情况。
克朗巴哈a 克朗巴哈a系数评价举例
例13 对50位研究生进行健康状况抽查。调查问卷设计 50位研究生进行健康状况抽查。调查问卷设计了如下7 了如下7个问题。 X1---对自己健康的满意程度 X1---对自己健康的满意程度 X2---是否注意调养身体 X2---是否注意调养身体 X3---身体有不适或不舒服感觉 X3---身体有不适或不舒服感觉 X4---有生病的感觉 X4---有生病的感觉 X5---有紧张情绪和压力感 X5---有紧张情绪和压力感 X6---晚间休息感到不能很快入睡 X6---晚间休息感到不能很快入睡 X7---吃饭有时觉得胃口不好 X7---吃饭有时觉得胃口不好每个问题的回答从好到差按4个等级记分（分别赋值1 每个问题的回答从好到差按4个等级记分（分别赋值1、 2、3、4）。调查结果如表2，试计算克朗巴哈a系数。）。调查结果如表2，试计算克朗巴哈a系数。
折半信度注意事项
需要测验项目的奇偶项的难度，需要测验项目的奇偶项的难度，内容等特征相似，等特征相似，并不是所有的测验都能计算折半信度。计算折半信度。整个问卷的信度不是在折半信度上乘就可以了，以2就可以了，而需要采用校正公式来就可以了求的。求的。 Spearman-Brown公式：公式：公式 rxx＝2rhh/（1+rhh）（
5、评分者信度
评分者信度是指不同评分者对同一批人的答卷进行评定时的一致性程度。人的答卷进行评定时的一致性程度。评分者信度 (interrater reliability)是是在测量工具的标准化程度较低的情况下，不同评分者的评分标准也会影响到测量的信度。到测量的信度。常用与观察法测量对象时。例如：常用与观察法测量对象时。例如：护理技能操作考试采用的评分表
折半信度
可了解测验的内部一致性，可了解测验的内部一致性，也叫内部内部一致性一致性系数。一致性系数。如何分成对等的两半：如何分成对等的两半：可按题号的奇偶性、题目的难度、题目的内容、偶性、题目的难度、题目的内容、前后顺序分半。后顺序分半。题目多，题分少，比较均匀时分半。题目多，题分少，比较均匀时分半。
信度系数
大部分信度指标都以相关系数( 来表示来表示，大部分信度指标都以相关系数 r )来表示，即用同一样本所得到的两组资料的相关系数作为测量一致性的指标,称为信度系数称为信度系数。作为测量一致性的指标称为信度系数。它在所测对象实得分数的差异中有多大的比例是由测量对象本身的差别决定的，比例是由测量对象本身的差别决定的，信度系数高表明测量的一致性程度高,测量的误差系数高表明测量的一致性程度高测量的误差少一般来说 r ≥ 0.70就可认为该测量是达到就可认为该测量是达到了足够的信度. 了足够的信度
①选择样本总数1/10的重测对象，先进行第一次测试。 ②隔一段时间（间隔以可能忘却上次测验内容为宜）以后进行重测。 ③然后计算两次测试结果的相关系数。如用领导潜能量表测量10名护理人员，一周后再次测评，两次测试结果如表2所示，计算其重测信度。
表2 领导潜能量表重测结果研究对象
1 2 3 4 5 6 7 8 9
4、内部一致性信度
内部一致性信度（internal consistent reliability））内部一致性信度是目前比较流行而且效果较好的信度评定方法，效果较好的信度评定方法，它从测量构思层次化入手，构思层次化入手，使测量项目形成一定的内部结构，定的内部结构，并以内部结构的一致性程度，对测量信度作出评定。性程度，对测量信度作出评定。
小结
在计算量表的信度时，在计算量表的信度时，应首先用随机抽样的方法选择样本量的1/10 或者至少10 20例 1/10， 10～选择样本量的1/10，或者至少10～20例样本进行量表的信度测定。对于一个公认的好量表信度值量表的信度测定。对于一个公认的好量表信度值 0.80，而对于一个新发展的量表，至少应达到 0.80，而对于一个新发展的量表，信度0.70即可接受。 0.70即可接受。即可接受任何一个量表在应用前均应作信度的测定，任何一个量表在应用前均应作信度的测定，当信度不够理想时，则需要对量表进行完善和修改。度不够理想时，则需要对量表进行完善和修改。介绍量表时，介绍量表时，最重要的是要报告出量表信度计算方法和信度值，以使同行判断量表的性能，方法和信度值，以使同行判断量表的性能，并根据自己研究的内容和特点进行选用。据自己研究的内容和特点进行选用。
2、复本信度
复本信度(Alternate-forms Reliability)：复本信度：复本是相对于原本而言的,它使原本的复制复本是相对于原本而言的它使原本的复制对一项调查的问题,让被调查者接受问品，对一项调查的问题让被调查者接受问卷测量，卷测量，并同时接受这份问卷的复本的调然后根据调查结果计算其相关系数，查,然后根据调查结果计算其相关系数，就然后根据调查结果计算其相关系数得出了复本信度，得出了复本信度，复本信度类似于考试的 A,B卷，它是根据同一目的编制出两套测卷量工具一测验同一主题现象。量工具一测验同一主题现象。
影响信度的因素
被试方面主试方面施测的情境方面测量工具方面测量时间间隔问题
提高测量信度的方法
增加测量长度选取同质群体严格评判标准作答时间宽裕控制误差：环境因素等控制误差：当然，编制一份信度高的问卷，当然，编制一份信度高的问卷，更关键在于问卷的内容合理。更关键在于问卷的内容合理。
k 2 ∑s i k α= 1 − i =1 2 k −1 sT
表示量表中的项目（ K—表示量表中的项目（题目）总数表示量表中的项目题目）表示所有被试对象在第i Si2——表示所有被试对象在第i项目上得分的方差 ST2——表示所有被试分数的方差 1， i= 1，2，3，·· ·· ··，k ，
信度的计算类型
信度通常以相关系数表示，信度通常以相关系数表示，由于测量中误差变异的来源有所不同，所以，中误差变异的来源有所不同，所以，各种信度系数分别说明信度的不同层面而具有不同的意义。面而具有不同的意义。人们一般是从不同方面来检查和评估调查资料的信在实际应用中,信度信度(也可以说是信度，在实际应用中信度也可以说是信度系数)有如下类型有如下类型：度系数有如下类型：
3、折半信度
折半信度( 折半信度 Split-half Reliability)：在：无复本且不准备重测的情况下，无复本且不准备重测的情况下，通常采用折半法一估计信度，采用折半法一估计信度，折半法是将调查来的结果按题目的单双分成两半计分，计分，再根据各个人的这两部分的总分计算其相关系数，就得到折半信度。分计算其相关系数，就得到折半信度。
研究工具性能的测定
护理系李鸿艳
教学目标
掌握信度的概念。掌握信度的概念。熟悉计算信度的方法。熟悉计算信度的方法。掌握效度的概念。掌握效度的概念。熟悉测量效度的方法。熟悉测量效度的方法。了解国外量表的翻译步骤。了解国外量表的翻译步骤。
一、信度
信度(Reliability)是指测量数据资料是指测量数据(资料信度是指测量数据资料) 可靠性程度即测量工具能否稳定程度,即测量工具能否稳定地的可靠性程度即测量工具能否稳定地测量到它要测量的事项的程度. 测量到它要测量的事项的程度信度是指同一或相似母体工具重复进行调查或测验,其所得结果间的一致性其所得结果行调查或测验其所得结果间的一致性的程度. 的程度信度的特征：稳定性、内在一致性、信度的特征：稳定性、内在一致性、等同性。等同性。
内部一致性信度
内部一致性信度主要有两种：库德内部一致性信度主要有两种：库德— 理查森的公式20（简称KR20）和克理查森的公式（简称）劳伯克（系数。劳伯克（Cronbach）的α系数。）系数 Cronbach’α系数是目前应用最广泛的系数是目前应用最广泛的信度指标。信度指标。两者测量所有项目间的平均相关程度同质性信度）（同质性信度）。
内部一致性
组成研究工具的各项目之间的同质性或内在相关性，内在相关性越大或同质性越好，在相关性，内在相关性越大或同质性越好，说明组成研究工具的各项目都在一致地测量同一个问题或指标，内部一致性越好，量同一个问题或指标，内部一致性越好，信度越高。信度越高。
优点为应用方便，且最大程度地克服了重测所带来的优点为应用方便，一系列问题。一系列问题。局限性在于由于折半方法很多，不同折半方法可以得局限性在于由于折半方法很多，到不同的信度值，到不同的信度值，研究者可能会不断改变折半方法以期得到较高的信度值。期得到较高的信度值。
复本信度注意事项
两测验必须平行（内容一致、两测验必须平行（内容一致、平均分标准差一致）标准差一致）信度高可直接下结论，信度高可直接下结论，但信度低则不可能是其中一个测验信度低。然，可能是其中一个测验信度低。消除顺序效应：一半人先A卷后做卷后做B卷消除顺序效应：一半人先卷后做卷，另一半人相反。另一半人相反。
克朗巴哈α系数(Chronbach‘ 克朗巴哈α系数(Chronbach‘s α coefficient ）：是量表所有可能的项目划分方法的得到的分半信度系数的平均值。系数的一个重要特性是值会随着量表项目的增加而增加。 α系数是目前最常用的信度系数。一般认为α系数应该达到系数是目前最常用的信度系数。一般认为α 0.7以上，有的学者认为应该达到0.9以上。这个指标可以处理任 0.7以上，有的学者认为应该达到0.9以上。这个指标可以处理任何测验的内部一致性系数的计算问题。
1、重测信度
重测信度(Test-retest Reliability )是重测信度是同一种试验（量表）同一组被试，用同一种试验（量表）对同一组被试，前后测验两次，前后测验两次，再根据被试者两次测验分数计算其相关系数，验分数计算其相关系数，即得出重测信度，这是一种最普遍,最常用的信度信度，这是一种最普遍最常用的信度检查方法。检查方法。
第一次测评
55 49 78 37 44 50 58 62 48
第二次测评
57 46 74 35 46 56 55 66 50 63
10 67 经过相关分析，该量表的重测信度为r=0.95
注意事项
前后两次测量相隔的时间必须适度遗忘和练习效应抵消时）最适宜的（遗忘和练习效应抵消时）,最适宜的相隔时间随测量的目的和性质而异。相隔时间随测量的目的和性质而异。当研究工具用于评估性质相对稳定的问题，如个性、价值观等，问题，如个性、价值观等，可用于重测信度来表示研究工作的信度。测信度来表示研究工作的信度。测量环境的一致性也是关键因素，测量环境的一致性也是关键因素，以减少外来因素的干扰。减少外来因素的干扰。