测量工具的信度和效度分析
10第十章信度与效度分析方法

10第十章信度与效度分析方法信度与效度是研究中经常涉及的概念,用于评估测量工具(问卷、测验等)的质量和可靠性。
本文将重点介绍常用的信度分析方法和效度分析方法。
信度是指测量工具能够稳定和一致地评估所要测量的概念或现象的程度。
信度分析主要包括重测信度、内部一致性信度和切割信度。
1.重测信度重测信度是通过对同一群体在不同时点进行两次测量得到的数据进行比较来评估测量工具的稳定性和一致性。
常用的重测信度分析方法包括相关系数法和检验差异法。
相关系数法可以通过计算测量工具在两个不同时间点的得分之间的相关系数来评价测量工具的信度。
一般认为,相关系数大于0.7表示信度较高。
使用检验差异法时,可以使用t检验或Wilcoxon符号秩检验来比较两次测量之间的差异。
2.内部一致性信度内部一致性信度是评估测量工具各个项目或子量表之间的相关性来衡量测量工具整体测量的一致程度。
常用的内部一致性信度分析方法包括Cro nbach's α系数、Kuder-Richardson公式20(KR-20)和Split-half 法。
Cronbach's α系数是最常用的内部一致性分析方法,一般认为,α系数大于0.7表示信度较高。
3.切割信度切割信度是评估测量工具中各个项目之间的一致性。
常用的方法包括检验差异法和相对切割信度系数。
检验差异法使用t检验或Wilcoxon符号秩检验来检验测量工具中各个项目之间的差异,一般认为,差异显著性水平小于0.05表示项目之间具有较高的切割信度。
相对切割信度系数通过计算测量工具中各个项目得分的标准差和总分的标准差之比来评估切割信度,一般认为,相对切割信度系数大于0.3表示切割信度较高。
效度是指测量工具能够准确地评估所要测量的概念或现象的程度。
效度分析主要包括内容效度、构效度和准确性效度。
1.内容效度内容效度是评估测量工具是否充分地反映所要测量的概念或现象的内容和特征。
常用的内容效度分析方法包括专家评分法、相关系数法和因素分析法。
信度和效度分析范文

信度和效度分析范文信度分析:信度是指测量工具在不同时间、不同测量者或不同测量内容下的稳定性和一致性。
如果测量工具具有高信度,那么它将能够产生相似或一致的结果。
以下是几种常见的信度分析方法:1.重测信度方法:重测信度方法是通过对同一组被试者进行两次以上的测量来评估测量工具的信度。
可以使用相关系数(如皮尔森相关系数、斯皮尔曼相关系数)来计算两次测试结果之间的相关性。
如果相关系数接近于1,则表明测量工具具有较高的重测信度。
2.分裂半信度方法:分裂半信度方法通过将测量工具分为两部分或多部分,然后计算这些部分得分之间的相关性来评估信度。
常见的方法包括将问卷的奇数题目和偶数题目分开计分,然后计算这两个得分之间的相关系数。
如果相关系数接近于1,则说明测量工具具有较高的分裂半信度。
3.内部一致性信度方法:内部一致性信度方法通过统计测量工具各个项目之间的相似性来评估信度。
最常见的方法是计算Cronbach's Alpha系数。
Cronbach's Alpha 系数越接近1,说明测量工具的内部一致性越高。
效度分析:效度是指测量工具能否准确地度量所要研究的概念或变量。
以下是几种常见的效度分析方法:1.内容效度:内容效度评估测量工具中各个项目是否能够充分覆盖研究的内容领域。
一般通过专家评审的方式来进行评估,专家将判断每个项目是否与所要研究的概念相关。
通常采用一致性指数来衡量内容效度,如简单一致性指数。
2.结构效度:结构效度评估测量工具所测量的概念结构的一致性。
可以使用因子分析或验证性因子分析来进行评估。
如果因子载荷值较高且具有合理的因子结构,那么测量工具就具有较高的结构效度。
3.判据效度:判据效度评估测量工具与其他已经被接受为有效的判据测量工具之间的相关性。
例如,对于一个测试学生的数学能力的测量工具,可以与学生成绩进行相关性分析。
如果相关系数较高,则说明测量工具具有较高的判据效度。
综上所述,信度和效度分析是量化研究中评估测量工具的关键步骤。
第4章 测量的信度与效度

实得分数的方差等于真分数的方差与误差方差之和。
调研人员应运用所掌握的统计知识,分析其是属于系统 误差还是属于随机误差。 系统误差会使调查结果有误,所以应尽量避免。 随机误差可通过提高样本代表性、增大样本量来减少。
信度一般规定是:真分数的方差在总体方差中所占的比 重,即信度系数:
当题目间的相关系数越大时,α系数也会越大。 当题目数目n越多时,S
2 H
n 值越大, 越接近于0, 2 SH n 1
2 S i
越接近于1,故α系数也会越接近于1。
要做信度分析须先检查每个题目是否都是同方向的,即 都是正面问法,反向问题需要做处理后才可以加入分析。
在计算α系数时,应该注意有些调查量表测量的内容包 含几个领域,这时宜分别计算各个领域的α系数。 克朗巴哈α系数适用于项目多重计分的测验数据或问卷 数据,可以用该系数测量Likert量表的信度。 在基础研究中,信度至少应达到0.8才可接受; 在探索性研究中,信度只要达到0.7就可以接受; 在旅游调查测量实践中,信度只要达到0.6即可接受。 α系数通常与量表题目数量有关,题目数量越多,α系 数就越大。
理想(甚佳,信度 佳(信度高) 很高) 非常理想(信度非 非常理想(甚佳, 常好) 信度很高)
二、克朗巴哈 α系数的手工计算
以一份有8个题项的量表为例,8个题项均为正向题, 受试样本数有6位,采用Likert 5点量表填答,获得调查 结果如下表:
题号 样本
量表试题
01 5 5 5 5 5 4 02 1 1 2 1 1 1 03 2 2 2 2 2 1 04 5 4 5 5 5 5 05 2 3 3 3 3 3 06 5 5 5 5 5 4 07 4 5 5 5 5 4 08 3 2 2 3 2 2 总分 27 27 29 29 28 24
心理测量学中的信度和效度分析

心理测量学中的信度和效度分析心理测量学是研究心理测量方法与技术的学科,旨在通过反映被测者的心理特征和过程,揭示其心理素质、智力水平等信息。
而在心理测量过程中,信度和效度分析是两个重要的概念。
一、信度分析信度是指测量工具在测量同一心理特征或过程时的稳定性和一致性。
换句话说,信度反映了测量工具在同一被测者群体中的结果是否稳定,并且是否能复现。
具体来说,信度分析主要从可靠性和稳定性两个方面来考量。
1.可靠性可靠性是指测量工具的结果是否稳定且一致。
在心理测量学中,一种常用的方式是通过内部一致性来评估可靠性,最常见的统计方法是Cronbach's α系数。
Cronbach's α系数介于0和1之间,数值越大代表内部一致性越高,通常要求α系数达到0.7以上为可靠。
2.稳定性稳定性是指测量工具在不同时间或在不同条件下所得到的结果是否一致。
为了评估测量工具的稳定性,常用的方法是再测法和半分法。
再测法是指在不同时间或条件下对同一样本重复测量,然后通过计算相关系数来评估稳定性。
而半分法则是将测量工具的题目分成两部分,分别进行测量并计算两部分得分的相关系数。
二、效度分析效度是指测量工具是否能够准确地测量所要测量的心理特征或过程。
也就是说,效度是评估测量工具是否真的测量到了我们想要测量的东西。
效度分析主要从描述效度、判别效度和预测效度三个方面来考量。
1.描述效度描述效度是指测量工具是否能够全面、准确地描述被测者的心理特征或过程。
具体来说,可以通过专家评定法和内容效度等方法来评估描述效度。
专家评定法是通过请相关领域的专家对测量工具进行评定,包括评估题目的合理性、适用性等方面。
而内容效度是指测量工具的题目是否充分、恰当地涵盖了被测者的心理特征或过程。
2.判别效度判别效度是指测量工具能否区分不同的心理特征或过程。
为了评估判别效度,常用的方法是构太效度。
构太效度是通过与已知测量工具或理论进行比较,来确定测量工具是否能够与其他相关测量工具或理论得到一致或相似的结果。
信度与效度分析步骤

信度与效度分析步骤信度与效度是社会科学研究中的重要概念,其对于研究结果的可靠性和有效性有着至关重要的影响。
在进行量表研究、问卷调查等量化方法的研究时,需要进行信度与效度分析,以确保研究结果的准确性。
下面将介绍信度与效度分析的步骤。
一、信度分析步骤1. 了解信度在进行信度分析之前,首先需要了解什么是信度。
信度是指量表或问卷的稳定性、一致性和可靠性程度。
在同样条件下,如数据的采集方式、研究对象、时间等条件不变的情况下,同一测验所得分数的一致性程度越高,则表明该测验的信度越高。
2. 测量信度的方法测量信度的方法有很多种,如测试重测法、平行测验法、内部一致性检验法等。
其中,测试重测法是最常用的方法之一。
该方法的基本思想是在不同的时间或条件下,对相同的受试者进行同一测验的重复测量,用相关系数或可信度系数来评价测试结果的稳定性和一致性。
3. 数据处理与分析在获得原始数据后,需要进行数据处理和分析。
常用的方法是计算相关系数和可信度系数。
常用的相关系数有皮尔逊相关系数和斯皮尔曼等级相关系数。
可信度系数是反映量表或问卷信度的最常用的统计指标之一。
常用的可信度系数有克朗巴赫α系数、Mcnemar法、Kappa系数、ICC系数等。
4. 结果解释最后需要对得出的数字进行解释,并结合实际情况来评估测量工具的信度程度。
一般来说,可信度系数越高,信度越高。
二、效度分析1. 了解效度效度是指测量工具所充分、准确地反映测量对象的特征和属性的程度,即测量工具所提供的信息与真实情况的匹配程度。
在进行效度分析之前,需要了解量表或问卷的检验目的和测量内容。
2. 提高效度的方法提高效度是所有研究中的重点,效度的提高有多种方法,如构思效度、判别效度、预测效度等。
在测量工具的设计初期,需要充分考虑效度,并进行合理的测量工具设计。
同时,还需要加强试题的设计和选择。
在进行测量之前,还需要对测量工具进行预测效度的检验,以确保测量结果的准确性。
3. 数据处理与分析在获得原始数据后,需要进行数据处理和分析。
信度和效度检验方法

信度和效度检验方法
信度和效度是常用于科学研究中的两个重要概念。
一种测量工具只有
通过信度和效度的检验,才能够被认为是可靠的。
信度是指一个测量
工具在不同时间下得出的结果是否一致;效度是指测量工具所衡量的
内容是否与实际情况相符。
在本文中,我们将详细探讨信度和效度检
验方法。
一、信度检验方法
1.测试-重测法:这种方法需要在不同时间下对同一组参与者进行测量,然后将两次测量结果进行比较。
若结果相似,则说明该测量工具有很
好的信度。
2.内部一致性方法:这种方法通过分析同一个测试工具中各个题目之间的相关性来检验信度。
如果各题目之间的相关性较高,则说明该测量
工具有很好的信度。
3.切割半法:将测试工具中的题目一分为二,然后比较两个半部分得分的相关性操作。
若相关性较高,则说明该测量工具有很好的信度。
二、效度检验方法
1.试验效度:这种方法需要将测试工具与其他评估工具进行比较,以确定它是否正确地测量了特定变量。
2.构效度:这种方法通过分析测量工具是否与预期的变量进行了关联来检验效度。
如果两者相关性较高,则说明该测量工具具有很好的效度。
3.面向任务效度:这种方法需要将测试工具应用于实际任务中,看其是否能够有效地预测参与者的表现情况。
综上所述,信度和效度的检验方法可以确保测量工具的可靠性和准确性。
然而,这并不意味着所有测量工具都必须通过所有的检验方法。
研究者应该根据自己的需要来选择合适的方法,从而确保研究的可信
度和准确性。
统计学中的信度与效度

统计学中的信度与效度统计学是一门研究收集、整理、分析和解释数据的学科。
在统计学中,信度和效度是两个重要的概念。
它们用于评估测量工具(如问卷调查或测试)的质量和可靠性。
本文将介绍信度和效度的定义、计算方法以及在实际研究中的应用。
信度信度是指测量工具的稳定性和一致性。
在统计学中,一个可靠的测量工具应该能够反映出被测量对象的真实状态,即在不同时间和条件下具有相似的结果。
信度可以分为内部一致性信度和测试-重测信度。
内部一致性信度内部一致性信度用于评估测量工具中各个项目(题目或指标)之间的关联性或相关性。
常见的内部一致性信度计算方法包括:皮尔逊相关系数:用于连续变量之间的相关性分析。
斯皮尔曼等级相关系数:用于有序分类变量之间的相关性分析。
克隆巴赫α系数:用于多个项目构成的测量工具的内部一致性评估。
测试-重测信度测试-重测信度用于评估同一个测量工具在不同时间或条件下的结果是否相似。
常见的计算方法有:皮尔逊相关系数:对连续变量进行测试-重测信度分析。
斯皮尔曼等级相关系数:对有序分类变量进行测试-重测信度分析。
人际相关系数:对多个观察者、评分者或测量者进行测试-重测信度分析。
效度效度是指测量工具所衡量的概念与实际情况是否一致。
一个有效的测量工具应该能够准确地反映出所要衡量的特征或属性。
效度可以分为内容效度、判别效度和预测效度。
内容效度内容效度是指测量工具中各个项目是否能全面、准确地反映所要衡量的特征或属性。
常见的评估方法有:面向专家群体进行评估:邀请领域专家对测量工具进行评审和反馈。
内容有效性指数(CVI):通过专家对每个项目进行评分后计算,通常使用于问卷调查。
判别效度判别效度是指测量工具与其他相关概念进行区分的程度。
常见的评估方法有:计算两个或多个概念之间的相关系数,如皮尔逊相关系数。
进行因子分析,检查因子载荷情况和因子方差解释比例。
预测效度预测效度是指测量工具对未来事件或行为进行预测的能力。
常见方法包括:使用回归分析等统计模型,通过历史数据预测未来结果。
信度与效度分析

信度与效度分析(from 中调网)一、信度分析信度(Reliability)即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。
信度指标多以相关系数表示,具体评价方法大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。
信度分析的方法主要有以下四种:1、重测信度法同样的问卷,对同一组访问对象在尽可能相同的情况下,在不同时间进行两次测量。
两次测量相距一般在两到四周之内。
用两次测量结果间的相关分析或差异的显著性检验方法,评价量表信度的高低。
2、折半法。
折半法是将上述两份问卷合成一份问卷(通常要求这两份问卷的问题数目相等),每一份作为一部分,然后考察这两个部分的测量结果之间的相关性。
3、折半信度法折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。
折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。
这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。
在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表。
进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式:求出整个量表的信度系数(ru)。
4、α信度系数法Cronbach α信度系数是目前最常用的信度系数,其公式为:其中,K为量表中题项的总数,为第i题得分的题内方差,为全部题项总得分的方差。
从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。
这种方法适用于态度、意见式问卷(量表)的信度分析。
二、效度分析效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测量工具的信度和效度分析常用的测量工具主要有调查问卷和量表,它们都是对个人行为和态度的一种测量技术,是测量答卷者对问卷题目主观认识的个体差异的工具,也是研究者用来搜集资料的一种技术。
一般情况下,编制一份量表必须做效度和信度评价,而调查问卷则不是必须的。
对于有些调查问卷,其包含了类似量表性质对答卷者客观指标测量的题目,对这部分题目需要进行效度和信度的评价。
第一节信度分析概述一、信度的概念信度是指测量工具的可靠性和稳定性的程度,或是指使用某测量工具所获得结果的一致程度或准确程度。
测量工具的信度包含2层含义:一是相同的个体在不同时间,以相同的测量工具测验或以复本测验,或在不同的情景下测验,是否能得到相同的结果,即测量工具的测验结果是否随时间和地点等因素而变化;二是能否减少随机误差对测量工具测验结果的影响,从而反映测量工具所要测量的真实情况,即测量工具是否具有稳定性、可靠性和可预测性。
信度的三个特征是:稳定性、内部一致性和等同性。
一个好的测量工具必须是稳定可靠,且多次测验结果应前后一致。
信度本质上是一个统计学概念,是用于估计测量误差大小的尺度,主要说明测量工具测验结果中测量误差所占的比例。
实际应用中主要通过构建平行测验来计算测量工具的信度。
二、信度的评价方法信度研究的是测量工具测验结果的可靠性与稳定性,这种可靠性与稳定性可以从4个不同的角度来评价:①在相同条件下所得测量工具测验结果一致程度;②不同研究者用同一种测量工具同时测验所得结果的一致程度;③同一研究者用同一种测量工具在不同时间内测验所得结果的一致程度;④同一答卷者在不同时间内对同一种测量工具测验的稳定程度。
根据研究角度不同,信度分为外在信度(external reliability)与内在信度(internal reliability)两大类。
外在信度是指不同时间测量时测量工具测量的一致性程度。
内在信度是指测量工具是否测量的是单一概念,同时也表明测量工具各项目之间的内在一致性程度。
衡量信度高低的统计指标是信度系数(r)来表示,r 〉0.75表明信度水平较高;r= 0.5-0.75表示信度处于中等水平低水平;r〈 0.5表示信度处于较低水平。
常见的信度系数有重测信度、复本信度、分半信度和Cronbach's系数等。
重测信度是最常用的外在信度,Cronbach's系数是最常用的内在信度。
三、信度的分析方法1重测信度(test-retest reliability)1.1定义:用同一工具两次或多次测定同一研究对象,所得结果的一致程度。
1.2指标:重测相关系数(r) r=0-1 ;r 越接近1,重测信度越高计算公式:r==∑X:第一次测试研究对象各得分之和∑Y:第二次测试研究对象各得分之和∑X2:第一次测试研究对象各得分平方之和∑Y2:第二次测试研究对象各得分平方之和1.3在SPSS中计算重测信度的步骤:在任务栏中选Analyze→correlate bivaviate→ varables→ pearson1.4使用重测信度需考虑的问题①两次测量间隔时间②研究工具所测量的变量性质:适用较稳定的变量:人格特征、能力、生活质量、某些生理指标。
③测量环境的一致,包括:物理环境、时间、测量程序与测试者等④样本量:预计样本的10%(10-20例1.5重测信度结果的影响原因:变量随时间推移而发生改变;第一次测量结果的记忆效应;被调查者对第二次测评的不认真;条目设置问题;答案的评分等级问题研究表明:采用同一份由204个问题组成的自填式医学问卷,对2352名病人进行两次调查,间隔30分钟,发现仅20%的人对所有问题两次回答一致,有5%的人对13个及以上的问题两次回答不一致。
2 复本信度(alternative form reliability):也叫等值性系数(coefficientOf equivalence)。
指两个大致相似的研究工具同时被用于研究对象,即题目不同但内容相似的两份测量工具。
复本信度越高,测量工具越可靠,越能代表所欲测量的内容。
计算方法是用两个复本间隔一定时间或同时施于同一答卷者所得分数的相关系数。
3分析测量工具内部一致性(internal consistency)的信度系数:适用于由多个条目组成的问卷或量表,是护理研究中最常用的信度测量方法。
种类包括:折半信度(split-half reliability)、Cronbach's a系数以及适用于计算二分类是非题同质性信度的库德-理查森20号公式(KR20)。
3.1折半系数:将测量工具(量表)的各项目分成两部分,分别加以计分,对这两个部分的数值进行相关分析,然后采用Spearman-Brown公式计算信度。
折半方法:奇偶折半法、前后折半法计算方法:先根据重测信度公式计算出相关系数r,再使用Spearman-Brown公式计算折半信度。
折半系数测定的缺点是:不同的折半方法会导致不同的结果,而Cronbach’a 系数与KR-20值所计算的是工具中所有项目的平均相关程度。
3.2 Cronbach’a系数:该系数是Cronbach于1951年创立的,取值范围在0-1之间,a系数越高,信度越高,测量工具内部一致性越好。
计算公式:α=N p/[1+p(N-1)在SPSS中计算重测信度的步骤:在任务栏中选Analyze→scale→ reliability→item→alpha3.3 KR-20:是Cronbach’a的一种特殊形式,适用于二分制的测量工具,例如回答“是”或“否”、“正确”或“错误”的测量工具。
计算公式:α= [k/(k - 1) ]. (δ2 -Σpiqi)/δ24 评分者信度:不同评定者使用相同的工具,同时测量相同的对象时,需计算评定者间一致程度。
检验方法:相关系数。
信度系数的计算有多种方法,各种方法所适用的信度类型也不同,因此在计算信度系数时必须认真考虑实际所求信度的类型,然后选择恰当的信度系数公式。
由于误差来源不同,即使同一个测量工具用不同方法所计算的信度系数也会不同,所以各信度系数间也不具有可比性。
一般在信度分析中,要分别报告不同方法计算出的信度值。
各种信度及其误差来源:重测信度:检验量表的稳定性,考虑的误差来源是时间取样。
分半信度:检验量表的一致性,它考虑的误差来源是内容取样。
内部一致性系数:检验量表的一致性,考虑的是测验内容是否异质。
评分者信度:检验量表的等同性,考虑的误差来源是评分者间的差别。
复本信度:检验量表的等同性,考虑的误差来源是内容取样。
四提高测量工具信度的方法1 适当延长测量工具的长度。
测量工具的题目越少,得分越容易受偶然因素的影响,测量工具的信度就越低;反之,测量工具题目越多,扩大了被测量者得分范围,在一定程度上排除了偶然因素的影响,提高了测量工具的信度。
但是测量工具长度的增加与测量工具信度的提高并不总成正比,当信度系数较小时,延长测量工具的题目,信度系数增加较大;而当信度系数较大时,延长测量工具的长度对信度系数的影响就较小。
2测量工具难度适中。
测量工具题目太难或太易都会使测量工具得分差异减小,从而降低了测量工具的信度。
3测量工具的内容尽可能同质。
4测验时间要充分,测验程序要统一,测量工具的评分要客观。
第二节效度分析概述一、效度的概念1 效度的定义:效度通常是指测量工具的有效性和正确性,即所用的测量工具能够测量出研究者所欲测量特性的程度。
效度是测量工具最重要的特征,效度越高表示该测量工具测验的结果所能代表要测验行为的真实度越高,越能够达到测验目的,该测量工具才越正确越有效。
对于一个标准测验来说,效度比信度更为重要,效度的大小由效度系数来表示。
效度包括了两方面的含义:其一是测量工具的测验目的;其二是测量工具对测量目标测量的精确度和真实性。
2 效度的性质效度是指测验结果的正确性或可靠性,而不是指测验工具本身;效度并非全有或全无,只是在程度上有高低不同的差别;效度是针对某一特殊功能或者某种特殊用途而言,不具有普遍性;效度无法实际测量,只能从现有信息作逻辑推断或对实证资料作统计检验分析。
3效度的分类①内在效度(internal validity)是指某特定测量工具中自变量与因变量之间存在因果关系的程度,反应测量工具的内容的正确性与真实性。
内在效度是测量研究工具中应具备的最基本的效度,测量工具的内在效度越高,其价值也越高。
②外在效度(external validity)是指研究结果的概括性和代表性,即研究结果可否推论到研究对象以外的其它受试者,或研究情景以外的其它情境。
一项研究越能实现以上目标,就表示该研究的外部效度越好。
二、效度的评价方法评价效度的指标有:表面效度(face validity)、内容效度(content validity)、效标关联效度(criterion-related validity)、结构效度(construct validity)、判别效度(discriminant validity)、聚合效度(covergent validity)、因子效度(factorial validity)等。
1表面效度( Face validity):定义:指通过粗略观察判断研究工具是否能测出所期望的概念。
表面效度属于一种直觉判断用“有”或“无”来评价,在阐述表面效度时,应详细报告评价者的特点及其评价的可信度。
缺点:缺乏科学性,不能体现效度在程度上差异2内容效度(content validity):2.1定义:指量表中条目反映所测量内容的程度。
即每个条目与所测内容的相关性,以及量表中条目是否充分地反映了测量工具所测的领域。
适用范围:问卷或量表形式的研究工具。
建立在大量查阅文献、工作经验、综合分析、判断的基础上。
2.2评价方法:专家组(expert panel)以文字形式评价评定,由专家对工具内容的合适性进行判断,一般需3个以上专家。
应包括社会心理学领域、相关领域的临床护理专家、护理教育专家。
专家资质要求:在本领域具有较高的学术水平;具有较高的教育背景;具有丰富的社会心理学知识;熟悉测量工具的发展与心理学特征测定的方法;严谨求实的科学态度。
2.3实施步骤:内容效度指数CVI公式( content validity index)专家两两配对成组,分别计算各组中两个专家都认为相关的条目数占总条目数的百分比。
如:AB-0.8 AC-0.9 AD-0.85、AE-0.9、BC-0.7、BD-0.8、BE-0.85、CD-0.7、CE-0.75、DE-0.75。
计算所有组的平均值,得到CVI为0.83、效标效度(criterion-related validity)定义:以一个公认有效的研究工具作为标准,检验新工具与标准工具测定结果的相关性。