研究工具的信度与效度08.4
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、表面效度( Face validity)
定义:指通过粗略观察判断研究工 具是否能测出所期望的概念 表面效度属于一种直觉判断 - 用“有”或“无”来评价 - 在阐述表面效度时,应详细报告 评价者的特点及其评价的可信度。 缺点:缺乏科学性,不能体现效度 在程度上差异
2、内容效度(content validity)
重测信度(test-retest reliability)
定义:用同一工具两次或多次测定
同一研究对象,所得结果的一致程 度。
指标: 重测相关系数(r)
r= 0- 1
;
r 越接近1,重测信度越高
人格问卷重测值
研究对象 1 2 3 4 5 6 7 8 9 10 第一次测试值 23 44 35 53 44 26 32 28 38 39 第二次测试值 27 38 37 49 46 28 34 25 34 36
研究样本的异质性
-量表信度并非固定不变,
• 反向问题的处理:在调查问卷中出
现反向问题是问卷设计的实际需 要 。由于反向问题的计分是反序 的,所以需要调整成为正序。调不 调成正序对信度的影响十分大。以 克朗巴赫系数α为信度指标,下表 给出调整前后的α值的变化。
调整反向问题前后的α值的变化
模块问题数
使用重测信度需考虑的问题
1. 两次测量间隔时间 2. 研究工具所测量的变量性质 -适用较稳定的变量:人格特征、能力、生 活质量、某些生理指标。 3. 测量环境的一致 包括:物理环境、时间、测量程序与测试 者等 4.样本量:预计样本的10%(10-20例)
重测信度结果的影响原因
1. 变量随时间推移而发生改变
。
信度的大小由信度系数(r)来表
示。
信度水平的评价:
高水平:
r 〉0.75
中等水平:r= 0.5-0.75 低水平:
r〈 0.5
量表信度的影响因素
策略:- 增加条目数
删除低区分度的条目 删除低相关性的条目
量表条目数量、条目区分度和条目相关性
他评量表中各类别定义的准确性
策略:培训研究人员
• 重测信度:检验量表的稳定性,考虑的误
差来源是时间取样。 • 分半信度:检验量表的一致性,它考虑的 误差来源是内容取样。 • 内部一致性系数:检验量表的一致性,考 虑的是测验内容是否异质。 • 评分者信度:检验量表的等同性,考虑的 误差来源是评分者间的差别。 • 复本信度:检验量表的等同性,考虑的误 差来源是内容取样。
• 估量信度的方法有很多,只用一次测
验求出的信度系数反映的是测验的内 部一致性(比如二分法、折半法、克 朗巴赫系数α),用两次以上测验求 出的信度系数是对测验等值性或稳定 性的估量(比如复本信度,评定者间 信度,重测信度)。
信度的相关问题
预试验时测定研究工具的信度。 信度好坏的标准值 信度值不高时的处理 论文中如何交待
2. 第一次测量结果的记忆效应
3. 被调查者对第二次测评的不认真
4. 条目设置问题
5. 答案的评分等级问题
※研究表明:采用同一份由204个
问题组成的自填式医学问卷,对 2352名病人进行两次调查,间隔 30分钟,发现仅20%的人对所有 问题两次回答一致,有5%的人对 13个及以上的问题两次回答不一 致。
效度可作为某行为、现象的预测指标。
4、结构效度(constructive
validity)
反映研究工具所依据理论的程度, 与理论框架相符合与否。用已 知的具体的概念反映抽象的概 念。 检验方法:因子分析
因子分析的主要功能是从量表全部变 量(题项)中提取一些公因子,各公 因子分别与某一群特定变量高度关联, 这些公因子即代表了量表的基本结构。 通过因子分析可以考察问卷是否能够 测量出研究者设计问卷时假设的某种 结构。在因子分析的结果中,用于评 价结构效度的主要指标有累积贡献率、 共同度和因子负荷。累积贡献率反映 公因子对量表或问卷的累积有效程度, 共同度反映由公因子解释原变量的有 效程度,因子负荷反映原变量与某个 公因子的相关程度。
( content validity index)
应对方式量表内容效度测定
完全 需修改 相关但 非常 修改意见
不相关 否则不相关 仍需改动 相关
1、通过抽烟、喝酒等方 式来解决烦恼 2、幻想可能会发生某种 奇迹改变现状 3、找出几个不同的解决 1 2 3 4 ……………… 1 2 3 4 ……………… 1 2 3 4
定义
- 指量表中条目反映所测量内容的程度。 - 即每个条目与所测内容的相关性,以及量表 中条目是否充分地反映了测量工具所测的领域。
适用:问卷或量表形式的研究工具
内容效度为专家对工具内容的合适性进行
判断,一般需3个以上专家。
建立的基础:
大量查阅文献 工作经验 综合分析、判断
评定方法:
专家组(expert panel)评定
用SPSS统计软件计算结果显示。
Item-total Statistics Scale Mean if Item Deleted X1 X2 X3 X4 6.1100 6.0500 6.1500 6.0700
Scale Variance if Item Deleted 1.6342 1.7247 1.7652 1.5405
果 • 而Cronbach’a系数与KR-20值所 计算的是工具中所有项目的平均 相关程度
KR-20值测定
• KR-20值是Cronbach’a的一种特殊
形式,适用于二分制的研究工具, 例如回答“是”或“否”、“正确” 或“错误”的研究工具。 • 计算公式:α= [k/(k - 1) ]. (δ2 Σpiqi)/δ2
目数占总条目数的百分比。
如:AB-0.8 AC-0.9 AD-0.85、AE-0.9、BC-0.7、
BD-0.8、BE-0.85、CD-0.7、CE-0.75、DE-0.75
计算所有组的平均值,得到CVI为0.8
3、效标效度
(criterion-related validity)
以一个公认有效的研究工具作为标准, 检验新工具与标准工具测定结果的相 关性。
内部一致性
(internal consistency)
定义:工具各条目之间的同质性与相关性,所有
条目应测量相同事物
适用:由多个条目组成的问卷或量表,是护理研
究中最常用的信度测量方法
种类与计算方法:
折半信度(split-half relaibility) Chronbach’s a相关系数 KR-20值:适用于二分制研究工具
效度的相关问题
社会心理学领域 相关领域的临床护理专家 护理教育专家
专家的资格要求:
1. 在本领域具有较高的学术水平
2.具有较高的教育背景 3.具有丰富的社会心理学知识 4.熟悉测量工具的发展与心理学 特征测定的方法 5.严谨求实的科学态度
内容效度的评价
主要通过专家对研究工具的内 容进行评价 检验方法:文字形式评价 内容效度指数CVI公式
r=0.83
同时效度举例
测评量表:健身锻炼自我效能量表 效标:个体是否进行每周3次的每次20分钟有氧锻炼 考察指标:两项结果的相关系数
预测效度举例
测评量表:青少年对婚前性生活的态度量表
效标:测评后2年间是否发生婚前性生活 考察指标:两者间相关性
若两者之间高相关,该量表具有很好的效标
人格问卷的折半情况
研究对象 1 2 3 4 5 6 7 8 9 10 总分 55 49 76 37 44 50 57 62 48 66 奇数项得分 28 26 34 18 23 30 30 33 23 28 偶数项得分 27 23 42 19 21 20 27 29 25 38
折半信度测定的缺点 • 不同的折半方法会导致不同的结
效度
效度概念(validity)
指测量工具是否有效地测定到了
它所打算测定的内容或测定工具 的测定结果与预想结果的符合程 度。(某研究工具能真正反映它所
期望研究的概念的程度,即正确程 度。) 效度的大小由效度系数来表示。
效度的类型
表面效度(face validity) 内容效度(content validity) 效标关联效度(criterion- related validity) 结构效度(construct validity)
计算公式ห้องสมุดไป่ตู้
∑X:第一次测试10名研究对象各得分之和 ∑Y:第二次测试10名研究对象各得分之和 ∑X2:第一次测试10名研究对象各得分平 方之和 ∑Y2:第二次测试10名研究对象各得分平 方之和
计算公式(0.93) 统计软件(SPSS)
Spss中重测信度的步骤
在任务栏中选Analyze correlate bivaviate varables pearson
Corrected ItemTotal Correlation .5198 .3307 .4470 .5587
Alpha if Item Deleted .6255 .6855 .6512 .6085
X5
X6 N of Cases = Alpha =
5.6500
6.1200 100.0
1.6439
1.6824
同时效度(concurrent validity)
研究工具与现有标准之间的相关性
预测效度(predictive validity)
测量工具作为未来情况预测指标的有效程度。
检验方法:相关分析或差异显著性检验
效标关联效度测定
研究对象 1 2 3 4 5 6 7 8 9 10 护士专业水平 量表得分 25 30 17 20 22 27 29 19 28 15 发表论文篇数 2 4 0 1 0 2 5 1 3 1
克朗巴赫系数α(Cronbach α): 研究工具中所有项目的平均相关程度, 用SPSS统计软件计算。
计算方法:公式: α=Np/[1+p(N-1) SPSS软件
Spss 中Cronbach α的步骤
在任务栏中选Analyze scale reliability items alpha
Chronbach’s a相关系数
………………
问题的方
4、………….. 5、………….. 1 1 2 2 3 3 4 4
………………
………………
**根据修改意见修改后,间隔一定时间(10—14d)再次评议
5位专家两两配对成10组。
AB、AC、AD、AE、BC、BD、BE、CD、CE、DE
分别计算各组中两个专家都认为相关的条
医生需求与去向 农村学历层次
调整前
0. 435 0. 317
调整后
0. 734 0. 734 0. 813
农村医学教育基本模式 0. 406
影响信度的因素
• 导致产生不一致的事件 1.被测者的实际特征发生了变化 2.随机变化 • 量表的设计 1.应答条目的级数(12%、35%) 2.条目的数量 3.条目的代表性 • 得分范围 • 样本容量
研究工具性能测定
学习目标:
1. 能说出信度、效度的概念 2. 能描述信度的三个特征 3. 能进行重测信度、内部一致性信度的计算 4. 能说出效度的类别 5. 能进行内容效度的计算 6. 能描述信度与效度的关系
(Reliability)
一、信度(reliability)概念 是指研究工具的可靠性和稳定性的程 度。或是指使用某研究工具所获得结 果的一致程度或准确程度。 包括三个主要特征: 稳定性、内部一致性和等同性
折半系数(split-half reliability):
将研究工具(量表)的各项目分成两部分, 分别加以计分,对这两个部分的数值进行相关 分析,然后采用Spearman-Brown公式计算信度。 折半方法:奇偶折半法、前后折半法
计算公式:先根据重测信度公式计算出相关系数
rnn(0.64), 再使用Spearman-Brown公式计算折半信度。 折半信度Rnn =2rnn/(1+rnn)(0.78) SPSS软件:人格特征
.2006
.4817 N of Items = 6
.7831
.6382
Reliability Coefficients
.6943
评定者间信度 (interrater reliability)
不同评定者使用相同的工具,同时测 量相同的对象时,需计算评定者间一 致程度。 检验方法:相关系数
复本信度
指两个大致相似的研究工具同时被用于 研究对象,需计算复本信度。 • 检验方法:相关系数