信度与效度资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究工具性能的测定
评价一个研究工作的科学性,应包括对 其所使用的研究工具的质量进行评价。 不好的研究工具,将影响所收集到的资 料,有时会破坏整个研究。信度和效度 是用来反映研究工具质量高低的两个指 标,高信度和高效度的研究工具是良好 科研的必需条件。本章将简要介绍研究 工具的信度与效度的概念,以及常用的 信度和效度的计算方法。
效标关联效度或准则关联效度
效标关联效度(criterion-related validity) 侧重反映的是研究工具与其他测量标准 之间的关系,而未体现研究工具与其所 测量概念的相符程度。相关系数越高, 表示研究工具的效度越好。效标关联效 度可分为同时效度(concurrent validity) 和预测效度(predictive validity)两种。
表面效度
表面效度(face validity)是由评估人根 据自己对所要测量的概念的理解,尽其 判断能力之所及来断定工具是否适当。 表面效度是一种直觉判断,它对研究工 具的效度的评价是用“有或无”来反映 的,而未体现效度在程度上的高低问题, 因此一般不能作为工具质量的有力证据。
内容效度
内容效度(content validity)是根据理论 基础及实际经验来对工具是否包括足够 的项目而且有恰当的内容分配比例所作 出的判断。内容效度需建立在大量文献 查阅、工作经验以及综合分析、判断的 基础之上,多由有关专家委员会进行评 议。反映整个测验内容范围的代表性程 度。
测量误差的来源
测验本身引起的测量误差 测验实施引起的测量误差 被试引起的测量误差
测验本身引起的测量误差
测验题目取样不当 测验题目格式不妥 测验的难度过高或过低 测验或指导语用词不当 测验时限过短
测验实施引起的测量误差
物理环境 主试方面 意外干扰 评分不客观 计算、登记分数出错
被试引起的测量误差
内在一致性信度
折半信度(Split-Half Reliability)是测 定内在一致性的最古老的方法之一。具 体做法是将组成研究工具的各项目(如 组成一份问卷中的各个题目)分成二部 分,分别加以计分,对这两个部分的数 值进行相关分析,然后采用Spearman Brown公式计算信度。折半方法常用的有 前后折半法、奇偶折半法。
信度
信度(reliability)是指使用某研究工具 所获得结果的一致程度或准确程度。当 使用同一研究工具重复测量某一研究对 象时所得结果的一致程度越高,则该工 具的信度就越高。同时,越能准确反映 研究对象真实情况的工具,其信度也就 越高。稳定性、内在一致性和等同性是 信度的三个主要特征。
信度的基本定义
应试动机的影响 测验的焦虑 生理因素 学习、发展和教育 测验经验
信度的种类
重测信度 复本信度 内在一致性信度 评分者信度
信度的计算方法
重测信度也称稳定系数
常用来表示研究工具的稳定性的大小, 即是指用同一工具两次或多次测定同一 研究对象,所得结果的一致程度。一致 程度越高,则研究工具的稳定性越好, 重测信度也就越高。
同时效度
如果准则资料与测验分数可以同时得到, 那么,根据这个资料计算的准则关联效 度就是同时效度,用相关系数来计算。
预测效度
是指测验对准则变量预测的有效性。预 测效度中,准则资料是在一段时间之后 才能收集到。 计算相关系数。
结构效度
结构效度(construct validity)重点是了 解工具的内在属性,而不是关心使用工 具后所测得的结果。它主要回答“该工 具究竟在测量什么?”,“使用该工具 能否测量出想研究的抽象概念?”这类 问题,结构效度反映的是工具与其所依 据的理论或概念框架的相结合程度,概 念越抽象就越难建立结构效度,同时也 越不适宜使用效标关联效度进行评价。
信度就是一组测验分数中真分数方差与 实测分数方差的比值。
表达式为:
rtt rt2
S2 St2
r信tt就度是指信标度,,是也真称分为数与信实度测系分数数。的rt相就关是。
信度与测量误差的关系
rtt rt2
S2 St2
S2 St2
1
Se2 St2
St2
S2
S
2 e
rtt
1 Se2 St2
信度是一组测验之间的一致性,而非个人的分 数的一致性。
St2
库德-理查逊公式20(KR-20值)
n St2
pq
n1
St2
其中
S
2 t
是总分方差,V是测验每个项目的方差。
等同性信度测量
评定者间信度和复本信度评定者间信度 (interrater reliability)和复本信度 (Alternate forms reliability)均用来表 示研究工具的等同性这一特征。研究工 具的等同性(Equivalence) 。
rtt
2rhh 1 rhh
内在一致性信度
Cronbach’ α相关系数与 KR-20值 :所 计算的是工具中所有项目间的平均相关 程度,避免了折半信度计算的缺点。KR -20值是Cronbach’α的一种特殊形式, 适用于二分制的研究工具。
内在一致性信度
Cronbach’ α系数
n St2
V
n1
计算方法:
一段时间
测验
再测验
重测信度用重测相关系数来表示,相关 系数越趋近于1,则重测信度越高。
使用重测信度需考虑的问题
两次测量之间的间隔时间 研究工具所测量的变量的性质 测量环境的一致
内在一致性信度
折半信度、Cronbach’α系数与KR-20值: 此三种方法均可用来反映研究工具的内 在一致性这一特征。内在一致性 (internal consistency)是指组成研究 工具的各项目之间的同质性或内在相关 性,内在相关性越大或同质性越好,说 明组成研究工具的各项目都在一致地测 量同一个问题或指标,也就是说明工具 的内在一致性越好,信度越高。
N
2
N
Ri
Ri2
பைடு நூலகம்
W
i1
i1
N
1 K2 N3 N
12
效度
效度(validity)是指某一研究工具能真 正反映它所期望研究的概念的程度。反 映期望研究的概念的程度越高,效度越 好。可以用表面效度、内容效度、结构 效度、效标关联效度、区分效度等来反 映一个研究工具的效度。但是效度的好 坏并不似信度那样易于评价,一些测量 效度的方法并没有数字的依据。
复本信度
以称为等值系数。估计的是两个假定相 等的复份测验的一致性。用于当同一测 验不能用来实施两次时,用两个大致相 同的研究工具同时被用于研究对象,需 计算复本信度。 计算相关系数
评定者间信度
不同评定者使用相同工具,同时测量相 同对象时,需计算评定者间一致程度。
当评分者为两人时计算相关系数。
当评分者为多人时计算肯德尔和谐系数。
相关文档
最新文档