信度的计算
心理测量学第三章信度
第三章信度心理测验就是对某些心理特质的个别差异进行测量的工具,对心理特质的测量与对物理属性,如物体长度和重量等的测量是一样的。
不同的是心理测量所测量的是抽象的心理特质,工具是心理测验,而物理测量的对象则是物体的重量和长度等特性,工具是尺子和天平。
心理测量与物理测量的另一个共同点是二者都难以避免误差的影响。
在对物体的长度进行测量时,物体的热胀冷缩,测量者读取刻度的准确性等因素都会使测量出的长度与物体的实际长度不符,在不同时间、地点的测量值会有出入。
就是说,在不同情景下测量结果是不稳定的,与测量情景和测量条件有关的误差称随机误差(random error)。
由于这一误差是由测量过程造成的,因此也称测量误差(measurement error)。
另一方面,使用一把尺子对物体的长度进行测量时,这把尺子本身的质量也可能造成误差。
如果一把尺子本身就是有问题的,测量出的物体的长度自然就不准确。
这类误差与测量情景引进的误差不同,只要在测量时使用这把尺子,误差就会恒定地存在,无法消除。
这类由测量工具本身造成的误差称为系统误差(system error)。
对心理的测量与对物理的测量一样,也同样存在这两类误差。
与这两类误差相对应,心理测验中引入了信度和效度的概念。
信度研究涉及了测验分数的可靠性和稳定性,也即如何控制和减少随机误差。
效度研究则涉及了测量的系统误差,也即如何提高测量工具本身的准确性。
第一节经典测验理论的信度观教育与心理测验的目的是将个体的心理特质数量化,从而更精确地研究心理的个别差异。
在廿世纪初心理测量实践的推动下,测验理论产生了。
经过几十年的发展,到廿世纪五十年代初,教育与心理测验理论对测验的构建、误差的控制、测验结果的统计分析及解释等问题已形成一个完整的理论体系。
为与以后产生的项目反应理论和概化理论相区别,人们习惯上将这一理论体系被称为经典测验理论(Classical Test Theory,简称CTT)。
如何计算信度和效度
1、选择10人采用“评测信度”问卷对其进行调查
2、数据录入Excel
3、录入时注意:答案为“是”记为“1”分,“否”记为“2”分
4、将每个人问卷总分算出来
5、录入格式
研究对象
第一次测试
第二次测试
1
分数
分数
2
分数
分数
3
分数
分数
4
分数
分数
5
分数
分数
6
分数Hale Waihona Puke 分数7分数
分数
8
分数
分数
9
分数
分数
10
分数
分数
6.两次测试间隔一周
7.如不录入数据,计算可以不通过软件
8.计算公式
X:第一次测试得分
Y:第二次测试得分
n=10
r:相关系数
>0.7问卷有效
二、内容效度
1.选择5名熟悉便秘及便秘护理相关知识专家,评价问卷内容。修改后再次评价。
2.应用效度测评问卷
3.计算平均效度
第六章-信度
rKK
(三)测验难度
难度对信度的影响,只存在于某些测验中。
如智力测验、成就测验、能力倾向测验等;
对于人格测验、兴趣测验、态度量表等不存在难
度问题,因为这些测验的题目没有正确或错误答
案之分。
就难度与信度的关系而言,并没有简单的对应关
系。
从理论上说,只有平均难度水平为50%时,才能使
4
5 6
6
3 1
6
3 1
6
2 1
18
8 3
R
i
=14+7+13+18+8+3=63
2 R i =142+72+132+182+82+32=811
由题意知 K=3, N=6, 将上述值代入公式有:
2 12 811 63 / 6 =0.95 W= 32 63 6
•
如在评定中有相同的等级时,用下式校正。其中n
K-R20公式(仅适用于以1、0记分)
rKK K ( K 1
2 SX pi qi 2 X
S
)
公式K-R20中:K为构成测验的题目数;Pi为通过
第i题的人数比例;qi为未通过第i题的人数比
例;SX为测验总分的标准差。
K-R21公式(适用于以1、0记分,各题难度近似)
rKK
KS X ( K X ) 2 ( K 1) S X
1.两次测验的时间间隔要适当
时间太短,第一次的测验记忆犹新,夸大了稳定性;时间 太长,受学习、成熟等影响,从而降低了稳定性。 2.再测法适用于速度测验或人格测验,而不适用于难度测 验。 因为速度测验和人格测验项目多,被试无法记住测验内 容,所以受第一次测验影响小。
教育测量的质量指标--信度概述
)
E=x-T
(公式1-2
(一)信度指实测值和真值相差的程度
1、试比较以下两次测量结果(只进行 一次)的信度:
用尺子量100cm高的一个儿童,得到1cm 的绝对误差;量185cm高的一位运动员 ,也得得到1cm的绝对误差。
要比较两种测量结果的信度,一定要看误差分数(E )对于真分数(T)所占的百分数是多少。这个百分 数表示该实得分数(x)的相对误差。其计算式如下 :
rxx
1-σE2 σ2x
=1- 2.8 =0.865 20.8
(二)信度指统计量与参数之间的接近程度
❖统计量是指样本上的各种数字特征。(如样本平均数 、标准差等);参数是总体上的各种数字特征(如总体 平均数、标准差等)。 ❖在统计学中,统计量越接近参数,这个统计量的可靠 性越高。而要知道统计量与参数的接近程度,可以对参 数进行区间估计。
NXY x Y
r A1A2 [N X 2 ( X )2 ] [N Y 2 ( Y )2 ]
12 6420 280 286
[12 6594 2802 12 6912 2862
采用重测法计算稳定系数时,要注意的问题:
1、两次测验之间的时间间隔要适宜,尽可能在 较短的时距内进行。
➢ 信度(reliability):指的是测量结果的 稳定性和可靠的程度,亦即测量的结果是否 真实、客观地反映了考生的实际水平,可记 为rxx。
➢ 具体而言,可以从以下三方面来理解测量的 信度:
(一)信度指实测值和真值相差的程度
x=T+E (公式1-1)
x表示实测值,T表示真值(是未知的,可以
把多次测量的实测值的平均值作为真值的近似
2、怎样估计对一组人或一个人测量多次的实测 值与真值(真分数)的差异程度呢?
问卷信度的计算
克朗巴赫系数 Cronbach α
• 内部一致性信度( Internal Consistency Reliability)
• 折半信度 (Split-halα系数
• 内部一致性系数大于0.7表明量表的可靠性较高;在探索性研究中,内部一致性系数可以 小于0.7,但应大于0.6;
分析——刻度——可靠性分析
选入量表的条目 模型选择Alpha
信度较低时,根据此表 格剔除部分条目。
谢谢!
• 问项数量小于6个时,内部一致性系数大于0.6,表明量表是有效的。
Hair Jr., J.F., Anderson, R., Tatham, R. and Black, W.C. (1998) Multivariate Data Analysis (5th Edition). Prentice Hall, Upper Saddle
问卷信度的计算
采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。信度是指 测验结果的一致性、稳定性及可靠性。信度系数愈高即表示该测验的结果愈一致、 稳定与可靠。
• 重测信度( Test-retest Reliability) • 复本信度( Alternate-orm reliability)
考试成绩评价的区分度、信度、效度等概念
目录考试成绩评价的区分度、信度、效度等概念 (1)高一化学备课组 2009.3.26 (4)考试成绩评价的区分度、信度、效度等概念1、试卷的区分度试卷的区分度指测试题目对被测试者实际水平的区分能力。
区分度高的试题,能将不同水平的被试者区分开来;区分度低的试题则对被试者水平不能很好地鉴别。
区分度是指试题对被试者情况的分辨能力的大小。
一般在-1~+1之间,值越大区分度越好。
试题的区分度在0.4以上表明此题的区分度很好,0.3 ~0.39表明此题的区分度较好,0.2 ~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。
计算区分度的方法很多,特别需要注意的是对同一个试题的考试成绩采用不同的方法所得到的区分度的值是不同的。
我们可以使用下面的两种方法计算区分度:(1)先将分数排序,P1=27﹪高分组的难度,P2= 27﹪低分组的难度区分度D =P1-P2或区分度 D = (27﹪高分组的平均分-27﹪低分组的平均分)?/font>满分值(2)利用积差系数r 计算区分度D当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关成为积差相关。
积差相关的使用条件a、两个变量都是由测量获得的连续性数据。
如百分制分数。
b、两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称的分布。
c、必须是成对的数据,而且每对数据之间是相互独立的。
d 、两个变量之间呈线性关系。
积差相关系数r的计算在计算机上是很容易进行的。
积差相关系数r的公式如下:r=(无法显示)原谅!2、试卷的信度试卷的信度主要从两个方面进行分析,一方面是考试成绩期望值与实际成绩平均值的差异,考试成绩期望值一般应以平时成绩的平均值为依据确定.另一方面是考试成绩的预期及格率与实际及格率的差异,考试成绩及格率的预期值同样以平时成绩的及格率为确定依据.两个方面的差异性较小,说明试卷信度较高.考试信度,简单地说是考试结果的可信程度,是推测考试可信与否的最重要的量化指标。
scott's pi信度公式
Scott's Pi信度公式是统计学中用于测量测量工具或测试的信度的一种方法。
信度是指一个测量工具稳定性和一致性的度量,也就是说,当同一个对象在不同时间或者不同条件下被测试时,结果是否稳定和一致。
Scott's Pi信度公式是由David W. Scott在1977年提出的,它可以用于二分类的测试数据,并且在实际应用中被广泛使用。
Scott's Pi信度公式的计算方法相对简单,它是通过测量两次测试之间的一致性来确定信度的。
具体而言,Scott's Pi信度公式可以衡量两次测试结果中同时判断为是或者不是的概率,以此来判断测试工具的信度。
在实际应用中,Scott's Pi信度公式常常用于衡量医学诊断测试、行为研究、心理学测试等领域中的信度。
使用Scott's Pi信度公式进行信度测量时,我们需要首先确定两次测试的结果,然后将结果分类为“是”和“否”,接着根据测试结果进行交叉分类计算,最后使用Scott's Pi信度公式进行计算。
具体的计算公式如下:1. 首先我们需要确定四个值,分别为a、b、c、d,它们分别代表了两次测试结果的交叉分类数量。
其中a代表两次测试中判断为“是”的数量,b代表第一次测试判断为“是”而第二次测试判断为“否”的数量,c代表第一次测试判断为“否”而第二次测试判断为“是”的数量,而d代表两次测试中判断为“否”的数量。
2. 我们通过计算Scott's Pi信度系数来得到信度的度量值。
计算公式如下:Pi = (a + d) / (a + b + c + d)Pi = 2(a + d) / (2(a + b) + 2(a + c))其中,Pi的取值范围为-1到1之间,当Pi为1时,表示两次测试结果完全一致,信度非常高;当Pi为0时,表示两次测试结果完全不一致,信度非常低;当Pi为-1时,表示两次测试结果完全相反,信度也非常低。
第二章 信度
18
3
23
4
21
5
17
6
18
7
20
8
17
9
16
10
13
11
14
12
13
13
12
14
8
15
8
奇数 20 题 (X)
偶数 20 题 (Y)
22
19
22
18
15
14
17
15
16
14
12
10
7
8
(2)库得-理查逊(Kuder&Richardson)系数(采 用0,1记分时 )
KR20
n ( n-1
第二讲 信度
内容: 1.信度的含义 2.信度的计算方法 3.影响测验信度的因素 4.提高测验信度的方法
(一)什么是信度 信度是指测量结果的稳定性或可靠性程度。 一个好的测量必须具有较高的信度,其结果就不应 随工具的使用者或使用时间等方面的变化而发生较 大的变化。 信度可以理解为:信度指实测值(观察分数)和真 值(真分数)相差的程度;信度指两次重复测量或 等值测量之间的关联程度。
3.内部一致性系数 (1)分半信度 在测验无复本且只能施测一次的情况下,通 常用分半法估计信度,即将测题分成对等的两 半,根据各人在这两半测验的分数,用皮尔逊 积差相关公式计算其相关系数,作为信度指标。 分半信度考察的是两半题目之间的一致性, 故这种信度系数也称内部一致性系数。计算分 半信度仍然可用积差相关方法。
也可用下列公式:其中X、Y为同一 被试的两个分数,Sx、Sy为两组分 数的标准差。X、Y为两组分数的平均 数,N为被试人数。
∑ XY/N-XY rxy = SxSy
信度和效度
信度和效度什么是信度?简单地说信度就是指测量数据和结论的可靠性程度,也就是说测量工具能否稳定地测量到它要测量的事项的程度。
我们可以举例说明信度的问题:如果想知道某人的体重,我们可以叫两个人来估计,一个人的估计为150镑,另一个人的估计为300镑,那么我们就可以认为,叫别人来估计体重是非常不可信的方法。
如果用磅秤,连续测量两次的结果都是相同的,因而我们可以说,在测量体重方面,用磅秤的方法要比叫人来估计更可信。
我们可以用信度系数来表示信度的大小如何计算信度我们知道在进行测量时,误差是难免的,这就使得真实值和测量值之间是不可能完全一致。
我们可以这样来表示真实值和测量值之间的关系。
X=T+B+E T表示真实值,B表示偏差即系统误差,E表示测量误差即随机误差。
由于系统误差很难分解,因而有些书中的分解式将系统误差包括在真实值之中,因而X可以简单地概括为X=T+E 对于测量误差E,一般假定他的期望值是0,却与真实值相独立,在此假定下,可以证明:E(x)=E(T)实得分数和真分数的总体均值相等。
σ2x=σ2T+σ2E实得分的方差等于真分数的方差与误差方差之和。
信度一般规定是真分数的方差在总体方差中所占的比例,即:信度系数Rxx=σ2T/σ2X=1-(σ2E/σ2X)信度系数越大,表明测量的可信程度越大。
信度类型(一) 重测信度这种方法通常是重复同样的测量来检验信度信度系数可以用相关系数来表示。
假如我们第一次测量时的观测值是X,第二次的观测值是Y,那么重测信度就等于X与Y的相关系数。
但重复测量时,我们要注意两次测量的时间间隔要恰当。
如果时间间隔太久,可能会发生一些变故,影响到被调查者的态度,那么前后的测量就会有很大的差异。
(二)复本信度复本是针对原本而言的,它是原本的复制品。
对一项调查的问题,让被调查者接受问卷测量,并同时接受调查问卷的副本的调查,然后根据结果计算原本和复本的相关系数,就得到复本信度。
(三)折半信度通常是在无副本且不准备重测的情况下,我们就用折半信度来计算信度系数。
评分者信度计算公式
评分者信度计算公式
评分者信度(inter-rater reliability)通常使用Kappa系数(Cohen's Kappa)来衡量,其公式如下:
K = (P(A) - P(E)) / (1 - P(E))
其中,P(A)是评分者之间的一致性概率,P(E)是随机达成一致的概率。
计算Kappa系数的步骤如下:
确定评分者:首先需要确定参与评分的评分者,通常需要至少两个评分者。
确定评分标准:需要明确评分标准,以便评分者能够按照同样的标准进行评分。
计算一致性概率:对于每个评分标准,计算评分者之间的一致性概率。
例如,可以使用百分比或数量来表示一致的评分结果。
计算随机达成一致的概率:计算随机达成一致的概率,即每个评分者都随机选择一个评分结果时的概率。
计算Kappa系数:使用上述公式计算Kappa系数。
Kappa系数的取值范围为-1到1之间,其含义如下:
Kappa系数小于0表示评分者之间的一致性程度低于随机水平。
Kappa系数为0表示评分者之间的一致性程度等于随机水平。
Kappa系数大于0表示评分者之间的一致性程度高于随机水平,其值越高表示评分者之间的一致性越好。
一般认为,Kappa系数在0.6以上表示评分者之间的一致性良好,可以接受。
观察者信度计算方法
观察者信度计算方法在社会科学研究中,观察者信度是指观察者对被观察对象进行观察和描述的可靠性。
在观察者信度的计算中,通常考虑以下几个方面:1.观察者一致性观察者一致性是指多个观察者对同一被观察对象进行观察和描述时,其观察结果和描述结论的一致程度。
如果多个观察者对同一被观察对象的观察结果和描述结论相差无几,则说明观察者一致性较高。
为了计算观察者一致性,可以进行以下步骤:(1)选择多个观察者对同一被观察对象进行观察和描述;(2)收集每个观察者的观察结果和描述结论;(3)将每个观察者的观察结果和描述结论与标准结果进行比较,计算其误差;(4)将所有观察者的误差进行比较,计算其一致性系数(如Kappa 系数、Cohen'skappa系数等)。
2.观察者内部一致性观察者内部一致性是指单个观察者在不同的时间点对同一被观察对象进行观察和描述的一致程度。
如果单个观察者在不同的时间点对同一被观察对象进行观察和描述的结果和结论相差无几,则说明观察者内部一致性较高。
为了计算观察者内部一致性,可以进行以下步骤:(1)选择一个观察者对同一被观察对象进行多次观察和描述;(2)收集该观察者在不同时间点的观察结果和描述结论;(3)将该观察者在不同时间点的观察结果和描述结论与标准结果进行比较,计算其误差;(4)将该观察者在不同时间点的误差进行比较,计算其内部一致性系数(如组内相关系数等)。
3.观察者评分标准观察者评分标准是指观察者在观察和描述被观察对象时所采用的评价标准。
为了提高观察者的一致性和内部一致性,需要制定明确的评分标准,并对观察者进行培训和指导。
在制定评分标准时,需要考虑以下因素:(1)评价内容的客观性和准确性;(2)评价标准的明确性和可操作性;(3)评价标准的可靠性和稳定性。
4.观察者互换性观察者互换性是指在多个观察者之间进行角色互换,以提高观察的准确性和客观性。
在观察者互换性方面,可以考虑以下措施:(1)多个观察者之间进行角色互换,以便更好地理解被观察对象的实际情况;(2)在互换过程中,观察者之间可以交流和分享各自的观察结果和描述结论,以提高整体观察水平;(3)在互换过程中,需要对不同的观察者和被观察对象进行分析和比较,以发现潜在的问题和误差。
量表的信度与效度分析计算
2、内在一致性分析 方法之一:折半法
(split-half technique) 优点:不需要重复的测量 常用分法:按项目号的前后顺序分
或按项目号的奇偶性分 计算公式:
ru = 2rh / (1 + rh)
2、内在一致性分析 方法之一:折半法
(split-half technique) 注意:需先将量表中的反意题作逆向处理
σT2
ቤተ መጻሕፍቲ ባይዱ
总得分(所有题项得分之和)的方差
α信度系数是评估量表内部一致性的比较常用系数
2、内在一致性分析 方法之三:平均相关系数法 缺点:偏重于项目之间的相关
而不是整个量表的信度 项目越多,平均相关系数就可能越高 提高信度的方法之一: 增加量表中的测量项目
因为各个项目的随机误差可能会相互抵消
2、内在一致性分析 小结: • 信度的高低既依赖于项目的内在一致性 • 也依赖于量表的长度 因此: • 一方面尽量设计内在相关性更高的项目 • 另一方面也可以考虑适当增加项目的数量
用零点没有调整在中心的秤来测量重量 对于反向题,表示持否定、消极态度的比例
例如,研究者希望测量电视广告的传播效果 (split-half technique)
称能测出结构的量表为具有高的结构效度的量表 最好再请一些专家来帮助判断
除采了用研 有究明目人显员导的的向主性:观的判问了断答之题解外组成广的量告表测能量态否度 引起目标消费群的购买欲望
二、效度(validity)定义 A 当使用两种不同的量表去测量同一概念时,这两种量表是否等价?
鉴别度= PH-PL 项目越多,平均相关系数就可能越高
• 所测量的是不是研究者所想要的 对于正向题,表示持肯定、积极态度的比例
如果能得到比较一致的结果 另一方面也可以考虑适当增加项目的数量
测量信度复习题
测量信度复习题测量信度复习题在心理学和社会科学研究中,测量信度是评估一个测量工具的重要指标。
它衡量了测量工具在不同情境下的稳定性和一致性。
在本文中,我们将回顾一些与测量信度相关的重要概念和复习题,以帮助读者更好地理解和应用这些概念。
一、可靠性与信度1. 什么是可靠性?可靠性是指测量工具在不同情境下的稳定性和一致性。
一个可靠的测量工具应该能够产生一致的结果,即在不同时间、不同场合下,对同一对象进行测量应该得到相似的结果。
2. 可靠性和信度之间有什么关系?可靠性和信度是相互关联的概念。
可靠性是一个更广泛的概念,它包括了信度。
信度是可靠性的一种度量方式,它专注于测量工具的稳定性和一致性。
二、信度的计算方法1. 重复测量法重复测量法是一种常用的计算信度的方法。
它要求在相同的条件下,对同一组被试进行两次或多次测量,并计算测量结果的相关系数。
如果相关系数接近于1,则说明测量工具具有较高的信度。
2. 内部一致性法内部一致性法是另一种计算信度的方法。
它通过分析测量工具内部各个项目之间的相关性来评估信度。
常用的内部一致性方法包括Cronbach's alpha系数和Kuder-Richardson系数。
三、信度的影响因素1. 测量工具的长度测量工具的长度对信度有一定的影响。
通常情况下,测量工具越长,其信度越高。
因为较长的测量工具可以提供更多的信息,减少了测量误差的可能性。
2. 测量工具的稳定性测量工具的稳定性也会影响其信度。
如果测量工具在不同时间点或不同情境下的得分变化较大,那么它的信度就会降低。
3. 被试的特征被试的特征也可能对信度产生影响。
例如,如果被试的情绪状态或注意力水平发生变化,那么测量结果的信度可能会受到影响。
四、信度的应用1. 评估测量工具的可靠性信度可以用来评估一个测量工具的可靠性。
如果一个测量工具具有较高的信度,那么它在不同情境下的测量结果应该是一致的,可以被认为是可靠的。
2. 选择合适的测量工具信度也可以用来帮助选择合适的测量工具。
信度效度_精品文档
(3)Cronbach’sα信度系数 α系数取值在0到1之间,α系数越高,信度越
高,问卷的内部一致性越好。Cronbach’sα系数 不仅适用于两级记分的问卷,还适用于多级计分 的问卷。计算公式:
其中,K为量表中题项的总数, 为第i题得分的 题内方差, 为全部题项总得分的方差。
α系数有以下性质: (1)α系数是所有可能的分半信度的平均值; (2)α系数是估计信度的最低限度; (3)当问卷计分为二分名义变量时,即答案为0或 1,α系数与KR20值相同,即库德-理查森信度公式 是克隆巴赫的α系数的一个特例。
一、信度的概念
信度(Reliability)即可靠性,是指根据测量工 具所得到的测量结果的一致性或稳定性,反映客观 事物被测特征真实程度的度量指标。
• 这种稳定可以是在对同一测验而言,也可以是 对平行测验而言。
• 信度反映的是消除随机误差的程度。 • 信度通常以相关系数计算,取值范围为[0,1]。
二、信度的种类及计算
信度主要分为四大类: • 重测信度(Test-retest Reliability) • 复本信度(Alternate-form Reliability) • 内部一致性信度(Internal Consistency Reliability) • 评分者信度(Scorer Reliability)
(2)库得─理查森信度
库德-理查森信度适用于计算“对或错”的是非 题的同质性信度,其是计算所有可能的分半信 度的平均数。最有代表性的计算公式是库德-理 查森公式:
为问卷测验总得分的方差,pi表示答对该 题的人数占总答卷人数的比例,pi可视为该题的 难度,qi=1-pi。式中n为问卷包含的题项总数.
三、影响信度的因素
测试时间
第五章、心理测验的技术指标
统计平均值
统计平均值:为了表示一组数 据的规律性,需要计算出一 些能够反映这组数据的统计 特征的数字。我们把它们称 为统计平均值。最常用的统 计平均值是平均数和标准差。
(一)、平均数(M):反映一组数据 的集中趋势。 计算公式是M=(∑Xi)/N 例1:有几组观测数据,请分别计算它 们的平均数? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;
最常见的常模表示方法有两种:标准分 数和百分位数。 标准分数是在原始分的基础上按照一定 的规则转化过来的,它反映了原始分数 在分数总体中的相对位置。 百分位系统,又称百分制,它是将一组测 验分数分成100等分。一个百分位数反 映在标准团体中高于和低于某个分数的 人数比例。例如,不管实际的得分是多 少,如果某人在测验中的得分为80百分 位数,那就意味着高于这个分数的人只 有20%,他处于80%人的最前端。
1.测验题目不能反应要测量的特 征.
2. 实施过程偏离了标准化的程 序. 3. 被试不如实回答.
2、效度的类别
类别 解释说明:
指测验项目所涉及的内容对欲测内容范围的代 表性程度。或者说所测内容对要测内容范围取 样的代表性。 构想效度表示一个测验是否达到了对某一理论 概念或特质的测量。如果一个人格测验测得的 结果与该测验所依据的人格理论或假设相符合, 那么,我们说该测验具有较高的构想效度。 预测效度又称效标关联效度,是指一个测验对 我们所感兴趣的行为能够预测到什么程度。在 这里,被预测的行为是检验测验效度的标准,简 称效标。
(二)、标准差(S):标准差就是一 组数据离平均数的平均距离。反映一组 数据的分散程度。 计算公式:S=√∑(Xi-M)2/N 例1:有几组观测数据,请分别计算它 们的标准差? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.问卷设计质量的信度检验
所谓问卷设计质量的信度检验,指的是对问卷测量结果准确性的分析,即对设计的问卷在多次重复使用下得到的数据结果的可靠性的检验。
在实际应用中,信度检验多以相关系数表示,常用的方法有:重测信度,复本信度,折半信度,克朗巴哈 信度,评分者信度等。
国内外已经有很多关于这些信度分析方法介绍的文献,在这里,笔者不再一一详述,仅列出相关公式作为参考。
(1)重测信度,也叫稳定系数,对同一组调查对象采用同一调查问卷进行先后两次调查,采用检验公式
,其中
为两次调查结果的协方差,
为第一次调查结果
的协方差, 为第二次调查结果的协方差。
系数值越大说明信度越高。
(2)复本信度,也叫等值系数,对同一组调查对象进行两种相等或相近的调查,要求两份问卷的题数、形式、内容及难度和鉴别度等方面都要尽可能的一致。
检验公式同稳定系数公式,系数越大,说明两份问卷的信度越高,具体调查时使用哪一份都可以。
(3)折半信度,也叫内在一致性系数,将调查的项目按前后分成两等份或按奇偶题号分成两部分,通过计算这两部分调查结果的相关系数来衡量信度。
当假定两部分调查结果得分的方差相等时,检验用Spearman-Brown 公式来表示:
, 其中 表示折半信
度系数;当假定方差不相等时,采用Flanagan 公式: ,其中 、 分别表示两部分调查结果的方差, 表示整个问卷调查结果的方差。
如果折半信度很高,则说明这份问卷的各项题之间难度相当,调查结果信度高。
(4)Cronbach’s α系数是Cronbach 于1951年创立的,是指测验内部的项目在多大程度上考察了同一内容,评价的是量表中各题项得分间的一致性。
同构型信度低时,即使各个测试题看起来似乎是测量同一特质,但测验实际上是异质的,即测验测量了不止一种特质。
α信度系数法是目前最常用的内部信度系数。
实际上,α系数是所有可能的分半信度的平均值,α系数是估计信度的最低限度,α系数高时,信度就高,α系数低时,信度不一定低。
低信度:α<0.35, 中信度: 0.35<α<0.70,高信度: 0.70<α。
一般来说,问卷的α系数在0.8以上该问卷的信度较好,达0.85以上,表明问卷信度良好。
克朗巴哈 信度,是对折半信度的改进,检验公式是:)1(1k k 2
2
i σσα∑--=
,其中K
表示问卷中的题目数, 为第i 题的调查结果方差, 为全部调查结果的方差。
信度
系数是目前最常用的信度分析法。
(5)评分者信度,包括 信度和
信度,将问卷中的每道题看作是一个变量,然后
通过调查的结果得分对所有问题做因子分析。
得到 ,
,其中
是最大特征值,N 是问题数, 是因子分析法的第i 个问题的共同度。
例:
【壹】内部一致性(Internal Consistency Coefficient)【计算α系数】
有5题问答题的随测验施测5名学生,每题问答题配分是5分,以下是施测
结果,请计算信度。
person Item 1 Item 2 Item 3 Item 4 Item 5
Joe 3 4 4 3 5
Sam 4 3 4 3 3
Sue 2 3 3 2 3
Peg 4 4 5 3 4
Gil 3 2 4 3 3
Dot 3 2 3 2 3
步骤一输入数据
步骤二按【Analyze】→【Scale】→【Reliability Analysis】将左边方格内的变项全选入右边items的方格内,在左下角
的Model框中选取Alpha后按键。
步骤三出现下列对话框候选取下列勾选处,后按键
按。
Reliability
****** Method 2 (covariance matrix) will be used for this analysis ******
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Correlation Matrix
ITEM_1 ITEM_2 ITEM_3 ITEM_4 ITEM_5
ITEM_1 1.0000
ITEM_2 .2970 1.0000
ITEM_3 .7647 .5941 1.0000
ITEM_4 .6860 .4330 .8575 1.0000
ITEM_5 .1588 .8018 .4763 .4629 1.0000
N of Cases = 6.0
Item-total Statistics
Scale Scale Corrected
Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted
ITEM_1 13.0000 6.4000 .5251 .6471 .8472 ITEM_2 13.1667 5.3667 .6757 .7500 .8116 ITEM_3 12.3333 5.4667 .8333 .8588 .7642 ITEM_4 13.5000 6.7000 .7481 .7857 .8093 ITEM_5 12.6667 5.8667 .5922 .7143 .8333
Reliability Coefficients 5 items
Alpha = .8457 Standardized item alpha = .8609
纸笔计算结果
σi 2 =
X =16.1667, σ2=7.4722 σ=2.7335 k=5 N=6
85
.84575.)3234.1)(25.1()4722
.74166
.21)(25.1()4722.75833.2222.4722.6667.4722.1(45==-=-=++++-
=α。