信度分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 信度概述

1.1 信度

问卷调查法是研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷架构,从而提升问卷的信度和效度,在此主要讨论信度分析。

信度又叫可靠性,是指测量结果的稳定性程度或一致性程度。一个好的测验必须稳定可靠,即多次测量的结果保持一致,否则便不可信。作好问卷调查后,接下来为了进一步考验问卷的可靠性与有效性,即要做信度分析(Reliability Analsis),信度本身与测量所得结果正确与否无关,它的功用在于检验测量本身是否稳定。

例如:我们用一个智力量表去测量某一个儿童,第一次测得的结果是IQ=90,第二次测得的结果是IQ=120。那么我们就会问:到底这儿童的智商是多少?这就是该智力测验的可靠性有问题。就好象用橡皮筋去量东西的长度。前面讲过,任何一种测量,总有或多或少的误差,信度受随机误差的影响。随机误差越大,信度也就越低;随机误差越小,信度就越高。因此,信度也可看作测量结果受机遇影响的程度。测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致,信度除受测验质量影响外,亦受很多其他受测者因素的影响,故没有一份测验是完全可靠的。信度只是一种程度上大小的差别而已。一致性高的问卷便是只同一群人接受性质相同题型相同目的相同的各种问卷测量后,在各衡量结果间显示出强烈的正相关。稳定性高的测量工具则是指一群人在不同时空下接受同样的衡量工具时,结果的差异很小。

一般信度的测量时容易产生误差的原因,是来自研究者的因素包括:测量内容(遣词用句、问题形式等)不当、情境(时间长短、气氛、前言说明等)以及研究者本身的疏忽(听错、记错等);而来自受访者的因素则可能是由于其个性、年龄、教育程度、社会阶层及其他心理因素等,而影响其答题的正确性。

问卷内容的同构型及受访时间间隔的影响是影响信度的两个主要因素。

在测量理论中,信度被定义为:一组测量分数的真变异数与总变异数(实得分数的变异数)的比率。即:

XX = S T2 /S X2

式中γ

XX 代表测量的信度,S

T2

代表真分数变异数,S

X2

代表总变异数,即实得

分数的变异数。

由于X=T+E,所以信度还可表示为:

γXX=(S X2-S E2)/ S X2=1- S E2/ S X2

由于真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,由于我们无法得到测验的真正信度,我们只能用一些指标对它进行估计。

1.2 信度系数

大部分的信度指标都以相关系数来表示,即用同一被试样本所得的两组资料的相关作为测量一致性的指标,称作信度系数。

对信度系数要注意三点:(1)在不同的情况下,对不同样本,采用不同方法会得到不同的信度系数,因此一个测验可能不止一个信度系数。(2)信度系数只是对测量分数不一致程度的估计,并没有指出不一致的原因。(3)获得较高的信度系数并不是测量追求的最终目标,它只是迈向目标的一步,是使测验有效的一个必要条件。

若以信度系数来表示信度的大小,信度系数越大,表示测量的可信程度越大。信度系数达到多高才可以接受呢?最理想的情况是γXX=1,但这是办不到的。不过我们可用已有的同类测验作为比较的基准。一般能力与成就测验的信度系数要求在0.90以上,有的可以达到0.95;至于性格、兴趣、价值观等人格测验的信度系数,通常在0.80到0.85或更高些。当γXX<0.70时,不能用测验来对个人作评价,也不能在团体间作比较;当γXX大于或等于0.70时,可用于团体间比较;当γXX大于或等于0.85时,可用于鉴别个人。

学者DeVellis (1991)认为,0.60~0.65(最好不要);0.65~0.70(最小可接受值);0.70~0.80(相当好);0.80~0.90(非常好)。由此,一份信度系数好的量表或问卷,最好在0.80以上,0.70至0.80之间还算是可以接受的范围;分量表最好在0.70以上,0.60至0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应考虑重新修订量表或增删题项。

任何测验只有包含特定样本的题目,由特定的施测者,对特定的被试,在特定的时间、地点施测,情况不同便会得到不同的分数。由于信度系数总是在特定情况下获得的,因此,只有当一个测验在很多情况下被证实具有较高的信度时,

才可以说它是比较可靠的测验。

1.3 信度的作用

信度系数有两个实际用处:一是用来解释个人分数的意义,二是用来比较不同测验分数的差异。

1.信度可以用来解释个人测验分数的意义

由于存在测量误差,一个人所得分数有时比真分数高,有时比真分数低,有时二者相等。理论上我们可对一个人施测无限多次,然后求所得分数的平均数与标准差,这样平均数就是这个人的真分数,标准差就是测量误差大小的指标。但这在实际上是行不通的。然而,我们可以用一组被试(人数足够多)两次施测的结果来代替对同一个人反复施测,以估计测量误差的变异数。此时,每个人在两次测验中的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误,是表示测量误差大小的指标。

测量的标准误可用下式计算:

SE=S 1 - γXX

这里SE为测量的标准误,S为所得分数的标准差,γXX为测量的信度。从式中可以看出,测量的标准误与信度之间有互为消长的关系:信度越高,标准误越小;信度越低,标准误越大。

根据上公式,知道了一组测量的标准差和信度系数,就可以求出测量的标准误。进一步我们就可以从每个人的实得分数估计出真分数的可能范围,即确定出在不同或然率水准上真分数的置信区间。人们一般采用95%的或然率水准,其置信区间为:

(X-1.96SE)≤ T ≤ (X+1.96SE)

这就是说,大约有95%的可能性真正分数落在所得分数±1.96SE的范围内,或者5%的可能性落在这范围之外。这实际上也表明了再测时分数改变的可能范围。

例如:在一次测验中有一学生得80分,这是否反映了他们的真实水平?如果再测一次他的分数将改变多少?已知该次测验的标准差为5,信度系数为0.84。

首先计算SE:

相关文档
最新文档