第三单元信度与测验分数的解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三单元信度与测验分数的解释
一、解释真实分数与实得分数的相关。
信度系数(0-1.00)可以解释为总的方差中有多少比例是由真实分数的方差决定的,如,当rxx=0.90时,即表示所得分数中有90%的变异是由真分数造成的,仅10%是来自测验的误差。
二、确定信度可以接受的水平。
一个测验究竟信度多高才合适:一般原则是:当rxx〈 0.70 时,测验不能用于对个人进行评价和预测,而且不能作团体比较.新编的测验信度应高于原有的同类测验或相似测验。
三、解释个人分数的意义。
1、估计真实分数的范围。
2、了解实得分数再测时可能的变化情形。
人们一般采用95%的概率水平,其置信区为:
X-1.96SE<XT≤X+1.96SE
S X为所得分数的标准差,r xx为测验的信度,SE为标准误。
表示大约有95%的可能性真分数落在所得分数±1.96SE范围内,或有5%的可能性落在范围之外.
例:IQ为100,是否反应真实水平?
四、比较不同测验分数的差异。
即比较两个人不同分数的差别和同一受测者在两个测验上的差别。这是差异分数的标准误的问题。计算公式:
S为两个测验的标准差,r xx和r yy分别为两个测验的信度。
例:某被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88.
计算得SEd=7.5,所以被试的差异分数110-102=8是不显著的.
第四单元影响信度的因素
一、样本特征
(一)样本团体异质性的影响。
若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。
(二)样本团体平均能力水平的影响。
对于不同水平的团体,题目具有不同的难度每个题目在难度上的微小差异累计起来便会影响信度。
二、测验长度
在一个测验中增加同质的题目可以使信度提高。
1、测验越长,测验的测题取样或内容取样就越具有代表性。
2、测验越长,被试的猜测因素影响就越小。
三、时间间隔
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大,间隔时间越久,信度系数便越低。
三、测验难度
洛德提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:
五择一测题,0.70;
四择一测题,0.74;
三择一测题,0.77;
是非题,0.85.