《心理测量信度》PPT课件
合集下载
心理测量学 PPT课件
因此,心理咨询师有必要了解心理测量的理论和技术。
❖
心理测量学知识部分的主要包括的内容有: 第1节 概述 第2节 测验的常模 第3节 测验的信度 第4节 测验的效度 第5节 项目分析 第6节 测验编制的一般程序 第7节 心理测验的使用
参考书目
❖ 主要依据国家职业资格培训教程的《心理咨询师(基础知识)》考试 中的《心理测量知识》部分进行。这本书的主要参考教材有: 1.郑日昌、蔡永红和周益群著,《心理测量学》,人民教育出版社, 1999 2.龚耀先主编,《心理评估》,高等教育出版社,2003 3.姜长青主编,《心理测验学》,吉林教育出版社,2004 4.戴海崎、张锋和陈雪枫主编,《心理与教育测量》,暨南大学出 版社,2002 5.顾海根编著,《学校心理测量学》,广西教育出版社,1999 6.宋维真、张瑶主编,《心理测量学》,科学教育出版社,1987 7.彭凯平编著,《心理测验——原理与实践》,华夏出版社,1990
的人数百分比。百分等级55的分数表示在常模,样本中有55%的人低于 这个分数。
最早的一个范例是葛塞尔发展程序表 (二)智力年龄
比内-西蒙量表中首先使用智力年龄的概念:基础年 龄与在较高年龄水平的题目上获得的附加月份之和。 计算方法:假如某儿童6岁组的题目全部通过,7岁组通过 4题,8岁组通过3题,9岁组通过2题,其智龄为:6(岁) +42(月)+32(月)+22(月)=6岁+18月=7岁6个月。 (三)年级当量
第一节 概述
【考查要点】 1.测量的含义; 2.不同的测量量表:命名、顺序、等
距和等比量表; 3.测验观:错误的和正确的; 4.不同的测验种类。
第一单元、测量与测量量表
一、什么是测量 • 测量就是依据一定的法则用数字对事物加以确定。 • 定义中包括三个主要的元素:(1)事物 (2)数字
心理测量学第三节 测量的信度
❖ 将差异标准误(7.5)乘以1.96,结果为14.7,这 表明个体在韦氏测验两半得分的差异大约15分, 才能达到0.05水平显著,上述被试的差异分数8 分,是不显著的。
2010年5月(二级)
❖ 10、某受测者在韦氏成人智力测验中言语智 商为102,操作智商为110。已知两个分数都 是以100为平均数、15为标准差的标准分数。 假设百语测验和操作测验的分半信度分别为 0.87和0.88,则该受测者的操作智商( )于言 语智商。
2009年5月(三级)
❖ 35、以再测法或复本法求信度,两次测验相 隔时间越短,其信度系数越( )
❖ (A)大 -
(B)低
小
(D)不确定
(C)
数分布范围最大,求得的信度也最高。 ❖ 对于选择题目由于存在着猜测因素,难度值应提高。 ❖ 洛德(lord)提出学绩测验中,各类选择题的理想
平均难度为:五择一测题0.70,四择一测题0.74, 三择一测题0.77,是非题0.85。
时间间隔与信度
❖ 只对重测信度和间隔施测的复本信度有影 响
❖ 两次测验相隔时间越短,其信度系数越大; 间隔时间越久,其他变因介入的可能性越 大,受外界影响也越大,信度系数便越低
❖ 即:X=T+E
一.信度的定义
❖ 信度是指测量结果的可靠性和一致性. ❖ 理论定义:一组测量分数的真实方差与实得方差的
比,即真空方差占总方差的百分比.
SX 2 ST 2 SE2
❖ 操作性定义:信度有是一个测验X与它的任意一个 平行测验X’的相关系数.
信度的定义
rxx
ST2
S
2 X
rxx
❖ 另一原则是:新编的测验信度应高于原有的同类测 验或相似测验。
2010年5月(二级)
❖ 10、某受测者在韦氏成人智力测验中言语智 商为102,操作智商为110。已知两个分数都 是以100为平均数、15为标准差的标准分数。 假设百语测验和操作测验的分半信度分别为 0.87和0.88,则该受测者的操作智商( )于言 语智商。
2009年5月(三级)
❖ 35、以再测法或复本法求信度,两次测验相 隔时间越短,其信度系数越( )
❖ (A)大 -
(B)低
小
(D)不确定
(C)
数分布范围最大,求得的信度也最高。 ❖ 对于选择题目由于存在着猜测因素,难度值应提高。 ❖ 洛德(lord)提出学绩测验中,各类选择题的理想
平均难度为:五择一测题0.70,四择一测题0.74, 三择一测题0.77,是非题0.85。
时间间隔与信度
❖ 只对重测信度和间隔施测的复本信度有影 响
❖ 两次测验相隔时间越短,其信度系数越大; 间隔时间越久,其他变因介入的可能性越 大,受外界影响也越大,信度系数便越低
❖ 即:X=T+E
一.信度的定义
❖ 信度是指测量结果的可靠性和一致性. ❖ 理论定义:一组测量分数的真实方差与实得方差的
比,即真空方差占总方差的百分比.
SX 2 ST 2 SE2
❖ 操作性定义:信度有是一个测验X与它的任意一个 平行测验X’的相关系数.
信度的定义
rxx
ST2
S
2 X
rxx
❖ 另一原则是:新编的测验信度应高于原有的同类测 验或相似测验。
心理测量第三篇—信度
二、概化理论的基本原理和概念
1.测量目标——希望测量的实体,如能力、 成就等特性。 2.侧面——一组特定的测量条件,其中条 件的数量为该侧面的水平。
例题:如果要求每个被试写两篇题目不同的短文,并 由三名评分者给所有短文评分 测量目标:被试的写作水平; 侧面:题目和评分者; 水平数:分别为2和3。
二、测验长度的影响
一般说来,在—个测验中增加同质性的题 目,可以使信度提高。
二、测验长度的影响
假设有一个包括10个题目的测验,信度 为0.50,若把测验增加到50个题目,其 信度将增加到:
二、测验长度的影响
当由于测题过少而导致信度较低时,增加 多少个题目可以达到理论的信度指标,可 以用下式来推算:
一、概化理论对经典测验理论的发 展
2.概化理论的诞生及其特点 (1)诞生:1972年,克朗巴赫出版《行 为测量的可靠性:测验分数和剖面图的概 化理论》,正式形成了概化理论(GT)。 (2)特点: 克朗巴赫指出:“概化分析超越经典信度 分析之处在于它明确问到,这个分析过程 如何计算误差?每个来源的变异有多大?”
一、测量的标准误的含义及其作用
5.测量的标准误差的解释
比如:以95%的置信度为标准,则Z0.95=1.96,
它表示真分数有95%的可能性落在 范围内。
二、直接估计标准误差
1.公式: 估计信度rtt要求每个人都有两个测验分数, 估计Se也是一样要求每个人要有成对的分 数,每个人成对的分数由复份法、再测法、 分半法获得。
(二)分半信度
2.“斯皮尔曼—布朗公式”校正
条件:两个分半测验分数的变异性相等。
(二)分半信度
当两个分半测验分数的变异性不等时: 费拉南根(Flanagan)公式:
【心理测量学 课件】信度c
x = 10, Mean = 75
meas = 7.07
b. Assume reliability is .9:
x = 10, Mean = 75
meas = 3.16
For applicant with a score of 70: There is a 95% chance that his/her true score is: a. 2 (7.07) or 70 14.14 or 55.86 and 84.14
Test Mean S.D. Reliability
Vocab. 10 Comp. 10 Trans. 10 Math. 10 Reas. 10
3 .80 3 .60 3 .90 3 .85 3 .85
rxy with Comp. .65
rxy with Trans. .33 .30
rxy with Math. .60 .55 .35
2 测量的标准误
• Standard Error of Measurement(SEM):测 量误差分布的标准差
• 假设在不受练习或疲劳等因素的影响下, 以同一测验重复测量相同受试者无限多次, 由于随机误差的影响,各测验实得分数与 真实分数的差,会呈正态分布
2.测量的标准误
• σe
SEM x 1 rtt
SEM 和个体测验分数
• 测量误差被假设呈正态分布,因此,可以 用来进行测量分数的区间估计
• For the 95% confidence interval,
X - 1.96 SEM < T < X + 1.96 SEM
SEM 和置信区间
meas = x 1 rtt
a. Assume reliability is .5:
meas = 7.07
b. Assume reliability is .9:
x = 10, Mean = 75
meas = 3.16
For applicant with a score of 70: There is a 95% chance that his/her true score is: a. 2 (7.07) or 70 14.14 or 55.86 and 84.14
Test Mean S.D. Reliability
Vocab. 10 Comp. 10 Trans. 10 Math. 10 Reas. 10
3 .80 3 .60 3 .90 3 .85 3 .85
rxy with Comp. .65
rxy with Trans. .33 .30
rxy with Math. .60 .55 .35
2 测量的标准误
• Standard Error of Measurement(SEM):测 量误差分布的标准差
• 假设在不受练习或疲劳等因素的影响下, 以同一测验重复测量相同受试者无限多次, 由于随机误差的影响,各测验实得分数与 真实分数的差,会呈正态分布
2.测量的标准误
• σe
SEM x 1 rtt
SEM 和个体测验分数
• 测量误差被假设呈正态分布,因此,可以 用来进行测量分数的区间估计
• For the 95% confidence interval,
X - 1.96 SEM < T < X + 1.96 SEM
SEM 和置信区间
meas = x 1 rtt
a. Assume reliability is .5:
心理测量学课件 信度
标出符合你个人情况的命题,其他的空出来。 在每一道命题上,不能停留太久,根据自 己的第一反应或第一印象作答。 S — 1.人们说我非常友好。 M — 2.我只有几个朋友,但我们非常密切! C — 3.我是天生的领导者。 P — 4.我宁可节省而不乱花钱。 S — 5.我享受生活! M — 6.我喜欢每个细节都完美。 M — 7.我情绪不定,我早上起床不知今天会 是什么情绪。 M — 8.我发觉很容易批评人与事。
2.1.3 常模
常模是一种供比较的标准量数,由标准化样本 测试结果计算而来,即某一标准化样本的平均 数和标准差。
2.1.3 常模
常模取样的方法:
㈠随机抽样法:①简单随机抽样②系统抽样③ 分组抽样④分层抽样(能够避免简单随机抽样 中样本集中于某种特性或缺少某种特性的现象。 还可以分为分层比例抽样、分层非比例抽样) ㈡非随机抽样法
第四次课
2.4 心理测验的实施
2.4.1测验的选择
适合测量的目的
符合心理测量学的要求
2.4 心理测验的实施
测验前的准备 预告测验—不搞突然袭击 主试自身的准备—熟悉指导语;熟悉具体程序; 应急的心理准备 测验材料的准备—预先模拟一遍测验
测验环境的准备—安静、通风、采光良好
2.4 心理测验的实施
考虑被试在测验前的经历或背景因素 注重测验的效度资料,在解释分数时应从最相 匹配的团体和最相近的情境中获得的资料 将测验分数视为一个范围而不是一些确定的点 对来自不同测验的分数不能直接加以比较
2.5 分数的合成与解释
分数的解释 如何向当事人报告分数 使用当事人所理解的语言 让当事人知道这个测验测量或预测什么 让当事人知道他是和什么团体进行比较 让当事人认识到分数只是一个最好的估计 让当事人知道如何运用他的分数 要考虑测验分数将给当事人带来什么影响 让当事人积极参与测验分数的解释
《心理测量信度》课件
02
信度系数可以帮助雇主了解测验的一致性和可靠性,从而更好地解释 和比较测验结果。
03
在职业测验中,信度可以通过重测法、分半法、同质性法等方法进行 评估。
04
高信度的测验结果可以更准确地反映应聘者的能力和潜力,为雇主做 出更明智的招聘决策提供支持。
信度在临床心理测验中的应用
在临床心理测验中,信度是评 估测验可靠性和稳定性的关键
因素。
在临床心理测验中,信度可以 通过重测法、分半法、同质性 法等方法进行评估。
信度系数可以帮助心理医生了 解测验的一致性和可靠性,从 而更好地解释和比较测验结果
。
高信度的测验结果可以更准确 地反映患者的心理状况和需求 ,为心理医生制定更有效的治 疗方案提供支持。
THANKS
感谢观看
测验难度
测验难度对信度的影响主要体现在被 试的得分分布上。如果测验难度适中 ,被试的得分分布较为集中,信度就 较高;如果测验难度过高或过低,被 试的得分分布就会过于分散,导致信 度下降。
VS
在编制心理测验时,应根据测验的目 的和被试的特点来设置适当的难度水 平,以保证测验的信度。
被试样本
被试样本的差异也会影响测验的信度 。如果被试样本具有代表性,那么测 验的信度就较高;如果被试样本偏差 较大,那么测验的信度就会受到影响 。
信度的意义
提高测量结果的可靠性
信度评估可以确定测量工具的一致性 ,从而提高测量结果的可靠性,使结 果更加准确可靠。
减少误差
比较和解释
信度评估可以比较不同测量工具之间 的结果,以及在不同时间或情境下对 同一对象进行测量的结果,从而更好 地解释和比较测量结果。
信度评估可以识别和减少测量误差, 从而提高测量的准确性。
信度系数可以帮助雇主了解测验的一致性和可靠性,从而更好地解释 和比较测验结果。
03
在职业测验中,信度可以通过重测法、分半法、同质性法等方法进行 评估。
04
高信度的测验结果可以更准确地反映应聘者的能力和潜力,为雇主做 出更明智的招聘决策提供支持。
信度在临床心理测验中的应用
在临床心理测验中,信度是评 估测验可靠性和稳定性的关键
因素。
在临床心理测验中,信度可以 通过重测法、分半法、同质性 法等方法进行评估。
信度系数可以帮助心理医生了 解测验的一致性和可靠性,从 而更好地解释和比较测验结果
。
高信度的测验结果可以更准确 地反映患者的心理状况和需求 ,为心理医生制定更有效的治 疗方案提供支持。
THANKS
感谢观看
测验难度
测验难度对信度的影响主要体现在被 试的得分分布上。如果测验难度适中 ,被试的得分分布较为集中,信度就 较高;如果测验难度过高或过低,被 试的得分分布就会过于分散,导致信 度下降。
VS
在编制心理测验时,应根据测验的目 的和被试的特点来设置适当的难度水 平,以保证测验的信度。
被试样本
被试样本的差异也会影响测验的信度 。如果被试样本具有代表性,那么测 验的信度就较高;如果被试样本偏差 较大,那么测验的信度就会受到影响 。
信度的意义
提高测量结果的可靠性
信度评估可以确定测量工具的一致性 ,从而提高测量结果的可靠性,使结 果更加准确可靠。
减少误差
比较和解释
信度评估可以比较不同测量工具之间 的结果,以及在不同时间或情境下对 同一对象进行测量的结果,从而更好 地解释和比较测量结果。
信度评估可以识别和减少测量误差, 从而提高测量的准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 心理测量的信度
第一节 第二节 第三节
什么是信度 估计信度的方法 影响信度系数的因素
a
1
一、信度的意义 二、信度系数的作用
back
a
2
一、信度的意义
信度即测验的可靠性,指的是测量的一致性程 度。
信度受随机误差的影响,随机误差越大,信度 越低。
在测量学中,信度被定义为:一组测量分数的
(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
a
6
1.评价测验 信度系数是衡量测验好坏的一个重要的技术指
标。 一般能力与学绩测验的信度系数为0.90以上,
有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
a
11
例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95% 的可靠度要求下,变动范围应是多大?
a
12
注意几点: (1)SE对真分数做的是区间估计,不可
能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。 (2)置信水平确定后,估计的精度主要 取决于SE,SE越小,范围越小,估计就 越精确,反之也然。 (3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。
数的差异与1.96SEd(0.05显著性水平)进行比较,
如果其绝对值大于此值,则差异显著,否则差异 不显著。
a
15
例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分, 此次数学测验年级平均分是81分,标准 差是10分,此次测验的信度系数是0.91;
a
7
2.用来估计个人的测验分数(真分数)
由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数, 标准差则为误差大小的指标。
a
8
X
a
9
在实际工作中,我们用一组被试(人数足够多) 两次施测的结果来代替对同一个人反复施测, 以估计测量误差的变异数。此时,个人在两次 测验中的分数差异就是测量误差。据此可制成 误差分数的分布。这个分布的标准差(误差分 布的标准差)我们称之为测量的标准误,是表 示测量误差的大小的指标,其计算公式为:
SESx 1rxx
(公式5-4)
式中SE表示测量的标准误,即误差分布的标准 差 度系;数Sx表。示一次测量分数的标准差;rxx表示信
a
10
我们可以用测量的标准误来估计个人测 验的真分数的大小。
如果选用95%的可靠性水平(置信水 平),即显著性水平(a值)为.05,, 真分数有95%的可能落入X ± Z S2 E ,即X ±1.96 SE的范围之内,也可以写成X- 1.96SE T X+1.96 SE,SE则用公式 5-4代入。或有5%的可能落入这范围之 外。这实际上也表明了再测时分数改变 的可能范围。
真变异数与总变异数(实得变异数)的比率。
即
rxx
S
2 T
S 2X
(公式5-1)
式中 rxx代表信度系数,S 2T 代表真分数的变异数,
S
2 X
代表实得分数的变异数,即总变异数。
a
3
根据公式5-1,信度还可以表示为:
rxxBiblioteka 1S 2E S2X
(公式5-2)
a
4
这个定义有两点要注意:
(1)信度是一组测量分数的特性,不是 某个测量分数的特性。是对一个人测量 多次或对一个群体进行测量得到一组测 量分数的特性
a
13
3.用来对两种测验分数进行比较
来自不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。
如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。
(2)真分数的变异数不能直接测量,因 此信度是一个理论上构想的概念,只能 根据一组实得分数进行估计。
a
5
对于信度系数,还应该注意以下几点:
(1)在不同的情况下,对于不同的样本, 采用不同的方法会得到不同的信度系数, 因此一个测验可能不止一个信度系数。
(2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。
a
14
我们可以用“差异的标准误”来检验差异的显著 性。
差异的标准误的公式为: SdE S12 E S2E 2S2rxx ry(y 公式5-5)
r SE d为差异的标准误,S为相同尺度的xx标准ry分y 数的 标准差,Z分数为1,T分数为10。 、 分别为 两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
求相关,其相关系数就叫再测信度。其计算公
式(皮尔逊积差相关公式的变式)为:
式 为全中体Xr1x、被x试X2为两X同次1X测一S21NS验被2的试X平的1X均两2 数次,测S验(1、分公S数式25,为-X两61 、)次X
2
测验的标准差,N为被试人数。
再测法的模式是:施测 适当时距 再施测
a
18
例2:假设有一份主观幸福感调查表,先后两次施测于 10名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。)
问小张这两次数学测验的成绩是否有显 著差异?
back
a
16
一、再测信度 二、复本信度 三、等值稳定性系数 四、内部一致性系数 五、评分者信度 总结 练习
back
a
17
再测信度(Test-Retest Reliability) ,也叫 重测信度,也叫稳定性系数。用同一个测验,
对同一组被试前后施测两次,对两次测验分数
第一节 第二节 第三节
什么是信度 估计信度的方法 影响信度系数的因素
a
1
一、信度的意义 二、信度系数的作用
back
a
2
一、信度的意义
信度即测验的可靠性,指的是测量的一致性程 度。
信度受随机误差的影响,随机误差越大,信度 越低。
在测量学中,信度被定义为:一组测量分数的
(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
a
6
1.评价测验 信度系数是衡量测验好坏的一个重要的技术指
标。 一般能力与学绩测验的信度系数为0.90以上,
有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
a
11
例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95% 的可靠度要求下,变动范围应是多大?
a
12
注意几点: (1)SE对真分数做的是区间估计,不可
能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。 (2)置信水平确定后,估计的精度主要 取决于SE,SE越小,范围越小,估计就 越精确,反之也然。 (3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。
数的差异与1.96SEd(0.05显著性水平)进行比较,
如果其绝对值大于此值,则差异显著,否则差异 不显著。
a
15
例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分, 此次数学测验年级平均分是81分,标准 差是10分,此次测验的信度系数是0.91;
a
7
2.用来估计个人的测验分数(真分数)
由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数, 标准差则为误差大小的指标。
a
8
X
a
9
在实际工作中,我们用一组被试(人数足够多) 两次施测的结果来代替对同一个人反复施测, 以估计测量误差的变异数。此时,个人在两次 测验中的分数差异就是测量误差。据此可制成 误差分数的分布。这个分布的标准差(误差分 布的标准差)我们称之为测量的标准误,是表 示测量误差的大小的指标,其计算公式为:
SESx 1rxx
(公式5-4)
式中SE表示测量的标准误,即误差分布的标准 差 度系;数Sx表。示一次测量分数的标准差;rxx表示信
a
10
我们可以用测量的标准误来估计个人测 验的真分数的大小。
如果选用95%的可靠性水平(置信水 平),即显著性水平(a值)为.05,, 真分数有95%的可能落入X ± Z S2 E ,即X ±1.96 SE的范围之内,也可以写成X- 1.96SE T X+1.96 SE,SE则用公式 5-4代入。或有5%的可能落入这范围之 外。这实际上也表明了再测时分数改变 的可能范围。
真变异数与总变异数(实得变异数)的比率。
即
rxx
S
2 T
S 2X
(公式5-1)
式中 rxx代表信度系数,S 2T 代表真分数的变异数,
S
2 X
代表实得分数的变异数,即总变异数。
a
3
根据公式5-1,信度还可以表示为:
rxxBiblioteka 1S 2E S2X
(公式5-2)
a
4
这个定义有两点要注意:
(1)信度是一组测量分数的特性,不是 某个测量分数的特性。是对一个人测量 多次或对一个群体进行测量得到一组测 量分数的特性
a
13
3.用来对两种测验分数进行比较
来自不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。
如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。
(2)真分数的变异数不能直接测量,因 此信度是一个理论上构想的概念,只能 根据一组实得分数进行估计。
a
5
对于信度系数,还应该注意以下几点:
(1)在不同的情况下,对于不同的样本, 采用不同的方法会得到不同的信度系数, 因此一个测验可能不止一个信度系数。
(2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。
a
14
我们可以用“差异的标准误”来检验差异的显著 性。
差异的标准误的公式为: SdE S12 E S2E 2S2rxx ry(y 公式5-5)
r SE d为差异的标准误,S为相同尺度的xx标准ry分y 数的 标准差,Z分数为1,T分数为10。 、 分别为 两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
求相关,其相关系数就叫再测信度。其计算公
式(皮尔逊积差相关公式的变式)为:
式 为全中体Xr1x、被x试X2为两X同次1X测一S21NS验被2的试X平的1X均两2 数次,测S验(1、分公S数式25,为-X两61 、)次X
2
测验的标准差,N为被试人数。
再测法的模式是:施测 适当时距 再施测
a
18
例2:假设有一份主观幸福感调查表,先后两次施测于 10名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。)
问小张这两次数学测验的成绩是否有显 著差异?
back
a
16
一、再测信度 二、复本信度 三、等值稳定性系数 四、内部一致性系数 五、评分者信度 总结 练习
back
a
17
再测信度(Test-Retest Reliability) ,也叫 重测信度,也叫稳定性系数。用同一个测验,
对同一组被试前后施测两次,对两次测验分数