第五章心理测量的信度说课讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表5-1 某幸福感调查表的两次测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 16 15 13 13 11 10 10 9 8 7
X2 16 16 14 12 11 9 11 8 6 7
计算再测信度必须注意几个问题:
(1)所测量的特性必须是稳定的。当然绝对 的稳定是不可能的,但应该是比较稳定的。
SE
,即
X ±1.96 SE的范围之内,也可以写成X
-1.96SE T X+1.96 SE,SE则用公
式5-4代入。或有5%的可能落入这范围
之外。这实际上也表明了再测时分数改
变的可能范围。
例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95% 的可靠度要求下,变动范围应是多大?
数的差异与1.96SEd(0.05显著性水平)进行比较,
如果其绝对值大于此值,则差异显著,否则差异 不显著。
例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分, 此次数学测验年级平均分是81分,标准 差是10分,此次测验的信度系数是0.91; 问小张这两次数学测验的成绩是否有显 著差异?
(2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。
(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
1Baidu Nhomakorabea评价测验
信度系数是衡量测验好坏的一个重要的技术指 标。
一般能力与学绩测验的信度系数为0.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
我们可以用“差异的标准误”来检验差异的显著 性。
差S 异d的E 标S 准1 误2 E 的S公2E 2 式 为S:2rxx ry(y 公式5-5)
r SE d为差异的标准误,S为相同尺度的xx标准ry分y 数的
标准差,Z分数为1,T分数为10。 、 分别为
两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
式(皮尔逊积差相关公式的变式)为:
rxx
X1X2 NX1X2 S1S2
(公式5-6)
式中X1、X2为同一被试的两次测验分数,X 1 、X 2
为全体被试两次测验的平均数,S1、S2为两次
测验的标准差,N为被试人数。
再测法的模式是:施测 适当时距 再施测
例2:假设有一份主观幸福感调查表,先后两次施测于 10名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。)
真变异数与总变异数(实得变异数)的比率。
即
式中
rxx
S
2 T
S 2X
(公式5-1)
rxx代表信度系数,S 2T 代表真分数的变异数,
S
2 X
代表实得分数的变异数,即总变异数。
根据公式5-1,信度还可以表示为:
rxx
1
S 2E S2X
(公式5-2)
对于信度系数,还应该注意以下几点:
(1)在不同的情况下,对于不同的样本, 采用不同的方法会得到不同的信度系数, 因此一个测验可能不止一个信度系数。
SESx 1rxx
(公式5-4)
式中SE表示测量的标准误,即误差分布的标准 差 度系;数Sx表。示一次测量分数的标准差;rxx表示信
我们可以用测量的标准误来估计个人测 验的真分数的大小。
如果选用95%的可靠性水平(置信水
平),即显著性水平(a值)为.05,,
真分数有95%的可能落入X
±Z
2
3.用来对两种测验分数进行比较
来自不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。
如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。
注意几点:
(1)SE对真分数做的是区间估计,不可 能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。
(2)置信水平确定后,估计的精度主要 取决于SE,SE越小,范围越小,估计就 越精确,反之也然。
(3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。
2.用来估计个人的测验分数(真分数)
由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数, 标准差则为误差大小的指标。
X
在实际工作中,我们用一组被试(人数足够多) 两次施测的结果来代替对同一个人反复施测, 以估计测量误差的变异数。此时,个人在两次 测验中的分数差异就是测量误差。据此可制成 误差分数的分布。这个分布的标准差(误差分 布的标准差)我们称之为测量的标准误,是表 示测量误差的大小的指标,其计算公式为:
第五章 心理测量的信度
第一节 第二节 第三节
什么是信度 估计信度的方法 影响信度系数的因素
一、信度的意义 二、信度系数的作用
back
一、信度的意义
信度即测验的可靠性,指的是测量的一致性程 度。
信度受随机误差的影响,随机误差越大,信度 越低。
在测量学中,信度被定义为:一组测量分数的
back
一、再测信度 二、复本信度 三、等值稳定性系数 四、内部一致性系数 五、评分者信度 总结 练习
back
再测信度(Test-Retest Reliability) ,也叫 重测信度,也叫稳定性系数。用同一个测验,
对同一组被试前后施测两次,对两次测验分数
求相关,其相关系数就叫再测信度。其计算公
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 16 15 13 13 11 10 10 9 8 7
X2 16 16 14 12 11 9 11 8 6 7
计算再测信度必须注意几个问题:
(1)所测量的特性必须是稳定的。当然绝对 的稳定是不可能的,但应该是比较稳定的。
SE
,即
X ±1.96 SE的范围之内,也可以写成X
-1.96SE T X+1.96 SE,SE则用公
式5-4代入。或有5%的可能落入这范围
之外。这实际上也表明了再测时分数改
变的可能范围。
例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95% 的可靠度要求下,变动范围应是多大?
数的差异与1.96SEd(0.05显著性水平)进行比较,
如果其绝对值大于此值,则差异显著,否则差异 不显著。
例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分, 此次数学测验年级平均分是81分,标准 差是10分,此次测验的信度系数是0.91; 问小张这两次数学测验的成绩是否有显 著差异?
(2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。
(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
1Baidu Nhomakorabea评价测验
信度系数是衡量测验好坏的一个重要的技术指 标。
一般能力与学绩测验的信度系数为0.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
我们可以用“差异的标准误”来检验差异的显著 性。
差S 异d的E 标S 准1 误2 E 的S公2E 2 式 为S:2rxx ry(y 公式5-5)
r SE d为差异的标准误,S为相同尺度的xx标准ry分y 数的
标准差,Z分数为1,T分数为10。 、 分别为
两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
式(皮尔逊积差相关公式的变式)为:
rxx
X1X2 NX1X2 S1S2
(公式5-6)
式中X1、X2为同一被试的两次测验分数,X 1 、X 2
为全体被试两次测验的平均数,S1、S2为两次
测验的标准差,N为被试人数。
再测法的模式是:施测 适当时距 再施测
例2:假设有一份主观幸福感调查表,先后两次施测于 10名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。)
真变异数与总变异数(实得变异数)的比率。
即
式中
rxx
S
2 T
S 2X
(公式5-1)
rxx代表信度系数,S 2T 代表真分数的变异数,
S
2 X
代表实得分数的变异数,即总变异数。
根据公式5-1,信度还可以表示为:
rxx
1
S 2E S2X
(公式5-2)
对于信度系数,还应该注意以下几点:
(1)在不同的情况下,对于不同的样本, 采用不同的方法会得到不同的信度系数, 因此一个测验可能不止一个信度系数。
SESx 1rxx
(公式5-4)
式中SE表示测量的标准误,即误差分布的标准 差 度系;数Sx表。示一次测量分数的标准差;rxx表示信
我们可以用测量的标准误来估计个人测 验的真分数的大小。
如果选用95%的可靠性水平(置信水
平),即显著性水平(a值)为.05,,
真分数有95%的可能落入X
±Z
2
3.用来对两种测验分数进行比较
来自不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。
如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。
注意几点:
(1)SE对真分数做的是区间估计,不可 能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。
(2)置信水平确定后,估计的精度主要 取决于SE,SE越小,范围越小,估计就 越精确,反之也然。
(3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。
2.用来估计个人的测验分数(真分数)
由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数, 标准差则为误差大小的指标。
X
在实际工作中,我们用一组被试(人数足够多) 两次施测的结果来代替对同一个人反复施测, 以估计测量误差的变异数。此时,个人在两次 测验中的分数差异就是测量误差。据此可制成 误差分数的分布。这个分布的标准差(误差分 布的标准差)我们称之为测量的标准误,是表 示测量误差的大小的指标,其计算公式为:
第五章 心理测量的信度
第一节 第二节 第三节
什么是信度 估计信度的方法 影响信度系数的因素
一、信度的意义 二、信度系数的作用
back
一、信度的意义
信度即测验的可靠性,指的是测量的一致性程 度。
信度受随机误差的影响,随机误差越大,信度 越低。
在测量学中,信度被定义为:一组测量分数的
back
一、再测信度 二、复本信度 三、等值稳定性系数 四、内部一致性系数 五、评分者信度 总结 练习
back
再测信度(Test-Retest Reliability) ,也叫 重测信度,也叫稳定性系数。用同一个测验,
对同一组被试前后施测两次,对两次测验分数
求相关,其相关系数就叫再测信度。其计算公