第四章测量信度与随机误差控制55页PPT

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢ 考察两个分数的差异是否可靠,是否真有差异的问题。比如,某人的物理成绩是否真的 优于化学?某人的数学技能本学期是否真有进步?某人在韦氏智力量表上操作智商与言
语智商的差异是否真有显著意义等。
2020/5/15
12
第一节 信度的概述
➢差异分数的测量标准误可用如下公式求出:
SEdiff SD2rxxryy
8
第一节 信度的概述
2.信度的统计定义
定义1:信度是被试团体真分数方差与实得 分数方差之比
2 T
2 X
2 T
2 E
2 E
rXX
2 T
2 X
定义2:信度是 被X2 试团体真分数与实得分数相关系数的平方
rXX
2 TX
定义3:信度是一个测验X(A卷)与它的任意一个平行测验
(B卷)的相关系数
2020/5/15
2020/5/15
19
第二节 测验信度的种类与评估方法
一、重测信度
4.使用重测信度时需要注意的问题 ➢ 两次施测时间间隔的长短会影响重测信度系数估计值的大 小,因此,在报告重测信度系数时应该报告间隔的时间长 度。 ➢ 应该根据已有的相关研究结论考虑所测心理特质本身的稳 定性程度,以确定前后两次施测时间的间隔究竟应该多长 比较合适时,不应该随便选择间隔时间的长短。
学习目标:
1.什么是信度?信度与测量随机误差的关系? 2.信度的统计定义? 3.描述信度的指标有哪些? 4.分析测验信度应注意哪些问题? 5.信度的标准与作用? 6.经典测量理论信度系数的估计方法。 7.提高测量信度的主要方法有哪些?
2020/5/15
1
第一节 信度概述
2020/5/15
2
XTE
如果某生的考试成绩为495分,在置信度为0.95时,其真分数的置信区间为:
[ 4 9 5 1 . 9 6 9 . 9 9 , 4 9 5 1 . 9 6 9 . 9 9 ] [ 4 7 5 , 5 1 5 ]
2020/5/15
11
第一ቤተ መጻሕፍቲ ባይዱ 信度的概述
4.信度可以帮助进行不同测验分数的比较。
S E d i f f S D 2 r x x r y y 1 5 2 0 .9 7 0 .9 3 4 .7 4
➢ 因为4.74×1.96=9.29,因此,言语和操作智商相差10分时,在0.05水平 上,我们说存在显著差异。若要在0.01水平上作出差异显著的结论,就 要相差13分。
测验分数的比较与平均数差异显著性检验是一回事吗?
➢ 式中,SEdiff是差异分数的测量标准误;rXX和rYY是两个 测验各自的信度系数;SD是两测验间使用的相同的标 准差。在比较分数之前,必须将两个测验分数转为具有
相同量表的标准分数。
2020/5/15
13
第一节 信度的概述
➢ 例如,在韦氏成人智力量表中,言语和操作分测验的信度为 0.97和0.93, 而它们的智商的平均数为100,标准差为15,故言语和操作智商差数的标 准误为:
2020/5/15
第一节 信度的概述
14
研 究 下 下 节 课 继 续
2020/5/15
15
第二节 信度的种类
与评估方法
详细介绍第一节中提出的各种信度估计方法的计算。
2020/5/15
16
一、重测信度
1.含义
➢ 同一个测量工具在两个不同时间对同一组被试施测所得结果的一 致性程度。
➢ 重测信度主要考察了一个测量工具是否能够保证在不同时间测量 结果的一致性,他反映了测量工具的结果受到时间间隔因素影响 的大小。
2020/5/15
6
第一节 信度的概述
❖测验信度表示测验分数中个体差异 可归因于所测特质中“真实”差异的 程度,以及可归因于随机误差的程度。
2020/5/15
7
二、信度的统计定义
1.经典测量理论假设的推论
XTE XVIE
TVI
2 X
T2E 2
T2 V2 I2
2 T
X 2 V 2I2E 2
2020/5/15
rXX XX
9
第一节 信度的概述
三、描述信度的指标
1.经典测量理论的信度系数
➢ 信度系数是表示测量结果的稳定性程度的指标。记为:
rXX
➢信度系数的值域:[0,1]
➢ 没有百分之百可靠的测量,因此,rXX=1只是理论上的值, 实际当中是不会存在的。
?相关系数的值域是[-1,+1] ,信度系数
的值域:[0,1],为什么?
2020/5/15
18
第二节 测验信度的种类与评估方法
一、重测信度
3.应用条件 ➢ 测量工具所测量的个体心理特质在时间上应该是相对稳定 的。 ➢ 测量工具所测量的个体心理特质应该不存在明显的练习效 应和遗忘效应。 ➢ 在两次施测间隔期间不应该进行专门的训练和培训,以保 证重测信度反映的是随机因素的影响效应。
➢ 一般来说,重测的时间间隔越短,那么各种施测情境的变化就越 小,重测信度系数就会越大。
➢ 重测信度系数较大时,说明该测量工具前、后两次的测量结果比 较一致。结果具有较好的跨时间上的稳定性。
2020/5/15
17
第二节 测验信度的种类与评估方法
一、重测信度
2.评估方法 ➢ 重测信度的大小可以通过计算测量工具的重测系数 (test-retest coefficient)或叫稳定性系数 (coefficient of stability)来标志。具体来说,就是 求取同一组被试在两个不同时间施测同一个测量工具 所得结果分数的相关系数。
2020/5/15
10
第一节 信度的概述
四、信度的作用
2.信度是测量过程中所存在的随机误差大小的反映。 3.信度可以用来解释个人测验分数的意义——测量标准误。
例如,我们已知高考文科试卷的总信度rXX =0.965,文科考生总分的标准差为 53.42,那么,文科考试成绩的标准误为:
S E M S D t 1 r X X 5 3 .4 2 1 0 .9 6 5 9 .9 9
2020/5/15
4
第一节 信度的概述
当T占X的比例很大时,那么测值就 会是稳定的。一般来说,稳定的测值 是可靠的、可信的,因此,信度可被 认为是测量结果的稳定性程度。
2020/5/15
5
2.信度的定义
❖信度(reliability)是指在不同时间,使 用同一测验,或者使用两个不同项目的等 值测验,或在其他不同的测试条件下,对 同一组被试实施两次或多次测试所得分数 的一致性。
一、信度与测量误差 TVI
1.经典测量理论的假设 XVIE
式中,X为观察分数,T为一般真分数, E为随机误差分数,V为目标真分数,I为 非目标真分数(系统误 差)。
2020/5/15
3
第一节 信度的概述
XVIE
2.信度的定义
T
测量追求的初步目标:T占X的比例越 大越好。
测量追求的终极目标:V占X的比例越 大越好。
相关文档
最新文档