项目反应理论讲座(文剑冰)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参数估计时标尺的建立
P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2) =P(2;2.0,-0.15,0.2)
P
0.2
1
1 0.2 e 1.710.5( 0.8)
0.2
1
1 0.2 e 1.71( 2 0.7 )
0.2
1
e
1 0.2
1.720.5(
0.15 )
– 通常将被试能力平均值设定为0
信息函数
• 试题信息函数
I ( ) Var(ˆ | )1
I ( )
(P)2 PQ
1.7a2 (1 c) [c e1.7a( b) ][1 e1.7a( b) ]2
max
b
1 1.7a
ln( 1 2
1 8c ) 2
• 测验信息函数(试题信息函数之和)
信息函数(例)
极低能力被 试答对的概
率为0 c=0
参数的含义(c)
低能力被试 可能答对的 可能性不为0
C=0.2
单参数模型
双参数模型
三参数模型
项目反应模型参数的估计
试题
试题参数
考生对试题的回答
a
b
c
1
2
3
4
5
1 1. 00 0.25 0.10 1 1 0 0 0
2 0.50 1.32 0.10 1 0 0 1 0
– 使后验概率函数值达到最大
• EAP(Expected a Posteriori)
– 后验概率函数值的平均数
估计项目参数的方法
• 联合极大似然估计法(JMLE)
• 边际极大似然估计法(MMLE)
• 条件极大似然估计法(CMLE)
• 联合估计时标尺的建立(通常设能力均数为0)
– P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2) =P(2;2.0,1.35,0.2)
试
试题参数
题a b c
1 1.80 1.00 0.00
2 0.80 1.00 0.00 3 1.80 1.00 0.25 4 1.80 -1.50 0.00 5 1.20 -0.50 0.10 6 0.40 0.50 0.15
信息函数的性质
• 同一试题信息函数随着所测被试能力 的不同而不同;同时试题信息函数受 试题自身特征的影响。
项目反应理论简介
华东师范大学心理系 文剑冰
经典测量理论(CTT)
• 经典测量理论的假设 X=T+E
• 经典测量理论的信度 • 经典测量理论的效度 • 经典测量理论的试题参数 • 经典测量理论的测验编制
经典测量理论的假设
• 观察分数=真分数+误差分数 X=T+E
• 观察分数与误差分数之间互相独立 • 误差分数的平均数为0 • 多次测量的误差分数之间相关为0
0.1
1
1 0.1 e 1.71( 0.5 0.25)
0.1
1
1 0.1 e1.70.5(0.51.32)
1
0.1
1
1 0.1 e1.71.6(0.51.25)
0.205
能力参数的估计方法
• 极大似然法(ML)
– 使已知反应模式的似然函数值达到最大
• MAP(Maximum a Posteriori)
• 区分度指标(鉴别力指数D或相关 系数r) D= PH-PL
经典测量理论的测验编制
• 假设被试的特质是正态分布,从而 测验总分的分布也是正态
• 测验分数尽可能区分被试,因此测 验总分的变异程度越大越好
• 测验中试题的难度中等为好,区分 度越大越好
经典测量理论的缺陷
• 参数依赖于样本 • 能力量表与难度量表不统一 • 对于所有被试的测量误差相等 • 无法反应潜在特质与被试作答之
• a,b相同的试题,c值大的信息量小。
• a值大的试题,只是在较窄的区间内提 供的信息量多,a值小的试题,对能力 的估计提供帮助不大,但是广泛地分 布在较宽区间
间的关系 • 在测验编制问题上的困惑
准备知识
• 标准分数
Z XX S
• Z>0,高于平均,Z<0,低于平均 • P(-1.96<Z<1.96)=0.950 • P(-3<Z<3)=0.997
A1 1 1 0 1 0 0 0 1 16 B0 1 0 1 1 1 1 0 1 0 6 C1 0 1 0 1 1 0 1 1 1 7 D1 1 1 0 0 0 0 0 0 14 E11110110107 F11000010115 G1 1 1 0 1 1 0 0 1 17 H0 1 1 1 1 0 1 1 1 18 I 10001001104 J 01100010014 总7 8 7 3 6 4 5 3 8 7
经典测量理论的信度
• 信度的概念
“真实分数方差在观测分数方差中所占的比率”
• 信度系数的估计方法
– 重测信度(稳定性系数) – 复本信度(等值性系数) – 内部一致性信度 – 评分者信度
• 信度系数的应用 Se St 1 rXX
经典测量理论的试题参数
• 难度指标(通过率或得分率P值)
P X X max
3 1.60 1.25 0.10
• 极大似然估计和贝叶斯估计(联合后验分布的众数)
对θ=0.5时似然函数的计算
L( ) P1( )P2 ( ) 1 P3( )
c1
ห้องสมุดไป่ตู้
1
1 c1 e1.7a1 ( b1 )
c2
1
1 c2 e1.7a2 ( b2 )
1
c3
1
1 c3 e1.7a3 ( b3 )
项目反应理论(IRT)
项目反应理论 (Item Response Theory)
三个理论假设 • 单维性假设 • 局部独立性假设 • 项目反应模型(项目特征函数)
项目反应模型
单参数模型(Rasch模型)
P( )=1exepx(p(--b)b)
双参数模型
P(
)= 1
exp[ Da(-b)] exp[ Da(-b)]
3 1.60 1.25 0.10 1 0 1 1 0
项目反应模型参数的估计
• 反应模式(110)的概率: • L=P1P2Q3
试题 试题参数
考生能力
abc 1 1. 00 0.25 0.10
0.50 1.00 1.50 似然函数值
2 0.50 1.32 0.10 0.205 0.235 0.150
P( )
a( b)
1 eZ2 / 2dZ
2
三参数模型
P(
)=c
(1
c)
exp Da(-b) 1 exp Da(-b)
c
1
exp
1 c
Da(
b)
项目反应模型的参数
• 单参数模型 双参数模型 三参数模型
参数的含义(a)
参数的含义(a)
参数的含义(b)
参数的含义(b)
参数的含义(c)