02经典测验理论--信效度+项目分析

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

度
适用范围：二分法计分的测验。
第二节信度评估的方法
3.克伦巴赫系数
测
验
α=
KK－1［1－
∑ Si2
Sx2
］
的
Si2:某项目分数的方差 SX2:测验总分的方差
信
说明：适用多重记分（1～n）的测验。
度
当k=2时，α 系数与分半效度估计等价。
第二节信度评估的方法
五、评分者信度
测
多位评分者对随机抽取的若干份测验卷按评

（3.3）
于是公式（3.2）可以改写为：

（3.4）
因此，一次测验中，一个团体的实测分数之间的变异性是由与目的有关的变异数（）、与测量目的无
关的变异数（），和测量误差变异数（）所
决定的。
对经典测验理论的评价
优点
以真分数模型为理论框架，使用少量的定义，依据弱假设（或弱势假设）形成。
验
1.信度系数最常用
指同一被试样本所测得的两组资料的相关系
的数。理论上，是真分数方差与实得分数的方差的
信比值。度
xx
ST2
S
2 X
（ 0≤rxx≤1）
第一节信度的概念
2.信度指数
测
真分数标准差与实得分数的标准差的比值称
验信度指数。它是信度系数的平方根。
的
rXT =
ST SX
=
rxx
两次施测期间被试的学习效果没有差别。
第二节信度评估的方法
二、复本信度等值性系数
测
以两个等值但题目不同的测验（复本）来测
验
量同一群体，然后求得被试者在两个测验上得分的相关系数。
的
复本信度反映的是测验在内容上的等值性，故又称
等值性系数。如果两个复本的施测相隔一段时间，则称
信重测复本信度或稳定与等值系数。
度
SE:测量的标准误
SX :所得分数的标准差
rxx:测验的信度系数
可见，测量的标准误与信度呈负相关。
第二节信度评估的方法
一、重测信度再测信度稳定性系数
测
使用同一测验，在同样条件下对同一组被
验试前后施测两次测验，求两次得分间的相关系
数。
的
两次测验的时距随测验的目的、性质和被试特点
信而异，一般人格测验常用的重测间隔是两周到四周较
（记为E）。即：

X=T+E （3.1）

这就是CTT的数学模型
根据CTT模型，可以有三个相关联的假设公理 ①若一个人的某种心理特质可以用平行测验反复
测量足够多次，则其观察分数的平均值接近于真分数。即： E（X）=T 或 E（E）=0 这说明E是个服从均值为零的正态分布的随机变量。
度
复本信度使用前提条件：
要有两份或以上真正平行的测验。
被试有条件接受两个测验。
第二节信度评估的方法
三、分半信度劈半信度折半信度
测
测验实施后将测验题分为相等的两半，分
验别计算每位被试在两半测验上的得分，求出这
两半分数的相关系数。
的
由于没有时间因素、练习效应的干扰，分
信
半信度是一种简单易行、行之有效的信度计算
度
xx
ST2
S
2 X
rxx：信度信度系数
第一节信度的概念
测
由于真分数的方差ST2无法统计，则
验的
XX

S
2 X

S
2 E
S
2 X
1
S
2 E
S
2 X
信
信度也可以间接地看作，在总的方差中测量误差(随机)的方差所占的比例。
度
第一节信度的概念
二、信度的描述指标
测（一）信度系数与信度指数
②真分数和误差分数之间相关为零。即： ρ（T，E）=0 ③各平均测验上的误差分数之间相关为零。即： ρ（E1，E2）=0 第②、第③条假设说明E是个随机误差，没有包
含系统误差在内。
对CTT的这一模型假设公理，可以从3方面理解：第一，在问题研究范围内，反映个体某种特质的心
经典测验理论
心理教研室李洋洋
目
录
Contents
01
测验的信度
02
测验的效度
03
项目分析
04
分数的解释
第三章经典测验理论概述
内容提要：心理特质及其可测性心理测量的误差及其种类真分数的含义经典测验理论的基本假设
人的身高、体重等生理特性是可以客观测量的人的心理特征能够测量吗？如果可以，应具备哪些
一、测量误差的含义测量误差是指在测验过程中由那些与测量目的无关
的变化因素所产生的一种不准确或不一致的测量效应。
测量误差由那些与测量目的无关的变因所致。测量误差表现为不一致和不准确两种方式。
二、测量误差的种类（一）随机误差由与测量目的无关的、偶然因素引起的而不容易控
信
（ 0≤rxT≤1）
度
（ rXT≥ rxx ）
第一节信度的概念
（二）测量标准误
测
对一个人施测N次测验，从其N个测验分数中随机抽取
验
K个样本数为n的小样本，得到K个样本均数。K个样本均数的平均数就是这个人的真分数；n个样本均数的标准差
的
就是标准误（SE），它反映抽样误差大小。
信
SE Sx 1 xx
●● ●●●
●
●
A
●
●
B
C
●
花生重量=花生净重+泥土重量花生重量=花生仁重量+花生壳重量+泥土重量
第一节信度的概念
一、信度的定义
测
信度是指同一被试在不同时间内用同一测验
验（或用另一套相等的测验）重复测量，所得结果
的一致程度。
的
信度只受随机误差的影响。系统误差稳定，
信不影响信度。随机误差越大，信度越低。因此，
测 l.计算同质性信度的基本公式
验
rxx=
K rij 1+（K－1）rij
的
rxx:同质性信度值
信
K:为构成测验的项目数
rij:项目间相关系数的平均数
度
第二节信度评估的方法
测 2.库德-理查逊公式
验
rxx=
KK－1［1－
∑ piqi
Sx2
］
的
K:构成测验的题目数 Pi:通过第i题的人数比例
信
qi:未通过第i题的人数比例 SX2:测验总分的方差
条件？经典测验理论的基本内容（Classical Test Theory,
CTT）
第一节心理特质及其可测性假设
一、心理特质的含义一个人身上所特有的相对稳定的行为方式即心理特
质（trait）
（1）特质是一组具有内部相关的行为概括，具有
一定的抽象性。“善良”、“聪明”、“勤劳”
（2）特质是一种一般的神经心理系统，可以使人
制的误差。它使多次测量产生了不一致的结果，其方向和大小变化是完全随机的。
（二）系统误差由与测量目的无关的变因引起的一种恒定而又规
律的效应。这种误差稳定地存在于每一次测量之中，此时尽管多次测量的结果非常一致，但实测结果与真实数值有所差异，是不准确的。
三、测量误差的来源与物理测量一样，心理测量的误差来源是测验本身、
理水平的真分数是假定不变的，测量任务就是估计这一真分数的大小。第二，观察分数被假定等于真分数与误差分数之和。即观察分数与真分数之间是线性关系。第三，测量误差是完全随机的，并服从均值为零的正态分布。
平行测验：CTT认为，如果两个题目不同的测验测的是同一特质，并且题目形式、数量、难度、区分度以及测查等值团体后所得分数（， S）的分布都是一致的，则这两个测验被认为是平行测验。
被测对象和施测过程3个方面。（一）测验本身引起的测量误差 1. 测验题目取样不当：太少或缺乏代表性。 2. 测验题目格式不妥：引起被试猜测 3. 测验题目难度过高或过低 4. 测验题目或指导语用词不当
（二）施测过程引起的测量误差 1. 测试环境 2. 测试时间 3. 意外干扰 4. 主试因素 5. 评分记分
（三）被试引起的测量误差 1. 测试动机与态度 2. 测验焦虑 3. 测验经验 4. 练习效应 5. 生理因素
第三节真分数及其有关假设
一、真分数的含义
人的心理特质水平经过测量之后得到一个数值，但由于测量误差的存在，这个数值难以与该特质的真正水平一致，总是围绕真实水平值变化。
验分标准分别给分，然后根据每份测验卷的多个分
数计算相关系数，即得评分者信度。它反映不同
的评分者之间所产生的误差。
信
一般要求在成对的受过训练的评分者之间平
信度亦可视为测验结果受随机误差影响的程度。
度
实得分数（X）= 真分数（T）+ 误差（E）
第一节信度的概念
根据统计方差分析理论
测
S
2 X

ST2

S
2 E
验的
SX2：测验实得分数的方差（即总方差） ST2：测验真分数的方差 SE2：测验误差的方差。
信
在测量理论中，信度被定义为：一组测量分数的真分数方差与总方差果两半测验分数的平均数和标准差不同，
测可以采用弗朗那根公式和卢伦公式来估计信度。
验的
rxx＝2［1－-S—aS2—+x2S—b2 ］弗朗那根公式
信度
rxx＝1－—SSxd—22
卢伦公式
Sa2、Sb2:两半测验分数的方差 rxx:估计信度
Sx2:测验总分的方差 Sd2:两半测验分数差的方差
（E. L. Thorndike）， “凡有数量的东西都可以测量” （W. A. McCall）。
心理特质是一种相对稳定的存在，是可以测量的，
这就是心理特质可测性的假设。
心理特质的测量相对困难，无法直接测量，只能
通过被试对一些刺激的行为反应来推测，即进行间接测量。
第二节测量误差及其来源
用许多彼此平行的测验反复测量同一个人的同一种心理特质是很难实现的，因此，CTT的模型只是一种理论上的描述。
在测验时，不是用许多平行测验反复测查同一批被试，而是用同一测验同时测查许多被试。由于每个人的误差都是随机的，且服从均值为零的正态分布，所以当被试团体足够大时，团体内的随机误差会相互抵消，整个团体测验的观察分数的均值会趋近团体真分数的均值。这里，多个被试接受同一测验相当于多个平行测验反复测差一个具有团体真分数均值水平的一个个体。
根据CTT模型和假设，能够推导出如下关系：

（3.2）
即：在一次测量中被观察分数的方差等于其真分数的方差与误差分数方差之和。
公式（3.2）中只涉及到了随机误差的变异，系统误差的变异包含在真分数的变异之中。即真分数还可分成两个部分：与测量目的有关的变异（）和与测量目的无关的变异（），即：
方法。
度
分半方法：奇偶分半、难度分半、内容分半等。
第二节信度评估的方法
分半信度实际上只是一半测验项目的相关
测系数，要评估整个测验的信度，就需用斯皮尔
验曼一布朗公式校正。
的
rxx =
2rhh 1 + rhh
信
rhh ：两半测验分数的相关系数
度
rxx ：整个测验的信度估计
使用前提：两半测验分数的方差相等
因此，我们规定反映某种心理特质真正水平的那个数值为真分数（True Score, 简称T分数），把实测的分数叫观察分数（Observed Score，一般记作X）。
测量误差小，观察分数应该接近或逼近真分数。
二、数学模型及其假设
观察分数很难等于真分数，二者的关系怎样？经典测验理论假定，观察分数（X）与真分数（T）之间是一种线性关系，并只相差一个随机误差
综合不同的刺激，对这些刺激做出相同的反应。
（3）特质是一个人身上比较稳定的特点（4）一个人的精神面貌是由多种特质分多个层次有
机组合而成。
（5）特质可以决定一个人对特定刺激的反应倾向，
可以对人的行为进行某种预测。
二、心理特质的可测性
心理特质是一种客观存在，“凡客观存在的事物都有其数量”
局限性
采用的指标依赖于受试者样本；能力的估计依赖于项目样本；各种参数估计都只能事后进行。
1
PART ONE
测验的信度
教学内容
测
第一节信度的概念
验
第二节信度评估方法
的
第三节信度在测验中的作用
信
第四节影响信度的因素
度
信度与效度
信度：稳定性，一致性效度：准确性，有效性
●●●●●
度
宜，间隔时间最好不超过六个月。
第二节信度评估的方法
重测信度的专用计算公式：
测
验
rxx =
Σ X1X2/ N－X1X2
S1S2
的
rxx:测验的信度系数 N:样本数
X1、X2:同一被试的两次测量分数
信
S1、S2:两次测验的标准差
度
计算重测信度应满足以下几个条件：
所测量的特质必须是稳定的；
遗忘与练习的效果相同；
第二节信度评估的方法
测四、同质性信度内部一致性信度
指测验内部所有题目间的一致性程度。
验
同质性是指测验的所有题目测量的是同一种
的特质或同一种能力。若各测题的得分有较高的正
相关时，则测验为同质的。相反，若各测题的得
信分相关很低或为负相关时，则测验为异质的。
度
同质性信度是最常用的信度指标。
第二节信度评估的方法