误差_测量的信度与效度

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1=绝对是
2=是
3=不一定
4=不是
5=绝对不是
B卷：你是一个喜欢安静的人吗？
1=绝对是
2=是
3=不一定
4=不是
5=绝对不是
对信度系数要注意三点：第一，在不同情况下，对不同样本，采用不同方法会得到不同的信度系数，因此一个测验可能不止一个信度系数；第二，信度系数只是对测量分数不一致程度的估计，并没有指出不一致的原因；第三，获得较高的信度系数并不是心理测量追求的最终目的，它只是迈向目标的一步，是使测验有效的一个必要条件。
（四）使用重测信度的优缺点１．（优点）能提供有关测验结果是否随时间而变异的资料，可作为预测受测者将来行为的依据。２．（缺点）容易受练习和记忆的影响，前后两次施测间隔的长短必须适度; 第一次尝试所发现的错误也可能导致第二次反应的变化而增加误差变异。
二、复本信度（等值系数）（一）定义与计算 1. 定义根据一组被试在两个平行（等值）测验上的得分计算相关系数。即测验复份A 最短时距测验复份B 因为它反映的是两个测验之间的等值程度，故又称等值系数。

当几个测验复本不等值时，接受不同的题目，就会获得不同的分数；测验题目格式不妥；测验的难度过高或过低；测题或指导语用词不当；测验时限过短。
（二）由施测过程引起的误差
三种误差来源中，此种误差可能是最容易控制和检验的。与施测过程有关的误差主要有以下几种： 1.物理环境施测现场的温度、光线、声音、桌面好坏、空间阔窄等皆有影响。
四、同质性信度（一）定义（二）计算五、评分者信度六、几种信度估计方法的比较

信度是一个理论上构想的概念，在实际应用时，通常以同一样本所得的两组资料的相关，作为测量一致性的指标。因为测验分数的误差来源不同，估计信度的方法也不同，故每一种信度系数只能说明信度的不同方面，因而具有不同的意义。
这里 X为实得分数或观测分数，T是假设的真分数，E是测量误差。
需要说明的是，这里的测量误差（E）指的是引起测量不一致性的变因产生的效应，即指随机误差，不包括系统误差，后者不引起分数的改变，因而包含在真值中。在公式中E可能是正的，也可能是负的。即一个人的实得分数可能大于真实量，也可能小于真实量，总是围绕真值上下波动。

一次测验的内容，又不能让其特质发生变化，或对所
学知识产生遗忘）
（二）误差来源 1. 测验本身：测验所测的特性本身就不稳定，例如情绪。 2. 被试方面：成熟、知识的发展并非人人都等量增长，且练习因素、记忆效果也存在个体差异。 3. 施测情境：偶发因素的干扰，如计时错误，情绪波动，健康状况，动机变化等。重测信度高，说明分数受被试状况和测验情境变化影响小。这里题目取样并不影响重测信度。
“νθι σεαυτν！”
“人啊，认识你自己！”
人啊，准确地（accurately）认识你自己！

准：一致确：正确
心理测量试图帮助我们准确了解人的心理现象（心理特质），就像尺子帮助我们测量身
高。但这个工具是有误差的。为了准确地认识心理特质，误差要控制在一
个许可的范围内。
一、误差的定义和种类心理测量中所指的误差就是在测量中与目的无关的变因所产生的不准确或不一致的效应。
第一节测量信度

一、什么是信度 1. 定义信度（reliability）是指测量结果的稳定性（stability）和可靠性程度。

一个好的测验必须稳定可靠，即多次测量结果要保持一致。
2. 信度的测量学定义一
信度系数
该定义有两点需要注意：第一、信度指的是一组测验分数或一列测量的特性，而不是个人分数的特性；第二、真分数的变异数是不能直接测量的，因此信度是一个理论上构想的概念，只能根据一组实得分数做出估计。信度涉及的主要问题是对测验分数意义的概化能力，即从一次测量来推论总体能达到何种正确程度。
信度係數可信程度

信度＜ 0.30
0.30 ＜信度＜ 0.40 0.40 ＜信度＜ 0.50 0.50 ＜信度＜0.70 0.70 ＜信度＜ 0.90
不可信
初步的研究，勉強可信稍微可信可信（最常見的信度範圍）很可信（次常見的信度範圍）
0.90 ＜信度
十分可信
~ 中臺科技大學李復惠編製 ~
第三节信度的估计方法

一、重测信度（一）定义与计算（二）误差来源（三）计算重测信度的几个假设（四）使用重测信度的优缺点（五）注意事项

二、复本信度（一）定义与计算（二）误差来源（三）等值测验应符合的条件（四）注意事项（五）使用复本信度的局限三、分半信度（一）定义及计算（二）分半的方法（三）校正公式
（四）注意事项 1. 两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似； 2. 两次测验的时间间隔要适当，若太短，由于测验太相似被试可能厌倦，若太长可能又会因新的学习而产生干扰。
（五）使用复本信度的局限 1. 只能减少但不能完全消除练习和记忆的影响； 2. 由于第二个测验只改变了题目的具体内容，已经掌握的解题原则，可以很容易地迁移到同类问题。 3. 对许多测验来说，建立复本是十分困难的。
2.测验焦虑一般来说，适度的焦虑会使人的兴奋性提高，注意力增强，提高反应速度，从而对测验成绩产生积极的影响。过高的焦虑却会使工作能力下降，注意分散，记忆中储存的东西不能提取，影响测验成绩。 3.生理因素生病、疲劳、失眠等生理因素会影响测验成绩而带来误差。
4.学习、发展和教育由一般学习经验或发展变化所引起的测验分数上的差异，在大多情况下，只构成恒定误差，但有时也构成随机误差。 5.测验经验受测者对测验的经验也会影响测验成绩，对测验的程序和技能熟悉程度不同，所得分数便不能直接比较。
一、重测信度（test-retest reliability）
（一）定义与计算１．定义用同一种测验，对同一组受试者，前后施测两次，再根据受试者两次测验分数计算其相关系数，即得再测信度。即
测验
时距（几分－几年）
再测验
此种信度能表示两次测验结果有无变动，反映测验分数的稳定程度，故又称稳定性系数。
※ 一是误差是由与测验目的无关的变因引起的； ※ 二是误差存在于的测量结果中。
主要类型：系统误差、随机误差。
系统误差是由与测验目的无关的因子所引起的恒定的、系统的、有规律的变化，存在于每次测量中，故又称常定误差。随机误差是使用测量工具进行心理测量所造成的误差，又称测量误差、观察误差、偶然误差。它是由与测验目的无关的偶然因素引起，使得几次测量结果不一致，且这种不一致是无系统的、随机的。
（三）等值测验应符合的条件等值测验可避免重测法的缺点，但所使用的必须是真正的复本。复本应符合以下条件： 1. 各份测验测量的是同一种心理特性； 2. 各份测验具有相同的内容和形式； 3. 各份测验的题目不应有重复的地方； 4. 各份测验题目数量相等，并且有大体相等的难度、区分度； 5. 分数分布（平均数和差异度）大致相等。
２．计算方法计算使用皮尔逊积差相关公式的变式：
∑ Ｘ１Ｘ２－ ∑Ｘ１ ∑Ｘ２／Ｎ
rxx
Ｓ１Ｓ２
式中Ｘ１、Ｘ２为同一被试的两个分数，Ｓ１、Ｓ２为两次测验的标准差，Ｎ为被试人数。

2.重测信度使用的条件（1）所测量的心理特质必须是稳定的（2）遗忘和练习的效果基本上相互抵消（3）在两次测试时间间隔内，被试在所要测查的心理特质方面没有其他的学习和练习
信度系数要达到多高才可以接受呢？
一般能力与学绩测验的信度系数在 0.90 以上；人格测验的信度系数通常在0.80 以上。当rxx ＜0.70时，不能用测验对个人作评价，也不能在团体间作比较；当rxx ≥0.70时，可用于团体间比较; 当rxx ≥ 0.85 时，可用于鉴别个人。
信度係數參考範圍

真分数理论的三个基本假设：误差分数的平均数是零（由于测量误差具有随机性）；误差分数与真分数相互独立，即相关为零；两次测量的误差分数之间的相关为零。
对于一个团体来说，实得分数、真分数和测量误差之间有如下关系： SX 2 =ST2+SE2
即实得分数的变异数等于真分数的变异数加上误差变异数。
2.主试者方面主试者的年龄、性别、外表，施测时的言谈举止、表情动作等均能影响测验结果。 3.意外干扰在测验环境复杂，特别是当受试人数较多时，容易发生意外情况，这会导致测验成绩不准确。 4.评分记分评分不客观、计分、登记分数出错等也是常见的误差。
（三）由受测者本身引起的误差即使一个测验经过精心编制，题目取样具有代表性，又有标准化的施测程序，由于受测者本身的变化，仍然会给测验分数带来误差，这种误差是最难控制的。主要有以下几种： 1.应试动机受测者对测验的动机不同，会影响其作答态度、注意力、持久性、反应速度等，从而影响测验成绩。

二、误差的来源

（一）测验内部引起的误差（二）由施测过程引起的误差（三）由受测者本身引起的误差
在心理测量中，常见的误差来源于三个方面：测验内部、施测过程、受测者本身。（一）测验内部引起的误差测验内部引起的误差主要来源于题目取样：当测验题目较少或取样缺乏代表性时，被试的反应受机遇影响较大；
2. 计算方法
rxx
=
∑ ＸAＸB／Ｎ－ＸAＸB ＳAＳB
式中ＸA 、ＸB为同一被试在两个测验复份A、B上的分数，ＸA 、ＸB为A、B两型测验的平均分数，ＳA 、ＳB为A、B两型测验的标准差，N为被试人数。
（二）误差来源 1. 测验两种形式是否等值：（1）测题取样是否匹配；（2）格式是否相同；（3）内容、题数、难度、平均数、标准差是否一致。 2. 被试方面情绪波动、动机变化等。 3. 测验情境的变化,偶发因素的干扰。
测量的信度与效度

本章提要：误差的概念与估计方法信度的概念与估计方法提高信度的方法效度及其与信度的关系效度的种类与估计方法提高效度的方法
从“斯芬克斯之谜”说起……
腿两一最条种多腿动时，物最晚无上早能三晨。条四腿条走腿路，；中午 :

古希腊的德尔斐，传说中的太阳神阿波罗的驻地，哲人塔列斯刻在太阳神圣殿外的一句传世名言：
公式(5.2) 只涉及随机误差的变异，系统误差的变异包含在真分数的变异中，即 ST 2=S V2+SI2 公式中S V2是与测量目的有关的（有效的）变异数，SI2 是与测量目的无关但却是稳定的变异数。
可得公式： SX 2= SV2+SI2+SE2
Sx 2
S V2
S I2
SE2
ST2 这就是说，一组测验分数之间的变异性是由与测量目的有关的变异数、稳定的但出自无关来源的变异数和测量误差变异数所决定的。

3.计算重测信度应注意的问题
（1）两次测验时间间隔要适当

（2）应提高被试的积极性
（3）适宜于人格测验与速度测验，不适合于智力等难度测验
时间间隔的把握

间隔时间越长，稳定性系数越低。适宜时间间隔依照
测验目的、性质及被试特点而定。几分钟至几年。年幼儿童，间隔要小；年长群体，间隔可大。智力测验的间隔不能太短，成就测验的间隔不能太长。一般间隔时间不超过六个月。（即不能让被试记住上
3. 误差方差与信度的关系

信度的范围 : 0到1.00 信度不受系统误差影响，受随机误差影响
信度的定义二

信度乃是一个被测团体真分数与实得分数的
相关系数的平方。

rXX=P2TX
信度的定义三

信度乃是一个测验X与它的任意一个
平行测验X＇的相关系数。 rXX=PXX＇

A卷：你是一个喜欢热闹的人吗？
6.练习效应任何一个测验在第二次应用时，都会有练习效应而使成绩提高。 7.反应方式反应方式是指独立于测验内容的反应倾向。这种反应倾向也会影响测验成绩。
三、真分数所谓真分数就是一个测量工具在测量没有误差时，所得到的纯正值。其操作定义是：经过无数次测量所得到的平均值。真分数的定义表明，一个人在一个测验上所得的分数，即是它的真分数的函数，也是测量误差的函数，用公式表示如下： X=T+E