误差_测量的信度与效度
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1=绝对是
2=是
3=不一定
4=不是
5=绝对不是
B卷:你是一个喜欢安静的人吗?
1=绝对是
2=是
3=不一定
4=不是
5=绝对不是
对信度系数要注意三点: 第一,在不同情况下,对不同样本,采用 不同方法会得到不同的信度系数,因此一个 测验可能不止一个信度系数; 第二,信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因; 第三,获得较高的信度系数并不是心理测 量追求的最终目的,它只是迈向目标的一步, 是使测验有效的一个必要条件。
(四)使用重测信度的优缺点 1.(优点)能提供有关测验结果 是否随时间而变异的资料,可作为预测 受测者将来行为的依据。 2.(缺点)容易受练习和记忆的 影响,前后两次施测间隔的长短必须适 度; 第一次尝试所发现的错误也可能导 致第二次反应的变化而增加误差变异。
二、复本信度(等值系数) (一)定义与计算 1. 定义 根据一组被试在两个平行(等值)测验 上的得分计算相关系数。 即 测验复份A 最短时距 测验复份B 因为它反映的是两个测验之间的等值程 度,故又称等值系数。
当几个测验复本不等值时,接受不 同的题目,就会获得不同的分数; 测验题目格式不妥; 测验的难度过高或过低; 测题或指导语用词不当; 测验时限过短。
(二)由施测过程引起的误差
三种误差来源中,此种误差可能是最 容易控制和检验的。与施测过程有关 的误差主要有以下几种: 1.物理环境 施测现场的温度、光线、声音、桌 面好坏、空间阔窄等皆有影响。
四、同质性信度 (一)定义 (二)计算 五、评分者信度 六、几种信度估计方法的比较
信度是一个理论上构想的概念,在 实际应用时,通常以同一样本所得的 两组资料的相关,作为测量一致性的 指标。因为测验分数的误差来源不同, 估计信度的方法也不同,故每一种信 度系数只能说明信度的不同方面,因 而具有不同的意义。
这里 X为实得分数或观测分数,T是假设的 真分数,E是测量误差。
需要说明的是,这里的测量误差(E) 指的是引起测量不一致性的变因产生的效 应,即指随机误差,不包括系统误差,后 者不引起分数的改变,因而包含在真值中。 在公式中E可能是正的,也可能是负的。 即一个人的实得分数可能大于真实量,也 可能小于真实量,总是围绕真值上下波动。
一次测验的内容,又不能让其特质发生变化,或对所
学知识产生遗忘)
(二)误差来源 1. 测验本身:测验所测的特性本身 就不稳定,例如情绪。 2. 被试方面:成熟、知识的发展并 非人人都等量增长,且练习因素、记忆 效果也存在个体差异。 3. 施测情境:偶发因素的干扰,如 计时错误,情绪波动,健康状况,动机 变化等。 重测信度高,说明分数受被试状况和 测验情境变化影响小。这里题目取样并 不影响重测信度。
“νθι σεαυτν!”
“人啊,认识你自己!”
人啊,准确地(accurately)认 识你自己!
准:一致 确:正确
心理测量试图帮助我们准确了解人的心理 现象(心理特质),就像尺子帮助我们测量身
高。 但这个工具是有误差的。 为了准确地认识心理特质,误差要控制在一
个许可的范围内。
一、误差的定义和种类 心理测量中所指的误差就是在测量 中与目的无关的变因所产生的不准确或 不一致的效应。
第一节 测量信度
一、什么是信度 1. 定义 信度(reliability)是指测量结果的稳定性(stability) 和可靠性程度。
一个好的测验必须稳定可靠,即多次测量结 果要保持一致。
2. 信度的测量学定义一
信度系数
该定义有两点需要注意: 第一、信度指的是一组测验分数或一 列测量的特性,而不是个人分数的特性; 第二 、真分数的变异数是不能直接测 量的,因此信度是一个理论上构想的概念, 只能根据一组实得分数做出估计。 信度涉及的主要问题是对测验分数意 义的概化能力,即从一次测量来推论总体 能达到何种正确程度。
信度係數 可信程度
信度 < 0.30
0.30 < 信度 < 0.40 0.40 < 信度 < 0.50 0.50 < 信度 <0.70 0.70 < 信度 < 0.90
不可信
初步的研究,勉強可信 稍微可信 可信(最常見的信度範圍) 很可信(次常見的信度範圍)
0.90 < 信度
十分可信
~ 中臺科技大學李復惠編製 ~
第三节 信度的估计方法
一、重测信度 (一)定义与计算 (二)误差来源 (三)计算重测信度的几个假设 (四)使用重测信度的优缺点 (五)注意事项
二、复本信度 (一)定义与计算 (二)误差来源 (三)等值测验应符合的条件 (四)注意事项 (五)使用复本信度的局限 三、分半信度 (一)定义及计算 (二)分半的方法 (三)校正公式
(四)注意事项 1. 两个测验必须在项目的内容、 形式、数量、难易、时限、指导语等方 面相同或相似; 2. 两次测验的时间间隔要适当, 若太短,由于测验太相似被试可能厌倦, 若太长可能又会因新的学习而产生干扰。
(五)使用复本信度的局限 1. 只能减少但不能完全消除练习 和记忆的影响; 2. 由于第二个测验只改变了题目 的具体内容,已经掌握的解题原则,可 以很容易地迁移到同类问题。 3. 对许多测验来说,建立复本是 十分困难的。
2.测验焦虑 一般来说 ,适度的焦虑会使人的兴奋 性提高,注意力增强,提高反应速度,从 而对测验成绩产生积极的影响。过高的焦 虑却会使工作能力下降,注意分散,记忆 中储存的东西不能提取,影响测验成绩。 3.生理因素 生病、疲劳、失眠等生理因素会影响测 验成绩而带来误差。
4.学习、发展和教育 由一般学习经验或发展变化所 引起的测验分数上的差异,在大多 情况下,只构成恒定误差,但有时 也构成随机误差。 5.测验经验 受测者对测验的经验也会影响 测验成绩,对测验的程序和技能熟 悉程度不同,所得分数便不能直接 比较。
一、重测信度(test-retest reliability)
(一)定义与计算 1.定义 用同一种测验,对同一组受试者,前 后施测两次,再根据受试者两次测验分数 计算其相关系数,即得再测信度。 即
测验
时距(几分-几年)
再测验
此种信度能表示两次测验结果有无变动, 反映测验分数的稳定程度,故又称稳定性 系数。
※ 一是误差是由与测验目的无关的变因引起的; ※ 二是误差存在于的测量结果中。
主要类型:系统误差、随机误差。
系统误差 是由与测验目的无关的因子所引起 的恒定的、系统的、有规律的变 化,存在于每次测量中,故又称常 定误差。 随机误差 是使用测量工具进行心理测量所造成 的误差,又称测量误差、观察误差、偶然 误差。它是由与测验目的无关的偶然因 素引起,使得几次测量结果不一致,且 这种不一致是无系统的、随机的。
(三)等值测验应符合的条件 等值测验可避免重测法的缺点,但所使 用的必须是真正的复本。复本应符合以下 条件: 1. 各份测验测量的是同一种心理特性; 2. 各份测验具有相同的内容和形式; 3. 各份测验的题目不应有重复的地方; 4. 各份测验题目数量相等,并且有大 体相等的难度、区分度; 5. 分数分布(平均数和差异度)大致 相等。
2.计算方法 计算使用皮尔逊积差相关公式的变式:
∑ X1X2- ∑X1 ∑X2 /N
rxx
S1S2
式中X1、X2为同一被试的两个分数, S1 、S2为两次测验的标准差,N为被 试人数。
2.重测信度使用的条件 (1)所测量的心理特质必须是稳定的 (2)遗忘和练习的效果基本上相互抵消 (3)在两次测试时间间隔内,被试在所要 测查的心理特质方面没有其他的学习和练 习
信度系数要达到多高才可以接受呢?
一般能力与学绩测验的信度系数在 0.90 以上; 人格测验的信度系数通常在0.80 以上。 当rxx <0.70时,不能用测验对个人作 评价,也不能在团体间作比较; 当rxx ≥0.70时,可用于团体间比较; 当rxx ≥ 0.85 时,可用于鉴别个人。
信度係數參考範圍
真分数理论的三个基本假设: 误差分数的平均数是零(由于测 量误差具有随机性); 误差分数与真分数相互独立,即 相关为零; 两次测量的误差分数之间的相关 为零。
对于一个团体来说,实得分数、真分 数和测量误差之间有如下关系: SX 2 =ST2+SE2
即实得分数的变异数等于真分数的变异数 加上误差变异数。
2.主试者方面 主试者的年龄、性别、外表,施测时的言谈举止、 表情动作等均能影响测验结果。 3.意外干扰 在测验环境复杂,特别是当受试人数较多时,容 易发生意外情况,这会导致测验成绩不准确。 4.评分记分 评分不客观、计分、登记分数出错等也是常见的 误差。
(三)由受测者本身引起的误差 即使一个测验经过精心编制,题目取样具有 代表性,又有标准化的施测程序,由于受测者 本身的变化,仍然会给测验分数带来误差,这 种误差是最难控制的。主要有以下几种: 1.应试动机 受测者对测验的动机不同,会影响其作答态 度、注意力、持久性、反应速度等,从而影响 测验成绩。
二、误差的来源
(一)测验内部引起的误差 (二)由施测过程引起的误差 (三)由受测者本身引起的误差
在心理测量中,常见的误差来源于三 个方面:测验内部、施测过程、受测者本 身。 (一)测验内部引起的误差 测验内部引起的误差主要来源于题目 取样: 当测验题目较少或取样缺乏代表性 时,被试的反应受机遇影响较大;
2. 计算方法
rxx
=
∑ XAXB/N-XAXB SASB
式中XA 、XB为同一被试在两个测验复 份A、B上的分数,XA 、XB为A、B两 型测验的平均分数,SA 、SB为A、B两 型测验的标准差,N为被试人数。
(二)误差来源 1. 测验两种形式是否等值: (1)测题取样是否匹配; (2)格式是否相同; (3)内容、题数、难度、平均数、 标准差是否一致。 2. 被试方面情绪波动、动机变化等。 3. 测验情境的变化,偶发因素的干扰。
测量的信度与效度
本章提要: 误差的概念与估计方法 信度的概念与估计方法 提高信度的方法 效度及其与信度的关系 效度的种类与估计方法 提高效度的方法
从“斯芬克斯之谜”说起……
腿两一 最条种 多腿动 时,物 最晚 无上早 能三晨 。条四 腿条 走腿 路, ;中 午 :
古希腊的德尔斐,传说中的太阳神阿波 罗的驻地,哲人塔列斯刻在太阳神圣殿 外的一句传世名言:
公式(5.2) 只涉及随机误差的变异,系 统误差的变异包含在真分数的变异中, 即 ST 2=S V2+SI2 公式中S V2是与测量目的有关的(有效 的)变异数,SI2 是与测量目的无关但 却是稳定的变异数。
可得公式: SX 2= SV2+SI2+SE2
Sx 2
S V2
S I2
SE2
ST2 这就是说,一组测验分数之间的变异性是 由与测量目的有关的变异数、稳定的但出自无关 来源的变异数和测量误差变异数所决定的。
3.计算重测信度应注意的问题
(1)两次测验时间间隔要适当
(2)应提高被试的积极性
(3)适宜于人格测验与速度测验, 不适合于智力等难度测验
时间间隔的把握
间隔时间越长,稳定性系数越低。适宜时间间隔依照
测验目的、性质及被试特点而定。几分钟至几年。 年幼儿童,间隔要小;年长群体,间隔可大。智力测 验的间隔不能太短,成就测验的间隔不能太长。 一般间隔时间不超过六个月。(即不能让被试记住上
3. 误差方差与信度的关系
信度的范围 : 0到1.00 信度不受系统误差影响,受随机误差影响
信度的定义二
信度乃是一个被测团体真分数与实得分数的
相关系数的平方。
rXX=P2TX
信度的定义三
信度乃是一个测验X与它的任意一个
平行测验X'的相关系数。 rXX=PXX'
A卷:你是一个喜欢热闹的人吗?
6.练习效应 任何一个测验在第二次应用时,都 会有练习效应而使成绩提高。 7.反应方式 反应方式是指独立于测验内容的反 应倾向。这种反应倾向也会影响测验 成绩。
三、真分数 所谓真分数就是一个测量工具在测量没 有误差时,所得到的纯正值。 其操作定义是:经过无数次测量所得到的平 均值。 真分数的定义表明,一个人在一个测验 上所得的分数,即是它的真分数的函数, 也是测量误差的函数,用公式表示如下: X=T+E