第二章 信度
信度概念及信度的主要特征
信度概念及信度的主要特征信度是指测量工具(例如问卷、测验或观察工具)测量结果的稳定性和一致性。
在研究中,信度是一个重要的概念,因为它表明了测量工具的准确性和可靠性。
如果测量工具具有高的信度,那么它可以提供可靠和稳定的测量结果,从而增加研究结果的可信度。
信度的主要特征如下:1. 稳定性(Test-Retest Reliability):稳定性信度是指在时间间隔相对较短的情况下,测量工具测量结果的一致性。
为了评估稳定性,研究者在两个不同的时间点对同一群体进行测量,然后计算相关系数来确定两个测量结果之间的一致性。
如果相关系数接近于1,则说明测量工具具有高的稳定性。
2. 等价性(Parallel-Forms Reliability):等价性信度是指两个或多个测量工具在测量同一概念或特征时的一致性。
为了评估等价性,研究者需要设计多个测量工具,然后在同一群体上进行测量。
通过比较不同测量工具的测量结果,可以确定它们之间的一致性。
如果不同测量工具的测量结果高度相关,则说明它们具有高的等价性。
3. 内部一致性(Internal Consistency):内部一致性信度是指测量工具各个项(问题)之间的相关性。
如果测量工具各个项在测量相同或相关的概念时具有高的相关性,那么测量工具具有较高的内部一致性。
常用的内部一致性统计指标包括Cronbach的α系数和分割半相关系数。
4. 信度的切割半(Split-Half Reliability):信度的切割半是指测量工具的各个项分为两个互斥的子集,然后通过比较两个子集的测量结果来评估信度。
通常,研究者将测量项分成两个互斥的子集,在同一群体上进行测量,并计算两个子集测量结果之间的相关系数。
如果相关系数接近于1,则说明测量工具具有高的信度。
5. 因子分析(Factor Analysis):因子分析是评估测量工具信度的一种常用方法。
通过对测量工具的各个项进行因子分析,可以确认测量工具是否测量了同一个概念。
《信度和效度测量》课件
外部信度是指 测量工具或方 法与其他测量 工具或方法的 相关性,如重 测信度、复本 信度等
效度是指测 量工具能够 准确地测量 出被测对象 的真实水平 的程度
效度包括内 容效度、结 构效度和信 度效度
内容效度是 指测量工具 的内容是否 符合被测对 象的实际需 求
结构效度是 指测量工具 的结构是否 符合被测对 象的实际需 求
目标
市场调研:通 过信度和效度 测量,提高调 研结果的准确
性和可靠性
应用场景:产 品定位、市场 细分、消费者
行为分析等
招聘与选拔:通 过信度和效度的 测量,可以更准 确地评估应聘者 的能力和素质, 提高招聘和选拔
的准确性。
绩效评估:通过 信度和效度的测 量,可以更准确 地评估员工的工 作表现,为绩效 评估提供科学依
预测效度:测量结果是否能预测未来行 为
区分效度:测量结果是否能区分不同群 体
概念:衡量预测变量与实际结 果之间的相关性
优点:简单易行,易于理解
缺点:可能存在偏差,不能完 全反映实际情况
应用:常用于预测市场趋势、 消费者行为等
PART FIVE
信度:测量工具 的稳定性和可靠 性,确保测量结
果的一致性
应用:广泛应用于 社会科学、教育学 等领域
优点:简单易用, 结果直观
PART FOUR
内容效度法是一种测量 效度的方法,用于评估 测量工具的内容是否与 理论或概念相符合。
内容效度法通常通 过专家评审、问卷 调查等方式进行评 估。
内容效度法可以评 估测量工具的覆盖 范围、准确性和代 表性。
内容效度法可以帮 助研究者确定测量 工具是否适合用于 特定的研究目的。
PART THREE
重测信度法的定义:通过在不同时 间对同一组受试者进行相同的测量, 比较测量结果的一致性来评估信度。
第二章实验研究的基本问题
3、定时系列设计举例
例: 小学生思维训练的效果的研究.
实验处理
1 2 3 4 5 6
7
实验观测
4、定时系列设计模式统计处理
假定试验处理的效应是短期的、暂时性的,可 根据实验处理前的各观测分数用线性回归或非线 性回归的方法把实验处理后可能的观测分数O6’预 测出来,然后用相关样本T检验比较和O6是否有差 异。 假定试验处理效应是连续的、长期的,则应该把 O6’ O7’ O8 ’ O9’ O10 ’等都预测出来,再将他 们和实际观测分数比较。
5、定时系列设计评价
优点:除具有前后设计的优点,还具有 (1)降低由于一次观测而得到被试不正常行为 的几率; (2)提供测量过程中的信息。
缺点: (1)由于更多次的观测,势必延长实验时间, 从而会有更多的外来影响; (2)也正是更多次的观测,更易引起顺序误差, 更易导致练习、疲劳、紧张或厌烦等效应。
实验。 2、基本原理:
每个被试者参与所有的实验处理然后比较相 同被试者在不同处理下的行为变化。 3、使用前提:
先实施给被试的处理对后实施的处理没有长 期影响。
(一)实验前后设计
1、定义: 在实验条件处理前对被试观测的结果与 实验条件处理后所做的同样观测的结果加以对比 的设计。
2、基本模式:
3、实验前后设计举例
目的:第一次参加射击运动的人在接受打 靶训练前后打靶成绩的变化。
方法:选择10名从来没有参加过射击运动 的被试,在他们进行打靶练习前,先进行 一次打靶测验,记录下他们的打靶成绩 (前测成绩)。然后对他们进行为期1周的 打靶训练,每天2小时。训练结束后,再次 对他们的进行打靶测验,记录下他们的成 绩(后测成绩)。将前后两次成绩进行比 较,就可以看出1周的训练是否有效果。
心理学研究方法名词解释
心理学研究方法名词解释《心理学研究方法》名词解释第一章:绪论1、科学是对客观事物及其运动变化规律的真理性认识,表现为系统化的知识体系。
2、科学研究,是指通过运用各种科学方法,遵循科学的认识过程,根据对收集到的事实材料的分析,对假设或理论进行检验,以寻求客观事物的本质及其运动变化规律的一种思维活动或过程。
3、科学方法:指从事科学研究所采用的手段,具有客观性、有效性等特性。
4、科学方法论:是以认识论为基础,以科学研究过程为线索,以一整套系统的科学研究方法为内容所建立起来的体系。
5、量化研究:研究涉及到可量化的变量,并且研究结果中变量之间的关系以一种数量化的方式来呈现。
6、质化研究:研究涉及的是难以进行量化的材料,研究的结论也常常是描述性的。
7、理论研究:它主要通过理论论证、列举材料、总结分析等方式对心理现象或规律提出新的见解。
如青少年早恋心理分析、教师心理健康及调适、试论心理健康教育运作模式等。
8、描述研究:它主要通过观察、访谈、案例分析(个案)等方式获得事实材料(证据)以表明或证明关于心理现象与规律的看法。
如课堂教学中师生互动的观察研究、有关心理健康教育的访谈研究、注意力不集中儿童的个案研究等。
9、实证研究:它主要通过测评、实验等方式获得数据材料以表明或证明有关心理现象与心理规律的看法。
如不同类型学校学生自信心状况研究、教师期望改变影响中学生学习动机的实验研究等。
第二章:研究课题的选择与文献查阅10、理论:一种能解释某些现象的具有逻辑关系的肯定陈述,是由一定的科学概念、概念间的关系及其论证所组成的知识体系。
即:对一系列抽象变量之间可能关系的描述。
11、研究问题:一个或多个变量与另一个或多个变量之间的关系12、研究假设:指明研究问题的可能结果,即变量之间关系的性质以及变量作用的程度13、预测性假设:对客观事物存在的某些情况,特别是差异情况作出推测判断。
14、相关性假设:对客观事物相互联系的性质、方向、密切程度作出推测性判断。
心理测量学-2017级-第2讲
区分度(discriminability)
计算
• 项目鉴别指数法
• 相关法(如,题总相关) • 方差法
相对性
算法、n、分组、同质性
区分度(discriminability)
区分度(discriminability)
难度与区分度
⒈难度接近1 难度接近0
⒉难度接近0.5 ⒊0.5,大梯度
效度(validity)
• 内容效度(Content validity)
1.含义 一个测验实际测到的内容与所要测量的内容之间的吻合 程度 2.用途 适合成就、职业测验;不适合能力和人格测验 3.确定方法 逻辑分析法/专家评定法等 4Байду номын сангаас其他 表面效度(Face Validity)
效度(validity)
效度(validity)
内容(广泛) 构想(抽象)
成就、职业等 人格、智力等
逻辑分析法 统计法 经验法
内、校标 间(相容、区分) 多-多矩阵、因素分析
外在标准
同时:诊断
(检验有效性) 预测:预测
相关 区分、预期表法 命中率 功利率法
表面效度 校标
影响及改进
• 主试 • 被试 • 工具 • 施测过程 • 其他
效度(validity)
• 构想效度(Construct validity)
1.含义 构想(construct):心理学理论所涉及的抽象而属假设性 的概念或特质,如智力、焦虑、人格等。 一个测验实际测到所要测量的理论结构或特质的程度。 2.用途
“unifying concept” 适合智力、人格测验 3.确定方法 (1)实证效度法 (2)测验内部:3 (3)测验之间:相容、区分 (4)多‐多矩阵法 (5)因素分析
《信度理论》课件
可以帮助研究人员确定调查数据的可靠性和一致性,从而得出更准确的
结论。
信度在沟通交流中的应用
• 信度在沟通交流中的应用:信度理论可以帮助沟通者评估信息 的真实性和可信度,从而做出更明智的沟通决策。例如,在商 务谈判中,信度评估可以帮助谈判者判断对方提供的信息是否 真实可和统计学领域
信度理论主要应用于概率论和统计学领域,用于估计某一事件或现象发生的可能性。
信度理论不适用于所有情况
虽然信度理论在某些情况下非常有用,但它并不适用于所有情况。例如,在处理复杂系统或不确定性较高的问题 时,信度理论可能无法提供准确的估计。
信度理论与其他方法的比较
与贝叶斯方法比较
自然语言处理
利用信度理论处理自然语言中的不确定性,提高 机器翻译、文本摘要等任务的准确性。
图像识别
结合信度理论对图像识别中的不确定性进行建模 ,提高图像分类、目标检测等任务的可靠性。
3
强化学习
将信度理论应用于强化学习中,为智能体提供更 准确的奖励信号,提高其决策能力。
THANKS
感谢观看
与概率论的结合
探讨信度理论与概率论之间的联系,借鉴概率论的严谨性和规范 性,完善信度理论。
与贝叶斯统计的融合
将贝叶斯统计的推理方法引入信度理论,为处理不确定性和主观判 断提供新的思路。
与决策科学的结合
研究信度理论在决策科学中的应用,为决策者提供更可靠的决策依 据。
信度理论在人工智能领域的应用前景
1 2
信度理论的局限与挑战
信度理论的有效性
信度理论的有效性取决于数据的质量和数量
信度理论依赖于大量的数据来计算信度,如果数据质量不高或数量不足,可能会 导致信度计算不准确。
信度理论对异常值敏感
心理测量 重点
第一章一.什么是测量?测量的三个要素是什么?测量就是根据一定的法则给事物指派数字。
事物及其属性——测量的对象法则——指导测量的规则和程序,数字——测量结果的表示方式。
二.测量有哪四种水平?其各自的特点是什么?(1)类别测量根据法则指派给事物的数字仅是事物的符号或称呼,没有任何数量大小的含义。
这种测量又可分为两类:代号,类别所适用的统计方法主要是次数统计,如频数、众数、百分比、卡方检验等。
(2)等级测量指派给事物的数字具有等级性和序列性,但不表示数与数之间的差距是相等。
适用的统计方法有中位数、百分位数、等级相关等。
(3)等距测量数字不但有大小关系,而且具有相等的单位,但没有绝对的零点。
可以做加减运算,但不能做乘除运算。
适用的统计量有平均数、标准差、积差相关、t检验、F检验等。
(4)比率测量数字不但具有相等的单位,而且具有绝对的零点。
所得的值可以进行加减乘除运算,适用的统计量除以上几种外还可以计算几何平均数、变异系数等。
三.什么是心理测量?理解心理测量的性质(特点)所谓心理测量,就是根据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值。
1、心理测量的间接性2、心理测量的相对性3、心理测量的时空性4、心理测量的客观性四.什么是心理测验?心理测验的三个要素是什么?心理测验实质上是对行为样组的客观和标准化的测量。
行为样本标准化:测验的一致性测验内容的标准化,施测条件的标准化,评分规则的标准化,测验常模的标准化客观性:科学性五.极限行为测验、典型行为测验、常模参照测验、标准参照测验?极限行为(最高行为)测验:要了解个体在某种心理特质或行为表现上的最佳表现水平。
典型行为测验:要了解被试在某种心理特质或行为上最一般、最具有代表性的表现。
常模参照测验:将被试测验结果的分数与常模分数相比较来解释被试的成绩。
标准参照测验:将被试测验结果的分数与一个既定的标准比较来解释被试的成绩。
第二章信度一.什么是测量误差?什么是系统误差与随机误差?测量的误差是指在测量过程中由那些与测量的目的无关的变化因素所产生的一种不准确或不一致的测量效应。
《测量的信度》课件
社会背景:被测 量者的社会背景 会影响其反应和 表现
Part Three
选择经过验证的测量工具,确保其可靠性和有效性 定期对测量工具进行校准和维护,确保其准确性 确保测量工具的使用符合操作规程和标准 定期对测量工具进行评估和更新,确保其先进性和适用性
培训内容:测量原 理、测量方法、测 量工具使用等
操作步骤:对同一 对象进行多次测量, 然后计算平均值
注意事项:确保每 次测量的条件一致 ,避免因条件变化 导致的误差
应用领域:广泛应 用于科学研究、工 程测量等领域
Part 即测量工具能够稳定地、可靠地测量出被测对象的 真实水平
效度:测量工具的准确性和有效性,即测量工具能够准确地、有效地测量出被测对象的 真实水平
信度是指测量工具的稳定性和可靠性,效度是指测量工具的准确性和有 效性。 在实际应用中,信度和效度需要平衡,不能只追求一方而忽视另一方。
提高信度的方法包括增加测量次数、采用更稳定的测量工具等。
提高效度的方法包括选择更合适的测量工具、采用更科学的测量方法等。
Part Five
心理测量:通过信 度检验,确保测量 工具的准确性和可 靠性
,
汇报人:
01 02 03 04
05
Part One
信度是指测量工具或方法的可靠性和稳定性 信度越高,测量结果越接近真实值 信度包括内部一致性、重测信度和分半信度等 信度是测量工具或方法质量的重要指标
信度是测量工 具质量的重要
指标
信度反映了测 量工具的稳定
性和可靠性
信度高的测量 工具可以提供 更准确的测量
添加标题
添加标题
考试评价:通过信度测量,确保考 试的公平性和有效性
教育研究:通过信度测量,提高教 育研究的科学性和准确性
信度
实施任何一项测验时,测验使用者 都希望相同个体在相似的情境下再次测 试的结果能够一致。期望测验分数能达 到的这种一致性叫做信度(relibility)。 是估计误差的最重要的量化指标之一。
主要内容
测量的误差 经典测量理论:真分数模型 测量的信度 估计信度的方法 影响信度的因素
1.1测量中的随机误差
随机误差的含义
与测量的目的无关的偶然因素引起的变化无规律的 误差,使得多次测量结果不一致,这种误差的大小 和方向是随机。 比如,“在人际交往中,我的自我感觉好极了。” 这样的题项测量就很大程度上受到近来人际交往状 况这个随机因素的影响。
随机误差的特点
随机误差是随机分布的 随机误差是正态分布的
如果相关,就会部分地反映一组被试的水平 差异,就不成其为误差了。 两次测量的误差分数之间的相关为零,误差 是随机的。
3、测量的信度:测量学定义
在测量学上,信度被定义为,某一测验的真分 数与观测分数间的相关系数,或者某一测验 分数的真分数变异数与总变异数的比率,
SX=ST +SE
2.2 真分数的涵义(T或ST )
本质涵义:反映个体真实水平的分数,测量 中不存在误差时的真值或客观值。 操作定义:无数次测验结果的平均值。 案例:比如测量视力、身高 跳远、学习成绩测验
2.3 真分数模型的基本假设
误差分数的平均数为零 误差分数与真分数相互独立,即相关为零。
r=st2/sx2 解释:变异数 群体与个体 案例:智力测量为例
3、测量的信度:操作定义
在实际测量中,真分数是未知的。 信度系数不能由上述公式获得,而由两组分 数的相关系数获得。
人才测评 第二章 信度与效度
1.专家判断法 最常用的方法是请有关专家对测验题目与 原定内容的符合性做出判断,看测验的题目是否代表规定 的内容。如果专家认为测验题目恰当地代表了所测内容, 测测验具有内容效度。由于这种估计效度的方法,是一个 逻辑分析的过程,所以内容效度有时又称“逻辑效度” 2.统计分析法 内容效度的确定也可采用一些统计分析 方法,例如计算两个评分者之间评定的一致性;内容效度 可由一组被试在独立取自同样内容范围的两个测验复本上 得分之相关来作估计;另外,再测法也可用于内容效度的 评估。 3.经验推测法 通过实践来检验效度。
效度的定义:在心理测验中,效度是指测量的与所要测量 的心理特点之间符合的程度,或者简单地说是指一个心理 测验的准确性. 在测验理论中,效度被定义为在一组测量中,与测量目标 有关的真实方差与总方差的比率。
r
2 xy
效度的性质
S S
2 V 2 X
(公式5-21)
1.效度具有相对性:测验只有用于与测验目标一致的目的和场合才 会有效。不能笼统地说测验有没有效,而应该说它测量什么有没有效. 2.效度具有连续性:测验效度只有程度上的不同,而没有“全有” 或“全无”的区别。应该用效度较高或较低来表示.
待指令生效后欧盟委员会将对暖气与热水设备电动马达系统家庭与服务业的照明设备家用电器家庭与服务业的办公室设备通风与空调设备等作出环境化设计的实施方法涵盖产品所含的原材料生产方式使用方式包括耗水耗能情况产品寿命以及产品报废时的处理方法或可以循环再造的程度
郑久华
心理特质的差异性 心理特质的稳定性 心理特征的可测性 人职匹配理论
学术成就 特殊训练成绩 实际工作表现 团体对比 等级评定 先上的构想或 特质的程度,即测验的结果是否能证实或解释某 一理论的假设、术语或构想,解释的程度如何。 确定构想效度的步骤
教育测量的质量指标--信度概述(ppt 54页)
三、信度系数的类型
(一)稳定性系数 (二)等值性系数 (三)内部一致性系数 (四)论文式测验的信度系数 (五)评分者信度
(一)稳定性系数( coefficient of stability )
又称重测信度,是指用同一量表对相同 被试者(一组人)在不同时间测验两次 的实得分数的相关系数。
2、怎样估计对一组人或一个人测量多次的实测 值与真值(真分数)的差异程度呢?
于率是。,即信:度(rxx)可定义为真分数的方差与实得分数方差的比
r xx
2 T
2 x
公式(1-6)
rxxσ2xσ 2xσE2 1σ σE2x2 公式(1-7)
σ 可见为,[0,E2 1越]小。,测量的信度就越高。信度的取值范围
判别两组数据谁好谁差,不能只靠对平均数的 统计和比较,关键是确定这两组数据偏离各
自的平均数的大小。为了消除数据容量的影
响,我们借鉴研究加权平均数的方法,选用
各个偏差的平方的平均数,来描述一组数据
偏离其平均数的大小,这就是方差。
根据假设,实得分数的方差应等于真分数的方差加上
测量误差的方差。即:
σ2x σ2T σE2 公式(1-5)
值),E表示误差。
E=x-T
(公式1-2)
(一)信度指实测值和真值相差的程度
1、试比较以下两次测量结果(只进行 一次)的信度:
用尺子量100cm高的一个儿童,得到1cm 的绝对误差;量185cm高的一位运动员, 也得得到1cm的绝对误差。
要比较两种测量结果的信度,一定要看误差分数(E) 对于真分数(T)所占的百分数是多少。这个百分数 表示该实得分数(x)的相对误差。其计算式如下:
➢ 信度(reliability):指的是测量结果的 稳定性和可靠的程度,亦即测量的结果是否 真实、客观地反映了考生的实际水平,可记 为rxx。
《心理测量信度》课件
信度系数可以帮助雇主了解测验的一致性和可靠性,从而更好地解释 和比较测验结果。
03
在职业测验中,信度可以通过重测法、分半法、同质性法等方法进行 评估。
04
高信度的测验结果可以更准确地反映应聘者的能力和潜力,为雇主做 出更明智的招聘决策提供支持。
信度在临床心理测验中的应用
在临床心理测验中,信度是评 估测验可靠性和稳定性的关键
因素。
在临床心理测验中,信度可以 通过重测法、分半法、同质性 法等方法进行评估。
信度系数可以帮助心理医生了 解测验的一致性和可靠性,从 而更好地解释和比较测验结果
。
高信度的测验结果可以更准确 地反映患者的心理状况和需求 ,为心理医生制定更有效的治 疗方案提供支持。
THANKS
感谢观看
测验难度
测验难度对信度的影响主要体现在被 试的得分分布上。如果测验难度适中 ,被试的得分分布较为集中,信度就 较高;如果测验难度过高或过低,被 试的得分分布就会过于分散,导致信 度下降。
VS
在编制心理测验时,应根据测验的目 的和被试的特点来设置适当的难度水 平,以保证测验的信度。
被试样本
被试样本的差异也会影响测验的信度 。如果被试样本具有代表性,那么测 验的信度就较高;如果被试样本偏差 较大,那么测验的信度就会受到影响 。
信度的意义
提高测量结果的可靠性
信度评估可以确定测量工具的一致性 ,从而提高测量结果的可靠性,使结 果更加准确可靠。
减少误差
比较和解释
信度评估可以比较不同测量工具之间 的结果,以及在不同时间或情境下对 同一对象进行测量的结果,从而更好 地解释和比较测量结果。
信度评估可以识别和减少测量误差, 从而提高测量的准确性。
2.1信度
第一节信度信度是衡量测验分数一致性或可靠性的一个指标,即用一个或一组测验对同一被试群体施测多次,所得结果的一致性程度,以及测验分数所反映被试真实水平(即真分数)的可靠性程度。
如果对一组学生用同一个测验实施两次,测试的结果完全一样,可以认为该测验完全可靠,这时它的信度系数为1。
但在现实中这种测验是很难找到的。
在测量心理属性的教学测量中,与测量目标无关的变量(或因素)对测量的不准确和不一致的效应,使这类测量产生各种误差。
误差越大,信度越低;而误差越小,信度越高。
因此,确定测验的客观性和可靠性程度的关键在于控制各种误差,使测验能测出心理属性的客观量数,并使其具有良好的稳定性。
怎样提高测验的信度,是值得进一步研究的问题。
一、信度的概念我们知道,影响信度的主要因素是测量中的误差。
那么误差又是如何产生的呢?一般情况下,测量资料存在三种误差。
一是抽样误差。
它是由机遇或抽样变动而造成的误差。
它的估计值Sx是样本标准差S与样本容量n的算术平方根之比。
由于测验取样容量n总是相当大,因此Sx很小,可以忽略不计。
二是随机误差。
它是由偶然因素引起的无规律的误差,是由心理属性的行为反应所造成的。
三是系统误差。
它是由与测验目标无关的某种常定因素所引起的恒定的、有规律性变化的误差。
由于这种误差的影响,可使每个学生的得分普遍偏高或普遍偏低,但是,它在测验成绩中不会引起不一致性。
因此,测验的可靠性主要是研究如何控制随机误差问题。
为此,我们将通过真分数、随机误差与所得分数的关系来揭示随机误差对信度的影响程度。
1.真分数在无数次测验中所得分数的期望值称作真分数。
由于测量误差在测验中不可避免地存在,因此,真分数只是理论上的概念。
根据真分数理论,我们可以将学生个体的测验实际得分X表示成真分数T与随机误差分数E的和,即X=T+E。
真分数理论存在着两个假设:一是真分数与误差分数相互独立,即真分数与误差分数的相关系数rte为零;二是由于随机误差是无规律的,不会倾向于任何一个方面,所以当测量次数n足够大时,随机误差的总和nii=1E为零。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18
3
23
4
21
5
17
6
18
7
20
8
17
9
16
10
13
11
14
12
13
13
12
14
8
15
8
奇数 20 题 (X)
偶数 20 题 (Y)
22
19
22
18
15
14
17
15
16
14
12
10
7
8
(2)库得-理查逊(Kuder&Richardson)系数(采 用0,1记分时 )
KR20
n ( n-1
第二讲 信度
内容: 1.信度的含义 2.信度的计算方法 3.影响测验信度的因素 4.提高测验信度的方法
(一)什么是信度 信度是指测量结果的稳定性或可靠性程度。 一个好的测量必须具有较高的信度,其结果就不应 随工具的使用者或使用时间等方面的变化而发生较 大的变化。 信度可以理解为:信度指实测值(观察分数)和真 值(真分数)相差的程度;信度指两次重复测量或 等值测量之间的关联程度。
3.内部一致性系数 (1)分半信度 在测验无复本且只能施测一次的情况下,通 常用分半法估计信度,即将测题分成对等的两 半,根据各人在这两半测验的分数,用皮尔逊 积差相关公式计算其相关系数,作为信度指标。 分半信度考察的是两半题目之间的一致性, 故这种信度系数也称内部一致性系数。计算分 半信度仍然可用积差相关方法。
也可用下列公式:其中X、Y为同一 被试的两个分数,Sx、Sy为两组分 数的标准差。X、Y为两组分数的平均 数,N为被试人数。
∑ XY/N-XY rxy = SxSy
例一
• 用一个算术四则的速度测验10个小学生,得分记 为X,为了考察测量结果的可靠性,于1个月后 再测一次,得分记为Y,问测验结果是否可靠? • 序号 1 2 3 4 5 6 7 8 9 10 • X 74 71 80 85 76 77 77 68 74 74 • Y 82 75 81 89 82 89 88 84 80 87 解:有题中数据可求得:∑ X=756 ,∑ Y=837, ∑ XY= 63369 ,∑X2 = 57352 ,∑Y2 =70245 代入公:
在使用重测法计算稳定性系数时,应 注意以下问题:
• 1、信度的取值范围为[0,1],当信度值 较大时,说明前后两次测量结果比较一 致; • 2、两次测验之间的时间间隔要适宜。应 由测验的性质、测题类型、测题数量和 被试特点所决定; • 3、重测法适用于速度测验而不适用于难 度测验; • 4、应注意提高被试者的积极性。
式中X1 、X2为每一被试奇数题得分和偶数 题得分,N为被试人数。
为什么要对分半信度进行校正?
• 将一个测验分成两个假定相等而独立的部分 来求其两组分数的相关系数,要用斯皮尔曼 —布朗公式予以校正。 • 因为测验的长度(题目数)对信度的高低有 一定的影响,测验越长,信度越高。用分半 法求信度系数,实际上相当于把整个测验长 度减小一半,求得的相关仅是半个测验分数 相关,求出的信度必然低于整个测验的信度。 因此,要用斯皮尔曼-布朗公式予以校正,藉 以估计整个测验的信度。
该定义有两点需要注意:
第一、信度指的是一组测验分数或一 列测量的特性,而不是个人分数的特性; 第二 、真分数的变异数是不能直接 测量的,因此信度是一个理论上构想的概 念,只能根据一组实得分数做出估计。 信度涉及的主要问题是对测验分数意 义的概化能力,即从一次测量来推论总体 能达到何种正确程度。
实得分数、真分数和测量误差之间有如下关 系: X=T+E T真分数、X观察分数、E 误差分数 SX 2 =S T2+SE2 SX 2 表示观察分数的方差;S T2 表示真分数 的方差;SE2表示误差分数的方差
施测
时间间隔
再施测
相关系数
重测信度图式
计算使用皮尔逊积差相关系数公式:其中X、 Y为同一被试的两个分数,N为被试人数。
N XY X Y
r
xy
2
ቤተ መጻሕፍቲ ባይዱ
[ N X ( X ) 2] [ N Y ( Y ) 2]
2
计算出相关系数后,需要进行检验。其 中自由度df=N—2,根据积差相关系数界 值表,将求得值与临界值进行比较。
信度系数要达到多高才可以接受呢?
一般能力与学绩测验的信度系数在0.90 以上; 人格测验的信度系数通常在0.80 以上。 当rxx < 0.70时,不能用测验对个人作评价,也不能在团体 间作比较;当 rxx ≥0.70时,可用于团体间比较; 当rxx ≥ 0.85 时,可用于鉴别个人。
信度的数学定义:一组测验分数中真分数 方差与实测分数方差的比率。信度一般在0 和1之间取值,rxx越接近 1,信度越高。
校正公式: (a)斯皮尔曼—布朗公式 rtt=2rX1X2/(1+ rx1X2) 其中,rX1X2为分半相关系数, rtt为校正 信度系数。 此法假设:两半测验分数的变异性相等, 即平均数、标准差、难度、区分度、分布形态 以及内容都相同,但实际资料未必符合此假设。 当两半不等值时,即上述假设不满足时, 可采用下面两公式之一:
重测信度的误差来源 1. 测验本身:测验所测的特性本身就不 稳定,例如情绪。 2. 被试方面:成熟、知识的发展并非人 人都等量增长,且练习因素、记忆效果也存在 个体差异。 3. 施测情境:偶发因素的干扰,如计时 错误,情绪波动,健康状况,动机变化等。 重测信度高,说明分数受被试状况和测 验情境变化影响小。这里题目取样并不影响重 测信度。
(b)弗朗那根公式: rxx=2[1-(Sa2+Sb2)/Sx2] 其中Sa2和Sb2分别表示两半测验分数的方 差,Sx2表示测验总分的方差。 (c)卢伦公式: rxx=1- (Sd2/Sx2) 其中Sd2表示两半测验分数之差的方差, Sx2表示整个测验分数的方差。
一个测验向 15 名被试试测,被试在奇偶分半测验上 的得分如下表所示,计算测验的分半信度系数。
计算重测信度的几个假设: 1.所测量的特性必须是稳定的; 2.遗忘与练习的效果相同; 3.两次施测期间被试的学习效果没 有差别。
使用重测信度的优缺点:
1.(优点)能提供有关测验结果 是否随时间而变异的资料,可作为预测 受测者将来行为的依据。 2.(缺点)容易受练习和记忆的 影响,前后两次施测间隔的长短必须适 度; 第一次尝试所发现的错误也可能导致 第二次反应的变化而增加误差变异。
真分数:所谓真分数就是一个测量工具在测 量没有误差时,所得到的纯正值。其操作定 义是:经过无数次测量所得到的平均值。 真分数的定义表明,一个人在一个测验上所 得的分数,即是它的真分数的函数,也是测 量误差的函数,用公式表示如下: X=T+E 这里 X为实得分数或观测分数,T是假设 的真分数,E是测量误差。
等值测验应符合的条件 等值测验可避免重测法的缺点,但所使用 的必须是真正的复本。复本应符合以下条件: 1. 各份测验测量的是同一种心理特性; 2. 各份测验具有相同的内容和形式; 3. 各份测验的题目不应有重复的地方; 4. 各份测验题目数量相等,并且有大体相等 的难度、区分度; 5. 分数分布(平均数和差异度)大致相等。
St 2 piqi
St
2
)
N是测试题数,Pi是第i题答对率,qi是第i题答错率, St2为样本考生总分的方差
KR21
n ( 1 n-1
X(
n
X)
nSt2
)
10名被试在一个测验上的得分如下表(答对得1分, 答错得0分),试估计被试反应的一致性程度。
题目 被试 得分
• 原始分数计算公式:
r
xy
N XY X Y [ N X 2 ( X ) 2] [ N Y 2 ( Y ) 2]
• 将计算结果与相关系数检验表比较
假设对10名学生用两个等值的A1与B1测验施测,测 验实得分数分别为X和Y表示,测验结果如下表,求 该测验的信度。
(二)信度的计算 1、重测信度(再测信度)-稳定性系数 指的是同一个量表对同一组被试施测两次所得 结果的一致性程度。 即测验A1时距(几分-几年)再测验A2 此种信度能表示两次测验结果有无变动,反映 测验分数的稳定程度,故又称稳定性系数。 其大小等于同一组被试在两次测验上所得分数 的相关系数,一般采用皮尔逊积差相关的公式 来计算。
2.复本信度-等值性系数 根据一组被试在两个平行(等值)测验上的 得分计算相关系数。 最短时距 即 测验复份A 测验复份B
因为它反映的是两个测验之间的等值程度, 故又称等值系数。
施测A型
最短时距 相关系数
施测B型
复本信度图式
计算方法 ∑ XAXB/N-XAXB rxx = SASB 式中XA 、XB为同一被试在两个测验复份A、 B上的分数,XA 、XB为A、B两型测验的平 均分数,SA 、SB为A、B两型测验的标准差, N为被试人数。
注意事项: 1. 两个测验必须在项目的内容、形式、 数量、难易、时限、指导语等方面相同或相似; 2. 两次测验的时间间隔要适当,若太短, 由于测验太相似被试可能厌倦,若太长可能又 会因新的学习而产生干扰。
使用复本信度的局限
1. 只能减少但不能完全消除练习和记忆 的影响;
2. 由于第二个测验只改变了题目的具体 内容,已经掌握的解题原则,可以很容易地迁 移到同类问题。 3. 对许多测验来说,建立复本是十分困 难的。
r xy
[N
N X 2 (
XY
X [N
Y Y 2 ( Y ) 2]
X ) 2]
10*63369
756*837
[10*57352 ( 756 ) 2] [10*70245 ( 837 ) 2] 0.48