心理测量的信度_PPT幻灯片
合集下载
心理测量学 PPT课件
因此,心理咨询师有必要了解心理测量的理论和技术。
❖
心理测量学知识部分的主要包括的内容有: 第1节 概述 第2节 测验的常模 第3节 测验的信度 第4节 测验的效度 第5节 项目分析 第6节 测验编制的一般程序 第7节 心理测验的使用
参考书目
❖ 主要依据国家职业资格培训教程的《心理咨询师(基础知识)》考试 中的《心理测量知识》部分进行。这本书的主要参考教材有: 1.郑日昌、蔡永红和周益群著,《心理测量学》,人民教育出版社, 1999 2.龚耀先主编,《心理评估》,高等教育出版社,2003 3.姜长青主编,《心理测验学》,吉林教育出版社,2004 4.戴海崎、张锋和陈雪枫主编,《心理与教育测量》,暨南大学出 版社,2002 5.顾海根编著,《学校心理测量学》,广西教育出版社,1999 6.宋维真、张瑶主编,《心理测量学》,科学教育出版社,1987 7.彭凯平编著,《心理测验——原理与实践》,华夏出版社,1990
的人数百分比。百分等级55的分数表示在常模,样本中有55%的人低于 这个分数。
最早的一个范例是葛塞尔发展程序表 (二)智力年龄
比内-西蒙量表中首先使用智力年龄的概念:基础年 龄与在较高年龄水平的题目上获得的附加月份之和。 计算方法:假如某儿童6岁组的题目全部通过,7岁组通过 4题,8岁组通过3题,9岁组通过2题,其智龄为:6(岁) +42(月)+32(月)+22(月)=6岁+18月=7岁6个月。 (三)年级当量
第一节 概述
【考查要点】 1.测量的含义; 2.不同的测量量表:命名、顺序、等
距和等比量表; 3.测验观:错误的和正确的; 4.不同的测验种类。
第一单元、测量与测量量表
一、什么是测量 • 测量就是依据一定的法则用数字对事物加以确定。 • 定义中包括三个主要的元素:(1)事物 (2)数字
心理测量学概述课件(PPT 57页)
注意:不要滥用和过度依赖量表。
18.11.2019
10
第六单元 心理测验的发展史
一、科学心理测验的产生与发展 科学心理测验的先驱:高尔顿、卡特尔。 高尔顿设计了测量差异的方法,被看作心理测验的开端;第一个提出 相关的概念。 卡特尔(1890)在《心理》上发表《心理测验与测量》,这是心理测 验第一次出现在心理学文献中。 产生:1905年,世界第一个正式的心理测验产生——比内-西蒙智力测验。 发展:1操作测验的发展
(四)等比量表
数字既有相等的单位,又有绝对零点。可进行加减乘 除运算。如,体重,长度等。
18.11.2019
6
第二单元 心理测验的基本概念
一、心理测验的定义 心理测验:依据心理学理论,使用一定的操
作程序,通过观察人的少数有代表性的行为,对 于贯穿在人的全部行为活动中的心理特点做出推 论和数量化分析的一种科学手段。(四个方面理解)
18.11.2019
29
第二单元 效度评估的方法
一、内容效度 (一)什么是内容效度
内容效度:测验题目对有关内容或行为取样的适用性,从而确定测验是 否是所欲测量的行为领域的代表性取样。
要编制较高内容效度的心理测验需要:1对所测量的心理特性有个明确的 概念,并划定出那些行为与这种心理特性有关,又较密切。2测验题 目应是所界定的内容范围的代表性取样。
欲K:提长改高度变信是后度原的,来长题的度数K与倍的原时增长的加度信公之度式比估为.计r:xx。:原:k测验rr的kxkx((11信rrk度xkx)); rkk:测验
18.11.2019
26
三、测验难度 洛德:五选一:0.70;四选一:0.74;三选
一:0.77;二选一:0.85.
四、时间间隔 两到四周,不超过六个月。
18.11.2019
10
第六单元 心理测验的发展史
一、科学心理测验的产生与发展 科学心理测验的先驱:高尔顿、卡特尔。 高尔顿设计了测量差异的方法,被看作心理测验的开端;第一个提出 相关的概念。 卡特尔(1890)在《心理》上发表《心理测验与测量》,这是心理测 验第一次出现在心理学文献中。 产生:1905年,世界第一个正式的心理测验产生——比内-西蒙智力测验。 发展:1操作测验的发展
(四)等比量表
数字既有相等的单位,又有绝对零点。可进行加减乘 除运算。如,体重,长度等。
18.11.2019
6
第二单元 心理测验的基本概念
一、心理测验的定义 心理测验:依据心理学理论,使用一定的操
作程序,通过观察人的少数有代表性的行为,对 于贯穿在人的全部行为活动中的心理特点做出推 论和数量化分析的一种科学手段。(四个方面理解)
18.11.2019
29
第二单元 效度评估的方法
一、内容效度 (一)什么是内容效度
内容效度:测验题目对有关内容或行为取样的适用性,从而确定测验是 否是所欲测量的行为领域的代表性取样。
要编制较高内容效度的心理测验需要:1对所测量的心理特性有个明确的 概念,并划定出那些行为与这种心理特性有关,又较密切。2测验题 目应是所界定的内容范围的代表性取样。
欲K:提长改高度变信是后度原的,来长题的度数K与倍的原时增长的加度信公之度式比估为.计r:xx。:原:k测验rr的kxkx((11信rrk度xkx)); rkk:测验
18.11.2019
26
三、测验难度 洛德:五选一:0.70;四选一:0.74;三选
一:0.77;二选一:0.85.
四、时间间隔 两到四周,不超过六个月。
第五章心理测量的信度
r SE d为差异的标准误,S为相同尺度的xx标准ry分y 数的
标准差,Z分数为1,T分数为10。 、 分别为
两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
数的差异与1.96SEd(0.05显著性水平)进行比较,
如果其绝对值大于此值,则差异显著,否则差异 不显著。
例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分, 此次数学测验年级平均分是81分,标准 差是10分,此次测验的信度系数是0.91; 问小张这两次数学测验的成绩是否有显 著差异?
back
一、再测信度 二、复本信度 三、等值稳定性系数 四、内部一致性系数 五、评分者信度 总结 练习
back
再测信度(Test-Retest Reliability) ,也叫 重测信度,也叫稳定性系数。用同一个测验,
对同一组被试前后施测两次,对两次测验分数
求相关,其相关系数就叫再测信度。其计算公
式(皮尔逊积差相关公式的变式)为:
rxx
X1X2 NX1X2 S1S2
(公式5-6)
式中X1、X2为同一被试的两次测验分数,X 1 、X 2
为全体被试两次测验的平均数,S1、S2为两次
测验的标准差,N为被试人数。
再测法的模式是:施测 适当时距 再施测
如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。
我们可以用“差异的标准误”来检验差异的显著 性。
心理测量学知识ppt课件
调查法
总结词
通过问卷、访谈等方式收集大量样本的 数据,以描述心理现象的分布和特点。
VS
详细描述
调查法是心理测量学中常用的研究方法之 一,通过问卷、访谈等方式收集大量样本 的数据,以描述心理现象的分布和特点。 调查法可以覆盖大范围的样本,具有较高 的代表性,能够揭示心理现象的普遍规律 和趋势。
个案研究法
信度与效度
信度的定义
信度是指测验的一致性程度,即多次测量结果之间的稳定性。
效度的定义
效度是指测验的有效性程度,即测验是否真实地反映了想要测量的 心理特质或行为。
信度与效度的关系
信度和效度是评估心理测验质量的两个重要指标,信度是效度的必 要条件,但效度更高的测验不一定信度更高。
因素分析
因素分析的定义
根据研究和实践反馈,不断更新和改进心理测量 学的理论和方法。
THANKS
感谢观看
03
心理测量学的应用领域
教育领域
01 学科能力评估
通过心理测量技术评估学生的学习能力、学科掌 Байду номын сангаас程度,为个性化教学提供依据。
02 人才选拔
运用心理测量工具对学生的学习潜力、天赋等进 行评估,选拔优秀学生。
03 教育质量监测
通过心理测量手段评估教育质量,为教育改革提 供数据支持。
职业领域
职业能力评估
心理测量学的重要性
提供科学依据
心理测量学通过客观的评估方法, 为心理学研究提供科学依据,帮 助揭示人类行为的规律和机制。
促进个体发展
心理测量学在教育领域的应用, 有助于了解学生的能力、兴趣和 潜力,为个性化教育和人才培养 提供指导。
辅助决策制定
在职业领域,心理测量学可以为 招聘、选拔和晋升提供参考依据, 帮助组织制定科学的人力资源政 策。
戴海崎 旧版心理与教育测量4-7PPT幻灯片
12
• 斯-布公式只有在两半测验分数的方差相等时才能使用,否 则,应选择下面两个等价的公式之一: • 弗郎那根(Flanagan)公式: rxx = 2 [ 1 -(Sa2 + Sb2)/ Sx2] , Sa2 ,Sb2 ,Sx2 分别为分半测验的方差和总分的方差
• 卢仑(Rulon)公式 rxx = 1 - Sd2 / Sx2 , Sd2 是两分半测验之差的方差
18
• 计算及适用范围
rxx = K rij /[ 1 +(K - 1)rij ], 其中K为一个测验的题目个数, rij 为项目间相关系数的平均数 • (1)KR20公式:
rxx = [ K /(K - 1)] [ 1-(Σpiqi)/ Sx2 ] • pi为答对第i题的人数的比例;qi为答错第i题的人数的比例。 K为题目数, Sx2为测验总分的变异。仅适用于(0,1)记分的测验。
• 实际上,K-R 20 和K-R 21 只是α系数的特例。
• α系数是所有可能的分半信度的平均值。
• 优缺点
• 用再测法估计信度的优点是能提供测验结果是否随时间而变化的资 料,可作为预测被试将来行为的依据。
• 其缺点是易受练习和记忆的影响。
7
SPSS计算
• 求出两次测量的总分 • Analyze-Correlate-Bivariate
8
• 二、复本信度 • 1.含义和计算 • 复本信度(Alternate-form reliability)指的是两个平行的测验测量同
11
பைடு நூலகம்
内部一致性信度(1)
• 三、分半信度 • 含义和计算
• 分半信度(split-half reliability)是指将一个测验分成 对等的两半后,所有被试在这两半上所得分数的一致性程 度。由于分半信度描述的是两半题目间的一致性,所以有 时也被称作内部一致性系数。
• 斯-布公式只有在两半测验分数的方差相等时才能使用,否 则,应选择下面两个等价的公式之一: • 弗郎那根(Flanagan)公式: rxx = 2 [ 1 -(Sa2 + Sb2)/ Sx2] , Sa2 ,Sb2 ,Sx2 分别为分半测验的方差和总分的方差
• 卢仑(Rulon)公式 rxx = 1 - Sd2 / Sx2 , Sd2 是两分半测验之差的方差
18
• 计算及适用范围
rxx = K rij /[ 1 +(K - 1)rij ], 其中K为一个测验的题目个数, rij 为项目间相关系数的平均数 • (1)KR20公式:
rxx = [ K /(K - 1)] [ 1-(Σpiqi)/ Sx2 ] • pi为答对第i题的人数的比例;qi为答错第i题的人数的比例。 K为题目数, Sx2为测验总分的变异。仅适用于(0,1)记分的测验。
• 实际上,K-R 20 和K-R 21 只是α系数的特例。
• α系数是所有可能的分半信度的平均值。
• 优缺点
• 用再测法估计信度的优点是能提供测验结果是否随时间而变化的资 料,可作为预测被试将来行为的依据。
• 其缺点是易受练习和记忆的影响。
7
SPSS计算
• 求出两次测量的总分 • Analyze-Correlate-Bivariate
8
• 二、复本信度 • 1.含义和计算 • 复本信度(Alternate-form reliability)指的是两个平行的测验测量同
11
பைடு நூலகம்
内部一致性信度(1)
• 三、分半信度 • 含义和计算
• 分半信度(split-half reliability)是指将一个测验分成 对等的两半后,所有被试在这两半上所得分数的一致性程 度。由于分半信度描述的是两半题目间的一致性,所以有 时也被称作内部一致性系数。
心理测量学第三节 测量的信度
❖ 将差异标准误(7.5)乘以1.96,结果为14.7,这 表明个体在韦氏测验两半得分的差异大约15分, 才能达到0.05水平显著,上述被试的差异分数8 分,是不显著的。
2010年5月(二级)
❖ 10、某受测者在韦氏成人智力测验中言语智 商为102,操作智商为110。已知两个分数都 是以100为平均数、15为标准差的标准分数。 假设百语测验和操作测验的分半信度分别为 0.87和0.88,则该受测者的操作智商( )于言 语智商。
2009年5月(三级)
❖ 35、以再测法或复本法求信度,两次测验相 隔时间越短,其信度系数越( )
❖ (A)大 -
(B)低
小
(D)不确定
(C)
数分布范围最大,求得的信度也最高。 ❖ 对于选择题目由于存在着猜测因素,难度值应提高。 ❖ 洛德(lord)提出学绩测验中,各类选择题的理想
平均难度为:五择一测题0.70,四择一测题0.74, 三择一测题0.77,是非题0.85。
时间间隔与信度
❖ 只对重测信度和间隔施测的复本信度有影 响
❖ 两次测验相隔时间越短,其信度系数越大; 间隔时间越久,其他变因介入的可能性越 大,受外界影响也越大,信度系数便越低
❖ 即:X=T+E
一.信度的定义
❖ 信度是指测量结果的可靠性和一致性. ❖ 理论定义:一组测量分数的真实方差与实得方差的
比,即真空方差占总方差的百分比.
SX 2 ST 2 SE2
❖ 操作性定义:信度有是一个测验X与它的任意一个 平行测验X’的相关系数.
信度的定义
rxx
ST2
S
2 X
rxx
❖ 另一原则是:新编的测验信度应高于原有的同类测 验或相似测验。
2010年5月(二级)
❖ 10、某受测者在韦氏成人智力测验中言语智 商为102,操作智商为110。已知两个分数都 是以100为平均数、15为标准差的标准分数。 假设百语测验和操作测验的分半信度分别为 0.87和0.88,则该受测者的操作智商( )于言 语智商。
2009年5月(三级)
❖ 35、以再测法或复本法求信度,两次测验相 隔时间越短,其信度系数越( )
❖ (A)大 -
(B)低
小
(D)不确定
(C)
数分布范围最大,求得的信度也最高。 ❖ 对于选择题目由于存在着猜测因素,难度值应提高。 ❖ 洛德(lord)提出学绩测验中,各类选择题的理想
平均难度为:五择一测题0.70,四择一测题0.74, 三择一测题0.77,是非题0.85。
时间间隔与信度
❖ 只对重测信度和间隔施测的复本信度有影 响
❖ 两次测验相隔时间越短,其信度系数越大; 间隔时间越久,其他变因介入的可能性越 大,受外界影响也越大,信度系数便越低
❖ 即:X=T+E
一.信度的定义
❖ 信度是指测量结果的可靠性和一致性. ❖ 理论定义:一组测量分数的真实方差与实得方差的
比,即真空方差占总方差的百分比.
SX 2 ST 2 SE2
❖ 操作性定义:信度有是一个测验X与它的任意一个 平行测验X’的相关系数.
信度的定义
rxx
ST2
S
2 X
rxx
❖ 另一原则是:新编的测验信度应高于原有的同类测 验或相似测验。
心理测量第三篇—信度
二、概化理论的基本原理和概念
1.测量目标——希望测量的实体,如能力、 成就等特性。 2.侧面——一组特定的测量条件,其中条 件的数量为该侧面的水平。
例题:如果要求每个被试写两篇题目不同的短文,并 由三名评分者给所有短文评分 测量目标:被试的写作水平; 侧面:题目和评分者; 水平数:分别为2和3。
二、测验长度的影响
一般说来,在—个测验中增加同质性的题 目,可以使信度提高。
二、测验长度的影响
假设有一个包括10个题目的测验,信度 为0.50,若把测验增加到50个题目,其 信度将增加到:
二、测验长度的影响
当由于测题过少而导致信度较低时,增加 多少个题目可以达到理论的信度指标,可 以用下式来推算:
一、概化理论对经典测验理论的发 展
2.概化理论的诞生及其特点 (1)诞生:1972年,克朗巴赫出版《行 为测量的可靠性:测验分数和剖面图的概 化理论》,正式形成了概化理论(GT)。 (2)特点: 克朗巴赫指出:“概化分析超越经典信度 分析之处在于它明确问到,这个分析过程 如何计算误差?每个来源的变异有多大?”
一、测量的标准误的含义及其作用
5.测量的标准误差的解释
比如:以95%的置信度为标准,则Z0.95=1.96,
它表示真分数有95%的可能性落在 范围内。
二、直接估计标准误差
1.公式: 估计信度rtt要求每个人都有两个测验分数, 估计Se也是一样要求每个人要有成对的分 数,每个人成对的分数由复份法、再测法、 分半法获得。
(二)分半信度
2.“斯皮尔曼—布朗公式”校正
条件:两个分半测验分数的变异性相等。
(二)分半信度
当两个分半测验分数的变异性不等时: 费拉南根(Flanagan)公式:
心理测量学(详细)PPT课件
(二)教学目的 通过学习,要求学生掌握心理测量的基本知识、心理测量的编制和实施、以及良好
测量所要求具备的基本条件。更重要的是,通过本课程的学习要使学生熟练掌握不同 心理测量的实际应用。
(三)教学内容 本课程的主要教学内容有:心理测量的基本内涵及其评价和测量的一般步骤和方
法两部分。内容涉及一般测量解析,测量的要素及量表类型,测验信、效度、难度和 区分度,测量的一般步骤和方法,智力测验、人格测验等心理测验,以及心理测量的 综合应用和心理测量理论的新发展等内容。
6
第二章 经典测验理论的基本假设
教学要点: 通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性,
心里测量的误差和种类,以及真分数的含义等内容。 教学时数:[6学时]
教学内容: 一、心理特质(Trait)及其可测性假设
1.经典测验(Classical Test Theory ,CTT)理论 2.特质假设
3
二、测量的要素及量表类型 1.测量的要素 识记: 单位(Unit),参照点(Reference Point),量表(Scale) 2.量表类型 (1)称名量表 称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说 明事物与事物之间差异的大小、顺序的先后及质的优劣。 (2)顺序变量 顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列 的变量,具有等级性和次序性的特点。 (3)等距变量 等距变量除能表明量的相对大小外,还具有相等的单位。 (4)比率变量 比率变量除了具有量的大小、相等单位外,还有绝对零点。
5
(五)心理测量的道德准则 1.心理测量工作者的素质要求 (1)心理测量工作的知识结构.(2)对心理测量的态度 2.心理测量工作者的道德准则 (1)测验的保密和控制原则(2)测验中个人隐私的保护
测量所要求具备的基本条件。更重要的是,通过本课程的学习要使学生熟练掌握不同 心理测量的实际应用。
(三)教学内容 本课程的主要教学内容有:心理测量的基本内涵及其评价和测量的一般步骤和方
法两部分。内容涉及一般测量解析,测量的要素及量表类型,测验信、效度、难度和 区分度,测量的一般步骤和方法,智力测验、人格测验等心理测验,以及心理测量的 综合应用和心理测量理论的新发展等内容。
6
第二章 经典测验理论的基本假设
教学要点: 通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性,
心里测量的误差和种类,以及真分数的含义等内容。 教学时数:[6学时]
教学内容: 一、心理特质(Trait)及其可测性假设
1.经典测验(Classical Test Theory ,CTT)理论 2.特质假设
3
二、测量的要素及量表类型 1.测量的要素 识记: 单位(Unit),参照点(Reference Point),量表(Scale) 2.量表类型 (1)称名量表 称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说 明事物与事物之间差异的大小、顺序的先后及质的优劣。 (2)顺序变量 顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列 的变量,具有等级性和次序性的特点。 (3)等距变量 等距变量除能表明量的相对大小外,还具有相等的单位。 (4)比率变量 比率变量除了具有量的大小、相等单位外,还有绝对零点。
5
(五)心理测量的道德准则 1.心理测量工作者的素质要求 (1)心理测量工作的知识结构.(2)对心理测量的态度 2.心理测量工作者的道德准则 (1)测验的保密和控制原则(2)测验中个人隐私的保护
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
克伦巴赫公式(ɑ系数)
❖ 适用于多重计分的测验
kk1(1SSx2 i2 )
❖ K为题目数 , Si2为某一题目分数的变异数 ❖ Sx2为测验总分的方差
❖ 只是测量信度的下界的一个估计值
计算举例
学生
题目
1
2
3
4
5
1
6
6
7
2
7
2
4
0
5
4
2
3
6
7
5
6
4
4
4
4
2
4
7
5
3
2
0
4
4
6
6
7
2
5
2
7
6
3
7
3
462.25 42.25 100 625 196 841 1156 3422.5
第三节 影响信度的因素
❖ (一)被试方面
❖ 被试的身心健康状况、应试动机、注意 力、耐心、求胜心、作答态度等往往会 影响被试心理特质水平的稳定性。
❖ 被试团体的异质性
被试团体异质性与信度
❖ 被试团体的异质性是指构成团体所在 被试的差异性。
(alternative-form reliability ) ❖ 三、分半信度(split-half reliability) ❖ 四、同质性信度(homogeneity
reliability) ❖ 五、评分者信度(scorer reliability)
一、重测信度
❖ 指的是同一量表对同一组被试施测两测所 得结果的一致性程度.其大小等于同一组 被试在两次测验上所得分数的皮尔逊相关 系数。
❖ 卢伦公式
rxx 1Sd2 Sx2
❖ Sd2表示同一组被试在两半测验上得分之差的变异数。
分半信度计算举例
学生 1 2 3 4 5 6 7 8 9 10
奇数题得分 38 29 42 41 35 36 22 46 38 34
偶数题得分 36 26 40 42 37 33 21 48 38 31
使用的前提条件
第一节 测量的信度
❖ 一.信度的概念
❖ 二.信度的作用
一.信度的概念
❖ 信度是指测量结果的可靠性和一致性.
一.信度的概念
❖ 理论定义:一组测量分数的真实方差与实得 方差的比,即真实方差占总方差的百分比.
SX2ST2SE2
rxx
S
2 T
S
2 X
第二节 信度的种类及估计方法
❖ 一、重测信度(test-retest reliability) ❖ 二、复本信度
计算公式
r xy NSXSY
rX1X2/NX1X2 S1S2
重测信度误差来源
❖ 测验内部:基本不影响 ❖ 测验条件: 主要影响因素 ❖ 被试的差别:主要影响因素
重测信度的使用条件
❖ 所测量的心理特性必须是稳定的 ❖ 遗忘或练习的效果相同 ❖ 所测查的心理特质方面没有获得
更多的学习和训练
重测信度注意事项
❖ 计算 ❖ 误差来源:题目取样 ❖ 使用条件:没复本且可分为等值两半
分半信度的计算
❖ 基本公式
r hh
xy N S XS Y
❖ 斯皮尔曼—布朗公式
rxx
2rhh
1 rhh
补充公式
❖ 弗朗南根公式
rxx2 1(S a2S b2)/S X 2
❖ Sa2 和Sb2 分别表示所有被试在两半测验上得分的变异数。 Sx2表示全体被试在整个测验上总得分的变异数。
❖ 斯-布公式要求被试在两半测验上得分 的变异数相等
❖ 无法分成对等的两半的测验,不宜使用分 半信度。
使用的前提条件
❖ 使用奇偶分半的前提:
按某种顺序排列(如按难度) 所有题目相等(随机排列) 各分量表分半求相关
四、 同质性信度
❖ 指测验内部所有题目间的一致性程度。
❖ 基本公式:
rxx
k rij
[1 (k 1)rij]
❖ K为测验的题目个数
❖ r i j 为所有题目间相关系数的平均值
库德-理查森公式
❖ KR20公式:适用于0,1计分
KR20kk1(1Spxi2 qi)
❖ K为题目数 , pi为答对第i题的人数比例,qi 为答错第i题的人数比例, Sx2为测验总分的方差
❖ KR21公式:
KR21kk1(1X(kkS X2X)
二、 复本信度
❖ 计算公式:积差相关公式 ❖ 种类:
等值性系数 稳定性与等值性系数
二、 复本信度
❖ 误差来源 ❖ 前提条件:平行测验并有条件接受两
测验 ❖ 注意事项:间隔时间适当 ❖ 优缺点:
三、 分半信度
❖ 分半信度指的是将一个测验分成对等 的两半后,所有被试在这两半上所得 分数的一致性程度。
评分者信度的计算
❖ 所评分数为连续变量用积差相关公式
❖ 所评分数为等级变量常使用斯皮尔曼等 级相关公式.
6 D2 rR 1 n(n2 1)
计算公式
❖ 多个评分者评多份试卷,并以等级计分
时用肯德尔和谐系数。
Ri2 (Ri)2
W
N
1 K 2(N 3 N )
12
❖ K为评分者人数 ❖ N为被试试卷数 ❖ Ri为每份试卷被评等级之和
肯德尔和谐系数计算例
N=4 1
13 21 34 42
评分者 K=5 234 334 211 443 122
Ri
Ri2
5
3 16 256
1 6 36
4 19 361
2 9 81
50 734
❖ 评分中出现相等等级时
W
SSRi
1 K2(N3N)KC
12
SS Ri
Ri 2
( Ri ) 2 N
C (t 3 t ) 12
❖ 不是所有测验都可以计算重测信度 ❖ 注意重测的间隔时间 ❖ 注意提高被试的积极性
二、 复本信度
❖ 是指两个平行测验测量同一批 被试所得结果的一致性程度, 其大小等同于同一批被试在两 个复本测验上所得分数的皮尔 逊相关系数。
二、 复本信度
❖ 复本(测验):在题目内容、 数量、形式、难度、区分度、 指导语、时限以及所用的例题、 公式、和测验等其他方面都相 同或相似。
❖ t指某一评价者对所有被评价者评出相同等级的人数
N=7
K=5
12345
A 4 5 3.5 5 4
B 1 1 1.5 2 1
C 2.5 2 1.5 2 2
D 65545
E 2.5 3 3.5 2 3
F 55766
G 77677
T=2 T=3 T=2 T=3
T=2
Ri
Ri2
21.5 6.5 10 25 14 29 34 140
7
8
8
4
5
5
3
注意事项
❖ 并不是所有测验都要求有较高的同质性信度, 取决于测量的目的
❖ 用于预测的测验或学绩测验可不考虑同质性
❖ 提出或验证某种心理学构想和假设时要求
五、评分者信度
❖ 指的是多个评分者给同一批人的答 卷进行评分的一致性程度。
评分者信度的计算
❖ 两个评分者对被试评分,评分者信度等于两 个评分者给同一批被试的评分分数的相关 系数.