第三单元信度与测验分数的解释

合集下载

心理测量学第三章信度

心理测量学第三章信度

第三章信度心理测验就是对某些心理特质的个别差异进行测量的工具,对心理特质的测量与对物理属性,如物体长度和重量等的测量是一样的。

不同的是心理测量所测量的是抽象的心理特质,工具是心理测验,而物理测量的对象则是物体的重量和长度等特性,工具是尺子和天平。

心理测量与物理测量的另一个共同点是二者都难以避免误差的影响。

在对物体的长度进行测量时,物体的热胀冷缩,测量者读取刻度的准确性等因素都会使测量出的长度与物体的实际长度不符,在不同时间、地点的测量值会有出入。

就是说,在不同情景下测量结果是不稳定的,与测量情景和测量条件有关的误差称随机误差(random error)。

由于这一误差是由测量过程造成的,因此也称测量误差(measurement error)。

另一方面,使用一把尺子对物体的长度进行测量时,这把尺子本身的质量也可能造成误差。

如果一把尺子本身就是有问题的,测量出的物体的长度自然就不准确。

这类误差与测量情景引进的误差不同,只要在测量时使用这把尺子,误差就会恒定地存在,无法消除。

这类由测量工具本身造成的误差称为系统误差(system error)。

对心理的测量与对物理的测量一样,也同样存在这两类误差。

与这两类误差相对应,心理测验中引入了信度和效度的概念。

信度研究涉及了测验分数的可靠性和稳定性,也即如何控制和减少随机误差。

效度研究则涉及了测量的系统误差,也即如何提高测量工具本身的准确性。

第一节经典测验理论的信度观教育与心理测验的目的是将个体的心理特质数量化,从而更精确地研究心理的个别差异。

在廿世纪初心理测量实践的推动下,测验理论产生了。

经过几十年的发展,到廿世纪五十年代初,教育与心理测验理论对测验的构建、误差的控制、测验结果的统计分析及解释等问题已形成一个完整的理论体系。

为与以后产生的项目反应理论和概化理论相区别,人们习惯上将这一理论体系被称为经典测验理论(Classical Test Theory,简称CTT)。

心理测量学 (综合版)

心理测量学 (综合版)

三、解释个人分数的意义 作用:其一是估计真实分数的范围;其二是了解 实得分数再测时可能的变化情形。 例:在一个智力测验中,某个被试的IQ为100, 这是否反映了他的真实水平?如果再测一次, 他的分数将改变多少? X―1.96SE< XT≤X+1.96SE 已知该智力测验的标准差为15,信度系数 为.84,则其IQ的测量标准误和可能范围为: SE=IQ=100±1.966=100±11.76≈88~112

——标准瑞文推理测验——

瑞文测验一共由60张图案组成,按逐步增加难 度的顺序分成A、B、C、D、E五组。
——中国比内测验——


比奈-西蒙量表自1905年问世以后,相继发展 了许多版本,其中1916年版的斯坦福-比奈智 力量表最负盛名。 1982年,吴天敏对该量表作了第三次修订,称 做《中国比内测验》,测试对象扩大为 2 - 18 岁,每岁3个项目,共51个项目。
第二单元 常模的类型
一、发展常模
(一)发展顺序量表 (二)智力年龄 比奈—西蒙量表中首先使用智力年龄 的概念。 (三)年级当量
二、百分位常模
(一)百分等级:在常模样本中低于这个分数的 人数的百分比。 未分组资料的百分等级计算公式 (二)百分点:也叫百分位数,在分数量表上, 相对于某一百分等级的分数点。 百分点的计算公式可根据直线内插法进行 (三)四分位数和十分位数
二,心理测验的基本概念

心理测验的定义:依据心理学理论,使用一定 的操作程序,通过观察人的少数有代表性的行 为,对于贯穿在人的全部行为活动中的心理特 点做出推论和数量化分析的科学手段。

心理测验的性质:
1,间接性 2,相对性 3,客观性
三,心理测验的分类

考试成绩评价的区分度、信度、效度等概念

考试成绩评价的区分度、信度、效度等概念

目录考试成绩评价的区分度、信度、效度等概念 (1)高一化学备课组 2009.3.26 (4)考试成绩评价的区分度、信度、效度等概念1、试卷的区分度试卷的区分度指测试题目对被测试者实际水平的区分能力。

区分度高的试题,能将不同水平的被试者区分开来;区分度低的试题则对被试者水平不能很好地鉴别。

区分度是指试题对被试者情况的分辨能力的大小。

一般在-1~+1之间,值越大区分度越好。

试题的区分度在0.4以上表明此题的区分度很好,0.3 ~0.39表明此题的区分度较好,0.2 ~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。

计算区分度的方法很多,特别需要注意的是对同一个试题的考试成绩采用不同的方法所得到的区分度的值是不同的。

我们可以使用下面的两种方法计算区分度:(1)先将分数排序,P1=27﹪高分组的难度,P2= 27﹪低分组的难度区分度D =P1-P2或区分度 D = (27﹪高分组的平均分-27﹪低分组的平均分)?/font>满分值(2)利用积差系数r 计算区分度D当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关成为积差相关。

积差相关的使用条件a、两个变量都是由测量获得的连续性数据。

如百分制分数。

b、两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称的分布。

c、必须是成对的数据,而且每对数据之间是相互独立的。

d 、两个变量之间呈线性关系。

积差相关系数r的计算在计算机上是很容易进行的。

积差相关系数r的公式如下:r=(无法显示)原谅!2、试卷的信度试卷的信度主要从两个方面进行分析,一方面是考试成绩期望值与实际成绩平均值的差异,考试成绩期望值一般应以平时成绩的平均值为依据确定.另一方面是考试成绩的预期及格率与实际及格率的差异,考试成绩及格率的预期值同样以平时成绩的及格率为确定依据.两个方面的差异性较小,说明试卷信度较高.考试信度,简单地说是考试结果的可信程度,是推测考试可信与否的最重要的量化指标。

测验的信度

测验的信度

注意: 注意:
信度估计方法不只上面几种, 信度估计方法不只上面几种,实际上有多少 误差来源,便有多少估计信度的方法。 误差来源,便有多少估计信度的方法。原则 上一个测验哪种误差大, 上一个测验哪种误差大,便采用哪种估计方 有时甚至需要有几种信度系数。 法,有时甚至需要有几种信度系数。
重测信度
定义:又称稳定性系数,即使用同一测验, 定义:又称稳定性系数,即使用同一测验,在 同样条件下对同一组被试者前后施测两次, 同样条件下对同一组被试者前后施测两次,求 两次得分间的相关系数。 两次得分间的相关系数。 2-4周 周 计算方法:重测法。 A2,求r12。 计算方法:重测法。A1 , 优点: 优点:能提供有关测验是否随时间而变异的资 料,可作为被试将来行为表现的依据。 可作为被试将来行为表现的依据。 缺点:易受练习和记忆的影响。 缺点:易受练习和记忆的影响。 两次测量之间最适宜的时距:随测验的目的、 两次测量之间最适宜的时距:随测验的目的、 性质和被试特点而异,一般是两周到四周为宜, 性质和被试特点而异,一般是两周到四周为宜, 间隔时间最好不超过六个月。 间隔时间最好不超过六个月。
测量标准误与信度的关系:互为消长, 测量标准误与信度的关系:互为消长, 信度高,标准误低;信度低, 信度高,标准误低;信度低,标准误高
例题: 例题:
1、公式rxx =r2xT=S2T/ S2x和公式 xT=ST/ Sx表明 、公式 和公式r 信度指数的( 就是信度系数。 信度指数的( )就是信度系数。 (A)一半 ) (B)平方 ) (C)倍数 ) (D)本身 ) 2、( )是指同一被试在不同时间内用同一测 、( 或用另一套相等的测验)重复测量, 验(或用另一套相等的测验)重复测量,所得 结果的一致程度。 结果的一致程度。 (A)信度 ) (B)效度 ) (C)难度 ) (D)区分度 ) 3、信度只受 )的影响。 的影响。 、信度只受( 的影响 (A)系统误差 系统误差 (B)随机误差 随机误差 (C)恒定效应 恒定效应 (D)概化作用 概化作用

心理测量学重点

心理测量学重点

第一章心理测量概述第一节心理测验的历史量的性质2、测验标准化条件:1测验内容的标准化2施测条件的标准化包括:①相同的测验情境..②相同的指导语..③相同的测验时限.. 3评分规则的标准化4测验常模的标准化二、心理测量一心理测量的定义一级定义所谓心理测量;就是依据心理学理论;使用一定的操作程序;通过观察人的少数有代表性的行为;对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段..第三节心理测验的种类与功能及其正确使用五按评价所参照的标准来分类1、常模参照测验一级定义是根据被试对量表中所规定的题目答对多少来评分的;被试成绩的优劣;是根据所得分数在常模中所处的地位来确定的;不是以是否达到某个标准来决定..2、目标参照测验一级定义是将被试水平与一绝对标准相比较;以便评价被试有无达到该标准为目的测验;也称标准参照测验..3、潜力参照测验是将被试水平与自身潜力相比较;以评价被试有无充分发挥自身潜力为目的的测验..三、心理测验使用的注意事项1慎重选择测验量表 2与被测验者建立协调关系 3控制实施测验的误差4正确解释测验结果 5遵守测验的道德 6注意测验的保密第二章心理测验的编制与应用第一节心理测验的编制①确定测验目的与对象②拟定编制计划③设计测试项目④项目的预测和分析⑤合成测验⑥测验使用的标准化⑦搜集信度、效度资料⑧编写测验手册一、确定测验目的与对象一测量对象测验编成后要用于何种团体..如被试的年龄、智力水平、受教育程度、社会经济和文化背景以及阅读水平等..二确定并分析测量的目标一般可分三种情况:一是编制带有预测功能的心理测验..工作分析二是编制针对某种心理特质的测验 ..下操作定义三是编制标准参照测验..双向细目表三测验用途测量目的二、拟定编制计划双向细目表主要有两个方面:一是全面而具代表性的测验内容..二是对各个内容点的相对重视程度;通常用百分比来标明..三、设计测试项目一搜集有关资料1、资料要丰富..2、资料要有普通性..3、资料要有趣味性..题目的来源:1、已出版的标准测验..2、理论和专家的经验..3、临床观察和记录..二选择项目形式考虑:1、测验的目的和材料的性质..2、接受测验的团体的特点..3、各种实际因素..三命题的一般原则1、内容方面2、文字方面3、理解方面4、社会敏感性方面四编写和修订项目要注意:1、项目的范围..2、项目的数量..3、测验项目的取样..4、项目的难度..5、项目的说明必须清楚;用语要力求精练简短、浅显明了..四、项目的预测和分析一预测应注意:1、预测对象..2、预测的实施过程..3、预测时限..4、在预测过程中;应随时记录被试的反应情形..二项目分析质的分析;量的分析..五、合成测验一项目的选择指标有三:1测验的性质..即要选择那些能够测量所要测量的东西的项目..2项目的难度..3项目的区分度..二项目的编排1并列直进式..2混合螺旋式..三编造复本复本的关键是等值..六、测验使用的标准化一施测过程1、指导语包括对测验目的的说明和被试应该如何反应的指示包括如何选择反应、记录反应以及时限等..指导语会直接影响被试的反应态度与方法..2、时限二评分、记分要求:1、及时而清楚地记录反应的情况..2、要有一张标准答案或正确反应的表格;即记分键..3、将被试的反应和记分键比较;对反应进行分类..准确无误是对记分的基本要求..三分数解释1、常模团体是由具有某种共同特征的人所组成的一个群体或是该群体的一个样本..常模选择的一般步骤:确定一般总体→确定目标总体→确定样本..确定常模群体的注意事项:1群体构成的界限必须明确..2常模团体必须是所测群体的一个代表性样本..3取样的过程必须明确且有详尽的描述..几种抽样方法:①简单随机抽样②系统抽样③分组抽样④分层抽样分层比例抽样和分层非比例抽样..4样本大小要适当..应注意:①总体的数目..样本大小适当的关键是样本要有代表性..②群体的性质..③测量结果的精确度..5常模团体必须是近时的..6注意一般常模与特殊常模相结合..2、几种主要的常模参照分数1发展常模①发展顺序量表:格塞尔发展程序表、皮亚杰对守恒概念的研究②智力年龄③年级当量2百分位常模百分等级:百分点;也称百分位数四分位数、十分位数3标准分常模T分数:平均数为50;标准差为10..标准九分:以5为平均数;以2为标准差..标准十分:平均数为5;标准差为1.5..标准二十分:平均数为10;标准差为3..4智商比率智商离差智商3、常模分数表示法1转换表表示法2剖面图表示法七、搜集信度、效度资料八、编写测验手册内容有:1测验的名称、作者、发行单位..2测验的目的和功用..3测验编制的理论背景和选择题目的依据..4测验的实施方法、时限及注意事项..5测验的标准答案和计分方法..6常模资料..7测验的信度资料和效度资料..第三章测量误差及其来源第一节测量误差的含义与种类一、测量误差的含义测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应..二、测量误差的种类一随机误差又叫可变误差;是由那些与测量目的无关的、偶然因素引起的、而又不易控制的误差..二系统误差又叫常定误差;是那种由测量目的无关的变因引起的一种恒定而有规律的效应..系统误差只影响测量的准确性;不影响稳定性;而随机误差既影响稳定性又影响准确性..第二节测量误差的来源一、测验本身引起的误差心理测量量表是否稳定..是否真正测到了我们所要测的东西..二、施测过程引起的误差①测试环境②测试时间③试因素④意外干扰⑤评分记分三、被试引起的误差①应试动机②测验焦虑③测验经验④练习效应⑤反应倾向⑥生理变因⑦学习、发展与教育第四章测量信度第一节信度的意义一信度的含义一级定义信度指可靠性或可靠的程度..测验的信度则是指测验结果的可靠程度..第二节信度系数的计算信度指标常用相关系数表示;也称信度系数;表示实得分数的变异数中有多少比例是由真分数的变异决定的..一、稳定性系数再测信度、重测信度跨时间的一致性是用同一量表对相同被试者在不同时间测验两次的实得分数的相关系数.. 重测法二、等值性系数复本信度跨形式的一致性是以两个等值题型、题数、难度、区分度相等;但具体内容不同的量表;在最短时距内;对相同的应试者先后施测两次测验所获得的两组对应分数的相关系数..复份法三、等值稳定性系数跨时间跨形式的一致性是合估等值性与稳定性而得到的信度系数..既能反映由于试题变异复份引起的测验成绩变化的程度;又能反映由于应试者的变异在两次测验的间隔中;由学习、练习、成熟等引起的应试者的变化而产生的测验成绩的变化的程度..复份法四、内部一致性系数同质性信度跨项目的一致性主要反映的是题目之间的关系;表示测验能够测量相同内容或特质的程度..方法有以下两种:1、分半法:代表了两半测验内容取样的一致程度..2、基于项目协方差的方法:代表测验内部所有题目间的一致性..五、阅卷者评分的信度系数跨评分者的一致性各种信度系数相应误差变异的来源第三节信度与测验分数的解释及其信度提高方法二、提高测验信度的方法二影响测验信度的因素1、系统误差:不影响信度..2、抽样误差:是影响信度的一个因素..3、随机误差:是影响信度的最主要的一种误差..三提高测验信度的方法①延长测验的长度②测验的难度要适中③测验的内容应尽量同质④测验的时间要充分⑤测验的程序应统一⑥评分要客观⑦加大应试者之间的差异第五章测验的效度第一节效度的意义一、效度的含义一级定义效度是量表能实际测量出其所要测量的特性或功能的程度..理解:1是对一定的测量的目的而言的..2是对测量的结果而言的..3一种测验结果的效度只是高或低的问题..第二节效度的估计逻辑效度:如内容效度和结构效度;统计效度:如目标关联效度..一、内容效度Content Validity基于所测内容的效度验证方法..指测验项目在内容上的适合性;即是否是所欲测量的行为领域的代表性取样..是指测验目的代表所要测量的内容和引起预期反应所达到的程度..研究的目的是要评估测题是否充分代表了所要测量的内容范围;及测验题目对有关内容或行为范围取样的适当性;它所关注的是测验的内容方面..主要应用:学业成就测验、职业资格测验、人员选拔与安置中的工作样本测验..一个测验要有内容效度必须具备两个条件:1.要有定义得完好的内容范围..2.测验项目应是已界定的内容范围的代表性样本..一逻辑分析的方法专家判断它要求让一组独立的专家他们不是测验的编制者;但是非常熟悉所测量的内容领域判断测题对所研究的领域的取样是否有代表性;通过这些评定资料来确定一个测验的内容效度..二克龙巴赫方法从同一个教学内容总体中抽取两套独立的测验题目;用这两套试题分别对相同的一些应试者进行测验;两次测验得分的相关系数;可以用来估计内容效度..若相关较高;可以认为内容效度亦高;若相关较低;则两次测验中至少有一次内容效度低..三统计分析法计算两个评分者之间评定的一致性评分者信度两个测验复本上得分之相关复本信度再测法测验-学习-再测验四经验推测法通过率提高内容效度的方法之一:编制命题的双向细目表二、结构效度构想效度、构念效度construct Validity基于所测心理结构的效度验证方法..是指测验分数能够说明心理学理论的某种结构或特征的程度;或测验实际测量了所要测量的结构和特性所达到的程度..建立构想效度的逻辑顺序:基于相关专业知识和观测资料;提出某一心理特质假设或某一心理结构理论假设;然后根据理论或假设所可能对应的行为特点编制测验并进行施测;最后对测量结果进行相关或因素分析;验证其与理论假设的符合程度..主要应用:各种心理测验;如智力测验、人格测验、焦虑测验、成就动机测验等..估计方法:1对测验本身的分析测验的内容效度:测验的同质性;分析被试者对题目的反应特点.. 2测验间的相互比较相容效度;区分效度;因素分析法..3效标关联法4实验操作法如;举行两场考试;使被试相信一场考试关系重大;另一场考试无关紧要;在考试前进行焦虑测验;看被试的焦虑测验分数是否存在显着的差异;分析原因..构想:考试焦虑是当考试结果对个人有重大意义时的一种害怕失败的紧张情绪”..有一个焦虑测验;考察这测验是否有构想效度..三、效标关联效度准则关联效度一级定义基于效标关联性的效度验证方法..又称实证效度;是指测量分数与作为效标的另一独立测验结果之间的一致程度..一效标是衡量测验有效性的参照标准;指的是可以直接而且独立测量的我们所感兴趣的行为..常见的效标有:1学业成就.. 2等级评定.. 3临床诊断..二效标测量:将观念上的效标用可操作的测量确定下来..防止效标污染;即指个人的效标因评定者知道个体的测验分数也叫预测源分数而受到影响..三效标关联效度的种类:1、同时效度2、预测效度是指测验结果对未来的行为或测验成绩效标能够准确预测的程度..四效标关联效度的估计方法:1、相关法①皮尔逊积差相关公式在两组数据都是连续变量;且两者存在线性关系时使用..②斯皮尔曼等级相关公式在两组数据都是等级变量..③点二列相关系数适用于一列数据为等距正态变量;另一列为离散型二分变量..④二列相关系数在测验分数和效标这两个变量中一个是连续变量;另一个是二分变量被人为地分成两类时使用..2、区分法3、命中率4、利用回归方程估计效标分数及计算其置信区间..X-1.96SE≤T≤X+1.96SE四、表面效度是指从外表直观地看来这个量表可以测量所想测量的特性和功能的程度..最高行为测验如能力测验要求有较高的表面效度..典型行为测验如人格测验却要求较低的表面效度..第三节提高测验效度的方法二、影响效度的因素一测验本身的因素测验取材的代表性、长度、试题类型、难度、区分度以及编排方式等都会影响效度..编制要注意:1测验材料要有应测内容具有代表性;2尽量避免误差较大的题型如是非题;3难度要适中;具有较大的区分度;4测验长度要恰当;保证一定的题量;5测题的排列应先易后难..二测验实施中的干扰因素1、主试的影响因素..如是否按照标准化来实施、测验与效标测量的实施的时间间隔、测验环境的布置等;2、被试的影响因素..如被试测验时的动机、情绪、态度、身体状态、反应定势等..三样本团体的性质1、样本团体的异质性..其他条件相同;样本团体同质性越高;分数范围越小;得到的效度系数就会越低;会低估测验效度;反之 ;得到的效度系数就越大 ;可能会高估效度..比如 ;只使用经选拔后的被试组成样本团体;增加了被试同质性;测验得到的效度系数会较低;2、干涉变量..样本团体的有些变量会影响效度测验;比如被试的年龄、性别、受教育程度、智力、动机、兴趣、职业等特征 ..对于同一个测验来说;使用的样本团体不同;得到的效度系数也会不同..四所选效标的性质三、提高效度的方法①控制系统误差②精心编制量表③妥善组织测验④扩大样本的容量代表性⑤合理处理效度与信度的关系⑥适当增加测验的长度第六章测验的项目分析一难度一级定义指试题的难易程度..P=R/NP代表试题难度;R为答对该试题人数;N为参加测验总人数一区分度一级定义是指测验对考生实际水平的区分程度..也叫鉴别力..第七章试题类型及评分一评分误差评分可靠是指不同人评定同一份试卷或同一个人在不同时间评定同一份试卷所评定的分数都应是一致的..这就叫评分信度..评分者本人的某些特点也能影响评定分数的客观性..1、评分者知识水平的影响..2、评分者心理状况的影响..3、评分者个性倾向的影响..4、各种“效应”的影响:①名片效应..②光环效应..③对比效应..④先后效应..5、评分者工作态度的影响..第八章智力测量第一节智力概述三、智龄和智商二智商比率智商 IQ = 智龄/实龄×100离差智商 IQ = 测验分数/同龄人的平均数×100离差智商 X=100+15Z离差智商一级定义是一种以年龄组为样本计算而得来的标准分数..离差智商=100+15Z;其中Z=X-M/S;其中M代表团体平均分数;X代表个体测验的实得分数;S代表该团队分数的标准差;Z代表该人在团队中所处位置;即他的标准分数..二、韦克斯勒智力量表详见课本P223页包括言语量表和操作量表两部分1.常识2.数字广度3.词汇4.算术5.理解6.类同7.填图8.图片排列9.积木图案 10.拼图11.译码或数字符号 12.迷津 13.句子 14.几何图形 15.动物房第九章人格测量第二节自陈量表法二、几种常用的人格自陈量表介绍一明尼苏达多相人格测验MMPI适用于16岁以上具有小学文化水平以上的群体..该量表共有测题566道;其中有16道重复题..内容包括健康状态、情绪反映、社会态度、心身性症状、家庭婚姻问题等26类题目;可鉴别强迫症、偏执狂、精神分裂症、抑郁性精神病等..MMPI项目涉及内容及项目数MMPI 临床量表4个效度量表Q:疑问量表Question没有回答的题数和对“是”和“否”都做反应的题数..566题版本超过30分;或399题版本超过22分;则答卷无效..L:说谎量表Lie超过10分;结果不可信..F:诈病量表Frequency说明伪装疾病或精神病程度重..K:校正量表Correction根据被试对测验的态度对测验得分进行校正..该测验有两种形式:卡片式、问卷式..测验没有时间限制;一般45分钟可以做完;最多也不超过90分钟..施测的步骤与结果转换:1施测前;主试要熟悉测验和测验的指示语、了解被试情况、确定安静整洁的测试环境..然后选择合适的测试方式卡片式、手册式或录音播放式;2开始测验时把指示语读给被试听;说明测验约需1个半小时;3测验开始后;主试要注意查看被试是否在答题纸上填写姓名、性别、地址等;所答题目序号是否与试卷上的序号符合等;4答题结束后;用读卷机或套版记分..套版记分方法是:把答卷按性别分开、检查并划掉同时选“是”和“否”的答案、查看Q分并当其超过30或22分时确定答卷无效、换用不同套版得到不同分量表原始分;5对5个临床量表进行校正:Hs+0.5K、Pd+0.4K、Pt+1.0K、Sc+1.0K、Ma+0.2K;6使用与被试年龄、性别等对应的换算表;得到各分量表T分..施测中应注意的事项:1测验前 ;要告知测验的意义 ;取得被试合作 ..如被试仍轻率从事或不愿暴露自己 ;主试可凭经验尽可能弄清情况;做好工作;争取被试的合作;并详细记录被试的表现;2向被试讲清楚;如遇不能回答的问题;可以空下来;但要尽可能回答;不要空的太多;每个问题的回答无所谓对错等;3如果因测验时间长被试情绪焦躁、不耐烦;则可以将测验分成几段进行;也可以用放录音的方法进行测验;4使用分量表时;尽量使用代码表示;而不要用中文全译名称;以免表达不准确或造成误解、误判、误读等..计分方法:原始分→T分数→剖面图计算Q量表的原始分..超过22分或30分无效..分别计算各量表的原始分..对5个量表加K分校正..Hs、Pd、Pt、Sc、Ma5个量表要分别加上一定比例的K分..查表把原始分转化为T分;或计算T分..60以上为异常中国标准:70分以上为异常美国常模T = 50 + 10X - X/ SD画出剖析图..临床量表及其诊断意义:1疑病Hs:反映对身体功能的不正常关心;高分者往往有疑病症、神经衰弱、抑郁等倾向;身体无病;也总觉得身体欠佳;2抑郁D:高分者常被诊断为抑郁症;表现忧郁、淡漠、悲观、思想与行动缓慢..分太高有自杀倾向;3癔症Hy:反映用转换反应对待压力或矛盾的倾向;高分者往往有癔症倾向;依赖、天真、外露、幼稚及自我陶醉等;4精神病态Pd:反映性格畸变..高分者蔑视社会习俗和规范;常有复仇攻击观念;多诊断为人格异常、反社会人格、被动攻击性人格;5男子气-女子气Mf:高分者有异性化倾向;极端高分则暗示有性变态倾向或性变态行为..6偏执Pa:高分者多疑、孤独、过分敏感等 ;T 分超过70则可能存在偏执妄想..尤其是F、Sc量表分数高;而Pa分又极端高;则常被诊断为精神分裂症偏执型和偏执性精神病;7精神衰弱 Pt:高分者紧张、焦虑、强迫思维、恐怖及内疚感;常自责自罪、自卑;Pt、D、Hs同时升高则多诊断为神经症;8精神分裂症Sc:高分者表现非常的或分裂的生活方式及情感反应 ..极高分数T>80者多有不恰当情感反应、怪异行为、妄想、幻觉、人格解体等精神症状及行为异常..如只有Sc高分、无F量表分升高常提示类分裂性人格;9轻躁狂Ma:高分者常为联想过多过快、活动过多、观念飘忽、夸大而情绪激昂、情感多变..极高分数多有妄想;T>90 者可能正处于躁郁症的躁狂相;10社会内向Si:高分者内向、退缩、紧张、固执、自罪;低分者外向、爱交际、冲动、做作;在社会关系中不真诚..三艾森克人格问卷EPQ该量表是由内外向性E量表、情绪性或神经质N量表、精神质或倔强性P量表和效度量表L量表等四个分量表组成..包括两式:儿童7~15岁;成人16岁以上..艾森克的人格理论E维度:内—外向高分表示人格外向;低分表示人格内向;N维度:情绪稳定性低分表示情绪稳定;高分表示神经过敏;P维度:精神质高分表示孤独;难以适应环境;感觉迟钝..L:说谎量表..E、N维度与古希腊盖伦的气质学说相吻合施测步骤和结果计算:艾森克人格问卷的施测非常简单;即将答卷和答题纸发给被试;可以个别测验;也可以团体测验..团体测验时要保证人手一套答卷和答题纸..严格按照指示语向被试说明完成测验的做法;即可由被试自行完成..施测中要求:第一;在问卷上印有指示语;施测时要让被试读懂指示语;第二;只需要就每一题回答“是”或“否”;第三;不要遗漏任何一道题目..评分界线:中间型:43.3~56.750± 6.7倾向型:38.5~43.3; 56.7~61.5典型型:< 38.5 50-11.5;> 61.5 50+11.5各维度的典型人格特征1典型外向E分特高表现为:爱社交、朋友多、喜欢冒险、追求剌激、不甘寂寞、好谈笑、冲动行事不爱做研究工作;喜欢实际的工作;反应迅速;随和;但情绪容易失去控制;做事粗心;从外表看似乎是一个不太可靠的人..审美:喜欢深颜色2典型内向E分特低表现:保守;交际不广;但有挚友;好静;做事瞻前顾后;行为不易受冲动的影响;不喜欢剌激;喜欢有秩序的生活和工作;极少发脾气;做事有计划;情绪倾向于悲观审美:喜欢浅色3典型的情绪不稳N分特高表现为:焦虑、紧张;易怒;往往又有抑郁;对各种剌激的反应都过于强烈;情绪被激发后以很难平复下来;好抱偏见;常患有多种心身障碍..4情绪极稳N分特低表现为:情绪反应缓慢;不强烈;而且容易平复;很难生气;在一般人难以忍耐的剌激下也有所反应;但不强烈..5P分高表现为:独身;不关心人;常到哪里都觉得不合适;有的可能表现为残忍;不人道;缺乏同情心;对人常抱有敌意;攻击性强;喜恶作剧..儿童:好恶作剧;很麻烦;缺乏是非感;令人讨厌的调皮..第三节投射测验一、投射测验的基本理论一基本理论向受测者提供预先编制好的一些未经组织的、意义模糊的标准化刺激情境;让受测者在不受任何限制的情况下;自由地对刺激情境作出他的反应;然后通过分析受测者的反应;推断受测者的人格特征..投射:一级定义是指个人对个体特征的想象式解释;在这种解释中;个人具有将自己身上发生的心理过程无意识地附着在客体身上的倾向..第十章心理与行为问题评估第一节 90项症状清单SCL-9090项症状清单Symptom Check List 90;简称SCL-90;又称为症状自评量表;也叫做Hopkin’s症状清单简称HSCL..适用范围:1心理卫生问题的评定工具;2了解躯体疾病求助者的精神症状;。

心理测量学知识

心理测量学知识

哪一个最合适。
二、常模团体的条件
(一)群体的构成必须明确界定 (二)常模团体必须是所测群体的代表性样本 (三)样本的大小要适当 总体数目小,只有几十个人,则需要100%的样本。如 果总体数目大,相应的样本也大,一般最低不小于30或 100个。全国性常模,一般应有2000~3000人为宜。 (四)标准化样组是一定时空的产物
第一单元、常模团体
一、常模团体的性质
• 常模团体是由具有某种共同特征的人所组成的一个群体, 或者是该群体的一个样本。它用一个标准的、规范的分数 表示出来,以提供比较的基础。 • 任何一个测验都有许多可能的常模团体 • 对测验编制者而言,常模的选择包括:确定一般总体、确 定目标总体、确定样本。 • 对测验的使用者来说,要考虑的问题是,现有的常模团体

【例题2.5】百分等级55的分数表示在常模样本中有55%的人比这个分 数( )。(2007年11月三级真题) A.低 B.相等 C.高 D.以上都不正确
【答案】A 【解析】一个测验分数的百分等级是指在常模样本中低于这个分数 的人数百分比。百分等级55的分数表示在常模,样本中有55%的人低于 这个分数。
第一节
概述
【考查要点】 1.测量的含义; 2.不同的测量量表:命名、顺序、等 距和等比量表; 3.测验观:错误的和正确的; 4.不同的测验种类。
第一单元、测量与测量量表
一、什么是测量 • 测量就是依据一定的法则用数字对事物加以确定。 • 定义中包括三个主要的元素:(1)事物 (2)数字 (3)法则。 二、测量要素 • 任何测量都应该具备两个要素:既参照点和单位。 • 参照点有两种:a.绝对零点 b.相对零点
第二节、测验的常模
【考查要点】


1.常模团体的条件中的重点是样本的大小; 2.取样的方法:系统抽样与分层抽样; 3.常模分数; 4.常模; 5.发展常模:智力年龄、年级当量; 6.百分位常模:百分等级、百分点、四分位数和十分位 数; 7.线性转换的标准分数 8.非线性转换的标准分数:T分数、标准九分、标准十分 和标准二十分; 9.智商中的常模:智力年龄、比率智商与离差智商; 10.常模分数的表示方法:转换表法、剖面图法。

心理测量学知识点疏理+心理测量学章节测试题(附答案)

心理测量学知识点疏理+心理测量学章节测试题(附答案)

心理测量学章节重点本阶段内容介绍:心理测验作为一门用于临床诊断、判断疗效,以及推动心理咨询进程的技术和方法,成为学习心理咨询必须掌握的一门技能,也是心理咨询师职业认证培训中的一门重要课程。

本课程主要讲授心理测验的基本理论、测验工具的使用。

本部分内容应注重对心理与行为问题的评估及测验结果的解释等。

本阶段学习建议:这部分内容在基础知识及案例选择题中通过选择题方式进行考核。

应对基础知识部分的考试,需要拿握习题集中涉及到的知识点。

应对技能部分的案例选择题,需对照相关视频讲解及考试联系,了解常考题型的解答思路。

总的来说这部分计算的内容虽然难,但不作为重点,而识记和理解则相对而言比较重要。

如果能够亲身参与几个心理测验,了解其过程,则更有助于知识的整体掌握。

第五章心理测暈学知识第一节概述第一单元测量与测量量表一、什么是测量1.测量就是依据一定的法则用数字对事物加以确定。

2.测量的三要素:事物、数字、法则。

二、测量要素测量的两个要素:参照点、单位参照点是确定事物的量时计算的起点,参照点有两种,绝对零点和相对零点。

“0℃属于相对零点,并不意味着没有温度。

好的单位要有确定的意义(即对同一单位),还要有相同的价值。

三、测量量表:在一个有定量单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。

根据单位的理想\不理想,量表分为四类:(一)命名量表:只能按照事物的某种属性对其进行分类或分组。

是最粗略、层次最低的计量尺度。

如性别(男、女)、学历、企业性质、职业、地区等。

由于定类尺度只能区分事物是同类或不同类,因此它具有“=和≠”的数学特性。

通常计算每一类别中各元素或个体出现的“频数或频率”来进行分析。

(二)顺序量表:是对事物之间等级差别或顺序差别的一种测度。

它不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。

如:◆考试成绩:优、良、中、及格、不及格。

◆教育水平:小学及以下、初中、髙中、大学及以上。

心理测量学知识-新教材-2014年秋

心理测量学知识-新教材-2014年秋

三、 标准分常模
线性转换:当原始分数是常态分布时
是将原始分与平均数的距离,以标准差为单位表示出来的量表
(见373页正态分布图)
Z分是最基本的标准分
T分=50+10(Z)(T分广泛使用,人格测验中常用) 标准20=10+3(Z) (如韦氏量表中各分测验成绩) 标准10=5.5+1.5(Z) 标准9=5+2(Z)
标准差(亦称单数标准差) 一般用s 表示,是表示个体间变异大小的
指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标; 而标准误一般用s…x 表示,反映样本平均数对总体平均数的变异程度,从 而反映抽样误差的大小,是量度结果精密度的指标。 随着样本数(或测量次数) n 的增大, 标准差趋向某个稳定值,即样本 标准差s 越接近总体标准差σ ,而标准误则随着样本数(或测量次数) n 的 增大逐渐减小,即样本平均数越接近总体平均数μ ;故在实验中也经常采用 适当增加样本数(或测量次数) n 减小s…x 的方法来减小实验误差,但样 本数太大意义也不大。
第二节
测验的常模
第一单元
常模团体
一、 常模团体的性质
由共同特征的人(或者其代表)所组成的群体, 用一个标准的分数表示,作为比较的基础。(如 SCL90常模中的男性大学生) 在制定常模时,首先要确定常模团体;在对常模参 考分数作解释时,也必须考虑常模团体的组成。 常模团体的选择一般包括:确定一般总体、确定目 标总体、确定样本
三、 测量量表
这个连续体称为量表
根据某一法则在一个定有单位和参照点的连续体上把事物的属性表现出来,
1.命名量表
用数字来标记-代号和分类(1代表男、2代表女)(不能做数量化分析)
2.顺序量表

心理测量学第三节 测量的信度

心理测量学第三节  测量的信度
❖ 将差异标准误(7.5)乘以1.96,结果为14.7,这 表明个体在韦氏测验两半得分的差异大约15分, 才能达到0.05水平显著,上述被试的差异分数8 分,是不显著的。
2010年5月(二级)
❖ 10、某受测者在韦氏成人智力测验中言语智 商为102,操作智商为110。已知两个分数都 是以100为平均数、15为标准差的标准分数。 假设百语测验和操作测验的分半信度分别为 0.87和0.88,则该受测者的操作智商( )于言 语智商。
2009年5月(三级)
❖ 35、以再测法或复本法求信度,两次测验相 隔时间越短,其信度系数越( )
❖ (A)大 -
(B)低

(D)不确定
(C)
数分布范围最大,求得的信度也最高。 ❖ 对于选择题目由于存在着猜测因素,难度值应提高。 ❖ 洛德(lord)提出学绩测验中,各类选择题的理想
平均难度为:五择一测题0.70,四择一测题0.74, 三择一测题0.77,是非题0.85。
时间间隔与信度
❖ 只对重测信度和间隔施测的复本信度有影 响
❖ 两次测验相隔时间越短,其信度系数越大; 间隔时间越久,其他变因介入的可能性越 大,受外界影响也越大,信度系数便越低
❖ 即:X=T+E
一.信度的定义
❖ 信度是指测量结果的可靠性和一致性. ❖ 理论定义:一组测量分数的真实方差与实得方差的
比,即真空方差占总方差的百分比.
SX 2 ST 2 SE2
❖ 操作性定义:信度有是一个测验X与它的任意一个 平行测验X’的相关系数.
信度的定义
rxx
ST2
S
2 X
rxx
❖ 另一原则是:新编的测验信度应高于原有的同类测 验或相似测验。

心理咨询师学习笔记之心理测量学

心理咨询师学习笔记之心理测量学

心理测量学总述提升自己的要诀是切勿停留在原地不动,而欲达到此目的,首先要有不满现状的心理。

但是仅仅不满足是不够的,你必须决定下一步往何处去?千万不要做个只会成天抱怨的懒人。

---- 麦尔顿心理测量的章节,因为涉及高等数学以及公式计算、难以理解,学起来比较难,很多应试的伙伴(特别是文科生)会选择放弃这部分的内容。

但是我们结合历年考试真题的统计,测量在基础考试和技能考试两部分都各占了十分左右,这个比例可不小。

当然如果你对其他章节备考相当有信心,可以考虑放弃本章节。

不过,以过来人的经验,只要掌握有效的应试技巧,每个考试部分各拿下7-8分也并不难。

首先,心理测量基础考试的部分,复习关键在于搞懂《基础心理知识》教材关于心理测量的七节内容里的重要概念,对于章节中的计算公式不明白的,就放下,不做纠结。

然后,心理测量技能考试的部分,《技能》教材里四节内容介绍的是各种具体心理测量技能的应用,比如:智力测验、人格测验等等,这里会涉及一些计算题,但每年考点也不多,所以考前结合历年真题做些练习就可以了。

这部分技能应用的内容会在以后学习三级技能和二技能时再分别介绍。

在此之前,我们要梳理一下整章共七节内容的知识结构,方便后面的学习理解。

第一节概述是测量的一些最基础的概念,如测量的组成元素,测量的分类等等,这些概念是理解后面章节内容的基础。

第二节测验的常模可以简单理解为用来比较和解释测验结果的参照标准。

例如我智力测验结果100,属于正常水平,因为正常水平的参照标准是90 109。

第三节测验的信度信度是评价测验是否合格,也就是说,衡量一个测验是否可用,考虑的是测验能用还是不能用的指标。

第四节测验的效度是恒量测验的准确性的指标,用大家平常的话就是在测验可信可用的前提下测验的结果有多准确,是否符合实际。

第五节项目分析讲的是对测验的题目的难度和区分度比如,如果给小学生出一道高等数学的题目,估计没有小学生会做吧,那么就区分不了被测的小学生们的水平了,那么这道题的难度太大,区分度太低了。

测验的信度

测验的信度

心理测量学——测验的信度学习笔记第三节测验的信度第一单元信度的概念第二单元信度评估的方法第三单元信度与测验分数的解释第四单元影响信度的因素第一单元信度的概念一、信度的定义信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。

在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率。

二、信度的指标(一)信度系数与信度指数信度指数是真分数标准差与实得分数标准差的比值。

信度指数的平方就是信度系数。

(二)测量标准误测量误差分布的标准差,即为测量的标准误。

第二单元信度评估的方法一、重测信度二、复本信度三、内部一致性信度四、评分者信度信度的类型与估计方法重测信度(test-retestreliability)–又称稳定性系数。

它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。

–最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最长不超过六个月。

内部一致性信度(internalconsistencyreliability)–分半信度(split-halfreliability)采集者退散是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。

分半法经常会低估信度,必须修正,借以估计整个测验的信度。

–同质性信度(homogeneityreliability)同质性主要代表测验内部所有题目间的一致性。

当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,则测验为同质的。

相反,即使所有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异质的。

–评分者信度(scorerreliability)–随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。

什么是信度?

什么是信度?

什么是信度?教育测量中,如何保证测验的客观性,取决于测验的几个相互联系的基本因素,这就是测验要有较高的信度、效度,测验题目要具有比较高的区分度和比较适当的难度。

只有保证了测验的这些要求,就可以做到将想要测验的内容测出来,把被评价者区分开,这也就达到了测量的目的。

可以说,保证测验是科学的和有价值的,必须关心测验的信度、难度、测验题目区分度以及测验的难度。

从测量与评价的结果来说,测验的科学性指的就是测评结果能准确地反映被测对象的真实情况,达到测量的目的,即测量要具有较高的信度和效度。

一、教育评价与测量的信度信度,简单地说就是测量结果的可信程度。

信度(reliability)指的是测量结果的稳定性程度,如果用同一测量工具反复测量同一种特质对象,则多次测量结果间的一致性程度就叫信度。

各种类型的测量,无论是物理测量还是教育与心理测量,先后向同一对象施测后,所得数值很难做到绝对一致。

每次测量结果实际上包含了被测量特质对象的实际水平和测量误差两部分。

如果每次测量结果中误差部分都很小,那么测量结果必然是稳定的。

教育测量,由于对象的特殊性,出现测量误差的可能性更大,如施测环境、完成时限、主被试关系、被试的动机和情绪等因素都可能影响到测量的结果。

信度在这里就是指对这种随机误差的控制。

测验本身排除无关变量影响的能力强,测验实施过程各方面偶然误差因素控制得好,多次施测所得分数的一致性就高,测量信度也就高,测验就比较可靠。

测验信度是对测验工具及其操作的整体质量的一种量度,是测验性能的重要质量指标。

1.信度定义信度指的是测量结果的稳定性程度。

如果用同一测量工具反复测量某人的同一特质,多次测量结果间的一致程度就叫信度,也可以叫做测量的可能性。

一个好的测量必须要具有较高的信度。

一个好的测量工具,只要遵守操作规则,其结果不应随工具的使用者或使用时间等方面的变化而发生较大变化。

信度有如下三个等价的定义:定义1,信度是一个被测团体的真分钟变异数与观察分数变异数之比。

心理与教育测量学重点总结

心理与教育测量学重点总结
3.提高测量信度的方法有哪些?(学会计算提高测验长度提高测验信度) 答:①适当增加测验的长度;②控制题目的难度分布,使其处于中等水平;③努
力提高每道题目的区分度;④选取适当的被试团体,努力提高测试在各个同 质亚团体上的信度;⑤规范施测程序,统一施测环境,严格控制误差。
第五章 测量效度
掌握概念: 1.效度:指一个测验所能测量到其想要测量的心理特质的程度。 2.表面效度:指测验的表面看起来与其所测验内容之间的一致性程度。 3.内容效度:指测验所能测量到的心理特质的内容与其想要测量的心理特质的内
5.影响效度的因素有哪些? 答:①测验本身:a.测题中所用的词汇或句型不能太难;
b.测题的指导语应该清楚; c.测题中不能提供额外线索; d.测题的难易顺序编制要合理; e.选择题的正确答案不能有明显的组型; f.测题的难度要适当; g.测题数目要适当; ②测验的实施:a.指导语标准化;
b.排除意外干扰; c.按照标准化的程序进行客观评分; ③所选校标的性质; ④测验的信度。
2.简述心理测验的基本条件。 答:标准化测验的技术指标有常模、信度和效度。
(1)常模:指某种心理测验在某一人群中测查结果的标准量数,即可比较的 标准。常模形式有:均数、标准分(如 Z 分、离差智商、T 分)、百分位、划 界分等。常模的制定要通过标准化的取样过程,样本的代表性要好。 (2)效度:指测验结果的有效和真实性,即某种测验测查到所要测查内容的 程度效度高是心理测验的充分必要条件。有内容关联效度、效标关联效度和结 构关联效度。 (3)信度:指测验分数反复测量的可靠性,反映测量误差。有分半信度、重 测信度和α系数等。
2.验证内容效度的方法有哪些? 答:①逻辑分析法;②克伦巴赫估计法;③再测法。
3.验证结构效度的方法有哪些? 答:①测验内方法:a.内容效度法;b.口语报告法;c.相关分析法;

信度指数的平方是信度系数

信度指数的平方是信度系数

杀绝,仍给人留有余地。在南方,白天和晚上几乎没有什么差别,
昼夜温差很小,人们也自然严阵以待,丝毫不敢松懈,在三十几度
的高温中坚持整个夏天。在北方,可就不一样,清晨和晚上是一天
中最凉快的时候,几乎是只要没有阳光时就一点也不热。正常情况 下,最高温度也就在30度左右,超过30度是很少的事,所以,人们 也就不用紧张,可以放心的,踏踏实实的度过整个夏天。


夏天来临,总会伴随着一些炎热,我生在北方,却住在南方。
对这南方北方的热,我可是深有体会。

南方的热是闷热,而北方的热多少有一些凉爽。处在南方,这
热除了呆在家中,否则你是无法躲藏的。热不仅隐藏在太阳光中,
而仿佛是一种弥漫在空气中的颗粒,古人说心静自然凉,我看恐怕
无法适用于此,即使你在树荫中盘坐,豆大的汗珠还是会源源不断
等值 性
程序
A卷
最 短 时 距
B卷
误差
内容 取样
使用条件
第一,前提是有复本测验。 第二,被试有条件接受两个测验(时间和经费等)。 第三,报告结果时要报告两次测验的间隔及有关经历.
评价
优点
不足
代表性增强,信度更准 一定程度避免练习、记忆效应
触类旁通 编制复本难
重测信度与复本信度有何异同?
几种典型测验的信度系数
测验类型
低中

成套成就测验
.66 .92 .98
学术能力测验
.56 .90 .97
成套倾向性测验 .26 .88 .96

影响 一致

响性度

系统 恒定、有规 稳定地存在于每 确 不影 效
误差 律的因素
次测量中

心理测量学基础

心理测量学基础

第四节
测验的效度
效度是指测试的准确程度. 除受随机误差影响外,还受系统误差的 影响。 可信的测验未必有效,而有效的测验必 定可信。(P378)
第四节
测验的效度
效度的性质 相对性:与目的和功能相一致的测试才有效 连续性:效度较高或较低。
效度评估的方法——内容效度:
该测验是否是所欲测量的行为领域的代表性取 样。 不一定要求是同质的 评估方法:专家判断法、统计分析法(评分者 效度,复本效度,再测法)、经验推测法 (P380) 表面效度,受测者所认为的测量。最高行为测 试需要表面效度高,典型行为测试需要表面效 度低(P381)
三、标准分常模(P365) 1.线性转换的标准分数 z=(X-X)/SD
Z=A+B· z
求1,2,3,4,5,6的X和SD X=(1+2+3+…+6)/6=3.5 2 2 SD=(1-3.5)+(2-3.5)+…
加上A是为了无负数,加上B是为了无小数
2.非线性转换的标准分数 原始分数 百分等级 标准分数
第二节 测验的信度
第一单元 信度的概念
定义:同一受测者在不同时间内 用同一测验重复测量,所得结果 的一致程度。
第一次测试:1.5,2, 2.5 平均数2, ST =0.5 2 第二次测试:8.5,9, 9.5 平均数9, Sx =0.5 2 2 信度系数rxx=真分数方差ST /重测分数方差Sx =0.5/0.5=1 2 第二次测试: 1, 2, 9 平均数4, Sx =38 rxx =0.5/38=0.01
2
第二节 测验的信度
第一单元 信度的概念 指标: 2 2 信度系数:r S /S 信度指数:信度系数的平方根 测量标准误:SE=S √1-r

心理测量

心理测量

一、信度信度是指同一被试在不同时间内用同一测验重复测量,所得结果的一致程度。

反映的是测验的稳定性在测量理论中,信度被定义为:一组测量分数的真分数方差和总方差的比率r XX= S2T/ S2X一个测验的实得分数(X)总是由真实分数(T)和误差(E)构成的,用公式表示如下:X=T+E如果我们讨论一组测验分数的特性时,可用方差代表具体分数:S2X=S2T+S2ES2X是测验实得分数的方差,S2T 是测验真分数的方差,S2E是S2T/ S2X测验误差的方差,那么rXX=S2TS2E r XX为信度,它是S2T、S2E的分界线,越往左,S2E越大,信度越低,越往右,S2T越大,信度越高二、信度的指标(一)信度系数和信度指数信度系数是= S2T/ S2X而信度指数就是信度系数的平方根信度指数的平方就是信度系数(二)测量标准误即S ES E = S x1-r xxS2X=S2T+S2E 此公式可通过公式的推导它和信度的关系:信度越高,标准误越低;信度越低,标准误越高第二单元信度评估的方法一、重测信度又称稳定性系数它是使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数优点:提供有关测验是否随时间而变异的资料,可作为被试将来行为表现的依据缺点:受练习和记忆的影响重测间隔时间一般两周到四周较宜,最好不要超过六个月。

间隔太短由于记忆、练习的影响信度系二、复本信度复本信度又称等值性系数,它是以两个等值题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。

复本信度反映的是测验在内容上的等值性。

复本信度也要考虑复本实施的时间间隔。

1、两个复本在同一时间里实施,相关系数反映的才是不同复本的关系。

2、两个复本的施测相隔一段时间则称重测复本信度稳定与等值系数既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性,因而为更严格的信度考核方法。

心理咨询师考试 测验理论基础知识总结

心理咨询师考试 测验理论基础知识总结

第一节概述第一单元:测量与测量量表1、测量就是依据一定的法则用数字对事物加以确定。

从字面上看,该定义包括一个主要的元素:事物、数字和法则。

2、数字,就是代表某一事物或事物某一属性的量。

数值具有区分性、序列性或等级性、等距等,可加性的特点。

3、任何测量都应该具备这样的两个要素:即参照点和单位。

参照点分为绝对零点和相对零点。

绝对零点如测量长度、轻重等都以零点为参照点。

相对零点,即人定的参照点,如海拔高度、0摄氏度等。

理想的参想点是绝对零点。

4、好的单位必须具备两个条件:一有确实的意义,即对同一单位,所有人的理解意义要相同,不能出一不同的理解。

二有相同的价值,即相邻两个单位点之间的差别都是相等的。

5、测量量表斯蒂文斯将测量从低级到高级分成四种水平,即命名量表,顺序量表,等距量表和等比量表。

命名量表:是最低的一种量表形式,只是用数字来代表事物或把事物归类。

数字只用来作标记和分类,如学生和运动员的编号,用1、2代表男女。

这种量表可以分为两种:代号和类别。

顺序量表:其数字不仅指明类别,同时指明类别的大小或含有某种属性的程度。

特点;具有序列性,但序列之间的差别并不相等。

如;考试名次、工资级别、能力等级,对某事物的喜爱程度等。

等距量表;不但有大小关系,而且具有相等的单位,其数值可以相互做加、减运算,但没有绝对零点,因此不能做乘、除运算。

特别;序列性、等距性。

如:典型例子摄氏温度,10度与15度的差别,因为它的零点是人定的,0度并不意味着没有温度。

等比量表:是最高水平的量表,既有相等单位又有绝对零点。

特点:序列性、等距性和绝对零点。

如长度、重量、时间等。

6、心理测验的编排是在顺序量表上进行的。

心理测验数据结果分析是把顺序量表得到的数据换算为等距数据来进行统计。

第二单元;心理测验的基本概念1、心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中心理特点做出推论和数量化分析的一种科学手段。

第三单元信度与测验分数的解释

第三单元信度与测验分数的解释

第三单元信度与测验分数的解释一、解释真实分数与实得分数的相关。

信度系数(0-1.00)可以解释为总的方差中有多少比例是由真实分数的方差决定的,如,当rxx=0.90时,即表示所得分数中有90%的变异是由真分数造成的,仅10%是来自测验的误差。

二、确定信度可以接受的水平。

一个测验究竟信度多高才合适:一般原则是:当rxx〈 0.70 时,测验不能用于对个人进行评价和预测,而且不能作团体比较.新编的测验信度应高于原有的同类测验或相似测验。

三、解释个人分数的意义。

1、估计真实分数的范围。

2、了解实得分数再测时可能的变化情形。

人们一般采用95%的概率水平,其置信区为:X-1.96SE<XT≤X+1.96SES X为所得分数的标准差,r xx为测验的信度,SE为标准误。

表示大约有95%的可能性真分数落在所得分数±1.96SE范围内,或有5%的可能性落在范围之外.例:IQ为100,是否反应真实水平?四、比较不同测验分数的差异。

即比较两个人不同分数的差别和同一受测者在两个测验上的差别。

这是差异分数的标准误的问题。

计算公式:S为两个测验的标准差,r xx和r yy分别为两个测验的信度。

例:某被试在韦氏成人智力测验中言语智商为102,操作智商为110。

已知两个分数都是100为平均数,15为标准差的标准分数。

假设言语测验和操作测验的分半信度分别为0.87和0.88.计算得SEd=7.5,所以被试的差异分数110-102=8是不显著的.第四单元影响信度的因素一、样本特征(一)样本团体异质性的影响。

若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。

(二)样本团体平均能力水平的影响。

对于不同水平的团体,题目具有不同的难度每个题目在难度上的微小差异累计起来便会影响信度。

二、测验长度在一个测验中增加同质的题目可以使信度提高。

1、测验越长,测验的测题取样或内容取样就越具有代表性。

2、测验越长,被试的猜测因素影响就越小。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三单元信度与测验分数的解释
一、解释真实分数与实得分数的相关。

信度系数(0-1.00)可以解释为总的方差中有多少比例是由真实分数的方差决定的,如,当rxx=0.90时,即表示所得分数中有90%的变异是由真分数造成的,仅10%是来自测验的误差。

二、确定信度可以接受的水平。

一个测验究竟信度多高才合适:一般原则是:当rxx〈 0.70 时,测验不能用于对个人进行评价和预测,而且不能作团体比较.新编的测验信度应高于原有的同类测验或相似测验。

三、解释个人分数的意义。

1、估计真实分数的范围。

2、了解实得分数再测时可能的变化情形。

人们一般采用95%的概率水平,其置信区为:
X-1.96SE<XT≤X+1.96SE
S X为所得分数的标准差,r xx为测验的信度,SE为标准误。

表示大约有95%的可能性真分数落在所得分数±1.96SE范围内,或有5%的可能性落在范围之外.
例:IQ为100,是否反应真实水平?
四、比较不同测验分数的差异。

即比较两个人不同分数的差别和同一受测者在两个测验上的差别。

这是差异分数的标准误的问题。

计算公式:
S为两个测验的标准差,r xx和r yy分别为两个测验的信度。

例:某被试在韦氏成人智力测验中言语智商为102,操作智商为110。

已知两个分数都是100为平均数,15为标准差的标准分数。

假设言语测验和操作测验的分半信度分别为0.87和0.88.
计算得SEd=7.5,所以被试的差异分数110-102=8是不显著的.
第四单元影响信度的因素
一、样本特征
(一)样本团体异质性的影响。

若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。

(二)样本团体平均能力水平的影响。

对于不同水平的团体,题目具有不同的难度每个题目在难度上的微小差异累计起来便会影响信度。

二、测验长度
在一个测验中增加同质的题目可以使信度提高。

1、测验越长,测验的测题取样或内容取样就越具有代表性。

2、测验越长,被试的猜测因素影响就越小。

三、时间间隔
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大,间隔时间越久,信度系数便越低。

三、测验难度
洛德提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:
五择一测题,0.70;
四择一测题,0.74;
三择一测题,0.77;
是非题,0.85.。

相关文档
最新文档