心理测量学知识

合集下载

相关主题

心理测验技能第一节

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

心理测量学知识
心理测量学知识
心理测量作为心理学的研究方法之一，始于欧洲，20世纪初传入中国。

第一节概述
第一单元测量与测量量表
一、什么是测量
测量就是依据一定的法则用数字对事物加以确定。

该定义包括三个主要元素：（1）事物（2）数字（3）法则。

所谓“事物”，指的是我们要测量的对象，更准确地说，就是引发我们兴趣的事物的特征或属性。

在心理测量中，我们所感兴趣的、所欲测量的当然就是心理能力和人格特点等。

所谓数字，是代表某一事物或事物某一属性的量。

所谓法则，代表的是测量所依据的规则和方法。

二、测量要素
任何测量都应该具备这样两个要素：即参照点和单位。

（一）参照点
要确定事物的量，必须要又一个计算的起点，这个起点叫做参照点。

参照点有两种，一种是绝对零点，另一种是人定的参照点，即相对零点。

（二）单位
单位是测量的基本要求，没有单位就无法进行测量。

好的单位必须具备两个条件：一为有稳定的意义，对同一单位，所有的人的理解意义要相同，不能出现不同的理解；二为有相同的价值，即相邻两个单位点之间的差别总是相等的。

三、测量量表
测量的本质是根据某一法则将事物数量化，即在一个定有单位和参照点的连续体上把事物的属性表现出现，这个连续体称为量表。

根据量表的精确程度，将测量从低级到高级分成四种水平，即命名量表、顺序量表、等距量表和等比量表。

（一）命名量表
这是测量水平最低的一种量表，只是用数字代表事物或把事物归类。

（二）顺序量表
它比命名量表水平更高，其中的数字不仅指明类别，同时指明类别的大小或含有某种属性的程度，主要用于分等或排出顺序。

在顺序量表中，既无相等单位，有无绝对零点，数字仅表示等级，并不表示某种属性的真正量或绝对值。

（三）等距量表
不但有大小关系，而且具有相等的单位，其数值可以相互做加、减运算，但没有绝对零点，因此不能做乘除运算。

（四）等比量表
是最高水平的量表，既有单位又有绝对零点。

一般说来，心理测量是在顺序量表上进行的。

第二单元心理测验的基本概念
一、心理测验的定义
所谓心理测验，就是依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯穿在人全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。

首先，心理测验测量的是人的行为，严格地说，只是测量了做测验的行为，也就是一个人对测验题目的反应。

其次，心理测验在测量个别差异的时候，往往只是对少数经过慎重选择的行为样本进行观察，来间接推知被试者的心理特征。

再次，为了使不同的被试者所获得的分数有比较的可能性，测验的条件对所有的被试者都必须试相同的。

第四，个人在测验中所得到的原始分数并具有什么意义，只有将它与其他人的分数常模相比较才有意义。

二、心理测验的性质
（一）间接性，我们只能通过一个人对测验项目的反应推论出他的心理特质。

（二）相对性
（三）客观性：首先，测验用的项目或作业；其次，评分记分的原则和手续经过了标准化，对反应的量表是客观的；再次，分数转换和解释经过了标准化，对结果的推论是客观。

第三单元心理测验的分类
一、按测验的功能分类
（一）智力测验
（二）特殊能力测验：这类测验偏重测量个人的特殊潜在能力，多为升学、职业直到以及一些特殊工种人员的筛选所用。

（三）人格测验：主要用于测量性格、气质、兴趣、态度、品德、情绪、动机、信念等方面的个性心理特征。

一般有两类：一为问卷法一为投射法。

二、按测验材料的性质分类
（一）文字测验：所用的是文字材料，它以言语来提出刺激，被试者用言语作出反应。

（二）操作测验：也称非文字测验，测验题目多属对图形、实物、工具、模型的辨认和操作，无须言语作答，所以不受文化因素的限制，可用于学前儿童和不识字的成人。

三、按测量材料的严谨程度分类
（一）客观测验
此类测验中，所呈现的刺激词句，图形等意义明确，只需被试者直接理解，无须发挥想象力来猜测和遐想，故称客观测验。

（二）投射测验
在此类测验中，刺激没有明确意义，问题模糊，对被试的反应也没有明确规定。

四、按测验的方式分类
（一）个别测验
指的是每次测验过程中是以一对一形式来进行的，即一次一个被试。

这是临床上最常用的心理测验形式。

（二）团体测验
五、按测验的要求分类
（一）最高作为测验
此类测验要求被试者尽可能做出最好的回答，主要与认知过程有关，有正确答案。

智力测验、成就测验均属最高作为测验。

（二）典型行为测验
此类测验要求被试者按通常的习惯方式做出反应，没有正确答案。

一般来说，各种人格测验
均属典型行为测验。

第四单元纠正错误的测验观
一、错误的测验观
不客观态度大体分为两类：一是测验完美无缺，另一个是测验无用且有害。

（一）测验万能论（二）测验无用论（三）心理测验即智力测验
二、正确的测验观
（一）心理测验是重要的心理学研究方法之一，是决策的辅助工具。

（二）心理测验作为研究方法和测量工具尚不完善。

心理测验的最大问题是理论基础不够坚实。

第五单元心理测验在心理咨询中的应用
在我国目前情况下，心理门诊中运用的大致有这样3类心理测验：智力测验、人格测验以及心理评定量表。

一、智力测验
目前常用量表有：吴天敏修订的中国比内量表，韦氏成人智力量表（W AIS—RS）、韦氏儿童智力量表和韦氏幼儿智力量表等。

二、人格测验
目前应用较多的有：艾森克人格问卷，卡特尔16人格因素问卷，以及明尼苏达多项人格调查表等
三、心理评定量表
心理评定量表主要包括有精神病评定量表、躁狂状态评定量表、
抑郁量表、焦虑量表、恐怖量表等。

第六单元心理测验的发展史
我国开始于汉代、兴于隋唐的科举取士制度就是被中外学者公认为世界上最早的心理测验的实践。

科学的心理测验则是工业革命成功后的19世纪的欧洲发展起来的。

一、科学心理测验的产生与发展
首先倡导科学心理测验的学者是英国生物学家和心理学叫高尔顿。

另一个对促进心理测验发展做出巨大贡献的是美国心理学家卡特尔。

比内—西蒙量表在心理测验史上及其重要，是世界上第一个正式的心理测验。

人们常说19世纪80年代时高尔顿的十年，90年代时卡特尔的十年，20世纪头十年则是比内的智力测验的十年。

此后，心里测验主要有以下几个方面的发展：
1，操作测验的发展
2，团体智力测验的发展
3，能力倾向测验的发展
4，人格测验的发展
二、现代心理测验在我国的发展
第二节测验的常模
第一单元常模团体
一、常模团体的性质
常模团体是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。

它用一个标准的、规范的分数表示出来，以提供比较的基础。

对测验编制者而言，常模的选择主要是基于对测验将施测得总体的认识，常模团体必须能够代表该总体。

包括：确定一般总体、确定目标目标、确定样本。

无论是测验编制者还是测验使用者，主要关心的是常模团体的成员。

二、常模团体的条件
（一）群体的构成必须明确界定
（二）常模团体必须是所测群体的代表性样本
（三）样本的大小要适当：总体数目小，只有几十人，则需要百分之百的样本。

如果总体数目达，相应的样本也大，一般最低不小于30或100个。

全国性常模，一般应有2000至3000人。

（四）标准化样组是一定时空的产物
三、取样的方法
取样即目标人群中选择有代表性的样本。

从统计学角度看，取样的方法有随机抽样和非随机抽样两种。

（一）简单随机抽样
（二）系统抽样
（三）分组抽样
（四）分层抽样：在确定常模时，最常用的是分层抽样方法。

分层抽样还可以分为两种方法：分层比例抽样和分层非比例抽样。

四、常模分数与常模
（一）常模分数
常模分数就是施测常模样本被试后，将被试者的原始分数按一定规则转换出来的导出分数。

准确地说，通过将被试者的反应与标准答案相比较而获得的测验分数叫原始分数。

由原始分数构成的分布转换而来的分数，叫导出分数。

（二）常模
常模分数构成的分布，就是通常所说的常模，它是解释心理测验分数的基础。

常模有一般常模与特殊常模之分。

第二单元常模的类型
一、发展常模
（一）发展顺序量表：最直观的发展常模就是发展顺序量表。

最早的一个范例是格塞尔发展程序表。

（二）智力年龄
比内—西蒙量表中首先使用智力年龄的概念。

一个儿童在年龄量表上所得到的分数，就是最能代表他的智力水平的年龄。

这种分数叫做智力年龄，简称智龄，是年龄量表上度量智力的单位。

（三）年级当量：实际上就是年级量表，测验结果说明属于哪一年级的水平，在教育成就测验中最常用。

二、百分位常模
包括百分等级和百分点、四分位数和十位数。

三、标准分常模
标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。

因为它的基本单位是标准差，所以叫标准分数。

最常见的分数有：z分数、Z分数、T分数、标准九分数、
离差智商等。

四、智商及其意义
目前一般都用比率智商和离差智商来表示智力的高低。

第三单元常模分数的表示方法
一、转换表法
最简单而且最基本的表示常模的方法就是转换表法，有时也叫常模表。

简单的转换表就是将单项测验的原始分数转换成一种或几种导出分数。

二、剖面图法
剖面图是将测验分数的转换关系用图形表示出来。

从剖面图上很可以直观地看出被试在各个分测验上的表现及其相对的位置。

第三节测验的信度
第一单元信度的概念
一、信度的定义
信度是指同一个被试者在不同时间内用同一测验（或用另一套相等的测验）重复测验，所得结果的一致程度。

信度只受随机误差的影响。

二、信度的指标
（一）信度系数与信度指数
（二）测量标准误
第二单元信度评估的方法
一、重测信度
又称稳定性系数，它的计算方法是采用重测法，即使用同一测验，在同样条件下对同一组被试者前后施测两次测验，求两次得分间的相关系数。

二、复本信度
又称等值性系数，它是以两个等值但题目不同的测验来测量同一群体，然后求得被试者在两个测验上得分的相关系数，这个相关系数就代表了复本信度的高低。

复本信度反映的是测验在内容上的等值性，故又称等值性系数。

三、内部一致性信度
重测信度和复本信度主要考察了测验跨时间的一致性和跨形式的一致性，而内部一致性信度系数主要反映的是题目之间的关系，表示测验能够测量相同内容或特质的程度。

（一）分半信度：指采用分半估计所得的信度系数。

计算分半信度仍然可以常用的积差相关方法。

（二）同质性信度：同质性主要代表测验内部所有题目间的一致性。

几个计算同质性信度的公式如下：库德—理查逊公式，克伦巴赫ɑ系数.
四、评分者信度
用于测量不同评分者之间所产生的误差。

为了衡量评分者之间信度高低，可随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再根据每份测验卷的两个分数计算相关，即得评分者信度。

一般要求在成对的受过训练的评分者之间平均一致性达到90分以上，才认为评分是客观的。

第三单元信度与测验分数的解释
一、解释真实分数与实得分数分数的相关
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的，也就是测验的总变异中真分数造成的变异占百分之几。

二、确定信度可以接受的水平
一般的能力测验和成就测验的信度系数都在0.90以上，有的可以达到0.95以上，而人格、兴趣、态度、价值观等测验的信度一般在
0.80～0.85或更高些。

三、解释个人分数的意义
从信度可以解释个人分数的意义，就是测验标准误的应用。

它有两个作用：其一是估计真实分数的范围；其二是了解实得分数再测时可能的变化情形。

四、比较不同测验分数的差异
第四单元影响信度的因素
一、样本特征
信度常用信度系数来表示。

（一）样本团体异质性的影响
（二）样本团体平均能力水平的影响
二、测验长度
亦即测验的数量，也是影响信度系数的一个因素。

一般来说，在一个测验中增加同质的题目，可以使信度提高。

第一，测验越长，测验的测题或内容取样就越有代表性。

第二，测验越长，被试的猜测因素影响就越小。

三、测验难度
从理论上说，只有平均难度水平为50﹪时，才能使测验分数分布范围最大，求得的信度也最高。

事实上，难度为0.05只适合简答型题目，对于选择型题目由于存在着猜测因素，难度值应提高。

四、时间间隔
时间间隔只对重测信度和不同时测量的复本信度有影响，对其余的信度来说不存在时间间隔问题。

第四节测验的效度
第一单元效度的概念
一、效度的定义
效度是指所测量的与所要测量的心理特点之间符合的程度，或者简单地说是指一个心理测验的准确性。

效度是科学测量工具最重要的必备条件。

二、效度的性质
（一）效度具有相对性
任何测验的效度是对一定的目标来说的，或者测验只有用于与测验目标一致的目的和场合才会有有效。

（二）效度具有连续性
测验效度通常用相关系数表示，它只有程度上不同，而没有“全有”或“全没有”的区别，因此，评价一个测验时，不应该说“有效”或“无效”，而应该用效度较高或较低来评价。

第二单元效度评估的方法
效度分为三大类：即内容效度、构想效度和效标效度。

一、内容效度
（一）什么是内容效度
内容效度指的是测验题目对有关内容或行为取样的适用性，从而确定测验是否是所欲测量的行为领域的代表性取样。

由于这种测验的效度主要与测验内容有关，所以称内容效度。

想编制有较高内容效度的心理测验，首先要对所测量的心理特性有个明确的概念，并划定出哪些与这种心理特性有关。

，又较密切。

其次，测验题目应是所界定的内容范围的代表性取样。

（二）内容效度的评估方法
1，专家判断法：为了确定一个测验是否有内容效度，最常用的方法就是请有关专家杜测验题目与原定内容的符合性做出判断，看测验的题目是否代表规定的内容。

2，统计分析法：
3，经验推断法
（三）内容效度的特性
内容效度与所有效度的性质一样，不是普遍适用的，而是根据具体情况分析得来的。

内容效度也有时间上的特定性。

在编制测验时，表面效度是一个必须考虑的特性。

二、构想效度
（一）什么是构想效度
构想效度的概念是1954年提出来的，由人也翻译成构思效度，或结构效度。

它主要涉及的是心理学的理论概念问题，是指测验能够测量到理论上的构想或特质的程度，即测验的结果是否能证实或解释某一理论的假设、术语或构想，解释的程度如何。

（二）构想效度的评估方法
1，对测验本身的分析
这类方法是通过研究测验内部结构来界定理论构想，从而为构思效度提供证据。

测验的内容效度可以作为构思效度的证据。

测验的内部一致性指标可以推断测验是测量单一特质还是测量多种特质，从而为评估测验构思效度提供证据。

有时分析被试者对题目的反应特点也可以作为构思效度的证据。

2，测验间的相互比较
通过分析几个测验间的相互关系，找出其共同之处，进而推断这些测验测量的特质是什么，也可以确定这些测验构思效度如何。

最简单的是计算两种测验之间得分的相关，其中一个测验是有研究效度的，另一个是已有效度证据的成熟的测验，但两者测量的是同一种心理特质。

区分效度是构思效度的又一个证据。

因素分析法也是建立构思效度的常用方法。

3，效标效度的研究证据
一个测验若效标效度理想，那么该测验所预测的效标的性质和种类就可以作为分析测验构思效度的指标。

另一种证实构思效度的方法是心理特质的发展变化。

4，实验法和观察法证实
观察实验前和实验后分数的差异也是验证构思效度的方法。

三、效标效度
（一）什么是效标效度
又称实证效度，反映的是测验预测个体在某种情境下行为表现的有效性程度。

被预测的行为是检验效度的标准，简称效标。

由于这种效度是看测验对效标预测得如何，所以叫效标效度。

这种效度需在实践中检验，所以又称实证效度。

（二）效标效度
1，相关法：相关法是评估效标效度最常用的方法，它是求测验分数与效标资料间的相关，这一相关系数称为效度系数。

2，区分法：区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。

3，命中率法：命中率法是当测验用来做取舍的依据时，用其正确决定的比例作为效度指标的一种方法。

第三单元效度的功能
一、预测误差
二、预测效度分数
三、预测效率指数
第四单元影响效度的因素
一、测验本身的因素
测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式等都会影响效度。

二、测验实施中的干扰因素
（一）主试的影响因素
（二）被试的影响因素
三、样本团体的性质
（一）样本团体的异质性：一是只以选拔上的被试为样本团体参加效度研究，降低了测验的效度。

二是选拔的标准太高，样本团体的同质性增加，降低了测验的效度。

（二）干涉变量
四、效标的性质
第五节项目分析
测验的项目分析包括定性分析和定量分析两个方面。

定性分析包括考虑内容效度，题目编写的恰当性和有效性等；定量分析主要是指对题目难度和区分度等进行分析。

第一单元项目的难度
一、定义
难度，是指项目的难易程度。

难度的指标通常以通过率表示，即以答对或通过该题的人数百分比来表示。

二、计算方法
（一）二分法记分的项目
心理测验的项目大多为选择题，通过记1分，错误记0分。

（二）非二分法记分的项目
三、难度水平的确定
（一）项目的难度
进行难度分析的主要目的是为了筛选项目，项目的难度多高合适，取决于测验的目的、性质以及项目的形式。

当测验用于选拔或诊断的时候，应该较多的选择难度值接近录取率的项目。

（二）测验的难度
测验的难度直接依赖于组成测验的项目的难度。

通过考察测验分数的分布，可以对测验的难度做出直观检验。

第二单元项目的区分度
一、定义
项目区分度，也叫鉴别力，是指测验项目对被试的心理特性的区分能力。

项目区分度是评价项目质量和筛选项目的主要指标，也是影响测验效度的重要因素。

区分度取值范围介于—1或+1之间，假如项目得分与实际能力水
平之间呈负相关，则区分度为负值，若呈正相关，则区分度为正值，相关系数越大，区分度越高。

二、计算方法
在具体估计项目区分度时，我们常常用其他指标替代实际能力水平，其中用得最多的是测验总分。

（一）鉴别指数
（二）相关法
第六节测验编制的一般程序
第一单元测验的目标分析
一、测验的对象
在编制测验前首先要明确测量对象，也就是该测验编成后要用于哪些团体。

受测者的年龄、受教育程度和社会经济以及阅读水平、文化背景等都要明确。

二、测验的用途
一般说来，测验的用途可分为两类：显示和预测。

（一）显示性测验
指的是测验题目和所要测量的心理特征相似的测验。

分为样本测验和标记测验。

（二）预测性测验
是指预测一些没被测量的行为的测验。

三、测验的目标
是指编制的测验是测什么的，即用来测量什么样的心理变量或行为特征。

目标分析以测验不痛而异，一般可以分为三种情况：
（一）工作分析：对于选拔和预测功用的预测性测验，它的主要任务是要对所预测的行为活动作具体的分析，我们称之为任务分析或工作分析。

这种分析包括两个步骤：第一，确定哪些心理特征和行为可以使要预测的活动达到成功。

第二，建立衡量被试是否成功的标准，这个标准我们称之为效标。

（二）对特定概念下定义
（三）取定测验的具体内容：成就测验就是典型的描述性显示测验。

第二单元测题的编写
一、搜集资料
题目的来源可分为三个方面：（一）已出版的标准测验（二）理论和专家的经验（三）临床观察记录
二、命题的一般原则
（一）内容方面
（二）文字方面
（三）理解方面
（四）社会敏感性方面
三、测题的编制要领
根据对被试的要求不同来分，可以分为两大类：提供型和选择型。

提供型题目要求被试者给出正确的答案，如伦问题、简答题、填充题等；选择题目要求被试在有限的几个答案中选择正确的答案，如选择题、是非题、匹配题等。

（一）选择题：由题干和选项两部分组成。

（二）是非题：又叫正误题，是指一个论点要被试判断是否正确，或是从是非两个答案做出选择，因此可以把是非题看作是两个备选答案的选择题。

（三）简答题
要求被试用一个正确的词或句子来完成或填充一个未完成的句子的空白，或者提供一个正确的答案。

有时将前者称之为填充题，后者称之为简答题。

（四）操作题
是介于一般认知结果的纸笔测验和在未来真实情境的实际活动之间的测验，是让被试实际操作。

第三单元测验的编排和组织
一、合成测验
（一）选择与审定试题。