《心理与教育测量》名师戴海崎讲义

合集下载

《心理与教育测量》课件-1

1.2 心理与教育测量的性质 1.2.4 心理与教育测量中的测验
测量是在测验中完成的。
选择
简答
心理测验（阿娜斯塔西） “心理测验实质上是对行为样本的客观的和标准化的测量”。
1.2 心理与教育测量的性质 1.2.4 心理与教育测量中的测验
编制一个测验应该具备的条件：选择简答
（一）行为样本（二）标准化（三）难度或应答率（四）信度和效度
A:错 B:不确定 C:对 D:不存在
1.1 一般测量概述 1.1.3 测量的量表
名词解释
选择
（1）称名量表
（2）顺序量表
（3）等距量表
（4）比率量表
1.1 一般测量概述 1.1.3 测量的量表
（1）称名量表表事物或用数字对事物进行分类，其中的数字只是事物属性的符号，并不具备有意义的固定原点、单位的等距性和数字的顺序性，因而该类数字没有数量的意义。
应答率：
编制诸如态度测验、兴趣测验、性格测验不存在难度问题，却有一个对项目的应答率问
题。如果在某些项目上，答“是”或答“否”的被试人数太多或太少，则同样不能有效
地区分不同态度、兴趣或性格的人。
1.2 心理与教育测量的性质 1.2.4 心理与教育测量中的测验
（四）信度和效度
选择
简答
信度指的是一个测验的可靠性，即用同一测验多次测量同一团体，所得结果之间的一致
通俗地说，测量就是依据一定的法则使用量尺对事物的属性进行定量描述的过程。
模拟演练
关于测量，正确的说法是（）
A:测量就是心理测量 B:就是依据一定的法则用数字对事物加以确定 C:就是用数字来描述事物的法则 D:就是用一些题目或数字来描述事物的属性
模拟演练

戴海崎《心理与教育测量》笔记和课后习题详解(测验等值)

第9章测验等值9.1 复习笔记一、测验等值概述（一）测验等值来源于测量实践的需要在心理与教育测量实践中，经常遇到一个测验需要配备多个测验形式的情况，特别是那些测验内容易受记忆或针对性训练影响的测验，在测验之前需严格保密，测验之后不能再用，必须配备多个不同形式供不同次施测所用。

（二）测验等值的实质从本质上来讲，测验等值就是通过对考核同一种心理品质的多个测验形式做出测量分数系统的转换，进而使得这些不同测验形式的测验分数之间具有可比性。

在实际操作中，测验等值可使各个不同形式的测验分数均对应起来，测验主持者可以任意指定其中的一个分数形式作为基准，而使所有其他形式的分数都转化到这个基准形式上。

测验等值中所讲的测量分数系统的转换与测验原始分数与导出分数之间的转换是不同的。

寻找测验等值关系与寻找两测验之间预测关系也是不相同的。

（三）测验等值的条件测量学所提出的测验等值的条件主要有以下几个方面：同质性、等信度、公平性、可递推性、对称性、样本不变性。

（四）测验等值的一些基本概念1．经典理论等值与项目反应理论等值两种等值的区别在于等值时以何种测验理论作指导。

以经典理论为指导的等值称为经典理论等值，以项目反映理论为指导的等值称为项目反映理论等值。

2．测验分数等值与项目参数等值（1）这是根据测验等值的直接操作对象不同而构成的一对概念：①测验分数等值：如果等值的直接操作对象是测验的原始分数，结果是直接找到两测验分数的转换关系，称为测验分数等值。

②项目参数等值：如果等值的直接操作对象是测验项目参数，找到的等值转换关系是两测验项目参数之间的转换关系，则称其为项目参数等值。

项目参数等值可以是终极目的，但更多的是中间目的，在项目参数等值的基础上可以进一步找到测验分数的转换关系。

（2）项目参数等值特别适用于大型题库建设。

利用项目参数等值可以把不同批次采集计算的项目参数，确定在一个统一的度量系统上，所有项目合并成一个大型题库。

从这样的题库中抽题组成的不同试卷进行测试，可获得一致的评价结果，不必再进行等值计算。

戴海崎《心理与教育测量》（第4版）笔记和课后习题考研真题详解

戴海崎《心理与教育测量》（第4版）笔记和课后习题考研真题详解戴海崎《心理与教育测量》（第4版）笔记和课后习题（含考研真题）详解完整版>精研学习网>无偿试用20％资料全国547所院校视频及题库资料考研全套>视频资料>课后答案>往年真题>职称考试第1章心理与教育测量概论1.1复习笔记1.2课后习题详解1.3典型题（含考研真题）详解第2章心理与教育测量简史2.1复习笔记2.2课后习题详解2.3典型题（含考研真题）详解第3章经典测验理论的基本假设3.1复习笔记3.2课后习题详解3.3典型题（含考研真题）详解第4章测量信度4.1复习笔记4.2课后习题详解4.3典型题（含考研真题）详解第5章测量效度5.1复习笔记5.2课后习题详解5.3典型题（含考研真题）详解第6章测验的项目分析6.1复习笔记6.2课后习题详解6.3典型题（含考研真题）详解第7章心理与教育测验的编制与实施7.1复习笔记7.2课后习题详解7.3典型题（含考研真题）详解第8章常模参照测验8.1复习笔记8.2课后习题详解8.3典型题（含考研真题）详解第9章目标参照测验9.1复习笔记9.2课后习题详解9.3典型题（含考研真题）详解第10章测验等值10.1复习笔记10.2课后习题详解10.3典型题（含考研真题）详解第11章学绩测验11.1复习笔记11.2课后习题详解11.3典型题（含考研真题）详解第12章能力测验（上）12.1复习笔记12.2课后习题详解12.3典型题（含考研真题）详解第13章能力测验（下）13.1复习笔记13.2课后习题详解13.3典型题（含考研真题）详解第14章人格测量14.1复习笔记14.2课后习题详解14.3典型题（含考研真题）详解第15章其他心理与教育测验15.1复习笔记15.2课后习题详解15.3典型题（含考研真题）详解第16章测量应用实务16.1复习笔记16.2课后习题详解16.3典型题（含考研真题）详解第17章测量理论与应用的新发展17.1复习笔记17.2课后习题详解17.3典型题（含考研真题）详解。

戴海崎《心理与教育测量》笔记和课后习题详解(目标参照测验)

第10章目标参照测验10.1 复习笔记一、目标参照测验概述（一）目标参照测验的产生从20世纪中期开始，随着常模参照测验模式的局限性（并不是所有的测验都只关心个体间的差异）逐渐被人们发觉，目标参照测验（亦称标准参照测验）应运而生。

1962年戈莱塞（R.Glaser）和克劳斯（D.Klaus）首先提出目标参照测验的概念。

（二）目标参照测验的定义目标参照测验的主要目的在于了解个体在所规定的测量内容上的行为水平，因此其出发点是个体本身的绝对水平，而不再是个体间的水平差异。

戈莱塞认为：“所谓目标参照测验，是根据某一明确界定的内容范围而缜密编制的测验，并且，被试在测验上所得结果，也是根据某一明确界定的行为标准直接进行解释的。

”二、目标参照测验的项目分析（一）内容范围的确定一个测验的内容范围包括所欲测量特质中蕴含的全部行为。

任何一个内容范围都具有一些共同的特点：内容范围具有边界；每一内容范围内容均可分为几类，每一类中又可分为更细更小的类，当每一类的内容及其在此内容范围内的相对重要性确定以后，内容范围就有了明确的结构。

（二）测验项目的内容效度分析目标参照测验的项目分析，首先要对构成测验的每一个题目是否合适以及有效进行分析，即检验题目与测验内容范围所要求的内容与目标的一致性。

这一过程一般缺乏客观的统计分析手段，通常采用专家评定的方法。

专家评定可以采取不同方式，其中比较直观和常用的一种方式是要求有关内容领域的专家填写项目内容评定表，在五级量表上对每个题目所测内容与项目编制者所欲测量的目标内容之间的一致性做出评定，通常情况下，需要同时邀请多位专家进行评定，以考察专家评定之间的一致性。

（三）测验项目的难度和区分度分析1．测验的预测测验编制完成后，须选取一定数量的被试进行预测，由此获得预测数据，然后才能在此数据基础上对项目的难度和区分度进行量化分析。

目标参照测验的预测方法主要有以下三种：（1）前测—后测方法：选取一组被试，在其接受与测验目标内容有关的教学过程前后各施测一次，取得前测和后测的结果，前者表示未掌握者在测验中的水平，后者表示已掌握者的水平。

戴海崎《心理与教育测量》教材讲解及考研真题详解-标准参照测验【圣才出品】

8 / 13
圣才电子书十万种考研考证电子书、题库视频学习平台

界分
●Nedelsky 法
·适用于多选一的项目
·每一位专家判断临界水平被试都能排除的选项
·记录剩下选项数的倒数
·求所有项目的倒数和 A
·求所有 A 的平均，为划界分数
·例：三道四选一项目，项目一排除 1 个，项目二排除 2 个，项目三排除 2 个，A=0.33+0.5+0.5
10 0 1 1 0 1 0 0 1 1 1
P0
1 0 0.6 0.5 0.4 0.8 1 1
4 / 13
圣才电子书

十万种考研考证电子书、题库视频学习平台
第三节信效度分析
3.1 标准参照测验中的信度
Hale Waihona Puke ●标准参照测验中原始分数的分布与常模参照测验不同，常模参照测验中分布较均匀，
·对项目代表性分等级
·评估临界被试在不同等级项目上的通过率
●Ebel 法比 Angoff 法更容易控制测验的结构
9 / 13
圣才电子书十万种考研考证电子书、题库视频学习平台

●将 Ebel 的两个维度变为，完成项目所需要的能力和每个项目的测量目标，称为 Angoff 修正法
4.2.1 专家判断法(2)
●Angoff 法
X cutoff X i Pi
i
Xi
Pi
X i Pi
1
8
0.8
2
10 0.65
3
22 0.7
4
25 0.6
5
35 0.55
6.4 6.5 15.4 15 19.25
X cutoff 62.55
4.2.1 专家判断法(3)

戴海崎《心理与教育测量》笔记和课后习题详解(能力测验(上))

第12章能力测验（上）12.1 复习笔记一、智力测验的一般问题（一）关于智力实质的理论研究1．智力的心理测量学理论（1）智力二因素论英国心理学家斯皮尔曼首先利用因素分析方法，将心理能力测验之间普遍存在的相关归因于一种一般因素或共同因素的作用，他命名这种因素为G因素；后来，斯皮尔曼又提出还存在特殊因素（S因素），并由此构成他的智力二因素论，并始终强调G因素是智力的核心。

（2）智力多因素论美国心理学家瑟斯顿利用多重因素分析方法首先提出：智力的核心不是单一的G因素，而是许多主要的、基本的、彼此相关的智力因素群。

经过多年研究，分析出语文理解、言语流畅性、推理、空间表象、数字、记忆和知觉速度等七种最主要、最基本的心理智力。

吉尔福特提出一个新的智力结构模型，主要包括三个维度：①内容因素，指引起心智活动的各类刺激，包括：视觉（F）、听觉（A）、符号（S）、语义（M）、行为（B）。

②操作因素，指由各种刺激引起的反应方式与心理过程，包括：认知（C）、记忆（M）、发散思维（D）、聚合思维（N）、评价（E）。

③结果因素，指心智活动的产物，亦即对各类刺激的反应结果，包括：单位（U）、类别（C）、关系（R）、系统（S）、转化（T）、涵义（I）。

（3）智力层次理论美国心理学家弗农提出了智力三层次模型，认为G因素处于智力结构最高层，贯穿于其他所有智力因素之中；第二层是言语智力和操作智力两个因素，分别控制着第三层的主要心理智力，如数学、语文、空间知觉等。

2．智力的生物学理论詹森的振荡理论是生物学理论中最有代表性的，该理论假设：每个结点的激活水平是振荡的。

对结点的刺激若超过了其激活阈限，则将沿着结点链传递下去直至最后的反应通道。

因而，对刺激作出反应的时间量，实质上依赖于两个因素：激活传导所必需经过的链的水平数；结点的平均振荡周期。

个体在这两个因素上的差异，导致了个体的反应时差异，并最终反映了个体在智力上的差异。

3．智力的认知心理学理论智力认知成分理论由美国心理学家斯滕伯格提出。

戴海琦心理与教育测量课后习题与答案

戴海琦心理与教育测量课后习题与答案心理与教育测量课后习题及答案戴海琦版第一章心理与教育测量概论练习与思考练习与思考：1.与物理测量相比较，阐明心理测量的特点。

2.为什么人们不能象对物理测量那样容易接受心理测量？（此题为思考题）3.如何才能证明心理测量的必要性和可能性？解答要点：１.（1）从依据的法则来说，心理与教育测量依据的法则在很大程度上只是一种理论。

（2）从测量的内容来说，心理与教育测量的内容是复杂的，内隐的，其测量只能是间接的。

（3）相对与物理测量的定量分析的精确度而言，心理与教育测量定量分析的精确度很低。

３.（1）从心理与教育测量的理论基础来看，心理测量是可能的。

（2）人的心理现象和知识水平如同其他一切物理现象一样是有差异的，这种差异既有质的方面，也有量的方面，因此有必要测定出这些差异的数量。

第二章心理与教育测量的产生与发展>>练习与思考练习与思考1.简述古代中国对心理与教育测量的贡献及其特点。

2.心理与教育测量从卡特尔到比内的发展过程中可以看出什么特点？（此题为思考题）3.推孟和韦克斯勒在智力测验发展过程中各有什么贡献？解答要点：１.在古代中国，在测验实践和测验理论方面都对心理与教育测量作出了贡献并具有自己的特点。

一、在测验实践方面的贡献。

1、在能力测量方面。

早在2500年前，思想家和教育家孔子凭自己的经验观察，首先评定学生能力的个别差异，并将人的智力分成中上之人、中人和中下之人三个等级。

董仲舒已论及到注意测验。

刘邵把人的才能划分为12种类型。

6世纪中叶，中国江南出现了类似现在的婴儿发展测验的"周岁试儿"习俗。

出现于清代的益智图、九连环可以认为是最早的创造力测验。

2、在人格测量方面。

孔子把人分为狂者、狷者和中行3种。

刘邵根据阴阳、五行和形体的关系及其人的行为表现，把人的性格划分成12种类型。

3、在教育测量方面。

世界上最早的教育测量出现于中国西周奴隶时期。

戴海崎《心理与教育测量》(第4版)全套资料【教材+笔记+题库】

戴海崎《心理与教育测量》（第4版）全套资料【教材+笔记+（1）梳理知识脉络，浓缩学科精华。

（2）详解课后习题，巩固重点难点。

（3）精选考研真题，培养解题思路。

第1章心理与教育测量概论1.1 复习笔记一、一般测量概述（一）测量及其种类1．测量的定义测量是指依据一定的法则使用量尺对事物的属性进行定量描述的过程。

这一定义包含四个关键词：（1）“一定的法则”，是指任何测量都要建立在某种科学规则和科学原理基础之上，并通过科学的方法和程序完成测量过程。

（2）“事物的属性”，是指所要测量的客体或事件的特定特征。

（3）“量尺”，是指测量中所使用的度量工具。

（4）“定量描述”，是指测量的结果总是对事物属性的量的确定。

“数量”不仅指描述事物特征的符号，而且指一种有序的量。

数量具有四个特性：区分性、序列性、等距性、可加性。

2．测量的精确度测量的精确度既与测量对象的性质有关，也同测量时所用的工具有关。

（1）测量的精确度决定于测量对象本身的性质。

可根据测量对象的性质把它分为三种类型：确定型、随机型、模糊型。

（2）测量的精确度决定于测量工具（量尺）的精密性。

尽可能使用精密的测量工具，是保证测量精确度的重要条件。

3．测量的分类根据测量对象的性质和特点，测量大致可分为以下四种类型：（1）物理测量：即对事物的物理特征的测量。

（2）生理测量：即对机体生理特征的测量。

（3）社会测量：即对社会现象的测量。

（4）心理测量：即对人的心理特征的测量。

（二）测量的基本要素一个完善的测量数量必须具备两个基本要素，即测量的参照点和测量的单位。

1．测量的参照点（1）参照点的定义测量的参照点是指在测量工作中，测量前测量对象的数量的固定原点。

（2）参照点的分类①绝对参照点，即以绝对的零点作为测量的起点。

②相对参照点，即以人为确定的零点作为测量的起点。

（3）参照点的常见使用情形①最为理想的测量参照点当然是绝对参照点，因为它的意义最为明确。

②在人们难以找到绝对参照点的情况下，就必须改用相对参照点。

戴海崎《心理与教育测量》笔记和课后习题详解(测验的项目分析)

第6章测验的项目分析6.1 复习笔记一、测验的难度（一）难度的定义难度是指测验项目的难易程度。

（二）难度的计算测验的计分方法不同，项目难度的计算方法也有所不同。

1．二分法记分项目的难度（1）通过率如果不考虑被试作答是猜测成功的机遇，二分法记分测验项目的难度通常以通过率来表示，即以答对或通过该项目的人数的百分比来表示：。

式中，P代表项目难度，N为全体被试数，R为答对通过该项目的人数。

以通过率表示项目的难度时，通过人数越多，P值越大，其难度越小；通过人数越少，P值越小，难度越大，题目越难。

（2）极端分组法当被试人数较多时，则可以先将被试依照测验总分从高到低排列，分成三组，总分最高的27%被试称为高分组（），总分最低的27%被试为低分组（），分别计算高分组和低分组的通过率，然后求项目的难度。

式中分别表示高分组和低分组的通过率；表示高分组和低分组通过该项目的人数；分别代表高分组和低分组的人数。

2．非二分法记分项目的难度对于论述题，每个项目不只有答对和答错两种可能结果，而是从满分至零分之间有多种可能结果。

对这类项目，常常用下面的公式来计算其难度。

式中x为被试在某一项目上的平均得分，为该项目的满分。

（三）测验难度水平的确定进行难度分析的主要目的是为了筛选项目，项目的难度水平取决于测验的目的、项目形式以及测验的性质。

（1）如果测验的目的是为了了解被试在某方面知识技能的掌握情况，可以不必过多地考虑难度，只要教育者认为重要的内容就可以选用，甚至那些100%通过或通过率为0的项目都可以采用。

（2）如果测验的目的是用于选拔录用人员，就应该将项目的难度控制在接近录取率左右，即较多地采用那些难度值接近录取率的项目。

（四）难度的等距变换通过率P无法指出难度之间差异的大小，对于作进一步的难度分析带来了困难，必须设法将它转换成等距量表。

（1）当样本容量很大时，测验分数将接近正态分布。

此时，可以根据正态分布曲线表，将试题的难度P作为正态曲线下的面积，转换成具有相等单位的等距量数，即Z分数。

戴海崎《心理与教育测量》笔记和课后习题详解(人格测量)

第14章人格测量14.1 复习笔记一、人格测量的一般问题（一）人格与人格测量1．人格（1）人格在心理学上是指一个人相对稳定的心理特征和行为倾向。

现代西方心理学家对人格本质的理解至少在四个方面是一致的或基本一致的：①绝大多数心理学家都强调或事实上承认人格的整体性；②所有心理学家都承认人格的独特性；③绝大多数心理学家都承认人格对个人行为的调节功能；④所有的心理学家都主张人格的相对稳定性。

（2）本书把人格理解为个人在与环境的相互作用过程中形成的相对稳定的心理特质和行为倾向的整体组织，它决定着个人行为的独特性。

2．人格测量人格测量就是通过一定的方法，对在人的行为中起稳定的调节作用的心理特质和行为倾向进行定量分析，以便进一步预测个人未来的行为。

（1）在心理与教育测量史上，首先提倡用科学方法测量人格的是英国学者高尔顿。

（2）1892年，克雷普林将联想测验用于临床诊断。

（3）1919年，美国武德沃斯发表了第一个自陈人格量表——个人资料调查表，从而打开了人格问卷测量之先河。

（4）1920年，罗夏克墨迹测验问世，投射测验由此诞生。

（5）目前，人格测量技术的主要种类有自陈问卷法、投射法、评定法、情境法、行为观察法、晤谈法等。

（二）人格测量的真实性问题1．人格测量的真实性问题相对于智力测量来说，人格测量的信度和效度更低一些，这就使得人们有理由提出人格测量的真实性问题，影响人格测量的真实性的因素除了编写测验项目的技术外，受测者是否真实地回答测验所提出的各种问题也是一个重要因素。

2．解决对策（1）为了防止受测者回答问题时有意识或无意识的防卫性反应，有的问卷插入了一个说谎量表，假如受测者在该量表上的得分过高，则说明受测者没有真实回答，所以其它方面的分数也就不能作为评价他的人格特征的依据。

（2）防止人格测量不真实的另一个办法是采用投射测验。

投射测验的一个优点是可以让受测者在不知不觉中将他的无意识心理投射到他对测验项目的反应之中。

戴海崎《心理与教育测量》(第4版)笔记和课后习题考研真题详解

戴海崎《心理与教育测量》（第4版）笔记和课后习题（含考研真题）详解完整版>精研学习网>无偿试用20％资料全国547所院校视频及题库资料考研全套>视频资料>课后答案>往年真题>职称考试第1章心理与教育测量概论1.1复习笔记1.2课后习题详解1.3典型题（含考研真题）详解第2章心理与教育测量简史2.1复习笔记2.2课后习题详解2.3典型题（含考研真题）详解第3章经典测验理论的基本假设3.1复习笔记3.2课后习题详解3.3典型题（含考研真题）详解第4章测量信度4.1复习笔记4.2课后习题详解4.3典型题（含考研真题）详解第5章测量效度5.1复习笔记5.2课后习题详解5.3典型题（含考研真题）详解第6章测验的项目分析6.1复习笔记6.2课后习题详解6.3典型题（含考研真题）详解第7章心理与教育测验的编制与实施7.1复习笔记7.2课后习题详解7.3典型题（含考研真题）详解第8章常模参照测验8.1复习笔记8.2课后习题详解8.3典型题（含考研真题）详解第9章目标参照测验9.1复习笔记9.2课后习题详解9.3典型题（含考研真题）详解第10章测验等值10.1复习笔记10.2课后习题详解10.3典型题（含考研真题）详解第11章学绩测验11.1复习笔记11.2课后习题详解11.3典型题（含考研真题）详解第12章能力测验（上）12.1复习笔记12.2课后习题详解12.3典型题（含考研真题）详解第13章能力测验（下）13.1复习笔记13.2课后习题详解13.3典型题（含考研真题）详解第14章人格测量14.1复习笔记14.2课后习题详解14.3典型题（含考研真题）详解第15章其他心理与教育测验15.1复习笔记15.2课后习题详解15.3典型题（含考研真题）详解第16章测量应用实务16.1复习笔记16.2课后习题详解16.3典型题（含考研真题）详解第17章测量理论与应用的新发展17.1复习笔记17.2课后习题详解17.3典型题（含考研真题）详解。

戴海崎《心理与教育测量》笔记和课后习题详解(学绩测验)

第11章学绩测验11.1 复习笔记一、学绩测验概述（一）学绩测验的性质学绩测验是对个体在一个阶段的学习或训练之后知识、技能的发展水平的测定。

其特点主要表现在以下几个方面：（1）学绩测验和一般的心理测验不同，它更希望测量个体通过一次或一个时期的学习训练之后，这种专门的知识和技能的发展水平。

（2）学绩测验与能力测验一样在测量学中属于最佳行为测验。

（3）编制学绩测验对于主试来讲就是要设计出与被试认知特质紧密相关的试题并组拼成试卷，通过施测、评阅将被试的认知发展水平与一个数字系统中的某个确定值相对应，以便区别被试的水平差异。

（4）与典型行为测验不一样，学绩测验担心所编测验达不到诱发被试发挥出最高水平的目的。

（5）学绩测验所测为认知性心理品质。

认知性心理品质的优劣表现在两个方面：认知内容的多寡和认知能力的高低。

（6）学绩测验通常用于对个体经学习、训练之后学习成绩的鉴定和诊断，有时也用来预测被试在今后的学习或工作中的成就，但是它与一般的性向测验又有不同：性向测验所测认知能力较具广泛性，有时还带有情感因素，其根本目的是要为被试能不能参加这种专门学习或训练提供依据。

（二）学绩测验的作用（1）学校使用学绩测验鉴定学生的学业成绩。

（2）学绩测验的结果反馈给学生，学生可以总结学习经验，纠正不足，利于学生进一步学习。

（3）学绩测验结果反馈给教师，教师可以总结教学经验，利于教师进一步改进教学。

（4）学校还使用学绩测验甄别学习困难儿童，诊断学生学习困难的原因，以便及时制定和采取补救措施，帮助学生全面掌握所学知识，全面提高专业能力。

（5）学校还应用学绩测验辅助教学管理。

（6）现代社会的人事管理也应用学绩测验。

（三）学绩测验的分类1．按测验的编制方法分按测验的编制方法可以把学绩测验分为教师自编课堂测验和标准化学绩测验两大类：（1）教师自编课堂测验：由教师根据自身经验编制，所测内容可多可少，时间可短可长，主要施用于自己的学生，紧密结合教材和教学实际，形式灵活多变，可用来考查学生学习情况，也可用来检查教师教学质量，甚至可以用来预测学生未来成就。

戴海崎《心理与教育测量》笔记和课后习题详解(测量效度)

第5章测量效度5.1 复习笔记一、效度概述（一）效度的概念（1）效度是指一个测验或量表实际能测出其所要测的心理特质的程度。

关于效度的概念，要特别注意以下几点：①效度是一个相对的概念。

这种相对性表现在两个方面：效度是相对于一定的测量目的而言的；心理特质是较隐蔽的特性。

②效度是测量的随机误差和系统误差的综合反映。

③判断一个测量是否有效要从多方面收集证据。

（2）一组测验分数的总变异包括三部分：真实的（稳定的）、与测量目的有关的变异；真实的、但出自无关来源的变异；随机误差的变异。

在测量理论中，效度被定义为：在一列测量中，与测量目的有关的真实变异数（由所要测量的变因引起的有效变异）与总变异数（实得变异数）的比率，即：这里单位代表测量的效度系数，代表有效变异数，代表总变异数。

（二）效度与信度的关系信度高是效度高的必要而非充分的条件，测验的效度受它的信度制约。

二、效度的估计（一）内容效度1．内容效度的含义内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。

估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。

2．内容效度的应用范围内容效度主要应用于成就测验，用来测量被试掌握某种技能或学习某门课程所达到的程度。

在这种测验中，题目取样的代表性问题是内容效度的主要考察方面。

内容效度也适合于某些用于选拔和分类的职业测验。

这种测验所要测的内容就是实际工作所需的知识和技能，编制这种测验应首先对实际工作做较细的分析。

内容效度不适合用于能力倾向测验和人格测验。

3．内容效度的确定方法（1）逻辑分析法内容效度的确定方法主要是逻辑分析法，其工作思路是请有关专家对测验题目与原定内容范围的吻合程度做出判断。

其具体步骤是：①明确欲测内容的范围，包括知识范围和能力要求两个方面。

②确定每个题目所测的内容，并与测验编制者所列的双向细目表（考试蓝图）对照，逐题比较自己的分类与制卷者的分类，并做记录。

③制定评定量表，考察题目对所定义的内容范围的覆盖率、判断题目难度与能力要求之间的差异，还要考察各种题目数量和分数的比例以及题目形式对内容的适当性，等等，对整个测验的有效性作出总的评价。

《心理与教育测量》课件-强化课

真题演练
统计回归效应统计回归效应也叫做向平均数回归，是指进行重复测量时，前测中获得极低或极高分数
会在后测时倾向于向平均值偏移，即随着时间的推移，高分成绩下降，低分成绩升高，这种自然倾向被称为“统计回归效应”。
真题演练
试述并评价人格测验的几种方法。
真题演练
试述并评价人格测验的几种方法。人格测验是指通过一定的方法，对在人的行为中起稳定调节作用的心理特质和行为预测
真题演练
举例说明什么是效标关联效度，列举几个效标（准则）关联效度的具体指标。常用的效标指标有：（1）相关系数。计算测验分数与效标测量的相关系数。（2）区分能力。被试接受测验后，让他们工作一段时间，再根据工作成绩的好坏将其分成两组。这时，再来分析这两组被试原先分数的差异。若两组被试测验分数差异显著，则说明测验效度较高。（3）命中率。当用测验做取舍决策时，决策的正命中率和总命中率是测验有效性的较好指标。其中，总命中率是指选出的合格的人当中合格的人数与淘汰的人当中的不合格人数之和在总人数中所占的比例，比例越高效度越高，强调社会公平。
真题演练
简述Z分布、t分布的特点，并说明异同。
真题演练
简述Z分布、t分布的特点，并说明异同。 Z分布也称标准正态分布，是连续随机变量概率分布的一种，标准正态分布的平均数为0。
标准差为1，Z分布通常写作N(0，1）正态分布。正态曲线的形状像一口钟，两头小，中间大呈对称分布，其平均数、中数、众数实际上对应于同一个数值。大部分的原始分数都集中分布在均值附近，极端值相对而言比较少。曲线先向内弯曲后向外弯曲，拐点在正负1个标准差处。两端向靠近横轴处不断延伸，但始终不会与横轴相交。正态曲线下面积为1，由过平均数点的垂线将其划分为左右相等的两部分，左右两部分的面积备为0.5。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《心理与教育测量》戴海崎讲义
第一部分教材精讲[视频讲解]
序《心理与教育测量》导学[视频讲解]心理测量理论部分
心理测验部分
心理与教育测量两大部分
心理测量理论（重点、难点、掌握）
重点掌握书中内容，视频辅助理解记忆
全面掌握和深度理解
研究生统考、复试、面试的重点
心理测验（非重点、了解）
书中和视频的内容结合了解，不需要机械记忆
对整体框架理解，了解具体测验的主要思想
统考中考的内容非常少，不会太具体，注意大题中可能需要了解一些具体测验的应用应用和测量方向的复试和面试中涉及的可能较大
现代测量理论部分
书本第十七章
项目反应理论
概化理论
对应视频中的第15章、第16章（难点、了解），
研究生统考几率较小，但是不排除一些概念和框架类的提问
测量学方向的研究生复试和面试考试基本概念和思想的几率很大应对考试，结合视频理解书中的内容
第一章心理与教育测量概论[视频讲解]
第一节心理测量的基本性质
一、心里测量应用的普遍性
二、心理的可测性
人的心里非物质，人的心理可测吗？
孟子：权，然后知轻重；夺然后知长短。

物皆然，心为甚。

桑代克：凡客观存在的事物都有其数量。

麦考尔：凡有其数量的事物都可以测量。

辩证唯物注意的观点：
人的外显行为客观存在，可以感觉、知觉，进而可以测量。

心理学的研究证明：
可以通过测量人的外显行为而推测人的心理。

三、心理测量的间接性
心理测量是一种间接测量。

间接测量必须找准中介媒质。

物理测量也有间接测量：测气温
中介媒质：水银
心理测量的中介媒质：人的外显行为
外显行为：种类众多而且复杂多变
心理测量的间接测量难度更大。

四、心理测量的定义
广义测量定义：
测量是依据一定的法则使用量具对事物的特征进行定量描述的过程。

心理测量定义：
依据一定的心理学理论，使用测验对人的心理品质进行定量描述的活动。

定义理解
1．心理测量依据的法则：
心理学理论
2．心理测量工具：测验。

测验的本质：一个一个精心设计、精心编排，被称为“题目”的行为刺激组成，“测验”内容千差万别，形式林林总总。

3．测量的对象：人的心理品质。

心理品质具有内隐性，概念具有抽象性
心理测量所测的心理品质实际上是人们的某种理论“构念”
还要在所测对象为何物的界定上下功夫
4．心理测量的结果：
对象的定量描述
作为现代科学的心理测量学，涉及多门学科。

区别本书三词的用法差异：
“心里测量”：多指一项活动，一个过程。

“心理测验”：多指一样工具，一个测量文本，偶尔当动词用。

“心里评估”指获取了测量结果信息后根据某种标准作出状态优劣判断的活动。

五、心理测量的心理影响性
心理影响性：无论主观愿望是什么，只要实施测量，就会给被测量者的心理发展带来影响。

影响可能是积极的，也可能是消极的，可能是短期的，也可能是长期的。

积极的心理影响：
（1）教育测量
准确评价，激励学习。

经历测量也是学习，有助于提高。

（2）人格测验
了解人格，促使人格健康发展，促使行为被人悦纳。

（3）能力倾向测验
了解特长，选择和分配合适工作，人、岗和谐匹配。

消极的心理影响：
误用和滥用，使用质量低劣的测验：
夸大教育考试的作用；
为应试而学习，忽视综合素质发展。

频繁施行教育考试，学生疲于应付，身心受摧残。

不科学解释智力测验：
盲目乐观，迷失方向或自暴自弃，丧失动力。

不合理使用人格测验：
伤害自尊，甚至导致人格分裂。

使用质量低劣测验：
对被试做出错误的描述，引发严重后果。

结论：编制、选择和使用测验都要非常慎重。

六、心理测量的工具及其特性
测验的本质：任何测量工具都是有参照点和测量单位的数字系统。

在心理测量学中也把它称做量表。

量表的两要素：参照点、测量单位
参照点：测量的起点，也称零点。

参照点分类：
绝对零点：绝对理解
相对零点：测值零只能说品质处于“零点”这个状态
有绝对零点的测量比只有相对零点的测量性能更好
优良测量单位：有统一的意义，有恒定的价值。

心理测量量表两要素的特点：
参照点是人为的
测量的单位要经过统计处理才能有统一意义，有恒定价值
七、心理测量误差存在的普遍性与严重性
测量的误差：
测量所得值与欲测品质实际值之间的差异值。

误差的区别：
误差的性质误差的大小
误差的来源误差控制的难度
心理与教育测量误差：
不仅存在而且还非常的严重。

测量研究主要任务：
研究如何控制测量的误差。

（一）测量误差的类型
随机误差：
所得值与实际值之间大小和方向都会随机变化的差异值。

系统误差：
所得值与实际值之间的那种大小和方向都不变的差异值。

特点：
误差与实际测量值共居一体、混淆难分。

任务：
将它们分离出来，评估它们的大小，研究控制办法。

（二）测量误差形成的原因
1．心理品质的特殊性
内隐、抽象，造成对目标认识不清晰，导致误差
不稳定，波动起伏，导致误差。

受测者未掌握正确作答技能，致使作答不能代表真实水平。

受测者故意掩饰。

致使评价出现误差。

2．使用质量不高的测量工具
人的外显行为与人的心理品质只具备相关关系
所测外显行为不是欲测心理品质的代表性行为
测验项目只“刺激”出了欲测心理品质的一部分行为
外显行为不清晰、不稳定
3．施测过程和施测环境安排控制不好
施测过程没有统一要求，
测试指导语没有统一版本，
作答起始时间和长短不统一，
测试时的内外环境令被试不能集中精力，
测试过程失控、纪律混乱，舞弊。

4．主试的不良品质
主试对所测心理品质的理解有误
主试实施的程序有误
评分标准掌握不准确
八、心理测量误差控制的理论与技术概述
目标真分数，记为V，是测量者所追求的测量值。

随机误差分数，记为E
非目标真分数(系统误差分数)：记为I
目标真分数与非目标真分数合在一起称为真分数，记为T。

九、心理测量误差控制的理论与技术概述
心理与教育测量学假设：
T=V+I
进而有：
X=T+E X=V+I+E
在三者都相互独立的假设下，推得以下两公式：
信度：真分数方差在观察分数方差中所占的比，
记为：
效度：目标真分数方差在观察分数方差中所占的比
记为：
心理测量的误差控制的任务：
努力控制测量的随机误差，提高测量的信度。

努力控制测量的随机误差和系统误差，提高测量的效度。

经典测量理论
（Classical Test Theory, CTT）
其他理论：
项目反应理论
（Item Response Theory,，TRT）
概化理论（Jeneralizability Theory，GT）。