测验效度

合集下载

简述测验中效度的概念

简述测验中效度的概念测验是一种常见的心理学研究工具，用于测量个体的某些心理特质、能力或行为。

测验的有效性在心理学研究中至关重要，其中效度是测验有效性的一个重要指标。

本文将简述测验中效度的概念及其在测验研究中的重要性。

效度是指测验测量的内容是否与测验的目的相符。

如果测验的内容与目的不符，则测验效度就会降低。

因此，测验的效度是测验是否有效的重要指标。

测验效度一般分为两种：内部效度和外部效度。

内部效度是指测验测量的内容是否与测验的目的相符。

例如，如果一项测验旨在测量个体的智力水平，那么测验的内容应该涵盖智力的多个方面，如数学、语言、空间能力等。

如果测验只涵盖其中的一两个方面，那么测验的效度就会降低。

因此，内部效度是测验的内容是否充分的重要指标。

外部效度是指测验的结果是否与其他已知的测量结果相符。

例如，如果一项测验旨在测量个体的社交能力，那么测验的结果应该与个体的社交行为、情感状态等相关。

如果测验的结果与这些相关因素不符，那么测验的效度就会降低。

因此，外部效度是测验结果是否准确的重要指标。

测验效度的重要性在于，如果测验效度不高，那么测验的结果就不能反映个体的真实特质或能力。

这就会导致测验结果的误解或误导，从而影响到测验的应用价值。

因此，在研究测验时，必须注意测验效度的问题，以保证测验的有效性和可靠性。

测验效度的提高可以通过以下几种方法实现：1. 测验内容的广泛性：测验的内容应该涵盖测量目的的多个方面，以确保测验的内部效度。

2. 样本的多样性：测验的样本应该具有多样性，以确保测验的外部效度。

例如，如果一项测验旨在测量个体的社交能力，那么测验的样本应该包括不同年龄、性别、文化背景等的个体，以确保测验结果的广泛性和可靠性。

3. 测验的标准化：测验应该经过标准化处理，以确保测验的结果具有可比性和可靠性。

4. 测验的改进：如果测验效度不高，那么需要对测验进行改进，以提高测验效度。

总之，测验效度是测验有效性的一个重要指标。

测验的效度的名词解释

测验的效度的名词解释测验是一种常用的评估工具，用于评估个体在特定领域的能力、技能或知识水平。

然而，仅仅进行一场测验并不足以确定其有效性。

在评估中，一个重要的概念是测验的效度（validity），它涉及到测验是否能够准确地衡量我们想要评估的内容。

效度是一个相对复杂的概念，它包含多个维度，旨在提供测验结果的可靠性和准确性。

下面将对一些常见的效度类型进行解释，并探讨它们在测验设计和解释中的重要性。

1. 内容效度（Content validity）内容效度关注的是测验是否涵盖了完整的评估领域。

简而言之，内容效度涉及测验内容是否充分、全面地反映了目标领域的重要特征和要求。

在设计或选择测验时，我们需要确保测验项（如题目、任务）覆盖目标领域的各个方面，并区分不同水平的表现。

例如，一场针对学生数学能力的测验在内容效度方面，需要涵盖不同难度级别的数学题目，包括基础概念、运算技能和问题解决能力等。

如果测验只包含简单的计算问题，那么它的内容效度就会受到质疑，因为它没有涵盖数学能力的全面范围。

2. 结构效度（Construct validity）结构效度关注的是测验项目和测验整体结构与被评估领域的概念结构之间的联系。

简而言之，结构效度涉及测验能否正确地衡量和区分不同的能力或维度。

举个例子，假设我们设计了一场针对大学生英语能力的测验。

如果测验包含了不同维度的英语技能，如词汇、语法、听力和口语等，并通过测验结果得出一个综合的英语能力评分，那么这场测验就具备了良好的结构效度。

3. 预测效度（Predictive validity）预测效度关注的是测验是否能够准确地预测被评估领域的未来表现。

这对于许多评估来说是至关重要的，尤其是在教育和职业背景中。

例如，大学招生考试常用的高中学业水平考试（SAT）被广泛用作预测大学入学成功的指标。

如果考试结果与大学的学业成绩和毕业率之间存在着较强的关联，那么就可以说该考试具备了较高的预测效度。

测验的效度(新教材)课件

综合多种方法进行评估
结构效度的评估需要综合考虑多种方法，包括内容效度、校标关联效度和因子分析等，以获得全面的评估结果。
04
验证效度
验证效度的定义
验证效度
指测验在特定目的下对测量目标的代表性和准确性进行的评估。它反映了测验结果与实际目标之间的关联程度。
定义解释
效度评估旨在确保测验真正测量了所需测量的内容，并且所得结果与实际情境相符合。
性和可靠性。
因子分析
通过因子分析等方法，对测验的结构进行统计检验，判断测验是
否符合预期的结构模型。
结构效度的注意事项
明确测量目标和概念定义
在评估结构效度之前，需要清晰地定义测量目标和所测量的概念，以确保测验内容与测量目标的一致性。
考虑测验的适用性
评估结构效度时，需要考虑测验的适用范围和适用人群，以确定测验是否适用于特定的测量目的。
测验的效度(新教材)课件
contents
目录
• 测验效度的基本概念 • 内容效度 • 结构效度 • 验证效度 • 应用与实例
01
测验效度的基本概念
定义与意义
定义
测验效度指的是测验在多大程度上准确地测量了所要测量的特性与功能。
意义
测验效度是衡量测验质量的重要指标，对于评估个体的能力、选拔人才、诊断问题等具有重要意义。
的一致性。
在编制测验时，应尽量选择具有代表性的题目，并确保题目难度适中，以提高测验的内容效度。
在评估内容效度时，应综合考虑专家的意见和统计分析的结果，以确保评估的准确性和可靠性。
03
结构效度
结构效度的定义
结构效度是指测验在多大程度上能够测量出所要测量的理论结构和特质的程度。它关注的是测验内容与测量目标之间的对应关系。

心理测量学第四节测验的效度

衡量测验效度的外在标准。它是独立于测验并可以从实践中直接获得我们所感兴趣的行为。做预测所依据的标准。检验效度的参照标准。测验所要测的或要预测的行为特质。
思考？
能够考上大学的学生是否是能力强、素质好、有发展前途的人？
我们可以通过他们的哪些方面来衡量？
可见，一个测验的效标是不唯一的。具有多样性、复杂性、特殊性和时间性。
最高作为测验表面效度可高些其他测验则希望表面效度低些
3、评估方法
1）专家判断法（逻辑分析法）
含义
专家按测题和假设内容范围作出的符合度判断。
作法与程序
确定总体范围；编制双向细目表；选择测验项目；制定评定量表。
局限
不同专家对内容范围会有不同的理解。不同专家对同一测验内容效度的判断可能不
提出理论提出假设检验假设
解释被试的测验表现
测验成绩的假设
逻辑和实证检验方法
3、估计方法
测验内方法测验间方法效标效度实验法或观察法的证实
3、估计方法
1）对测验本身的分析——测验内方法
研究测验内部构造分析测验的结构效度。具体方法
内容效度法内部一致性法分析解题的心理过程
取样：芝加哥校区
被试：145名7～8年级学生内容：实施24个心理测验结果：
4个基本因素图--词测验和数--图测验的功能不明显。
24个心理测验的因素归类
词语
速度
推理
记忆
1.一般知识 5.加法 11.视知觉 15.数字游戏 19.词汇识别
段落理解 6.编码 2.句子填空 7.计数 3.词汇分类 8.点子 4.词义解释 9.直-曲
（二）效度的性质
效度是一个相对的概念。效度具有连续性。效度是针对测验结果的。

效度和信度如何区分

信度与效度的区分1.效度：指的是一个测验能否真实准确地反应所要测量事物的程度，简单来说，可以理解为某测验测量准确与否的问题，因此也是衡量一个测验优劣的最重要的指标。

效度的内涵及其地位考试中也常以内涵型或地位型单选题、判断题形式考察，需要大家能够理解识记。

2.信度：同一测验多次测量，测量结果的一致性、稳定性与可靠性程度，这一概念内涵尤其是其中的可靠性，考试中常被归为效度以判断形式考察，需要重点掌握。

同时，考试中经常考察测验长度(即测验题量的多少)对测验信度的影响，因此二者关系也需要大家掌握。

一般来说，增加同类题目的测验长度，增加题目的代表性，是提高信度的一个有效办法，当然也要避免过犹不及的现象，测验题目过长反而会干扰测验信度。

效度vs信度关于效度和信度的关系，也是常考的一个难点：信度高的，效度不一定高;效度高，信度一定高。

下面将通过一个生活中的例子帮助考生理解。

小明用一个坏了的体重计测体重，多次测量得到的结果都是20公斤，而小明的实际体重应该是60公斤。

测量得到的结果一致性很高，说明这个测验的信度高。

但这个体重计却并没有准确地测出小明的真实体重，说明这个测验的效度低。

总结一下就是，当一个测验信度高的时候，效度不一定高。

如果小明用一个正常的体重计，多次测量得到的结果都是60公斤，也就是小明真实的体重。

这次测验准确测出了小明的体重，且结果保持一致，也就是说效度高、信度也高。

在一定时间内，真实结果一般是保持相对稳定的，因而只要能测出真实结果，多次施测结果就会保持较高的一致性，即效度高、信度一定高。

理解了信度和效度的内涵，大家就可以去推断二者的关系，主要包括以下几种：1.高效度一定高信度——测量准确即可八正测量结果的稳定和可靠2.高信度不一定高效度——测量结果稳定并不能保证结果的准确，如拿高三数学卷子测试小学三年级孩子的数学水平，测试多次结果均为0.信度高，但并不能说小学三年级孩子没有数学能力。

3.低效度不一定低信度——道理与高信度不一定高效度一致。

3.测验的效度

SV2
ST2
SX2 SI2
SE2
效度受信度的制约
第一单元效度的概念
效度的性质：
效度是针对测验结果的效度具有相对性
评鉴测验的效度时，必须考虑其目的与功能。
效度具有连续性
效度
效度的概念效度评估的方法效度的功能影响效度的因素
第二单元效度评估的方法
内容效度（逻辑效度）
（A）稳定性（B）准确性（C）可信度（D）区分性
在测量理论中，效度被定义为在一组测量中，与目标有关的真实方差与（）方差的比率。（A）误差（B）系统误差（C）随机误差（D）总
（）指的是测验题目对有关内容或行为取样的适用性，从而确定测验是否是所预测量的行为领域的代表性取样。
编制测验时，效度是重要的要考虑的特性。如果是编制最高行为测验，除了内容效度，也要求有（）。
（A）较高的表面效度（B）较好的专家判断（C）较好的外行判断（D）主观性
计算两种测验之间得分的相关，其中一种测验是待研究效度的，另一种是已有效度证据的成熟测验，但两者测量的是同一特质，假如相关高，说明新测验所测量的特质确实是老测验所反映的特质或行为。这种方法叫（）。（A）区分效度（B）逻辑效度（C）相容效度（D）构想效度
可以作为构想效度证据的有（）。
（A）测验的内容效度（B）测验的内部一致性指标（C）分析几个测验间的相互关系（D）分析被试者对题目的反应特点
可以作为构想效度的测验间比较的有（）。
（A）内容效度（B）相容效度（C）区分效度（D）因素分析法
效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度。它可以分为（）。（A）相容效度（B）区分效度（C）同时效度（D）预测效度

第4章效度

二、内容效度的确定方法
（一）逻辑分析法：专家评定(p175) 根据自己的知识经验对量表的有效性（逻辑性）作出判断，也称逻辑效度。为使内容效度的判断过程更客观，一般采用下列步骤： ①确定测验内容的总体范围； ②编制双向细目表； ③编制评定量表，从测验内容所测的技能、题目对所定义的范围的覆盖率、各种题目数量和分数的比例以及题目形式的适当性等方面，对测验作出总的评价。
因素分析案例
公因子 F1 Z1=代数1 0.896 公因子 F2 0.341 共同度 hi2
Z3=几何 Z4=三角
0.802
0.516 0.841
0.496
0.855 0.444
0.889
0.997 0.904
0.111
0.003 0.096
Z5=解析几何
第四章效度
第一节效度概述
一、什么是效度（一）定义 1、效度（validity）是指一个测验或量表实际能测出其所要测的心理特质的程度。（1）效度是一个相对的概念：每个测量工具都有自己的目的；内隐特质是通过外显行为间接测得的；（2）效度是测量的随机误差和系统误差的综合反映；（3）判断一个测量是否有效要从多方面收集证据。
第七节因素分析
• 1904，斯皮尔曼，《客观决定和测量一般智力》，用因素分析技术研究智力结构。标志着因素分析方法的诞生。 • 运用此方法，心理学家探索出多种智力理论。如：群因素论、三维结构智力模型。（探索性因素分析） • 20世纪60年代后期，统计学家波克等人在研究因素分析模型中参数的假设检验问题时，发展出验证性因素分析。 • 1973年，乔纳斯柯格创立了验证性因素分析，运用因素分析检验假设成为可能。
（二）区分法测验→工作→准则测量（工作成绩）按工作成绩分高低两组，如工作成绩高，测验得分也高；工作成绩低，测验得分也低，说明该测验是有一定效度的 1、差异性检验 2、重叠量的计算见P184

测验的效度

实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性。也就是说，一个测验是否有效，应该以实践的效果作为检验标准。例如，当我们用机械能力倾向测验测查了一大批机械工人之后，若有证据表明测验高分组的实际工作成绩确实优于低分组的实际工作成绩，则可以认为该测验具有较高的实证效度。又如，在军队选拔汽车驾驶兵时，若用测验选出来的兵在学习驾驶技术，以及日后驾驶过程中的表现都大大好于以前未用测验随意指派的汽车兵，则表明该测验也具有较高的实证效度。在这里，被估计的行为是检验测验效度的标准，简称为效标。实证效度也称效标关联效度。根据效标资料搜集的时间差异，实证效度可以分成同时效度和预测效度两种。例如前文所说的机械能力倾向测验，其效标资料是与测验分数同时搜集的，所以它是同时效度。前文中所说的汽车兵选拔测验，其效标资料是在测验之后根据实际工作成绩来确定的，所以它叫预测效度。无论是同时效度还是预测效度，其目的都是想在一个有代表性的样本上，用实证的方法来证明测验有效，于是在今后就可以用简便的测验去预测类似于样本的其他团体或个体的行为。因此，有人把这两种效度都称作预测效度。
的评估在很大程度上取决于人们对测量目的的解释。目前，比较常见的解释角度主要有三种：一是用测量的内容来说明目的;二是用心理学上的某种理论结构来说明目的;三是用工作实效来说明目的。这就是传统上广为使用的内容效度、结构效度和实证效度的概念。
内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。这里，所要测量的内容或行为领域是依据测量目的而定的，它通常包括欲测的知识范围和该范围内各知识点所要求掌握的程度两个方面。首先，在判断一个高中物理试卷是否有较高的内容效度时，我们必须首先分析考题是否有效地覆盖了中学物理所包括的力学、电学、光学、热学和原子物理五个方面。内容效度高的物理测验应当是由这五个方面最有代表性的试题样本组成的。

第四章效度

第四章效度信度解决的是测验分数是否可靠的问题，但即使一个测验分数有跨时间的稳定性和跨情境的一致性，却不能保证测验分数代表了被试的真实水平。

比如说，某测验的目的是测量能力，但测题却都是一些死记硬背的知识，测验分数是不能代表被试真实能力水平的。

这就涉及了测量的客观性和准确性问题，即测验的效度问题。

第一节效度概述一、效度的概念测验的效度（validity）指的是测验的有效性，即测验分数能够代表所要测量的心理特质的程度，或测验结果达到测验目的的程度。

任何测验对所要测量的心理特质的测量都不是绝对客观和准确的。

一些编制得好的智力测验一般是效度较高的，但也免不了受智力之外的因素的影响。

因为测验的题目必然要从人们的生活实践中选材，来自不同生活背景的人对同一个测验题目的熟悉程度是不同的，即使智力相同，测验分数也会不同。

因此人们的知识经验就成了影响测验分数的无关因素之一。

研究表明，文化和种族因素会造成测验的不公平，因为与测验分数有关的并不完全是智力。

人格和成就测验同样存在无关因素影响测验分数的问题。

效度总是针对一定的测验目的而言的。

例如，用编制得好的人格测验测量人的个性，诊断心理障碍是有效的，即有一定效度，但若用来测量智力，测量结果就是无效的。

因为人格与智力无关，故分数的高低不能代表智力的高低。

以上讨论的是心理测量中的效度问题，在物理测量中，效度问题也是同样存在的。

如，用不标准的尺子量物体，用不准确的称去称物体，都会使测量的结果不准确。

可见，效度是由于测量工具（量尺）本身的问题造成的，在多次测量中都会恒定地出现而无法消除，因而称系统误差。

测量的效度问题是测验结果中包含了多大比例的系统误差的问题，系统误差可能是由以下几方面原因造成的：（1）所要测量的特质有多方面的含义，而量表本身未能全部包含这些方面；（2）测验题目中包含了与所测特质无关的题目；（3）记分方面的问题，如选择题的备选答案是不全面的，即没有完全体现被试情况的差异，因此答案就不是足够准确的，而且各题目得分是简单累加而未经加权处理，不同题目的重要性程度就没有得到区分。

第4节测验的效度

中华心理学习网
官方总站：圣才学习网
（二）效度具有连续性 1．测验效度通常用相关系数表示，它只有程度上的不同，而没有“全有”或“全无”的区别。因此，我们评价一个测验时，不应该说“有效”或“无效”，而应该用效度较高或较低来评价。比如我们用尺子来测量人的腰围，从而衡量体重，一定程度上也是可以的。当然准确性会差些，即效度会较低，因为体重重的，一般腰围也粗些，可是有两个明显的干扰变量：身高和胖瘦。 2．效度是针对测验结果的。举个例子来说，当对某一儿童实施一套智力测验时，儿童的父母首先可能会提出“这个测验有效吗？”这样的问题。实际上，他们是在问“这个测验真的测得出智力吗？测验的结果真的代表了孩子的智力水平吗？”可以看出，测验的有效性是针对测验结果而言的，即测验效度是“测验结果”的有效性程度。
中华心理学习网
官方总站：圣才学习网
2．想编制有较高内容效度的心理测验：（1）首先要对所测量的心理特性有个明确的概念，并划定出哪些行为与这种心理特性有关，又较密切。这就需要通过查阅大量资料，观察及询问来发现究竟哪些行为是受这种心理特性所制约。例如要测定人的“忧虑性”，就要对忧虑性概念有个明确的内容范围，然后从临床观察、病人自述、医生笔记以及文献报道中了解到具有忧虑性的人具有哪些行为特点，并通过自己的观察及调查加以验证，从而明确编制测量人的“忧虑性”的测验。（2）其次，测验题目应是所界定的内容范围的代表性取样。有人在编制测验时不注意取样策略，哪方面内容编起来容易，哪方面题目就占较大比例，这样会影响测验的内容效度。为了防止此种情况的发生，必须对内容范围进行系统分析，将该范围区分细目，并且对每个细目作适当加权，然后再根据权数从每个细目中作随机取样，直到得到所需要的题目数。 3．需要说明的是，要求内容效度的测验，并不一定要求测验为同质的。例如智力测验通常包括了各种能力与技能，高度同质性的规定将不实际且不需要。在细目之内的高度同质性也许需要，但要求测验总体为同质就不必要了。然而，假使测验是用来测量某一心理特质时，则高度的同质性是需要的。

测验的效度

• 6、一般来说，最佳行为测验（最高作为测验）往往表面效度要求较（） • A、高 • B、低 • C、中等 • D、无法确定
• 7、双向细目表有助于内容效度分析，布鲁姆的学习水平分类是双向细目表的重要组成部分，共分（）个层次 A、4个 B、5个 C、6个 D、7个
• • • • •
8、内容效度有时有称为（） A、逻辑效度 B、结构效度 C、实证效度 D、效标效度
第二单元效度评估的方法
一、内容效度
（一）什么是内容效度
内容效度指的是测验题目对有关内容或行为范围取样的适当性。比如，教师为了解学生在某一学科知识掌握的情况，要进行一个全面的考试。考试不可能包含所有学科内容。于是，就从学科知识范围可能的题目中取样来编成测验，根据测验分数推论学生学科知识掌握的情况。如果测验题目的取样代表性好，则推论将有效；如果题目取样有偏差，则推论将无效。由于这种测验的效度主要同测验的内容有关，所以叫内容效度。
• 3、好的效标应具备的条件包括( )。 • (A)效标测量本身必须有效 • (B)效标必须具有较高的信度 • (C)效标可以客观地加以测量 • (D)效标测量的方法（有关。 • (A) 测验人数（B）测验时间 • (C) 测验长度（D）测验题目
）
• 5、效度的用途主要包括( )。 • (A)预测误差（B）预测效标分数 • (C)预测效率指数（D）预测可信程度
先将测验施测于某个团体，该团体对测验所包含的内容仅具有最少量的知识因而得分很低。让这个团体参与有关材料的教学和培训，结束后再进行测验。如果成绩提高，说明测验测量的是课堂上所教的内容，推论测验对于教学具有较高的内容效度。

（二）确定内容效度的方法 1、专家判断法 2、复本分析法 3、再测分析法 4、经验法

第五章-测量效度

第五章测量效度第一节效度概述一、什么是效度（一）效度的概念效度是指一个测验或量表实际能测出其所要测的心理特质的程度。

例如，一个小学生数学测验的成绩若同时受到其数学和语文能力的影响（如，有的人看不懂题意等）则认为实际测到其所要测的特质（数学能力）的程度不高，因而它是个效度不高的数学测验。

（二）对效度概念的理解1、效度是一个相对概念。

这种相对性表现在两个方面：（1）效度是相对于一定的测量目的而言的。

因为效度是指实测结果与所要测查的特质之间的吻合一致性程度，因此，一个测验或量表是否有效主要是看它是否达到了测量目的。

测量某一特质有效的量表，若用它来测量另一种特质，则必然会无效或效度极低。

例如，测量身高很有效的钢尺若用它来测量体重则必定无效。

又如，人的测量智力很有效的量表若是用来测量性格则必定是效度不高的。

（2）心理特质是较隐蔽的特性，只能通过他的行为表现来进行推测，因此，心理测量不可能达到百分之百的准确，而只能达到某种程度上的准确。

不过，由于任何一个量表的编制都有其目的，所以在正常情况下，一个量表的效度也不会为零。

例如，一个数学测验，无论其文字表达如何艰深，它总能测到一定的数学能力，即总会有一定的效度，而不会效度为零。

（3）判断一个测量是否有效要从多方面收集证据。

表面上看来，测量的效度就是实际测量的结果与我们所要测量的心理特性的吻合一致性程度，获取效度的办法也就是拿实测结果与心理特性来比较。

然而，心理特性是我们要测的东西，是未知的，通常也是比较抽象和隐蔽的。

因此，不能把它直接拿来与结果比较，而必须先从多种角度把这种特性描述清楚。

由于描述心理特性的角度可以是理论上的，也可以是实践上的，途径很多，因此，获取测量效度的途径也是多样的。

例如，智力测验是否测得了人的智力，我们就可以从理论上做逻辑分析，也可以从他在工作、学习中的实际表现等许多方面加以证实。

（4）效度和信度一样，也是指一列测量的特性，也是一个构想概念。

测量效度

答案
➢ 用点二列相关公式
rpbi =
X p -Xq St
pq
rpbi=0.60
，St=3.324，
效标关联效度的估计方法
命中率（正命中率、负命中率和总命中率） ➢ 正命中率指测验选出来的人中真正被选对的人数
比率。
➢ 负命中率指测验淘汰的人中真正该被淘汰的人数
比率。
➢ 总命中率指测验选对的人数和淘汰对的人数之和
内容效度的确定方法——再测法
➢ 在被试接受某种知识的学习之前进行一次测验，
在学习该知识之后再做同样的测验。
➢ 如果后测成绩显著优于前测成绩，说明该测验对
这部分内容而言具有较高的内容效度。
效度的评估
重点难点
内容效度
含义、应用范围、与表面效度相区分、确定方法
效标关联效度
含义、观念效标、效标测量、种类、作用、确定步骤、估计方法
内容提要
1 效度的含义 2 效度与信度的关系 3 效度的评估 4 影响效度的因素 5 提高效度的方法
效度的含义
➢ 效度是指一个测验或量表实际能测出其所要测的
心理特质的程度。
➢ 在测量理论中，效度被定义为：在一列测量中，
与测量目的有关的真实变异数与总变异数的比率。即rxy2=SV2/SX2，rxy2为效度，rxy为效度系数。
掌握某种技能或学习某门课程所达到的程度。
➢ 也适用于某些用于选拔和分类的职业测验，测验
内容是实际工作需要的知识和技能。
➢ 不适合用于能力倾向测验和人格测验。
内容效度与表面效度相区分
➢ 表面效度是外行人对某个测验从表面上看好像是
测某种心理特质的一种现象。
➢ 当外行人认为某个测验能有效地测得某种心理特

心理测量学第五章测验效度

（四）系统比较

评价内容效度最常用的方法是由有关专家对测验题目与测验所涉及的内容总体的符合性进行判断，即定性的方法，而不是定量的方法。将测验所涉及的内容总体进行细分，由专家们对各个部分进行系统比较，可以大大地提高这种定性判断的准确性。
第三节
效标关联效度
一、效标和效标关联效度二、效标关联效度的计算三、影响效标关联效度的因素
例1 为了考察高等教育自学考试数学试卷的效度，有关单位在自学高考的高等数学考试之后，请30名考生参加了某重点大学的高等数学结业考试。这些考生在两次考试上的成绩如下表。计算自学高考数学试卷成绩与普通大学数学考试成绩之间的相关系数：见附件1
例2 某工厂考虑采用一项考试作为招收工人的依据。为了检验这项考试的效度，对20名新工人施测考试之后，让他们工作了一年，并根据其工作各方面表现进行综合评定。这20 名工人的考试成绩和工作评定成绩如表。见附件2
正确录取人数 A Ppc 录取总人数 A B
５．预测误差效度系数反映了预测的的误差范围，预测误差的大小称为估计的标准误，即
2 SE S Y 1 rXY
标准误差是误差分数（ E Yˆ Y ）的分布的标准差，真正的效标分数Y有95%的可能在估 ˆ 计的效标 Y 增减1.96个标准误的范围之内，即
ˆ ˆ Y 1.96SE Y Y 1.96SE
2 YX 2 Y

rXY
S
2 YX
S
2 Y
=效度系数 =由测验所决定的效标分数方差 =效标分数方差
对于例1，我们可以认为，由于
r
2 XY
=
（0.882）2=0.78，所以，数学成绩的方差的78%可以用测验分数来解释。

测验效度名词解释

测验效度名词解释
嘿，咱今天来聊聊测验效度呀！测验效度，这可不是个简单的玩意
儿呢！就好比你有一把尺子，你得保证这尺子能准确地量出东西的长度，对吧？测验效度就像是这尺子的准确性！比如说，有个考试说是
要测大家的数学能力，结果呢，题目出得乱七八糟，和数学没啥大关系，那这考试的测验效度不就低得可怜啦！这就好比你拿着个坏了的
尺子去量东西，能准吗？
咱再举个例子哈，假如有个心理测试说是能测你性格有多开朗，结
果里面一堆问题都是问你喜不喜欢吃甜食，这不是瞎扯嘛！这测验效
度简直低到谷底了呀！测验效度高，就说明这个测验真的能测到它该
测的东西，就像一个精准的导航，能带你准确地到达目的地！
那测验效度都有哪些种类呢？有内容效度呀，这就像是一场考试的
题目是不是涵盖了该学科的重要内容，要是重要的都没考到，那这考
试还有啥意义呢？还有效标关联效度，就是看这个测验和其他已经被
认可的标准测验或者实际表现的关联程度。

这不就跟你找朋友一样嘛，你得找个靠谱的，能和你玩到一起的呀！
再来说说结构效度，这就好比搭积木，得看这些积木能不能搭出一
个稳固的结构来。

如果一个测验说要测你的逻辑思维，结果测出来的
东西乱七八糟，那这结构效度肯定不行呀！
测验效度真的超级重要啊！如果一个测验没有好的效度，那不是在浪费大家的时间和精力嘛！那不是瞎折腾嘛！咱可不能让这种事情发生呀！所以呀，在设计和使用测验的时候，一定要把测验效度放在重要的位置上，要像爱护宝贝一样对待它！这就是我对测验效度的理解啦，你们觉得呢？。

测验的效度——精选推荐

第4节测验的效度一、单项选择题1．测量的正确性，即一个测验能够测量出其所要测量的东西的程度叫( )。

A．信度B．效度C．区分度D．难度[答案] B[解析] 效度是指测量的正确性，即一个测验能够测量出其所要测量的东西的程度。

效度考虑的问题是：测验测量什么?测验对测量目标的测量精确性和真实性有多大?因此，答案选B。

*2．在测验理论中，效度被定义为在一组测量中，与测量目标有关的真实方差(或称有效方差)与( )方差的比率。

A．误差B．总C．随机误差D．系统误差[答案] B[解析] 效度的计算公式为，其中代表测量的效度系数，代表有效方差，代表总方差。

*3．假设你要测查一个儿童的智力，你测量了他眼眉以上头的周长，你测量了5次，得到了一个平均值，然后将平均数乘以7得到该儿童的IQ，这种测量IQ的程序( )。

A．不可信，也无效B．不可信，但有效C．可信，但无效D．即可信又有效[答案] C[解析] 测量该儿童眼眉以上头的周长的结果是相对稳定的，即是可信的。

但是用眼眉以上头的周长乘以7得到IQ，则是没有根据的，即是无效的。

4．“如一个学生在数学能力测验中得了高分，他在数学学习中的成绩也好”说明这个测验( )。

A．信度高B．效度高C．难度高D．区分度高[答案] B[解析] 效度指测验是否测到了所要测的心理特质。

如一个学生在数学能力测验中得了高分，他在数学学习中的成绩也好，这个测验的效度就高；反之，效度就低。

5．如果某测验的效度是0.70，则在测验中无法做出正确预测的比例是( )。

A．0.30 B．0.51 C．0.49 D．0.70[答案] B[解析] 在测验中可以做出正确预测的比例是效度的平方。

效度为0.70表示在测验中可以做出正确预测的比例为0.70×0.70=0.49。

则无法做出预测的比例为1-0.49=0.51。

6．下列选项中关于效度的说法错误的是( )。

A．是指所测量的与所要测量的心理特点之间符合的程度B．是在选用标准化测验或自行设计编制测量工具时，首先必须鉴定的C．是指同一被试者在不同时间内，用同一测验重复测量，所得结果的一致性程度D．是指一个心理测验的准确性[答案] C[解析] 效度是指所测量的与所要测量的心理特点之间符合的程度，或者简单地说是指一个心理测验的准确性。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

效标关联效度

定义：效标关联效度(criterion-related validity) 也称为统计效度(statistical validity)或实证效度(empirical validity)。
• 以测验分数和效度标准之间的相关系数，来表示测验效度的高低，所以又称之为统计效度。由于它以实践的效果来作为检验测验是否有效的标准，所以也称为实证效度。实际上是一个测验对于特定情境中的个体行为进行预测时的有效性程度。
构念的两个基本的属性
它们本质上是对某些规律性进行的抽象概括它们与具体的可观察的实体或事件存在相关
构念效度(construct related validity)
指一个测验实际测到所要测量的理论构念和
特质的程度，或者说它是指测验分数能够说明心理学理论的某种构念或特质的程度。测验结果与对某特质理论解释的一致性程度。

99年版本：效度被定义为“关于测验分数的特定解释所得到的支持程度。这种支持来自累积的证据或理论。这种解释是测验应用的基础。” “在本标准中，所有的分数都被视为对构念的测量”。在99年版《标准》中，没有再沿用把效度分为构念、内容和效度标准的3种分类法。

关于Construct

常用的效标：

学业成就(academic achievement) 实际工作表现(job performance) 对照组(contrasted groups) 精神病诊断((psychiatric diagnosis) 特殊训练课程成绩(performance in specialized training) 评定(ratings) 先前己有的测验((previously available tests)
效度的估计

由于真分数方差是无法估计的，因此对测验的效度的检验就难以依靠心理计量学的理论。
• 但由于潜在心理特质之间及与人的外显行为之间有密切的关系，因此我们可以通过逻辑的和实证的方法对效度进行间接的验证。
内容效度

定义：content related validity,又称内容关联效度。

预测效度和同时效度之间的逻辑区分，不是根据时间而是根据测验目标。
• 同时效度多用于诊断现在的状态，检查和测量现有的某种能力或特质的有效性。 • 预测效度则预测将来的结果，表明测验对某种行为的预测的有效性。

“某人具有这种能力吗？” “某人会有这种能力吗？” “某人的心理正常吗？” “某人会出心理问题吗？” “某人有资格当优秀飞行员吗?” “某人具备成为优秀飞行员的必要条件吗？”
心理测验标准》(Standards for Educational and Psychological Testing )。

《标准》是教育与心理测验领域中的一份权威性文献，体现了测验领域中的行业标准，是测验工作者和测验研究人员的一本重要的参考书。

在1999年之前，颁布《标准》的3家机构曾经颁布过5个有关测验开发和使用的文件。
Validity / Validation
• Content validity、Construct validity、 Predictive validity、Concurrent validity

1999年的《标准》改以Validation来说明心理测验的有效性的评估。
• 把Validation译成：效度验证、考验效度、效化
关于construct的解释是：“测验所测量的概念或特性(the concept or the characteristic that a test is designed to measure)。”
• 使用术语‘概念(concept)’可能比使用术语 ‘construct’更好，但是，我们使用后者的原因是为了强调，这些范畴是为了将经验组织进定律性陈述而精心创造的。(Cronbach)

效标关联效度的估计方法

相关系数法区分法或分组检验法思路：被试接受测验后，让他们工作一段时间，再根据工作成绩(效标测量结果)分为两个极端组（成功与不成功，合格与不合格），然后检验这两组被试原来的测验分数是否具有统计学上的差异显著性。
重叠量另一个版本：计算出成功组中低于失败组平均数的人数，再计算出失败组中超过成功组平均数的人数，两数相加除以两组总人数即为重叠量。计算出处于两组分数分布的共同区域的人数百分比
同时效度(concurrent validity)和预测效度(predictive validity)

同时效度：测验分数与效标资料的取得约在同一时间内连续完成，计算这两种资料的相关系数即代表测验的同时效度。指测验与同时获得的效标行为的一致性程度。
• 预测效度：在测验分数取得一段时间后才获得效标资料，计算这两种资料间的相关系数就代表测验的预测效度。指测验结果对效标行为的预测程度。
• 效度的概念
CTT认为，效度(validity)是指一个测验或量表实际能测出其所要测的心理特质的程度。
效度概念的理解
效度是一个相对的概念：(1)效度是相对于一定的测量目的而言的；(2)只能达到某种程度上的准确。 • 效度是测量的随机误差和系统误差的综合反映

• 判断一个测量是否有效要从多方面收集证据

译为“结构” 的人并没有准确理解 construct本身的涵义
• 在英语中，与“概念(concept)”相比， construct更强调建造、创造、人为的意思。
• 所以，认为译为“构念”会更好，既强调了建造、创造的意思，又体现了概念的意思。
效度概述

效度所要回答的问题：(1)测验测量的是什么？ (2)对它所测量的东西测量到什么程度？

在90年代出现两种主要趋向：①加强理论趋向；②心理学理论与通过经验和实验的假设检验之间密切联系。
日益认识到构念（结构construct）在描述和理解人类行为中的重要性。构念是一种广泛的范畴，源自直接可观察的行为变量共同具有的一般特性。构念又是一种理论实体，本身无法直接观察。

99年的《标准》认为，就说明测验测量什么东西而言，构念效度逐渐被认为是基本的、包括一切的效度概念。
心理测量学
第十一讲测验效度
教育与心理测验标准

1999年美国教育研究协会(American
Educational Research Association, AERA)、美国心理学会(American Psychological Association, APA)和美国国家教育测量学会 (National Council on Measurement in Education, NCME) 3家机构共同颁布了新版的《教育与
效度与信度的关系

信度是效度的必要条件(necessary condition) 而非充分条件(sufficient condition) 。效度是测验的首要条件，而信度是效度不可缺少的辅助品。
• 信度系数的平方根是效度系数的最高限
rc=rxy/

rxxryy
• rc表示校正后的效度系数，rxy表示实得的效度系数，rxx为测验的信度，ryy为效标的信度
(1)1954年由APA颁布的《关于心理测验和诊断技术的技术建议》 (2)1955年由国家教育协会颁布、由AERA 和NCME编制的《关于成就测验的技术建议》
(3)1966年由APA出版、由APA, AERA和 NCME共同编制的《教育与心理测验及手册的标准》
(4)3家机构于1974年对第3个文件的修订版
效
成功
标
失败
成功测验分数失败
正确接受（A）错误接受（B）正错误拒绝（C）确拒绝（D）
在实际Biblioteka 算测验的效度时，要统计出四类被试的人数（即表中ABCD四个数字），再计算分类决策的取舍正确性。
总命中率
正命中率
构念效度

构念
如何理解：构念或构想是充满科学想象的产物，抽象而属假设性的概念或特质。为更好地描述人的具有内在一致性的行为和心理现象

测验的效度受它的信度制约。
• 根据效度和信度的定义有：r2XY= ó2co /ó2o 和rXX = ó2T/ó2O •又因为ó2T= ó2co + ó2sp •所以可得到：r2XY=ó2CO/ó2O=(ó2T－ó2SP) /ó2O=rXX－ó2SP/ó2O • 因为ó2SP >0 所以 r2XY <rXX 这就是说，一个测验的效度总是受它的信度所制约的。
•内容效度比
内容效度与表面效度

表面效度(face validity)
• 表面效度会影响被试的测验动机 • 适当的表面效度
内容效度的应用

成就测验教育测量中的标准参照测验职业测验
效标关联效度

效标：即效度标准(validity criterion)，是指独立于测验结果，反映测验目的的行为参照，也称效标行为。理解：用来检验效度的参照标准；用来显示测验所欲测量的特性的变量。例如：智力测验，它的效标可以有哪些呢？飞行员选拔测验的效标有哪些呢？企业的招聘测验的效标。
观念效标与效标的测量
• 选择效标时首先要进行逻辑分析，判断被试的某种行为表现与所要测量的心理特质间是否有对应关系，如果所测特质是该行为表现的决定因素或主要影响因素，则这一行为表现就可作为相应测验的效标。

观念效标是指从概念上确定所要选择的测验效标是什么。
• 观念效标确定后就要将其数量化，即以具体的测量指标表示效标行为水平的高低，这就是效标的测量。效标所具有的特点：有效性可靠性客观性实用性

测验效度

简述测验中效度的概念

测验的效度的名词解释

测验的效度(新教材)课件

心理测量学 第四节 测验的效度

效度和信度如何区分

3.测验的效度

第4章效 度

测验的效度

第四章 效度

第4节 测验的效度

测验的效度

第五章-测量效度

测量效度

心理测量学 第五章 测验效度

测验效度名词解释

测验的效度——精选推荐

心理测量学第四节测验的效度

第4章效度

第四章效度

第4节测验的效度

心理测量学第五章测验效度