效标关联效度
心理测量学 第五章 效度(用)

b YX r XY
sY sX
0
0 . 923
a=57.5-0.923×69.4=-6.56 Yˆ =-6.56+0.923X
如果我们已知一组人的测验得分,我们可以 根据上式得到他们的效标成绩平均值的预测 值: X=76时, Yˆ =-6.56+0.923×76=63.6 X=55时, Yˆ =-6.56+0.923×88=74.7 预测值不是一个确定值,只是一个估计值, 可以被理解为所有获得某一测验分数者的平 均效标分数值。就是说,所有在测验上得76 分的人的效标分数的平均分为63.6,在例1 中,测验中实际得76分的人的效标平均分为 59.5,测验得88分的人的效标平均分为79.5。
三、影响效标关联效度的因素
(一)样本 这种影响来自两个方面:一是样本的含量,二是样 本的代表性。 (二)基础率 基础率是经选择的总体中具有某种与测验目的有关 的特质的人数比例。极高与极低的基础率,运用测 验都是得不偿失的。 (三)录取率 录取率是根据测验选拔出的人数与全体受测者的比 例。录取率越低,选拔的有效性越高。录取率越高, 错误选择的可能性越大。
2. 方差比例。根据效度定义,效度是有效 分数方差在所得分数方差中所占比例。这只 是一种理论概念,在实际的效度系数的计算 中,效度分数的平方可以解释为在效标分数 的方差中可以用测验分数来解释的百分比,
r XY
2
S YX SY
2
2
r XY =效度系数
S YX
2
SY
2
=由测验所决定的效标分数方差 =效标分数方差
例1 为了考察高等教育自学考试数学试卷的 效度,有关单位在自学高考的高等数学考试 之后,请30名考生参加了某重点大学的高等 数学结业考试。这些考生在两次考试上的成 绩如下表。 计算自学高考数学试卷成绩与普通大学数学 考试成绩之间的相关系数:见附件1
信度效度难度区分度分析

信度效度难度区分度分析在教育测量和评估领域,信度、效度、难度和区分度是四个非常重要的概念。
它们对于衡量测试的质量、评估学生的学习成果以及改进教学方法都具有至关重要的意义。
接下来,让我们逐一深入探讨这四个概念。
信度,简单来说,就是指测试结果的稳定性和可靠性。
如果我们对同一批学生在相同的条件下进行多次相同的测试,得到的结果应该是相近的。
就好比用同一把尺子去测量一个物体的长度,每次测量的结果都应该差不多。
信度主要包括重测信度、复本信度和内部一致性信度等。
重测信度是在不同时间对同一批被试进行重复测量。
比如,今天对一群学生进行了一次数学测验,一周后再用相同的测验对他们进行测试,如果两次测试的成绩相近,说明这个测验的重测信度较好。
然而,重测可能会受到记忆、练习等因素的影响。
复本信度则是使用两个平行的测验(即内容、形式、难度等方面都相似)对同一批被试进行测量。
如果两个测验的结果一致性高,就表明复本信度良好。
但要编制两个高质量的平行测验并非易事。
内部一致性信度通常通过计算测验内部各个项目之间的相关程度来衡量。
例如,一份试卷中的各个题目,如果它们在测量同一个知识点或能力方面表现出较高的一致性,那么这份试卷的内部一致性信度就比较高。
常用的计算方法有克朗巴赫α系数等。
效度是指测试能够准确测量出所要测量的东西的程度。
好比射箭要射中靶心,测验也要准确测量到我们期望测量的内容。
效度主要包括内容效度、结构效度和效标关联效度。
内容效度关注的是测验内容是否涵盖了所要考查的知识和技能范围。
比如,一场语文考试如果能够全面考查学生的字词、语法、阅读理解和写作能力,那么它在内容效度方面就表现较好。
为了确保内容效度,出题者需要对教学大纲和课程目标有清晰的理解。
结构效度考察的是测验是否能够反映出所假设的理论结构或心理特质。
比如,一个智力测验是否真正测量了智力的各个方面,而不仅仅是某些表面的表现。
这需要通过复杂的统计分析和理论研究来验证。
效标关联效度则是将测验结果与一个外在的标准进行比较。
第五章 效度

ˆ 这里, Y 为预测的效标分数;
S X 和 SY 分别为效标分数与测验分数的标准差.
X为测验得分。
效标关联效度的关键是选择好效标。一个好的效标必 须具备以下几个条件:(1)可靠性,即效标测验必须具有 较高的信度,如果效标测验不稳定,就不能与本测验有恒 定的关系.相关系数也就不能科学地解释同时或预测效度; (2)有效性,即效标测验本身必须是有效的,如果效标测 验本身缺乏有效性,则无法准确确定本测验的同时效度或 预测效度;〔3)客观性,即效标测验必须尽量客观 标准化.力求排除主观偏见,特别是防止效标污染的影响; (4)实用性.即效标应尽量使其用法简单、省时、花费少、 讲究经济实用。
三、效标关联效度
效标关联效度是指测验分数与作为效标的另一独立测验结果之间 的一致性程度。一般是用本测验与效标测验去测同一组被试得到的 两组分数的相关系数表示。 所谓效标,是检验测验效度的参照标准。效标实际上是本测验 所想测量或要预测的特性或功能,这些特性和功能通常以另一独 立测验的结果来表示。因此,效标是估计效标关联效度的主要根 据,所以效标必须确实能反映某个方面的特性和功能,才能成为估 计测验效度的依据。在运用效标进行测验时.还要避免效标污染。 所谓效标污染,是指由于主试知道某个人(或某个集体)的原来测验 成绩,存有成见,凭印象给分.影响了在效标测验中对某个人(或 某个集体)的成绩评定。
第一节 效度的估算
效度的估算与效度的类型相关,对于测验效度 的类型,不同学者有不同的分类方法。美国心理 学会1974年发行的《教育和心理测验的标准》一 书,正式采用将效度分为内容效度、构想效度和 效标关联效度三大类的方法。目前在教育与心理 测量中,应用最广泛的就是这种效度分类方法。
一、内容效度
内容效度是指测验内容与预定要测的内容之间 的一致性程度。也可以说是指测验内容对所要测 验的全部内容的取样代表性程度。取样代表性是指 测验题目能最大限度地代表预测的内容范围。因 此,一个测验要具有较高的内容效度必须具备两个 条件,其一是测验内容范围明确,其二是取样具有 代表性。
13 效标关联效度

2. 分类(收集效标的时间)
同时效度(concurrent validity):效标资料与测验资料 同时获得;
预测效度(predictive validity):效标资料后于测验资料 获得;
3. 应用
同时效度:诊断现状 预测效度:预测未来结果
某人成功了吗?某人患病了吗? 某人会成功吗?某人会患病吗?
p 66 0.1875 66 286
q 1 p =0.8125
查正态分布表,得出常态曲线下所对应的Y值为0.2685
rb
114 96 14.53
0.1875 0.8125 0.2885
0.65
(3) 四分相关系数
适用条件:当测验分数与效标分数都是连续变量,且 每一个变量的变化都被人为地分为两种类型,即以二 分变量表示。
主要内容
一、效度概述 二、内容效度 三、结构效度 四、效标关联效度 五、影响效度的因素 六、效度的作用 七、效度的概化
学习目标:
掌握效标关联效度定义、种类和应用; 掌握效标与效标测量; 了解效标关联效度的估计方法 ;
一、定义、种类、应用
1. 定义
效标关联效度(criterion-related validity)是指测验对个体 的效标行为表现进行估计的有效性程度。 又称实证效度、经验效度、准则关联效度。
返回
2. 组的分类
根据被试的效标行为表现,将他们分为不同的组别(团 体),如果这些组在测验分数上有显著性差异,则说明 该测验的效度高。
XY X Y n X 2 ( X )2 n Y 2 (Y )2 n
=0.75
(2)二列相关系数
适用条件:测验分数与效标分数都是连续变量,其中一个 变量被人为分为两类
公式:
三种效度之间的关系(信度,效度与难度)

二、难度对测验的影响
1、影响测验分数的分布状态。 、影响测验分数的分布状态。 2、影响测验的鉴别能力。 、影响测验的鉴别能力。
三、影响题目难度的因素
1、考查知识点的多少 、 2、考查能力的复杂程度或层次的高低 、 3、考生对题目的熟悉程度 、 4、命题的技巧 、 5、利用经验判断或者通过预测调整难度 、
第四节
区分度
一、关于区分度
区分度指测验或量表题目区别被试水平能力的量度, 区分度指测验或量表题目区别被试水平能力的量度, 记为D。 记为 。区分度的计算 (1)相关法。区分度的实质是题分与总分的相关。 )相关法。区分度的实质是题分与总分的相关。 计算方法: 计算方法: 点双列相关系数(适应用于0\1计分的题目或二分变 点双列相关系数(适应用于 计分的题目或二分变 量,总分是连续变量) 总分是连续变量) 二列相关系数(适用于两个变量都是正态连续变量, 二列相关系数(适用于两个变量都是正态连续变量, 但其中一个变量被人为分为两类) 但其中一个变量被人为分为两类) 积差相关系数(适应于非二分变量项目) 积差相关系数(适应于非二分变量项目) (2)高低分组法。 )高低分组法。
测验的适宜难度
0≤P≤1,P=0难度最大,P=1难度最小。 , 难度最大, 难度最小。 难度最大 难度最小 在常模参照性测验中, 在常模参照性测验中,大多数题目难度介于 0.3~0.7之间,平均难度为0.5左右 0.3~0.7之间,平均难度为0.5左右。 左右。 之间 在不同的测验中,对难度的要求不同。 在不同的测验中,对难度的要求不同。
三种效度之间的关系
存在差异, 存在差异,各有侧重 内容效度、效标关联效度是结构效度的特例。 内容效度、效标关联效度是结构效度的特例。
(三)提高效度的方法 A、效度系数 、
三类效度及关系

测验 预测个体在某种情境下行为表现 的有效性程度 。通常是 如 何 。而 内容 效 度 对 能 力 倾 向测 验 和 人格 测验 不 是 很 合 适 , 求实际测验分数与效标 间的关系, 属于实征统计关系, 因而又 主要是因为测量的往往是 范围难 以界定的缺乏理想数量指标 称为实征性效度 。如果测验 与外在效标间的相关越 高,表示 的较抽象的特质 ,无法考证测验项 目的代表性并妨碍 了信 息
细 目表 来 检 视 测 验 内容 的 效度 。 生 理 智力 发 展 、 学 习生 活 环 境等 需要 明确 界 定 范 围 , 用 文 字 和
内容效度 的确定方法主要是逻辑分析法 , 其主要步骤是: 语 言 两 种 形式 完 整 、 准 确地 表 述 研 究 变 量 。( 3 ) 对 研 究变 量 做 ( 1 ) 明确欲测内容 的范围, 包括知识范围和能力要求两个方面; 出准确、 严格 的操作定义, 并选 择对应 、 客观 的观测指标 。( 4 ) ( 2 ) 确定每个题 目所测的 内容, 并与双向细 目表对照 以比较 、 避免采用单一方法或单一指标去代表或分析多维的、多层 次 分 类 与记 录 ; ( 3 ) 制定定量表, 考 察 题 目对 所 定义 的 内容 范 围 的、 多侧 面 的 事物 和 活 动 , 尽 可 能 采 用 多种 方 法 、 多种 指 标 , 从 的覆 盖率 、 判断题 目难度与能力要求间的差异 、 题 目量与分数 不同角度分析研 究相 同的理论构思。 比例及题 目形式对 内容的适 当性 ,对整个测验的有效性做 出 4三种 效 度 之 间 的 关 系 总的评价 。此外 , 还有经验推测法及 C r o n b a c h提 出的统计分 析方法。 2效标关联效度
此测验 的效标关联效度越高。效标关联效度主要重视那些与 交流和各测验 的相 比较。有些测验对所测 内容或行为范围
效度

2.内容效度
• 指一套测试题是否测试了应该测试的内容或者 说所测试的内容是否反映了测试的要求,即测 试的代表性和覆盖面的程度。例如,如果某一 套发音技能测试题仅仅考查发音所必须具备的 某些技能,如只考单一音素的发音,而不考查 重读、语调或音素在词语中的发音,那么,该 测试的内容效度就很低。
2.内容效度
4.结构效度
·结构效度——是指实验与理论之间的一致性, 即实验是否真正测量到假设(构造)的理论。 ·重点是了解工具的内在属性,而不是使用工 具测得的分数。它主要回答“该工具到底在测 量什么?”,“使用该工具能否测量出被研究 的抽象概念?”这类问题,反映工具所依据理 论或概念构架的程度。概念越抽象就越难建立 结构效度,同时也越不适宜使用效标关联效度 评价。结构效度的建立最为复杂,目前有关结 构效度的数字计算,应用最多的是因子分析。
表面效度是测试出受试者正常水平的一种保
证因素。
2.内容效度
• 是根据理论基础及实际经验来对工具是否
包括足够项目而且有恰当的内容比例分
配所做出的判断。内容效度需建立在大量
文献查阅、工作经验以及综合分析判断的
基础之上,多由有关专家来评议。
2.内容效度
• 内容效度是指项目对欲测的内容或行为范围取 样的适当程度。例如,教师在讲授了一段时间 课程之后就要进行考试,而试卷不可能包含所 有内容,只能从中选出一个代表性样本来测试, 再根据分数来推论学生在该范围内的知识技能 的掌握情况。如果测试题目是该范围内容的好 样本,推论就有效。
• 一个测验要具备较好的内容效度必须满足两个 条件。
• ①要确定好内容范围,并使测验的全部项目均
在此范围内。所谓内容范围可以是具体知识或
技能,也可以是复杂行为。成就测验的主要目
第七章--效度

教案课题:《第七章效度》课型:新授课课时:3学时教学目标:1.了解效度的意义。
2.掌握效度的类型及各种估算方法。
3.了解提高测验效度的方法教学重难点:教学重点:效度估算的各种类型,提高测验效度的六种方法。
教学难点:效度估算各种类型的计算方法。
教学方法:读书指导法、讲授法、练习法。
教学过程:一、导入:列举效度的意义,激发学生的学习动机。
二、感知:引导学生感知学习内容。
三、讲授:通过具体内容的讲授分析,促进学生进一步理解学习内容。
讲授主要内容如下:一、内容效度(一)内容效度的概念内容效度是指测验内容与预定要测的内容之间的一致性程度。
也可以说是测验题目所涉及的内容对所要测验的全部内容的取样代表性程度。
取样代表性是指测验题目能最大限度地代表欲测的内容范围。
因此,一个测验要具有较高的内容效度必须具备两个条件:其一是测验内容范围明确,即必须明确界定所要测验的内容范围;其二是取样具有代表性,即测验题目对所有测验内容的覆盖面要大。
在理解测验的内容效度时,不要与测验的表面效度相混淆。
表面效度是指从外表直观地看,测验题目与测验目标的一致性程度。
表面效度从严格意义上讲不能算作一种效度的,但在实际测验中却是不能忽视的。
(二)内容效度的估计方法1.逻辑分析法用逻辑分析法估计内容效度,主要是指依据教材内容、课程标准的范围以及教学目标分析测验内容,检查测验内容究竟在体现教材内容和教学目标方面达到多大的程度。
用逻辑分析法估计内容效度实际上是在进行定性分析。
这种方法的缺点主要表现在:没有数量指标来描述教材内容、教学目标与测验试题的一致性程度;内容效度一般采用专家主观性评判,因而很难做到客观、准确,不同判断者的判断标准不同,可能导致批评结果的不一致。
因而,对内容效度的估计必须谨慎,而且对内容效度的估计值也应当一分为二的看待。
2.统计分析法统计分析法主要是采取定量分析手段来描述测验的内容效度,其方法主要有以下几种:(1)克龙巴赫法克龙巴赫曾提出估计内容效度可以用同一教学内容范围的总体中抽取两套独立的测验试题,用这两套测验试题对相同的被试分别进行测验,测验之后求得两次得分的相关系数,如果相关系数大,就可推论内容效度高,若相关系数小,则说明这两套试题中至少有一套测验的内容效度比较低。
心理学考研心理测量知识点效度

心理学考研心理测量知识点:效度1、效度是指:测验能测量到所要测量的对象的程度。
这一定义包含着两层含义:测验测量什么?测验对测量目标的测量精确度和真实性是多少?2、效度的公式为:rxy = SV2/SX2它是与测量目标有关的真实分数方差与总方差的比率。
其中rxy是常用的效度表示法;SV2是“有关的真实方差”,也就是由测验所要测量的心理变量引起的方差,也叫有效方差;SX2是总方差。
3、信度和效度的差别是:两者所涉及的误差不同:信度仅考虑偶然的随机误差占测验总变异的比例,效度则还包括与测验无关的但稳定的测量误差。
(1)信度是效度的必要而非充分条件。
(2)效度是受信度制约的。
4、效度的性质:效度的真实含义是指测验结果的效度,也就是测验结果的准确程度。
(1)效度具有相对性。
(2)效度具有连续性。
测验的有效性只有程度上的差别。
(3)效度也不是直接就可以测量到的,它是从已有的证据推理而来的。
5、效度的种类:内容效度、构思效度和效标关联效度。
6、效标关联效度是指:测验总分数与外在标20、准(效标)之间的相关程度,反映的是用测验预测个体在某种情境下行为的表现如何的有效性程度。
由于外在标准成了考察测验有效性的参照标准,因此简称为效标。
7、阿斯丁把效标分为两个层次:一是理论描述水平的“观念效标”,二是操作定义水平的“效标测量”。
(1)观念效标是效标的理论定义,效标测量是效标的操作定义,效标测量必须能真正反映观念效标。
(2)效标测量的一个重要特征是客观性。
为此因做到:1避免偏见影响效标测量,特别是以等级评定为效标4测量时,评分者的主观偏见会有很大影响。
2防止效标污染,即指个人的效标因评定者知道个体的测验分数(也叫预测源分数)而受到影响。
8、常用的效标:学业成就、临床诊断、实际工作表现、特殊训练成绩、效标团体比较、先前有效的测验、等级评定。
9、同时效度:它的效标资料是和测验分数差不多同时搜集的。
一般情况下,它可以代替预测效度。
效度分析含义及其分类

效度分析涵义及其分类一、效度的涵义:简言之,就是测量结果的有效性。
或某项测量活动能够测量到测量者所希望了解的特性的程度。
效度与测量目的相关,同一种测量工具在某些测量中具有高效度,但在另一些测量中却效度不高。
例如:一把信度很高的尺子在测量身高时具有很好的效度,但在测量血压时效度显然不佳。
因此有人将效度定义为:测验等够达到某种目的的程度(Mehens&Lehmann,1978,p.109)二、效度的类型:由于效度是相对于研究目的和研究侧面而言的,具有多层面的特性,因此效度具有多种类型。
主要有:1.内容效度(content validity)2.效标关联效度(criterion-related validity)3.结构效度(construct validity)(一)内容效度涵义:内容效度是指测量工具的内容是否能够代表所欲测量的行为领域,即量表内容是否具有代表性。
例如:一位教师给学生做一个数学测验,该测验的题目如果涵盖了教学所欲达成的目标,及教材的重要内容,我们说该测验有内容效度。
测量方法:尚没有一种数量的测量方法,它的确定主要是采用逻辑的分析方法,仔细判断每一项目是否符合及涵盖所要测量的研究领域。
(二)效标关联效度涵义:效标关联效度是以经验性的方法,研究测验分数与一些外在效标间的关系,故又可称为经验效度或统计效度(empirical or statistical validity),(Thorndike & Hagen,1977,p.60).根据选择效标的时间不同,可分为:同时效度和预测效度同时效度(concurrent validity):是指测验分数与实施测验同一个时间所取得的效标之间的相关,旨在使用测验分数估计个人在效标方面的目前实际表现。
例如测量学生智力时,将学生当时的成绩作为效标。
预测效度(predictive validity)是指测验分数与实施测验后一段时间所取得效标之间的相关,旨在使用测验分数预测个人在效标方面的未来表现。
13-效标关联效度

2. 组的分类
• 根据被试的效标行为表现,将他们分为不同的组别(团 体),如果这些组在测验分数上有显著性差异,则说明 该测验的效度高。
——
t Xs Xa SEDX
df ns na 2 =
—
XS
、X—a——成功组、失败组的平均分
ns
n
——成功组、失败组样本容量
a
S
2 s
S —2 —成功组、失败组得分的方差 a
其中 y 为正态曲线中值p
对应的高度
rb
Xp St
Xt
p y
• 例题:进行一项智力测验,被试中66名来自实验班, 286名来自普通班,最后测出实验班的被试IQ均数为 114,普通班被试的IQ均数为96,所有被试IQ分的标 准差为14.53,计算二列相关系数。
p 66 0.1875 66 286
主要内容
一、效度概述 二、内容效度 三、结构效度 四、效标关联效度 五、影响效度的因素 六、效度的作用 七、效度的概化
学习目标:
• 掌握效标关联效度定义、种类和应用; • 掌握效标与效标测量; • 了解效标关联效度的估计方法 ;
一、定义、种类、应用
1. 定义
效标关联效度(criterion-related validity)是指测验对个体 的效标行为表现进行估计的有效性程度。 又称实证效度、经验效度、准则关联效度。
临界分数
错误接收 7
到54页 到55页 到56页
1
180 ad
bc
a、b、c、d表示由两个二分变量 所分成的四种类别的实际频数
大学入学考试 研究生入学考试(数学)
(数学)
通过
未通过
优
a=10
效标关联效度名词解释

效标关联效度名词解释
效标关联效度(Effectiveness Plus Linkage效度)是一种评估网络拓扑结构对目标网络达到效果的能力的技术。
它通过对节点和边之间的连接关系进行建模,来度量网络对目标网络的效果。
具体来说,效标关联效度是一种通过计算网络中所有节点与目标节点之间的关联度(包括连接和边),然后对网络进行加权平均得到的结果。
这个加权平均结果可以代表网络中各个节点之间的相互作用程度。
在网络中,节点与节点之间的相互作用程度对于达到目标网络的效果至关重要。
效标关联效度可以帮助评估网络拓扑结构中各个节点之间的相互作用程度,从而帮助确定哪些节点需要被加强,哪些节点需要被削弱,或者是否需要进行其他调整。
此外,效标关联效度还可以用于解决网络中的冲突和瓶颈问题,从而提高网络的性能和效率。
效标关联效度名词解释

效标关联效度名词解释
效标关联效度(Impact Function Connected 效度)是一种评估评估系统对目标变量的影响程度的指标,通常用于解释系统的性能。
效标关联效度是指通过对系统的不同参数进行调整,使得系统的性能指标在不同的调整条件下呈现出一定的规律性。
例如,一个系统可以通过调整其中一个参数来改变其响应时间,而其他参数则对响应时间的影响较小。
在这种情况下,可以使用效标关联效度来评估不同参数之间的关系,从而确定最佳参数组合来改善系统的性能。
效标关联效度通常使用数学模型来实现,其中系统被描述为一系列参数的线性组合,每个参数对于系统的性能都有一个独立的影响。
通过对系统的不同参数进行调整,计算出各个参数对系统性能的总体影响,并与其他性能指标进行比较,从而确定最佳参数组合。
MBTI人格类型量表的效标关联效度分析

・研究原著・文章编号:100022790(2000)1121304203 M BTI人格类型量表的效标关联效度分析苗丹民1,皇甫恩1,罗正学1,刘旭峰1,王广献2,安 超2(1第四军医大学航空航天医学系心理学教研室,陕西西安710033,2西安陆军学院军队政工教研室,陕西西安710108)关键词:M yers2b riggs type indicato r;大学生;效标关联效度中图号:R395.1 文献标识码:A摘 要:目的 探讨中文版M BT I人格测验的效标关联效度,为M BT I人格量表在中国的应用提供理论依据.方法 大学本科生929(男729,女200)名;M BT I2G量表中文修订版;关联效标测验量表包括EPQ,16PF和PH I人格测验.结果 外倾2内倾维度与EPQ和16PF中内向人格因素间有0.7水平的相关;直觉型个体主要表现为高恃强性、幻想性、独立性,而感觉型个体表现出新环境中高成功能力;对人2对事维度与专业成就因子相关最高,在成功领导者评价上有一定意义;认知型个体较孤僻,而判断型个体社会化程度高、新环境中成长能力强.结论 该研究修订的中文版M BT I具有较好的效标关联效度.Referen t va l id ity of Ch i nese version M BT IM IA O D an2M in1,H UA N GFU E n1,L UO Z heng2 X ue1,L IU X u2F eng1,W A N G Guang2X ian2,A N Chao21D ep artm en t of P sycho logy,Facu lty of A ero sp ace A viati on M edicine,Fou rth M ilitary M edical U n iversity,X i’an710033,Ch ina,2D ep artm en t of M ilitary Po litical W o rk,X i’an M ilitary A cadem y, X i’an710108Keywords:M yers2b riggs type indicato r;studen t;referen t validityAbstract:A I M To investigate the referen t validity of Ch inese versi on M BT I.M ETHOD S 929studen ts(m ale 729,fem ale200),aged19~23,partici pated in the study. M BT I Fo rm G w as revised and u sed.T he tests fo r referen t validity con sisted of16PF,EPQ and PH I.RESUL TS T here收稿日期:2000201207; 修回日期:2000203204基金项目:“九五”军队医药卫生科研基金指令性课题(96L05024)作者简介:苗丹民(19562),男(汉族),山东省威海市人.教授,博士生导师.T el.(029)3374814 Em ail.p sych@fmm w as a co rrelati on(abou t0.7).betw een E I and tw o facto rs of EPQ2E and16PE2EXT.N type show ed h igh assertiveness, i m aginativeness and sen se of independence w h ile S type show ed a capacity to succeed in new environm en t.T here w as also a clo se co rrelati on betw een T F and the leadersh i p of 16PF.P type exh ib ited h igh eccen tricity w h ile J type had h igh socializati on and capacity to succeed in new environm en t.CONCL USI ON Ch inese versi on M BT I has a very h igh referen t validity.0 引言M B T I(M yers2b riggs typ e indicato r)是代表Jung心理类型理论的测量工具之一,B riggs自20世纪40年代中创建以来已经走完了50多年的发展历程.它同国际上著名人格量表一样具有广泛的影响和应用前景,特别是在职业指导、人事咨询、管理人员评估及团体动力学分析等方面,已成为泛美航空公司、美海军武器中心、弗吉尼亚电力公司、苹果公司等大型机构管理人员选拔与评估的重要手段[1].根据美国心理类型应用中心主席M cCau lley估计,全世界每年有170万各类人员接受M B T I的测试[2].我们以中国西安地区大学生为研究对象,以16PF,EPQ, PH I等人格测验为效标,分析M B T I的效标关联效度,探讨M B T I测验各维度的实际内涵,为其在中国推广应用提供理论依据.1 对象和方法1.1 对象 西安地区大学生929(男729,女200)名,平均20.7岁,包括医科、工科、文科、外语、指挥等专业.1.2 M BT I中文修订版 在保持原量表完整性基础上,对美国1987年修订的M B T I Fo rm G量表[3]进行翻译和修订.原则是:符合中国人的文化背景和语言习惯;将难以理解的词对转变成句子,提高测验的可理解性.修订后的量表由意思表达完整的83个短句和14对意思清晰的词语组成;回答问题采用2至4个强迫选择条目.量表分4个维度:外倾2内倾(E I),感觉2直觉(SN),对事2对人(T F),判断2认知(JP).1.3 关联效标测验量表及测验程序1.3.1 16PF人格测验 华东师范大学戴忠恒修订,包括16项人格因素:乐群性(A)、聪慧性(B)、稳定性(C)、恃强性(E)、兴奋性(F)、有恒性(G)、敢为性(H)、敏感性(I)、怀疑性(L)、幻想性(M)、世故性(N)、忧虑性(O)、实验性(Q1)、独立性(Q2)、自律性(Q3)、紧张性(Q4).参加M B T I和16PF量表测试的被试为:西安地区6所大学二至四年级本科生329 (男197,女132)名,平均21.4岁.1.3.2 EPQ人格测验 湖南医科大学龚耀先修订,包括4项指标:精神质(P)、内外向(E)、神经质(N)和谎分(L).参加M B T I和EPQ量表测试的被试为:大学二年级本科生320(男252,女68)名,平均19.7岁.1.3.3 PH I心理健康量表 中国科学院心理研究所在MM P I人格测验基础上修订,包括7个临床量表:躯体化(SOM)、抑郁(D EP)、焦虑(AN X)、病态人格(PSD)、疑心(H YP)、脱离现实(U N R)和兴奋状态(HM A).参加M B T I和PH I量表测试的被试为:工科二年级本科生280名,平均20.0岁,全部男性.统计分析:采用Pearson相关统计方法.为研究M B T I与关联效标测验量表各因素间主要相关关系,以下各表中全部取P<0.01相关的相关系数值,将P>0.01的相关系数值省略.2 结果2.1 M BT I-E I维度与3个量表各因素间相关分析 将929名被试M B T I中E I分量表的测验结果分别与EPQ,16PF和PH I3项人格量表各因素测试结果作相关分析,其中将相关系数P<0.01的因素列入T ab1.表1 M BT I2E I与3项人格量表各因子相关分析T ab1 Co rrelati on betw een M BT I2E I and facto rs of3 personality testsT est Facto r E I T est Facto r E I16PF A0.355EPQ E0.710E0.329 N-0.229F0.433PH I AN X-0.380H0.453 H YP-0.246O-0.315 UN R-0.301Q2-0.265Q4-0.239A:outgo ing;E(16PE):assertive;F:excitability;H:venturesom e; O:disturbance;Q2:independent;Q4:tensi on;E(EPQ): extroversi on;N:neuro ticis m;AN X:anxiety;H YP:hypochndria; UN R:unrealistic. T ab1中所示,M B T I测验的E I维度与乐群性(A)、恃强性(E)、兴奋性(F)、敢为性(H)、内外向(E)等因素呈正相关关系;与忧虑性(O)、独立性(Q2)、紧张性(Q4)、神经质(N)、焦虑(AN X)、疑心(H YP)和脱离现实(U N R)等因素呈负相关关系.2.2 M BT I-SN维度与3个量表各因素间相关分析 将M B T I中SN分量表测验结果分别与EPQ, 16PF和PH I人格量表各因素测试结果作相关分析,将相关系数P<0.01的因素列入T ab2.表2 M BT I2SN与3项人格量表各因子相关分析T ab2 Co rrelati on betw een M BT I2SN and facto rs of3 personality testsT est Facto r SN T est Facto r SN16PF E-0.323EPQ E-0.167F-0.196PH I PSD-0.173H-0.237 HM A-0.207M-0.314O0.162E(16PF):assertive;F:excitability;H:venturesom e;M: i m aginative;O:disturbance;E(EPQ):extroversi on;PSD: p sychopath ic deviate;HM A:hypom ania. T ab2中所示,M B T I测验的SN维度仅与忧虑性(O)呈正相关;与恃强性(E)、兴奋性(F)、敢为性(H)、幻想性(M)、内外向(E)、病态人格(PSD)、兴奋状态(HM A)等因素呈负相关.2.3 M BT I-TF维度与3个量表各因素间相关分析 将M B T I中T F分量表测验结果分别与EPQ、16PF和PH I人格量表各因素测试结果作相关分析,将相关系数P<0.01的因素列入T ab3.表3 M BT I2T F与3项人格量表各因子相关分析T ab3 Co rrelati on betw een M BT I2T F and facto rs of3 personality testsT est Facto r T F T est Facto r T F16PF C0.26216PF Q30.244E0.253 Q4-0.238G0.164EPQ N-0.191H0.172PH I AN X-0.219O-0.255 H YP-0.174Q10.165 UN R-0.182Q20.153C:stable;E:assertive;G:conscienti ous;H:venturesom e;O: disturbance;Q1:rasdicalis m;Q2:independent;Q3:h igh selfconcep t;Q4:tensi on;N:neuro ticis m;AN X:anxiety;H YP: hypochondria;UN R:unrealistic. T ab3中所示,M B T I测验的T F维度与稳定性(C)、恃强性(E)、有恒性(G)、敢为性(H)、实验性(Q1)、独立性(Q2)、自律性(Q3)等因素呈正相关;与忧虑性(O)、紧张性(Q4)、神经质(N)、焦虑(AN X)、疑心(H YP)和脱离现实(U N R)等因素呈负相关.2.4 M BT I-JP维度与3个量表各因素间相关分析 将M B T I中JP分量表测验结果分别与EPQ、16PF和PH I人格量表各因素测试结果作相关分析,将相关系数P<0.01的因素列入T ab4.表4 M BT I2JP与3项人格量表各因子相关分析T ab4 Co rrelati on betw een M BT I2JP and facto rs of3 personality testsT est Facto r JP T est Facto r JPEPQ P-0.35416PF G0.247L0.256PH I UN R-0.173P:p sycho ticis m;L:lie;G:conscienti ous;UN R:unrealistic. T ab4中所示,M B T I测验的JP维度仅与社会性(L)和有恒性(G)呈正相关;也仅精神质(P)和脱离现实(U N R)呈负相关.3 讨论M B T I编制的目的,是通过测量4个人格维度的量,以了解4种人格类型的偏好倾向性.Gardner 等[4]通过大量的文献回顾,对M B T I的效度进行了分析,证实M B T I具有较好的效度,并认为该心理类型理论对人格问题的研究提供了一种非常有效的工具. M yers等[3]也对M B T I的效度作了验证,特别是发现成年大学毕业生测验的内部一致性Sp earm an2 B row n相关系数,均达到0.8以上.我们就中文版M B T I的4个维度分别与EPQ、16PF和PH I3个人格量表作效标关联效度分析,其主要发现有:M B T I 测验的外倾2内倾维度(E I)与EPQ和16PF中内外向人格因素间有显著性的相关,相关系数均在0.7左右.可以推论,E I与EPQ的E维度所测量的是同样的人格内涵.同时还表征了高敢为性、高兴奋性、高乐群性和低独立性等特征,这些均为典型外向人格特征.M ac Donald等[5]研究发现,M B T I的内倾性与五大人格测验(N EO)的压抑和自我意识因素有显著性相关.研究还发现,外向程度越高,情绪稳定性越高,焦虑、忧虑、紧张性、疑心、脱离现实等情绪程度越低.高感觉2直觉维度(SN)的个体具有温和、现实、谨慎的人格特征,和低病态人格及低兴奋状态;低感觉2直觉维度的个体则具有恃强、敢为、幻想、果断和中强度A型行为特征,并显示出一定的外向性特征. M iller[6]研究发现,直觉型护士凭直觉做事、技术熟练、精神生活充实、对抽象事物有极大的兴趣、好冒险等.T hom son等[7]研究则发现,SJ(感觉2判断)型个体比N P(直觉认知)型个体表现出更高的内倾和自控.高对事2对人维度(T F)的个体表现出稳重、安详、恃强和自律的人格特征,具备明显的专业成功的人格特点.M o sley[8]在341名银行经理的研究发现, STJ(感觉2对事2判断)型被试所占比率最高;CA PT 数据库中4390名银行经理TJ(对事2判断)型占65%,STJ型占51%.在高级领导层中有一些N T (直觉2对事)型者,普通经理领导层中则S(感觉)、T (对事)和J(判断)型人为主.低对事2对人个体多感情用事、情绪紧张和焦虑.此项发现与M B T I原设计有很好的吻合.高判断2认知(JP)的个体具有善于交往、高社会化程度,做事有强的责任感和有恒性;而低判断2认知的个体有较高的孤僻性特征.C rysk iew icz等[9]认为,PN(认知2直觉)型个体与创造性问题解决有显著性相关,这可能与其孤僻性人格特征有关.本研究的绝大多数发现与Eysenck和Cattell的研究发现有非常好的相似性,也进一步表明本研究采用的中文版M B T I量表有很好的可靠性.参考文献:[1]M oo re T.Personality test are back[M].N ew Yo rk:Fo rtuneM agazine,1987:10-12.[2]M yers I B.Introducti on to type[M].4th ed.Palo A lto,CA:Consulting P sycho logists P ress,1987.[3]M yers I B,M acCaulley M H.M anual:A guide to thedevelopm ent and use of the M yers2B riggs type indicato r[M].Palo A lto,CA:Consulting P sycho logists P ress,1985:31-34.[4]Gardner WL,M artinko M J.T he relati onsh i p betw eenp sycho logical types,m anagerial behavi o r,and m anagerial effeciveness:A n emp irical investigati on[J].J P sy chol Typ e,1990;19:35-43.[5]M ac Donald DA,A nderson PE,T sagarak is C I et al.Co rrelati ons betw een the M yers2B riggs types indicato r and the N EO personality invento ry facets[J].P sy chol R ep,1995;76(2):449-450.[6]M iller V G.Characteristics of intuitive nurses[J].W est J N u rsR es,1995;17(3):305-316.[7]T hom son N F,M artinko M I.T he relati onsh i p betw een M BT Itypes and attributi onal style[J].J P sy chol Typ e,1995;35:22 -30.[8]M o sley DC.T ype p rofiles and m anagerial styles of bankers[J].J P sy chol Typ e,1985;10:41-45.[9]C rysk iew icz N P,T ullar WL.T he relati onsh i p betw eenpersonality type and creativity style among m anagers[J].JP sy chol Typ e,1995;32:30-35.编辑 何扬举。
效标关联效度计算方法

效标关联效度是一种用来评估心理测验、能力测试或其它评估工具有效性的方法,主要通过计算测验分数与某个外部效标(通常是公认的、独立的标准或结果)之间的关系强度来实现。
计算效标关联效度的主要方法包括:
1.相关系数法:
o积差相关系数(Pearson's r):适用于连续变量,当测验分数和效标分数都是连续分布的数据时,可以计算皮尔逊积差相关系数来评估两
者间的线性关系强度。
o斯皮尔曼等级相关(Spearman's rho):当两个变量的等级关系比数值关系更重要时,可以使用非参数的相关分析方法。
o肯德尔和谐系数(Kendall's tau):也是用于非参数等级相关分析的方法之一。
2.回归分析:
o通过建立回归模型,可以分析测验分数对效标分数的预测能力,并计算决定系数(R²)或偏回归系数等指标,以评估预测效度。
3.分组法:
o根据效标分数将被试分成高、低或多组,然后比较各组在测验上的得分是否有显著差异,例如使用t检验或方差分析。
4.命中率分析:
o在预测效度的背景下,特别是对分类变量的预测,可计算各种命中率指标,如真阳性率、假阳性率、真阴性率、假阴性率,以及总的预测
准确性、敏感性和特异性等。
5.区分度分析:
o分析测验分数是否能有效地区分效标所定义的不同群体。
具体操作时,通常收集一组被试的测验分数和相应的效标分数,然后选择合适的方法计算它们之间的关联度。
效标关联效度既可以是同时效度(同时评估测验与效标
的关联),也可以是预测效度(用测验分数预测未来的表现或结果)。
在SPSS等统计软件中,可以方便地进行这些相关分析和回归分析以获得效标关联效度的证据。
2.2效度

第二节效度在物理测量中,使用某种合适的测量工具测量物体所获得的数量资料(即数值与单位)可以对所要测量物体的属性给出明确的意义。
但在教学测量中,用分数描述行为反应的心理属性,它的意义就不那么明确了。
例如,学生的某次数学测验成绩是依赖他们掌握语文或物理的知识和能力所得到的,那么这次数学成绩在很大程度上并不能反映所要测量的逻辑思维、运算和空间想象等方面的心理属性。
因此,需要考察测验到底测量了哪些心理属性,对这些心理属性能够测量到什么程度,这就是测验的有效性。
为了估计测验的有效性,需要建立参照标准。
我们常常把反映某种属性的有效客观标准称作效标。
它可用一份测验卷来体现,用这份测验卷去测试学生称作效标测量,由此得到的分数称作效标分数。
一个测验的有效性,必须着眼于该测验本身所具有的独特的目的、功能和适用范围。
对于某种独特的目的、功能和适用范围是正确、有效的测验,对另一种目的,功能和适用范围可能就是不正确、无效的。
不存在对于任何目的、功能和适用范围都有效的测验。
此外,由于测验是通过行为样本,对特定的某种属性作间接测量,它只能达到某种程度的正确性,一般用两个测验分数之间的相关系数表示,这种相关程度越高,可称该测验的效度越好。
因此,只有程度上的不同而不存在全有或全无的差别,而且测验的有效性是相对的。
一、效度的概念1.效度的定义我们知道,个体的测验分数可以表示成真分数与误差分数之和。
根据真分数理论,可以进一步将真分数表示成与测验目的有关的有效分数V和与测验目的无关的系统误差分数SE之和:T=V+SE。
这样,个体的测验分数可表示成X=V+SE+E。
对于团体的测验分数方差,相应地有以下关系:效度是测验有效性或准确性的指标,在理论上被定义为:有效分数方差与测验所得分数方差之比,即这里,Val表示效度系数。
由效度的理论定义可以知道,效度系数Val的范围是[0,1]。
由于效度分析可以针对各种要求和运用各种程序,而在特定的条件下,使用不同的分析方法可以得到不同的效度。
心理学中的各种信度和效度

心理学中的各种信度和效度一、信度所谓信度,指的是测量结果的稳定性程度,其操作定义是,信度乃是一个测验X与它的任意一个“平行测验X'的相关系数。
无关因素、测验的长度、测验试题的区分度、被试团体的代表性都会影响信度。
(一)重测信度1、定义:利用同一量表,让同一被试群体在不同时间两次施测之后的相关值。
这一信度值表示的是测验结果的稳定性,故也称之为稳定性系数。
2、形式:施测——经过适当时间——再施测3、举例:假设有一份主观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,结果如下表所示,求该测验的重测信度。
4、使用的前提条件(1)所测量的心理特质必须是稳定的。
(2)遗忘和练习的效果基本上互相抵消。
(3)在两次施测的间隔期内,被试在所要测查的心理特质方面没有更多的学习和训练。
5、注意事项(1)有些测验不宜采用重测法估计信度,如测量推理和创造力的测验。
那些不易受重复使用影响的测验才能用再测法估计信度。
如感觉运动测验、人格测验。
(2)两次测验间隔的时间要适当,并注意提高被试的积极性(3)测验手册中报告重测信度时应说明两次施测的间隔,以及在此期间内被试的有关经历(4)时间间隔的把握:适宜时间间隔依照测验目的、性质及被试特点而定,可以是几分钟甚至几年。
例如对于年幼儿童的间隔要小;年长群体的间隔可大。
但智力测验的间隔不能太短,成就测验的间隔不能太长。
一般间隔时间不超过六个月,既不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘。
6、重测信度的评价:(1)优点:能够提供有关测验结果是否随时间而变异的资料,可作为预测受测者将来行为表现的依据。
(2)缺点:易受练习和记忆的影响,前后两次施测间隔的长短必须要适度。
(二)复本信度1、什么是复本:任何测验只是所有可能题目中的一份取样,所以可编制许多平行的等值测验,叫做复本。
复本等值要符合下列条件:(1)各份测验测量的是同一种心理特性。
(2)各份测验具有相同的内容和形式。