第七章 效度
2018考研心理学考研心理测量知识要点:效度
1、效度是指:测验能测量到所要测量的对象的程度。
这⼀定义包含着两层含义:测验测量什么?测验对测量⽬标的测量精确度和真实性是多少? 2、效度的公式为:rxy = SV2/SX2它是与测量⽬标有关的真实分数⽅差与总⽅差的⽐率。
其中rxy是常⽤的效度表⽰法;SV2是“有关的真实⽅差”,也就是由测验所要测量的⼼理变量引起的⽅差,也叫有效⽅差;SX2是总⽅差。
3、信度和效度的差别是:两者所涉及的误差不同:信度仅考虑偶然的随机误差占测验总变异的⽐例,效度则还包括与测验⽆关的但稳定的测量误差。
(1)信度是效度的必要⽽⾮充分条件。
(2)效度是受信度制约的。
4、效度的性质:效度的真实含义是指测验结果的效度,也就是测验结果的准确程度。
(1)效度具有相对性。
(2)效度具有连续性。
测验的有效性只有程度上的差别。
(3)效度也不是直接就可以测量到的,它是从已有的证据推理⽽来的。
5、效度的种类:内容效度、构思效度和效标关联效度。
6、效标关联效度是指:测验总分数与外在标20、准(效标)之间的相关程度,反映的是⽤测验预测个体在某种情境下⾏为的表现如何的有效性程度。
由于外在标准成了考察测验有效性的参照标准,因此简称为效标。
7、阿斯丁把效标分为两个层次:⼀是理论描述⽔平的“观念效标”,⼆是操作定义⽔平的“效标测量”。
(1)观念效标是效标的理论定义,效标测量是效标的操作定义,效标测量必须能真正反映观念效标。
(2)效标测量的⼀个重要特征是客观性。
为此因做到: 1 避免偏见影响效标测量,特别是以等级评定为效标4 测量时,评分者的主观偏见会有很⼤影响。
2 防⽌效标污染,即指个⼈的效标因评定者知道个体的测验分数(也叫预测源分数)⽽受到影响。
8、常⽤的效标:学业成就、临床诊断、实际⼯作表现、特殊训练成绩、效标团体⽐较、先前有效的测验、等级评定。
9、同时效度:它的效标资料是和测验分数差不多同时搜集的。
⼀般情况下,它可以代替预测效度。
护理学研究,知识点讲义,第七章 研究工具性能的测定
第七章研究工具性能的测定学习目标掌握1.信度的概念2.信度的不同特征与测量方法3.效度的概念;效度的多种表达形式熟悉计算信度的方法熟悉建立和测量效度的方法了解国外量表的翻译步骤第一节研究工具的信度(reliability)一、基本概念:定义:使用研究工具所获得的结果的一致程度或准确程度信度的三个主要特征1、稳定性用同一工具两次或多次测定同一研究对象,所得结果的一致程度。
一致程度越高,工具的稳定性越好。
2、内在一致性组成研究工具的各项目之间的同质性和内在相关性。
内在相关性越大或同质性越好,工具的内在一致性越好,信度越高。
3、等同性不同评定者使用相同工具同时测量相同对象时,评定者间的一致程度;或大致相同两个研究工具同时被用于研究对象,工具的一致程度。
二、信度的测量方法稳定性测量——重测信度内在一致性测量——折半信度Cronbach’α系数KR-20值等同性测量——评定者间信度复本信度1、重测信度(test-retest reliability)定义: 用同一工具两次或多次测定同一研究对象所得结果的一致程度。
常表示研究工具的稳定性。
一致程度越高,重测信度越高,研究工具的稳定性越好。
计算方法:使用研究工具对研究对象施行第一次测试,间隔一段时间后使用同一工具对同一研究对象进行重测,然后计算两次资料的相关系数,该系数反映研究工具重测信度的高低。
相关系数在0~1之间,越接近1,说明重测信度越高。
研究对象第一次测试(X)第二次测试(Y)例:人格问卷重测数值表例: 第一次测试和第二次测试数据间的相关系数即为人格问卷的重测信度。
公式如下:X ∑ :第一次测试10名研究对象各得分之和 Y ∑ :第二次测试10名研究对象各得分之和2X ∑ :第一次测试10名研究对象各得分平方之和 1 23 272 44 383 35 374 53 495 44 466 26 287 32 348 28 259 38 341039 362Y :第二次测试10名研究对象各得分平方之和使用重测信度需考虑的问题两次测量之间的间隔时间1)使第一次测量对第二次测量的结果不会造成影响;2)在客观情况未发生改变时进行;测量环境的一致尽量保证测量环境的一致,如相同的测试者、相同的测量程序、相同的测量时间、相同的测量环境等工具所测量的变量的性质:1)对性质相对稳定的问题,如个性、价值观、生活质量等进行测量,适宜用重测信度来表示研究工具的信度如何;2)对性质不稳定的问题,如情感、态度、知识等进行测量,则不宜使用重测信度来表示研究工具的信度如何。
效度[教学教程课件
第一节 效度的概述
一、效度的定义
效度是衡量测验结果有效性的重要 指标,它是指一个测验是否能准确地测 量出它所要测量的特质或功能的程度。
对于物理、化学等自然科学,效度 的问题并不是很突出的,因为科学家们 很清楚他的工具所测量的是什么。例如, 天平,测到的肯定是重量;米尺,测到
的肯定是长度。但是在教育和心理的测 量中,由于被测试的对象非常复杂,只 能采用间接测量的方法,由此就产生了 效度的问题。测量的有效性是良好测验 的最基本条件,一个缺乏效度的测量是 毫无价值的。
2、根据各项教材重点和各类行为改 变的相对重要性而决定它们的权重。
3、编制一个命题双向细目表 4、根据命题双向细目表来编制测验。
A、成就测验的效标,可以是学年的平均成 绩,教师的评定结果,学习量,对所学知 识的应用能力,评判知识的批判能力,自 学能力等等。
B、智力测验的效标,可以是学科的成绩, 教师的评定结果,学生的总成绩等等。
(3)训练差异评定内容效度:先给一组 被试进行先期测量,这组人必须对测验 与包含的内容具有最少量的知识,然后 让这组人参加训练活动,再给以后期测 量,这样可以发现测验是否测量了课堂 上所教的知识,如果后期测量的结果显 著优于前期,就说明该测验对课程内容 范围的测量是有效的。
第三节 效标关联效度
效度的形式化定义是指与测验目的
有关的真实变异数 Sv2 和实得分数变异 数 Sx2 之比,即效度。
rxy= Sv2 / Sx2
二、效度的种类
美国心理学会1974年发行的《教育和心理 测验的标准》一书中将效度区分为内容效度、 效标关联效度和结构效度。
内容效度是指测验的试题能否充分代表其 所要测量的内容范围,它的检验方法一般是靠 专家来评测。
效度的名词解释
效度的名词解释
效度是指一个测试或测量工具的有效性和准确性。
在心理学、教育学、医学等领域中,效度是评估测量工具的重要指标之一。
它是指测量工具所测量的内容是否与被测量的现象相对应。
如果一个测量工具具有高效度,则说明它能够准确地测量出被测量的现象,从而可靠地评估人们的表现、能力、态度、情感等方面。
效度分为内部效度和外部效度两种。
内部效度是指测量工具的各项指标之间的相互关系,包括信度、稳定性、一致性等。
信度是指测量工具的稳定性和一致性,即测量结果的可靠性。
稳定性是指测量工具在不同时间、不同环境下所得到的结果是否一致。
一致性是指测量工具的各项指标之间是否相互协调和一致。
外部效度则是指测量工具与被测量现象之间的关系,包括相关效度、预测效度、构效度等。
相关效度是指测量工具所测量的内容与被测量现象之间的相关性。
预测效度是指测量工具能否准确地预测被测量现象的变化趋势。
构效度是指测量工具所测量的内容是否与被测量现象的内在结构相一致。
测量工具的效度是评估其是否具有正确性和准确性的重要指标。
一个测量工具的效度高,则说明它能够准确地测量出被测量的现象,从而可靠地评估人们的表现、能力、态度、情感等方面。
因此,在选择和使用测量工具时,必须考虑其效度,以保证测量结果的准确性和可靠性。
同时,在测量过程中,也应该注意对测量工具的效度进行监测和评估,以确保测量结果的正确性和准确性。
总之,效度是测量工具的一个重要指标,它关系到测量结果的准
确性和可靠性。
在选择和使用测量工具时,必须考虑其效度,并对其进行监测和评估,以确保测量结果的正确性和准确性。
第七章 - 效度和信度
三、改善信度的途径
改善评价者的信度 例:在汉语测试的主观题阅卷工作中,为了提高评价者信度,要使
用有汉语教学经验并接受过汉语教学评价训练的汉语教师担任评 价者。
改善评价对象的信度 例:应该在多个不同的场合评价同一对象 改善评价工具的信度 例:创造理想的评价条件,如安静的考场,良好的录音听力设备等。
第二节 汉语教学评价信息的效度
2. 有害的反拨效应 3. 有益的反拨效应
相互依存又相互排斥 -没有信度不可能有效度。 -没有效度,信度也就毫无意义。 -高信度可能会带来低效度;高效度也可能会带 来低信度。 例如:客观题能满足信度要求,却不符合效度要 求;主观题符合效度要求,却不符合信度要求。
例:看拼音,写汉字。 chējié guǒkū jìnyě ( )( ) ( ) 分析:低信度,低效度。换言之,没有信度, 分析:低信度,低效度。换言之,没有信度,不 可能有效度。 可能有效度。
影响效度的因素
汉语测试本身的构成 汉语被试的特点
精心编制测试或量表 试题要很好的地代表想测的内容或结构。例外,题目指令要清楚,题 目不宜太难或太简单,题量也不宜太少,题目顺序安排也要得当。 创造规范的应试环境 汉语考试者的应试动机,时间,态度,身体状态都会影响效度。 学生要遵守指令,评分者也要认真评分。 严密组织和安排测试
可行性指用来收集汉语教学评价信息的某 种评价方案是否便于实际投入施行。
可行性的相关因素
思考:在计划评价和收集信息的时候,我们应该 考虑什么? 1. 资金投入 2. 时间耗费 3. 收集者资格 4. 可接受性 5. 反拨效应
反拨效应
1.概念
测试对教学和学习所产生的影响被称为反拨效应。 测试对教学和学习所产生的影响被称为反拨效应。
效度分析
内容效度的应用
• 是编制任何测验都要考虑的基本方面; • 适合于教育和职业成就测验;
– 作用一:该测验是否是应该考察的某种技能和 知识的代表性样本;
– 作用二:测验的成绩是否与其他无关内容无关。
效标(实证)效度
•效标效度指测验分数与外在标准(效标)的相关程 度。测验分数对个体的效标行为表现进行预测的有效 性程度。 •效标:考察测验效用的外在参照标准。被预测的行 为是检验测验效度的标准,就是效标。 •实证(效标)效度强调的是效标行为,因此,测验 内容是次要的,测验题目不需要与效标有明显关系, 只要测验分数能预测效标行为。
t xs x f ss2 s f 2 NS N f
确定实证效度的方法
• 命中率
– 总命中率:正确决定数目对总数目的比率 – 正命中率:所选择的人成功的比例,选择效率
效标成绩 测验预测
成功(+)
失败(-) (A)失误
成功(+) (B)命中
失败(-)
(C)命中
(D)失误
命中率种类
总命中率
命中 命中+失误
信度与效度的关系
▪ 信度是效度的必要条件,但非充分条件
▪ 测量的信度只受随机误差因素的影响, 不受系统误差因素的影响 ▪ 测量的效度既受随机误差因素的影响, 又受系统误差因素的影响 ▪ 因此,测量的效度总低于信度
信度与效度的关系
SX2
SV2
SI2
SE2
ST2
SV2 代表有效变异; ST2代表信度变异; SI2代表系统变异; SE2代表随机误差变异; Sx2 代表总变异。
内容效度的确定方法
• 专家判断法
– 确定测验内容的总体范围和边界; – 确定每个指标是否具有代表性; – 编制双向细目表,确定内容的具体细节各自所
教育统计与测量 第7章 效度
结构效度的大小完全取决于事先假定的心理特 质理论,一旦人们对同一种心理特质有着不同 的定义或假设,则会使得关于特质测验的结构 效度的研究结果无法比较。 当实际测量的资料无法证实我们的理论假设时 ,并不一定就表明该测验结构效度高。因为还 有可能出现理论假设不成立,或者该实验设计 不能对该假设作适当的检查等情况,这就使得 结构效度的获取更为困难。
(用全国高考的成绩作为效标来检验高中毕业生会考的 成绩,计算两者之间的相关系数就是会考的同时效度; 而用大学一年级的成绩作为效标来检验高考的成绩,计 算两者的相关系数就是高考的预测效度。)
同时效度:用于标准化测验的建立 预测效度:常用于评定原测验的预测功能。
可靠性:较高的信度 有效性 客观性 实用性
28
通过因子分析,可以找出少数的几个因子 来代替原来的变量做回归分析、聚类分析、判别
分析等。
29
因子分析可以通过下面的数学模型来表示:
独特因子
公共因素
30
因子分析把每个原始变量分解成两部分:一部分是由所 有变量共同具有的少数几个因子所构成的,即所谓公共因
素部分;另一部分是每个变量独自具有的因素,即所谓独
Байду номын сангаас
(1)逻辑分析的方法。其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。 (2)统计分析法。 科隆巴赫法:从同一个教学内容总体中抽取两套独立的 平行测验,用这两个测验来测同一批被试,求其相关。 若相关高,表明测验内容效度较高;若相关低,表示测 验的内容效度较低。 评分一致性考查法:不同评分者之间评分的一致性程度 前后测比较法:训练前后测验的差异 内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。 内容效度不适合用于能力倾向和人格测验。
07第七章 社会测量
1、定类测量 (nominal measurement)
也称类别测量或定名测量 本质:(分类体系)将调查对象的不同属性或特征加
以区分,标以不同的名称或符号,以确定其类别。
数学特征:等于、不等于(或者属于与不属于); 定类尺度是社会测量的最低层次;不能类比大小和按
排顺序,更不能进行加减、乘除运算。
实例:对人们的性别、职业、等变量特征的测量,都 是常见的定类尺度的测量。 遵循原则:互斥、穷尽等
量表可根据他的测量内容分类 分为:态度量表、能力量表、智力量表、人 格量表等类型。
量表还可以分为调查量表与测验量表
1、总加量表
总加量表:就是用不同的回答构成一个简单 累加的分数。它是由一组有关事物的态度或 看法的陈述构成,回答者分别对这些陈述发 表同意或不同意的意见,然后按照某种标准 将回答者在全部陈述上的得分加起来,就得 到了该回答者对这一事物态度化的量化结果。
定比测量与定距测量的差别:是否有绝对零点
定比测量是一种能够测定事物之间比例、倍数关 系的测量尺度。 (1)定比尺度是测量中的最高层次,它除了定类、 定序、定距尺度的特征之外,还具有实在意义的 真正零点。 (2)定比尺度下的数字是可以进行四则运算的, 运算的结果都有实在意义。 (3)一个变量能否以定比尺度测量,关键在于零 点是否绝对。 定比测量可以进行乘除运算。如:一群人的平均 年龄是可以计算的,但其平均宗教信仰是不可以 计算的,因为宗教信仰是定类变量。
这个分数是其态度的量化结果,它的高低就代 表了个人在态度量表上的位置。
总加量表
总加量表也称为李克特量表(Likert Scaling)是社会调查问卷中用的最多的一种 量表形式,它最初形式是给出一组问题,请被 调查者做出 “同意”或 “不同意”的回答.
第七章--人员测评的信度与效度
其中, r' xx 为估计的信度;rxx 为取样的信度;SSxX
为取样团体的标准差;Sx' 为估计团体(取样的
总体)的标准差。
3)不同团体间能力水平的差异
2.测评的长度
信度还会受测评长度(即题目的多少) 的影响。一般来说,测评越长,信度值 越高。
实际上效度指的是“测评结果的效度”, 是指测评结果的准确性程度,而并不是指测评 本身。也反映了测评结果对测评目标的体现程 度。
6.2 .2如何评估人员测评的效度
6.2 .2 .1内容效度
1.内容效度的定义
内容效度是指测评内容取样是否反映测评 的目标,适用于测评对象。
2.内容效度的评估方法 ·测评内容范围明确; ·测评内容的取样有代表性。
3.内部一致性信度
内部一致性信度主要反映的是测评内部题 目之间的关系,考察测评的各个题目是否测评 了相同的内容或特质。
1)分半信度
分半信度系数是通过将测评分成两半,计 算这两半测评之间的相关性而获得的信度系数。
分半法经常会低估信度,必须进行修正。斯皮 尔曼一布朗公式可以估计增长或缩短一个测评 对其信度系数的影响,用这个公式进行修正的 前提条件为:两半测评的方差相等。
224 1 42 63 6
0.80
12
6.1.5 影响信度的因素 1.样本团体的性质 1)样本团体的分数分布
分数分布越广,信度系数就相对越高,分 数分布越窄,信度系数就会越低。
2)样本团体的异质性
一般来说,取样团体的异质性越大,信度 系数就相对越高。
但是在测评中,往往会因为团体过于同质或 过于异质而出现信度被低估或高估的情况。这 种情况下,可以采用下面的公式对求出的信度 进行修正:
第七章 效度
(二)效标关联效度的计算
4.命中取舍法 总命中率=命中总数/总预测数目 正命中率=实际成功人数/预测成功人数 负命中率=实际失败人数/预测失败人数 例:70人参加一个预测测验,预测结果:50人成 功、20人失败。效标结果:预测成功50人中40人 成功,预测失败的20人中8人失败。 总命中率=(40+8)/70 正命中率=40/50,负命中率=8/20
一是测验内容范围明确,即必须明确界定所 要测验的内容范围。 二是取样具有代表性,即测验题目对所有测 验内容的覆盖面要大。 内容效度一般用于估算学业成就测验的效度, 因为学科测验容易确定测验内容的范围。
(二)内容效度的估计方法
逻辑分析法:依靠有关专家对测验题目与 应测内容范围的吻合程度作出判断 统计分析法:克龙巴赫法;评分一致性考 察法;前后测比较法
二、构想效度
构想:心理学或社会学理论等所涉及的抽 象而属假设性的概念和特性。例如智力、 能力倾向、焦虑、动机、创造力等。对它 们只能下操作性定义。 构想效度:测验能够说明理论上所定义的 某种结构或特性的程度。 或:实测分数与某种构想的对应程度。
构想效度的分析步骤:
第一,建立理论结构,据此编制测验题目。 第二,根据理论结构,提出有关测验成绩 的假设。
第二节
提高测验效度的方法
控制系统误差。(试题的内容结构、目标 结构、题型结构、难度结构、分数结构、 时限结构直接影响测验的效度,要处理好 它们的相互关系。) 精心编制测验量表。 有效组织测量。 扩大样本容量 合理处理信度与效度的关系 适当增加测验的长度。
(一)效标关联效度的概念
1.同时效度 本测验的结果与另外一个大约同时获得的测 验结果(效标)之间的一致性程度。 2.预测效度 测验结果对未来的行为或者测验成绩(效标) 能够准确预测的程度。 效标是在本测验之后相当长一段时间后才能 获得。
效度的名词解释
效度的名词解释效度是心理学中一个非常重要的概念,它指的是一种度量工具或测试工具能够测量出所要测量的心理特征或行为的程度的准确程度。
效度是心理测量学的核心概念之一,也是心理测量学的基本要求之一。
在心理学研究中,效度是评价一个测量工具的优劣的重要指标之一,它是测量工具是否有效的重要标准。
在心理测量学中,效度通常分为两种类型:内部效度和外部效度。
内部效度是指测量工具能否测量出所要测量的心理特征或行为的程度的准确程度。
外部效度是指测量工具与其他测量工具和实际情况的相关性和一致性。
内部效度和外部效度都是评价测量工具的重要指标,两者缺一不可。
内部效度是评价测量工具的准确性的重要指标。
内部效度可以通过比较测量工具内部各项指标的一致性来评价。
内部效度的评价方法包括:同质性检验、因素分析、信度检验等。
同质性检验是通过比较测量工具不同题目的得分来评价测量工具的内部一致性。
因素分析是通过分析测量工具的各项指标之间的关系来评价测量工具的内部一致性。
信度检验是通过比较测量工具的重复测量结果来评价测量工具的内部一致性。
这些方法可以帮助评价测量工具的内部效度,从而更准确地测量心理特征和行为。
外部效度是评价测量工具的相关性和一致性的重要指标。
外部效度可以通过比较测量工具与其他测量工具和实际情况的相关性和一致性来评价。
外部效度的评价方法包括:相关系数分析、回归分析、判别分析等。
相关系数分析是通过比较测量工具与其他测量工具和实际情况的相关性来评价测量工具的外部效度。
回归分析是通过比较测量工具与其他测量工具和实际情况的一致性来评价测量工具的外部效度。
判别分析是通过比较测量工具与其他测量工具和实际情况的差异来评价测量工具的外部效度。
这些方法可以帮助评价测量工具的外部效度,从而更准确地测量心理特征和行为。
在心理测量学中,效度是评价一个测量工具的优劣的重要指标之一。
效度是测量工具是否有效的重要标准。
评价测量工具的效度可以通过比较测量工具内部各项指标的一致性和测量工具与其他测量工具和实际情况的相关性和一致性来评价。
效度评估的方法.pptx
测验前分数——训练——测验后分数(提高)
(三)效标效度
定义 效标 估计方法
1、定义
效标效度是指一个测验对处于特定情境中的个 体行为进行估计的有效性。
被预测的行为是检验效度的标准叫效标。 由于这种效度是看测验对效标预测的如何,所
避免与表例面2:效当度你发(现领导)在讲混话淆时明显出现了错误时,你
一个测A当验场看指出上去B装适做不合知道欲C测会目后吿的知 的程度,
而非实际适合欲测目的的程度。
测验在使用者或被试主观上感觉有效的 程度。
编制测验应适当考虑表面效度。
最高作为测验表面效度可高些
(二)构想效度
()
定义 确定步骤 估计方法
二、效度的性质
效度是一个相对的概念。(目的和功能) 效度具有连续性 (程度上的不同;高效或低效;针对测验
结果)
三、信度与效度的关系
SX 2 SV 2SI2SE 2
2 信度高,给 S²V 增加提供可能 能否提高效度,再看S²I大小 信度高不一定效度高 效度要高,S²V须占较大比重,S²T↑ 效度高,信度必高
取样:芝加哥校区 被试:145名7~8年级学生 内容:实施24个心理测验 结果: 4个基本因素 图词测验和数图测验的功能不明显。
24个心理测验的因素归类
词语
速度
推理
记忆
1.一般知识 5.加法 11.视知觉 15.数字游戏 19.词汇识别
段落理解 6.编码 12.体积 16.问题推理 20.数字识别
=()/()
正命中率=成功人数/选择人数
()
第三单元 效度的功能
一、预测误差 效度系数的实际意义常以决定系数表示,
效度
4)经验效度(empirical validity)。经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或 多个标准尺度相对照而得出。经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的 结果同另一次时间相近的有效测试的结果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度 (predictive validity),即将一次测试的结果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比 较而得出的系数。
影响统计效度的因素
影响统计效度的因素主要有方面:统计功效低、违反统计方法的使用条件、测量信度低。
统计结论效度的条件
研究的统计结论效度主要取决于两个方面的条件:一是数据的质量,数据分析程序的效度是以数据的质量作 为基础的,数据质量差的研究是谈不上统计结论效度的;二是统计检验方法,数据分析中所采用的各种统计方法, 都有其明确的统计检验条件的要求,一项研究中统计检验条件不明确或者被违反,就会显著降低统计结论效度。
测试维度
测试维度
1)表面效度(face validity)。指测试应达到的卷面标准,即一套测试题从表面看来是否是合适的。例 如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。表面效度 是测试出受试者正常水平的一种保证因素。
2)内容效度(content validity)。指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反 映了测试的要求,即测试的代表性和覆盖面的程度。例如,如果某一套发音技能测试题仅仅考查发音所必须具备 的某些技能,如只考单一音素的发音,而不考查重读、语调或音素在词语中的发音,那么,该测试的内容效度就 很低。
2015年经济师《中级人力》知识点预习-第七章 信度与效度
概念类型关系重测信度又称稳定性系数,指用同一方法对一组应聘者在两个不同时间进行测试,所得结果之间的一致性信度也叫可靠性或一致性,一个好的测量工具必须稳定可靠,或不产生错误,或产生的是系统误差,复本信度(1)又称等值性系数,指采用两个测验复本(功能相同但题目内容不同)来测验同一群体,所得到的两个分数的相关性(2)复本信度的高低反映了两个测验在内容上的等值性程度(3)复本法适合于许多测验,尤其是能力测验每次测试的错误相同内部一致性信度(1)主要反映同一测试内部不同题目的测试结果是否具备一致性(2)这是检测测验本身好坏的重要指标评分者信度(1)不同评分者对同样对象进行评定时的一致性(2)反映的是跨评价人员的可靠性信度对效度而言内容效度(1)测验方法是否真正测出工作绩效的某些重要因素(2)采用专家判断方法检验(3)多用于知识测验和实际操作测验,但不适用于对能力或潜力的预测是一个必要而非充分的条件效度即有效性或精确性,是指招聘者真正测试到的品质与想要测量的品质问的符合程度效标关联效度(1)也叫协同效度.指对现有员工实施某种测验,然后将所得结果与这些员工的工作表现或工作考核得分加以比较,若两者相关系数很大,说明此测验与某项工作密切相关(2)特点:省时,但有可能无法准确预测应聘者未来的工作潜力预测效度可用于将来的人员选拔,且多用于能力及潜力测验,效果很好构想效度(1)能够测量到理论上的构想或特质的程度(2)其关心的是:是否能够正确反映理论构想的特性【例14?单选题】采用一个测验的两个复本来测试同一群体,所得到的两个分数的相关系数是()。
A.等值性系数B.区分效度系数C.评分者信度系数D.内容效度系数【答案】A【解析】本题考查信度的种类之一等值性系数,也称为复本信度。
【例15?单选题】在选拔测试中,招聘者真正测试到的品质与想要测量的品质间的符合程度称为()。
A.接近度B.信度C.难易度D.效度【答案】D【解析】本题考查效度的概念。
效度的功能
效度的功能
一、预测误差
决定性系数=rxy2 ,效度系数的实际意义常以决定性系数表示。
表示测验正确预测或解释的效标的方差占总方差的比例。
如:效度=0.8,则决定系数=0.64,表明测验的总方差中有64%的方差是测验分数的方差。
即测验分数正确预测的比例是64%,其余36%无法做出正确的预测。
高考英语测验成绩与入大学后第一学年的英语成绩的相关为0.6
则, rxy2=0.36,即入大学后第一学年的英语考试成绩中有36%的方差是由高考成绩来加以解释的,即36%由高考来预测的。
效标完美时, rxy2 =1,估计标准误=0,测验分数可以
完全代替效标。
当rxy2 =0时,估计标准误为效标分数的
分布标准差相同,测验无异于猜测。
大多少情况下预测
误差介于二者之间。
二、预测效标分数
知道一个人的测验分数,带入回归方程即可对效标分数做出估计。
三、预测效率指数
E=100(1-K),E的大小表明使用测验比盲目猜测能减少多
少误差。
r=0.8,则k =√1 – rXy2 =0.6,E=40,表明预
测误差仅为随机猜测所产生误差的60%,即由于测验的
使用,估计被试的效标分数时减少了40%的误差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教案课题:《第七章效度》课型:新授课课时:3学时教学目标:1.了解效度的意义。
2.掌握效度的类型及各种估算方法。
3.了解提高测验效度的方法教学重难点:∙教学重点:效度估算的各种类型,提高测验效度的六种方法。
∙教学难点:效度估算各种类型的计算方法。
教学方法:读书指导法、讲授法、练习法。
教学过程:一、导入:列举效度的意义,激发学生的学习动机。
二、感知:引导学生感知学习内容。
三、讲授:通过具体内容的讲授分析,促进学生进一步理解学习内容。
讲授主要内容如下:一、内容效度(一)内容效度的概念内容效度是指测验内容与预定要测的内容之间的一致性程度。
也可以说是测验题目所涉及的内容对所要测验的全部内容的取样代表性程度。
取样代表性是指测验题目能最大限度地代表欲测的内容范围。
因此,一个测验要具有较高的内容效度必须具备两个条件:其一是测验内容范围明确,即必须明确界定所要测验的内容范围;其二是取样具有代表性,即测验题目对所有测验内容的覆盖面要大。
在理解测验的内容效度时,不要与测验的表面效度相混淆。
表面效度是指从外表直观地看,测验题目与测验目标的一致性程度。
表面效度从严格意义上讲不能算作一种效度的,但在实际测验中却是不能忽视的。
(二)内容效度的估计方法1.逻辑分析法用逻辑分析法估计内容效度,主要是指依据教材内容、课程标准的范围以及教学目标分析测验内容,检查测验内容究竟在体现教材内容和教学目标方面达到多大的程度。
用逻辑分析法估计内容效度实际上是在进行定性分析。
这种方法的缺点主要表现在:没有数量指标来描述教材内容、教学目标与测验试题的一致性程度;内容效度一般采用专家主观性评判,因而很难做到客观、准确,不同判断者的判断标准不同,可能导致批评结果的不一致。
因而,对内容效度的估计必须谨慎,而且对内容效度的估计值也应当一分为二的看待。
2.统计分析法统计分析法主要是采取定量分析手段来描述测验的内容效度,其方法主要有以下几种:(1)克龙巴赫法克龙巴赫曾提出估计内容效度可以用同一教学内容范围的总体中抽取两套独立的测验试题,用这两套测验试题对相同的被试分别进行测验,测验之后求得两次得分的相关系数,如果相关系数大,就可推论内容效度高,若相关系数小,则说明这两套试题中至少有一套测验的内容效度比较低。
(2)评分一致性考查法内容效度的确定也可以计算不同评分者之间评分的一致性程度,即考查评分者的信度。
虽然它代表的是测验信度,但由于来自两个独立的评判者,因此符合程度越高就反映测验的内容效度也越高。
(3)前后测比较法这种方法是,先对一组被试进行前期测验,这一组被试对测验的内容知之甚少,然后对这一组被试进行有关内容的教学与训练,经过一定时间后,再对这一组被试进行后期测验,这样可以看出测验是否测验出课堂上进行的教学与训练的效果。
二、构想效度(一)构想效度的概念构想效度是指测验成绩能够解释心理学理论上的某种结构或特质的程度,构想效度主要适用于心理测验效度的确定。
所谓构想,是指心理学理论所涉及的抽象而属假设性的概念、特质或变量,如智力、能力倾向、行为习惯、成就动机、人格结构等。
(二)确定构想效度的步骤和方法确定构想效度的步骤和方法是:首先根据一定的心理学理论建立某种心理品质的理论结构;然后根据这一理论结构提出有关测验成绩的假设;最后用逻辑和实证的研究由果求因来验证提出的假设。
三、效标关联效度(一)效标关联效度的概念效标关联效度是指测验分数与作为效标的另一独立测验结果之间的一致性程度,一般是用本测验与效标测验去测同一被试得到的两组分数的相关系数表示。
所谓效标,是检验测验效度的参照标准。
效标实际上是奔测验所想测验或要预测的特性或功能,这些特性或功能通常以另一独立测验的结果来表示。
效标关联效度分为两种:1.同时效度同时效度是一种测验的结果与另一大约同时获得的测验结果之间的一致程度,同时效度的高低用两次测验结果的相关系数来估计。
它常用于标准化测验的建立,用它作为检验所建立测验能否成为标准化测验的一种手段。
2.预测效度预测效度是指测验分数与将来的效标之间的关联程度,或者说预测效度是测验是预测被试将来从事某种学习或工作能够达到应有水平的有效程度,预测效度的高低用两次测验结果的相关系数来估计。
预测效度常用于评定原测验的预测功能,在实际中预测效度的高低由预测的准确程度来决定。
效标关联效度的关键是选好效标,一个好的效标必须具备以下几个条件:(1)可靠性,即效标测验必须具有较高的信度;(2)有效性,即效标测验本身必须是有效的;(3)客观性,即效标测验必须尽量客观标准化,力求排除主观偏见,特别是防止效标污染的影响;(4)实用性,即效标应尽量使其用法简单、省时、花费少,讲究经济实用。
预测效度与同时效度都是把测验分数和一种效标分数相比将,用求得的相关系数来表示。
但是,两种效度的意义是有区别的。
同时效度主要用于查明自编测验的效度,以便有效地研究、编制和使用新的测验;预测效度主要是用于评价原测验的预测能力,而且预测效度的效标要在原测验之后隔相当长的时间才能获得。
(二)效标关联效度的计算1.相关法相关法是确定效标关联效度最为普遍的方法。
其基本思想是求得测验分数与效标分数之间的相关系数,所求得的相关系数称为效度系数。
相关法既可以用积差相关公式求相关系数,也可以用等级相关、点二列相关等公式来求其相关系数。
2.分组法分组法是先将效标分数按规定的分数线分组,分成成功组和失败组,然后考查组与组之间原测验分数的差异是否显著。
如果经检验差异不显著,则可认为原测验的效度还未达到要求;如果经检验结果差异显著,就可以认为原测验的效度达到了要求,也可以说原测验的预测效度是较高的。
利用分组法确定预测效度时,若样本容量n 大于等于30,则用大样本Z 检验法,其公式为:nqS npS qX p X qp22Z +-=若n <30,则用小样本t 检验法,其公式为:)11(2)1()1(t 22qp q p qq p p n n n n S n S n qX p X +-+-+--=2-+=q p n n df在这里,p X 为成功组的平均分数;q X 为失败组的平均分数;S p 为成功组的标准差; S q 为失败组的标准差;n p 为成功组的人数; n q 为失败组的人数; d f 为自由的度。
3.预期表法预期表是一种双向列联表,表的左边是原测验分数,表的右边是效标分数,这两种分数都以等级类别排列。
表中间的数字不是绝对数而是相对数,即以原测验得若干分的人数除其中列入各种等级的人数所得的百分数。
预期表从左下角至右上角对角线上的数字越大,其他数字越小,则测验的效标关联效度就越高。
所以,可用从左下角至右上角对角线上的数字所占的百分比表示效标关联效度的高低。
例如,240人在学期开始参加数学推理测验和期末的代数测验成绩所制成的预期表如下表所示。
预期表本例对角线上的数字比较大,可以直观判断效度系数比较大。
我们可以这样确定对角线数字,B A 4060−−→−−−→−)()(,良优,中−−→−+5020与D 、差−→−20E 。
因此效度系数为:%792401902402050204060==++++)(4.命中取舍法当测验是用来作取舍的依据时,其测验有效性的指标就是正确决定的比例。
具体地说,预测与效标之间有四种情况:预测成功而且事实上成功;预测成功但事实上不成功;预测不成功但事实上成;预测不成功而且事实上也不成功。
我们称一、四两种正确的预测为命中,二、三两种不正确的预测为失败,这样,可以计算以下两种指标来表示预测效度的高低。
总预测数目命中失败命中命中总命中率=+=预测成功人数人数预测成功且事实成功的正命中率=以上两种指标的值越大,说明测验越有效。
第二节 提高测验效度的方法 一、控制系统误差考虑测验效度时,假设随机误差足够小而且不变,那么系统误差方差越小,则有效方差就越大,因此达到测验目标的程度也就越大,即效度越高。
所以,效度也就可以定义为有效方差与实得方差之比,即:22vS xS r =由此可知,随机误差方差和系统误差方差都会对效度产生影响。
而事实上,影响测验效度高低的主要因素是系统误差的大小。
比如测验题目和指导语有暗示性、答案组型有规律性等都影响测验效度。
所以,控制系统误差可以提高测验效度。
二、精心编制量表量表是形式和内容都会影响测验长度,所以测验量表在形式上必须表述清楚、明了,排列应由易到难,长度适中,应在形式上就引起被试的兴趣,特别是量表印刷必须清楚而且精美。
测验量表在内容上必须保证测验的目的性,力求测量出所要测量的东西,而且测验项目难度应合适,并保证有足够的区分度,所有这些都有助于提高测验的效度。
三、有效组织测验测验的实施情况对测验的效度有很大的影响。
首先要确保有良好的施测环境(包括物理环境和心理环境)。
其次,在测验过程中掌握好时间,统一测验程序,评分时要客观准确,避免错误。
并且应把握好测验之间的间隔时间,间隔时间的长短一定要按测验目的合理安排。
四、扩大样本的容量扩大样本的容量,可以增加样本对总体的代表性,增加代表性便可以抵消测验的随机误差,使测验更稳定可靠。
扩大样本容量可以扩大有效分数的方差,从而使效度22vS xS r =增大。
所以,要提高测验效度应扩大样本容量。
一般而言,样本容量应大于30才可靠。
另外,为了提高测验效度,获得样本的方法也是很重要的,要根据测验的目的选择最能代表研究总体的样本,比如,通过随机抽样获得的随机样本,代表性强,这也有助于提高测验的效度。
五、合理处理信度与效度的关系测验效度要受测验信度的限制,事实上,效度的最大值受它的信度所制约,有公式:信效r ≤r 。
比如说,一个测验的信度是0.49,那么它的效度不会高于0.7,即0.70.49=。
由此可知,信度是效度的必要条件,虽然信度高的测验效度不一定高,但效度高的测验,信度一定比较高。
还应注意效标信度与信度的关系。
如果效标的测量误差较大,则信度就较低,其效度也会就较低。
如果选一个不大可靠的测验成绩作效标,效度系数是不会大的。
如果所选用的效标信度系数不理想,则可按下列公式校正,以免影响测验结果的效度。
YYXY 'XYr r =r在这里,'XY r 为校正后的效度系数; XY r 为效度系数; YY r 为效标的信度。
六、适当增加测验的长度测验的题目数即长度对测验的效度有一定的影响。
因为测验的题目数增加,可提高试题的代表性,从而提高测验的信度。
又由于效度系数的最大值与测验信度有关,因此增加试题的数目也能提高测验的效度。
不过,增加测验长度对信度的影响大于对效度的影响。
关于测验长度与信度、效度的关系,如表所示。
从上表可以看出,当测验题数增加到6倍时,信度系数增加到2.4倍,而效度系数只增加到1.55倍;当测验长度增加到48倍时,信度增加到3.18倍,而效度只增加到1.78倍。