心理测量学测验的效度2_PPT幻灯片
合集下载
第5章效度_PPT幻灯片
3、经验推测法
这种效度是通过实践来检验效度。如儿 童发展量表是否有效,需要经过实践调查。
(三)内容效度的特性 表面效度(重点):是由外行对测
验作表面上的检查确定的,它不反映 测验实际测量的东西,只是指测验表 面上看来好像是测量所要测的东西。
编制测验时,表面效度需要考虑。
最高行为测验,如智力测验、成 就测验,需要较高的表面效度。
第三节 影响效度的因素
一、测验本身的因素 二、测验实施中的干扰因素 (一)主试的影响因素 (二)被试的影响因素 三、样本团体的性质 (一)样本团体的异质性 (三)干涉变量 四、效标的性质
一、测验本身的因素
如词汇和句型不能过于太难,如低年级 小学生,要用拼音和图形来注解。测验取 材、测验长度、试题类型、难度、区分度 及编排方式等都会影响效度。
• 1、如果某测验的效度系数是0.70,则在测 验中无法作出正确预测的比例是( )。
• (A)0.30 • (B)0.51 • (C)0.49 • (D)0.70
• 2、一个测验所测量的与所要测量的心理特 点之间符合的程度,指的就是测验的( )。
(A)信度 (B)难度 (C)区分度 (D)效度
• 3、好的效标应具备的条件包括( )。 • (A)效标测量本身必须有效 • (B)效标必须具有较高的信度 • (C)效标可以客观地加以测量 • (D)效标测量的方法经济实用
典型行为测验却要求较低的表面效 度,如大多数人格测验,如UPI中的25 题“想轻生”。
二、构想效度
(一)什么是构想效度 定义:是指测验能够测量到理论上的构
想或特质的程度,即测验的结果是否能 证实或解释某一理论的假设、术语或构 想,解释的程度如何。
建立构想效度的三步
心理测量学第四节 测量的效度
Sest Sy 1 rx2y
❖ Rxy2代表效度系数的平方,即决定系数;Sy 为效标成绩的标准差。
❖ 真正效标分数落在预测效标分数的不同水 平的Sest范围内。
习题
❖ 21、如果某测验的效度是0.70,则在测验中 无法作出正确预测的比例是( )。 (A)0.30 (B)0.51 (C)0.49 (D)0.70
效标测量的判断标准
❖ 有效性 ❖ 可靠性 ❖ 客观性 ❖ 实用性
实证效度的检验方法
❖ 相关法 ❖ 区分法 ❖ 命中率法
相关法
❖ 计算测验分数与效标测量的相关。根 据变量的性质不同,可分别采用不同 的积差相关,等级相关法,二列相关法 等。
区分法体。
2008年5月(二级)
❖ 58、效度系数的实际意义常常以决定系数来 表示,如测验的效度是0.80,则测验可以 正确预测或解释的效标的方差可占效标总方 差的( ).
❖ (A)36% (B)46% ❖ (C)56% (D)64%-
二.预测效标分数
❖ 建立测验分数预测效标成绩的回归方程
· Y a byx X
❖ 最常采用的t检验。
命中率法
❖ 预测源与效标关系可能四种情况:
效标测 量 预测源
成功
成功 失败
A(命中) B(失误)
失败 C(失误) D(命中)
命中率法两种指标
❖ 总命中率
Pct
命中 命中 失误
A
AD BC
D
正确 总数
❖ 正命中率
pcp
成功人数 选择人数 *100%
A A B
内容效度确定的方法
❖ 专家判断法(逻辑效度) ❖ 经验判断法 ❖ 统计分析法
❖ Rxy2代表效度系数的平方,即决定系数;Sy 为效标成绩的标准差。
❖ 真正效标分数落在预测效标分数的不同水 平的Sest范围内。
习题
❖ 21、如果某测验的效度是0.70,则在测验中 无法作出正确预测的比例是( )。 (A)0.30 (B)0.51 (C)0.49 (D)0.70
效标测量的判断标准
❖ 有效性 ❖ 可靠性 ❖ 客观性 ❖ 实用性
实证效度的检验方法
❖ 相关法 ❖ 区分法 ❖ 命中率法
相关法
❖ 计算测验分数与效标测量的相关。根 据变量的性质不同,可分别采用不同 的积差相关,等级相关法,二列相关法 等。
区分法体。
2008年5月(二级)
❖ 58、效度系数的实际意义常常以决定系数来 表示,如测验的效度是0.80,则测验可以 正确预测或解释的效标的方差可占效标总方 差的( ).
❖ (A)36% (B)46% ❖ (C)56% (D)64%-
二.预测效标分数
❖ 建立测验分数预测效标成绩的回归方程
· Y a byx X
❖ 最常采用的t检验。
命中率法
❖ 预测源与效标关系可能四种情况:
效标测 量 预测源
成功
成功 失败
A(命中) B(失误)
失败 C(失误) D(命中)
命中率法两种指标
❖ 总命中率
Pct
命中 命中 失误
A
AD BC
D
正确 总数
❖ 正命中率
pcp
成功人数 选择人数 *100%
A A B
内容效度确定的方法
❖ 专家判断法(逻辑效度) ❖ 经验判断法 ❖ 统计分析法
第五章 测量效度_PPT幻灯片
第五章 测量效度
第二节 效度的估计
二、实证效度 (一)实证效度的含义、种类及作用 2 实证效度的种类和作用 预测效度表达的是测验与将来进行的效标之间的
效度关系。 预测效度用于预测某个个体将来的行为。
第五章 测量效度
第二节 效度的估计
二、实证效度 (一)实证效度的含义、种类及作用
2 实证效度的种类和作用 “某人具有这种能力吗?” “某人会有这种能
反映。 3 判断一个测量是否有效要从多方面收集证
据
第五章 测量效度
第一节 效度概述
(二) 效度的数学定义及其基本原理
回顾前面介绍的CTT的内容: 一组测验分数的总变异(S2X)包括三部分: 真实的(稳定的)、与测量目的有关的变
异(S2V) 真实的、但出自无关来源的变异(S2I) 随机误差的变异(S2E)
第二节 效度的估计
一、内容效度 (二)内容效度的确定方法 2 内容效度的统计分析方法: Cronbach提出,两测验的相关法 3再测法:
处理后的重测法
第五章 测量效度
第二节 效度的估计
二、实证效度 (一)实证效度的含义、种类及作用 1 含义:实证效度是指一个测验对处于特定情境
中的个体的行为进行估计的有效性。即以实践的 效果来作为检验标准,所以也叫效标关联效度。
联效度,是指一个测验实际测到的内容与所要测 量的内容之间的吻合程度,也即测验项目在多大 程度上表示了所要测定的特征范畴。
如,如果要从一批待业人员中挑选机床工,所用 的测验项目就应该能表明机床操作能力的范畴。
第五章 测量效度
第二节 效度的估计
一、内容效度
(一)含义及应用范围
2 内容效度通常包括欲测的知识范围,以及 该范围内各知识点所要求掌握的程度两个 方面。一般以双向细目表的形式呈现。
第九章%20%20效度ppt
68
70
65
65
50
积差相关:连续变量——连续变量
智商:135 性别: 1
120 2
110 2
100 2
90 1
80 1
70 1
65 2
点二列相关:二分变量——连续变量
主讲 潘发达(讲师,心理学硕士) 心理测量与评价
智商:135
120
110
100
90
80
70
65
成绩: 98
90
92
85
70
50
45
测量单一特质 还是多种特质
出声反应
社会评价 道德判断
心理测量与评价
主讲
潘发达(讲师,心理学硕士)
测验间的相互比较
相容效度 区分效度 因素分析
主讲
潘发达(讲师,心理学硕士)
心理测量与评价
效标效度的研究证明
实验法或观察法证实
类似于“统计分析法——再测法”估计内容效
度
主讲
潘发达(讲师,心理学硕士)
主讲 潘发达(讲师,心理学硕士) 心理测量与评价
思考题:
1.对于一个测验来说,效标效度能提供什
么信息?
2.同时效度与预测效度的根本区别是获得
效标资料的时间不同吗?
3.区分法估计效标效度的原理是什么?
主讲 潘发达(讲师,心理学硕士) 心理测量与评价
第三节
影响效度的因素
一、测验本身的因素
测验取材的代表性、测验长度、试题类
第九章 测验的效度
第一节 效度概述
第二节
第三节
估计效度的方法
影响效度的因素
主讲
潘发达(讲师,心理学硕士)
心理测量与评价
70
65
65
50
积差相关:连续变量——连续变量
智商:135 性别: 1
120 2
110 2
100 2
90 1
80 1
70 1
65 2
点二列相关:二分变量——连续变量
主讲 潘发达(讲师,心理学硕士) 心理测量与评价
智商:135
120
110
100
90
80
70
65
成绩: 98
90
92
85
70
50
45
测量单一特质 还是多种特质
出声反应
社会评价 道德判断
心理测量与评价
主讲
潘发达(讲师,心理学硕士)
测验间的相互比较
相容效度 区分效度 因素分析
主讲
潘发达(讲师,心理学硕士)
心理测量与评价
效标效度的研究证明
实验法或观察法证实
类似于“统计分析法——再测法”估计内容效
度
主讲
潘发达(讲师,心理学硕士)
主讲 潘发达(讲师,心理学硕士) 心理测量与评价
思考题:
1.对于一个测验来说,效标效度能提供什
么信息?
2.同时效度与预测效度的根本区别是获得
效标资料的时间不同吗?
3.区分法估计效标效度的原理是什么?
主讲 潘发达(讲师,心理学硕士) 心理测量与评价
第三节
影响效度的因素
一、测验本身的因素
测验取材的代表性、测验长度、试题类
第九章 测验的效度
第一节 效度概述
第二节
第三节
估计效度的方法
影响效度的因素
主讲
潘发达(讲师,心理学硕士)
心理测量与评价
第五章 测量效度_PPT幻灯片
2.根据教育目标的要求,将测验目的具体化为不同层 次的测验目标。教育测验目标一般采用布鲁姆教育目 标分类学中的分类标准,将测验目标分成识记、理解、 应用、分析、综合、评价六个层次。按不同层次的测 验目标对知识点进行分类。
3.确定每一层次目标在整个测验项目中所占的
比重。
4.编制测验双向细目表。
验的效度的考察。
内容效度对各种用于人员选拔和安置的职
业测验也是适用的。职业测验关心的是被试是
否具有从事某项职业的知识、技能等,那么要
明确某项职业所需的全部知识和技能,再对这
些知识和技能进行取样,取出一个有代表性的
样本。
内容效度不适合用于能力倾向测验和人格
测验。
缺点:缺乏理想的数量指标,因而妨碍了信息 交流和各测验的相互比较。
一、内容效度
(一)含义
内容效度是指一个测验实际测到的内容与所要测
量的内容之间的吻合程度。
一个测验要有内容效度必须具备两个条件: 1.要有定义得完好的内容范围
20以内的加减法 中小学生的心理健康的特点和表现。 2.测验项目应是已界定的内容范围的代表性样本
如果把所有的内容视为一个总体,那么测验项目可 以视为一个样本,这个样本要具有代表性,这个样 本能够代表总体的程度就是内容效度。
最高行为测验要求有较高的表面效度,典型
行为测验却要ቤተ መጻሕፍቲ ባይዱ较低的表面效度。
(二)估计方法 1.专家判断法 2.统计法
复本法 (克龙巴赫法) 再测法 内容效度比
专家评定法
这是一种定性分析的方法,由专家对测验项目 与所涉及的内容范围进行符合性判断。
我们以教育测验为例来说明应遵循的程序。
1.确定所要测量的全部内容范围。比如要考察某一学 科测验是否有效度,就要根据教材和教学大纲列出这 门课程的全部知识点。
3.确定每一层次目标在整个测验项目中所占的
比重。
4.编制测验双向细目表。
验的效度的考察。
内容效度对各种用于人员选拔和安置的职
业测验也是适用的。职业测验关心的是被试是
否具有从事某项职业的知识、技能等,那么要
明确某项职业所需的全部知识和技能,再对这
些知识和技能进行取样,取出一个有代表性的
样本。
内容效度不适合用于能力倾向测验和人格
测验。
缺点:缺乏理想的数量指标,因而妨碍了信息 交流和各测验的相互比较。
一、内容效度
(一)含义
内容效度是指一个测验实际测到的内容与所要测
量的内容之间的吻合程度。
一个测验要有内容效度必须具备两个条件: 1.要有定义得完好的内容范围
20以内的加减法 中小学生的心理健康的特点和表现。 2.测验项目应是已界定的内容范围的代表性样本
如果把所有的内容视为一个总体,那么测验项目可 以视为一个样本,这个样本要具有代表性,这个样 本能够代表总体的程度就是内容效度。
最高行为测验要求有较高的表面效度,典型
行为测验却要ቤተ መጻሕፍቲ ባይዱ较低的表面效度。
(二)估计方法 1.专家判断法 2.统计法
复本法 (克龙巴赫法) 再测法 内容效度比
专家评定法
这是一种定性分析的方法,由专家对测验项目 与所涉及的内容范围进行符合性判断。
我们以教育测验为例来说明应遵循的程序。
1.确定所要测量的全部内容范围。比如要考察某一学 科测验是否有效度,就要根据教材和教学大纲列出这 门课程的全部知识点。
最新心理测量技能二级PPT课件
3 粗分按照手册相应用表可转化为平均数为 10标准差为3的量表分
量表分根据相应用表换算成言语智商、操作 智商与总智商
❖ 结果解释 智力等级分布表 掌握超常智商 120-129 边界智商 70-79 重度智力缺陷 20-34
❖ 相关知识 言语测验中的背数,操作测验中的迷津 属于备用测验 分测验主要功能: 重点掌握常识、数字广度、积木、拼图
❖ 案例十二 某求助者做了简明精神病评定量表,量表得分为36分 单选:98.简明精神病评定量表的英文缩写为( ) (A)HAMA (B) BPRS (C) BRMS (D) CBCL 单选:99.简明精神病评定量表一般评定病人近( )的 症状情况 (A) 1周 (B)2周 (C)2-6周 (D) 6周 多选:100.根据测验结果,说明该求助者( )
80.( )不属于HAMD因子。 A.睡眠障碍 B.认知障碍 C.日夜变化 D.情绪障碍
❖ 结果解释
总分较好地反映了病情的严重程度
对于24项版本,总分超过35分可能为严重抑 郁,超过20分可能是轻或中度抑郁,小于8分 没有抑郁症状
17项版本分别为24、17和7分
❖ 常用抑郁测评工具
自评类:Beck抑郁问卷、SDS 他评类:蒙哥马利抑郁评定量表、抑郁症状 问卷、Raskin量表等
单选:99.按照我国HAMA量表协作组提供的资料,提示被试 者可能有( )。
A.明显抑郁 B.严重抑郁
C.明显焦虑 D.严重焦虑
多选:100.HAMA量表的施测方法是( )
A.自评
B.他评
C.各项采用1~5分评定 D.各项采用0~4分评定
第三单元 简明精神病评定量表(BPRS)
❖ BPRS由Overall和Gorham编制,精神科广泛 应用的量表之一,初版为16项,后增加为18 项,教材选用18项版本按5类因子记分,我国 量表协作组增添了“工作和自知力”两个项 目
心理测量学(详细)PPT课件
(二)教学目的 通过学习,要求学生掌握心理测量的基本知识、心理测量的编制和实施、以及良好
测量所要求具备的基本条件。更重要的是,通过本课程的学习要使学生熟练掌握不同 心理测量的实际应用。
(三)教学内容 本课程的主要教学内容有:心理测量的基本内涵及其评价和测量的一般步骤和方
法两部分。内容涉及一般测量解析,测量的要素及量表类型,测验信、效度、难度和 区分度,测量的一般步骤和方法,智力测验、人格测验等心理测验,以及心理测量的 综合应用和心理测量理论的新发展等内容。
6
第二章 经典测验理论的基本假设
教学要点: 通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性,
心里测量的误差和种类,以及真分数的含义等内容。 教学时数:[6学时]
教学内容: 一、心理特质(Trait)及其可测性假设
1.经典测验(Classical Test Theory ,CTT)理论 2.特质假设
3
二、测量的要素及量表类型 1.测量的要素 识记: 单位(Unit),参照点(Reference Point),量表(Scale) 2.量表类型 (1)称名量表 称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说 明事物与事物之间差异的大小、顺序的先后及质的优劣。 (2)顺序变量 顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列 的变量,具有等级性和次序性的特点。 (3)等距变量 等距变量除能表明量的相对大小外,还具有相等的单位。 (4)比率变量 比率变量除了具有量的大小、相等单位外,还有绝对零点。
5
(五)心理测量的道德准则 1.心理测量工作者的素质要求 (1)心理测量工作的知识结构.(2)对心理测量的态度 2.心理测量工作者的道德准则 (1)测验的保密和控制原则(2)测验中个人隐私的保护
测量所要求具备的基本条件。更重要的是,通过本课程的学习要使学生熟练掌握不同 心理测量的实际应用。
(三)教学内容 本课程的主要教学内容有:心理测量的基本内涵及其评价和测量的一般步骤和方
法两部分。内容涉及一般测量解析,测量的要素及量表类型,测验信、效度、难度和 区分度,测量的一般步骤和方法,智力测验、人格测验等心理测验,以及心理测量的 综合应用和心理测量理论的新发展等内容。
6
第二章 经典测验理论的基本假设
教学要点: 通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性,
心里测量的误差和种类,以及真分数的含义等内容。 教学时数:[6学时]
教学内容: 一、心理特质(Trait)及其可测性假设
1.经典测验(Classical Test Theory ,CTT)理论 2.特质假设
3
二、测量的要素及量表类型 1.测量的要素 识记: 单位(Unit),参照点(Reference Point),量表(Scale) 2.量表类型 (1)称名量表 称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说 明事物与事物之间差异的大小、顺序的先后及质的优劣。 (2)顺序变量 顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列 的变量,具有等级性和次序性的特点。 (3)等距变量 等距变量除能表明量的相对大小外,还具有相等的单位。 (4)比率变量 比率变量除了具有量的大小、相等单位外,还有绝对零点。
5
(五)心理测量的道德准则 1.心理测量工作者的素质要求 (1)心理测量工作的知识结构.(2)对心理测量的态度 2.心理测量工作者的道德准则 (1)测验的保密和控制原则(2)测验中个人隐私的保护
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
智力随年龄而增长; 智力与学业成绩有密切关系; 智商是相对稳定的; 智力受遗传的影响。
3、估计方法
测验内方法 测验间方法 效标效度 实验法或观察法的证实
3、估计方法
1)对测验本身的分析——测验内方法
研究测验内部构造分析测验的结构效度。 具体方法
内容效度法 内部一致性法 分析解题的心理过程
提出理论 提出假设 检验假设
解释被试的 测验表现
测验成绩 的假设
逻辑和实证 检验方法
关于情绪稳定性的假设
测验分数和心理学家的评价有某种程度的相关; 精神病人和正常人的测验分数是有区别的; 测验分数和同伴的评价有一定的关系; 测验分数与IQ没有什么关系; 测验分数和性别没有关系。
关于智力的假设
(一)内容效度
1、概念
定义:测验对于应测内容的代表性程度。 内容高的条件:
内容范围明确 取样有代表性
应用:
成就测验 职业选择测验
2、特性
特定性:测验编制者与使用者的关系 避免与表面效度( face validity )混淆
❖ 一个测验看上去适合欲测目的的程度,而非实 际适合欲测目的的程度。 ❖ 测验在使用者或被试主观上感觉有效的程度。 ❖ 编制测验应适当考虑表面效度。
基本原理 总变异=共同因素+特殊因素+误差
(美)霍尔津格(Holzinger)和斯温 福德(Swineford)的因素分析
取样:芝加哥校区
被试:145名7~8年级学生 内容:实施24个心理测验 结果:
4个基本因素 图--词测验和数--图测验的功能不明显。
24个心理测验的因素归类
词语
速度
推理
记忆
1.一般知识 5.加法 11.视知觉 15.数字游戏 19.词汇识别
段落理解 6.编码 2.句子填空 7.计数 3.词汇分类 8.点子 4.词义解释 9.直-曲
12.体积 13. 面积 14.打旗
16.问题推理 20.数字识别 17.系列填空 21.图形识别 18.演绎推理 22.实物-数
SX 2SV 2SI2SE 2
(三)效度的特点
效度是一个相对的概念。 效度是两种误差的综合反映。 效度的确定要从多方面搜集证据。
二、效度评估的方法
根据人们对测验目的解释的不同: 内容效度 结构效度 效标效度
考研题
(一)内容效度
(content validity)
概念 评估方法 特性
(Validity)
效度的概念 效度评估的方法 影响效率的因素
一 、效度的概念
效度的定义 效度的特点
一、效度的概念
(一)效度的定义
信度 S²X= S²T + S²E
随机 误差
有效方差 S²V
系统误差 S²I
效度 S²X= S²V + S²I + S²E
(二)信度与效度的关系
信度是效度的必要条件 非充分条件
再测信度 首测---训练---再测---成绩提高
(二)构想效度
(construct validity)
定义 确定步骤 估计方法
(二)构想效度
1、定义
构想(结构)
解释行为的理论框架或心理特质的抽象概念。
结构效度
测验在多大程度上测量了所要测的理论构想。
应用
智力测验和人格测验
2、确定步骤
1、定义
效标效度是指一个测验对处于特定情境 中的个体行为进行估计的有效性。
一个测验是否有效,应以实践的效果来作 为检词
24. 数-图
3)效标效度的研究证明
测验效标
效标效度资料:提供与结构效度有关的信息。
4)实验法和观察法的证实
考察实验变量对X的影响
比较实验处理:前后分数的差异
搜集某些变异上的证据。
(三)效标效度
criterion-related validity 定义 效标 估计方法
最高作为测验表面效度可高些 其他测验则希望表面效度低些
3、评估方法
1)专家判断法(逻辑分析法)
含义
专家按测题和假设内容范围作出的符合度判断。
作法与程序
确定总体范围; 编制双向细目表; 选择测验项目; 制定评定量表。
局限
不同专家对内容范围会有不同的理解。 不同专家对同一测验内容效度的判断可能不
①相容效度
concurrent validity 含义
测相同结构的各种测验间应有较高的相关。 求一个新编测验与另一已知结构测验间的相关。
②区分效度
含义
某一特定测验的分数与已知测量不同结构的 测验分数无关。
相关高
说明新测验的效度有问题。
③因素效度
含义
通过对一组测验进行因素分析,找到影响测验分 数的共同因素,每个测验在共同因素上的负荷量 即每个测验与共同因素的相关,称作测验的因素 效度。
否大方? 做游戏时,与人交往时,能与人合得来吗?
卡特尔16PF
16个特质,187个题目 乐群性,聪慧性,稳定性,持续性,兴奋性,
有恒性,敢为性,敏感性,怀疑性,幻想性, 世故性,忧虑性,实验性,独立性,自律性, 紧张性 分测验间关系的分析:特质间相互独立 分测验内项目关系的分析:项目相互联系
②内部一致性法
目的
推断测验是否测量单一特质
方法
极端组比较法(extreme-group method) 二列相关法:求题目与总分的相关 分测验与总分的相关
2)测验间的相互比较——测验间方法
含义
同时考虑几个测验间的关联,考察是否测同一结构。
常用方法
相容效度 区分效度 因素效度
①内容效度法
确定取样内容范围后,利用这些资料 定义测验欲测的结构性质
韦氏智力测验 言语:常识、理解、算术、相似性、词汇、 记忆广度 操作:译码、填图、积木图案、图片排列、 图形拼凑
独生子女合群性测验
内容范围的描述
见到老师、小朋友是否主动打招呼? 愿意自己独自玩,还是与其他孩子一起玩? 语言较多还是较少,见生人时是否害羞?是
一致; 无良好的数量指标描述这种符合性的程度;
2)经验推测法
检查不同年级被试总分与每题分数变化情况 若随年级增高总分和每题通过率也升高,可 推论该测验基本测量了教学内容和目标。
检查不同年龄儿童测验分数的变化情况 是否随年龄增长而增加。
3)统计分析法
信度指标
复本信度 r高:内容效度高(也可能两个都低) r低:至少一个缺乏内容效度
3、估计方法
测验内方法 测验间方法 效标效度 实验法或观察法的证实
3、估计方法
1)对测验本身的分析——测验内方法
研究测验内部构造分析测验的结构效度。 具体方法
内容效度法 内部一致性法 分析解题的心理过程
提出理论 提出假设 检验假设
解释被试的 测验表现
测验成绩 的假设
逻辑和实证 检验方法
关于情绪稳定性的假设
测验分数和心理学家的评价有某种程度的相关; 精神病人和正常人的测验分数是有区别的; 测验分数和同伴的评价有一定的关系; 测验分数与IQ没有什么关系; 测验分数和性别没有关系。
关于智力的假设
(一)内容效度
1、概念
定义:测验对于应测内容的代表性程度。 内容高的条件:
内容范围明确 取样有代表性
应用:
成就测验 职业选择测验
2、特性
特定性:测验编制者与使用者的关系 避免与表面效度( face validity )混淆
❖ 一个测验看上去适合欲测目的的程度,而非实 际适合欲测目的的程度。 ❖ 测验在使用者或被试主观上感觉有效的程度。 ❖ 编制测验应适当考虑表面效度。
基本原理 总变异=共同因素+特殊因素+误差
(美)霍尔津格(Holzinger)和斯温 福德(Swineford)的因素分析
取样:芝加哥校区
被试:145名7~8年级学生 内容:实施24个心理测验 结果:
4个基本因素 图--词测验和数--图测验的功能不明显。
24个心理测验的因素归类
词语
速度
推理
记忆
1.一般知识 5.加法 11.视知觉 15.数字游戏 19.词汇识别
段落理解 6.编码 2.句子填空 7.计数 3.词汇分类 8.点子 4.词义解释 9.直-曲
12.体积 13. 面积 14.打旗
16.问题推理 20.数字识别 17.系列填空 21.图形识别 18.演绎推理 22.实物-数
SX 2SV 2SI2SE 2
(三)效度的特点
效度是一个相对的概念。 效度是两种误差的综合反映。 效度的确定要从多方面搜集证据。
二、效度评估的方法
根据人们对测验目的解释的不同: 内容效度 结构效度 效标效度
考研题
(一)内容效度
(content validity)
概念 评估方法 特性
(Validity)
效度的概念 效度评估的方法 影响效率的因素
一 、效度的概念
效度的定义 效度的特点
一、效度的概念
(一)效度的定义
信度 S²X= S²T + S²E
随机 误差
有效方差 S²V
系统误差 S²I
效度 S²X= S²V + S²I + S²E
(二)信度与效度的关系
信度是效度的必要条件 非充分条件
再测信度 首测---训练---再测---成绩提高
(二)构想效度
(construct validity)
定义 确定步骤 估计方法
(二)构想效度
1、定义
构想(结构)
解释行为的理论框架或心理特质的抽象概念。
结构效度
测验在多大程度上测量了所要测的理论构想。
应用
智力测验和人格测验
2、确定步骤
1、定义
效标效度是指一个测验对处于特定情境 中的个体行为进行估计的有效性。
一个测验是否有效,应以实践的效果来作 为检词
24. 数-图
3)效标效度的研究证明
测验效标
效标效度资料:提供与结构效度有关的信息。
4)实验法和观察法的证实
考察实验变量对X的影响
比较实验处理:前后分数的差异
搜集某些变异上的证据。
(三)效标效度
criterion-related validity 定义 效标 估计方法
最高作为测验表面效度可高些 其他测验则希望表面效度低些
3、评估方法
1)专家判断法(逻辑分析法)
含义
专家按测题和假设内容范围作出的符合度判断。
作法与程序
确定总体范围; 编制双向细目表; 选择测验项目; 制定评定量表。
局限
不同专家对内容范围会有不同的理解。 不同专家对同一测验内容效度的判断可能不
①相容效度
concurrent validity 含义
测相同结构的各种测验间应有较高的相关。 求一个新编测验与另一已知结构测验间的相关。
②区分效度
含义
某一特定测验的分数与已知测量不同结构的 测验分数无关。
相关高
说明新测验的效度有问题。
③因素效度
含义
通过对一组测验进行因素分析,找到影响测验分 数的共同因素,每个测验在共同因素上的负荷量 即每个测验与共同因素的相关,称作测验的因素 效度。
否大方? 做游戏时,与人交往时,能与人合得来吗?
卡特尔16PF
16个特质,187个题目 乐群性,聪慧性,稳定性,持续性,兴奋性,
有恒性,敢为性,敏感性,怀疑性,幻想性, 世故性,忧虑性,实验性,独立性,自律性, 紧张性 分测验间关系的分析:特质间相互独立 分测验内项目关系的分析:项目相互联系
②内部一致性法
目的
推断测验是否测量单一特质
方法
极端组比较法(extreme-group method) 二列相关法:求题目与总分的相关 分测验与总分的相关
2)测验间的相互比较——测验间方法
含义
同时考虑几个测验间的关联,考察是否测同一结构。
常用方法
相容效度 区分效度 因素效度
①内容效度法
确定取样内容范围后,利用这些资料 定义测验欲测的结构性质
韦氏智力测验 言语:常识、理解、算术、相似性、词汇、 记忆广度 操作:译码、填图、积木图案、图片排列、 图形拼凑
独生子女合群性测验
内容范围的描述
见到老师、小朋友是否主动打招呼? 愿意自己独自玩,还是与其他孩子一起玩? 语言较多还是较少,见生人时是否害羞?是
一致; 无良好的数量指标描述这种符合性的程度;
2)经验推测法
检查不同年级被试总分与每题分数变化情况 若随年级增高总分和每题通过率也升高,可 推论该测验基本测量了教学内容和目标。
检查不同年龄儿童测验分数的变化情况 是否随年龄增长而增加。
3)统计分析法
信度指标
复本信度 r高:内容效度高(也可能两个都低) r低:至少一个缺乏内容效度