第六章效度

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

（3）考察测验的准则关联效度（实证效度）法根据效标把被试分组，考察其得分差异。根据测验得分差异把被试分组，考察其所测特质（行为表现）的差异。
（4）实验操作法控制某些实验条件，观察其对测验分数的影响。如：平时的焦虑测验分数－重大考试前焦虑测验分数
（5）发展水平的变化根据理论，预测：随着年龄的增长，所测心理品质会发生什么变化。
5 建立效度方法的概化用不同方法得到的效度指标是否一致？不同的效度之间是否有矛盾？
二、交叉效度分析交叉效度分析是考察效度概化能力的一种方法，只涉及被试样本的概化。方法：对两个独立取自同一总体的样本分别建立预测源-效标关系，看从一个样本中得到的效度资料是否适用于另一样本。
三、提高测量效度的方法
1、影响测量效度的因素 A．测验的构成项目的质量项目数量测验长度与效度的关系：
n测验增长倍数
B．测验的实施过程 C．被试身心特点：样本特点：常模团体的同质性影响到对被试测验得分的解释，进而影响到测验的效度。
D．效标测量行为与所选效标的相似性越高，效度越高。测验分数与效标行为之间是否是线性关系，如果不是线性关系，求皮尔逊相关就会低估效度。效标本身的测量越可靠，效度就可能越高。
2、结构效度的确定方法（★）
结构效度确立的一般步骤：（1）提出理论框架；（2）依据理论框架推演出有关测验成绩的假设；（3）用逻辑或实证的方法来证明假设。

（1）测验内部寻找证据法 A. 分析测验的内容效度：若内容效度高，说明其结构效度也高。 B. 分析被试对题目反应的特点：有无社会称许性的题目，如“当事情不顺我意时，我时常动怒。” C. 计算测验的同质性信度：单一特质或？
操作定义：总变差中与由所测量的特性造成的变差所占的百分比。
（★）
效度=SV2/SX2=rXY
SX2
SV2 SI2 SE2
ST2
2、效度的性质
① ② ③
效度是针对测验结果的。效度是针对某种特定的测验目的的。效度只有程度上的差异
三、效度的种类
1.
2.
3.
内容效度：测验用的测题对整个测验内容范围的代表性程度。成就测验结构效度：测验能说明心理学上的理论结构或特质的程度。准则关联效度：测验分数对某一行为表现的预测能力。用测验分数和准则分数之间的相关来表示。

定性分析相对主观：理论不统一，理解有差异。
双向细目表

双向细目表包括：测量的内容范围（内容）；学习结果（行为目标）；权重。布鲁纳的教育目标分类学习活动：认知、精神运动、情感认知包括：知识、理解、应用、分析、综合、评价

例：小学自然常识测验编题计划
知识生物世界资源利用动力与机械物质与能量气象宇宙地球合计 3 2 2 5 2 2 2 18 理解 5 3 3 6 4 5 2 28 应用 6 3 4 8 3 4 2 30 分析 3 1 2 3 2 1 1 13 综合 2 1 0 2 2 0 1 8 评价 1 0 1 1 0 0 0 8 合计 20 10 12 25 13 12 8 100
2、提高测量效度的方法

（1）精心编制测验量表，避免出现较大的系统误差. （2）妥善组织测验，控制随机误差。（3）创设标准的应试情境，让每个被试都能发挥正常的水平。（4）选好正确的效标，定好恰当的效标测量，正确地使用有关公式。
补充：效度资料的概化

概化：指在一定条件下得出的结论能否适用于其他情况。测验的效度和信度一样，都与特定情境有关，只有在具体情境下的效度，而没有笼统谈论某一测验的效度。
（三） criterion-related validity
1、criterion
（★） criterFra bibliotekon ：指被预测的行为，是检
验测验是否有效的标准。 Criterion的测量阿斯丁把效标分为两个层次：观念效标：效标的理论定义，如“大学的成功”。效标测量：效标的操作定义，效标测量必须能真正反映观念效标。如大学成绩

（2）复本法用两个测验复本来测同一批被试，用测验的相关来进行估计。若相关高，则内容效度可能高，也可能有相同误差。若相关低，则必有一个测验缺乏内容效度。
（3）再测法前测→教学→后测如果后测成绩优于前测成绩，说明该测验对于教学具有一定的内容效度。
（4）经验法不同的被试团体在测验上的得分和对每题的反应存在较大差异。如：不同的被试团体：高年级－低年级测验上的得分和对每题的反应：总分和题目的通过率。若一致，则：效度高
第六章
效度
一、效度概述二、效度的估计三、影响效度的因素四、效度的应用
第一节
效度概述
一、效度要回答的基本问题 1. 测验测量的是什么？ 2. 测验对它所测量的东西测量到了什么程度？
二、效度的含义
1、什么是效度（★）validity是指测量的有效性，即一个测验对所要测量的心理特质准确测量的程度。说明：（1）效度是一个相对的概念：每个测量工具都有自己的目的；内隐特质通过外显行为间接测得。（2）效度是测量的随机误差和系统误差的综合反映。（3）判断一个测量是否有效要从多方面收集证据
B/（A+B）
（5）功利率比较使用测验所需的费用和所得到的收益，看是否利大于弊。一个测验如果简单易行，省时省钱，不经过特殊训练的人也能掌握，又适合于团体施测，那么，即使效度低一些，也会有人使用。反之，只有效度极高，能给人带来很大好处时，才会使用。
4、标准参照测验的效度

标准参照测验：主要用于检验学习效果，看对指定的内容范围掌握得如何或是否达到某种标准。衡量标准参照测验的主要指标：内容效度
（2）分组法分组依据：根据准则测量成绩分组。考察：测验分数（预测分数）能否区分由准则测量所定义的不同的团体。如：按学习成绩分高低两组：如果高考成绩高，准则测量得分也高；高考成绩低，准则测量得分也低。即：两组之间的测验成绩有显著差异。说明：该测验是有一定效度的。
（3）预期表法方法：把预测源分数和效标分数制成双锥图表，每个变量按水平分成若干档次，然后列出每个档次上的人数百分比。如：
学业成就（智力）临床诊断（人格）实际工作表现（职业倾向）特殊训练成绩（成就）不同团体的总体表现（智力）先前有效的测验等级评定
2、准则关联效度的估计方法
（1）效度系数（相关法）：计算测验分数与准则测量之间的相关系数。优点：数量化；可用回归方程进行个人准则预测缺点：要求预测源与准则呈线性关系；无法提供关于取舍正确性的指标
（二）、结构效度
（★） structure validity：指一个测验实际测到所要测量的理论结构或特质的程度，或者说测验分数能够说明心理学理论的某种结构或特质的程度。
1、结构效度的特点：（1）具有不同理论构思的测验，其结构效度无法进行比较；（2）结构效度有时很难获得；（3）结构效度没有单一的指标，是由各方面的证据累积起来进行评价的。
一、效度概化的五个方面的问题： 1 预测源的概化使用同一测验的不同复本是否同样有效？同一测验对不同分数水平的人的预测是否同样有效？ 2 效标的概化采用不同种类或不同时距的效标，测验是否同样有效？对于效标的不同分数水平是否预测得一样好？
3 施测情境的概化不同的施测者、不同的施测条件以及在不同的指导语或心向下做测验是否同样有效？ 4 被试团体的概化测验对于取自同一总体的另一样本是否同样有效？测验对于不同性别、不同年龄、不同教育水平、不同社会经济地位、不同地区、不同民族、不同学校、不同职业的被试是否同样有效？
① ②
一个测验要有内容效度必须具备两个条件：要有确定好内容范围，项目均在此范围内。测验题目应是所界定的内容范围的代表性取样。（双向细目表）

应用范围：教育成就测验，职业选拔测验。（标准参照测验）
2．内容效度的确定方法（★）
（1）专家判断法（逻辑分析法）专家根据自己的知识经验对测验项目与所涉及的内容范围进行符合性判断。
大学一年级成绩高考成绩 A 高中 60 10 B 40 20 40 30 C D E
低
10
40
40
40
（4）命中率法（取舍正确性）应用范围：预测源和效标都是二分的。
工作表现测验成绩合格不合格不合格 A C 合格 B D
强调社会公平时使用，总命中率=（B+C）/（A+B+C+D）当测验用于提高工作或学习效率时使用，正命中率=
criterion的特性（补）
a.多样性：一个测验可能有不同的观念效标，同一个观念效标又可能有不同的效标测量。 b.复杂性：几乎每一种效标行为都由多种特质构成，包含复杂的成分。 c.特殊性：即使一个普通的效标，在应用时也有特殊性。 d.时间性：近期效标与最后效标
criterion测量的条件（★）
a.有效性：效标测量能真正反映观念效标。 b.可靠性：有较高的信度 c.客观性：效标测量必须能真正反映观念效标，防止效标污染。
效标污染（criterion contamination）是指评定者知道被试的测验分数，因而影响到对效标的客观评定。
d.实用性：经济实用
常用的效标

（2）测验间寻找证据法 A. 相容效度：新老测验之间的相关（两测验测的是同一心理特质）。若相关高，则说明新测验可能有较高的效度。 B. 区分效度：新老测验之间的相关（两测验测的不是同一心理特质），若相关低，则说明新测验可能有较高的效度。 C. 因素分析法：得出的因素符合理论的构思，说明效度高。

计算测验效度所依据的样本必须与选择项目所依据的被试样本不同。如果使用同一样本，则会使效度系数假性的高。实质是循环论证。
具体步骤： ①确定测验内容的总体范围；并描绘出有关知识与技能的轮廓。 ②划分细纲目，并根据重要性规划好各个纲目的加权比例。 ③确定每个项目所测的知识与技能，将自己的分类与测验编制者的纲目作比较。 ④ 编制评定量表。从测验内容所测的技能、题目对所定义的范围的覆盖率、各种题目数量和分数的比例以及题目形式的适当性等方面，对测验作出总的评价。
四、效度与信度的关系（★）（1）信度高是效度高的必要而非充分条件一个测验效度高，其信度也必然高；但一个测验信度高，其效度不一定高。（2）测验的效度受它的信度制约 rXY≤rXX 一个测验的信度必然比效度高，至少相等。
二、效度的估计
（一）、内容效度 1、（★） content validity是指测验项目对欲测的内容或行为范围取样的适当程度，即一个测验实际测到的内容与所要测量的内容之间的吻合程度。