第二章 教育测量的质量指标2(效度)

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、效度的概念
• 这是因为:
• ⑴教育测量的对象大多是精神现象,只能通过对其 具有可测性的外部表现(如语言或动作等)的测量, 以间接认识其心理活动、心理特征或知识水平等。
• ⑵学生的心理活动、心理特征与其外部表现之间, 一般仅具有相关关系而无函数关系,外部行为并不 能准确无误地反映某种心理状态。
• ⑶教育测量的对象不是物而是有主观能动性的人。 人能有意识地调节自己的外部行为,掩盖自己的内 心活动,这就增加了认识其精神现象的难度。
σV2
σI2
σE2
高效度、高信度
σV2
σI2
σE2
低效度、高信度Leabharlann Baidu
σV2
σI2
σE2
低效度、低信度
根据分析,可得结论如下:1)高信度是高效度的必要条 件,而非充分条件。2)效度系数不会大于信度系数的 平方根。可以用下式表示:
rxy rxx 公式(2 4)
三、效度的估计
• 效度估计就是多方寻找证据来证明一个测 验的有效性程度的过程。
• 估计内容效度的方法:
估计内容效度的方法:
(1)逻辑分析的方法。其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。
(2)统计分析法。从同一个教学内容总体中抽取两套 独立的平行测验,用这两个测验来测同一批被试,求其 相关。若相关高,表明测验内容效度较高;若相关低, 表示测验的内容效度较低。
• 1974年美国心理学会发行的《教育和心 理测量的标准》一书将效度分为三大类: 内容效度、效标关联效度和结构效度。
(一)内容效度(Content validity)
• 又称合理效度或逻辑程度,是指测验内容 或行为取样的代表性和适当程度;即测验 的内容范围、材料与所要测量的内容范围、 教育目标是否相符合;测验中测题所引起 的行为是否是所要测量的属性的明确反应; 测验的结果是否是一个有代表性的行为样 本。
峰对称分布,当然样本并不一定要正态。
• ③必须是成对的数据,而且每对数据之间是相互独立的,即各 自互不影响,本条件是难以检验的。
• ④两个变量之间呈线性关系。一般用描绘散点图的方式来观察, 最好是先各自转化为Z分数,单位会统一些。
例:
某中学数学教研组的教师积多年的教学法经验,认为刚入 高中的学生学习立体几何感到困难的主要原因是空间想像力 弱。
1、用积差相关系数的方法估计效度
• 积差相关,是计算两个变量线性相关的一种方法,由英国统计 学家皮尔逊提出,因此也称为皮尔逊(Pearson)相关。要使用 积差相关必须同时具备如下几个条件:
• ①两个变量都是由测量获得的连续性数据,即等距或等比数据。 • ②两个变量的总体都呈正态分布,或接近正态分布,至少是单
第二章 教育测量的质量指标
第二节 效度
第二节 效度
一、效度的概念 二、效度的统计学原理及其与信度的关系 三、效度的估计 四、提高效度的方法
一、效度的概念
• 效度(Validity)是指测量结果的准确性和有效
性的程度,亦即测量是否达到了预期的目的。 • 第一,效度是一个相对的概念。
– 1.测量的效度始终是对一定的测量目的而言的。 – 2.测量的效度是相对于测量的结果而言的。 • 第二,一种测验的效度只是高或低的问题。 • 第三,在教育测量中,效度问题比在其他领域的 测量中更为重要。
二、效度的统计学原理及其与信度的关系 1、效度的统计学原理
在实际测量中,影响效度的主要因素是系统误差。 因而在讨论效度时,还必须把真分数方差分解为两 个部分,一是潜在真分数方差(σV2),另一部分 是系统误差分数方差(σI2) ,它与由随机误差引 起的变异(σE2)不同。
2 T
2 V
2 I
(公式2
1)
因而,
2 x
2 V
2 I
2 E
(公式2
2)
所以可以将效度rxy定义为
潜在真分数方差(
V2)实得分数方差(
2)之比,
x
即:rxy
2 V 2 x
2 x
(
2 I 2 x
2 E
)
1
2 I
2 x
2 E
(公式2 3)
rxx
2 I
2 x
2、效度与信度的关系
根据公式(2-2)和(2-3),可将效度与信度的关 系图解于后:
采用求统计量的公式进行计算,其公式有以下三种形式:
内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。
内容效度不适合用于能力倾向和人格测验。
(二)效标关联效度
• 又可称为经验效度或统计效度,是以测验分数和 效标之间的相关系数来表示测验效度的高低的。
• 效标就是足以显示测验所欲测量的特性的变量或 足以显示测验所欲预测的特性的变量。它是用来 检验测验效度的外在的、客观的标准和尺度。
就现有资料,用什么方法可以判断教师们的意见是否正确?
表2-1:
(答对的题数) 1 2 3 4 5 6 7 8 9 10
A5
所B 4
评 的 等
C D
3 2
级E 1
1 3 10 5 4 2 1 6 8 8 4 31 2459831 1 13211 11211
解:(1)设期末考试的等第为y,空间想像力测 验答对的题数为x,列出二重交叉次数分布表:
• 效标关联效度又可分为同时效度和预测效度。
(用全国高考的成绩作为效标来检验高中毕业生会考的 成绩,计算两者之间的相关系数就是会考的同时效度; 而用大学一年级的成绩作为效标来检验高考的成绩,计 算两者的相关系数就是高考的预测效度。)
• 估计效标关联效度可采用积差相关、二列相关或 点二列相关、四格相关和多元相关系数等计算各 种相关系数。
为了证明这个论点,他们让刚入高中的103名学生作10道 题,测量其空间想像力。为避免知道了某些学生的刚入高中 时的成绩影响以后考试的评分,试卷暂不评阅。立体几何学 完后,进行考试,按得分多少把成绩分为五等(A、B、C、D、 E)分别得5、4、3、2、1分。这时才评阅入学时的试卷,统 计出期末得5、4、3、2、1分者在入学测验中分别答对1道题 至10道题的人数(见表2-1)。
X(答对的题数) 1 2 3 4 5 6 7 8 9 10
Y A5
1 3 10 5 4 2 25
所B 4
1 6 8 8 4 31
31
评 的 等
C D
3 2
2459831 1 13211
32 9
级E1 1 1 2 1 1
6
合计 2 4 10 14 20 20 17 9 5 2 103
相关文档
最新文档