教育测量的质量指标2效度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
峰对称分布,当然样本并不一定要正态。 ? ③必须是成对的数据,而且每对数据之间是相互独立的,即各
自互不影响,本条件是难以检验的。 ? ④两个变量之间呈线性关系。一般用描绘散点图的方式来观察,
最好是先各自转化为Z分数,单位会统一些。
例:
某中学数学教研组的教师积多年的教学法经验,认为刚入 高中的学生学习立体几何感到困难的主要原因是空间想像力 弱。
1、用积差相关系数的方法估计效度
? 积差相关,是计算两个变量线性相关的一种方法,由英国统计 学家皮尔逊提出,因此也称为皮尔逊(Pearson)相关。要使用 积差相关必须同时具备如下几个条件:
? ①两个变量都是由测量获得的连续性数据,即等距或等比数据。 ? ②两个变量的总体都呈正态分布,或接近正态分布,至少是单
一、效度的概念
? 这是因为:
? ⑴教育测量的对象大多是精神现象,只能通过对其 具有可测性的外部表现(如语言或动作等)的测量, 以间接认识其心理活动、心理特征或知识水平等。
? ⑵学生的心理活动、心理特征与其外部表现之间, 一般仅具有相关关系而无函数关系,外部行为并不 能准确无误地反映某种心理状态。
? ⑶教育测量的对象不是物而是有主观能动性的人。 人能有意识地调节自己的外部行为,掩盖自己的内 心活动,这就增加了认识其精神现象的难度。
就现有资料,用什么方法可以判断教师们的意见是否正确?
表2-1:
(答对的题数) 1 2 3 4 5 6 7 8 9 10
A5
所B 4
评C 3
的 等
D
2
级E 1
1 3 10 5 4 2 1 6 8 8 4 31 2459831 1 13211 11211
解:(1)设期末考试的等第为 y,空间想像力测 验答对的题数为 x,列出二重交叉次数分布表:
为了证明这个论点,他们让刚入高中的 103名学生作10道 题,测量其空间想像力。为避免知道了某些学生的刚入高中 时的成绩影响以后考试的评分,试卷暂不评阅。立体几何学 完后,进行考试,按得分多少把成绩分为五等( A、B、C、D、 E)分别得5、4、3、2、1分。这时才评阅入学时的试卷,统 计出期末得5、4、3、2、1分者在入学测验中分别答对1道题 至10道题的人数(见表2-1)。
采用求统计量的公式进行计算,其公式有以下三种形式:
内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。
内容效度不适合用于能力倾向和人格测验。
(二)效标关联效度
? 又可称为经验效度或统计效度,是以测验分数和 效标之间的相关系数来表示测验效度的高低的。
? 效标就是足以显示测验所欲测量的特性的变量或 足以显示测验所欲预测的特性的变量。它是用来 检验测验效度的外在的、客观的标准和尺度。
?
? ?
2 I 2 x
2、效度与信度的关系
根据公式( 2-2)和(2-3),可将效度与信度的关 系图解于后:
σV2
σI2
σE2
高效度、高信度
σV2
σI2
σE2
低效度、高信度
σV2
σI2
σE2
低效度、低信度
根据分析,可得结论如下 :1)高信度是高效度的必要条 件,而非充分条件。 2)效度系数不会大于信度系数的 平方根。 可以用下式表示:
二、效度的统计学原理及其与信度的关系 1、效度的统计学原理
在实际测量中,影响效度的主要因素是系统误差。 因而在讨论效度时,还必须把真分数方差分解为两 个部分,一是潜在真分数方差(σ V2),另一部分 是系统误差分数方差(σ I2) ,它与由随机误差引 起的变异(σ E2)不同。
?
2 T
?
?
2 V
?
? 效标关联效度又可分为 同时效度 和预测效度 。
(用全国高考的成绩作为效标来检验高中毕业生会考的 成绩,计算两者之间的相关系数就是会考的同时效度; 而用大学一年级的成绩作为效标来检验高考的成绩,计 算两者的相关系数就是高考的预测效度。)
? 估计效标关联效度可采用积差相关、二列相关或 点二列相关、四格相关和多元相关系数等计算各 种相关系数。
?
2 I
(公式2 ? 1)
因而,?
2 x
?
?
2 V
??
2 I
??
2 E
(公式2 ? 2)
所以可以将效度 rxy定义为
潜在真分数方差(? V2)实得分数方差( ? x2)之比,
即:rxy
?
?
2 V
?
2 x
?
?
2 x
?
(?
?
2 I
?
?
2
x
2 E
)
?
1?
?
2 I
?
?
?
2 x
2 E
(公式2 ? 3)
?
rxx
X(答对的题数) 1 2 3 4 5 6 7 8 9 10
Y A5
1 3 10 5 4 2
25
所B 4
1 6 8 8 4 31
31
评C 3
2459831
32
的 等
D
2
1 13211
9
级E 1 1 1 2 1 1
第二章 教育测量的质量指标
第二节 效度
第二节 效度
一、效度的概念 二、效度的统计学原理及其与信度的关系 三、效度的估计 四、提高效度的方法
一、效度的概念
? 效度(Validity )是指测量结果的准确性和有效
性的程度 ,亦即测量是否达到了预期的目的。 ? 第一,效度是一个相对的概念。
–1.测量的效度始终是对一定的测量目的而言的。 –2.测量的效度是相对于测量的结果而言的。 ? 第二,一种测验的效度只是高或低的问题。 ? 第三,在教育测量中,效度问题比在其他领域的 测量中更为重要。
? 估计内容效度的方法:
估计内容效度的方法:
(1)逻辑分析的方法。 其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。
(2)统计分析法。从同一个教学内容总体中抽取两套 独立的平行测验,用这两个测验来测同一批被试,求其 相关。若相关高,表明测验内容效度较高;若相关低, 表示测验的内容效度较低。
rxy ? rxx
பைடு நூலகம்
公式(2 ? 4)
三、效度的估计
? 效度估计就是多方寻找证据来证明一个 测验的有效性程度的过程。
? 1974年美国心理学会发行的《教育和心 理测量的标准》一书将效度分为三大类: 内容效度、效标关联效度和结构效度。
(一)内容效度 (Content validity)
? 又称合理效度或逻辑程度,是指测验内 容或行为取样的代表性和适当程度;即 测验的内容范围、材料与所要测量的内 容范围、教育目标是否相符合;测验中 测题所引起的行为是否是所要测量的属 性的明确反应;测验的结果是否是一个 有代表性的行为样本。
自互不影响,本条件是难以检验的。 ? ④两个变量之间呈线性关系。一般用描绘散点图的方式来观察,
最好是先各自转化为Z分数,单位会统一些。
例:
某中学数学教研组的教师积多年的教学法经验,认为刚入 高中的学生学习立体几何感到困难的主要原因是空间想像力 弱。
1、用积差相关系数的方法估计效度
? 积差相关,是计算两个变量线性相关的一种方法,由英国统计 学家皮尔逊提出,因此也称为皮尔逊(Pearson)相关。要使用 积差相关必须同时具备如下几个条件:
? ①两个变量都是由测量获得的连续性数据,即等距或等比数据。 ? ②两个变量的总体都呈正态分布,或接近正态分布,至少是单
一、效度的概念
? 这是因为:
? ⑴教育测量的对象大多是精神现象,只能通过对其 具有可测性的外部表现(如语言或动作等)的测量, 以间接认识其心理活动、心理特征或知识水平等。
? ⑵学生的心理活动、心理特征与其外部表现之间, 一般仅具有相关关系而无函数关系,外部行为并不 能准确无误地反映某种心理状态。
? ⑶教育测量的对象不是物而是有主观能动性的人。 人能有意识地调节自己的外部行为,掩盖自己的内 心活动,这就增加了认识其精神现象的难度。
就现有资料,用什么方法可以判断教师们的意见是否正确?
表2-1:
(答对的题数) 1 2 3 4 5 6 7 8 9 10
A5
所B 4
评C 3
的 等
D
2
级E 1
1 3 10 5 4 2 1 6 8 8 4 31 2459831 1 13211 11211
解:(1)设期末考试的等第为 y,空间想像力测 验答对的题数为 x,列出二重交叉次数分布表:
为了证明这个论点,他们让刚入高中的 103名学生作10道 题,测量其空间想像力。为避免知道了某些学生的刚入高中 时的成绩影响以后考试的评分,试卷暂不评阅。立体几何学 完后,进行考试,按得分多少把成绩分为五等( A、B、C、D、 E)分别得5、4、3、2、1分。这时才评阅入学时的试卷,统 计出期末得5、4、3、2、1分者在入学测验中分别答对1道题 至10道题的人数(见表2-1)。
采用求统计量的公式进行计算,其公式有以下三种形式:
内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。
内容效度不适合用于能力倾向和人格测验。
(二)效标关联效度
? 又可称为经验效度或统计效度,是以测验分数和 效标之间的相关系数来表示测验效度的高低的。
? 效标就是足以显示测验所欲测量的特性的变量或 足以显示测验所欲预测的特性的变量。它是用来 检验测验效度的外在的、客观的标准和尺度。
?
? ?
2 I 2 x
2、效度与信度的关系
根据公式( 2-2)和(2-3),可将效度与信度的关 系图解于后:
σV2
σI2
σE2
高效度、高信度
σV2
σI2
σE2
低效度、高信度
σV2
σI2
σE2
低效度、低信度
根据分析,可得结论如下 :1)高信度是高效度的必要条 件,而非充分条件。 2)效度系数不会大于信度系数的 平方根。 可以用下式表示:
二、效度的统计学原理及其与信度的关系 1、效度的统计学原理
在实际测量中,影响效度的主要因素是系统误差。 因而在讨论效度时,还必须把真分数方差分解为两 个部分,一是潜在真分数方差(σ V2),另一部分 是系统误差分数方差(σ I2) ,它与由随机误差引 起的变异(σ E2)不同。
?
2 T
?
?
2 V
?
? 效标关联效度又可分为 同时效度 和预测效度 。
(用全国高考的成绩作为效标来检验高中毕业生会考的 成绩,计算两者之间的相关系数就是会考的同时效度; 而用大学一年级的成绩作为效标来检验高考的成绩,计 算两者的相关系数就是高考的预测效度。)
? 估计效标关联效度可采用积差相关、二列相关或 点二列相关、四格相关和多元相关系数等计算各 种相关系数。
?
2 I
(公式2 ? 1)
因而,?
2 x
?
?
2 V
??
2 I
??
2 E
(公式2 ? 2)
所以可以将效度 rxy定义为
潜在真分数方差(? V2)实得分数方差( ? x2)之比,
即:rxy
?
?
2 V
?
2 x
?
?
2 x
?
(?
?
2 I
?
?
2
x
2 E
)
?
1?
?
2 I
?
?
?
2 x
2 E
(公式2 ? 3)
?
rxx
X(答对的题数) 1 2 3 4 5 6 7 8 9 10
Y A5
1 3 10 5 4 2
25
所B 4
1 6 8 8 4 31
31
评C 3
2459831
32
的 等
D
2
1 13211
9
级E 1 1 1 2 1 1
第二章 教育测量的质量指标
第二节 效度
第二节 效度
一、效度的概念 二、效度的统计学原理及其与信度的关系 三、效度的估计 四、提高效度的方法
一、效度的概念
? 效度(Validity )是指测量结果的准确性和有效
性的程度 ,亦即测量是否达到了预期的目的。 ? 第一,效度是一个相对的概念。
–1.测量的效度始终是对一定的测量目的而言的。 –2.测量的效度是相对于测量的结果而言的。 ? 第二,一种测验的效度只是高或低的问题。 ? 第三,在教育测量中,效度问题比在其他领域的 测量中更为重要。
? 估计内容效度的方法:
估计内容效度的方法:
(1)逻辑分析的方法。 其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。
(2)统计分析法。从同一个教学内容总体中抽取两套 独立的平行测验,用这两个测验来测同一批被试,求其 相关。若相关高,表明测验内容效度较高;若相关低, 表示测验的内容效度较低。
rxy ? rxx
பைடு நூலகம்
公式(2 ? 4)
三、效度的估计
? 效度估计就是多方寻找证据来证明一个 测验的有效性程度的过程。
? 1974年美国心理学会发行的《教育和心 理测量的标准》一书将效度分为三大类: 内容效度、效标关联效度和结构效度。
(一)内容效度 (Content validity)
? 又称合理效度或逻辑程度,是指测验内 容或行为取样的代表性和适当程度;即 测验的内容范围、材料与所要测量的内 容范围、教育目标是否相符合;测验中 测题所引起的行为是否是所要测量的属 性的明确反应;测验的结果是否是一个 有代表性的行为样本。