教育统计与测量 第7章 效度

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测验内容范围明确
取样具有代表性
一般用于考查学生学业成绩测验的有效性
表面效度
(1)逻辑分析的方法。其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。
(2)统计分析法。
科隆巴赫法:从同一个教学内容总体中抽取两套独立的 平行测验,用这两个测验来测同一批被试,求其相关。 若相关高,表明测验内容效度较高;若相关低,表示测 验的内容效度较低。 评分一致性考查法:不同评分者之间评分的一致性程度
σV2
σI2
σE2
低效度、高信度
σV2
σI2
σE2
低效度、低信度
根据分析,可得结论如下:1)高信度是高效度的必要条 件,而非充分条件。2)效度系数不会大于信度系数的 平方根。可以用下式表示:
rxy rxx
1.信度低,效度不可能高。因为如果测量的数据不 准确,也并不能有效地说明所研究的对象
同时效度:用于标准化测验的建立
预测效度:常用于评定原测验的预测功能。
可靠性:较高的信度 有效性 客观性 实用性
1.相关法:测验分数与校标分数之间的相关系数,
称为效度系数。相关系数必须达到统计上的显著水 平,越高越好。P99 表7.2
2.分组法:将校标分数按规定的分数线分组,成功
组与失败组,然后考查组与组之间原测验分数的差 异性是否显著。如果不显著,则可认为原测验效度 未达标,如果显著,则效度较高。大样本Z检验, 小样本t检验。
第二,一种测验的效度只是高或低的问题。
第三,在教育测量中,效度问题比在其他领域的 测量中更为重要。
这是因为:
⑴教育测量的对象大多是精神现象,只能通过对其 具有可测性的外部表现(如语言或动作等)的测量 ,以间接认识其心理活动、心理特征或知识水平等 。
⑵学生的心理活动、心理特征与其外部表现之间, 一般仅具有相关关系而无函数关系,外部行为并不 能准确无误地反映某种心理状态。
⑶教育测量的对象不是物而是有主观能动性的人。 人能有意识地调节自己的外部行为,掩盖自己的内 心活动,这就增加了认识其精神现象的难度。
在实际测量中,影响效度的主要因素是系统误差。
因而在讨论效度时,还必须把真分数方差分解为两
个部分,一是潜在真分数方差(σV2),另一部分 是系统误差分数方差(σI2) ,它与由随机误差引 起的变异(σE2)不同。
1974年美国心理学会发行的《教育和心理测量 的标准》一书将效度分为三大类:内容效度、效 标关联效度和结构效度。
又称合理效度或逻辑程度,是指测验内容或行为 取样的代表性和适当程度;即测验的内容范围、 材料与所要测量的内容范围、教育目标是否相符 合;测验中测题所引起的行为是否是所要测量的 属性的明确反应;测验的结果是否是一个有代表 性的行为样本。
3.预期表法:表的左边是原测验分数,表的右边是 校标分数,这两种分数都以等级排列。表中间的数 字不是绝对数而是相对数,以原测验得若干分的人 数除其中列入各种等级的人数所得的百分数。用从 左下角至右上角对角线上的数字所占的百分比表示 效度高低。
4.命中取舍法:正确决定的比例。 命中:预测成功—事实成功 预测失败—事实失败 失败:预测成功—事实失败 预测失败—事实成功
2 T
2 V
2 I
因而,
2 x
V2
2 I
2 E
所以可以将效度rxy定义为
潜在真分数方差(
V2)实得分数方差(
2)之比,
x
即:rxy
2 V
2 x
2 x
(
2 I
2 E
)
2 x
1
2 I
பைடு நூலகம்
2 x
2 E
rxx
2 I 2 x
可将效度与信度的关系图解于后:
σV2
σI2
σE2
高效度、高信度
一、效度的概念 二、效度的统计学原理及其与信度的关系 三、效度的估计 四、提高效度的方法
效度(Validity)是指测量结果的准确性和有效
性的程度,亦即测量是否达到了预期的目的。
第一,效度是一个相对的概念。
◦ 1.测量的效度始终是对一定的测量目的而言的。 ◦ 2.测量的效度是相对于测量的结果而言的。
因素是否成立。
又可称为经验效度或统计效度,是以测验分数和 效标之间的相关系数来表示测验效度的高低的。
效标就是足以显示测验所欲测量的特性的变量或 足以显示测验所欲预测的特性的变量。它是用来 检验测验效度的外在的、客观的标准和尺度。
效标关联效度又可分为同时效度和预测效度。
(用全国高考的成绩作为效标来检验高中毕业生会考的 成绩,计算两者之间的相关系数就是会考的同时效度; 而用大学一年级的成绩作为效标来检验高考的成绩,计 算两者的相关系数就是高考的预测效度。)
前后测比较法:训练前后测验的差异
内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。 内容效度不适合用于能力倾向和人格测验。
结构效度是指一个测量能实际测量出理论上的构想或 心理特性的程度。它的目的在于从心理学的理论观点 就测验的结果加以解释和探讨。
这里的结构的含义是心理学理论所涉及的抽象而属假 设性的概念、构想、特性或变量,如智力、焦虑、机 械能力倾向、成就、动机等。
当实际测量的资料无法证实我们的理论假设时 ,并不一定就表明该测验结构效度高。因为还 有可能出现理论假设不成立,或者该实验设计 不能对该假设作适当的检查等情况,这就使得 结构效度的获取更为困难。
A、提出理论假设; B、根据假定结构拟定测题,编制测验; C、以测验结果为根据来验证假设结构中的各种
2.信度高,效度未必高。例如,如果我们准确地测 量出某人的经济收入,也未必能够说明他的消费水 平。
3.效度低,信度很可能高。例如,即是一项研究未 能说明社会流动的原因,但它很有可能很精确很可 靠地调查各个时期各种类型的人的流动数量。
4.效度高,信度也必然高。
效度估计就是多方寻找证据来证明一个测验的有 效性程度的过程。
结构效度主要用于智力测验、人格测验等一些心理测 验方面。
例如:人的创造力可以分解为人的思维流畅性、灵活 性和创造性三大特性,并根据这三大特性编制测验, 若有足够的证据来证明该测验确实可以测到这些特性 ,则认为该测验是个结构效度较高的创造力测验。
结构效度的大小完全取决于事先假定的心理特 质理论,一旦人们对同一种心理特质有着不同 的定义或假设,则会使得关于特质测验的结构 效度的研究结果无法比较。
相关文档
最新文档