教育统计与测量第7章效度

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

测验内容范围明确
取样具有代表性
一般用于考查学生学业成绩测验的有效性
表面效度
（1）逻辑分析的方法。其工作思路是请有关专家对测验题目与原定内容范围的吻合程度作出判断。
（2）统计分析法。
科隆巴赫法：从同一个教学内容总体中抽取两套独立的平行测验，用这两个测验来测同一批被试，求其相关。若相关高，表明测验内容效度较高；若相关低，表示测验的内容效度较低。评分一致性考查法：不同评分者之间评分的一致性程度
σV2
σI2
σE2
低效度、高信度
σV2
σI2
σE2
低效度、低信度
根据分析，可得结论如下:1)高信度是高效度的必要条件，而非充分条件。2)效度系数不会大于信度系数的平方根。可以用下式表示：
rxy rxx
1.信度低，效度不可能高。因为如果测量的数据不准确，也并不能有效地说明所研究的对象
同时效度：用于标准化测验的建立
预测效度：常用于评定原测验的预测功能。
可靠性：较高的信度有效性客观性实用性
1.相关法：测验分数与校标分数之间的相关系数，
称为效度系数。相关系数必须达到统计上的显著水平，越高越好。P99 表7.2
2.分组法：将校标分数按规定的分数线分组，成功
组与失败组，然后考查组与组之间原测验分数的差异性是否显著。如果不显著，则可认为原测验效度未达标，如果显著，则效度较高。大样本Z检验，小样本t检验。
第二，一种测验的效度只是高或低的问题。
第三，在教育测量中，效度问题比在其他领域的测量中更为重要。
这是因为：
⑴教育测量的对象大多是精神现象，只能通过对其具有可测性的外部表现（如语言或动作等）的测量，以间接认识其心理活动、心理特征或知识水平等。
⑵学生的心理活动、心理特征与其外部表现之间，一般仅具有相关关系而无函数关系，外部行为并不能准确无误地反映某种心理状态。
⑶教育测量的对象不是物而是有主观能动性的人。人能有意识地调节自己的外部行为，掩盖自己的内心活动，这就增加了认识其精神现象的难度。
在实际测量中，影响效度的主要因素是系统误差。
因而在讨论效度时，还必须把真分数方差分解为两
个部分，一是潜在真分数方差（σV2），另一部分是系统误差分数方差（σI2），它与由随机误差引起的变异（σE2）不同。
1974年美国心理学会发行的《教育和心理测量的标准》一书将效度分为三大类：内容效度、效标关联效度和结构效度。
又称合理效度或逻辑程度，是指测验内容或行为取样的代表性和适当程度；即测验的内容范围、材料与所要测量的内容范围、教育目标是否相符合；测验中测题所引起的行为是否是所要测量的属性的明确反应；测验的结果是否是一个有代表性的行为样本。
3.预期表法：表的左边是原测验分数，表的右边是校标分数，这两种分数都以等级排列。表中间的数字不是绝对数而是相对数，以原测验得若干分的人数除其中列入各种等级的人数所得的百分数。用从左下角至右上角对角线上的数字所占的百分比表示效度高低。
4.命中取舍法：正确决定的比例。命中：预测成功—事实成功预测失败—事实失败失败：预测成功—事实失败预测失败—事实成功
2 T
2 V
2 I
因而，
2 x
V2
2 I
2 E
所以可以将效度rxy定义为
潜在真分数方差（
V2）实得分数方差（
2）之比，
x
即：rxy
2 V
2 x
2 x
(
2 I
2 E
)
2 x
1
2 I
பைடு நூலகம்
2 x
2 E
rxx
2 I 2 x
可将效度与信度的关系图解于后：
σV2
σI2
σE2
高效度、高信度
一、效度的概念二、效度的统计学原理及其与信度的关系三、效度的估计四、提高效度的方法
效度（Validity）是指测量结果的准确性和有效
性的程度，亦即测量是否达到了预期的目的。
第一，效度是一个相对的概念。
◦ 1.测量的效度始终是对一定的测量目的而言的。 ◦ 2.测量的效度是相对于测量的结果而言的。
因素是否成立。
又可称为经验效度或统计效度，是以测验分数和效标之间的相关系数来表示测验效度的高低的。
效标就是足以显示测验所欲测量的特性的变量或足以显示测验所欲预测的特性的变量。它是用来检验测验效度的外在的、客观的标准和尺度。
效标关联效度又可分为同时效度和预测效度。
（用全国高考的成绩作为效标来检验高中毕业生会考的成绩，计算两者之间的相关系数就是会考的同时效度；而用大学一年级的成绩作为效标来检验高考的成绩，计算两者的相关系数就是高考的预测效度。）
前后测比较法：训练前后测验的差异
内容效度主要应用于成就测验、学科测验、选拔和分类职业测验。内容效度不适合用于能力倾向和人格测验。
结构效度是指一个测量能实际测量出理论上的构想或心理特性的程度。它的目的在于从心理学的理论观点就测验的结果加以解释和探讨。
这里的结构的含义是心理学理论所涉及的抽象而属假设性的概念、构想、特性或变量，如智力、焦虑、机械能力倾向、成就、动机等。
当实际测量的资料无法证实我们的理论假设时，并不一定就表明该测验结构效度高。因为还有可能出现理论假设不成立，或者该实验设计不能对该假设作适当的检查等情况，这就使得结构效度的获取更为困难。
A、提出理论假设； B、根据假定结构拟定测题，编制测验； C、以测验结果为根据来验证假设结构中的各种
2.信度高，效度未必高。例如，如果我们准确地测量出某人的经济收入，也未必能够说明他的消费水平。
3.效度低，信度很可能高。例如，即是一项研究未能说明社会流动的原因，但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。
4.效度高，信度也必然高。
效度估计就是多方寻找证据来证明一个测验的有效性程度的过程。
结构效度主要用于智力测验、人格测验等一些心理测验方面。
例如：人的创造力可以分解为人的思维流畅性、灵活性和创造性三大特性，并根据这三大特性编制测验，若有足够的证据来证明该测验确实可以测到这些特性，则认为该测验是个结构效度较高的创造力测验。
结构效度的大小完全取决于事先假定的心理特质理论，一旦人们对同一种心理特质有着不同的定义或假设，则会使得关于特质测验的结构效度的研究结果无法比较。

教育统计与测量 第7章 效度

教育统计与测量第7章效度