心理学(研究方法)内容精讲(心理测量学-效度)【圣才出品】

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

心理学(研究方法)内容精讲

第四部分心理测量学

第六章效度

测验的效度一般被理解为它能测量的对象的程度。测验具有多种效度,这些效度的确定依赖于测验的具体目的和评估效度的方法。效度所考虑的问题是:测验测量什么,测验对测量目标的测量精确度和真实性有多大?一般说来,效度的作用比信度的作用更为重要。一个测验的效度若很低,则无论其信度有多高,也是无用的。高的效度,是一个良好测验最重要的特性,是选择和评鉴测验的重要依据。

第一节效度的基本问题

一、什么是效度

效度指的是测量的正确性,即一个测验或量具能够测量出其所要测量的东西的程度。效度所要回答的基本问题是:一个测验测量什么特性?它对所要测量的特性测得有多准?效度是科学测量工具最重要的必备条件,选用标准测验或自行设计编制测量工具,必须首先评鉴其效度。在评鉴测验的效度时,必须考虑其目的与功能。只有所测得的结果符合该测验的目的,才能认为它是个有效的测量工具。另外,测验是根据行为样本,对所要测量的心理特性作间接的推断,只能达到某种程度的正确性,而且测验的效度常以相关系数表示,只有程度上的不同而非全有与全无的差别,因此测验的效度是相对的而非绝对的。

一组测验分数的总变异包括三部分;真实的、稳定的、与测量目的有关的变异;真实的、但出自无关来源的变异;随机误差的变异。

在测量理论中,效度被定义为:在一组测量中,与测量目的有关的真实变异数(由所要测量的变因引起的有效变异)与总变异数(实得变异数)的比率,即

效度=2

22/XY

X V R S S 这里2XY R 代表测量的效度系数,2V S 代表有效变异数,2X S 代表总变异数。

一个测验的效度表明,在一组测验分数中,有多大比例的变异数是由测验所要测量的变异引起的。二、效度和信度的关系

信度和效度的差别在于所涉及的误差不同。信度考虑的是随机误差的影响,效度的误差则还包括由于测量了对测验目的来说无关的变量所引起的系统误差。信度高不一定效度高,但一个测验的效度高的话,测验的信度必须高。换句话说,一个测验对某一个目的具有一定的信度,但并不一定是有效的;而一个测量工具如果对某一个目的是有效的,那么它一定是可信的。

三、影响效度的因素

凡是能产生随机误差和系统误差的因素都会降低测验的效度。一个效度低的测验,其得分在很大程度上受到与测验目的无关的因素影响,而效度高的测验则受无关因素影响很小。对效度有普遍影响的因素,可归纳为下列三方面:

(一)测验组成方面

试题是构成测验的要素,测验之效度取决于试题性能。凡测验的取材,测验长度、试题的区分度。难度及其编排方式等皆与效度有关。要想提高测验的效度,须谨慎选择测验材料,适当安排测验的长度,使试题具有相当的鉴别力而且难易程度适中。

(二)测验实施方面

测验的实施程序是影响效度的重要因素。若主试能适当控制测验情景,遵照测验手册的各项规定而实施,就能避免外在因素对测验结果的影响。在测验实施的过程中,如果场地的布置、材料的准备、作答方式的说明、时间的限制等任何一方面不遵照标准化的程序进行,都会使效度降低,失去测验的意义。

(三)被试反应方面

被试的兴趣、动机、情绪、态度和身心健康状况等,都能影响他在测验情景中的行为反应。被试是否充分合作,也会影响测验结果的可靠性与正确性。

四、效度的种类

测验的效度分为三大类:内容效度、构想效度、效标效度。

1.内容效度指测验题目在要测量的行为领域的代表性。内容效度的评估方法主要应用于对学绩测验的评估。

2.构想效度是指一个测验对某种心理学理论所涉及的抽象概念或心理特质测得如何。

3.效标效度又称实证效度,指的是测验对研究者所感兴趣的外在行为能够做出多好的预测。这种外在行为是衡量测验是否有效的标准,简称效标。

第二节内容效度

一、什么是内容效度

内容效度指的是测验题目对有关内容或行为范围取样的适当性。这种测验的效度主要与测验内容有关,所以叫内容效度。

一个测验要有内容效度必须具备两个条件:

1.要有定义得完好的内容范围

内容范围,可以是一个明确而有限的题目总体,也可以是由编制者界定的一些范围较广的材料与技能;可以包括具体的知识,也可以包括复杂的行为。

2.测验题目应是所界定的内容范围的代表性取样

所谓代表性取样,指根据材料与技能的重要性来选题目,而非随机取样,以便使选出的题目能包含所测内容范围的主要方面,并使各方面题目比例适当。测验题目并不需要包罗该范围的所有材料,而只需包含测验编制者认为是重要的材料。

二、确定内容效度的方法

(一)专家判断

为了确定一个测验是否具有内容效度,最常用的方法是请有关专家对测验题目与原定内容范围的符合性做出判断。为了提高判断过程的客观性,可采用以下几个步骤:1.定义好内容总体,描绘出有关知识与技能的轮廓。

2.划分细纲目,并根据重要性规定好各纲目的比例,对内容范围作尽可能详尽的描述。

3.确定每个题目所测的内容与技能,并与测验编制者所列的双向细目表对照,逐题将自己的分类与编制者的分类作比较。

4.制定评定量表,从测验内容所测的技能、题目对所定义的范围的覆盖率,各种题目数量和分数的比例以及题目形式对内容的适当性等方面,对测验做出总的评价。

(二)统计分析

内容效度可由一组被试在独立取自同样内容范围的两个测验复本上得分之相关来作数量的估计。若相关低,说明二者至少有一个缺乏内容效度;若相关高,一般可推论测验有内

容效度。

(三)经验法

检查不同年级的学生在测验上的得分和在每个题目上的反应情况。一般说来,测验总分和题目通过率随年级而提高,便是测验具有内容效度的证据。

三、内容效度的特点

(一)内容效度的特定性

内容效度不是普遍适用的,而是根据具体情况分析得来的,如果测验编制者和测验使用者二者定义的内容范围相同,则编制者报告的内容效度对使用者而言是有意义的,否则就没有意义。此外,内容效度也有时间上的特定性,适合过去总体的代表性样本,未必符合现在的总体,因此内容范围定义的不同,会降低测验的内容效度。

(二)内容效度常与表面效度混淆

表面效度是由受测者、使用测验者的行政人员及其他没有受过专门训练的观察者来看,这个测验是否有效,也就是从表面上来看,测验题目与测量目的是否一致。表面效度是由外行对测验作表面上的检查而确定的,而内容效度是由够资格的判断者详尽地、系统地对测验作评价而建立的。虽然二者都是根据测验内容做出的主观判断,但判断的标准不同。前者只考虑题目与测量目的之间明显的、直接的关系,后者则同时考虑到题目与测量目的和内容总体之间逻辑的微妙关系。

四、内容效度的应用和评价

内容效度不但是评价学绩测验的最适合的方法,而且是编制任何测验都要加以考虑的基本方面。考虑测验题目与规定的内容或所取样的行为范围之间的符合性,可使选题更谨慎、

相关文档
最新文档