可以作为构思效度证据的有[对语言测试效度及其证据来源的一些认识和思考]

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

可以作为构思效度证据的有[对语言测试效度及其证
据来源的一些认识和思考]
一、语言测试中的效度
语言测试的首要目的是为研究者提供一个测量个体语言能力的指标。

效度是测试的有效性最重要也是最必要的准则,它体现了实现测试结果的有效程度。

效度通常被定义为一个研究对研究者所意图测量的特定概念所能反映或评测的程度。

语言测试中,效度关系到测量被测试者语言能力的研究是否成功,可用来判断某一项评分的解释是否合理,而这个解释也涵括了测试的意义及合理性。

这就要求测试中应充分考虑作为基础的评分指向的证据来源,以及评分应用的社会影响。

因而效度并非测试或测评的附属产物,而是测试结果涵义的产物。

二、效度的四个类型
效度传统习惯上被分为四个类别:表面效度,内容效度,标准效度和结构效度。

表面效度涉及测量方法及其过程是如何呈现的。

包括它是否以合理的方式获取研究员试图得到的信息,它看起来是否设计良好,以及它看起来能否可靠地动作。

不同于内容效度,表面效度不需要架设理论来获得支持。

表面效度仅仅意味着表面的有效性。

由于表面效度的模糊性和主观性,心理测试学者们很久前便放弃了这个概念。

内容效度以测量方法所能反映的测量领域的程度为基础,找出测试内容是否反映了测试的要求。

乍看之下。

内容效度似乎类似于表面效度,但二者是有区别的。

在内容效度中,证据是在考官评判的协商中获得的。

简而言之,表面效度可以由~个人确立。

而内容效度需要一个专家小组来检测。

不过,这种方法仍存在一些缺点。

有的测试由内容专家编写出来后,别人看起来十分艰涩,这种情况并不少见。

此外,内容专家并不辨认主题学习的宗旨。

标准效度,也称工具效度,用来证明测试方法或过程的准确性,这需要将它与另一已经证实有效的测量方法或过程进行比较。

确切地说,标准效度是一种预测而不是一种解释。

预测是非偶然性或具有数学推断性的,而解释具有原因或逻辑具有依赖性。

由于标准效度的局限性,评估者必须使用结构效度来进行检验。

结构效度是在理论性概念和具体测量设备或过程中寻求统一的一种检验方法。

例如,为了得到一个可接受的结构效度,发明新的语言测试的研究员也许要花费大量的时间来“定义”语言能力的概念。

汉特和施密特(1990)认为,结构效度是一个定量问题。

而不是区别如“有效”或“无效”这样的定性的问题;它是一个程度问题。

结构效度可以通过测量倾向的独立变量(结构)和替代的独立变量(指标,标志)之间的交互作用来确定。

尽管效度被分为了四个类别,但结构效度的概念最终最被广泛接受。

在教育测量方法的领域里,这四种类型被当作结构效度的统一形式的不同层面来进行研究。

无论结构效度如何定义。

目前并没有研究它的最好的单一的办法。

多数情况下,结构效度结构效度需要从多种角度搜索大量的证据进行论证。

因此,只有使用更多的策略和方法去验证一个测试的效度,测试使用者对测试的结构效度才越有信心。

三、效度来源的证据
前面我们已经提及效度的四种类型如今被当作结构效度的统一形式的不同层面来进行研究,并且需要从多种角度搜索大量的证据进行论证,因此,有必要用一种较新也较好的方法来讨论一下效度来源的证据的问题。

1、基于内容的证据
通过观察测试内容和测试结构的关系可以获得重要的效度证据。

在拟定测试内容之前,测试内容通常需要界定和分类,而且每部分的内容应设定好比例,重要效度证据可通过这三步来实现。

专家评测内容效度时,要评估测试的每一部分和测试结构之间的关系,以及每两部分内容之间的相对比例关系和必要关系。

2、基于反应过程的证据
效度证据还可通过分析参试者的反应来获得。

对反应的分析可以考察出测试意图评估的目的与实际评估到的结果之间的一致程度。

比如,在意图评估推断能力的测试中,如果真实地测试了参试者的推断能力,那么这个测试就有较高的效度;而如果只是反映了一个人某种具体知识或结论的记忆力,那么该测试的效度就是低的。

研究人员可以通过记录参试者回答问题的步骤和方法来研究测试的效度。

在一些涉及主观评估的测试中,测试的结果既可能受到参试者的影响,也受到评估者的影响。

在这种情况下,应该对评估者的评分过程进行检查,为测试的效度提供证据。

3、基于内部结构的证据
许多测试是有具体理论结构作为基础的,有的测试是一维的,而有的是多维的。

但无论如何,效度证据可通过考察测试的内容结构来获得。

对差异项目功能的研究便属于这个领域。

为测试效度提供了论证。

4、基于其它变量关系的证据
最重要的效度证据是通过考察测试结果与其它独立于测试的变量之间的关系获得的。

效度证据首先来源于反映测试目标的测试标准,然后基本的问题在于测试能预测或反映效度标准的程度。

如果测试还没设有效度标准,那么我们应该把重点放在效度的预测性上。

反之,我们应该注重同步效度的问题。

5、基于测试结果的证据
测试效度与分析测试结果的关系是直接的,在分析中,要求研究人员辨别从测试中得出的结果和从与测试无关的结果。

例如。

测试者间紧张的竞争关系可能导致死记硬背,从而忽略了开发解决问题的能力,结果可能导致个体发展的失败。

四、结语
总的来说,测试效度的研究正随着科学测试体系的发展不断地更新,日益成熟。

研究人员正以更新更好的手段来对效度进行分门别类,把重点放在对结构效度及其效度证据来源的研究上。

随着越来越多的证据,我们将理好地利用和解释测试的评分,完善结构效度的定义并提高测试本身的效度。

相关文档
最新文档