语言测试中的构念效度研究

合集下载

语言测试中结构效度的实现

语言测试中结构效度的实现

语言测试中结构效度的实现【语言学研究】沈阳师范大学学报(社会科学版)Journal of Shenyang Normal University(Social Science Edition)2012年第1期第36卷(总第169期)№1,2012Vol.36General,№169语言测试中结构效度的实现马蓉(辽宁省文化艺术职工大学基础部,辽宁沈阳110180)[摘要]作为一门独立学科,语言测试是检验和评估教学效果和学习效果的重要手段。

结构效度是实现语言测试目的的基础,决定了测试的目的和收集证据检验测试的有效性。

而针对不同的受试者测试会有所倾向,产生测试偏见,影响结构效度的实现。

科学性的语言测试要求测试者在测试始终合理有效的规避测试偏见,实现结构效度,使语言测试更科学。

[关键词]语言测试;结构效度;测试偏见[中图分类号]H0-0[文献标识码]A[文章编号]1674-5450(2012)01-0117-02[收稿日期]2011-11-10[作者简介]马蓉(1977-),女,辽宁沈阳人,辽宁省文化艺术职工大学讲师,教育学硕士。

语言测试是检验语言水平和能力的重要途径,既受测试信度、效度和区分度的影响,也与受试者个人的特征密切相关。

而效度即是考查测试者想要测量的内容,是实现测试的重要方面。

在构建测试效度时应避免受试者个人特征对测试表现的影响,也就是避免测试偏见,才能测试出受试者语言能力的真实水平。

一、语言测试中的结构效度(一)结构效度的概念Lyle F.Bachman 在他的Language Testing in Practice (《语言测试实践》)一书中指出:所谓结构效度,从属于对语言测试分数所作的解释的意义性和合理性,这就意味着对测试分数的解释就是对受试者语言能力的评估[1]。

Bachman 认为通过结构效度,我们不仅可以评估想要测量的受试者的语言能力,还可以通过对测试分数的解释来判断测试所采用的目标语使用语域是否合理。

语言测试中的构念效度研究

语言测试中的构念效度研究

知识文库 第14期64 语言测试中的构念效度研究王天予1.引言在考虑到语言测试发展、解释和使用时首要考虑的就是效度。

那么什么是构念效度?如何更好地理解构念效度?该效度与其他效度的不同之处是什么?2.构念及构念效度 2.1构念要想理解什么是构念效度,首先要明白什么是构念(construct)。

从心理学的角度来看,构念指的是人类头脑中存在的一种特质、水平、能力或技巧(Brown,2000:9)。

在教育测量领域,构念就是一种能力(Wiley,2002),“指成功完成特定任务所要求的人类特征”。

Ebel 和Frisbie(1991:108)将构念解释为“有关人类行为某一方面的心理构建或理论概念,是既不能够直接测量也不能够直接观察的。

”构念效度是指某个心理测验在多大程度上正确地验证编制测验的理论构想。

《标准》(APA,1999)将构念视为一个测验拟测的概念或特征。

这是从广义上将构念来指测验所涉及测量的概念或特征。

实际上,构念的选择对考试内容、考试方式和分数意义的解释息息相关,是效度研究的基础,也对考试的设计和评价起着重要的作用。

2.2 构念效度如何更好的理解构念效度呢?在教育测量领域,上述讨论的内容效度、准则关联效度和构念效度这三种类型效度都是作为整体构念效度的不同方面。

语言测试者认为这种把构念效度作为整体观点是一种新的发展。

理论界对构念的定义有不同的看法,因此,通过识别他们是如何解释应答一致性来定义构念(Messick 1981) 。

Loevinger(1957:636)最早提出要把构念效度作为整体效度来看待。

在80 年代, 这一观点逐渐得到人们的认同: 构念效度不再作为效度的一种证据,而应包括内容和标准证据、信度及其它与理论验证有关的方法 (Messick 1975, 1980, 1988, 1989; Anastasi 1986)。

其中影响最大的是 Messick 的“效度整体观”。

Messick (1988,1989)进一步丰富了效度理论,对测试的解释和使用提供了证据基础。

英语语言测试中效度的测量与估计

英语语言测试中效度的测量与估计

英语语言测试中效度的测量与估计沈阳师范大学大学外语教学部 许亚楠一、效度的基本概念(一)效度的定义及分类不同的语言测试学家对于效度这一概念的界定也不尽相同。

巴奇曼在《语言测试要略》中认为,“效度是对实证证据和理论原理在多大程度上支持基于测试的推断和行为的充分性和适当性的综合评价判断”。

换句话说,效度其实就是指一项测试中测量结果的准确性和有效性的程度,即测量是否达到了预期的目的。

效度通常可以分为构念效度、内容效度、预测效度、表面效度以及方法效度五种。

构念效度是指我们对于根据测试成绩对评价测试结果的解释是否是恰当且有意义的,即在多大程度上可以说一次测试成绩能够反映考生具备所考查的语言能力。

内容效度是指测试内容反映测试目的以及能够达到预期考查效果的程度。

预测效度是指测试结果能够在某种程度上预测出学生在未来学习中的表现和成就。

表面效度指的是一项测试能够测量出它想要测量的内容,这一概念其实和内容效度是有交叉的。

方法效度则一般用来评价测试方式与测试目标之间的关系。

(二)影响测试效度的因素测试效度的高低受到许多方面因素的影响,主要包括测验组成、测验实施、被试主观状态、效度效标和样本选择五个方面。

测验的效度与测验的取材和长度、测试题的难度、区分度及其编排方式等密切相关。

要想保证测验效度,主试应该适当控制测验环境,例如场地、材料、考试说明、考试时间等。

另外,被试对测验的态度、情感以及自身的身体健康状况都会影响测验结果的准确性和有效性,同时选择合适的效标也是估计效度所要依据的条件。

最后在样本选择上要尽可能地增加样本容量以减少测量误差,使所得的测量结果处于相对稳定的状态。

(三)提高效度的方法测试者可以通过控制系统误差、精心编制量表、妥善组织测验、扩充样本容量、增加测验长度等方法来有效提高测试效度。

效度的高低主要受到没有校准仪器、测试题目和指导语具有暗示性、答案有明显的组型等系统误差的影响,所以必须严格控制这些干扰因素。

语言测试构念效度

语言测试构念效度
持续改进测试
根据测试结果和反馈,对测试进行持续改进,优化试题设计、评分标 准和考试流程,进一步提高语言测试的构念效度和实用性。
05
结论和展望
主要结论汇总
语言测试构念效度是评估语言测试结 果是否真实反映被测者语言能力的重 要指标。
研究表明,有效的语言测试应该具备 清晰的目标、真实的任务、可靠的评 分方法等特征。
03
语言测试构念效度的 实证研究
研究设计
明确研究目标
首先,需要明确语言测试构念效 度的具体目标,例如,是要验证 某一特定语言测试的构念效度, 还是要比较不同语言测试的构念
效度。
选择适当的受试者
受试者的选择应当代表语言测试 的目标人群,以确保研究结果的 普遍性。同时,受试者的数量也 应足够,以满足统计分析的要求

设计测试任务
测试任务应能全面反映语言能力 的各个方面,包括听、说、读、 写等。任务的难度和长度应适中 ,以避免受试者产生疲劳或厌倦

Hale Waihona Puke 数据收集和分析方法数据收集
收集受试者在语言测试中的表现数据,包括得分、反应时间、错误类型等。同时,也可以收集一些背景信息,如 受试者的年龄、性别、母语等。
数据分析
可以采用定量和定性两种分析方法。定量分析可以通过统计方法,如相关分析、回归分析等,来探究语言测试和 语言能力之间的关系。定性分析可以通过对受试者的表现进行深入观察和分析,来获取更丰富的信息。
构念的理解
构念可以是理论构念,也可以是经验构念,它们都是对某一现象或事物的抽象描 述。
构念效度的评估方法
内容效度评估
通过检查测验内容是否充分、 全面地反映了所要测量的构念
来进行评估。
结构效度评估

浅析语言测试中信度与效度两者之间的关系

浅析语言测试中信度与效度两者之间的关系

浅析语言测试中信度与效度两者之间的关系语言测试在语言教学中处于中心地位,是从属于应用语言学这一学科的。

在过去语言测试在应用语言学中处于边缘地位,而在长达三十多年的发展中,语言测试现已发展成为一个相对独立的学科,已经在学术上占有了一席之地。

通过语言测试教育者可以及时发现学习者学习上存在的不足之处并在日后的教学过程中加以正确引导,也可以衡量教学任务和教学大纲的执行情况,但是这些都是基于科学的语言测试能够得到良好的反馈情况,反之,如果是一套不科学的语言测试就很可能对学习者做出错误的判断从而影响学习效率,所以科学的语言测试无论是对受教育者还是对教育者来说都是非常重要的。

一套设计比较科学的测试应该是具有信度,效度,难度和区分度四点特征,信度与效度是难度和区分度的基础,同时也是语言测试的两大根本要求,只有正确认识了信度与效度两者之间的关系才能寻找出一个科学的方法使得语言测试更加科学准确。

信度指的是测量的一致性,一个实验或测试的信度指它在重复测量时产生同样结果的程度,也就是说测量的稳定性是否一致。

影响信度的因素很多,其不仅存在于考试过程中的各个环节,也存在于阅卷的过程中,如试卷中的试题长度偏长,项目种类多,那么测试的信度就会提高,反之则会降低,考试分数集中于某一点或某一个区域时信度也会有所降低;考试期间考生时间充裕那么估算能力考试的信度也相对较高等等,这些都是存在于考试过程中各个环节的部分举例,在阅卷过程中阅卷者自身的信度和阅卷者之间的信度等问题也是影响信度的因素之一,如在评阅主观性的题目时(作文,口语等),阅卷者在评分时就具有很大的主观色彩,而不同的阅卷者掌握的主观的评分标准在评阅主观性试题时,不容易取得一致,也会使得测试的信度不稳定。

效度指的是我们所获的证据在多大程度上支持我们根据分数所做出的推断,也就是考试是否检测到了它所要检测的东西,是否达到了它的预定目标。

效度共分为三种不同的类型,其不同类型的效度测试有各自不同的测试着重面,内容效度测试的目的是为了了解测试者在一些实际环境中是如何运作的,如果测试的样本能够充分代表总体,那么测试在内容上就是有效的,反之效度则不高;预测效度和共时效度都是属于与标准有关的效度,预测效度是标志测试者将来能力的标准,如通过摸底考试分班,共时效度是指一个测试结果与另一个同时使用的标准的结果的关系;构想效度是指要考察一个测试者在多大程度上和我们根据某一理论所作出的预测是否一致,也就是说验证的是我们所做的假设是否有效。

罗夏墨迹技术的构念效度

罗夏墨迹技术的构念效度

内容摘要
然而,罗夏墨迹技术也存在一些缺点。首先,该技术的评估结果受到评估者 主观因素的影响,可能导致评估结果的不一致。其次,由于罗夏墨迹技术的实施 过程较为繁琐,需要专门的培训和技能,因此成本相对较高。此外,由于罗夏墨 迹技术的结果解释需要丰富的专业知识和实践经验,因此对评估者的要求较高。
内容摘要
内容摘要
罗夏墨迹技术是一种著名的投射测试,通过展示模糊的墨迹图片,引导受试 者描述图片中的形象、场景、情感等,从而了解其人格特征和内心世界。该技术 最初用于临床心理学中,后来逐渐被应用于人际关系构念测量和心理诊断领域。
内容摘要
在人际关系构念测量方面,罗夏墨迹技术主要通过分析受试者对墨迹图片的 描述,了解其人际敏感度、信任程度等方面。例如,墨迹图片中如果出现人脸或 身体部位,受试者可能会联想到与他人交往的经历,从而反映其人际关系的心理 特质。在心理诊断方面,罗夏墨迹技术可以帮助评估受试者的心理健康状况,例 如通过分析其描述中是否涉及抑郁、焦虑等情绪。
然而,也有一些研究指出罗夏墨迹技术的构念效度存在一定的问题。例如, 有些研究发现,不同测试者对同一受试者的墨迹图案解读存在较大的差异,影响 了该技术的有效性。此外,也有一些批评指出,罗夏墨迹技术过于主观和模糊, 缺乏科学性和可靠性。
案例分析
案例分析
为了更好地理解罗夏墨迹技术的构念效度,我们选取了一个具体的案例进行 分析。在一项研究中,研究人员使用了罗夏墨迹技术来评估一群职业罪犯的心理 特征。研究表明,与非罪犯对照组相比,职业罪犯组在罗夏墨迹测试中的反应显 示出更高的攻击性和更低的适应性。此外,研究还发现,职业罪犯组的反应与外 部效标(如犯罪行为、心理健康状况等)具有显著的相关性。
罗夏墨迹技术的构念效度进行全面分析,指出其在心理学、 社会学和历史学等领域的应用中具有一定的有效性和可靠性。然而,我们也需要 注意到该技术的构念效度会受到多种因素的影响,需要在应用时谨慎评估其局限 性和风险。

语言测试构念效度研究

语言测试构念效度研究

语言测试构念效度研究2005年的英语专业八级考试是根据2004年新的八级考试大纲设计和施测的第一次考试,考试的性质、构念领域、任务要求、分数权重等都发生了较大变化。

作为全国唯一的测量英语专业学生高年级英语水平的大规模考试,这些变化对个人、团体和社会将产生重大影响。

测试界认为,越是高风险考试,越要对考试的技术和应用方面进行评价,对考试的效度验证要求越高。

因此,运用先进的效度理念、分析技术和行业规范对我国的八级考试进行研究,不仅有理论价值,也具有现实意义。

在对测验的评价中,效度是最重要的考虑因素。

然而,在过去近一个世纪以来,效度的概念从多类效度发展到统一构念效度。

与效度概念发展相联系,效度验证的范式和方法也产生了变化。

因此,全面和准确地理解效度,具有十分重要具有理论意义。

而掌握效度验证的科学方法具有运用价值。

本研究的目的有二:一是对统一效度概念从本体论、认识论、方法论视角进行较全面的评述,旨在为八级考试效度验证提供一个理论和方法框架;二是在统一效度概念下,对八级考试的客观试题从实证的角度进行效度验证。

验证的问题包括四个:八级考试客观试题的测量学属性如何?客观题目实际测量的维度与考试设计的理念是否一致?客观试题分数的意义在不同的群体中是否具有类似的解释?新增加的人文知识分测验在是否存在考试偏差? 针对两个目的,采用两种研究方法。

对构念效度的理论和方法讨论采用文献综述方式;针对八级考试客观题目的效度验证是用定量的方式提供解释依据。

构念一致性问题是本研究中关于分数解释的切入点,解决的是测验所测量的构念在不同背景的考生的意义是否具有可比性问题。

当一个测验在一个组别(群体)中所测量的假设特质(或者心理构念)与另一组别相同,或者当一个测验在测量相同的特质而测量的准确程度相似时,构念具有可比性。

构念一致属于分数结构和效度概化问题。

它与考试偏差分析一起,为分数的可解释性和考试公正提供依据。

本研究的对象是446所大学参加2005年TEM 8考试的96696名考生。

基于计算机的语言测试及其效度验证_李清华

基于计算机的语言测试及其效度验证_李清华

1.引言 在过去近一个 世 纪里 , 计 算机 技术 改变 着 人类 的生 活 、工作 和学 习 ( C h a l h o u b D e v i l l e 2002) ; 计算机技术的出现堪称人类文明发展新的转折点 ( P r o v e n z o , B r e t t &M c C l o s k e y 1999) 。 近五十年来 , 随着语言学 、认知科学和测量学等相关学科的不断发展 , 计算机技术对语言测试 与评估也产生了巨大影响 。 特别在测试管理 、试题设计编写 、 任务呈现 、 评分 、 成绩分析与报道 等方面 , 计算机的高效率受到越来越多大规模语言测试开发和管理者的青睐 ( A l d e r s o n &B a n e r j e e 2002) 。 现代语言测试的语言学基础经历了数次革新 , 测量学理论由经典测试理论 ( C l a s s i c a l T e s t T h e o r y ) 发展 到概化 理论 ( G e n e r a l i z a b i l i t yT h e o r y ) 和 项目 反应 理论 ( I t e mR e s p o n s e T h e o r y , I R T )( 李清华 2006a ) 。 计算机技术的发展促使语言测试的介质发生了变化 。 传统的 基于纸笔的语言测试 ( P a p e r a n d P e n c i l B a s e dL a n g u a g eT e s t i n g , P B L T ) 正在向基于计算机的语 ① 言测试 ( C o m p u t e r B a s e dL a n g u a g eT e s t i n g , C B L T ) 迈进 。 C B L T 由 机助 语言测 试 ( C o m p u t e r A s s i s t e dL a n g u a g e T e s t i n g ) 发展到计算机适应性语言测试 ( C o m p u t e r A d a p t i v e L a n g u a g eT e s t i n g ,

语言测试之效度理论发展五十年

语言测试之效度理论发展五十年

研究如何平衡考试内容与构念效度的关系,以实现两者的最佳结合。此外, 也可以将研究范围扩展到不同类型、不同层次的语言测试中,以丰富和完善相关 理论体系和实践应用。
感谢观看
通过分析该测试的效度,发现其具有以下优点: 1、测试内容全面,涵盖多个领域,能够准确反映学生的综合英语能力;
2、采用交际性能力测试方法,贴近实际语言使用情况,能够评估学生在真 实语境中运用英语的能力;
3、通过智能化评分技术,确保评分的客观性和准确性,有效避免了人为因 素对评分的影响;
4、通过数据分析,能够对测试的效度进行深入研究和改进,进一步提升测 试的有效性和可靠性。
总的来说,结构效度是评估语言测试有效性的重要指标。提高语言测试的结 构效度需要从多个方面进行考虑和设计,包括明确测试目的、合理规划测试内容、 选择适当的测试方法和制定合理的评分标准等。只有这样,我们才能确保语言测 试的结果能够准确反映学生的实际语言知识和技能水平,从而为语言教育提供更 有价值的参考依据。
研究结果
通过文献综述,我们发现语言测试构念效度的研究已经取得了丰富的成果, 但同时也存在一些问题和挑战。例如,对于语言能力的定义和构成要素仍存在争 议;构念效度的评估标准也不够明确;以及如何平衡考试内容与构念效度的关系 等问题。案例分析则显示,一些语言测试在构念效度方面表现出较好的一致性和 可靠性,但也有一些测试存在较大的偏差和不一致。
关键词
语言测试效度理论、新发展、语 言能力、评估、应用
理论发展
语言测试效度理论的新发展主要包括以下几个方面:
1、综合效度框架:综合效度框架强调语言测试的整体性和综合性,测试内 容、测试方式和测试结果三个方面的效度。这一框架下的效度评估更加全面,有 助于提高测试的可靠性和有效性。

构念效度

构念效度

总结:
• 近三年的高考英语听力全国卷基本考查了理解主旨和要 义 ,获取具体的、事实性信息 ,对所听内容作出推断 , 理解说话者的意图、观点和态度等能力,能力构念划分 十分明确,而且符合考试大纲要求,因此构念效度都比 较高。
2.选项设计干扰性强。要求学生在听取录音时,不仅需要有速记相关信息点能力,同
时也还需要具有理解原文,辨别信息的能力,均符合考纲要求。
[以12题为例]
C. In Avon.
12. Where is the woman now? A. In Baltimore. B. In New York.
该题三个选项的地名对话中都出现过。因此需要学生进行排除。
2014年高考英语听力全国卷的构念效度分析:
• 从整体上看,2014年高考英语听力全国卷的 20 个小题中,理解主 旨与要义有 1 个题,获取事 实性的具体信息有 9 个题,对所听内 容作出推断有 7个题,理解说话者的意图、观点和态度有3个,与
13年大体上相同。较好地体现了考试大纲对考生的能力要求பைடு நூலகம்也
2013,2014,2015年高考英语听力全国卷考 试大纲
• 听力 : 要求考生能听懂所熟悉话题的简短独白和对话。 考生应能: • (1) 理解主旨和要义 • (2) 获取具体的、事实性信息 • (3) 对所听内容作出推断 • (4) 理解说话者的意图、观点和态度
2013年高考英语听力全国卷的构念效度分析:
• 整体上来看,本套试题对能力考察点的分布还是比较正常的,以 考查事实细节为主,有12道题左右,目的是检测学生听取和捕抓 具体的,事实性信息等的能力。其余的理解,推断,总结题约为8
个,主要考查的是从已知信息中作推断,理解说话者意图并且进

浅谈语言测试中的效度问题

浅谈语言测试中的效度问题

英 语 教学 大 纲 》 规定 的 教 学 目标 考 核 修完 大 学 英 语



大 学 英语 课 程 的 教
,
经 验 效 度 是指 语 言测 试 的 结 果 与对 应 试者 语 言 能 力 的 评估 在 多 大程 度 上相 一 致 为两 种 一 种 是共 时效 度
种 是 预 示 效度
,
学 目的 是 培 养 学 生 具 有 较 强 的 阅 读 能 力 和 一 定 的 听 说 写 译能 力 使学 生 能 以 英语 为 工 具 获 取 专 业 所 需 信 息 并 为 进一 步 提 高英 语水 平 打 下 较好 的

信度 但这 只 是 个 理想 化 的 目 标 因 为做 到这 一 点
往往 是不 可 能 的

在 编制试 题时 既 不 能为 了追 求
,
水平 测 试用来 衡量 学生 的 语 言 能 力 即 看学 生
是 否 达 到 某 一 水 平 从 而 决定其 是 否 能胜 任 某 一 任
,
,
信度 而忽 视 效 度 也 不 能 为 了 追 求 效 度 而 放 弃 信
学 习 语 言的 潜 力

。 。
高 的 信度 但 它却 能够考 查学生 实际 应 用 语 言的 能
力 具 有 较高 的 效 度
, 。
语 言潜 能 测 试 以 某种 语 言 行 为
,
因 此 一 套好 的 试题 应 包 括
, 。
,
理 论和 学 习 理 论 为 依 据 因 此 首 先 要 考 虑 编 制 效
,
标准



效 度 指测 试 是否 考查 了设 计 者想 要 考查 的
,

构念效度(Construct Validity)

构念效度(Construct Validity)

构念效度的指标
– 聚敛效度( Convergent validity ):是指不 同方法是否可用来测量同一构念 – 区分效度( Discriminant validity ):是指不 同构念是否存在显著差异
聚敛效度( Convergent validity )
• 对同一构念使用不同测量方法所得结果之 间应该具有高相关性
构念效度(Construct Validity )
2012. 04
什么是构念 (Construct)?
举 例
构念 (Construct)
团队行为
团队有效性
实证变量 (Empirical Variable)
任务目标团队 交流
团队 冲突
团队承诺 和信任
非财务 团队绩效
财务 团队绩效
Construct A
Construct B
聚敛效度( Convergent validity )
• Cronbach‘s alpha 一致性指标.
区分效度( Discriminant validity )
• 因子分析
构念效度( Construct validity)--分析方法
分析方法
(1)相关分析 (2)因子分析 探索性因子分析(EFA) 验证性因子分析(CFA) (3)多质多法(MTMMMulti-trait,Multi-method methodologies )
科学研究中构念和测量之间的关系
LEVEL 构念(Construct)
C
实证测量(Empirical, Operational)
C
构念效度( Construct validity)-概念
• 构念效度是指一个测量实际测到所要测量的理论 结构和特质的程度,或者说测量能够说明测量的 理论结构和特质的程度。

第七章 语言测试的效度研究

第七章 语言测试的效度研究

第六章语言测试的效度研究本章将研究所有语言测试中最重要的问题:效度问题。

效度是测试评估中最重要的指标。

一项测试如果从设计目的角度讲不是有效的,那么测试分数的推断和解释自然不会准确(Alderson et al. 1995:170)。

Messick(1992:89指出,众多测试设计者承认其有义务提供证明测量结果富有价值的效度证据,但遗憾的是很少有人真正这样去做。

Hughes,Porter以及Weir认为提供令人满意的效度证据是任何严肃测试必不可少的条件。

第一节效度的概念效度是教育和心理测量学中的一个概念,由来已久。

Kelly(1927:14)指出“效度问题就是一项测试是否真正测量了它声称所要测量的东西”。

Lado(1961:321)提出了这样的问题:“一项测试测量了它应该测量的东西了么?如果是,那它就是有效的。

” 上述是对效度进行的概括性或普遍定义。

下面我们从不同维度解读效度概念。

Henning(1987:89)对效度的理解偏重测试的设计目的,该定义为:一般来说,效度是指一项测试或测试一部分测量它声称测量内容的合适性(appropriateness)。

测试有效是指它测量了它应该测量的东西。

当效度用来描述一项测试时,它应该与“for”连用。

任何一项测试只有针对特定的目的才有效。

该定义突出了测试研发和使用的目的性。

测试使用最普遍的问题之一就是测试误用,即测试不是本着最初的设计目的而得以运用,当然这并不是说一项测试不能有效于多个目的,无论它出于何种目的被运用,其有效性证据必须要建立并加以呈现。

我们不能简单地说“该测试有效”,而应回答下面的问题“你是怎么知道该测试有效的?”以及“该测试有效性体现在哪里?”Henning的定义中还考虑到了效度的程度问题:测试相对其设计目的或多或少是有效的,即效度不是一个“要么有要么无”的概念,而是一个相对概念(Alderson et al. 1995:170)。

Weir认为效度存在于测试分数的解释中,而非测试本身。

构念效度的定义

构念效度的定义

1.构念效度的定义1.构念效度就是测验能够测量到所欲测量的心理特质程度2.心理学的许多特质都是假设的人的属性和理论概念(理论构念),如智力、创造力、焦虑、自我效能感等。

只能通过观察行为(测验项目)间接推论其存在。

3.构念效度就是指测验分数在多大程度上测量或解释了某种理论构念。

1.创造力是人对一定刺激产生大量的独创性反应的能力,主要表现为流畅性、灵活性、变通性。

(提出构念,并给出构念的结构框架)2.创造力随着年龄的增加而增加。

创造力与智力相关不高,与学习成绩只有微不足道的相关。

(提出与该构念相关的理论假设)3.计算创造力测验分数与年龄、智力测验等的相关系数。

(收集数据对理论假设进行验证)3.构念效度的验证方法1.测验内方法:通过研究测验内部构造(如测验内容、对测验题目的反应以及题目之间和分测验之间的关系)来研究测验的构念效度)2.测验间方法:同时考虑几个测验的相互关系,聚合效度、区分效度、因素分析(内部结构)3.多元特质多重方法矩阵:综合运用聚合效度和区分效度考察构念效度。

4.效标关联效度:求新编测验与以知的测量同一特质具有较高构念效度的测验的相关,也可以称作相容效度。

(1)测验内方法1.内容效度方法:测验内容效度的双向细目表就是对测验目标做了类似理论结构的解释,因此一个测验具有较高的内容效度可以作为构念效度高的证据。

2.被试反应方法:一个测验测量什么目标,有没有测到,可以采用个别测验的方式,让被试边想边做边说,了解其思维操作过程,可以核实测验是否真正测到了想要测量的东西,如数学推理测验借此可以了解被试的推理过程。

3.同质性系数方法:通过考察克伦巴赫系数判断测验时单一特质还是多维特质,进而考察与特质(构念)吻合程度。

(2)测验间方法聚合效度:如果两个测验是测量同一特质的,即使使用不同的方法进行测量,它们之间的相关也是比较高的,又称求同效度、收敛效度。

区分效度:如果两个测验测量的是不同的特质,即使使用相同的方法进行测量,他们之间的相关也应该是低的,又称求异效度、判别效度。

语言学习潜能测试构念的研究

语言学习潜能测试构念的研究

语言学习潜能测试构念的研究卜杰民(浙江广厦建设职业技术学院经贸外国语学院,浙江东阳 322100)*摘 要:语言学习潜能测试构念(L a n g u a g eL e a r n i n g Po t e n t i a lT e s tC o n s t r u c t )是语言学习潜能测试试卷编制的语言学和认知科学的基础㊂文章界定了语言学习潜能测试构念的概念,建立了语言学习潜能测试构念的分类框架,论述了其因子的表征,进行了因子表的结构效度验证㊂文章是对语言学习潜能测试构念所进行的理论探索,以为语言学习潜能测试试卷的编制提供一种理论架构㊂关键词:语言学习潜能;语言能力;学习能力;测试构念;结构效度验证d o i :10.3969/j.i s s n .2095-5642.2020.06.011中图分类号:H 08 文献标志码:A 文章编号:2095-5642(2020)06-0071-10语言学习潜能(L a n g u a g eL e a r n i n g Po t e n t i a l )是指学习者为完成语言学习任务所具有的潜在或者可能的能力㊂它是语言能力(L a n g u a g eA p t i t u d e )和学习能力(L e a r n i n g A pt i t u d e )的综合㊂语言学习潜能在第二语言习得中起着至关重要的作用,是因为语言学习潜能既是第二语言习得的个体差异变量之一[1],也是预测第二语言习得的学习结果的因素之一[2],同时具有语言学习普适性的属性[3]㊂国内外学者从不同的角度从以下几个方面对语言学习潜能进行了研究,相关研究文献包括:语言学习潜能测量结果和学习结果的相关数达0.50[4]㊁语言学习潜能和第二语言语法水平的相关性[5-7]㊁语言学习潜能和语言知识的相关性[8]㊁语言学习潜能在外显学习和内隐学习条件下的作用[9-14]㊁语言学习潜能对第二语言习得的影响[15]㊁语言学习潜能研究范式[16]及语言学习潜能和学习任务之间关系的实证研究[17]㊂这些研究文献主要回答了以下四个问题:(1)语言学习潜能和语言知识的相关性问题;(2)语言学习潜能在不同的教学环境和学习任务中的作用问题;(3)语言学习潜能对语言学习水平的预测性问题;(4)语言学习潜能的研究范式问题㊂这些相关研究文献奠定了语言学习潜能测试理论建构的基础㊂语言学习潜能测试旨在测试学习者的语言学习潜能,或者说测试学习者的语言能力倾向,其理论建构的核心问题是语言学习潜能测试构念概念的建构㊁因子表征和因子表的结构效度验证㊂为了简洁之便,语言学习潜能测试构念这个术语取其英文单词首字母,下文通称L L P T C ㊂有鉴于L L P T C 理论建构的核心问题,本研究探讨三个问题:(1)概念的建构;(2)因子的表征;(3)因子表的结构效度验证㊂概念的建构旨在解决L L P T C 范畴的问题,其因子表征旨在解决L L P T C 范畴在语言学层面和认知层面的构成成分表征的问题,因子表的结构效度验证旨在解决L L P T C 因子有效性的问题㊂在汉语语境下研究中国语言学习者L L P T C 概念的建构㊁因子的表征和结构效度验证,必须要了解第二语言习得的语言学习能力模块㊂17*收稿日期:2019-12-30基金项目:浙江省教育考试2018年度研究课题 基于多元智力理论的学生语言学习潜能动态评估研究与实践 (2018Z J K S 229)部分研究成果 作者简介:卜杰民(1962 ),男,浙江东阳人,副教授,硕士,研究方向:语言学和语言习得㊂成都师范学院学报2020年6月一㊁语言学习能力模块语言学习能力(潜能)与第二语言习得有着相互联系㊂S k e h a n[18]把语言能力进行了分解,分为听觉加工模块㊁语言加工模块和记忆模块㊂听觉加工模块对应语音编码能力,语言加工模块对应语法感知力和语言归纳能力,记忆模块对应记忆(即时记忆和延时记忆)能力和检索能力㊂在此基础上S k e h a n[19]把这些语言学习能力模块和信息处理过程进行了对应:(1)语音编码能力与输入加工相联系;(2)语言分析能力与中间处理相联系;(3)作为检索的记忆与输出和流利相联系㊂Dör n y e i与S k e h a n[2]对语言习得加工步骤和语言学习能力模块的联系进行了细化,具体情况见表1㊂表1二语习得步骤与语言学习能力模块联系表二语习得加工步骤相应的语言学习能力模块语言输入的加工策略注意力的控制,工作记忆注意语音编码能力,工作记忆语言结构的识别语音编码能力,工作记忆,语法感知力,归纳性语言学习能力语言结构重构和操纵语法感知力,归纳性语言学习能力语言结构的控制自动化,融合记忆语言结构的融合组块能力,检索记忆表1中所列出的语言学习能力模块反映语言学习者的语言学习潜能㊂从语言学的层面来看,语言学习潜能是一种与生俱有的天资,固存于人们的大脑中,体现为语言学习者大脑中的语言学习能力的初始状态,具体表现为以下潜在的能力:(1)能够说出或理解以前未接触到的㊁合乎语法的语句;(2)能够辨析有歧义的语句;(3)能够判别表面形式相同而实际语义不同,或者表面形式不同而实际语义相似的语句;(4)听㊁说㊁读㊁写㊁译等语言技能㊂语言学习潜能具有三个特点:(1)对于语言习得而言,语言学习潜能具有普适性属性;(2)对于语言学习者而言,语言学习潜能具有个体差异性属性;(3)对于语言测试而言,语言学习潜能具有可测性属性㊂从心理学的层面来看,语言学习潜能以心理特质的形式存在于人们的大脑中㊂心理特质指的是心理活动进行时所表现出来的稳定特点㊁反映意识倾向,体现心理活动的独特性㊂语言学习潜能就是这样一种语言学习方面的心理特质,体现语言学习的能力倾向㊂但是如何测试这种语言学习潜能心理特质呢?语言学习潜能心理特质的测试可以通过测试构念这个概念来加以体现,测试构念可以通过因子表征的方法来加以实现㊂下面先讨论L L P T C概念的建构㊂二㊁L L P T C概念的建构测试构念(T e s tC o n s t r u c t)是一个心理测量学的概念,指的是人们所具有的某种心理特质通过间接的方式所表现出来的测试点[20]㊂测试构念奠定了语言学习潜能测试的基础,在心理学层面测试构念以心理构念(P s y c h o l o g i c a l C o n s t r u c t)的方式体现㊂这种心理构念根据G a r d n e r多元智力理论的理解,不是单一的而是多维度的心理构念,是语言潜能和学习潜能的综合体现,其测试构念(测试点)可以用范畴的方式表征㊂此处的范畴(C a t e g o r y)是指反映语言学习潜能本质属性和普遍联系的基本概念㊂但是测试构念如何以范畴的方式表征呢?在现实世界里,其范畴的表征要通过范畴化(C a t e g o r i z a t i o n)的过程来实现㊂所谓L L P T C范畴化是指认知主体对其范畴进行分类的过程,是构建L L P T C范畴的基础㊂综合C h o m s k y的语言天赋论理论[21]和G a r d n e r的多元智力理论[22],L L P T C范畴可以分解为L L P T C知识范畴(L L P T CK n o w l e d g eC a t e g o r y)和L L P T C认知范畴(L L P T CC o g n i t i v eC a t e g o r y)㊂知识范畴对应于表1中的语音编码能力㊁语法感知力和相应的语言学习能力模块,属于C h o m s k y界定的语言能力范畴;认知范27第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究畴对应于表1中的工作记忆和归纳性语言学习能力,属于G a r d n e r界定的智力范畴㊂L L P T C范畴的二分法较好地体现了语言学习潜能的本质属性,是建立L L P T C分类框架的一种途径㊂L L P T C知识范畴折射语言学习者的语言能力倾向测试点类型,体现他们的语言学习潜能在语言学层面的测试构成要素,反映他们在未来语言学习前的大脑中语言习得(学习)机制中语言能力的初始状态㊂其知识范畴包括语音辨析能力(P h o n e t i cR e c o g n i t i o n)㊁语素辨析能力(M o r p h e m eR e c o g n i t i o n)㊁语法感知力能力(G r a mm a t i c a l S e n s i t i v i t y)和语义辨析能力(S e m a n t i cA n a l y s i s),分别对应语音学/音系学㊁语素学㊁句法学和语义学范畴㊂语音辨析能力是指识别不同语音的能力,它以语音符号联想能力为特征,在语音和代表它们的符号之间建立联想;语素辨析能力是指识别构成最小意义单位语素的能力;语法感知力能力是指把语言形式与其特定的语境分离,从语言材料中推断出语言规则的能力;语义辨析能力是指分辨词的意义和词与词意义之间逻辑关系的能力㊂L L P T C认知范畴体现语言学习者的语言学习元认知能力,反映他们在未来语言学习前的大脑中语言习得(学习)机制中学习能力的初始状态,包括配对联想能力(P a i r e d A s s o c i a t i o n)㊁归纳分析能力(I n d u c t i v e A n a l y s i s)和记忆能力(M e m o r y)㊂配对联想能力是指把刺激和反应联系在一起的能力,迅速而有效地学习语音和意义之间联系的能力[23]㊂归纳分析能力是指根据已知语言材料推断㊁归纳及支配一组语言材料规则的能力㊂记忆能力是指保存语音和意义之间联系和语言规则的能力㊂L L P T C知识范畴和L L P T C认知范畴共同构成L L P T C范畴㊂它们两者之间的关系是:认知范畴是知识范畴的认知基础,知识范畴是认知范畴的加工对象,认知范畴蕴含知识范畴,知识范畴表征认知范畴㊂知识范畴构成L L P T C语言因子,其加工对象和表征属性反映语言因子的属性;认知范畴构成L L P T C学习因子,其认知基础和蕴含属性反映学习因子的属性㊂L L P T C的分类框架及关系如图1所示㊂图1 L L P T C分类框架及关系图在理解了L L P T C分类框架和它们之间关系的基础上,下面讨论在测试中实现这种分类框架的方法,即研究L L P T C因子的表征㊂三、L L P T C因子的表征所谓L L P T C因子(L L P T CF a c t o r)指的是其范畴的构成成分㊂如图1所示,L L P T C知识范畴相对应的有四个组成成分,分别是语音辨析㊁语素辨析㊁语法感知力和语义辨析㊂这四个组成成分体现了大的L L P T C语言学属性,称为L L P T C共同语言因子(L L P T CC o mm o nL a n g u a g eF a c t o r)㊂L L P T C认知范畴相对应的有三个组成成分,分别是配对联想㊁归纳分析和记忆㊂这三个组成成分包含了大的L L P T C认知学习属性,称为L L P T C共同学习因子(L L P T C C o mm o n L e a r n i n g F a c t o r)㊂L L P T C的因子表征就是把L L P T C共同因子((L L P T CC o mm o nF a c t o r)所代表的L L P T C大范畴分解成具有测试可操作性的L L P T C 特殊因子(L L P T CS p e c i f i cF a c t o r)所代表的L L P T C小范畴,形成语言学习潜能测试点㊂L L P T C各个因子形成一个因子表,如表2所示㊂37成都师范学院学报2020年6月表2 L L P T C因子表L L P T C共同因子L L P T C特殊因子表征信息L L P T C 共同语言因子语音辨析语素辨析语法感知力语义辨析语音符号根据所听到的语音辨识音节符号语音分辨根据所听到的句子辨识所含的单词重音辨识根据所听到的单词语音辨识重音相异的单词语素分析辨识名词构词㊁动词构词㊁形容词构词和副词构词句子中的单词根据例示辨识单词在句子中的语法功能词汇同义词㊁近义词辨析词语类比辨识词语之间的逻辑语义关系L L P T C 共同学习因子配对联想拼写提示根据意义把语音和符号联系在一起归纳分析语言分析分析语言规则,翻译句子记忆词汇记忆根据提示记忆词汇如表2所示,共同因子由其所属的各特殊因子组合而成㊂具体讲就是:共同因子表征由其所属的各特殊因子共同的抽象属性,特殊因子不但表征其所属的共同因子的抽象属性,而且还表征其本身的具体属性㊂换句话讲共同因子是各个特殊因子所共有的因子,是对某个集合成员所有因子的概括,特殊因子是共同因子所概括的某个集合成员中的一个因子㊂表2所示的因子表体现其范畴结构,反映其本质属性㊂共同因子和特殊因子构成L L P T C结构效度验证的对象㊂结构效度验证就是看看在多大程度上这些因子能够测试出所要测试的语言学习潜能㊂下面讨论L L P T C因子表的结构效度验证的问题㊂四、L L P T C因子表的结构效度验证(一)结构效度验证的理论假设L L P T C因子表的结构效度验证采用因子分析法(F a c t o rA n a l y s i s)㊂因子分析法所依据的原理是检验表2所示的L L P T C因子表中特殊因子在其所属共同因子下的聚合效应(C o n v e r g e n tE f f e c t)及各个共同因子间的区分效应(D i s c r i m i n a n tE f f e c t)㊂如果能够证明L L P T C因子表具有较好的聚合效应和区分效应,则说明L L P T C因子表具有较好的结构效度㊂聚合效应反映因子表中特殊因子在其所属共同因子下相互紧密联系的程度,其相互紧密联系的目的是保证共同因子所属的特殊因子都具有其共同因子的属性㊂其紧密联系的程度用特征值(E i g e n v a l u e)㊁因子负荷((F a c t o rL o a d i n g)和共同性(C o mm u n a l i t y)三个指标来度量㊂(1)特征值指的是共同因子解释其所属特殊因子的程度㊂特征值越大,说明共同因子解释其特殊因子的程度越高㊂(2)因子负荷指的是共同因子和其所属各个特殊因子之间的相关系数㊂因子负荷越大,说明共同因子和特殊因子的相关程度越高㊂(3)共同47第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究性指的是特殊因子能被共同因子解释的程度㊂共同性越大,说明特殊因子能被共同因子解释的程度越高㊂区分效应反映因子表中各个共同因子之间互不重复㊁相对独立的程度,其相对独立的目的是保证不同的共同因子具有不同的属性㊂(二)结构效度验证的方法L L P T C因子表的聚合效应验证是通过特征值㊁因子负荷㊁共同性的统计值和其相应参数临界值的比较来进行的㊂L L P T C因子表的聚合效应验证的参数临界值是[24]:(1)特殊值达到可接受值1.0或者1.0以上;(2)因子负荷达到可接受值0.3或者0.3以上;(3)共同性达到可接受值0.7或者0.7以上㊂如果L L P T C因子分析的统计值满足以上三个条件,则可以推断:(1)共同因子解释其所属特殊因子的程度较高;(2)共同因子与其所属的特殊因子有较高的相关程度;(3)特殊因子被共同因子解释的程度较高㊂由此证明本研究的L L P T C因子表中共同因子和其所属的特殊因子具有较好的聚合效应㊂较好的区分效应通过采用因子分析中的直角旋转法(O r t h o g o n a lR o t a t i o n)来达到㊂直角旋转的作用是使各个L L P T C共同因子相对独立,以保证每个共同因子在解释L L P T C因子表结构效度中起到应该起的独特作用㊂(三)结构效度验证的任务L L P T C因子表的结构效度验证的任务是:(1)检验L L P T C因子的特征值;(2)检验L L P T C因子的因子负荷;(3)检验L L P T C因子的共同性㊂(四)结构效度验证的被试本研究的被试为某高校在新生入学时从参加语言学习潜能测试的全体大一新生中随机抽取的120名学生,其中,有60名男生和60名女生㊂之所以从全体测试新生中随机抽取120名学生,是因为全体大一新生能够保证:(1)有足量的被试;(2)有异质的被试(即含有语言水平和认知水平高㊁中㊁低的被试)㊂足量的被试保证随机抽取的测试样本量足够大,能够保证数据检验有统计意义;异质的被试作为一个整体样本反映自然状态下所测试的语言学习者的语言能力和认知能力初始状态分布的情况,即含有语言能力和认知能力高中低的被试并按正态分布,保证随机抽取的测试样本是反映自然状态的真实样本㊂本研究的被试满足这两个条件,因此L L P T C因子表的结构效度的数据检验具有统计意义,从而保证了本研究的信度和效度㊂(五)测试样卷结构信息和样题信息本研究的测试样卷分七个大部分㊁十个小部分㊂每一个小部分10道题,共100道题;每题1分,总分100分㊂七个大部分对应七个测试构念共同因子,十个小部分对应十个测试构念特殊因子㊂样卷结构信息和样题信息如附录所示㊂(六)数据收集与分析运用语言学习潜能测试样卷,在大一新生入学时在全体大一新生中进行语言学习潜能测试,其性质是诊断性的,其目的是了解学生的语言学习潜能,以便开展分层分类教学㊂同时利用该测试数据进行本研究的L L P T C因子表的结构效度验证㊂测试时间为120分钟㊂在测试开始前,参加语言学习潜能测试的全体大一新生进行随机抽取编号㊂随机抽取编号的目的是为了便于评分结束后的随机抽取样本试卷㊂在测试时要求每位学生在试卷上填上姓名㊁性别㊁年龄和编号㊂测试结束后,教师按照评分规则评分,统计出每位学生试卷上的每一小部分的分数㊂评分结束后,随机抽取120份答卷(60份男生答卷㊁60份女生答卷),形成被试样本试卷,以备数据录入分析㊂因为数据是以分数的方式呈现,所以所分析的L L P T C因子表是定距测量,满足因子分析的前提条件㊂数据录入分两部分进行㊂第一部分录入被试样本试卷每位被试的姓名㊁性别㊁年龄和编号㊂第二部分录入每位被试答卷的每一小部分成绩,它们分别对应于语音符号㊁语音分辩㊁重音辨识㊁语素㊁句子中的单词㊁词汇㊁词语类比㊁拼写提示㊁语言分析和词汇记忆的分数㊂这十个分数变量对应十个L L P T C特殊因子,如表2所示㊂前三个特殊因子对应第一个L L P T C共同因子 语音辨析;第四个特殊因子对应第二个L L P T C共同因子 语素辨析;第五个特殊因子对应第三个L L P T C共同因子 语法感知力;第六个和第七个特殊57成都师范学院学报2020年6月因子对应第四个L L P T C共同因子 语义辨析;第八个特殊因子对应第五个L L P T C共同因子 配对联想;第九个特殊因子对应第六个L L P T C共同因子 归纳分析;第十个特殊因子对应第七个L L P T C共同因子 记忆㊂前四个共同因子表征被试语言学习潜能的语言(知识)属性特征,后三个共同因子体现被试语言学习潜能的学习(认知)属性特征,被试的语言(知识)属性特征和学习(认知)属性特征共同勾画出其语言学习潜能特征㊂数据录入完毕后,运用S P S S统计软件对已录入的数据进行验证性因子分析(C o n f i r m a t o r y F a c t o rA-n a l y s i s),其因子旋转选择V a r i m a x旋转,计算出相关系数㊂五㊁结果与讨论(一)KMO测度和B a r t l e t t球体检验在作因子分析以前,先进行KMO测度和B a r t l e t t球体检验,以检查数据是否适用于因子分析,结果见表3㊂表3 KMO测度和B a r t l e t t球体检验表KMO测度值(K a i s e r-M e y e r-O l k i n M e a s u r eO f S a m p l i n g A d e q u a c y)0.897B a r t l e t t球体检验值(B a r t l e t t sT e s tO fA p p r o x.C h i-S q u a r eS p h e r i c i t y)677.638方差值(d f.)9显著水平值(S i g.)0.000注:显著水平值(S i g.)ʈ0.000<0.05,数据具有统计意义㊂表3列出了KMO测度值㊂KMO测度值表明全部变量的方差比例,也就是说该方差比例可能是由潜在的因子造成的㊂一般来说,KMO测度值越高(接近于1.0),表明变量间的共同因子越多,数据越适合用因子分析㊂KMO测度值的可接受值为0.7[24]㊂表3所示的KMO测度值为0.897,大于0.7可接受值,数据适合做因子分析㊂表3也列出了B a r t l e t t球体检验值㊂B a r t l e t t球体检验值说明相关矩阵是否为单位矩阵㊂如果是单位矩阵,不适宜用因子分析㊂如果显著水平值(S i g.)大(>0.05),说明变量间相关性低,相关矩阵是单位矩阵,不适宜用因子分析[24];如果显著水平值(S i g.)小(<0.05),说明变量间相关性高,相关矩阵不是单位矩阵,适合用因子分析[24]㊂表3所示的B a r t l e t t球体检验中,显著水平值(S i g.)ʈ0.000<0.05,表明变量间有显著的关系,变量间存在着共同因子,适合用因子分析㊂(二)特征值㊁因子负荷和共同性的检验表4列出了因子的特征值㊂特征值是所有特殊因子值在某一共同因子上的负荷值的平方总和,解释的是相关矩阵中的方差,可接受值是1.0,特征值越大,共同因子解释其特殊因子的程度越高㊂表4因子的特征值㊁解释方差和累计方差表L L P T C共同因子标签(L a b e l)特征值(E i g e n v a l u e)方差(V a r i a n c e)累计方差(C u m u l a t i v eV a r i a n c e)L L P T C 共同语言因子因子1语音辨析2.5327.05158.065因子2语素辨析2.2115.38252.194因子3语法感知力3.7212.45650.183因子4语义辨析2.4518.57554.02367第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究(接上表)L L P T C 共同因子标签(L a b e l)特征值(E i ge n v a l u e )方差(V a r i a n c e )累计方差(C u m u l a t i v eV a r i a n c e)L L P T C共同学习因子因子5配对联想2.1425.75357.564因子6归纳分析2.0811.07850.056因子7记忆2.2612.64750.195表5列出了因子负荷和共同性㊂因子负荷反映特殊因子和共同因子之间的相关程度,解释的是特殊因子值对共同因子的贡献率,可接受值是0.3,因子负荷越大,相关程度越高㊂共同性是每个特殊因子值在每个共同因子上的负荷值的平方总和,从共同性的大小可以判断特殊因子和共同因子之间的关联程度,可接受值是0.7,共同性越大,特殊因子能被共同因子解释的程度越高㊂表5 因子负荷和共同性表L L P T C 共同因子L L P T C 特殊因子因子负荷(F a c t o rL o a d i n g)共同性(C o mm u n a l i t y)L L P T C共同语言因子语音辨析语素辨析语法感知力语义辨析语音符号0.8050.704语音分辩0.8240.852重音辨识0.8360.736语素0.7420.719句子中的单词0.8680.758词汇0.8560.795词语类比0.7230.703L L P T C共同学习因子配对联想拼写提示0.7010.767归纳分析语言分析0.8470.824记忆词汇记忆0.8710.875从表4和表5可以看出,各因子的特征值介于2.08-3.72之间,各因子的因子负荷介于0.701-0.871之间,各因子的共同性介于0.703-0.875之间,都大于可接受值,L L P T C 因子表具有较好的聚合效应㊂较好的区分效应通过V a r i m a x 旋转得到了保证㊂因此可以得出结论:本研究的L L P T C 因子表具有较好的结构效度㊂六、结语本研究梳理了语言学习潜能相关研究文献,界定了L L P T C 的概念,研究了L L P T C 的分类框架和L L P T C 因子的表征,进行了L L P T C 因子表的结构效度验证㊂本研究成果为语言学习潜能测试试卷的编制提供了一种理论架构和命题依据㊂把该研究成果大规模地应用到语言学习潜能测试工作中去,还需要建设试题库,保证有足量试题以供抽题㊂只有做好了这项工作,才能成功地实施语言学习潜能测试工作,取得它应该有的效果㊂77成都师范学院学报2020年6月附录T h e I n f o r m a t i o n f o rL a n g u a g eL e a r n i n g P o t e n t i a l S a m p l eT e s tP a p e r(语言学习潜能测试样卷结构信息和样题信息)P a r t I.P h o n e t i cR e c o g n i t i o n(语音辨析)S e c t i o nA.P h o n e t i cS c r i p t(语音符号)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h eb e s t a n s w e r.A.b e e kB.b e e vC.b u tD.b u vS e c t i o nB.S o u n dD i s c r i m i n a t i o n(语音分辩)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h eb e s t a n s w e r.A.r i n g e rB.h a n g e rC.f i n g e rD.s i n g e rS e c t i o nC.S t r e s sP a t t e r n I d e n t i f i c a t i o n(重音辨识)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h e s t r e s sw h i c h i s d i f f e r e n t f r o mt h e o t h e r t h r e e o n e s A.N a v y B.A r m y C.B u r g e r D.R e p l a c eP a r t I I.M o r p h e m eR e c o g n i t i o n(语素辨析)S e c t i o nA.M o r p h o l o g y(语素)D i r e c t i o n s:A c c o r d i n g t ot h es e n t e n c e m e a n i n g f i l l i nt h eb l a n k w i t ht h e p r o p e rf o r m o f t h e w o r d m a r k e dA,B,Ca n dD.1.T h e f a i l u r e h i mf r o mk e e p i n g o n t r y i n g a n d a t l a s t h eb e c a m e a r e a l f a i l u r e.A.e n c o u r a g e dB.c o u r a g eC.d i s c o u r a g e dD.c o u r a g e o u sP a r t I I I.G r a m m a t i c a l S e n s i t i v i t y(语法感知力)S e c t i o nA.W o r d s i nS e n t e n c e s(句子中的单词)D i r e c t i o n s:C h o o s e t h eb e s t a n s w e r t h a t h a s t h e s a m e g r a mm a t i c a l f u n c t i o na s t h e c u ew o r d(提示词).1.J O H Nt o o ka l o n g w a l k i n t h ew o o d s.T h e c u ew o r dC h i l d r e n i nb l u e j e a n sw e r e s i n g i n g a n dd a n c i n g i n t h e p a r k.A B C DP a r t I V.S e m a n t i cA n a l y s i s(语义辨析)S e c t i o nA.V o c a b u l a r y(词汇)D i r e c t i o n s:C h o o s e t h eb e s t a n s w e r t h a t h a s t h e s a m em e a n i n g a s t h e c u ew o r d(提示词).1.p r o l o n g e d(t h e c u ew o r d)A.p r o m p tB.d e c r e a s e dC.d i f f i c u l tD.e x t e n d e dS e c t i o nB.W o r dA n a l o g y(词语类比)D i r e c t i o n s:A c c o r d i n g t o t h e s e m a n t i c r e l a t i o n s b e t w e e n t h e c u ew o r d s(提示词)c h o o s e t h e b e s t a n s w e r.1.m o u n t:h o r s e::t r a i n(t h e c u ew o r d s)A.s t a b l eB.s h o eC.r i d eD.b o a r dP a r tV.P a i r e dA s s o c i a t i o n(配对联想)S e c t i o nA.S p e l l i n g C u e(拼写提示)D i r e c t i o n s:A c c o r d i n g t o t h em e a n i n g o f t h e c u ew o r d(提示词)p r o n o u n c e db y t h e d i s g u i s e dw o r d(伪装词)c h o o s e t h eb e s t a n s w e rw h i c hh a s t h e s a m em e a n i n g a s t h e c u ew o r d.1.r e s t r n t(t h e c u ew o r d/t h e d i s g u i s e dw o r d)A.f o o dB.s e l f-c o n t r o lC.s l e e pD.s p a c e e x p l o r e r87第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究P a r tV I.I n d u c t i v eA n a l y s i s(归纳分析)S e c t i o nA.L a n g u a g eA n a l y s i s(语言分析)D i r e c t i o n s:A n a l y s e t h e l a n g u a g e r u l e s f o r t h e c u es e n t e n c e(提示句)a n d t r a n s l a t e t h es e n t e n c e i n t oE n g l i s h.提示句 T h e c u e s e n t e n c e汉语E n g l i s h一个英俊的男孩喜欢一条跑着的狗㊂Ah a n d s o m eb o y l i k e s a r u n n i n g d o g.T h e l a n g u a g e r u l e s(语言规则)汉语E n g l i s h男孩,一个男孩b o y,ab o y狗,一条狗d o g,ad o g英俊的,跑着的h a n d s o m e,r u n n i n gT h e s e n t e n c e t ob e t r a n s l a t e d(翻译句子)汉语一条英俊的狗喜欢一个跑着的男孩㊂E n g l i s h t r a n s l a t i o n.P a r tV I I.M e m o r y(记忆)S e c t i o nA.V o c a b u l a r y M e m o r y(词汇记忆)D i r e c t i o n s:F i r s t l o o k a t t h eE n g l i s hw o r d s,t o g e t h e rw i t h t h e i rC h i n e s e e q u i v a l e n t s,a n d t h e n c h o o s e t h eb e s t a n s w e r a c c o r d i n g t o t h e c u ew o r d(提示词).汉语E n g l i s h桔子汁j u i c e公牛o x儿子s o n1.公牛(t h e c u ew o r d)A.a n i m a lB.s t i c kC.j u m pD.o x参考文献:[1] C O C H R A NJL,M C C A L L UM RR,B E L LSM.T h r e eA s:H o wd o a t t r i b u t i o n s,a t t i t u d e s,a n d a p t i t u d e c o n t r i b u t e t of o r e ig n l a n g u a g e l e a r n i n g[J].F o r e i g nL a n g u a g eA n n a l s,2010,43:566-582.[2] DÖR N Y E I Z,S K E HA NP.I n d i v i d u a l d i f f e r e n c e s i n s e c o n d l a n g u a g e l e a r n i n g[C]//D o u g h t y CJ.T h eH a n d b o o ko f s e c-o n d l a n g u a g e a c q u i s i t i o n.O x f o r d:B l a c k w e l l,2003:589-63.[3] C A R R O L LJB.I m p l i c a t i o n s o f a p t i t u d e t e s t r e s e a r c h a n d p s y c h o l i n g u i s t i c t h e o r y f o r f o r e i g n l a n g u a g e t e a c h i n g[J].I n t e r-n a t i o n a l j o u r n a l o f p s y c h o l i n g u i s t i c s,1973(2):5-l4.[4] S K E HA NP.I n d i v i d u a l d i f f e r e n c e s i n s e c o n d l a n g u a g e l e a r n i n g[J].S t u d i e s i n s e c o n d l a n g u a g e a c q u i s i t i o n:275-298.[5] A B R A HAM S S O N N,H Y L T E N S T AM K.T h e r o b u s t n e s s o f a p t i t u d e e f f e c t s i nn e a r-n a t i v e s e c o n d l a n g u a g e a c q u i s i t i o n[J].S t u d i e s i n s e c o n d l a n g u a g e a c q u i s i t i o n,2008,30(4):481-509.97成都师范学院学报2020年6月[6] D E K E Y S E RR,A L F I-S HA B T A YI,R A V I DD.C r o s s-l i n g u i s t i c e v i d e n c e f o r t h e n a t u r e o f a g e e f f e c t s i n s e c o n d l a n g u a g ea c q u i s i t i o n[J].A p p l i e d p s y c h o l i n g u i s t i c s,2010,31(3):413-438.[7] G R A N E N A G.A g ed i f f e r e n c e s a n dc o g n i t i v e a p t i t u d e s f o r i m p l i c i t a n de x p l i c i t l e a r n i n g i nu l t i m a t e s e c o n d l a n g u a g ea t-t a i n m e n t[D].U n p u b l i s h e dP h Dd i s s e r t a t i o n,M a r y l a n d:U n i v e r s i t y o fM a r y l a n d,2012.[8] G R A N E N A G,L O N G M.A g e o f o n s e t,l e n g t h o f r e s i d e n c e,l a n g u a g e a p t i t u d e,a n du l t i m a t eL2a t t a i n m e n t i n t h r e e l i n-g u i s t i c d o m a i n s[J].S e c o n d l a n g u a g e r e s e a r c h,2013,29(3):311-343.[9] E R L AM R.L a n g u a g e a p t i t u d e a n d i t s r e l a t i o n s h i p t o i n s t r u c t i o n a l e f f e c t i v e n e s s i n s e c o n d l a n g u a g e a c q u i s i t i o n[J].L a n-g u a g e t e a c h i n g r e s e a r c h,2005,9(2):147-171.[10] S H E E N Y.T h e e f f e c t o f f o c u s e dw r i t t e n c o r r e c t i v e f e e d b a c k a n d l a n g u a g e a p t i t u d e o nE S L l e a r n e r s a c q u i s i t i o no f a r t i-c l e s[J].T E S O L q u a r t e r l y,2007,41(2):255-283.[11] HWU F,S U N S.T h ea p t i t u d e t r e a t m e n t i n t e r a c t i o ne f f e c t so nt h e l e a r n i n g o f g r a mm a r r u l e s[J].S y s t e m,2012,40(4):505-521.[12] V A N P A T T E N B,B O R S TS.T h e r o l e s o f e x p l i c i t i n f o r m a t i o n a n d g r a m m a t i c a l s e n s i t i v i t y i n p r o c e s s i n g i n s t r u c t i o n:n o m i n a-t i v e a c c u s a t i v e c a s em a r k i n g a n dw o r d o r d e r i nG e r m a nL2[J].F o r e i g n l a n g u a g e a n n a l s,2012,45(1):92-109. [13] V A NP A T T E NB,B O R S TS.T h e r o l e s o f e x p l i c i t i n f o r m a t i o n a n d g r a mm a t i c a l s e n s i t i v i t y i n t h e p r o c e s s i n g o f c l i t i c d i-r e c t o b j e c t p r o n o u n s a n dw o r do r d e r i nS p a n i s hL2[J].H i s p a n i a,2012,95(2):270-284.[14] Y I L MA ZY.R e l a t i v e e f f e c t s o f e x p l i c i t a n d i m p l i c i t f e e d b a c k:t h e r o l e o fw o r k i n g m e m o r y c a p a c i t y a n d l a n g u a g e a n a l y t-i c a b i l i t y[J].A p p l i e d l i n g u i s t i c s,2013,34(3):344-368.[15]戴运财.语言学能对二语习得的影响[J].外语教学与研究,2006(6):451-459.[16]戴运财,蔡金亭.二语习得中的语言学能研究:回顾㊁现状㊁思考与展望[J].外国语,2008(5):80-89.[17]顾伟勤.重谈语言学能 外语学习中个体差异的一个重要构成[J],中国外语,2008(6):62-67.[18] S K E HA NP.Ac o g n i t i v e a p p r o a c h t o l a n g u a g e l e a r n i n g[M].O x f o r d:O x f o r dU n i v e r s i t y P r e s s,l998.[19] S K E HA NP.T h e o r i s i n g a n du p d a t i n g a p t i t u d e[C]//R O B I N S O NP.I n d i v i d u a l d i f f e r e n c e s i n i n s t r u c t e d l a n g u a g e l e a r n-i n g.P h i l a d e l p h i a:J o h nB e n j a m i n sP u b l i s h i n g C o m p a n y,2002:69-94.[20] C R O N B A C H LJ,M E E H LPE.C o n s t r u c t v a l i d i t y i n p s y c h o l o g i c a l t e s t s[J].P s y c h o l o g i c a l b u l l e t i n,1955(52):281-302.[21] C HOM S K Y N.A s p e c t s o f t h e t h e o r y o f s y n t a x[M].C a m b r i d g e:M I TP r e s s,1965.[22] G A R D N E R H.F r a m e s o fm i n d:t h e t h e o r y o fm u l t i p l e i n t e l l i g e n c e s[M].N e w Y o r k:B a s i cB o o k s,1983.[23] V I C O R Y AC,A S H E RJ J.T h e p a i r e d a s s o c i a t e t a s k a s a p r e d i c t o r o f f o r e i g n l a n g u a g e f l u e n c y[J].T h e j o u r n a l o f p s y-c h o l o g y,1966(64):29-32.[24]秦晓晴.外语教学研究中的定量数据分析[M].武汉:华中科技大学出版社,2003.O nL a n g u a g eL e a r n i n g P o t e n t i a l T e s t C o n s t r u c tB UJ i e m i n(F o r e i g nL a n g u a g e sS c h o o l,Z h e j i a n g G u a n g s h aC o l l e g eO fA p p l i e dC o n s t r u c t i o n,D o n g y a n g,Z h e j i a n g322100,C h i n a)A b s t r a c t:L a n g u a g eL e a r n i n g P o t e n t i a l T e s t C o n s t r u c t(h e r e i n a f t e r r e f e r r e d t o a sL L P T C)i s t h e b a s i s o f l i n g u i s t i c s a n d c o g n i t i v e s c i e n c e o f t h e c o m p i l a t i o no f l a n g u a g e l e a r n i n gp o t e n t i a l t e s t p a p e r.T h i s p a p e r d e f i n e s t h e c o n c e p t o fL L P T C,e s t a b l i s h e s t h e f r a m e w o r kf o r t h ec l a s s i f i c a t i o no fL L P T C,d i s c u s s e s t h e r e p r e s e n t a t i o no fL L P T Cf a c t o r s a n d p e r f o r m s t h e v e r i f i c a t i o no f t h e s t r u c t u r ev a l i d i t y o fL L P T Cf a c t o r s. T h i s p a p e r i s a t h e o r e t i c a l e x p l o r a t i o n o f L L P T C,a n d p r o v i d e s a t h e o r e t i c a l f r a m e w o r k f o r t h e c o m p i l a t i o n o f l a n g u a g e l e a r n i n gp o t e n t i a l t e s t p a p e r.K e y w o r d s:l a n g u a g e l e a r n i n g p o t e n t i a l;l a n g u a g e a p t i t u d e;l e a r n i n g a p t i t u d e;t e s t c o n s t r u c t;v e r i f i c a-t i o no f s t r u c t u r e v a l i d i t y(责任编辑:赵华责任校对:罗布) 08。

交际语言能力模型的构念效度研究

交际语言能力模型的构念效度研究

交际语言能力模型的构念效度研究
随着智能机器人技术得到快速发展,社交技能逐渐成为研究的热点。

而社交交际中的交际语言能力是机器人的重要组成部分,可以帮助机器人更好的介入到社会中。

因此,研究人员努力设计和开发出交际语言能力模型。

交际语言能力模型是一种可用于提高机器人的话语表达技能的模型。

它主要涉及话语表达的表示形式,提供机器人语言表达的工具,为机器人提供情感和关系技术等。

它把机器人话语表达技能拆分成几个独立和有系统连接的领域,以期更深入地认识机器人交际语言能力。

传统的交际语言能力模型一般包括:意义建构、表达策略、语用能力和情绪交际能力。

模型的有效性是人们关注的重要问题。

因此,开展模型效度研究是确定模型的有效性的有效方法,很多研究者提出了构念效度的概念,其中的思想就是以构思的形式,来研究交际语言能力模型的有效性。

构念效度是社会科学研究中的一种评估方法,它专注于表达模型概念能力的有效性。

构念效度研究的关键是构建一个有效的模型,以估计模型的有效性,并从内在意义出发,详细地分析交际语言能力模型的可用性。

构念效度研究流程主要包括:阐述模型的范围,遴选适当的评测方法,将模型融入到实际的语言表达活动中,根据评估结果调整模型,并且重新评估它。

构念效度能够帮助研究者对机器人交际语言能力模型进行有效的评估,从而有助于更好地提高机器人语言能力。

未来,希望能有更多的研究者带入更广泛的研究,以提供更完整、更有效的交际语言能力模型。

基于体裁的商务英语话语能力研究:构念界定与测试开发

基于体裁的商务英语话语能力研究:构念界定与测试开发
第一章是引言,主要对所研究问题的背景、目的和意义进行介绍。本章概述了商务英语专业教学和测试理论与实践的发展历程,指出商务英语测试开发和效度研究具有现实的必要性。
需要对商务英语测试进行深入的研究,使其能够客观准确地测量教与学的实际水平,对教学起到正向反拨作用。第二章是文献综述部分,目的是为本研究提供理论基础和方法依据。
为了保证所开发测试的科学性和可行性,本论文参考与借鉴美国教育考试服务(ETS)和英国剑桥大学ESOL考试中心等著名语言能力评估机构的研究成果,提出商务英语专业八级考试开发的设计原则和开发流程。商务英语专业八级考试的设计目标是,能够科学地反映考生”基于体裁的商务英语话语能力”,以保障专业教学的质量,为社会培养合格的商务英语人才。
为了使测试能够更好地服务于专业英语教学,测试开发者必须保证所开发测试的效度。正是在上述背景下,本文选择商务英语测试开发这一课题,重点探讨商务英语话语能力的构念界定和测试开发。
本论文主要有三个目的:一、通过对语言教学与测试理论的梳理,提出“基于体裁的商务英语话语能力”构念。二、围绕拟测构念“基于体裁的商务英语话语能力”,开发和设计标准化学业测试——商务英语专业八级考试(TBEM-8)。
第四章和第五章是本研究设计与实施的理论基础。第四章对商务英语话语共同体、商务英语专业体裁研究和基于体裁的商务英语专业话语实践展开深入讨论。
在此基础上,第五章提出“基于体裁的商务英语话语能力”构念框架。第六章介绍了商务英语专业八级考试的设计和开发过程,详细描述了从测试设计、操作到实施这三个阶段的各主要环节。
341名学生参加了TBEM-8范型试卷考试并填写了“考试后效学生调查问卷”,共收回有效问卷318份。访谈对象为商务英语专业的15名在职教师。
问卷和访谈结果表明:学生和教师认为,TBEM-8将对商务英语专业教学与学习具有良好的反拨作用,考试的实施能够强化和促进教学目标的实现,考试结果可以为教学与学习提供有价值的反馈信息。本论文由八章构成。

浅析《人文英语3》的语言测试与评估

浅析《人文英语3》的语言测试与评估

浅析《人文英语3》的语言测试与评估王宇本文是以国家开放大学(以下简称“国开”)为非英语专业开设的公共英语课程《人文英语3》(以下简称《人3》的期末考核为基础, 试从“构念”、“任务特征”和“效度研究”三个维度对其进行结构分析与评价,论述了语言评估与测试在非英语专业英语教学中的重要作用,并探讨合理设置《人3》科目测试目标和内容的基本思路。

引言近年来,在外语教学领域的专家与学者们越来越关注语言评估与测试的研究。

其中,英语语言测试是对英语语言教学效果、英语学习者英语各方面能力的测量和评估,是英语教学中一个不可分割的环节。

广大英语教师已经意识到语言测试与评估是英语专业教学和非英语专业教学的重要组成部分。

它不仅是衡量外语教学成效和提高教学质量的重要手段,而且是为教学服务的。

因此为了更好地服务于成人学生群体,国家开放大学(以下简称国开)针对他们学习的实际需求,在公共英语课程的语言评估测试中,进行了改革与创新,推出《人文英语》等系列课程。

其中《人3》是为人文类非英语专业(专升本)第一学期开设的全新公共英语课程。

通过学习本课程,学生应能熟练使用其中的2000个左右词汇,包括在职场中常用的词汇和短语,以及在相关职业活动中最基本的英语词语及表达方式,能在涉及法学、社会工作、汉语言、教育等相关专业的商务环境中进行基本交流;使他们提升在人文情境中使用英语进行交际的实际能力。

1 语言测试与评估的理论语言测试(主要指外语测试)是多种学科的结合体,是一门成熟的跨学科的综合性学科。

(李华田,补爱华:2003)众所周知,教学成评估相辅相成。

韩宝成教授认为对基于任务的教学进行评估既应包括形成性的,又要包括终结性的:既有过程评估,又有结果评估,但核心是对学生的学习成绩做出评价,由此便产生了基于任务的语言测试。

时至今日,由Bachman教授所提出的交际语言模式已经对语言测试的发展产生了深远的影响。

也就是说,大量的语言测试与评估的研究不断地证明,语言测试的设置更加需要全面的考虑。

语言测试之效度理论发展五十年

语言测试之效度理论发展五十年
尽管构念效度仍被看作几种效度证据之一但至少基于构念的三方面模式逐渐被当作效度验证的普遍原则kane2001232构念效度核心地位的确立crobach和meehl已播下把构念效度扩展为效度的通用框架的种子但最早提出把构念效度作为整体效度概念的是loevinger既然预期效度共时效度内容效度都是针对某一目的的那么科学的观点是见kane2001
2. 教育与心理测量学中效度理论的发展
语言测试中的效度理论来自于教育与心 理测量学。Kane( 2001) 把 20 世纪 50 年代以 来效度理论在教育与心理测量学领域的发展 按照时间先后分为 3 种模式: ( 1) 基于标准的
பைடு நூலகம்
效度模式; ( 2) 构念模式; ( 3) 整体效度模式。 本文根据人们对效度的普遍认识的演变, 把 效度理论发展大体划分为 3 个时期: ( 1) 单 一效度观时期; ( 2) 分类效度观时期; ( 3) 效度 整体观时期。
关键词: 效度、构念、效度整体观、语言测试 [ 中图分类号] H310.42 [ 文献标识码] A [ 文章编号] 1003-6105( 2006) 01-0087-08
1. 引言
效度( validity) 和信度( reliability) 是语言 测试及其它教育与心理测量质量评价的根本 要求。从普通计量学引入的信度概念比较稳 定, 教育与心理测量学家关注的是信度的估 算方法。效度则是社会科学计量学的概念, 自 20 世纪 30 年代提出以来, 效度概念不断演 变, 在近半个多世纪取得了重大进展。尤其是 从 80 年代中期以来逐渐形成的 “效度整体 观”颠覆了“分类效度观”的统治, 对当代效度 研究产生了深远影响。但在我国应用语言学 界, 效度理论的新进展尚未得到充分重视。本 文拟梳理语言测试效度理论的演变进程, 并 探讨当代效度的概念及效度验证的方法, 以 期国内同行关注效度理论的研究成果, 用当 代效度理论指导自己的研究。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语言测试中的构念效度研究
1.引言
在考虑到语言测试发展、解释和使用时首要考虑的就是效度。

那么什么是构念效度?如何更好地理解构念效度?该效度与其他效度的不同之处是什么?
2.构念及构念效度
2.1构念
要想理解什么是构念效度,首先要明白什么是构念(construct)。

从心理学的角度来看,构念指的是人类头脑中存在的一种特质、水平、能力或技巧(Brown,2000:9)。

在教育测量领域,构念就是一种能力(Wiley,2002),“指成功完成特定任务所要求的人类特征”。

Ebel和Frisbie(1991:108)将构念解释为“有关人类行为某一方面的心理构建或理论概念,是既不能够直接测量也不能够直接观察的。

”构念效度是指某个心理测验在多大程度上正确地验证编制测验的理论构想。

《标准》(APA,1999)將构念视为一个测验拟测的概念或特征。

这是从广义上将构念来指测验所涉及测量的概念或特征。

实际上,构念的选择对考试内容、考试方式和分数意义的解释息息相关,是效度研究的基础,也对考试的设计和评价起着重要的作用。

2.2 构念效度
如何更好的理解构念效度呢?在教育测量领域,上述讨论的内容效度、准则关联效度和构念效度这三种类型效度都是作为整体构念效度的不同方面。

语言测试者认为这种把构念效度作为整体观点是一种新的发展。

理论界对构念的定义有不同的看法,因此,通过识别他们是如何解释应答一致性来定义构念(Messick 1981)。

Loevinger(1957:636)最早提出要把构念效度作为整体效度来看待。

在80 年代,这一观点逐渐得到人们的认同:构念效度不再作为效度的一种证据,而应包括内容和标准证据、信度及其它与理论验证有关的方法(Messick 1975,1980,1988,1989;Anastasi 1986)。

其中影响最大的是Messick 的“效度整体观”。

Messick(1988,1989)进一步丰富了效度理论,对测试的解释和使用提供了证据基础。

图表1呈现的就是Messick效度观。

根据图表可以看出效度的证据基础既包括测试分数的解释还包括测试分数的使用。

对于测试解释的证据基础涉及到构念效度实证研究,而这个构念效度是作为在理论语境中与其他构念存在隐含的关系。

对于测试使用中的证据基础既包含了与构念效度也包含了相关性/实用性。

效度的后果基础涉及到对测试分数的解释和使用。

对于测试解释的后果基础要对价值意义作出判断,也就是这个隐含关系是好是坏,是可取还是不可取等。

而对于测试使用中的后果基础涉及到对社会后果的判断,这种价值语境涉及测试使用的隐含后果与实际应用在
测试中的影响。

概括起来,Messick 对效度理论的贡献主要表现在:(1)明确了效验的对象是测试分数的解释和使用,而不是测试本身(Davies,2003);(2)确立了构念的核心地位,加强了对构念效度作为效度整体概念的一致认识(Alderson & Banerjee,2001;Davies,2003);(3)把效度的涵盖范围由分数意义扩展到相关性和使用(relevance and utility)、价值意义及社会后果(Shepard,1993)。

构念效度是效度的最本质内容,内容效度和效标关联效度都是用来服务和支持构念效度的(刘万伦,2006 :108)。

美国心理学会、美国教育研究学会和国家教育测量协会1999年出版的《教育与心理测验的标准和指南》中,已经用构念效度来统一定义效度。

构念效度不仅是决定考什么和怎么考,而且回答为什么这样考,而且是检验语言测试质量的重要参照依据。

就是考试中的试题是否考了相关的内容,测试结果与测试要求是否相关、指向是否完全一致,测试是否对教与学发挥积极推进作用等。

构念效度的重要性更体现在出该测试是否有用的问题(缪学,2010:39)。

语言学家Bachman L. F. &A. Palmer认为,构念效度是指依据考试成绩所做的一切结果和解释是否有意义的问题(Bachman L. F. &A. Palmer,1996)。

也就是说一次考试成绩是否考查了学生的语言能力,就是要看我们的构念效度如何。

构念效度的建立是一个过程,在这个过程中,测试设计者首先提出关于能力或特质(trait)的理论假设即所谓构念,然后对构念进行操作性定义并根据构念编制和实施测试,最后对测试结果进行分析,检验测试结果与构念的一致性程度。

3.结语
当前把效度作为一个统一概念使用,效度是衡量语言测试的重要标准之一。

涉及到我们对测试分数解释和使用是否适当和正确。

构念效度研究又处于效度研究的核心地位,也是测验代表语言学习基本理论程度的指标。

构念效度验证研究测试所测量的能力,为测试提供理论基础。

相关文档
最新文档