语言测试构念效度研究
语言测试中结构效度的实现

语言测试中结构效度的实现【语言学研究】沈阳师范大学学报(社会科学版)Journal of Shenyang Normal University(Social Science Edition)2012年第1期第36卷(总第169期)№1,2012Vol.36General,№169语言测试中结构效度的实现马蓉(辽宁省文化艺术职工大学基础部,辽宁沈阳110180)[摘要]作为一门独立学科,语言测试是检验和评估教学效果和学习效果的重要手段。
结构效度是实现语言测试目的的基础,决定了测试的目的和收集证据检验测试的有效性。
而针对不同的受试者测试会有所倾向,产生测试偏见,影响结构效度的实现。
科学性的语言测试要求测试者在测试始终合理有效的规避测试偏见,实现结构效度,使语言测试更科学。
[关键词]语言测试;结构效度;测试偏见[中图分类号]H0-0[文献标识码]A[文章编号]1674-5450(2012)01-0117-02[收稿日期]2011-11-10[作者简介]马蓉(1977-),女,辽宁沈阳人,辽宁省文化艺术职工大学讲师,教育学硕士。
语言测试是检验语言水平和能力的重要途径,既受测试信度、效度和区分度的影响,也与受试者个人的特征密切相关。
而效度即是考查测试者想要测量的内容,是实现测试的重要方面。
在构建测试效度时应避免受试者个人特征对测试表现的影响,也就是避免测试偏见,才能测试出受试者语言能力的真实水平。
一、语言测试中的结构效度(一)结构效度的概念Lyle F.Bachman 在他的Language Testing in Practice (《语言测试实践》)一书中指出:所谓结构效度,从属于对语言测试分数所作的解释的意义性和合理性,这就意味着对测试分数的解释就是对受试者语言能力的评估[1]。
Bachman 认为通过结构效度,我们不仅可以评估想要测量的受试者的语言能力,还可以通过对测试分数的解释来判断测试所采用的目标语使用语域是否合理。
基于口语任务的语言测试效度实证研究

这种 以任务 为 核心 的语 言 测试 与传 统测 试 有着 极 大 的 区别 , 目标 是 诱 导 和 评 价 学 习 者 在 以意 义 为 中心 其 并有 明确交 际 目的 的语 言 使 用环 境 下 的交 际行 为 , 真实 世 界 的需 要 成 为任 务 设 计 的驱 动力 。 TL B A的发 展 是依 据 当前 颇 为流 行 的 “ 构 主义 ” cnt c v m) 交 际 语 言 测试 。建 构 主 义 认 为 知 建 (osuti 和 r is 识 是 暂 时 的 、 展 的和 非 客观 的 , 经过 学 习者 内心构 建 并 受社 会 文 化影 响 的 , 的认 知 与 经 验 共 同发 发 是 人 展 , 识 与经 验 的重 新 构建 是 体验 、 现 和创 造 的过 程 。 因 而 真 实 自然 的任 务 有利 于 激 活 学 习者 已 有 的 知 发 知 识结 构 和认 知 图式 , 进 自身知 识 的重 组 与构 建 , 现 语 言知 识 的 内化 。基 于 上 述 理论 , 务 型语 言测 促 实 任 试 将测 试 目标 指 向学 习 者在 实 际 生 活 中有效 运 用 语 言完 成 特 定 交 际 任 务 的 能 力 。相 对 于 以语 言知 识 为 纲 的结 构 主义 测试 和 以 意义 为纲 的综合 测 试 , 类测 试 是 以交 际任 务 为纲 , 真 实性 和交 互 性 为 特 性 。
关 键 词 : 言测 试 ; 务 ; 度 语 任 效
中 图分 类 号 : 0 H9
文 献 标 识 码 :C
文 章 编 号 : 0 8 1 8 2 1 ) 4— 0 8—0 10 —8 4 ( 0 0 0 0 0 3
2 0世 纪 8 0年代 , 任务 型语 言 教 学 T L (akb sdln ug a hn ) B T ts—ae g aet c ig 已成 为 国际 英 语 教 育 的主 流 模 a e 式 。作 为 交 际法教 学 的延 续 , 它将 任务 的设 计 、 制 和 完 成 置 于 交 际 环 境 之 中 , 导 以 体 验 、 践 、 与 、 控 倡 实 参 交 流和 合作 的学 习方式 实 现 目标 并 感 受 成 功 。新 的语 言 学 习 观 和教 学 法 理 论 必 然 催 生 相 应 的 测 试模 式 与之 匹 配 。近 年来 , 正是 在 T L B T理 论 的推 动 下 , 于任 务 的语 言 测 试 (akb sdl g a eass n ) 基 ts —ae a u g ses t 迅 n me 速发 展并 成 为测 试 界关 注 的 热点 。2 0 0 0年在 加 拿 大温 哥 华 召开 的 第 2 2届 国际语 言测试 研 讨 会 主题 之 一 就 是 “ ut gt k ets 。语 言测 试 权威 杂 志 L n u g et g于 2 0 P tn sst t t i a oh e ” a g aeT sn i 0 2年第 4期 专 刊讨 论 基 于任 务
对语言测试效度及其证据来源的一些认识和思考

对语言测试效度及其证据来源的一些认识和思考作者:陈雨珣来源:《青年文学家》2009年第16期摘要:效度是语言测试最重要的准则之一,本文考查了效度概念中传统习惯划分的四个类别:标准效度、表面效度、内容效度和结构效度。
发展至今,结构效度成为其中最被广泛接受和最受研究的效度证据。
随着概念的发展,效度的证据来源也有了新的诠释,文章对五种证据来源作了说明。
关键词:效度结构效度表面效度内容效度标准效度证据来源【中图分类号】H31【文献标识码】A【文章编号】1002-2139(2009)-16-0075-01一、语言测试中的效度语言测试的首要目的是为研究者提供一个测量个体语言能力的指标。
效度是测试的有效性最重要也是最必要的准则,它体现了实现测试结果的有效程度。
效度通常被定义为一个研究对研究者所意图测量的特定概念所能反映或评测的程度。
语言测试中,效度关系到测量被测试者语言能力的研究是否成功,可用来判断某一项评分的解释是否合理,而这个解释也涵括了测试的意义及合理性。
这就要求测试中应充分考虑作为基础的评分指向的证据来源,以及评分应用的社会影响。
因而效度并非测试或测评的附属产物,而是测试结果涵义的产物。
二、效度的四个类型效度传统习惯上被分为四个类别:表面效度,内容效度,标准效度和结构效度。
表面效度涉及测量方法及其过程是如何呈现的。
包括它是否以合理的方式获取研究员试图得到的信息,它看起来是否设计良好,以及它看起来能否可靠地动作。
不同于内容效度,表面效度不需要架设理论来获得支持。
表面效度仅仅意味着表面的有效性。
由于表面效度的模糊性和主观性,心理测试学者们很久前便放弃了这个概念。
内容效度以测量方法所能反映的测量领域的程度为基础,找出测试内容是否反映了测试的要求。
乍看之下。
内容效度似乎类似于表面效度,但二者是有区别的。
在内容效度中,证据是在考官评判的协商中获得的。
简而言之,表面效度可以由~个人确立。
而内容效度需要一个专家小组来检测。
十一语言测试的效度

十一语言测试的效度1 效度(validity)● A measure is valid if it does what it is intended to do, which is typically to act as an indicatorof an abstract concept (for example height, weight, time, etc.) which it claims to measure.The validity of a language test therefore is established by the extent to which it succeeds in providing an accurate concrete representation of an abstract concept (for example proficiency, achievement, aptitude).●效度就是测验测到它打算测的东西的程度,或者说,是根据测验分数所作出的推论的恰当性程度。
一项语言测试,它测的到底是什么;对设计者打算测量的某种心理属性,它测得的程度如何;根据测试的结果,可以作出怎样的推论与解释。
诸如此类的问题都与测试的效度有关。
2 效度的种类效度通常有如下几种:●结构效度/构念效度/构想效度(construct validity)●内容效度(content validity)●效标关联效度(criterion-related validity),包括⏹同期效度/同时效度(concurrent validity)⏹预期效度(predictive validity)●表面效度/表层效度(face validity)(1)结构效度/构念效度/构想效度(construct validity)●概念构想效度是指测验成绩能够解释心理学理论上的某种结构或特质的程度。
语言测试中的构念效度研究

知识文库 第14期64 语言测试中的构念效度研究王天予1.引言在考虑到语言测试发展、解释和使用时首要考虑的就是效度。
那么什么是构念效度?如何更好地理解构念效度?该效度与其他效度的不同之处是什么?2.构念及构念效度 2.1构念要想理解什么是构念效度,首先要明白什么是构念(construct)。
从心理学的角度来看,构念指的是人类头脑中存在的一种特质、水平、能力或技巧(Brown,2000:9)。
在教育测量领域,构念就是一种能力(Wiley,2002),“指成功完成特定任务所要求的人类特征”。
Ebel 和Frisbie(1991:108)将构念解释为“有关人类行为某一方面的心理构建或理论概念,是既不能够直接测量也不能够直接观察的。
”构念效度是指某个心理测验在多大程度上正确地验证编制测验的理论构想。
《标准》(APA,1999)将构念视为一个测验拟测的概念或特征。
这是从广义上将构念来指测验所涉及测量的概念或特征。
实际上,构念的选择对考试内容、考试方式和分数意义的解释息息相关,是效度研究的基础,也对考试的设计和评价起着重要的作用。
2.2 构念效度如何更好的理解构念效度呢?在教育测量领域,上述讨论的内容效度、准则关联效度和构念效度这三种类型效度都是作为整体构念效度的不同方面。
语言测试者认为这种把构念效度作为整体观点是一种新的发展。
理论界对构念的定义有不同的看法,因此,通过识别他们是如何解释应答一致性来定义构念(Messick 1981) 。
Loevinger(1957:636)最早提出要把构念效度作为整体效度来看待。
在80 年代, 这一观点逐渐得到人们的认同: 构念效度不再作为效度的一种证据,而应包括内容和标准证据、信度及其它与理论验证有关的方法 (Messick 1975, 1980, 1988, 1989; Anastasi 1986)。
其中影响最大的是 Messick 的“效度整体观”。
Messick (1988,1989)进一步丰富了效度理论,对测试的解释和使用提供了证据基础。
语言测试构念效度

根据测试结果和反馈,对测试进行持续改进,优化试题设计、评分标 准和考试流程,进一步提高语言测试的构念效度和实用性。
05
结论和展望
主要结论汇总
语言测试构念效度是评估语言测试结 果是否真实反映被测者语言能力的重 要指标。
研究表明,有效的语言测试应该具备 清晰的目标、真实的任务、可靠的评 分方法等特征。
03
语言测试构念效度的 实证研究
研究设计
明确研究目标
首先,需要明确语言测试构念效 度的具体目标,例如,是要验证 某一特定语言测试的构念效度, 还是要比较不同语言测试的构念
效度。
选择适当的受试者
受试者的选择应当代表语言测试 的目标人群,以确保研究结果的 普遍性。同时,受试者的数量也 应足够,以满足统计分析的要求
。
设计测试任务
测试任务应能全面反映语言能力 的各个方面,包括听、说、读、 写等。任务的难度和长度应适中 ,以避免受试者产生疲劳或厌倦
。
Hale Waihona Puke 数据收集和分析方法数据收集
收集受试者在语言测试中的表现数据,包括得分、反应时间、错误类型等。同时,也可以收集一些背景信息,如 受试者的年龄、性别、母语等。
数据分析
可以采用定量和定性两种分析方法。定量分析可以通过统计方法,如相关分析、回归分析等,来探究语言测试和 语言能力之间的关系。定性分析可以通过对受试者的表现进行深入观察和分析,来获取更丰富的信息。
构念的理解
构念可以是理论构念,也可以是经验构念,它们都是对某一现象或事物的抽象描 述。
构念效度的评估方法
内容效度评估
通过检查测验内容是否充分、 全面地反映了所要测量的构念
来进行评估。
结构效度评估
语言学习潜能测试构念的研究

语言学习潜能测试构念的研究卜杰民(浙江广厦建设职业技术学院经贸外国语学院,浙江东阳 322100)*摘 要:语言学习潜能测试构念(L a n g u a g eL e a r n i n g Po t e n t i a lT e s tC o n s t r u c t )是语言学习潜能测试试卷编制的语言学和认知科学的基础㊂文章界定了语言学习潜能测试构念的概念,建立了语言学习潜能测试构念的分类框架,论述了其因子的表征,进行了因子表的结构效度验证㊂文章是对语言学习潜能测试构念所进行的理论探索,以为语言学习潜能测试试卷的编制提供一种理论架构㊂关键词:语言学习潜能;语言能力;学习能力;测试构念;结构效度验证d o i :10.3969/j.i s s n .2095-5642.2020.06.011中图分类号:H 08 文献标志码:A 文章编号:2095-5642(2020)06-0071-10语言学习潜能(L a n g u a g eL e a r n i n g Po t e n t i a l )是指学习者为完成语言学习任务所具有的潜在或者可能的能力㊂它是语言能力(L a n g u a g eA p t i t u d e )和学习能力(L e a r n i n g A pt i t u d e )的综合㊂语言学习潜能在第二语言习得中起着至关重要的作用,是因为语言学习潜能既是第二语言习得的个体差异变量之一[1],也是预测第二语言习得的学习结果的因素之一[2],同时具有语言学习普适性的属性[3]㊂国内外学者从不同的角度从以下几个方面对语言学习潜能进行了研究,相关研究文献包括:语言学习潜能测量结果和学习结果的相关数达0.50[4]㊁语言学习潜能和第二语言语法水平的相关性[5-7]㊁语言学习潜能和语言知识的相关性[8]㊁语言学习潜能在外显学习和内隐学习条件下的作用[9-14]㊁语言学习潜能对第二语言习得的影响[15]㊁语言学习潜能研究范式[16]及语言学习潜能和学习任务之间关系的实证研究[17]㊂这些研究文献主要回答了以下四个问题:(1)语言学习潜能和语言知识的相关性问题;(2)语言学习潜能在不同的教学环境和学习任务中的作用问题;(3)语言学习潜能对语言学习水平的预测性问题;(4)语言学习潜能的研究范式问题㊂这些相关研究文献奠定了语言学习潜能测试理论建构的基础㊂语言学习潜能测试旨在测试学习者的语言学习潜能,或者说测试学习者的语言能力倾向,其理论建构的核心问题是语言学习潜能测试构念概念的建构㊁因子表征和因子表的结构效度验证㊂为了简洁之便,语言学习潜能测试构念这个术语取其英文单词首字母,下文通称L L P T C ㊂有鉴于L L P T C 理论建构的核心问题,本研究探讨三个问题:(1)概念的建构;(2)因子的表征;(3)因子表的结构效度验证㊂概念的建构旨在解决L L P T C 范畴的问题,其因子表征旨在解决L L P T C 范畴在语言学层面和认知层面的构成成分表征的问题,因子表的结构效度验证旨在解决L L P T C 因子有效性的问题㊂在汉语语境下研究中国语言学习者L L P T C 概念的建构㊁因子的表征和结构效度验证,必须要了解第二语言习得的语言学习能力模块㊂17*收稿日期:2019-12-30基金项目:浙江省教育考试2018年度研究课题 基于多元智力理论的学生语言学习潜能动态评估研究与实践 (2018Z J K S 229)部分研究成果 作者简介:卜杰民(1962 ),男,浙江东阳人,副教授,硕士,研究方向:语言学和语言习得㊂成都师范学院学报2020年6月一㊁语言学习能力模块语言学习能力(潜能)与第二语言习得有着相互联系㊂S k e h a n[18]把语言能力进行了分解,分为听觉加工模块㊁语言加工模块和记忆模块㊂听觉加工模块对应语音编码能力,语言加工模块对应语法感知力和语言归纳能力,记忆模块对应记忆(即时记忆和延时记忆)能力和检索能力㊂在此基础上S k e h a n[19]把这些语言学习能力模块和信息处理过程进行了对应:(1)语音编码能力与输入加工相联系;(2)语言分析能力与中间处理相联系;(3)作为检索的记忆与输出和流利相联系㊂Dör n y e i与S k e h a n[2]对语言习得加工步骤和语言学习能力模块的联系进行了细化,具体情况见表1㊂表1二语习得步骤与语言学习能力模块联系表二语习得加工步骤相应的语言学习能力模块语言输入的加工策略注意力的控制,工作记忆注意语音编码能力,工作记忆语言结构的识别语音编码能力,工作记忆,语法感知力,归纳性语言学习能力语言结构重构和操纵语法感知力,归纳性语言学习能力语言结构的控制自动化,融合记忆语言结构的融合组块能力,检索记忆表1中所列出的语言学习能力模块反映语言学习者的语言学习潜能㊂从语言学的层面来看,语言学习潜能是一种与生俱有的天资,固存于人们的大脑中,体现为语言学习者大脑中的语言学习能力的初始状态,具体表现为以下潜在的能力:(1)能够说出或理解以前未接触到的㊁合乎语法的语句;(2)能够辨析有歧义的语句;(3)能够判别表面形式相同而实际语义不同,或者表面形式不同而实际语义相似的语句;(4)听㊁说㊁读㊁写㊁译等语言技能㊂语言学习潜能具有三个特点:(1)对于语言习得而言,语言学习潜能具有普适性属性;(2)对于语言学习者而言,语言学习潜能具有个体差异性属性;(3)对于语言测试而言,语言学习潜能具有可测性属性㊂从心理学的层面来看,语言学习潜能以心理特质的形式存在于人们的大脑中㊂心理特质指的是心理活动进行时所表现出来的稳定特点㊁反映意识倾向,体现心理活动的独特性㊂语言学习潜能就是这样一种语言学习方面的心理特质,体现语言学习的能力倾向㊂但是如何测试这种语言学习潜能心理特质呢?语言学习潜能心理特质的测试可以通过测试构念这个概念来加以体现,测试构念可以通过因子表征的方法来加以实现㊂下面先讨论L L P T C概念的建构㊂二㊁L L P T C概念的建构测试构念(T e s tC o n s t r u c t)是一个心理测量学的概念,指的是人们所具有的某种心理特质通过间接的方式所表现出来的测试点[20]㊂测试构念奠定了语言学习潜能测试的基础,在心理学层面测试构念以心理构念(P s y c h o l o g i c a l C o n s t r u c t)的方式体现㊂这种心理构念根据G a r d n e r多元智力理论的理解,不是单一的而是多维度的心理构念,是语言潜能和学习潜能的综合体现,其测试构念(测试点)可以用范畴的方式表征㊂此处的范畴(C a t e g o r y)是指反映语言学习潜能本质属性和普遍联系的基本概念㊂但是测试构念如何以范畴的方式表征呢?在现实世界里,其范畴的表征要通过范畴化(C a t e g o r i z a t i o n)的过程来实现㊂所谓L L P T C范畴化是指认知主体对其范畴进行分类的过程,是构建L L P T C范畴的基础㊂综合C h o m s k y的语言天赋论理论[21]和G a r d n e r的多元智力理论[22],L L P T C范畴可以分解为L L P T C知识范畴(L L P T CK n o w l e d g eC a t e g o r y)和L L P T C认知范畴(L L P T CC o g n i t i v eC a t e g o r y)㊂知识范畴对应于表1中的语音编码能力㊁语法感知力和相应的语言学习能力模块,属于C h o m s k y界定的语言能力范畴;认知范27第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究畴对应于表1中的工作记忆和归纳性语言学习能力,属于G a r d n e r界定的智力范畴㊂L L P T C范畴的二分法较好地体现了语言学习潜能的本质属性,是建立L L P T C分类框架的一种途径㊂L L P T C知识范畴折射语言学习者的语言能力倾向测试点类型,体现他们的语言学习潜能在语言学层面的测试构成要素,反映他们在未来语言学习前的大脑中语言习得(学习)机制中语言能力的初始状态㊂其知识范畴包括语音辨析能力(P h o n e t i cR e c o g n i t i o n)㊁语素辨析能力(M o r p h e m eR e c o g n i t i o n)㊁语法感知力能力(G r a mm a t i c a l S e n s i t i v i t y)和语义辨析能力(S e m a n t i cA n a l y s i s),分别对应语音学/音系学㊁语素学㊁句法学和语义学范畴㊂语音辨析能力是指识别不同语音的能力,它以语音符号联想能力为特征,在语音和代表它们的符号之间建立联想;语素辨析能力是指识别构成最小意义单位语素的能力;语法感知力能力是指把语言形式与其特定的语境分离,从语言材料中推断出语言规则的能力;语义辨析能力是指分辨词的意义和词与词意义之间逻辑关系的能力㊂L L P T C认知范畴体现语言学习者的语言学习元认知能力,反映他们在未来语言学习前的大脑中语言习得(学习)机制中学习能力的初始状态,包括配对联想能力(P a i r e d A s s o c i a t i o n)㊁归纳分析能力(I n d u c t i v e A n a l y s i s)和记忆能力(M e m o r y)㊂配对联想能力是指把刺激和反应联系在一起的能力,迅速而有效地学习语音和意义之间联系的能力[23]㊂归纳分析能力是指根据已知语言材料推断㊁归纳及支配一组语言材料规则的能力㊂记忆能力是指保存语音和意义之间联系和语言规则的能力㊂L L P T C知识范畴和L L P T C认知范畴共同构成L L P T C范畴㊂它们两者之间的关系是:认知范畴是知识范畴的认知基础,知识范畴是认知范畴的加工对象,认知范畴蕴含知识范畴,知识范畴表征认知范畴㊂知识范畴构成L L P T C语言因子,其加工对象和表征属性反映语言因子的属性;认知范畴构成L L P T C学习因子,其认知基础和蕴含属性反映学习因子的属性㊂L L P T C的分类框架及关系如图1所示㊂图1 L L P T C分类框架及关系图在理解了L L P T C分类框架和它们之间关系的基础上,下面讨论在测试中实现这种分类框架的方法,即研究L L P T C因子的表征㊂三、L L P T C因子的表征所谓L L P T C因子(L L P T CF a c t o r)指的是其范畴的构成成分㊂如图1所示,L L P T C知识范畴相对应的有四个组成成分,分别是语音辨析㊁语素辨析㊁语法感知力和语义辨析㊂这四个组成成分体现了大的L L P T C语言学属性,称为L L P T C共同语言因子(L L P T CC o mm o nL a n g u a g eF a c t o r)㊂L L P T C认知范畴相对应的有三个组成成分,分别是配对联想㊁归纳分析和记忆㊂这三个组成成分包含了大的L L P T C认知学习属性,称为L L P T C共同学习因子(L L P T C C o mm o n L e a r n i n g F a c t o r)㊂L L P T C的因子表征就是把L L P T C共同因子((L L P T CC o mm o nF a c t o r)所代表的L L P T C大范畴分解成具有测试可操作性的L L P T C 特殊因子(L L P T CS p e c i f i cF a c t o r)所代表的L L P T C小范畴,形成语言学习潜能测试点㊂L L P T C各个因子形成一个因子表,如表2所示㊂37成都师范学院学报2020年6月表2 L L P T C因子表L L P T C共同因子L L P T C特殊因子表征信息L L P T C 共同语言因子语音辨析语素辨析语法感知力语义辨析语音符号根据所听到的语音辨识音节符号语音分辨根据所听到的句子辨识所含的单词重音辨识根据所听到的单词语音辨识重音相异的单词语素分析辨识名词构词㊁动词构词㊁形容词构词和副词构词句子中的单词根据例示辨识单词在句子中的语法功能词汇同义词㊁近义词辨析词语类比辨识词语之间的逻辑语义关系L L P T C 共同学习因子配对联想拼写提示根据意义把语音和符号联系在一起归纳分析语言分析分析语言规则,翻译句子记忆词汇记忆根据提示记忆词汇如表2所示,共同因子由其所属的各特殊因子组合而成㊂具体讲就是:共同因子表征由其所属的各特殊因子共同的抽象属性,特殊因子不但表征其所属的共同因子的抽象属性,而且还表征其本身的具体属性㊂换句话讲共同因子是各个特殊因子所共有的因子,是对某个集合成员所有因子的概括,特殊因子是共同因子所概括的某个集合成员中的一个因子㊂表2所示的因子表体现其范畴结构,反映其本质属性㊂共同因子和特殊因子构成L L P T C结构效度验证的对象㊂结构效度验证就是看看在多大程度上这些因子能够测试出所要测试的语言学习潜能㊂下面讨论L L P T C因子表的结构效度验证的问题㊂四、L L P T C因子表的结构效度验证(一)结构效度验证的理论假设L L P T C因子表的结构效度验证采用因子分析法(F a c t o rA n a l y s i s)㊂因子分析法所依据的原理是检验表2所示的L L P T C因子表中特殊因子在其所属共同因子下的聚合效应(C o n v e r g e n tE f f e c t)及各个共同因子间的区分效应(D i s c r i m i n a n tE f f e c t)㊂如果能够证明L L P T C因子表具有较好的聚合效应和区分效应,则说明L L P T C因子表具有较好的结构效度㊂聚合效应反映因子表中特殊因子在其所属共同因子下相互紧密联系的程度,其相互紧密联系的目的是保证共同因子所属的特殊因子都具有其共同因子的属性㊂其紧密联系的程度用特征值(E i g e n v a l u e)㊁因子负荷((F a c t o rL o a d i n g)和共同性(C o mm u n a l i t y)三个指标来度量㊂(1)特征值指的是共同因子解释其所属特殊因子的程度㊂特征值越大,说明共同因子解释其特殊因子的程度越高㊂(2)因子负荷指的是共同因子和其所属各个特殊因子之间的相关系数㊂因子负荷越大,说明共同因子和特殊因子的相关程度越高㊂(3)共同47第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究性指的是特殊因子能被共同因子解释的程度㊂共同性越大,说明特殊因子能被共同因子解释的程度越高㊂区分效应反映因子表中各个共同因子之间互不重复㊁相对独立的程度,其相对独立的目的是保证不同的共同因子具有不同的属性㊂(二)结构效度验证的方法L L P T C因子表的聚合效应验证是通过特征值㊁因子负荷㊁共同性的统计值和其相应参数临界值的比较来进行的㊂L L P T C因子表的聚合效应验证的参数临界值是[24]:(1)特殊值达到可接受值1.0或者1.0以上;(2)因子负荷达到可接受值0.3或者0.3以上;(3)共同性达到可接受值0.7或者0.7以上㊂如果L L P T C因子分析的统计值满足以上三个条件,则可以推断:(1)共同因子解释其所属特殊因子的程度较高;(2)共同因子与其所属的特殊因子有较高的相关程度;(3)特殊因子被共同因子解释的程度较高㊂由此证明本研究的L L P T C因子表中共同因子和其所属的特殊因子具有较好的聚合效应㊂较好的区分效应通过采用因子分析中的直角旋转法(O r t h o g o n a lR o t a t i o n)来达到㊂直角旋转的作用是使各个L L P T C共同因子相对独立,以保证每个共同因子在解释L L P T C因子表结构效度中起到应该起的独特作用㊂(三)结构效度验证的任务L L P T C因子表的结构效度验证的任务是:(1)检验L L P T C因子的特征值;(2)检验L L P T C因子的因子负荷;(3)检验L L P T C因子的共同性㊂(四)结构效度验证的被试本研究的被试为某高校在新生入学时从参加语言学习潜能测试的全体大一新生中随机抽取的120名学生,其中,有60名男生和60名女生㊂之所以从全体测试新生中随机抽取120名学生,是因为全体大一新生能够保证:(1)有足量的被试;(2)有异质的被试(即含有语言水平和认知水平高㊁中㊁低的被试)㊂足量的被试保证随机抽取的测试样本量足够大,能够保证数据检验有统计意义;异质的被试作为一个整体样本反映自然状态下所测试的语言学习者的语言能力和认知能力初始状态分布的情况,即含有语言能力和认知能力高中低的被试并按正态分布,保证随机抽取的测试样本是反映自然状态的真实样本㊂本研究的被试满足这两个条件,因此L L P T C因子表的结构效度的数据检验具有统计意义,从而保证了本研究的信度和效度㊂(五)测试样卷结构信息和样题信息本研究的测试样卷分七个大部分㊁十个小部分㊂每一个小部分10道题,共100道题;每题1分,总分100分㊂七个大部分对应七个测试构念共同因子,十个小部分对应十个测试构念特殊因子㊂样卷结构信息和样题信息如附录所示㊂(六)数据收集与分析运用语言学习潜能测试样卷,在大一新生入学时在全体大一新生中进行语言学习潜能测试,其性质是诊断性的,其目的是了解学生的语言学习潜能,以便开展分层分类教学㊂同时利用该测试数据进行本研究的L L P T C因子表的结构效度验证㊂测试时间为120分钟㊂在测试开始前,参加语言学习潜能测试的全体大一新生进行随机抽取编号㊂随机抽取编号的目的是为了便于评分结束后的随机抽取样本试卷㊂在测试时要求每位学生在试卷上填上姓名㊁性别㊁年龄和编号㊂测试结束后,教师按照评分规则评分,统计出每位学生试卷上的每一小部分的分数㊂评分结束后,随机抽取120份答卷(60份男生答卷㊁60份女生答卷),形成被试样本试卷,以备数据录入分析㊂因为数据是以分数的方式呈现,所以所分析的L L P T C因子表是定距测量,满足因子分析的前提条件㊂数据录入分两部分进行㊂第一部分录入被试样本试卷每位被试的姓名㊁性别㊁年龄和编号㊂第二部分录入每位被试答卷的每一小部分成绩,它们分别对应于语音符号㊁语音分辩㊁重音辨识㊁语素㊁句子中的单词㊁词汇㊁词语类比㊁拼写提示㊁语言分析和词汇记忆的分数㊂这十个分数变量对应十个L L P T C特殊因子,如表2所示㊂前三个特殊因子对应第一个L L P T C共同因子 语音辨析;第四个特殊因子对应第二个L L P T C共同因子 语素辨析;第五个特殊因子对应第三个L L P T C共同因子 语法感知力;第六个和第七个特殊57成都师范学院学报2020年6月因子对应第四个L L P T C共同因子 语义辨析;第八个特殊因子对应第五个L L P T C共同因子 配对联想;第九个特殊因子对应第六个L L P T C共同因子 归纳分析;第十个特殊因子对应第七个L L P T C共同因子 记忆㊂前四个共同因子表征被试语言学习潜能的语言(知识)属性特征,后三个共同因子体现被试语言学习潜能的学习(认知)属性特征,被试的语言(知识)属性特征和学习(认知)属性特征共同勾画出其语言学习潜能特征㊂数据录入完毕后,运用S P S S统计软件对已录入的数据进行验证性因子分析(C o n f i r m a t o r y F a c t o rA-n a l y s i s),其因子旋转选择V a r i m a x旋转,计算出相关系数㊂五㊁结果与讨论(一)KMO测度和B a r t l e t t球体检验在作因子分析以前,先进行KMO测度和B a r t l e t t球体检验,以检查数据是否适用于因子分析,结果见表3㊂表3 KMO测度和B a r t l e t t球体检验表KMO测度值(K a i s e r-M e y e r-O l k i n M e a s u r eO f S a m p l i n g A d e q u a c y)0.897B a r t l e t t球体检验值(B a r t l e t t sT e s tO fA p p r o x.C h i-S q u a r eS p h e r i c i t y)677.638方差值(d f.)9显著水平值(S i g.)0.000注:显著水平值(S i g.)ʈ0.000<0.05,数据具有统计意义㊂表3列出了KMO测度值㊂KMO测度值表明全部变量的方差比例,也就是说该方差比例可能是由潜在的因子造成的㊂一般来说,KMO测度值越高(接近于1.0),表明变量间的共同因子越多,数据越适合用因子分析㊂KMO测度值的可接受值为0.7[24]㊂表3所示的KMO测度值为0.897,大于0.7可接受值,数据适合做因子分析㊂表3也列出了B a r t l e t t球体检验值㊂B a r t l e t t球体检验值说明相关矩阵是否为单位矩阵㊂如果是单位矩阵,不适宜用因子分析㊂如果显著水平值(S i g.)大(>0.05),说明变量间相关性低,相关矩阵是单位矩阵,不适宜用因子分析[24];如果显著水平值(S i g.)小(<0.05),说明变量间相关性高,相关矩阵不是单位矩阵,适合用因子分析[24]㊂表3所示的B a r t l e t t球体检验中,显著水平值(S i g.)ʈ0.000<0.05,表明变量间有显著的关系,变量间存在着共同因子,适合用因子分析㊂(二)特征值㊁因子负荷和共同性的检验表4列出了因子的特征值㊂特征值是所有特殊因子值在某一共同因子上的负荷值的平方总和,解释的是相关矩阵中的方差,可接受值是1.0,特征值越大,共同因子解释其特殊因子的程度越高㊂表4因子的特征值㊁解释方差和累计方差表L L P T C共同因子标签(L a b e l)特征值(E i g e n v a l u e)方差(V a r i a n c e)累计方差(C u m u l a t i v eV a r i a n c e)L L P T C 共同语言因子因子1语音辨析2.5327.05158.065因子2语素辨析2.2115.38252.194因子3语法感知力3.7212.45650.183因子4语义辨析2.4518.57554.02367第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究(接上表)L L P T C 共同因子标签(L a b e l)特征值(E i ge n v a l u e )方差(V a r i a n c e )累计方差(C u m u l a t i v eV a r i a n c e)L L P T C共同学习因子因子5配对联想2.1425.75357.564因子6归纳分析2.0811.07850.056因子7记忆2.2612.64750.195表5列出了因子负荷和共同性㊂因子负荷反映特殊因子和共同因子之间的相关程度,解释的是特殊因子值对共同因子的贡献率,可接受值是0.3,因子负荷越大,相关程度越高㊂共同性是每个特殊因子值在每个共同因子上的负荷值的平方总和,从共同性的大小可以判断特殊因子和共同因子之间的关联程度,可接受值是0.7,共同性越大,特殊因子能被共同因子解释的程度越高㊂表5 因子负荷和共同性表L L P T C 共同因子L L P T C 特殊因子因子负荷(F a c t o rL o a d i n g)共同性(C o mm u n a l i t y)L L P T C共同语言因子语音辨析语素辨析语法感知力语义辨析语音符号0.8050.704语音分辩0.8240.852重音辨识0.8360.736语素0.7420.719句子中的单词0.8680.758词汇0.8560.795词语类比0.7230.703L L P T C共同学习因子配对联想拼写提示0.7010.767归纳分析语言分析0.8470.824记忆词汇记忆0.8710.875从表4和表5可以看出,各因子的特征值介于2.08-3.72之间,各因子的因子负荷介于0.701-0.871之间,各因子的共同性介于0.703-0.875之间,都大于可接受值,L L P T C 因子表具有较好的聚合效应㊂较好的区分效应通过V a r i m a x 旋转得到了保证㊂因此可以得出结论:本研究的L L P T C 因子表具有较好的结构效度㊂六、结语本研究梳理了语言学习潜能相关研究文献,界定了L L P T C 的概念,研究了L L P T C 的分类框架和L L P T C 因子的表征,进行了L L P T C 因子表的结构效度验证㊂本研究成果为语言学习潜能测试试卷的编制提供了一种理论架构和命题依据㊂把该研究成果大规模地应用到语言学习潜能测试工作中去,还需要建设试题库,保证有足量试题以供抽题㊂只有做好了这项工作,才能成功地实施语言学习潜能测试工作,取得它应该有的效果㊂77成都师范学院学报2020年6月附录T h e I n f o r m a t i o n f o rL a n g u a g eL e a r n i n g P o t e n t i a l S a m p l eT e s tP a p e r(语言学习潜能测试样卷结构信息和样题信息)P a r t I.P h o n e t i cR e c o g n i t i o n(语音辨析)S e c t i o nA.P h o n e t i cS c r i p t(语音符号)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h eb e s t a n s w e r.A.b e e kB.b e e vC.b u tD.b u vS e c t i o nB.S o u n dD i s c r i m i n a t i o n(语音分辩)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h eb e s t a n s w e r.A.r i n g e rB.h a n g e rC.f i n g e rD.s i n g e rS e c t i o nC.S t r e s sP a t t e r n I d e n t i f i c a t i o n(重音辨识)D i r e c t i o n s:A c c o r d i n g t ow h a t y o uh e a r c h o o s e t h e s t r e s sw h i c h i s d i f f e r e n t f r o mt h e o t h e r t h r e e o n e s A.N a v y B.A r m y C.B u r g e r D.R e p l a c eP a r t I I.M o r p h e m eR e c o g n i t i o n(语素辨析)S e c t i o nA.M o r p h o l o g y(语素)D i r e c t i o n s:A c c o r d i n g t ot h es e n t e n c e m e a n i n g f i l l i nt h eb l a n k w i t ht h e p r o p e rf o r m o f t h e w o r d m a r k e dA,B,Ca n dD.1.T h e f a i l u r e h i mf r o mk e e p i n g o n t r y i n g a n d a t l a s t h eb e c a m e a r e a l f a i l u r e.A.e n c o u r a g e dB.c o u r a g eC.d i s c o u r a g e dD.c o u r a g e o u sP a r t I I I.G r a m m a t i c a l S e n s i t i v i t y(语法感知力)S e c t i o nA.W o r d s i nS e n t e n c e s(句子中的单词)D i r e c t i o n s:C h o o s e t h eb e s t a n s w e r t h a t h a s t h e s a m e g r a mm a t i c a l f u n c t i o na s t h e c u ew o r d(提示词).1.J O H Nt o o ka l o n g w a l k i n t h ew o o d s.T h e c u ew o r dC h i l d r e n i nb l u e j e a n sw e r e s i n g i n g a n dd a n c i n g i n t h e p a r k.A B C DP a r t I V.S e m a n t i cA n a l y s i s(语义辨析)S e c t i o nA.V o c a b u l a r y(词汇)D i r e c t i o n s:C h o o s e t h eb e s t a n s w e r t h a t h a s t h e s a m em e a n i n g a s t h e c u ew o r d(提示词).1.p r o l o n g e d(t h e c u ew o r d)A.p r o m p tB.d e c r e a s e dC.d i f f i c u l tD.e x t e n d e dS e c t i o nB.W o r dA n a l o g y(词语类比)D i r e c t i o n s:A c c o r d i n g t o t h e s e m a n t i c r e l a t i o n s b e t w e e n t h e c u ew o r d s(提示词)c h o o s e t h e b e s t a n s w e r.1.m o u n t:h o r s e::t r a i n(t h e c u ew o r d s)A.s t a b l eB.s h o eC.r i d eD.b o a r dP a r tV.P a i r e dA s s o c i a t i o n(配对联想)S e c t i o nA.S p e l l i n g C u e(拼写提示)D i r e c t i o n s:A c c o r d i n g t o t h em e a n i n g o f t h e c u ew o r d(提示词)p r o n o u n c e db y t h e d i s g u i s e dw o r d(伪装词)c h o o s e t h eb e s t a n s w e rw h i c hh a s t h e s a m em e a n i n g a s t h e c u ew o r d.1.r e s t r n t(t h e c u ew o r d/t h e d i s g u i s e dw o r d)A.f o o dB.s e l f-c o n t r o lC.s l e e pD.s p a c e e x p l o r e r87第36卷(总第328期)卜杰民:语言学习潜能测试构念的研究P a r tV I.I n d u c t i v eA n a l y s i s(归纳分析)S e c t i o nA.L a n g u a g eA n a l y s i s(语言分析)D i r e c t i o n s:A n a l y s e t h e l a n g u a g e r u l e s f o r t h e c u es e n t e n c e(提示句)a n d t r a n s l a t e t h es e n t e n c e i n t oE n g l i s h.提示句 T h e c u e s e n t e n c e汉语E n g l i s h一个英俊的男孩喜欢一条跑着的狗㊂Ah a n d s o m eb o y l i k e s a r u n n i n g d o g.T h e l a n g u a g e r u l e s(语言规则)汉语E n g l i s h男孩,一个男孩b o y,ab o y狗,一条狗d o g,ad o g英俊的,跑着的h a n d s o m e,r u n n i n gT h e s e n t e n c e t ob e t r a n s l a t e d(翻译句子)汉语一条英俊的狗喜欢一个跑着的男孩㊂E n g l i s h t r a n s l a t i o n.P a r tV I I.M e m o r y(记忆)S e c t i o nA.V o c a b u l a r y M e m o r y(词汇记忆)D i r e c t i o n s:F i r s t l o o k a t t h eE n g l i s hw o r d s,t o g e t h e rw i t h t h e i rC h i n e s e e q u i v a l e n t s,a n d t h e n c h o o s e t h eb e s t a n s w e r a c c o r d i n g t o t h e c u ew o r d(提示词).汉语E n g l i s h桔子汁j u i c e公牛o x儿子s o n1.公牛(t h e c u ew o r d)A.a n i m a lB.s t i c kC.j u m pD.o x参考文献:[1] C O C H R A NJL,M C C A L L UM RR,B E L LSM.T h r e eA s:H o wd o a t t r i b u t i o n s,a t t i t u d e s,a n d a p t i t u d e c o n t r i b u t e t of o r e ig n l a n g u a g e l e a r n i n g[J].F o r e i g nL a n g u a g eA n n a l s,2010,43:566-582.[2] DÖR N Y E I Z,S K E HA NP.I n d i v i d u a l d i f f e r e n c e s i n s e c o n d l a n g u a g e l e a r n i n g[C]//D o u g h t y CJ.T h eH a n d b o o ko f s e c-o n d l a n g u a g e a c q u i s i t i o n.O x f o r d:B l a c k w e l l,2003:589-63.[3] C A R R O L LJB.I m p l i c a t i o n s o f a p t i t u d e t e s t r e s e a r c h a n d p s y c h o l i n g u i s t i c t h e o r y f o r f o r e i g n l a n g u a g e t e a c h i n g[J].I n t e r-n a t i o n a l j o u r n a l o f p s y c h o l i n g u i s t i c s,1973(2):5-l4.[4] S K E HA NP.I n d i v i d u a l d i f f e r e n c e s i n s e c o n d l a n g u a g e l e a r n i n g[J].S t u d i e s i n s e c o n d l a n g u a g e a c q u i s i t i o n:275-298.[5] A B R A HAM S S O N N,H Y L T E N S T AM K.T h e r o b u s t n e s s o f a p t i t u d e e f f e c t s i nn e a r-n a t i v e s e c o n d l a n g u a g e a c q u i s i t i o n[J].S t u d i e s i n s e c o n d l a n g u a g e a c q u i s i t i o n,2008,30(4):481-509.97成都师范学院学报2020年6月[6] D E K E Y S E RR,A L F I-S HA B T A YI,R A V I DD.C r o s s-l i n g u i s t i c e v i d e n c e f o r t h e n a t u r e o f a g e e f f e c t s i n s e c o n d l a n g u a g ea c q u i s i t i o n[J].A p p l i e d p s y c h o l i n g u i s t i c s,2010,31(3):413-438.[7] G R A N E N A G.A g ed i f f e r e n c e s a n dc o g n i t i v e a p t i t u d e s f o r i m p l i c i t a n de x p l i c i t l e a r n i n g i nu l t i m a t e s e c o n d l a n g u a g ea t-t a i n m e n t[D].U n p u b l i s h e dP h Dd i s s e r t a t i o n,M a r y l a n d:U n i v e r s i t y o fM a r y l a n d,2012.[8] G R A N E N A G,L O N G M.A g e o f o n s e t,l e n g t h o f r e s i d e n c e,l a n g u a g e a p t i t u d e,a n du l t i m a t eL2a t t a i n m e n t i n t h r e e l i n-g u i s t i c d o m a i n s[J].S e c o n d l a n g u a g e r e s e a r c h,2013,29(3):311-343.[9] E R L AM R.L a n g u a g e a p t i t u d e a n d i t s r e l a t i o n s h i p t o i n s t r u c t i o n a l e f f e c t i v e n e s s i n s e c o n d l a n g u a g e a c q u i s i t i o n[J].L a n-g u a g e t e a c h i n g r e s e a r c h,2005,9(2):147-171.[10] S H E E N Y.T h e e f f e c t o f f o c u s e dw r i t t e n c o r r e c t i v e f e e d b a c k a n d l a n g u a g e a p t i t u d e o nE S L l e a r n e r s a c q u i s i t i o no f a r t i-c l e s[J].T E S O L q u a r t e r l y,2007,41(2):255-283.[11] HWU F,S U N S.T h ea p t i t u d e t r e a t m e n t i n t e r a c t i o ne f f e c t so nt h e l e a r n i n g o f g r a mm a r r u l e s[J].S y s t e m,2012,40(4):505-521.[12] V A N P A T T E N B,B O R S TS.T h e r o l e s o f e x p l i c i t i n f o r m a t i o n a n d g r a m m a t i c a l s e n s i t i v i t y i n p r o c e s s i n g i n s t r u c t i o n:n o m i n a-t i v e a c c u s a t i v e c a s em a r k i n g a n dw o r d o r d e r i nG e r m a nL2[J].F o r e i g n l a n g u a g e a n n a l s,2012,45(1):92-109. [13] V A NP A T T E NB,B O R S TS.T h e r o l e s o f e x p l i c i t i n f o r m a t i o n a n d g r a mm a t i c a l s e n s i t i v i t y i n t h e p r o c e s s i n g o f c l i t i c d i-r e c t o b j e c t p r o n o u n s a n dw o r do r d e r i nS p a n i s hL2[J].H i s p a n i a,2012,95(2):270-284.[14] Y I L MA ZY.R e l a t i v e e f f e c t s o f e x p l i c i t a n d i m p l i c i t f e e d b a c k:t h e r o l e o fw o r k i n g m e m o r y c a p a c i t y a n d l a n g u a g e a n a l y t-i c a b i l i t y[J].A p p l i e d l i n g u i s t i c s,2013,34(3):344-368.[15]戴运财.语言学能对二语习得的影响[J].外语教学与研究,2006(6):451-459.[16]戴运财,蔡金亭.二语习得中的语言学能研究:回顾㊁现状㊁思考与展望[J].外国语,2008(5):80-89.[17]顾伟勤.重谈语言学能 外语学习中个体差异的一个重要构成[J],中国外语,2008(6):62-67.[18] S K E HA NP.Ac o g n i t i v e a p p r o a c h t o l a n g u a g e l e a r n i n g[M].O x f o r d:O x f o r dU n i v e r s i t y P r e s s,l998.[19] S K E HA NP.T h e o r i s i n g a n du p d a t i n g a p t i t u d e[C]//R O B I N S O NP.I n d i v i d u a l d i f f e r e n c e s i n i n s t r u c t e d l a n g u a g e l e a r n-i n g.P h i l a d e l p h i a:J o h nB e n j a m i n sP u b l i s h i n g C o m p a n y,2002:69-94.[20] C R O N B A C H LJ,M E E H LPE.C o n s t r u c t v a l i d i t y i n p s y c h o l o g i c a l t e s t s[J].P s y c h o l o g i c a l b u l l e t i n,1955(52):281-302.[21] C HOM S K Y N.A s p e c t s o f t h e t h e o r y o f s y n t a x[M].C a m b r i d g e:M I TP r e s s,1965.[22] G A R D N E R H.F r a m e s o fm i n d:t h e t h e o r y o fm u l t i p l e i n t e l l i g e n c e s[M].N e w Y o r k:B a s i cB o o k s,1983.[23] V I C O R Y AC,A S H E RJ J.T h e p a i r e d a s s o c i a t e t a s k a s a p r e d i c t o r o f f o r e i g n l a n g u a g e f l u e n c y[J].T h e j o u r n a l o f p s y-c h o l o g y,1966(64):29-32.[24]秦晓晴.外语教学研究中的定量数据分析[M].武汉:华中科技大学出版社,2003.O nL a n g u a g eL e a r n i n g P o t e n t i a l T e s t C o n s t r u c tB UJ i e m i n(F o r e i g nL a n g u a g e sS c h o o l,Z h e j i a n g G u a n g s h aC o l l e g eO fA p p l i e dC o n s t r u c t i o n,D o n g y a n g,Z h e j i a n g322100,C h i n a)A b s t r a c t:L a n g u a g eL e a r n i n g P o t e n t i a l T e s t C o n s t r u c t(h e r e i n a f t e r r e f e r r e d t o a sL L P T C)i s t h e b a s i s o f l i n g u i s t i c s a n d c o g n i t i v e s c i e n c e o f t h e c o m p i l a t i o no f l a n g u a g e l e a r n i n gp o t e n t i a l t e s t p a p e r.T h i s p a p e r d e f i n e s t h e c o n c e p t o fL L P T C,e s t a b l i s h e s t h e f r a m e w o r kf o r t h ec l a s s i f i c a t i o no fL L P T C,d i s c u s s e s t h e r e p r e s e n t a t i o no fL L P T Cf a c t o r s a n d p e r f o r m s t h e v e r i f i c a t i o no f t h e s t r u c t u r ev a l i d i t y o fL L P T Cf a c t o r s. T h i s p a p e r i s a t h e o r e t i c a l e x p l o r a t i o n o f L L P T C,a n d p r o v i d e s a t h e o r e t i c a l f r a m e w o r k f o r t h e c o m p i l a t i o n o f l a n g u a g e l e a r n i n gp o t e n t i a l t e s t p a p e r.K e y w o r d s:l a n g u a g e l e a r n i n g p o t e n t i a l;l a n g u a g e a p t i t u d e;l e a r n i n g a p t i t u d e;t e s t c o n s t r u c t;v e r i f i c a-t i o no f s t r u c t u r e v a l i d i t y(责任编辑:赵华责任校对:罗布) 08。
语言测试中的效度与信度

- 200-校园英语 /语言测试中的效度与信度西南科技大学/邹微 杨纾凡【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。
本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。
【关键词】语言测试 语言教学 信度 效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。
Bachman 曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。
”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。
同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。
评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。
”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。
它是测试最基本的出发点。
“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。
”1.内容效度。
内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。
如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。
内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。
2.标准相关效度。
标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。
语言测试之效度理论发展五十年

研究如何平衡考试内容与构念效度的关系,以实现两者的最佳结合。此外, 也可以将研究范围扩展到不同类型、不同层次的语言测试中,以丰富和完善相关 理论体系和实践应用。
感谢观看
通过分析该测试的效度,发现其具有以下优点: 1、测试内容全面,涵盖多个领域,能够准确反映学生的综合英语能力;
2、采用交际性能力测试方法,贴近实际语言使用情况,能够评估学生在真 实语境中运用英语的能力;
3、通过智能化评分技术,确保评分的客观性和准确性,有效避免了人为因 素对评分的影响;
4、通过数据分析,能够对测试的效度进行深入研究和改进,进一步提升测 试的有效性和可靠性。
总的来说,结构效度是评估语言测试有效性的重要指标。提高语言测试的结 构效度需要从多个方面进行考虑和设计,包括明确测试目的、合理规划测试内容、 选择适当的测试方法和制定合理的评分标准等。只有这样,我们才能确保语言测 试的结果能够准确反映学生的实际语言知识和技能水平,从而为语言教育提供更 有价值的参考依据。
研究结果
通过文献综述,我们发现语言测试构念效度的研究已经取得了丰富的成果, 但同时也存在一些问题和挑战。例如,对于语言能力的定义和构成要素仍存在争 议;构念效度的评估标准也不够明确;以及如何平衡考试内容与构念效度的关系 等问题。案例分析则显示,一些语言测试在构念效度方面表现出较好的一致性和 可靠性,但也有一些测试存在较大的偏差和不一致。
关键词
语言测试效度理论、新发展、语 言能力、评估、应用
理论发展
语言测试效度理论的新发展主要包括以下几个方面:
1、综合效度框架:综合效度框架强调语言测试的整体性和综合性,测试内 容、测试方式和测试结果三个方面的效度。这一框架下的效度评估更加全面,有 助于提高测试的可靠性和有效性。
英语口语测试的信度和效度研究

键 , 指我们 把一 项 测试 成 绩 作 为要 测 试 的能力 是
或结 构 的指示 物对 它所 能进行 解释 的程 度 。结 构
表性 ; 比如 , 再 尽量 使试 卷 的评 分客 观一些 。评分
效度 是一个 动态 的过程 , 根据 测 试 成 绩所 作 的解 释永 远不 能说是 绝 对 有效 的 , 只 是 一个 相 对 的 它 概念 。讨论 测试 效度必 须 与具体 的测试 目的相结 合, 否则是 没有 意义 的 。对 于某些 测试 理论家 , 结 构效 度是 测试 效度 的一 种形 式 , 实 质 上是 评 定 它 测试 在 多大程 度上有 效地 基于其 基础理 论 , , 即 测
这种困境, 于测试有效性是相对而非绝对的。 在
不一 致性 的不 利 因素 控 制 在最 低 程 度 , 以便 于提 高测 试 信 度 。信 度 主 要 是 看 学 生 的分 数 是 否 稳
定, 如果 分数 忽高忽 低 , 就说 明信度不 高 。信度是
受许 多 因素影 响 的 , 比如测 试 的时 间 、 境 、 生 环 学 的健康 状况 、 题 目的理 解 等 等 。例 如不 同 的环 对 境 对 听力测试 的影 响是 很 大 的 , 些 靠 近喧 闹街 那 道教 室里 的学生 是很难 将注 意力 放在 听力材料 上
可靠则 要看 评分 标准 是否 客观 、 准确 , 评分 过程是
否一 致 。测试 效度 可通过 对学 生进行 访谈 或 问卷 调查 的方 式 , 了解 他 们 对 测 试 的态 度 、 映 和感 反
条件 : 度 与 效 度 。B c ma [ ( 9 6 把 信 度 定 信 a h n3 1 9 )
手 段 。而 口语 测试 的信 度与 效度 的把握 则是 测试
构念效度

总结:
• 近三年的高考英语听力全国卷基本考查了理解主旨和要 义 ,获取具体的、事实性信息 ,对所听内容作出推断 , 理解说话者的意图、观点和态度等能力,能力构念划分 十分明确,而且符合考试大纲要求,因此构念效度都比 较高。
2.选项设计干扰性强。要求学生在听取录音时,不仅需要有速记相关信息点能力,同
时也还需要具有理解原文,辨别信息的能力,均符合考纲要求。
[以12题为例]
C. In Avon.
12. Where is the woman now? A. In Baltimore. B. In New York.
该题三个选项的地名对话中都出现过。因此需要学生进行排除。
2014年高考英语听力全国卷的构念效度分析:
• 从整体上看,2014年高考英语听力全国卷的 20 个小题中,理解主 旨与要义有 1 个题,获取事 实性的具体信息有 9 个题,对所听内 容作出推断有 7个题,理解说话者的意图、观点和态度有3个,与
13年大体上相同。较好地体现了考试大纲对考生的能力要求பைடு நூலகம்也
2013,2014,2015年高考英语听力全国卷考 试大纲
• 听力 : 要求考生能听懂所熟悉话题的简短独白和对话。 考生应能: • (1) 理解主旨和要义 • (2) 获取具体的、事实性信息 • (3) 对所听内容作出推断 • (4) 理解说话者的意图、观点和态度
2013年高考英语听力全国卷的构念效度分析:
• 整体上来看,本套试题对能力考察点的分布还是比较正常的,以 考查事实细节为主,有12道题左右,目的是检测学生听取和捕抓 具体的,事实性信息等的能力。其余的理解,推断,总结题约为8
个,主要考查的是从已知信息中作推断,理解说话者意图并且进
浅谈语言测试中的效度问题

英 语 教学 大 纲 》 规定 的 教 学 目标 考 核 修完 大 学 英 语
。
以
。
大 学 英语 课 程 的 教
,
经 验 效 度 是指 语 言测 试 的 结 果 与对 应 试者 语 言 能 力 的 评估 在 多 大程 度 上相 一 致 为两 种 一 种 是共 时效 度
种 是 预 示 效度
,
学 目的 是 培 养 学 生 具 有 较 强 的 阅 读 能 力 和 一 定 的 听 说 写 译能 力 使学 生 能 以 英语 为 工 具 获 取 专 业 所 需 信 息 并 为 进一 步 提 高英 语水 平 打 下 较好 的
。
信度 但这 只 是 个 理想 化 的 目 标 因 为做 到这 一 点
往往 是不 可 能 的
。
在 编制试 题时 既 不 能为 了追 求
,
水平 测 试用来 衡量 学生 的 语 言 能 力 即 看学 生
是 否 达 到 某 一 水 平 从 而 决定其 是 否 能胜 任 某 一 任
,
,
信度 而忽 视 效 度 也 不 能 为 了 追 求 效 度 而 放 弃 信
学 习 语 言的 潜 力
度
。 。
高 的 信度 但 它却 能够考 查学生 实际 应 用 语 言的 能
力 具 有 较高 的 效 度
, 。
语 言潜 能 测 试 以 某种 语 言 行 为
,
因 此 一 套好 的 试题 应 包 括
, 。
,
理 论和 学 习 理 论 为 依 据 因 此 首 先 要 考 虑 编 制 效
,
标准
容
。
。
效 度 指测 试 是否 考查 了设 计 者想 要 考查 的
,
浅论语言测试的效度

浅论语言测试的效度[摘要] 信度与效度是语言测试两大基本要求,信度与效度的关系问题是语言测试的根本问题。
考试的效度指的是考试在多大程度上测出预期要测量的东西,信度指的是考试结果的可靠性。
本文重点介绍了效度的含义,对效度的测量方法以及效度与信度的关系等问题做了详细的阐述。
[关键词] 语言测试效度信度[Abstract] As a branch of applied linguistics, language testing has developed into a relative independent subject. Validity and reliability is the most important two criteria of language testing and the relationship of both is the ultimate issue. This article makes comments on the two criteria in detail. Validity is concerned with if a test measures accurately what it is intended to measure. Reliability means the quality of being reliable on consistency. This article puts emhasis on validity and also explains the testing methods of validity as well as the relation between validity and reliability.[Key words] Language testing validity reliability一、引言语言测试学作为应用语言学的一个分支,现已发展成一个相对独立的学科。
从“命题说话”探讨普通话水平测试的效度

从“命题说话”探讨普通话水平测试的效度【摘要】普通话水平测试采用计算机辅助测试的方式,信度固然有所提升,但效度有所下降。
本文以测试的第四项“命题说话”为例,从表面效度、内容效度、结构效度、反拨作用等方面,探讨普通话水平测试的效度。
【关键词】普通话水平测试;命题说话;效度;反拨作用普通话水平测试作为国家实施的汉语语言能力测试的载体,合理而准确的考试内容设计、精确严密的量化计分是完全必要的,也是不可缺少的。
如何让这种代表着普通话测试发展方向的测试方式能够更好地生存、发展,得到更多的认可和参与度,这里就不得不提到测试的效度。
普通话水平测试的效度是指测试是否考了它所要考的,是测试最重要的属性。
也就是说测试的形式和内容要有代表性,要能够准确、全面、充分地体现要测试所要达到的目的。
本文以普通话水平测试中第四项“命题说话”(以下简称“说话题”)为对象,对普通话水平测试的效度进行分析。
1 说话题的表面效度表面效度是指普通话测试从表面看上去是否有效以及被人接受的程度,表面效度高的测试容易引起应试者的兴趣,吸引他们参加测试。
“说话题”是普通话测试中唯一没有文字依据的一项,目的是测查应试人在脱离文字凭借的情况下说普通话所能达到的规范程度。
说话题的分值为40分,占普通话水平测试总分的40%,占重要地位,换句话说,普通话水平测试是否能够达到一定的水平,关键就看这一题。
测试的表面效度较高。
测试评分采用由测试中心将应试人说话题的考试电脑录音通过打分平台随机发给2-3位测试员,这几位测试员采用上网、背靠背打分的方式,在测试评分差别不大的情况下取其平均分作为应试人最后的得分。
一旦几位测试员的评分差别较大,超出了允许值,则请另外几位测试员再次打分,最大程度避免测试员主观因素对评分的影响,保证了说话题最后得分的公平公正,同时也保证了测试的有效性。
2 说话题的内容效度内容效度是指普通话水平测试的内容是否具有代表性,是否能够准确、全面而充分的展示要测试的内容,从而达到测试目的。
语言测试的信度和效度及其关系

科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。
其中, 以信度和效度最为重要。
一、语言测试的信度语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。
即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。
信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。
同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。
影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。
试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。
与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。
2. 考试条件不一样。
同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。
3. 监考施策。
不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。
4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。
5. 保密工作做的不好, 泄题事件发生。
6. 评分。
主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。
7. 样品数量太小, 样本不足。
8. 身体及心理状态不好等等, 这些因素都会影响到信度。
因此, 为了提高信度, 我们必须对症下药, 采取各种措施。
听力理解测试的构念效度及实现方法

听力理解测试的构念效度及实现方法[摘要]听力理解测试是语言测试的一部分,是通过测试来检验学习者的听力能力。
只有具有较高程度构念效度的听力测试试卷,才能更加真实的反应出受测试者的语言能力。
本文基于听力构念理论,探讨实现听力理解测试的构念效度的方法[关键词]听力测试听力理解构念效度一、引言效度(validity)研究在一直在语言测试研究领域具有非常重要的地位,杨惠中认为语言测试的基本出发点就是效度(杨惠中,1998:55),测试的效度也是bachman提出的语言测试的六大要素之一。
效度就是考试的有效性,在于“所考的是否是设计人想要考的内容,或者说,在多大程度上考了想要考的”(刘润清,韩宝成,2000:206),如果某一听力考试缺乏构念效度,那么考试分数就无法对考生听力能力的好与坏做出解释,分数随之就失去了意义。
国内外的语言测试界对效度进行了诸多研究,而国内的研究目前尚不完善。
本文试图通过最大限度保证听力材料的真实性,听力题型多样性和提高与标准关联证据之间的相关性三个方面探讨构念效度实现的方法。
二、“构念”与构念效度构念(construct),它在测量学中指所要测量的属性或事物。
检验或者评估有关测量的工具是否能有效的来度量某个属性即是“构念”,就是建立该工具的构念效度。
构念效度(construct validity)“测试中的表现与我们根据能力或构想理论所做出的预测在多大程度上相一致”(bachman,1990:255)。
整体效度理论认为,构念效度是效度的最根本的方面,也是效度理论的核心,是决定测试分数解释和结果使用有效性的基础。
构念效度要收集各类证据以论证测试分数和构念之间的关系是否符合理论假设(bachman, 1990;chapelle,1998)。
要保证测试的构念效度,测试设计者就需要按照相关的理论设计合适的测试任务,以到达测试的目的。
听力理解能力作为语言能力的一部分,一般只能通过观察事实或者是行为来进行推断。
浅析《人文英语3》的语言测试与评估

浅析《人文英语3》的语言测试与评估王宇本文是以国家开放大学(以下简称“国开”)为非英语专业开设的公共英语课程《人文英语3》(以下简称《人3》的期末考核为基础, 试从“构念”、“任务特征”和“效度研究”三个维度对其进行结构分析与评价,论述了语言评估与测试在非英语专业英语教学中的重要作用,并探讨合理设置《人3》科目测试目标和内容的基本思路。
引言近年来,在外语教学领域的专家与学者们越来越关注语言评估与测试的研究。
其中,英语语言测试是对英语语言教学效果、英语学习者英语各方面能力的测量和评估,是英语教学中一个不可分割的环节。
广大英语教师已经意识到语言测试与评估是英语专业教学和非英语专业教学的重要组成部分。
它不仅是衡量外语教学成效和提高教学质量的重要手段,而且是为教学服务的。
因此为了更好地服务于成人学生群体,国家开放大学(以下简称国开)针对他们学习的实际需求,在公共英语课程的语言评估测试中,进行了改革与创新,推出《人文英语》等系列课程。
其中《人3》是为人文类非英语专业(专升本)第一学期开设的全新公共英语课程。
通过学习本课程,学生应能熟练使用其中的2000个左右词汇,包括在职场中常用的词汇和短语,以及在相关职业活动中最基本的英语词语及表达方式,能在涉及法学、社会工作、汉语言、教育等相关专业的商务环境中进行基本交流;使他们提升在人文情境中使用英语进行交际的实际能力。
1 语言测试与评估的理论语言测试(主要指外语测试)是多种学科的结合体,是一门成熟的跨学科的综合性学科。
(李华田,补爱华:2003)众所周知,教学成评估相辅相成。
韩宝成教授认为对基于任务的教学进行评估既应包括形成性的,又要包括终结性的:既有过程评估,又有结果评估,但核心是对学生的学习成绩做出评价,由此便产生了基于任务的语言测试。
时至今日,由Bachman教授所提出的交际语言模式已经对语言测试的发展产生了深远的影响。
也就是说,大量的语言测试与评估的研究不断地证明,语言测试的设置更加需要全面的考虑。
论语言测试的信度和效度

一、 信度 2 3*’,&+,’,.4 5
信度指测试结果的稳定性 5 67389&97: ; 或一致性 5 <%=6967-=<: ; 。 语言测试信度的高低主要说明的是 测试结果在多大程度上反映了受试者真实的语言 水平。 也就是说, 只要被测量的对象本身没有变化, 用同样的 “ 尺子 ” 去测量, 总会得到同样的结果。 但 语言测试的对象是人, 人的因素是不稳定的, 所以 测试的目的是要衡量其中相对稳定的东西。
三、 信度和效度的关系
信度和效度是语言测试中两个重要的标准。 两者之间存在着密切的关系: 既相互依存, 又相互 排斥。 语言测试以语言能力为测量目标, 而语言能 力是抽象的, 是通过具体的语言行为体现出来的, 难以直接测量。 另外, 任何测试都不必要更不可能 测量所有的语言行为, 因此语言测试的目的是通
!" #$% &%’()*(’(#+ )", -)’(,(#+ ./ 0)"12)1% 3%4#("1
!"# $%&’, ()#* +,& - +./.% 0’%1.23%456 7&89%’: ;<=;;;6 >?%’& @ 5*4#6)7#8 !"#$%"$& ’&(’)#$ )( " *+"#,- ./ "001)&2 1)#$%)(3 ’),(4 5-)( "+’),1& 6"7&( ,.66&#’ .# ’-& ’8. )60.+’"#’ ,+)’&3 +)" )# $+&"’ 2&’")19 +&1)"*)1)’: "#2 ;"1)2)’:4 <&1)"*)1)’: 6&"#( ’-& =%"1)’: ./ *&)#$ +&1)"*1& .# ,.#()(’&#,:4 >"1)2)’: 6&"#( ’-& =%"1)’: ./ *&)#$ ;"1)2 .+ +&"1)?"’).# ./ ’-& 0%+0.(&(4 5-& "+’),1& "1(. &@01")#( ’-& ,1"(()/),"’).#(A ,"1,%1"’)#$ 6&’-.2( "( 8&11 "( ’-& +&1"’).# *&’8&&# ’-& ’8. ,+)’&+)"4 B’ ,"# *& ,.#(’+%,’);& /.+ ’-& &;"1%"’).# ./ 1"#$%"$& ’&(’)#$4 9%+ :.6,48 A&’:,&:. 4.34%’:B 2.A%&/%A%45B 1&A%9%45
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语言测试构念效度研究
2005年的英语专业八级考试是根据2004年新的八级考试大纲设计和施测的第一次考试,考试的性质、构念领域、任务要求、分数权重等都发生了较大变化。
作为全国唯一的测量英语专业学生高年级英语水平的大规模考试,这些变化对个人、团体和社会将产生重大影响。
测试界认为,越是高风险考试,越要对考试的技术和应用方面进行评价,对考试的效度验证要求越高。
因此,运用先进的效度理念、分析技术和行业规范对我国的八级考试进行研究,不仅有理论价值,也具有现实意义。
在对测验的评价中,效度是最重要的考虑因素。
然而,在过去近一个世纪以来,效度的概念从多类效度发展到统一构念效度。
与效度概念发展相联系,效度验证的范式和方法也产生了变化。
因此,全面和准确地理解效度,具有十分重要具有理论意义。
而掌握效度验证的科学方法具有运用价值。
本研究的目的有二:一是对统一效度概念从本体论、认识论、方法论视角进行较全面的评述,旨在为八级考试效度验证提供一个理论和方法框架;二是在统一效度概念下,对八级考试的客观试题从实证的角度进行效度验证。
验证的问题包括四个:八级考试客观试题的测量学属性如何?客观题目实际测量的维度与考试设计的理念是否一致?客观试题分数的意义在不同的群体中是否具有类似的解释?新增加的人文知识分测验在是否存在考试偏差? 针对两个目的,采用两种研究方法。
对构念效度的理论和方法讨论采用文献综述方式;针对八级考试客观题目的效度验证是用定量的方式提供解释依据。
构念一致性问题是本研究中关于分数解释的切入点,解决的是测验所测
量的构念在不同背景的考生的意义是否具有可比性问题。
当一个测验在一个组别(群体)中所测量的假设特质(或者心理构念)与另一组别相同,或者当一个测验在测量相同的特质而测量的准确程度相似时,构念具有可比性。
构念一致属于分数结构和效度概化问题。
它与考试偏差分析一起,为分数的可解释性和考试公正提供依据。
本研究的对象是446所大学参加2005年TEM 8考试的96696名考生。
分析的数据是由上海外国语大学四、八级考试中心提供的全体考生在客观题目上的原始反应数据以及已经对反应进行判断过的数据。
针对不同的研究问题,使用了不同的统计分析手段:描述统计用于基本数据探索;相关方法分析题目同质性、题目区分度、聚合和区别效度、构念一致性检验;因子和谐系数用于检验不同群体因子负荷之间的相似程度;单因素方差分析进行跨群体均值比较;因子分析用于因子维度探索和验证;标准。