浅谈语言测试的信度与效度
谈语言测试的信度与效度
2000年3月第8卷 第1期 西安外国语学院学报Journal of Xi an F oreign Languages U niversityM ar.2000Vol.8N o.1谈语言测试的信度与效度赵成发(复旦大学大学英语教学部上海200433)中图分类号:H0 文献标识码:A 文章编号:1008-4703(2000)01-0011-05信度与效度原是计量学中的两个重要概念,20世纪30年代被引入语言测试领域。
60年代,以L a-do等为代表的结构主义测试学家对这两个概念进行了系统的阐述和论证,标志着语言测试已形成科学的体系,成为一门独立的学科。
可以说,语言测试理论及实践上的发展和纷争都是以信度与效度为主线进行的,信度与效度是语言测试永恒的主题。
一、信度与效度的概念语言测试的信度是指测试结果的可靠程度。
语言测试信度的高低主要说明的是测试结果在多大程度上反映了受试者真实的语言行为。
影响信度的因素很多,它们存在于语言测试的每个环节中。
对试卷本身来说主要是样本的大小(size of sample)和区及各种组织之间的横向协作与联合。
这样一来,新亚欧大陆桥就不仅成为一条国际性贸易大通道,而且会成为一条经济、科技等多种领域使用和东西方文化交流的桥梁。
第二,充分发挥连云港市的桥头堡作用。
我国长江三角洲经济区的形成和迅速发展,有两个至关重要的因素,一是有黄金水道之称的长江,一是有中心城市上海的辐射作用。
上海凭着沿江与沿海交汇点独特的地理优势,率先发展起来,从而带动长江三角洲区域经济的发展。
陇兰经济带有一个协作与联合的纽带新亚欧大陆桥还不够,还必须有一个能像上海一样发挥作用的中心城市。
连云港作为沿线与沿海的交汇点,其地理位置的优势不亚于上海,完全可以把连云港市建设成为新亚欧大陆桥沿线省区共有的出口产品加工区,外贸基地和窗口。
连云港市也将对大陆桥沿线省区产生新的、更大的渗透力。
进一步增强新亚欧大陆桥东桥头堡和陇兰经济带的龙头地位。
浅析语言测试中信度与效度两者之间的关系
浅析语言测试中信度与效度两者之间的关系语言测试在语言教学中处于中心地位,是从属于应用语言学这一学科的。
在过去语言测试在应用语言学中处于边缘地位,而在长达三十多年的发展中,语言测试现已发展成为一个相对独立的学科,已经在学术上占有了一席之地。
通过语言测试教育者可以及时发现学习者学习上存在的不足之处并在日后的教学过程中加以正确引导,也可以衡量教学任务和教学大纲的执行情况,但是这些都是基于科学的语言测试能够得到良好的反馈情况,反之,如果是一套不科学的语言测试就很可能对学习者做出错误的判断从而影响学习效率,所以科学的语言测试无论是对受教育者还是对教育者来说都是非常重要的。
一套设计比较科学的测试应该是具有信度,效度,难度和区分度四点特征,信度与效度是难度和区分度的基础,同时也是语言测试的两大根本要求,只有正确认识了信度与效度两者之间的关系才能寻找出一个科学的方法使得语言测试更加科学准确。
信度指的是测量的一致性,一个实验或测试的信度指它在重复测量时产生同样结果的程度,也就是说测量的稳定性是否一致。
影响信度的因素很多,其不仅存在于考试过程中的各个环节,也存在于阅卷的过程中,如试卷中的试题长度偏长,项目种类多,那么测试的信度就会提高,反之则会降低,考试分数集中于某一点或某一个区域时信度也会有所降低;考试期间考生时间充裕那么估算能力考试的信度也相对较高等等,这些都是存在于考试过程中各个环节的部分举例,在阅卷过程中阅卷者自身的信度和阅卷者之间的信度等问题也是影响信度的因素之一,如在评阅主观性的题目时(作文,口语等),阅卷者在评分时就具有很大的主观色彩,而不同的阅卷者掌握的主观的评分标准在评阅主观性试题时,不容易取得一致,也会使得测试的信度不稳定。
效度指的是我们所获的证据在多大程度上支持我们根据分数所做出的推断,也就是考试是否检测到了它所要检测的东西,是否达到了它的预定目标。
效度共分为三种不同的类型,其不同类型的效度测试有各自不同的测试着重面,内容效度测试的目的是为了了解测试者在一些实际环境中是如何运作的,如果测试的样本能够充分代表总体,那么测试在内容上就是有效的,反之效度则不高;预测效度和共时效度都是属于与标准有关的效度,预测效度是标志测试者将来能力的标准,如通过摸底考试分班,共时效度是指一个测试结果与另一个同时使用的标准的结果的关系;构想效度是指要考察一个测试者在多大程度上和我们根据某一理论所作出的预测是否一致,也就是说验证的是我们所做的假设是否有效。
现代语言测试的信度和效度的分析
( 江 阴职业技 术学 院 外 语 系 , 江苏 江 阴 2 1 4 4 0 5 )
摘 要: 信度和效度是语言测试的两个极其重要的评价标准。信度指的是考试结果的可靠性 , 效度 是 指考试 达 到预 定 目的的程度 。从 宏观 角度进 行分 析 , 并对 现代 语 言 测试 中效度 和 信度 的取 向进
Ab s t r a c t : Re l i a b i l i t y a n d v a l i d i t y a r e t wo i mp o r t a n t c it r e r i a f o r e v a l u a t i o n i n l a n g u a g e t e s t i n g . Re l i a b i l i t y me a n s t h e q u a l i t y
此, 近些 年来 , 语 言测试 的信 度与效 度受 到 了广 大 国
内外语言学者 的关注。作为外语教学工作者 , 要想
了解学 生对所 学 知识 的掌 握 程度 , 主要 通 过 定期 的 测 试 的方式来 进行 。而有效 的测试 对教 师才有 真正 的指导 作用 。如何 验 证 是 否 是 有 用 而 有效 的测 试 , 那 就需 要综合 考查 它 的效度 , 信度 , 真实性 , 互 动性 , 考 试 的冲击 力和 可行性 。而语 言测 试 的标 准其 中最 重 要 的是考虑 测试 的信 度和效 度 。
一
、
语 言测试 效度 和信度 的概 念及 分类
测 试效度 是指 测试 是否考 查 了原定需 要考 查 的
度上与一些外在标 准相关 , 故又称标准参照效度 。 简 单地说 就是 考试结 果能 够在某 种程 度上 预测学 生
语言测试中的效度与信度
- 200-校园英语 /语言测试中的效度与信度西南科技大学/邹微 杨纾凡【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。
本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。
【关键词】语言测试 语言教学 信度 效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。
Bachman 曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。
”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。
同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。
评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。
”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。
它是测试最基本的出发点。
“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。
”1.内容效度。
内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。
如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。
内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。
2.标准相关效度。
标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。
语言测试的信度和效度
有 变 化 . 管 施 考 多 少 次 . L , 各 次 的测 试 成 绩 不  ̄J<X 象 - . t
应 该 一 致 。 之 . 果 测 试 成 绩 忽 高 忽 低 就 说 明 该 测 反 如 试 的 信 度 不 高 。 此 可 见 。 试 要 成 为 有 效 的 测 量 手 由 测 段 . 度 是其 关键 因素 之一 。 信
教 学 中发挥 积极 的反 拨作 用 , 测 试 能否是 客 观 的 、 而 公 正 的 、甚 至 是 权 威 的 评 估 ,也 都 取 决 于 测 试 的 质
果 间 隔 时 间 太 长 .受 试 者 可 能 由于 学 习 导 致 语 言 水
平 变 化 . 而 造 成 两 次 测 试 成 绩 的 不 一 致 . 果 相 关 从 结
个 测 试 具 有 较 高 的 信 度 . 只 要 被 测 量 的 对 象 本 身 没
两 个 相 互 独 立 的 并 行 子 试 卷 .然 后 对 两 个 部 分 分 数 的 比 较 以 获 得 整 份 试 卷 的 信 度 . 通 过 这 种 方 法 得 到 的 相 关 系 数 就 叫 分 半 信 度 。 两 个 部 分 的 分 数 一 致 性 越 高 . 卷 的 信 度 也 就 越 高 。 种 方 法 避 免 了重 复 测 试 这
上 反 映 了 受 试 者 的 真 实 语 言 水 平 【。 言 之 . 果 一 ”换 如
问 题 .在 设 计 试 卷 时 我 们 无 法 确 信 两 套 试 卷 在 难 度 及 内 容 上 是 否 完 全 相 同 . 此 操 作 起 来 很 困 难 。 就 因 也
论语言测试中的信度与效度
出 了以下几 点要 求 , 即在 设 计 测试 内容 时要 充 分 考 虑 题 目是 否适合 每 一 位 受试 者 的经 验 或 水 平 ; 就 测 试 内容本 身来 说 , 是 否存 在选 择项 表述模 糊 、 过难 或 偏 易 的 问题 等 。诸 如此类 客 观存 在 的人 为 因素都 会 影 响 考试 效度 本身 的有 效性 _ 6 J 。
二、 信 度
( 一) 概 念及 测量 方法
一
致化 , 使 之更 容 易让 受 试 者接 受 并 真 正 理 解题 目的 要求 ; 对 于 那 些 模 棱 两 可 的 选 项 也 要 尽 量 避 免 出 现 J 。此外 , 考生 在考 试 前 应充 分 熟 悉 考 试题 型并 训 练相 应应 对技 巧 , 使 之 表 现 能 达 到 预期 效 果 。 更
一
效度 。表面效度 , 就是指测试表面上 的可信程度 , 特 点是 会对 受试 者 的 回应有 一定 的影 响作 用 。如果 一 项测试表面上不可信 , 就很难吸引受试者 的注意力 ,
更 不 用说 用积 极 的心 态 应 试 , 这 样 得 到 的测 试 效 度
必 将 大打 折扣 。内容 效 度 , 通 常评 估 的是 与 所 测 试 项 目相关 的领 域 , 包 括 测试 的 内容 、 主题 以及评 分 标 准等 。一项 测 试 的 内容 效 度 越 高 , 结 果 就 越会 接 近 最 初 的测试 目标 。结构 效度 中的结构 指 的是语 言 能 力 理论 中假 设 的 基 础 能 力 或 特 征 J 。如 果 一 种 考 试 表 明能够 测 试某 个 能 力 结 构 , 比如 阅读 能力 或 写 作 能力 , 它 就具 有 结 构 效 度 J 。尺 度 关 联 效 度 主要
浅谈语言测试中的效度问题
英 语 教学 大 纲 》 规定 的 教 学 目标 考 核 修完 大 学 英 语
。
以
。
大 学 英语 课 程 的 教
,
经 验 效 度 是指 语 言测 试 的 结 果 与对 应 试者 语 言 能 力 的 评估 在 多 大程 度 上相 一 致 为两 种 一 种 是共 时效 度
种 是 预 示 效度
,
学 目的 是 培 养 学 生 具 有 较 强 的 阅 读 能 力 和 一 定 的 听 说 写 译能 力 使学 生 能 以 英语 为 工 具 获 取 专 业 所 需 信 息 并 为 进一 步 提 高英 语水 平 打 下 较好 的
。
信度 但这 只 是 个 理想 化 的 目 标 因 为做 到这 一 点
往往 是不 可 能 的
。
在 编制试 题时 既 不 能为 了追 求
,
水平 测 试用来 衡量 学生 的 语 言 能 力 即 看学 生
是 否 达 到 某 一 水 平 从 而 决定其 是 否 能胜 任 某 一 任
,
,
信度 而忽 视 效 度 也 不 能 为 了 追 求 效 度 而 放 弃 信
学 习 语 言的 潜 力
度
。 。
高 的 信度 但 它却 能够考 查学生 实际 应 用 语 言的 能
力 具 有 较高 的 效 度
, 。
语 言潜 能 测 试 以 某种 语 言 行 为
,
因 此 一 套好 的 试题 应 包 括
, 。
,
理 论和 学 习 理 论 为 依 据 因 此 首 先 要 考 虑 编 制 效
,
标准
容
。
。
效 度 指测 试 是否 考查 了设 计 者想 要 考查 的
,
浅论语言测试的效度
浅论语言测试的效度[摘要] 信度与效度是语言测试两大基本要求,信度与效度的关系问题是语言测试的根本问题。
考试的效度指的是考试在多大程度上测出预期要测量的东西,信度指的是考试结果的可靠性。
本文重点介绍了效度的含义,对效度的测量方法以及效度与信度的关系等问题做了详细的阐述。
[关键词] 语言测试效度信度[Abstract] As a branch of applied linguistics, language testing has developed into a relative independent subject. Validity and reliability is the most important two criteria of language testing and the relationship of both is the ultimate issue. This article makes comments on the two criteria in detail. Validity is concerned with if a test measures accurately what it is intended to measure. Reliability means the quality of being reliable on consistency. This article puts emhasis on validity and also explains the testing methods of validity as well as the relation between validity and reliability.[Key words] Language testing validity reliability一、引言语言测试学作为应用语言学的一个分支,现已发展成一个相对独立的学科。
什么是测试的信度和效度,如何保证测试的信度和效度
什么是测试的信度和效度,如何保证测试的信度和效度什么是测试的信度和效度,如何保证测试的信度和效度。
并编写小学六年级第一学期期末读写测试题,并在试题前附上该试题内容与目标的双向细目表。
测试信度也叫测试的可靠性,指的是测试结果是否稳定可靠。
也就是说,测试的成绩是不是反映了受试者的实际语言水平。
例如,如果同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。
测试的信度与测试的效度有着密切的关系。
一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。
测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。
试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。
1.所谓测验的信度,即可靠性,它是测量反映被测特征的真实程度的指标,有人称之为测验的准确性,也有人把信度作为测验结果的稳定性和一致性指标。
2.测验的效度是指心理测验的有效性,即测验得到的是不是所要测定的心理行为与行为特征,也就是测验结果是否体现测验所预期效果的程度。
上学期六年级期末英语检测题一(选词填空:sky, twin,fun,take,tourists,well,use,happy,meets,same 1(The traffic lights are the in every country.2. the No.12 bus.3.I think it’s to walk on the moon.4.I’m to have a new pen pal.5.He helps the bank use their money .6.I’m going to the .7.He many other little water drops.8.She often helps find their way.9.My sister Ann likes drawing pictures.10.Are you going to any books?二,组合句子:1.put,into,I,a,some,pot,seeds.2.motor,she,work,goes,by,cycle,to3.about,something,me,tell,you4.my,with,I’m,supermarket,mom,going,the,to5.for,mminutes,walk,three,east三,选择;( )1.First,put the in the soil.A.sproutB.seedsC.plant( )2.Her mother is .A.a cleanerB.a teacher.C.an actress( )3.My pen pal likes .A.drawing picturesB.riding a bikeC.collecting stamps( )4.I want to buy .A.a lookB.a pair of shoesC.some apples( )5.The park is the cinema.A.in front ofB.next toC.near( )6.I usually go to school .A.on footB.by busC.by bike 四,把下列单词按要求进行变化:1,come (现在分词)2.do(第三人称单数)3.policeman(复数)4.dive(现在分词)5.family(复数)6.teach(第三人称单数)7.sing (名词 )8.write (名词)9.teach (名词)10.watch (第三人称单数)11.go (第三人称单数)12.live(第三人称单数)13.ride(ing 形式 )14.dive(ing形式)15.play(ing形式)16.make (ing形式)五,按要求变化下列句型:1.The cloud comes from the vapour(对画线部分提问)the cloud come from? 2.She is my aunt. (对画线部分提问)she?3.He can go with us.(变为一般疑问句)go with us?4.I’m going to buy an English book tomorrow. (对画线部分提问) are you going to ?5.It is far from our school.(变为否定句) It far from our school. 六,选词填空:a,an,do,does,teach,by,to,riding,be,read 1.Her mother is ateacher.She math. 2.I’m going to a doctor. 3.Is your auntaccountant?Yes,she is. 4.Does Amy go to school bike?Yes,she does. 5.My brother likes a bike.6.Is he policeman?No,he isn’t.7. he like collecting stamp?Yes,he does.8.My father usually newspaper after lunch.9.They are going to their homework this afternoon.10.Sarah’s mother goes work by bus. 七.找朋友:( )1.How can I get to the zoo? ( )2.What do you do?( )3.Is she an artist/( )4.What are you going to do this afternoon?( )5.What does she do?( )6.Does he like diving?( )7.What’s your hobby?( )8.Where does your mother work?( )9.Where does the cloud come from?( )10Are they going to play chess next Sunday?A.It comes fro m the vapour.B.I’m a teacher.C.I’m going to buy an English book.D.I like collecting stamps.E.No,she isn’t.She’s a TV reporter.F.Yes,they are.G.Yes,hedoes. H.You can ride a bike there. I.My mother works in a factory. J.He is a driver. 八,改错:1.How can he water become vapour?2,What does she likes do?3,he goes to Canada by plane.4,I’m go to the cinema tomorrow.5,She likes watches TV.九.连词成句:1.rain,does,come,where,from,the,2.brother,bed,goes,10:00,to,at,my3.to,does,go,your,mother,how,work4.he,violin,the,like,playing5.we,do,should,then,what?十.填空:1.Mr White usually (go)to work by car.2.I (visit)my frandpa next week.3.The children like (swim)4. you (do)your homework now?5.What Mike’s father (do)? ________________ 5. Was Mike at homelast night ,_________________________________________________________________ 三、用括号内所给的单词(名词、代词、形容词或动词)的适当形式填空(在每条横线上不一定只写一个单词):(10分)1. Look at those __________ (child). They _________ ( swim) in the swimming pool.2. What language __________________yoursister____________ (learn) next year? 3. Foshan __________(have) a___________(long) history(历史) than Zhongshan. 4. They_______________(not play) badminton last Saturday morning They just__________(stay)at home.5. Can I _________(take) a message for ___________ (he)?四、选择正确的答案,把正确答案的字母编号写在括号内:(15分) 1. )1.This _______ Mrs. White speaking.A. amB. areC. isD. be( ) 2.Class begins at 8.00. It’s 8.15 now. You are________.A. busyB. differentC. lateD. fine( ) 3.I think Hangzhou is _____________ city in China. A. beautiful B. more beautiful C. most beautiful D. the most beautiful( ) 4What’s the matter _________ her?A. inB. toC. onD. with( ) 5. A: Did he see the doctor?B: No,_____________.A. he isn’tB. he doesn’tC. he didn’tD. he don’t ( ) 6. A:________ will he come back?B: At lunch time.A. HowB. WhenC. WhereD. What( ) 7.A: I can’t go to school today because I don’t feel very well.A. Thank you.B. Goodbye.C. You are welcome.D. I’m sorry to hear that.( ) 8. Canberry is the capital of ____________? A. Australia B.Japan C. New Zealand D. America ( ) 9. Mrs. Webb likes______________ Guangzhou dimsum very much. A. eat B. eats C. eating D. is eating ( ) 10._____________ you like to go shopping with me?A. DoB. AreC. DidD. Would 五、写出对话所缺的单词(每个空格填写一个单词,包括缩写形式):(10分)(I)A: W_______ are you going to Hong Kong?B: The day a________ tomorrow.A: How are you going to g_________ there?B: B_________ train.A: How long are you going to s_______ there? B: About two w________.(II)Mrs. White: Good evening. I called you this afternoon.Mrs. Webb: Sorry, I _________ at the market.Mrs. White: I’m __________ a party at home. Would you like to come? Mrs. Webb: I’d l__________ to. Thank _______ very much. 六、阅读对话,根据对话填写句子所缺单词(每个空格填写一个单词,包括缩写形式)(5分)This was the first day of the new term.Mr. Chen: Good morning, class. Welcome back to school. Pupils: Good morning, Mr. Chen.Mr. Chen: You all look happy today. Could you tell me what you didon your summer holiday?Jiamin: I stayed at my uncle’s farm and had a lot of fruit. Mr. Chen: Wow! That sounds great. Did you like the life on the farm? Pupils: Yes, I did. The air(空气) was better than here in Guangzhou. Mr. Chen: What about you, Xiaoling?Xiaoling: I went to the Disney Land in Tokyo.Mr. Chen: That’s interesting. Did you speak Japanese in Tokyo? Xiaoling: Yes, only a little. Some Japanese understand English. So sometimes I spoke English.Mr. Chen: Excellent! Thank you. Let’s have our new English lesson now. 1. The pupils _________happy today.2. Xiaoling travelled in ____________ on the summer holiday.3. Jiamin __________ a lot of fruit on his uncle’s farm.4. Xiaoling can speak a little ____________.5. The pupils are ____________ an English lesson.七、写出不少于五个句子,描述你昨天的活动。
论英语语言测试的信度和效度
论英语语言测试的信度和效度摘要:信度和效度是英语语言测试中两个比较重要的评价标准,也是衡量测试是否有效且可靠的重要因素。
信度是指测试结果的可靠性,可信性以及稳定性;效度是指语言测试的科学性和有效性,即考试达到预定目标的程度。
本文将深入探讨信度和效度的两个概念,并进一步阐述两者之间的关系。
关键词:英语语言测试;信度;效度;语言测试是一门具有语言教学的综合性科学,并运用一系列科学而又具有实践性的方法来客观评估学生的语言运用能力。
语言测试的标准包括信度,效度,真实度,区分度,实用性等。
在这些衡量标准中,信度和效度是两个非常重要的衡量维度,也是必须在英语语言测试中应用到的两个衡量标准。
信度和效度这两个概念最初于1930年引进到语言测试这个领域中的。
以Lado为代表的结构主义测试者,他系统地阐述并论证了信度和效度这两个概念,认为语言测试已经形成了一个科学体系,成为一个独立的学科。
从整体上看,语言测试在理论和实践上都偏向于信度和效度。
此外,信度和效度是评价学业测试的重要依据。
两者之间的关系是学术考试的基本问题,学术考试的最终目标是为语言教学服务。
因此,两者的作用在于是否对英语教学产生重要影响,是否能够支撑英语教学,是否能够实现教学目标,又是否能和学习的过程相契合。
语言测试不仅能够检查学生掌握知识的能力和水平,还能够发现学生学习中存在的潜在问题,并能够为教师之后的教学提供有效的指导和帮助。
鉴于此,本文将深入探讨信度和效度的两个概念,并进一步阐述两者之间的关系。
1.语言测试中的信度和效度信度又称有效性,是指测试结果的可靠性、可信性和稳定性,要求其结果不受受试群体和试题的干扰,从而反映被测试者真实的语言行为。
简而言之,测试结果应当客观真实地反映,不受其他因素影响。
如果一份英语试卷了信度,也就不能客观公正地反映被测试者的语言行为,那么这份试卷就失去了它的使用价值。
因此,同一份测试题在不同场合下测试,得到的结果在很大程度上保持一致,则该测试的信度是比较高的(冯彤,2003)。
语言测试的效度与信度
2.信度在实施阶段的考虑 .
• 实施阶段的任务是制定具体的、可操作的考试大纲, 详细说明试题包 括的内容。换言之,在此阶段必须制作出 完整的试卷。图1所示, Bachrnan的语言模式把测试方法 作为影响测试成绩的三大类因素之 一。因此,对试卷中每 个部分所采用的测试方法必须做出严格的要求。 否则,不 恰当的测试方法将导致考生成绩的极大差异,使测试成绩 失去信度。 • 例如,多项选择方法(multiple-choice)的最明显的 优越性就是它的评 分具有很高的信度,属于客观测试方法。 但是,某些语言领域的技能 如写作、口语表达能力若采用 多项选择方法测试则很难测试出受试者 的真实语言能力, 测试信度有所降低。综合填空方法(Gloze-test)则 较适合 测试阅读能力。不难看出,正确的测试方法能够可信、有 效 地诱导出反映某种语言能力的行为。某些测试方法只适 用于测试特定 的语言能力,而无法用于其他语言能力。基 于我们对测试方法对成绩 的影响的了解还十分粗浅,我们 无法推荐究竟用何种测试方法去测试 具体的语言能力。 • Lyle F.Bachman(1990)在选定测试方法方面提出了 很好的建议。 “(1)测试任何一种语言能力时,至少采用两 种或更多的测试方法。 (2)如果一份试题可能重复使用时, 尽量有目的地变换测试方法。” 此举,一方面加深对测试方 法的理解,一方面降低由于测试方法选择 不当而导致的测 试结果不一致的误差源,从而提高试题的信度。在实 施阶 段,保证试题的信度还可以从其他方面人手。比如,尽可 能增 大试题量或严格限制考生自由选择的范围来提高信度。 由于上述做法 能够提高测试信度,因此在实施阶段的作用 应得到极大的重视。
3.信度在考后阶段的考虑 .
从考后阶段的主要任务来看,提高信度应把 重点放在 培训阅卷员上,同时必须提供详细准确的标准答 案。由 于任何考试的评分方法不可能全部使用多项选择, 对错 一目了然。因此,主观题的评分必须首先规定正确答 案。 另外,说明若遇到部分正确的答案时应如何打分。标 准 答案规定愈清楚、细致,就愈可提高评分信度,也就更 有助于提高整个测试成绩的信度。培训阅卷员也是一条保 证评分信度的有效途径。在评阅主观题时,阅卷员必须经 过严格的岗前培训,统一批改试卷,然后将各评卷员评阅 过的卷子进行比较,也可由有经验的专家对其评阅进行分 析审核,那些严重偏离标准答案的阅卷员或停用,或对其 所评试卷进行再次审核。阅卷员的评分差异性是影响考后 阶段测试信度的较大的误差源,应千方百计降低或杜绝, 从而提高信度。
语言测试的信度与效度之间的关系
语言测试的信度与效度之间的关系李翌豪【摘要】测试的信度和效度是用来衡量一门考试是否有效和可靠的两个关键因素,任何测试的开发与评估都应当把二者纳入到重点考虑范围之内。
然而,一些研究者对于测试信度的定义往往过于理论化,甚至把其成立的基础建立在某些理想化的客观条件之上;同时他们在测量信度时所采取的过于机械化的统计方法,也导致了其结果不能准确地反映出试题的客观稳定性。
考虑到信度与效度之间不可避免的逆反关系,为了满足语言测试的首要目的,测试的开发者应当首先给予效度最大限度的重视。
由于“套题”中包含了复杂的“题内相关性”,所以它并不利于测试在数据上达到令人信服的“可靠性系数”值;但如果以此为依据就盲目地将其排除在外,我们就忽略了其在考查被测能力方面的作用,从而忽视了对测试整体效度的把握。
%There are lots of concerns involved in developing a test,especially a language test for second and foreign lan-guage learners,but the two most important ones that any test developer should take into consideration are reliability and validity.However,reliability and validity are not always mutually contributive to each other,and sometimes even an in-verse relationship could exist between them.Aiming at assessing and reflecting the true language ability of test-takers,I think any test-developing activities should be organized around how to make the test more valid,in other words,how to resolve the potential tension between reliability and validity and ensure the latter one at the same time.My article will dis-cuss how certain assumptions and suggestions underlying the theoretical definition and statistical measurement of reliabili-ty might distract testdevelopers'attention away from validity and negatively affect their decision concerning the selection and construction of test items conducive to validity.【期刊名称】《江苏师范大学学报(哲学社会科学版)》【年(卷),期】2016(042)005【总页数】5页(P88-92)【关键词】测试信度;测试效度;语言测试【作者】李翌豪【作者单位】江苏师范大学外国语学院,江苏徐州 221116【正文语种】中文【中图分类】H08众所周知,在一门测试的开发过程当中需要考虑诸多因素,尤其是对专门为第二语言或外语学习者所打造的语言能力测试而言,试题开发者对其信度和效度的把握无疑是试题开发当中最关键的两个环节。
浅议小学英语测试的信度和效度
浅议小学英语测试的信度和效度任何一次英语考试,为保证达到预期的测试目的,首先要尽量追求试题具有较高的信度、效度。
在教学过程中的阶段性评价或某教学过程结束后的终结性评价中,测试者在施测前可以从信度和效度两个方面对测试进行理论指导,施测后再从这两个方面对测试的质量和效果进行评价,从而使测试更具科学性。
信度和效度是评估语言测试最为关键的两个质量指标。
如果我们要使一次英语测试成绩能正确反映学生的语言能力,达到预期的测试目的,那么在设计和使用测试时,信度和效度是我们首要关注的特征。
但两者在本质上又是相互冲突的。
在一定的约束条件下,为了使英语测试的总效用达到最大化,我们要尽量找到信度和效度之间最佳的平衡关系。
信度是“测试的一致性”。
简言之,就是测试结果的可信度、可靠度。
我们可以这样来检验测试的信度:使用同样一份试卷,在两种不同的场合、环境中,在较短的时间间隔内,施与同样的学生,如果测试结果基本吻合,那么证明该测试是有信度的。
一份试卷的测试结果如果缺乏信度,就没有使用价值,同时也减弱了考试的公正性。
当然,要完全消除不一致性也是不可能的,我们能做的是尽量把影响不一致性的不利因素控制在最低程度,以便于提高测试信度。
信度和效度作为评估测试质量的两个基本特性,两者虽然在一定程度上是相互矛盾的,但完全可以通过相互协调使之达到适切的平衡,以保证测试的总效用性最大化。
在英语测试的设计和命题过程中,不能绝对、片面、盲目地追求或强调某一方面而以失去另一方面为代价,只有综合平衡二者的关系才能获得最大的总效用。
语言测试的信度是指语言测试结果的一致性程度,通常包括三个方面:测试本身的信度、受试者在不同情况下的表现以及评分的信度。
列举了五项影响测试信度的因素:(1)学习者的波动,如临时的心理或生理的变化;(2)评分的波动,如评分员之间、每个评分员自身前后之间的差异;(3)测试过程中的波动,如外界的干扰、不同的指令;(4)测试的特征,如测试时间的长短,试题的难易度、区分度;(5)与作答相关的错误,如猜测因素等。
试论大学英语语言测试的信度与效度
试论大学英语语言测试的信度与效度作者:戴小玲来源:《文教资料》2018年第29期摘要:信度和效度在大学英语语言测试中是最关键的一部分,然而大部分教师没有掌握好信度与效度的标准,影响英语语言测试的真实性。
英语语言测试是英语教学中的重要部分,本文就加强大学英语测试的信度和效度提出建议,通过提高测试合理性,增强教师学习研究的意识,增强测试的合理性、多样性,进一步实现大学英语语言测试的完善化,有效提高大学英语教育水平。
关键词:大学英语测试信度效度引言大学英语语言测试是学习英语过程中较为重要的一部分,它与课堂教学两者巧妙结合、相互影响。
合理的英语测试充分体现了教育方法与目标,教育方法应当与教学内容一致。
克服英语语言测试中的问题,提高信度与效度已经成了我国大学英语教学必不可少的教育手段,同样成了大学英语教学改革的趋势。
一、语言测试的信度和效度有关概述信度是指语言测试结果的稳定性与可靠性。
比如做同一套试题,考试结果都一样,那就证明考试是有信度的。
相反如果考试成绩相差过多就证明测试信度不高。
效度则是指如果测试结果是想要的那就是有效度的。
对于测试来说效度是最重要的衡量标准,如果效度不高,那么测试毫无意义。
语言测试的效度有几种:一是表面效度,指能从表面上测试出学生的英语能力,不要求学生开口。
二是内容效度,要求考试内容与学生所学内容一致。
三是共时效度,指测试的结果与有效考试结果相对比,得分相近则证明内容有效度。
四是预示效度,用学生的测试效果跟雅思考试的结果相比,相近则有较高的效度。
五是结构效度,根据学生的实际交际能力观察学生的语言技能,结构效度是语言测试中的重要基础,是反映学生成绩的有利依据[1]。
二、大学英语测试中的问题(一)测试设计缺乏合理性。
在我国大学英语语言测试中,考查学生语言综合能力与教学部分的内容比例不够合理。
大多数高校在英语课堂教学中能做到提高学生的听、说、读、写能力,但是在实践考试中只注重单词背诵及语法使用的考查,学生的交际能力无法真实地评估,这种缺乏合理性的英语测试不可能测试学生的真实水平,也无法得到积极的反馈。
论语言测试的信度和效度
一、 信度 2 3*’,&+,’,.4 5
信度指测试结果的稳定性 5 67389&97: ; 或一致性 5 <%=6967-=<: ; 。 语言测试信度的高低主要说明的是 测试结果在多大程度上反映了受试者真实的语言 水平。 也就是说, 只要被测量的对象本身没有变化, 用同样的 “ 尺子 ” 去测量, 总会得到同样的结果。 但 语言测试的对象是人, 人的因素是不稳定的, 所以 测试的目的是要衡量其中相对稳定的东西。
三、 信度和效度的关系
信度和效度是语言测试中两个重要的标准。 两者之间存在着密切的关系: 既相互依存, 又相互 排斥。 语言测试以语言能力为测量目标, 而语言能 力是抽象的, 是通过具体的语言行为体现出来的, 难以直接测量。 另外, 任何测试都不必要更不可能 测量所有的语言行为, 因此语言测试的目的是通
!" #$% &%’()*(’(#+ )", -)’(,(#+ ./ 0)"12)1% 3%4#("1
!"# $%&’, ()#* +,& - +./.% 0’%1.23%456 7&89%’: ;<=;;;6 >?%’& @ 5*4#6)7#8 !"#$%"$& ’&(’)#$ )( " *+"#,- ./ "001)&2 1)#$%)(3 ’),(4 5-)( "+’),1& 6"7&( ,.66&#’ .# ’-& ’8. )60.+’"#’ ,+)’&3 +)" )# $+&"’ 2&’")19 +&1)"*)1)’: "#2 ;"1)2)’:4 <&1)"*)1)’: 6&"#( ’-& =%"1)’: ./ *&)#$ +&1)"*1& .# ,.#()(’&#,:4 >"1)2)’: 6&"#( ’-& =%"1)’: ./ *&)#$ ;"1)2 .+ +&"1)?"’).# ./ ’-& 0%+0.(&(4 5-& "+’),1& "1(. &@01")#( ’-& ,1"(()/),"’).#(A ,"1,%1"’)#$ 6&’-.2( "( 8&11 "( ’-& +&1"’).# *&’8&&# ’-& ’8. ,+)’&+)"4 B’ ,"# *& ,.#(’+%,’);& /.+ ’-& &;"1%"’).# ./ 1"#$%"$& ’&(’)#$4 9%+ :.6,48 A&’:,&:. 4.34%’:B 2.A%&/%A%45B 1&A%9%45
语言测试中的效度与信度
语言测试中的效度与信度作者:邹微杨纾凡来源:《校园英语·中旬》2015年第08期【摘要】语言测试是检验学生语言习得效果最直接的手段,是语言教学的有机组成部分。
本文旨在对语言测试的信度和效度进行分类阐释,并分析影响语言测试信度与效度的主要因素,同时,对二者的关系进行分析,以期为考题设计者命制考题提供借鉴和参考,使语言测试真正服务于语言教学。
【关键词】语言测试语言教学信度效度一、引言随着语言教学的不断推进,语言测试逐渐从应用语言学中分离出来,成为一门独立的学科。
Bachman曾说“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。
”测试是检验学生学习效果最直接的方式,有效、可靠的测试,其结果能够帮助教师了解学生的学习水平,是因材施教的一个重要参照。
同时,测试也是评估教师教学效果的重要手段之一,为教师下一步教学计划的制定、教学方法的调整、教学重难点、目标的明确提供了依据。
评估一项测试的指标主要有“信度、效度、区分度和实用性,其中以信度和效度最为重要。
”二、效度效度,简而言之就是测试的有效性,是指该测试是否测试出命题人想要检测的内容、达到命题人预期的测试目的。
它是测试最基本的出发点。
“波尔斯基和梅西克视效度为外语测试的主要问题,其范畴包括内容效度、标准相关效度、构卷效度和表面效度等。
”1.内容效度。
内容效度,是指试题的内容是否考查了出题人想要考查的语言技能及语言要素等。
如,一个专项的语法考试,出题人需按照教学大纲的要求,大纲里规定有哪些语法是必考,那么出题人在出题的时候就必须考虑到这些语法点,考题的内容必须要覆盖大纲里规定的所有必考点,这样的考试才能算的上是有内容效度的。
内容效度是衡量测试效度的一把重要的尺子,在教学过程中,通过内容效度较高的测试,教师能更好地制定教学计划,了解教学的重难点,进而明确语言教学的方向。
2.标准相关效度。
标准相关效度指的是“测试与某一个独立并且相当可靠的学生能力测量工具”之间的关联程度。
浅析语言测验的信度
练习效 应指 的是这样 的情况 :被试者 由于第 一次测 试 的 验 时 间安排不 当,就 会 出现 难度 测验 向速度 测验 发展 的 比较 突然 , 然后第 二次经 过测试 ,了解 熟悉 了测验 方式 , 趋 势 。即有相 当一 部分学 生 因为时 间的原 因不 能笞完 全 或者 说是 因为他熟 悉 了测试 方式 ,所 以他 第二 次测验 的
结 构主 义时期 ,语 言测验 成 为一 门正式 的学科 。无
论是什 么样 的测验 ,主观 的或者客观 的 、大规模 的还是 小规模 的 、 分立式 的抑或 综合式 的 , 都有一 个质量 问题 , 即我们 根据什 么标准 来判 断一个 测验 的好坏 ,而 信度 就 是标 准之一 。 2 信度 的含义 信度 就是 我们常 说 的可靠 性 ,是 指测验 结 果 的一致 性 程度 。 一个 好 的测 量工具 , 对 同一事物 反复 多次测 量 , 其结果 应该始 终保持 不变 ,测 验 的稳 定性 就叫信 度 。假 设 同一 个测验 让 同一 批学 生在短 时间 内做 几次 ,我们会
一
再测 信度 也可 以称做 稳定 系数 ,是一 组被测 验者 在 不 同时间用 同一测验 两次 。由于再测 信度是 同一个 测验 在 同一 批被试 中重复 施测 ,这就会带 来练 习效应 。所谓
一
5 . 2 测 验 时 间
测验 的 时间是影 响测验 信度 的 因素之一 。 我们 知道 , 个难 度测验 也必须 在规 定 的有 限时间 内完成 。如果 测
焦
! 生
箜 鲞箜 塑
浅 析 语 言测 验 的信 度
陈 茜 , 袁 喜 竹 ( 邵 阳 学 院 湖 南 邵 阳 4 2 2 O 0 0)
【 摘要 】信度 就是人们常说 的可靠性。本 文着重从信度 的含 义、信度 系数 的含 义、估计信度 的方 法以及影 响信度 的 因素这几个方 面来分析研 究语言测验 的信度 。
语言测试的信度和效度及其关系
科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。
其中, 以信度和效度最为重要。
一、语言测试的信度语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。
即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。
信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。
同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。
影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。
试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。
与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。
2. 考试条件不一样。
同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。
3. 监考施策。
不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。
4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。
5. 保密工作做的不好, 泄题事件发生。
6. 评分。
主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。
7. 样品数量太小, 样本不足。
8. 身体及心理状态不好等等, 这些因素都会影响到信度。
因此, 为了提高信度, 我们必须对症下药, 采取各种措施。
现代语言测试的信度和效度的分析
现代语言测试的信度和效度的分析
陆乔叶
【期刊名称】《包头职业技术学院学报》
【年(卷),期】2013(014)001
【摘要】信度和效度是语言测试的两个极其重要的评价标准.信度指的是考试结果的可靠性,效度是指考试达到预定目的的程度.从宏观角度进行分析,并对现代语言测试中效度和信度的取向进行了阐述.
【总页数】3页(P38-39,64)
【作者】陆乔叶
【作者单位】江阴职业技术学院外语系,江苏江阴214405
【正文语种】中文
【相关文献】
1.《中国家庭追踪调查》中字词测试的信度和效度分析 [J], 吴琼;李佩华
2.现代语言测试的效度应重于信度 [J], 柯贤兵
3.基于 TEM4听力测试标准的英语专业期末听力测试信度和效度分析--以长江大学外国语学院为例 [J], 叶贝贝
4.听障人员普通话水平替代性测试信度与效度的统计分析 [J], 陈蓓琴; 史玉凤; 韩艳
5.基于"通用手语"的听障人员普通话水平替代性测试信度、效度分析 [J], 陈蓓琴;韩艳;史玉凤
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、信度与效度的相互关系
语言测试以语言能力为测量目标,而语言能力是抽象的,是通过具体的语言行为体现出来的,所以难以直接测量。另外任何测试都不必要,更不可能测量所有的语言行为,因此语言测试的目的是通过对受试者语言行为样本的测量结果来推测受试者的语言能力。语言测试涉及两方面的内容:首先作为一种测
量工具,它必须保证测量结果的可靠性,也就是信度要求。显而易见,用一把本身具有很大伸缩性的尺子来测量物体的长度,其结果必然不可信;同时,语言测试以语言能力为测量目标,它的内容和形式与语言能力应有最大的相关性,亦即效度要求。语言测试的信度说明考试结果与语言行为的关系,语言测试的效度反映所测试的语言行为与语言能力的关系。没有信度意味着测试结果不可信,不是受试
者语言行为的真实反映,我们就难以藉此测量任何东西。没有效度只有信度的测试也毫无意义,因为它准确地测量了与语言能力不太相关或毫不相关的东西。在此情况下,我们同样无法从考试结果中推测受试者真正的语言能力。要实现一个语言测试的目的,信度与效度缺一不可,这是二者关系的统一性一面。另一方面矛盾和对立构成了二者关系的主要特征。
・2009年第1
期・
5
陈静
浅谈语言测试的信度与效度
收稿日期:2008-09-24作者简介:陈静(1981-),女,吉林华桥外国语学院科研处,讲师,长春130117
[摘
要]本文通过测试的信度与效度的对比分析,结合其发展过程分析了信度与效度的相互关系对语言测试及语
言教学的影响。正确、科学的现代语言测试的取向应该是效度重于信度。提高测试的效度可以提高语言测试的正面反拨作用,即促进语言教学的质量。
效度使语言测试注重语言的整体性、艺术性,所以题目要多样化,内容和形式尽量接近语言运用的实际。信度要求则使语言测试强调语言的科学性,将语言进行分割处理,注重测试题目的同质性,使语言测试的内容与形式脱离语言运用的实际。因此,任何测试,任何测试题型都难以兼有极高的信度和极高的效度。
以离散型测试为主要特征的结构主义语言测试能保证高信度;而强调以真实的语言为测试内容的交际测试能保证高效度。三、语言测试的效度应重于信度
测试理论经过了科学前语言测试时期、心理测量——结构主义语言测试时期、社会语言测试阶段,发展到现代的交际语言测试时期,人们逐步意识到语言的使用过程是一个动态的互动过程,从而
使外语教学的重点转移到培养语言交际能力上,与之相应的测试则是要求学习者借助所学的语言完成现实生活或类似的活动或任务,
旨在考察其对语
・2009年第1
期・
7
浅谈语言测试的信度与效度
言的实际运用。因此,语言交际功能的培养是语言教学的首要目标,同时衡量语言交际能力也成为,即一个语言测试效度的高低不仅在于它是否考了它要考的,还在于它考的是什么。测试的内容和形式越接近实际使用中的语言就越有效度。
语言测试的信度是指测试结果的可靠程度。
浅谈语言测试的信度与效度
吉林华桥外国语学院学报
6
即当被测试对象发生变化,用同样的“尺子”去重复测量时,总是获得类似的结果。影响信度的因素很多,它们存在于语言测试的每个环节中,就试卷本身来说主要是样本的大小和区分度等。取样大,样
本具有广泛性,测试的信度就高,反之信度就低。另外试题太难或太易,考试分数集中于某一点或某一区域测试也失去信度。在测试的组织、实施这个环节中,一方面考试的环境和条件要对考试有利。另一方面考试的环境和条件对所有的受试者是否一致也影响到考试的信度。在测试评分的环节上,评分标准是否一致对信度影响很大,尤其是主观题的评分很难能达到很高的标准。
[关键词]语言测试;信度;效度[中图分类号]H087[文献标识码]A [文章编号](2009 01-0005-04
语言测试学,作为应用语言学的一个分支,现已发展成一个相对独立的学科。作为对语言教学进行测量和评估的一个重要手段,语言测试愈来愈受到广大外语教学工作者的重视。Bachman (2004:54曾说:“在教育程序中,语言测试的基本运用是给教学评估提供重要的信息。”通过测试可以检查学生对知识的掌握情况和教学中存在的问题,对今后的教学提供指导和帮助;同时,通过测试可以衡量教学任务和教学大纲的执行情况。不科学的测试不仅不能起指挥棒的作用,有时反而会误导教学,将学生和教师引向歧途。因此我们主张的是科学的,符合教育原理的测试,这样的测试会对教学产生积极
的反拨作用。一套设计比较科学的测试,一般认为应该有四点特征,即效度,信度,实用性和良好的反拨作用。其中信度与效度是后两者的基础,是语言测试的永恒主题,信度与效度孰重孰轻,也是现代语言测试学家一直争论不休的话题。本篇论文通过测试信度与效度的研究,旨在帮助教师设计合理的测试,并在测试后对试题总结、归纳,以加大测试力度,提高测试效果。一、信度与效度的概念
科学、公正的测试具有较高的信度和效度。测试的信度越高,就越能客观、准确地反映受试者的语言能力;而测试的效度越高,就越能有效地反映被测试者的语言运用和交际能力。但二者之间存在固有的矛盾。信度要求使测试强调语言的科学性,即将语言分割处理,趋向于测试题目的同质性,往往导致测试在内容和形式上脱离真实的语境;效度要求使测试偏重于语言的艺术性、整体性,题目趋向多样性,测试在内容和形式上紧密联系实际。这就决定了同时具有高信度和高效度的语言测试是不存在的。