效度视阈下的英语语言测试社会维度

合集下载

语言测试真实性维度的再认识——兼谈考试效度的诠释

语言测试真实性维度的再认识——兼谈考试效度的诠释

针对大众对语言测试“ 真实性” 的普遍理解 , 重新梳 理语言测试 “ 实性” 真 研究 , 探究其 困境 , 揭示语 言测 试真实性 的本 质 , 指 出其研究走 向。 并
性 ; 材料信息的时效性 ; 材料载体的真实性 ; ② ③ ④ 材料作者是否是本族语者 ; 材料使用者是否 ⑤ 为本 族语者 ; 材 料 呈 现 是 否 自然 ; 意 图 真实 ⑥ ⑦
和考试 中借 鉴 。拿 阅读 测 试 的材 料 来 讲 , 内容 其 既要 反映重 要 的主题 和 思 想 , 又要 体 现 课程 目标 ;
既要 联 系学 习 者社 会 生 活 的 经 历 , 要 有 助 于 学 又
性” 概念伴随交际语言教学 的盛行 而流行 , 长期 以 来 一 直 受 到 语 言 教 学 和 测 试 界 的 关 注I 。Wi t ] d .
新 闻) 登 了王蔚 同志 的《 年 高考 英 语 口试 题 目 刊 今 让考生 有 些 意外— —考 口语 表 达 , 是 考 时 政》 还 一 文。上 海市 20 O8年高 考英 语 口试 题 目出现 大量 的 时政性话 题 , 引起 大众 关 注 : 口语 考试 应 该 纯 粹 考 查学生 的语 言表 达 水平 还 是 应该 把 外语 作 为 一 种 载体考查 学生 的综 合能 力 。该 文指 出, 语 学 习需 外
m n 出测试 的情 景 真实 性 和互动 真 实性 的理 a提 论 _ 。情景 真实 性 指考 试 题 目的特 点 是 否 和 目的 7 J 语的环境 中语言使用 的情 况吻合 , 而互动真实性 指 考生 和考 试 题 目之 间 的 互 动 关 系 , 即题 目是 否 能激发考生的语言能力 , 使其完成考试任务_ 。 8 _
要融入 到 社 会 生 活 中 , 言 教 学 需 要 关 注社 会 热 语 点, 语言测试也 应该 如此 。该文 反 映出 目前公 众对 语言测 试 “ 实性 ” ateti ) 真 (uhn cy 问题 的 疑惑 。本文 it

英语核心素养的四个维度 语言能力

英语核心素养的四个维度 语言能力

英语核心素养的四个维度英语学科核心素养主要包括语言能力、文化意识、思维品质和学习能力。

四语言能力——学科基础语言能力指在社会情境中,以听、说、读、看、写等方式理解和表达意义的能力,以及在学习和使用语言的过程中形成的语言意识和语感。

语言能力是英语学科的基础,也是英语学科核心素养的核心。

语言能力的提高,蕴含文化意识、思维品质和学习能力的提升,有助于学生拓展国际视野和思维方式,开展跨文化交流。

【解读】首先,语言的使用一定是在社会情境中发生的,它不可能脱离情境。

孤立地脱离语境而学习词汇或语法,不是在培养真正的语言能力素养。

学习词汇和语法知识是发展语言能力素养的途径,而不是最终目的。

其次,增加了“看”的技能。

听、说、读、写是英语的基本技能。

这里加了一个“看”的技能,也是首次在《英语课程标准》中提出了听、说、读、看、写这五种技能。

为什么要增加“看”的技能?因为当今社会,很多信息都可以来源于“看”。

信息可以通过一个图表、一幅图画或一个视频来传递,不一定是全篇的文字形式。

所以“看”是信息社会获取学习资源的一项重要技能。

最后,语言能力的最终目的发展学生英语语言能力,是让学生能够通过听、说、读、看、写等活动,理解口头和书面语篇所传递的信息、观点、情感和态度等,能够利用所学语言知识、文化知识等,根据不同目的和受众,通过口头和书面等形式创造新语篇,传递自己的情感态度和价值观念。

语言能力两个目的:1、能够理解理解口头和书面语篇所传递的信息、观点、情感和态度。

2、能够通过口头和书面等形式创造新语篇,传递自己的情感态度和价值观念。

托福考试社会维度分析——兼谈大学英语四、六级考试

托福考试社会维度分析——兼谈大学英语四、六级考试

收稿 日期 :2 1-71 0 00 .6 作者 简介 :王立 群 (9 8 )男, 16 -, 河北 衡水 人, 一 南通纺 织职 业技术 学 院外 语系 副教授
第 2期
王立 群
托 福 考 试 社 会 维 度 裁保 罗 ・ 姆 齐 (al R msy T 国 拉 P u A. a e)
到很好 的 启 示作 用 。
关键 词 :托福考试;社会功能;语言测试;社会维度
中图分类 号 :G 2. 44 4 7
文献标 识码 :A
文章编 号 :17.05 0 1 2 16 3 63 6( 1 0, 2- . 2 ). - 2 0 0
英语语言 测试是在 一个 国家或地 区社会和教育大 环境下实施的 ,语言测试 的方方面 面都体现 了测试 的
T E L iT 的要 求 是 :T t cr :7- 5( 分 o lSoe 4 7 满 a 价值等之间会有矛盾 。但这 并不意味着就应该否定语 (O F B 1 言测试 ,而是要求我们思考 如何解 决语言测试 问题 的 1 0 ; B so iest. l g f Ge ea  ̄de, ) 2 o tn Unv ri Col e o n rl S is y e 同时把其社会维度考虑进去 。 情况 、社会特征 以及测试所产生的社会影 响和后果 。 Sh o f n gmet 托福考试 成绩(O F T 的 c ol ae n; c Ma 对 T E Li ) a

果的使用不合理甚至滥用 【,而事实上 却具备了语言 2 】
测试 的社会准入性 。如美 国绝大数 的高等院校 ,都以

语言测试社会维 度研 究的产生及内涵
语言测试 是在特 定社会环境下 ,以特 定的社会组 托福 考试 成绩来衡量外 国学生 的英文娴熟程度 ,是录 织为依托而进行的 ,所 以对语言测试 的研 究,首先必 取入学最主要的一项指标 ,托福成绩成为入学 的重要 须对其社会 维度有很好 的把握 。语言测试牵涉到复杂 准 绳和 尺度 。 因此 ,托 福考 试便 具备 了社会准 入 功 oa cm d o ee l 的社会 问题,特 别是有时语 言测试 与社会公正 、社会 能 。如 H w r o m蛐 C l g 对 托 福考 试 成 绩

浅析《人文英语3》的语言测试与评估

浅析《人文英语3》的语言测试与评估

浅析《人文英语3》的语言测试与评估作者:王宇来源:《知识文库》2020年第17期本文是以国家开放大学(以下简称“国开”)为非英语专业开设的公共英语课程《人文英语3》(以下简称《人3》的期末考核为基础,试从“构念”、“任务特征”和“效度研究”三个维度对其进行结构分析与评价,论述了语言评估与测试在非英语专业英语教学中的重要作用,并探讨合理设置《人3》科目测试目标和内容的基本思路。

近年来,在外语教学领域的专家与学者们越来越关注语言评估与测试的研究。

其中,英语语言测试是对英语语言教学效果、英语学习者英语各方面能力的测量和评估,是英语教学中一个不可分割的环节。

广大英语教师已经意识到语言测试与评估是英语专业教学和非英语专业教学的重要组成部分。

它不仅是衡量外语教学成效和提高教学质量的重要手段,而且是为教学服务的。

因此为了更好地服务于成人学生群体,国家开放大学(以下简称国开)针对他们学习的实际需求,在公共英语课程的语言评估测试中,进行了改革与创新,推出《人文英语》等系列课程。

其中《人3》是为人文类非英语专业(专升本)第一学期开设的全新公共英语课程。

通过学习本课程,学生应能熟练使用其中的2000个左右词汇,包括在职场中常用的词汇和短语,以及在相关职业活动中最基本的英语词语及表达方式,能在涉及法学、社会工作、汉语言、教育等相关专业的商务环境中进行基本交流;使他们提升在人文情境中使用英语进行交际的实际能力。

语言测试(主要指外语测试)是多种学科的结合体,是一门成熟的跨学科的综合性学科。

(李华田,补爱华:2003)众所周知,教学成评估相辅相成。

韩宝成教授认为对基于任务的教学进行评估既应包括形成性的,又要包括终结性的:既有过程评估,又有结果评估,但核心是对学生的学习成绩做出评价,由此便产生了基于任务的语言测试。

时至今日,由Bachman教授所提出的交际语言模式已经对语言测试的发展产生了深远的影响。

也就是说,大量的语言测试与评估的研究不断地证明,语言测试的设置更加需要全面的考虑。

高职高专大学生英语四、六级考试社会维度

高职高专大学生英语四、六级考试社会维度
己英 语水平的高低。
收 稿 日期 :2 0 1 3—0 7—2 5
作 者简介 :郑欣 荣 ( 1 9 7 9一) ,女 ,硕士 ,南通纺织职 业技 术学院素质教 学部讲 师,研 究方 向:现 当代英 美文学。 项 目基金 :南通 纺织职 业技 术学院 2 0 1 1 年院级教研课题 “ 大学英语 四、六级 考试 的社会 维度调 查” ( F YJ Y / 2 O l 1 / 1 0 ) 。
测试社会维度研究就是将语言测试与社会问题 结合起来 ,突
高专适 合什么样的英语教学呢?排在第一位 的是 职业英 语教 学 ( 5 2 . 3 %) ,基础英语教学只 占 2 1 . 7 % ,还有 2 5 . 7 %被调 查者认为只要有用就行 。数据表明 ,高职高专 学生 更重视英 语应 用能力的培养 ,要求教学从 基础英语 教学 向职业英 语教 学转变 ,要学 习有用的英语 。
2 高职 高专学生对 四、六级 考试 的态度
出语 言测试 的社会特征 ,改善语言测试的社会维度 ,从 而更 好地 服务 于社会 。 大学英语 四、六级考试 作为一项全 国统 一的英语 测试 , 是大规模标准化语言考 试。作为一项 测试 教学效果 的考试 ,
从 1 9 8 7 年 开始到现在 ,已经获得 了广泛 的社会认 可 。英语
6 1 . 6 % ,认为是 “ 必不 可少 的流 行趋 势 ”的 占 1 8 . 9 %。绝
有1 2 . 1 %的学生学英 语 “ 没有什 么 目的 ,只是学 校开 的必
修课 ” 。
针对 目前学院进行的公共英语教学改革 ,学生认为高职
大多数学 生参加四、六 级考 试是因为 四、六 级考试有社会认 可度 高 ,是找工作时的敲门砖 ,或是 为了更 深层次的深造 的 需 要 ,而不是因为真正的了解这项考试 ,也不是为 了检验 自

英语学科核心素养的四个维度

英语学科核心素养的四个维度

英语学科核心素养的四个维度作为全球共同使用的语言,英语始终在世界上占据着重要地位。

而英语教育也成为我国教育改革的重要方向之一。

英语学科核心素养作为英语教育的重要方面也成为研究的热点之一。

英语学科核心素养作为英语教育的重要理念,提出了四个维度,分别为语言知识与技能、文化意识与跨文化意识、学习及思维策略、情感态度与价值观。

接下来,我们将从以下几个方面分别进行详细阐述。

一、语言知识与技能语言知识与技能是英语学科核心素养的首要维度。

该维度注重学生拥有与日常生活对话、交际需要相适应的听、说、读、写四项技能的同时,还必须能够熟练运用基础的语言知识进行有效交流。

这项素养的重点在于学生的语言技能和知识的核心部分,是保证学生能够使用英语进行日常生活和学习所必须具备的基础。

二、文化意识与跨文化意识文化意识与跨文化意识是英语学科核心素养的第二维度。

这一维度强调学生的文化素养和跨文化交际能力。

学生必须理解英语世界的文化和文化背景,并且具有开阔的跨文化视野和交际技能,能够在跨文化交流中发挥自己的作用。

学生应该能够通过语言学习而获得学术和职业方面的优势,并发展一个全球化的视野。

三、学习及思维策略学习及思维策略是英语学科核心素养的第三维度,它主要强调学生具备一种有效、持续和全面的学习能力。

学生应该具有通过学习获得知识和技能的能力,学生同时应该能够接受新的挑战并且在学习过程中发现问题。

强化学生英语学习的方法,鼓励学生通过思考和反省来不断完善学习策略和方法。

四、情感态度与价值观情感态度与价值观是英语学科核心素养的第四维度。

它主要强调学生应具有积极的情感态度和正确的价值观。

学生需要具备自信,能够理解和尊重不同文化环境下的人们,秉持着渴望成功的精神和愿意承担责任的态度。

理解人与人之间正确的关系,才能更好地培养学生的发展,也是培养国际化人才的重要维度。

总之,英语学科核心素养中的四个维度,分别是语言知识与技能、文化意识与跨文化意识、学习及思维策略、情感态度与价值观,这些核心素养的建设,有利于学生在英语学习中综合各个方面的提高,也能够有效提高学生的综合素质。

语言测试的效度与信度

语言测试的效度与信度

• •
3.效度在考后阶段的考虑
在语言测试的设计和使用中,效度问题即我们对测试 成绩的解释和 使用是有效的--被称为是保证测试质量的 不可或缺的重要指标。因此, 在考后阶段,应该对考试成 绩做描述性的分析和解释,包括制定恰当 的及格分数线, 并针对各分数段所能达到的能力进行解释。说明,以 便决 策部门正确使用成绩。根据成绩做出的决策影响面颇广, 上至 政府用人部门,中至招聘职员的公司企业,下至受试 者个人,可谓一 把“双刃剑”。在大规模、高风险的选拔人 才的考试中如全国性的大 学入学考试,合理有效地使用考 试成绩,就能选拔出对国家政治经济 发展有用的人才。否 则,依据没有效度保证的测试成绩或不合理使用 测试成绩, 就达不到选拔人才的目的,给国家造成重大的损失。对使 用测试成绩做任用决策的公司企业,有效的成绩可以招聘 对其事业发 展有用的人才。反之,结果则显而易见。对受 试者个人来说,影响也 十分重大。他们有可能被成就理想, 从此走向光明的人生之路;也有 可能被错误淘汰,造成经 济上、时间上和心理上的巨大损失。在考后 阶段,对成绩 的解释和使用应该十分慎重,必须把此成绩同以往的成 绩 进行对比分析,征求命题人员、测试专家以及考生的意见, 利用 多种手段对测试进行效度分析。惟其如此,才能对用 人单位和受试个 人负责,使测试工作自始至终有高效度质 量的保证。
一、信度(Reliability)
• Lyle F.Bachman把信度定义为“测试结果的一致性”。 换 句话说,有信度的试题应在任何时间、地点下通过测试 都能够 得到一致的结果。试题的信度可以通过比较两套试 题结果或试 题内容来获得,如果它们的结果接近或一致, 那么说明试题是 有信度保证的。评估测试结果的一致性可 依据许多方法加以衡 量。例如,在传统真实分数测试理论 (classical true score measurement theory)模式中有三种衡量 信度的方法,每一种方 法针对不同的误差源(sources of er- ror):试卷内容一致性评估 方法(internal consistency)主要 关注来自于试题内容和评分过程 中的偏差问题;稳定性 (stability)评估方法指出同一试题在相隔 一段时间之后给 同一组测试对象测试的结果的一致性问题;对 等性(equtv- alence)评估方法提供两套试题结果之间一致性程度 的信度 系数。但是测试结果的可靠性还要受到诸多其他因素的 影 响,测试成绩的高低虽然很大程度上取决于受试者语言水 平 的高低,但是同时不可忽视的是测试成绩又受到测试方 法、受 试者个性特征,诸如认知风格、知识范围、情感因 素、性别、 民族以及诸多不可预见因素的影响。

英语测试理论与实践

英语测试理论与实践

英语测试理论与实践1. 引言在全球化时代,英语已经成为了一种重要的国际交流语言。

为了评估和衡量个人的英语能力,英语测试变得越来越重要。

本文将探讨英语测试的理论基础和实践方法,并介绍一些常用的英语测试类型。

2. 英语测试理论2.1. 语言能力维度英语测试的理论基础是语言能力维度模型。

根据该模型,语言能力可以分为四个维度:•听力:评估个体理解和理解英语听力材料的能力。

•口语:评估个体用英语进行口头交流的能力。

•阅读:评估个体理解和分析英语阅读材料的能力。

•写作:评估个体用英语进行书面表达的能力。

2.2. 测试原理英语测试的原理是基于能力理论和信度理论。

能力理论指出,英语能力是一个连续的潜在变量,可以用一个得分来表示。

信度理论关注测试结果的可靠性和一致性。

常用的英语测试方法包括标准化测试和非标准化测试。

标准化测试使用统一的评分标准和程序,可以进行成绩比较和分级。

非标准化测试更加灵活,可以根据需要进行个性化评估。

3. 英语测试实践3.1. 阅读和听力测试阅读和听力测试是英语测试中常用的类型。

这些测试将不同难度的材料提供给被试者,评估其理解和分析能力。

常见的阅读和听力测试包括填空、选择和判断题等。

3.2. 口语测试口语测试是评估个体口头交流能力的一种方法。

常用的口语测试包括问答、演讲和对话等。

口语测试可以通过面试、录音或视频进行。

3.3. 写作测试写作测试是评估个体书面表达能力的一种方式。

常见的写作测试包括作文和翻译等。

写作测试可以通过手写、打字或在线方式进行。

4. 结论英语测试在评估和衡量个体的英语能力方面起着重要的作用。

通过了解英语测试的理论基础和实践方法,我们可以更好地设计和实施英语测试,提高测试的准确性和可靠性。

希望本文对于英语测试的理论与实践有所启发,并对相关研究和实践提供参考。

论英语语言测试的信度和效度

论英语语言测试的信度和效度

论英语语言测试的信度和效度摘要:信度和效度是英语语言测试中两个比较重要的评价标准,也是衡量测试是否有效且可靠的重要因素。

信度是指测试结果的可靠性,可信性以及稳定性;效度是指语言测试的科学性和有效性,即考试达到预定目标的程度。

本文将深入探讨信度和效度的两个概念,并进一步阐述两者之间的关系。

关键词:英语语言测试;信度;效度;语言测试是一门具有语言教学的综合性科学,并运用一系列科学而又具有实践性的方法来客观评估学生的语言运用能力。

语言测试的标准包括信度,效度,真实度,区分度,实用性等。

在这些衡量标准中,信度和效度是两个非常重要的衡量维度,也是必须在英语语言测试中应用到的两个衡量标准。

信度和效度这两个概念最初于1930年引进到语言测试这个领域中的。

以Lado为代表的结构主义测试者,他系统地阐述并论证了信度和效度这两个概念,认为语言测试已经形成了一个科学体系,成为一个独立的学科。

从整体上看,语言测试在理论和实践上都偏向于信度和效度。

此外,信度和效度是评价学业测试的重要依据。

两者之间的关系是学术考试的基本问题,学术考试的最终目标是为语言教学服务。

因此,两者的作用在于是否对英语教学产生重要影响,是否能够支撑英语教学,是否能够实现教学目标,又是否能和学习的过程相契合。

语言测试不仅能够检查学生掌握知识的能力和水平,还能够发现学生学习中存在的潜在问题,并能够为教师之后的教学提供有效的指导和帮助。

鉴于此,本文将深入探讨信度和效度的两个概念,并进一步阐述两者之间的关系。

1.语言测试中的信度和效度信度又称有效性,是指测试结果的可靠性、可信性和稳定性,要求其结果不受受试群体和试题的干扰,从而反映被测试者真实的语言行为。

简而言之,测试结果应当客观真实地反映,不受其他因素影响。

如果一份英语试卷了信度,也就不能客观公正地反映被测试者的语言行为,那么这份试卷就失去了它的使用价值。

因此,同一份测试题在不同场合下测试,得到的结果在很大程度上保持一致,则该测试的信度是比较高的(冯彤,2003)。

英语口语测试的效度研究论文

英语口语测试的效度研究论文

英语口语测试的效度研究论文英语口语测试的效度研究论文【摘要】口语在语言中占据基础地位,口语测试是语言测试很重要的一个方面,对口头表达能力的测量是口语测试的目标。

要保证口语测试的效度,应在充分理解效度、口语活动、口语能力等基本概念的基础上,明确设计口语测试的原则性问题以及口语测试对教学应起的后效作用。

【关键词】语言能力口语能力测试效度1 语言测试的效度问题1.1表面效度表面效度(face validity),指测试中根据观察者的主观判断,测试达到预先设想的衡量知识或能力的程度,是指试卷表面形式的可信度和公众对考试的接受程度(Ingram 1977)。

1.2内容效度内容效度(content validity),其高低根据测试所包含的具体内容来确定。

考试是否具有内容效度可从三个方面进行判断:(1)测试的内容是否和测试目标有关;(2)测试内容(试题)是否具有代表性;(3)测试内容是否适合测试对象。

1.3结构效度结构效度(construct validity),其高低根据测试项目和其所反映的理论关系决定。

一项测试的结构效度的高低是指考试的结果能在多大程度上解释人的语言能力及与语言能力有关的心理特征。

如果测试所测的东西与考试的原则或理论相吻合,那么,这个测试的结构效度就好。

1.4共时效度共时效度(concurrent validity),是将一次测试的结果同另一次同时或时间相近的测试的结果相比较,或同教师对学生的评估相比较而得出的系数。

例如,一组学生刚考过大学四级考试,接着又考我们自己设计的一套题目,如果得分情况相似,那么我们自己设计的测试就有较高的共时效度。

1.5预测效度预测效度(predictive validity),其高低根据测试能否准确地预测者将来的学习而定。

某一单项语言测试应该能够预测学习者在这一语言能力方面的水平。

涉及测试的预测能力,即测试结果到底在多大程度上能够预测出某些将来会发生的可能性,或者说对考生未来的行为做出的预测性的程度有多高。

外语专业四、八级考试的历史回顾

外语专业四、八级考试的历史回顾

外语专业四、八级考试的历史回顾外语专业八级考试是我国外语教育的重要组成部分,对于衡量外语专业学生的语言应用能力和水平具有重要意义。

本文将对外语专业八级考试的历史进行回顾,包括其产生背景、发展历程、考试内容、考试变化以及考生反馈等方面,并提出一些自己的看法和建议。

外语专业八级考试的产生背景可以追溯到20世纪80年代。

当时,我国外语教育逐渐得到重视,各级外语专业的学生数量不断增加,对外语专业学生的语言应用能力和水平进行科学、客观、有效的评估成为当务之急。

在此背景下,外语专业八级考试应运而生。

外语专业八级考试主要包括笔试和口试两个环节,其中笔试包括听力、阅读、写作和翻译四个部分,口试则主要测试口语表达和听力理解能力。

考试难度逐级上升,四级的难度主要对应大学外语专业二年级的水平,八级的难度则对应大学外语专业四年级的水平。

自产生以来,外语专业八级考试经历了多次改革。

其中一次重要的改革是在20世纪90年代中期,当时的外语专业八级考试增加了口语测试环节,使得对学生的语言应用能力的考察更加全面。

此后,随着社会的不断发展,外语专业八级考试也在不断进行新的尝试和改革。

对于外语专业八级考试的考生来说,他们普遍认为考试难度较大,需要付出大量的时间和精力进行备考。

同时,考生们也提出了一些对于考试内容的建议,例如希望增加对于听力理解和写作能力的考察,以及加强对翻译的评分标准等。

外语专业八级考试作为我国外语教育的重要组成部分,对外语专业学生的语言应用能力和水平的评估起到了积极作用。

然而,面对新的社会需求和挑战,外语专业八级考试还需要不断进行改革和完善。

针对考生反馈中提到的考试难度问题,相关部门可以进一步优化考试内容,使其更加科学、合理。

例如,可以适当降低部分题目的难度,增加一些与日常生活更为相关的内容,以更好地考察学生的实际应用能力。

对于考生提到的考试内容建议,相关部门可以在接下来的改革中认真考虑并采纳。

例如,可以加强对听力理解和写作能力的考察,提高翻译评分标准的透明度和公正性等。

英语测试信度效度

英语测试信度效度

英语测试信度效度1引言据全国大学英语四、六级考试委员会与英国文化委员会的合作研究结果认为:CET4和CET6(简称)是一项信度极高的考试,每次考试客观题的内部信度都达0.9以上;效度相当高,回收问卷中有92%的教师认为CET能反映学生的实际英语水平。

作者以为这里所指的信度和效度的界定很模糊,就某次具体的测试来说,信度和效度是受特定条件限制的,不可能是绝对的。

迄今为止,我国的高考、研究生入学考试、公共英语等级考试(PET),包括CET等大规模英语测试还是以客观性题型为主,主观题只占10%或20%左右。

就评分方法来说,因客观性试题答案的唯一性,可用机器阅卷,从而保证了测试结果的客观性和一致性,无疑具有相对较高的信度,但不足之处就是效度难以保证。

同时大量采用主观性、直接性试题的测试在阅卷信度上也令人怀疑。

这样的困惑总是或多或少存地在于考试的开发、设计和评估过程中。

我们能否使信度和效度同时最大化呢?信度和效度又应如何整合而达到适当的(appropriate)平衡?Bachman和Palmer在其测试理论中认为可设置“可接受的最低水准”(minimumaccepbrlevel)的效度或信度等质量指标从而使得语言测试的“效用性”(usefulness)原则中各特征之间达到适度平衡。

因为测试总是在一定的价值判断、测试目标、社会环境等约束条件下实行的,本文尝试探索在可行性条件下,测试的总效用(overallusefulness)最大化时效度和信度之间可能存有的关系。

2效度和信度的基本概念及特点如果我们想阐释一次特定的考试成绩是否准确反映了学生的语言水平,那么在设计和使用测试时,信度和效度是我们首要注重的特征。

Bachman把信度定义为“测试的一致性”(consistencyofmeasurement)。

简言之,就是测试结果的可信度、可靠度。

例如,我们能够这样来检验测试的信度:使用同样一份试卷,在两种不同的场合、环境中,在较短的时间间隔内,施与同样的学生,如果测试结果基本吻合,那么证明该测试是有信度的。

基于情境效度测评英语学科核心素养的试题命制与改进

基于情境效度测评英语学科核心素养的试题命制与改进

赵连杰(首都师范大学,北京100037)基于情境效度测评英语学科核心素养的试题命制与改进测试与评价在基础教育课程改革中一直占有举足轻重的地位。

随着《普通高中英语课程标准(2017年版)》(以下简称《课程标准》)的颁布与实施,如何科学合理地开展指向英语学科核心素养的测评研究与实践,成为英语基础教育课程改革和发展的重要议题。

尽管《课程标准》强调基于英语学科核心素养的课堂教学评价的重要性,倡导“评价主体的多元化、评价形式的多样化、评价内容的全面性和评价目标的多维化”[1]81,但在未来一段时期,英语课堂教学评价要由理念学习走向实践应用还需多方共同努力。

《课程标准》在对学业水平考试与高考命题的建议中指出,考试命题要“全面考查英语学科核心素养”[1]94。

目前,针对如何科学、精准地命制指向考查英语学科核心素养的试题,有关学者已进行初步探讨,如:从考试大纲研制、考查内容、命题素材、命题技巧等方面,探究如何基于核心素养进行英语学业水平考试和高考命题[2];从测评内容与要求、测试使用的语言素材、测试方式等方面提出具体的命题建议[3];聚焦问题情境在考试命题中的重要性,探讨英语考试的命题理念与技术[4];分析主观题之于英语学科核心素养测评的特殊优势[5];等等。

上述研究为进一步明晰基于英语学科核心素养的命题提供了诸多经验和启发;但是,已有研究趋于从整体上对试题拟制的注意事项和具体策略作一般性探讨,鲜有研究对试题拟制中的关键要素进行集中讨论。

鉴于此,本文从情境效度的微观视角讨论其对测查英语学科核心素养的重要意义,并结合具体的试题命制案例,透视试题的优化和改进过程。

1情境效度与英语学科核心素养测评的试题命制情境是界定学科核心素养内涵的重要组成收稿日期:2020-06-19修回日期:2020-12-03基金项目:作者简介:北京市教育委员会2020年度社科计划一般项目“课例研究对中学英语教师学习的影响效应探析”(SM202010028004)赵连杰(1985—),男,首都师范大学教师教育学院讲师。

语言测试的基本理论有哪些

语言测试的基本理论有哪些

语言测试的基本理论有哪些1. 引言语言测试是评估个体语言能力的一种常用方法。

无论是在教育、职业发展还是移民等领域,语言测试都起着关键的作用。

本文将介绍语言测试的基本理论,以帮助读者更好地理解语言测试的原理与方法。

2. 可信度和效度在语言测试中,可信度和效度是两个重要的概念。

可信度指测量工具在不同条件下提供相似结果的程度。

效度则指测量工具测量所要评估的特定语言能力的程度。

3. 口语和书面语测试语言测试通常涉及口语和书面语两个方面。

口语测试侧重于评估个体的口头交流能力,包括流畅度、发音准确性、词汇应用等。

书面语测试则主要考察个体的书面表达能力,如语法正确性、篇章组织能力等。

4. 语法和词汇测试语法和词汇是语言能力的基本构成部分,因此在语言测试中占据重要地位。

语法测试旨在评估个体对语法规则的掌握程度,包括句法结构、时态、语态等方面。

词汇测试则侧重于个体对词汇的理解与运用能力。

5. 听力测试听力测试是评估个体对听力材料的理解能力的一种方法。

这种测试通常包括听力材料的播放,然后要求个体根据听到的内容回答问题或完成相应的任务。

6. 阅读测试阅读测试是评估个体对书面材料的理解能力的一种方式。

这种测试考察个体对文本的理解程度、推理能力以及词汇掌握情况。

7. 写作测试写作测试旨在评估个体的写作能力,包括语言表达的准确性、连贯性、逻辑性以及语法正确性。

这种测试通常要求个体根据指定的题目完成一篇文章或作文。

8. 跨文化适应能力测试跨文化适应能力测试是用来评估个体在跨文化环境下的语言运用能力。

这种测试考察个体对不同文化背景的理解和适应能力,以及对语言和文化差异的敏感性。

9. 社会互动能力测试社会互动能力测试旨在评估个体在不同社交场景下的语言运用能力。

这种测试考察个体在交际中的流利度、会话技巧、语言礼仪等方面的能力。

10. 总结语言测试的基本理论涵盖了可信度和效度、口语和书面语测试、语法和词汇测试、听力测试、阅读测试、写作测试、跨文化适应能力测试以及社会互动能力测试等方面。

语言能力评估的社会维度

语言能力评估的社会维度

语言能力评估的社会维度社会维度是一个概念,用来描述社会文化的实质。

在讨论语言能力评估时,概念社会维度也是不可忽视的。

它可以帮助人们理解语言能力评估中存在的社会问题。

本文将从语言能力评估的社会维度出发,讨论以下几个方面:首先,语言能力评估如何反映和反应社会结构;其次,语言能力评估如何影响和受到社会偏见的影响;最后,语言能力评估如何反映社会变迁。

首先,语言能力评估反映和反应社会结构。

在某种程度上,语言能力的评估是社会结构的一种反映,因为某些语言能力评估实质上反映了社会结构,某些英语能力考试甚至是设计来测量社会结构的。

例如,英语学习者中对特定社会结构的精确识别及其相应的语言能力。

其次,语言能力评估受到社会偏见的影响。

由于语言能力的评估体系完全取决于当时的社会环境,所以其结果常常受到先入为主的思想和偏见的影响,这也是语言能力评估的重大缺陷之一。

例如,某些英语能力考试包含一些对外国学生不公平的题目,这些题目实质上是暗示外国学生有不如当地学生的能力。

同时,社会也会对语言能力评估产生某种影响,某些语言能力评估体系设计专门用来筛选学生、工作者或者招募者,这表明社会环境对语言能力评估也有一定的影响。

最后,语言能力评估反映社会变迁。

随着时代的变迁,社会也在发生变化,而语言能力评估也受到这种变化的影响。

例如,由于社会的科技进步,计算机相关的技能越来越受到重视,许多英语能力考试也增加了相关的题库,以测试考生的计算机技能。

另外,由于信息的发展,许多国家的英语能力考试也开始专门测试考生对网络信息的认知能力。

总之,语言能力评估反映了当前社会变迁的趋势,这也表明它也是一种受到社会影响的能力。

综上所述,语言能力评估不仅是一种衡量学习者语言能力的工具,它同时也体现了社会结构的影响,受到社会偏见的影响以及社会变迁的影响。

此外,受到社会影响的语言能力评估也存在一定的缺陷,例如偏见、歧视等。

因此,在未来,要实现真正公平、公正的语言能力评估体系,我们需要更多的研究和实践,以实现语言能力评估体系的完善和社会维度的充分考虑。

交际语言测试理论视角下英语专业四级中听力测试的结构效度研究的开题报告

交际语言测试理论视角下英语专业四级中听力测试的结构效度研究的开题报告

交际语言测试理论视角下英语专业四级中听力测试的结构效度研究的开题报告一、研究背景随着全球化进程的加快,语言的交际功能变得越来越重要。

英语文化在全球范围内得到广泛传播和应用,越来越多的人开始学习英语,其中包括很多英语专业的学生。

英语专业四级考试是英语专业学生的重要考试之一,目的是考察英语学习者的英语听力、阅读、写作和翻译能力。

因此,英语专业四级考试中的听力测试具有重要意义。

然而,在英语专业四级考试中,听力测试的结构和效度问题一直备受关注。

听力测试的结构决定了测试质量,而测试效度则是测试结果可靠性和有效性的保证。

在听力测试中,影响听力测试效度的因素有很多,如选材、难度、测试时间、测试类型等等。

因此,对英语专业四级听力测试的结构和效度进行研究具有重要意义。

二、研究目的本研究旨在从交际语言测试理论视角出发,探究英语专业四级中听力测试的结构和效度问题,具体包括以下几个方面:1. 分析英语专业四级中听力测试的测试结构,探究测试元素的配比、难易度和题型的区别等因素对测试结果的影响。

2. 从听力考试的基本要素入手,比如选材、难度、语速、语调、声音质量等多维度探究听力测试的效度问题,分析测试听力的真实度和可靠度。

3. 提出针对性措施,解决测试结构和效度方面存在的问题,提高英语专业四级听力测试的质量。

三、研究方法本研究采用实证研究方法,运用问卷调查、实地访谈、比较分析等多种方法,探究英语专业四级听力测试的结构和效度问题。

主要研究内容包括:听力测试结构的探究、测试难易度与答题正确率的关系、开放式和选择式题型的效度比较、测试时间对学生答题表现的影响以及选材和声音质量等听力测试关键因素对测试效度的影响等。

四、研究意义本研究从交际语言测试理论角度出发,探究英语专业四级中听力测试的结构效度问题,将为英语教学和教育评估提供参考。

研究结果将有助于提高英语专业四级考试的质量和水平,为英语专业学生建设教育体系提供参考,同时也有助于加深我们对听力测试的了解和认识,以便更好地指导教育教学实践。

杨慧中——语言测试的社会学思考

杨慧中——语言测试的社会学思考

2007年11月November2007第30卷第4期Vol.30No.4现代外语(季刊)ModernForeignLanguages(Quarterly)1.引言语言测试经过半个多世纪的发展,已经成为一门独立的学科。

从语言测试发展的历史看,语言测试工作者的研究重点逐步从提高测试信度和改进测试效度发展到关注测试的后效。

近年来,国际语言测试界逐渐把研究的重点转向语言测试的社会应用,即研究语言测试的社会性。

这一发展轨迹反映了语言测试工作者认识的深化。

一项好的语言测试首先本身的专业质量要高,主要是考试的信度和效度要高。

提高信度是语言测试的内部问题,通过采用心理测量学所提供的技术手段,仅凭语言测试工作者本身努力即可解决。

效度问题涉及到考试的对象和用户,它的研究要复杂得多。

效度是一个实证问题,必须靠实验来验证。

大规模语言测试必须开展效度研究,以实据来证明自己的效度,即测量了所要测量的语言能力,这样才能取信于民(Aldersonetal.1995:193)。

关注语言测试对教学的反拨作用是语言测试工作者的本职工作。

作为对教学结果的评估手段,测试自然会对教学产生影响,即产生反拨作用。

反拨作用有正面的,也有负面的。

负面的反拨作用限制学习的深度和广度;从广义来说,作弊、替考、应试培训和模拟试题集泛滥等都可算是考试的负面作用。

语言测试工作者努力探索新的题型、改进考试的内容和形式,对减少考试的负面效应有一定的效果。

但是,教学是一种社会现象,作为教学一部分的考试自然也是一种社会现象。

考试是在特定的社会环境下(socialcontext)发生的。

对考试反拨作用进行深入研究后发现,考试的反拨作用是一个极其复杂的现象,涉及语言测试工作者、教师、学生、家长、政策制定者、用人部门等等,可说是涉及一切与考试有关的人员。

一项考试,尤其是一项大规模、高风险考试,如果不但要求测量准确、而且还要收到良好的反拨作用,那就需要社会各方面的协同努力;认为改进考试对教学的反拨作用(washbackeffectandsocialimpact)只是语言测试的社会学思考*上海交通大学杨惠中广东外语外贸大学桂诗春提要:大规模、高风险考试的设计者有很重的社会责任,因为许多年轻人的未来取决于考试结果。

语言测试的信度和效度及其关系

语言测试的信度和效度及其关系

科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。

其中, 以信度和效度最为重要。

一、语言测试的信度语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。

即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。

信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。

同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。

影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。

试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。

与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。

2. 考试条件不一样。

同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。

3. 监考施策。

不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。

4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。

5. 保密工作做的不好, 泄题事件发生。

6. 评分。

主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。

7. 样品数量太小, 样本不足。

8. 身体及心理状态不好等等, 这些因素都会影响到信度。

因此, 为了提高信度, 我们必须对症下药, 采取各种措施。

《语言测试:社会维度》介绍

《语言测试:社会维度》介绍

作者: 黄大勇[1]
作者机构: [1]四川广汉中国民航飞行学院外语学院,618307
出版物刊名: 外语教学与研究:外国语文双月刊
页码: 158-159页
主题词: 语言测试;社会维度;社会声音;技术指标;技术性问题;责任问题;道德规范;公平问题
摘要:Filer(2000:2)认为测试领域历来有两种声音:技术声音(technical discourse)和社会声音(sociological dis- course)。

前者关注测试本身的质量,如信度、效度、标准等技术指标;后者关注测试在社会中的使用及产生的影响。

Schwandt &
Jang(2004)也讨论了语言测试领域的这两种声音,并指出社会声音在近年越来越大。

这声音来自语言测试领域对许多非技术性问题的探讨。

这些问题包括责任问题(Hamp-Lyons 2000)、道德规范(Da- vies 1997)、公平问题(Kunnan 2000,2003)、。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
— — 社 会 维 度 的产 生 和发 展
2 1 语 言测试 效度 的两个 重要观 点 .
较 早的效 度定义 是 由 K l e y于 12 l 9 7年提 出 的 : 度问题 就 是一项 测 试是 否真 正测 量 了它所要 测 量的 效 东西l 效 度仅仅被 看作 一种 相关 系数 , 3 l 。 因而 可 称之为 “ 单一效 度观 ” C rtn进 一步 明确 了效度 操作 化定 。 ueo 义 : 项测 试分数 在 多大程度上 估计 或预 测了标 准 ( 试 ) 数 。但 这种效 度 观的前 提是能 够 找到适 当的 一 测 分
文献标 志码 : B
文 章编 号 :17 — 1 1 2 0 )2 0 9 — 3 6 1 6 9 (0 9 0 — 0 6 0
1 英语 语 言 测 试 社 会 维 度 的概 念 及 内涵
语言测试 的社 会维度指 语言测试在社会 中的使 用情 况 、 会特征 以及测 试所产生 的社会 影响和 后果【 社 l J 。 语 言测 试 的社会 维 度包括 语 言测 试 的官 方性 和 非官 方性 、 试 的道 德规 范 、 试的 后效 ( 测 测 广义 的 ) 以及测
第 2期
王 立群 : 度 视 阈下 的 英语 语 言 测试 社 会 维度 效
大程 度 上对 教学 产生 了正 面的 影 响 。他 的 后果 效 度概 念 只是 提 出 了测试 对 教学 所 产生 的 正面 影 响 , 没 而 有提 及 测试 对 社会产 生 的 影响 。B c ma ah n和 P l e 把 考 试 后效 纳 入其 考试 有 用性 框 架体 系 [ 该评 价 体 am r 7 1 ,
不 是指 测试本 身 的效度 , 是测 试分 数解 释 的效度 ; 而 分数 解释 的效 度 涉及 社会 的认 识 、 值 和后果 。效 验 价
的对象是 对受 试反应 ( 试分数 )的推论和 解释 , 测 而不 是反应 本 身 。 这一理 论 中首次 包涵 了语 言测试 的社
会 因素 , 为在语 言测试 后效概 念及 其 内涵构建 中提 出社会 维度 的概念 奠定 了基础 。
来 , 出语言测 试 的社会 特征 , 突 改善 语 言测试 的社 会维 度 , 从而 更好 地服 务于 社会 。纵 观语 言测 试理 论 的 发展 , 其社会 维度 是在核 心概念— —效 度研 究层 面上逐 步建 立起来 的 。因此 . 分析 语言 测试 的主要理 论基
础对研 究测 试的社 会维 度理论建 构有 着重 要的意 义 。
概念 效度研 究层 面上 逐步 建 立起 来的 。 因此 , 分析 语 言测试 的效 度理 论基 础 对研 究测试 的社 会 维度理 论 建构 , 重构我 国英语语 言 测试 的社 会 维度有 着重要 的 意义。
关 键 词 :效 度 ; 英语 语 言 测 试 ; 社 会 维 度
中图分类 号 : 4 G2
作为标 准的测 量 。 显然 , A 以 B为标 准 , 若 那么 B又 以什么为 标准 ?难 以解 决 的问题 是 “ 准 ” 身如何 效 标 本 验 ?单一效 度观最 终难 免陷入 循环 论证 。在 2 0世 纪 4 0年代 , 有 学者试 图为 效度 分类 , 试研 究 中出现 就 测
了分类效 度观 。 0世 纪 5 2 0年代 , 随着对 效度认 识 的深入 , 人们 意识 到效度 远非 一个相 关 系数那 么简单 , 对 效 度的 多 角度 研 究产生 了林 林总 总 的效度 。其 中 ,rn ah提 出了关于 效 度理 论 的两个 重要 观点l 效 度 Cobc 5 l :
第 9卷 第 2期 2009 年 6月
南通 纺织 职业技 术学 院学报 ( 合 版 ) 综
J u n lo no gTe te Vo ain lT c n lg le e o r a fNa tn xi c t a e h oo yColg l o
Vo . No2 19. .
系包 括 考试 的信 度 、 念效 度 、 实性 、 互性 、 效 作用 和可 操 作性 。其 中 , 义 的后 效作 用 指测 试 的使 构 真 交 后 广
用 会影 响社 会 、 教育 体 制和 个 人 。因此 , 对 测 试后 效 的研 究上 升 到社 会 层面 上 , 他 明显 体现 了语 言测 试的
试 的其他 社会影 响和 后果 l 2 1 言测试 是在 特定 社会 环境 下 , 。语 以特 定的社 会 组织 为依托 而进 行 的 , 涉到 牵
复杂 的社会 问题 , 别是 有时语 言测 试与社 会公 正 、 会价值 等之 间会 有矛盾 。这 要求 我们思 考如何 解决 特 社 语 言测试 问题 的 同时把 其社会维 度考 虑进 去 。语 言测 试社会 维度 研究就 是将 语言 测试 与社会 问题结 合起
J n 2009 u.
效度视 阈下的英语语言测试社会维度
王 立 群
( 通 纺织 职业 技 术 学 院 , 通 2 6 0 ) 南 南 2 0 7
摘 要 : 言测 试除 了尽 一切 可能保 证 测试 对考 生的语 言 能 力提 供 准 确 、 观 和公 正 的测 量及 对教 学 语 客 有好 的反拨作 用 外 , 还要 确保测试 的 良好社会 维度 。纵 观语 言测试 理论 的发展 , 其社 会 维度理论 是在核 心
22 语言 测试后 效的概 念及 内涵 .
M r w提 出了考试 后果效 度 w s akvl i ) or o ahbc ai t 的概 念[ 认 为评价 一个 考 试的效 度 要看 这个考 试多 dy 6 1 ,
收 稿 日期 :2 0 — 4 0 090 —2
作 者 简 介 :王 立 群 (9 8 )男 , 北衡 水 人 , 通 纺 织 职业 技 术 学 院副 教 授 , 院教 务处 副 处 长 。 16 一 , 河 南 学
相关文档
最新文档