2第一章语言测试的性质,目的及其类别概述
应用语言学语言测试理论知识点整理
应用语言学语言测试理论知识点整理在应用语言学领域,语言测试理论是一个重要的分支,它对于评估语言学习者的语言能力、指导教学实践以及推动语言教育的发展都具有关键意义。
以下将对应用语言学语言测试理论的一些重要知识点进行整理。
一、语言测试的定义与目的语言测试是对语言学习者的语言能力进行测量和评估的一种手段。
其主要目的包括:1、为教育决策提供依据,例如确定学生的升级、留级或毕业。
2、评估教学效果,帮助教师了解教学方法的有效性和学生的学习进展。
3、为学生提供反馈,让他们了解自己的语言水平和不足之处,以便进一步改进学习策略。
二、语言测试的类型1、水平测试(Proficiency Test)旨在测量考生对某种语言的整体掌握程度,不考虑考生之前的学习经历或特定的课程内容。
常见的水平测试如雅思(IELTS)、托福(TOEFL)等。
2、成绩测试(Achievement Test)侧重于检测考生在特定课程或学习阶段所掌握的语言知识和技能,与教学内容紧密相关。
比如学校的期末考试、单元测验等。
3、诊断测试(Diagnostic Test)主要用于发现考生在语言学习中存在的具体问题和薄弱环节,以便为后续的教学和学习提供针对性的指导。
4、潜能测试(Aptitude Test)预测考生学习语言的潜力和能力,而非对现有语言水平的评估。
三、语言测试的质量评估标准1、效度(Validity)指测试能够准确测量出其所要测量的语言能力或语言知识的程度。
效度分为内容效度、结构效度、预测效度等。
内容效度:测试内容是否涵盖了所要考查的语言技能和知识点。
结构效度:测试结果是否与语言能力的理论结构相一致。
预测效度:测试成绩能否有效地预测考生在未来语言学习或实际语言运用中的表现。
2、信度(Reliability)反映测试结果的稳定性和一致性。
包括重测信度、复本信度、分半信度等。
重测信度:对同一批考生在不同时间进行相同测试,两次测试结果的相关性。
复本信度:使用两份内容相似但不完全相同的试卷对同一批考生进行测试,两次结果的相关性。
测试的目的和类别
2)综合性测试 指将各种汉语知识和语言技能综合在一份试卷或一个试题中,以 全面地考查汉语学习者的语言能力的一种测试。 优点:可以全面考查汉语学习者的语言能力,尤其是综合运用汉语 的能力。 不足:评分标准不好掌握,实施过程费时费力。
3、判卷评分方式
(1)主观性测试 指试题的答案比较灵活,可能不止一个,评分时 需要评卷人对考生的做大情况做出主观性判断的测试。 比如:留学生的写作测试、口语测试。 优点:便于深度性的汉语考查,命题方便,题量少,耗时短;利于防止 猜测得分。 不足:考查范围受到限制;评阅工作量大;评分结果难以达到高度 一致。 (2)客观性测试 指试题有固定的标准答案,评分客观可靠,不受 评阅人主观因素影响的测试。 比如:多项选择题、判断题。
2、测试命题方式
(1)分离性测试 指将汉语分离成语音、词汇、语法、汉字等各个构成要素,把言 语技能分离成听、说、读、写等分项技能,逐一进行测试。 优点:考查汉语项目和分项技能多,测试成绩容易进行量化分析, 测试结果能准确反映学生的具体困难,便于教师对症下药,有针 对性地帮助学生。 不足:孤立地考查汉语学习者的某一项汉语知识或技能,难以反映 他综合运用汉语的水平,特别是汉语交际水平。
测试的目的和类别
—史聪101120212
一、测试的目的 对外汉语测试的目的,概括的讲,就是为考查
汉语作为第二语言的应试者是否具备完成某项特 定任务所需的汉语能力。 不同类型的测试有着不同的测试目的,比如 潜能测试的目的,在于预测汉语作为第二语言 的学习者是否具备学习汉语的潜在素质,即看他 是否具备学习汉语的潜力和天赋。 成绩测试的目的,在于衡量学习者对某一汉语 课程内容的掌握程度。 水平测试的目的,则是考查学习者的汉语能力 是否达到了规定的标准和要求。
汉语语言测试方法1
已有的学能测试:
① 卡罗尔和萨彭:1959. 现代语言学能测试
② 卡罗尔和萨彭:1967. 初级现代语言学能测试 ③ 平斯勒:1966. 语言学能考试 开发语言学能测试的意义(1)为语言教学解决问题;
论文写作式的短文写作,翻译统一的客观
评估标准,测试结果完全凭考官的主观判断来决定。
缺乏科学性、系统性,是语言测试发展的雏形时期。
2、心理测量—结构主义时期(科学时期)(1950s-1970s)
(1)理论体系:以结构主义语言学为理论基础;
心理学的行为主义理论以及心理测量学的原则和方法对语言测
4、语言测试的定义:
语言测试是根据一定的评估目的,以抽样方 式通过有限试题来诱导出受试者的言语行为,然 后借助于定量描述来推断受试者所掌握的语言知 识和能力。
5、测试的任务:
设法有效地诱导出体现受试者语言知识和能 力的言语行为,并对这种行为进行量化和说明解 释。
6、影响测试科学性的因素:
(1)间接性。语言知识和能力无法直接测量, 只能通过诱导出的言语行为来测量。测试提供一 种条件或刺激,使掌握了某种语言规则或语言结 构的受试者能立即使用出来,而没掌握的则使用 不出来。制造这样的条件——命题, 是进行测试
(4)偶然性。测试的命题、受试者的临场发挥以及评 卷等过程中总有一些偶然性的因素。特别是学校的一 般性考试,常出现命题不合理、受试者猜中试题,或 受试者自身原因,临场未能正常发挥,使具有相同语 言能力的人言语表现出了差异。
二、语言测试的环节
1、规划设计阶段 2、操作实施阶段 3、阅卷评分 4、后效研究
2第一章语言测试的性质,目的及其类别
15
诊断测试和成绩测试
诊断测试可以用来考查单个的语言项目(如语序),也 可以是综合性的,其目的是为了改进教学,调整教学 计划,进行个别指导。
成绩测试是回顾以前,水平测试主要是展望未来,同 时也注意过去,而潜能测试只是预见未来。
16
3.按考试方式来分:
分离式测试(discrete-point test):把知识和能力分解 为若干小的单位,如集中考查语言的某一方面,或考 查学生单方面的技能。 综合性测试(integrative test):听写、完形填空、写 作、翻译。
在外语教学领域我们感兴趣的是学生的语言能力而学生的语言能力属于人的心理特征是无法直接测量的但是人的心理活动语言能力属于人的心理特征是无法直接测量的但是人的心理活动会在人的具体活动和行为中体现出来所以只能通过测量其外显行为会在人的具体活动和行为中体现出来所以只能通过测量其外显行为或外在表现特征来推论一个学生语言能力的高低或外在表现特征来推论一个学生语言能力的高低指派数字或符号
语言测试及方法
李君丽
● 湖南涉外经济学院外国语学院 ● 2017.02.16
一、语言测试的性质、目的
作为老师,几乎天天和测试打交道。如: 讲新课之前,要抽出几分钟的时间复习一 下上一课学过的内容,或者听写单词或者 听写句子等; 每学完一课书,要检查学生对本课掌握的 情况; 学期中间,一般要进行期中考试,期末有 期末考试,等等。 因此,教学离不开测试。
11
1.2 语言测试的目的
具体用途:
1.诊断及反馈 2 . 筛选或选拨 3 .编班 4 .科研或调查 ......
12
1.3 语言测试的类别
语言测试教案1
一语言测试的性质1 测量语言测试是一种测量1.1测量的要素:测度、数字系统、测量单位、零点、手段●测度测量的对象所具有的可测量的属性。
如,方桌可以测量其长度、宽度、高度;西瓜可以测量其大小或重量。
●数字系统测量事物所得的结果必须用某个数字来表示,可以是正数、负数、零,也可以是小数。
●测量单位测量对象的性质不同,测量所得的数字往往用不同的单位来表示。
测量长度可以用米、公分等做单位,测量重量则用千克、克等做单位,商品的价格用元、角等做单位。
●零点测量事物计算数量的起点(不等于“没有”或“无”)。
两条不知起点的道路是不能测量长短的,也是不能比较长短的。
●手段测量事物所凭借的工具、方法。
测量长度用尺子(“一箭之地”),测量重量用天平(“重如泰山”),测量语言水平用什么?以上诸要素中,测度是本质、根本,是所有的测量所必需的。
1.2四种量表(scale):称名量表、顺序量表、等距量表、比率量表●称名量表(nominal scale)把测量对象分成不同的类别。
●顺序量表(ordinal scale)不仅把测量对象分成不同的类别,而且要将不同的对象进行排序,建立起大小、高低的顺序关系。
●等距量表(interval scale)不仅把测量对象分成不同的类别、进行排序,而且表示出不同对象之间距离的大小,距离用一定的数量单位表示,还须要规定一个相对的零点。
●比率量表(ratio scale)比率量表与其他量表的最大区别是它具有绝对的零点。
测量重量、长度、面积或体积所得到的量表就是比率量表。
四种量表性质的比较:property nominal ordinal interval ratio Distinctiveness ++++Ordering -+++Equal interval --++Absolute zero point ---+2 语言测试的对象语言测试所测的是人的语言能力,它表现为人使用(包括接受和产出)语言时的心理活动及其表现。
语言测试类型知识点总结
语言测试类型知识点总结语言测试的种类有很多,比如笔试、口试、听力测试、阅读测试等。
在进行语言测试时,需要根据测试的目的选择合适的测试方法和评分标准。
不同的语言测试项目需要测试不同的语言技能,比如词汇、语法、听力、口语、阅读、写作等。
下面我们将逐一介绍这些语言测试中的知识点。
一、词汇词汇是语言的基本组成部分,它是语言运用的基础。
在语言测试中,词汇测试通常包括词义、词性、词组、短语、语境等方面的考察。
测试者需要掌握词汇的拼写、发音、用法和搭配等方面的知识。
1、词义:词义是词汇的基本含义,它是词汇测试的重点内容之一。
测试者需要掌握词汇的基本含义,了解常用词汇的多种含义和用法。
2、词性:词性是词汇的重要属性,它决定了词汇的用法和搭配。
测试者需要掌握各种词性的词汇,理解它们在语言中的作用和用法。
3、词组和短语:词组和短语是语言中常用的固定搭配,它们在语言测试中也是重点内容之一。
测试者需要掌握常用的词组和短语,了解它们的意义和用法。
4、语境:语境是词汇使用的重要依据,它可以帮助理解词汇的含义和用法。
测试者需要在不同的语境中运用词汇,理解它们的具体含义和用法。
二、语法语法是语言的基本规则,它决定了语言的结构和用法。
在语言测试中,语法通常包括句子结构、时态、语态、语气、语序、主谓一致、形容词和副词的比较级和最高级、连词、代词等方面的考察。
1、句子结构:句子结构是语法的基本内容之一,它是语言表达的基本单位。
测试者需要掌握不同类型的句子结构,了解它们的构成和用法。
2、时态:时态是表示动作发生时间的一种语法形式,它在语言测试中也是重点内容之一。
测试者需要掌握各种时态的用法,理解它们的差异和应用场合。
3、语态:语态是表示句子主语和谓语之间关系的一种语法形式,它在语言测试中也是重点内容之一。
测试者需要掌握各种语态的用法,了解它们在句子中的作用和区别。
4、语气:语气是表示说话者的语气和情绪的一种语法形式,它在语言测试中也是重点内容之一。
语言测试主要内容资料讲解
语言测试主要内容考试信度:考分的一致性。
考试效度:考试达到其预期测试意图的程度。
交互性:指在考试所设计的任务中学生的参与程度。
直接考试:学生被要求直接运用被试的技能或能力。
间接考试:测试那些相关技能、以达到评估能力的目的。
诊断考试:此类考试旨在了解学生在某个阶段中学习上的长处与短处,其最终目的是为了给教师提供教学效果或质量方面的信息。
整体评分法:把作文视作一完整的篇章,根据对其总体印象打分。
原始分数:未经处理或未加权重的分数。
考试:用来获取某些行为的方法,其目的是从这些行为中推断出个人具有的某些特征。
1.根据考试的方式,考试的分类:1直接考试(①侧重考试形式的真实性②便于从总体上考查产出性技能,如口语能力、写作能力、翻译能力等③从命题人员的角度出发,直接考试具有比较明确的测试目标)2间接考试(①不强调考试形式上的真实性,即考试形式无需与实际语用环境相一致②由于不受语用环境的限制,所选择测试的技能可以更具有代表性和概括性③间接考试可选用多项选择题型,可以提高考试信度。
)2.常用的口试形式及特点:①朗读:学生事先在规定时间里浏览朗读材料,然后朗读。
材料的长度视考试难度或学生水平而定,可以是单句,也可以是段落。
但是,朗读作为口试形式只测试学生的语音语调等,无法检查整体口语能力。
②看图说话:给学生一幅或多幅图片,让他们描绘或叙述图中所发生的事件。
③简短说话:是一种弹性口试形式,即在难度上有伸缩性,可以是一个三言两语的形式,也可以是一个时间较长的形式。
④对话:在一个假设情景中进行,学生之间或学生与考官之间根据情景要求进行对话。
对话者既要运用一些常用会话技能,同时还要运用解决沟通问题的技能。
⑤小组讨论:学生们就一个话题展开交流,一般控制在三四个人左右。
⑥面试型口试:基本上采取问答形式,但又不同于简单的一问一答形式。
考官通过各种提问技巧,从多个层面来观察学生的口语能力。
3.如何评阅作文,特点?⑴整体评分法①节省评阅时间②阅卷人员注重作文的整体质量③它的问题主要表现在阅卷人员对标准的理解和掌握上,以及所定档次标准瑜现实作文之间的吻合性。
测试的目的和类别
汉语作为第二语言的应试者是否具备完成某项特 定任务所需的汉语能力。 不同类型的测试有着不同的测试目的,比如 潜能测试的目的,在于预测汉语作为第二语言 的学习者是否具备学习汉语的潜在素质,即看他 是否具备学习汉语的潜力和天赋。 成绩测试的目的,在于衡量学习者对某一汉语 课程内容的掌握程度。 水平测试的目的,则是考查学习者的汉语能力 是否达到了规定的标准和要求。
二、测试的类别
不同的分类标准有: 1、测试目的 2、测试命题方式 3、判卷评分方式 4、反应成绩的方式 其中最主要的划分标准是测试目的。
1、测试目的
(1)成绩测试 成绩测试是考查学生学习学习某一汉语课程一段时间后,对所学 课程内容掌握程度的测试。其突出特点是测试内容不超过教学大 纲、教学计划及所用教材范围,教什么,考什么。 (2)水平测试 水平测试的内容和范围不受某一课程教学大纲、教学计划化和使 用教材的限制,也不考虑不同学习者学习时间、学习地点和学习 程度的不同。它关心的是学习者现有的汉语熟练程度能否保证他 在未来完成特定的汉语交际任务。 测试内容广泛,涉及汉语的语音、词汇。语法、汉字等各语言要 素和汉语的听、说、读、写等各项技能。
2)综合性测试 指将各种汉语知识和语言技能综合在一份试卷或一个试题中,以 全面地考查汉语学习者的语言能力的一种测试。 优点:可以全面考查汉语学习者的语言能力,尤其是综合运用汉语 的能力。 不足:评分标准不好掌握,实施过程费时费力。
3、判卷评分方式
(1)主观性测试 指试题的答案比较灵活,可能不止一个,评分时 需要评卷人对考生的做大情况做出主观性判断的测试。 比如:留学生的写作测试、口语测试。 优点:便于深度性的汉语考查,命题方便,题量少,耗时短;利于防止 猜测得分。 不足:考查范围受到限制;评阅工作量大;评分结果难以达到高度 一致。 (2)客观性测试 指试题有固定的标准答案,评分客观可靠,不受 评阅人主观因素影响的测试。 比如:多项选择题、判断题。
语言测试与理论
2) A test used to determine whether a student‟s English is good enough to follow a course of study at a British university.
contrast, do not have any occupation or course of study in mind. For them the concept of proficiency is more general. e.g. Cambridge examinations (First Certification Examination and Proficiency Examination); The Oxford EFL examinations (Preliminary and Higher)
The purpose of language testing is to measure the language competence of a candidate.
3. Kinds of test and testing Kinds of test: Proficiency tests 水平测试 Achievement tests 成绩测试 Diagnostic tests 诊断测试 Placement tests 编班测试
Progress achievement tests, as their name suggests, are intended to measure the progress that students are making.
Hale Waihona Puke Since ‘progress’ is towards the achievement of course objectives, these tests too should relate to objectives.
第二讲语言测讲义验基本概念
语言测验的质量标准(二)
• 难易度(facility value) • 区分度 (discrimination index)
▪ 标准化 (standardized test): 标准化测验的特点有三个:
第一,有固定的、标准的内容,其内容不因测验有不同 版本而改变;
第二,施测和评分按标准程序进行,每次测验的考务和 评分程序都一样,不能随意改变;
不高 低
不大 小
常模参照和标准参照的区别
┏━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃
┃常模参照
┃标准参照┃Fra bibliotek┣━━━━━━╋━━━━━━━━━━━━╋━━━━━━━━━━━━┫
┃测验的性质 ┃ 一般语言能力或水平 ┃ 特定的语言点
┃
┠──────╂────────────╂────────────┨
(P&P) (CBT) ✓ 主观测验/客观测验 (就评分方法而言) ✓ 分立式测验(discrete-point) / 综合式测验
(integrative) ✓ 速度测验(speed test)/难度测验(power test) ✓ 高风险测验(high-stake test )/ 低风险测验
(low-stake test )
┃测验的目的 ┃ 区分所有被试的能力 ┃ 看被试掌握了多少教学 ┃
┃
┃
┃ 内容
┃
┠──────╂────────────╂────────────┨
┃测验的内容 ┃ 被试不知道或很少知道 ┃ 被试完全知道
┃
┗━━━━━━┻━━━━━━━━━━━━┻━━━━━━━━━━━━┛
标准正态分布
语言测验的质量标准(一)
语言测试
潜能测试、诊断测试 潜能测试、
潜能测试主要是测试受试者是否具备将来学习语 潜能测试主要是测试受试者是否具备将来学习语 言的天赋,设计的题目往往多一些, 言的天赋,设计的题目往往多一些,目的是通过 考查受试者模仿、记忆等方面的能力, 考查受试者模仿、记忆等方面的能力,判断其学 习语言的潜力。 习语言的潜力。 诊断测试的目的与成绩测试相反, 诊断测试的目的与成绩测试相反,成绩测试所关 的目的与成绩测试相反 注的是学习成功的程度, 注的是学习成功的程度,而诊断测试关注的是失 败的程度,即学习者在哪些方面犯了错误, 败的程度,即学习者在哪些方面犯了错误,并借 此找出补救的办法。 此找出补救的办法。
8
常模参照性测试
常模是指一群类型相同的人在一类考试中的成绩, 常模是指一群类型相同的人在一类考试中的成绩,这个 是指一群类型相同的人在一类考试中的成绩 常模一般用该考试的平均分与标准差来表示。 常模一般用该考试的平均分与标准差来表示。 常模参照性测试是指参照某一个常模来对某考生的分数 常模参照性测试是指参照某一个常模来对某考生的分数 作出解释。 作出解释。实际上是结合其他考生的得分情况来反映一 个考生的分数,说明他在这群人当中的位置。 个考生的分数,说明他在这群人当中的位置。如: 某次HSK成绩的平均分是 分 标准差为66, 某次HSK成绩的平均分是512分,标准差为66,某考生 成绩的平均分是512 在这次考试中得了578, 在这次考试中得了578,比平均分正好多出一个单位的 即一个标准差的分数(512+66=578)。 )。按照正态分 值,即一个标准差的分数(512+66=578)。按照正态分 布的原理, 84.13%的考生成绩低于得 分的考生 的考生成绩低于得578分的考生。 布的原理,有84.13%的考生成绩低于得578分的考生。 这种测试有利于选拔学生。 这种测试有利于选拔学生。
《语言测试》课程教学大纲
《语言测试》课程教案大纲总学时:学分:理论学时:实验学时:面向专业:商务英语课程代码:先开课程:基础英语课程性质:必修课执笔人:韩小敏审定人:于文杰、王竹青、王玉环第一部分:理论教案部分一、说明1、课程的性质、地位和任务本课程系为商务英语三年级学生第六学期所开设的一门主干课程,其教案目的在于系统地讲授英语专业四级考试相关的知识,帮助学生顺利通过英语专业四级考试。
本课程根据英语专业四级考试的大纲要求,进行相关训练和模拟测试,全面检查学生是否达到四级考试大纲所规定的各项要求。
在教案中,通过讲解英语专业四级考试的相关题型以及各个题型的答题技巧,详细解读历年真题和模拟试卷,全面提高学生运用各项英语基本技能的能力,如听写文章环节中,学生的理解和书写能力、拼写熟练程度以及标点符号的正确运用;听力理解环节中,学生能听懂英文材料和英语新闻,理解中心大意,抓住主要论点或情节,并根据所听材料进行揣测和分析的能力;完形填空环节中,学生理解短文的意思和结构,补全短文的能力;语法及词汇环节中,学生对语法结构和词语用法的把握能力;阅读理解环节中,学生能掌握所读材料的主旨和大意、了解说明主旨和大意的事实和细节、既理解字面的意思,也能根据所读材料进行一定的判断和推论、既理解个别句子的意义,也理解上下文的逻辑关系的能力;写作环节中,学生能准确理解题目要求,清楚表达思想,严密论证,基本不犯语言错误的能力等等。
教案过程中,在提高学生的综合能力的同时,也要注意学生的各项单项技能以及应试能力和技巧的提高,从而帮助学生顺利通过英语专业四级考试。
、课程教案和教改基本要求语言测试课程的目的在于帮助学生提高应试能力,因此教案材料以历年真题和相关模拟试卷为主,教案方式为学生课下做练习、模拟测试,老师课堂上讲解应试技巧和模拟试卷解读。
课程的基本要求:本课程要求讲解深透,融会贯通,理论结合实践,对英语专业四级考试要求有全面的领会和掌握,使学生的综合英语水平和应试能力都能有所提高。
语言测试及它的方法 复习大纲 内容全面,尊重原创!!
2. 词汇测试的效度、信度、区分度,主要依据词汇的代表性和档次的划分。
3. 词汇测试的题型:配对型、取代型、填空型。
词的使用牵涉三方面的因素:意义、搭配、语法。
4. 语法测试常见题型:多项选择、识别错误、填空、句型转换、配对。
5. 测试阅读能力的方法:正误判断、完成句子、简答题、组句成段、多项选择、完形填空。
多项选择的命题要求:语言正确、地道、得体、简洁;避免试题的偏颇性;选择项与题干的相容性问题;尽可能保持选择项的相似性;题干或者干扰项不要为答题提供线索;避免出现轨迹题。
4. 填充题:测量的是语言的运用能力,而不是辨认能力,测试效度高。综合填充题型又称完形填空。
3. 制定考试细目表:包括考试内容所占比重、题型、题量、考试时间分配。
第三代:交际语言测试,Bachmann,CLA
2. Bachman 的语言测试模式
特点:对于语言能力的认识更加全面深刻;指出了测试工具与目标语言语境的关系。
构成:语言能力;策略能力;心理生理机制
语言能力:语言组织能力(语法能力,语篇能力);语言使用能力(语义能力,功能能力,社会语言能力)
策略能力:评估策略;确定目标策略;制定计划策略;执行计划策略
3. 口语测试的评分方法:分析法、综合法。
第十一章 如何设计写作测试
1. 写作测试的最大优点是效度高,它不仅能考察考生的输出性技能,同时也能考察考生的接受性技能,同时能测试语言的各个层次和范畴,对教学有很好的反拨作用。缺点是信度低,因为它属于主观测试,评分无法客观化。
2. 写作测试的评分方法:机械法、印象法、分析法。
曲线越抖说明分数越集中,越缓说明分数越分散。
专业的语言测试
专业的语言测试语言是人类交流的重要工具,准确、流畅地运用语言可以有效传达信息,增进交流。
在越来越多的场景中,需要对个体的语言能力进行评估和测试,以便确定其专业素养和适用领域。
专业的语言测试旨在通过各种方式评估个体的语言能力,为其提供有针对性的培训和职业规划建议。
一、语言测试的背景和意义随着全球化的发展和交流的增多,语言的作用变得愈加重要。
不同国家和地区拥有不同的正式语言和方言,而在一个多元文化的环境中,多语言的运用成为趋势。
对于专业人士而言,具备良好的语言表达能力尤为重要,无论是在国内还是国际舞台上。
语言测试的目的是为了准确评估个体的语言能力,发现其所需加强的方面,并为其提供相应的培训和进一步的发展。
语言测试既可以作为选拔人才的手段,也可以作为个人评估和学习的工具。
在教育、职业发展和国际交流等方面,语言测试的意义不可忽视。
二、专业的语言测试方法专业的语言测试方法包括口语测试、听力测试、阅读测试和写作测试等多种形式,结合具体要求进行综合评估。
口语测试是通过对个体进行实际口头交流的方式,评估其表达能力和语音语调等方面。
可以通过模拟真实情境,考察个体的应对能力和沟通能力。
听力测试旨在评估个体对于语言的听觉理解能力。
可以通过听录音材料并回答问题的形式,检测个体对于语音、语调、语速的理解程度。
阅读测试是通过提供文章、新闻、广告等文本,评估个体对于语言的理解和阅读能力。
可以考察个体对于语法、词汇、篇章结构的理解程度,以及获取信息和推理判断的能力。
写作测试是通过要求个体书写文章、摘要、作文等形式,评估其语言组织和表达能力。
可以考察个体的字词选择、句子结构、篇章连贯等方面的能力。
三、专业的语言测试应用领域专业的语言测试可以应用于多个领域,以满足不同群体的需求。
教育领域是其中一个主要的应用领域。
学校、教育机构等需要对学生或者教师进行语言能力的评估,以确定适合的课程安排和培训需求。
通过语言测试,可以对学生的阅读、写作、口语等能力进行评估,并为其提供个性化的学习计划。
第一讲语言测试概说
Such bodily reaction might conceivably help 9 the effects of psychological stress. Anyway, the act or laughing probably does 11 one classical theory of emotion, our feelings are partially rooted 12 physical reactions. It was argued at the end of 19th century that humans do not cry 13 they are sad but they become sad when the tears begins to flow
Although sadness also 14 tears ,evidence suggests that emotions can flow 15 muscular responses. In an experiment published in 1988, social psychologist Fritz Strack of the University of wiirzburg in Germany asked volunteers to 16 a pen fight with their teeth-thereby creating an artificial smile-or with their lips, which would produce a(n) 17 expression. Those forced to exercise their enthusiastically to funny cartoons than did those whose months were contracted in a frown, 19 that expression may influence emotions rather than just the other way around 20 ,the physical act of laughter could improve mood
《语言测验基本概念》完整版资料
┃性 质 ┃┃ 被试比较┃ 分布
┃ 预先┃制定的内容比较
┃┃
┠──────╂─┠────────────╂───────────╂──────────╂───────────────┨────┨
┃
┃┃检验分的布目的 ┃ 区分一切被试的才┃干
┃ 看被试掌握了多少教学 ┃ ┃
┃内容效度〔cont┃┠┃e┃n─检t ─v验常─a的l─id─内模i─ty容╂〕参──┃ ┃─照─被─试──不─知─道──或─很╂少─┃知──道标───准┃┃──参─内被─容试─照完─┨全知道
和评分程序都一样,不能随意改动; • 第三,都经过实验,在进展了大量的阅历性研讨之后
第二讲:言语检验的根本概念
❖言语检验的作用和目的 ❖言语检验的种类 ❖言语检验的质量规范
言语检验的作用和目的
• 作用:科学地丈量出学习者的言语才干 • 目的: • 选拔 • 诊断 • 评价 • 预测 • 研讨
检验的种类
• 按用途〔目的〕划分
• 才干检验〔或程度检验〕proficiency test、
言语检验的作用和目的是什么?
干 作用:科学地丈量出学习者的言语才干
难易度〔facility value〕 ┣━━━━━━╋━━━━━━━━━━━━╋━━━━━━━━━━━━┫
• 按照参照系统划分 想象效度(construct validity)
• 常模参照检验(norm-referenced test):所谓 常模〔norm〕是指规范化样本中检验的分数 分布
东西。 • 内容效度〔content validity〕 • 效标关联效度〔criterion-related validity 〕 • 共时效度(concurrent validity) • 预测效度(predictive validity) • 想象效度(construct validity) • 外表效度(face validity)
语言测试与评估
语言测试与评估第一节语言测验的基本原理一、语言测验的作用和目的作用:科学地测量出学习者的语言能力。
目的:我们使用测量工具时要达到的目的。
1、选拔2、诊断3、评估4、研究二、怎样用科学方法测量语言能力1、测量的定义:测量是给人或事物的某种属性确定数和量的过程。
2、测量的四个要素:测度(测量的对象、可测量的属性)、测量单位、数字(实数)系统、零点(0)。
3、四种测量水平和四种量表称名测量——称名量表顺序测量——顺序量表等距测量——等距量表比率测量——比率量表4、测量对象及其性质显性隐性5、自我测量工具非自我测量工具6、测量中心:以主体为中心以刺激为中心以反映为中心测量水平和测量中心语言测验的中心7、怎样使不可测的东西变为可测的——虚构测度(可测量的属性)三、测验的种类1、按用途分水平测验——能力测验或熟练程度测验语言水平指学习者能够使用目的语完成听课、做翻译、经商、旅游等目的的语言能力。
如汉语水平考试(HSK)。
其特点是不以教材为基础,没有明确的内容范围,一般是标准化测验。
成绩测验——以教材为依据的测验,不一定是标准化测验。
能力倾向测验——教学前的测验,了解被试是否具有学习语言的潜在能力。
分班测验——教学前的测验,了解被试的语言水平等级,以确定进高、中、初级班。
诊断测验——教学中的测验,为了发现问题,改进教学。
2、按测验方式或评分方式分主观测验和客观测验:在评分过程中需要评分员自己作出判断的,就是主观测验;评分时不需要评分员做出判断的就是客观测验。
分立式测验和综合式测验笔试和口试纸笔测验和计算机辅助测验3、测验的标准化第一,有固定的、标准的内容第二,施测和评分按标准程序进行第三,题目都经过预测第二节规划、设计和实施一、规划设计第一节确定目标团体第二节确定测验目的教育、选拔人才、改进教学第三节确定测验内容教学内容、非教学内容第四节确定测验方式和卷面构成题型:客观题、主观题题量:考虑信度和时间题型题量分布表汉语水平考试的题量和时间分布第五节确定评分方式和分数体系客观评分、主观评分主观题的评分标准和分值二、操作和实施一、编写测验说明和题目细则一个简单的测试说明2、训练命题员3、聘请专家组就有关问题进行咨询三、施测、信度、效度及后效研究第三节客观题的编写与修改一、客观题的类型一、多项选择题1.1多项选择题的原则1.1.1每一个多项选择题只能有一个正确答案。
语言测试的基本理论
词汇修辞结构控制功能对语域差异的语感
词法教诲功能对自然地道语言的语感
句法想象功能对文化含义或比喻的理解
1.2.3Language measurementrefers to the meaningful and appropriate interpretations thatEnglishteachers make on the basis of a given test scores. As we know that learners’language ability is psychological behaviors, and is difficult to measure. Therefore, we have to use somequantitative scores or criteria to measure learners’language production.
d.HavingTest 2to know whether the learners have arrived at the expected learning targets
e.Graduation (if the learners have arrivedatthe targets, they will be allowed to graduate, otherwisecertainremedial measures should be added to help learners to reach the expected targetsbefore graduation.
1.3
l
1
1.3.4
a.Enrolment of new students
语言测试的功能与分类
-3 -2 -1 标准正态分布
x 0
。
1 2 3
Z=
x 0 x 5 x 5 不同平均值的正态分布
T 10 Z 50
x - x 78 - 70 = = 1.6 s 5
0.5
Z ?
GRE = 100 Z + 500 IQ = 15Z + 100
1
x = 70
信息 尺度 定类 定序 定距 定比 类别 √ √ √ √
信息类型 顺序 间距 √ √ √
比例
√ √
√
分布的集中趋势(central tendency)
算术平均数(Mean)
1 X = å xi N i=1
N
1 x = å xi n i =1
n
X 为总体平均数, x
为样本平均数,
xi
N 为总体容量,n 为样本容量, 为第 i 次观测值
拒绝区间 α/2 p/2
两类错误
决 策 H0为真 H0为假
拒绝H0
接受H0
弃真(Type I error)
决策正确
决策正确
纳伪(Type II error)
• 弃真的概率为显著性水平α,弃真也称α错误。由于α为一个很 小的概率,所以犯弃真错误的可能性很小。 • 纳伪的概率用β表示,纳伪也称β错误。 • “拒绝才有说服力”:H0通常为大概率事件,对于大概率事件, 通过逻辑推理即可得出结论而没有必要进行假设检验,所以假 设检验中的H0通常是用来被拒绝的,并且弃真的可能性很小。 • 小概率原理:若能证实小概率事件(H1),证明一般情况下不 可能发生的事情确实发生了,那就意味假设中的“小概率”事 实上很可能不是小概率,H1的发生肯定是有原因的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3
测量这一定义包含三个要素
1) 事物及其属性。
这是测量的对象或目标。上面提到的对桌子的高度进行测量,属于对 物体进行测量,其属性——高度,是可以观察到的,可以进行客观测 量的。在外语教学领域,我们感兴趣的是学生的语言能力,而学生的 语言能力属于人的心理特征,是无法直接测量的,但是人的心理活动 会在人的具体活动和行为中体现出来,所以只能通过测量其外显行为 或外在表现特征来推论一个学生语言能力的高低
语言测试及方法
李君丽
● 湖南涉外经济学院外国语学院 ● 2017.02.16
一、语言测试的性质、目的
作为老师,几乎天天和测试打交道。如: 讲新课之前,要抽出几分钟的时间复习一 下上一课学过的内容,或者听写单词或者 听写句子等; 每学完一课书,要检查学生对本课掌握的 情况; 学期中间,一般要进行期中考试,期末有 期末考试,等等。 因此,教学离不开测试。
4
3) 法则
法则是指测量所依据的规则和方法,是测量的关键。法则不好或不可 靠,得到的测量结果就会出偏差,失去测量的意义。简单来说,尺子 不准,测量的结果就无法使人信服。对客观世界的物体进行测量时, 由于有公认的测量法则或尺度,如测量物体的高度、重量等;一般不 会出现大的偏差。而对人的某些特性(心理特征)进行测量时,则往 往会出现较大的偏差。举例来讲,有几个评委对某学生的英语口语进 行评定。评委A认为一个人的口语要好,必须发音准确,而该学生的 发音好,所以他给打了个5分。评委B认为流利性最能体现一个人的 口语水平,该同学尽管发音不错,但流利性差一些,所以她给他3分。 同一名学生,让不同的评委去打分,成绩出现了偏差。这也很自然, 原因是他们没有按照一个评定口语成绩的统一法则(rules)去给这名 学生打分,结果造成了偏差。这个例子提醒我们,在对人的某些心理 特征,如口语表达能力、阅读理解能力等等进行测量时,首先要制定 一个便于操作的,稳定的法则或标准。这样得到的测量结果才可靠, 才具有可比性。
1.1 几个基本概念
1.测量 (Measurement) 2.考试(Test) 3. 评价( Evaluation )
1.测量。 什么是测量? Stevens(195)认为,“广义而言,测量(measurement) 就是根据法则赋予事物数量。”也就是说,按照一定的规则给事物的 属性指派数字或符号的过程就是测量。这是迄今为止公认的测量定义。 举例来讲,要测量一下桌子的高度,我们可以拿尺子来量一量,看 看它有多高。尺子是人们根据一定的法则制定的量具,利用它就可以 把事物的属性,即桌子的高度用数字表示出来,如,0.75米。这种测 量属于客观测量,因为它基本上不受观察者的主观判断的影响。
2) 指派数字或符号。
所谓指派数字或符号,就是用数字或符号来代表某一事物或事物的某 一属性的量。如张三在本次阅读考试中得了87分,李四得了92分,我 们说李四比张三多考了5分。数字本身没有意义,只是一种符号。我 我们用它来代表考生的阅读成绩,这时它就变成了量化的数,可以对 其进行解释和分析。在一定的条件下,还可以对数据进行运算从而对 事物的属性进行推测。
8
测量,测试和评价的关系?
评价 1 测量
2
测试 3 4
5
9
测量,测试和评价的关系?
源自1.我们在对某教育目标(或学生的行为)作出评价时不一定用到测试或 测量(如面积1所示),这种评价属于质量评价,或叫定性评价。 2.如指出学生在学习方面存在的问题。有时在作出评价时只需测量,而 无需测试(如面积2所示),对学生的口头表达能力定出级别就属于这 种性质的评价。 3.如果要检查学生学习的进步情况,通常就要对学生实施测试,这又是 另一种性质的评价,即只通过测试对学生的成绩作出评价(如面积3所 示)。 4.许多情况下,测试只是作为一种科研的工具或手段,而不是用来作出 评价(如面积4所示), 5.在外语教学、第二语言习得研究领域,我们经常拿水平测试作为研究 的工具。不用测试便可进行测量的情况(如面积5所示)
5
2.测试 测试(test)又称测验。
不同的心理学家对此下的定义不同。Anastasi(1982)认为,“测试实 质上是对行为样本所做的客观的标准化的测量。”这个定义是人们公 认的最权威的定义,它包含以下三个基本要素:
1) 行为样本
语言测试的目的是要测量受试者的语言能力。上面提到,语言能力 是无形的,如何测量?只能测量它的有形表现,这里所说的有形表 现,是指语言表现,如说出来的话,写出来的句子,对测试题目所 做的各种反应等等、这些行为,都是无形的语言能力的有形表现, 用心理学术语叫“表征”(manifestation)。所谓行为样本,是指对语 言能力表现行为的有效的抽样。我们知道,一个人的语言能力的表 现行为会有各种各样的形式,测试时不可能也没有必要把它的全部 表现行为都测到,只能选取一部分有代表性的抽样进行测量,然后 据此对受试者的语言能力作出推测。
7
3.评价
Weiss(1972)认为,“评价(evaluation)是指为作出某 种决策而收集资料,并对资料进行分析,作出解释的系统 过程。”与测量、测试相比,评价的含义更广、综合性更 强。Bachman(1990)指出,决策的正确与否,一方面取 决与决策者本身的能力,另一方面则取决于收集到的信息 的质量。在其它条件等同的情况下,如果收集到的信息越 可靠,相关性越强,那么,作出正确决策的可能性就越大。 所以说,评价的一个很重要的方面就是要获得可靠的、相 关的信息。在谈到评价与测量及测试的关系时,Bachman 指出,在对个体(学生)作出评价时,我们可以从质量和 数量两个方面进行描述,或只描述其中一个方面。所谓质 量方面的描述是指对学生的行为作出定性的描述,如 某 某学生的口头表达能力优秀,书面表达能力优等; 数量方面的描 述则是指某次测验的分数等。
6
2 ) 客观的测量 所谓客观的测量是指测量的标准是否符合实际。对于一项 测试的客观性程度可以从这么几个方面去评价:⑴ 测试 题目的难易度和区分度如何;⑵ 测试结果的可靠性程度 如何?⑶ 测试结果的有效性如何?这几项指标是衡量一 项测试质量的重要指标。 3) 标准化的测量 标准化的测量是指在测试题目的编制、测试的实施、记分 以及对分数的解释等方面有一套严密的系统的程序。只有 这样,测试才有统一的标准,对不同人的测量结果才有可 比性。凡是不标准化的测量,都没有可比性。