测试类型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 人才选拔
• 考试=能 力
组织单位 目的 考察方式 测量方式 评分方式 考分解释方式
学校考试V.S.社会性考试 学校考试 教育测试 服务于教学 教研组命题

• 社会性考试 • 无教学大纲限制 • 正规考纲及流程
– – – – 标准化水平测试 公共英语等级考 托福 剑桥商务英语
初中毕业升学 考 高考 专业四八级 课业考试


标准化考试是采用系统科学的程序对考试 进行编写与实施,考试的每个阶段特别是 试卷设计、测试、考试实施、建立常模等 阶段都有统一严格的标准,并且对误差进 行严格控制的考试。

标准化考试一般具备如下七个特征:(1)权威性。标 准化考试必须由权威性的机构负责组织和主持,根据一 定法令来实施,并受法律的保护,结果受到国家和公众 的承认。(2)稳定性。定期举行,保持严格稳定的标 准,不同时间举行的同一类考试的分数具有可比性。 (3)社会性,面向社会,对社会负责,为社会提供鉴 定和选拔人才的尺度。(4)广泛性。规模大,跨地区。 (5)科学性。根据现代教育测量学的理论,对试题的 难度、区分度、信度、效度等考试质量指标进行科学的 统计分析,严格控制测量误差,使考试达到预期的指标。 (6)建有常模。建立一个可以对考生分数进行比较的 常模,并定期对常模进行修改。(7)系统性。有三支 专业化队伍紧密配合:行政管理队伍、命题队伍和电脑 统计分析队伍
考核的范围不能很大,考核的内容必须有代表性,而 且每个考核内容必须有适当的题量,这样才能对考生 在某一方面的长处与问题作出可靠的推断,并对造成 的原因作出合理的解释。
学能考试主要预测学生学习外语的潜在能 力。 学能考试却是通过测定母语及其他能力来预 测考生的外语潜能。 学能考试从分析影响学生外语学习的因素着 手,根据这些因素确定相应的测试方法,然 后依据测试结果预测一个人学习外语的潜力。 因此,学能考试的命题依据是外语学习理论 和外语习得理论,
从下列名词中任选四个,用自己的话例释。 主观测试 间接测试 分立式测试 社会性测试 常模参照测试 标准模参照测试
Brain Storm… 功能: Mid-term • 信息反馈 Quiz • 调节; Entrance Test • 激励 CET4… • 成绩评定 TOFEL • 教学效果
在这类考试中我们关心的是学生是否达到 了教学目标的要求,取得了预期的学习成 果。 通过考试,我们希望了解:(1) 有多少学生 达到教学目标所规定的要求,可以进入下 一阶段或下一门课程的学习?(2) 每个学生 应得到的等级。



成绩考试主要用于了解学生在经过较长一段时 间学习后,对教学大纲中所规定的课程要求 (包括知识和技能)掌握的情况,或者说取得的 成绩。 成绩考试应以教学大纲作为命题依据。它测试 的是学生掌握教学目标所规定的语言知识与技 能的掌握程度。在一个大纲多本的情况,对考 试成绩解释的唯一依据就是大纲。成绩考试可 以作为升留级、授予文凭、决定毕业与否的依 据。
尽管综合测试测定的是考生对多种语言技 能和语言成分的掌握情况,但它仍属于 ________测试,与现实生活中的语言行为没 有直接联系。 出国人员选拔考试属于_______测试。 间接 水平

将人的语言能力视为一个整体,对考生的 多种能力的多个方面同时进行的测试称为 __________。 A. 分离式测试 B. 交际性测试 C. 综合性测试 D. 水平测试

这里解释学生考试结果的参照指标是考生的平均成 绩,即所谓的常模。相对评价

标准参照考试或称目标参照考试,以事先确定 的知识和技能目标作为参照标准,解释考生成 绩的一种考试。它是通过考生与外在的标准进 行比较解释考生分数的一种方法。

绝对评价。
常模参照考试(NRT)
主要用途 考生间进行比较 测试重点 个体差异



某校采用交际教学法后,学生的语言运用能力 有了很大提高,但在传统的考试中成绩并不 十分突出,试从效度概念对此现象加以分析 学生的语言能力提高后,考试成绩并没有提 高,原因在于考试的效度有问题,或者说是考 试运用不当。学生提高的是语言能力,而传统 考试测试的是语言知识,因此学生能力的提高 无法从考试中反映出来。从效度的角度看,传 统考试对于测试语言运用能力而言,其效度比 较低。改进的方法是采用交际性测试对学生的 语言能力进行评估
信度 :复测可靠性、内部一致性、参照法可靠 性、阅卷人可靠 效度:构念效度 、内容效度、预测效度、表面 效度、方法效度 真实性:考试实用性 互动性:考试对学习方法的影响 冲击力:影响 可行性:经济、评分可操作性、施测可行性、分 数解释可行性
(一)选择题 (二)配伍 (三)填空与填图 (四)词语替换 (五)句型转换 (六)完形填空 (七)阅读理解 (八)书面表达
Biblioteka Baidu
语言能力成套测试”(Language Aptitude Battery, LAB 皮姆斯勒 (Paul· Pinsleur)认为对一个人的外语学习产生影响的有三 大因素:言语智能 (verbal intelligence)、学习动机 (motivation)和语 音能力 (auditory ability);并从六个方面预测考生的外语学习潜能: (1) 外语以外其他学科的平均分,(2) 外语学习的兴趣,(3) 母语词 汇,(4) 语言分析,(5) 声音辨认,(6)音形联系。前两项由考生填 写,后四项采用考试形式,要求考生在规定的38分钟内完成。 “现代语言能力测试”(Modern Language Aptitude Test ,MLAT 卡罗尔和萨庞(carroll and sapon)等人认为一个人的语言潜能取 决于下列因素:(1)语言编码能力——将听到的语言材料进行“编 码”,间隔一段时间后重新辨认或记忆的能力;(2)语法敏感性— —根据上下文对单词在句中功能的判断力;(3)机械记忆能力; (4)语言归纳能力。卡罗尔用5个分测验对上四种能力进行测定。 完整版包括所有5个分测验,规定在70分钟内完成。简约版只包括 3个分测验,规定在30分钟内完成。
编班考试、外语竞赛、高考、四六级、托福
高中会考、学校期末考试、市民英语等级考 试 甄别、分类、选拔 教育性、社会性 分班、诊断、学业、水平 常模参照、标准参照
(一)选择题 (二)配伍 (三)填空与填图 (四)词语替换 (五)句型转换 (六)完形填空 (七)阅读理解 (八)书面表达 直接、间接 分立式、综合式 主观性、客观性

例如英语写作、口试等就属于主观型考试。

客观型考试是指考试的评分不受阅卷人员 主观因素影响,任何阅卷人评分的结果都 一样,甚至可以用机器阅卷的一类考试。

例如大量使用多项选择题的考试就属于客观型考试。
常模参照测试 标准模参照测试


常模参照考试是将某一学生的行为(通常用学 生的考试成绩表示)与参加同一次考试或同一 类考试的其他学生的行为作比较。


海姆斯提出的交际能力包括四个方面,即 形式正确、合理可行、______ 和实际使用。 A. 应对灵活 B. 交谈流畅 C. 行文规范 D. 内 容得体

分离式测试认为语言能力是可分的,这一 观点受______的影响。
A.心理语言学 B.社会语言学C.结 构主义语言学 D.应用语言学

下列测试形式往往为____所采用。 A. 分离式测试 B. 综合性测试 C. 传统测试 D. 交际性测试 The lady over there is one of the teachers who _______ to Australia. A. has gone B. have gone C. has been D. have been
预测效度对于______具有特别重要的意义。 A. 毕业考 B. 高考 C. 期末考试 D. 市民等级考

在口试中采用分解评分和多人评分的目的 是为了提高口试_________。 A. 信度 B. 效度 C. 可行性 D. 积极的反拨作用 B A

效度高的考试,其成绩能真实地代表学生 的交际能力。 会考不必以内容效度为主要的质量指标。 只要选择信度高的英语考试,就能测出学生 的实际英语水平。


用于测试学生的语言能力与水平 它以考生今后为了胜任某项任务而必须在语言熟练 程度上要达到水平作为考试的命题依据。 不以某一特定任务为测试目的的水平考试,仍有自 己详细的考核细目,和考核要求。


(proficiency) 具有更普遍、更一般的含义。例如,英国 的第一证书考试(First Certificate Examination)和剑桥 大学的水平考试(Proficiency Examination)。 考试的机构一般独立于教学单位,因此更公正。 人们可以利用这类考试对不同国家、不同地区、不同 学校的学生情况进行公正的比较。


A. 学能测试 B. 综合性测试 C. 诊断测试 D. 交际性测试 You were applying to a university and needed a letter of recommendation. You went to a professor, who was also your friend, and said: A. “I’d appreciate it if you could write a letter of recommendation for me.” B. “I want to ask you to write a letter of recommendation for me.” C. “I wonder if you could write a letter recommendation me.” D. “Hey, give me recommendation letter.” (评分标准:A 正确,得2分;B语法正确,不够得体,得1分;C 较得体,但语言 有误,得1分;D 语言有误,内容不得体,0 分。)
分立式测试 综合式测试 直接性测试 间接性测试


每个题目只考察一个语言点。

在一个单选题中考两个或多个语言点是不科学 的

用一种测试方式同时测量学生综合运用多 项语言能力。

听写
主观测试 客观测试


主观型考试是指阅卷人员的主观因素如语 言水平、对评分标准的理解、阅卷时的心 情等对考试的分数会产生影响的一类考试。
信度(稳定) :
复测可靠性、内部一致性、 参照法可靠性、阅卷人可靠
效度(所测内容):
构念效度 、内容效度、 预测效度、表面效度、方法效度
真实性:考试实用性 互动性:考试对学习方法的影响 冲击力:影响 可行性:经济、评分可操作性、 施测可行性、分数解释可行性


如果在一次考试中,大量使用下列试题以测试 学生的口语能力,它的最大问题是 _______ 得 不到保证。 A. 信度 B. 效度 C. 难度 D. 区分度 口语:从A、B、C、D中选一组正确的排列顺 序,使所给的语句成为一段文理通顺的话语。 ① Fine, thank you. And you· ② Hi, Lucy! How are you toda③ I’m fine, too y A. ①②③ B. ②①③ C. ②③① D. ③②①
分级测试 诊断性测试 学业\成绩测试 水平测试

• 学校测试? • 社会性测试?
学生应有知识—补课 学生应学知识—调整教学计划



教师根据本人教学需要自行命题,测试重点是 了解外语教与学的问题,考试成绩作为诊断教 学进展情况之用,而不作为衡量学生水平的尺 度,故称之诊断考试或形成性考试。 考试内容的选择
标准参照考试(CRT)
学习掌握程度 具体的学习情况 内容应尽量详细
内容覆盖 覆盖面广
试题的区分 说明学生学习水平 试题选择 (分数间的差异要大) 难度与区分度 应剔除十分容易的题目。 学生在群体中 评价成绩 相对位置 预先制定的绝对标准

常模参照考试主要用于
,例如,就属于常模参照考试。标准参照 考试常用于各类证书考试,如、大学英语 四、六级考试等都属于这类考试
相关文档
最新文档