英语测试与试题设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019年5月19日
感谢你的观看
4
根据测量标准进行分类 常模参照考试( norm-referenced test) 将某个学生的成绩与其他学生的成绩 进行比较; 不适合用于平时课堂测验,因为课堂 测验的目的不是把学生分为三六九等。
2019年5月19日
感谢你的观看
5
标准参照考试(criterion-referenced test) 将考生的成绩与事先制定的标准进行对 比,不受其他考生成绩的影响。即用一 个既定标准/尺度来衡量学生的学习结果。
2019年5月19日
感谢你的观看
23
7. 仅就形式而言,几个选项都应该能分别 放入题干之中。
Someone who designs houses is a _____ . A. designer B. builder C. architect (改题干) Someone who designs houses is a(n) ____. (改选项) A. a designer B. a builder C. an architect
2019年5月19日 感谢你的观看 28
11. 题干语言问题
2006年 辽宁卷第29题: I think it is necessary for my 19-year-old son to have his own mobile phone, for I sometimes want to make sure if he home for dinner. A. come B. comes C. has come D.will come [D]
2019年5月19日
感谢你的观看
6
根据测试形式进分类:
直接考试(direct test) 以适当的形式直接考查学生的某种知识 和技能,口语、写作等考试,学生需要 直接运用与考试内容相关的语言技能。
2019年5月19日
wenku.baidu.com
感谢你的观看
7
间接考试(indirect test) 用间接的方式考查知识和技能的掌握情 况,如果用选择题的形式来考查学生识 别作文中的错误的能力,并据此来判断 学生的写作能力。
2019年5月19日 感谢你的观看 12
(二)信度(Reliability) 信度是指测试的结果是否稳定、可靠。如果 让一个考生把同一份试卷做两次,如果两次 结果相近,那么测试具有较高的信度。 主观题的信度尤其重要。由于评分者的信度 难以保证,主观题的信度也往往难以保证。
2019年5月19日
Look! That house is on fire. Let’s call _____ quickly. A. 119 B. 114 C. 120 D. 121
A:Please don’t make any noise in the reading-room. B:____. A.Sorry,I won't B.Sorry,I can't C.Yes, I won't 。 D.OK,I didn't 不要在阅览室制造噪音.现在我们不清楚B是否已经制造 了噪音。如果他已经制造了噪音,那么他应该说Sorry,而 不能说Sorry,I won’t。如果他没有制造噪音,他应该说 Sure (OK),I won't。因此,不管他是否已经制造了噪音, 他都不会说出四个选项中的任何一个。
请看江西卷的两道高考试题
Scientists are convinced_____ the positive effect of laughter____physical and mental health. A.of, at B.by,in C.of,on D.on,at Many people have come to realise that they should go on______balanced diet and make____room in their day for exercise A.a,/ B.the ,a C.the ,the D./,a
2019年5月19日 感谢你的观看 25
Did you borrow the bike Jim? A. with B. from C. to D. for 这道题的正确答案是B,但选项D也是合 理的。用选项B时,句子的意思是“你从Jim那 里借的自行车吗?”;用选项D时,句子的意思 是“你为Jim借的自行车吗?”
英语测试与试题设计
赣州市教研室 2019 xx
2019年5月19日
感谢你的观看
1
科学前语言测试 离散考点语言测试 交际性语言测试
2019年5月19日
感谢你的观看
2
一、英语测试的目的
甄别(Screening):鉴别优劣 评估(Evaluation):验收 诊断(Diagnostic):发现问题
2019年5月19日 感谢你的观看 24
8. 设计单项选择题选项时,首先需要 注意保证答案的唯一性。如果出现多种 可能的答案,试题就缺乏信度。
例39 If I’m free, I’d like to spend _______ holiday in the country. A. a two-day B. two days’ C. twoday D. two days
2019年5月19日 感谢你的观看 9
三、英语测试的设计原理
(一)测试的效度(Validity) 效度是指测试是否有效地考查了希望考查 的内容。 就语言水平测试而言,效度直接关系到测试 结果能否准确反映考生的语言能力。 考试内容、考试形式与命题技术都直接关系 到测试的效度。
2019年5月19日 感谢你的观看 10
2019年5月19日 感谢你的观看 16
四、英语试题设计技巧
(一)单项选择题的命题技术
1. 不能出错题!!!!
2019年5月19日
感谢你的观看
17
2.要科学、合理地设计考点 例:W: How old is your sister, John? M: She is ten years old, and I’m thirteen. Question: How old is John? A. He’s seven B. He’s ten C. He’s thirteen.
2019年5月19日 感谢你的观看 30
2019年5月19日
感谢你的观看
21
各选项的形式(如词性 )、难度也应基本一 致,如: A. going B. on C. by D. for
2019年5月19日
感谢你的观看
22
6.要保证试题的答案没有争议 例:You were in Shanghai last week, _______ you? A. were B. weren’t C. did D. didn’t
2019年5月19日 感谢你的观看 15
四、编制细目表
考试命题双向细目表是一种考查目标(能力) 和考查内容之间的列联表。制作考试命题双 向细目表,是命题工作的一个重要环节。双 向细目表可以使命题工作避免盲目性而具有 计划性;使命题者明确测验的目标,把握试 题的比例与份量,提高命题的效率和质量。 同时,它对于审查试题的效度也有重要的指 导意义。 (表格见桌面)
该题题干语言不妥, 因为make sure后一般跟陈述句,而 很少跟表示疑问的结构,在一些国家语料库中也没查到 make sure if…结构。建议改为to check if he will…;改为 29 2019年5want 月19日 to know whether/if… 感谢你的观看
12. 测试偏颇性问题
2019年5月19日
感谢你的观看
26
9 选项设计不应背离考查目标。
The woman _________ to the same shop every week. A. go B. goes C. have gone D. am going
2019年5月19日
感谢你的观看
27
10. 尽量避免挖双空或多空
2019年5月19日 感谢你的观看 18
3.试题设计要具有严密的科学性和严谨性 例: The three months of spring in China are ________. A. December, January and February B. March, April and May C. January, February and March D. February, March and April
感谢你的观看
13
(三)难度(facility value ) 也就是正确答案前面的百分数就是难度系 数,也就是易度值。 计算公式: P=X/K (说明:P:难度系 数 X:该主观题的平均得分 K:该题 的满分)
2019年5月19日
感谢你的观看
14
(四) 区分指数(discrimination index) 区分度分客观题区分指数和主观题的区分指数: 客观题区分度 D=PH-PL 最高得分组的难度系数为 0.75;最低得分组的难度系数为0.43 区分度为0.32 呈正态分布。 主观题区分度 D=(XH –XL)/n(H-L) 说明 D:区分度 ;PH: 高分组的难度系数(取参考人 数的27%);PL: 低分组的难度系数(取参考人数 的27%) XH: 高分组得分总数,XL:低分组得分总 数 n参考人数的25%;H为该项最高得分;L为该 项最低得分。 如:书面表达区分度的计算方法:参加考试时1658人, 取其25%那就是415人。前415人书面表达总得分为 8719分;后415人的总得分为5812分。书面表达最高 位满分25分。最低得分为4分。经过计算区分度为 0.33。
2019年5月19日
感谢你的观看
3
二、英语测试的类型
根据测试目的进行分类: 入学考试(admissions test) 分班考试(placement test) 诊断考试(diagnostic test) 阶段测试(progress test) 成就测试(achievement test)
如果通过让学生写单词的音标来考查学生的 语音能力,那么测试就缺乏效度。能写音 标不等于能正确发音。 现在中考中经常使用的间接口语考试的效度 也不高。
2019年5月19日
感谢你的观看
11
如果不讲究命题技术,试题也会缺乏效度: Which of the following does paper burn in? A. CO2 B. N2 C. O2 D. H2
2019年5月19日
感谢你的观看
8
根据测试内容进行分类:
分项考试(discrete-point test) 分项考试指每道题只考查一个语言知识 点或一个微观语言技能,如辨音题、和 单项选择的语法题等。 综合考试(integrative test) 考查学生综合运用语言的能力,一道题 涉及多项语言知识和语言技能,如听写、 完形填空等。
2019年5月19日
感谢你的观看
19
4.选项本身在语法上应该是正确的 例:He _____ to the USA many times. A. has been B. has went C. had go D. had went
2019年5月19日
感谢你的观看
20
5.选项长度要适当、均衡。 正确答案与其它干扰项的外在形 式、长度应基本一致,不应有过分 醒目的特征。
测量中的偏颇性(test bias)问题早在1911年就 引起了学者的关注 (Eels et al., 1951)。测试偏颇 性影响测试效度和信度,最终影响测试公平。 2006年福建卷第24题: Ladies and gentlemen, please fasten your seat belts. The plane ________. A. takes off B. is taking off C. has taken off D. took off 该题考点是时态。该题涉及考生乘飞机旅行方面的 背景知识:飞机起飞或降落时乘务员会提醒乘客 系好安全带。该题对没有飞行经历的考生显失公 平。