浅谈语言测试试题设计的几个标准

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浅谈语言测试试题设计的几个标准

大学时学过语言测试这门课,现结合本次培训所学内容,肤浅的谈一谈在进行语言测试时试题设计的几个标准:

(一)效度(test validity)

效度就是测量的有效性,也就是看考试是否考查了想要考查的内容。语言测试能测出预定要测量的事物的程度,或能够引起预报作用的程度。“语言测试的效度,亦称有效性,指测试所考的,是否就是所要考的,或者说,在多大程度上,是考了目的所要考的”(李筱菊)。如:用作文考查写作能力就比用多项选择题有效。用听写考查听力,评分不当,考试有效性就会降低。有效性反映在测试的不同方面,验证有效性要通过多种途径收集数据。如:内容有效(考试内容的代表性,选择内容应广泛)、结构有效(试卷结构的合理性,兼顾语言内容和技能的各个方面)、共时有效(现行考试与以往成绩的关系,与教师掌握的情况相比较)、预测有效(考试成绩与学生以后发展的关系)、答题有效(学生答题情况:是否认真,是否作弊)等。

(二)信度(reliability)

信度(reliability)(又称一致性,consistency),指语言测试的测量结果一致性即考试结果准确、稳定、可靠的程度。要求由不同的评卷人阅卷,所得分数大致相同;同一个评卷人在不同时间阅卷,分数也大致相同。Henning列举了五项威胁测试信度的因素:(1)学习者的波动,如:临时的心理或生理的变化;(2)评分的波动,如:评分员之间、每个评分员自身前后之间的差异;(3)施测过程中的波动,如:外界的干扰、不同的指令;(4)测试的特征,如:测试时间的长短、试题的难易度、区分度;(5)与作答相关的错误,如:猜测因素等。Bachman和Palmer认为:“完全消除不一致性是不可能的”(It is impossible to eliminate inconsistencies entirely)。然而,如果我们遵循某些原则,确实可以最大程度的减少这些威胁。为此,Hughes提出了一些建议:(1)抽取足够的样本;(2)不给受试过多的自由;(3)不设含糊的题目;(4)提供清楚明了的指令;(5)确保试卷卷面设计完善;(6)施考条件一致,无干扰;(7)尽可能采用评分客观的题型;(8)使受试之间的比较尽可能直接;(9)提供详细的评分细则;(10)培训评分员;(11)评分前确定统一的可接受的答案和评分标准;(12)通过考号而非姓名来辨别受试;(13)采用多人独立评分等。

信度和效度的关系:

信度是效度的必要条件信度不是效度的充分条件

→有效度必有信度→有信度不一定有效度

→信度低效度一定低→信度高效度不一定高

→效度高信度一定高→效度低信度不一定低

总之,对于考试来说,信度与效度都是必不可少的:信度是保证效度的基础;撇开效度只谈信度是没有实际意义的。

(三)区分度(discrimination)

区分的目的主要是为了比较。在设计语言测试试题时,要根据考试性质,注意难易题目数量上的比例。难题太多会挫伤学生的学习积极性;简单题太多则测试的效度和信度降低;这些都不利于区分学生之间的能力差距,也不利于试后准确的反馈评估。

(四)实用性(practicality)

即可行性。一项测试只有在其人力、物力、时间许可的范围内才具可行性。试题便于使用,试卷印制清晰醒目,措辞简洁、避免拼法错误或遗漏,尽量少涉及各种器材设备。因为设备不一定处处都有,而且质量也不完全一样。可行性主要与实施测试的方式和在多大程度上是否要建立和采用某项测试有关。

(五)影响(back-wash effect)

即后效作用,指语言测试对语言教学和学生学习的作用和影响。积极影响:发现问题,积极督促。消极影响:考什么,学什么;不考就不学。好的外语测试应对受测者和教育者起正确引导和教育作用。如:国家教育部希望提高学生外语的听说能力和语言运用能力,希望学校方面多花些时间在听力技能教学上,决定在高考中引进听力测试,由此产生的后效作用是老师和学生在听力技能方面的重视和投入以及提高。可以看出,这种测试对全面提高学生的语言能力有促进作用,具有教育性。但是,也有一些测试或试题设计的不错,区分度很高,也便于实施,但是,使用不当,对教学会产生副作用,如:外语测试中的多项选择题。由于使用过多,加之部分教师误导,不少同学产生误解,认为学外语就是做多项选择题,多做多项选择题就能学好外语。或夸大测试的功能,把测试成绩绝对化。用模拟考试、做试题冲击教学,替代讲课和练习,把生动活泼的外语教学变成枯燥的应试技巧训练,都是测试负面的或有害的后效作用。

(六)真实性(authenticity)

切实把握语言测试的真实性原则。B. J. Carrol曾指出:“在讨论语言测试时,真实性问题永远是一个重要方面”。语言测试的真实性,是指与现实生活的相似,即考生在考试中要完成的任务就是在现实生活中可能要解决的事情。

(七)交互性(interactiveness)

强调考生与测试任务之间的交际关系,如在完成某一测试任务时,考生语言能力的哪些方面参与了该任务的活动、参与程度如何。在谈到测试的真实性时,Carrol认为:“考生所承担的任务应该是现实生活中的,相互作用的交际活动”。这就意味着测试不应是单纯就语言知识和技能进行选择、填空、判断对错等,而应是学生在平时或将来的生活、学习中可能碰到的,需要解决的问题。要做到这一点,教师在命制模块测试题时,应尽量使用真实、地道、典型的当代外语素材;应加强语境的设计,尽可能提供真实的语言运用场景,而不是去迁就教材涉及的语言点和内容。

相关文档
最新文档