语言测试的信度和效度及其关系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION
我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。
其中, 以信度和效度最为重要。
一、语言测试的信度
语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。
即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。
信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。
同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。
影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。
试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。
与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。
2. 考试条件不一样。
同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。
3. 监考施策。
不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。
4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。
5. 保密工作做的不好, 泄题事件发生。
6. 评分。
主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。
7. 样品数量太小, 样本不足。
8. 身体及心理状态不好等等, 这些因素都会影响到信度。
因此, 为了提高信度, 我们必须对症下药, 采取各种措施。
例如:提供统一规范的考试环境、规范监考、题目必须做到明了易懂等等。
通常, 用来检测信度最常用的有三种方法:1. 考后复测法。
在考试后再让学生做同一套试卷, 如果几次考试的结果是一致的, 这份试卷就是有信度的。
但是在实际操作过程中, 学生在不断的学习提高, 而且记忆因素也会影响复测的结果,因此用这一方法很难检测考试的信度。
2. 平行测试法。
设计试卷时, 设计两份难度一样的试卷, 在不同的时间给学生做, 如果结果一致, 则有效。
但是, 在设计试卷时我们无法确信两套试卷在难度及内容上是否完全相同,因此操作起来很困难。
这种方法常用在补考试题的设计中。
3. 分半法。
设计一套试题让学生做, 然后把结果分为奇数和偶数题进行分析评判, 并算出它们之间的相关性。
二、语言测试的效度
效度, 即有效性, 是指试题是否考了出题者想考的内容或多大程度上考了出题者想考的内容。
效度是语言测试的最重要的一个指标, 或者说是语言测试的基本出发点, 效度不高的测试是没有意义的。
效度可分为以下五种:
1. 表面效度。
表面效度就是说, 一套试卷看起来是否合适, 像不像一套试卷。
具有表面效度的测试容易引起人的兴趣。
Alan Davies 曾说, 表面信度是可以达到的, 但却不是必要的, 表面的但却又是有用的。
他可以让别人相信试卷是有效的。
2. 内容效度。
内容效度是指是否符合大纲的要求, 是否与测试目的有关。
例如:老师教了一个学期想看看学生对于所教内容掌握得如何, 但是在选题时, 所出的题目与学生学的内容无关, 则这套试卷没内容效度。
在有内容效度的测试中考查的语言要素和技能都能有所体现。
成绩测试和诊断测试尤其要注意符合教学内容。
3. 同期效度。
同期效度就是一次测试的结果与另一次时间相近的有效测试的结果相比较,或同教师对学生的评估相比较而得出的系数。
4. 预测效度。
它是指试卷结果是否, 或者在多大程度上可以预测将来的考试成绩。
5. 结构效度。
即从理论上说, 试卷的各个部分是否出的有道理。
结构效度测试是说一套测试要以一定的语言学习理论为依据。
Alan Davies 在论述语言测试的信度时说,信度的种类与运用有关。
例如:成绩考试既要表面效度又要内容效度; 能力测试要有表面效度、结构效度和内容效度特别依靠内容效度; 水平测试必须要有表面效度、预测效度和同期效度。
语言测试的种类不同, 对各种效度的要求也就不同。
语言潜能测试多基于某种语言行为理论和语言学习理论, 因此重视编制效度。
水平测试强调共时效度和预示效度。
成绩测试和诊断测试要受教学大纲的限制, 因此首先要看内容效度。
提高效度的常用方法有:明确考试的目的、决定与目的相反的考试内容、决定考试的方法以及增加考试的信度四种。
三、信度和效度的关系
通常, 我们把信度和效度看成是不同的, 但是却在测试中两者又是具有相互联系的特征。
尽管效度是最重要的特征, 但是信度却是效度必不可少的条件。
但在涉及到测试的方法时, 两者的差异就变的模糊了。
Campbell , Lyle F. Bachman 和 Fiske 都曾对信度和效度的关系做过经典的论述。
Lyle F. Bachman 认为:在研究影响分数的因素时, 信度和效度是互为补充的两个方面。
信度回答的是引起考试结果不一致的原因有多少是由测量误差所引起的; 然而, 效度则是找出考试结果中那些导致有效的不一致的因素, 即考试结果有多少是由考生的某种特殊语言能力的程度而引起的。
因此, 我们可以说信度是考查考试结果哪些是由想考的内容以外的因素引起的, 效度则是看考试结果的差异哪些是由语言能力所引起的。
信度和效度有密切的联系, 但它们的关系是单方面的。
效度是信度的前提, 但有信度的试卷可能是高效度的, 也可能是效度较低的, 即效度较高不能保证信度也一定较高。
一项测试有信度 , 它的效度有可能高 , 也有可能低; 但是如果一项测试没有信度, 则这次测试必然是无效的。
信度差效度就差, 但效度差不一定信度就差。
信度是效度必不可少的条件, 试卷如果没有信度根本不可能对测试进行(下转第 214页
语言测试的信度和效度及其关系
曹桂花
(孝感学院外国语学院湖北孝感 432000
【摘要】语言测试是对语言教学的评价。
通过对语言知识或语言技能及语言能力的测试, 老师可以了解教学效果, 了解到学生对知识的掌握程度, 看到他们的进步与不足, 有利于教学的调整。
要达到这个目的, 就必须有好的试卷, 我们一般从信度、效度、区分度、实用性、全面性、公正性及后期效应来对试卷进行评价。
本文讨论了其中极其重要的两个标准信度和效度以及它们之间的关系。
【关键词】语言测试; 信度; 效度
The relationship between validity and reliability of language testing
Cao Gui-hua
(school of foreign language, Xiaogan University
【 Abstract 】 Language testing is a way to value the language teaching. From language testing, the teachers can know whether the students master what they have taught, the students ’ weaknesses and strengths and improvement, which is helpful to the language teaching. To achieve this purpose a well-designed paper is needed. Usually, we think good qualities of good test include:validity, reliability, discrimination, practicality, and backwash effect. This paper is mainly validity and reliability and the relationship of these two.
【 Key words 】 language testing ; validity ; and reliability
○ 高校讲坛○
182
科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION
(上接第 182页有效的解释。
例如:我们希望对学生进行一次期中测试, 检查一下学生半学期以来对所学知
识的掌握程度。
假如试卷本身设计得不合理, 有些题目好学生不会做而基础较差的学生却做得出来, 或者由于外界的条件较差, 非常吵闹, 气温很高, 或者评卷人的主
观评卷等, 都会影响测试的信度, 那么的测试结果就根本达不到检测学生的目的, 因为评判的条件没有达到, 此次测试就是无效的了, 也无从判断试卷本身的效度。
只有我们确信测试是有效的了之后, 对效度做出判断才是有意义的。
在确信了测试是有效的之后, 我们才可能从内容、结构共时、预测和表面等几个方面来判断测试
是否达到了考试的目的,即是否考了想考内容。
又如, 我们想了解学生的写作能力, 可是给他们考的题型却是多项选择题、听力和阅读, 根本没有设计写作的题型。
这样的考试虽然是有效的, 但却偏离了考试的初衷, 因此不能很好的检测学生的写
作能力, 因此此次考试无效的。
反之, 我们确信试卷的效度很低, 即没考想考的内容, 那么我们说其信度可能高也可能低, 因为影响信度的因素主要是我们上文提到, 与
效度没有多大关系。
需要指出的是, 高效度和高信度是测试者的目标, 但是这只是一种理想, 一项测试既有高信度, 又有高效度是不可能的。
四、结论
语言测试的信度及效率问题一直是语言测试专家关注的问题, 也是教师所关心的。
了解了测试中的信度和效度这两个最重要的标准及其关系后, 试卷的设计者在设计试卷时一定要注意试题的本身的科学性, 紧扣考试的目的; 而监考者在测试的
过程中也应尽量减少来自于外界的影响测试的效度和信度的因素,以期测试能更好的服务于教学。
【参考文献】
[1]李筱菊 . 语言测试科学与艺术 [M]. 湖南教育出版社 ,1997.
[2]刘润清, 韩宝成 . 语言测试和它的方法 [M]. 外研社 ,2000.
[3]Davies, Alan. 1990. Principles of Language Testing . Oxford:Basil Blackwell.
[4]Bachman, Lyle F. 1990. Fundamental Consideration in Language Testing . Oxford University Press.
[5]Bachman, L. F. &Adrian S. Palmer . 1996. Language Testing in Practice. Oxford University Press.
作者简介:曹桂花(1979— , 女, 湖北荆州人, 孝感学院外国语学院讲师, 英语语言文学硕士。
[责任编辑:张新雷]科
科
好的生活方式和能积极地参加体育锻炼。
国家鼓励、扶持社会组织或者个人兴办老年福利院、敬老院、老年公寓、老年医疗康复中心和老年文化体育活动场所等设施。
更需要大量专业的社会体育的组织者和引路人。
2.5.3奥运会的推动作用
奥林匹克主义追求的是“ 高水平竞技体育与群众体育高度的结合” 。
回顾历史, 我们会发现每一届奥运会的举办国都极尽全力将本国的竞技水平推到了极致。
他们之间的不同之处也许就在于有的国家不但收获了金牌, 并且借主办奥运会之良机成功地推动了群众体育的发展, 提高了全民身体素质。
毋庸置疑, 2008年的北京奥运会, 我们的竞技体育一定会再创新高, 那么北京奥运会我们的群众体育将收获些什么昵 ? 我们如何充分利用北京奥运会这样千载良机, 把全民身体素质、健康水平提到一个新的更高层次呢? 1964年日本成功地举办了东京奥运会, 1988年韩国也成功地举办了汉城奥运会。
在举办过奥运会后, 日、韩的大众体育都得到迅速发展。
如今, 他们的大众体育都已形成规模, 其体育人口的比例、国民体质状况、人均体育消费额在全世界尤其是亚洲位居前列。
我国与日本、韩国同时亚洲国家, 在
文化、历史等方而共通之处较多,他们在大众体育的发展历程中所采取的政策、方针、方法, 必然有值得我们借鉴之处。
2.5.4面临的挑战
21世纪, 社会对体育人才的需求及对体育教师素质方面的要求, 都将更加突出。
当前, 学校体育 21世纪发展的总趋势是 :学校体育目标向着多元化方向发展, 学校体育不只是以生物体育观为基础的教育体育, 而是形成了一个健康、保健体育、娱乐体育目标、教养教育目标、竞技体育目标和促进学生个性全面发展等学校体育目标的新体系。
大大拓展了学校体育目标的内容。
同时学校体育向追求阶段效益和长远效益相结合的方向发展, 过去学校体育一般只强调阶段效益, 即学生在校学习期间的效益。
随着社会发展, 改革的深入, 学校体育将十分重视其长远效益, 即培养终身体育的习惯。
要符合这个发展趋势, 作为中学体育教育的母机—体育教育专业, 必须主动适应这个变化。
体育教师的工作对象和范围不仅仅只限制在学校, 而更具有社会性, 这给体育教育专业的人才培养提出了新的要求。
江泽民同志在全国科技大会上提出“ 科教兴国” 。
体育是科教兴国的一个必不可少的组成部分。
体育界己经提出“ 科教兴体” 的战略, 这就要求我国培养的人才具有科研意识, 及时摄取信息的能力和具有一定的科研能力, 这给体育专业人才培养提出新的要求。
3. 解决问题
3.1高校方面的因素
高等院校要通过改革教学思想与教育观念, 加强素质教育, 拓宽专业口径, 推动教学与科研、生产相结合等方面的改革, 逐步建立起注重素质教育和创新精神, 融传授知识、培养能力, 提高素质为一体, 培养基础扎实、知识面宽、能力强、素质高, 创新性强的专门人才, 打造具有时代特征的多样化的人才培养模式, 并完善管理与监督机制保障改革切实有效地进行。
对学生进行就业指导以市场需要为导向“ 生产学生”使就业后的学生“ 回炉” 接受再教育, 提高其社会适应能力使其始终能够适应社会的发展。
3.2学生方面的因素
在学校打好自己专业基础的同时积极学习适应未来社会发展需求的知识和技能使自己真正成为一名“ 厚基础宽口径” 的多能型人才。
还应该转变就业观念, 响应政府的号召, 在学习之余积极投身到社会主义全民健身运动的指导和实践当中去。
学以致用, 让自己能够在实践中得到锻炼并培养自己解决实际问题的能力。
让自己能够更好的适应未来社会的需求。
3.3社会方面的因素
政府部门的政策支持是一切工作的前提和最有力的保障。
一、建立体育指导员轮训制, 使体育指导员的体育健康知识保持常新, 以使他们能够科学合理地传授体育健身知识, 指导社区体育健身。
二、是积极引进体育院校毕业生或在校生到社区进行体育志愿服务, 为社区体育输入新鲜血液。
三、是利用重大体育比赛群众体育快速发展的契机, 转化为社区体育发展的动力。
四、是社区体育的制度化、常规化、全民化, 是培养社区居民体育健身习惯的重要手段。
五、应将社区体育基础设施建设纳入市政工程建设规划, 社区体育基本经费的投入应纳入政府的财政预算,并确保群众体育事业费在体育事业费中的合理比例, 真正体现“ 确保体育事业经费随财政收入的增民逐步增长” 。
4. 结语
让我们共同关注体育教育专业学生的就业问题。
因为, 解决体育教育专业学生的就业问题不是学生、学校或是社会单一方面的努力所能解决的事情, 而是三者共同努力的结果。
奥运将至, 全民健身的高潮也即将到来。
让体育工作者更好的发挥他们的专业优势推动全民健身运动科学而有序开展, 为构建社会主义和谐社会奏出和谐的音符。
【参考文献】
[1]谢芳 . 试论未来高师体育院系面临的机遇与发展对策 [J]. 山东体育科
技 ,2005(3. [2]沙灵 . 关于中学教师组织管理行为的探讨 [J]. 中外学校体育文
摘 ,1985(3:11. [3]王兴林 . 田径专修课培养教学能力的研究 [J]. 体育学刊 ,1996(1.
[4]夏书红 , 邹师 . 日韩在主办奥运会后大众体育发展策略的分析与借鉴 [J]. 体育科学 ,2007(1.
[5]赵原 . 社区体育发展的问题与途径 [J]. 柳州师专学报 ,2007(1.
[责任编辑:田瑞鑫]●
○ 高校讲坛○ 214。