信度与效度

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

试卷信度与效度

高考的性质最主要的在两个方面:一、高考是一种选拔性考试,高考成绩是高等学校录取新生的依据,这是高考的选拔性质。二、高考是一种导向性考试,高考是中学教学的指挥棒,起着对中学教学的引导作用,这是高考的引导性质。高考性质的这两方面决定了高考试题应有的信度、效度、难度和区分度,而这些是我们进行高考生物复习首先要清楚的,能够避免我们在复习时的盲目。

下面我先简单地介绍一下信度、效度、难度和区分度四个概念:

信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性程度。

效度是指考试有效性或正确性的质量指标,考试效度的高低反映着考试是否达到它的预定目的,是否考了要考的内容。

难度指试卷(题)的难易程度。一般用试卷(题)的得分率或答对率表示,所以难度事实上是容易度或通过率。其值在0~1之间,数值越大,说明试卷(题)越容易。

区分度是指试题对不同考生的知识、能力水平的鉴别程度。如果一个题目的测试结果使水平高的考生答对(得高分),而水平较低的考生答错(得低分),它的区分能力就很强。题

目的区分度反映了试题这种区分能力的高低。一般认为,区分度的数值达到了0.3,便可以接受;低于0.3的题目,区分能力差。

高考的性质决定了高考试题首先要保证信度,缺少信度或信度较低都无法向几百万考生交代,无法向考生家长交代,无法向社会交代。从这一角度看高考试题所考查的一定是确定性和稳定性的内容,对于现在还没有被确定的内容或者说有争议内容是不能作为高考命题依据的。你知道了吗?复习时,可不要让这样的问题浪费你的精力呀!同时要注意,有些题目看起来让你回答的是假设和猜想,你可不要忘记高考试题的确定性,不要得意忘形呀,还是老老实实从生物学的基本原理来回答,只有这样你才能得分。OK!

高考的效度要求高考试题是有效和正确的,考查的是考纲规定的内容。你想想牵动着百万考生、千万家庭、亿万人员,如果哪位命题大人在命题中出了错误或者超出了考试要求,会怎么样呢?哪他可就大了,他将成为千夫所指,这样的事情是每一位命题人都不会干的。鉴于此,我们的复习一定要紧紧盯住考试纲要,对考试纲要要求的内容理解、记牢,让它扎根心田;对于违背考试纲要或超出纲要要求的内容,则不要理睬;一些脑筋急转弯、文字游戏类的问题就让它见鬼去吧。

高考试题要有难度,这个难度有多大,平时复习需要用

什么样的态度去对待不同难度的试题呢?高考试题的难度与参加考试人数和当年高等学校的录取人数是密切关联的。去年山东省高考报名人数是70多万,实际录取人数接近40万,高考试题的难度定位应该是有利于把这40万考生选拔出来,因此,试题的难度系数应在0.6左右。这意味着什么?意味着将有60%左右的考生通过高考被定位在基础较好、能力较强、具有学习潜能;而90年代只有10%左右的考生能够进入高校相比,那时10%左右的考生通过高考被定位在基础较好、能力较强、具有学习潜能。这不是说现在学生中优秀的比例提高了,而是高考试题的难度变了,高考试题的侧重点变了。变成什么样了呢?变成60%的试题是基础题目了。你只有能把基础概念、基本原理、基本事实掌握了你就至少能拿到60%的分,你就进入了优秀基础较好、能力较强、具有学习潜能的考生的行列。高三复习,特别是一轮复习的重点和目标就确定了——基本概念、基本生物事实、基本生物学原理、基本生物学方法、基本生物学思想。记住了,抓基础,把60%先抓在手中。

高考是选拔性考试,高考试题一定要有区分度,以利于不同层次学校对人才的选拔。因此高考还要有中档题和难度较大的题目,根据考生人数和录取人数的比例,这两类题目所占的比例将在40%左右。对于生物学科讲,这部分试题的难度主要体现在生物科学思想和生物知识的运用,以及生物试题

的解题技巧上。要想在这部分试题中得高分也不难,需要在平时复习时注意在做题目的同时总结方法,逐步建立起生物科学的思维方法和熟练生物学试题的解题技巧。前60%是进入高校的保证,后40%则是进入较好大学所必需的,谁不想上大学,谁不想上好大学,因此这部分试题往往成了香饽饽,为此,今后每期我们都专门开设专门栏目进行辅导,设计专门的创新题供大家热身。这部分确实很重要,但要有前面的60%作基础,切不可逐末舍根呀。

测试信度(test reliability)也叫测试的可靠性,指的是测试结果是否稳定可靠。也就是说,测试的成绩是不是反映了受试者的实际语言水平。例如,如果同一套测试在对同一测试对象(即受试者本身没有变化)进行的数次测试中,受试者的分数忽高忽低的话,则说明该测试缺乏信度。测试的信度与测试的效度有着密切的关系。一般说来,只有信度较高的测试才能有较高的效度,但效度较高不能保证信度也一定较高。测试的信度主要涉及到试题本身的可靠性和评分的可靠性这两个方面。试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素;评分是否可靠则要看评分标准是否客观和准确。

测试的信度通常用一种相关系数(即两个数之间的比例关系)来表示,相关系数越大,信度则越高。当系数为1.00时,说明测试的可靠性达到最高程度;而系数是0.00时,

则测试的可靠性降到最低程度。在一般情况下,系数不会高到1.00,也不会降到0.00,而是在两者之间。对信度指数的要求因测试类别的不同而不同,人们通常对标准化测试的信度系数要求在0.90以上,例如“托福”的信度大致为0.95,而课堂测试的信度系数则以0.70-0.80之间为可接受性系数。测试信度的计算方法有很多种,以下仅介绍三种易于操作的方法:

1)重测法(the retesting method)。用同一套试卷在两个不同时间内来测试同一批受试者,这样便获得两组分数,然后计算出两组分数的相关系数。当然,在两次测试中,学生第二次的测试成绩理应比第一次的要高,因为在第二次测试时学生已经有了进步而且临场经验也更丰富了。但是若该试题是比较可靠的,每个学生在两次测试中的排名次序应该是基本不变的。

2)交替形式法(the alternative method)。对同一批受试者使用试题类型完全相同,难易程度相当,但具体题目不同的两套对等试卷先后进行两次测试,然后计算出两次得分的相关系数。

3)对半法(the split-half method)。测试只进行一次,但将整份试卷的题目按单、双数分成两组来分别计分,算出两组分数的相关系数,然后再用Spearman-Brown的公式计算整份试卷的信度系数。具体计算步骤是:将两组分

相关文档
最新文档