试卷编制的方法和命题技术

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

r效
1 k
k i 1
Di
内容效度
测验的题目对所要测量的内容具有代表性的程度称作内容效度．它反映测验题目在所要测量的内容范围和教学目标内取样是否充分和确切的问题，主要用于学科成绩测验．
内容效度一般不用数量化指标来表示，主要依靠在某种依据的基础上作出逻辑分析．
三、试卷测试结果的分析指标
2．测验
测验是指对通过一定的仪器和试题所引起的受测者的行为样本进行测量的系统程序．
3．测验的种类
按测验的功用分类（1）学绩测验. 测量个人（或团体）经过一定形式的学习活动后对知识和技能的掌握程度．
（2）能力测验指一般能力测验、特殊能力测
验、潜在能力测验（又称能力倾向测验）．
（3）人格测验
2. 区分度
是试题对不同考生的知识、能力水平的鉴别程度．如果一个题目的测试结果使水平高的考生答对（得高分），而水平低的考生答错（得低分），它的区分能力就很强．题目的区分度反映了试题这种区分能力的高低．一般认为，区分度的数值达到了0.3，便可以接受；达到了0.3以上为好的题目；在0.4以上为优秀题目；低于0.3的题目，区分能力差．
1995年 88.36 24.00 0.590 0.8506 0.8867
1996年 82.79 25.30 0.550 0.8500 0.8884
4. 效度
效度是反映一份试卷有效性或准确性的指标．
每一种效度有其特定的适用范围，主要有：效标效度，内容效度，结构效度．
由于客观上的种种原因，难以确定有效的效标，因此，效度的计算，采用求平均区分度代替，其计算公式是：
1．算术平均数——平均分一组数值的总和除以数据的
总频数所得的商称为算术平均数，简称平均数．
x x1 x2 xn n
2．标准差
标准差是反映全体考生分数之间的离散程度和差异情况．它与平均分一起使用，决定了某次考试分数分布情况．s 值越大，表示部分考生离平均分的“差距越大”，也就是分数分布较广； s 值越小，则分数分布较窄或说“集中在平均分附近”．
（2）目标参照测验参照被测达到目标的程度来解释分数的
测验，叫做目标参照测验，也称作标准参照测验．
常模参照测验和目标参测验对照表
种类参照系归属作用理想分布
常模参群体水平相对评价比较全距大，
照测验
选拔正态分布
目标参教育目标绝对评价鉴定负偏态照测验
4．测量的要素
（2）形成性测验
是指在教学活动的进程中所实施的、以改进教学为目的的测验，这种测验形式灵活，师生可以通过形成性测验了解前段教与学的状况，以便采取措施及时矫正．
（3）终结性测验
是指在学期学年或某一门课程终了时举行的测验，其目的在于鉴定教师的教学和学生的学习、甚至一门课程的编制．
诊断、形成、终结性测验对照表
种类目的
特点
时间
诊断性预测摸底比较正规教学开始测验
形成性矫正改进灵活教学进程中测验
终结性测验
鉴定
正规教学结束
按测验的对象分类
（1）个别测验每次仅以一个被试为对象．优点是主试对被试者的言语、情绪有较多
的控制机会，能进行细致的观察．缺点是费时多，手续复杂，对主试专业素
3. 信度
信度是衡量测验分数一致性或可靠性的一个指标，即用一个或一组测验对同一被试群体施测多次，所得结果的一致性的程度，以及测验分数所反映被试真实水平（即真分数）的可靠性程度．
1994~1996年高考数学（理科）试卷统计数据对比表
项目平均分标准差
难度分半信度 α—信度
1994年 83.12 25.50 0.550 0.8339 0.7580
有关考试难度水平估计一览表
最易容易适中题较难难很难
难度 0.95 0.85 0.70 0.50 0.30 0.10
章节考试 20% 40% 30% 10%
高考
30% 30% 20% 20%
竞赛
20% 30% 30% 20%
一般情况下，测验的平均难度接近0.50时，分数趋于正态分布，否则分数分布将出现偏态．就整个测验而言，当平均难度为0.5 且题目组间的相关为零的情况下，分数呈正态分布，而难度值越小，则题目越难，低分段人数必然较多．难度值越大，题目越容易，分数将大部分集中在高分区．这样，在分数的分布上，就会呈现出两种不同的偏向，前者为正偏态，后者为负偏态．
质要求较高．
（2）团体测验
是指在同一时间内由一位主试对多数人实施的测验．
优点是时间经济而且不一定找专业素质高的人担任主试．
缺点是对被试的行为不能有效的控制和细致观察．
按解释分数和方法分类
（1）常模参照测验指参照被测群体的实际水平解释分数的测
验叫做常模参照测验．群体的平均分数一般可以反映群体的水平，称为常模．
试卷编制的方法及其命题技术
主要内容
一、教育测量学的基本概念二、衡量试卷质量的主要指标三、试卷测试结果的分析指标四、试卷的命制技术
一、教育测量学的基本概念
要搞好命题工作，我们的教师必须具有一定的教育测量学的知识和专业知识。 1. 教育测量
教育测量有广义和狭义之分．从广义上说，教育测量泛指运用测量手段对教育活动所进行的量的测定．从狭义上讲，教育测量专指按一定规则对学生的知识、智能、个性发展、思想品德等所进行的量的测定．通常所提及的多是狭义上的教育测量．
测量动机、兴趣，态度，气质，情感、信念、价值观等除能力以外的个性特征和倾向．
按测验的目的分类
（1）诊断性测验（也称作配置性测验）是指在教学活动的一定阶段，如学年、
学期或教学某一课程章节之初进行的测验，其目的在于了解学生的知识基础和情感发展状态，对即将学习的内容的准备状况，使教师、管理人员心中有数，以便合理编班、组织教学、恰当处理教学内容．
测量的三要素： ①参照点参照点分绝对零点和相对零点．教育测量所应用的参照点都是相对零点． ②统一的单位 ③量具（测量工具）教育测量常用的工具是试卷．
二、衡量试卷质量的主要指标
1. 难度
难度是指试卷（题）的难易程度．一般用试卷（题）的得分率或答对率（P）表示，所以难度事实上是容易度．P值在0~1 之间，数值越大，说明试卷（题）越容易．