新课程中学物理评价专题讲座

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

▪ 据北师大研究表明,旧法考试有 着诸多不合理的现象,如1979年 政治第一大题共10个小题占30分, 其难度为0.83-0.99,表明绝大 部分考生能回答,这意味着约占 1/3的题目对选拔不起作用,同 年化学试题共11个题,小于0.3 的有7个,0.2以下的有4个显然 太难了。
近几年高考物理试卷的难度 如下表所示
▪ 提高信度,通常采取的办法是:
▪ 增加试题的数量、难度适中,内容应同质评分 要客观,北京师大曾对1979年和1980年高考 试卷进行统计分析,除1979年物理、数学和 1980的化学试卷信度高外,其它各科试卷信度 均较低,1981年的政治信度仅为0.317, 与要 求在0.85以上,差距大的惊人。 同时他们随机
▪ 考试说明\09物理考试说明\09物理考试说明.doc
3.教育测量学基础
▪ 标准化考试是一种按系统的科学程序组织, 具有统一的标准,并对误差作了严格控制的 考试。包括试题编制、考试设施、阅卷评分 及分数转换和解释等四个环节。对于命题来 说主要涉及试题编制和阅卷评分的标准化。
▪ (1)、教育测量的质量指标
▪ 结构效度:是指一个测量能实际测量出 理论上的结构的程度。即解释说明分数是 什么?
▪ 简易的结构效度如题型结构、内容结构等。
▪ 较复杂的结构效度需用因素分析方法
▪ 影响效度的因素:试题难度的影响,效标 合理,增加试卷长度,试题排列由易到难 等。
▪ (参见朱行建 物理高考的结构效度检验)
信度与效度的关系:

2000 2010 2011

▪ 难度 0.52 0.54 0.62
▪ , 试题难度对信度、效度标 准差都有影响。
▪ ⑤区分度:是试题对考生实际水平 的区分程度,具有良好区分度的测 验,实际水平高的应该得高分,实 际水平低的应该得低分,故区分度 又叫鉴别力。它是试题评价最主要 的指标。 区分度计算是用试题 与试卷得分的相关系数表示,通常 在0~1之间,越大越好。
美国考试专家伊贝尔关于试题区 分度的评价标准如表
▪ ①信度:指测量结果的稳定性、内部一 致性或可靠性程度,亦即测量结果是否 真实,测量误差越小,信度就越高。信 度是任何一个测量的必要条件,只有信 度高的测量才能成为教育工作有用的工 具。否则,测量的结果是无意义的、无 效的。信度通常有分半信度和α信度两种, 其系数一般在0.8以上。
▪ (参见教育测量学 王汉澜)
▪ (参见Bloom:教育评价 目标分类学
▪ 根据这一理论,物理课程标准从教学的角度将“知 识与技能”根据知识的重要程度不同划分为四个层 次,即:了解、认识、理解、独立操作;将“情感 态度与价值观”划分为三个层次,即:经历、反应、 领悟;而将“过程与方法”划分为六个层次,即观 察、提出问题、信息收集、信息处理、分析概括和 交流能力。而从考试测量的角度说,有些问题不易 测量,如物理实验中的独立操作。因此根据布卢姆 的目标分类理论结合物理学科和考试测量的技术与 要求进行重新划分.
抽取五个考生的语文、数学、物理、政治四科
复印发到二十八个省市、请各地阅卷组评分, 结果发现同一份语文试卷最大评分差异达33分, 最低差异为13分,平均差异为28.2分,四科评 分差异之和竟达63.8分。因此评卷误差控制非 常重要。
近几年高考物理试卷信度如表所示:
▪ 年度 2005 2006 2007 2008 2009 ▪ 信度 0.88 0.89 0.82 0.85 0.83
▪ 效标关联效度:又称予测效度,是以测验分数 和效标之间的相关系数来表示考试的效度高低。 如北京师大对78、79年的高考进行了效度分析, 以大学一年级的成绩作为效标来检验高考的成 绩,计算两者之间的相关系数来说明高考的予 测效度,结果发现24个相关系数中只有5 个达 到显著性水平,特别是其中还出现了6个负值, 使我们不得不承认高考总分并不能有效地予测 学生进入大学后的学习成绩。再如用学生的平 时成绩作为效标,求与高考成绩相关系数,来 衡量高考试卷的质量。具体计算可参见有关统 计学书箱。

2005 2006 2007 2008 2009
▪ 标准差 24.5 28.2 26.9 29.3 27.9 试卷(题)的难易程度及试卷的长度对标准差
有重要影响。
▪ ④难度:试卷(题)的难易程度。 一般用试卷(题)的平均得分率或 答对率表示,通常在0~1之间,值 越大,表示越易,值越小,表示越 难。一般认为0.3以下为难题,0.3- 0.7为中等,0.7以上为容易. 在 命题时,通常过易(0.8以上)过难 (0.2)以下的题目尽量不出,试卷的 难度控制在0.55左右为易。
▪ 效度高才能是信度高,信度高不一 定效度高。因此在处理信度与效度 的关系上,首先要保证高的效度。 两者可形象的比喻为打靶,集中和 准确。
Baidu Nhomakorabea
▪ ③标准差:反映全体考生分数之间离散程度的 差异量,它与平均分一起使用,决定了某次考 试分数分布情况。说明了试卷将全体考生分数 拉开的水平。命题时原则上要求本科线应控制 在平均分与标准差之和的水平上。通常物理科 标准差控制在25-30之间为易, 近几年高考试 卷的标准差如表所示:
新课程中学物理评价专题讲座
朱行建 天津师范大学
2012.2
2.能力要求理论
▪ 对能力的考查是中考的一个重要方面,它实际解决 考到什么程度的问题,特别是在具体的情景中运用 所学的知识分析和解决问题的能力是考查的重点。 目前对能力的分类理论,以美国教育测量专家布卢 姆(B、S、Bloom)的目标分类理论最为显著,他 认为认知领域教育目标分类目标分类,应该着重于 知识和能力的意义,按照从简单到复杂的顺序划分 为六个层次,即:知识、领会、运用、分析、综合、 评价。
▪ ②效度:是指测量结果的准确性和有效 性的程度,亦即测量是否达到了预期的 目的。是否测出了需要测量的东西,是 否体现了考试目标,是衡量试卷最重要 的指标。效度的分类:内容效度、效标 关联效度和结构效度。 内容效度: 通俗的话说是测量内容的代表性程度, 即内容覆盖率,可分为知识内容和能力 要求内容。(通常用知识双向细目表来 实行)。
相关文档
最新文档