教育测量评价的基本问题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

促进 发展
发现 问题 明确 方向
找出 差距
高考的原则
• • • • 评价学生的素质和学习潜力 符合新课 考试,高考必须同时兼顾各
方的要求。这些要求从表面 上看有时是不协调、甚至是 矛盾的。因此,高考的命题 必须设法协调各方的要求, 这是对高考命题人员素质的 最大考验。
高考命题的 基本要求
高考的理念与基本问题
• • • • • • • • 高考的目的是什么? 高考的原则是什么? 高考的标准是什么? 高考由谁来实施? 高考的对象是谁? 高考的内容是什么? 高考的方法和程序怎样? 高考的结果如何解释
高考的目的是什么?
肯定 成绩
检查 情况
高考的目的非常 具体,就是为选 拔高校新生提供 依据。这实际上 是通过对学生已 有基础的检查来 预测其未来发展, 让符合其发展预 期的学生进入学 校学习,最终还 是为了学生的充 分发展。
• 高考的改革不能以全盘否定和取消高考为前提, 否则会对整个社会和教育事业所带来破坏性的影 响。 • 高考的全面深入改革,不仅是考试和招生技术的 改革,更有待于社会的进步和教育的全面改革, 不能幻想“毕其功于一役”。 • 恰如其分地估计高考制度的利弊,是高考改革成 功的起点。 • 考试只是一种工具,有所能必有所不能,大学招 生不能单纯依赖考试一种方法。 • 高考的改革必须与招生制度的改革同时进行,或 者说必须在招生制度改革的前提下进行。
教育测量评价的 基本问题
测量与教育测量
• 测量:利用工具从量的方面确定物体的某 种特性。
– 物理测量:
• 物理工具 • 直接测量
– 心理测量:
• 测验工具 • 间接测量-利用刺激去激发有机体的反应,再测量 反应的量的特征
– 教育测量:
• 学生在教育影响下的心理活动 • 提供资料和数据作为教育评价的判断基础
参考金娣、王刚编著:《教育评价与测量》
教育评价的要素
• • • • • • • • 为什么要进行评价?评价的目的是什么? 以什么理念来指导评价?评价的原则是什么? 以什么为标准进行评价? 谁来评价?评价的实施者是谁? 评价谁?评价的对象是谁? 评价什么?评价的内容是什么? 怎样进行评价?评价的方法和程序怎么样? 如何解释、利用评价的结果?评价有什么样的功 能?
• 效度与信度的关系:
– 效度低、信度不一定低 – 信度低、效度一定低
区分度与难度
• 区分度:测验或试题鉴别被试者的水平差异的本 领或精确程度 • 难度:测验或试题相对被试者的难易程度 • 区分度与难度的关系
– 过高或过低的难度都会导致区分度的下降
• 高考对区分度和难度的要求
– 从选拔的角度来说,高考试题应该有高的区分度 – 从有利于中学教学的角度来看,高考试题应该与考生 所能达到的水平相适应 – 从试卷编制的工艺来看,高考试题的区分度和难度应 该在一定范围内均衡分布
新课程背景下高考改革的方向
• 高考必修根据新课程的理念、要求、内容 和实际实施情况进行改革。 • 高考和应试教育没有必然的联系,不能冀 望通过高考改革来消除应试教育。应试教 育的主要根源在于:
–急功近利思想的泛滥 –以管理经济(生产)的方法和量化的“硬”指 标来管理教育, “见物不见人”。 –社会诚信普遍缺失。 –教育职业道德的崩溃
评价什么?
有效?
高考主要采用书面笔试的方式,因为考试规模 所谓模型,指的是构成该体系或过程的要素和 非常大,控制阅卷的误差很不容易,因此试题 要素之间的关系。高考的模型是比较复杂的, 主要采用有唯一正确答案的题目,大量需要灵 从大的方面来所,它包括了社会环境、教育导 活思考、没有唯一正确解答的试题不太可能出 向、中学课程、高等学校、高中学校、考生、 现在高考试卷中。这就使高考所能考查的能力 教师、命题人员、招生工作管理人员、等等。 受到很大的局限,考试效度大受影响。总体上 如果只看命题,这以模型就要简单一些,主要 看,高考只能考查到学生对知识的了解和理解, 是命题人员、考生、中学课程和大学要求四个 以及较低层次的思维和表达能力。要提高高考 标准 工具 方面。 的效度,一定要打破纸笔考试的局限,打破封 闭式试题的局限。
谁来评价?
上级
外 部 评 价 者
高考是一种典型的外部评价,最大优点就在 教师 专家 教师 于其公平性,而最大的问题在于其有效性。 由于时间和形式的限制,高考不可能全面地 学生 考查学生的素质。因此,怎样使得考试更有 效地、更全面地反映基本素质,是进行试卷 社会 学校 设计的时候需要考虑的问题。
学校
•高考是一次社会性很强 的公众考试 高考改革不可能 •高考主要是为选拔高等 完全与新课程同步 学校新生的考试 •高考有其自身的规律
高考存在的问题
• 三个方面
– 高考的功能定位问题 – 高考的方式方法问题 – 高考结果的合理利用问题

六大问题
1. 2. 3. 4. 5. 6. 将高考定位为选拔性考试,是造成试卷实际难度逐步加大的原因。 单一的笔试形式造成对学生全面发展的忽视。 封闭式试题影响了高层次的认知能力的发展。 唯一的考卷加重了学生的负担,不利于学生特长的培养。 计分方法不合理。 以省为单位排总分划分数线的做法,极度夸大了考试分数的价值, 负面影响极大。
以同辈 为参照
以自身发 展为参照
新课程背景下 高考改革的方向
高考改革与新课程改革
高考改革是否新课程评价改革的一部分?

不完全是
不是
•高考必须以高中学生的 课程为考试的基点,随 高考改革必须与新 课程的改变而改变 •高考对高中教学有很强 课程同步 的回流作用 •高考带有评价高中教学 效果的成分
两难问题
高考命题的理论与技术专题讲座一
教育测量评价的基本问题 与 高考命题改革
高凌飚
华南师范大学基础教育课程研究中心
gaolb@
2007.8.6
• • • •
教育测量评价的基本问题 高考命题的基本要求 新课程背景下高考改革方向 高考与教学
效度与信度
• 效度:测验能够有效测出所要检测的东西的程度
– 内容效度:试题与教学的目的和内容相符的程度 – 结构效度:测验的结构与目标要求相符的程度 – 标准相关效度:测验与作为标准的测验相符的程度
• 信度:测验获得的信息的可靠和准确程度
– – – – 内部一致性:测试题目所检测的对象的一致程度 重测信度:一份测试前后两次测验的相关程度 复份信度:两次内容和目标相同的测试的相关程度 对半信度:等质量的两部分测试的相关程度
• 服务功能
– 利用评价结果为教育决策服务
参考金娣、王刚编著:《教育评价与测量》
教育评价的主要类型
• • • • • • • 按评价范围分类:宏观、中观、微观 按评价内容分类:条件、过程、成果 按评价基准分类:相对、绝对、个体内部差异 按评价主体分类:自我、他人 按评价的时间和作用分类:诊断、形成、终结 按评价方法分类:定量、定性 按评价对象的复杂程度分类:单项、综合
评价的本质
顾明远主编《教育大辞典》增订合编本;上海教育出版社,1998, p.1188 :
“评价,evaluation,指事物价值的判断”
美国A.S.雷伯 著,李伯黍等译:《心理学词典》上海译文出版社,1996, p.290 :
evaluation,一般说来指对于某事的价值作决定
什么是评价?
• 评价是从特定的目的出发,根据一定的标 准,通过特定的程序对已经完成或正在从 事的工作(或学习)进行检测,找出反映 工作(或学习)进程的质量或成果的水平 的资料或数据,从而对工作(或学习)的 质量或成果的水平做出合理的判断。
内 部 评 价 者
家长
在目前的考试形式下,高考难以考查学生 知识 方法 技能 的非智力品质所,也难以考查真正联系实 际、解决问题的能力。高考可能考查的是 一些基本的知识和技能,包括思维的技能 认知、思维、实践能力 和专业的技能,这构成了与人文和科学素 养密切相关的基本“能力”,构成了所谓创 新能力的基础,对考生的未来发展潜力有 一定的预测功能。这也是高考为大众所普 遍接受的原因。不要给高考提一些不可能 实现的要求,如:跨学科的综合能力、解 非智力品质 决实际问题的能力等等。因此,高考题目 设计应该围绕高中课程的基本内容和基本 要求来展开,不要随意地超纲,把高考题 情感 态度 价值观 变成“竞赛题”。
• 必要时可增加面试或其他的辅助考试或选拔方法。 逐步实现变单一的书面笔试形式为多种不同的考 试形式,以考查不同形式的能力表现。 • 考试科目的设臵应体现新课程既保证全面基础, 又有利于个性特长的发展的理念。 • 坚持标准分的改革。 • 取消全省一条分数线的做法,按考生群体数划分 数线,或进一步改由各学校根据报名和考试的情 况自定报名的资格和录取分数线。 • 将高考从强调区分的常模参照考试改为强调水平 的标准参照考试。
高考的标准
• 课程标准 • 考试大纲 • 范例样题
前述三方面的标准,第一和第二 方面规定了考试的范围,对考试 的深浅程度却难以规范。第三种 比较具体,但却不是一种相对稳 定的标准。实际上,由于高考是 一种常模参照的考试,它采用的 是一种以全体考生为参照的相对 标准,没有绝对的标准要求,其 实际标准也就随考生水平的变化 而水涨船高。这是目前的高 考所存在的严重问题之一。
分数与测验结果的解释
• 分数:用以表示测量结果的量
– 分数单位的模糊性 – 分数单位的等值要求 – 等级制和百分制
• 等级制更适应测验对象的模糊性,反映测验者水平的质的差异, 适用于水平参照的测验 • 百分制有较为细致的分数单位和基本连续的分数分布,适用于 常模参照的测验
• 测验结果的解释:
– 以考生群体为标准:常模参照 – 以相对稳定的目标要求为标准:目标参照 – 从选拔的角度来看,高考是常模参照的测验;但是, 高考不能脱离中学教学的基本要求,在一定程度上要 以课程目标为参照。因此,不能说高考是纯的常模参 照测验。
教育评价的内涵
• 在教育的领域对教育的政策方针、管理行政、课程教学、教师发展等 等各个方面进行评价。
– – – – – –
– – – – – – –
目的在于促进学生、教师和学校以至整个教育事业的发展; 以国家的教育方针政策为依据,以教育的目标为标准; 包括量和质两个方面的方法; 包括对教育过程与教育效果进行评价; 通过规范而有效的程序收集数据和资料,作出判断; 评价的结果有鉴定、诊断和导向的意义。
高考改革的切入点
• 将考试分为基础考试和能力考试两部分:基础考 试以考查学生对基础知识的了解和相应的基本技 能为主,保证考生具有全面均衡的基础知识;能 力考试着重考查学生的能力,区分学生的不同水 平。 • 逐步减少封闭式试题的权重,增加开放式试题的 权重;适当提高试题的灵活性与综合性。 • 加大对评分的投入和研究,逐步减少开放式试题 的评分误差。
现行高考制度的正面作用
• 高考是世界各国普遍采取的选拔方法之一。 • 统一高考是新中国成立以后采取的一项重要措施,大大提 高了行政效率,为方便了考生的应考和高校的选拔。 • “文化大革命”的历史教训告诉我们,取消高考带来的是 高等教育的沦落和整个教育体系的崩溃。 • 恢复高考是打倒“四人帮”以后,教育战线拨乱反正的头 件大事,给惨遭文革摧残的教育系统带来重生,给逐步恢 复的中小学教学秩序的带来稳定和保障。 • 高考有严密的规范程序和公开统一的标准,是公众心目中 一块保持社会公平公正的“绿洲”,对整个社会稳定起到 一种不可或替的作用。 • 高考为青少年学生树立了一个具体的人生奋斗目标,对青 少年的成长有积极的激励作用
学校的评价 课程的评价 教材的评价 教学的评价 教师的评价 学生的评价 学习的评价
• 在比较狭义的范围内,教育评价通常关注的是:
教育评价的主要功能
• 导向功能
– 引导评价对象朝着理想的目标前进
• 鉴定功能
– 认定判断对象所达到的水平和质量
• 改进功能
– 促进评价对象改进和完善其行动
• 调控功能
– 通过反馈对评价对象的活动进行调节和控制
模型
可信?
评价 方法
可行?
评价的解释
以教育目标 为参照
高考是一种以同辈为参照(常模参照)的 考试,这就要求我们以常模为基础进行计 分,而不是以绝对水平为基础进行计分。 当然常模参照的考试和目标参照的解释并 不是非此即彼、互不相容的两个对立面, 高考的第一需要是按考试结果对考生排队, 这时应采用常模参照的计分方法。高考的 结果又可以用来检查高中教学中存在的问 题,这时应利用水平参照的计分方法。
相关文档
最新文档