教育测量评价的基本问题
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
促进 发展
发现 问题 明确 方向
找出 差距
高考的原则
• • • • 评价学生的素质和学习潜力 符合新课 考试,高考必须同时兼顾各
方的要求。这些要求从表面 上看有时是不协调、甚至是 矛盾的。因此,高考的命题 必须设法协调各方的要求, 这是对高考命题人员素质的 最大考验。
高考命题的 基本要求
高考的理念与基本问题
• • • • • • • • 高考的目的是什么? 高考的原则是什么? 高考的标准是什么? 高考由谁来实施? 高考的对象是谁? 高考的内容是什么? 高考的方法和程序怎样? 高考的结果如何解释
高考的目的是什么?
肯定 成绩
检查 情况
高考的目的非常 具体,就是为选 拔高校新生提供 依据。这实际上 是通过对学生已 有基础的检查来 预测其未来发展, 让符合其发展预 期的学生进入学 校学习,最终还 是为了学生的充 分发展。
• 高考的改革不能以全盘否定和取消高考为前提, 否则会对整个社会和教育事业所带来破坏性的影 响。 • 高考的全面深入改革,不仅是考试和招生技术的 改革,更有待于社会的进步和教育的全面改革, 不能幻想“毕其功于一役”。 • 恰如其分地估计高考制度的利弊,是高考改革成 功的起点。 • 考试只是一种工具,有所能必有所不能,大学招 生不能单纯依赖考试一种方法。 • 高考的改革必须与招生制度的改革同时进行,或 者说必须在招生制度改革的前提下进行。
教育测量评价的 基本问题
测量与教育测量
• 测量:利用工具从量的方面确定物体的某 种特性。
– 物理测量:
• 物理工具 • 直接测量
– 心理测量:
• 测验工具 • 间接测量-利用刺激去激发有机体的反应,再测量 反应的量的特征
– 教育测量:
• 学生在教育影响下的心理活动 • 提供资料和数据作为教育评价的判断基础
参考金娣、王刚编著:《教育评价与测量》
教育评价的要素
• • • • • • • • 为什么要进行评价?评价的目的是什么? 以什么理念来指导评价?评价的原则是什么? 以什么为标准进行评价? 谁来评价?评价的实施者是谁? 评价谁?评价的对象是谁? 评价什么?评价的内容是什么? 怎样进行评价?评价的方法和程序怎么样? 如何解释、利用评价的结果?评价有什么样的功 能?
• 效度与信度的关系:
– 效度低、信度不一定低 – 信度低、效度一定低
区分度与难度
• 区分度:测验或试题鉴别被试者的水平差异的本 领或精确程度 • 难度:测验或试题相对被试者的难易程度 • 区分度与难度的关系
– 过高或过低的难度都会导致区分度的下降
• 高考对区分度和难度的要求
– 从选拔的角度来说,高考试题应该有高的区分度 – 从有利于中学教学的角度来看,高考试题应该与考生 所能达到的水平相适应 – 从试卷编制的工艺来看,高考试题的区分度和难度应 该在一定范围内均衡分布
新课程背景下高考改革的方向
• 高考必修根据新课程的理念、要求、内容 和实际实施情况进行改革。 • 高考和应试教育没有必然的联系,不能冀 望通过高考改革来消除应试教育。应试教 育的主要根源在于:
–急功近利思想的泛滥 –以管理经济(生产)的方法和量化的“硬”指 标来管理教育, “见物不见人”。 –社会诚信普遍缺失。 –教育职业道德的崩溃
评价什么?
有效?
高考主要采用书面笔试的方式,因为考试规模 所谓模型,指的是构成该体系或过程的要素和 非常大,控制阅卷的误差很不容易,因此试题 要素之间的关系。高考的模型是比较复杂的, 主要采用有唯一正确答案的题目,大量需要灵 从大的方面来所,它包括了社会环境、教育导 活思考、没有唯一正确解答的试题不太可能出 向、中学课程、高等学校、高中学校、考生、 现在高考试卷中。这就使高考所能考查的能力 教师、命题人员、招生工作管理人员、等等。 受到很大的局限,考试效度大受影响。总体上 如果只看命题,这以模型就要简单一些,主要 看,高考只能考查到学生对知识的了解和理解, 是命题人员、考生、中学课程和大学要求四个 以及较低层次的思维和表达能力。要提高高考 标准 工具 方面。 的效度,一定要打破纸笔考试的局限,打破封 闭式试题的局限。
谁来评价?
上级
外 部 评 价 者
高考是一种典型的外部评价,最大优点就在 教师 专家 教师 于其公平性,而最大的问题在于其有效性。 由于时间和形式的限制,高考不可能全面地 学生 考查学生的素质。因此,怎样使得考试更有 效地、更全面地反映基本素质,是进行试卷 社会 学校 设计的时候需要考虑的问题。
学校
•高考是一次社会性很强 的公众考试 高考改革不可能 •高考主要是为选拔高等 完全与新课程同步 学校新生的考试 •高考有其自身的规律
高考存在的问题
• 三个方面
– 高考的功能定位问题 – 高考的方式方法问题 – 高考结果的合理利用问题
•
六大问题
1. 2. 3. 4. 5. 6. 将高考定位为选拔性考试,是造成试卷实际难度逐步加大的原因。 单一的笔试形式造成对学生全面发展的忽视。 封闭式试题影响了高层次的认知能力的发展。 唯一的考卷加重了学生的负担,不利于学生特长的培养。 计分方法不合理。 以省为单位排总分划分数线的做法,极度夸大了考试分数的价值, 负面影响极大。
以同辈 为参照
以自身发 展为参照
新课程背景下 高考改革的方向
高考改革与新课程改革
高考改革是否新课程评价改革的一部分?
是
不完全是
不是
•高考必须以高中学生的 课程为考试的基点,随 高考改革必须与新 课程的改变而改变 •高考对高中教学有很强 课程同步 的回流作用 •高考带有评价高中教学 效果的成分
两难问题
高考命题的理论与技术专题讲座一
教育测量评价的基本问题 与 高考命题改革
高凌飚
华南师范大学基础教育课程研究中心
gaolb@
2007.8.6
• • • •
教育测量评价的基本问题 高考命题的基本要求 新课程背景下高考改革方向 高考与教学
效度与信度
• 效度:测验能够有效测出所要检测的东西的程度
– 内容效度:试题与教学的目的和内容相符的程度 – 结构效度:测验的结构与目标要求相符的程度 – 标准相关效度:测验与作为标准的测验相符的程度
• 信度:测验获得的信息的可靠和准确程度
– – – – 内部一致性:测试题目所检测的对象的一致程度 重测信度:一份测试前后两次测验的相关程度 复份信度:两次内容和目标相同的测试的相关程度 对半信度:等质量的两部分测试的相关程度
• 服务功能
– 利用评价结果为教育决策服务
参考金娣、王刚编著:《教育评价与测量》
教育评价的主要类型
• • • • • • • 按评价范围分类:宏观、中观、微观 按评价内容分类:条件、过程、成果 按评价基准分类:相对、绝对、个体内部差异 按评价主体分类:自我、他人 按评价的时间和作用分类:诊断、形成、终结 按评价方法分类:定量、定性 按评价对象的复杂程度分类:单项、综合
评价的本质
顾明远主编《教育大辞典》增订合编本;上海教育出版社,1998, p.1188 :
“评价,evaluation,指事物价值的判断”
美国A.S.雷伯 著,李伯黍等译:《心理学词典》上海译文出版社,1996, p.290 :
evaluation,一般说来指对于某事的价值作决定
什么是评价?
• 评价是从特定的目的出发,根据一定的标 准,通过特定的程序对已经完成或正在从 事的工作(或学习)进行检测,找出反映 工作(或学习)进程的质量或成果的水平 的资料或数据,从而对工作(或学习)的 质量或成果的水平做出合理的判断。
内 部 评 价 者
家长
在目前的考试形式下,高考难以考查学生 知识 方法 技能 的非智力品质所,也难以考查真正联系实 际、解决问题的能力。高考可能考查的是 一些基本的知识和技能,包括思维的技能 认知、思维、实践能力 和专业的技能,这构成了与人文和科学素 养密切相关的基本“能力”,构成了所谓创 新能力的基础,对考生的未来发展潜力有 一定的预测功能。这也是高考为大众所普 遍接受的原因。不要给高考提一些不可能 实现的要求,如:跨学科的综合能力、解 非智力品质 决实际问题的能力等等。因此,高考题目 设计应该围绕高中课程的基本内容和基本 要求来展开,不要随意地超纲,把高考题 情感 态度 价值观 变成“竞赛题”。
• 必要时可增加面试或其他的辅助考试或选拔方法。 逐步实现变单一的书面笔试形式为多种不同的考 试形式,以考查不同形式的能力表现。 • 考试科目的设臵应体现新课程既保证全面基础, 又有利于个性特长的发展的理念。 • 坚持标准分的改革。 • 取消全省一条分数线的做法,按考生群体数划分 数线,或进一步改由各学校根据报名和考试的情 况自定报名的资格和录取分数线。 • 将高考从强调区分的常模参照考试改为强调水平 的标准参照考试。
高考的标准
• 课程标准 • 考试大纲 • 范例样题
前述三方面的标准,第一和第二 方面规定了考试的范围,对考试 的深浅程度却难以规范。第三种 比较具体,但却不是一种相对稳 定的标准。实际上,由于高考是 一种常模参照的考试,它采用的 是一种以全体考生为参照的相对 标准,没有绝对的标准要求,其 实际标准也就随考生水平的变化 而水涨船高。这是目前的高 考所存在的严重问题之一。
分数与测验结果的解释
• 分数:用以表示测量结果的量
– 分数单位的模糊性 – 分数单位的等值要求 – 等级制和百分制
• 等级制更适应测验对象的模糊性,反映测验者水平的质的差异, 适用于水平参照的测验 • 百分制有较为细致的分数单位和基本连续的分数分布,适用于 常模参照的测验
• 测验结果的解释:
– 以考生群体为标准:常模参照 – 以相对稳定的目标要求为标准:目标参照 – 从选拔的角度来看,高考是常模参照的测验;但是, 高考不能脱离中学教学的基本要求,在一定程度上要 以课程目标为参照。因此,不能说高考是纯的常模参 照测验。
教育评价的内涵
• 在教育的领域对教育的政策方针、管理行政、课程教学、教师发展等 等各个方面进行评价。
– – – – – –
– – – – – – –
目的在于促进学生、教师和学校以至整个教育事业的发展; 以国家的教育方针政策为依据,以教育的目标为标准; 包括量和质两个方面的方法; 包括对教育过程与教育效果进行评价; 通过规范而有效的程序收集数据和资料,作出判断; 评价的结果有鉴定、诊断和导向的意义。
高考改革的切入点
• 将考试分为基础考试和能力考试两部分:基础考 试以考查学生对基础知识的了解和相应的基本技 能为主,保证考生具有全面均衡的基础知识;能 力考试着重考查学生的能力,区分学生的不同水 平。 • 逐步减少封闭式试题的权重,增加开放式试题的 权重;适当提高试题的灵活性与综合性。 • 加大对评分的投入和研究,逐步减少开放式试题 的评分误差。
现行高考制度的正面作用
• 高考是世界各国普遍采取的选拔方法之一。 • 统一高考是新中国成立以后采取的一项重要措施,大大提 高了行政效率,为方便了考生的应考和高校的选拔。 • “文化大革命”的历史教训告诉我们,取消高考带来的是 高等教育的沦落和整个教育体系的崩溃。 • 恢复高考是打倒“四人帮”以后,教育战线拨乱反正的头 件大事,给惨遭文革摧残的教育系统带来重生,给逐步恢 复的中小学教学秩序的带来稳定和保障。 • 高考有严密的规范程序和公开统一的标准,是公众心目中 一块保持社会公平公正的“绿洲”,对整个社会稳定起到 一种不可或替的作用。 • 高考为青少年学生树立了一个具体的人生奋斗目标,对青 少年的成长有积极的激励作用
学校的评价 课程的评价 教材的评价 教学的评价 教师的评价 学生的评价 学习的评价
• 在比较狭义的范围内,教育评价通常关注的是:
教育评价的主要功能
• 导向功能
– 引导评价对象朝着理想的目标前进
• 鉴定功能
– 认定判断对象所达到的水平和质量
• 改进功能
– 促进评价对象改进和完善其行动
• 调控功能
– 通过反馈对评价对象的活动进行调节和控制
模型
可信?
评价 方法
可行?
评价的解释
以教育目标 为参照
高考是一种以同辈为参照(常模参照)的 考试,这就要求我们以常模为基础进行计 分,而不是以绝对水平为基础进行计分。 当然常模参照的考试和目标参照的解释并 不是非此即彼、互不相容的两个对立面, 高考的第一需要是按考试结果对考生排队, 这时应采用常模参照的计分方法。高考的 结果又可以用来检查高中教学中存在的问 题,这时应利用水平参照的计分方法。