教育测量与评价期末复习题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章质量特性
1、教育测量与评价包括哪四度?考虑方案的可用性。(P86)信度、效度、难度、区分度
一、信度
1、概念、分类
2、模型X=T+E,反映的是误差
信度反映的是()
A、高低分B、误差C、难易程度D、有效性
3、具体估算
⑴异质性信度:
重测信度:用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。(假设测量的潜在特质短期内不会随着时间推移而改变)
②著名的测量与评价领域人及名言
格兰朗德(N.E.Gronlund)认为,评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测量)两方面。
“教育测量与评价是所有成功教学的基础”。
斯塔费尔比姆说,“评价最重要的意图不是为了证明,而是为了改进。”
SE=
公式中SE为测量的标准误,S(x)是所得分数的标准差,r(xx)为测验的信度系数,从公式我们可以看出测量的标准误与信度之间有互为消长的关系:信度越高,标准误越小,信度越低,标准误越大。
⑵通过与标准误关系估算真分数范围(计算题)
二、效度
1、包括哪些?
①APA:1974年美国心理学会为了规范效度研究,把效度分为三类内容效度、结构效度和效标关联效度。
②定量定性:
逻辑效度:内容效度又称逻辑效度、表面效度,是指项目对欲测的内容或行为范围取样的代表性程度,即测量内容的适当性和相符性。成就测验和熟练测验特别注重这种效度。
统计效度:是指实验数据确实表示自变量与因变量的因果关系,这种关系不是偶然的。
2、内容效度(概念、结合测验蓝图编制:双向细目表)
3、效标关联效度
3、相关概念
①教育测量与评价关系
②测验与考试:测验是测量的工具。测验的概念比考试的概念更广泛,教育测验包括教育考试。测验或考试解释教育测量与评价的一种工具。
二、历史发展
1、著名的测量与评价领域人及名言
①桑代克“无论什么东西,只要存在的,总存在于数量之中。”
②麦柯尔(W.A.Mecall)“任何东西,存在于数量中的,都可以被测量。”
一、从不同的角度分为哪些类型
1、从运用时机分为形成性测量与评价、诊断性测量与评价、终结性测量与评价
2、按解释测量结果或评价结果时的参照点分类
常模参照测量与评价(例如高考)、标准参照测量与评价、潜力参照测量与评价
二、教育测量与评价四大功能
教育判断的功能、改进教师教学的功能、促进学生学习的功能、行使教育管理的功能
克龙巴赫(cronbach)系数
α为信度系数,n为测验题目数,S2i为每题各被试得分的方差,S2t为所有被试所得总分的方差。
一般来说,该系数愈高,即工具的信度愈高。在基础研究中,信度至少应达到0.80才可接受,在探索性研究中,信度只要达到0.70就可接受,介于0.70-0.98均属高信度,而低于0.35则为低信度,必须予以拒绝。
④量表的概念,按测量精确程度分为哪四种。
心理学家史蒂文斯根据测量的精确度,把量表从低级到高级分成称名量表、顺序量表、等距量表、比率量表四中水平。
教育测量:一方百度文库不像物理特性那样明确,领一方面他们有一直受人心理活动的影响,同时他们的测量只能是对外线行为和反应的取样分析加以推断,这就使教育测量的对象具有模糊性和不确定性。
问题:请列举教育测量与评价领域三个重要人物及名言
三、学科地位和作用
1、当今教育科学研究的三大领域:
教育及版本理论研究、教育测量与评价科学研究、教育发展理论研究
2、教育测量与评价在教育改革中的作用
①教育系统中的组成部分
②改革突破口
3、教育测量与评价是教师的专业素养和能力
第二章教育测量与评价的类型和功能
克隆巴赫系数公式α﹦(n / n -1)(1-∑Si2/St2)
⑶百分比一致性(标准参照测验的信度):PA(percent agreement)指同一测验或两平行测验先后两次施测,其对被试的分类结果一致的比例。
⑷评分者信度(相关系数):多个评分者给同一批人的答卷进行评分的一致程度。
4、信度运用
⑴测量标准误SE:指测验中所得测值偏离真分数的程度
复本信度:在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但测试又不是相同的测试。也称作平行测验。
⑵同质性信度(内部一致性信度):测验内部所有题目间的一致性程度,即一个测验所测内容或特质的相同程度。
分半信度:讲一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
①效标:是测验效度的参照标准,用以显示测验所欲测量的特性的变量,通常以一种测验分数或活动来表示。
②相关计算法
三、区分度与难度
1、区分度:题目区别被试水平能力的量度,常记为D
难度:被试完成题目或项目任务时的困难程度。
2、计算
难度:
P=X/M(X为试题平均得分;M为试题满分)
P=1—R/N R为答对人数,N为全体人数。
测量对象的模糊性和测量误差的不可避免性:凭借学生之间成绩的微笑差异,判定或排列学生的能力高低名次,其证据是不充分的。
问题:教育测量与物理测量的区别是什么?
物理测量:通过发展精良的测量工具,按照科学的测量方法和规范的测量程序,我们完全有可能吧物理量的测量误差控制在人次那个的误差范围内。而教育测量则不然。
量表具有多样性,结果具有相对抽象性:在教育测量中,按照标准化程序命制的试卷就是教育测量的一种量表。由于教育测量对象的复杂性和多样性,以及制定教育测量量表的类型和精确度不同,使得教育测量量表具有多样性。
2、教育评价
①教育评价概念:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
第一章教育测量与评价的学科发展
一、测量与评价基本问题
1、教育测量
①测量三要素:量具、测量的单位、测量的参照点
②教育测量概念:针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。
③教育测量的特点:
间接性和推断性:对人的知识技能、智力水平、思维品质、创造能力、心理素质、情感态度、思想道德等作出间接性的推断性的测量
极端分组法:P=1—(PH+PL)∕2
相关文档
最新文档