教育测验的常模及建立方法

合集下载

教育测验编制的一般步骤与方法

教育测验编制的一般步骤与方法

缺点:
1.不易编制,且花费时间较多。 2.易受考生阅读能力的影响。 3.难以排除考生对试题的随机猜测。 (二)客观题命题的一般原则 1.试题能反映教学内容的重点或知识 点。
2.题目之间的相关性越低越好。 3.试题的文字力求浅显易懂、题意明 确。
2020/3/27 4.答案应该是明确、唯一的。
(三)不同类型选择题的命题原则
3
1
1
1
0
第四章 溶液 6
3
3
1
8
第五章酸碱盐 4
3
3
5
2
合计
26 12 13 14 18
评价
2 2 2 6 5 17
合计
22 21 8 22 22 100
由上图可见,命题双向细目表由3个要素组成:
测验目标、测验内容以及二者的比例,即权重。权
重代表了这部分内容的相对重要性。
2020/3/27
◆在真实的命题中,一般遵循如下顺序:
内容范围 3 1 5 3 2 2 2 15
内容范围 4
3444
15
内容范围 5 1 6 2 3 3 2 17
合计
6 32 24 16 14 8 100
2020/3/27
例 1 初中化学内容与教学目标细目表
测验目的 测验内容
知识 理解 运用 分析 综合
第一章 氧
6
3
4
4
3
第二章 氢
7
2
2
3
5
第三章 碳
① 测验材料要适合测验目的
② 测验材料要能够代表该科教材的全部 内容(测验材料要有合理的覆盖面,突出 基本内容及重点内容,比例参照命题双向 细目表)
③ 测验材料要有普遍性(要依据统一的 教学大纲)

教育测量与评价 第二章 教育测验的编制.

教育测量与评价 第二章  教育测验的编制.

• 一、确定测验的目的
• 1、确定测量对象
• 2、确定测量目标(一般要将目标转 化成可操作的术语)
• 3、确定测量的功用(常与评价目标 结合在一起)

如是诊断性测验还是选拔性测验。

• 二、分析测量目标并制定编题计划
• 美国心理学家布鲁姆(Bloom) 最早 提出教育目标的分类问题。他把学习的 心理活动过程分成认知、情感二个领域。 又把认知领域具体分为知识(记忆事实、 条件、方法、原理等的能力)、理解、 应用、分析、综合、评价六个层次。
• 1.2 愿意承受特定刺激的行为 • 1.3 控制或选择的注意,是指有意识或
半意识的从内容或情境中辩别某种特定 的刺激.
2 反应所关心的是学生受到动机的充分驱 动,积极地注意学习内容
• 2.1 默认的反应,这种反应强调行为的 被动性,一般产生遵从或顺从.
• 2.2 愿意的反应,学生完全致力于表现 自己的行为,是自己想做或自愿去做.
• 9、所提问题应避免涉及社会禁忌与隐私。
• 10、施测与评分省时。
• 二、测题的种类及编制要领
• 根据应答方式,测题的种类分为两大类, 即自由应答型和固定应答型。自由应答 型题目是让受测者用自己的语言或行动 来对某一问题做出回答,包括填充题、 简答题、应用题、论文题、联想题、操 作题等。固定应答型题目又称客观性题 目,是让受测者从测验编制者事先定好 的答案中辩认出一个正确答案,包括了 多选题、是非题、匹配题等。
气象 宇宙 地球 合计
识记
3 2 2 5 2 2 2 18
理解
5 3 3 6 4 5 2 28
应用 分析 综合
632 311 420 832 322 410 211 30 13 8

心理测量学:测验的常模之常模的类型

心理测量学:测验的常模之常模的类型

心理测量学:测验的常模之常模的类型:㈠发展常模(又称年龄量表):⑴发展顺序量表:①葛塞尔发展程序量表(发展顺序量表最早的一个范例。

16周能使头保持平衡,28周能用手抓握东西并把玩,40周能控制躯干、坐立、或爬行,52周能控制腿脚运动、站立和行走)②皮亚杰的守恒概念(5岁理解质量守恒,6岁掌握重量守恒,7岁有容量守恒)⑵智力年龄(又称智龄。

吴天敏的比内-西蒙量表智龄的计算方法:6岁+4×2月+3×2月+2×2月=7岁6个月)⑶年级当量(又称年级量表。

在教育成就测验中最常用。

)㈡百分位常模:⑴百分等级:是应用最广的表示测验分数的方法。

一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比,百分等级指出的是个体在常模团体中所处的位置,百分位等级越低,个体所处的位置就越低。

未分组资料百分等级计算公式PR=100-(100R-50)/N。

⑵百分点:在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。

百分点的计算根据直线内插法(例见P341)。

⑶四分位数:是将量表分成四等分,相当于百分等级的25%、50%和75%对应的三个百分分成的四段。

⑷十分位数:1%~10%为第一段,91%~100%为第十段。

㈢标准分常模:⑴线性转换的标准分数:z分数为最典型的线性转换的标准分数z=(X-)/SD,转换公式Z=A+Bz⑵非线性转换的标准分数:当原始分数不是常态分布时也可以是使之常态化,这一转换过程就是非线性的。

转换为T分数T=50+10。

标准九分是以5为平均数,以2为标准差的一个分量表,最早广泛应用于美国空军和某些教学情境中的分级。

标准十分平均数为5,标准差为1.5;标准二十分平均数为10,标准差为3。

单纯用心理年龄来表示智力的高低的方法缺乏不同年龄儿童间的可比性,因此一般都用比率智商和离差智商来表示智力的高低。

⑴比内-西蒙量表由美国斯坦福大学推孟教授于1916年对其修订而成斯坦福-比内量表,其中以比率智商(IQ)表示结果IQ=MA/CA×100IQ等于100代表正常,高于100代表发展迅速,低于100代表发育迟缓。

教育测量与评价课件(7)(第七章 教育测验“标准”及其建立方法)

教育测量与评价课件(7)(第七章 教育测验“标准”及其建立方法)

标准参照测验分数解释方法之二:掌握分数
无论是针对每一教学单元的形成性测验,还是针对一门课程的终结性测 验,如果要了解与判断学生是否掌握所学的内容,我们就要编制一份有内容效 度的教育测验,并且事先定出一个可接受的最低标准。这个标准是人为确定的, 它可以是百分制评分量尺上的某一人点,也可以是80%-90%的正确反应 所对应的分数,作为最低通过标准。这个分数就是所谓的掌握分数。以它作为 判断标准,把所有的学生区分为掌握和未掌握两类。 对于掌握分数,应注意以下几点: ① “掌握”与“未掌握”是人为确定的。 ② 从知识的掌握状态来讲,事实上更应该是一种连续模型。因此,把学 生区分为“掌握”与“未掌握”两类,在许多情况下的确是迫不得已的办法。 ③ “掌握”、“及格”或“合格”的概念类似,但有区别。 ④ 当利用测验的掌握分数给学生进行二分类时,对于不同的年级、不同 的课题内容、不同的测验乃至同一测验中不同的分测验,人为规定的掌握分数 也未必相同。
(2)美国IOX模式
① 一般描述:是对测量的领域进行一般性的、简明扼要的描述。 ② 样本题目:是给出一个带有指导性与限制性的测验题目的具体例子。 ③ 刺激的界定:是对题目的内容、素材、难度、广度等因素作出更为明确的规
定。
④ 反应的界定:是对被试者如何作答题目的方式,包括正确答案与错误答案的 区分准则等方面作出规定。 ⑤ 其他补充说明:若有必要时,对界定测验内容领域所涉及的有关问题作出交 待或补充说明。
(② 目的; ③ 评价目标 ④ 内容或核心内容; ⑤ 评价目标和内容的关系; ⑥ 评价技术; ⑦ 等级描述。
编写测验内容领域规范的方法(二)
(4)我国高中毕业会考标准的建立模式
① 制定各学科考试大纲; ② 使用参照试卷进行取样测试,建立高中毕业会考的标准分量表: T 85 15Z ; ③ 根据分数,把高中毕业会考成绩确定为五个等级; ④ 编制与参照试卷大体平行的会考试卷; ⑤ 在保密的状态下,抽取有代表性的样本,随机分成两组,分别用会考试卷和参 照试卷进行测试,取得数据; ⑥ 在会考试卷原始分数和参照考试卷原始分数建立等值对应关系; ⑦ 根据每位高中生的会考成绩,经分数转换表,便可得知会考的等级分数。

教育测量标准及其建立

教育测量标准及其建立

②要有将测验分数和效标之间的关系结合起来 的方法,如转换图表。 例如,如果一个学生在大学入学考试委员会的 学术测验(SAT)上得530分,他在一所具体 大学的一年级平均成绩处于A、B、C、D、F等 类的可能性各是多少?考察预测分数(SAT) 对效标成绩(一年级平均成绩)的双变量分布, 就能获得这类信息。

(三)结果参照分数
结果参照又叫效标参照。它是将效标材料直接结 合到测验结果的解释过程中。这种分数适合于用 测验来作预测的情况。 例如,高考平均分数在80分(各科满分为100 分)以上的人,我们可以预测其入大学后的学 习成绩将为优等。这里,是用结果来解释测验 分数,而不是用常模和内容来解释。 要得到结果参照分数必须有两个前提条件: ①需要有效度证据,即测验分数必须与一个重 要的效标具有高相关。

如果把这种双变量分布的每个单元的人数转换 成百分比,结果就是期望表。 例:预测分数是第一学期末 “区别能力倾向测 验”中的数推理测验(DAT),效标则是第二学 期最后一次考试的课程成绩。数据从211名六 年级学生中得出。测验分数和效标的相关是 0.60。 :(见下表)。

表:211名六年级学生DAT数推理测验 与数学课程成绩之间的关系
DAT 分数
≥30
20~29 10~19 ≤9
人数
22
104 71 14
数学课程成绩的百分比
≤D C B A
5
9 37 43
0
21 36 36
36
43 24 14
59
27 3 7
三、测验分数的解释
4.3.1 如何看待测验分数的意义 4.3.2 如何向受测者报告测验分数
(一) 如何看待测验分ห้องสมุดไป่ตู้的意义

第四章教育测验结果的整理与解释

第四章教育测验结果的整理与解释
33
• E= W1 P1%+ W2 P2%+ W3 P3% • =40×80%+40×50%+20×20% • =32+20+4 • =56(分)
34
第五节 标准分数在我国高考中的试点应用
• 一、建立标准分数制度是高考标准化的重 要环节
• 高考引入标准化考试的改革试验始于1985年 – 标准化考试阶段 – 分数的解释和使用标准化阶段
40
第六节 教育测验分数的解释
• 一、测验分数的理解
• 1.解释测验分数的类型 – 叙述、溯因、预测、评价
• 2.资料处理的方法 – 机械的处理与非机械的出来
• 3.资料的来源 – 测验资料与非测验资料
41
二、解释测验分数意义的原则
• 1.主试应充分了解测验的性质与功能; • 2.对导致测验结果的原因的解释应慎重,谨防片面
17
• 一、标准分数的概念
– (一)概念 – 将原始分数与平均分的距离以标准差为单位
表现出来的结果即为标准分数。 Z XX S
18
• (二)特点
– 一批原始分数转换为一批Z分数后,这批Z分数的均 值为0,标准差为1。Z分数大于0,表示测验成绩在 平均分之上。 Z分数小于0,表示测验成绩在平均分 之下。
– 标准分数Z量表是等距量表。 – 在一般情况下,Z分数的取值范围在-3到+3之间。
19
• 二、原始分数向标准分数的转换
– (一)线性转换的标准分数
– 公式如下:
Z XX S
– 式中:X为任一原始分数,X 为平均分,S为原
始分数的标准差。
20
• 例:学生甲在某次语文考试中的得分为72分, 全班的平均成绩为60分,标准差为12分。求甲 的标准分数?

教育测量与评价课件(6)(第六章 教育测验的常模及其建立方法)

教育测量与评价课件(6)(第六章 教育测验的常模及其建立方法)


348 350
就原始分数而言,应该优先录取乙生(甲生总成绩(348)低于乙生总 绩(350)),这一结论是不科学的。因为原始分数单位不同,因此不能比 较,也不能合并。但把原始分数转换成标准分数后,单位相同,因此就可 以合并成总成绩进行比较。就标准分数而言,应该优先录取甲生(甲生的 总成绩(2.5)高于乙生的总成绩(1.505))。
在高考中使用原始分数的局限性
原始分数是未经任何处理或转换的分数,是考生在一份试 卷所得的卷分数。我国高考一直沿用原始分数制度,原始分数从作答率
或通过率方面反映考生已取得的成就水平,但存在如下局限性: ① 原始分数未能反映考试分数相对于团体的位置信息; ② 不同科目或同一科目不同考试之间分数可比性较差; ③ 各科标准差不一影响对科目权重的设计。
标准九分与其他评分制相互关系 标准九分 9 8 7 6 5 4 3 2 1 Z分范范围 + 1.75以上 + 1.25—+ 1.75 + 0.75—+ 1.25 + 0.25—+ 0.75 –0.25—+ 0.25 –0.75—–0.25 –1.25—–0.75 –1.75—–1.25 –1.75以下 百分等级范围 96—100 89—95 77—88 60—76 41—59 24—40 12—23 5—11 1—4 标准九分个案百分比(%) 4 7 12 17 20 17 12 7 4
(2)其他多点评分量表 除了上述标准九分量表外,还有标准十分、标准十五分和标准二十分量 表等,它们在本质上都是基于百分等级的多点(等级)评分量表。
标准分数使用的条件
标准分数的使用是基于常模数据服从正态分布的假设。只有在正态分布 之下使用标准分数,才能充分体现标准分数的优越性与内涵(标准分数Z与百 分等级PR之间存在着一定的关系)。 但是,在实际测试过程中,很可能碰到常模团体的测验分数严重偏态, 这种情况下若要直接使用上述的标准分数体系来建立常模就不大妥当。而一 种可行的办法是先对测验分数分布进行正态化处理,尔后再建立标准分数常 模。其主要步骤如下: ① 根据常模团体的测验分数次数分布表,建立起原始分数{ Xi }与百分 等级PRi 之间的一一对应关系; ② 利用正态分布面积表,从已知的每一个百分等级PRi 反查其对应的标 准分数Zi ,从而间接实现了从{ Xi }到{ Z i }之间的变换; ③ 根据需要选择公式 T a bZ 中的 a 与 b 两个常数,通过公式再次实 现{ Z i }到{ T i }之间的线性变换。从而建立正态化标准分数常模。

7教育测验的常模及其建立方法

7教育测验的常模及其建立方法

一、什么是常模?
? 在教育测量学中,测验的常模指一个有代表性的样组 在某种测验上的表现情况,或者说,是一个与被试同 类的团体在相同测验上得分的分布状况与结构形式。
? 例如:在某地区范围内按一定的方法选取 600名小学四年级学生 参加语文阅读理解水平测验,据此得到这个测验的常模资料。
? 参照测验的常模,对测验的分数进行解释与评价实质 是通过考查个体的心理特质在某一群体所有成员中的 相对位置,来衡量和评价该个体的心理特质。
Zi
?
Xi ? S
X
i ? 1,2,..., N
X与S分别表示常模团体中的 N个被试在该测验上的平
均分数和标准差。
从定义式可知:标准分数是一种以平均数为参照,以 测验分数的标准差来衡量原分数在其常模团体中地位 高低的评定方法。
? ? ? 其中,S ?
1N N i?1
2
Xi ? X
n
? X ? x1 ? x2 ? ?
数序列 ?Xi? 和标准分数序列 ?Zi?之间或者与标 准分数 ?Ti?之间,建立起对应关系,从而形成
某种测验的标准分数常模,以便解释其他分数。
标准分数常模示例
原始分
量表分(T=50+10Z)
原始分
量表分(T=50+10Z)
100
69
70
60
90
66
60
57
80
63
50
54
标准分数Z的性质和特点
1. 任何一批原始分数,转化为Z分数后,这批Z分数的平 均值为0,标准差为1。Z>0表示测验成绩在平均数之上, Z<0表示测验成绩在平均数之下,Z=0表示测验成绩与 平均数相等。
建立年龄常模资料的方法: 1)基于不同年龄组测试所得的平均分,并与相应的年龄

教育测验的常模及其建立步骤

教育测验的常模及其建立步骤

二、标准分数
• (一)定义 : Z X X S
• (二)性质:平均数为0 ,标准差为1 • (三)应用
比较同一个体不同科目的成绩
例如:对某校高二学生进行期中学习质量 检测,语文、数学和英语成绩的平均数分别 是80分、70分和85分,这三种成绩的标准 差分别是10分、15分和12分。某学生的三 科成绩分别是85分、82分和90分,问:该 生这三科成绩哪一科最好?
– 包含年级常模和年龄常模
• 组内常模
– 同一身份的人在某种测验所测特性上的一般 表现水平
– 包含百分等级常模和标准分数常模
一、年龄常模
• 人的某些能力特性,在某个年龄阶段随着年 龄的增长逐渐发展变化
• 不同年龄组其能力变化的差异有统计学上的 显著意义
• 年龄常模多用于少年儿童阶段,尤其对义务 教育的意义很大
180 160 140 120 100 80 60
40 20
0
4 8 12 16
20
24 28
32 36
年级量表
将被试的测验成绩与某一年级的学生的平均分 数做比较,求出被试相当于哪一年级的水平。
年级当量的表述方式常常是:某学生的算术是 6年级水平,阅读是4年级水平,理解是5年级 的水平等。这种表述的依据是把被试的测验得 分与各年级的平均得分相比较。
成绩的影响不计 • 例如,四年级中期成绩
数学-5.5,语文-5.0, 阅读-6.0,英语-4.5 • 不同时期,不同学科,单位不相等 • 一般水平,而非优秀水平
3~8年级阅读测验的年级当量
• 绘图:12月初和次年5月各年 级的平均分
• 查表
三、年级常模和年龄常模的局限性
• 许多身心特性发展在某年龄段中速度不 一

教育测量与评价期末复习题

教育测量与评价期末复习题

第一章教育测量与评价的学科发展一、测量与评价基本问题1、教育测量①测量三要素②教育测量概念:针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。

③教育测量的特点问题:教育测量与物理测量的区别是什么?④量表的概念,按测量精确程度分为哪四种。

2、教育评价①教育评价概念:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。

②著名的测量与评价领域人及名言格兰朗德(N.E.Gronlund)认为,评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测量)两方面。

“教育测量与评价是所有成功教学的基础”。

斯塔费尔比姆说,“评价最重要的意图不是为了证明,而是为了改进。

”3、相关概念①教育测量与评价关系②测验与考试二、历史发展1、著名的测量与评价领域人及名言①桑代克“无论什么东西,只要存在的,总存在于数量之中。

”②麦柯尔(W.A.Mecall)“任何东西,存在于数量中的,都可以被测量。

”问题:请列举教育测量与评价领域三个重要人物及名言三、学科地位和作用1、当今教育科学研究的三大领域2、教育测量与评价在教育改革中的作用①教育系统②改革突破口3、教育测量与评价是教师的专业素养和能力第二章教育测量与评价的类型和功能一、从不同的角度分为哪些类型例如:1、从运用时机分为-------?2、形成性测量与评价?3、形成性测量、诊断性测量与评价和总结性测量与评价区别?二、教育测量与评价四大功能教育判断的功能、改进教师教学的功能、促进学生学习的功能、行使教育管理的功能第三章质量特性1、教育测量与评价包括哪四度?考虑方案的可用性。

(P86)一、信度1、概念、分类2、模型 X=T+E,反映的是误差信度反映的是()A、高低分B、误差C、难易程度D、有效性3、具体估算⑴异质性信度:重测、复本概念⑵同质性信度:分半信度克龙巴赫(cronbach)系数①概念②区别③相关系数⑶百分比一致性(标准参照测验的信度)⑷评分者信度(相关系数)4、信度运用⑴测量标准误概念⑵通过与标准误关系估算真分数范围(计算题)二、效度1、包括哪些?① APA:1974年美国心理学会为了规范效度研究,把效度分为三类内容效度、结构效度和效标关联效度。

现代教育测量与评价学 名词解释 知识点

现代教育测量与评价学 名词解释 知识点

06231《现代教育测量与评价学》-- 名词解释知识点第一章教育测量与评价的学科发展测量:根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。

P2 2013年4月教育测量:教育测量就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。

P3 2005年4月量表(量尺):是确定了测量单位和参照点并具有取值系统的测量工具。

P4 2016年4月称名量表:是最低水平的一种量表,用来对事物或人的心理现象进行分类。

顺序量表:也是用来对事物或人的心理现象进行分类,但这种分类是以所测属性的数量大小为基础进行的。

等距量表:不但能在一个连续体上表示事物量的大小,而且具有相同的测量单位。

等距量表的零点是相对的,即人为确定的相对零点。

比率量表:除了具有量的大小和相等单位外,还具有绝对零点。

比率量表是最高水平的量表。

评价:广义地讲,评价泛指衡量、判断人物或事物的价值。

P5教育评价:(广义的)是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。

P7 2010年4月考试:(广义的)泛指人类社会一切测度和甄别人的身心各个方面之群体或个体差异的活动。

P9考试:(狭义的)指由主试根据一定社会的要求,在一定场所,采取一定的方式方法,选择适当的内容,对应试者的德、学、才、体诸多方面或某方面所进行的有组织、有目的的测度或甄别的活动。

教育考试:在学校教育与人才选拔的过程中,教育考试是根据教育内容和目标,选择有代表性的内容和问题,按照一定的方式,对应试者的知识、技能等进行测量与评价的过程。

第二章教育测量与评价的类型和功能形成性测量与评价:是在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。

P34 2012年4月诊断性测量与评价:是对经常表现出学习困难的学生所做的测量与评价,它的目的是对个人的问题行为及其原因进行诊断。

教育测量与评价 复习要点 附试卷

教育测量与评价 复习要点 附试卷

教育测量与评价复习要点总结第一章教育测量与评价的学科发展1.测量的三要素:2.教育测量3.教育测量的特点4.史蒂文斯根据测量的精确度将量表分为:5.教育评价的概念6.桑代克在《精神与社会测量导论》中提到:无论什么东西,只要存在的,总存在与数量之中。

7.八年研究的四条基本原则:8.八年研究中泰勒提出了以全面发展的教育目标为核心和依据的两条原理:课程编制原理和评价活动原理。

9.教育测量与评价理论的发展:统计模型提供强有力的支持,20世纪60年代以来:经典测量理论(CTT),项目反应理论(IRT)和概化理论(GT)。

第二章教育测量与评价的类型和功能1.教育测量与评价的主要类型:1)按运用时机分:形成性测量与评价;诊断性测量与评价;终结性测量与评价2)按解释测量结果或评价结果时的参照点分类:常模参照测量与评价;标准参照测量与评价3)按测量与评价被试行为表现的性质分类:最佳行为测量与评价;典型行为测量与评价4)按量表的标准化程度可分为标准化测验和非标准化测验2.教育测量与评价的主要功能: 1)实现教育目标的功能2)改进教师教学的功能3)促进学生学习的功能4)行使教育管理的功能第三章教育测量与评价的质量特性1.信度2.重测信度3.复本信度、内部一致性信度(同质信度)、异质测验4.效度、应注意以下几点5.结构效度验证的四个步骤6.教育测量方案的可用性第四章编制教育测验的一般原理和方法1.选择题的优缺点2.选择题的编写原则:1)题干意义完整并能表达一个确定的问题;2)题干简明;3)题干不要滥用否定结构,要尽可能地采取正面陈述;4)诱答项(干扰项)应具有似真性;5)不能对正确答案有任何暗示;6)统一测验中每一个测验试题之间应相互独立避免牵连;7)选项的文字表达,力求简短精炼;8)尽量避免“以上皆是”“以上皆非”的选项3.填空题的编制原则:1)题意要明确、限定要严密,使空白处应填的答案是唯一的;2)空白处所填写的应是关键词语,并且要和上下文有密切的关系,使被试不至于填写困难;3)题目中空白地方不能太多,以免句子变得支离破碎,不利于被试理解题意;4)尽量将空白放在句子的后面或中间,而不要放在句子开头;5)所有空白处的线段长度应当一致,不能随正确答案文字的多少而长短不一,以免产生暗示作用;6)若答案是数字,应指明单位和数字的精确程度。

教育测量的基本方法

教育测量的基本方法

教育测量的基本方法教育测量与教学评价是教学活动的重要组成部分,是在教学领域中进行科学管理的重要手段,合理地开展测量评价活动是提高教育质量的有效保证.一、基本概念1.教育测量教育测量有广义和狭义之分.从广义上说,教育测量泛指运用测量手段对教育活动所进行的量的测定。

它涉及的范围很广,凡是需要并能够测量的与教育有关的活动均在研究之列,如教育投入、教育过程各要素、教育的效果等。

从狭义上讲,教育测量专指按一定规则对学生的知识、智能、个性发展、思想品德等所进行的量的测定。

通常所提及的多是狭义上的教育测量。

2. 教学评价教育评价是按照一定标准,运用科学可行的方法,对教育活动所进行的价值判断的过程。

它包括对教学过程和教学效果的评价,诸如学校、教师的教学工作、课堂教学、教学方法、模式和内容以及学生的学业成就、一般智能发展、个性发展、思想品德状况等评价。

3.测验及其种类测验是指对通过一定的仪器和试题所引起的受测者的行为样本进行测量的系统程序。

教育测量的对象和内容是非常丰富的,测验作为教育测量的主要工具,种类也很繁多,可按不同标准加以分类。

按测验的功用分类(1)学绩测验;(2)能力测验;(3)人格测验。

按测验的目的分类(1)诊断性测验;(2)形成性测验;(3)终结性测验。

诊断、形成、终结三种测验对照表按解释分数和方法分类(1)常模参照测验指参照被测群体的实际水平解释分数的测验叫做常模参照测验。

群体的平均分数一般可以反映群体的水平,称为常模。

以常模为参照点,将被测个人的成绩与常模比较,并把比较结果所反映出来的差异数量化,作为导出分数。

参照常模解释分数,便于比较和选拔工作的进行,它属于相对评价的范畴。

例如,在升学考试中,按标准化的要求进行的分数转换就是参照常模得出的。

(2)目标参照测验参照被测达到目标的程度来解释分数的测验,叫做目标参照测验,也称作标准参照测验。

通过与特定的标准进行比较,了解被测的达标程度,这是一种绝对评价方法。

第七章 测验编制的方法和步骤

第七章 测验编制的方法和步骤

11 3 2
5 0 1 1 0 2 2 2 3
P 0.9
0.65 0.55
0 . 12 5
D 0.2
0.3 0
0
0 .2 5
第二节 试测和测题筛选
(二)测题难度和区分度的应用 尽可能选择区分度在0.3以上的测题。 尽可能选择区分度在0.3以上的测题。 0.3以上的测题 根据测验的目的选择不同难度的题目。 根据测验的目的选择不同难度的题目。常模参照测 验一般难度应在0.2 0.8之间 难度分布接近正态分布。 0.2— 之间, 验一般难度应在0.2—0.8之间,难度分布接近正态分布。 为此,可将测题难度和区分度列成双向表, 为此,可将测题难度和区分度列成双向表,与测验难度 分布计划进行比较,决定测题的筛选。 分布计划进行比较,决定测题的筛选。 根据测验的双向细目表考查所选测题是否符合测验 内容和目标层级的分布要求。 内容和目标层级的分布要求。
拟定测验编制计划 试测和测题筛选 测验的评价
第七章 测验编制的步骤和方法
第一节 拟定测验编制计划
教育测验多种多样,编制测验的方法, 教育测验多种多样,编制测验的方法,也相应依测验 的性质而异。但是,不管什么样的教育测验, 的性质而异。但是,不管什么样的教育测验,其编制过程 一般均遵循类似的基本程序:测验目标与测验内容的确定; 一般均遵循类似的基本程序:测验目标与测验内容的确定; 测验的设计;测验的技术分析; 测验的设计;测验的技术分析;测验的鉴定或称测验的评 价。
第三节 测验的评价
一、评定测验的信度和效度 二、建立测验量表 三、编写测验说明书 测验说明书是测验能正确、合理地实施与应用的保证。 测验说明书是测验能正确、合理地实施与应用的保证。测验说明书 应包括以下内容: 应包括以下内容: 测验的编制人、编制时间、 (1)测验的编制人、编制时间、测验的法定权益 (2)测验的目的和功能 (3)测验选题的依据 测验的实施程序、 (4)测验的实施程序、时限及注意事项 (5)测验的评分标准 (6)测验分数解释的依据 测验的信度、效度资料,包括信度系数、 (7)测验的信度、效度资料,包括信度系数、效度系数及其估计 方法。 方法。

(完整word版)《教育测量与评价》教案

(完整word版)《教育测量与评价》教案

《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展[教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。

[重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。

难点:数学教育测量和教育评价的含义及二者之间的关系。

[教学时数]讲授2课时,课堂讨论、学生自主学习1课时[教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合第一节数学教育测量与评价的基本问题一、数学教育测量与评价的含义二、教育评价的基本问题三、教育评价相关概念辨析第二节数学教育测量与评价的发展历史一、中国是考试制度的发源地二、中国科举制度的世界地位三、数学教育测量学科的诞生四、数学教育测量运动的蓬勃开展五、美国的“八年研究”是教育评价的催生剂六、数学教育测量与评价理论的发展第三节数学教育测量与评价的学科地位和作用一、数学教育测量与评价是现代教育科学研究的三大领域之一二、数学教育测量与评价在教育改革中具有重要的作用三、教育改革呼唤数学教育测量与评价更加科学化四、数学教育测量与评价是教师的专业素养和能力[课堂训练、作业思考题][1]数学教育测量与评价有什么联系与区别?[2]教育评价与教育评估有什么联系与区别?[3]在学科专业分类中,“数学教育测量与评价”放在哪一个类别中比较合适?[4]试分析一下,狭义、中义与广义的教育评价概念有何区别?[5]怎样使用数学教育测量与评价这个概念?[6]为什么说数学教育测量与评价在教育中有重要的作用?[7]为什么说数学教育测量与评价是教师必备的知识技能修养?[8]基础教育课程改革对考试评价制度改革提出哪些要求?第二章数学教育测量与评价的类型和功能[教学目的与要求]掌握数学教育测量与评价的不同标准的分类,了解形成性、诊断性和总结性测验(评价)之间的区别和联系,初步了解常模参照测验和标准参照测验的意义与区别,认识潜力参照测量与评价的意义和特点、最佳行为评价和典型行为评价的意义及其区别,初步领会计算机自适应测验的理念,能够分别阐述数学教育测量与评价在实现教育判断、改进教师教学、促进学生学习、行使等教育管理方面的功能。

教育测验的编制与实施

教育测验的编制与实施
义务教育阶段数学测试中三类常见“错题”: (1)科学性错误,包括概念错误、试题设计不当、表述不当; (2)超出学生知识能力范围; (3)命题技术错误,包括试题类型不当、与试题编制要求相悖以及试题考查目 标不明确。
针对120份调查问卷的分析可知,义务教育阶段数学教师对“错题”的正确识别状况令人担忧: 概念 错误(初中被调查者之中能够识别者占23%、小学被调查者之中能够识别者占87%);设计不当(初 中被调查者之中能够识别者占77.3%);表述不当(小学被调查者之中能够识别者占90.7%);超出 学生知识能力范围(初中被调查者之中能够识别者占79%、小学被调查者之中能够识别者占23%); 试题类型不当(初中被调查者之中能够识别者占17%、小学被调查者之中能够识别者占9%);与试题 编制要求相悖(初中被调查者之中能够识别者占74%);试题考查目标不明确(小学被调查者之中能 够识别者占19%)。
(1)教育测验目的直接影响着测验的编制; (2)明确不同教育测验目的的多重性、差异性; (3)充分考虑测验对象的教育基础与心理特点;
小学儿童思维以具体形象思维为主逐步向抽象逻辑思维主过渡
第一节 教育编制测验的一般原则
二、典型性与一致性原则(高信效度)
内容抽样具有代表性: (1)知识面的涵盖要广 (2)考核层次与教学要求相符合 (3)难度水平符合要求
(6)按测验的功能分类
• 调查测验 • 诊断性测验:主要用来测查学生在各个具体教学内容、
教学目标上学习的长处和不足,鉴别被试在学习功课方 面的困难,分析学生学习困难的原因,并提出相应的补 救措施。 • 水平测验 • 预测性测验 • 准备性测验
(7)按测验的用途分类 • 总结性测验:以测量成绩作为最终产物,目的是
基本方法:动宾结构的短语法,行为动词说明行为的类型,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二节 标准分数常模及建立方法
2、正态分布下若干种评分体系之间的关系
(1)标准九分及其与百分等级和标准分数之 间的关系
1
4
4
标准九分数的分布特点
正态Z分数与标准十的转换方法
——
标准十的分布特点
几种导出分数间的相互关系
3.85 =0.0385*100
(三)建立百分等级常模的方法
1、基于未归类数据建立百分等级常模的方法 第1步:排序(从大到小) 第2步:统计次数(f) 第3步:计算以下累积次数(cf) 第4步:计算 “以下累积相对次数”(cRf) 第5步:确定百分等级(PR) 第6步:形成百分等级常模表
二、教育测验常模的主要类型
发展常模
某类个体正常发展过程中各个特定阶段的一
般水平 包含年级常模和年龄常模
组内常模
同一身份的人在某种测验所测特性上的一般
表现水平 包含百分等级常模和标准分数常模
1.年龄常模
示例:格塞尔行为发展量表(婴儿发育常模)
1.年龄常模
(1)取平均值作为指标 基于不同年龄组测试所得的平均分, 并与相应的年龄当量联系起来构成年龄常 模资料。 (2)用一组题目作为指标 用一批能使某年龄组大多数被试都能 通过的题目来代表该年龄组的发展水平。
2、测验常模注意事项
①有代表性的样组
特定人群
常模团体,在建立测验常模过程中实际受测被试样
组,代表着一个有明确定义的人群。
②测量某种身心特性
特定身心特性
③同一身心特性的测验可能多种多样
特定测验 例如,在某地区范围内按一定方法选取600名小学四年级 学生参加某种语文阅读理解水平测验。
3、常模的用途和导出分数
常模是解释测验分数的参照系 →某学生的测验成绩与其他学生相比如何。 如:丽丽数学成绩在班级是什么水平? →某学生在不同科目测验中成绩相比如何。 如:丽丽数学和语文哪门科目成绩更好? →某学生在同一科目不同形式测验中成绩相比如何。 如:丽丽哪次数学成绩考更好?
3、常模的用途和导出分数
导出分数:以常模团体的原始分数为基础, 用统计学的方法,导出一种新的、具有特 定意义的、能反映个体发展在其团体中相 对位置状况的分数量表或符号系统。 原始分数→参照体系→导出分数
一系列的原始分数(平均值)和与之对应的年级 当量构成该测验的年级常模表。
三年级上学期 月份 九 月 当量 3.0 值 均分 68
三年级下学期
十 十一 十二 一 二 三 四 五 六 月 月 月 月 月 月 月 月 月
3.1 72 3.2 75 3.3 77 3.4 3.5 79 83 3.6 85 3.7 88 3.8 90 3.9 92
分数 59 56 52 50 47 46 44 43 41 40 PR 98.08 96.15 94.23 90.38 88.46 86.53 84.62 80.77 76.92 75.00 分数 39 38 37 36 35 34 33 32 31 30 PR 73.08 67.31 61.54 53.85 50.00 46.15 44.23 38.46 32.69 28.85 分数 29 28 27 25 24 22 21 20 17 PR 25.00 23.08 17.31 15.38 13.46 9.62 5.77 0.00 在这次拼 写测试中, 小明和小花 分别获得50 分和35分, 请分别对两 人的成绩做 出合理解释。
43 41 40
1 1 1 2 1 1 1
2 2 1
51
39 38 37 36 35 34 33
32 31 30
1 3 3 4 2 2 1
3 3 2
29 28 27 25 24 22 21
20 17
2 1 3 1 1 2 2
1 2 2 0 0.0385 =2/52 0.0000
59,56,52,50,50,47,46,44,43,43,41,41,40,39,38,38,38,37,37, 37,36,36,36,36,35,35,34,34,33,32,32,32,31,31,31,30,30,29, 29,28,27,27,27,25,24,22,22,21,21,20,17,17
瑞文推理测验的百分等级常模
百分等级常模可以用于解释学生单一能力 测验的成绩,以便了解该生的能力发展在 其所属团体中的相对位置。 百分等级常模可以用于比较学生在不同学 科上的发展状况。
(三)建立百分等级常模的方法
实例:P133 下面是52名学生在一项拼写测验上的成绩分 布,请建立关于三年级学生此项拼写测验的百分 等级常模。
原始分数——又称观测分数,是观测直接所 得、未经任何加工的数据。
原始分数没有普遍意义,而且不等距。
原始分数的参照点不同
Ø 学生各次考试所得的成绩不具有可比性 Ø 不同学科的成绩不具有可比性 Ø 不同学科的成绩不具有可加
4
5
6
7
8
9
对测验分数进行解释和评价是教育 测量的一个重要组成部分,如何正 确解释分数呢?
2、基于分组归类数据建立百分等级常模的方法
某一分数x的百分等级的计算公式:
x - L f Fb i PRx *100 N Fb:小于L的累积频数; f:x所在组的频数; L:x所在组的下限; i:组距; N:总频数
2、基于分组归类数据建立百分等级常模的方法
——参照测验的常模资料
T
0
1
2
3
4
5
6
7
8
9
T
0
1
2
3
4
5
6
7
8
9
一、常模及常模意义
1、什么是常模
常模——一个有代表性的样组在某种测验 上的表现情况,或者说,是一个与被试同 类的团体在相同测验上的得分的分布状况 与结构形式。 参照测验的常模,对测验的分数进行解释 与评价的测验,称为常模参照测验
利用年级常模表将原始分数转化为年级当 量,如此可以通过测验来了解和评价学生 的发展。 如:某学生4年级中期的算术、语文、阅读、 外语四门学科成就测验的年级当量如下: 算术-5.5 语文-5.0 阅读-6.0 外语-4.5 评价:成就不错!
三、百分等级(PR)与百分等级常模
(一)百分等级 百分等级——指在常模样本中低于这个分 数的人数百分比值。 如:百分等级为85:表示在常模样本中有 85%的人比这个分数要低。 再如:某学生期末语文统考卷面分75分, 而其所在年级有80%的学生成绩低于75分, 则该学生的百分等级为80。
第四章 教育测验的常模及 建立方法
第一节 百分等级常模 第二节 标准分数常模
第一节 百分等级常模
爸爸看到小丽的期末考试成绩单说, “上次你数学考了80,这次考了88分, 有进步;语文才78分,比数学差多了, 要努力啊,总分是多少,我看看……” 你认为小丽爸爸对小丽的成绩评价科学 吗?
原始分数的不足
2、年级常模
(1)概念:不同年级学生在某种测验上的正常的 一般表现水平。 (2)建立方法:利用某年级学生在某一测验上的 平均分和相应的年级当量之间的对应关系来描述该 测验的年级常模。 年级当量通常用两位表示,第一位为年,第二位 为月。若假定1年有10个月在校接收教育,则三年 级的年级当量范围为3.0-3.9。 例如:刚上小学三年级的一个有代表性的学生样 组在某一“语文阅读技能测验”所得平均分为68分, 则给这个分数安排一个3.0的年级当量;刚上小学 四年级的一个有代表性的样组,在该测验上的平均 分为76分,则给76分安排一个4.0的年级当量。
59,56,52,50,50,47,46,44,43,43,41,41,40,39,38,38,38,37,37, 37,36,36,36,36,35,35,34,34,33,32,32,32,31,31,31,30,30,29, 29,28,27,27,27,25,24,22,22,21,21,20,17,17 f cf cRf 分数 f cf 分数 f 分数 59 56 52 50 47 46 44
59,56,52,50,50,47,46,44,43,43,41,41,40,39,38, 38,38,37,37,37,36,36,36,36,35,35,34,34,33,32, 32,32,31,31,31,30,30,29,29,28,27,27,27,25,24, 22,22,21,21,20,17,17
一般步骤
第1步:选择有代表性的常模团体 第2步:施测,取得实测数据 第3步:编制常模团体实测分数的次数分布表 第4步:计算测验原始分数X对应的PR 第5步:讲变换结构用表或图表示,即为测验的百 分等级常模。
讨论
在百分等级常模中,每一个等级差异是否 意味着成就与能力的相等差异呢? 如:A、B、C三位同学某门课程成绩的百 分等级分别是70,80和90。请问他们之间的 能力或成就差异相等吗?
在学科测验中,百分等级把学生的原始分数放在 该学生所在群体成绩中进行比较,以确定该学生 在群体中的相对地位之高低。 我们再来评价小丽的语文和数学成绩
科目 语文 数学 原始成绩 78 88 百分等级 85 80
(二)百分等级常模
百分等级常模就是基于某个常模团体,为 某种测验的原始分数与百分等级之间建立 起对应关系的组内常模类型。
相关文档
最新文档