目标参照测验
常模参照测验
常模参照测验:是指以学生团体测验的平均成绩作为参照标准,说明某一学生在团体中的相对位置,将学生分类排队。
重在个人与个人之间的比较,主要用于选拔或编组、编班,要求试题难度适中,尽量对所有学生都有较强的鉴别力和区分度。
常模参照测验以鉴别学生个别差异为指导思想,目的是为了测得学生在所处团体中的相对水平。
常模实际上即是该团体在测验中的平均成绩,学生成绩便是以常模为参照标准来确定的。
这一测验衡量的是学生的相对水平,故其评分属相对评价范畴。
标准参照测验又称目标参照测验,标准参照测验是用来衡量学生是否达到预期教学目标的测验。
测验将个人分数与特定的标准相比较,评价学生是否合格,而不考虑学生在团体中的相对位置,故常用绝对评分方式记分。
标准参照测验是指以体现教育教学目标的标准作业为准,看学生是否达到标准以及达到标准的程度。
它主要不是用于比较个人之间的差异。
如我国高中会考及教师自编测验。
利用它可具体了解学生对某单元的知识、技能的学习和掌握情况。
标准参照测验,它是指依据某种特定操作标准可以直接解释测量结果的测验。
操作标准一般可以通过界定个体所应该完成的任务确定。
对标准参照测验来说,他的分数解释是以界定良好的任务或行为领域为基础的,是与预先设计的特定标准相对照所确定的,有了这个条件,我们便可以从较少的有代表性的测验题目的反应情况,推断出被试的真实水平。
用目标表示领域,并且题目是该领域中行为的有代表性样本,这时目标参照测验就是标准参照测验。
标准参照测验主要用于鉴定的目的。
能力评估与传统评估的不同点之一就在于,原有学习技术系统侧重的是常模参照的评价,而能力导向的评估与认证强调的乃是基于能力标准的评估,而很多能力标准的都用一些模糊的词汇加以描述,比如“理解”“掌握”“能够”,所以在能力评估的过程中也很难把握,很难给其一个质性的评价,所以能力标准的细化描述成为能力评估有效实施的关键。
标准参照测验
标准参照测验标准参照测验是一种通过对被试者进行测试,以确定其在某一特定领域的能力水平的方法。
在各行各业中,标准参照测验被广泛应用于选拔人才、评估学习成绩、确定职业资格等方面。
本文将从标准参照测验的定义、特点、应用领域以及优缺点等方面进行详细介绍。
首先,标准参照测验是一种通过与标准群体进行比较,以确定被试者在某一特定领域的表现水平的测试方法。
标准参照测验的结果通常以百分位数、标准分数等形式呈现,能够清晰地展现被试者在该领域的相对位置。
这种测试方法能够客观地评估被试者的能力水平,为选拔人才、评估学习成绩提供了重要的参考依据。
其次,标准参照测验具有客观性、可比性和标准化的特点。
由于测试结果是通过与标准群体进行比较得出的,因此具有客观性和可比性。
同时,标准参照测验采用标准化的测试程序和评分标准,能够保证测试的公平性和准确性,有效地避免了主观因素的影响。
标准参照测验在各个领域都有着广泛的应用。
在教育领域,标准参照测验被用于评估学生的学习成绩和能力水平,为学校和家长提供了重要的参考依据。
在人力资源管理领域,标准参照测验被用于选拔人才、评定员工的职业能力,帮助企业进行人才管理和培训规划。
在医学领域,标准参照测验被用于评估患者的身体健康状况和心理状态,为临床诊断和治疗提供了重要的参考依据。
然而,标准参照测验也存在着一些局限性。
首先,标准参照测验需要一个代表性的标准群体作为参照,而有些领域的标准群体很难确定,这就限制了标准参照测验的应用范围。
其次,标准参照测验只能提供被试者在相对位置上的表现,不能直接反映其真实的能力水平,因此在解释测试结果时需要注意其局限性。
综上所述,标准参照测验作为一种重要的测试方法,在选拔人才、评估学习成绩、确定职业资格等方面发挥着重要作用。
它具有客观性、可比性和标准化的特点,但也存在着一定的局限性。
在实际应用中,需要根据具体情况综合考虑,合理运用标准参照测验,以达到更好的效果。
常模标准参照测验名词解释
常模标准参照测验名词解释
常模参照测验是指在心理学和教育学中常见的一种测验方法。
它是根据某个特定的标准或参考来评价个体或团体的表现。
常模参照测验通常将个体的分数与某个特定的常模进行比较,以评估个体在特定领域中的相对位置。
常模通常是由一组具有代表性的样本人群组成,这些样本在某个特定的测验或任务中获得一系列分数。
通过统计方法,可以计算出常模中各种百分位数、均值、标准差等指标,从而为后续的个体或团体评估提供参考。
常模参照测验广泛应用于教育、心理学、社会学等领域,例如智商测试、学术能力评估、职业能力测试等。
通过常模参照测验,可以帮助教师、学生、家长等了解个体在同龄人群中的相对表现,从而制定相应的教育计划和学习目标。
除了常模参照测验,还有标准参照测验和相对参照测验等不同的评估方法。
标准参照测验是根据一定的客观标准来评价个体的表现,例如体育比赛中的评分标准。
相对参照测验则是将个体的分数与自己的过去表现或其他个体进行比较,例如个人的年度绩效考核。
需要注意的是,常模参照测验的适用性取决于常模的代表性、测验的可靠性、有效性以及评估目的等因素。
在选择和使用常模参照测验时,应考虑到这些因素,并遵循相应的伦理和法律规定,以保障被试者的权益和隐私。
总之,常模参照测验是一种常见的评估方法,它通过将个体的分数与某个特定的常模进行比较,以评估个体在特定领域中的相对位置。
常模参照测验广泛应用于教育、心理学、社会学等领域,有助于了解个体在同龄人群中的相对表现,并制定相应的教育计划和学习目标。
在使用常模参照测验时,应考虑到其适用性和限制因素,并遵循相关伦理和法律规定。
戴海崎《心理与教育测量》笔记和课后习题详解(目标参照测验)
第10章目标参照测验10.1 复习笔记一、目标参照测验概述(一)目标参照测验的产生从20世纪中期开始,随着常模参照测验模式的局限性(并不是所有的测验都只关心个体间的差异)逐渐被人们发觉,目标参照测验(亦称标准参照测验)应运而生。
1962年戈莱塞(R.Glaser)和克劳斯(D.Klaus)首先提出目标参照测验的概念。
(二)目标参照测验的定义目标参照测验的主要目的在于了解个体在所规定的测量内容上的行为水平,因此其出发点是个体本身的绝对水平,而不再是个体间的水平差异。
戈莱塞认为:“所谓目标参照测验,是根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验上所得结果,也是根据某一明确界定的行为标准直接进行解释的。
”二、目标参照测验的项目分析(一)内容范围的确定一个测验的内容范围包括所欲测量特质中蕴含的全部行为。
任何一个内容范围都具有一些共同的特点:内容范围具有边界;每一内容范围内容均可分为几类,每一类中又可分为更细更小的类,当每一类的内容及其在此内容范围内的相对重要性确定以后,内容范围就有了明确的结构。
(二)测验项目的内容效度分析目标参照测验的项目分析,首先要对构成测验的每一个题目是否合适以及有效进行分析,即检验题目与测验内容范围所要求的内容与目标的一致性。
这一过程一般缺乏客观的统计分析手段,通常采用专家评定的方法。
专家评定可以采取不同方式,其中比较直观和常用的一种方式是要求有关内容领域的专家填写项目内容评定表,在五级量表上对每个题目所测内容与项目编制者所欲测量的目标内容之间的一致性做出评定,通常情况下,需要同时邀请多位专家进行评定,以考察专家评定之间的一致性。
(三)测验项目的难度和区分度分析1.测验的预测测验编制完成后,须选取一定数量的被试进行预测,由此获得预测数据,然后才能在此数据基础上对项目的难度和区分度进行量化分析。
目标参照测验的预测方法主要有以下三种:(1)前测—后测方法:选取一组被试,在其接受与测验目标内容有关的教学过程前后各施测一次,取得前测和后测的结果,前者表示未掌握者在测验中的水平,后者表示已掌握者的水平。
《目标参照测验》课件
目标参照测验将逐渐应用于跨文化领域中,为不同文化背景的人群 提供更加客观和准确的评估。
标准化与规范化
目标参照测验的标准化和规范化将是未来的重要发展方向,制定统一 的测验标准和规范,提高测验的可靠性和有效性。
THANKS
感谢观看
大数据分析
通过大数据分析,对大量的测验数据进行深入挖掘,发现潜在的规 律和特征,为测验的改进和优化提供科学依据。
虚拟现实技术
虚拟现实技术将为测验提供更加真实和沉浸式的环境,使测验更加 生动有趣,提高测验的参与度和效果。
应用领域的拓展
1 2 3
教育领域
目标参照测验将进一步应用于教育领域中,为学 生的学业评估和教师教学提供更加科学和准确的 依据。
灵活性不足
对于不同学习者或不同学习环境,目标参照 测验可能缺乏足够的灵活性。
高成本
设计和实施目标参照测验需要投入大量时间 和资源。
改进建议
增加多元评估方式
提高测验内容的适应性
结合目标参照测验与其他评估方式,如表 现评估和同行评估,以获得更全面的学习 者表现。
根据不同的学习者或学习环境调整测验内 容,使其更符合实际需求。
03
目标参照测验的应用领域
教育领域
评估学生的学习进度和掌握程度
目标参照测验可以用来评估学生在某一学科或技能上的学习进度和掌握程度,帮助教师了 解学生的学习需求和困难,从而制定针对性的教学计划。
诊断学生的学习问题
通过目标参照测验,教师可以发现学生在学习上的薄弱环节和问题,进而进行针对性的指 导和干预,帮助学生改进学习方法,提高学习效果。
重要性
01
提高评估的准确性和有效性
目标参照测验以个体实际表现为评估标准,能够更准确地反映个体的能
《目标参照测验》课件
分析评价结果
通过分析测验结果,可以获得有关个体表现与评价目标之间的差距的信息。 - 测验结果分析方法及案例
如何应用目标参照测验
目标参照测验的应用非常广泛,以下是一些常见的应用场景: - 学校教学评估 - 企业培训评价 - 个人职业规划
总结
目标参照测验具有一定的局限性,但其未来发展趋势仍然很可观。 - 目标参照测验的局限性 - 目标参照测验的未来发展趋势 感谢观看!
《目标参照测验》PPT课 件
目标参照测验是一种评估方法,通过将个体的表现与预先设定的目标进行比 标的比较,评估个体在特定领域的表现。 - 目标参照测验的定义 - 目标参照测验的优点
测验过程
1. 确定评价目标 2. 定义测验环境 3. 确定评价标准 4. 制定测验题型 5. 编写测验题目 6. 安排测验时间和地点 7. 进行测验
第七章 测验分数的解释与应用
按照行为发生的一定顺序来判断发展的正常 与否
皮亚杰量表
用特定的任务来揭示儿童发展处于哪个阶段
格塞尔发展顺序量表 格塞尔认为,婴幼儿的行为系统的建立是一个有次序 的过程,反映了神经系统的不断成长和功能的分化, 因而可以把每个成熟阶段的行为模式作为智能诊断的 依据。
4周 不能控制 头部,仰 卧姿势左 右不对称 16周 28周 40周 可独坐, 爬行,扶 着物件站 立 52周 搀一手 行走, 摇摆 颈可竖直, 扶起独 头微摇动, 坐,身 体前倾 仰卧姿势 左右对称
2、年级当量(grade equivalents)
即年级常模,用年级代替年龄,指把学生的
测验成绩与各年级学生的平均成绩比较,看他
相当于几年级的水平。
年级常模的单位通常为10个月间隔。如5年级 的分布为5.0到5.9,5.0表示五年级的初始水 平,5.5则表示五年级中期的平均成绩。
3、 发展顺序量表(ordinal scales)
缺点: 单位不等,尤其在分配的两个极端 只具有顺序性,属于顺序量表,不能做加减乘 除运算,无法通知来说明不同被试之间分数差 异的数量 两个不同样本中的百分等级不能相互比较
2、标准分数
什么是标准分数? 有哪些特点? 如何计算?
标准分数又称Z分数,这是等距量表中最常用
的一ent referenced score) 内容参照又叫范围参照,是看被试对指定 范围中的内容和技能掌握得如何。 内容参照分数特别适用于计算机辅助教学 以及利用程序教材自我掌握进度的学习 内容参照分数主要用于成就测验以及能确 定出可接受的最低标准的资格测验
在编制内容参照测验和对此各测验分数做 解释时有两个主要步骤: 一是确定测验所包含的知识或技能的范围 二是编造一个能报道测验成绩的量表
目标参照测验
• 2、对照组法
– 临界水平被试难以界定,改用对照组法,即用 专家界定出掌握组与未掌握组两组被试,将测 验用于这些被试,然后将两组成绩绘制两分布 曲线,其交点即为合格分数线。此法被试较上 法易找,但同样依据于经验,被试选择会影响 分界点的确定,改善方法:① 多找一些组对用 其均值;② 找教学与否组代替掌握与否组,但 被认为更不准确;③由于依赖专家,因此多找 专家,综合各方的意见,更稳妥一些。
二、专家判定法
• 1、理论依据:
– 据临界水平被试在各项目上正确作答产可能性 ,进而推断整卷的合格分数线,即临界点。其 中“临界水平被试”是虚拟的,正确作答可能 性是据专家经验推测的。
• 2、Nedelsky 方法(1954)—适用于选择题
– ① 判断临界水平被试在每一试题上的正确作答 概率,方法是先判断其可排除几个错误选项, 然后再作概率估计。如选 四选一,若能排除一 个错误选项,则正确作答概率为0.33,若能排 除两个错误选项,正确作答概率为0.5。 – ② 在每一题的正确作答概率都确定后,将每一 题的正确作答概率以题分加权求和,即可得整 λ 卷分界点, =∑ Fi Pi – ③ 若能由各位专家分别评定则以各位专家评定 分数的均数为最终分界点。
• 信度及其估计 • 效度及其估计
一、信度及其估计
• 1、信度定义: 不变。 • 2、常模测验信度不适用目标测验的原因:
– 相关系数信度高低与被试团体分布有关,被试 异质性越强,信度越高,目标测验不在于鉴别 被试差异,因而分数分布相对集中,即使测验 可靠稳定,其相关也不高,因此相关信度不适 用于目标测验。
四、测验分数的解释
• 两种测验模式不同,但分数解释可以配合 使用,即常模式解释可以同时用于目标测 验,特别是既对被试绝对水平感兴趣,又 对其相对水平感兴趣时,更可以配合使用 ,如标准分数,百分等级等。
第十章 目标参照测验1
二、测验项目的内容效度分析
专家评定法(教材表10-2,10-3) 结合以前学过的常模参照测验的内容效 度分析来进行对比学习
三、测验项目的难度和区分度分析
1。测验的预测 (1)前测-后测方法(一组被试) (2)已接受教学组-未接受教学组方法(两组被 试) (3)对照组方法(两组被试) 2。测验项目的难度分析 目标参照测验的项目难度计算与常模参照测验相 同,一般以通过率来表示。往往并不必要。
St
适用项目是0、1记分(或二分变量),而效标或测验 总分是连续变量的数量资料。
(2)二列相关
Xp - Xq pq
rb=
•
St
y
Xp - Xt p
或 rb=
•
St
y
适用于连续的测量变量。但其中一个变量被人为二分。
(3)φ 相关 ad-bc
rφ= √(a+b)(c+d)(a+c)(b+d)
适用于φ相关的统计方法适用于两个变量都是点分配的资料,即两个变 量都是二分名义变量。在有些情况下,一些连续变量也可以用此方法计算 相关程度。φ相关不要求变量呈正态分布。
回忆常模参照测验的难度分析(注重适中值) 目标参照测验项目难度的计算,大多情况下只是 作为项目区分度分析的基础。
3。测验项目的区分度分析 注意与常模参照测验的对比
(1A-PB D的大小,可以直接反映出该项目在多大程度上对未掌握者和掌 握者作出了区分。D值从-1.00到+ 1.00之间变化,越接近于+ 1.00, 题目区分度越高,说明题目越有效。
(1)积差相关系数
当预测分和效标分都是连续变量时,可采用积差相关 系数的计算方法来求得测验的效度系数。
例:假设有10名男性经职业兴趣测验而被选定作为推 销员,其测验分数下表第一行,而第二行是经过若干年后 他们某段时间内销售金额总量(以万元为单位)。现问该测 验的预测效度如何?
第9章-目标参照测验
测量专家认为,重视内容领域规范是标准参照测验 最重要的一环,至少有四个目的:
其一,为试题编写人员准备试题时提供内容和技术上的 指导;
其二,向内容方面或测量方面的专家提供每种能力所包 括的内容和行为的清晰表述;
其三,帮助解释被试个体的能力水平;
其四,向用户提供能力广度和范围的明确规定。
2021/4/9
来表示,也可以以在预测源测验中和效标测验中均通过和均未通过的人 数占总人数的比例来表示。 决策效度(DV)=(a+d)/a+b+c+d
预测源测验
通过人 数
未通过人数
效
标通过人数
a
b
测
2021/4/9
未通过人数
c
d
13
第四节 测验分数的解释——分数分界点的确定
一、专家评定法 这种方法是在测验的内容范围明确界定的基础上,
第九章 目标参照测验
学习目标: 1、了解目标参照测验的定义。 2、掌握目标参照测验的项目分析、信效度分析,
巩固测验基本原理。 3、掌握合格分数分界点的确定的过程和方法。
重点:
掌握目标参照测验的项目分析、信度、效度分析。
难点: 目标参照测验的合格分数分界点的重要意义及确定方法。
2021/4/9
1
第一节 概述
正确百分数的计算公式: 正确百分数=(答对题目数/总题目数)*100
2021/4/9
5
(2)掌握分数
无论是针对每一教学单元的形成性测验,还 是针对一门课程的终结性测验,如果要了解 与判断学生是否掌握已经学习的内容,要编 制一份有内容效度的教育测验来进行测量。
2021/4/9
6
第二节 目标参照测验的项目分析
标准参照测验
由专家直接判断处于临界水平的被试在某测验的每一题目正确 作答的可能性(Pi),设每题的满分为Fi,则该测验的分数分界点 (λ)为: λ=∑Fi Pi
Company name
四、标准参照测验的分数解释
临界组法
–效标组预测法
由专家判断和选择一组正处于临界水平的被试,将测验施测于该 组被试,计算他们在测验上的平均成绩,以体现测验的内容范围所要 求的临界水平,因而可视该平均成绩为测验分数分界点的估计值。 该方法的困难在于临界水平被试的选择和评定。 对照组法 先采取专家评定的方法确定两组被试,一组被明确判为掌握组, 另一组被明确判为未掌握组,那些不容易被判为“掌握”或“未掌握” 的被试一概剔除。对这两组被试施测,可得到两组被试原始分数分布 图,分布图中两条分布曲线的交界点即为测验分数分界点。
三、标准参照测验的信度与效度
(一)信度及其估计
在常模参照测验的信度评估中,通常是以相关系数作为信度指标,相 关程度高,信度就高,测验越可靠。 然而,以相关系数表示的测验信度的高低很大程度上受到受测者团体 异质性的影响,即被试异质性越高,从而相关系数越高,测验信度相 应也越高, 标准参照测验的目的一般不在于鉴别个体差异,而在于了解个体在所 测内容上的掌握水平,因而在大多数情况下,被试团体在标准参照测 验上的分数分布比较集中(例如高考)。
二、标准参照测验的项目分析
(一)内容范围的确定
1、内容范围具有边界。 2、每一内容范围内容可分为几类,每一类中又可分为 更细更小的类。 3、特定测验目的的确定常为内容范围的界定提供依据, 而界定的结果常常以双向细目表的形式表现出来。
二、标准参照测验的项目分析 (二)测验项目的内容效度分析
1、对构成测验的每一个题目是否合适以及有效进行分析, 即检验题目与测验内容范围所要求内容与目标的一致 性。 2、对于测验中每一项目的内容与其目标内容之间一致性 的等级评定,通常需要邀请多位专家共同进行。
目标参照测验
目标参照测验目标参照测验,也称为目标相关测验,是一种心理测量工具,用于衡量个人对特定目标的关注程度和期望程度。
通过这个测验,我们可以了解个体对自己的目标有多大的关注和期望,以进一步调整行为和制定目标计划。
目标参照测验的步骤主要包括:确定目标、编制量表、进行测验、分析结果。
首先,确定要测量的目标,例如学业成绩、健康状况、事业发展等。
然后,根据目标制定适当的量表,通常采用一定的评分标准,例如1-5分,1表示不关注或没有期望,5表示非常关注或期望。
接着,对被测者进行测验,通常采用问卷的形式,要求被测者根据自己的实际情况进行评估。
最后,根据测验结果进行分析和总结,找出个体在各个目标上的关注和期望程度,以及不同目标之间的差异。
通过目标参照测验,我们可以从以下几个方面了解个体的目标情况:首先,了解个体对不同目标的关注程度。
不同个体对不同目标的关注程度可能存在差异,某些人可能更关注事业发展,而另一些人可能更关注家庭和健康。
其次,了解个体对目标的期望程度。
期望是推动个体行动的重要动力,个体对不同目标的期望程度也可能存在差异。
例如,某些人可能对自己的学业成绩有很高的期望,而其他人可能对此并不那么重视。
最后,了解个体在目标设定和规划方面的差异。
个体在目标设定和规划方面存在的差异可能会影响他们的行动和决策,从而影响结果的实现。
目标参照测验可以应用于个人的发展规划、组织的人力资源管理、学校的评估等多个领域。
在个人发展规划中,了解自己对不同目标的关注和期望,可以帮助个体更好地制定目标和计划行动,提高自己的执行力和成就感。
在组织的人力资源管理中,了解员工对不同目标的关注和期望,可以帮助组织更好地匹配员工的能力和动机,提升员工的工作满意度和绩效。
在学校的评估中,了解学生对不同目标的关注和期望,可以帮助学校更好地制定教育目标和改进教育方法,提高学生的学业成绩和发展水平。
综上所述,目标参照测验是一种测量个体对特定目标关注和期望程度的方法。
心理测量 复习重点内容
心理测量复习重点名词解释:1、心理测量:所谓心理测量,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。
2、个别测验:每次以一位被试为对象,通常是由一位主试与一位被试在面对面的情形下进行。
是临床心理诊断测验中最常用的测验形式3、团体测验:指每次测验过程中由一个或几个测验者对数量较多的被测验者(一个群体)同时实施测验。
一般用于广泛的心理健康调查。
4、常模参照测验:是根据被试对量表中所规定的题目答对多少来评分的,被试成绩的优劣,是根据所得分数在常模中所处的地位来确定的,不是以是否达到某个标准来决定。
5、目标参照测验:是将被试水平与一绝对标准相比较,以便评价被试有无达到该标准为目的测验,也称标准参照测验。
6、测量误差:测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应.7、随机误差:又叫可变误差,是由那些与测量目的无关的、偶然因素引起的、而又不易控制的误差。
8、系统误差:又叫常定误差,是那种由测量目的无关的变因引起的一种恒定而有规律的效应。
9、信度:指可靠性或可靠的程度。
测验的信度则是指测验结果的可靠程度。
换句话说,若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度。
10、效度:效度是量表能实际测量出其所要测量的特性或功能的程度。
11、难度:指试题的难易程度。
12、区分度:是指测验对考生实际水平的区分程度。
也叫鉴别力。
13、评分可靠:是指不同人评定同一份试卷或同一个人在不同时间评定同一份试卷所评定的分数都应是一致的。
这就叫评分信度。
14、人格:是个人在与环境的相互作用过程中形成的相对稳定的心理特质和行为倾向的整体组织,它决定着个人行为的独特性。
15、人格测量:就是通过一定的方法,对在人的行为中起稳定的调节作用的心理特质和行为倾向进行定量分析,以便进一步预测个人未来的行为。
心理测量学考试重点
名词解释1.常模团体常模团体是指由具有某种共同特征的人所组成的一个群体,或者是该群体的一个代表性样本。
常模团体是用一个标准的、规范的分数表示出来,以提供对个体作比较或评价的基础。
任何一个测验都有多个可能的常模团体。
如智力测验分儿童智力测验和成人智力测验。
2.测验信度信度指的是相同被试在不同时间或不同场合下,重复用同一测量工具或等价工具测量某种心理特质所得结果的一致性程度。
信度反映了测量结果中由于随机误差因素所带来的方差变异大小。
信度越高,随机方差越小,测量结果越稳定或越一致。
3.表面效度表面效度是指外行人从表面上看测验是否有效,测验题目与测验目的是否一致。
表面效度不是真正的效度指标,但它容易和内容效度搞混。
表面效度影响被试的测验动机。
人格测验要求表面效度不宜过高。
4.能力测验能力倾向测验(aptitude test)分为一般能力倾向测验和特殊能力倾向测验。
一般能力倾向测验是测量个体在多种能力上的潜在优势的测验,特殊能力倾向测验是测量个体在音乐、绘画等特殊能为上的潜在优势的测验。
能力倾向测验具备预测功能,测量结果可以帮助安置个体,可以预测个体在某些领域的发展成就。
个体的能力倾向既依赖于个体的先天因素,也与个体的生活经验有关,一般不受专门的教学或训练的影响,其测值相对稳定。
5.导出分数为了便于确定个体的测验得分在标准化样本群体中所处的地位,被试在测验中得到的原始分数经常会被转换成某种导出分数(横向转换、纵向装换)。
导出分数的目的主要有:①可以清晰地表示个体在标准化样本群体中的相对位置,从而可以在与其他人比较的基础上,对其成绩作出评价。
②可以对个体在不同测验上的作答表现直接进行横向比较。
6.真分数一个测量工具在没有测量误差时,所得到的真正值。
操作定义为:经过无数次测量所得的平均值。
其定义表明,一个人在一个测验上所得的分数,是他的真分数的函数,也是测量误差的函数。
(x观测分数=T真分数+E测量误差)7.测量参照点是指在测量工作中必须要有的一个起点,这个起点就叫做测量的参照点。
第十章 目标参照测验
决策效度可以以在测验中被评为掌握组和未 掌握组的人数占总人数的比例来表示,也可
以以在预测源测验中和效标测验中均通过和
均未通过的人数占总人数的比例来表示,见 下表:
预测源测验
效标测验
及格
不及格
及格
A
B
不及格
C
D
决策效度(DV)=(a+d)/a+b+c+d
第四节 测验分数的解释 -分数分界点的确定
试在每一题上有能力排除的错误选择项,从而计算其正 确回答的可能性,再求出每一题上的正确回答的可能性 之和,即为测验分数的分界点。
例如:某测验由四择一选择题组成,某题A、B、C、D四 个答案中A为唯一正确的答案。若专家判定处于临界水 平的被试应该可以正确地排除B和D两个选择项,那么在 该题上正确的可能性为1/(4-2)=0.5。最后再对每一 题正确回答的可能性求和,可以得到该测验的及格线。 若多位专家同时评定,则可将多个及格线的平均值作为 最终的及格线。
分类一致性信度的优点在于计算简单,意义直 观可靠,但由于其所采用的方法类同于常模参照测 验信度评估中的再测法和复本法,因而再测法和复 本法的缺点在此也同样存在。此外,分类一致性信 度也受到测验长度和被试分数分布的影响。
方差分析方法--荷伊特信度 此法的最大优点在于它不受测验目的或
被试异质性的影响。具体计算与解释见79 页第(4)小部分。
D为-1.00时,表明题目也能将掌握者和未掌握者 做最大的区分,但问题在于掌握者无人通过该题, 而未掌握者却全部通过。这种情况表明该项目存在 错误,或是出题错误,或是将正确答案弄错。
(2)个人获得指数(DIG)
采取前测--后测方法,可获得在前测中错误回答 某项目而在后测中能够正确回答的被试人数比例, 此即该项目的个人获得指数,其值在0-+1.00之间 变化,其大小直接反映了经过教学活动之后受益的 被试比例。个人获得指数越接近+1.00,表明某项 目的区分度越大,越接近0,表明该项目的区分度 越小。
心理测量学部分概念解释(二)
鉴别指数(discrimination index):一个好的有效测验应该能区分能力强与能力差的被试,鉴别指数就是检验测验项目鉴别力的方法。
做法是根据检验成绩总分将被试者排队,取27%高分端的受试者组成高分组,另取27%低分端的受试者组成低分组,然后比较高分组被试者在该项目的的通过率,用公式表示为:D=PH-PL.式中,D=鉴别指数,PH-高分组的项目通过率,PL=低分组的通过率。
根据D 值大小了解每个测验项目的区分力,D值越高表示区分度越大。
交叉效度分析(cross validity):同一测验用于不同样本时的效度分析即交叉效度分析。
由于单一样本存在取样误差的可能,此时得到的效度可能并不真实,需要通过对不同样本进行效度分析,进一步证实。
曾有例子说明对一个样本统计分析表明测验有较高的效度之后,在另一个样本不能证实第一个样本发现的效度结果,提示一个样本的效度有可能与抽样有关,因此,测验效度需要用不同样本的检验证实,即进行交叉效度分析。
克伦巴赫α系数(cronbach's α系数):测验信度分析的方法之一。
检验测验项目的一致性程度,即题目与题目之间的一致性关系。
适用于多重记分的项目,如某种态度量表的项目记分有经常、有时、偶尔和从不4个等级,对这种采用多重记分的题型,不宜用分半相关法,而要采用克伦巴赫α系数。
客观测验(objective test):测验项目由客观题组成的一类测验。
客观题指计分客观,事先规定好标准答案(记分键),评分时没有评分者的主观和随意判断。
常用客观题有是非题、填空题和多项选择题等。
绝大部分心理测验都属于客观测验,如韦氏智力量表、明尼苏达多相人格问卷、90项心理症状核查表等。
客观题(objective item):测验题目的一种类型,其特点是计分的客观性,即在测验前就规定好测验题目的正确答案,严格按标准(记分键)记分,评分时没有评分者的主观判断。
常见题有多项选择题、填空题、是非题、匹配题等。
特殊儿童测验分数的解释—内容参照分数与结果参照分数
分数分界点的科学确定是评估测验分 类一致性的前提,报告标准参照测验 的分类一致性信度时,必须同时提供 测验的分数分界点,以及测验长度等 资料。
方差分析法:荷伊特信度
MS人:被试均方,MS人、题:交互 作用
内容效度 命题细目表 专家评定
Angoff方法:由专家直接判断处于临界水平的被 试在某测验的每一题目正确作答的可能性(记为Pi), 设每一题的满分为Fi,则该测验的分数分界点λ = ΣFiPi Angoff方法在实际运用中较多。
效标组预测法
临界组法:由专家判定和选择一组 正处于临界水平的被试,将测验施测 于该组被试,计算他们在测验上的平 均成绩。(抽象、主观)
效标关联效度 决策效度(预测源测验,效标测验)
结构效度目前关注不多
标准参照测验的分数解释
如何确定分界点: 专家判定法
Nedelsky方法:由专家来判断处于临界水平的被 试在每一题上有能力排除的错误选择项,从而计算 其正确回答的可能性,再求出每一题上正确回答的 可能性之和,即为测验分数分界点。
标准参照测验
标准参照测验:又称目标参照测验,当一个 测验是以某一明确界定的内容范围为基础编 制而成,并且其分数是参照该内容范围所要 求的绝对标准进行解释。
作用:了解个体在所规定的测量内容上的行 为水平,因此其出发点是个体本身的绝对水 平,而不再是个体间的水平差异。
标准参照测验的题目分析
内容范围的确定:双向细目表 内容效度分析:专家评定 难度、区分度分析: 预测试
前分析:通过率,大多数情况下作为区分度分析 的基础
区分度分析:
难度差值
掌握组-未掌握组鉴别指数D = PA – PB 个人获得指数DIG:前测中错误回答某项目而 在后测中能够正确回答的被试人数比例
教育测量的基本方法
教育测量的基本方法教育测量与教学评价是教学活动的重要组成部分,是在教学领域中进行科学管理的重要手段,合理地开展测量评价活动是提高教育质量的有效保证.一、基本概念1.教育测量教育测量有广义和狭义之分.从广义上说,教育测量泛指运用测量手段对教育活动所进行的量的测定。
它涉及的范围很广,凡是需要并能够测量的与教育有关的活动均在研究之列,如教育投入、教育过程各要素、教育的效果等。
从狭义上讲,教育测量专指按一定规则对学生的知识、智能、个性发展、思想品德等所进行的量的测定。
通常所提及的多是狭义上的教育测量。
2. 教学评价教育评价是按照一定标准,运用科学可行的方法,对教育活动所进行的价值判断的过程。
它包括对教学过程和教学效果的评价,诸如学校、教师的教学工作、课堂教学、教学方法、模式和内容以及学生的学业成就、一般智能发展、个性发展、思想品德状况等评价。
3.测验及其种类测验是指对通过一定的仪器和试题所引起的受测者的行为样本进行测量的系统程序。
教育测量的对象和内容是非常丰富的,测验作为教育测量的主要工具,种类也很繁多,可按不同标准加以分类。
按测验的功用分类(1)学绩测验;(2)能力测验;(3)人格测验。
按测验的目的分类(1)诊断性测验;(2)形成性测验;(3)终结性测验。
诊断、形成、终结三种测验对照表按解释分数和方法分类(1)常模参照测验指参照被测群体的实际水平解释分数的测验叫做常模参照测验。
群体的平均分数一般可以反映群体的水平,称为常模。
以常模为参照点,将被测个人的成绩与常模比较,并把比较结果所反映出来的差异数量化,作为导出分数。
参照常模解释分数,便于比较和选拔工作的进行,它属于相对评价的范畴。
例如,在升学考试中,按标准化的要求进行的分数转换就是参照常模得出的。
(2)目标参照测验参照被测达到目标的程度来解释分数的测验,叫做目标参照测验,也称作标准参照测验。
通过与特定的标准进行比较,了解被测的达标程度,这是一种绝对评价方法。
目标参照测验名词解释
目标参照测验名词解释
一、概念
目标参照测验是一种以预定的目标为参照,测量学生学习成果的测验方法。
在目标参照测验中,测验题目的答案不是唯一的,而是根据学生的学习目标和教学要求来设计的。
这种测验方法的主要目的是评估学生在达成特定目标方面的表现,而不是将学生之间的成绩进行比较。
二、特点
1. 个性化:目标参照测验的特点在于个性化,可以根据每个学生的学习目标和教学要求来设计测验题目,更好地评估学生的学习成果。
2. 目标导向:目标参照测验以预定的目标为参照,测验题目的答案是根据目标来设计的,因此可以更好地引导学生的学习和教学活动的开展。
3. 评估效果:目标参照测验可以更好地评估学生在达成特定目标方面的表现,帮助教师更好地了解学生的学习状况,及时调整教学策略,提高教学效果。
4. 适用范围:目标参照测验适用于各个学科领域,可以在不同层次的学生中进行应用,例如小学生、初中生、高中生和大学生等。
三、应用范围
目标参照测验广泛应用于教育教学领域,主要应用于以下几个方面:
1. 课堂教学:目标参照测验可以用于课堂教学中,帮助教师更好地了解学生的学习状况,及时调整教学策略,提高教学效果。
2. 期末考试:目标参照测验可以用于期末考试中,评估学生在一学期内的学习成果,帮助教师更好地了解学生的学习状况,为下一学期的教学工作提供参考。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 4、方差分析方法——荷伊特信度
– 公式:
– 评价:由于此式不受被试分布及测验目标影响, 可用于目标参照测验,又因为不涉及合格线, 因1、目标测验要求有明确的内容范围,要求 试题严格限制在内容范围之内,且有最充 分代表性,因此,内容效度是目标对参照 性测验关心的重点,评估计方法与常模测 验方法相同。
• 3、Angoff方法(1971)
– Angoff方法省却专家判断被试可排除的选项的 步骤,直接判断正答概率。然后用 λ=∑ F P 求分 界点。此法适用于任何题型,专家评定较自由 ,因而此法更受欢迎,但专家评定正答概率的 先验依据也就较少了。
i i
三、效标组预测法
• 1、临界组法:
– 将测验施测于一批临界水平被试,用平均值作 为合格分数线。困难是临界水平被试较难界定 ,要找一批更加困难。
• 2、难度差值指标:
• ① 掌握组—非掌握组鉴别指数(D)。 • ② 个人获得指数(DIG)
• 3、相关系数
– 常模参照测验中常用相关系数作项目区分度指 标,在目标参照测验中同样可以使用,方法也 是一样的,但只有负值题才淘汰,对低值题还 是要视其内容重要性决定取舍。
第三节 目标参照测验的信度与效度
第二节 目标参照测验的项目分析
• • • • 一、内容范围的界定 二、测验项目的内容效度分析 三、难度分析 四、区分度分析
1、内容范围界定的意义
• ① 目标参照测验本身的要求,要有明确的 内容范围。 • ② 项目分析的需要以至测验总体的评价都 要以内容的界定作前提。
2、内容范围的特点
• ① 内容范围有边界:边界有大,有小,须 界定。 • ② 内容范围中的内容可以分类、分层。每 一类每一层有其相对地位,划分清楚类层 及地位,如此构成内容的结构。 • ③ 明确了内容范围的边界和其内部结构, 则认为内容范围得到了明确的界定。
• 2、效标关联效度
– 目标测验的目的在于鉴别人的合格与某测验施 测鉴别结果是否准确应以客观评价为准,因此, 目标测验的效标关联效度成为测验评价与客观 评价一致性程度指标,可用两次评价一致的人 数在总人数中的比作为效度,也称为“决策效 度”。具体算法类似于表10.5,只是其中一次 为客观评价的合格与否。
二、专家判定法
• 1、理论依据:
– 据临界水平被试在各项目上正确作答产可能性 ,进而推断整卷的合格分数线,即临界点。其 中“临界水平被试”是虚拟的,正确作答可能 性是据专家经验推测的。
• 2、Nedelsky 方法(1954)—适用于选择题
– ① 判断临界水平被试在每一试题上的正确作答 概率,方法是先判断其可排除几个错误选项, 然后再作概率估计。如选 四选一,若能排除一 个错误选项,则正确作答概率为0.33,若能排 除两个错误选项,正确作答概率为0.5。 – ② 在每一题的正确作答概率都确定后,将每一 题的正确作答概率以题分加权求和,即可得整 λ 卷分界点, =∑ Fi Pi – ③ 若能由各位专家分别评定则以各位专家评定 分数的均数为最终分界点。
– 以个体有未达到一客观的标准来评价个体行为 的测验
• 2、从测验的编制角度定义—(R.Glaser,1971)
– “目标参照测验是根据某一明确界定的内容范 围而缜密编制的测验,并且被试在测验上所得 结果,也是根据某一明确界定的行为标准直接 进行解释的。”
Glaser的定义强调“内容范围”与 “行为标准”两词
目标参照性测验
第一节 概述
• 一、目标参照测验的意义 • 二、目标参照测验的定义
一、目标参照测验的意义
• 1、产生于实际需要。 • 2、发展的原因是常模参照测验无法胜任这 一任务。 • 3、目标参照测验应用广泛,且副作用较小, 有利于素质教育,有利于教育大面积丰收。
二、目标参照测验的定义
• 1、从评价参照标准来定义
第四节 分界点确定法
• • • • • 一、分界点确定的意义 二、专家判定法 三、效标组预测法 四、测验分数的解释 五、试卷结构调整法决定分界点
一、分界点确定的意义
• 1、知识的掌握是一个程度问题,理论上不 存在一个非常明确的合格点。 • 2、实际中都非常需要对被试的某种技能、 技术、专业知识能力作出合格与否的界定 。 • 3、上述两点的结果是需要划分界点确又非 常困难,现有方法很多,但各有缺点。
• ① 内容范围在测验编制之前就必须明确界定,最好 有操作性定义。 • ② 内容范围包括知识内容范围和能力目标范围两个 方面。 • ③ 测验试题应在内容范围之内,并且是所有属此内 容范围内试题的一个有充分代表性的样本,否则评 价是不准确的。 • ④ “行为标准”是一客观的、稳定的,被指为“已 掌握这一内容范围”的最低标准。 • ⑤ “行为”标准从统计上说就是一条合格分数线, 也称“分界点”。
3、内容范围界定的依据和方法
• 特定测验目的是界定的依据。
– (A) 如某专业资格测验,可以通过该工作分析 来界定,测验内容范围。 – (B) 教学测验可通过教材、大纲来界定,测验 内容范围。 – 形式就是测验双向细目表。
二、测验项目的内容效度分析
• 1、分析目的:检验所命试题的内容是否与 测验内容范围所规定的内容一致。 • 2、分析方法:专家评定法。 该专家对测题所测内容与测题编制者宣称 要测量的目标内容间的一致性进行评价。
• 2、对照组法
– 临界水平被试难以界定,改用对照组法,即用 专家界定出掌握组与未掌握组两组被试,将测 验用于这些被试,然后将两组成绩绘制两分布 曲线,其交点即为合格分数线。此法被试较上 法易找,但同样依据于经验,被试选择会影响 分界点的确定,改善方法:① 多找一些组对用 其均值;② 找教学与否组代替掌握与否组,但 被认为更不准确;③由于依赖专家,因此多找 专家,综合各方的意见,更稳妥一些。
• 3、分类一致性信度估计(P0)
– (A) 目标测验关心的产对被试合格与否的分类是 否一致,分类一致性指标成为目标测验的信度 是顺理成章的。 – (B) 方法: ① 测试采用复测法或复本法;② 统计 以合格线为界分别进行。③ 计算在两次测试中 分数一致人数(两次均及格或两次均表格人数) 在总人数中之比。 – (C) 评价:① 越大,信度越高,意义明确,计 算简单。 ② 但再测、复本的测试缺陷存在。③ 依赖于合格分数线的准确划分 。
三、难度分析
• 1、目标参照测验的难度计算与常模测验 的难度计算采用同一种方法。 • 2、有人认为,目标参照测验中属内容范 围中不可缺少题目并不在乎它是难还是易, 都要测。 • 3、计算目的:(A) 分析区分度的基础;(B) 调整合格分数线的参考值。
四、区分度分析
• 1、数据采集方法:
• ① 前测—后测法:同一项目对同一组被试在学 习之前之后分别测试一次。 • ② 学过组—非学过组法:同一项目对学过组和 非学过组被试各测一次。 • ③ 对照组法,掌握组—非掌握组法:同一项目 对两组被试各施测一次。 • 第③种方法被认为是对①、②两法的改进,但 分组依赖于都是的经验判断。
四、测验分数的解释
• 两种测验模式不同,但分数解释可以配合 使用,即常模式解释可以同时用于目标测 验,特别是既对被试绝对水平感兴趣,又 对其相对水平感兴趣时,更可以配合使用 ,如标准分数,百分等级等。
五、试卷结构调整法决定分界点
• 1、前面所介绍的方法都是根据试卷实际情 况来确定分界点,但在实践中,象我国都 有另一种特殊要求,这就是合格分数线有 一条,即60分,所以必须调整试卷结构, 使合格线恰好在60分以上。 • 2、调整试卷结构的含义:调整与合格标准 有关的各项指标结构比例:常见的有难度 、教学目标、内容范围、内容重要性、题 目类型等等。一般内容范围是不变的,题 型的影响不大,所以可调的是难度和教学 目标。
• 信度及其估计 • 效度及其估计
一、信度及其估计
• 1、信度定义: 不变。 • 2、常模测验信度不适用目标测验的原因:
– 相关系数信度高低与被试团体分布有关,被试 异质性越强,信度越高,目标测验不在于鉴别 被试差异,因而分数分布相对集中,即使测验 可靠稳定,其相关也不高,因此相关信度不适 用于目标测验。