第10章 标准参照测验
戴海崎《心理与教育测量》(第3版)课后习题(第10章 目标参照测验——第12章 智力测验(上))【圣
![戴海崎《心理与教育测量》(第3版)课后习题(第10章 目标参照测验——第12章 智力测验(上))【圣](https://img.taocdn.com/s3/m/0739705704a1b0717ed5dd7a.png)
第10章目标参照测验1.请根据表10.3中专家评定结果的平均数对表中14道题目的内容效度进行评定,并决定题目取舍。
答:从表10.3的结果中,可以直接分析每一道题目的内容效度并进而决定题目的取舍:(1)若以中数为基础进行分析,表中第2、7、14题均是针对目标内容l而编制的,经专家评定,这三题所测内容均和其目标内容之间具有完美的匹配(等级评定中数均为5);同理,第4、12、5、11题的内容效度亦得到很高的评价。
因此,这七道题目无疑可以原封不动地保留下来。
再看,第1、3、6、9题所测内容与其目标内容之间的匹配程度分别被评定为较好(中数为3)或很好(中数为4),说明这四题也还是可取的,只需根据专家意见略作修改即可,最后,第8、13、10题的内容效度一般(中数为2)或较差(中数为1),说明这三题没有能够很好地反映出其欲测的目标内容,内容效度很低或根本不具备内容效度,一般需作较大的修改或删除。
(2)若以均值为基础进行分析,得到的结果与上述以中数为基础进行分析的结果是十分类同的。
(3)为了增加参加评定的专家们之间的一致性,也可根据每位专家在所有题目上所评等级与中数间的差异量来决定专家的取舍。
如表所示,第二位专家在所有题目上所评等级与各中数间的差异之和为24,说明该专家的评定结果与其他8位专家之间具有较大的差异,因此可以不考虑这位专家的意见,只保留8位专家的评定结果,在此基础上得到均值和中数等统计数据并进一步决定题目的取舍。
2.目标参照测验的题目区分度可以通过哪些方法来确定?答:测验项目的区分度一般采取两类指标:难度差值和相关系数。
(1)难度差值①掌握组——未掌握组鉴别指数(D)a.分别计算掌握者和未掌握者两组在某项目上的平均通过率,记为P A和P B,则该项目的鉴别指数为:K=P A-P B。
b.鉴别指数D的大小,可以直观反映出该项目在多大程度上对掌握者和未掌握者作出了区分。
D值从-1.00到+1.00之间变化,越接近于+1.00,题目区分度越高。
标准参照测验
![标准参照测验](https://img.taocdn.com/s3/m/141b5a26571252d380eb6294dd88d0d232d43c6e.png)
标准参照测验标准参照测验是一种通过对被试者进行测试,以确定其在某一特定领域的能力水平的方法。
在各行各业中,标准参照测验被广泛应用于选拔人才、评估学习成绩、确定职业资格等方面。
本文将从标准参照测验的定义、特点、应用领域以及优缺点等方面进行详细介绍。
首先,标准参照测验是一种通过与标准群体进行比较,以确定被试者在某一特定领域的表现水平的测试方法。
标准参照测验的结果通常以百分位数、标准分数等形式呈现,能够清晰地展现被试者在该领域的相对位置。
这种测试方法能够客观地评估被试者的能力水平,为选拔人才、评估学习成绩提供了重要的参考依据。
其次,标准参照测验具有客观性、可比性和标准化的特点。
由于测试结果是通过与标准群体进行比较得出的,因此具有客观性和可比性。
同时,标准参照测验采用标准化的测试程序和评分标准,能够保证测试的公平性和准确性,有效地避免了主观因素的影响。
标准参照测验在各个领域都有着广泛的应用。
在教育领域,标准参照测验被用于评估学生的学习成绩和能力水平,为学校和家长提供了重要的参考依据。
在人力资源管理领域,标准参照测验被用于选拔人才、评定员工的职业能力,帮助企业进行人才管理和培训规划。
在医学领域,标准参照测验被用于评估患者的身体健康状况和心理状态,为临床诊断和治疗提供了重要的参考依据。
然而,标准参照测验也存在着一些局限性。
首先,标准参照测验需要一个代表性的标准群体作为参照,而有些领域的标准群体很难确定,这就限制了标准参照测验的应用范围。
其次,标准参照测验只能提供被试者在相对位置上的表现,不能直接反映其真实的能力水平,因此在解释测试结果时需要注意其局限性。
综上所述,标准参照测验作为一种重要的测试方法,在选拔人才、评估学习成绩、确定职业资格等方面发挥着重要作用。
它具有客观性、可比性和标准化的特点,但也存在着一定的局限性。
在实际应用中,需要根据具体情况综合考虑,合理运用标准参照测验,以达到更好的效果。
戴海崎《心理与教育测量》笔记和课后习题详解(目标参照测验)
![戴海崎《心理与教育测量》笔记和课后习题详解(目标参照测验)](https://img.taocdn.com/s3/m/351a73ac551810a6f524865f.png)
第10章目标参照测验10.1 复习笔记一、目标参照测验概述(一)目标参照测验的产生从20世纪中期开始,随着常模参照测验模式的局限性(并不是所有的测验都只关心个体间的差异)逐渐被人们发觉,目标参照测验(亦称标准参照测验)应运而生。
1962年戈莱塞(R.Glaser)和克劳斯(D.Klaus)首先提出目标参照测验的概念。
(二)目标参照测验的定义目标参照测验的主要目的在于了解个体在所规定的测量内容上的行为水平,因此其出发点是个体本身的绝对水平,而不再是个体间的水平差异。
戈莱塞认为:“所谓目标参照测验,是根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验上所得结果,也是根据某一明确界定的行为标准直接进行解释的。
”二、目标参照测验的项目分析(一)内容范围的确定一个测验的内容范围包括所欲测量特质中蕴含的全部行为。
任何一个内容范围都具有一些共同的特点:内容范围具有边界;每一内容范围内容均可分为几类,每一类中又可分为更细更小的类,当每一类的内容及其在此内容范围内的相对重要性确定以后,内容范围就有了明确的结构。
(二)测验项目的内容效度分析目标参照测验的项目分析,首先要对构成测验的每一个题目是否合适以及有效进行分析,即检验题目与测验内容范围所要求的内容与目标的一致性。
这一过程一般缺乏客观的统计分析手段,通常采用专家评定的方法。
专家评定可以采取不同方式,其中比较直观和常用的一种方式是要求有关内容领域的专家填写项目内容评定表,在五级量表上对每个题目所测内容与项目编制者所欲测量的目标内容之间的一致性做出评定,通常情况下,需要同时邀请多位专家进行评定,以考察专家评定之间的一致性。
(三)测验项目的难度和区分度分析1.测验的预测测验编制完成后,须选取一定数量的被试进行预测,由此获得预测数据,然后才能在此数据基础上对项目的难度和区分度进行量化分析。
目标参照测验的预测方法主要有以下三种:(1)前测—后测方法:选取一组被试,在其接受与测验目标内容有关的教学过程前后各施测一次,取得前测和后测的结果,前者表示未掌握者在测验中的水平,后者表示已掌握者的水平。
智慧树答案教育测量与评价知到课后答案章节测试2022年
![智慧树答案教育测量与评价知到课后答案章节测试2022年](https://img.taocdn.com/s3/m/44c077a0f021dd36a32d7375a417866fb94ac055.png)
第一章1.根据教育目标的要求,按照一定的规则对教育活动的效果加以数量化测定的过程叫做()。
答案:教育测量2.其数值可以进行加、减、乘、除运算的量表是()。
答案:定比变量3.将抽象的定义转化为操作性定义,可以测量概念。
答案:对4.测量是一种()的过程。
答案:纯客观5.以下哪种说法正确()。
答案:斯塔弗尔比姆认为,评价应“有助于更好地执行和改进我们的方案”。
他强调:“评价最重要的意图不是为了证明,而是为了改进”。
;泰勒将教育评价解释为:“确定教育目标在实际上被理解到何种程度的过程。
”;我国学者陈玉琨认为:“教育评价是对教育活动满足社会与个体需要的程度做出判断的活动。
”;克龙巴赫则认为:“评价是为决策提供信息的过程。
”6.第一个较为完整的教育评价模式()。
答案:目标达成模式7.以下哪些属于现代教育评价的主要模式()。
答案:应答模式;CIPP模式;目标游离模式;泰勒的目标达成模式8.被称为教育评价的催生剂的是美国的一项著名研究,它是()。
答案:八年研究9.现代教育评价的发展阶段包括()。
答案:开创时期;专业时期;大发展时期10.属于教育测量的工具有()。
答案:量表;李克特量表第二章1.()指测量结果的可信程度或者稳定性程度。
答案:信度2.用某量表测验10名学生,得分记为X,为考察测量结果的可靠性,于16天后用原量表对这10名同学再测一次,得分记为Y,计算该测验的信度。
(其中X总和为659,Y总和为676,X·Y总和为46742,X的平方总和为47449,Y的平方总和为48256)答案:0.683.5名被试在某测验(共6道题)上的得分情况:第1题方差为3.76;第2题方差为0.4;第3题方差为1.36;第4~5题方差为1.84;第6题方差为2.00;第1位被试总分为17;第2位被试总分为28;第3位被试总分为16;第4位被试总分为19;第5位被试总分为17。
求该测验的信度系数。
(请用微课中克龙巴赫α系数的计算公式进行计算)答案:0.514.当评分者人数为两人时,评分者信度可用肯德尔和谐系数进行估计。
第十章目标参照测验ppt课件
![第十章目标参照测验ppt课件](https://img.taocdn.com/s3/m/86c6fa9f9fc3d5bbfd0a79563c1ec5da51e2d64d.png)
Thank you!
① 对照组法,掌握组—非掌握组法 含义:同一项目对两组被试各实施一次。
第三种方法被认为是第一二两法的改进,但分组依赖于 教师评定,都是经验判断。
测验项目的难度分析
1. 目标参照测验的难度计算与常模测验的难度计算采 用同一种方法。
2. 有人认为,目标参照测验中属于内容范围中不可或 缺题目,并不在它是难还是易,都要测。
目标参照测验的定义
有许多定义,但是戈莱塞在1971年对于目 标参照测验的描述与界定被广泛的接受。
“所谓的目标参照测验,是根据某一明确 界定的内容范围而缜密编制的测验,并且,被 试在测验中所得结果,也是根据某一明确界定 的行为标准直接进行解释的。”
理解:特别强调“内容范围”,“行为标准”两 个词。
3. 计算目的:分析区分度的基础。
测验项目的区分度分析
难度差值指标:
① 掌握组—非掌握组鉴别指数(D)。 计算公式:D=PA-PB 其中PA 为掌握组的得分率,PB为非掌握组的得分率。
D值越大,区分度越高。
① 个人获得指数(DIG)。 • 一般用在前测—后测方法中。 • 计算方法为:前测中错误回答某项目而在后测中 能够正确回答的被试人数的比例。范围在[0,1]之 间。 • 局限:未考虑前测中通过而后测中失败的被试
测验项目的内容效度分析
A. 分析目的: 检验所命试题家评定法,填写项目内容鉴定表。
测验项目的难度和区分度分析
测验的预测(数据搜集方法)
① 前测—后测法 含义:同一项目对同一组被试在学习之前之后分别
测试一次。
① 学过组—非学过组法 含义:通过一项目对学过和非学过组被试各测一次。
标准参照测验
![标准参照测验](https://img.taocdn.com/s3/m/184a4a5311a6f524ccbff121dd36a32d7375c7ba.png)
标准参照测验标准参照测验是一种常见的测验方式,它通过对被试者的表现与特定标准进行比较,从而评估被试者的能力水平。
本文将从测验的定义、特点、设计和应用等方面进行介绍。
首先,标准参照测验是一种以标准为参照物的测验方法,其目的是通过对被试者的表现与特定标准进行比较,从而评估被试者的能力水平。
与常见的等级参照测验相比,标准参照测验更注重对被试者在特定领域的表现进行量化评估,而非简单地进行排名或分类。
其次,标准参照测验具有以下特点,一是相对性。
标准参照测验的评分标准是相对固定的,被试者的得分是通过与标准进行比较而确定的。
二是客观性。
由于评分标准相对固定,标准参照测验的评分更加客观,减少了主观因素的干扰。
三是量化评估。
标准参照测验更注重对被试者在特定领域的表现进行量化评估,能够更准确地反映被试者的能力水平。
在标准参照测验的设计中,需要考虑以下几个方面,一是确定评分标准。
评分标准应该具有客观性和公正性,能够准确地反映被试者的能力水平。
二是选择合适的测验内容和形式。
测验内容应该与被试者所处领域的实际情况相符合,测验形式应该能够有效地评估被试者的能力水平。
三是进行试题的编制和抽样。
试题的编制需要考虑到不同能力水平的被试者,抽样也需要符合统计学的原则,能够有效地代表整个被试者群体。
标准参照测验在实际应用中具有广泛的意义。
一是在教育领域中,标准参照测验能够更准确地评估学生的学习成绩和能力水平,为学校和家长提供客观的参考。
二是在人力资源管理中,标准参照测验能够帮助企业更科学地评估员工的能力和潜力,为人才选拔和培训提供依据。
三是在医学领域中,标准参照测验能够帮助医生评估患者的健康状况和疾病风险,为临床诊断和治疗提供依据。
综上所述,标准参照测验是一种以标准为参照物的测验方法,具有相对性、客观性和量化评估的特点。
在设计和应用中,需要考虑评分标准、测验内容和形式以及试题的编制和抽样等方面。
在教育、人力资源管理和医学等领域中具有广泛的应用前景。
第十章 目标参照测验1
![第十章 目标参照测验1](https://img.taocdn.com/s3/m/c4b2bd5b04a1b0717ed5dd01.png)
二、测验项目的内容效度分析
专家评定法(教材表10-2,10-3) 结合以前学过的常模参照测验的内容效 度分析来进行对比学习
三、测验项目的难度和区分度分析
1。测验的预测 (1)前测-后测方法(一组被试) (2)已接受教学组-未接受教学组方法(两组被 试) (3)对照组方法(两组被试) 2。测验项目的难度分析 目标参照测验的项目难度计算与常模参照测验相 同,一般以通过率来表示。往往并不必要。
St
适用项目是0、1记分(或二分变量),而效标或测验 总分是连续变量的数量资料。
(2)二列相关
Xp - Xq pq
rb=
•
St
y
Xp - Xt p
或 rb=
•
St
y
适用于连续的测量变量。但其中一个变量被人为二分。
(3)φ 相关 ad-bc
rφ= √(a+b)(c+d)(a+c)(b+d)
适用于φ相关的统计方法适用于两个变量都是点分配的资料,即两个变 量都是二分名义变量。在有些情况下,一些连续变量也可以用此方法计算 相关程度。φ相关不要求变量呈正态分布。
回忆常模参照测验的难度分析(注重适中值) 目标参照测验项目难度的计算,大多情况下只是 作为项目区分度分析的基础。
3。测验项目的区分度分析 注意与常模参照测验的对比
(1A-PB D的大小,可以直接反映出该项目在多大程度上对未掌握者和掌 握者作出了区分。D值从-1.00到+ 1.00之间变化,越接近于+ 1.00, 题目区分度越高,说明题目越有效。
(1)积差相关系数
当预测分和效标分都是连续变量时,可采用积差相关 系数的计算方法来求得测验的效度系数。
例:假设有10名男性经职业兴趣测验而被选定作为推 销员,其测验分数下表第一行,而第二行是经过若干年后 他们某段时间内销售金额总量(以万元为单位)。现问该测 验的预测效度如何?
心理与教育测量第十章
![心理与教育测量第十章](https://img.taocdn.com/s3/m/abc1571654270722192e453610661ed9ad515594.png)
– 内容范围界定的依据和方法
• 特定测验目的是界定的依据。
• (A) 如某专业资格测验,可以通过该工作分析来界 定,测验内容范围。
• (B) 教学测验可通过教材、大纲来界定,测验内容 范围。
• 形式就是测验双向细目表。由三个要素组成:一是 考查目标;考查内容;每一类内容和每一种目标相 结合后在整个内容范围中所占的比重(即重要性)。 如下表:
(一) Nedelsky方法
– ① 判断临界水平被试在每一试题上的正确作答 概率,方法是先判断其可排除几个错误选项, 然后再作概率估计。
• 如选四选一,若能排除一个错误选项,则正确作答 概率为0.33,若能排除两个错误选项,正确作答概 率为0.5。
– ② 在每一题的正确作答概率都确定后,将每一 题的正确作答概率以题分加权求和,即可得整 卷分界点,即
• 相关系数接近0,一般不予保留,但应视该项目所测 内容在内容范围中的重要性而决定其取舍。
第三节 目标参照测验的信度与效度
• 信度及其估计
– 定义:与常模参照测验的信度定义一致。 – 计算:
• 不能采用相关系数法求取信度,原因:相关系数信 度高低与被试团体的特质水平分布有关,被试异质 性越强,信度越高,目标参照测验不在于鉴别被试 差异,因而分数分布相对集中,即使测验可靠稳定, 其相关也不高,因此相关系数不适用于目标参照测 验。
(三)Ebel方法
• 步骤
– 首先请评判者把题目的难度区分为若干等级。 – 然后依据题目的代表性程度将题目分成若干等
级。 – 再由专家估计临界被试答对某一代表性程度、
某一困难等级题目的百分比。 – 计算划界分数。 – 如果有多个专家参加,则划界分数为所有评估
《心理测量学》全套精品课件 第十章 目标参照测验
![《心理测量学》全套精品课件 第十章 目标参照测验](https://img.taocdn.com/s3/m/7e6adc33c381e53a580216fc700abb68a982ad3b.png)
的被试进行预测,由此获得预测数据,然后 才能在此数据基础上对项目的难度和区分度 进行量化分析。目标参照测验的预测方法主 要有三种:前测-后测方法、已接受教学组未接受教学组方法、对照组方法。
难度分析
难度是指测验项目的难易程度。目标参照测验 的项目难度计算与常模参照测验相同,一般以通过 率来表示。但对目标参照测验的项目难度的计算, 在多数情况下只是作为项目区分度的基础,这是因 为目标参照测验一般注重的是所测内容范围以及被 试在所测内容范围上的掌握程度,因而若某项目被 确定为内容范围内所不可缺少的重要内容,那么无 论该项目是难是易,均应得到保留。
测 验 A 目标参照测验的产生 由于常模参照测验所存在的局限性,即并不是所有的测验都只关心个体间的差异,有些测验的目的在于了解和界定个体在测验内
容上掌握的绝对水平,所以1962年戈莱塞(R.
个人获得指数越接近+1.
决策效度可以以在测验中被评为掌握组和未掌握组的人数占总人数的比例来表示,也可以以在预测源测验中和效标测验中均通过和均
目标参照测验在其分数解释上最常见的做法就是 将被试分类,一般是根据某一分数分界点将被试分 为掌握者和未掌握者两类。对目标参照测验分类的 一致性的度量指标,就叫做分类一致性信度。
其最常见的估计方法是考查被试在同一测验的两次 施测中或两个复本的施测中是否被分在同一类中。
具体的做法类似于常模参照测验中的再测法荷复本 法,但统计方法和所用指标不同。在此是将同一被 试团体在两次测验结果中均被分为及格或不及格类 别中的人数百分比例作为分类一致性信度的指标。
D为-1.00时,表明题目也能将掌握者和未掌握者 做最大的区分,但问题在于掌握者无人通过该题, 而未掌握者却全部通过。这种情况表明该项目存在 错误,或是出题错误,或是将正确答案弄错。
目标参照测验
![目标参照测验](https://img.taocdn.com/s3/m/27121d5fc4da50e2524de518964bcf84b9d52dd4.png)
目标参照测验目标参照测验,也称为目标相关测验,是一种心理测量工具,用于衡量个人对特定目标的关注程度和期望程度。
通过这个测验,我们可以了解个体对自己的目标有多大的关注和期望,以进一步调整行为和制定目标计划。
目标参照测验的步骤主要包括:确定目标、编制量表、进行测验、分析结果。
首先,确定要测量的目标,例如学业成绩、健康状况、事业发展等。
然后,根据目标制定适当的量表,通常采用一定的评分标准,例如1-5分,1表示不关注或没有期望,5表示非常关注或期望。
接着,对被测者进行测验,通常采用问卷的形式,要求被测者根据自己的实际情况进行评估。
最后,根据测验结果进行分析和总结,找出个体在各个目标上的关注和期望程度,以及不同目标之间的差异。
通过目标参照测验,我们可以从以下几个方面了解个体的目标情况:首先,了解个体对不同目标的关注程度。
不同个体对不同目标的关注程度可能存在差异,某些人可能更关注事业发展,而另一些人可能更关注家庭和健康。
其次,了解个体对目标的期望程度。
期望是推动个体行动的重要动力,个体对不同目标的期望程度也可能存在差异。
例如,某些人可能对自己的学业成绩有很高的期望,而其他人可能对此并不那么重视。
最后,了解个体在目标设定和规划方面的差异。
个体在目标设定和规划方面存在的差异可能会影响他们的行动和决策,从而影响结果的实现。
目标参照测验可以应用于个人的发展规划、组织的人力资源管理、学校的评估等多个领域。
在个人发展规划中,了解自己对不同目标的关注和期望,可以帮助个体更好地制定目标和计划行动,提高自己的执行力和成就感。
在组织的人力资源管理中,了解员工对不同目标的关注和期望,可以帮助组织更好地匹配员工的能力和动机,提升员工的工作满意度和绩效。
在学校的评估中,了解学生对不同目标的关注和期望,可以帮助学校更好地制定教育目标和改进教育方法,提高学生的学业成绩和发展水平。
综上所述,目标参照测验是一种测量个体对特定目标关注和期望程度的方法。
第十章 目标参照测验
![第十章 目标参照测验](https://img.taocdn.com/s3/m/d17ec80d680203d8cf2f2418.png)
决策效度可以以在测验中被评为掌握组和未 掌握组的人数占总人数的比例来表示,也可
以以在预测源测验中和效标测验中均通过和
均未通过的人数占总人数的比例来表示,见 下表:
预测源测验
效标测验
及格
不及格
及格
A
B
不及格
C
D
决策效度(DV)=(a+d)/a+b+c+d
第四节 测验分数的解释 -分数分界点的确定
试在每一题上有能力排除的错误选择项,从而计算其正 确回答的可能性,再求出每一题上的正确回答的可能性 之和,即为测验分数的分界点。
例如:某测验由四择一选择题组成,某题A、B、C、D四 个答案中A为唯一正确的答案。若专家判定处于临界水 平的被试应该可以正确地排除B和D两个选择项,那么在 该题上正确的可能性为1/(4-2)=0.5。最后再对每一 题正确回答的可能性求和,可以得到该测验的及格线。 若多位专家同时评定,则可将多个及格线的平均值作为 最终的及格线。
分类一致性信度的优点在于计算简单,意义直 观可靠,但由于其所采用的方法类同于常模参照测 验信度评估中的再测法和复本法,因而再测法和复 本法的缺点在此也同样存在。此外,分类一致性信 度也受到测验长度和被试分数分布的影响。
方差分析方法--荷伊特信度 此法的最大优点在于它不受测验目的或
被试异质性的影响。具体计算与解释见79 页第(4)小部分。
D为-1.00时,表明题目也能将掌握者和未掌握者 做最大的区分,但问题在于掌握者无人通过该题, 而未掌握者却全部通过。这种情况表明该项目存在 错误,或是出题错误,或是将正确答案弄错。
(2)个人获得指数(DIG)
采取前测--后测方法,可获得在前测中错误回答 某项目而在后测中能够正确回答的被试人数比例, 此即该项目的个人获得指数,其值在0-+1.00之间 变化,其大小直接反映了经过教学活动之后受益的 被试比例。个人获得指数越接近+1.00,表明某项 目的区分度越大,越接近0,表明该项目的区分度 越小。
标准参照测验的设计与编制
![标准参照测验的设计与编制](https://img.taocdn.com/s3/m/592d5086680203d8ce2f24dc.png)
标准参照测验的设计与编制
标准参照测验的设计与编制
第三节划界分数设置方法与被试评价
一、判断法 (一)整体判断法 在测验的内容范围明确界定的基础上,每位专家 从整体上对测验与和内容范围进行判断,提出处 于临界水平的被试能够正确回答的题目的比例, 然后将所有专家的分数平均,作为划界分数。 临界水平的被试指那些由未掌握水平转入掌握水 平的被试,这些被试实际上是在专家的想象中虚 拟出来的。
第三节划界分数设置方法与被试评价 二、综合法 (二)对照组法: Nedelsky1954提出 • 由专家直接选定掌握组、非掌握组被试, 剔除中间被试。而后进行施测得到原始分 数分布图。图中两条分布曲线的交叉点即 为测验分数分界点。 • 因受被试团体的影响,因此更合理的作法 是选取若干对对照组,取每对对照组交叉 点分数的平均值作为测验分数的分界点。
标准参照测验的设计与编制
第二节标准参照测验的信、效度和与误差控制 二、标准参照测验的信度 (一)分类一致性信度 • 对分类一致性信度考察的简单常用的方法是考查 被试在同一测验的两次施测中或两个复本的施测 中是否被分在同一类中。具体方法类似于常模参 照测验中的再测法和复本法。 • 采用同一批被试团体在两次测验结果中均被分为 及格和不及格类别中的人数百分比例作为分类一 致性信度的指标。
标准参照测验的设计与编制
第二节标准参照测验的信、效度和与误差控制
心理测量复习资料
![心理测量复习资料](https://img.taocdn.com/s3/m/d53ff90d4a7302768e9939cd.png)
心理测量第一章:心理测量的历史1、中国古代心理测量的方法P(7)(一)观察法(二)访谈法(三)自然实验法(四)个案调查法2、心理测验产生的社会背景和对个体差异的研究P(9)背景:心理测验最初产生的原因是,在西方一些国家完成工业革命后,对劳动力的需要急剧增加。
工厂需要童工和低能儿,因此要有适当的工具和手段以便有效识别,人们对精神异常者和智力落后者的同等不良待遇,人们要对他们进行区别,也需要建立一种客观的分类标准和鉴别方法。
对个体差异的研究:天文学的一个事件。
第二章:心理测量概述1、测量的定义P(23)测量就是根据一定的法则用数字对事物加以确定。
2、测量的要素P(24)参照点:计算事物的量的起点。
参照点有两种:一种是绝对零点。
另一种是人为指定的参照点。
心理测量中的参照点是人定的,从该点起计算的数值不能以“倍数”的方式解释。
单位:理想的单位需要具备两个条件:一是有确定的意义,即同一单位在大家看来意义是相同的,不允许有不同的解释。
而是有相等的价值。
也就是说,第一单位与第二单位间的距离等于第二单位与第三单位间的距离。
3、测量的量表:要测量某个事物,必须有一个定有单位和参照点的连续体,将要测量的每个事物放在这个连续体的适当位置上,看他距离参照点的远近,以此得到一个测量值,这个连续体就叫量表(measurement),即测量的量表是指在进行测量时体现了测量规则的连续体。
命名量表:类别量表或称名量表,它是量表中测量水平最低的一种,只是用数字来代表事物或把事物归类,没有任何数量的意义,只起着标志事物的作用,因而没有序列性、等距性和可加性。
顺序量表:等级量表,其测量水平比命名量表高,指明类别的大小或含有某种属性的多少,它所适用的统计方法有中位数、百分位数、斯皮尔曼等级相关和肯德尔和谐系数等,但不能做加、减、乘、除运算。
顺序量表具有区分性和序列性,但不具有等距性,也没有可加性。
等距量表:等距量表不仅有大小关系,而且有相等的单位。
心理与教育测量学重点总结
![心理与教育测量学重点总结](https://img.taocdn.com/s3/m/9a7adc6a5acfa1c7aa00cc4f.png)
力提高每道题目的区分度;④选取适当的被试团体,努力提高测试在各个同 质亚团体上的信度;⑤规范施测程序,统一施测环境,严格控制误差。
第五章 测量效度
掌握概念: 1.效度:指一个测验所能测量到其想要测量的心理特质的程度。 2.表面效度:指测验的表面看起来与其所测验内容之间的一致性程度。 3.内容效度:指测验所能测量到的心理特质的内容与其想要测量的心理特质的内
5.影响效度的因素有哪些? 答:①测验本身:a.测题中所用的词汇或句型不能太难;
b.测题的指导语应该清楚; c.测题中不能提供额外线索; d.测题的难易顺序编制要合理; e.选择题的正确答案不能有明显的组型; f.测题的难度要适当; g.测题数目要适当; ②测验的实施:a.指导语标准化;
b.排除意外干扰; c.按照标准化的程序进行客观评分; ③所选校标的性质; ④测验的信度。
2.简述心理测验的基本条件。 答:标准化测验的技术指标有常模、信度和效度。
(1)常模:指某种心理测验在某一人群中测查结果的标准量数,即可比较的 标准。常模形式有:均数、标准分(如 Z 分、离差智商、T 分)、百分位、划 界分等。常模的制定要通过标准化的取样过程,样本的代表性要好。 (2)效度:指测验结果的有效和真实性,即某种测验测查到所要测查内容的 程度效度高是心理测验的充分必要条件。有内容关联效度、效标关联效度和结 构关联效度。 (3)信度:指测验分数反复测量的可靠性,反映测量误差。有分半信度、重 测信度和α系数等。
2.验证内容效度的方法有哪些? 答:①逻辑分析法;②克伦巴赫估计法;③再测法。
3.验证结构效度的方法有哪些? 答:①测验内方法:a.内容效度法;b.口语报告法;c.相关分析法;
标准参照测验
![标准参照测验](https://img.taocdn.com/s3/m/1a41360b3a3567ec102de2bd960590c69ec3d832.png)
由专家直接判断处于临界水平的被试在某测验的每一题目正确 作答的可能性(Pi),设每题的满分为Fi,则该测验的分数分界点 (λ)为:
λ=∑Fi Pi
Company name
四、标准参照测验的分数解释 –效标组预测法
临界组法
由专家判断和选择一组正处于临界水平的被试,将测验施测于该 组被试,计算他们在测验上的平均成绩,以体现测验的内容范围所要 求的临界水平,因而可视该平均成绩为测验分数分界点的估计值。 该方法的困难在于临界水平被试的选择和评定。
➢20世纪中期,人们发现了常模参照测验的局限:并不是所有的测验都 只关心个体间测差异,有的测验目的在于了解被试在测验内容上掌握的 绝对水平。
一、标准参照测验的定义与作用
怎样通过测验评价被试在教学活动中对内容的掌握程度?
➢ 这一测验的目的在于确定在某个教学领域内,被试是否掌握了该教学领 域的知识和技能,了解被试在该领域的困难,并对其有目的地加以教 学辅导与补救。
➢ 常模参照测验的结构效度评估大多是以相关系数为基础 ➢ 所以,关于目标参照测验的结构效度,目前尚未得到较大关注。
总体上说来,标准测验的信效度验证理论还未发展成熟和完善, 有待于进一步的研究和拓广、深化。
四、标准参照测验的分数解释
分数分界点的确定
专家判定法
1在、测N验ed的el内sk容y范方围法明
一致性程度。
2)测题的代表性 ▪ 要求组成标准参照测验的测题必须对测验领域总体有一定的 代表性,从而使测验具有较高的内容效度。 ▪ 为了保证测题的代表性,标准参照测验编制中往往需要制订 双向细目表;同时人们也提出了利用“重复实验”方法。
三、标准参照测验的信度与效度
(二)效度及其估计(续)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
能够排除的反应数; ❖ 第二步,记录下剩余的反应数的倒数; ❖ 第三步,将该份测验中所有项目的倒数的和记为A,
作为该专家确定的临界水平考生的可能分数; ❖ 最后一步,对所有专家的A值进行平均,即为最低
通过分数。
❖ (三)Angoff方法
一、判断法
Nedelsky 方法
整体 判断法
Angoff 修正法
判断法
Ebel 方法
Angoff 方法
❖ (一)整体判断法
心理测量学
一、判断法
❖ 每位专家从整体上对测验和内容范围进行判断,提 出符合标准的最低能力水平被试正确回答的项目的 比例。然后将所有专家的分数平均,作为划界分数。
心理测量学
一、判断法
心理测量学
一、标准参照测验的定义
❖ 若已知测验分数和某个外部效标有关,则可用被试 在效标上的表现直接解释测验分数,这种测验被称 为结果参照测验(result-referenced test)。
心理测量学
二、标准参照测验的编制
心理测量学
三、标准参照测验的用途
用途
各类教育水平 、职业水平测 试,采取了标 准参照测验的 编制、施测、 记分和解释模 式
(二)测验项目的区分度分析
D P甲 P乙
心理测量学
一、标准参照测验的项目分析
(二)测验项目的区分度分析
心理测量学
二、标准参照测验的信度
分类一致 性信度
荷伊特 信度
心理测量学
二、标准参照测验的信度
(一)分类一致性信度
bc PO N
PO Pe PO PAPB qAqB
1 Pe 1 PAPB qAqB
第十章 标准参照测验
心理测量学
引子
▪ 够水平的通过,不够水平的通不过 ▪ 不够水平的通过了,够水平的没过
1 标准参照测验概述
心理测量学
目录
2 标准参照测验的信、效度与误差控制 3 划界分数设置方法与被试评价
心理测量学
第六章 标准参照测验的设计与编制
1
标准参照测验概述
心理测量学
第一节 标准参照测验概述
心理测量学
二、实证法
❖ Glass(1978)将9年级学生测验成绩的中位数作为 一所中学毕业证书考试的最低标准;
❖ 有人采取低于团体平均水平一个标准差的方法确定 截点;
❖ Block(1972)提出一种“教育效果法”,试图建立 测验分数与学习效果的函数关系,他提出存在一条 S型的学习曲线,分界分数在曲线的拐点周围;
心理测量学
一、判断法
❖ (四)Ebel方法
心理测量学
一、判断法
பைடு நூலகம்
心理测量学
一、判断法
❖ (五)Angoff修正法
❖ 这种方法划分了与Ebel方法不同的两个维度,一个 维度为被试完成测题所需要的能力(如记忆和理解 等),另一个维度是每题的测量目标(如词汇、语 法和阅读理解等)。然后计算划界分数与Ebel方法 的过程就一样了。
性。
❖ 如果题目对要考察的内容范围有良好的代表性,即 使通过率很高或很低也应该保留下来;
❖ 如果题目相对要考察的内容范围而言,不具备很好 的代表性,即使中等左右通过率的题目也应修改或 删除。
心理测量学
一、标准参照测验的项目分析
(二)测验项目的区分度分析
D P后测 P前测
心理测量学
一、标准参照测验的项目分析
心理测量学
二、标准参照测验的信度
(一)分类一致性信度
(二)荷伊特信度
心理测量学
二、标准参照测验的信度
rxx
1
MS人题 MS人
内容
心理测量学
三、标准参照测验的效度
结构
绩效
从内容入手寻找 效度证据,可以 借助专家判断的 方法,也可以通 过经验规律、统 计等方法进行分 析。
从理论结构入手 寻找效度证据有 几种方法,常见 的有聚合效度法、 区分效度法和因 素分析法,其中 又以因素分析法 最为常用。
心理测量学
三、综合法
❖ (二)对照组法 ❖ 1.选择熟悉被试的专家; ❖ 2.让专家判断一组被试为掌握组,另一组被试为非
掌握组,不太容易判断的被试一概剔除; ❖ 3.对两组被试进行施测; ❖ 4.在同一坐标系上画出两个被试组的分数分布图
(见图6-6); ❖ 5.将两个组的交叉点设置为划界分数。
❖ (二)对照组法
心理测量学
三、综合法
心理测量学
三、综合法
❖ (三)Jaeger方法 ❖ 1. 每位专家先完成这份测验。 ❖ 2. 每位专家对问题“当地每个要毕业的中学生都应能正确回
答这道题吗?”作“是”或“否”回答。 ❖ 3. 确定每组专家所建议的通过分数分布,计算每组专家中各
项目的是-否反应数目。 ❖ 4. 告诉每位专家一组11年级的学生(比毕业生低一个年级)
广泛应用于教 育教学实践, 如教师自编测 验、自定进度 的教学系统等
心理测量学
第六章 标准参照测验的设计与编制
2
标准参照测验的信、效度与误差控制
心理测量学
第二节 标准参照测验的信、效度与误差控制
效
项 目 分
信 度 分 析
度 分 析
析
心理测量学
一、标准参照测验的项目分析
(一)测验项目的难度分析 ❖ 标准参照测验对题目难度的要求则侧重题目的代表
❖ 还有人提出,当通过率与达标比率一致时,可以采 用通过率确定及格线的参考标准。
心理测量学
三、综合法
临
对
Jaeger
界
照
方
组
组
法
法
法
❖(一)临界组法
心理测量学
三、综合法
❖ 1982年,Livingston和Zeiley提出由专家判断和选择 一组正处于临界水平的被试,将测验施测于该组被 试,计算他们在测验上的平均成绩,以确定测验的 内容范围所要求的临界水平。
用
编
定
途
制
义
心理测量学
一、标准参照测验的定义
❖ 戈莱塞(1971):“所谓标准参照测验,是根据某 一明确界定的内容范围而缜密编制的测验,并且, 被试在测验中所得结果,也是根据某一明确界定的 行为标准直接进行解释的”。
❖ 当使用的标准是用内容材料定义的,即为掌握某领 域知识和技能的比例,这时测验就被称为内容参照 测验(domain-referenced test)。
相关系数大小受 分数分布的影响, 不适用于标准参 照测验。下张介 绍一下标准参照 测验通过绩效或 结果来验证效度 的评估方法。
心理测量学
三、标准参照测验的效度
心理测量学
第六章 标准参照测验的设计与编制
3 划界分数设置方法与被试评价
心理测量学
第三节 划界分数设置方法与被试评价
判
实
综
断
证
合
法
法
法
心理测量学