目标参照测验

合集下载

常模参照测验

常模参照测验

常模参照测验:是指以学生团体测验的平均成绩作为参照标准,说明某一学生在团体中的相对位置,将学生分类排队。

重在个人与个人之间的比较,主要用于选拔或编组、编班,要求试题难度适中,尽量对所有学生都有较强的鉴别力和区分度。

常模参照测验以鉴别学生个别差异为指导思想,目的是为了测得学生在所处团体中的相对水平。

常模实际上即是该团体在测验中的平均成绩,学生成绩便是以常模为参照标准来确定的。

这一测验衡量的是学生的相对水平,故其评分属相对评价范畴。

标准参照测验又称目标参照测验,标准参照测验是用来衡量学生是否达到预期教学目标的测验。

测验将个人分数与特定的标准相比较,评价学生是否合格,而不考虑学生在团体中的相对位置,故常用绝对评分方式记分。

标准参照测验是指以体现教育教学目标的标准作业为准,看学生是否达到标准以及达到标准的程度。

它主要不是用于比较个人之间的差异。

如我国高中会考及教师自编测验。

利用它可具体了解学生对某单元的知识、技能的学习和掌握情况。

标准参照测验,它是指依据某种特定操作标准可以直接解释测量结果的测验。

操作标准一般可以通过界定个体所应该完成的任务确定。

对标准参照测验来说,他的分数解释是以界定良好的任务或行为领域为基础的,是与预先设计的特定标准相对照所确定的,有了这个条件,我们便可以从较少的有代表性的测验题目的反应情况,推断出被试的真实水平。

用目标表示领域,并且题目是该领域中行为的有代表性样本,这时目标参照测验就是标准参照测验。

标准参照测验主要用于鉴定的目的。

能力评估与传统评估的不同点之一就在于,原有学习技术系统侧重的是常模参照的评价,而能力导向的评估与认证强调的乃是基于能力标准的评估,而很多能力标准的都用一些模糊的词汇加以描述,比如“理解”“掌握”“能够”,所以在能力评估的过程中也很难把握,很难给其一个质性的评价,所以能力标准的细化描述成为能力评估有效实施的关键。

第二章 学生测评的类型与目标

第二章  学生测评的类型与目标

2.心理测验
•即对人们的心理特征及个别差异进行估测、描述 和诊断的一种方法。包括智力测验、人格测验、能 力倾向测验等。 •智力测验(能力测验)测量的是一个人理解、处 理和适应其周围环境的最一般的能力,即观察能力、 注意能力、记忆能力、想象能力、思维能力等各种 认识能力的综合,是以抽象思维能力为核心的能力。 如韦克斯勒智力量表,瑞文推理测验。 •应用:一是用于预测性目的,作为升学选拔和校 内学生分组等决策的辅助性工具;二是用于诊断性 目的,检测弱智儿童,以便把不适合接收正常教育 的儿童分离出来,并送到特殊学校。
• 主观性测验在考查学生文字表达、材料组织、逻辑推 理等方面具有客观性测验所代替不了的作用,因此, 测验时一般采取客观性试题和主观性试题相结合的方 式。
(四)按测验的标准化程度分,可分为标准 化测验和教师自编测验
•1.标准化测验是指由测量专家严格按照测验编制 程序且测验实施全过程标准化的一种测验。
–终结性测验的试题范围较广,并且要对教学内容具 有代表性和综合性,试题难度较分散。
(三)按试题类型分,可分为客观性测验和 主观性测验
•客观性测验
–是指完全采用客观性试题组成的测验。 –客观性试题:由被试从可供选择正确或错误答案的题目, 包括是非题,选择题,配对题等。 –限制性题目,如简答题,填空题也可归为客观性试题 –在评分时,无论是人工评分还是机器评分,评分的结果 是一致的,评分不受主观因素影响。客观性测验能有效 消除评分者的评分误差。
(五)按解释分数的参照标准,可分为 常模参照测验和目标参照测验
•1.常模参照测验:以常模为标准来解释测验分数 意义的测验。 •目的主要是在于考查被试的个体差异,衡量被试 的相对水平。即在于把测验成绩作横向比较,指出 每个被测对象在某一参照群体中的相对地位的高低, 如各种选拔测验。

常模标准参照测验名词解释

常模标准参照测验名词解释

常模标准参照测验名词解释
常模参照测验是指在心理学和教育学中常见的一种测验方法。

它是根据某个特定的标准或参考来评价个体或团体的表现。

常模参照测验通常将个体的分数与某个特定的常模进行比较,以评估个体在特定领域中的相对位置。

常模通常是由一组具有代表性的样本人群组成,这些样本在某个特定的测验或任务中获得一系列分数。

通过统计方法,可以计算出常模中各种百分位数、均值、标准差等指标,从而为后续的个体或团体评估提供参考。

常模参照测验广泛应用于教育、心理学、社会学等领域,例如智商测试、学术能力评估、职业能力测试等。

通过常模参照测验,可以帮助教师、学生、家长等了解个体在同龄人群中的相对表现,从而制定相应的教育计划和学习目标。

除了常模参照测验,还有标准参照测验和相对参照测验等不同的评估方法。

标准参照测验是根据一定的客观标准来评价个体的表现,例如体育比赛中的评分标准。

相对参照测验则是将个体的分数与自己的过去表现或其他个体进行比较,例如个人的年度绩效考核。

需要注意的是,常模参照测验的适用性取决于常模的代表性、测验的可靠性、有效性以及评估目的等因素。

在选择和使用常模参照测验时,应考虑到这些因素,并遵循相应的伦理和法律规定,以保障被试者的权益和隐私。

总之,常模参照测验是一种常见的评估方法,它通过将个体的分数与某个特定的常模进行比较,以评估个体在特定领域中的相对位置。

常模参照测验广泛应用于教育、心理学、社会学等领域,有助于了解个体在同龄人群中的相对表现,并制定相应的教育计划和学习目标。

在使用常模参照测验时,应考虑到其适用性和限制因素,并遵循相关伦理和法律规定。

戴海崎《心理与教育测量》笔记和课后习题详解(目标参照测验)

戴海崎《心理与教育测量》笔记和课后习题详解(目标参照测验)

第10章目标参照测验10.1 复习笔记一、目标参照测验概述(一)目标参照测验的产生从20世纪中期开始,随着常模参照测验模式的局限性(并不是所有的测验都只关心个体间的差异)逐渐被人们发觉,目标参照测验(亦称标准参照测验)应运而生。

1962年戈莱塞(R.Glaser)和克劳斯(D.Klaus)首先提出目标参照测验的概念。

(二)目标参照测验的定义目标参照测验的主要目的在于了解个体在所规定的测量内容上的行为水平,因此其出发点是个体本身的绝对水平,而不再是个体间的水平差异。

戈莱塞认为:“所谓目标参照测验,是根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验上所得结果,也是根据某一明确界定的行为标准直接进行解释的。

”二、目标参照测验的项目分析(一)内容范围的确定一个测验的内容范围包括所欲测量特质中蕴含的全部行为。

任何一个内容范围都具有一些共同的特点:内容范围具有边界;每一内容范围内容均可分为几类,每一类中又可分为更细更小的类,当每一类的内容及其在此内容范围内的相对重要性确定以后,内容范围就有了明确的结构。

(二)测验项目的内容效度分析目标参照测验的项目分析,首先要对构成测验的每一个题目是否合适以及有效进行分析,即检验题目与测验内容范围所要求的内容与目标的一致性。

这一过程一般缺乏客观的统计分析手段,通常采用专家评定的方法。

专家评定可以采取不同方式,其中比较直观和常用的一种方式是要求有关内容领域的专家填写项目内容评定表,在五级量表上对每个题目所测内容与项目编制者所欲测量的目标内容之间的一致性做出评定,通常情况下,需要同时邀请多位专家进行评定,以考察专家评定之间的一致性。

(三)测验项目的难度和区分度分析1.测验的预测测验编制完成后,须选取一定数量的被试进行预测,由此获得预测数据,然后才能在此数据基础上对项目的难度和区分度进行量化分析。

目标参照测验的预测方法主要有以下三种:(1)前测—后测方法:选取一组被试,在其接受与测验目标内容有关的教学过程前后各施测一次,取得前测和后测的结果,前者表示未掌握者在测验中的水平,后者表示已掌握者的水平。

心理测量学重点

心理测量学重点

第一章心理测量概述第一节心理测验的历史量的性质2、测验标准化条件:1测验内容的标准化2施测条件的标准化包括:①相同的测验情境..②相同的指导语..③相同的测验时限.. 3评分规则的标准化4测验常模的标准化二、心理测量一心理测量的定义一级定义所谓心理测量;就是依据心理学理论;使用一定的操作程序;通过观察人的少数有代表性的行为;对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段..第三节心理测验的种类与功能及其正确使用五按评价所参照的标准来分类1、常模参照测验一级定义是根据被试对量表中所规定的题目答对多少来评分的;被试成绩的优劣;是根据所得分数在常模中所处的地位来确定的;不是以是否达到某个标准来决定..2、目标参照测验一级定义是将被试水平与一绝对标准相比较;以便评价被试有无达到该标准为目的测验;也称标准参照测验..3、潜力参照测验是将被试水平与自身潜力相比较;以评价被试有无充分发挥自身潜力为目的的测验..三、心理测验使用的注意事项1慎重选择测验量表 2与被测验者建立协调关系 3控制实施测验的误差4正确解释测验结果 5遵守测验的道德 6注意测验的保密第二章心理测验的编制与应用第一节心理测验的编制①确定测验目的与对象②拟定编制计划③设计测试项目④项目的预测和分析⑤合成测验⑥测验使用的标准化⑦搜集信度、效度资料⑧编写测验手册一、确定测验目的与对象一测量对象测验编成后要用于何种团体..如被试的年龄、智力水平、受教育程度、社会经济和文化背景以及阅读水平等..二确定并分析测量的目标一般可分三种情况:一是编制带有预测功能的心理测验..工作分析二是编制针对某种心理特质的测验 ..下操作定义三是编制标准参照测验..双向细目表三测验用途测量目的二、拟定编制计划双向细目表主要有两个方面:一是全面而具代表性的测验内容..二是对各个内容点的相对重视程度;通常用百分比来标明..三、设计测试项目一搜集有关资料1、资料要丰富..2、资料要有普通性..3、资料要有趣味性..题目的来源:1、已出版的标准测验..2、理论和专家的经验..3、临床观察和记录..二选择项目形式考虑:1、测验的目的和材料的性质..2、接受测验的团体的特点..3、各种实际因素..三命题的一般原则1、内容方面2、文字方面3、理解方面4、社会敏感性方面四编写和修订项目要注意:1、项目的范围..2、项目的数量..3、测验项目的取样..4、项目的难度..5、项目的说明必须清楚;用语要力求精练简短、浅显明了..四、项目的预测和分析一预测应注意:1、预测对象..2、预测的实施过程..3、预测时限..4、在预测过程中;应随时记录被试的反应情形..二项目分析质的分析;量的分析..五、合成测验一项目的选择指标有三:1测验的性质..即要选择那些能够测量所要测量的东西的项目..2项目的难度..3项目的区分度..二项目的编排1并列直进式..2混合螺旋式..三编造复本复本的关键是等值..六、测验使用的标准化一施测过程1、指导语包括对测验目的的说明和被试应该如何反应的指示包括如何选择反应、记录反应以及时限等..指导语会直接影响被试的反应态度与方法..2、时限二评分、记分要求:1、及时而清楚地记录反应的情况..2、要有一张标准答案或正确反应的表格;即记分键..3、将被试的反应和记分键比较;对反应进行分类..准确无误是对记分的基本要求..三分数解释1、常模团体是由具有某种共同特征的人所组成的一个群体或是该群体的一个样本..常模选择的一般步骤:确定一般总体→确定目标总体→确定样本..确定常模群体的注意事项:1群体构成的界限必须明确..2常模团体必须是所测群体的一个代表性样本..3取样的过程必须明确且有详尽的描述..几种抽样方法:①简单随机抽样②系统抽样③分组抽样④分层抽样分层比例抽样和分层非比例抽样..4样本大小要适当..应注意:①总体的数目..样本大小适当的关键是样本要有代表性..②群体的性质..③测量结果的精确度..5常模团体必须是近时的..6注意一般常模与特殊常模相结合..2、几种主要的常模参照分数1发展常模①发展顺序量表:格塞尔发展程序表、皮亚杰对守恒概念的研究②智力年龄③年级当量2百分位常模百分等级:百分点;也称百分位数四分位数、十分位数3标准分常模T分数:平均数为50;标准差为10..标准九分:以5为平均数;以2为标准差..标准十分:平均数为5;标准差为1.5..标准二十分:平均数为10;标准差为3..4智商比率智商离差智商3、常模分数表示法1转换表表示法2剖面图表示法七、搜集信度、效度资料八、编写测验手册内容有:1测验的名称、作者、发行单位..2测验的目的和功用..3测验编制的理论背景和选择题目的依据..4测验的实施方法、时限及注意事项..5测验的标准答案和计分方法..6常模资料..7测验的信度资料和效度资料..第三章测量误差及其来源第一节测量误差的含义与种类一、测量误差的含义测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应..二、测量误差的种类一随机误差又叫可变误差;是由那些与测量目的无关的、偶然因素引起的、而又不易控制的误差..二系统误差又叫常定误差;是那种由测量目的无关的变因引起的一种恒定而有规律的效应..系统误差只影响测量的准确性;不影响稳定性;而随机误差既影响稳定性又影响准确性..第二节测量误差的来源一、测验本身引起的误差心理测量量表是否稳定..是否真正测到了我们所要测的东西..二、施测过程引起的误差①测试环境②测试时间③试因素④意外干扰⑤评分记分三、被试引起的误差①应试动机②测验焦虑③测验经验④练习效应⑤反应倾向⑥生理变因⑦学习、发展与教育第四章测量信度第一节信度的意义一信度的含义一级定义信度指可靠性或可靠的程度..测验的信度则是指测验结果的可靠程度..第二节信度系数的计算信度指标常用相关系数表示;也称信度系数;表示实得分数的变异数中有多少比例是由真分数的变异决定的..一、稳定性系数再测信度、重测信度跨时间的一致性是用同一量表对相同被试者在不同时间测验两次的实得分数的相关系数.. 重测法二、等值性系数复本信度跨形式的一致性是以两个等值题型、题数、难度、区分度相等;但具体内容不同的量表;在最短时距内;对相同的应试者先后施测两次测验所获得的两组对应分数的相关系数..复份法三、等值稳定性系数跨时间跨形式的一致性是合估等值性与稳定性而得到的信度系数..既能反映由于试题变异复份引起的测验成绩变化的程度;又能反映由于应试者的变异在两次测验的间隔中;由学习、练习、成熟等引起的应试者的变化而产生的测验成绩的变化的程度..复份法四、内部一致性系数同质性信度跨项目的一致性主要反映的是题目之间的关系;表示测验能够测量相同内容或特质的程度..方法有以下两种:1、分半法:代表了两半测验内容取样的一致程度..2、基于项目协方差的方法:代表测验内部所有题目间的一致性..五、阅卷者评分的信度系数跨评分者的一致性各种信度系数相应误差变异的来源第三节信度与测验分数的解释及其信度提高方法二、提高测验信度的方法二影响测验信度的因素1、系统误差:不影响信度..2、抽样误差:是影响信度的一个因素..3、随机误差:是影响信度的最主要的一种误差..三提高测验信度的方法①延长测验的长度②测验的难度要适中③测验的内容应尽量同质④测验的时间要充分⑤测验的程序应统一⑥评分要客观⑦加大应试者之间的差异第五章测验的效度第一节效度的意义一、效度的含义一级定义效度是量表能实际测量出其所要测量的特性或功能的程度..理解:1是对一定的测量的目的而言的..2是对测量的结果而言的..3一种测验结果的效度只是高或低的问题..第二节效度的估计逻辑效度:如内容效度和结构效度;统计效度:如目标关联效度..一、内容效度Content Validity基于所测内容的效度验证方法..指测验项目在内容上的适合性;即是否是所欲测量的行为领域的代表性取样..是指测验目的代表所要测量的内容和引起预期反应所达到的程度..研究的目的是要评估测题是否充分代表了所要测量的内容范围;及测验题目对有关内容或行为范围取样的适当性;它所关注的是测验的内容方面..主要应用:学业成就测验、职业资格测验、人员选拔与安置中的工作样本测验..一个测验要有内容效度必须具备两个条件:1.要有定义得完好的内容范围..2.测验项目应是已界定的内容范围的代表性样本..一逻辑分析的方法专家判断它要求让一组独立的专家他们不是测验的编制者;但是非常熟悉所测量的内容领域判断测题对所研究的领域的取样是否有代表性;通过这些评定资料来确定一个测验的内容效度..二克龙巴赫方法从同一个教学内容总体中抽取两套独立的测验题目;用这两套试题分别对相同的一些应试者进行测验;两次测验得分的相关系数;可以用来估计内容效度..若相关较高;可以认为内容效度亦高;若相关较低;则两次测验中至少有一次内容效度低..三统计分析法计算两个评分者之间评定的一致性评分者信度两个测验复本上得分之相关复本信度再测法测验-学习-再测验四经验推测法通过率提高内容效度的方法之一:编制命题的双向细目表二、结构效度构想效度、构念效度construct Validity基于所测心理结构的效度验证方法..是指测验分数能够说明心理学理论的某种结构或特征的程度;或测验实际测量了所要测量的结构和特性所达到的程度..建立构想效度的逻辑顺序:基于相关专业知识和观测资料;提出某一心理特质假设或某一心理结构理论假设;然后根据理论或假设所可能对应的行为特点编制测验并进行施测;最后对测量结果进行相关或因素分析;验证其与理论假设的符合程度..主要应用:各种心理测验;如智力测验、人格测验、焦虑测验、成就动机测验等..估计方法:1对测验本身的分析测验的内容效度:测验的同质性;分析被试者对题目的反应特点.. 2测验间的相互比较相容效度;区分效度;因素分析法..3效标关联法4实验操作法如;举行两场考试;使被试相信一场考试关系重大;另一场考试无关紧要;在考试前进行焦虑测验;看被试的焦虑测验分数是否存在显着的差异;分析原因..构想:考试焦虑是当考试结果对个人有重大意义时的一种害怕失败的紧张情绪”..有一个焦虑测验;考察这测验是否有构想效度..三、效标关联效度准则关联效度一级定义基于效标关联性的效度验证方法..又称实证效度;是指测量分数与作为效标的另一独立测验结果之间的一致程度..一效标是衡量测验有效性的参照标准;指的是可以直接而且独立测量的我们所感兴趣的行为..常见的效标有:1学业成就.. 2等级评定.. 3临床诊断..二效标测量:将观念上的效标用可操作的测量确定下来..防止效标污染;即指个人的效标因评定者知道个体的测验分数也叫预测源分数而受到影响..三效标关联效度的种类:1、同时效度2、预测效度是指测验结果对未来的行为或测验成绩效标能够准确预测的程度..四效标关联效度的估计方法:1、相关法①皮尔逊积差相关公式在两组数据都是连续变量;且两者存在线性关系时使用..②斯皮尔曼等级相关公式在两组数据都是等级变量..③点二列相关系数适用于一列数据为等距正态变量;另一列为离散型二分变量..④二列相关系数在测验分数和效标这两个变量中一个是连续变量;另一个是二分变量被人为地分成两类时使用..2、区分法3、命中率4、利用回归方程估计效标分数及计算其置信区间..X-1.96SE≤T≤X+1.96SE四、表面效度是指从外表直观地看来这个量表可以测量所想测量的特性和功能的程度..最高行为测验如能力测验要求有较高的表面效度..典型行为测验如人格测验却要求较低的表面效度..第三节提高测验效度的方法二、影响效度的因素一测验本身的因素测验取材的代表性、长度、试题类型、难度、区分度以及编排方式等都会影响效度..编制要注意:1测验材料要有应测内容具有代表性;2尽量避免误差较大的题型如是非题;3难度要适中;具有较大的区分度;4测验长度要恰当;保证一定的题量;5测题的排列应先易后难..二测验实施中的干扰因素1、主试的影响因素..如是否按照标准化来实施、测验与效标测量的实施的时间间隔、测验环境的布置等;2、被试的影响因素..如被试测验时的动机、情绪、态度、身体状态、反应定势等..三样本团体的性质1、样本团体的异质性..其他条件相同;样本团体同质性越高;分数范围越小;得到的效度系数就会越低;会低估测验效度;反之 ;得到的效度系数就越大 ;可能会高估效度..比如 ;只使用经选拔后的被试组成样本团体;增加了被试同质性;测验得到的效度系数会较低;2、干涉变量..样本团体的有些变量会影响效度测验;比如被试的年龄、性别、受教育程度、智力、动机、兴趣、职业等特征 ..对于同一个测验来说;使用的样本团体不同;得到的效度系数也会不同..四所选效标的性质三、提高效度的方法①控制系统误差②精心编制量表③妥善组织测验④扩大样本的容量代表性⑤合理处理效度与信度的关系⑥适当增加测验的长度第六章测验的项目分析一难度一级定义指试题的难易程度..P=R/NP代表试题难度;R为答对该试题人数;N为参加测验总人数一区分度一级定义是指测验对考生实际水平的区分程度..也叫鉴别力..第七章试题类型及评分一评分误差评分可靠是指不同人评定同一份试卷或同一个人在不同时间评定同一份试卷所评定的分数都应是一致的..这就叫评分信度..评分者本人的某些特点也能影响评定分数的客观性..1、评分者知识水平的影响..2、评分者心理状况的影响..3、评分者个性倾向的影响..4、各种“效应”的影响:①名片效应..②光环效应..③对比效应..④先后效应..5、评分者工作态度的影响..第八章智力测量第一节智力概述三、智龄和智商二智商比率智商 IQ = 智龄/实龄×100离差智商 IQ = 测验分数/同龄人的平均数×100离差智商 X=100+15Z离差智商一级定义是一种以年龄组为样本计算而得来的标准分数..离差智商=100+15Z;其中Z=X-M/S;其中M代表团体平均分数;X代表个体测验的实得分数;S代表该团队分数的标准差;Z代表该人在团队中所处位置;即他的标准分数..二、韦克斯勒智力量表详见课本P223页包括言语量表和操作量表两部分1.常识2.数字广度3.词汇4.算术5.理解6.类同7.填图8.图片排列9.积木图案 10.拼图11.译码或数字符号 12.迷津 13.句子 14.几何图形 15.动物房第九章人格测量第二节自陈量表法二、几种常用的人格自陈量表介绍一明尼苏达多相人格测验MMPI适用于16岁以上具有小学文化水平以上的群体..该量表共有测题566道;其中有16道重复题..内容包括健康状态、情绪反映、社会态度、心身性症状、家庭婚姻问题等26类题目;可鉴别强迫症、偏执狂、精神分裂症、抑郁性精神病等..MMPI项目涉及内容及项目数MMPI 临床量表4个效度量表Q:疑问量表Question没有回答的题数和对“是”和“否”都做反应的题数..566题版本超过30分;或399题版本超过22分;则答卷无效..L:说谎量表Lie超过10分;结果不可信..F:诈病量表Frequency说明伪装疾病或精神病程度重..K:校正量表Correction根据被试对测验的态度对测验得分进行校正..该测验有两种形式:卡片式、问卷式..测验没有时间限制;一般45分钟可以做完;最多也不超过90分钟..施测的步骤与结果转换:1施测前;主试要熟悉测验和测验的指示语、了解被试情况、确定安静整洁的测试环境..然后选择合适的测试方式卡片式、手册式或录音播放式;2开始测验时把指示语读给被试听;说明测验约需1个半小时;3测验开始后;主试要注意查看被试是否在答题纸上填写姓名、性别、地址等;所答题目序号是否与试卷上的序号符合等;4答题结束后;用读卷机或套版记分..套版记分方法是:把答卷按性别分开、检查并划掉同时选“是”和“否”的答案、查看Q分并当其超过30或22分时确定答卷无效、换用不同套版得到不同分量表原始分;5对5个临床量表进行校正:Hs+0.5K、Pd+0.4K、Pt+1.0K、Sc+1.0K、Ma+0.2K;6使用与被试年龄、性别等对应的换算表;得到各分量表T分..施测中应注意的事项:1测验前 ;要告知测验的意义 ;取得被试合作 ..如被试仍轻率从事或不愿暴露自己 ;主试可凭经验尽可能弄清情况;做好工作;争取被试的合作;并详细记录被试的表现;2向被试讲清楚;如遇不能回答的问题;可以空下来;但要尽可能回答;不要空的太多;每个问题的回答无所谓对错等;3如果因测验时间长被试情绪焦躁、不耐烦;则可以将测验分成几段进行;也可以用放录音的方法进行测验;4使用分量表时;尽量使用代码表示;而不要用中文全译名称;以免表达不准确或造成误解、误判、误读等..计分方法:原始分→T分数→剖面图计算Q量表的原始分..超过22分或30分无效..分别计算各量表的原始分..对5个量表加K分校正..Hs、Pd、Pt、Sc、Ma5个量表要分别加上一定比例的K分..查表把原始分转化为T分;或计算T分..60以上为异常中国标准:70分以上为异常美国常模T = 50 + 10X - X/ SD画出剖析图..临床量表及其诊断意义:1疑病Hs:反映对身体功能的不正常关心;高分者往往有疑病症、神经衰弱、抑郁等倾向;身体无病;也总觉得身体欠佳;2抑郁D:高分者常被诊断为抑郁症;表现忧郁、淡漠、悲观、思想与行动缓慢..分太高有自杀倾向;3癔症Hy:反映用转换反应对待压力或矛盾的倾向;高分者往往有癔症倾向;依赖、天真、外露、幼稚及自我陶醉等;4精神病态Pd:反映性格畸变..高分者蔑视社会习俗和规范;常有复仇攻击观念;多诊断为人格异常、反社会人格、被动攻击性人格;5男子气-女子气Mf:高分者有异性化倾向;极端高分则暗示有性变态倾向或性变态行为..6偏执Pa:高分者多疑、孤独、过分敏感等 ;T 分超过70则可能存在偏执妄想..尤其是F、Sc量表分数高;而Pa分又极端高;则常被诊断为精神分裂症偏执型和偏执性精神病;7精神衰弱 Pt:高分者紧张、焦虑、强迫思维、恐怖及内疚感;常自责自罪、自卑;Pt、D、Hs同时升高则多诊断为神经症;8精神分裂症Sc:高分者表现非常的或分裂的生活方式及情感反应 ..极高分数T>80者多有不恰当情感反应、怪异行为、妄想、幻觉、人格解体等精神症状及行为异常..如只有Sc高分、无F量表分升高常提示类分裂性人格;9轻躁狂Ma:高分者常为联想过多过快、活动过多、观念飘忽、夸大而情绪激昂、情感多变..极高分数多有妄想;T>90 者可能正处于躁郁症的躁狂相;10社会内向Si:高分者内向、退缩、紧张、固执、自罪;低分者外向、爱交际、冲动、做作;在社会关系中不真诚..三艾森克人格问卷EPQ该量表是由内外向性E量表、情绪性或神经质N量表、精神质或倔强性P量表和效度量表L量表等四个分量表组成..包括两式:儿童7~15岁;成人16岁以上..艾森克的人格理论E维度:内—外向高分表示人格外向;低分表示人格内向;N维度:情绪稳定性低分表示情绪稳定;高分表示神经过敏;P维度:精神质高分表示孤独;难以适应环境;感觉迟钝..L:说谎量表..E、N维度与古希腊盖伦的气质学说相吻合施测步骤和结果计算:艾森克人格问卷的施测非常简单;即将答卷和答题纸发给被试;可以个别测验;也可以团体测验..团体测验时要保证人手一套答卷和答题纸..严格按照指示语向被试说明完成测验的做法;即可由被试自行完成..施测中要求:第一;在问卷上印有指示语;施测时要让被试读懂指示语;第二;只需要就每一题回答“是”或“否”;第三;不要遗漏任何一道题目..评分界线:中间型:43.3~56.750± 6.7倾向型:38.5~43.3; 56.7~61.5典型型:< 38.5 50-11.5;> 61.5 50+11.5各维度的典型人格特征1典型外向E分特高表现为:爱社交、朋友多、喜欢冒险、追求剌激、不甘寂寞、好谈笑、冲动行事不爱做研究工作;喜欢实际的工作;反应迅速;随和;但情绪容易失去控制;做事粗心;从外表看似乎是一个不太可靠的人..审美:喜欢深颜色2典型内向E分特低表现:保守;交际不广;但有挚友;好静;做事瞻前顾后;行为不易受冲动的影响;不喜欢剌激;喜欢有秩序的生活和工作;极少发脾气;做事有计划;情绪倾向于悲观审美:喜欢浅色3典型的情绪不稳N分特高表现为:焦虑、紧张;易怒;往往又有抑郁;对各种剌激的反应都过于强烈;情绪被激发后以很难平复下来;好抱偏见;常患有多种心身障碍..4情绪极稳N分特低表现为:情绪反应缓慢;不强烈;而且容易平复;很难生气;在一般人难以忍耐的剌激下也有所反应;但不强烈..5P分高表现为:独身;不关心人;常到哪里都觉得不合适;有的可能表现为残忍;不人道;缺乏同情心;对人常抱有敌意;攻击性强;喜恶作剧..儿童:好恶作剧;很麻烦;缺乏是非感;令人讨厌的调皮..第三节投射测验一、投射测验的基本理论一基本理论向受测者提供预先编制好的一些未经组织的、意义模糊的标准化刺激情境;让受测者在不受任何限制的情况下;自由地对刺激情境作出他的反应;然后通过分析受测者的反应;推断受测者的人格特征..投射:一级定义是指个人对个体特征的想象式解释;在这种解释中;个人具有将自己身上发生的心理过程无意识地附着在客体身上的倾向..第十章心理与行为问题评估第一节 90项症状清单SCL-9090项症状清单Symptom Check List 90;简称SCL-90;又称为症状自评量表;也叫做Hopkin’s症状清单简称HSCL..适用范围:1心理卫生问题的评定工具;2了解躯体疾病求助者的精神症状;。

第七章 测验分数的解释与应用

第七章 测验分数的解释与应用

按照行为发生的一定顺序来判断发展的正常 与否

皮亚杰量表
用特定的任务来揭示儿童发展处于哪个阶段

格塞尔发展顺序量表 格塞尔认为,婴幼儿的行为系统的建立是一个有次序 的过程,反映了神经系统的不断成长和功能的分化, 因而可以把每个成熟阶段的行为模式作为智能诊断的 依据。
4周 不能控制 头部,仰 卧姿势左 右不对称 16周 28周 40周 可独坐, 爬行,扶 着物件站 立 52周 搀一手 行走, 摇摆 颈可竖直, 扶起独 头微摇动, 坐,身 体前倾 仰卧姿势 左右对称

2、年级当量(grade equivalents)

即年级常模,用年级代替年龄,指把学生的
测验成绩与各年级学生的平均成绩比较,看他
相当于几年级的水平。

年级常模的单位通常为10个月间隔。如5年级 的分布为5.0到5.9,5.0表示五年级的初始水 平,5.5则表示五年级中期的平均成绩。
3、 发展顺序量表(ordinal scales)
缺点: 单位不等,尤其在分配的两个极端 只具有顺序性,属于顺序量表,不能做加减乘 除运算,无法通知来说明不同被试之间分数差 异的数量 两个不同样本中的百分等级不能相互比较
2、标准分数
什么是标准分数? 有哪些特点? 如何计算?


标准分数又称Z分数,这是等距量表中最常用
的一ent referenced score) 内容参照又叫范围参照,是看被试对指定 范围中的内容和技能掌握得如何。 内容参照分数特别适用于计算机辅助教学 以及利用程序教材自我掌握进度的学习 内容参照分数主要用于成就测验以及能确 定出可接受的最低标准的资格测验
在编制内容参照测验和对此各测验分数做 解释时有两个主要步骤: 一是确定测验所包含的知识或技能的范围 二是编造一个能报道测验成绩的量表

第十章 目标参照测验1

第十章  目标参照测验1

二、测验项目的内容效度分析
专家评定法(教材表10-2,10-3) 结合以前学过的常模参照测验的内容效 度分析来进行对比学习
三、测验项目的难度和区分度分析
1。测验的预测 (1)前测-后测方法(一组被试) (2)已接受教学组-未接受教学组方法(两组被 试) (3)对照组方法(两组被试) 2。测验项目的难度分析 目标参照测验的项目难度计算与常模参照测验相 同,一般以通过率来表示。往往并不必要。
St
适用项目是0、1记分(或二分变量),而效标或测验 总分是连续变量的数量资料。
(2)二列相关
Xp - Xq pq
rb=

St
y
Xp - Xt p
或 rb=

St
y
适用于连续的测量变量。但其中一个变量被人为二分。
(3)φ 相关 ad-bc
rφ= √(a+b)(c+d)(a+c)(b+d)
适用于φ相关的统计方法适用于两个变量都是点分配的资料,即两个变 量都是二分名义变量。在有些情况下,一些连续变量也可以用此方法计算 相关程度。φ相关不要求变量呈正态分布。
回忆常模参照测验的难度分析(注重适中值) 目标参照测验项目难度的计算,大多情况下只是 作为项目区分度分析的基础。
3。测验项目的区分度分析 注意与常模参照测验的对比
(1A-PB D的大小,可以直接反映出该项目在多大程度上对未掌握者和掌 握者作出了区分。D值从-1.00到+ 1.00之间变化,越接近于+ 1.00, 题目区分度越高,说明题目越有效。
(1)积差相关系数
当预测分和效标分都是连续变量时,可采用积差相关 系数的计算方法来求得测验的效度系数。
例:假设有10名男性经职业兴趣测验而被选定作为推 销员,其测验分数下表第一行,而第二行是经过若干年后 他们某段时间内销售金额总量(以万元为单位)。现问该测 验的预测效度如何?

目标参照测验

目标参照测验

目标参照测验目标参照测验,也称为目标相关测验,是一种心理测量工具,用于衡量个人对特定目标的关注程度和期望程度。

通过这个测验,我们可以了解个体对自己的目标有多大的关注和期望,以进一步调整行为和制定目标计划。

目标参照测验的步骤主要包括:确定目标、编制量表、进行测验、分析结果。

首先,确定要测量的目标,例如学业成绩、健康状况、事业发展等。

然后,根据目标制定适当的量表,通常采用一定的评分标准,例如1-5分,1表示不关注或没有期望,5表示非常关注或期望。

接着,对被测者进行测验,通常采用问卷的形式,要求被测者根据自己的实际情况进行评估。

最后,根据测验结果进行分析和总结,找出个体在各个目标上的关注和期望程度,以及不同目标之间的差异。

通过目标参照测验,我们可以从以下几个方面了解个体的目标情况:首先,了解个体对不同目标的关注程度。

不同个体对不同目标的关注程度可能存在差异,某些人可能更关注事业发展,而另一些人可能更关注家庭和健康。

其次,了解个体对目标的期望程度。

期望是推动个体行动的重要动力,个体对不同目标的期望程度也可能存在差异。

例如,某些人可能对自己的学业成绩有很高的期望,而其他人可能对此并不那么重视。

最后,了解个体在目标设定和规划方面的差异。

个体在目标设定和规划方面存在的差异可能会影响他们的行动和决策,从而影响结果的实现。

目标参照测验可以应用于个人的发展规划、组织的人力资源管理、学校的评估等多个领域。

在个人发展规划中,了解自己对不同目标的关注和期望,可以帮助个体更好地制定目标和计划行动,提高自己的执行力和成就感。

在组织的人力资源管理中,了解员工对不同目标的关注和期望,可以帮助组织更好地匹配员工的能力和动机,提升员工的工作满意度和绩效。

在学校的评估中,了解学生对不同目标的关注和期望,可以帮助学校更好地制定教育目标和改进教育方法,提高学生的学业成绩和发展水平。

综上所述,目标参照测验是一种测量个体对特定目标关注和期望程度的方法。

心理测量 复习重点内容

心理测量  复习重点内容

心理测量复习重点名词解释:1、心理测量:所谓心理测量,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。

2、个别测验:每次以一位被试为对象,通常是由一位主试与一位被试在面对面的情形下进行。

是临床心理诊断测验中最常用的测验形式3、团体测验:指每次测验过程中由一个或几个测验者对数量较多的被测验者(一个群体)同时实施测验。

一般用于广泛的心理健康调查。

4、常模参照测验:是根据被试对量表中所规定的题目答对多少来评分的,被试成绩的优劣,是根据所得分数在常模中所处的地位来确定的,不是以是否达到某个标准来决定。

5、目标参照测验:是将被试水平与一绝对标准相比较,以便评价被试有无达到该标准为目的测验,也称标准参照测验。

6、测量误差:测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应.7、随机误差:又叫可变误差,是由那些与测量目的无关的、偶然因素引起的、而又不易控制的误差。

8、系统误差:又叫常定误差,是那种由测量目的无关的变因引起的一种恒定而有规律的效应。

9、信度:指可靠性或可靠的程度。

测验的信度则是指测验结果的可靠程度。

换句话说,若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度。

10、效度:效度是量表能实际测量出其所要测量的特性或功能的程度。

11、难度:指试题的难易程度。

12、区分度:是指测验对考生实际水平的区分程度。

也叫鉴别力。

13、评分可靠:是指不同人评定同一份试卷或同一个人在不同时间评定同一份试卷所评定的分数都应是一致的。

这就叫评分信度。

14、人格:是个人在与环境的相互作用过程中形成的相对稳定的心理特质和行为倾向的整体组织,它决定着个人行为的独特性。

15、人格测量:就是通过一定的方法,对在人的行为中起稳定的调节作用的心理特质和行为倾向进行定量分析,以便进一步预测个人未来的行为。

第十章 目标参照测验

第十章 目标参照测验

决策效度可以以在测验中被评为掌握组和未 掌握组的人数占总人数的比例来表示,也可
以以在预测源测验中和效标测验中均通过和
均未通过的人数占总人数的比例来表示,见 下表:
预测源测验
效标测验
及格
不及格
及格
A
B
不及格
C
D
决策效度(DV)=(a+d)/a+b+c+d
第四节 测验分数的解释 -分数分界点的确定
试在每一题上有能力排除的错误选择项,从而计算其正 确回答的可能性,再求出每一题上的正确回答的可能性 之和,即为测验分数的分界点。
例如:某测验由四择一选择题组成,某题A、B、C、D四 个答案中A为唯一正确的答案。若专家判定处于临界水 平的被试应该可以正确地排除B和D两个选择项,那么在 该题上正确的可能性为1/(4-2)=0.5。最后再对每一 题正确回答的可能性求和,可以得到该测验的及格线。 若多位专家同时评定,则可将多个及格线的平均值作为 最终的及格线。
分类一致性信度的优点在于计算简单,意义直 观可靠,但由于其所采用的方法类同于常模参照测 验信度评估中的再测法和复本法,因而再测法和复 本法的缺点在此也同样存在。此外,分类一致性信 度也受到测验长度和被试分数分布的影响。
方差分析方法--荷伊特信度 此法的最大优点在于它不受测验目的或
被试异质性的影响。具体计算与解释见79 页第(4)小部分。
D为-1.00时,表明题目也能将掌握者和未掌握者 做最大的区分,但问题在于掌握者无人通过该题, 而未掌握者却全部通过。这种情况表明该项目存在 错误,或是出题错误,或是将正确答案弄错。
(2)个人获得指数(DIG)
采取前测--后测方法,可获得在前测中错误回答 某项目而在后测中能够正确回答的被试人数比例, 此即该项目的个人获得指数,其值在0-+1.00之间 变化,其大小直接反映了经过教学活动之后受益的 被试比例。个人获得指数越接近+1.00,表明某项 目的区分度越大,越接近0,表明该项目的区分度 越小。

心理测量学部分概念解释(二)

心理测量学部分概念解释(二)

鉴别指数(discrimination index):一个好的有效测验应该能区分能力强与能力差的被试,鉴别指数就是检验测验项目鉴别力的方法。

做法是根据检验成绩总分将被试者排队,取27%高分端的受试者组成高分组,另取27%低分端的受试者组成低分组,然后比较高分组被试者在该项目的的通过率,用公式表示为:D=PH-PL.式中,D=鉴别指数,PH-高分组的项目通过率,PL=低分组的通过率。

根据D 值大小了解每个测验项目的区分力,D值越高表示区分度越大。

交叉效度分析(cross validity):同一测验用于不同样本时的效度分析即交叉效度分析。

由于单一样本存在取样误差的可能,此时得到的效度可能并不真实,需要通过对不同样本进行效度分析,进一步证实。

曾有例子说明对一个样本统计分析表明测验有较高的效度之后,在另一个样本不能证实第一个样本发现的效度结果,提示一个样本的效度有可能与抽样有关,因此,测验效度需要用不同样本的检验证实,即进行交叉效度分析。

克伦巴赫α系数(cronbach's α系数):测验信度分析的方法之一。

检验测验项目的一致性程度,即题目与题目之间的一致性关系。

适用于多重记分的项目,如某种态度量表的项目记分有经常、有时、偶尔和从不4个等级,对这种采用多重记分的题型,不宜用分半相关法,而要采用克伦巴赫α系数。

客观测验(objective test):测验项目由客观题组成的一类测验。

客观题指计分客观,事先规定好标准答案(记分键),评分时没有评分者的主观和随意判断。

常用客观题有是非题、填空题和多项选择题等。

绝大部分心理测验都属于客观测验,如韦氏智力量表、明尼苏达多相人格问卷、90项心理症状核查表等。

客观题(objective item):测验题目的一种类型,其特点是计分的客观性,即在测验前就规定好测验题目的正确答案,严格按标准(记分键)记分,评分时没有评分者的主观判断。

常见题有多项选择题、填空题、是非题、匹配题等。

特殊儿童测验分数的解释—内容参照分数与结果参照分数

特殊儿童测验分数的解释—内容参照分数与结果参照分数
P0 = (A + D) / (A + B + C + D)
分数分界点的科学确定是评估测验分 类一致性的前提,报告标准参照测验 的分类一致性信度时,必须同时提供 测验的分数分界点,以及测验长度等 资料。
方差分析法:荷伊特信度
MS人:被试均方,MS人、题:交互 作用
内容效度 命题细目表 专家评定
Angoff方法:由专家直接判断处于临界水平的被 试在某测验的每一题目正确作答的可能性(记为Pi), 设每一题的满分为Fi,则该测验的分数分界点λ = ΣFiPi Angoff方法在实际运用中较多。
效标组预测法
临界组法:由专家判定和选择一组 正处于临界水平的被试,将测验施测 于该组被试,计算他们在测验上的平 均成绩。(抽象、主观)
效标关联效度 决策效度(预测源测验,效标测验)
结构效度目前关注不多
标准参照测验的分数解释
如何确定分界点: 专家判定法
Nedelsky方法:由专家来判断处于临界水平的被 试在每一题上有能力排除的错误选择项,从而计算 其正确回答的可能性,再求出每一题上正确回答的 可能性之和,即为测验分数分界点。
标准参照测验
标准参照测验:又称目标参照测验,当一个 测验是以某一明确界定的内容范围为基础编 制而成,并且其分数是参照该内容范围所要 求的绝对标准进行解释。
作用:了解个体在所规定的测量内容上的行 为水平,因此其出发点是个体本身的绝对水 平,而不再是个体间的水平差异。
标准参照测验的题目分析
内容范围的确定:双向细目表 内容效度分析:专家评定 难度、区分度分析: 预测试
前分析:通过率,大多数情况下作为区分度分析 的基础
区分度分析:
难度差值
掌握组-未掌握组鉴别指数D = PA – PB 个人获得指数DIG:前测中错误回答某项目而 在后测中能够正确回答的被试人数比例

教育测量的基本方法

教育测量的基本方法

教育测量的基本方法教育测量与教学评价是教学活动的重要组成部分,是在教学领域中进行科学管理的重要手段,合理地开展测量评价活动是提高教育质量的有效保证.一、基本概念1.教育测量教育测量有广义和狭义之分.从广义上说,教育测量泛指运用测量手段对教育活动所进行的量的测定。

它涉及的范围很广,凡是需要并能够测量的与教育有关的活动均在研究之列,如教育投入、教育过程各要素、教育的效果等。

从狭义上讲,教育测量专指按一定规则对学生的知识、智能、个性发展、思想品德等所进行的量的测定。

通常所提及的多是狭义上的教育测量。

2. 教学评价教育评价是按照一定标准,运用科学可行的方法,对教育活动所进行的价值判断的过程。

它包括对教学过程和教学效果的评价,诸如学校、教师的教学工作、课堂教学、教学方法、模式和内容以及学生的学业成就、一般智能发展、个性发展、思想品德状况等评价。

3.测验及其种类测验是指对通过一定的仪器和试题所引起的受测者的行为样本进行测量的系统程序。

教育测量的对象和内容是非常丰富的,测验作为教育测量的主要工具,种类也很繁多,可按不同标准加以分类。

按测验的功用分类(1)学绩测验;(2)能力测验;(3)人格测验。

按测验的目的分类(1)诊断性测验;(2)形成性测验;(3)终结性测验。

诊断、形成、终结三种测验对照表按解释分数和方法分类(1)常模参照测验指参照被测群体的实际水平解释分数的测验叫做常模参照测验。

群体的平均分数一般可以反映群体的水平,称为常模。

以常模为参照点,将被测个人的成绩与常模比较,并把比较结果所反映出来的差异数量化,作为导出分数。

参照常模解释分数,便于比较和选拔工作的进行,它属于相对评价的范畴。

例如,在升学考试中,按标准化的要求进行的分数转换就是参照常模得出的。

(2)目标参照测验参照被测达到目标的程度来解释分数的测验,叫做目标参照测验,也称作标准参照测验。

通过与特定的标准进行比较,了解被测的达标程度,这是一种绝对评价方法。

《目标参照测验》课件

《目标参照测验》课件
跨文化应用
目标参照测验将逐渐应用于跨文化领域中,为不同文化背景的人群 提供更加客观和准确的评估。
标准化与规范化
目标参照测验的标准化和规范化将是未来的重要发展方向,制定统一 的测验标准和规范,提高测验的可靠性和有效性。
THANKS
感谢观看
大数据分析
通过大数据分析,对大量的测验数据进行深入挖掘,发现潜在的规 律和特征,为测验的改进和优化提供科学依据。
虚拟现实技术
虚拟现实技术将为测验提供更加真实和沉浸式的环境,使测验更加 生动有趣,提高测验的参与度和效果。
应用领域的拓展
1 2 3
教育领域
目标参照测验将进一步应用于教育领域中,为学 生的学业评估和教师教学提供更加科学和准确的 依据。
灵活性不足
对于不同学习者或不同学习环境,目标参照 测验可能缺乏足够的灵活性。
高成本
设计和实施目标参照测验需要投入大量时间 和资源。
改进建议
增加多元评估方式
提高测验内容的适应性
结合目标参照测验与其他评估方式,如表 现评估和同行评估,以获得更全面的学习 者表现。
根据不同的学习者或学习环境调整测验内 容,使其更符合实际需求。
03
目标参照测验的应用领域
教育领域
评估学生的学习进度和掌握程度
目标参照测验可以用来评估学生在某一学科或技能上的学习进度和掌握程度,帮助教师了 解学生的学习需求和困难,从而制定针对性的教学计划。
诊断学生的学习问题
通过目标参照测验,教师可以发现学生在学习上的薄弱环节和问题,进而进行针对性的指 导和干预,帮助学生改进学习方法,提高学习效果。
重要性
01
提高评估的准确性和有效性
目标参照测验以个体实际表现为评估标准,能够更准确地反映个体的能

《目标参照测验》课件

《目标参照测验》课件

分析评价结果
通过分析测验结果,可以获得有关个体表现与评价目标之间的差距的信息。 - 测验结果分析方法及案例
如何应用目标参照测验
目标参照测验的应用非常广泛,以下是一些常见的应用场景: - 学校教学评估 - 企业培训评价 - 个人职业规划
总结
目标参照测验具有一定的局限性,但其未来发展趋势仍然很可观。 - 目标参照测验的局限性 - 目标参照测验的未来发展趋势 感谢观看!
《目标参照测验》PPT课 件
目标参照测验是一种评估方法,通过将个体的表现与预先设定的目标进行比 标的比较,评估个体在特定领域的表现。 - 目标参照测验的定义 - 目标参照测验的优点
测验过程
1. 确定评价目标 2. 定义测验环境 3. 确定评价标准 4. 制定测验题型 5. 编写测验题目 6. 安排测验时间和地点 7. 进行测验

第9章-目标参照测验

第9章-目标参照测验

测量专家认为,重视内容领域规范是标准参照测验 最重要的一环,至少有四个目的:
其一,为试题编写人员准备试题时提供内容和技术上的 指导;
其二,向内容方面或测量方面的专家提供每种能力所包 括的内容和行为的清晰表述;
其三,帮助解释被试个体的能力水平;
其四,向用户提供能力广度和范围的明确规定。
2021/4/9
来表示,也可以以在预测源测验中和效标测验中均通过和均未通过的人 数占总人数的比例来表示。 决策效度(DV)=(a+d)/a+b+c+d
预测源测验
通过人 数
未通过人数

标通过人数
a
b

2021/4/9
未通过人数
c
d
13
第四节 测验分数的解释——分数分界点的确定
一、专家评定法 这种方法是在测验的内容范围明确界定的基础上,
第九章 目标参照测验
学习目标: 1、了解目标参照测验的定义。 2、掌握目标参照测验的项目分析、信效度分析,
巩固测验基本原理。 3、掌握合格分数分界点的确定的过程和方法。
重点:
掌握目标参照测验的项目分析、信度、效度分析。
难点: 目标参照测验的合格分数分界点的重要意义及确定方法。
2021/4/9
1
第一节 概述
正确百分数的计算公式: 正确百分数=(答对题目数/总题目数)*100
2021/4/9
5
(2)掌握分数
无论是针对每一教学单元的形成性测验,还 是针对一门课程的终结性测验,如果要了解 与判断学生是否掌握已经学习的内容,要编 制一份有内容效度的教育测验来进行测量。
2021/4/9
6
第二节 目标参照测验的项目分析

目标参照测验

目标参照测验

• 2、对照组法
– 临界水平被试难以界定,改用对照组法,即用 专家界定出掌握组与未掌握组两组被试,将测 验用于这些被试,然后将两组成绩绘制两分布 曲线,其交点即为合格分数线。此法被试较上 法易找,但同样依据于经验,被试选择会影响 分界点的确定,改善方法:① 多找一些组对用 其均值;② 找教学与否组代替掌握与否组,但 被认为更不准确;③由于依赖专家,因此多找 专家,综合各方的意见,更稳妥一些。
二、专家判定法
• 1、理论依据:
– 据临界水平被试在各项目上正确作答产可能性 ,进而推断整卷的合格分数线,即临界点。其 中“临界水平被试”是虚拟的,正确作答可能 性是据专家经验推测的。
• 2、Nedelsky 方法(1954)—适用于选择题
– ① 判断临界水平被试在每一试题上的正确作答 概率,方法是先判断其可排除几个错误选项, 然后再作概率估计。如选 四选一,若能排除一 个错误选项,则正确作答概率为0.33,若能排 除两个错误选项,正确作答概率为0.5。 – ② 在每一题的正确作答概率都确定后,将每一 题的正确作答概率以题分加权求和,即可得整 λ 卷分界点, =∑ Fi Pi – ③ 若能由各位专家分别评定则以各位专家评定 分数的均数为最终分界点。
• 信度及其估计 • 效度及其估计
一、信度及其估计
• 1、信度定义: 不变。 • 2、常模测验信度不适用目标测验的原因:
– 相关系数信度高低与被试团体分布有关,被试 异质性越强,信度越高,目标测验不在于鉴别 被试差异,因而分数分布相对集中,即使测验 可靠稳定,其相关也不高,因此相关信度不适 用于目标测验。
四、测验分数的解释
• 两种测验模式不同,但分数解释可以配合 使用,即常模式解释可以同时用于目标测 验,特别是既对被试绝对水平感兴趣,又 对其相对水平感兴趣时,更可以配合使用 ,如标准分数,百分等级等。

标准参照测验

标准参照测验

20世纪中期,人们发现了常模参照测验的局限:并不是所有的测验都 只关心个体间测差异,有的测验目的在于了解被试在测验内容上掌握的 绝对水平。
一、标准参照测验的定义与作用
怎样通过测验评价被试在教学活动中对内容的掌握程度?
这一测验的目的在于确定在某个教学领域内,被试是否掌握了该教学领 域的知识和技能,了解被试在该领域的困难,并对其有目的地加以教 学辅导与补救。
主要内容
1. 标准参照测验的定义与作用 2.标准参照测验的题目分析
3.标准参照测验的信度与效度
4.标准参照测验的分数解释
Company name
一、标准参照测验的定义与作用
(一)标准参照测验的产生
20世纪早期,出于解释测验原始分数含义的需要,西方早期心理与教 育测量学专家提出了相对能力的测量,由此发展起来的测验模式就是常 模参照测验,随之发展了常模参照测验项目分析、信效度分析及分数解 释的方法。
Company name

Company name

总结
各种测验的分数分界点的确定过程中,专家评定是中 占据一定的位置,这就使得分界点带有一定的主观色 彩。对此一般采用多位专家评定的方法,综合采用专 家的意见。
标准参照测验和常模参照测验虽然是两种不同的测验 模式,但它们并非互不相容,可被采用到同一种测验 中。
2、难度分析
难度已不能简单地解释成题目的难易程度或题目的通过率,而必须 理解为测验者对测验内容要求的高低,它通过测量目标反映出来。
纯粹的标准参照测验一般注重的是所测内容范围以及被试在所测内 容范围上的掌握程度,因而若某项目所测为内容范围内不可缺的重 要内容,那么无论该项目是难是易,均应得到保留。 对于标准参照测验的项目难度的计算,在大多情况下只是来表示

效标参照测验

效标参照测验

效标参照测验“效标参照测验”效标参照测验(Criterion-referenced test)是一种评估学生学习成就的方法。

它通过与特定标准或目标进行比较,确定学生在特定领域中的能力水平。

效标参照测验不同于常见的相对评价方法,如百分制和等级制,它更关注学生是否达到了特定的学习目标。

效标参照测验提供了一种全面了解学生学习成就的方式。

它不仅可以评估学生在不同学科领域的知识,还可以评估学生在不同认知层次上的能力。

例如,在语言学习中,效标参照测验可以帮助评估学生的听力、口语、阅读和写作能力。

通过了解学生在每个方面的表现,教师可以更好地了解学生的强项和弱项,并有针对性地进行教学。

效标参照测验的结果还可以用于确定教学计划和目标。

通过对学生的评估,教师可以确定学生在特定学科或技能方面的掌握程度。

这样,教师可以针对学生的需要进行教学,制定相应的教学计划和目标。

这种个性化的教学方式可以更好地满足学生的需求,提高学习效果。

此外,效标参照测验还可以激发学生的学习动力。

当学生知道自己将接受一项根据特定标准进行评估的测验时,他们会更加专注和认真地学习。

这种评估方式可以激励学生努力提高自己的学习成绩,达到或超过预期的标准。

然而,效标参照测验也存在一些挑战和限制。

首先,确定有效的评估标准是一项复杂的任务。

标准的制定需要考虑到学科特点、学生的年级和教学目标等因素。

其次,评估过程需要严谨和客观,以确保结果的准确性和可靠性。

最后,评估结果应该以一种能够被学生和家长理解的方式呈现,以便于他们了解学生的学习情况。

总之,“效标参照测验”是一种有益的评估方法,它能够提供全面了解学生学习成就的途径。

通过这种评估方式,教师可以更好地了解学生的学习状况,制定个性化的教学计划和目标。

同时,这种评估方式也能够激发学生的学习动力,促使他们更加努力地学习。

然而,我们也必须充分认识到评估过程中的挑战和限制,以确保评估结果的准确性和可靠性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

内容范围界定的依据和方法
a) 特定测验目的是界定的依据。 如某专业资格测验,可以通过该工作分析
来界定测验内容范围。教材测验可通过教材, 大纲老界定,测验的内容范围。
a) 形式就是测验双向细目表。由三个要素组 成:一是考查目标;二是考查内容;三是 在整个内容范围中每一类内容和每一种目 标相结合后再整个内容范围中所占的比重 (相对重要性)。 如下表:
目标参照测验的应用
• 目标参照测验旨在考查考生是否达到了预先规定的 标准。如驾驶执照考试,学科结业考试,各种专业 化的资格考试等等。
• 目标参照测验与常模参照测验的区别:前者关心有 没有达到预定的学习目标,后者着重学生之间的比 较。目标参照测验适用于诊断和发现学生的不足; 常模参照测验适用于选拔性考试和总结性评定。
第十章 目标参照测验
第一节:目标参照测验概述 第二节:目标参照测验的项目分析
第一节 目标参照测验概述
目标参照测验的产生
1、产生于实际需要。
西方国家发展测验初期只关心个体差异,到了20世纪 中叶发现这是片面的。我们还需要关心个体在测验内容上 的绝对水平。
2、常模参照测验的局限性。
常模测验只能描述被试者在团体中的相对位置,无法 说明他对测验内容所达到的绝对水平。
第二节 目标参照测验的项目分析
内容范围的确定
1、内容范围确定的意义
① 目标参照测验本身的要求,要有明确的内容 范围。
② 项目分析的需要以及测验总体的评价都要以 内容的界定作为前提。
内容范围的特点
① 内容范围有边界:边界有大有小,须界定。
② 内容范围中的内容可以分为几类,每一类可以 分成更小的类。当每一类的内容及其在此内容 范围内的相对重要性确定以后,内容范围就有 了明确的结构。
① 对照组法,掌握组—非掌握组法 含义:同一项目对两组被试各实施一次。
第三种方法被认为是第一二两法的改进,但分组依赖于 教师评定,都是经验判断。
测验项目的难度分析
1. 目标参照测验的难度计算与常模测验的难度计算采 用同一种方法。
2. 有人认为,目标参照测验中属于内容范围中不可或 缺题目,并不在它是难还是易,都要测。
测验项目的内容效度分析
A. 分析目的: 检验所命试题的内容是否与测验内容范围所规定的内容 一致。 A. 分析方法: 专家评定法,填写项目内容鉴定表。
测验项目的难度和区分度分析
测验的预测(数据搜集方法)
① 前测—后测法 含义:同一项目对同一组被试在学习之前之后分别
测试一次。
① 学过组—非学过组法 含义:通过一项目对学过和非学过组被试各测一次。
• 相关系数接近0,一般不予保留,但是应视该项目所 测内容在内容范围中的重要性而决定其取舍。
Thank you!
D1=1-0=1 D2=0-1=-1 D3=5/10-6/10=-0.1 D4=8/10-4/10=0.4 D5=1-1=0
相关系数法
方法同常模参照相关系数为负值,应检查题目问题所在,予以删除或 修改。
• 相关系数为正值,其值越大,越具有区分力。项目越 有效。
目标参照测验的定义
有许多定义,但是戈莱塞在1971年对于目 标参照测验的描述与界定被广泛的接受。
“所谓的目标参照测验,是根据某一明确 界定的内容范围而缜密编制的测验,并且,被 试在测验中所得结果,也是根据某一明确界定 的行为标准直接进行解释的。”
理解:特别强调“内容范围”,“行为标准”两 个词。
3. 计算目的:分析区分度的基础。
测验项目的区分度分析
难度差值指标:
① 掌握组—非掌握组鉴别指数(D)。 计算公式:D=PA-PB 其中PA 为掌握组的得分率,PB为非掌握组的得分率。
D值越大,区分度越高。
① 个人获得指数(DIG)。 • 一般用在前测—后测方法中。 • 计算方法为:前测中错误回答某项目而在后测中 能够正确回答的被试人数的比例。范围在[0,1]之 间。 • 局限:未考虑前测中通过而后测中失败的被试
相关文档
最新文档