心理与教育测量第七章
石大教育测量与评价教案07教育评价心理及其调控
第七章教育评价心理及其调控教育评价过程是评价者依据某种标准对被评价者有关方面情况进行评判的过程。
其中,评价者的心理状态必定会影响评价结果;被评价者由于受到心理因素的影响,也会出现“失真”,从而都导致评价结果不准确。
为了提高评判信度,就必须考虑和分析评价者和被评价者的评价心理现象。
第一节教育评价心理概述一、评价心理的分类评价心理,指评价者和被评价者对评价全过程的实践活动和评价过程的各种关系、交往等现实活动的反映。
因此,评价心理既指评价者和被评价者反映评价现实的心理现象,又指对评价现实作出反应的行为方式。
(一)根据心理学范畴分类可分为评价的心理过程、心理状态、心理特征。
评价的心理过程,指在评价过程中即时产生的各种心理活动,包括观察、社会知觉、记忆、比较、分析、综合、判断、推理、想象等。
评价的心理状态,指评价过程中较长时间的较为复杂的心理现象。
包括情感方面的情绪状态,注意方面的集中或分心,意志方面的信心或沮丧,思维待方面的定势与灵活等状态。
评价的心理特征,指评价者或被评价者比较稳定、恒常的心理品质。
包括个性的不同气质类型;性格的理智特征,情绪特征,意志特征等。
(二)根据评价过程的阶段分类可分为组织过程心理、设计过程心理、实施过程心理、评价过程心理和被评价者的准备心理、自评心理、受评过程心理、结果反馈心理等。
组织过程心理,指评价的组织者在组织评价工作全过程中的心理现象。
包括选择评价人员、机构建立、评价者与被评价者沟通、相互调控、内部关系处理、评价意见冲突处理、总结汇报等环节中的心理现象。
设计过程心理,指评价人员设计评价方案,特别是评价标准时的心理现象,如新奇心理、角色心理、捷径取巧、急躁畏难心理等。
实施过程心理,指实施实际评价过程中的心理现象,如首因效应、近因效应、晕轮效应、遵从心理、逆反心理、心理定势、疲劳效应、期待心理、同行宽容、冤家心理、时尚心理等。
评价过程心理,指对结果进行解释和应用时的心理现象,如亲疏心理、刻板印象、老好人心理、回避心理等,以及工作结束时的大功告成、草率等。
(整理)心理与教育测量重点全部
第一章心理与教育测量概论1、测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程。
所谓一定的法则,是指任何测量都要建立在科学规则和科学原理基础之上,并通过科学的方法和程序完成测量过程。
所谓事物的特征,是指所要测量的事物的特定属性。
所谓量具,是指测量中所使用的工具。
所谓定量描述,是指任何测量的结果总是对事物特征的量的确定。
2、任何测量都必须具备两个基本要素,即测量的参照点和测量的单位。
参照点有两种,一种是绝对参照点,即以绝对的零点作为测量的起点。
另一种是相对参照点,即以人为确定的零点为测量的起点。
理想的测量单位应当具备两个条件:一是要有确定的意义,二是要有相等的价值。
3、测量量表分为4种:1)命名量表,是最低水平的量表,它只是用数字代表事物或对事物进行分类;2)顺序量表,如第1名,第2名;3)等距量表,不仅能代表事物的类别,等级,而且具有相等的单位,等距量表没有绝对的零点;4)比率量表,是最高水平的测量量表,有绝对的零点。
心理与教育测量的量表属于顺序量表。
心理与教育测量属于顺序量表。
★4、心理测验实质上是对行为样本的客观的和标准化的测量。
编制一个测验应当具备下列4个基本条件:1)行为样本。
从人的大量行为中抽取与欲测量的心理特质直接有关的一组行为进行测量,并依据对这一组行为的测量结果推断其心理特质和教育成就。
这一组被抽取出来的,作为直接的测量对象的行为就是行为样本。
2)标准化标准化就是指测验的编制、实施、记分以及测量分数解释的程序的一致性。
测验的标准化要具备下列条件:a、测验内容的标准化;b、施测条件的标准化;c、评分规则的标准化;d、测验常模的标准化。
3)难度或应答率4)信度和效度5、心理与教育测验的种类:按测量对象:智力测验、能力倾向测验、成就测验、人格测验。
按测量方式:个别测验,团体测验。
按测验内容的形式:文字测验,非文字测验按测验功能:成就测验与预测测验,难度测验与速度测验,描述测验与诊断测验。
心理与教育测量学-戴海琦-第三版-重点问答题及答案
第一章、心理测量概述1、心理测量的含义、特点;测量的含义;要素;以及测量的量表(1)心理测量的含义:依据一定的法则,对人的心理特质进行定量描述的过程.(2)心理测量的特点–间接性:与物理的直接测量不同,从外显行为推测,以间接了解人的心理属性;–相对性:测量的结果是与其所属团体比较而言。
–客观性:即测验的标准化,是对一切测量的基本要求。
(3)什么是测量:测量是根据法则给事物分派数字(S。
S。
Stevens)事物:测量对象,在心理测量中,想测量的当然是心理能力和人格特点;数字:代表某一事物或事物某一属性的量;法则:测量所依据的规则和方法.(4)测量的要素:参照点:①测量工作中测量对象的数量的固定原点②绝对参照点:以绝对的零点作为测量起点,如长度/高度③相对参照点:相对零点,如温度[水冰点]、海拔[海平面]单位①理想的单位一是要有确定的意义,不能有不同解释②其次应有相同的价值,即两个单位点之间差异相等。
(5)测量的量表:量表:任何可以使事物数量化的值或量的渐进系列.①命名量表:数字仅仅代表分类,无任何意义;不可比较,如男女②顺序量表:可比较,没有相同单位和零点,不能加减;如名次③等距量表:可比较,有相同单位无绝对零点,可加减,不可乘除;适用多种统计方法:平均数、标准差等,如温度④比例量表:最理想的量表,有等距的的单位和绝对零点,有倍数关系;如年龄.2、什么是心理测验,如何理解心理测验?心理测验的类型;心理测量的功能;(1)什么是心理测验:心理测验实质上是行为样本的客观的和标准化的测量.①行为样本:有代表性的题目②标准化:测验的编制、实施、计分和分数解释的一致性。
③难度的客观测量:测验的编制、实施等过程中减少主试和被试的随意性程度即标准化,测验的难度水平应确定④信度:测验结果的一致性⑤效度:测验结果的有效性和正确性.(2)、心理测验的类型:①测验对象分:智力测验、能力倾向测验、成就测验、人格测验②按测量方式分:个别测验和团体测验③按测验材料性质分:文字测验和非文字测验④按测验功能分:成就测验与预测测验,难度测验与速度测验,描述测验与诊断测验。
戴海崎《心理与教育测量》(第3版)课后习题(第7章 测验常模——第9章 测验等值)【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台
①从测验的编制者来讲,确定常模团体的问题,变成确定所编制的测验将来用于什么总 体,所选定的常模团体必须能够代表该总体。大部分测验都有不止一个常模团体。
②对测验的使用者,要从不同角度来选定常模,选定一个与施测样本最适合的一个常模 团体。因为标准化测验通常提供许多原始分数与各种常模团体的比较转换表,被试的分数必 须与最合适的常模比较。
布仍然非正态。
c.任何一组原始分数经转换为 Z 分数以后均有 Z 0 、
数对不同测验分数进行比较。
,因此,可以利用 Z 分
②缺点:
Z 分数由于计算中经常出现负数和小数,且单位过大(一个标准差单位),所以,使用
起来不够方便。
(3)T 分数的优缺点
一种将 Z 分数作线性变换,使负号与小数消失,全部变为正数的转换方法。这种转换
圣才电子书
十万种考研考证电子书、题库视频学习平台
第 7 章 测验常模
1.试比较各种导出分数的优缺点。 答:导出分数就是在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的 具有一定参照点和单位,且可以相互比较的分数。这种按某种规则将原始分数转化为导出分 数的过程称作分数的转换。常用的导出分数有百分等级、标准分数、T 分数等。 (1)百分等级的优缺点 百分等级是应用最广的导出分数。一个原始分数的百分等级是指在一个群体的测验分数 中,得分低于这个分数的人数的百分比。其优缺点为: ①优点: a.是一种相对位置量数,具有可比性,且具有易于计算、解释方便等优点,对一般教 师、学生和家长而言,均能了解百分等级的意义,所以它较适用于不同的对象和性质不同的 测验。 b.百分等级不受原始分数分布状态的影响,即使分数分配不是正态的,也不会改变百 分等级常模的解释能力。 ②缺点: a.单位不等,尤其在分配的两个极端。 b.百分等级只具有顺序性,而无法用它来说明不同被试之间分数差异的数量。 (2)标准分数的优缺点 标准分数是一种具有相等单位的量数,又称作 Z 分数,以 Z 表示。它是将原始分数与 团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的 距离。其优缺点为:
心理与教育研究方法---第五到七章
第五章研究文献的查阅第一节研究文献的类别与特点一、研究文献的类别心理与教育研究科学的研究文献主要指记录、保存、交流和传播心理与教育科学知识的一切印刷品和视听材料。
按照不同的载体形式和记录技术:手工型,印刷型,微缩型,机读型,视听型按文献内容加工程度不同:一次文献,二次文献,三次文献按文献所属领域不同:心理学文献,教育科学文献,综合型文献按公开程度:国内外公开文献,国内公开文献,内部文献按编辑出版的不同形式:书籍,期刊,会议论文,报纸,学位论文,内部资料二、目前研究文献发展的新特点1.数量的急剧增加2.各种文献的内容交叉重复3.质量下降4.分布分散5.分布不平衡,缺乏交流6.翻译文献多,语言障碍增加,术语不统一,研究文献格式不规范,发表“时滞”拉长,文献来源情况复杂,记录手段和载体多样化等等特点。
三、研究文献查阅的意义、作用1.有助于研究者对相关研究领域的情况有一个系统、全面地认识和了解;2.有助于研究者选择研究课题、形成研究假设;3.有助于研究者搞好研究设计;4.有助于研究者解释研究结果、撰写研究论文。
第二节研究文献搜集的原则,渠道和方法一、研究文献搜集的原则1.采用倒查法,先查最近的,再插过去的文献;2.在范围和数量上应该有所限制;3.应注意搜集第一手的资料,而少搜集多次转述的资料4.应注意搜集有代表性的各种观点,甚至是互相矛盾的资料;5.不仅收集直接与自己的研究课题直接相关的资料,还应该收集跨学科、跨领域的资料。
1.通过图书馆搜集文献;2.通过专门研究机构的资料室搜集资料;3.通过大学有关系所资料室搜集资料;4.通过学术会搜集资料;5.通过个人交往搜集资料。
三、研究文献搜集的方法1.检索工具查找法优点:研究文献比较全面、广泛缺点:信息滞后,难反应最新研究动态(1)手工检索工具主要有目录卡片、目录索引和文摘(2)计算机检索计算机信息分为文献检索、数据检索和事项检索计算机文献检索包括内部检索和开放检索2.参考文献查找法(追溯查找法)优点:所查找的文献针对性强、直接、集中、效率高缺点:文献资料不够全面,原文作者列出的资料有主观性,选择性,会受到制约。
教育测量与评价课件(7)(第七章 教育测验“标准”及其建立方法)
标准参照测验分数解释方法之二:掌握分数
无论是针对每一教学单元的形成性测验,还是针对一门课程的终结性测 验,如果要了解与判断学生是否掌握所学的内容,我们就要编制一份有内容效 度的教育测验,并且事先定出一个可接受的最低标准。这个标准是人为确定的, 它可以是百分制评分量尺上的某一人点,也可以是80%-90%的正确反应 所对应的分数,作为最低通过标准。这个分数就是所谓的掌握分数。以它作为 判断标准,把所有的学生区分为掌握和未掌握两类。 对于掌握分数,应注意以下几点: ① “掌握”与“未掌握”是人为确定的。 ② 从知识的掌握状态来讲,事实上更应该是一种连续模型。因此,把学 生区分为“掌握”与“未掌握”两类,在许多情况下的确是迫不得已的办法。 ③ “掌握”、“及格”或“合格”的概念类似,但有区别。 ④ 当利用测验的掌握分数给学生进行二分类时,对于不同的年级、不同 的课题内容、不同的测验乃至同一测验中不同的分测验,人为规定的掌握分数 也未必相同。
(2)美国IOX模式
① 一般描述:是对测量的领域进行一般性的、简明扼要的描述。 ② 样本题目:是给出一个带有指导性与限制性的测验题目的具体例子。 ③ 刺激的界定:是对题目的内容、素材、难度、广度等因素作出更为明确的规
定。
④ 反应的界定:是对被试者如何作答题目的方式,包括正确答案与错误答案的 区分准则等方面作出规定。 ⑤ 其他补充说明:若有必要时,对界定测验内容领域所涉及的有关问题作出交 待或补充说明。
(② 目的; ③ 评价目标 ④ 内容或核心内容; ⑤ 评价目标和内容的关系; ⑥ 评价技术; ⑦ 等级描述。
编写测验内容领域规范的方法(二)
(4)我国高中毕业会考标准的建立模式
① 制定各学科考试大纲; ② 使用参照试卷进行取样测试,建立高中毕业会考的标准分量表: T 85 15Z ; ③ 根据分数,把高中毕业会考成绩确定为五个等级; ④ 编制与参照试卷大体平行的会考试卷; ⑤ 在保密的状态下,抽取有代表性的样本,随机分成两组,分别用会考试卷和参 照试卷进行测试,取得数据; ⑥ 在会考试卷原始分数和参照考试卷原始分数建立等值对应关系; ⑦ 根据每位高中生的会考成绩,经分数转换表,便可得知会考的等级分数。
教育心理学第七章
二、动作技能形成的阶段与习得的指标 (一) 认知阶段 认知阶段也称知觉阶段。这一阶段主要
是理解学习任务,并形成目标意象和目 标期望。目标意象主要是指学习者对自 己解决问题的目标模式反应和动作型式, 在头脑中形成一个表象,即明确解决问 题的目标模式。而目标期望则是对自己 的作业水平的估价,即明确自己能做得 如何。这两种期望都起着学习定向作用。
果将心、身二者的练习相结合,其效果 更佳。决定心理练习有效性的关键是学 习者要对练习的任务熟悉。从未进行过 身体练习的动作,不可能做心理练习, 若练习也只能是错误的练习。另外,心 理练习的时间不能太长,否则容易产生 厌烦情绪,使作业水平下降。 心理练习的效果也决定于任务的性质。 若任务中认知因素起的作用较小,反应 主要是依靠肌肉的线索,则心理练习作 用甚微。
部程序控制 (五)在不利条件下能维持正常操作水 平
第二节
动作技能的习得与保持
一、关于动作技能学习的理论
像其他领域的学习一样,心理学家对动作
技能的学习也提出了多种解释。在众多的 解释中,可分为强调行为的、强调认知的 和强调生态的三种基本不同的观点。
(一)习惯论
习惯论认为,一种运动成分所产生的反
学习心理学家目前主要采用保持测验和迁
移测验来测量表现的相对持久的变化。保 持测验是在一段时间之后测量表现,迁移 测验则是在变化条件下测量表现。之所以 采用这两种测验,是因为在动作技能的学 习中,有两种导致表现发生变化的因素: 一是导致学习的表现特征发生相对持久变 化的因素,二是导致表现发生暂时变化的 因素。由于训练期间(习得阶段)观察到 的表现的任何变化,可以是暂时的变化, 也可以是更持久的变化,因而有必要包括 保持测验和迁移测验。
(二)指导的内容
心理测量的复习大纲
心理测量的复习大纲心理测量大纲.第一章:第一节一般测量概述1、测量的概念:依据一定的法则使用量具对事物的特征进行定量描述的过程。
2、影响测量精确的因素:一、测量对象本身的性质。
①确定型(物体的长度)。
②随机型(人的短时记忆容量)③模糊型,即事物本身的量是模糊不定的(人的性格特征)二、测量的精确度取决于测量工具的精确性。
3、根据测量的性质和不同的特点,可以将不同形式的测量大致分为4种类型。
①物理测量:及对事物物理特征的测量。
长度,重量等。
②生理测量:对机体生理特征的测量。
如对动植物各种化学成分含量的测量。
③社会测量:即对社会现象的测量,如人口普查。
④心理测量:对人的心理特征的测量。
如智力、人格测量。
4、任何测量都必须具备两个基本要素:参照点和测量的单位。
其中参照点分为绝对参照点和相对参照点。
5、测量的量表:能够使事物的特征数量化的数字的连续体就是量表。
量表可以分为四种:①命名量表:用数字代表事物或用数字对事物进行分类。
命名量表又分为名称量表(用数字指代个别事物)和类别量表(用数字指代事物种类)。
②顺序量表:按照事物的大小,等级,程度而排列数字的量表。
③等距量表:不仅能够指代事物的类别,等级而且具有相等的单位。
等距量表的数字是一个真正的数量,这个数量中各个部分的单位是相等的。
因此可以对其进行加减运算。
等距量表没有绝对的零点。
它的零点是人们假定的相对零点。
对于等距量表的两个数不能进行乘除运算。
④比率量表:除了具有类别、等级、等距的特征外,还有绝对的零点。
第二节心理与教育测量的性质1.、心理与教育测量的定义:依据一定的心理学和教育学原理,使用测验对人的心理特质和教育成就进行定量描述的过程。
其独特的性质:①心理与教育测量依据的法则在很大程度上只是一种理论,很难达到如同物理测量依据的法则那样普遍被人们接受的水平。
②心理与教育测量的对象是人的心理特质和教育成就。
③心理与教育测量的量具市有关领域的专家编制,经过长期的试用,修订,完善而逐渐形成的标准化测验。
现代心理与教育测量学系统复习资料
现代心理与教育测量学第一章1.测量:依据一定的法则使用量具对事物的特征进行定量描述的过程。
2.测量的参照点:测量工作中必须有一个量的起点,这个起点就叫做测量的参照点。
3.量表:能够使事物的特征数量化的数字的连续体就是量表。
(测量的量表:等距量表、称名量表、顺序量表、比率量表)4.心理与教育测量:依据一定的心理学和教育学的理论,使用测验对人的心理特质和教育成就进行定量描述的过程。
5.测验的标准化:是编制测验的一个重要步骤,是指测验的编制、实施、记分以及测量分数解释的程度的一致性。
6.测验标准化应具备的条件(或测验标准化的内容是什么)(1)测验内容的标准化。
(2)施测条件的标准化。
(3)评分规则的标准化。
(4)测验常模的标准化。
7.论述心理与教育测验的功能:(1)理论研究功能①收集研究资料②建立和检验理论假设③实验分组(2)实际应用功能①选拔人才②人员安置③心理诊断④描述评价⑤心理咨询第三章1. 测量误差:是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。
2. 随机误差:是那种由与测量目的无关的、偶然因素引起的而又不易控制的误差。
3. 系统误差:是那种由与测量目的无关的变因引起的一种恒定而有规律的效应。
4. 真分数:反映被试某种心理特质真正水平的那个数值叫做该特质的真分数。
5. 心理测量的误差来自3个方面,即测量工具(如所测的东西与我们预测的目的之间出现偏差)、被测对象(如被试在接受测量时的心理和生理状态会影响其水平的正常发挥)、施测过程(如实测现场的温度、光线、声音、桌面好坏、空间阔窄,主试者的年龄、性别、外表及其施测时的言谈举止、表情动作等)6.真分数的数学模型与假设: 经典测验理论假定,观察分数(记为X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(记之为E)。
即:X=T+E 这就是CTT的数学模型。
这一模型,引申出三个相关联的假设公理:(1)若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。
教育统计与测量 第7章 效度
结构效度的大小完全取决于事先假定的心理特 质理论,一旦人们对同一种心理特质有着不同 的定义或假设,则会使得关于特质测验的结构 效度的研究结果无法比较。 当实际测量的资料无法证实我们的理论假设时 ,并不一定就表明该测验结构效度高。因为还 有可能出现理论假设不成立,或者该实验设计 不能对该假设作适当的检查等情况,这就使得 结构效度的获取更为困难。
(用全国高考的成绩作为效标来检验高中毕业生会考的 成绩,计算两者之间的相关系数就是会考的同时效度; 而用大学一年级的成绩作为效标来检验高考的成绩,计 算两者的相关系数就是高考的预测效度。)
同时效度:用于标准化测验的建立 预测效度:常用于评定原测验的预测功能。
可靠性:较高的信度 有效性 客观性 实用性
28
通过因子分析,可以找出少数的几个因子 来代替原来的变量做回归分析、聚类分析、判别
分析等。
29
因子分析可以通过下面的数学模型来表示:
独特因子
公共因素
30
因子分析把每个原始变量分解成两部分:一部分是由所 有变量共同具有的少数几个因子所构成的,即所谓公共因
素部分;另一部分是每个变量独自具有的因素,即所谓独
Байду номын сангаас
(1)逻辑分析的方法。其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。 (2)统计分析法。 科隆巴赫法:从同一个教学内容总体中抽取两套独立的 平行测验,用这两个测验来测同一批被试,求其相关。 若相关高,表明测验内容效度较高;若相关低,表示测 验的内容效度较低。 评分一致性考查法:不同评分者之间评分的一致性程度 前后测比较法:训练前后测验的差异 内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。 内容效度不适合用于能力倾向和人格测验。
戴海琦《心理与教育测量》课后习题与答案
心理与教育测量课后习题及答案戴海琦版第一章心理与教育测量概论练习与思考练习与思考:1.与物理测量相比拟,说明心理测量的特点。
2.为什么人们不能象对物理测量那样容易承受心理测量?〔此题为思考题〕3.如何才能证明心理测量的必要性和可能性?解答要点:1.〔1〕从依据的法那么来说,心理与教育测量依据的法那么在很大程度上只是一种理论。
〔2〕从测量的容来说,心理与教育测量的容是复杂的,隐的,其测量只能是间接的。
〔3〕相对与物理测量的定量分析的准确度而言,心理与教育测量定量分析的准确度很低。
3.〔1〕从心理与教育测量的理论根底来看,心理测量是可能的。
〔2〕人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异既有质的方面,也有量的方面,因此有必要测定出这些差异的数量。
第二章心理与教育测量的产生与开展>>练习与思考练习与思考1.简述古代中国对心理与教育测量的奉献及其特点。
2.心理与教育测量从卡特尔到比的开展过程中可以看出什么特点?〔此题为思考题〕3.推孟和韦克斯勒在智力测验开展过程中各有什么奉献?解答要点:1.在古代中国,在测验实践和测验理论方面都对心理与教育测量作出了奉献并具有自己的特点。
一、在测验实践方面的奉献。
1、在能力测量方面。
早在2500年前,思想家和教育家孔子凭自己的经历观察,首先评定学生能力的个别差异,并将人的智力分成中上之人、中人和中下之人三个等级。
董仲舒已论及到注意测验。
邵把人的才能划分为12种类型。
6世纪中叶,中国江南出现了类似现在的婴儿开展测验的"周岁试儿"习俗。
出现于清代的益智图、九连环可以认为是最早的创造力测验。
2、在人格测量方面。
孔子把人分为狂者、狷者和中行3种。
邵根据阴阳、五行和形体的关系及其人的行为表现,把人的性格划分成12种类型。
3、在教育测量方面。
世界上最早的教育测量出现于中国西周奴隶时期。
据记载,在西周的"国学"中已经建立具有相当系统性的教育测量制度。
戴海琦《心理与教育测量》习题答案
第一章心理与教育测量概论1.与物理测量相比较,阐明心理测量的特点。
3.如何才能证明心理测量的必要性和可能性?解答要点:1.(1)心理与教育测量依据的法则在很大程度上只是一种理论。
(2)心理与教育测量的内容是复杂的,内隐的,其测量只能是间接的。
(3)心理与教育测量定量分析的精确度很低。
3.(1)从心理与教育测量的理论基础来看,心理测量是可能的。
(2)人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异既有质的方面,也有量的方面,因此有必要测定出这些差异的数量。
第三章经典测量理论的基本假设1.简述"心理特质"的含义。
2.心理测量的误差来源主要包括哪些?模型及其假设的重要内容是什么?答案要点:1.心理特质指表现在一个人身上所特有的相对稳定的行为方式,就是人的心理特质。
(1)特质是一组具有内部相关的行为的概括,具有一定的抽象性。
(2)特质是可以综合不同刺激,使人对这些刺激做出相同的反应"。
(3)特质是一个人身上比较稳定的特点。
(4)特质分多个层次有机组合而成的。
(5)可以对人的行为进行某种预测。
2.心理测量的误差主要来自3个方面:测量工具、被测对象和施测过程。
模型是:经典测验理论假定,观察分数(记为X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(记为E)。
即:X=T+E其主要内容为:(1)若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值会接近于真分数。
(2)真分数和误差分数之间的相关为零。
(3)各平行测验上的误差分数之间相关为零。
第四章测量信度1.指出各种信度系数所对应的误差来源。
3.已知某态度量表用道题,被试在各题上得分的方差分别是,,,,,,测验总分的方差为,求α值。
4.怎样提高测量信度?解答要点:1.对重测信度来说,其对应的误差来源有:①所测量的心理特质不稳定;②遗忘和练习的效果没有相互抵消;③在两次施测的时间间隔里,所要测的被试的心理特质得到了学习和训练;④两次测查的时间间隔不同在信度不同。
戴海琦《心理与教育测量》(第三版)课后习题答案
《心理与教育测量》戴海琦(第三版)第一章心理与教育测量概论1.与物理测量相比较,阐明心理测量的特点。
(1)从依据的法则来说,心理与教育测量依据的法则在很大程度上只是一种理论。
(2)从测量的内容来说,心理与教育测量的内容是复杂的、内隐的,其测量只能是间接的。
(3)相对与物理测量的定量分析的精确度而言,心理与教育测量定量分析的精确度很低。
2.为什么人们不能象对物理测量那样容易接受心理测量?(此题为思考题)3.如何才能证明心理测量的必要性和可能性?(1)从心理与教育测量的理论基础来看,心理测量是可能的。
(2)人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异既有质的方面,也有量的方面,因此有必要测定出这些差异的数量。
第二章心理与教育测量的产生与发展1.简述古代中国对心理与教育测量的贡献及其特点。
古代中国,在测验实践和测验理论方面都对心理与教育测量作出了贡献并具有自己的特点。
(1)在测验实践方面的贡献。
(1)在能力测量方面。
早在2500年前,思想家和教育家孔子凭自己的经验观察,首先评定学生能力的个别差异,并将人的智力分成中上之人、中人和中下之人三个等级。
董仲舒已论及到注意测验。
刘邵把人的才能划分为12种类型。
6世纪中叶,中国江南出现了类似现在的婴儿发展测验的“周岁试儿”习俗。
出现于清代的益智图、九连环可以认为是最早的创造力测验。
(2)在人格测量方面。
孔子把人分为狂者、狷者和中行3种。
刘邵根据阴阳、五行和形体的关系及其人的行为表现,把人的性格划分成12种类型。
(3)在教育测量方面。
世界上最早的教育测量出现于中国西周奴隶时期。
据记载,在西周的“国学”中已经建立具有相当系统性的教育测量制度。
在汉代,考试制度、考试类型和考试功能方面都作了重要的发展。
除了学校内部测量的自身发展以外,取士制度自汉以来的发展,客观上也对我国的古代乃至西方的教育测量发展起了促进作用。
(2)在测验理论方面的贡献。
孔子后约150年,大思想家孟子就指出了测量人类心理的必要性和可能性。
心理与教育测量学重点总结
力提高每道题目的区分度;④选取适当的被试团体,努力提高测试在各个同 质亚团体上的信度;⑤规范施测程序,统一施测环境,严格控制误差。
第五章 测量效度
掌握概念: 1.效度:指一个测验所能测量到其想要测量的心理特质的程度。 2.表面效度:指测验的表面看起来与其所测验内容之间的一致性程度。 3.内容效度:指测验所能测量到的心理特质的内容与其想要测量的心理特质的内
5.影响效度的因素有哪些? 答:①测验本身:a.测题中所用的词汇或句型不能太难;
b.测题的指导语应该清楚; c.测题中不能提供额外线索; d.测题的难易顺序编制要合理; e.选择题的正确答案不能有明显的组型; f.测题的难度要适当; g.测题数目要适当; ②测验的实施:a.指导语标准化;
b.排除意外干扰; c.按照标准化的程序进行客观评分; ③所选校标的性质; ④测验的信度。
2.简述心理测验的基本条件。 答:标准化测验的技术指标有常模、信度和效度。
(1)常模:指某种心理测验在某一人群中测查结果的标准量数,即可比较的 标准。常模形式有:均数、标准分(如 Z 分、离差智商、T 分)、百分位、划 界分等。常模的制定要通过标准化的取样过程,样本的代表性要好。 (2)效度:指测验结果的有效和真实性,即某种测验测查到所要测查内容的 程度效度高是心理测验的充分必要条件。有内容关联效度、效标关联效度和结 构关联效度。 (3)信度:指测验分数反复测量的可靠性,反映测量误差。有分半信度、重 测信度和α系数等。
2.验证内容效度的方法有哪些? 答:①逻辑分析法;②克伦巴赫估计法;③再测法。
3.验证结构效度的方法有哪些? 答:①测验内方法:a.内容效度法;b.口语报告法;c.相关分析法;
第七章 学前教育测量
测验在职业训练或就业指导方面应用得最广泛。它分为两类:一 类是测量一个人多方面的潜在能力,如哪些方面的潜在能力较 强,哪些方面的潜在能力较弱,这一类测量称为一般能力倾向测 验;另一类是测量一个人的特殊潜在能力,如音乐、图画能力等, 称为特殊能力倾向测验。
(3)人格测验 人格测验主要是测量人的态度、情绪、兴趣、品德、动机、 意志、性格、美感等方面的行为,以及引起行为的心理特性。由 于人格一词在心理学上至今尚缺乏一致性的定义和严格的范围; 而这些心理特性的形成原因,既基于天赋又是环境教育的结果, 不易有客观的衡量标准,所以这类测验发展较迟。 (4)教育测验 教育测验又称成就测验或学习成绩测验,其目的在于测量学
教育测量关注学生的发展,而学生的发展是多方面的。除了 掌握学科的知识与技能外,还要发展学生的道德、情感、态度、 价值观、兴趣、思维能力、实践能力、创造能力等方面。总之, 教育测量涉及到学生在德育、智育、体育、美育、劳动技能以及
个性、心理素质等许多方面。然而,由于许多身心特性存在着复 杂性和模糊性,使得教育测量比物理测量有更多的困难,教育测 量的结果也不像物理测量的结果那么容易让人理解。
三、教育测量的种类
教育测量的种类比较多,以不同的目的、方法和范围而区分 为不同类型。
1.根据测量的属性分类 (1)智力测验 智力测验又称智慧测验,其主要目的在于测量智力的高低。 它是最早发展起来的一种心理测验,目前从出生的婴儿一直到老 年人都有不同年龄阶段的智力测验。 (2)能力倾向测验 能力倾向测验的主要目的在于发现被试的潜在能力。所谓潜 在能力是指经教育或训练之后,能够发挥出来的能力。能力倾向
2.测量对象的模糊性和测量误差的不可避免性 测量的误差一般有系统误差和随机误差。通过发展精良的测 量工具,按照科学的测量法则和规范的测量程序,我们完全有可 能把物理量的测量误差控制在人定的误差范围内。如要测量桌子 的长度,我们完全可以使测量的结果具有令人满意的精确度。但 是教育测量则不然。我们所测的精神特性,如知识水平、智力水
《教育测量与评价》第07章在线测试
《教育测量与评价》第07章在线测试(应为第7章)答题须知:1、本卷满分20分。
2、答完题后,请一定要单击下面的“交卷”按钮交卷,否则无法记录本试卷的成绩。
3、在交卷之前,不要刷新本网页,否则你的答题结果将会被清空。
第一题、单项选择题(每题1分,5道题共5分)1、这朵花是白的,这是一个(D)A、现象描述B、主观猜测C、价值判断D、事实判断2、评价者的情感和意志特征,是指评价者和被评者的(B)A、意识倾向性B、情意心理C、认知倾向D、个性心理特征3、评价者已有的知识、经验、认知模式等对评价可靠性影响,是指评价者和被评者的(C)A、意识倾向性B、情意心理C、认知倾向D、个性心理特征4、用一定的手段和方法,对评价者和被评价者可能出现的心理行为进行调节、控制和利用,使评价工作顺利开展。
叫做(A)A、评价心理调控B、评价心理机制C、评价的心理过程D、个性心理特征5、通过评价者的目的、需要、价值观等构成的评价心理机制及倾向性,与不同的评价方式结合,作用于被评价者时所引起的被评价者的自我意识、情绪状态、意志动机、需要和成就目标、与评价者人际关系的变化等。
叫做(C)A、类群效应B、模式效应C、评价效应D、理想效应第二题、多项选择题(每题2分,5道题共10分)1、评价心理根据心理学范畴,可分为(BCD)A、心理机制B、评价的心理过程C、心理状态D、心理特征2、评价心理根据评价者和被评者的心理机制分,可分为(ABCD)A、意识倾向性B、情意心理C、认知倾向D、个性心理特征3、评价者对被评者的心理影响,有哪些(ABCD)A、对自信心和自我概念、自我知觉的影响B、对情绪稳定和不安的影响C、对意志和动机的影响D、对要求水平和达到目标的影响4、调控评价心理的意义,有哪些(ABC)A、可以使教育评价的准备更加合理充分B、可以保证教育评价活动的实施得以顺利进行,更好地完成各环节的任务C、可以使评价的功能得以全面发挥,圆满实现评价的目的D、可以使被评价者更好的调节心理反映5、被评价者的心理现象,包括哪些(BCD)A、评价者的心理现象B、被评价者自我评价心理现象C、受评过程心理现象D、结果反馈心理现象第三题、判断题(每题1分,5道题共5分)1、评价心理主要指被评价者的心理状态正确错误2、施评过程中要注意使用首因效应正确错误3、施评过程中的顺序效应指的是评价的先后顺序不同而对评价结果产生影响正确错误4、自我评价不是评价过程的必要环节正确错误5、偏激和偏见型评价中具有较高的不良评价效应正确错误。
《教育测量与评价》第07章在线测试
《教育测量与评价》第07章在线测试
A B
C D
、用语言描述形式以及哲学思辨、逻辑分析揭示被评价对象特征的信息收集分析、处理的方法,叫做()
A B
C D
、以调查方式去访问有关人员,了解情况,从而收集评价信息的方法叫做()
A B
C D
、书面的量表进行收集评价信息的方法有种分为两大类,其中观察、听汇报、访谈、座谈会、问卷法都属于()
A B
C D
、行为目标评价法的理论基础是()
A B
C D
D、D 时限性
2、相对评价法()内
A、A 评价标准在评价对象的集合
B、B 使用面较窄
C、C 使用面较广
D、D 有时容易降低客观标准
3、评价信息的收集方法常用的有很多种,除了观察法、听汇报、测量法还有哪些()
A、A 调查访问
B、B 座谈会
C、C 收集文字资料
D、D 问卷法
4、在采用听汇报的收集方法时应注意哪些事项()
A、A 听汇报前将目的、内容和要求通知汇报者
B、B 营造融洽的谈话氛围
C、C 善于引导,让其客观汇报
D、D 做好记录
5、教育评价信息的定性分析描述法包括哪些()
A、A 等级评定法
B、B定性分析描述法
C、C 评语鉴定法
D、D写实分析法
第三题、判断题(每题1分,5道题共5分)
1、问卷法属于调查法中的一种
正确错误
2、用数值形式以及数学、统计方法反映被评价对象特征的信息分析、处理的方法叫定性分析方法
正确错误、听课也是观察的一种途径
正确错误分数和标准分都是属于统计分析评判法
正确错误、标准分可以直观看出个体测验分数在群体中的位置
正确错误。
心理测验分数的处理与解释
2.3
多重回归
多重回归就是研究一种事物或现象与其他多种 事物或现象在数量上相互联系和相互制约的统 计方法。 基本方程式为: Y=a十b1Xl十b2X2十…十bnXn 只有当预测源与效标间存在线性关系时才是适 合的
2.4
多重划分
适用于所测特质之间是不能互相补偿 在整个测验实施时,是把所有组成这一测 验的分测验按一定顺序排列起来逐一实施。 只有通过了前一次测验,才能继续实施后 一个测验。由于成功的被试必须过一连串 测验的栅栏,所以这种方法也叫作“连续 栅栏”。
第七章 心理测验分数的处 理与解释
心理测量学
第一节
心理测验分数的合成
一﹒分数合成的种类
项目的组合
分测验或量表的组合 测验或预测源的组合
二.
分数合成的方法
临床诊断——直觉合成 加权求和合成 多重回归 多重划分
2.1 临床诊断-直觉合成
根据直觉的经验,主观地将各种因素加权;而获得结论 或预测的方法叫作临床诊断。 临床诊断法的优点是:
解释测验分数的意义遵循基本原则:
主试应充分了解测验的性质与功能。 对导致测验结果的原因的解释应慎重,谨防片面极 端。 必须充分估计测验的常模和效度的局限性。 解释分数应参考其他有关资料。 对测验分数应以“一段分数”来解释,而不应以 “特定的数值”来解释。 对来自不同测验的分数不能直接加以比较。
百分位数的变式: 四分位数 十分位数
百分等级的优点
容易计算,容易解释
对于各种被试和各种测验普遍适用 不受原始分数状态的影响
百分等级量数的主要缺点
单位不等
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 3、测验或预测源组合
• 作某一决策时,将几个测验或预测源得分进行组合。
• 分数合成中的问题
– 1、合成的方法是什么?
• 牵涉到合成的目的,各部分分数间的关系,能否替 代,能否补偿。
– 2、合成分数的评价标准是什么?
• 一般用效标分数。
– 3、参加组合的总分用多少,用哪些?
• 在效果相同情况下,用最少分数,用最有效分数参 加合成,可逐步增加。
• 常模的编制步骤:
– ① 确定有关的比较团体,即常模团体; – ② 对常模团体施测,获得该团体成员的测验分 数; – ③ 将常模团体测验分数转化为某种导出分数。 这个导出分数也叫常模分数。
• 常模团体的选择
– 常模团体的定义:
• 由具体有某种共同特征的人所组成的群体。实际中 常指它的一个有充分代表性的样本。同一测验可有 多个不同的常模团体。 • 任何一个测验都有许多常模团体,在制定常模时首 先要确定常模团体,在解释时也要考虑常模团体的 组成。 • 对测验编制者而言,常模团体的选择必须能够代表 该总体,常模团体的选择包括确定一般总体、确定 目标总体、确定样本。
• ④样本大小要适当。太大,人财物力不够;太小, 代表性不够。此外,要考虑到总体的大小;群体的 同质性;测验结果的精确度。一般来说,样本不得 小于30或100。全国性常模需取样2000-3000人。 • ⑤常模数据应是近时的,时间太长了要修订。 • ⑥注意一般常模与特殊常模的结合。
• 常模团体的被试取样方法:遵循随机原则。 具体的随机抽样方法有以下几种。
R
– 通式(适用分组和未分组资料):
• 其中N表示被试样本人数,X表示某被试的原始分 数,L表示被试所在组的组实下限,Fb表示被试所 在组的下一组累积人数。i表示被试所在组的组距。
举例
• 从某地抽取了高三学生的代表性样组施以 数学测验(全卷满分为120),所得分数整理 列表如下表。若甲生110分,乙生100分, 丙生70分,试求他们的百分等级。
• 3、导出分数定义:
– 导出分数是在原始分数基础上按照一定的规则 经过统计处理获得的具有明确的参照点和单位, 可以表明个体在团体中相对地位的分数。
• 4、常见导出分数:
– 百分等级;标准分数;标准九分数。
二、百分等级分数
• 1、定义:
• 2、计算:
– 在一个群体的测验分数中,得分低于这个分数 的人数的百分比。通常用 P 表示。
分数组 116-120 111-115 106-110
人数 2 17 23
分数组 86-90 81-85 76-80
人数 31 24 11
101-105 96-100
91-95
37 53
40
71-75 66-70
61-65
6 4
2
– 特式(适用于未整理的原始资料,且没有相同 的原始分数):
• 其中R为某被试的原始分数在所测人群中从高到低 的排名,N为所测人群的总人数。
标准十的分布特点
六、几种导出分数的相互关系
第二节
• 分数合成的意义 • 分数合成的方法
分数合成
一、分数合成的意义
• 分数合成的种类
– 1、项目组合
• 将测验下所有项目分数合成得到测验总分。合成方 法有简单合成和加权合成两种。
– 2、分测验或分量表组合
• 一个总测验下有若干个分测验或分量表,将各分测 验分数合成为一个总测验分。
• 计算公式
• 使用方法:
– 先采用简单相关最大的变量,再依次加入偏相关最大 的变量,直到R2增加不大时为止。
(四)多重划分
• 各部分分数不具备代偿功能时,第2种和第3种方 法均不可使用,改用它法。 • 多重划分是一种方法,即在每一总分测验上都有 一个取舍选择,只有同时通过所有总分选择才最 终成功。如研究生考试的2条分数线。 • 为节约起见,可采用连续选择法,即每作测验选 择一次,未入选的不再参加下轮测试。排序时一 种方法是将最有效选择测验放前面。另一种是将 省时省力放前面。(高考)
三、标准分数
• 定义
– 以标准差为单位的离均差。以Z表示,又称为Z 分数。
• 计算
或
z
x
• Z分数的性质
– 是以一批分数的平均数为参照点,以标准差为 单位的等距量表。
• 正负号表示位于平均数之上或之下,绝对值表示与 平均数的距离。
– 将原始分数转化为标准分数,是线性转换,不 改变原有分数的性质和分布。
– 简单随机取样 – 等距取样:也叫系统取样。 – 分组取样 – 分层取样:这是确定常模团体的最常用方法。
二、常模的类型
• 群体常模 • 个体常模
• 群体常模
– 组间常模:也叫发展常模。
• 将个体的成绩与各种发展水平的人的平均成绩进行 比较,从而确定个体处于哪个发展阶段。 • 组间常模通常有发展顺序量表、智力年龄、年级当 量(或年级量表)。
五、标准九分数
• 定义:
– 标准九分是将原始分数分成九个部分的标准分 数系统。
• 原始分数转换为标准九分的方法
– 若原始分数呈正态分布,则以0.5个标准差为单 位,将正态曲线下的横轴分为九段,最高一端 为9分,最低一端为5分,除两端(1分,9分) 外,每段均有半个标准差宽。如下表和图所示。
标准九的分布特点
第三节 常模编制
• 概述 • 常模分数的类型 • 常模的表示方法
一、常模的概述
• 常模的定义
– 常模是根据标准化样本的测验分数经过统计处 理而建立的具有参照点和单位的测验量表。
• 常模的意义
– 有了测验常模,被试可以据自己在测验上的得 分查得对应的常模,常模分数,进而可以确定 自己在团体中的相对地位,从而获得一定意义。 – 原始分数转换为常模分数之后,不同测验的分 数可以相加。
• ③要求:
– 需要研究者(或操作者)受过专门训练,并且具有丰 富的经验。
(二)加权求和合成
• 条件
– 在各部分分数可同时获得,相互间有代偿作用 时用加权合成。
• 方法
– ① 单位加权——简单相加:
• 方法简单,权数是各部分分数的标准差比。
– ② 等量加权:
• 各部分分数分别转为标准分数,再简单相加,各部 分分数地位平等。
四、标准分数的变式
• 需要变式的原因
– 标准分数或正态化标准分数存在负号和小数点,为了 去掉负号,和小数点(使单位变小),需要进行线性 变换。变换后变式具有同标准分数同样的性质。
• 常见的变式
– – – – ① T分数 ② CEEB分 ③ 韦氏IQ ④ EPT分 T=10*Z+50 CEEB=100*Z+500 IQ=15*Z+100 EPT=20*Z+90
心理与教育测量
主讲:邓稳根(博士) 赣南师范学院教育科学学院 E-Mail: dwengen@
第七章 测验常模
• 分数转换 • 分数合成 • 常模编制
第一节 分数转换
• • • • • • • 原始分数与导出分数 百分等级分数 标准分数 标准分数的变式 标准九分 标准十分 几种导出分数之间的关系
举例
• 某被试在一次由50人参加的成绩测验中得 80分,排名第九,则该生成绩的百分等级 为多少?
• 3、评价:
– 优点:
• 相对地位量数,可横向比较,意义明确,计算简单。 不受原始分数分布形态的影响。
– 缺点:
• ① 顺序量表,无相等测量单位,不可计算差值。 • ② 在分数疏松区间反应迟钝,在分数密集处反应过 分敏感。 • ③ 随参照团体的变化百分等级会发生变化。
• 注意:标准分数分布不等于标准正态分布!
– 所有原始分数转化为Z分数之后,Z分数的平均 数都为0,标准差为1。因此,可用于横向比较 和具有可加性。Z分数的分布范围在[-3,3]之 间,约占全体的99.73%。
• 正态化的标准分数
– 正态化的原因:由于不同测验的原始分数不一 定呈正态分布,因此直接根据标准分数进行比 较时,实际上所包含的百分等级并不相同,因 此比较的结果并不准确。
二、分数合成的方法
• • • • 临床诊断——直觉合成 加权求和合成 多重回归 多重划分
(一)临床诊断——直觉合成
• ① 方法:
– 凭直觉和经验分析各分测验的关系和重要性综合决策。 如医生诊断病情、指导考生填报高考志愿。
• ② 评价:
– 优点:高度综合性;针对性强。 – 缺点:缺乏精确量化分析;带有主观偏面性。
(一)发展常模
• 年龄量表
– 发展顺序量表
• 将个体的行为表现与不同年龄的人的行为平均表现 进行比较,确定其行为处于哪个年龄阶段。
– 智力年龄
• 将个体在的分数与不同年龄的人在同样测验上的平 均分数进行比较,确定其智力年龄处于哪个年龄阶 段。
• 年级当量
– 将个体的教育成就分数与不同年级的人的平均 分数进行比较,确定其教育成就处于哪个年级 水平。
1、发展顺序量表
• 它是最直观的发展常模。指明了多大年龄 的人应具备何种能力或行为。 • 它最早的范例是葛塞尔发展程序表
– 如婴儿的感觉运动发展是这样:4周,能控制 眼睛运动,去追随一个对象看;16周,能使头 保持平衡;28周,能用手抓握东西并玩弄它; 40周,能控制躯干、坐立或爬行;52周,能控 制腿脚运动、站立和行走。
标准十分
• 定义:
– 标准九分是将原始分数分成十个部分的标准分 数系统。
• 原始分数转换为标准十分的方法
– 也是以0.5个标准差为单位,与标准九不同的是, 它将正态曲线下的横轴分为十段。如下表和下 图所示。
正态Z分数与标准十的转换方法
正态Z分数 z<-2.0 -2.0≤Z<-1.5 -1.5≤Z<-1.0 -1.0≤Z<-0.5 -0.5≤Z<0.0 0.0 ≤Z<0.5 0.5≤Z<1.0 1.0≤Z<1.5 1.5≤Z<2.0 Z≥2.0 合计 标准等级 总体中的百分比 1 2.3% 2 4.4% 3 9.2% 4 15.0% 5 19.1% 6 19.1% 7 15.0% 8 9.2% 9 4.4% 10 2.3% — 100%