第十四章心理与教育测量理论与技术的新发展
(整理)心理与教育测量重点全部
第一章心理与教育测量概论1、测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程。
所谓一定的法则,是指任何测量都要建立在科学规则和科学原理基础之上,并通过科学的方法和程序完成测量过程。
所谓事物的特征,是指所要测量的事物的特定属性。
所谓量具,是指测量中所使用的工具。
所谓定量描述,是指任何测量的结果总是对事物特征的量的确定。
2、任何测量都必须具备两个基本要素,即测量的参照点和测量的单位。
参照点有两种,一种是绝对参照点,即以绝对的零点作为测量的起点。
另一种是相对参照点,即以人为确定的零点为测量的起点。
理想的测量单位应当具备两个条件:一是要有确定的意义,二是要有相等的价值。
3、测量量表分为4种:1)命名量表,是最低水平的量表,它只是用数字代表事物或对事物进行分类;2)顺序量表,如第1名,第2名;3)等距量表,不仅能代表事物的类别,等级,而且具有相等的单位,等距量表没有绝对的零点;4)比率量表,是最高水平的测量量表,有绝对的零点。
心理与教育测量的量表属于顺序量表。
心理与教育测量属于顺序量表。
★4、心理测验实质上是对行为样本的客观的和标准化的测量。
编制一个测验应当具备下列4个基本条件:1)行为样本。
从人的大量行为中抽取与欲测量的心理特质直接有关的一组行为进行测量,并依据对这一组行为的测量结果推断其心理特质和教育成就。
这一组被抽取出来的,作为直接的测量对象的行为就是行为样本。
2)标准化标准化就是指测验的编制、实施、记分以及测量分数解释的程序的一致性。
测验的标准化要具备下列条件:a、测验内容的标准化;b、施测条件的标准化;c、评分规则的标准化;d、测验常模的标准化。
3)难度或应答率4)信度和效度5、心理与教育测验的种类:按测量对象:智力测验、能力倾向测验、成就测验、人格测验。
按测量方式:个别测验,团体测验。
按测验内容的形式:文字测验,非文字测验按测验功能:成就测验与预测测验,难度测验与速度测验,描述测验与诊断测验。
《心理测量学》复习思考题
《心理测量学》复习思考题一第一章心理测量概论1.为什么说人的心理是可测的?2.同是间接测量,测人的心理与测温度有什么不同?3.心理测量量表有什么特点?4.心理测量误差的类型与来源各有哪些?4.说说标准化测验的“标准”要求有哪些?5.说说常模参照测验与标准参照测验的不同之处。
6.心理测验编制的一般步骤有哪些?7.你从心理测量发展的历史中感悟到了什么?第二章测量信度与随机误差控制1.测量信度的概念和作用是什么?2.有哪些主要的测量信度估计方法?3.测量信度的影响因素有哪些?如何进行控制?第三章测量效度与系统误差控制1.测量效度的概念和作用是什么?2.有哪些主要的效度证据采集方法?3.测量效度的影响因素有哪些?如何进行控制?第四章测验题目性能与题目编写1. 对测验题目性能分析的目的是什么?如何对测验题目性能进行分析?2. 下表是11名考生在某测验6道题目上的得分及总分情况,请计算每题的难度及区分度。
题号一二三四五六总分满分 1 25343238104379153452534102462753651433834782292584214010112 252580 5 5 3 3 3 3 101525608 5 1013195212 8 14194610133620 18 2247 38 45第五章常模参照测验的设计与编制1. 什么是常模参照测验?主要有哪些编制原则?2. 什么是标准化样本?选取标准化样本时需要注意些什么?3. 什么是常模?常模有哪些种类?如何编制?4. 常模资料的主要呈现方法有哪些?第六章标准参照测验的设计与编制1.简述标准参照测验的编制过程。
2.标准参照测验的区分度分析有几种情况,它们之间有什么关系?3.什么是分类一致性信度,如何计算?4.举例说明标准参照测验几种划界分数的设置方法。
5.试比较标准参照测验与常模参照测验效度分析的异同。
第七章测验分数的可比性与测验等值1.应用例7.1的数据使用等百分位等值方法完成下面的等值对应表。
教育心理学考试重点提示第十四章教学测量与评价
★教育心理学考试重点提示: 第十四章教学测量与评价★重点提示统观近几年全国各省的教师资格认证教育心理学考试,本章的考查重点是:(1) 标准化成就测验的含义和特点。
(2) 自编测验的含义和特征。
(3) 非测验评价技术。
(4) 教学评价结果的处理与报告。
★考纲链接1.教学评价的概念:指系统地收集有关学生学习行为的资料,参照预定的教学目标对其进行价值判断的过程,其目的是对课程、教学方法以及学生培养方案做出决策。
2.教学评价包括确定评估目标、搜集有关的资料、描述并分析资料、形成价值判断以及做出决定等步骤。
3.教学评价与测量及测验的关系:(1) 测量和测验是对学习结果的客观描述,而教学评价是对客观结果的主观判断与解释,以客观描述为基础;(2) 测量与测验所得到的结果,只有通过教学评价,才能判断这种客观描述的实际意义,才有实际价值。
4.根据发生的时机,教学测评可分为:(1) 诊断性评价;(2) 形成性评价;(3) 总结性评价。
5.根据对测验解释时所采用的标准,教学测评可分为:(1) 常模参照评价;(2) 标准参照评价。
6.根据严谨程度,教学测评可分为:(1) 正式评价;(2) 非正式评价。
7.教学测量与评价的功能:(1) 鞭策和促进学生的学习;(2) 是学校鉴别学生学业成绩、家长了解学生学习情况的主要方式;(3) 是教学过程的一个重要组成部分;(4) 作为教育评价和决策的依据。
8.标准化成就测验:指由专家或学者们所编制的适用于大规模范围内评定个体学业成就水平的测验。
9.标准化成就测验的特点:(1) 由专门机构或专家学者编制;(2) 施测条件、计分手段、分数的解释完全相同;(3) 测验都有常模为依据,且有信度、效度的资料可查;(4) 测试规模大,整个地区、国家以至在国际上都可统一使用。
10.测验标准化的程序:(1) 制定测验目的;(2) 修改测验项目;(3) 扩大样本;(4) 确定常模。
11.标准化测验的优点:(1) 客观性,比教师自编测验更加客观;(2) 可比性,使得不同考试的分数可以进行比较。
心理与教育测量知识点汇总
e心理与教育测量知识点汇总第一章心理与教育测量概论一、名词解释1.测量:依据一定的法则使用量具对事物的特征进行定量描述的过程。
2.测量的参照点:测量工作中必须有一个量的起点,这个起点就叫做测量的参照点。
3.量表:能够使爭物的特征数量化的数字的连续体就是量表。
4.心理与教育测量:依据一定的心理学和教育学的理论,使用测验对人的心理特质和教育成就进行定量描述的过程。
5.测验的标准化:是编制测验的一个重要步骤,是指测验的编制、实施、记分以及测量分数解释的程度的一致性。
二、简答与论述1.简述理性测量单位应具备的条件?P4一是要有确定的意义,即对同一单位,所有的人的理解都是相同的,不允许作出不同的解释; 二是要有相等的价值,即第一个单位与第二个单位之间的距离等于第二个单位与第三个单位之间的距离。
但是在某些情况下,要具备这两个条件是相当困难的。
2.简述四种测量量表及其特点?P5-6①命名量表,是最低水平的测量量表,它只是用数字代表事物或用数字对事物进行分类。
数字只是事物的符号,没有任何数量的意义,不能进行代数运算。
可进行的统计方法有百分比、次数、众数和X检验。
②顺序量表,是次低水平的测量屋表,不仅能够指代事物的类别,而且能够表明不同类别的人小、等级或事物具有某种特征的程度。
在顺序量表中,数字只表示等级、人小和程度的顺序,它既没有相等的单位,也没有绝对的零点,因此不能进行代数运算。
可进行的统计方法有中位数、百分位数、等级相关系数和肯德尔和谐系数等。
③等距量表,是较高水平的测量量表,不仅能够指代事物的类别、等级,而且具有相等的单位,可以进行加减运算。
但它没有绝对零点,不能进行乘除运算。
可进行的统计方法有平均数、标准差、积差相关系数以及t检验和f检验。
④比率量表,也叫等比量表,是最高水平的测量量表,除了具有类别、等级、等距的特征外, 还具有绝对的零点,可进行加减乘除运算。
可进行的统计方法除了与等距量表相同外,还与几何平均数、变异系数相同。
《心理与教育测量》大纲知识要点
《心理测量》大纲知识要点[考试总体要求]1.正确理解心理测量的基本概念,掌握心理测量的基本方法。
2.掌握各种测量理论和各种测量指标的计算方法;能够正确使用各种测验,并对其结果进行解释。
三、心理测量的基本理论(一)心理测量的理论基础1.心理测量的基本概念(03首师大,名)(1)基本概念:所谓心理测量,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。
(测量:按照一定法则使用量具给事物指派数字的过程。
)(2)心理测量三要素:行为样组、标准化和客观性。
(01华东师大,简答题)①行为样组是指以被测量的行为作为代表来推测与其关联的心理特征。
一个测验的好坏,首先决定于测题编制的好坏,即必须要求这些测题能够引发和测量出具有高度代表性的行为样组。
②标准化是指测验的一致性,也即:测验的编制、实施、记分以及测验分数解释的程序的一致性。
③心理测验的客观性,是指测验不受主观支配,其测量方法是可以重复的,被试外部的行为是客观的,测验的实施、记分和解释都是客观的。
客观性是衡量科学性的一个根本标志,对于心理测验尤为重要,这是决定一个心理测验能否存在的必要条件。
行为样组的代表性和测验程序的标准化,都是为了保证这种客观性。
(3)心理测量是动词意义,心理测验是名词意义。
心理测量的参照点是相对参照点;单位不等距。
一般来说,心理测量是在顺序量表上进行的。
但通过统计方法,可以把测量数据转换为等距数据。
(心理测量属于哪一种水平上的测量,为什么?【02华东师大,简答题】)(4)对心理测量的评价贡献:首先,为心理科学理论的发展,特别是个体差异心理提供了具体方法和手段,构筑了差异心理理论的重要基石。
其次,心理测量为社会实践服务做出了巨大的贡献。
局限:首先,心理测量具有间接性,精确程度远远劣于物理测量。
其次,心理测量所依据的理论尚不完善。
2.心理测量的特征、分类(1)心理测量的特征①心理测量的间接性研究者无法直接测量人的心理,只能测量人的外显行为。
《心理与教育测量》课件
利用心理与教育测量工具,评估个体的人格特质和心 理健康状况,为心理咨询和治疗提供科学依据。
感谢观看
THANKS
THE FIRST LESSON OF THE SCHOOL YEAR
虚拟现实与增强现实技术
利用虚拟现实和增强现实技术,创造沉浸式的测量环境,提供更加 真实和客观的测量体验。
测量理论的发展
综合测量理论
01
结合多种测量理论,形成更加全面和系统的心理与教育测量理
论体系,提高测量的可靠性和有效性。
动态测量理论
02
研究心理与教育测量的动态变化过程,发现新的测量方法和指
标,提高测量的实时性和准确性。
01
心理与教育测量的 误差与控制
误差的来源
被试误差
被试的态度、动机、情绪、个性等个体 差异可能导致测量结果的误差。
施测误差
施测环境、施测人员、时间安排等因 素可能影响测验结果,产生误差。
测验设计误差
测验的题目设计、难度、区分度等不 科学、不合理,可能导致测量结果的 误差。
评分误差
评分标准不明确、评分主观性强、评 分误差大等可能导致测量结果的误差 。
心理与教育测量
THE FIRST LESSON OF THE SCHOOL YEAR
目录CONTENTS
• 心理与教育测量的基本概念 • 心理与教育测量的类型 • 心理与教育测量的误差与控制 • 心理与教育测量的应用 • 心理与教育测量的未来发展
01
心理与教育测量的 基本概念
定义与目的
定义
心理与教育测量是对人的心理特质和教育成就进行数量化的评估过程,通过使 用测量工具和技术,收集和分析数据,以了解个体的心理特征、能力水平和发 展状况。
戴海琦《心理与教育测量》课后习题及答案[1]
心理与教育测量课后习题及答案戴海琦版第一章心理与教育测量概论练习与思考练习与思考:1.与物理测量相比较,阐明心理测量的特点。
2.为什么人们不能象对物理测量那样容易接受心理测量(此题为思考题)3.如何才能证明心理测量的必要性和可能性解答要点:1.(1)从依据的法则来说,心理与教育测量依据的法则在很大程度上只是一种理论。
(2)从测量的内容来说,心理与教育测量的内容是复杂的,内隐的,其测量只能是间接的。
(3)相对与物理测量的定量分析的精确度而言,心理与教育测量定量分析的精确度很低。
3.(1)从心理与教育测量的理论基础来看,心理测量是可能的。
(2)人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异既有质的方面,也有量的方面,因此有必要测定出这些差异的数量。
第二章心理与教育测量的产生与发展>>练习与思考练习与思考1.简述古代中国对心理与教育测量的贡献及其特点。
2.心理与教育测量从卡特尔到比内的发展过程中可以看出什么特点(此题为思考题)3.推孟和韦克斯勒在智力测验发展过程中各有什么贡献解答要点:1.在古代中国,在测验实践和测验理论方面都对心理与教育测量作出了贡献并具有自己的特点。
一、在测验实践方面的贡献。
1、在能力测量方面。
早在2500年前,思想家和教育家孔子凭自己的经验观察,首先评定学生能力的个别差异,并将人的智力分成中上之人、中人和中下之人三个等级。
董仲舒已论及到注意测验。
刘邵把人的才能划分为12种类型。
6世纪中叶,中国江南出现了类似现在的婴儿发展测验的"周岁试儿"习俗。
出现于清代的益智图、九连环可以认为是最早的创造力测验。
2、在人格测量方面。
孔子把人分为狂者、狷者和中行3种。
刘邵根据阴阳、五行和形体的关系及其人的行为表现,把人的性格划分成12种类型。
3、在教育测量方面。
世界上最早的教育测量出现于中国西周奴隶时期。
据记载,在西周的"国学"中已经建立具有相当系统性的教育测量制度。
心理与教育测量
心理诊断
心理障碍诊断
通过心理测量对心理障碍进行诊 断,如抑郁症、焦虑症、强迫症 等,为制定治疗方案提供依据。
智力障碍诊断
通过心理测量对智力障碍进行诊断, 如智力落后、自闭症等,为制定康 复计划和教育方案提供参考。
发展障碍诊断
通过心理测量对发展障碍进行诊断, 如语言障碍、运动障碍等,为制定 干预措施和发展计划提供指导。
03
CHAPTER
教育测量的基本概念
教育测量的定义与目的
定义
教育测量是一种评估学生知识、技能和能力的工具和方法,通过使用标准化测试 和评估工具来衡量学生的学习成果和进步。
目的
教育测量的目的是为学生、教师、家长和管理者提供关于学生学习状况的客观、 准确和可靠的信息,以便更好地指导学生的学习和改进教学方法。
VS
创新与改进方向
开发基于计算机的测量方法,如在线测验 、游戏化测验等,以提高测量的效率、趣 味性和互动性。
测量技术在教育中的应用前景
教育领域的需求
随着教育信息化的发展,教育领域对心理与 教育测量的需求日益增加。
应用前景展望
心理与教育测量技术将在学生评估、教师培 训、课程设计等方面发挥重要作用,为个性 化教育和教育质量提升提供有力支持。
心理评估
心理健康评估
人际关系评估
通过心理测量评估个人的心理健康状 况,发现和诊断心理问题,为心理治 疗和干预提供依据。
通过心理测量评估个人的人际关系能 力、沟通能力和社交技能,帮助个人 改善人际关系和提高社交能力。
学习适应性评估
通过心理测量评估学生的学习适应性, 发现学习困难和障碍,为教育工作者 提供教学策略和方法的建议。
目的
心理与教育测量的目的是为了了解个 体的心理特征、能力水平、知识掌握 程度等,为教育评估、选拔、诊断和 改进提供依据。
教育心理学练习题-第十四章---教学测量与评价
第十四章教学测量与评价一、单选题1.形成性评价通常发生在()。
A.教学过程之前B.学生毕业时C.教学过程之中D.教学过程之后2.从实施教学评价的时机来分,教学评价可分为()。
A.总结性评价与形成性评价B.常模参照评价和标准参照评价C.配置性评价与诊断性评价D.正式评价和非正式评价3.教学评价的目的是对课程、教学方法以及学生培养方案()。
A.做出决策B.做出判断C.作出分析D.进行评估4.测量首先要根据某种标准和一定的程序将学生的学习行为与结果确定为()。
A.一种题型B.一种量值C.某种题型D.多种题型5.根据教学评价的严谨程度来分,教学评价可分为()。
A.总结性评价与形成性评价B.常模参照评价和标准参照评价C.配置性评价与诊断性评价D.正式评价和非正式评价6.教师评分的相对标准对应的评价方式是()。
A.标准参照评价B.常模参照评价C.诊断性评价D.形成性评价7.通常在一门课程或教学活动结束后进行,对一个完整的教学过程进行的测定称为()。
A.形成性评价B.配置性评价C.总结性评价D.诊断性评价8.根据教学评价的功能来分,教学评价可分为()。
A.总结性评价和形成性评价B.常模参照评价和标准参照评价C.配置性评价与诊断性评价D.正式评价和非正式评价9.根据教学评价资料的处理方式来分,教学评价可分为()。
A.总结性评价与形成性评价B.常模参照评价和标准参照评价C.配置性评价与诊断性评价D.正式评价和非正式评价10.美国心理学家布朗认为,测验是测量一个行为样本的()。
A.基本过程B.系统程序C.主要过程D.全部过程11.标准化成就测验是指由专家或学者们按一定测验理论和技术,根据全国或地区所有学校的共同教育目标来编制的适用于大规模范围内评定个体学业()。
A.智力发展的测验B.结构的测验C.能力形成的测验D.成就水平的测验12.()可用来考察学生对知识的回忆,且可将学生的猜测可能性降到最小。
A.是非题B.选择题C.论问题D.填空题13.()不是标准化成就测验的优越性。
略论心理和教育测量理论的发展历程
பைடு நூலகம்
荔 理 是 活 在 的 理 逻 时量 论 测量 动内 关系 抽象 性和
: 辑 形式 化 的 反映 。就 其 内容说 ,包 括测 量 对 象 气 的 辩 明 , 引 与确 定 . 量规 则 选 用 与 体 现 测 量 规 则 导 测 :的 测 量 工 具 制作 使 用 ,以及 测 量 结 果 分 析 处 理 的 理 论 。随着 人类 物 理 测 量实 际活 动 的深 ^ 开展 ,8 纪 l世 : 人 们 已 经 明 确认 识 到 , 量误 差服 从 正 态分 布 , 称 测 或
展至今 . 这方 面的改进极其有限。试题与项 目的陈陈
相 因 现象 . 直非 常 突 出 , 一 比较 可 予 称道 的 , 是 出 现 就
. 于绝对和差劓感觉阕限这种心理物理量, 二 跟外部物理 了选 择 题这 种 客 观题 题 型 。 !刺激量间, 也存在着相当确定的函数关系; 虽然这屑 物理量一般都能在等距乃至比例尺度上指定值 ,
量 尺 上 , 说给 其 在 线 性 的 等 距 量 尺 上 指 定值 了 ( 或 当 另 外 还有 相应 的测 量标 准误 差 与信 度 指 数 ( 即观 察分 数 跟真 分 数 的 相关 系数 ) 求取 公 式 。 这 样一 套 的 理论 . 然 并 不 严谨 , 显粗 糙 , 虽 颤 但却也 较实 用 。 从诞 生 至 夸 . 也 为 控 制 测验 误差 ・ 进 心 理 量 的测 量 技 确 改 术 作 出了 贡献 。真 分 数 理 论 的测 量 误差 , 就某 一被 是 试 组来 说 的 , 种水 平 被 试 同等 看 待 这 就 抹 煞 了测 各 验难 度 跟 被试 水 平 相适 应 时 , 误差 要 小 于难 度跟 被 其 试 水平 相 距很 远 时 的误 差 这 种重 要 事 实 。另 外 , 据 根 这 种信 度理 论 的要求 ,就 要选 取 内部相 关 一 致 性 高 , 而 且难 度 只适 舍 于 中等 水 平 被 试 的 测 验 项 目来 构 成
戴海崎《心理与教育测量》(第4版)全套资料【教材+笔记+题库】
戴海崎《心理与教育测量》(第4版)全套资料【教材+笔记+(1)梳理知识脉络,浓缩学科精华。
(2)详解课后习题,巩固重点难点。
(3)精选考研真题,培养解题思路。
第1章心理与教育测量概论1.1 复习笔记一、一般测量概述(一)测量及其种类1.测量的定义测量是指依据一定的法则使用量尺对事物的属性进行定量描述的过程。
这一定义包含四个关键词:(1)“一定的法则”,是指任何测量都要建立在某种科学规则和科学原理基础之上,并通过科学的方法和程序完成测量过程。
(2)“事物的属性”,是指所要测量的客体或事件的特定特征。
(3)“量尺”,是指测量中所使用的度量工具。
(4)“定量描述”,是指测量的结果总是对事物属性的量的确定。
“数量”不仅指描述事物特征的符号,而且指一种有序的量。
数量具有四个特性:区分性、序列性、等距性、可加性。
2.测量的精确度测量的精确度既与测量对象的性质有关,也同测量时所用的工具有关。
(1)测量的精确度决定于测量对象本身的性质。
可根据测量对象的性质把它分为三种类型:确定型、随机型、模糊型。
(2)测量的精确度决定于测量工具(量尺)的精密性。
尽可能使用精密的测量工具,是保证测量精确度的重要条件。
3.测量的分类根据测量对象的性质和特点,测量大致可分为以下四种类型:(1)物理测量:即对事物的物理特征的测量。
(2)生理测量:即对机体生理特征的测量。
(3)社会测量:即对社会现象的测量。
(4)心理测量:即对人的心理特征的测量。
(二)测量的基本要素一个完善的测量数量必须具备两个基本要素,即测量的参照点和测量的单位。
1.测量的参照点(1)参照点的定义测量的参照点是指在测量工作中,测量前测量对象的数量的固定原点。
(2)参照点的分类①绝对参照点,即以绝对的零点作为测量的起点。
②相对参照点,即以人为确定的零点作为测量的起点。
(3)参照点的常见使用情形①最为理想的测量参照点当然是绝对参照点,因为它的意义最为明确。
②在人们难以找到绝对参照点的情况下,就必须改用相对参照点。
心理学(研究方法)内容精讲(心理测量学-心理与教育测量理论的新进展)【圣才出品】
心理学(研究方法)内容精讲第四部分心理测量学第十四章心理与教育测量理论的新进展第一节项目反应理论概述一、经典测量理论的局限经典测量理论在测量研究中仍然占据着非常重要的地位,继续指导着多种测验的编制和应用,但是,经典测验理论的理论框架是先天缺陷的,在测验实践飞速发展的今天,已显示出它的局限性。
(一)经典测量理论信度估计精度不够根据真分数理论假设,测验原始分数X线性分解为测验真分数T和误差分数E两部分,并且进一步假设真分数是测验原始分数的期望,误差分数与真分数相互独立,从而导出测验信度为真分数方差与原始分方差之比。
但是,在这个定义中除原始分数方差可以获得以外,真分数方差与误差分数方差都是没有途径获得的。
为了实际估计测验信度,经典测验理论提出了平行测验概念或者条件弱一点的等价测验概念,从而推演出若干信度估计公式,但是,严格的平行测验是不存在的,等价的测验也是很难获得的,由此造成了实际估计的信度精度就比较差。
(二)经典测验理论的误差指标笼统单一、不精细经典测验理论导出测验测量标准误差为SE,以此可估计真分数置信区间。
但是,这个SE是所有被试测量误差的标准差,或叫做测验平均标准误差,因此这个值可以用来描述所有被试的测量精度。
从应用上讲,这样非常的方便,但实际上却是经典测量理论的缺陷。
因为,不仅是不同的测量有不同的测量误差,相同的测量对于不同的被试也会有不同的测量误差。
用一个笼统单一或称作为平均的误差指标来刻画所有被试的测量精度,是难以让人满意的。
(三)经典测验理论各种参数的估计对样本的依赖性较大经典测验理论构造了一个完整的理论体系,同时设计了一系列的参数指标来描述测量的各方面特性。
这些指标中最主要的就是测验的信度、效度和试题的难度、区分度,要编制出高质量的测验离不开对测验“四度”的估计。
经典测验理论提出了用相应的样本统计量值作为总体参数估计值的方法。
但是在经典理论中,这些参数的估计对样本的依赖性是很高的。
《心理测量》-课程教学大纲
《心理测量学》教学大纲一、课程基本信息课程代码:16091303课程名称:心理测量英文名称:Psychometrics课程类别:专业必修课学时:48学分: 3适用对象: 应用心理学专业大三本科生考核方式:考试先修课程:无二、课程简介《心理测量学》介绍了当今心理学研究中主要的测量方法,包括测量的信度、效度、以及测量中随机误差和系统误差的控制方法;测验的难度、区分度,以及试题难度分布的控制技术和提高试题区分度的技术;介绍了各种著名测验,除了要求了解编制原理,还要求掌握实际使用方法;本书还介绍了标准参照测验教育成就测验的技术和理论。
还引进了题库建设、测验等值、项目功能差异、评价中心技术、行为情境判断测验、内隐联想测验等较为新近或更为实用的测量理论和技术。
除了介绍经典测量理论,还介绍了发展前景更为诱人的项目反应理论和概化理论,以及认知诊断理论。
为将来准备从事心理学应用、教育考试、人员测评等工作的本科生学习使用。
Psychometrics program introduce some measure methods which are widely used in psychological research. Those methods are reliability, validity and control methods of random measurement error and systematic error; difficulty, discrimination and How to control the degree of difficulty and improve the distinction; introduced a variety of well-known tests, in addition to understand the principle, but also required to master the practical use; besides introducing classical measurement theory, also introduced a more attractive prospect item response theory and generalizability theory, and the theory of cognitive diagnosis.三、课程性质与教学目的心理测量学课程是心理学各专业共同必修的一门应用与方法课程。
戴海崎《心理与教育测量》(第3版)章节题库(第16章测量的综合应用——第17章心理与教育测量理论
戴海崎《⼼理与教育测量》(第3版)章节题库(第16章测量的综合应⽤——第17章⼼理与教育测量理论第16章测量的综合应⽤⼀、单项选择题1.在评价中⼼技术中,⽆领导⼩组、⽂件框等测验属于()。
[统考2010研] A.情境测验B.评定量表C.投射测验D.⾃陈测验【答案】A【解析】评价中⼼技术是现代⼈事测评的⼀种主要形式,被认为是⼀种针对⾼级管理⼈员的最有效的测评⽅法。
⼀次完整的评价中⼼通常需要两三天的时间,对个⼈的评价是在团体中进⾏的。
⽆领导⼩组、⽂件框等测验属于情境测验。
2.关于⼼理测量在⼼理咨询中的应⽤,正确的看法是()。
A.是必不可少的B.可有可⽆C.是没有必要的D.应根据情况选⽤【答案】D【解析】⼼理测验在咨询和⼼理治疗过程中并不是必不可少的⼀个环节,应根据情况选⽤。
如果通过与咨询或治疗对象的交谈,对其问题已形成明确的看法,就可放弃不必要的⼼理测验。
有时过多的使⽤还会影响咨询、治疗的过程和效果。
⼆、论述题⼼理测量在我国⼼理咨询、⼈事测评及教育评价这三⼤领域有哪些主要应⽤?答:⼼理测验在实际应⽤⽅⾯,主要可⽤于选拔⼈才、岗位安置、诊断、预测、评价、辅助咨询等,在⼼理咨询、⼈事测评和教育评价三⼤领域的应⽤分别如下:(1)⼼理测验在⼼理咨询中的应⽤⼼理咨询包括三个核⼼过程:分析诊断过程;帮助指导过程;效果评估过程。
不同形式的⼼理测验在其中⼜有不同的应⽤:①在⾃我认识、⼈⽣规划咨询中,⽐较常⽤的⼈格测验有卡特尔⼈格问卷、YG性格问卷等。
②能⼒⽅⾯的测验有智⼒测验,如韦克斯勒智⼒测验和瑞⽂标准推理测验、能⼒倾向成套测验和单项特殊能⼒测验。
③在神经症、⼈格障碍等咨询中,常⽤的诊断和评估⼯具有明尼苏达多相⼈格调查表、艾森克⼈格问卷、症状⾃评量表以及部分焦虑测验量表。
(2)⼼理测验在⼈事测评中的应⽤⼈事测评是指根据职业或⼯作的要求,通过各种测量⼿段,对⼈的素质适合事的程度进⾏评价的过程,其⽬标是实现⼈与事的最佳匹配。
课后答案资料戴海崎《心理与教育测量》(第4版)笔记和课后习题(含考研真题)详解
戴海崎《心理与教育测量》(第4版)笔记和课后习题(含考研真题)详解完整版>精研学习䋞>无偿试用20%资料全国547所院校视频及题库资料考研全套>视频资料>课后答案>往年真题>职称考试试读(部分内容)隐藏第1章心理与教育测量概论1.1复习笔记一、一般测量概述(一)测量及其种类1.测量的定义测量是指依据一定的法则使用量尺对事物的属性进行定量描述的过程。
这一定义包含四个关键词:(1)“一定的法则”,是指任何测量都要建立在某种科学规则和科学原理基础之上,并通过科学的方法和程序完成测量过程。
(2)“事物的属性”,是指所要测量的客体或事件的特定特征。
(3)“量尺”,是指测量中所使用的度量工具。
(4)“定量描述”,是指测量的结果总是对事物属性的量的确定。
“数量”不仅指描述事物特征的符号,而且指一种有序的量。
数量具有四个特性:区分性、序列性、等距性、可加性。
2.测量的精确度测量的精确度既与测量对象的性质有关,也同测量时所用的工具有关。
(1)测量的精确度决定于测量对象本身的性质。
可根据测量对象的性质把它分为三种类型:确定型、随机型、模糊型。
(2)测量的精确度决定于测量工具(量尺)的精密性。
尽可能使用精密的测量工具,是保证测量精确度的重要条件。
3.测量的分类根据测量对象的性质和特点,测量大致可分为以下四种类型:(1)物理测量:即对事物的物理特征的测量。
(2)生理测量:即对机体生理特征的测量。
(3)社会测量:即对社会现象的测量。
(4)心理测量:即对人的心理特征的测量。
(二)测量的基本要素一个完善的测量数量必须具备两个基本要素,即测量的参照点和测量的单位。
1.测量的参照点(1)参照点的定义测量的参照点是指在测量工作中,测量前测量对象的数量的固定原点。
(2)参照点的分类①绝对参照点,即以绝对的零点作为测量的起点。
②相对参照点,即以人为确定的零点作为测量的起点。
(3)参照点的常见使用情形①最为理想的测量参照点当然是绝对参照点,因为它的意义最为明确。
心理与教育测量理论的新发展
第一节
01
项目反应理论简介
02 第二节
概化理论简介
三、项目反应理论的优良性质
一. 题目参数的跨群体不变性 二. 潜在特质量表的可选择性
三. 参数设计的科学性
四. 信息函数概念的引进与信息函数的可加性
(一)题目参数的跨群体不变性
• 项目反应理论题目参数估计独立于被试样本
(三)参数设计的科学性
1 2
题目难度参数b与 被试潜在特质参数 θ定义在同一度量 系统上
3
区分度参数与难 度系数相互独立
伪机遇参数的 实证性
(四)信息函数概念的引进与信息函数的可加性
• 可以精确估计每一测试项目以及测验针对每一个被试施测的测量 误差
2 • 项目信息函数: Ii ( ) ( P i ' ( ) ) / P i ( ) Qi ( )
求出所有水平之上的最小允许信息量,形成一个信息函数
(三)目标参照测验编制
一.准确的划定合格分数线 • 原则 二.尽量降低对被试合格与否的误判率
.若测验的对象已经确定:
①请专家就整个题库针对被试合格要求定一个合格率
1 ②用下式求出专家心目中的潜在特质合格分数: c N
P
i 1 i
P i (θ)是 Pi(θ) 对 θ的一阶导函数
所得θ值的测量标准误差为 :
'
SEi I i( )
1 2
项目反应理论进一步证明测验题目信息函数具有可加性,累加值称为测验信息函数, I ( ) 记为
I ( ) I i ( )
i 1
n
整个测验的测量标准误差为:
ME( ) 1/ I ( )
N
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 项目反应理论简介
❖ (一)测验对被试的评价依赖于测验项目的具体组合和项目数量 ❖ 评价指标:测验原始总分 ❖ 局限:分数的解释依赖于测验的具体内容。 ❖ 对被试的比较被迫限制在同一份试卷上
一、经典测验理论回顾
❖ (二)测验性能指标的估计依赖于被试样本 ❖ 项目难度估计值会随被试水平的变化而变化。 ❖ 区分度、信度和效度,本质上是相关系数,也都依赖于被试样本。 ❖ 同一测验在不同被试样本上施测所估性能指标不一样。
0
❖ 项目反应理论划合格分数线的方法(续): ❖ 3、估计与对应的能力值,是能力合格分数分界点
(四)提高合格分数线的划分质量
❖ 4、试卷合格分数由下式确定:
N 1 iN 1Pi()0 0
n
合格分数线Pi() i1
(四)提高合格分数线的划分质量
❖ 方法优点: ❖ 每一试卷合格线与同一能力合格线对应,因此标准是相同的、稳定的。 ❖ 是由专家在全题库基础上确定的合格比例求得的,因此是准确的。 ❖ 测试精度可以通过控制合格分数线上信息函数达到预设要求。
(Normal Ogive Model) ❖
第一节 项目反应理论简介
Pi( )
ai (bi)
1 Z2 e 2 dz
2
1.双参数正态肩形曲线模型
❖ b的意义:
❖将ห้องสมุดไป่ตู้
代入模型,即可得:
❖ b是对称曲线的中心与拐点,是曲线的定位参数。
b p 0.5 ❖ IRT难度定义: 在项目上恰有0.5正确作答概率的那些个体的能力值b为该项目难度值。
❖
,
,
❖ 采用锚测验-非等组设计,计算参数转换系数A和B,完成参数转换。
b Ab B a ab A c c
三、项目反应理论的部分特色应用简介
❖ (三)测验编制中用目标信息函数控制测验精度 ❖ 1、确定目标信息函数:对不同能力被试提出不同精度要求,转换成不同信息量要求。 ❖ 2、编写或选择项目,累积测验信息函数达到或超过目标信息函数。
(四)项目反应理论的优良性质
(四)项目反应理论的优良性质
❖ 3.被试能力参数量表与项目难度参数量表的一致性 ❖ 1、可准确预估被试的正确作答概率。 ❖ 2、可针对被试能力选择试题,是进行自适应测验的技术保证。
(四)项目反应理论的优良性质
❖ 4.可以精确估计每一测试项目以及测验针对每一个被试施测的测量误差 ❖ 项目信息函数: ❖ ❖ 测验信息函数: ❖
第二节 概化理论简介
❖ 二、概化理论基本框架 ❖ (一)概化理论的测验情境关系说 ❖ 为了探清测验误差的来源、类型、大小,必须建立一个理论模型。
❖ 二、概化理论基本框架 ❖ (一)概化理论的测验情境关系说(续) ❖ 概化理论模型的建立依赖于对测验情境关系的详细调查。 ❖ 测验情境关系是指测量目标与各测量侧面所组成的一种关系结构。
(三)项目反应理论的基础模型(续)
Rasch模型的最大特点是它的项目参数只有难度。
P () ex b ) p /1 [( ex b ) p](
i
i
i
(三)项目反应理论的基础模型(续)
❖ 3.Logistic模型 ❖ 伯恩鲍姆(Birnbaum,1958)双参数Logistic模型:
❖ 其中D一般取1.7 ❖ 令a=1,成单参数Logistic模型。
一、经典测验理论回顾
❖ (三)被试能力与项目难度两指标的 不一致性
❖ 测验总分的参照系是测验项目全体。 ❖ 项目难度的参照系是被试全体例。 ❖ 两个指标的参照系不相同,被试能力分数与项目难度两指标不匹配。
一、经典测验理论回顾
❖ (四)测验误差估计的不精确性 ❖ 经典理论中测验的信度估值是不精确的、笼统的。 ❖ 信度不是按定义公式求取而是借助于“平行测验”假设估计得到的。 ❖ 经典理论以同一误差估计值评价所有被试测值非常笼统,很不精确。
第十四章 心理与教育测量理论与技术的新发展
第
二
概化理论简介
节
第二节 概化理论简介
❖ 一、概化理论的发展 ❖ (一)概化理论的发展思路 ❖ 概化理论(Generalizability Theory,GT)是经典理论宏观发展,重在研究误差控制、研究测验
整体设计。
❖ 1、测验分数方差的测量学意义 ❖ 测验分数方差有目标分数方差和误差分数方差之区别。如: ❖ 被试真正能力水平间的分数方差是目标分数方差。 ❖ 同一被试不同次测验分数间的方差是误差方差。 ❖ 同一作品多个评分间的方差也是误差方差。
一、经典测验理论回顾
一、经典测验理论回顾
❖ 结论: ❖ 经典测量理论的这些局限性限制了测量在实践中的应用。 ❖ 项目反应理论(IRT)是在这背景上发展起来的一种全新的现代测验理论。
❖ 二、项目反应理论基础 ❖ (一)潜在特质理论(Latent Trait Theory) ❖ 测量学研究“潜在特质”目的:
(1,2......k)
(一)潜在特质理论
(一)潜在特质理论
❖ 完备的潜在特质空间定义: ❖ 如果一个K维潜在特质空间包含了制约人某种任务行为的所有潜在特质,称其为一个完备的潜在特质空
间,简称全特质空间。
(一)潜在特质理论
❖ 测量单维性定义: ❖ 如果制约某种任务行为的空间既是一维的,又是完备的,则称这一任务行为的测量具有单维性。单维
❖ a的意义:
❖ 将模型对 求导,将
代入,
可得
。
❖ a是曲线拐点(难度点)的斜率。
b
❖ 曲线越陡峭,难度点附近不同被试正确作答概率的差异越大
a ❖ a 定义为区分度 2 tgA
1.双参数正态肩形曲线模型
1
1/2
0 b
图 双参数模型的项目特征曲线
1、双参数项目特征曲线
❖ 2.Rasch模型 ❖ 丹麦学者拉希建 Rasch 模型
Ii() (P i'())2/P i()Q i()
n
I()Ii () i1
(四)项目反应理论的优良性质 ❖ 4.可以精确估计每一测试项目以及测验针对每一个被试施测的测量误差(续) ❖ 针对每一个被试施测的测量标准误:
ME()1/ I()
二、项目反应理论基础(续)
❖ (五) 项目反应理论模型的参数估计和模型—数据资料拟合检验 ❖ 1、根据测试数据估计出所有的参数
(一)概化理论的测验情境关系说
❖ 2、测量侧面(续) ❖ 固定侧面的优点:
第二节 概化理论简介
❖ 1、测量目标 ❖ 测量目标:测量者希望通过测量用测量值描绘的心理品质。 ❖ 确定测量目标的方法:问“测谁”和“测什么”。 ❖ 一般一场测量目标只能一个 ❖ 研究同一测量问题测量目标一经确定不能改变。
(一)概化理论的测验情境关系说
❖ 2、测量侧面 ❖ 测量侧面:测量的条件。 ❖ 测量侧面水平:测量条件的不同水平。 ❖ 测量侧面类型:随机侧面 固定侧面
2
2
2
X
T
E
2 T
/
2 X
(一)概化理论的发展思路
(一)概化理论的发展思路
❖ 3、经典测验理论处理分数方差的办法 ❖ 优点:定义了随机误差,可设法估计其大小。 ❖ 缺点:没有能告诉我们误差由哪些原因造成,各种原因造成的误差各有多大。
❖ 4、概化理论的研究目的 ❖ 探清总分方差结构、 ❖ 区分误差原因, ❖ 明确各种误差大小, ❖ 找到最优设计方案。
(一)概化理论的发展思路
(一)概化理论的发展思路
❖ 2、误差来源的多样性与总分方差结构 的复杂性 ❖ 测量误差的原因多方面,误差方差的种类多种。 ❖ 总分方差结构复杂:不同来源的误差方差与目标分数方差共存。
❖ 3、经典测验理论处理分数方差的办法 ❖ 假定X = T + E, ❖ 然后有: ❖ 再定义信度为:
IRT模型是最为人们熟悉的。
第一节 项目反应理论简介
❖ (二)项目特征曲线 (Item Characteristic Curve, ICC)
❖ 项目特征曲线原理: 编制质量良好的试题,随着被试水平的提高,其正确作答的概率会越来越大。
❖ 经典测量理论项目特征曲线实质: 被试正确作答概率对测验总分的回归曲线
(一)概化理论的发展思路
❖ (二)概化理论发展的理论与技术基础 ❖ 1、经典测验理论
概化理论与经典测验理论相比,不同之处多于相同之处。 ❖ 2、方差分量分析
依靠方差分量分析将总分方差分解、定性。
第二节 概化理论简介
第二节 概化理论简介
❖ (三)概化理论发展史 ❖ 用方差分量分析研究测量误差的历史可以追溯到20世纪上半叶。 ❖ 公认的GT正式诞生的标志物是克朗巴赫等的专著《行为测量的可靠性》的正式出版。
第十四章心理与教育测量理论与 技术的新发展
第十四章 心理与教育测量理论与技术的新发展
第
项目反应理论简介
一
节
第
概化理论简介
二
节
第
新一代测量理论与认知诊断测验发展
三
节
第十四章 心理与教育测量理论与技术的新发展
第
一
项目反应理论简介
节
❖ 一、经典测验理论回顾 ❖ 巨大贡献、重要地位、继续发挥作用 ❖ 历史原因、先天不足、四个方面局限
某项目信息函数图(a=1.0064 b=-1.6972 c=0.2526) ❖ 这是一个中上质量项目
❖ 根据测验信息函数从总体上评价测验质量。
(一)用信息函数评价项目和测验质量
❖
图 某测验信息函数图
❖ 这是一个质量较高的测验。
三、项目反应理论的部分特色应用简介
❖ (二)实现大型题库项目参数等值
❖ 项目反应理论证明,两个不同样本所估同一项目两套参数之间存在如下关系:
探清结构和性质,将其数量化, 测量个体特质变量值,预测个体行为。
第一节 项目反应理论简介