心理测量学(详细)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
心理测量学
Psychological Testing
上传 目的 刘景波(snr5aliu) 仅用于学习交流
一、说明 (一)课程性质 本课程适合于大学本科心理学、教育科学等专业的本科生及研究生教育。本课程 的学习将有助于实验设计、教育评价、心理与教育统计学等学科的学习,是培养学生 科学研究及掌握研究方法的基础性学科。 (二)教学目的 通过学习,要求学生掌握心理测量的基本知识、心理测量的编制和实施、以及良好 测量所要求具备的基本条件。更重要的是,通过本课程的学习要使学生熟练掌握不同 心理测量的实际应用。 (三)教学内容 本课程的主要教学内容有:心理测量的基本内涵及其评价和测量的一般步骤和方 法两部分。内容涉及一般测量解析,测量的要素及量表类型,测验信、效度、难度和 区分度,测量的一般步骤和方法,智力测验、人格测验等心理测验,以及心理测量的 综合应用和心理测量理论的新发展等内容。 (四)教学时数 54个课时
• 定义:在测验没有复本且只能实施一次的情况
下,可将测验项目分成对等的两半,根据被试
在这两半测验中所得的分数计算相关系数,即
得分半信度。 • 计算分半信度先要对测验分半。不同的分半法 可能会得到不同的信度值。
分半信度(Split-Half Reliability)
• 为了使两半基本等值,可将项目按由易到难的 顺序排列编号,然后按奇数和偶数序号将项目 分半。要注意使那些性质相同、联系紧密的项 目分在相同的一半,否则会使信度值偏高。
• 复本编好后,应再测一次,以确保各份测验的等值。
定义:两个复本施测同一被试群体,求其相关。
• 等值性系数:同时连续施测,反映内容变异。
• 形式:复本A—最短时间—复本B
• 稳定性与等值性系数:
• 时间间隔施测,内容变异+重测信度误差 • 形式:复本A—适当时间—复本B
分半信度(Split-Half Reliability)
• 假设对100个六年级学生以两个月的时间间隔先后施测一个创 造力测验的A\B两个复本,所得的等值性与稳定性系数为0.70。 我们还根据 • 被试对每个复本的反应计算出分半信度为0.80 • (先计算每个复本的分半相关系数。将二者平 • 均后再用斯皮尔曼-布朗公式校正)。同时, • 我们让另一个评分者随机抽取50份卷子另外评 • 分,得到评分者信度为0.92。然后,我们对这 • 三种方法所产生的误差变异进行分析。
1.心理特质(Trait)及其可测性假设 2.测量误差及其来源 3.真分数模型及其假设 4.经典测验理论的不足
第三章 测验信度
教学要点: 通过本章的学习,掌握信度的意义,信度系数的计算,了解影响信度的 主要因素以及提高信度的常用方法等内容。 教学时数:[4学时] 教学内容: 一、信度的意义 1. 信度指实测值和真值相差的程度 2. 信度指统计量与参数之间的接近程度 3. 信度是指一种测验对相同的应试者再次测验时引起同样反应的程度 二、信度系数的计算 1.稳定性系数 2.等值性系数 3.等值稳定性系数 4. 内部一致性系数 5. 评分者的信度系数
三、提高测验信度的方法 1. 信度系数以多大为宜 2. 影响信度的因素 3. 提高测验信度的方法 考核要求: 1.信度的意义 2.信度系数的计算 识记:稳定性系数,等值性系数,等值稳定性系数,内部一致性系数,评分 者的信度系数 3.提高测验信度的方法
请列举一些你所使用过或接触过的量表
思考: 量表的作用是什么?
(五)心理测量的道德准则 1.心理测量工作者的素质要求 (1)心理测量工作的知识结构.(2)对心理测量的态度 2.心理测量工作者的道德准则 (1)测验的保密和控制原则(2)测验中个人隐私的保护 考核要求:
1.心理测量的种类 2.测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区 别 3.测量的要素及量表类型 单位,参照点,量表,称名量表,顺序变量,等距变量,比率变量 4.心理测量的本质、基本条件及功能 5.心理测量发展简史
两次施测,求其相关。
• 实质:表示测验结果的稳定性。故称之为稳定 性系数(Coefficient of Stability) • 形式:施测—适当时间—再施测
时间间隔的把握
• 间隔时间越长,稳定性系数越低。适宜时间间隔依照
测验目的、性质及被试特点而定。几分钟至几年。 • 年幼儿童,间隔要小;年长群体,间隔可大。智力测 验的间隔不能太短,成就测验的间隔不能太长。 • 一般间隔时间不超过六个月。(即不能让被试记住上
• 由于分半信度实际上只是半个测验的信度,测 验越长、项目越多,两半分数的相关就越高。 因此,对长度不同的测验,要用校正公式。
同质性信度(Homogeneity Reliability)
• 同质性指测验的所有题目测量的是同一种心理
特质,表现为各个题目得分之间有较高的相关,
相关越高则同质性越强。
• 因素分析的思路
二、测量误差及其来源 1. 测量误差的含义 2.误差种类 识记: 随机误差,系统误差 3.误差来源 (1)来自心理测量工具,(2)来自测量对象,(3)来自实测过程 (二)真分数模型及其假设 1. 真分数的含义 2.真分数数学模型解析 领会:(1)几个推理,(2)CTT的基本含义,(3)CTT的基本公式 3.经典测验理论的不足 考核要求:
你如何解释下述现象?
一个很聪明的孩子,测得智商是80分
一个学习很好的学生,考试成绩为60分
一个人缘很好的人,人际关系测量低于常 模值
量表帮助我们了解心理现象(心理特质),就像
尺子帮助我们测量身高。
思考:我们如何知道我们有多高? 有两个工具:尺子 / 秤
尺子的数据与我们的目测更一致,而秤盘的数据
信度系数的类型 再测信度 复本信度(连续施测) 复本信度(间隔施测) 分半信度 同质性信度 评分者信度
误差变异的来源 时间取样 内容取样 时间与内容取样 内容取样 内容的异质性 评分者间的差异
• 实际上,有多少种误差来源,便有 • 多少种估计信度的方法。一个测验
• 哪种误差大,便应该用哪种误差估
• 计。有时一个测验需要有几种信度 • 系数,这样我们就把总分数的变异 • 数分成不同的分支。
X'的相关系数。
• rXX=PXX'
A卷:你是一个喜欢热闹的人吗?
1=绝对是
2=是
3=不一定
4=不是
5=绝对不是
B卷:你是一个喜欢安静的人吗?
1=绝对是
2=是
3=不一定
4=不是
5=绝对不是
信度的估计方法
• 重测信度(Test-Retest Reliability)
• 定义:同一量表,同一被试群体,在不同时间,
三、心理测量的本质、基本条件及功能 1. 心理测量的本质 2. 编制心理测验的基本条件 3. 心理测量的功能 (1)理论研究功能,(2)实际应用功能 四、心理测量发展简史 1. 主观经验性考试阶段(1864年以前) 2. 客观标准化测验阶段(1864年——1940年) 3. 客观测验的深入发展阶段(1940年——) 4. 西方心理测量的发展 5. 心理测验在我国的发展
• 最简单的估计方法就是随机抽取若干份答卷,由 两个独立的评分者打分,再求每份答卷两个评判 分数的相关系数。这种相关系数的计算可以用积 差相关方法,也可以采用斯皮尔曼等级相关方法。
• 如果评分者在三人以上,而且又采用等级记分时, 就需要用肯德尔和谐系数来求评分者信度。
估计信度的方法与测验复本的数目 以及施测次数的关系
一次测验的内容,又不能让其特质发生变化,或对所
学知识产生遗忘)
复本信度(Alternate-form raliability)
• 因为任何测验只是所有可能题目中的一份取样 (行为样本),所以可编制许多平行的等值测 验,叫做复本。
复本等值要符合下列条件:
• 各份测验测量的是同一种心理特性。
• • • • 各份测验具有相同的内容和形式。 各份测验的题目不应重复。 各份测验题目数量相等,难度和区分度大体相同。 各份测验的分数分布(平均数和标准差)大致相等。
则与我们的目测不一致。因此,尺子是测量身高 的有效工具——效度。 什么材料的尺子?——钢铁(热胀冷缩)
涉及到一致性的问题。——信度
• •
物理不等于数学 1.70与1.7的关系
• 总结:量表是我们用来了解心理特质的工具, 但这个工具是有误差的。误差要控制在一个许 可的范围内。
回顾
• 什么是误差?
• 误差的种类?
第二章 经典测验理论的基本假设
教学要点: 通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性, 心里测量的误差和种类,以及真分数的含义等内容。 教学时数:[6学时] 教学内容:
一、心理特质(Trait)及其可测性假设 1.经典测验(Classical Test Theory ,CTT)理论 2.特质假设
• 误差是在测量中与目的无关的变因所产生的不
准确或不一致的效应。
• 误差分为随机误差和系统误差。
Biblioteka Baidu• 高尔顿的智力观 • 比奈的智力观 • 判断题、选择题和问答题 • SX2 = ST2 + SE2 ST2 = SV2 + SI2 SX2 = SV2 + SI2 + SE2
SX2 SV2 SI2 SE 2
ST2
信度
• 稳定性 \ 可靠性 \ 一致性
• 信度乃是一个被测团体真分数的变异数与实得 分数的变异数之比。 • rXX=ST2/SX2
信度的定义二
• 信度乃是一个被测团体真分数与实得分数的相
关系数的平方。
• rXX=P2TX
• 思考:相关系数的平方?
信度的定义三
• 信度乃是一个测验X与它的任意一个平行测验
五、评分者信度(Scorer Reliability)
• 评分者信度是指不同评分者之间在测验结果计
分上的一致性。
• 在心理测验中,评分者信度的计算,通常是随机
抽取若干份试卷,由至少两位受过训练的评分 者按计分规则分别判分,然后计算它们的相关。 几个评分者的评分越一致,评分者信度越高。
五、评分者信度(Scorer Reliability)
(五)教学方式 课堂教学与实践应用相结合。
第一编
心理测量的基本内涵及其评价 第一章 绪论
教学要点: 通过本章的学习,了解测量的基本性质及其要素,测量量表的四种水平, 心里测量的本质、基本条件及功能,心里测量的发展以及心理测量的道德准 则等内容,对心理测量有一个概括化的了解。 教学时数:[10学时] 教学内容: 一、一般测量解析 1.测量(Measurement)概论 2.测量的分类 3.心理测量的种类 (1)以测量对象来分,(2)以测量的目的来分,(3)以测量的方式来分 类,(4)以项目结构或组成形式来分,(5)按评价参照的标准分类 4.测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区 别
一个假想测验的误差变异来源分析 信度类型 分半信度 上述二者差异 评分者信度 误差变异总和 真实变异 误差变异量 误差变异来源 时间与内容取样 内容取样
复本信度(间隔施测) 1-0.70=0.30 1-0.80=0.20
0.30-0.20=0.10 时间取样 1-0.92=0.08 评分者差异
0.20+0.10+0.08=0.38 1-0.38=0.62
所需要 施测的次数 一 所需要副本的数目
一
分半信度 同质性信度 评分者信度 再测信度
二
副本信度 (连续施测) 复本信度 (间隔施测)
二
• 在一般情况下,间隔施测的副本信度最低,因 为很多因素有机会影响到分数。相反,校正过 的分半相关,因为影响的因素少,所得的信度 估计为最高。
各种信度系数相应误差变异的来源
二、测量的要素及量表类型 1.测量的要素 识记: 单位(Unit),参照点(Reference Point),量表(Scale) 2.量表类型 (1)称名量表 称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说 明事物与事物之间差异的大小、顺序的先后及质的优劣。 (2)顺序变量 顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列 的变量,具有等级性和次序性的特点。 (3)等距变量 等距变量除能表明量的相对大小外,还具有相等的单位。 (4)比率变量 比率变量除了具有量的大小、相等单位外,还有绝对零点。
Psychological Testing
上传 目的 刘景波(snr5aliu) 仅用于学习交流
一、说明 (一)课程性质 本课程适合于大学本科心理学、教育科学等专业的本科生及研究生教育。本课程 的学习将有助于实验设计、教育评价、心理与教育统计学等学科的学习,是培养学生 科学研究及掌握研究方法的基础性学科。 (二)教学目的 通过学习,要求学生掌握心理测量的基本知识、心理测量的编制和实施、以及良好 测量所要求具备的基本条件。更重要的是,通过本课程的学习要使学生熟练掌握不同 心理测量的实际应用。 (三)教学内容 本课程的主要教学内容有:心理测量的基本内涵及其评价和测量的一般步骤和方 法两部分。内容涉及一般测量解析,测量的要素及量表类型,测验信、效度、难度和 区分度,测量的一般步骤和方法,智力测验、人格测验等心理测验,以及心理测量的 综合应用和心理测量理论的新发展等内容。 (四)教学时数 54个课时
• 定义:在测验没有复本且只能实施一次的情况
下,可将测验项目分成对等的两半,根据被试
在这两半测验中所得的分数计算相关系数,即
得分半信度。 • 计算分半信度先要对测验分半。不同的分半法 可能会得到不同的信度值。
分半信度(Split-Half Reliability)
• 为了使两半基本等值,可将项目按由易到难的 顺序排列编号,然后按奇数和偶数序号将项目 分半。要注意使那些性质相同、联系紧密的项 目分在相同的一半,否则会使信度值偏高。
• 复本编好后,应再测一次,以确保各份测验的等值。
定义:两个复本施测同一被试群体,求其相关。
• 等值性系数:同时连续施测,反映内容变异。
• 形式:复本A—最短时间—复本B
• 稳定性与等值性系数:
• 时间间隔施测,内容变异+重测信度误差 • 形式:复本A—适当时间—复本B
分半信度(Split-Half Reliability)
• 假设对100个六年级学生以两个月的时间间隔先后施测一个创 造力测验的A\B两个复本,所得的等值性与稳定性系数为0.70。 我们还根据 • 被试对每个复本的反应计算出分半信度为0.80 • (先计算每个复本的分半相关系数。将二者平 • 均后再用斯皮尔曼-布朗公式校正)。同时, • 我们让另一个评分者随机抽取50份卷子另外评 • 分,得到评分者信度为0.92。然后,我们对这 • 三种方法所产生的误差变异进行分析。
1.心理特质(Trait)及其可测性假设 2.测量误差及其来源 3.真分数模型及其假设 4.经典测验理论的不足
第三章 测验信度
教学要点: 通过本章的学习,掌握信度的意义,信度系数的计算,了解影响信度的 主要因素以及提高信度的常用方法等内容。 教学时数:[4学时] 教学内容: 一、信度的意义 1. 信度指实测值和真值相差的程度 2. 信度指统计量与参数之间的接近程度 3. 信度是指一种测验对相同的应试者再次测验时引起同样反应的程度 二、信度系数的计算 1.稳定性系数 2.等值性系数 3.等值稳定性系数 4. 内部一致性系数 5. 评分者的信度系数
三、提高测验信度的方法 1. 信度系数以多大为宜 2. 影响信度的因素 3. 提高测验信度的方法 考核要求: 1.信度的意义 2.信度系数的计算 识记:稳定性系数,等值性系数,等值稳定性系数,内部一致性系数,评分 者的信度系数 3.提高测验信度的方法
请列举一些你所使用过或接触过的量表
思考: 量表的作用是什么?
(五)心理测量的道德准则 1.心理测量工作者的素质要求 (1)心理测量工作的知识结构.(2)对心理测量的态度 2.心理测量工作者的道德准则 (1)测验的保密和控制原则(2)测验中个人隐私的保护 考核要求:
1.心理测量的种类 2.测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区 别 3.测量的要素及量表类型 单位,参照点,量表,称名量表,顺序变量,等距变量,比率变量 4.心理测量的本质、基本条件及功能 5.心理测量发展简史
两次施测,求其相关。
• 实质:表示测验结果的稳定性。故称之为稳定 性系数(Coefficient of Stability) • 形式:施测—适当时间—再施测
时间间隔的把握
• 间隔时间越长,稳定性系数越低。适宜时间间隔依照
测验目的、性质及被试特点而定。几分钟至几年。 • 年幼儿童,间隔要小;年长群体,间隔可大。智力测 验的间隔不能太短,成就测验的间隔不能太长。 • 一般间隔时间不超过六个月。(即不能让被试记住上
• 由于分半信度实际上只是半个测验的信度,测 验越长、项目越多,两半分数的相关就越高。 因此,对长度不同的测验,要用校正公式。
同质性信度(Homogeneity Reliability)
• 同质性指测验的所有题目测量的是同一种心理
特质,表现为各个题目得分之间有较高的相关,
相关越高则同质性越强。
• 因素分析的思路
二、测量误差及其来源 1. 测量误差的含义 2.误差种类 识记: 随机误差,系统误差 3.误差来源 (1)来自心理测量工具,(2)来自测量对象,(3)来自实测过程 (二)真分数模型及其假设 1. 真分数的含义 2.真分数数学模型解析 领会:(1)几个推理,(2)CTT的基本含义,(3)CTT的基本公式 3.经典测验理论的不足 考核要求:
你如何解释下述现象?
一个很聪明的孩子,测得智商是80分
一个学习很好的学生,考试成绩为60分
一个人缘很好的人,人际关系测量低于常 模值
量表帮助我们了解心理现象(心理特质),就像
尺子帮助我们测量身高。
思考:我们如何知道我们有多高? 有两个工具:尺子 / 秤
尺子的数据与我们的目测更一致,而秤盘的数据
信度系数的类型 再测信度 复本信度(连续施测) 复本信度(间隔施测) 分半信度 同质性信度 评分者信度
误差变异的来源 时间取样 内容取样 时间与内容取样 内容取样 内容的异质性 评分者间的差异
• 实际上,有多少种误差来源,便有 • 多少种估计信度的方法。一个测验
• 哪种误差大,便应该用哪种误差估
• 计。有时一个测验需要有几种信度 • 系数,这样我们就把总分数的变异 • 数分成不同的分支。
X'的相关系数。
• rXX=PXX'
A卷:你是一个喜欢热闹的人吗?
1=绝对是
2=是
3=不一定
4=不是
5=绝对不是
B卷:你是一个喜欢安静的人吗?
1=绝对是
2=是
3=不一定
4=不是
5=绝对不是
信度的估计方法
• 重测信度(Test-Retest Reliability)
• 定义:同一量表,同一被试群体,在不同时间,
三、心理测量的本质、基本条件及功能 1. 心理测量的本质 2. 编制心理测验的基本条件 3. 心理测量的功能 (1)理论研究功能,(2)实际应用功能 四、心理测量发展简史 1. 主观经验性考试阶段(1864年以前) 2. 客观标准化测验阶段(1864年——1940年) 3. 客观测验的深入发展阶段(1940年——) 4. 西方心理测量的发展 5. 心理测验在我国的发展
• 最简单的估计方法就是随机抽取若干份答卷,由 两个独立的评分者打分,再求每份答卷两个评判 分数的相关系数。这种相关系数的计算可以用积 差相关方法,也可以采用斯皮尔曼等级相关方法。
• 如果评分者在三人以上,而且又采用等级记分时, 就需要用肯德尔和谐系数来求评分者信度。
估计信度的方法与测验复本的数目 以及施测次数的关系
一次测验的内容,又不能让其特质发生变化,或对所
学知识产生遗忘)
复本信度(Alternate-form raliability)
• 因为任何测验只是所有可能题目中的一份取样 (行为样本),所以可编制许多平行的等值测 验,叫做复本。
复本等值要符合下列条件:
• 各份测验测量的是同一种心理特性。
• • • • 各份测验具有相同的内容和形式。 各份测验的题目不应重复。 各份测验题目数量相等,难度和区分度大体相同。 各份测验的分数分布(平均数和标准差)大致相等。
则与我们的目测不一致。因此,尺子是测量身高 的有效工具——效度。 什么材料的尺子?——钢铁(热胀冷缩)
涉及到一致性的问题。——信度
• •
物理不等于数学 1.70与1.7的关系
• 总结:量表是我们用来了解心理特质的工具, 但这个工具是有误差的。误差要控制在一个许 可的范围内。
回顾
• 什么是误差?
• 误差的种类?
第二章 经典测验理论的基本假设
教学要点: 通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性, 心里测量的误差和种类,以及真分数的含义等内容。 教学时数:[6学时] 教学内容:
一、心理特质(Trait)及其可测性假设 1.经典测验(Classical Test Theory ,CTT)理论 2.特质假设
• 误差是在测量中与目的无关的变因所产生的不
准确或不一致的效应。
• 误差分为随机误差和系统误差。
Biblioteka Baidu• 高尔顿的智力观 • 比奈的智力观 • 判断题、选择题和问答题 • SX2 = ST2 + SE2 ST2 = SV2 + SI2 SX2 = SV2 + SI2 + SE2
SX2 SV2 SI2 SE 2
ST2
信度
• 稳定性 \ 可靠性 \ 一致性
• 信度乃是一个被测团体真分数的变异数与实得 分数的变异数之比。 • rXX=ST2/SX2
信度的定义二
• 信度乃是一个被测团体真分数与实得分数的相
关系数的平方。
• rXX=P2TX
• 思考:相关系数的平方?
信度的定义三
• 信度乃是一个测验X与它的任意一个平行测验
五、评分者信度(Scorer Reliability)
• 评分者信度是指不同评分者之间在测验结果计
分上的一致性。
• 在心理测验中,评分者信度的计算,通常是随机
抽取若干份试卷,由至少两位受过训练的评分 者按计分规则分别判分,然后计算它们的相关。 几个评分者的评分越一致,评分者信度越高。
五、评分者信度(Scorer Reliability)
(五)教学方式 课堂教学与实践应用相结合。
第一编
心理测量的基本内涵及其评价 第一章 绪论
教学要点: 通过本章的学习,了解测量的基本性质及其要素,测量量表的四种水平, 心里测量的本质、基本条件及功能,心里测量的发展以及心理测量的道德准 则等内容,对心理测量有一个概括化的了解。 教学时数:[10学时] 教学内容: 一、一般测量解析 1.测量(Measurement)概论 2.测量的分类 3.心理测量的种类 (1)以测量对象来分,(2)以测量的目的来分,(3)以测量的方式来分 类,(4)以项目结构或组成形式来分,(5)按评价参照的标准分类 4.测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区 别
一个假想测验的误差变异来源分析 信度类型 分半信度 上述二者差异 评分者信度 误差变异总和 真实变异 误差变异量 误差变异来源 时间与内容取样 内容取样
复本信度(间隔施测) 1-0.70=0.30 1-0.80=0.20
0.30-0.20=0.10 时间取样 1-0.92=0.08 评分者差异
0.20+0.10+0.08=0.38 1-0.38=0.62
所需要 施测的次数 一 所需要副本的数目
一
分半信度 同质性信度 评分者信度 再测信度
二
副本信度 (连续施测) 复本信度 (间隔施测)
二
• 在一般情况下,间隔施测的副本信度最低,因 为很多因素有机会影响到分数。相反,校正过 的分半相关,因为影响的因素少,所得的信度 估计为最高。
各种信度系数相应误差变异的来源
二、测量的要素及量表类型 1.测量的要素 识记: 单位(Unit),参照点(Reference Point),量表(Scale) 2.量表类型 (1)称名量表 称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说 明事物与事物之间差异的大小、顺序的先后及质的优劣。 (2)顺序变量 顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列 的变量,具有等级性和次序性的特点。 (3)等距变量 等距变量除能表明量的相对大小外,还具有相等的单位。 (4)比率变量 比率变量除了具有量的大小、相等单位外,还有绝对零点。