心理测量学课件 信度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.3.2标准参照分数
内容参照分数 内容标准分数:把内容分数和常模分数结合使 用,即能指出他正确反映的百分比,又能指出 他的成绩达到了那种人的水平 等级评定量表:当需要报告一种活动的熟练水 平或一种产品的质量时,需要采用等级评定量 表来对各种等级定出标准
2.3.2标准参照分数
内容参照分数 优点:内容参照分数表明了个人所掌握的知识 或技能的水平和程度,在大多数情况下,这比 知道一个人在团体中的相对位臵更有价值 用途:内容参照分数主要用于成就测验以及能 确定出可接受的最低标准的资格测验(考驾照)
思考:我们如何知道我们有多高? 有两个选择工具: A.尺子 B.秤
量表帮助我们了解心理现象(心理特质),就像尺 子帮助我们测量身高。
物理不等于数学 1.70与1.7的关系 总结:量表是我们用来了解心理特质的工具, 但这个工具是有误差的。误差要控制在一个许 可的范围内。
3.1信度的概念
信度:使用相同的测验或工具,再次测 验相同的被试时,所得分数的一致性程 度。
2.结构效度(Construct Validity)
结构效度是指测验对于被称作构想的某一理论概念或特质测量 的程度。
效度的估计方法
3.实证效度(Criterion related Validity)
实证效度是指一个测验对处于特定情景中的个 体的行为进行估计的有效性。 提高测量效度的方法 (1)控制系统误差,(2)精心编制量表, (3)妥善组织测验,(4)扩充样本容量, (5)适当增加测验的长度
2.2 分数的合成
分数的合成
组合变量的特殊方法方法 完形记分:将各个变量看作一个整体,不是孤立地看 每一个反应结果,而是看总的方应模式 轮廓分析:考虑被试在各个测验或量表上所得分数的 轮廓,而不是将各个变量作简单的线性组合(MMPI)
2.2 分数的合成
各种组合方法的比较 应用范围的比较.doc
施测
指导语和时限—使用统一的指导语;事先告知时限 记分及解释—将被试的反映数量化并赋予意义的过程 对被试的反映给予及时而清楚、详细地记录; 对非客观题目不得随意记分; 保持和蔼、微笑的态度,不做暗示; 参照常模或其他标准作出解释。
2.4.2 测验的应用与管理
测验在实际工作中的应用
选材—预测个体活动的适应性,提高人才选拔和职业 训练的效率。 安臵—人职匹配 诊断—鉴别、发现问题 评价—能力、水平、优点、缺点 咨询—发展咨询、健康咨询
第四次课
2.4 心理测验的实施
2.4.1测验的选择
适合测量的目的
符合心理测量学的要求
2.4 心理测验的实施
测验前的准备 预告测验—不搞突然袭击 主试自身的准备—熟悉指导语;熟悉具体程序; 应急的心理准备 测验材料的准备—预先模拟一遍测验
Fra Baidu bibliotek
测验环境的准备—安静、通风、采光良好
2.4 心理测验的实施
估计信度的方法与测验复本的数目以及施测次数的关系
所需要 施测的次数 一
所需要副本的数目

分半信度 同质性信度 评分者信度 再测信度

副本信度 (连续施测) 复本信度 (间隔施测)

各种信度系数相应误差变异的来源
信度系数的类型 再测信度 复本信度(连续施测) 复本信度(间隔施测) 分半信度 评分者信度
考虑被试在测验前的经历或背景因素 注重测验的效度资料,在解释分数时应从最相 匹配的团体和最相近的情境中获得的资料 将测验分数视为一个范围而不是一些确定的点 对来自不同测验的分数不能直接加以比较
2.5 分数的合成与解释
分数的解释 如何向当事人报告分数 使用当事人所理解的语言 让当事人知道这个测验测量或预测什么 让当事人知道他是和什么团体进行比较 让当事人认识到分数只是一个最好的估计 让当事人知道如何运用他的分数 要考虑测验分数将给当事人带来什么影响 让当事人积极参与测验分数的解释
在这两半测验中所得的分数计算相关系数,即
得分半信度。 计算分半信度先要对测验分半。不同的分半法 可能会得到不同的信度值。
信度的估计方法
4.评分者信度(Scorer Reliability) 评分者信度是指不同评分者之间在测验结果计 分上的一致性。
在心理测验中,评分者信度的计算,通常是随机
抽取若干份试卷,由至少两位受过训练的评分 者按计分规则分别判分,然后计算它们的相关。 几个评分者的评分越一致,评分者信度越高。
2.3.2标准参照分数
结果参照分数:又称校标参照分数,使用校标 行为的水准来表示分数(职业测验) 先决条件:测验分数必须与一个重要的校标具 有高相关,即要具有效度证据;要有一个能把 测验分数和校标成绩之间的关系结合起来的方 法,即要具有转换分数的图表
2.3.3 分数的解释与交流
解释分数要注意的几个问题
信度的估计方法
4.评分者信度(Scorer Reliability)
最简单的估计方法就是随机抽取若干份答卷,由 两个独立的评分者打分,再求每份答卷两个评判 分数的相关系数。这种相关系数的计算可以用积 差相关方法,也可以采用斯皮尔曼等级相关方法。 如果评分者在三人以上,而且又采用等级记分时, 就需要用肯德尔和谐系数来求评分者信度。
C P P S
— 9.我容易生气。 — 10.我难以做出决定。 — 11.事情很少能使我生气或不安。 — 12.和一群人在一起时我喜欢讲生动 的 故事。 S — 13.人们说我不太靠得住。 M — 14.我很自律。 C — 15.人们说我冷漠无情。 C — 16.我果断。 P — 17.我幽默风趣。 P — 18.我喜欢闲逛和无所事事。 S — 19.我不是很有组织性。 P — 20.我更喜欢旁观而不是参与。
2.3.2标准参照分数
内容参照分数 步骤:确定测验所包含的知识和技能的范围; 编造一个能报道测验成绩的量表 掌握分数:只测验被试对一些基本知识和技能 是否掌握,并不需要对被试作进一步的区分, 在这种情况下,只要确定出一个可接受的最低 标准即可,代表该标准的分数叫做掌握分数 正确百分数:被试答对题目的百分比
2.2 分数的合成
分数的合成
组合变量的方法
多重回归:当同时采用几个预测源来预测一个效标, 而这些预测源变量之间又具有互偿性时,多重回归是 最常用来组合分数的模式
在实际应用时,一般2-4个预测源就足以达到最高的预 测正确性 在一个多重回归方程中,每个预测源的权数应该同它 与校标的相关成正比,同它与其他预测源的相关成反 比
心理测量学
大连工业大学 任课教师 郭志峰
第三章 测验信度
3.1 3.2 3.3 3.4 信度的概念 信度的类型 影响信度的因素 测量标准误差
请列举一些你所使用过或接触过的量表
思考: 量表的作用是什么?
你如何解释下述现象?
一个很聪明的孩子,测得智商是80分 一个学习很好的学生,考试成绩为60分 一个人缘很好的人,人际关系测量低于常 模值
3.1信度的概念
二、误差的种类
误差:在测量中与目的无关的因素所产生的不准确的 或不一致的结果
抽样误差:由抽样变动而造成的误差 测量误差:由与测量目的无关的偶然因素引起 的变化无规律的误差,使得多次的测量结果不 一致,这种误差的大小和方向是随机的 系统误差:由与测量目的无关的因素引起的恒 定的有规律的误差,它稳定地存在于每一次测 量中
资料特征的比较.doc
效度的比较.doc
2.3 分数的解释
2.3.1常模参照分数
常模参照分数是把被试的成绩与具有某种特征 的人所组成的有关团体作比较,根据一个人在 该团体内的相对位臵来报告他的成绩 制定常模的步骤:确定有关的比较团体;获得 该团体成员的测验分数;把原始分数转化为量 表分数(该量表分数能把个人分数表示成在这 个团体中的相对位臵)
样本的大小要适当(取样误差与样本大小成反比) 要注意常模的时间性 要将一般常模和特殊常模(地方常模)结合起来
2.3.2标准参照分数
内容参照分数:将测验内容作为比较的标准, 通过测验了解被试对测验内容的掌握程度(成 就测验) 结果参照分数:将外在校标作为比较的标准, 用预期的校标成绩解释测验分数(职业测验)
2.1.3 常模
常模是一种供比较的标准量数,由标准化样本 测试结果计算而来,即某一标准化样本的平均 数和标准差。
2.1.3 常模
常模取样的方法:
㈠随机抽样法:①简单随机抽样②系统抽样③ 分组抽样④分层抽样(能够避免简单随机抽样 中样本集中于某种特性或缺少某种特性的现象。 还可以分为分层比例抽样、分层非比例抽样) ㈡非随机抽样法
2.4.2 测验的应用与管理
测验在理论研究中的应用
收集资料
建立和检验假说 实验分组
2.4.2 测验的应用与管理
心理测验的管理 保密性 科学性
2.4.2 测验的应用与管理
对待测验的正确态度 测验是心理学研究的一种重要方法和作决策的
辅助工具
测验作为一个研究手段和测量工具尚不完善
个人类型测试 了解你的个性类型
C — 21.我发现自己难以宽恕别人。 C — 22.我在短时间能做许多事情。 S — 23.人们说我太喧哗。 M — 24.我易于犹豫和悲观。 P — 25.我不是太有动机。 P — 26.我非常有耐心。 S — 27.我爱说话。 M — 28.我实在不喜欢大的聚会,我愿意只 有几个密切的朋友。 S — 29.我是个热情的人。 C — 30.人们说我是一个非常勇敢的冒险者 C — 31.我对事情有清楚的看法。 P — 32.我喜欢睡觉。
误差变异的来源 时间取样 内容取样 时间与内容取样 内容取样 评分者间的差异
3.3影响信度的因素
测验的长度 测验的难度 被试团体变异性 被试团体能力水平
3.4测量标准误差
一、测量标准误差的定义
课后思考题
1.信度的概念。 2.结合生活中实际,请分析一下测验的误 差现象。
2.1.2 测验的效度
2.3 分数的解释
常模参照分数
常模团体是由具有共同特征的人所组成的一个 群体。如果群体较大,常模团体应是该群体的 代表性取样,称作标准化样本
2.3 分数的解释
确定常模团体的注意事项 群体的构成必须明确界定(用年龄、性别、职业等变量) 标准化样本必须是所要测量群体的一个代表性取样(随机)
取样的过程必须详尽地描述(常模团体的大小、取样策略、取样 时间等)
误差的来源
测验自身引起的误差:主要来源于测验编制过 程中,其中项目取样的影响最大 施测过程引起的误差:测试环境、时间、主试 者、意外干扰、评分记分等
被试引起的误差:应试动机、测验焦虑、测验 经验、练习效应、反应倾向、生理变因
三、信度的多样性和特征的单一性 完全正相关 完全负相关 零相关 皮尔逊积差相关系数:
信度的估计方法
3.同质性信度(Homogeneity Reliability)
同质性指测验的所有题目测量的是同一种心理 特质,表现为各个题目得分之间有较高的相关,
相关越高则同质性越强。
信度的估计方法
3.1分半信度(Split-Half Reliability) 定义:在测验没有复本且只能实施一次的情况 下,可将测验项目分成对等的两半,根据被试
标出符合你个人情况的命题,其他的空出来。 在每一道命题上,不能停留太久,根据自 己的第一反应或第一印象作答。 S — 1.人们说我非常友好。 M — 2.我只有几个朋友,但我们非常密切! C — 3.我是天生的领导者。 P — 4.我宁可节省而不乱花钱。 S — 5.我享受生活! M — 6.我喜欢每个细节都完美。 M — 7.我情绪不定,我早上起床不知今天会 是什么情绪。 M — 8.我发觉很容易批评人与事。
3.2信度的类型
1.再测信度 使用同一测验,对同一组被试,前后施 测两次。两次测验所得分数之间的相关 系数。
例题
A卷:你是一个喜欢热闹的人吗?
1=绝对是 2=是
3=不一定
4=不是
5=绝对不是
B卷:你是一个喜欢安静的人吗?
1=绝对是 2=是
3=不一定
4=不是
5=绝对不是
3.2信度的类型
2.复本信度(Alternate-form raliability) 定义:第一次使用一种测验型式,第二次 使用另一种测验等值,在同一时间测验两 次计算相关系数。
1.效度的定义 效度是指测验的准确性,即测验能够测出他们所 欲测的特质的程度。 2.效度的信度关系 (1)高效度,高信度(2)高信度,低效度(3) 低信度,低效度
效度的估计方法
1966年美国心理学会在《教育心理测验值标准》中将效度分为 三大类:
1.内容效度(Content Validity)
内容效度指测验实际测到的内容与所要测量的内容之间的吻合 程度。
相关文档
最新文档