心理学中的各种信度和效度

合集下载

第五讲 心理学研究的信度和效度

第五讲 心理学研究的信度和效度

第五讲心理学研究的信、效度

长江大学教育科学系严磊

研究设计的主要目标是特高整个研究的科学性水平,即保证研究结果、结论能真实的反映人的心理活动规律和教育规律。信度与效度不但是研究设计应当遵循的标准,而且也是评价研究设计质量乃至整个研究结果科学水平。信度、效度源于心理与教育测验领域,现在心理学者将诶用了测量领域的信度与效度概念,并把研究的信度和效度作为设计与评价各种研究的标准,以提高心理与教育科学中各类研究的客观性、可靠性和科学性。如今,有关研究信度和效度的理论和方法已经为心理、教育研究者普遍接受,成为研究和实验设计的关键,也成为心理、教育研究方法发展的里程碑。

一心理测量的信度和效度射击打靶

1.真分数假设

假设一:在所讨论的问题范围内,真分数不变,亦即个体具有恒定的特质,其分量一定,取值是常数。

假设二:误差是完全随机的。这里有二层意思,一是测量误差是平均数(期望值)为零的正态随机变量;二是测量误差跟被测心理特质即真分数间相互独立。

假设三:观察分数是真分数与误差分数的和。

2.测量的信度

信度(reliability)是指测量结果的稳定性和可靠性程度。

重测信度、复本信度、分半信度、评分者一致性信度

3.测量的效度

一研究的信度

二研究的信度

1.研究信度的概念

研究的信度指研究所的事实、数据的一致性和稳定性程度。一向好的心理与教育研究,其结果必须稳定可靠,即重复研究的结果要保持稳定、一致,否则便可不信。

根据影响信度的误差来源,信度可分为两大类:稳定性和同质性。稳定性指研究结果跨时间、跨情境的一致性。同质性指研究工具本身各项目内容的一致性。举例:用同一思维研究工具在前后相隔较短的时间内测查某一年级的儿童两次,结果发现两次测查结果不一致,第一次测查结果表明被试未达到逻辑思维水平,第二次结果发现他们已经达到逻辑思维水平。

实验心理学期末复习-信度和效度

实验心理学期末复习-信度和效度

信效度

(1)效度:实验是否有效、明确,确定实验的有效性,就是效度。实验研究效度是一项实验所能揭示的事物本质规律的有效程度。反应实验结果的准确性和有效性程度。

主要包括内部效度和外部效度。内部效度和外部效度是互相联系、互相影响的,提高实验内部效度的措施可能会降低其外部效度,而提高实验外部效度的措施又可能会降低其内部效度。这两种效度的相对重要性,主要取决于实验目的和实验的要求。

一般而言,在实验中控制额外变量的程度越大,则对因果关系的测量就越有效。因此,可以在保证实验内部效度的前提下,采取适当措施以提高外部效度。

(2)内在效度:实验的内部效度是指实验中的自变量与因变量之间的因果关系的明确程度。由于研究中有系统误差的存在,自变量和因变量之间固定的明确关系程度变得不明确了,也就是降低了实验研究的内在效度。影响内在效度的因素可能有:生长和成熟、历史(经历)、前测的影响、被试的选择偏性、被试者的缺失、实验程序的不一致(例如台湾繁体字和大陆简体字)、统计回归的影响(向总体的平均水平靠拢的趋势)

(3)霍桑效应和安慰剂效应:混淆自变量效果,从而降低了内部效度

(4)统计回归的影响:在取样时,选取某些特质位于两极端的被试,而这些被试在前后两次测试时出现最高分和最低分的被试其得分向中间回归,即高分组降低分数,低分组被试提高了分数这一自然回归现象。

(5)外部效度:实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。任何造成研究条件更具有特异性的因素都会带来对研究外部效度的损害,这些因素的特异性越强,越有可能导致研究情景与人们日常生活情景的差异性,也就制约了研究结论的可推广性。影响外部效度的因素可能有:实验环境的人为性(模拟研究和现场试验研究)、被试者样本缺乏代表性、测量工具的局限性。

《信度和效度测量》课件

《信度和效度测量》课件

复本信度法的应用:常用于教育、心理、 医学等领域的研究中,如对智力、性格、 健康状况等的测量。
优点:简单易行,易于计算
原理:将测量项目分为两部分, 分别测量,然后计算两部分之 间的相关系数
缺点:不能完全消除测量误 差
应用:常用于问卷调查、心 理测量等领域
原理:通过计算内 部一致性来评估信 度
计算公式:α= (k/(k-1))* (1-Σ(s²)/Σ(s) ²)
效度:测量工具 的有效性和准确 性,确保测量结 果与实际概念相

信度和效度在心 理学研究中的应 用:用于评估心 理测量工具的质 量,确保测量结 果的准确性和有
效性
信度和效度在心 理学研究中的应 用:用于评估心 理测量工具的稳 定性和可靠性, 确保测量结果的 一致性和可靠性
信度:衡量测试 结果的稳定性和 一致性,确保测 试结果的可靠性
概念:测量工具与理论构念之间的 对应关系
缺点:容易受到主观因素的影响
添加标题
添加标题
添加标题
添加标题
优点:能够直接反映理论构念的内 涵和外延
应用:广泛应用于教育、心理等领 域
内容效度:测量内容是否与研究目标一 致
结构效度:测量结构是否符合理论框架
信度效度:测量结果是否稳定可靠
评价效度:测量结果是否符合评价标准
效度:衡量测试 结果是否能够准 确地反映被测者 的真实水平,确 保测试结果的有 效性

信度和效度的类型-社会统计学

信度和效度的类型-社会统计学

信度和效度的类型社会统计学

一、信度

1.信度的定义

信度也叫测试的可靠性,指的是测试结果是否稳定可靠。信度是用来检验人员测评与选拔质量的重要指标,从测评与选拔指标体系的制定,到测评与选拔的整个实施过程,始终都要考虑可靠性,即测评与选拔的信度问题。

【概念剖析】信度即多次测量的一致性。

2.信度的分类

按照衡量测评信度的方法的不同,信度可分为再测信度、副本信度、内在一致性信度、评分者信度等。

①再测信度。再测信度是指用同一套试卷在两个不同时间来测试同一批被测者,这样便获得两组分数,然后计算出两组分数的相关系数。当然,在两次测试中,第二次的测试成绩理应比第一次的高,因为被测者在第二次测试时已经有了进步而且临场经验也更丰富了。但是若该试题是比较可靠的,每个被测者在两次测试中的排名次序应该是基本不变的。

②副本信度。副本信度是指对同一被测者先后进行两次内容相当的测试,然后计算出这两次测试结果间的相关程度(减少了再测信度中前一次对后一次测试的影响,但两次测试间的相互作用依然存在)。

③内在一致性信度。内在一致性信度是指所测素质相同的各测评项目分数间的一致性程度。若被测者在第一个项目中的分数高于他人,在第二个项目中的分数还高于他人,在第三个项目中的分数仍高于他人……且这些测评项目所测评的是同

一素质,那么可以认为测评的结果较可靠。内在一致性信度是通过分析同一测评中各测评项目之间的一致性来分析测评信度,它实质上是一种跨测评项目的一致性。再测信度与副本信度都需要组织两次测评,而内在一致性信度只需进行一次测评,增加了人员测评的可操作性,同时也为实际工作带来了极大的方便。

1、简述量表信度和效度的含义及检验方法。

1、简述量表信度和效度的含义及检验方法。

1、简述量表信度和效度的含义及检验方法。

1.引言

1.1 概述

在心理学和社会科学研究中,量表是研究者收集数据和评估心理现象的常用工具。量表信度和效度是评估量表质量的重要指标,影响着研究结果的可靠性和有效性。

量表信度是指量表测量结果的稳定性和一致性,表示在相同条件下,量表能够得出相似或一致的结果。具有高信度的量表能够在重复测试中获得相似的分数。如果一个量表的信度较低,那么对于同一个人在不同时间或不同测评者之间得到的结果可能会有较大的差异。常见的量表信度检验方法包括重测信度和内部一致性信度。

重测信度是通过对同一受试者在不同时间点进行重复测量来评估量表的信度。该方法通过比较两次测量结果之间的相关性或一致性来确定量表在时间上的稳定性。一种常用的重测信度检验方法是计算测量结果的相关系数,如皮尔逊相关系数或斯皮尔曼相关系数。

内部一致性信度是通过量表中各个项目之间的相关性来评估量表的信度。这种方法可以反映一个量表内部各项是否协调一致,即一致的测量同

一个构念或特质。常见的内部一致性信度指标包括Cronbach's alpha系数和切分半信度。

量表效度是指量表能否准确地测量到所要评估的心理现象或特质,即量表能否有效地反映研究对象的真实状态。具有高效度的量表能够准确地评估所研究的心理现象。常见的量表效度检验方法包括内容效度、构效度和准确度效度。

内容效度是指量表是否全面、完整地涵盖所要评估的内容范围。评估内容效度常常需要通过专家评审和已有文献综述等方法来进行。专家评审可以评估量表的项目是否合理、明确地反映所要评估的特质,从而确保量表的内容效度。

心理测量的信度和效度

心理测量的信度和效度

五、评定者信度(inter-rater reliability)
含义:多名评分者给同一批人的答卷进行评分的一致性程度。 计算及适用范围: 适用于主观评分 可用肯德尔和谐系数进行估计
提高信度的方法
影响因素: 被试、主试、施测情境、测量工具、两次施测间隔时间
提高方法: 1.适当增加测验的长度 2.使所有试题的难度接近正态分布,并控制在中等水平 3.努力提高测验试题的区分度 4.选取恰当的被试团体,提高测验在各同质性较强的亚 团体上的信度 5.主试要严格执行施测规程,严格按标准评分,施测场 地按测验手册布置,减少无关因素干扰
含义:又叫内部一致性系数,指测验内部所有题目之间的一致性程度。 一致性程度高的测验得分之间具有较高的正相关。 计算及适用范围: 库德一理查逊公式(KuderRichardson formula 20,K-R20),适用 于二分法计分题量表 克伦巴赫α 系数(Cronbach' s S α Coefficicient),多重记分法量 表
四、测量的效度
效度(Validity)
即有效性,它是指测量工具或手段 能够准确测出所需测量的事物的程度。 ►效度是一个相对的概念 ►效度是测量的随机误差和系统误差的 综合反映 ►判断一个测量是否有效要从多方面搜 集证据
来自百度文库
信度与效度的关系
信度是效度的必要而非充分条件 测验的效度受信度制约

第四章 心理测验的信度与效度

第四章 心理测验的信度与效度

4
2 5 6 3 1
5
3 4 6 2 1
14
7 13 18 8 3
25
2
3
90
81
72
63
60
54
4
5 6
60
84 96
60
75 90
42
63 66
R
i
=14+7+13+18+8+3=63
Ri2 =142+72+132+182+82+32=811
由题意知 K=3, N=6, 将上述值代入公式有:
33
2

例1,已知WISC-R的标准差为15,信度系数为 0.95,对一名12岁的儿童实施该测验后,IQ为 110,那么他的真分数在95%的可靠度要求下, 变动范围应是多大?
34
S E S x 1 rxx
X t 110
= 15 1 0.95 3.35
110 1.96 3.35 X 110 1.96 3.35
质方面没有获得的更多的学习和训练。
易受练习和记忆的影响,两次测试的时间间隔要适当,
一般是2~4周较宜,间隔时间最好不超过6个月。
13
(二)复本信度
1、定义:又称等值性系数,是以两个等值但题目不同的

信度和效度教资

信度和效度教资

信度和效度教资

一、信度

1.定义

信度是指测量结果的可靠性和一致性。在教育心理学领域,信度通常被视为评估、测试或量表的重要质量标准之一。

2.影响信度的因素

(1)样本:样本的大小和代表性是影响信度的关键因素。如果样本过小或不具有代表性,那么测试结果的可靠性将会受到质疑。

(2)方法:评估或测试的方法也是影响信度的因素。不同的方法可能具有不同的误差和偏差,因此需要仔细考虑方法的可靠性和有效性。

(3)环境:测试环境的不同也可能影响信度。例如,在考试环境中,考生之间的相互影响、考场规则等因素都可能影响测试的可靠性。

3.提高信度的方法

(1)选择具有代表性的样本:选择更大、更具代表性的样本可以提高测试的可靠性。

(2)使用多种方法进行评估:使用多种方法进行评估可以降低单一方法可能带来的误差和偏差。

(3)创造稳定的测试环境:创造稳定的测试环境可以减少环境因素对测试结果的影响。

二、效度

1.定义

效度是指测量结果的准确性和有效性。在教育心理学领域,效度通常被视为评估、测试或量表的质量标准之一,它表示该评估或测试能否真实地反映出受试者的能力或特征。

2.影响效度的因素

(1)目的:评估或测试的目的会影响效度。如果测试的目的与实际需要不符,那么测试结果的效度就会受到影响。

(2)方法:评估或测试的方法也是影响效度的因素。不同的方法可能具有不同的误差和偏差,因此需要仔细考虑方法的准确性和有效性。

(3)内容:测试的内容也是影响效度的因素。如果测试内容不全面或不准确,那么测试结果的效度就会受到影响。

3.提高效度的方法

(1)明确测试目的:明确测试的目的可以确保测试更加准确地反映出受试者的能力或特征。

心理测量学真分数与信度和效度

心理测量学真分数与信度和效度
随着实验观测次数的增加,随机误差的变化会呈现一定的规律性—— 它总是围绕被观测的真正值(又称真分数,一般用多次观测的平均值来表 示,真正值是无法测量到的)波动,随机误差的算术平均数随着观测次数 的增加而逐渐减少以至于趋近于零。
系统误差
就是观测过程中服从确定规律性的误差。由于实验条件不同,造成不 同的有一定规律性的误差属于这类误差。心理学实验中,不同的实验方 法、不同的被试样本等都会对实验结果产生规律性的影响。这类误差不 能通过增加实验次数消除。如果需要可以通过实验设计加以消除,这一 问题我们将在后边的变量处理和实验设计中讨论。
③、意外干扰
在测验环境复杂,特别是当受试人数较多时,容易发生出乎意料的干扰或分心事件。 例如:停电、有人生病、有人作弊、计时表停了、临时发现题目或作答纸张印刷不清或装 订错误等,无论哪种情况都会引起不安和扰乱,导致成绩不准确、不一致。
④、评分计分
评分不客观以及计算登记分数出错也是常见的误差。一般选择题的评分教为客观。而 问答题、论文题等自由反应型的题目,评分标准很难掌握,加之阅卷者的偏好个不相同, 因而难以保证分数的一致性。不仅各教师间有此差异,即使是同一教师一次评许多卷,受 情绪疲劳、外界干扰、卷面整洁、考试前后位置引起的对比效应以及对学生成见的影响, 标准也可能不统一,甚至同一张试卷隔一段事件再评,前后给分也可能不一致。至于学校 间、地区间的差别就更大了。

信度、效度、难度、区分度

信度、效度、难度、区分度

信度、效度、难度、区分度

在全国统考教师资格考试中,对于备考的考生而言,无论是教育学还是心理学都存在一些学习方面的难点,这对于自己备考的考生而言是非常困难的。中公讲师结合自己的教学经验与深厚的专业知识,将中学《教育知识与能力》的教学难点进行专题讲解,希望能够对各位考生的笔试备考提供一些帮助。

1、测量指标的含义

信度、效度、难度、区分度是中学教学部分的考试内容,主要是用来检验测验质量本身的重要指标。所谓信度指的是多次测量结果额一致性与稳定性。它本身强调是测量结果是不是一样的,例如:小明第一次测量得分是80分,第二次测量得分也是80分,说明两次结果一样,则说明两次测量的信度高。反之,第一次测量得分80分,第二次测量得分40分,两次结果不一样,说明信度低。所谓效度指的是测量的正确性,是指一个测量所要测量的结果的程度。效度所关注的是测量到对象多少程度?比如:假如小明本身的真实成绩是80分,第一次测量得分是正常发挥得分是80分,说明本次测量的效度高,如果失常发挥,高于80分或者低于80分,本次测量的效度低。所谓难度主要指的是测量的难易程度,测量的难度系数值的范围是0—1,难度系数值越小,则反映试卷难度越大,难度系数值越大,则反映试卷难度越小。所谓区分度,指的是测量对不同考生的区分程度,也就是可以理解为通过测验能够将好的选出来,差的筛下去。比如高考的就是区分度很高的测验,否则就难以将好生、差生进行区分。

2、测量指标之间的关系

信度与效度的十大关系:

信度高,效度不一定高(或效度不一定低)

信度低,效度一定低

简述信度与效度的概念

简述信度与效度的概念

简述信度与效度的概念

关于信度和效度的概念,是高考试题中经常涉及到的内容。我们首先来了解一下什么是信度和效度。

从心理学角度看,信度是指某一测验能够测量出其所要测量的东西的程度,即能回答“是什么”的程度;效度则是指该项测验有效地测量了所要测量的东西的程度,即能回答“有什么”的程度。

在心理测验中,信度和效度相辅相成,互相制约。没有信度,效度也就失去了意义;反过来,如果没有效度,信度也将会受到影响。两者之间不存在矛盾,但又不可偏废。具体地说,信度和效度的关系是:(1)测验的信度高,则测验的效度也高; (2)测验的信度低,则测验的效度也低; (3)测验的效度高,则测验的信度也高; (4)测验的效度低,则测验的信度也低。效度比信度更能反映测验的优劣,但如果信度差,测验的效度高,也会掩盖真实情况,而且效度高并不等于信度高。例如,甲学校组织学生进行测验,有96%的学生得A,有90%的学生得B,则这次测验的信度为96%,效度为90%,即很好,能代表全校大多数同学的水平。又如,乙学校组织学生进行测验,有96%的学生得A,有93%的学生得B,则这次测验的信度为93%,效度为92%,即一般,能代表部分学生的水平。

信度是指测验结果的稳定性。效度是指测验的有效性。信度和效度这两个概念虽然没有明确的界限,但在测验时,由于两者之间的密切关系,往往用效度代替信度。从目前世界各国发展趋势来看,心理测验越来越重视测验的效度。所谓信度,是指测验分数的稳定性、一

致性和可靠性。一份好的测验应该是内容效度和形式效度的统一。内容效度是指测验题目对知识内容的覆盖面,即测验对特定内容的测量程度,通常以所得分数在正常分布范围之内的百分比来表示。它反映的是一项测验能测量其所要测量内容的程度,也就是测验对所测内容的代表性。

信度效度检验方法

信度效度检验方法

信度效度检验方法

信度和效度是心理测量的两个重要属性。信度指的是测量工具在多次使用中能够稳定地得出相似的结果,即测量结果的一致性和稳定性。效度指的是测量工具能够准确地反映所要测量的概念或特性。

以下是常用的信度和效度检验方法:

1. 重测法(Test-Retest Reliability):通过对同一群体进行两次测量,比较两次测量结果的一致性。可以计算出相关系数来评估测量工具的信度。

2. 分割半法(Split-Half Reliability):将测量工具分为两部分,分别对同一群体进行测量,然后比较两部分的得分。可以计算出相关系数来评估测量工具的信度。

3. 内部一致性分析(Internal Consistency Analysis):常用的方法有Cronbach's alpha系数和Kuder-Richardson公式。通过评估测量工具中各个项目之间的相关程度,来评估其内部一致性。

4. 交叉验证法(Cross-validation):将样本随机分为两组,一组用于构建模型,另一组用于验证模型。通过比较两组的测量结果,评估测量工具的效度。

5. 效标关联法(Criterion-related validity):将测量结果与已知标准或其他测

量工具进行比较,来评估测量工具的效度。常用的方法有相关系数和回归分析。

6. 内容效度分析(Content Validity Analysis):评估测量工具中各个项目是否涵盖了所要测量的内容领域。可以通过专家评估或主观判断来进行分析。

7. 结构效度分析(Construct Validity Analysis):评估测量工具是否能够准确地反映所要测量的概念结构。常用的方法有因子分析和验证性因子分析。

信度和效度经典例子

信度和效度经典例子

信度和效度经典例子

一、信度经典例子:

1. 在心理学研究中,使用重复测量设计来测试某种变量的稳定性和一致性。研究者可以使用同一套问卷两次或多次测量被试者的特征或行为,比较不同时间点的测量结果。如果测量结果在不同时间点之间保持一致,那么可以认为该测量工具具有较高的信度。

2. 在医学领域,为了评估一种新的医疗技术的准确性和可靠性,研究者通常会进行多次实验,并与已知的黄金标准进行比较。如果新的医疗技术的结果与黄金标准的结果高度一致,那么可以认为该技术具有较高的信度。

3. 在教育评估中,为了确保测量工具的信度,研究者可以使用分半法来检测问卷或测试题目的内部一致性。研究者将问卷或测试题目分为两个部分,然后比较两部分的测量结果。如果两个部分的测量结果高度一致,那么可以认为测量工具具有较高的信度。

4. 在市场调研中,为了确保问卷调查的信度,研究者可以通过复制抽样的方式来检验调查结果的稳定性。研究者可以在不同的时间点或不同的地区进行相同的调查,并比较不同样本的调查结果。如果不同样本的调查结果高度一致,那么可以认为问卷调查具有较高的信度。

5. 在心理疾病诊断中,为了确保诊断工具的信度,临床医生可以使用测试-重测法来评估诊断结果的一致性。医生可以在不同的时间点对患者进行诊断,并比较不同时间点的诊断结果。如果诊断结果在不同时间点之间保持一致,那么可以认为诊断工具具有较高的信度。

6. 在社会科学研究中,为了确保采访调查的信度,研究者通常会使用多个访谈者对同一组被访者进行独立的采访。然后比较不同访谈者的采访结果,如果不同访谈者的采访结果高度一致,那么可以认为采访调查具有较高的信度。

心理测量-信度与效度

心理测量-信度与效度

(二)标准参照测验的信度
作为心理与教育统计,都是以个别差异的 模式为基础的,即适合常模参照测验。在 教育测验种有很多是标准参照测验(掌握 测验),统计方法还在探索中,还不成熟。 一般以两次测验的通过率差异来判断,当 然,前提是被试同质
(三)分测验的信度
整个测验信度高,不能说明各分测验的信度 也高,要保证各分测验有高信度。
(二)确定内容效度的方法
1、专家判断法
要件:定义好的总体、划分好细目表、确定 好每个题目要测验的内容与技能、准确的评 定量表
2、相关法
两个独立取样的测验复本去测同一组被试, 如果相关高,一般可以认为具有高效度,但也 有可能是同时偏向某个方向造成虚假效度。如 果相关低,至少有一个是低内容效度的。
3、再测法
心理测量
信度与效度
第二节 信度(reliability)
一、定义
1、信度是指测量的一致性程度,或者说是测验分数的可靠性
程度
2、统计定义:
X=T+E
(1)信度是观测分数与真分数的相关
(2)真分数的变异在观测变异中所占的比例
(3)平行测验之间的相关
r XT
s2
T
r
s2 X
X1X 2
二、信度的种类
1、再测信度 同一测验对同一组被试的先后两次测量之间的相关
度。如编制的量表

信度与效度

信度与效度
测验分数可能在某一方面一致性很高,在其他 方面一致性很不理想。
3)信度的估计是完全采用统计方法的。
要估计测验的信度,必须以所编制的测验对一 组较具有代表性的样本实施一次或数次测验, 然后求测验结果的一致性
信度系数
大部分的信度指标都以相关系数表示,即用同 一被试样本所得的两组资料的相关作为测量一 致性的指标,称作信度系数。
有时一个测验需要有几种信度系数,这样我们就能 把总分数的变异数分成不同的分支加以考察。
影响信度的因素
信度多高是好的?
一般情况下,标准化或学绩测验信度应在0.9以上 人格测验的信度应该0.8以上 教师自编学绩测验能达到0.6以上,就可以被认为
是较高信度了 低于0.6的信度估计一般被认为不可接受。
从操作上来讲,效标可以是多种事物,没有规定说 一个效标应该由什么构成。
测验分数、一个具体的行为、精神病学的诊断、培训 的费用、缺勤率等
效标的选取要满足几个条件
相关性 有效性 无污染
效标关联效度可分同时效度和预测效度。
同时效度指测验分数与当前的效标之间的相关程度, 通常与心理特性的评估和诊断有关,常用的效标资料 包括在校学业成绩、教师评定的等级、临床检查、其 他同性质测验的结果等;
一般要求在成对的受过训练的评分者之间平均 一致性达0.90以上,才认为评分是客观的。
当多个评分者评定多个对象,并以等级法记分 时,可采用特定公式去估计评分者信度。

心理学中的各种信度和效度

心理学中的各种信度和效度

路漫漫其修远兮,吾将上下而求索-百度文库

心理学中的各种信度和效度

一、信度

所谓信度,指的是测量结果的稳定性程度,其操作定义是,信度乃是一个测验X与它的任意一个“平行测验X,的相关系数。无关因素、测验的长度、测验试题的区分度、被试团体的代表性都会影响信度。

(一)重测信度

1、定义:利用同一量表,让同一被试群体在不同时间两次施测之后的相关值。这一信度值表示的是测验结果的稳定性,故也称之为稳定性系数。

2、形式:施测一一经过适当时间一一再施测

3、举例:假设有一份主观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,

结果如下表所示,求该测验的重测信度。

4、使用的前提条件

(1)所测量的心理特质必须是稳定的。

(2)遗忘和练习的效果基本上互相抵消。

(3)在两次施测的间隔期内,被试在所要测查的心理特质方面没有更多的学习和训练。

5、注意事项

(1)有些测验不宜采用重测法估计信度,如测量推理和创造力的测验。那些不易受重复使用影响的测验才能用再测法估计信度。如感觉运动测验、人格测验。

(2)两次测验间隔的时间要适当,并注意提高被试的积极性

(3)测验手册中报告重测信度时应说明两次施测的间隔,以及在此期间内被试的有关经历

(4)时间间隔的把握:适宜时间间隔依照测验目的、性质及被试特点而定,可以是几分钟甚至几年。例如对于年幼儿童的间隔要小;年长群体的间隔可大。但智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月,既不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘。

6、重测信度的评价:

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

心理学中的各种信度和效度

一、信度

所谓信度,指的是测量结果的稳定性程度,其操作定义是,信度乃是一个测验X与它的任意一个“平行测验X'的相关系数。无关因素、测验的长度、测验试题的区分度、被试团体的代表性都会影响信度。

(一)重测信度

1、定义:利用同一量表,让同一被试群体在不同时间两次施测之后的相关值。这一信度值表示的是测验结果的稳定性,故也称之为稳定性系数。

2、形式:施测——经过适当时间——再施测

3、举例:假设有一份主观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,结果如下表所示,求该测验的重测信度。

4、使用的前提条件

(1)所测量的心理特质必须是稳定的。

(2)遗忘和练习的效果基本上互相抵消。

(3)在两次施测的间隔期内,被试在所要测查的心理特质方面没有更多的学习和训练。5、注意事项

(1)有些测验不宜采用重测法估计信度,如测量推理和创造力的测验。那些不易受重复使用影响的测验才能用再测法估计信度。如感觉运动测验、人格测验。

(2)两次测验间隔的时间要适当,并注意提高被试的积极性

(3)测验手册中报告重测信度时应说明两次施测的间隔,以及在此期间内被试的有关经历(4)时间间隔的把握:适宜时间间隔依照测验目的、性质及被试特点而定,可以是几分钟甚至几年。例如对于年幼儿童的间隔要小;年长群体的间隔可大。但智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月,既不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘。

6、重测信度的评价:

(1)优点:能够提供有关测验结果是否随时间而变异的资料,可作为预测受测者将来行为表现的依据。

(2)缺点:易受练习和记忆的影响,前后两次施测间隔的长短必须要适度。

(二)复本信度

1、什么是复本:任何测验只是所有可能题目中的一份取样,所以可编制许多平行的等值测验,叫做复本。复本等值要符合下列条件:

(1)各份测验测量的是同一种心理特性。(2)各份测验具有相同的内容和形式。

(3)各份测验的题目不应重复。(4)各份测验题目数量相等,难度和区分度大体相同。(5)各份测验的分数分布(平均数和标准差)大致相等。

(6)复本编好后,应再测一次,以确保各份测验的等值。

2、复本信度定义:两个复本施测同一被试群体,求其相关。

(1)等值性系数:同时连续施测,反映内容变异。形式:复本A—同时—复本B

(2)稳定与等值性系数是对信度最严格的检验,反映的是“内容变异+时间变异”的共同作用效果。形式为:复本A—适当时间—复本B

3、使用前提条件:构造出两份或两份以上真正平行的测验,被试要有条件接受两个测验。

4、复本信度的评价

(1)优点:可以在一定程度上避免重测法的缺点

(2)缺点

①只能减少而不能排除练习和记忆的影响。

②第二个测验只改变了测验的具体内容,已经掌握的解题原则容易迁移到同类问题。

③对于许多测验来说,建立复本十分困难。

(三)分半信度

1、定义:在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。有时为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。

2、校正:分半信度只是半个测验的信度,须用斯皮尔曼-布朗公式校正: r xx=2r hh/(1+r hh) 且两半测验分数的变异数相等时才能使用。

(四)同质性信度(内部一致性信度)

1、定义:同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。同质性信度也叫内部一致性系数,是指测验内部所有题目间的一致性程度,一个测验所测内容或特质的相同程度。

2、注意事项:同质测验分数的意义比较明确,但是,单独的同质性测验不能预测一个异质

的行为或心理特性。现行的许多心理测验都是异质的,不过它们多半是由若干个相对同质的分测验或分量表所组成,每个分测验或分量表只测量一个方面的特征。这样,当把分数组合起来后便可以做出明确的解释。

3、使用范围:学绩测验可不考虑同质性。同质性信度与结构效度密切相关。

4、计算方式:一般采用数据统计软件,克隆巴赫系数最为常用。

(五)评分者信度

1、定义评分者信度是指不同评分者之间在测验结果计分上的一致性。在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高。

2、计算方法:最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。如果评分者在二人以上,而且又采用等级记分时,就需要用肯德尔和谐系数来求评分者信度。

(六)对信度系数计算的评价

1、在一般情况下,间隔施测的复本信度最低,因为很多因素有机会影响到分数。

2、校正过的分半相关,因为影响的因素少,所得的信度估计为最高。

3、稳定与等值性系数是对信度最严格的检验,反映的是“内容变异+时间变异”的共同作用效果。

(七)信度的影响因素和提高信度的方法

1、影响因素:被试、主试者方面、施测情景方面、测量工具方面、两次施测得间隔时间;

2、提高信度的方法

(1)适当增加测验的长度:虽然增加题目可以提高信度,但并非多多益善。增加测验长度的效果遵循报酬递减率,测验过长是得不偿失的,有时还会引起被试的疲劳和反感而降低可靠性,还要注意一点的是,只有当新题目是与原题目选自同一总体,即新题目与原题目具有同质性时,增长测验才能改进信度。

(2)使测验中所有试题的难度接近正态分布,并控制在中等水平。

(3)努力提高测验试题的区分度

(4)选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。

(5)减少无关因素的影响。

相关文档
最新文档