第五章信度

合集下载

信度名词解释

信度名词解释

信度名词解释
信度是指测验结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。

信度系数愈高即表示该测验的结果愈一致、稳定与可靠。

系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。

反之,随机误差可能导致不一致性,从而降低信度。

信度即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。

从另一方面来说,信度就是指测量数据的可靠程度。

信度的估计
在对问卷的信度进行估计之前,需要通过采用适当的量表(如Likert 量表)将问卷中的各类主观的或客观的备选答案转化为数字形式,然后在此基础上进行问卷评分(包括单项评分、相关题目分组评分和总评分等)。

信度分析的常用具体方法有重测信度、复本信度
重测信度
重测信度也称为再测信度,是对同一组被调查人员采用相同的调查问卷,在不同的时间点先后调查两次,两次调查结果之间的差异程度。

重测信度反映了随机误差的影响。

复本信度
复本信度又称为等值性系数,是等值性信度的一种,指问卷调查结果相对另一个非常相同的问卷调查结果的变异程度,是对同一组被调查人员运用两份内容等价但题目不同的问卷进行调查,然后比较两组数据的相关程度。

心理与教育测量学 戴海琦 第三版 重点问答题及答案

心理与教育测量学 戴海琦 第三版 重点问答题及答案

第一章、心理测量概述1、心理测量的含义、特点;测量的含义;要素;以及测量的量表(1)心理测量的含义:依据一定的法则,对人的心理特质进行定量描述的过程。

(2)心理测量的特点–间接性:与物理的直接测量不同,从外显行为推测,以间接了解人的心理属性;–相对性:测量的结果是与其所属团体比较而言。

–客观性:即测验的标准化,是对一切测量的基本要求。

(3)什么是测量:测量是根据法则给事物分派数字(S.S.Stevens)事物:测量对象,在心理测量中,想测量的当然是心理能力和人格特点;数字:代表某一事物或事物某一属性的量;法则:测量所依据的规则和方法。

(4)测量的要素:参照点:①测量工作中测量对象的数量的固定原点②绝对参照点:以绝对的零点作为测量起点,如长度/高度③相对参照点:相对零点,如温度[水冰点]、海拔[海平面]单位①理想的单位一是要有确定的意义,不能有不同解释②其次应有相同的价值,即两个单位点之间差异相等。

(5)测量的量表:量表:任何可以使事物数量化的值或量的渐进系列。

①命名量表:数字仅仅代表分类,无任何意义;不可比较,如男女②顺序量表:可比较,没有相同单位和零点,不能加减;如名次③等距量表:可比较,有相同单位无绝对零点,可加减,不可乘除;适用多种统计方法:平均数、标准差等,如温度④比例量表:最理想的量表,有等距的的单位和绝对零点,有倍数关系;如年龄。

2、什么是心理测验,如何理解心理测验?心理测验的类型;心理测量的功能;(1)什么是心理测验:心理测验实质上是行为样本的客观的和标准化的测量。

①行为样本:有代表性的题目②标准化:测验的编制、实施、计分和分数解释的一致性。

③难度的客观测量:测验的编制、实施等过程中减少主试和被试的随意性程度即标准化,测验的难度水平应确定④信度:测验结果的一致性⑤效度:测验结果的有效性和正确性。

(2)、心理测验的类型:①测验对象分:智力测验、能力倾向测验、成就测验、人格测验②按测量方式分:个别测验和团体测验③按测验材料性质分:文字测验和非文字测验④按测验功能分:成就测验与预测测验,难度测验与速度测验,描述测验与诊断测验。

信度的分类及影响因素

信度的分类及影响因素

信度的分类及影响因素
信度是指度量工具测量结果的准确性和一致性的程度。

信度可以分为内部一致性信度和测试再测信度两种类型。

内部一致性信度是指度量工具中各个测量项之间相互关联的程度,如Cronbach’s α系数。

测试再测信度是指在同一样本中,使用同一度量工具测量两次时,两次测量结果之间的相关性,如Pearson相关系数。

影响信度的因素包括:
1. 测量工具的可理解性:度量工具的指导语言应该明确、清晰,避免难以理解的术语和双关语。

2. 测量工具的一致性:度量工具中各个测量项应该相互关联,能够共同衡量所要度量的概念。

3. 测量工具的稳定性:度量工具的结果应该是稳定的,即在同样的条件下多次测量结果应该相似。

4. 测量工具的可信性:度量工具应该是可靠的,即在不同的测试条件下也能得到相似的测量结果。

5. 评估者的准确性:评估者在使用度量工具进行测量时应遵循测量工具的使用说明,准确地记录和解读测量结果。

6. 受测者的回答偏倚:受测者可能因为种种原因而产生回答偏倚,如回避问题、社会期望等,这些因素都可能影响测量结果的信度。

7. 测量工具的时间间隔:如果两次测试的时间间隔太短,受测者可能记忆仍然活跃而导致结果相关性较高;如果时间间隔太长,受测者可能发生变化,导致结
果相关性较低。

综上所述,信度的分类包括内部一致性信度和测试再测信度,影响信度的因素包括测量工具的可理解性、一致性、稳定性和可信性,评估者的准确性,受测者的回答偏倚以及测量工具的时间间隔等。

信度的概念及影响因素

信度的概念及影响因素

信度的概念及影响因素信度是指测量工具能够稳定且准确地度量出同一变量的能力。

在研究中,信度是一个重要的概念,因为它关乎到测量工具的可靠性和稳定性,直接影响到研究结果的有效性和可信度。

本文将介绍信度的概念,并探讨影响信度的因素。

信度可以分为两个维度:内部一致性信度和稳定性信度。

内部一致性信度是指测量工具各个项目内部之间的一致性程度,即项目之间的相关性。

常用的内部一致性的测度指标包括Cronbach's alpha系数和Kuder-Richardson系数。

稳定性信度是指测量工具在时间稳定性上的一致性程度,即同一测量工具在不同时间点上的测量结果相似性。

常用的稳定性测度指标包括测试-重测法和等价测量法。

影响信度的因素有以下几个方面:1.测量工具本身的特性:首先,测量工具的设计和构建对信度有重要影响。

一个好的测量工具应该是清晰、明确、简洁、明白易懂,避免双关语和含糊不清的项目。

此外,测量工具的项目应该全面覆盖所要度量的概念,并且应该具有较高的区分度,即能够区分不同水平的被试者。

2.测量过程的标准化和规范化:在进行测量时,需要保证测量过程的标准化和规范化,以确保测量的稳定性和一致性。

例如,对于问卷调查,可以提供详细的指导说明,统一被试者的测量环境和测量时间,并确保测量工具的正确使用。

3.受试者的特点:被试者的特点也会影响到测量工具的信度。

例如,被试者的理解能力、认知水平、态度和动机等因素,都可能影响到被试者对测量工具的理解和回答方式。

在实际研究中,需要针对被试者的特点进行合理的控制和筛选,以减少个体差异对信度的影响。

4.测量工具的长度和复杂性:测量工具的长度和复杂性对信度也有一定的影响。

一般来说,测量工具的长度越短,被试者填写的时间越短,从而减少了测量误差的可能性,提高了信度。

此外,测量工具的复杂性也会影响被试者的理解和回答方式,进而影响到信度。

5.样本的特点:样本的特点也可能对信度产生影响。

例如,样本的大小和多样性,如果样本过小或者样本之间的差异过大,可能导致测量结果的不稳定性和不一致性,影响到信度。

信度的种类和内涵心理学解释

信度的种类和内涵心理学解释

标题:信度的种类和内涵心理学解释引言信度是心理测量学中一个重要的概念,用来评估测量工具或者测量结果的稳定性和一致性。

在心理学研究中,信度是确保测量结果可靠和准确的关键因素之一。

本文将介绍信度的种类和内涵,并提供心理学解释。

一、信度的概念和意义1.1 信度的定义信度是指测量工具或者测量结果的稳定性和一致性程度。

它反映了测量工具或测量结果中随机误差的程度。

1.2 信度的意义信度是心理学研究中至关重要的概念,它保证了研究的可信度和准确性。

如果测量工具或者测量结果的信度较高,研究者可以更有信心地使用这些工具进行数据收集和分析,并得出可靠的结论。

二、信度的种类2.1 内部一致性信度内部一致性信度是指测量工具内部各项指标或题目之间的相互关联程度。

常用的内部一致性信度指标包括Cronbach's alpha 系数和Kuder-Richardson公式20。

2.2 测试-重测信度测试-重测信度是指同一测量工具在不同时间点上的测量结果之间的相关性。

通过重复测试同一受试者,可以评估测量工具的稳定性和一致性。

2.3 平行形式信度平行形式信度是指不同但具有相似测量目标的测量工具之间的相关性。

研究者使用不同的测量工具来测量同一概念,通过比较它们的结果相关性来评估平行形式信度。

2.4 交叉信度交叉信度是指不同的评分者或评分项目对同一对象进行评分时的一致性程度。

它常用于评估客观性测量工具,例如问卷调查中的主观题。

三、信度的计算方法3.1 相关系数法相关系数法是最常用的计算信度的方法之一。

通过计算两个变量(例如两次测量结果)之间的相关性来评估信度的程度。

常用的相关系数包括皮尔逊相关系数和斯皮尔曼相关系数。

3.2 内部一致性信度的计算方法内部一致性信度可以使用Cronbach's alpha系数或Kuder-Richardson公式20来计算。

这两种方法可以评估测量工具内部各项指标或题目之间的相互关联程度。

3.3 直接比较法直接比较法是通过比较不同测量工具或不同评分者的结果来评估信度。

信度的主要估计方法

信度的主要估计方法

信度的主要估计方法信度是指测量工具所提供结果的稳定性和准确性的度量。

在心理学和教育领域中,信度是评估测量工具的重要指标,因为一个测量工具只有在具有足够的信度的情况下才能得到可靠和有效的结果。

信度的主要估计方法有内部一致性信度、重测信度和内部一致性信度。

内部一致性信度是指在测量工具中各项之间相关关系的程度。

在研究中,内部一致性信度通常通过克伦巴赫(Cronbach)α系数来进行估计。

克伦巴赫(Cronbach)α系数是根据受试者回答多组题目的结果计算得出的一个值,值的范围是0到1,数值越接近1代表内部一致性越高。

一个测量工具的内部一致性信度越高,说明测试结果越稳定和可信。

重测信度是指同一个测量工具在不同时间点或条件下得到的结果之间的一致性。

重测信度通过计算同一组受试者在两个或多个不同时间点或条件下得到的分数的相关性来进行估计。

通常,Pearson相关系数或Spearman秩相关系数被广泛应用于测量重测信度。

如果两次测试的结果高度相关,说明测量工具具有较高的重测信度。

内部一致性信度是指测量工具中各项之间相关关系的程度。

在内部一致性信度中,研究者通常使用一致性检验或因子分析来估计测量工具的信度。

通过一致性检验可以检测各项之间的相关性,从而评估测量工具的内部一致性。

因子分析则旨在探究测量工具中各项的因素结构,通过因子载荷来评估不同因素对总体得分的贡献程度,从而确定测量工具的信度。

除了以上提到的三种主要估计方法外,还有其他一些方法可以用来评估测量工具的信度。

例如,使用分割半信度来评估测量工具的内部一致性,该方法通过将测量工具的一半项与另一半项分开,然后计算它们之间的相关性来估计信度。

此外,还可以使用容纳性或等效信度来评估测量工具的信度,该方法通过比较不同版本或形式的测量工具的结果来评估其一致性。

总的来说,信度是测量工具的重要属性,对于正确评估个体或群体的特质和行为至关重要。

研究者应该根据研究目的和测量工具的特点选择合适的方法来估计信度,并确保所使用的方法能够提供可靠和有效的结果。

第五章信度

第五章信度

四、同质性信度
1.含义
同质性信度(homogeneity reliability), 也叫内部一致性系数,是指测验内部所有题 目间的一致性程度。可弥补分半法的不足。
(★)
2.计算及适用范围 基本公式: rkk = K rij / [ 1 +(K - 1)rij ] K为测验项目数 r ij是项目间相关系数的平均数。
复本信度(间隔施测)
分半信度 同质性信度 评分者信度
时间与内容取样
内容取样 内容取样和内容的异质性 评分者间的差异
第五节 影响信度系数的因素
一、影响因素 除被试、测验内容、施测情景外,影响信度系数的因 素还有: (一)分数分布的影响 分数分布范围越宽,信度系数就越高。被试团体同质 性水平 同质性越高(个体差异越小)→分数分布范围小→ 信度越低
概化理论的提出
克龙巴赫(Cronbach)等率先提出了概化理论 (Generalizabillity Theory )的基本框 架; 运用对方差或协方差分量分解的方法,将测 验情景中的各类误差进行分解和控制,实现 了对经典测量理论的扩展; 用于评分者信度的估计、临界分数误差估计、 测验分数的推广性和标准参照测验的信度研 究中。
库德-理查逊公式 KR20公式: rxx = [ K /(K - 1)] [ 1-(Σpiqi)/ Sx2 ] pi为答对第i题的人数的比例;qi为答错第i题的 人数的比例;K为题目数, Sx2为测验总分 的变异。 适用于:已知各项目的难度
KR21公式: rxx = [ K /(K - 1)] [1 -(K p q )/ Sx ] =[K Sx2-X(K-X)]/(K-1) Sx2 适用于:各项目难度相近的情况
பைடு நூலகம்

五章心理测量的信度

五章心理测量的信度

三、等值稳定性系数
等值稳定性系数是用两个平行的(等值的)测 验,间隔适当时距施测于同一组被试得到两组 测验分数,求这两组测验分数的相关,其相关 系数就是等值稳定性系数。
等值稳定性系数的模式是:
测验A 适当时距 测验B
计算方法同稳定性系数和等值性系数。
等值稳定性系数也是采用复本对被试施测,但 等值性系数的测验要求两次测验的时间间隔尽 可能短,而计算等值稳定性系数的两次测验却 要求有一个适当的时距。
(1)计算出每个应试者的奇数题总分(X1)和 偶数题总分(X2),见表5-3。

被试
分 1 2 3 4 5 6 7 8 9 10
X1 38 37 38 41 40 36 38 39 40 35
X2 37 37 36 39 39 34 38 39 39 36
采用分半信度应注意以下几个问题:
(1)若用分半法时,以按奇数题和偶数题分 半为宜。
复本信度的模式是:复本A 最短时距 复本B
例3:假设用A、B两型创造力复本测验对 初中一年级10个学生施测。结果见表5- 2。请同学们自己计算。
表5-2 某创造力复本测验测试结果

被试
验 1 2 3 4 5 6 7 8 9 10
X1 20 19 19 18 17 16 14 13 12 10
2

SE
,即
X ±1.96 SE的范围之内,也可以写成X
-1.96SE T X+1.96 SE,SE则用公
式5-4代入。或有5%的可能落入这范围
之外。这实际上也表明了再测时分数改
变的可能范围。
例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95% 的可靠度要求下,变动范围应是多大?

问卷的信度和效度

问卷的信度和效度
一是产生于问卷测验过程中的误差,称为测量误差(meas-urement error),也称为随机误差(random error);
二是由问卷的质量造成的误差,称为系统误差(system error)。与两类误差相对应,在问卷测验结果分析中引入了信度(reliability)和效度(validity)的概念,信度和效度是衡量问卷整体质量的重要指标,一份好的问卷应同时具有较高的信度和效度。
2、解释问卷分数解释问卷测验的分数包括两个方面的内容:一是解释问卷测验的个人分数;二是比较问卷测验分数的差异。
(1)解释个人分数:实际问卷中,问卷者往往希望通过一次问卷了解答卷者的真实分数。因为存在测量误差,我们只能根据已有信息答卷者的真实得分进行估计。根据数理统计知识,我们可以采用区间估计的方法,利用答卷者的实得分数估计其真实得分:
1、在相同条件下所得问卷测验结果的一致程度。
2、不同研究者用同一种问卷同时测验所得结果的一致程度。
3、同一研究者用同一种问卷在不同时间内测验所得结果的一致程度。
4、同一答卷者在不同时间内对同一种问卷测验的稳定程度等。
根据研究的不同角度,信度分为“外在信度”(external reliability)与“内在信度”(internal reliability)两大类:
式中 、 为同一答卷者两次测验得分, 、 为同一问卷两次测验的平均分,s1、s2是同一问卷两次测验得分的标准差,N是参与该次测验的答卷者数。
重测信度反映了问卷在不同测验时间上的稳定性,故又称稳定性系数。重测信度可以作为预测答卷者将来行为表现的依据。
重测信度也存在着局限性:
(1)问卷前后两次测验结果易受答卷者练习和记忆的影响,两次测验的间隔时间也会影响重测信度。间隔时间长,答卷者因受环境影响而发生变化,其对第二次测验结果将产生影响;如果间隔时间短,则答卷者对第一次测验的记亿会对第二次测验产生影响,这些都将影响到重测信度。

名词解释信度

名词解释信度

名词解释信度信度是一种评估量表或测量工具的可靠性和稳定性的统计指标。

它衡量了测量工具在多次测试中产生相似结果的程度,在心理学、教育研究和社会科学等领域被广泛使用。

信度是一种内在的属性,表示测量工具所测量的特征或概念在不同场合下的一致性或稳定性。

如果一个测量工具具有高信度,那么同一人或同一现象在不同时间或不同环境下得到的测量结果应该是相似的。

在评估量表或测量工具的信度之前,我们需要先了解两个重要的概念:真实分数和观察分数。

真实分数是指被测量的特征或概念在理想条件下的真实评估结果。

观察分数则是在实际测量中所观察到的分数。

由于观察分数受到测量误差的影响,所以观察分数往往与真实分数存在差异。

信度可以分为两种类型:内部一致性信度和重测信度。

内部一致性信度是指在同一时间或同一场合下,测量工具各个项目或指标之间相互关联的程度。

例如,如果一个问卷用于测量人的幸福感,那么内部一致性信度就表示问卷中的各个问题是否在度量幸福感这一概念上一致。

内部一致性信度可以通过计算统计指标Cronbach's alpha来评估,该指标的范围从0到1,数值越大表示内部一致性信度越高。

重测信度是指在不同时间或不同场合下,同一测量工具得到的测量结果之间的一致性。

通常使用统计指标如相关系数或Kappa系数来评估重测信度。

相关系数的取值范围从-1到1,数值越接近1表示重测信度越高。

为了提高信度,我们可以采取以下措施:1. 保持测量工具的一致性:确认测量工具的各个项目或指标之间的相关性,并确保它们都在度量同一概念或特征。

2. 增加测量项:增加更多的项目或指标来多角度地度量同一特征或概念,以提高信度。

3. 考虑反应偏差:注意测量工具可能引起的主观偏见或反应偏差,例如回答方式的一致性等。

4. 使用标准化程序:在进行重测之前,使用标准化程序对被测量的人群进行适应性培训或说明,以确保他们理解测试要求,并在不同时间或场合下保持一致的反应。

总之,信度是一种评估量表或测量工具的统计指标,它衡量了测量工具在多次测试中产生相似结果的程度。

信度和效度

信度和效度
用同一种试验对统一群受试者,前后测验两次,再根据 受使者两次测验分数计算其相关系数,即得出再测信度, 这是一种最普遍,最常用的信度检查方法 .
② 复本信度(Parallel-forms Reliability)
复本是相对于原本而言的,它是原本的复制品,对一项调 查的问题,让被调查者接受问卷测量,并同时接受这份问 卷的复本的调查.然后根据调查结果计算其相关系数,就 得出了复本信度
2. 信度系数
大部分信度指标都以相关系数( r )来表示, 即用同一样本所得到的两组资料的相关系数作 为测量一致性的指标,称为信度系数,信度系数 可以解释为,在所测对象实得分数的差异中有多 大的比例是由测量对象本身的差别决定的.
3 .信度的类型
① 再测信度(Test-retest Reliability )
② 调查者是否按规定程序和标准,是否有 意或无意地对被调查者施加影响,纪录的认 真程度等.
③ 测量内容是否措辞含糊不清,不易理解.
④测量环境和时间如研究人员对被调查 者有较大的干扰,他人在场的影响,两次测 量的时间间隔太长等.
二.效度(Validity)
1. 效度的概念
效度是指正确性程度,即测量工具确 能测出其所要测量的特质的程度.效度越 高级表示测量结果越能显示出所要测量 对象的真正特征.
③ 折半信度( Split-half Reliability)
在无复本且不准备重测的情况下,通常采用折半法一估 计信度,折半法是将调查来的结果按题目的单
双分成两半计分,再根据各个人的这两部分的总分计算 其相关系数,就得到折半信度
4. 影响信度的因素
①被调查者:如是否耐心,认真,专注,不受 情绪波动影响,一般说来调查时间越,提出 的问题越多,越复杂,信度越低.

信度的定义公式

信度的定义公式

信度的定义公式信度是指在测量中的一个重要概念,用来衡量所测量的数据或结果的可靠性和准确性。

在不同领域的研究中,信度是一个非常重要的指标,它可以帮助研究者判断研究结果的可信度,从而决定是否可以对这些结果进行进一步的分析和解释。

在心理学领域,信度是指测量工具在不同时间、不同环境或不同测试者之间的一致性。

一种常用的衡量信度的方法是通过重测法,即在相同的条件下对同一样本进行两次测量,然后计算两次测量结果之间的相关系数。

如果相关系数较高,说明测量工具具有较好的信度;如果相关系数较低,说明测量工具的信度较差,可能需要进行改进或选择其他测量工具。

除了重测法外,还有其他一些常用的方法来衡量信度,如切分半法、信度系数等。

切分半法是将测量工具的各个项目分成两半,然后计算两个半分的得分之间的相关系数;信度系数是通过统计分析来计算测量工具内部各个项目之间的相关性,常用的信度系数有克伦巴赫α系数和Cronbach's β系数等。

在教育评估领域,信度也是一个重要的指标。

教育评估中常用的信度测量方法有重测法、平行测量法和等价测量法。

重测法是在相同的条件下对同一样本进行两次测量,然后计算两次测量结果之间的相关系数;平行测量法是在相同的条件下,使用不同但具有相同的测量目的的测量工具对同一样本进行测量,然后计算两个工具的测量结果之间的相关系数;等价测量法是使用不同但具有相同的测量目的的测量工具对同一样本进行测量,然后计算两个工具的测量结果之间的相关系数。

在市场调研和问卷调查中,信度也是一个重要的指标。

在设计问卷时,需要确保问题的表达清晰明确,避免歧义和误导。

此外,还可以通过预测试和试测来评估问卷的信度。

预测试是在正式调查之前对问卷进行试用,以评估问卷的可理解性和一致性;试测是在正式调查过程中对问卷进行多次使用,然后计算各个问题之间的相关系数来评估问卷的信度。

信度是衡量测量结果可靠性和准确性的一个重要指标。

在不同领域的研究中,信度的计算方法和评估标准可能有所不同,但都旨在确保所测量的数据或结果具有较高的可信度。

信度与效度

信度与效度

上学年问卷设计作业(“大学生道德行为与心理调查”)中量表 设计的存在问题(错误): 1、民族主义情感量表: 能大致说出民族主义与爱国主义的区别(正向) 中国自古就是礼仪之邦,而现在国人的不文明行为表明中国不是 礼仪之邦了(反向) 2、差序格局心理程度量表: 人的本性是自私的(正向) 义工服务在欧美比在中国更普遍(反向) 中国社会是关系社会(正向) 差序格局不利于社会发展 遇到挫折时对普通人的依赖比对家人的依赖要强(反向) 量表中测量什么?道德行为心理得分?
如果有一天我能成为某一领域的 权威或者掌权者,我希望有足够 多的人忠于我服从我 (正向)
李克特量表例子(量表补充例子):民族主义情感量表 请对下列说法发表你的意见(请在每一行适当的位置打勾): (部分) 很同意 同意 一 般 或 不同意 不清楚 很不同 意
总的看来西方文化比中国文化更 为先进 (反向) 美国的的对外政策具有霸权主义 特征 (正向) 如果台湾宣布独立,我们必须以 武力收复台湾 (正向) 如果台湾回归违背大多数台湾人 的意愿,我可接受其不回归 (反 向) 人权高于主权 (反向) 美国政府对中国人权的批评别有 用心 (正向) 我尽量使自己从人类的立场看问 题,而不局限于本民族本国家的 立场 (反向)
(一)测量的信度的含义与类型(P110) 信度含义:可靠程度,一致程度,稳定程度 信度类型:再测信度、复本信度、折半信度 (二)测量的效度的含义与类型(P112) 效度含义:有效程度、准确程度 效度类型:表面效度、准则效度、构造效度 (三)信度与效度关系P113 问: 这两者哪个要求更高?对一个人评价,三个 都说这人是好人,他就是好人?(信度是效度 的必要但不充分的条件,有信度不一定有效度)
行业协会与政府关系?
1
5
2

5心理测量 第五章 经典测验理论——信度

5心理测量 第五章 经典测验理论——信度

5 0.5 0.5 0.25
题目5 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
题目6 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
四、估算信度系数的方法
克伦巴赫( Cronbach)α系数 非0、1计分,如人格测验、态度测验 0、1计分的测验同样可以采用 大多测验采用克伦巴赫( Cronbach)
质方面没有获得过学习和训练 注意提高被试的积极性
二、估算信度系数的方法
2、复本信度 平行测验信度 parallel form reliability 对一组被试用两个复本测验(平行测
验)施测,计算积差相关系数,就是复 本信度。
被试 测验A(X) 测验B(Y)
X2
Y2
XY
01
8
9
64
81
72
α系数来表示,使用范围广泛
被试 题目1 题目2 题目3 题目4 题目5 题目6 总分Xt Xt2
01
3
4
3
2
1
4
17
289
02
6
3
4
5
4
6
28
784
03
1
3
1
2
4
5
16
256
04
6
2
2
1
5
3
19
361
05
5
3
1
2
4
2
17
289
∑X
21
15
11
12
18
20
97 1979
∑X2
107
47

信度与效度的关系

信度与效度的关系
《社会调查与统计分析》
第五章 测量
知识点11 信度和效度的关系
Hale Waihona Puke 信度和效度的关系信度和效度的关系
调查某校学生文体活动情况
校系领导作了多少次报告 开了多少次大会 学校开设了多少门课程……
信度和效度的关系
对党员先进性教育的效果进行调查,设 计项目包括“教育深刻的人数”“学习 认真的人数”“马虎应付的人数”“没 有参与的人数”等,这些项目不可能做 出可靠回答,因此,调查的数字不管多 少,都不可能说明任何实际问题。
信度和效度的关系
l 信度是效度的必要条件而非充分条件。 l 信度是效度的基础,有效的测量必须
是可信的测量,不可信的测量必定是 无效的。
信度和效度的关系
要了解社区符合“城市居民最低生活保障对 象”的数量情况,三个指标:①无生活来源 、无劳动能力、无法定赡养人或抚养人的居 民数量;②领取失业救济金期间或失业保障 金期满仍未重新就业,家庭人均收入低于当 地最低生活保障标准的居民数量;③在职人 员和下岗人员在领取工资和最低工资、基本 生活费后以及退休人员领取退休金后,其家 庭人均收入仍低于当地最低生活保障标准的 居民数量;通过把各个数目累计汇总,从而 得出该社区“低保”对象数量。

第五章、心理测验的技术指标

第五章、心理测验的技术指标

统计平均值
统计平均值:为了表示一组数 据的规律性,需要计算出一 些能够反映这组数据的统计 特征的数字。我们把它们称 为统计平均值。最常用的统 计平均值是平均数和标准差。
(一)、平均数(M):反映一组数据 的集中趋势。 计算公式是M=(∑Xi)/N 例1:有几组观测数据,请分别计算它 们的平均数? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;
最常见的常模表示方法有两种:标准分 数和百分位数。 标准分数是在原始分的基础上按照一定 的规则转化过来的,它反映了原始分数 在分数总体中的相对位置。 百分位系统,又称百分制,它是将一组测 验分数分成100等分。一个百分位数反 映在标准团体中高于和低于某个分数的 人数比例。例如,不管实际的得分是多 少,如果某人在测验中的得分为80百分 位数,那就意味着高于这个分数的人只 有20%,他处于80%人的最前端。
1.测验题目不能反应要测量的特 征.
2. 实施过程偏离了标准化的程 序. 3. 被试不如实回答.
2、效度的类别
类别 解释说明:
指测验项目所涉及的内容对欲测内容范围的代 表性程度。或者说所测内容对要测内容范围取 样的代表性。 构想效度表示一个测验是否达到了对某一理论 概念或特质的测量。如果一个人格测验测得的 结果与该测验所依据的人格理论或假设相符合, 那么,我们说该测验具有较高的构想效度。 预测效度又称效标关联效度,是指一个测验对 我们所感兴趣的行为能够预测到什么程度。在 这里,被预测的行为是检验测验效度的标准,简 称效标。
(二)、标准差(S):标准差就是一 组数据离平均数的平均距离。反映一组 数据的分散程度。 计算公式:S=√∑(Xi-M)2/N 例1:有几组观测数据,请分别计算它 们的标准差? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;

第五章心理测量工具的评价指标

第五章心理测量工具的评价指标

第五章心理测量工具的评价指标正如任何一个测量工具一样,心理测量工具也有它自身的评价指标。

在心理测量学中,信度、效度、项目区分度和有效的常模都是检验心理测量工具是否具有可靠性、有效性、鉴别性、可比性等良好测量特征的技术指标。

因此,了解相关技术指标的内涵和计算方法对于从事心理测量的人力资源管理部门工作人员来说具有重大意义。

第一节心理测量的信度在进行心理测量时,最重要的心理测量学指标之一就是信度(reliability)。

任何一项好的测量都必须有良好的信度,这是人事测评的中心问题,同时它也是标准化测评的一项基本要求和原则。

一、信度的定义信度指的是测量数据和结果的一致性或可靠性程度,它用于分析测量工具测量的前后一致性水平,并以这种一致性的程度来判断测量工具或测量方法的可靠性。

也就是说使用的测评工具可以稳定地测到它所要测量的事物的程度。

我们在选择和使用测评工具或方法时,信度必须是考虑的重要问题。

测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致,信度除受测验工具本身的影响外,亦受很多其它因素的干扰,如所测量的被试样本特征等。

因此没有一份测验是完全可靠的,信度只是一种程度上大小的差别而已。

一致性高的测量工具是指同一群人接受性质相同内容相同的测验测量后,在各结果间显示出的较强的正相关。

稳定性高的测量工具则是指同一批被试在不同的时间接受同样的测验时,结果间的差异很小。

二、信度与误差在进行心理测量时,信度指的是测验分数未受测量误差(errors of measurement)影响的程度。

测量误差指由与测量目的无关的因素产生的不准确或不一致的效应。

测量误差愈小,测量结果愈可靠;换言之,如果测量的结果能反应受试者真实的特征,而不因其他因素而影响测验结果,那么这个测验所测量的结果是可靠的。

测量误差通常包括两种不同类型的误差,即系统误差和随机误差。

系统误差是由与测量目的无关的因素引起的一种恒定而有规律的效应,它稳定地存在于每一次测量中,此时虽然每次的测量值具有一致性,但不正确。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

库德-理查逊公式 KR20公式: rxx = [ K /(K - 1)] [ 1-(Σpiqi)/ Sx2 ] pi为答对第i题的人数的比例;qi为答错第i题的 人数的比例;K为题目数, Sx2为测验总分 的变异。 适用于:已知各项目的难度
KR21公式: rxx = [ K /(K - 1)] [1 -(K p q )/ Sx ] =[K Sx2-X(K-X)]/(K-1) Sx2 适用于:各项目难度相近的情况
2人时:相关系数(积差相关)
多人时:肯德尔和谐系数
W=12 [ΣR i2 -(ΣR i)2 / N] / [K2(N3 -N)] (K=3 ~ 20;N=3 ~ 7时,查W表检验) R I为第i个被试被评的水平等级之和
>.90
各种信度系数相应误差变异的来源 (★) 信度 重测信度 复本信度(连续施测) 误差变异来源 时间取样 内容取样
概化理论的提出
克龙巴赫(Cronbach)等率先提出了概化理论 (Generalizabillity Theory )的基本框 架; 运用对方差或协方差分量分解的方法,将测 验情景中的各类误差进行分解和控制,实现 了对经典测量理论的扩展; 用于评分者信度的估计、临界分数误差估计、 测验分数的推广性和标准参照测验的信度研 究中。
2
克龙巴赫α系数:
α = [ K /(K - 1)] [1 -(ΣSi2)/ Sx2 ] 注意: 用于预测的测验或学绩测验可不考虑同质性。
验证理论构想时必须考虑同质性。因此,同 质性不但与信度有关,还与效度有关。
五、评分者信度 1.含义和计算
(★) 评分者信度(scorer
reliability)是指多个评分者 给同一批人的答卷进行评分的一致性程度。
真分数理论的基本假设(★) : 1. 误差的平均数为0 2. 误差分数与真分数之间的相关为0; 3. 两次测量的误差分数之间的相关为0 。
对于一个团体来说, SX2 = ST2 + SE2
实得分数变异数=真分数的变异数+误差变异数(随机误差)
ST2 = SV2 + SI2
真变异数=与测量目的有关的变异数+与测量目的无关的稳 定的变异数(系统误差)
• 克龙巴赫认为,获取的测验观察分仅仅只是可获 取的测验观察分总体分数中的一个样本而已,因 此,测验的编写者有责任说明对这个获取的观察 分所来自的观察分总体分数(总体分)应如何认识。 • 从统计上说,总体分实际上就是所有观察分的平 均数。在一个具体的测验条件下,如一个特定的 场合、一个特定的主试以及被试在一个特定的测 验形式上所获取的观察分,还有推测出来的总体 分,与在另一个测验情形下所产生的观察分及其 总体分相比较,一般说来两者总是不一样的。 • 测验编写者在指定了可获取的总体分之后,应对 该测验进行一般化研究(即G研究)和决策研究(即D 研究)。
例:每个被试写两篇题目不同的短文,由三个 评分者给所有短文评分。 测量目标:被试的写作水平 测量侧面:题目(2)、评分者(3)
GT的主要任务(★) : 区分出误差的各种来源,并把误差方差分解 成各个相应的方差分量,为控制和减少测量 误差提供依据。
(二)在概化理论中用可靠性(dependability)的 概念代替了传统信度的概念。 可靠性指的是从一个测验或是测量的被测者 得分到施测者同等程度接受的所有可能条件 下被测者均分的概化的精确性,即从测量对 象在样例测量上的得分到全域分的概化精确 性。 概化越精确,越能从一个测量或测验的情况 来推断观察全域的情况。
三、信度好坏的判断标准(★)
标准化能力或学绩测验:>0.90 人格测验:>0.80 教师自编学绩测验:>0.60
第六节 概化理论简介
(★)经典测验理论(CTT)中信度存在的问题: 1. 严格平行测验假设难以成立。要求子测验在 内容、均数、变差、信效度方面完全相同。 这在实际的测验情景中很难满足。 2. 信度系数往往随测量设计的不同而不同,误 差难于控制,也不能有效地分离误差的来源。 误差变异并非单一的结构,经典测量理论对 误差来源的笼统划分与控制成为它在实际应 用中最为突出的缺陷。
3、重测信度的误差来源与控制(★) ① 测验本身:心理特性的稳定性。适用于稳 定的心理特质(速度测验、人格测验) ② 被试方面:成熟、知识变化、练习、记忆 效果、情绪。时间间隔适当。要提高被试 积极性、消除不合作态度。 ③ 施测过程及期间:记时错误、情结波动、 健康状况、动机变化
二、复本信度
1.含义和计算 (★)复本信度(Alternate-form reliability)是指 两个平行(等值)的测验测量同一批被试所得结果 的一致性程度。 计算方法与再测法相同。 2.使用的前提条件(★) ① 两测验真正平行:项目的内容、形式、数量、难 易、时限、指导语等 ② 被试要有条件接受两个测验。注意:时间间隔要 适当。
Sx:所得分数的标准差
rxx:测验的信度 真分数的置信区间(95%)
3.不同测验分数的比较
• 来自不同测验的原始分数无法直接比较。只有参 照同一团体的平均分数,将它们转换成相同尺度 的标准分数(T、Z),才能比较。
• 要比较个人在两种测验上的差异,用差异标准误 来检验其差异的显著性。 • 差异标准误 S:标准分数的标准差 rxx、ryy:两个测验的信度系数 • 标准分数的差异与1.96SEd(0.05水平)进行比 较。> = <?
复本信பைடு நூலகம்(间隔施测)
分半信度 同质性信度 评分者信度
时间与内容取样
内容取样 内容取样和内容的异质性 评分者间的差异
第五节 影响信度系数的因素
一、影响因素 除被试、测验内容、施测情景外,影响信度系数的因 素还有: (一)分数分布的影响 分数分布范围越宽,信度系数就越高。被试团体同质 性水平 同质性越高(个体差异越小)→分数分布范围小→ 信度越低
常见的分半方法是按测题序号奇偶分半:
①测验题目按某种顺序(如难度)排列; ②如果是随机排列的题目,则必须是所有题目是 平等的(要么难度相等,要么性质一致,是测同 一个心理特质的); ③如果测验有多个分量表,应在分量表内部排好 顺序,再把各分量表的两半组合起来求相关。
分半法:按正常的程序实施测验,然后将全 部项目分成相等的两半,根据各人在这两半 测验的分数计算其相关。然后进行修正(?) 校正公式:斯皮尔曼-布郎公式 rxx= 2 rhh /(1+ rhh) rhh是两半测验分数之间的相关系数。
决定系数是真分数与实测分数相关系数的平方,标志着 因变量能以自变量解释的比例部分。
误差越小,信度越高。
注意: (1)信度指的是一组测验分数或一系列测量 的特性,而不是个人分数的特性; (2)真分数的变异数是不能直接测量的,因 此信度是一个理论上构想的概念,只能根据 一组实得分数作出估计。
信度系数
第三篇 测量的理论
信度 效度 项目分析 量表与常模
第五章
信度
同一个人一天中用同一称称体重多次,结 果(单位:公斤)是: 55;40;62;45;55; 49;82;46;60;53 此人的体重是多少?
第一节
二、测量误差的种类
测量误差及其来源
一、测量误差的含义: 测量值与实际值的差异
(★)系统误差:测量工具本身引起的误差(稳定)。 (★)随机误差:由不稳定因素引起的误差(不稳定)。
第二节 真分数及其有关的假设
一、真分数的含义 (★)真分数(True Score):一个测量工具 在没有测量误差时所得到的真值。 (★)操作定义:无数次测量结果的平均值。 观察分数(Observed Score):测验分数
二、真分数的数学模型及其假设 对一个测验成绩(个体)而言 X=T+E X:测验分数;T:真分数;E:测量误差
注意: (1)信度系数有多种。 (2)同一种信度系数也会因样本、测查时间 不同而有多个。 (3)信度系数只是对测量分数一致性的估计, 但并没有指出不一致的原因。 (4)获得较高的信度只是测验有效的必要条 件。
二、测量误差的来源(★)
(一)测量工具(测验内部)引起的误差 1. 题目取样 2. 测验题目格式 3. 难度 4.指导语 5.时限
第四节 估计信度的方法
一、重测信度 1.含义和计算 (★)重测信度(testretest reliability): 用同一量表对同一组 被试施测两次所得结 果的一致性程度。
2.使用的前提条件(★) ① 所测量的心理特质必须是稳定的; ② 练习和遗忘的效果基本上相互抵消; ③ 在两次施测的间隔时期内,被试在所要测 查的心理特质方面没有获得更多的学习和 训练。
四、同质性信度
1.含义
同质性信度(homogeneity reliability), 也叫内部一致性系数,是指测验内部所有题 目间的一致性程度。可弥补分半法的不足。
(★)
2.计算及适用范围 基本公式: rkk = K rij / [ 1 +(K - 1)rij ] K为测验项目数 r ij是项目间相关系数的平均数。
(二)由施测过程引起的误差
1. 物理环境
2.主试因素
3.意外干扰
4.评分计分
(三)被试引起的误差 1. 应试动机 2. 测验焦虑 3. 生理因素 4. 学习、发展和教育 5. 测验经验
三、信度的作用
1.评价测验:信度是测量过程中所存在的随 机误差大小的反映 2.解释个人测验分数的意义
SE:标准误
当假定“两半测验等值(具有相同的平均数 和标准差”)不成立时,用弗朗那根公式或 卢仑公式来估计信度。 弗朗那根公式: rxx = 2 [ 1 -(Sa2 + Sb2)/ Sx2] Sa2 、 Sb2是两半测验分数的变异数, Sx2是测验总分的变异数
卢仑公式: rxx = 1 - Sd2 / Sx2 Sd2 :两半测验分数之差的变异数 Sx2:测验总分的变异数
相关文档
最新文档