小学教育研究方法ppt第四章 测量与操作化
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三)测量结果的相对性
物理测量是有绝对零点的,如测量课 桌宽度的尺子上的“零点”就是没有任何 长度的意思,因而是绝对参照点。根据这 个零点,我们能够确定“课桌宽50厘米” 的意义。但心理属性是没有“绝对零点” 的。比如,测量学生的学业成就,我们不 能确定怎样才是完全没有学业成就,只能 根据群体比较获得一个相对的评价。和一 个“较低”分数的学生相比较而言,可以 说另一个学生的学业成就水平“较高”。 测量法则具有群体相对评定的特点,这也 就说明了测量结果不能独立于某个群体来 解释。
一、测量的内涵
有学者认为测量就是“根据某种法则分配数字于某种物体或事件之上”杨国枢.社会及行为科学研究法: 上册[M].台北:台湾东华书局股份有限公司,1989:305.。测量是一个赋值的过程,但这种赋值又不是随意 的,而需要遵循某种法则。我们认为,测量指依据一定的法则,使用量具给某种事物或现象所具有的属性或 特征赋值的过程。测量不仅可以对事物的属性做定量的说明,也能对事物的属性做定性的说明。
如果一套测量有两个或两个以上的复本,则可以让同一研究对象同时接受两个复本的测量,所得结果的相关系 数则为复本信度。所谓复本指两套及以上在难度、内容、题型、题量等方面基本一致的不同指标或量器。
二、测量的要素
为了更好地理解测量的概念,需要专门说明构成测量的要素。我们先来看看下面两个有关测量的例子: ●用一台电子秤称一箱苹果的重量,记下电子秤显示的结果。 ●用一张语文试卷考核小学生,得到语文试卷的卷面分数。 在第一个例子中,测量的对象是一箱苹果。想要测量一箱苹果的重量,方法是用一台电子秤去 称,结果是得到一个以千克为单位的质量。 在第二个例子中,测量的对象是小学生,想要测量学生的语文学习状况,标准术语叫作学业成就,方法 是用测验卷进行考试,结果是每位同学取得的卷面分数。 上述两个例子都蕴含了测量的四个要素:
第四章
测量与操作化
目录
Contents
01 测量概述 03 概念的操作化
02 测量的层次 04 测量质量的评估
学习目标
分析教育测量的要素 与特征
说出操作化的内涵与 作用,能按步骤实施 某一概念的操作化
辨别定性、定序、定 距、定比等四类测量, 能根据测量对象的性 质和特征选用合适的 测量
说明什么是信度、什 么是效度,能结合实 例解释如何进行信度、 效度评估
(1)测量客体,即测量的对象。
(2)测量内容,即测量客体的某种属性或特征。
(3)测量法则,即用数字或符号表达事物各种属性或特征的操作规则,包括测量工具和测量过程两个部分。
(4)测量结果,即数字、符号或文字。
一、测量的特征
(一)测量主客体的主观性
在教育研究中,测量客体通 常是各种各样的人,以及由若干 个人所组成的各种社会群体、组 织等。人一方面是测量的客体或 对象,另一方面又是测量过程的 主体。不论是作为测量客体的人, 还是作为测量主体的人,都具有 主观意识、思想感情、思维能力 和价值观念,都会对测量的过程 和方式做出种种反应。这使得教 育现象的测量在很大程度上受到 人们的认识水平和价值取向的影 响,带有明显的主观色彩。
二、操作化的作用
操作化在教育研究中有着极为重要的作用。如“智力”这个概念被界定为“思维和适应环境 的能力”,这一抽象定义虽简洁明了,却在实际测量中难以进行。因此,研究者应当采用操作性 定义,列举测量该概念或变量所做的操作活动。比如,将上述“智力”界定为“在某智力测验中 所得的分数”。因而可以将教育研究中的操作化比喻成一座桥梁,它联通了理论与实际、抽象与 具体,为我们在教育研究中实际地测量抽象概念提供了关键手段。简言之,操作化的目的就是要 把难以理解的抽象概念或者有关人们行为、思想和特征的内在事实,用代表它们的可观察的外在 事实来替换,以便于通过后者来研究前者。
第三节
概念的操作化
一、操作化的内涵
在教育研究中,我们在测量复杂变量时难免会遇到一些困难。比如,问学生“你上课有没有 开小差”,很多学生顾及其他因素,不会讲真话;问老师“某同学的课堂参与度如何”,他很难 做出简短、肯定的回答,因为“课堂参与度”一词的概念很模糊。但如果问“某同学在课堂中举 手发言的次数是多少”,他就很容易回答了。可见,有些变量不能被直接观察到,而是要通过测 量另外一个(或一组)与之相关的可观察到的现象,再根据二者间的关系进行推理而获得。因此, 在教育研究中仅仅有概念的抽象定义是不够的,还必须根据抽象定义演绎出可具体操作或测量的、 相互联系的具体指标或经验现象。这些具体指标或经验现象就被称为概念的操作化或布里奇曼 (Bridgman,P W.)所提出的操作化定义。
(二)、确定变量
•会发生变化的概念及其属性叫做变量,即一个 概念若包含两个及以上的取值或范畴时即是变 量。一般来说,在教育研究中,变量是概念的 具体表达方式,概念必须用变量的形式来反映。
(三)、确定指标 与维度
•指标就是对一个抽象概念在经验层 面上的具体说明,是用一组可观察 到的事物或现象对一个抽象概念所 做出的“指标和标志“
第二节
测量的层次
在测量过程中,变量或指标的属性在质或量上具有一定的差异,存在着大小、高低、强弱,变量或指标还具有间断或 连续的特征,因此,形成了测量的不同层次。仇立平.社会研究方法[M].重庆:重庆大学出版社,2015:183.根据史蒂文 斯1951年创立的测量层次分类法,测量具有四种层次:定性测量、定序测量、定距测量和定比测量。
定性测量
类别区分
✔️
(=、≠)
次续区分 (<、>)
距离区分 (+、-)
比例区分 (×、÷)
定序测量 ✔️
✔️
定距测量 ✔️
✔️
✔️
定比测量 ✔️ ✔️ ✔️ ✔️
表4-1四种测量层次的数学特性总结
在教育研究资料的整理与分析中,应当根据不同测量层次所具有的数学特性采用不同的统计方法。此外,还有一个重 要规则:尽可能地使用高层次的测量。因为高层次的测量所包含的信息更多,测量结果很容易转化为低层次测量的结果, 反之则不行。
三、操作化的步骤
操作化明确地说明了如何测量某个概念,告诉研究者如何辨识抽象概念所指称的现实世界中的现象。那么, 究竟该如何进行操作化呢?从大的方面来看,操作化过程主要包含三个步骤:一是界定概念,二是确定变量,三 是确定指标与维度。
(一)、界定概念
•概念是反映对象的本质属性的思维形式,是对事物的抽象,是 一类事物的属性在人们主观上的一致性反映。对概念进行界定 时,可以直接采用学术界公认的概念定义,也可以先参考其他 研究者所下的定义,在此基础上对概念作出新的界定
简单来说,概念的操作化就是用经验上可以观察的指标对一个理论概念或抽象概念进行界定。 换句话说,操作化就是对那些抽象层次较高的概念进行具体测量时所采用的程序、步骤、方法和手 段的详细说明。阿特斯兰德.经验性社会研究方法[M].李路路,林克雷,译.北京:中央文献出版社, 1995:52.比如,发散性思维能力是一个很抽象的概念,那么在对这一能力进行测量时,我们就可 以将其转化为可观察的具体指标,即在规定时间内尽可能多地写出“砖块有哪些用途”。写的用 途数量越多,说明发散性思维能力越强。
指标与变量的关系非常密切,我们往往需要同时使用能够全面反映变量性质的一组指标来完成对变量的测量, 二者关系如图4—1所示。
变量
指标1 指标2 指标3 指标4 …… 指标N 图4-1指标与变量的关系示意图
指标与概念也有着密切而复杂的关系。对于有些概念来说,建立测量指标很容易,如性别、文化程度等。但对 于一些抽象程度较高的概念来说,建立测量指标就不那么简单了,需要通过操作化的方法建立一套指标进行测量。
以上四种测量的层次由低到高,逐渐上升。高层次的测量具有低层次测量所具备的功能,即它既可以测量低层次ห้องสมุดไป่ตู้量 可以测量到的内容,又可以测量低层次测量所无法测量到的内容。同时,高层次的测量也可以降级,作为低层次的测量来 处理,反之则不可以。为了更清楚地说明这四种测量层次之间的差别,我们将它们各自的数学特性做如下总结(见表4—1)
第一节
测量概述
在日常生活中,我们对测量并不陌生,经常会有意无意 地用到测量。比如,我们用自己的各种身体器官去测量和感 知外部世界:用眼睛测量物体的大小、颜色、形状、距离 等,用鼻子测量物体的气味,用耳朵测量声音的高低与方 向,用皮肤测量物体的温度、触感,等等。但这种测量的方 法具有较强的主观性,结果不是很精确,而且测量的范围也 不全面。因此,科学家发明了很多仪器用于专业测量,比 如,用电子秤测量物体的质量,用刻度尺测量物体的长度, 用温度计测量温度,用望远镜测量浩瀚的宇宙,等等。
物理世界是可以测量的,头脑中的观念也可以测量吗? 比如爱情、憎恨、同情心、偏见等等。社会科学研究认为, 对任何事物都可以进行测量,只不过测量方法需要经过精心 设计。比如,可以运用人口登记的方法测量一个国家的人口 数量和人口结构,可以运用追踪调查的方法测量小学生的心 理发展,还可以运用问卷和访谈等方法测量复杂的同情心等 心理状况,等等。虽然各种测量的内容和方式千差万别,但 是它们有着共同的内涵、要素,并与某一测量层次相关。
定性测量 定序测量 定距测量 定比测量
定性测量(nominal measurement)也称定类测量或类别测量,是 测量层次中最低的一种,是所有测量的基础。定性测量的本质是一种 分类体系,即给研究对象的属性或特征标以不同的符号或名称,以确 定其类别。 定序测量(ordinal measurement)也称等级测量或顺序测量。定序 测量可以根据某种特征或标准将对象区分为程度或等级不同的序列。 定序测量不但能像定性测量一样对事物的种类进行划分,而且能反映 事物或现象在序列上的差异。
相对来说,概念是抽象的,而指标一般是具体的、可观察的。但对于高度抽象的概念来说,有些指标本身依然 是概念,仍需进一步操作化。
可见,并不是所有指标都可以通过观察直接得到,由此就产生了“一级指标”“二级指标”等。有些教材就将 较为抽象的“一级指标”称为“维度”。即维度是对概念进行分类的术语,是概念被研究者分解为几个不同方面的 分类标准。区分概念的不同维度,常常会加深我们对研究事物的了解。
(四)测量偏误的必然性
“偏误”是指偏差和误差, 偏差评价的是测量结果的准确程 度,而误差则反映测量结果的精 确程度。其实,任何测量多少都 会有误差。
(二)测量内容的复杂性
在教育研究中,测量的内容常常是 人们的心理属性或社会属性。这些内容 是内在的、建构的,不能直接进行测量, 得通过外显行为才能推测内隐的品质, 因而十分复杂。
定距测量(interval measurement)也称等距测量或区间测量。它不 仅能够将社会现象或事物区分为不同的类别或等级,还可以确定它们 之间在数量上的差别和等级上的间隔距离。。
定比测量(ratio measurement)也称等比测量或比例测量。定比测 量是量化水平最高的测量,变量的属性除了前面提到的类别、顺序和 等距以外,还有一个绝对零点。在比率量表中,零是有实际意义的, 长度“0”就是无长度,重量“0”就是没重量。因此,定比测量所得 到的结果既可以进行加减运算,又能进行乘除运算。
第四节
测量质量的评估
一、信度
信度( reliability )即测量的稳定性或一致性,是对测量方法及其测量结果可靠性的评估,指的是采取同样的 方法和指标对同一对象重复测量时,其所得结果相一致的程度。也就是说,信度是指测量工具能否稳定地测量所测 的事物或变量。
信度评估的是测量结果的可靠性,也就是重复测量所得结果的一致性程度。由此可见,要分析测量的信度,前 提条件就是要对事物的属性进行两次或多次测量。在量化研究中,通常会使用“信度系数”这个术语,即若干次测 量结果之间的相关系数( r )。信度系数越高,信度也就越高。什么是若干次测量结果呢?信度的类型就是依照获 得“若干次测量结果”的方法来分类的。
(一)重测信度(test-retest reliability)
对同一对象采用同一种测量方法,在不同的时间点重复测量两次或两次以上,多次测量结果的相关系数被称为 重测信度。这是一种最常用、最普遍的信度检查方法。使用这种方法时要注意, 两次测量所使用的方法和工具都要 求是一致的。
(二)复本信度(parallel-forms reliability)
物理测量是有绝对零点的,如测量课 桌宽度的尺子上的“零点”就是没有任何 长度的意思,因而是绝对参照点。根据这 个零点,我们能够确定“课桌宽50厘米” 的意义。但心理属性是没有“绝对零点” 的。比如,测量学生的学业成就,我们不 能确定怎样才是完全没有学业成就,只能 根据群体比较获得一个相对的评价。和一 个“较低”分数的学生相比较而言,可以 说另一个学生的学业成就水平“较高”。 测量法则具有群体相对评定的特点,这也 就说明了测量结果不能独立于某个群体来 解释。
一、测量的内涵
有学者认为测量就是“根据某种法则分配数字于某种物体或事件之上”杨国枢.社会及行为科学研究法: 上册[M].台北:台湾东华书局股份有限公司,1989:305.。测量是一个赋值的过程,但这种赋值又不是随意 的,而需要遵循某种法则。我们认为,测量指依据一定的法则,使用量具给某种事物或现象所具有的属性或 特征赋值的过程。测量不仅可以对事物的属性做定量的说明,也能对事物的属性做定性的说明。
如果一套测量有两个或两个以上的复本,则可以让同一研究对象同时接受两个复本的测量,所得结果的相关系 数则为复本信度。所谓复本指两套及以上在难度、内容、题型、题量等方面基本一致的不同指标或量器。
二、测量的要素
为了更好地理解测量的概念,需要专门说明构成测量的要素。我们先来看看下面两个有关测量的例子: ●用一台电子秤称一箱苹果的重量,记下电子秤显示的结果。 ●用一张语文试卷考核小学生,得到语文试卷的卷面分数。 在第一个例子中,测量的对象是一箱苹果。想要测量一箱苹果的重量,方法是用一台电子秤去 称,结果是得到一个以千克为单位的质量。 在第二个例子中,测量的对象是小学生,想要测量学生的语文学习状况,标准术语叫作学业成就,方法 是用测验卷进行考试,结果是每位同学取得的卷面分数。 上述两个例子都蕴含了测量的四个要素:
第四章
测量与操作化
目录
Contents
01 测量概述 03 概念的操作化
02 测量的层次 04 测量质量的评估
学习目标
分析教育测量的要素 与特征
说出操作化的内涵与 作用,能按步骤实施 某一概念的操作化
辨别定性、定序、定 距、定比等四类测量, 能根据测量对象的性 质和特征选用合适的 测量
说明什么是信度、什 么是效度,能结合实 例解释如何进行信度、 效度评估
(1)测量客体,即测量的对象。
(2)测量内容,即测量客体的某种属性或特征。
(3)测量法则,即用数字或符号表达事物各种属性或特征的操作规则,包括测量工具和测量过程两个部分。
(4)测量结果,即数字、符号或文字。
一、测量的特征
(一)测量主客体的主观性
在教育研究中,测量客体通 常是各种各样的人,以及由若干 个人所组成的各种社会群体、组 织等。人一方面是测量的客体或 对象,另一方面又是测量过程的 主体。不论是作为测量客体的人, 还是作为测量主体的人,都具有 主观意识、思想感情、思维能力 和价值观念,都会对测量的过程 和方式做出种种反应。这使得教 育现象的测量在很大程度上受到 人们的认识水平和价值取向的影 响,带有明显的主观色彩。
二、操作化的作用
操作化在教育研究中有着极为重要的作用。如“智力”这个概念被界定为“思维和适应环境 的能力”,这一抽象定义虽简洁明了,却在实际测量中难以进行。因此,研究者应当采用操作性 定义,列举测量该概念或变量所做的操作活动。比如,将上述“智力”界定为“在某智力测验中 所得的分数”。因而可以将教育研究中的操作化比喻成一座桥梁,它联通了理论与实际、抽象与 具体,为我们在教育研究中实际地测量抽象概念提供了关键手段。简言之,操作化的目的就是要 把难以理解的抽象概念或者有关人们行为、思想和特征的内在事实,用代表它们的可观察的外在 事实来替换,以便于通过后者来研究前者。
第三节
概念的操作化
一、操作化的内涵
在教育研究中,我们在测量复杂变量时难免会遇到一些困难。比如,问学生“你上课有没有 开小差”,很多学生顾及其他因素,不会讲真话;问老师“某同学的课堂参与度如何”,他很难 做出简短、肯定的回答,因为“课堂参与度”一词的概念很模糊。但如果问“某同学在课堂中举 手发言的次数是多少”,他就很容易回答了。可见,有些变量不能被直接观察到,而是要通过测 量另外一个(或一组)与之相关的可观察到的现象,再根据二者间的关系进行推理而获得。因此, 在教育研究中仅仅有概念的抽象定义是不够的,还必须根据抽象定义演绎出可具体操作或测量的、 相互联系的具体指标或经验现象。这些具体指标或经验现象就被称为概念的操作化或布里奇曼 (Bridgman,P W.)所提出的操作化定义。
(二)、确定变量
•会发生变化的概念及其属性叫做变量,即一个 概念若包含两个及以上的取值或范畴时即是变 量。一般来说,在教育研究中,变量是概念的 具体表达方式,概念必须用变量的形式来反映。
(三)、确定指标 与维度
•指标就是对一个抽象概念在经验层 面上的具体说明,是用一组可观察 到的事物或现象对一个抽象概念所 做出的“指标和标志“
第二节
测量的层次
在测量过程中,变量或指标的属性在质或量上具有一定的差异,存在着大小、高低、强弱,变量或指标还具有间断或 连续的特征,因此,形成了测量的不同层次。仇立平.社会研究方法[M].重庆:重庆大学出版社,2015:183.根据史蒂文 斯1951年创立的测量层次分类法,测量具有四种层次:定性测量、定序测量、定距测量和定比测量。
定性测量
类别区分
✔️
(=、≠)
次续区分 (<、>)
距离区分 (+、-)
比例区分 (×、÷)
定序测量 ✔️
✔️
定距测量 ✔️
✔️
✔️
定比测量 ✔️ ✔️ ✔️ ✔️
表4-1四种测量层次的数学特性总结
在教育研究资料的整理与分析中,应当根据不同测量层次所具有的数学特性采用不同的统计方法。此外,还有一个重 要规则:尽可能地使用高层次的测量。因为高层次的测量所包含的信息更多,测量结果很容易转化为低层次测量的结果, 反之则不行。
三、操作化的步骤
操作化明确地说明了如何测量某个概念,告诉研究者如何辨识抽象概念所指称的现实世界中的现象。那么, 究竟该如何进行操作化呢?从大的方面来看,操作化过程主要包含三个步骤:一是界定概念,二是确定变量,三 是确定指标与维度。
(一)、界定概念
•概念是反映对象的本质属性的思维形式,是对事物的抽象,是 一类事物的属性在人们主观上的一致性反映。对概念进行界定 时,可以直接采用学术界公认的概念定义,也可以先参考其他 研究者所下的定义,在此基础上对概念作出新的界定
简单来说,概念的操作化就是用经验上可以观察的指标对一个理论概念或抽象概念进行界定。 换句话说,操作化就是对那些抽象层次较高的概念进行具体测量时所采用的程序、步骤、方法和手 段的详细说明。阿特斯兰德.经验性社会研究方法[M].李路路,林克雷,译.北京:中央文献出版社, 1995:52.比如,发散性思维能力是一个很抽象的概念,那么在对这一能力进行测量时,我们就可 以将其转化为可观察的具体指标,即在规定时间内尽可能多地写出“砖块有哪些用途”。写的用 途数量越多,说明发散性思维能力越强。
指标与变量的关系非常密切,我们往往需要同时使用能够全面反映变量性质的一组指标来完成对变量的测量, 二者关系如图4—1所示。
变量
指标1 指标2 指标3 指标4 …… 指标N 图4-1指标与变量的关系示意图
指标与概念也有着密切而复杂的关系。对于有些概念来说,建立测量指标很容易,如性别、文化程度等。但对 于一些抽象程度较高的概念来说,建立测量指标就不那么简单了,需要通过操作化的方法建立一套指标进行测量。
以上四种测量的层次由低到高,逐渐上升。高层次的测量具有低层次测量所具备的功能,即它既可以测量低层次ห้องสมุดไป่ตู้量 可以测量到的内容,又可以测量低层次测量所无法测量到的内容。同时,高层次的测量也可以降级,作为低层次的测量来 处理,反之则不可以。为了更清楚地说明这四种测量层次之间的差别,我们将它们各自的数学特性做如下总结(见表4—1)
第一节
测量概述
在日常生活中,我们对测量并不陌生,经常会有意无意 地用到测量。比如,我们用自己的各种身体器官去测量和感 知外部世界:用眼睛测量物体的大小、颜色、形状、距离 等,用鼻子测量物体的气味,用耳朵测量声音的高低与方 向,用皮肤测量物体的温度、触感,等等。但这种测量的方 法具有较强的主观性,结果不是很精确,而且测量的范围也 不全面。因此,科学家发明了很多仪器用于专业测量,比 如,用电子秤测量物体的质量,用刻度尺测量物体的长度, 用温度计测量温度,用望远镜测量浩瀚的宇宙,等等。
物理世界是可以测量的,头脑中的观念也可以测量吗? 比如爱情、憎恨、同情心、偏见等等。社会科学研究认为, 对任何事物都可以进行测量,只不过测量方法需要经过精心 设计。比如,可以运用人口登记的方法测量一个国家的人口 数量和人口结构,可以运用追踪调查的方法测量小学生的心 理发展,还可以运用问卷和访谈等方法测量复杂的同情心等 心理状况,等等。虽然各种测量的内容和方式千差万别,但 是它们有着共同的内涵、要素,并与某一测量层次相关。
定性测量 定序测量 定距测量 定比测量
定性测量(nominal measurement)也称定类测量或类别测量,是 测量层次中最低的一种,是所有测量的基础。定性测量的本质是一种 分类体系,即给研究对象的属性或特征标以不同的符号或名称,以确 定其类别。 定序测量(ordinal measurement)也称等级测量或顺序测量。定序 测量可以根据某种特征或标准将对象区分为程度或等级不同的序列。 定序测量不但能像定性测量一样对事物的种类进行划分,而且能反映 事物或现象在序列上的差异。
相对来说,概念是抽象的,而指标一般是具体的、可观察的。但对于高度抽象的概念来说,有些指标本身依然 是概念,仍需进一步操作化。
可见,并不是所有指标都可以通过观察直接得到,由此就产生了“一级指标”“二级指标”等。有些教材就将 较为抽象的“一级指标”称为“维度”。即维度是对概念进行分类的术语,是概念被研究者分解为几个不同方面的 分类标准。区分概念的不同维度,常常会加深我们对研究事物的了解。
(四)测量偏误的必然性
“偏误”是指偏差和误差, 偏差评价的是测量结果的准确程 度,而误差则反映测量结果的精 确程度。其实,任何测量多少都 会有误差。
(二)测量内容的复杂性
在教育研究中,测量的内容常常是 人们的心理属性或社会属性。这些内容 是内在的、建构的,不能直接进行测量, 得通过外显行为才能推测内隐的品质, 因而十分复杂。
定距测量(interval measurement)也称等距测量或区间测量。它不 仅能够将社会现象或事物区分为不同的类别或等级,还可以确定它们 之间在数量上的差别和等级上的间隔距离。。
定比测量(ratio measurement)也称等比测量或比例测量。定比测 量是量化水平最高的测量,变量的属性除了前面提到的类别、顺序和 等距以外,还有一个绝对零点。在比率量表中,零是有实际意义的, 长度“0”就是无长度,重量“0”就是没重量。因此,定比测量所得 到的结果既可以进行加减运算,又能进行乘除运算。
第四节
测量质量的评估
一、信度
信度( reliability )即测量的稳定性或一致性,是对测量方法及其测量结果可靠性的评估,指的是采取同样的 方法和指标对同一对象重复测量时,其所得结果相一致的程度。也就是说,信度是指测量工具能否稳定地测量所测 的事物或变量。
信度评估的是测量结果的可靠性,也就是重复测量所得结果的一致性程度。由此可见,要分析测量的信度,前 提条件就是要对事物的属性进行两次或多次测量。在量化研究中,通常会使用“信度系数”这个术语,即若干次测 量结果之间的相关系数( r )。信度系数越高,信度也就越高。什么是若干次测量结果呢?信度的类型就是依照获 得“若干次测量结果”的方法来分类的。
(一)重测信度(test-retest reliability)
对同一对象采用同一种测量方法,在不同的时间点重复测量两次或两次以上,多次测量结果的相关系数被称为 重测信度。这是一种最常用、最普遍的信度检查方法。使用这种方法时要注意, 两次测量所使用的方法和工具都要 求是一致的。
(二)复本信度(parallel-forms reliability)