第七章 测量与操作化(1)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)社会指标的特点 1、具体性或可感知性 2、计量性或可量度性 3、重要性或代表性 4、时间性
(三)社会指标的类型 1ຫໍສະໝຸດ Baidu客观指标与主观指标 2、经济指标与非经济指标 3、描述性指标和评价性指标 4、肯定指标、否定指标和中性指标 5、投入指标、活动量指标和产出指标
(四)社会指标的功能 1、反映功能 2、监测功能 3、比较功能, 4、评价功能 5、预测功能, 6、计划功能
▲ 准则效度分:预测效度、共变效度、实用效度 a.预测效度 将已经得到的测量结果与未来实际发生的情况进行比较,以检查两 者的一致性。 例如:设计一种预测学生学习成绩的测验,用它来测量学生毕业时 的学习成绩。如果在学生毕业时,实际的成绩确实与预测相一致, 那么这一测验就具有预测效度。 b.共变效度 共变效度是判断其他的测量工具是否可以取代作为效标的测量工具。 例如:假如有一种心理测验方法能高度精确地鉴别出某种精神疾病, 但就是这种测验太费时、费力,在短期内不可能完成检查。如果能 够设计出另一种简单的、自我填写的量表,而且这一量表的测量结 果与心理测验的结果高度相关的话(即具有共变效度),那么它就 可以替代原先的心理测验方法。 c.实用效度。通常用来检查测量工具的实际效果。
三、量表
本部分内容见教材111—119页,要求下 去自学。
第五节 测量的信度与效度
对于任何一种测量工具或测量手段来说,都会涉
及到这样一些基本问题:
测量所得的数据或资料是否与人们感兴趣的特征有关?
测量所得的结果是否正是人们所希望测量的东西?
当这种测量的时间、地点及操作者发生改变时,测量的结果将会受到什 么样的影响?
3、建构效度 考察建构效度就是要了解测量工具是否 反映了概念和命题的内部结构,这种方 法常常在理论的研究中使用。 由于它是通过与理论假设相比较来检验 的,因此建构效度也被称为理论效度。 它涉及到一个理论的关系结构中其他 概念(或变量)的测量。
例如,假定我们设计了一种测量方法,来测量人们的“婚姻满 意程度”。 为了评价这种测量方法的效度,我们需要用到与婚姻满意程度 有关的理论命题或假设中的其他变量。 假设:婚姻满意程度与主动做家务的行为有关。 婚姻满意程度越高,越是主动承担家务。 那么,如果我们的测量在婚姻满意程度与承担家务方面的结果 具有一致性,则称我们的测量具有建构效度。如果婚姻满意程 度不同的对象在承担家务方面的行为都是一样的,那么,我们 测量的建构效度就面临挑战。 内容效度,它只需要一个单一的概念和对它的一个单一的测量 法。准则效度需要对一个概念的两个以上的测量法。而建构效 度,它不仅需要对一个概念的两个以上的测量法,而且还需要 其他概念及其通过命题与所研究的概念相关的测量法,是最强 有力的效度测定程度。
二、社会指标体系
(一)社会指标体系概念 社会指标体系,是根据一定的目的、一 定的理论设计出来的综合反映社会现象 的具有科学性、代表性和系统性的一组 社会指标。
(二)社会指标体系的特点 1、目的性 2、理论性 3、科学性 4、代表性 5、系统性
(三)社会指标体系的建立 1、社会管理型的社会指标体系。 通常是政府或各行政主管部门为进行社会规 划、社会管理,在原有统计指标的基础上, 经过加工改造而建立起来的。 2、专题研究型的社会指标体系。 通常是各种研究机构或学者为了研究某一社 会课题根据一定的研究假设或价值取向独立 设计出来的社会指标体系。
▲ 内容效度主要考虑: a.测量工具所测量的是否正是调查人员所想要测量的 那种行为? b.测量工具是否提供了有关那种行为的适当样本? 例如,政治知识的考试。其不能列出所有的内容,但 是考试中必然对政治知识的每一部分都列出几道试题, 作为这一部分的样品。这样就能通过考察这些样品是 否代表了变量的各个部分来评判考卷的内容效度。 因此,检查内容效度就是检查由概念到指标的经验推 演是否符合逻辑,是否有效。
第七章 测量与操作化
第四节 指数与量表
为了更好的了解指标与社会指标,我们 先来看以下“社会和谐综合评价指标”。
一、社会指标
(一)社会指标的概念
社会指标,是反映社会现象的数量、质量、类别、状 态、等级、程度等特性的项目。例如,国民生产总值、 人口自然增长率、人均地方财政收入等等。 社会指标是相对于自然指标(比如气温、风向等)而 言的。 社会指标是测量社会现象特征的有力工具,它能提供 一个对整个社会状况的客观描述,有助于说明社会问 题、预测社会趋势。社会指标既是对社会过程和社会 调查研究成果的某种概括和总结,也为系统地、科学 地进行社会调查提供了一定的指南和依据。
(四)社会指标体系的评价 在社会指标体系中,由于各种社会指标反映 的具体内容不同,计量单位各异,因此,其 调查结果不能简单地直接相加,而只能进行 综合评价。综合评价的方法很多,有综合指 数法、因素分析法、标准化评分法、无量纲 法、两基点法、投影法、综合评分法等等。 其中,综合评分法简单易学,计算结果比较 符合实际。
▲ 内在效度和外在效度 如果在一项具体的研究中,对上述三种效度的检查没 有发现问题的话,就可以认为这一研究具有内在效度, 即它的资料和结论可以有效地解答所研究的问题。但 是,这一研究结论的有效性是否可以适用于其他时间、 地点和对象呢?这就涉及外在效度的问题了,即这种 研究结论的普遍有效性。 例如:在美国的一些城市抽取几百名工人进行研究发 现,“当代工人的阶级意识普遍淡漠”,考查它的外 在效度,就是看它是否在超越具体的时间、地点之后 是否具有代表性,是否具有普遍意义。
对于同一种对象,人们常常会采取各种不同的测量方 法,常常会采用各种不同的测量指标。也许这些方法 和指标都没有错,但它们相互之间一定会在效度与信 度这两方面存在程度上的差别。
评价和选择的标准
越是在准确性和一致性上程度更高的方
法和指标,就越是好的测量方法,就越是高 质量的测量指标。
3、折半信度 在一种测验没有复本且只能实施一次的情况下,通常 采用折半法来估计测验的信度。 常用的折半法是将受试者的测验结果,按题目的单双 数分成两组记分,计算这两组分数之间的相关系数, 这种相关系数就叫做折半信度。 例如一个态度测量包括30个项目,若采用折半法技术 来了解其内在一致性,则可将这30个项目分为相等的 两部分,再求其相关系数。 通常,研究者为了采用折半信度来检验测量的一致性, 需要在他的测量表中,增加一倍的测量项目。
二、测量的效度
(一)效度的含义 效度指的是测量的有效性或准确度,即测量工具或测 量手段能够如实反映某一概念真正含义的程度。效度 是指测量工具测出变量的正确性程度。 选择测量工具和设计问卷、表格时,首先要考虑其效度, 也就是说,要考虑测量出来的东西是否真的是研究者想 要得到的东西,所测得的结果是否能正确有效地说明所 要研究的现象. 在评估测量的效度时,如果某一测量方法能测出研究 者所要测量的变量,则此测量方法就可说合乎有效性。 反之,则称为无效的测量或者测量不具有效度。
2、准则效度 准则是衡量有效性的参照标准。准则效度具体可分为两种情况: 其一,准则效度,指的是用几种不同的测量方式或不同指标对 同一变量进行测量时,将其中的一种方式或指标作为准则,其 他的方式或指标与这个准则作比较。 如果其他的方式或指标与准则的方式或指标具有相同的效果, 则其他的方式与指标就具有准则效度。 其二,准则效度,指的是用一种不同以往的测量方式或指标对 同一事物或变量进行测量时,将原有的一种测量方式或指标作 为准则,用新的方式或指标所得到的测量结果与原有准则的测 量结果作比较,如果新的测量方式或指标与原有的作为准则的 测量方式或指标具有相同的效果,那么,我们就说这种新的测 量方式或指标具有准则效度。 准则是被假设或被定义为有效的测量标准,符合这种标准的测 量工具可以作为测量某一特定现象或概念的效标。 对同一概念的测量可以使用多种测量工具,其中每种测量方式 与效标的一致性称为准则效度。
如何评价一种测量是否具有内容效度? 首先,必须知道所测量的概念是如何定义的; 其次,需要知道这种测量所收集的信息是否和该概念密切相关。 然后,评价者才能尽其判断能力之所及,作出这一测量是否具 有内容效度的结论。 例如,用问卷去测量人们的消费观念,首先要弄清“消费观念” 的定义,然后看问卷中的问题是否都与人们的消费观念有关。 如果问卷中的问题明显是有关其他方面的,则这种测量就不具 有内容效度。如果发现问卷中的问题所涉及的都是有关消费观 念方面的内容,而看不出它们是在测量与消费观念无关的其他 观念时,则可以说这一测量具有表面效度。
(二)信度的类型 其基本的类型有以下三种: 1、再测信度 对同一群对象采用同一种测量,在不同的时间点先后 测量两次,根据两次测量的结果计算出相关系数,这 种相关系数就叫做再测信度。 这是一种最常用、最普遍的信度检查方法。 如,在智力测验中第一次测出某人智商为105,第二 次则为130,那就说明这一智力量表缺乏信度。
2、复本信度 如果一套测验有两种以上的复本,则可交替使用,根据一个受 试者接受两种复本测验的得分计算其相关系数,即可得复本信 度。(复本是针对原本而言的,它使原本的复制品。) 复本类似于考试中的A、B卷,它是根据同一目的,编制出两种 平行的等值量表,就是说,研究者设计两套测量工具以测验同 一主题现象。 如,在测量英语程度时使用A、B卷,如果一个人在A卷和B卷的 得分相同,就说明考题具有信度;如果两者差异很大,则缺乏 信度。 在社会研究中,研究人员可以设计两份研究问卷,每份使用不 同的项目,但都用来测量同一个概念或事物,两份都让同时在 场的同一个或同一群回答者作答。然后根据两份问卷所得的分 数计算其复本信度。 复本信度可以避免上述再测信度的缺点;
一、测量的信度
(一)信度的含义 信度(reliability)即可靠性,它指的是采取同 样的方法对同一对象重复进行测量时,其所 得的一致的程度。换句话说,信度是测量结 果的一致性或稳定性。也即指测量工具能否 稳定地测量所测的变量。 社会调查必须真实可信的。而且经得起反复 的检验,这样的调查才有价值,因此,信度 是社会调查成功的基本条件。
信度的大小可以用信度系数(r)来表示。 信度系数,即用同一样本所得到的两组资料的相关系数作为测 量一致性的指标。 信度系数可以解释为在所测对象实得分数的差异中有多大比例 是由测量对象本身的差别决定的。 信度系数高表明测量的一致性程度高,测量误差少。 如,当 r=0.90时,可以认为实得分数中有90%的差异来自测量对象本身 的差别,只有10%来自测量误差; r=1.00时,则表示无测量误差,所有的差异都来自测量对象本身; 这是理想的状况,实际是办不到的。 r=0,则所有的差异均反映了测量误差。 一般来说,r≥0.80,即可认为该测量是达到了足够的信度。
以朱庆芳、吴寒光根据国家统计居城调队编的《1992 年中国城市统计年鉴》为例,来说明综合评分法的具 体步骤和作法。 第一步,搜集数据。 第二步,确定权数,即确定每一个指数的权数。 第三步,确定评分标准,即将每个指标按数值的高低 分成若干组,并给每个组确定标准分的分值。一般来 说,分组越多,准确性越高。 第四步,求出各个指标的得分、分类分和总分。 第五步,进行比较和评价。
检查效度的三种程序
表面效度 概念层次 准则效度 X 学习能力 建构效度 X 工作 Y 闲暇时间
的利用
X
政治知识
经验层次
X1 政治
考试成绩
X1 预测
学习成绩
X2 实际
学习成绩
X1 工作
主动性
Y1 有效活动
时间比率
X2 工作动机
注 意
测量的效度与信度都是一种相对量,而不是一种绝对
量,即它们都是一种“程度事物”。
(二)效度的类型 1、内容效度 它指的是测量内容或测量指标与测量目标之 间的适合性和逻辑相符性。 考察内容效度旨在系统地检查测量内容的适 当性,并根据我们对所研究的概念的了解去 鉴别测量内容是否反映了这一概念的基本内 容。检验内容效度就是检验由概念到指标的 经验推演是否符合逻辑,是否有效。 内容效度实质上是一个判断问题。