1_社会科学研究领域的定量分析过程与方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 理论:科学的逻辑层面 – 数据:观察层面 – 检验假定:比较预期的逻辑和实际观察之间的吻合度
提出问题
生成假定
理论
来自百度文库
检验假定
分析数据
收集数据
图1. 科学研究流程 注释:双向箭头表示相互影响,单向箭头表示先后顺序
理论
• 人们由实践概括出来的关于自然界和社会的系统结论;对某些特定现 象的系统解释
– 对客体概括性的归纳和总结 – 在观察到的现象和概念之间建立一种联系 – 用以解释个体或群体之间两个或多个可观察的属性关系,解释为什
• 宏观理论难以检验
中层理论(middle range theory)
• Merton(1968)提出了介于宏观模式和微观分析框架之间的中层理论 • 中层理论继承社会学的古典传统,即设想社会学能像物理学那样,建
立一些颠扑不破的铁律 • 中层理论虽也涉及抽象概念,但它始于有限的社会现象,且其抽象概
念得到可观察到的数据的支持或反证 • 与宏观理论最大的不同之处在于,它有许多并存的小理论,适用于有
步骤 II:生成假定
• 研究背景的回顾 • 理论模型的构建 • 理论假定的生成
假定的生成
• 假定是两个变量之间关系的陈述,也即是未经检验 的、对研究问题的回答
– 假定是尝试性的,尚未经过实证的检验或核实
• 假定不必是正确的,但必须是可以经过检验的 • 假定关注事物之间的因果关系。例如:
– 教育程度越高,收入越高 – 男性的收入高于女性的收入 – 女性占绝大多数的职业的收入水平低于男性占绝大多数
• 自变量和因变量之间的关系可以表现为不同的性质
– 正关系:指自变量水平的增加(因)导致因变量相应的增加 (果),反之亦然;在正关联中,自变量和因变量的变化的方向 一致:
– 负关系:指自变量水平的增加导致因变量相应的降低,反之亦然; 在负关联中,自变量和因变量的变化的方向相反
– 性质不明确:有时,在生成假定时,我们并不明确因果的正负方 向。但这并不意味着两个变量之间缺乏联系,而只表明,我们不 知道他们是如何相关的
因果关系的类型
• 直接因果关系。 一个因素对另一个因素发生直接作用。 如父母的收入与子女的教育机会
• 间接因果关系。一个因素对另一个因素的影响是通过第三 个(中间)因素实现的。如温度与犯罪之间的关系
• 直接和间接因果关系。一个因素通过直接和间接双重路径 对另一个因素发生影响。如性别对收入的作用
• 受到调节的因果关系 • 虚假的因果关系。一个因素对另一个因素的影响实际上并
么一种现象以一种特殊的方式与另一种现象相关联
• 理论关心的是是什么(what is)和为什么(why)、而不是应该 (should be)如何。理论不是价值判断,而是对事物之间联系的系 统的、言之成理的客观描述、总结和解释
• 理论与方法论关系:车之两轮、鸟之双翼
• 因研究、解释的对象和构建的不同可以分为三个层次:宏观理论,中 层理论和微观理论
• 客观问题不能只靠推理、设想、道德判断等方法来回答;实证研究方法 • 主观问题,表达个人的价值判断(好/坏)。比如:
– 城市的生活方式比农村的生活方式更好吗? – 男性比女性更适合担任领导工作吗?
• “更好”、“更适合”:主观成分,不能被直接检验;需要重新定义 • 通过将主观问题客观化,带有个人主观价值判断的问题就演变成对客观
• 时间顺序(time order):假定之因必须发生在假定之果之 前;
• 真实关系(nonspuriousness):两个因素之间的关系必须 是真实的,不能被其它因素所取代。只有排除因素之间的 虚假关系(spuriousness)——两个变量之间巧合性的统计 关系,实际上是由第三个变量引起的——后,才能真正建 立两个因素之间的因果关系
(discrete variable) (属性互不相连,完全和排斥的类别) • 按存在方式区分:内生变量(endogenous variable)或外生
变量(exogenous variable):例如 • 自变量:
– 按研究问题区分:主要自变量vs. 控制变量
变量的内生关联性(endogeneity)I
– 用眼观察,用心感受形形色色的社会现象 – 从新闻媒体、个体体验和直觉中获得启示 – 从与他人的交谈中开启思路 – 从文献的检索中得到灵感,帮助提出合适的研究问题
主观问题和客观问题
• 客观问题,描述客观现象之间的关联(是/否)。比如:
– 父母的收入水平影响子女的教育程度吗? – 限制性的生育政策导致了出生性别比的失衡吗?
研究工作的起点是研究问题的提出,包括: • 研究问题的提出 • 研究内容的确定 • 研究对象的选择 • 研究概念的界定
如何提出研究问题
• 研究问题的好坏直接影响研究的意义和价值,成果去向、 用途和影响
• 研究问题:具有明确的实际意义和(或)学术意义 • 如何提出新颖且有价值的研究问题? • 能否提出问题、提出怎样的问题? • 如何弥补资料积累不多、阅历不深的不足呢?
宏观理论(grand theory;total theory; paradigm)
• 社会科学家往往尝试着构建一个完整的理论体系,以便更 为精确地解释事物原理和社会生活的一些共性特征,并最 终揭示社会客体的本质
• 这样的理论往往着眼于大的社会结构或体制。比如:
– 马克思的资本理论、辩证唯物主义和历史唯物主义理论 – 韦伯的官僚体制效率理论 – 帕森斯的结构功能理论
• 概念化缩小研究范围,使研究更具有可行性和操作性 • 概念可大可小。有的相对抽象、较为模糊
– 若是想对某个事情(物)获得一个“思想把手”,从而更清楚地 将自己的观点对他人表达出来的话,这样的概念多比较模糊
– 个体“经济成功”:为什么有些人经济上取得很大成就,而其他 人却未能成功
• 概念也可以是比较具体、容易被观察或体验,比如生育率
• 研究过程:探求事物原理和关联时遵从的一系列行为;研 究方法:研究过程实施的手段。方法寓于过程之中,也指 导研究过程和步骤的实施。通过这些行为和方法,研究者 最终得以回答研究问题
• 定量研究的5个基本步骤和过程:
– 提出问题、生成假定、收集数据、分析数据、检验假定
• 与理论互动,既被理论影响,也验证理论的适应性
事物之间关系的描述了,也成为可经实证检验的科学研究问题了
确认研究总体(Population/Universe)
• 在提出研究问题的过程中,同时也确定了(1)研究目的; (2)研究内容;(3)研究总体
• 总体:理论上研究要素的特定集合体 • 以人为研究对象的总体:社会科学和行为科学领域的主要
研究对象是人
步骤三:收集收据
省略
步骤IV:数据的分析
• 样本的确定 • 变量的定义 • 描述性统计 • 推断性统计
在这个阶段,统计分析在研究过程中扮演十分重要的角色
样本(sample)与总体
• 在提出研究问题的同时,需要认定研究总体
• 总体与样本 • 样本不同于总体,但来自于总体,是总体的一部份。比如
– 一位老师想知道大学一年级学生的平均年龄。如何获得相关资料? – 一位研究生打算检验婚姻市场上“甲女丁男”的现象是否成立。如
– “大研究机构”:什么是“大”?学生的数量、老师的数量、校园 的面积?
概念 成绩好 智力 年轻 经济成功
表1. “概念、变量、属性”之间的关系
变量 平均成绩 IQ测试 年龄 年收入
属性 每个学生的成绩介于A-F之间 每个个体都有一个介于某个区间的数值 青年、中年、老年 $50000-100000等
– 对理论理解的欠缺 – 对研究方法掌握的不足 – 对研究过程和方法本身的不了解,等等
目的
• 勾勒出社会科学(尤其是社会学和人口学研究领域)定量 研究过程
• 探讨在此过程中需要遵循的行为规范 • 寻求整合研究理论与数据处理的最优途径 • 演绎法(deduction)和归纳法(induction)
– 演绎法从一般到个别,即从(1)逻辑或理论上预测的模式到(2) 观察检验预期的模式是否确实存在;换言之,演绎法是从“为什 么”推延到“是否”
• 不是所有的研究问题或与此相关的概念都与人有关。“大 学”、人口的年龄分布、犯罪率、职业机会
量化概念
• 变量:概念的可衡量指标。 概念相对抽象;变量具体、能 被观察和衡量;被观察到的特性即属性。比如:
– 将年收入在10万元以上的个体定义为经济成功。“经济成功”=概念, “年收入”=变量,具体的收入水平=属性
不存在。相反,这两个因素都是由一个共同因素而决定的
直接关系
父母的收 入水平
子女的教 育机会
间接关系
温度
户外活 动时间
犯罪率
直接和间接关系 职业
性别
收入
调节关系
性别观念 生育政策
的强弱 社会经济
现代科技
出生性别 比失衡
其它因素
虚假关系
火灾规 模
派出救火 车的数量
损失大小
假定的类型
• 假定描述两个变量之间的关系,且通常是因果关系:“是 什么引起了什么”。假定的“引起变量”即为自变量,而 假定的“被引起变量”为因变量
• 变量的内生关联性之源包括
– 双向因果关系 – 遗漏变量偏误(omitted variable bias) – 选择性偏误(sample selection bias)
• 以教育与收入的关系为例:
y b1 * x1 b2 * x2 e
其中,y=收入;x1 = 教育水平;x2=其它因素 • x1与y可能存在内生关联性,因为被忽略的第三者(比如“智力”)
– 在类似的职场中,由于工作类型不同,女性的收入也多低于男性
• IT领域:男性为主(职场分割);女性很少能升迁到高层管理部门(职 业分割)
• 两性行业和职业的不同可能是造成收入不公的直接原因
• 职场分割影响两性收入不公是分析理论。但该理论命题是 否正确,只有在经过反复检验和修正后才能确定
步骤 I:提出问题
的职业的收入水平
因果关系存在的条件
• 相关关系——二者同变(co-vary)。一个因素的变化必然 导致另一个因素的变化。换言之,两个因素之间必须存在 直接或间接的逻辑关系,而不是风马牛不相及的。然而, 同变(co-variation)虽是因果关系的必要条件,但不是充 分条件。因果关系的存在还必须满足以下前提:
何获得相关资料?
• 根据样本得出的特征不一定完全等同于总体特征,但若样 本选择恰当、具有代表性的话,其分析结果可能十分接近 总体特征,并可推断到全部人群——从样本中发现的规律 也就是整个人群的特征和规律
变量
• 按因果关系区分:自变量 vs. 因变量 • 按衡量方式区分:连续变量(continuous variable) 和离散变量
– 人们为什么会做出这样的举动,而不是其它举动 – 为什么有的育龄妇女子女众多,而有的很少,甚至不生孩子 – 为什么男性的收入高于女性
• 全体人群、所有育龄妇女、全体男性和女性 = 总体
• 以非人为研究对象的总体:组织机构、制度、物品等
定义概念
• 概念指物体(如,书本)、行为(如,犯罪)、观点(如, 成绩好)或现象(如,年轻),等等
第一章 社会科学领域的定量分析过程与方法
导论
• 社会科学研究:探究事情的真相,关注事物之间的联系及其原因
• 同一个体的不同特征之间 • 不同个体之间 • 个体与群体之间 • 个体与社会制度之间
• 合适的理论,科学的方法,合理的步骤有助于有效地发掘事物之间关 联的显性和潜在机制
• 一个普遍的问题:理论、方法和与经验材料分析的脱节。原因:
限的数据,可以解释社会生活多面面现象。比如:
– 社会流动理论 – 角色冲突理论 – 行为失范理论 – 代际权力转移理论
微观理论(conceptual/analytical framework)
• 即分析框架,以解释日常现象和事件。如:两性收入不公
• 职业和行业的性别差异、职场的性别分割
– 男性和女性从事不同的工作。女性工作往往收入较低,声望较差, 升迁机会较少;职场的性别分割影响两性职业声望,导致收入差异
可能同时影响教育和收入,即个人的智力同时导致了教育水平的高低 和收入的多寡,而不是教育影响收入 • 如果不对内生关联性问题进行处理的话,分析结果可能产生偏误
– 归纳推理从个别到一般,从一系列特定的观察中,发现一种模型, 在一定程度上代表所有给定时间的秩序
– 两种途径的结合可以寻求人们对事物更有力、更完整的理解
本章主要内容
1.1.理论的作用 1.2.提出问题 1.3.生成假定 1.4.收集数据 1.5.分析数据 1.6.假定检验 1.7.分析结果陈述
研究过程与方法
相关文档
最新文档