第五讲 实验、纵向及截面设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
将约5000个低收入家庭随机分配到不同的计划中 (没有收入支持、有短期支持、长期有保证的收入)
在众多被测量的变量中有测量工作努力度和婚姻稳定 性的变量
研究者从实验一开始直至整个实验过程的不同时点分 别对这些变量进行测量
参加实验的过程中,这些家庭过着他们的正常生活, 并将受到研究期间所有的变动经历的影响和其他变化 的影响(例如政治变化和社会变化)
(8)同期群序列设计:有的群经过一段时间 后就退出研究(与转轮式追踪调查设计类似)
2、回溯性设计 (1)回溯性追踪调查设计 前瞻性追踪调查设计的优缺点
问题:记忆的扭曲 当我们处理难忘的事件的时候,这种方法比
较可靠
(2)记录连接设计 官方记录 缺陷:难以获得;数据的局限性
干预或者仅仅是自然观察) 设计中包含一个“实验组”,可以用来测量变化。
由于缺少随机控制组,引起一个问题:无法知道变化 究竟是由研究者的“干预”,还是时间的逝去或其他 影响引起的。
替代方案:选择大且多样性的样本,测定在一段时间 内,哪些人经历了“干预”而哪些人没有,因而产生 对照组。作用有限,但有价值
结果等同于无前测方法
但是如果是小样本,不能保障随机化,组间的初始 状态可能有差异,就需要使用前测来测量变化
4、因子设计——评估多个自变量的交互影响
表5-4 因子设计
分组的方法 随机分组
时间1(T1) 实验干预 前测 (X1和X2)
工作满意度 高控制男性 测量(Y)
随机分组
工作满意度 低控制男性 测量(Y)
——不能,因为这种变化可能与某一历史阶 段有关
那么,如何区分成长效应和历史(时期)效 应呢?
——跨时间追踪不同年龄的群体
表5-5 发展影响:同期群在1980-2000年间政治保守程度的变化
同期群出 1980年时 保守分 1990年时 保守分 2000年时 保守分 生年月 的年龄群 值 的年龄群 值 的年龄群 值
1920-9 51~60 50 61~70 50 71~80 50 1930-9 41~50 40 51~60 40 61~70 40 1940-9 31~40 30 41~50 30 51~60 30 1950-9 21~30 20 31~40 20 41~50 20 1960-9 11~20 10 21~30 10 31~40 10
随机分组 均值=50 (控制组) 随机分组 无 (控制组)
无处理 无处理
均值=60 均值=50
控制组间的 差异为10 (60-50), 这个归因于 工具反应
将工具反应去除,干预的真实影响就是消除了工具 反应的实验组和控制组之间的差异。这种情况下的 实验组得分为70,而控制组得分为50,我们可以推 断干预具有20分的影响
1、描述变化模式及稳定性 2、建立时间序列 因果分析的前提是时间顺序 思考:如何确定失业与心理健康之间的关系? 截面设计: 纵向设计:
3、确立成长(年龄)效应
政治保守主义在老年人中比在青年人中要明显 得多,如何理解?
解释方案1:人们随着年龄的增长而变得保守。 他们可能变得没有冒险精神,需要更大的确 定性,或者对那些宣称变化会使世界更美好 的人持更加怀疑的态度
解释方案2:时代特征,比如说20世纪30年 代大萧条时期成长起来的一代人有着经济上 没有保障的经历,这可能是他们在政治上趋 保守的原因
解决方案:在一段时期内追踪相同的个体, 看他们是否随着年龄的增长而发生变化
ຫໍສະໝຸດ Baidu
4、确立历史(时期)效应
前例中,如果在一定时间跨度内追踪一群年 轻人,发现他们趋于保守,能否确定这一成 长效应?
(2)多重时间点前瞻性追踪调查设计 与前面类似,只是增加收集数据的时点 目的: ——考察长期和短期效应 ——当发生变化时进行追踪 ——描述变化的“形式” ——识别变化(或无变化)前的因素
(3)无替换单个追踪调查设计
(4)有替换单个追踪调查设计
通常是匹配替换,丧失随机性
突发性群体事件 自然灾害 社会动荡 (孪生子的故事)
(五)分析实验数据
实验分析的核心是组间比较
在比较中,需要强调三点: 1)比较应聚焦于组而不是个人 2)在对差异的重要性作出判断之前,需要确定实
验组和控制组之间差异多大才算显著 3)要用结果变量进行组间比较
其他
相互竞争的事前模型中,究竟哪个与数据拟 合得最好 4)可以用截面数据来评估和修正一个给定的 事前模型
测量结果变 量(Y)
测量结果变 量(Y)
测量结果变 量(Y)
做法:增加不进行前测的实验组和控制组
表5-3 所罗门四组设计举例
分组的方法 时间1(T1)干预 前测
时间2(T2) 后测
随机分组 均值=50 (实验组) 随机分组 无 (实验组)
处理 处理
均值=80 均值=70
实验组间的 差异为10 (80-70), 这个归因于 工具反应
1920-9 51~60 50 61~70 60 71~80 70 1930-9 41~50 40 51~60 50 61~70 60 1940-9 31~40 30 41~50 40 51~60 50 1950-9 21~30 20 31~40 30 41~50 40 1960-9 11~20 10 21~30 20 31~40 30
时间1(T1) 干预 前测
投票意愿% 强制,无制裁
时间2(T2) 后测
投票意愿%
投票意愿% 强制,警告初犯 投票意愿%
投票意愿% 强制,轻度罚款 投票意愿%
投票意愿% 强制,严厉罚款 投票意愿%
投票意愿% 无强制
投票意愿%
3、所罗门四组设计——有助于评估变量结果 是不是由工具反应导致的
工具反应:当有前测和后测阶段时,即使没 有任何干预,这些测量本身也会让测量对象 产生一些变化。
在某种程度上,变化是由测量而不是实验处 理导致的。
表5-2 所罗门四组设计
分组的方法
随机分组 (实验组) 随机分组 (实验组) 随机分组 (控制组) 随机分组 (控制组)
时间1(T1) 干预 前测
测量结果变 处理 量(Y)
无
处理
测量结果变 量(Y)
无
无处理 无处理
时间2(T2) 后测
测量结果变 量(Y)
米尔格拉姆实验 baike./view/1672946.htm
伦理议题:斯坦福监狱实验 baike./view/402672.htm
二、纵向设计
测量穿越时间的变化,并收集至少两个时间 点上的数据(类似于实验设计的前测和后测)
与实验不同的是,纵向设计一般没有随机分 派的控制组
(三)更复杂的实验设计
我们可以通过引进两个以上的小组、增加额 外的前测和后测、引入更多的自变量等方式 来丰富经典实验设计
1、多重后测——有助于辨别短期和长期结果 (孪生子的故事)
婚姻法的影响
2、多组
表5-1 强制投票对选举出席人数的影响
分组的方法
随机分组 (实验组1) 随机分组 (实验组2) 随机分组 (实验组3) 随机分组 (实验组4) 随机分组 (控制组)
表5-6显示,保守性得分是由人们何时出生决 定的
这样不同同期群保守性的差异就是由于历史 效应而不是因为成长效应产生的。
5、生命历程“生涯”分析 吸毒与亚文化的关系
(二)纵向设计的类型
1、前瞻性追踪调查设计 (1)简单前瞻性追踪调查设计 收集相同样本在两个时间点上的数据(可以积极制造
例如,研究有孩子是否会促使人们在政治上更为保守
设计:比较有孩子组和没孩子组的政治保守水平
由于任何小组之间的不同均可以归因于亲子关系之外 的因素,我们应该收集其他关于家庭的信息,并且对 两个组进行配对,这样我们可以将两个相似的组进行 比较。
然而,我们仍不能确定,有孩子是否会导致政治观点 上的变化,为了检验这个命题,我们可以要求参加者 描述他们在有孩子之前、较早的某个时期的政治观点。
考察生育孩子对家庭性别分工的影响
从一个无子女夫妇样本开始,观察男女双方各自负 担的家庭工作的范围
之后持续观察这些家庭,可能有些有了孩子,而有 些没有
将有子女的分为一组,没有的分为另一组,观察两 组家庭分工的差异
问题:两组可能差异很大,可能是其他因素影响家 庭分工
解决方案:扩大样本,收集相关信息——统计控制 方法可以提高论证水平
组不施加严格的进入程序 4)实验组的进入程序完成后,同时测量两组
成员的“成员对群体吸引力的感受” 5)比较实验组和控制组变化的差异
概念界定和操作化
“成员对群体吸引力的感受” “加入的难度”
(二)简单的实验设计
1、单控制组后测设计 随机方法分组,省略前测阶段
2、回溯性实验设计:运用策略提供虚构“前 测”
除去无前测实验外,实验设计主要是一种特 殊的纵向设计类型(追踪研究)
重要决定
是否需要追踪同一个个案
趋势研究(重复的截面研究):在不同的时 间收集可以进行比较的样本的信息,但没有 必要针对同一群人
追踪研究:对同一群人进行重复调查
是否需要在同一时点上收集数据
回溯性追踪调查设计
(一)纵向设计的目的
为了区别成长(年龄)效应和历史(同期群/时期) 效应,我们需要跨时间考察多个同期群。
如果同期群没有随着年龄增长而变得更加保 守,则说明不存在成长效应
但是,可能出现下列情况:
表5-6 时期影响:同期群在1980-2000年间政治保守程度的变化
同期群出 1980年时 保守分 1990年时 保守分 2000年时 保守分 生年月 的年龄群 值 的年龄群 值 的年龄群 值
思考
可能出现什么问题? T1到T2期间控制不足的问题,危险在于导致
观察差异的原因往往是没有得到控制的事件 而不是实验干预。
至少如下两种情形会导致此类问题的发生: 1)一个组可能比另一个组更容易受到额外因
素的影响 2)外部因素可能与实验干预交互作用
自然实验
依赖自然发生的事件为干预,而不是依赖实验者引 入的干预
随机分组
工作满意度 高控制女性 测量(Y)
随机分组
工作满意度 低控制女性 测量(Y)
时间2(T2) 后测
工作满意度 测量(Y)
工作满意度 测量(Y)
工作满意度 测量(Y)
工作满意度 测量(Y)
(四)实验设计的不同方式
1、实验室法 2、田野实验 3、自然实验
田野实验
70年代,西雅图/丹佛收入维持实验:确定工作者最 低收入保障对工作努力度和参加者婚姻稳定度的影响
第五讲 实验、纵向及截面设计
一、实验设计
(一)经典实验设计
课堂讨论:
如果我们要检验命题1:一个人越难加入一个 群体,这个群体对这个人越发显得有吸引力
应该如何进行实验设计?
经典实验研究的步骤:
1)将人们随机分成两组:实验组和控制组 2)对“成员对群体吸引力的感受”进行测量 3)对实验组施加严格的进入程序,而对控制
在这个例子中,表5-5显示,每个同期群在保守性上 每10年就增加10分,而且,所有的同期群显示了相 似的变化程度,这种变化与特定的历史时期无关。
简而言之,不是历史时期,而是时间造就了这种变 化——成长效应
如果只追踪一个同期群(比如50年代),我们观察 到随着年龄的增长他们变得越来越保守。但是,我 们不知道这是由于年龄增长造成的,还是由于这个 特定的同期群有些与众不同才使得他们更加保守, 因为他们生长在60-70年代。
(5)轮转式追踪调查设计
做法:建立一系列相同样本组,每个相同样本组从 不同时间开始,但是在时间上至少与其他某些相同 样本有重叠
好处:每个相同样本组都有个时间限制,因此参与 者不会感到疲劳,而研究可以无限制延伸;可以集 中所有的相同样本进行截面研究
(6)单个同期群设计
(7)多个同期群设计
3、准纵向设计(趋势研究) (1)模拟前、后测设计 (2)重复的截面设计
三、截面设计
三个明显特征: 1)无时间维度 2)着眼于既存的差异,而非引入干预因素所
产生的变化 3)根据既存的差异而不是随机分配来分组
用途: 1)描述性分析 2)确定因果关系的不存在是很有效的 3)可以帮助我们评价在根据理论获得的多个
在众多被测量的变量中有测量工作努力度和婚姻稳定 性的变量
研究者从实验一开始直至整个实验过程的不同时点分 别对这些变量进行测量
参加实验的过程中,这些家庭过着他们的正常生活, 并将受到研究期间所有的变动经历的影响和其他变化 的影响(例如政治变化和社会变化)
(8)同期群序列设计:有的群经过一段时间 后就退出研究(与转轮式追踪调查设计类似)
2、回溯性设计 (1)回溯性追踪调查设计 前瞻性追踪调查设计的优缺点
问题:记忆的扭曲 当我们处理难忘的事件的时候,这种方法比
较可靠
(2)记录连接设计 官方记录 缺陷:难以获得;数据的局限性
干预或者仅仅是自然观察) 设计中包含一个“实验组”,可以用来测量变化。
由于缺少随机控制组,引起一个问题:无法知道变化 究竟是由研究者的“干预”,还是时间的逝去或其他 影响引起的。
替代方案:选择大且多样性的样本,测定在一段时间 内,哪些人经历了“干预”而哪些人没有,因而产生 对照组。作用有限,但有价值
结果等同于无前测方法
但是如果是小样本,不能保障随机化,组间的初始 状态可能有差异,就需要使用前测来测量变化
4、因子设计——评估多个自变量的交互影响
表5-4 因子设计
分组的方法 随机分组
时间1(T1) 实验干预 前测 (X1和X2)
工作满意度 高控制男性 测量(Y)
随机分组
工作满意度 低控制男性 测量(Y)
——不能,因为这种变化可能与某一历史阶 段有关
那么,如何区分成长效应和历史(时期)效 应呢?
——跨时间追踪不同年龄的群体
表5-5 发展影响:同期群在1980-2000年间政治保守程度的变化
同期群出 1980年时 保守分 1990年时 保守分 2000年时 保守分 生年月 的年龄群 值 的年龄群 值 的年龄群 值
1920-9 51~60 50 61~70 50 71~80 50 1930-9 41~50 40 51~60 40 61~70 40 1940-9 31~40 30 41~50 30 51~60 30 1950-9 21~30 20 31~40 20 41~50 20 1960-9 11~20 10 21~30 10 31~40 10
随机分组 均值=50 (控制组) 随机分组 无 (控制组)
无处理 无处理
均值=60 均值=50
控制组间的 差异为10 (60-50), 这个归因于 工具反应
将工具反应去除,干预的真实影响就是消除了工具 反应的实验组和控制组之间的差异。这种情况下的 实验组得分为70,而控制组得分为50,我们可以推 断干预具有20分的影响
1、描述变化模式及稳定性 2、建立时间序列 因果分析的前提是时间顺序 思考:如何确定失业与心理健康之间的关系? 截面设计: 纵向设计:
3、确立成长(年龄)效应
政治保守主义在老年人中比在青年人中要明显 得多,如何理解?
解释方案1:人们随着年龄的增长而变得保守。 他们可能变得没有冒险精神,需要更大的确 定性,或者对那些宣称变化会使世界更美好 的人持更加怀疑的态度
解释方案2:时代特征,比如说20世纪30年 代大萧条时期成长起来的一代人有着经济上 没有保障的经历,这可能是他们在政治上趋 保守的原因
解决方案:在一段时期内追踪相同的个体, 看他们是否随着年龄的增长而发生变化
ຫໍສະໝຸດ Baidu
4、确立历史(时期)效应
前例中,如果在一定时间跨度内追踪一群年 轻人,发现他们趋于保守,能否确定这一成 长效应?
(2)多重时间点前瞻性追踪调查设计 与前面类似,只是增加收集数据的时点 目的: ——考察长期和短期效应 ——当发生变化时进行追踪 ——描述变化的“形式” ——识别变化(或无变化)前的因素
(3)无替换单个追踪调查设计
(4)有替换单个追踪调查设计
通常是匹配替换,丧失随机性
突发性群体事件 自然灾害 社会动荡 (孪生子的故事)
(五)分析实验数据
实验分析的核心是组间比较
在比较中,需要强调三点: 1)比较应聚焦于组而不是个人 2)在对差异的重要性作出判断之前,需要确定实
验组和控制组之间差异多大才算显著 3)要用结果变量进行组间比较
其他
相互竞争的事前模型中,究竟哪个与数据拟 合得最好 4)可以用截面数据来评估和修正一个给定的 事前模型
测量结果变 量(Y)
测量结果变 量(Y)
测量结果变 量(Y)
做法:增加不进行前测的实验组和控制组
表5-3 所罗门四组设计举例
分组的方法 时间1(T1)干预 前测
时间2(T2) 后测
随机分组 均值=50 (实验组) 随机分组 无 (实验组)
处理 处理
均值=80 均值=70
实验组间的 差异为10 (80-70), 这个归因于 工具反应
1920-9 51~60 50 61~70 60 71~80 70 1930-9 41~50 40 51~60 50 61~70 60 1940-9 31~40 30 41~50 40 51~60 50 1950-9 21~30 20 31~40 30 41~50 40 1960-9 11~20 10 21~30 20 31~40 30
时间1(T1) 干预 前测
投票意愿% 强制,无制裁
时间2(T2) 后测
投票意愿%
投票意愿% 强制,警告初犯 投票意愿%
投票意愿% 强制,轻度罚款 投票意愿%
投票意愿% 强制,严厉罚款 投票意愿%
投票意愿% 无强制
投票意愿%
3、所罗门四组设计——有助于评估变量结果 是不是由工具反应导致的
工具反应:当有前测和后测阶段时,即使没 有任何干预,这些测量本身也会让测量对象 产生一些变化。
在某种程度上,变化是由测量而不是实验处 理导致的。
表5-2 所罗门四组设计
分组的方法
随机分组 (实验组) 随机分组 (实验组) 随机分组 (控制组) 随机分组 (控制组)
时间1(T1) 干预 前测
测量结果变 处理 量(Y)
无
处理
测量结果变 量(Y)
无
无处理 无处理
时间2(T2) 后测
测量结果变 量(Y)
米尔格拉姆实验 baike./view/1672946.htm
伦理议题:斯坦福监狱实验 baike./view/402672.htm
二、纵向设计
测量穿越时间的变化,并收集至少两个时间 点上的数据(类似于实验设计的前测和后测)
与实验不同的是,纵向设计一般没有随机分 派的控制组
(三)更复杂的实验设计
我们可以通过引进两个以上的小组、增加额 外的前测和后测、引入更多的自变量等方式 来丰富经典实验设计
1、多重后测——有助于辨别短期和长期结果 (孪生子的故事)
婚姻法的影响
2、多组
表5-1 强制投票对选举出席人数的影响
分组的方法
随机分组 (实验组1) 随机分组 (实验组2) 随机分组 (实验组3) 随机分组 (实验组4) 随机分组 (控制组)
表5-6显示,保守性得分是由人们何时出生决 定的
这样不同同期群保守性的差异就是由于历史 效应而不是因为成长效应产生的。
5、生命历程“生涯”分析 吸毒与亚文化的关系
(二)纵向设计的类型
1、前瞻性追踪调查设计 (1)简单前瞻性追踪调查设计 收集相同样本在两个时间点上的数据(可以积极制造
例如,研究有孩子是否会促使人们在政治上更为保守
设计:比较有孩子组和没孩子组的政治保守水平
由于任何小组之间的不同均可以归因于亲子关系之外 的因素,我们应该收集其他关于家庭的信息,并且对 两个组进行配对,这样我们可以将两个相似的组进行 比较。
然而,我们仍不能确定,有孩子是否会导致政治观点 上的变化,为了检验这个命题,我们可以要求参加者 描述他们在有孩子之前、较早的某个时期的政治观点。
考察生育孩子对家庭性别分工的影响
从一个无子女夫妇样本开始,观察男女双方各自负 担的家庭工作的范围
之后持续观察这些家庭,可能有些有了孩子,而有 些没有
将有子女的分为一组,没有的分为另一组,观察两 组家庭分工的差异
问题:两组可能差异很大,可能是其他因素影响家 庭分工
解决方案:扩大样本,收集相关信息——统计控制 方法可以提高论证水平
组不施加严格的进入程序 4)实验组的进入程序完成后,同时测量两组
成员的“成员对群体吸引力的感受” 5)比较实验组和控制组变化的差异
概念界定和操作化
“成员对群体吸引力的感受” “加入的难度”
(二)简单的实验设计
1、单控制组后测设计 随机方法分组,省略前测阶段
2、回溯性实验设计:运用策略提供虚构“前 测”
除去无前测实验外,实验设计主要是一种特 殊的纵向设计类型(追踪研究)
重要决定
是否需要追踪同一个个案
趋势研究(重复的截面研究):在不同的时 间收集可以进行比较的样本的信息,但没有 必要针对同一群人
追踪研究:对同一群人进行重复调查
是否需要在同一时点上收集数据
回溯性追踪调查设计
(一)纵向设计的目的
为了区别成长(年龄)效应和历史(同期群/时期) 效应,我们需要跨时间考察多个同期群。
如果同期群没有随着年龄增长而变得更加保 守,则说明不存在成长效应
但是,可能出现下列情况:
表5-6 时期影响:同期群在1980-2000年间政治保守程度的变化
同期群出 1980年时 保守分 1990年时 保守分 2000年时 保守分 生年月 的年龄群 值 的年龄群 值 的年龄群 值
思考
可能出现什么问题? T1到T2期间控制不足的问题,危险在于导致
观察差异的原因往往是没有得到控制的事件 而不是实验干预。
至少如下两种情形会导致此类问题的发生: 1)一个组可能比另一个组更容易受到额外因
素的影响 2)外部因素可能与实验干预交互作用
自然实验
依赖自然发生的事件为干预,而不是依赖实验者引 入的干预
随机分组
工作满意度 高控制女性 测量(Y)
随机分组
工作满意度 低控制女性 测量(Y)
时间2(T2) 后测
工作满意度 测量(Y)
工作满意度 测量(Y)
工作满意度 测量(Y)
工作满意度 测量(Y)
(四)实验设计的不同方式
1、实验室法 2、田野实验 3、自然实验
田野实验
70年代,西雅图/丹佛收入维持实验:确定工作者最 低收入保障对工作努力度和参加者婚姻稳定度的影响
第五讲 实验、纵向及截面设计
一、实验设计
(一)经典实验设计
课堂讨论:
如果我们要检验命题1:一个人越难加入一个 群体,这个群体对这个人越发显得有吸引力
应该如何进行实验设计?
经典实验研究的步骤:
1)将人们随机分成两组:实验组和控制组 2)对“成员对群体吸引力的感受”进行测量 3)对实验组施加严格的进入程序,而对控制
在这个例子中,表5-5显示,每个同期群在保守性上 每10年就增加10分,而且,所有的同期群显示了相 似的变化程度,这种变化与特定的历史时期无关。
简而言之,不是历史时期,而是时间造就了这种变 化——成长效应
如果只追踪一个同期群(比如50年代),我们观察 到随着年龄的增长他们变得越来越保守。但是,我 们不知道这是由于年龄增长造成的,还是由于这个 特定的同期群有些与众不同才使得他们更加保守, 因为他们生长在60-70年代。
(5)轮转式追踪调查设计
做法:建立一系列相同样本组,每个相同样本组从 不同时间开始,但是在时间上至少与其他某些相同 样本有重叠
好处:每个相同样本组都有个时间限制,因此参与 者不会感到疲劳,而研究可以无限制延伸;可以集 中所有的相同样本进行截面研究
(6)单个同期群设计
(7)多个同期群设计
3、准纵向设计(趋势研究) (1)模拟前、后测设计 (2)重复的截面设计
三、截面设计
三个明显特征: 1)无时间维度 2)着眼于既存的差异,而非引入干预因素所
产生的变化 3)根据既存的差异而不是随机分配来分组
用途: 1)描述性分析 2)确定因果关系的不存在是很有效的 3)可以帮助我们评价在根据理论获得的多个