CFPS家庭关系库的应用及常见问题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8
综 合 变 量 组
统计变量
身份类别 决策人 抽样信息
父母的综合 变量 家庭结构
fam_sum gene_n core_n genetype coremember
tf10pid
subpopulation subsample fbirth12 mbirth12 feduc12 meduc12 Generation
同灶吃饭成员的总人数 同灶吃饭中基因成员人数 同灶吃饭中核心成员人数 所属基因成员类型 是否是核心成员
家庭重大事件决策人样本编码
抽样子总体 是否在全国再抽样样本中 父亲出生年份(综合变量) 母亲出生年份(综合变量) 父亲最高学历(综合变量) 母亲最高学历(综合变量) 家庭代际数
09/13/2015
A
leavingtime_m_p 个人离家的月份
个人是否与该家庭同
co_a12_p
灶吃饭
过去一个月外出成员
e7_a_p
是否给家里寄钱
外出成员给家里寄钱
离家人与家 e701_a_p
金额
庭经济联系
过去一个月家里是否
E8_a_p
给外出成员寄钱
家里是否给外出成员
E801_a_p
寄钱金额
A
是否物理外出
是否经济联系 在一起 追访物理外出 成员独有
数据存储的问题 恢复3位码
8. CFPS没有定义“家庭户主”, 但是在实际研究中需要定义户主,请
给出定义户主的建议。 家庭主事人(2010) 重要事件决策人(2012) 最熟悉家庭财务的成员(2012) 房产证上的成员
中的数量多呢?多出的来自哪里?
个人问卷生成规则 + 未完访
6.变量值为“-8”表示的“不适用”和其它值表示的“没有**”的区
别是什么?这会决定对该变量充分正确的使用。
“-8”表示没有采集该信息
09/13/2015
A
12
7. cfps2010年家庭数据库中的主事者的户内顺序号是1、2的个位数的
,想和家庭关系库的数据匹配,但是家庭关系库的个体家庭内部编号 是按101、102… … 不知道应该如何匹配呢?
配偶code变化: A: 1XX -> 4XX,局限是4XX新进入家庭,未进入? B:2XX -> 4XX,不能判断是否是同一个人
主要依据应该是成人数据库中问“是否是初婚 ”,关系库辅助使用。
09/13/2015
A
11
4.请问家庭关系问卷中父亲家庭内部编码有的为何是4开头?
户内3位码的编码规则
5.为什么家庭关系库中的家庭和个体总量要比成人、少儿问卷
09/13/2015
A
10
2.对比2010年数据库,成员的家庭关系有没有变更
?
两补充 + 一 更新
3.在2012年以4开头的是新进的人,那么是不是可以理解为2010年在
婚且2012年配偶家户号以4为开头的人,就是在2010到2012年间离婚又
再婚的人?如果可以这样理解,那么为什么在这些人中还有针对成人 问卷中“是否是初访配偶”的回答为“是”的情况呢?
追访成功 完访另组家庭
A
3
2012年
家庭成员
非家庭成员
非核心
核心
新进成员
09/13/2015
基因成员
原
在 家
需追 踪的 物理 离家
A
基因成员
需追 踪的 另组 离家
不追 踪的 物理 离家
不追
踪的 去 另组 世 离家
另组 家庭
4
大家庭里的幸福生活
43 2
43 1
40 1
09/13/2015
A
5
三、家庭关系库的结构
9
四、用户问题
1.对“CFPS同灶吃饭”这个的概念的理解?“不同灶吃饭”的原因应该
有哪些? 同灶吃饭:与家庭经济联系在一起
2012年不同灶吃饭的类别; 1.外出读书,且不需要家里养 2.外出工作、出境,且有正式工作不养家 或是没有正式工作不被家养 3.基因成员的在外且不需供养的新生子女 4.从家庭中分裂组成新家庭的: 分家、离婚、嫁出 5.特殊人群:出家、服刑、参军、去世
一组 变量
家庭 编码
成员编码 及基本信 息 (vars_p)
父亲编码 母亲编码 配偶编码 及基本信 及基本信 及基本信 息(vars_f) 息(vars_m) 息(vars_s)
孩子们编码 综合 及基本信息 变量组
(vars_ci)
家庭A
家庭B ……
A成员1
A成员2 ……
B成员1 ……
A成员3 ……
家庭关系库的应用及常见问题
戴利红
中国社会科学调查中心
北京大学 2015 年 9 月
A
1
基本概念
一.家庭层面
原家庭:调查前确定的追访家庭 另组家庭:调查中由原家庭分裂出来、且经济独立的新家庭样本
二、个人层面
基因成员:2010年所有家庭成员 + … + 往期调查的基因成员在 当期追访时的新生或是不超过10岁的领养子女
核心成员:关系人(父母、配偶、子女)中至少有一个是基因成 员的非基因成员。
非核心成员:关系人都不是基因成员的家庭成员
09/13/2015
A
2源自文库
二、成员构成
2010年
家庭成员
CFPS样本变化
2010年初访 2012年第一次追踪 2014年第二次追踪
09/13/2015
在家
同灶吃饭
物理 外出
未追成功
2010年家庭 2012年家庭
7
09/13/2015
变量名
变量标签
2012年个人是否在家
TB6_A12_p
住
TB601_A12_p
个人离家的原因
outpers_where12_ 离家人(个人)的居
家庭人员的 p
住区域
信息变量名 TB602ACODE_A12 离家人(个人)的省
_p
国标码
leavingtime_y_p 个人离家的年份
……
A成员2 ……
……
…… A成员3
……
…… A成员1
……
家庭成员
及离家人 员信息
家庭关系
网及关系 人信息
09/13/2015
A
6
成 员 变 量 组
09/13/2015
成员编码 家庭编码
家庭人员的 信息变量名
变量名 pid fid12 fid10 code_a_p
cfps_interv_p
TB1A_A_p TB1B_A_p TB1Y_A_p TB1M_A_p TB2_A_p ALIVE_A_p deathreason_p TB3_A12_p TB4_A12_p qa301_a12_p qa302_a12_p
变量标签 个人样本编号 2012年家户号 2010年家户号 个人家庭内部编码 个人产生有效问卷 的情况 个人属相 2012年个人年龄 个人出生(年) 个人出生(月) 个人性别 个人是否健在 个人去世的原因 个人婚姻状况 个人最高学历 个人户口类型 个人户口所在地
A
0:没有任何个人问卷 1:2012年有个人问卷 5:往期调查有个人问卷
综 合 变 量 组
统计变量
身份类别 决策人 抽样信息
父母的综合 变量 家庭结构
fam_sum gene_n core_n genetype coremember
tf10pid
subpopulation subsample fbirth12 mbirth12 feduc12 meduc12 Generation
同灶吃饭成员的总人数 同灶吃饭中基因成员人数 同灶吃饭中核心成员人数 所属基因成员类型 是否是核心成员
家庭重大事件决策人样本编码
抽样子总体 是否在全国再抽样样本中 父亲出生年份(综合变量) 母亲出生年份(综合变量) 父亲最高学历(综合变量) 母亲最高学历(综合变量) 家庭代际数
09/13/2015
A
leavingtime_m_p 个人离家的月份
个人是否与该家庭同
co_a12_p
灶吃饭
过去一个月外出成员
e7_a_p
是否给家里寄钱
外出成员给家里寄钱
离家人与家 e701_a_p
金额
庭经济联系
过去一个月家里是否
E8_a_p
给外出成员寄钱
家里是否给外出成员
E801_a_p
寄钱金额
A
是否物理外出
是否经济联系 在一起 追访物理外出 成员独有
数据存储的问题 恢复3位码
8. CFPS没有定义“家庭户主”, 但是在实际研究中需要定义户主,请
给出定义户主的建议。 家庭主事人(2010) 重要事件决策人(2012) 最熟悉家庭财务的成员(2012) 房产证上的成员
中的数量多呢?多出的来自哪里?
个人问卷生成规则 + 未完访
6.变量值为“-8”表示的“不适用”和其它值表示的“没有**”的区
别是什么?这会决定对该变量充分正确的使用。
“-8”表示没有采集该信息
09/13/2015
A
12
7. cfps2010年家庭数据库中的主事者的户内顺序号是1、2的个位数的
,想和家庭关系库的数据匹配,但是家庭关系库的个体家庭内部编号 是按101、102… … 不知道应该如何匹配呢?
配偶code变化: A: 1XX -> 4XX,局限是4XX新进入家庭,未进入? B:2XX -> 4XX,不能判断是否是同一个人
主要依据应该是成人数据库中问“是否是初婚 ”,关系库辅助使用。
09/13/2015
A
11
4.请问家庭关系问卷中父亲家庭内部编码有的为何是4开头?
户内3位码的编码规则
5.为什么家庭关系库中的家庭和个体总量要比成人、少儿问卷
09/13/2015
A
10
2.对比2010年数据库,成员的家庭关系有没有变更
?
两补充 + 一 更新
3.在2012年以4开头的是新进的人,那么是不是可以理解为2010年在
婚且2012年配偶家户号以4为开头的人,就是在2010到2012年间离婚又
再婚的人?如果可以这样理解,那么为什么在这些人中还有针对成人 问卷中“是否是初访配偶”的回答为“是”的情况呢?
追访成功 完访另组家庭
A
3
2012年
家庭成员
非家庭成员
非核心
核心
新进成员
09/13/2015
基因成员
原
在 家
需追 踪的 物理 离家
A
基因成员
需追 踪的 另组 离家
不追 踪的 物理 离家
不追
踪的 去 另组 世 离家
另组 家庭
4
大家庭里的幸福生活
43 2
43 1
40 1
09/13/2015
A
5
三、家庭关系库的结构
9
四、用户问题
1.对“CFPS同灶吃饭”这个的概念的理解?“不同灶吃饭”的原因应该
有哪些? 同灶吃饭:与家庭经济联系在一起
2012年不同灶吃饭的类别; 1.外出读书,且不需要家里养 2.外出工作、出境,且有正式工作不养家 或是没有正式工作不被家养 3.基因成员的在外且不需供养的新生子女 4.从家庭中分裂组成新家庭的: 分家、离婚、嫁出 5.特殊人群:出家、服刑、参军、去世
一组 变量
家庭 编码
成员编码 及基本信 息 (vars_p)
父亲编码 母亲编码 配偶编码 及基本信 及基本信 及基本信 息(vars_f) 息(vars_m) 息(vars_s)
孩子们编码 综合 及基本信息 变量组
(vars_ci)
家庭A
家庭B ……
A成员1
A成员2 ……
B成员1 ……
A成员3 ……
家庭关系库的应用及常见问题
戴利红
中国社会科学调查中心
北京大学 2015 年 9 月
A
1
基本概念
一.家庭层面
原家庭:调查前确定的追访家庭 另组家庭:调查中由原家庭分裂出来、且经济独立的新家庭样本
二、个人层面
基因成员:2010年所有家庭成员 + … + 往期调查的基因成员在 当期追访时的新生或是不超过10岁的领养子女
核心成员:关系人(父母、配偶、子女)中至少有一个是基因成 员的非基因成员。
非核心成员:关系人都不是基因成员的家庭成员
09/13/2015
A
2源自文库
二、成员构成
2010年
家庭成员
CFPS样本变化
2010年初访 2012年第一次追踪 2014年第二次追踪
09/13/2015
在家
同灶吃饭
物理 外出
未追成功
2010年家庭 2012年家庭
7
09/13/2015
变量名
变量标签
2012年个人是否在家
TB6_A12_p
住
TB601_A12_p
个人离家的原因
outpers_where12_ 离家人(个人)的居
家庭人员的 p
住区域
信息变量名 TB602ACODE_A12 离家人(个人)的省
_p
国标码
leavingtime_y_p 个人离家的年份
……
A成员2 ……
……
…… A成员3
……
…… A成员1
……
家庭成员
及离家人 员信息
家庭关系
网及关系 人信息
09/13/2015
A
6
成 员 变 量 组
09/13/2015
成员编码 家庭编码
家庭人员的 信息变量名
变量名 pid fid12 fid10 code_a_p
cfps_interv_p
TB1A_A_p TB1B_A_p TB1Y_A_p TB1M_A_p TB2_A_p ALIVE_A_p deathreason_p TB3_A12_p TB4_A12_p qa301_a12_p qa302_a12_p
变量标签 个人样本编号 2012年家户号 2010年家户号 个人家庭内部编码 个人产生有效问卷 的情况 个人属相 2012年个人年龄 个人出生(年) 个人出生(月) 个人性别 个人是否健在 个人去世的原因 个人婚姻状况 个人最高学历 个人户口类型 个人户口所在地
A
0:没有任何个人问卷 1:2012年有个人问卷 5:往期调查有个人问卷