CFPS家庭关系库的应用及常见问题
中国家庭动态跟踪调查CFPS抽样说明
4
表 3. 样本区/县的村居数据统计表 村居数 100 以下 100~200 200~300 300~400 400~500 500~600 600 以上 合计 区县数 31 41 38 22 11 8 11 162
45 40 35 30 25 20 15 10 5 0 100以下 100~200 200~300 300~400 400~500 500~600 600以上
3.1.2 “小省”的抽样 对于作为 CFPS 样本剩余组成部分的“小省”的样本,这些省份中的区(若为城市)或 者县(若为农村)构成了一个抽样框。为了形成内隐分层,区/县按照辅助信息进行以下排 序: ⑴ 20 个省级行政区按照社会经济地位(SES)降序排列。 ⑵ 每个省内,将全省所有市级行政区以省会城市居首、其它地级市按照社会经济地位 (SES)降序排列。 ⑶ 将每个地级市或同级行政区划区分成三个部分:区、县级市和县。在每一部分内,
1
最初我们还要求受访家庭户中至少有一名成员在抽样社区居住时间满 6 个月,但在执行过程中,这一条 件被取消,实际被这一条件过滤掉的仅有极少数家户。 1
由上,本次基线调查共有 6 个子总体,即 5 个“大省”和 其它“小省” 。根据中国和 世界上一些大型的抽样调查的经验及 2008、2009 年对北京市、上海市、广东省三个省市预 调查的经验, 在考虑调查经费和估计量精度的基础上, 确定两类省市的样本量: 5个 “大省” 的目标样本量分别是 1600 户, “小省”的目标样本量总共是 8000 户,共 16000 户。
6
将上述合并后的村居视为抽样框中的虚拟村居,其人口数为合并村居的人口数和,区 域面积为合并村居的区域面积和。由此,得到样本区/县或样本街道/乡镇的村居抽样框。
老年父母照料家庭与成年子女劳动供给基于CFPS微观数据的分析
分析方法与步骤
其次,以家庭为单位,建立回归模型,探讨老年父母照料家庭对成年子女劳 动供给的影响。控制变量包括家庭经济状况、子女个数、父母年龄、健康状况等。
分析方法与步骤
最后,根据回归结果,深入剖析老年父母照料家庭对成年子女劳动供给的影 响及其可能的原因。
结果及解释
结果及解释
通过描述性统计,我们发现老年父母照料家庭的比例较高,而成年子女参与 劳动的比例较低。这表明老年父母照料家庭现象较为普遍,同时成年子女劳动供 给可能受到一定限制。
CFPS微观数据介绍
些缺点,如数据更新较慢、部分数据质量不高、存在样本选择偏误等。
分析方法与步骤
分析方法与步骤
本次演示采用描述性统计和回归分析方法,分步骤探讨老年父母照料家庭与 成年子女劳动供给之间的关系。
分析方法与步骤
首先,我们描述不同家庭中老年父母照料家庭和成年子女劳动供给的现状。 通过计算老年父母照料家庭的比例和成年子女参与劳动的比例,分析其分布特征。
老年父母照料家庭与成年子 女劳动供给基于CFPS微观
数据的分析
目录
01 CFPS微观数据介绍
02 分析方法与步骤
03 结果及解释
04 结论与建议
05 参考内容
内容摘要
老年父母照料家庭与成年子女劳动供给:基于CFPS微观数据的分析 随着人口老龄化的加剧,老年父母照料家庭与成年子女劳动供给之间的关系 日益受到。本次演示利用中国家庭追踪调查(CFPS)微观数据,分析这两者之
五、未来研究方向
五、未来研究方向
尽管本次演示已经对子女健康对父母劳动力供给的影响进行了深入探讨,但 仍有一些方面值得进一步研究。例如,可以进一步研究不同地区、不同社会经济 地位家庭在面对子女健康问题时的反应是否存在差异。此外,也可以考虑将其他 家庭成员(如配
cfps 计算家庭老年人抚养比
cfps 计算家庭老年人抚养比下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by the editor. I hope that after you download them, they can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!In addition, our shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!计算家庭老年人抚养比的重要性与方法引言随着人口老龄化趋势的不断加剧,老年人口的增长对家庭抚养比的计算和理解变得尤为重要。
CFPS家庭关系库的应用及常见问题
追访成功 完访另组家庭
.
3
2012年
家庭成员
非家庭成员
非核心
核心
新进成员
09/13/2015
基因成员
原
在 家
需追 踪的 物理 离家
.
基因成员
需追 踪的 另组 离家
不追 踪的 物理 离家
不追
踪的 去 另组 世 离家
另组 家庭
4
大家庭里的幸福生活
43 2
43 1
40 1
09/13/2015
.
5
三、家庭关系库的结构
leavingtime_m_p 个人离家的月份
个人是否与该家庭同
co_a12_p
灶吃饭
过去一个月外出成员
e7_a_p
是否给家里寄钱
外出成员给家里寄钱
离家人与家 e701_a_p
ห้องสมุดไป่ตู้
金额
庭经济联系
过去一个月家里是否
E8_a_p
给外出成员寄钱
家里是否给外出成员
E801_a_p
寄钱金额
.
是否物理外出
是否经济联系 在一起 追访物理外出 成员独有
中的数量多呢?多出的来自哪里?
个人问卷生成规则 + 未完访
6.变量值为“-8”表示的“不适用”和其它值表示的“没有**”的区
别是什么?这会决定对该变量充分正确的使用。
“-8”表示没有采集该信息
09/13/2015
.
12
7. cfps2010年家庭数据库中的主事者的户内顺序号是1、2的个位数的
,想和家庭关系库的数据匹配,但是家庭关系库的个体家庭内部编号 是按101、102… … 不知道应该如何匹配呢?
(戴利红)CFPS家庭关系库的应用与常见问题
_p
国标码
leavingtime_y_p 个人离家的年份
leavingtime_m_p 个人离家的月份
co_a12_p
个人是否与该家庭同 灶吃饭
是否经济联系 在一起
过去一个月外出成员
e7_a_p
是否给家里寄钱
离家人与家 e701_a_p
庭经济联系
外出成员给家里寄钱 金额 过去一个月家里是否
追访物理外出 成员独有
原 在 家
需追 踪的 物理 离家
基因成员
需追 踪的 另组 离家
不追 踪的 物理 离家
不追
踪的 去 另组 世 离家
另组 家庭
4
大家庭里的幸福生活
201
202
203
204 432
101
102
431
103
104 嫁 105 出
出
国
401
09/13/2015
5
三、家庭关系库的结构
一组 变量
家庭 编码
成员编码 父亲编码 母亲编Fra bibliotek 配偶编码 孩子们编码 综合 及基本信 及基本信 及基本信 及基本信 及基本信息 变量组 息(vars_p) 息(vars_f) 息(vars_m) 息(vars_s) (vars_ci)
家庭A
家庭B ……
A成员1
A成员2 ……
B成员1 ……
A成员3 ……
……
A成员2 ……
……
…… A成员3
……
…… A成员1
……
家庭成员 及离家人 员信息
家庭关系 网及关系 人信息
09/13/2015
6
成 员 变 量 组
09/13/2015
(戴利红)CFPS家庭关系库的应用及常见问题ppt课件
8. CFPS没有定义“家庭户主”, 但是在实际研究中需要定义户主,请
给出定义户主的建议。 家庭主事人(2010) 重要事件决策人(2012) 最熟悉家庭财务的成员(2012) 房产证上的成员
13
9.发现CFPS家庭关系库2012年数据中有个别样本pid重号现象。请问如何
2
二、成员构成
2010年
家庭成员
CFPS样本变化
2010年初访 2012年第一次追踪 2014年第二次追踪
在家
同灶吃饭
物理 外出
未追成功
2010年家庭 2012年家庭
追访成功 完访另组家庭
3
2012年
家庭成员
非家庭成员
非核心
核心
新进成员
基因成员
原 在 家
需追 踪的 物理 离家
基因成员
需追 踪的 另组 离家
配偶code变化: A: 1XX -> 4XX,局限是4XX新进入家庭,未进入? B:2XX -> 4XX,不能判断是否是同一个人
主要依据应该是成人数据库中问“是否是初 婚”,关系库辅助使用。
11
4.请问家庭关系问卷中父亲家庭内部编码有的为何是4开头?
户内3位码的编码规则
5.为什么家庭关系库中的家庭和个体总量要比成人、少儿问卷
新进成员判定 + 个人问卷生成规则
希望对有关家庭成员进入和退出家庭相关数据清理的操作给出更具体 的例子
新进成员和离家成员的判断依据
18
不追 踪的 物理 离家
不追
踪的 去 另组 世 离家
另组 家庭
4
大家庭里的幸福生活
201
202
203
相亲结婚真的靠谱吗基于CFPS数据的研究
相亲结婚真的靠谱吗基于CFPS数据的研究相亲是指通过家庭介绍或媒体平台相互了解、交流,并最终达成婚姻的一种形式。
然而,相亲结婚是否靠谱一直是备受争议的话题。
为了探讨这个问题,本文将基于中国家庭追踪调查(CFPS)的数据来进行研究。
首先,相亲结婚的核心目的是寻找合适的对象结婚,这与恋爱结婚也是相同的。
研究显示,相亲结婚的人们通常更为重视婚姻的稳定性和家庭角色的分配。
由于双方在开始阶段就有明确的婚姻意图,相亲结婚可能更容易避免恋爱中的不稳定因素,如浪漫情感的盲目热恋和冲动行为。
因此,相亲结婚可能更有可能建立在理性与实际基础上。
其次,相亲提供了一个平台,使得双方能够更多地了解对方的家庭背景、兴趣爱好、经济状况等信息。
相比于自由恋爱中通过漫长的交往过程逐渐了解对方,相亲在短时间内提供了更多信息,使双方能够更快速地决定是否进一步发展。
此外,相亲还可以提供熟人的背书和参考,增加了结婚成功的可能性。
第三,CFPS数据显示,基于相亲结婚的夫妻对于婚姻满意度相对较高。
这可能是因为相亲过程中双方更加谨慎和理性,会更多地考虑婚姻的长远发展。
同时,由于相亲结婚中双方家庭的背景通常更为接近,可能会减少一些家庭冲突和矛盾的发生。
然而,相亲结婚也存在一些问题。
首先,婚姻是一项复杂的关系,并不仅仅是基于信息和理性的决策。
夫妻双方的感情和互相适应程度同样重要,而这些在相亲过程中可能无法完全展现。
其次,相亲结婚存在一定的随机性和不确定性。
尽管相亲提供了一些基本的信息,但双方在结婚前并没有完全了解对方的全部特点和优缺点。
因此,相亲结婚仍然存在一定的风险。
综上所述,相亲结婚在一定程度上是靠谱的。
通过相亲结婚,夫妻双方在开始阶段就有明确的婚姻意图和更多的信息交流,可以更加理性地做出决策。
此外,研究表明,相亲结婚的夫妻对婚姻满意度相对较高。
然而,相亲结婚也存在一些问题,如感情因素和不确定性。
因此,在选择相亲结婚时,还需要综合考虑各种因素,包括感情、共同兴趣和长远发展,以确保婚姻的幸福和稳定。
个人资源、家庭因素与再婚行为基于CFPS数据的分析
个人资源、家庭因素与再婚行为基于CFPS数据的分析一、概述随着社会的发展和观念的变迁,再婚现象在当代中国社会中愈发普遍。
个人资源、家庭因素与再婚行为之间的关系成为社会学、心理学、人口学等多个学科关注的焦点。
本文旨在利用中国家庭追踪调查(CFPS)的丰富数据资源,深入分析个人资源、家庭因素如何影响个体的再婚选择。
通过对数据的挖掘和统计分析,我们期望能够揭示再婚行为背后的多元动因,为相关政策制定和社会学研究提供实证支持。
具体而言,本文将首先对个人资源(如教育程度、经济收入、职业地位等)进行量化分析,探讨这些资源如何影响个体的再婚意愿和再婚机会。
我们将关注家庭因素,包括原生家庭的结构和关系、再婚对象家庭背景等,分析这些因素如何制约或促进个体的再婚决策。
我们将综合考虑个人资源和家庭因素的交互作用,探讨它们对再婚行为的综合影响。
本研究不仅有助于我们理解再婚行为的个人和社会层面动因,也能为政府制定相关婚姻政策和家庭支持政策提供科学依据。
同时,通过深入剖析再婚现象,我们还能增进对当代中国社会变迁和家庭结构变化的认识,为构建和谐社会提供理论支持。
1. 背景介绍:再婚现象在当今社会的普遍性及其重要性。
在当今社会,再婚现象已经变得相当普遍,这背后反映了社会观念的转变和人们对婚姻生活的重新理解。
随着社会经济的发展和人们思想的开放,离婚和再婚不再被视为不光彩的事情,而是被看作是对个人幸福追求的一种体现。
再婚现象的普遍性,不仅体现了个人的选择和权利,更在某种程度上揭示了社会的宽容度和进步。
再婚现象的普遍性得益于社会宽容度的提高。
过去,离婚和再婚往往被视为一种社会禁忌,甚至会受到家族和社会的歧视。
随着时代的变迁,人们逐渐认识到,婚姻的幸福与否并不取决于是否离婚或再婚,而是取决于夫妻双方是否用心经营。
这种观念的转变,使得再婚人群能够更加坦然地面对自己的选择,不再受到外界的偏见和压力。
再婚现象的普遍也反映了人们对婚姻质量的追求。
(戴利红)CFPS家庭关系库的应用及常见问题
家庭成员
及离家人 员信息
家庭关系
网及关系 人信息
09/13/2015
6
成 员 变 量
组
成员编码 家庭编码
家庭人员的信 息变量名
变量名
变量标签
pid
个人样本编号
fid12
2012年家户号
fid10
2010年家户号
code_a_p
个人家庭内部编码
个人产生有效问卷的 cfps_interv_p 情况
09/13/2015
1
2.对比2010年数据库,成员的家庭关系有没有变更?
两补充 + 一 更新
3.在2012年以4开头的是新进的人,那么是不是可以理解为2010年在
婚且2012年配偶家户号以4为开头的人,就是在2010到2012年间离婚 又再婚的人?如果可以这样理解,那么为什么在这些人中还有针对成 人问卷中“是否是初访配偶”的回答为“是”的情况呢?
1
原
在 家
需追 踪的 物理 离家
基因成员
需追 踪的 另组 离家
不追 踪的 物理 离家
不追
踪的 去 另组 世 离家
另组 家庭
4
大家庭里的幸福生活
201
202
203
204 432
101
102
431
103
104 嫁 105 出
出
国
401
09/13/2015
5
三、家庭关系库的结构 一组 变量
家庭 编码
成员编码 父亲编码
家庭人员的 TB602ACODE_ 离家人(个人)的省国
信息变量名 A12_p
标码
leavingtime_y_
p
CFPS家庭关系库的应用及常见问题
数据处理与分析方法
变量处理
根据研究目的,选择合适的变量 ,并进行必要的变量转换或生成 新变量。
推论性统计
运用统计模型对数据进行深入分 析,探究变量之间的关系和影响 。
01
数据清洗
在进行分析前,需要对数据进行 清洗,包括处理缺失值、异常值 和重复值等。
02
03
04
描述性统计
对数据进行描述性统计分析,了 解数据分布和特征。
政策制定
基于家庭关系库的数据分析 ,可以为政策制定者提供有 关家庭结构、家庭关系等方 面的信息,为制定针对性政
策提供依据。
社会服务
家庭关系库的数据可以为社 会服务机构提供有关家庭状 况的信息,有助于更好地满 足家庭需求,提高服务质量 。
未来发展趋势预测
数据更新与维护
随着社会的变迁和家庭结构的变化,家庭关 系库需要不断更新和维护,以保持数据的时
结果呈现与报告编写
结果呈现方式
根据研究目的和受众,选择合适的结果呈现方式,如图表 、表格或文字描述等。
报告编写结构
报告应包括标题、摘要、引言、方法、结果、讨论和结论 等部分。
报告注意事项
确保报告内容准确、简洁、清晰,避免使用过于专业的术 语,以便受众易于理解。同时,要遵守学术规范,注明数 据来源和引用文献。
02
CFPS家庭关系库概述
数据来源与收集
数据来源
CFPS家庭关系库的数据主要来源于中国家庭追踪调查(CFPS)项目,该项目是一个全国性、综合性的社会追踪 调查项目。
数据收集
CFPS家庭关系库通过定期的家访、电话访问等方式收集数据,确保数据的真实性和准确性。同时,该项目还与 多个政府部门和机构合作,获取相关的行政记录和统计数据。
CFP案例答疑整理
1.Q: 请老师再给讲下遗嘱需求法,比如老公去世了,那么遗嘱所需费用应该是家庭支出和妻子收入的现值之差是不?不是应该妻子的支出和收入的现值之差吗?A:遗属需要法要考虑的因素很多,考试的时候主要看题目,哪些因素需要考虑,哪些不需要你提出了“家庭支出”还是“老婆的支出”的问题,考虑到典型家庭一般有小孩,所以遗嘱需求法用“家庭支出”乘以“支出调整率”(“支出调整率”题中会给),而不是用“妻子的支出”。
遗属需要法一般情况下,需要考虑遗属的工作收入现值,不过做题时还是需要看题目条件;净收入弥补法当中工作收入和生活支出的年份是一样的,不存在差异。
2.Q:如何来确定缴费基数?在工资不超过社平工资三倍的情况下按实际工资额,超过三倍就按社平工资的3倍来算这点应该是确定的。
那么,如果在题目背景中直接告诉缴费基数情况下,是不是就不用考虑实际工资和社平工资3倍了呢?还是要和实际工资,社平工资3倍来作比较的?A:是的,可直接按缴费基数计算。
有时题目给出的缴费基数2008年,但是要计算的是2009年,则此条件为干扰项。
3.Q: 综合案例教育金的问题。
在综合案例的教育金问题方面,什么时候用内部报酬率方法,什么时候可以直接用求终值和现值的方法计算教育金的需求?A:如果题目给的教育金是不规则现金流用CF方法计算,如果是规则的就可以直接用PMT。
教育金在C阶段时,大部分是分段计算增长型年金。
4.Q: 案例中住房积金的问题,是不是所有住房公积金都是按1:1配款,不用说明?A:是,不需要再说明。
5.Q: 保费负担率公式哪个正确?书本上:年保费/年收入;课件上:年保费/年工作收入A:以课件为准,年保费/年工作收入。
6.Q: 在真题2中的A选项紧急备用金考虑了贷款利息的支出。
真题46和真题20中,并未考虑加入贷款利息的支出。
问计算紧急备用金的时候支出部分是否要加入贷款利息?A:紧急预备金这3个题目都同样考虑了贷款利息支出第2题A)紧急预备金=现金及活期存款=24000,贷款利息=200000*7%=140006个月支出=(55200+6000+3000+960+14000)/2=39580,24000<39580,需要调整第20题A)流动性资产48万元,三个月生活支出34.55万元,贷款本息支出5.19万元(高于利息支出),合计39.74万元,48万元〉39.74万元第46题现金9万元,月消费支出1万元,月利息支出5000元,3个月月支出合计45000元,紧急预备金足以支应3个月支出即使以现金流的概念把应还本金也纳入月现金流出,上述3题的答案仍然正确。
农村家庭多维贫困测量及影响因素分析基于CFPS
农村家庭多维贫困测量及影响因素分析基于CFPS一、本文概述本文旨在探讨农村家庭多维贫困的测量方法及其影响因素,基于中国家庭追踪调查(CFPS)的数据进行深入分析。
多维贫困不仅仅关注收入贫困,还涉及到教育、健康、生活质量等多个维度。
文章首先对农村家庭多维贫困的概念进行界定,明确贫困测量的多维性和复杂性。
然后,运用CFPS数据,构建多维贫困指数,对农村家庭的贫困状况进行量化描述。
接着,通过计量经济学方法,识别影响农村家庭多维贫困的关键因素,包括家庭特征、社区环境、政策干预等多个层面。
根据分析结果,提出针对性的减贫政策和建议,为农村扶贫工作提供科学依据。
本文的研究不仅有助于深入理解农村贫困问题的本质和特征,也为政策制定者提供了决策参考,对于推动农村减贫和可持续发展具有重要意义。
二、文献综述多维贫困测量及其影响因素分析一直是国内外学者研究的热点问题。
特别是近年来,随着中国经济的快速发展,农村地区的多维贫困问题逐渐凸显,引起了广泛的关注。
本文将从国内外两个方面,对农村家庭多维贫困测量及其影响因素的相关文献进行综述。
国内研究方面,学者们基于不同的理论框架和研究方法,对农村家庭多维贫困进行了深入探索。
例如,有学者运用阿玛蒂亚·森的可行能力理论,从教育、健康、生活水平等多个维度构建了多维贫困指标体系,并对农村地区进行了实证分析。
还有学者运用主成分分析、熵值法等统计方法,对多维贫困进行了量化测量,揭示了农村多维贫困的严重程度和分布特征。
国外研究方面,多维贫困测量及其影响因素的研究起步较早,形成了较为完善的理论体系和研究方法。
学者们普遍认为,多维贫困不仅包括收入贫困,还包括教育、健康、社会福利等多个方面的贫困。
在测量方法上,国外学者多采用主成分分析、因子分析等方法,对多维贫困进行量化评估。
他们还关注多维贫困的影响因素的研究,如经济发展、政策环境、家庭结构等因素对多维贫困的影响。
国内外学者在农村家庭多维贫困测量及其影响因素方面已经取得了一定的研究成果。
中国追踪调查数据权数的使用-北京大学中国社会科学调查中心
2、追踪数据库 --------------------------------------------------------(1)CFPS的人员类型和问卷数据库
非他家庭成员
非核心人员
核心人员
核心人员个人问卷数据
各追踪年新进基因
家庭问卷数据库
2010年基因
个人问卷数据库
核心成员问卷信息都可以作为辅助信息使用
3、抽样总体(全国25省)(subsample=1)
(二)研究对象 --------------------------------------------------------
中国(除香港、澳门、台湾、新疆维吾尔自治区、西藏自治区、 青海省、内蒙古自治区、宁夏回族自治区和海南省等省区之外) 的25个省市自治区的家庭户和家庭户中的所有满足调查条件的 家庭成员。 上海市的家庭户和家庭户中的所有满足调查条件的家庭成员 辽宁省的家庭户和家庭户中的所有满足调查条件的家庭成员 河南省的家庭户和家庭户中的所有满足调查条件的家庭成员 甘肃省的家庭户和家庭户中的所有满足调查条件的家庭成员 广东省的家庭户和家庭户中的所有满足调查条件的家庭成员
追踪数据库分析 --------------------------------------------------------(1)横截面分析:分析调查年家庭经济和个人总体情况。 调查年数据(2010基因+各年新进基因) 调查年横截面权数。 (以往各年的数据、核心成员个人数据、家庭关系数据、村居数 据作为辅助信息) 方法:可以将存在横截面权数的数据库提取出来使用。 (2)纵向分析:仅分析2010年的基因成员变动情况。 调查年及其以往各年数据(或调查年与基线调查数据) 调查年纵向权数。 方法:可以将存在纵向权数的数据库提取出来使用。
(戴利红)CFPS家庭关系库的应用及常见问题
判断父母与子女是否异地、兄弟姐妹是否同住的情况也都类似
09/13/2015
16
isssdailh@
09/13/2015
2015.9.13
17
2010年家庭成员问卷中T1“同住家庭成员表”,T2“家庭成员直 系亲属关系表”,T3“家庭成员不同住直系亲属列表”分别代表 了哪些家庭成员,如何使用?
09/13/2015
10
2.对比2010年数据库,成员的家庭关系有没有变更?
两补充 + 一 更新
3.在2012年以4开头的是新进的人,那么是不是可以理解为2010年在
婚且2012年配偶家户号以4为开头的人,就是在2010到2012年间离婚又
再婚的人?如果可以这样理解,那么为什么在这些人中还有针对成人 问卷中“是否是初访配偶”的回答为“是”的情况呢?
0:没有任何个人问卷 1:2012年有个人问卷 5:往期调查有个人问卷
7
变量名
变量标签
TB6_A12_p
2012年个人是否在家 住
是否物理外出
TB601_A12_p
个人离家的原因
outpers_where12_ 离家人(个人)的居
家庭人员的 p
住区域
信息变量名 TB602ACODE_A12 离家人(个人)的省
09/13/2015
2
二、成员构成
2010年
家庭成员
CFPS样本变化
2010年初访
在家
同灶吃饭
未追成功
物理 外出
2012年第一次追踪 2014年第二次追踪
2010年家庭 2012年家庭
追访成功 完访另组家庭
09/13/2015
3
2012年
家庭成员
CFPS中国家庭动态跟踪调查
中国家庭动态跟踪调查抽样设计谢宇 邱泽奇 吕萍2012.12.20C F P SC hina F amily P anel S tudies中国家庭动态跟踪调查技术报告系列:CFPS-1系列编辑:谢宇 责任编辑:胡婧炜1. 调查对象和目标样本量CFPS调查的对象为中国(不含香港、澳门、台湾以及新疆维吾尔自治区、西藏自治区、青海省、内蒙古自治区、宁夏回族自治区、海南省)25个省/市/自治区的满足项目访问条件的家户和样本家户中满足项目访问条件的家庭成员。
在2010年的基线调查中,居住在传统居民住宅内的、家中至少有一人拥有中国国籍的一个独立经济单元,便可视为一个满足项目访问条件的家户。
1满足项目访问条件的家庭成员则指样本家户中经济上联系在一起的:A.与该家庭有血缘/婚姻/领养关系的直系亲属;B.与该家庭有血缘/婚姻/领养关系且居住满3个月的非直系亲属;C.与该家庭没有血缘/婚姻/领养关系但居住满6个月的其他成员。
CFPS样本所在的25个省/市/自治区的人口覆盖了中国除香港、澳门、台湾外总人口数的94.5%,由于覆盖范围如此广泛,因此可以将CFPS样本视为一个全国代表性样本。
CFPS重点关注中国社会经济、教育、家庭、人口和健康等方面的变迁,为了更好的了解这一点,不仅需要从宏观层面上把握中国的整体变迁,还需要在微观层面上了解中国的几个典型省/市的在这些方面的变化状况。
因此,在抽样设计上,我们首先将全国25个省/市/自治区分成两类:一类省市为在省级层次的推断样本,用以满足省级推断的要求。
我们选择了5个省/市,分别为辽宁、上海、河南、广东、甘肃,也称为大样本省(以下简称为“大省”)。
二类省市为上述5个省/市外的20个省/市/自治区,这一类省市的样本量不能够在省级层次进行推断,也称小样本省(以下简称为“小省”)。
从这两类样本数据的加权可以得到对25个省/市/自治区总体的有效估计,进而用来推断全国。
25个省/市/自治区的分类见表1。
cfps 社会价值观
CFPS(中国家庭追踪调查)是一项大型的、具有全国代表性的追踪调查项目,旨在通过收集个体、家庭、社区三个层次的数据,了解中国社会、经济、人口等方面的变化,探究各种社会问题及其影响因素。
社会价值观是指人们对社会现象、社会问题、社会变革等所持有的观点和态度,它反映了人们对社会公正、道德伦理、个人与集体关系等方面的看法和价值取向。
在CFPS中,社会价值观是一个重要的研究领域,主要关注以下几个方面:
社会公正:研究人们对社会公正的看法和态度,探究不同群体在社会资源分配、权利保障、机会平等等方面的差异和原因。
道德伦理:探讨人们的道德观念和行为准则,研究不同文化背景和社会环境下人们的道德观念和行为差异。
个人与集体关系:研究个人与集体之间的关系,了解人们在追求个人利益和集体利益时所持有的观点和态度。
社会变革:探究人们对社会变革的看法和态度,分析社会变革对人们的生活、价值观等方面的影响。
通过对社会价值观的研究,CFPS旨在深入了解中国社会的价值观变迁和社会问题,为政策制定和社会发展提供科学依据。
中国家庭追踪调查家庭关系原始库的分解与重构
1.2 万个变量。
我们根据问卷设计的各个模块内容, 分别将原始的家庭成员数据库进行分解, 生成方便使用
的数据结构。 最终的发布数据库以家庭中每个成员为一条观测,
变量包含每个成员的基本信
2010 年的 T 表( T1、T2、T3)格式,1 表和 T2 表。
一、家庭成员问卷的设计理念
CFPS2010 年的家庭成员问卷采用 T 表来采集家庭关系与家庭成员信息, 从而建立了一 个完整、精确的家庭结构网络,它为 CFPS 之后的追踪访问奠定了基础。 2012 年的家庭成 员问卷以 2010 年的家庭结构为基础,通过采集新进个体与原家庭成员的血缘关系、经济联 系的相关问题来判断其是否为 CFPS 定义的家庭成员和成员类型; 对于离开原家庭较长时间 的个体, 通过询问离家的原因、 与原家庭在家成员的关系、 是否养家等相关问题来判断离家 人员是否仍为 CFPS 定义的原家庭成员、是否需要继续追踪访问。此外,家庭成员问卷还采 集需要追访的外出个人和另组家庭的地址、电话等联系方式,为继续追访提供联系信息。
非核心成员: 家庭中除了基因成员、核心成员之外的家庭成员。 三种成员类型没有包含,并且不可以转化。
10 岁的领养子女。
针对不同的家庭成员类型, CFPS制定了不同的追踪策略:如果是基因成员, CFPS将永
久追踪,但可能因为某些原因(如服刑、参军
/ 服役、出家和出境),当期不追踪;如果是
核心成员, 则进行有条件的后续追踪, 当核心成员与基因成员同时在一个家庭中, 则实施追
(一) 基本概念
1. 家庭类型:
原家庭: 当期调查前存在于家庭成员数据库中的完访家庭。
另组家庭: 当期调查从原家庭中分裂出来,与原家庭经济上相互独立的经济体。
CFPS-35中国家庭追踪调查2016年数据库介绍及数据清理报告
中国家庭追踪调查2016年数据库介绍及数据清理报告吴琼 戴利红 甄祺 张婧申 谷丽萍 张聪 赵方圆2018.10.23C F P SC hina F amily P anel S tudies 中国家庭追踪调查 技术报告系列:CFPS-35 系列编辑:谢宇 责任编辑:赵启琛一.背景介绍CFPS2016为中国家庭追踪调查的第四轮全国调查,集中的面访时间为2016年7月至11月,加上后期的外出家庭追访以及电话调查,调查执行期持续到2017年5月。
2017年9月CFPS项目组发布了成人、少儿、经济库的测试版本,2018年4月发布了家庭关系库,2018年7月发布了成人、少儿、经济库的正式版本以及个人跨年库。
这份技术报告针对2018年4月及之后发布的各库清理过程进行梳理,并向用户介绍使用这些数据库的注意事项。
CFPS2016最终完成家庭层面有效样本14763户,个人有效样本45319份。
以2014年调查完访样本为基础,CFPS2016在家庭层面的追踪率是89%,个人层面追踪率是82%。
如果以2010年基线调查在家庭关系库中界定的57155名家庭成员为基础,经过六年之后,CFPS2016成功追踪到该基线样本的69%。
在所有CFPS2016的样本中,约两成左右由电话访问完成。
从问卷内容上看,此轮问卷基本保持了与CFPS2014相同的模块,但将以前个人问卷中分属成人和少儿问卷但内容相同的一些模块改成了共用模块。
这步变更对数据的使用将产生两方面的影响:在CFPS2016内部,成人和少儿模块中相同的问题会有同样的变量名,为同一轮数据的跨库使用增加了便捷性;但在跨年间,CFPS2016的这个变动有可能造成部分变量在不同轮次间变量名发生改动,需要用户比对问卷进行确认。
CFPS2016还新增了部分问卷采集内容,也相应地删除了部分题目,具体的变化内容可以从CFPS项目网站上的《历年问卷内容变动表》中获取。
CFPS2016在问卷结构上的另一个重大调整是大幅度扩充了电访调查的内容,除了认知测试只在面访中提问之外,其他所有问题在面访和电访问卷中都是一致的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同灶吃饭成员的总人数 同灶吃饭中基因成员人数 同灶吃饭中核心成员人数 所属基因成员类型 是否是核心成员
家庭重大事件决策人样本编码
抽样子总体 是否在全国再抽样样本中 父亲出生年份(综合变量) 母亲出生年份(综合变量) 父亲最高学历(综合变量) 母亲最高学历(综合变量) 家庭代际数
09/13/2015
A
变量标签 个人样本编号 2012年家户号 2010年家户号 个人家庭内部编码 个人产生有效问卷 的情况 个人属相 2012年个人年龄 个人出生(年) 个人出生(月) 个人性别 个人是否健在 个人去世的原因 个人婚姻状况 个人最高学历 个人户口类型 个人户口所在地
A
0:没有任何个人问卷 1:2012年有个人问卷 5:往期调查有个人问卷
9
四、用户问题
1.对“CFPS同灶吃饭”这个的概念的理解?“不同灶吃饭”的原因应该
有哪些? 同灶吃饭:与家庭经济联系在一起
2012年不同灶吃饭的类别; 1.外出读书,且不需要家里养 2.外出工作、出境,且有正式工作不养家 或是没有正式工作不被家养 3.基因成员的在外且不需供养的新生子女 4.从家庭中分裂组成新家庭的: 分家、离婚、嫁出 5.特殊人群:出家、服刑、参军、去世
配偶code变化: A: 1XX -> 4XX,局限是4XX新进入家庭,未进入? B:2XX -> 4XX,不能判断是否是同一个人
主要依据应该是成人数据库中问“是否是初婚 ”,关系库辅助使用。
09/13/2015
A
11
4.请问家庭关系问卷中父亲家庭内部编码有的为何是4开头?
户内3位码的编码规则
5.为什么家庭关系库中的家庭和个体总量要比成人、少儿问卷
核心成员:关系人(父母、配偶、子女)中至少有一个是基因成 员的非基因成员。
非核心成员:关系人都不是基因成员的家庭成员
09/13/2015
A
2
二、成员构成
2010年
家庭成员
CFPS样本变化
2010年初访 2012年第一次追踪 2014年第二次追踪
09/13/2015
在家
ห้องสมุดไป่ตู้
同灶吃饭
物理 外出
未追成功
2010年家庭 2012年家庭
……
A成员2 ……
……
…… A成员3
……
…… A成员1
……
家庭成员
及离家人 员信息
家庭关系
网及关系 人信息
09/13/2015
A
6
成 员 变 量 组
09/13/2015
成员编码 家庭编码
家庭人员的 信息变量名
变量名 pid fid12 fid10 code_a_p
cfps_interv_p
TB1A_A_p TB1B_A_p TB1Y_A_p TB1M_A_p TB2_A_p ALIVE_A_p deathreason_p TB3_A12_p TB4_A12_p qa301_a12_p qa302_a12_p
leavingtime_m_p 个人离家的月份
个人是否与该家庭同
co_a12_p
灶吃饭
过去一个月外出成员
e7_a_p
是否给家里寄钱
外出成员给家里寄钱
离家人与家 e701_a_p
金额
庭经济联系
过去一个月家里是否
E8_a_p
给外出成员寄钱
家里是否给外出成员
E801_a_p
寄钱金额
A
是否物理外出
是否经济联系 在一起 追访物理外出 成员独有
数据存储的问题 恢复3位码
8. CFPS没有定义“家庭户主”, 但是在实际研究中需要定义户主,请
给出定义户主的建议。 家庭主事人(2010) 重要事件决策人(2012) 最熟悉家庭财务的成员(2012) 房产证上的成员
7
09/13/2015
变量名
变量标签
2012年个人是否在家
TB6_A12_p
住
TB601_A12_p
个人离家的原因
outpers_where12_ 离家人(个人)的居
家庭人员的 p
住区域
信息变量名 TB602ACODE_A12 离家人(个人)的省
_p
国标码
leavingtime_y_p 个人离家的年份
一组 变量
家庭 编码
成员编码 及基本信 息 (vars_p)
父亲编码 母亲编码 配偶编码 及基本信 及基本信 及基本信 息(vars_f) 息(vars_m) 息(vars_s)
孩子们编码 综合 及基本信息 变量组
(vars_ci)
家庭A
家庭B ……
A成员1
A成员2 ……
B成员1 ……
A成员3 ……
中的数量多呢?多出的来自哪里?
个人问卷生成规则 + 未完访
6.变量值为“-8”表示的“不适用”和其它值表示的“没有**”的区
别是什么?这会决定对该变量充分正确的使用。
“-8”表示没有采集该信息
09/13/2015
A
12
7. cfps2010年家庭数据库中的主事者的户内顺序号是1、2的个位数的
,想和家庭关系库的数据匹配,但是家庭关系库的个体家庭内部编号 是按101、102… … 不知道应该如何匹配呢?
8
综 合 变 量 组
统计变量
身份类别 决策人 抽样信息
父母的综合 变量 家庭结构
fam_sum gene_n core_n genetype coremember
tf10pid
subpopulation subsample fbirth12 mbirth12 feduc12 meduc12 Generation
09/13/2015
A
10
2.对比2010年数据库,成员的家庭关系有没有变更
?
两补充 + 一 更新
3.在2012年以4开头的是新进的人,那么是不是可以理解为2010年在
婚且2012年配偶家户号以4为开头的人,就是在2010到2012年间离婚又
再婚的人?如果可以这样理解,那么为什么在这些人中还有针对成人 问卷中“是否是初访配偶”的回答为“是”的情况呢?
家庭关系库的应用及常见问题
戴利红
中国社会科学调查中心
北京大学 2015 年 9 月
A
1
基本概念
一.家庭层面
原家庭:调查前确定的追访家庭 另组家庭:调查中由原家庭分裂出来、且经济独立的新家庭样本
二、个人层面
基因成员:2010年所有家庭成员 + … + 往期调查的基因成员在 当期追访时的新生或是不超过10岁的领养子女
追访成功 完访另组家庭
A
3
2012年
家庭成员
非家庭成员
非核心
核心
新进成员
09/13/2015
基因成员
原
在 家
需追 踪的 物理 离家
A
基因成员
需追 踪的 另组 离家
不追 踪的 物理 离家
不追
踪的 去 另组 世 离家
另组 家庭
4
大家庭里的幸福生活
43 2
43 1
40 1
09/13/2015
A
5
三、家庭关系库的结构