中国家庭动态跟踪调查CFPS抽样说明
cfps变量解释
cfps变量解释
CFPS是中国家庭追踪调查(China Family Panel Studies)的缩写。
它是中国社会科学院社会学研究所主持的一项重要社会科学研究项目,旨在对中国家庭进行长期追踪和观察,以了解和分析中国社会的变化、家庭结构、家庭经济状况、教育、健康等方面的情况。
CFPS项目自2010年开始实施,采用了多阶段、多模式的样本抽取方法,覆盖了中国的城市和农村地区,涵盖了各个年龄段的家庭成员。
通过对家庭成员的个人访谈、问卷调查和记录家庭信息的方式,收集了大量的数据,为研究者提供了深入了解中国家庭和社会变迁的重要资料。
CFPS的变量解释指的是在CFPS数据中使用的各种变量,这些变量是对家庭成员、家庭背景、教育、就业、收入、健康等方面进行测量和描述的指标。
这些变量可以用于分析和研究不同社会群体之间的差异以及变化趋势,帮助研究者更好地理解中国社会的结构和特点。
对于具体的变量解释,需要参考CFPS数据文档或相关研究报告。
CFPS简介
个体生命历程 与社会变迁
抽样设计
• 25个省市自治区样本,占全国总人口的 94.5% • 大小省样本
– 大省:在省级层次可以做推论,共5个大省,为 目标样本 – 小省:非省级层次推论样本,只用于全国推论
抽样设计
CFPS样本分布
抽样设计
• 样本单位
– 样本家庭户指常住家庭户,具体是: – 户籍在本村居,户籍人口居住在本村居的家庭 户 – 户籍在本村居,户籍人口离开本村居不足6个月 家庭户 – 户籍不在本村居,但在本村居居住6个月或以上 的家庭户
谢谢!
– 如用截面数据,对两个问题的回答方法相同的 – 如用跟踪数据,对两个问题的回答方法不同了 – 跟踪数据能够有效地解释双胞胎的差异 – 跟踪数据比截殊性
– 再举例:
• 贫困:因为什么而贫困?
– 截面数据可以说明贫困的状态,但不能说明 状态的变化
– 跟踪数据既可以说明贫困的状态,也可以说 明状态的变化
目的与目标
• 中国已经有了众多的截面数据
– 普查:人口、经济、农业、工业、卫生 – 专题:中国综合社会调查/中国社会综合调查 – ……
目的与目标
• 已经有了一些专题的跟踪数据
– 中国老年健康长寿调查(曾毅) – 中国城乡收入分配调查(李实)
区人口密度
人口密度 人口密度 非农比例 非农比例 人口密度 人口密度 非农比例
……
非农比例
地级市1
地级市1
……
……
地级市GDP
地级市GDP
地级市GDP
区 层
县 级 市 层
大省抽样
• 分层策略
县 层
省1
省1
省会城市
省会城市
省会城市
地级市1
中国家庭追踪调查CFPS
0-1岁 (不含1岁)
1-3岁 (不含3岁)
3-6岁 (不含6岁)
婴儿模块 (父母代答)
幼儿模块一 (父母代答)
幼儿模块二 (父母代答)
6-16岁 (不含16岁)
少儿模块 (父母代答)
少儿模块
(10岁以上少儿自6 答)
抽样设计:目标总体
• CFPS覆盖了中国25个省、自治区或直辖市,不包含 香港、澳门、台湾、新疆、西藏、青海、内蒙古、宁 夏以及海南
100+ 90-94 80-84 70-74 60-64 50-54 40-44 30-34 20-24 10-14
0-4
CFPS 2010(T1表成员) N=36,946
0 0 0 .1 .4 1 1.4 1.7 2.5 3.4 3.3 3.9 4.5 4.1 3.4 3.7 4.8 3.6 3.1 3.1 3
• CFPS样本分布在全国161个县(区)的649个行政 村(居)
• 基线调查抽样户数为:19986户
抽样调查
• 为什么要抽样调查? • 什么是好的样本? • 为什么要追踪调查数据?
8
样 本 来 源 区
9
样本评估:性别-年龄结构金字塔
100+ 90-94 80-84 70-74 60-64 50-54 40-44 30-34 20-24 10-14
0 0 .1
.3 .6 .9 1.4 1.6
2.5 3.5
3.1 4.1 4.4
3.9 3.3 3.4
4.6 3.4 2.9 2.5 2.6
-7
-5
-3
-1 0 1
3
5
7
%
男
女
-7
-5
-3
为标准国际职业社会经济地位指数(_isei)_cfps_概述说明以及解释
为标准国际职业社会经济地位指数( isei) cfps 概述说明以及解释1. 引言1.1 概述本文旨在对标准国际职业社会经济地位指数(ISEI)和中国家庭追踪调查(CFPS)进行全面的概述说明与解释。
ISEI是一个用于衡量和比较不同职业在社会经济地位上的指数,而CFPS是中国特定的家庭追踪调查项目。
通过搭建ISEI与CFPS之间的关系框架,我们可以更好地理解以及利用这两个数据集进行研究和分析。
1.2 文章结构本文主要分为五个部分。
首先,引言部分将提供对文章整体结构和内容的概述。
然后,在第二部分中,我们将详细介绍ISEI和CFPS,并讨论它们之间的关系。
接下来,在第三部分中,我们将解释ISEI的重要性,并介绍计算方法和指标。
此外,我们还将给出ISEI在不同国家和群体中应用实例。
在第四部分中,我们将深入探讨CFPS对ISEI的研究框架、目标以及得出的结果,并解读其意义。
最后,在结论部分中,我们将总结文章主要内容,并展望ISEI与CFPS研究潜力及未来发展方向。
1.3 目的本文的目的是提供关于ISEI和CFPS的全面介绍和解释。
通过阐述ISEI在衡量职业社会经济地位上的重要性以及CFPS对ISEI的研究结果,读者能够更清晰地理解这两个概念,并认识到它们在社会经济研究中的实际应用价值。
另外,我们还将展望ISEI与CFPS未来发展方向,为相关研究提供参考。
2. 标准国际职业社会经济地位指数(ISEI) CFPS概述说明:2.1 ISEI简介标准国际职业社会经济地位指数(ISEI)是一种用于衡量个体社会经济地位的指标。
它采用了多维度的评估方法,综合考虑了教育程度、职业地位和收入水平等因素,能够较为客观地反映个体在社会中的地位。
2.2 CFPS简介全国家庭调查(CFPS)是中国重要的社会科学研究项目,旨在探索和分析中国家庭及其成员的社会经济状况、生活方式以及其他相关问题。
CFPS采用问卷调查的方式,涵盖了广泛的调查内容,并收集了大量有关家庭成员个体特征、职业情况、教育背景和收入水平等信息。
ChinaFamilyPanelStudiesCFPS中国家庭追踪调查
ChinaFamilyPanelStudiesCFPS中国家庭追踪调查中国家庭追踪调查2014年数据库介绍及数据清理报告吴琼戴利红张聪王⽟磊张⽂佳 2016.6.1C F P S C hina F amily P anel S tudies中国家庭追踪调查技术报告系列:CFPS-34系列编辑:谢宇责任编辑:张聪⼀.2014年调查问卷更新情况中国家庭追踪调查(CFPS)基线调查在2010年实施,2012年该项⽬实施全国范围的⾸轮全样本追踪。
CFPS2014为第三轮全样本调查,集中的⾯访时间为2014年7⽉⾄11⽉,但由于后期有追访⼯作的补充以及电话调查,实际调查执⾏期持续到2015年5⽉。
在此报告中,我们以CFPS2014来指代CFPS的第三轮全国调查,并不特指在2014年完成的CFPS 调查。
CFPS 三轮调查的问卷结构基本保持⼀致,但在具体模块以及具体问题的问法上可能会有调整。
关于问卷设计细节上的更新,⽤户可以通过⽐较不同年的问卷得到,以下是以CFPS2012的问卷为基础,CFPS2014问卷设计上的主要更新。
1.家庭成员经济联系的双重界定在CFPS2012追踪调查时,外出单元与原家庭是否存在经济联系(也即是否还属于CFPS 定义上的同⼀家庭的家庭成员)由原家庭的家庭成员问卷中⼏个问题的结果单纯的进⾏系统判定:当外出单元与原家庭有经济联系时,该外出单元被判断为物理上离家但经济上仍然归属原家庭的个体,他们的家户号fid不会发⽣改变(也即fid14与fid12保持⼀致);⾃答个⼈问卷在原家庭中产⽣,个⼈pid也不会发⽣改变;当外出单元与原家庭没有经济联系时,该外出单元被判断为经济上独⽴的个体,他们将会被分配新的家户号fid(也即fid12与fid10不同),个⼈⾃答问卷在新家庭中产⽣,但其个⼈pid不会发⽣改变。
⽽在CFPS2014调查时,⾸先,由原家庭回答⼈判断外出单元与原家庭是否经济独⽴,同时系统给其分配各⾃不同且不同于fid12的单元编码,在此阶段不产⽣个⼈⾃答问卷;其次,当外出单元被追踪成功时,他们⾃我界定与原家庭的经济联系,同时在该单元中产⽣个⼈⾃答问卷,pid维持不变。
家庭日常支出cfps
CFPS(中国家庭动态跟踪调查)主要研究中国家庭在多维度的动态变化,其数据采集主要涉及家庭成员的人口统计学特征、经济状况、健康医疗、教育就业、社区环境等多个领域。
关于家庭日常支出,CFPS数据涵盖了多个方面,包括食品、衣着、居住、家庭设备及用品、交通通讯、医疗保健、文教娱乐、其他消费性支出等。
这些支出构成了家庭总支出的主要部分,特别是在居民消费支出方面,这构成了家庭总支出的85%以上。
如需了解更多关于家庭日常支出的数据,建议查阅CFPS官方发布的数据报告,或咨询专业的经济学者。
个人资源、家庭因素与再婚行为基于CFPS数据的分析
个人资源、家庭因素与再婚行为基于CFPS数据的分析一、概述随着社会的发展和观念的变迁,再婚现象在当代中国社会中愈发普遍。
个人资源、家庭因素与再婚行为之间的关系成为社会学、心理学、人口学等多个学科关注的焦点。
本文旨在利用中国家庭追踪调查(CFPS)的丰富数据资源,深入分析个人资源、家庭因素如何影响个体的再婚选择。
通过对数据的挖掘和统计分析,我们期望能够揭示再婚行为背后的多元动因,为相关政策制定和社会学研究提供实证支持。
具体而言,本文将首先对个人资源(如教育程度、经济收入、职业地位等)进行量化分析,探讨这些资源如何影响个体的再婚意愿和再婚机会。
我们将关注家庭因素,包括原生家庭的结构和关系、再婚对象家庭背景等,分析这些因素如何制约或促进个体的再婚决策。
我们将综合考虑个人资源和家庭因素的交互作用,探讨它们对再婚行为的综合影响。
本研究不仅有助于我们理解再婚行为的个人和社会层面动因,也能为政府制定相关婚姻政策和家庭支持政策提供科学依据。
同时,通过深入剖析再婚现象,我们还能增进对当代中国社会变迁和家庭结构变化的认识,为构建和谐社会提供理论支持。
1. 背景介绍:再婚现象在当今社会的普遍性及其重要性。
在当今社会,再婚现象已经变得相当普遍,这背后反映了社会观念的转变和人们对婚姻生活的重新理解。
随着社会经济的发展和人们思想的开放,离婚和再婚不再被视为不光彩的事情,而是被看作是对个人幸福追求的一种体现。
再婚现象的普遍性,不仅体现了个人的选择和权利,更在某种程度上揭示了社会的宽容度和进步。
再婚现象的普遍性得益于社会宽容度的提高。
过去,离婚和再婚往往被视为一种社会禁忌,甚至会受到家族和社会的歧视。
随着时代的变迁,人们逐渐认识到,婚姻的幸福与否并不取决于是否离婚或再婚,而是取决于夫妻双方是否用心经营。
这种观念的转变,使得再婚人群能够更加坦然地面对自己的选择,不再受到外界的偏见和压力。
再婚现象的普遍也反映了人们对婚姻质量的追求。
ChinaFamilyPanelStudiesCFPS中国家庭追踪调查
中国家庭追踪调查2014年数据库介绍及数据清理报告吴琼 戴利红 张聪 王玉磊 张文佳 2016.6.1C F P S C hina F amily P anel S tudies中国家庭追踪调查技术报告系列:CFPS-34系列编辑:谢宇责任编辑:张聪一.2014年调查问卷更新情况中国家庭追踪调查(CFPS)基线调查在2010年实施,2012年该项目实施全国范围的首轮全样本追踪。
CFPS2014为第三轮全样本调查,集中的面访时间为2014年7月至11月,但由于后期有追访工作的补充以及电话调查,实际调查执行期持续到2015年5月。
在此报告中,我们以CFPS2014来指代CFPS的第三轮全国调查,并不特指在2014年完成的CFPS 调查。
CFPS三轮调查的问卷结构基本保持一致,但在具体模块以及具体问题的问法上可能会有调整。
关于问卷设计细节上的更新,用户可以通过比较不同年的问卷得到,以下是以CFPS2012的问卷为基础,CFPS2014问卷设计上的主要更新。
1.家庭成员经济联系的双重界定在CFPS2012追踪调查时,外出单元与原家庭是否存在经济联系(也即是否还属于CFPS 定义上的同一家庭的家庭成员)由原家庭的家庭成员问卷中几个问题的结果单纯的进行系统判定:当外出单元与原家庭有经济联系时,该外出单元被判断为物理上离家但经济上仍然归属原家庭的个体,他们的家户号fid不会发生改变(也即fid14与fid12保持一致);自答个人问卷在原家庭中产生,个人pid也不会发生改变;当外出单元与原家庭没有经济联系时,该外出单元被判断为经济上独立的个体,他们将会被分配新的家户号fid(也即fid12与fid10不同),个人自答问卷在新家庭中产生,但其个人pid不会发生改变。
而在CFPS2014调查时,首先,由原家庭回答人判断外出单元与原家庭是否经济独立,同时系统给其分配各自不同且不同于fid12的单元编码,在此阶段不产生个人自答问卷;其次,当外出单元被追踪成功时,他们自我界定与原家庭的经济联系,同时在该单元中产生个人自答问卷,pid维持不变。
CFPS家庭关系库的应用及常见问题
数据处理与分析方法
变量处理
根据研究目的,选择合适的变量 ,并进行必要的变量转换或生成 新变量。
推论性统计
运用统计模型对数据进行深入分 析,探究变量之间的关系和影响 。
01
数据清洗
在进行分析前,需要对数据进行 清洗,包括处理缺失值、异常值 和重复值等。
02
03
04
描述性统计
对数据进行描述性统计分析,了 解数据分布和特征。
政策制定
基于家庭关系库的数据分析 ,可以为政策制定者提供有 关家庭结构、家庭关系等方 面的信息,为制定针对性政
策提供依据。
社会服务
家庭关系库的数据可以为社 会服务机构提供有关家庭状 况的信息,有助于更好地满 足家庭需求,提高服务质量 。
未来发展趋势预测
数据更新与维护
随着社会的变迁和家庭结构的变化,家庭关 系库需要不断更新和维护,以保持数据的时
结果呈现与报告编写
结果呈现方式
根据研究目的和受众,选择合适的结果呈现方式,如图表 、表格或文字描述等。
报告编写结构
报告应包括标题、摘要、引言、方法、结果、讨论和结论 等部分。
报告注意事项
确保报告内容准确、简洁、清晰,避免使用过于专业的术 语,以便受众易于理解。同时,要遵守学术规范,注明数 据来源和引用文献。
02
CFPS家庭关系库概述
数据来源与收集
数据来源
CFPS家庭关系库的数据主要来源于中国家庭追踪调查(CFPS)项目,该项目是一个全国性、综合性的社会追踪 调查项目。
数据收集
CFPS家庭关系库通过定期的家访、电话访问等方式收集数据,确保数据的真实性和准确性。同时,该项目还与 多个政府部门和机构合作,获取相关的行政记录和统计数据。
【中心】北大中国家庭动态跟踪调查
【关键字】中心主题:中国家庭动态跟踪调查中国家庭动态跟踪调查(Chinese Family Panel Studies, CFPS)是北京大学中国社会科学调查中心实施的一项旨在通过跟踪搜集个体、家庭、社区三个层次的数据,反映中国社会、经济、人口、教育和健康的变迁,为学术研究和政策决策提供数据为目标的重大社会科学项目。
项目的前期经费由教育部985二期计划支持,从2005年开始进行筹备,2006年成立机构,2007年正式进入前期工作,在北京、河北、上海完成了两次共计140户的测试性调查,问卷工具基本成熟。
2008年在北京、上海、广东的展开探索性调查,调查规模为2400户;2009年在北京、上海、广东三地展开工具性测试跟踪调查,测试CAPI技术、调查进程实时管理技术、调查进程实时技术支持系统、数据质量实时监控技术的稳定性和可靠性。
2010年在全国(西藏、青海、新疆、宁夏、内蒙古、海南、香港、澳门、台湾不在其列)正式实施,调查规模为16000户,每年一次跟踪调查。
中国家庭动态跟踪调查第一期计划为12年(2008-2020)。
2010年开始,每年3-7月在全国展开实地调查,8-10月清理数据,11月-次年2月向北京大学及调查合作院校师生提供数据,撰写关键指标报告(《中国报告》),并交由北京大学出版社出版;3月发布前一年关键指标的公开报告;在次年3月对社会公开数据。
北京大学中国社会科学调查中心(Institute of Social Science Survey, iSSS,以下简称“中心”)成立于2006年9月,是直接隶属于北京大学的教学科研实体。
作为“中国家庭动态跟踪调查”项目的执行机构,中心还承担国内外学术和政府机构的委托调研,以调查、收集、整理、集成中国社会经济和社会科学研究数据为目的,为教学、科研、政策分析和决策提供数据平台。
“中国家庭动态跟踪调查”是一项旨在反映我国社会、经济、人口、教育和健康的变迁,为学术研究和政策决策提供数据为目标的重大社会科学项目。
cfps收入综合变量的计算逻辑
cfps收入综合变量的计算逻辑CFPS收入综合变量的计算逻辑CFPS(China Financial Panel Survey)是由中国人民银行研究局发起的一项大型家庭调查项目,旨在了解中国家庭的收入、消费、储蓄、负债等经济状况。
其中,CFPS收入综合变量是衡量家庭经济状况的重要指标之一。
本文将介绍CFPS收入综合变量的计算逻辑。
CFPS收入综合变量的计算逻辑基于家庭的收入来源和收入分配情况,主要包括以下几个步骤:1. 收入来源分类CFPS将家庭的收入来源进行分类,一般包括工资、经营所得、财产性收入、转移性收入等。
其中,工资是家庭成员从劳动所得到的收入,经营所得是家庭成员从经营活动中获得的收入,财产性收入是家庭成员从资产(如房屋、股票等)获得的收入,转移性收入是家庭成员从政府或其他家庭获得的社会救济、补贴等收入。
2. 收入分配权重CFPS根据家庭成员的收入来源和收入分配情况,对不同收入来源的权重进行分配。
一般来说,工资收入所占比重较大,其次是经营所得和财产性收入,转移性收入的权重相对较小。
这样,可以更准确地反映家庭收入来源的重要性。
3. 收入计算CFPS根据家庭成员的收入来源和收入分配权重,计算出家庭的总收入。
具体而言,对于每个家庭成员,将其各个收入来源乘以相应的权重,然后将得到的结果相加,即可得到该成员的个人收入。
最后,将所有家庭成员的个人收入相加,即可得到家庭的总收入。
4. 收入综合变量计算CFPS根据家庭的总收入,计算出收入综合变量。
收入综合变量是对家庭收入水平的综合评价,通常采用加权平均法计算。
即将家庭的总收入除以家庭人口数,得到家庭的平均收入,然后再根据权重对家庭平均收入进行调整,得到收入综合变量。
需要注意的是,CFPS收入综合变量的计算逻辑是根据家庭的收入来源和收入分配情况进行综合评价的,因此在计算过程中要确保数据的准确性和可靠性。
同时,由于家庭成员的收入来源和收入分配情况可能存在差异,因此在计算过程中要对不同的家庭类型进行分类处理,以得到更准确的结果。
中国追踪调查数据权数的使用-北京大学中国社会科学调查中心
2、追踪数据库 --------------------------------------------------------(1)CFPS的人员类型和问卷数据库
非他家庭成员
非核心人员
核心人员
核心人员个人问卷数据
各追踪年新进基因
家庭问卷数据库
2010年基因
个人问卷数据库
核心成员问卷信息都可以作为辅助信息使用
3、抽样总体(全国25省)(subsample=1)
(二)研究对象 --------------------------------------------------------
中国(除香港、澳门、台湾、新疆维吾尔自治区、西藏自治区、 青海省、内蒙古自治区、宁夏回族自治区和海南省等省区之外) 的25个省市自治区的家庭户和家庭户中的所有满足调查条件的 家庭成员。 上海市的家庭户和家庭户中的所有满足调查条件的家庭成员 辽宁省的家庭户和家庭户中的所有满足调查条件的家庭成员 河南省的家庭户和家庭户中的所有满足调查条件的家庭成员 甘肃省的家庭户和家庭户中的所有满足调查条件的家庭成员 广东省的家庭户和家庭户中的所有满足调查条件的家庭成员
追踪数据库分析 --------------------------------------------------------(1)横截面分析:分析调查年家庭经济和个人总体情况。 调查年数据(2010基因+各年新进基因) 调查年横截面权数。 (以往各年的数据、核心成员个人数据、家庭关系数据、村居数 据作为辅助信息) 方法:可以将存在横截面权数的数据库提取出来使用。 (2)纵向分析:仅分析2010年的基因成员变动情况。 调查年及其以往各年数据(或调查年与基线调查数据) 调查年纵向权数。 方法:可以将存在纵向权数的数据库提取出来使用。
CFPS中国家庭动态跟踪调查
中国家庭动态跟踪调查抽样设计谢宇 邱泽奇 吕萍2012.12.20C F P SC hina F amily P anel S tudies中国家庭动态跟踪调查技术报告系列:CFPS-1系列编辑:谢宇 责任编辑:胡婧炜1. 调查对象和目标样本量CFPS调查的对象为中国(不含香港、澳门、台湾以及新疆维吾尔自治区、西藏自治区、青海省、内蒙古自治区、宁夏回族自治区、海南省)25个省/市/自治区的满足项目访问条件的家户和样本家户中满足项目访问条件的家庭成员。
在2010年的基线调查中,居住在传统居民住宅内的、家中至少有一人拥有中国国籍的一个独立经济单元,便可视为一个满足项目访问条件的家户。
1满足项目访问条件的家庭成员则指样本家户中经济上联系在一起的:A.与该家庭有血缘/婚姻/领养关系的直系亲属;B.与该家庭有血缘/婚姻/领养关系且居住满3个月的非直系亲属;C.与该家庭没有血缘/婚姻/领养关系但居住满6个月的其他成员。
CFPS样本所在的25个省/市/自治区的人口覆盖了中国除香港、澳门、台湾外总人口数的94.5%,由于覆盖范围如此广泛,因此可以将CFPS样本视为一个全国代表性样本。
CFPS重点关注中国社会经济、教育、家庭、人口和健康等方面的变迁,为了更好的了解这一点,不仅需要从宏观层面上把握中国的整体变迁,还需要在微观层面上了解中国的几个典型省/市的在这些方面的变化状况。
因此,在抽样设计上,我们首先将全国25个省/市/自治区分成两类:一类省市为在省级层次的推断样本,用以满足省级推断的要求。
我们选择了5个省/市,分别为辽宁、上海、河南、广东、甘肃,也称为大样本省(以下简称为“大省”)。
二类省市为上述5个省/市外的20个省/市/自治区,这一类省市的样本量不能够在省级层次进行推断,也称小样本省(以下简称为“小省”)。
从这两类样本数据的加权可以得到对25个省/市/自治区总体的有效估计,进而用来推断全国。
25个省/市/自治区的分类见表1。
CFPS简介
谢谢!
实地
核查
回放
键盘 重现
调查实施
调查 系统
访问 行为
数据 库
管理 行为
调查实施
访问管 理系统 财务管 理系统 样本管 理系统
访问报 告系统
数据 库
访员维 护系统
质量督 导系统
样本维 护系统
调查实施
• 进度管理
数据公布
• 公众了解
数据公布
• 提供研究
– 当年的数据,第二年的第一学期在北京大学校 内公开 – 第三年的第一学期,提供学术和政策研究 – 例如:2010年的初访调查数据,将于2011年春 季学期提供北京大学教学科研,并于2012年春 季学期提供学术和政策研究 – 不提供商业研究
理论设计
• 人的成长是阶段性的
– 少年—中年—老年
• 每个阶段的重点是不同的
– 少年:养成好的性格;获得优秀的能力 – 中年:获得高的成就;建立幸福的家庭 – 老年:感受人生的幸福:福、禄、寿
理论设计
• 哪些因素是重要的?
– 身体/天赋:优生优育、卫生医疗、日常生活 – 性格:家长、家庭、邻里、同伴、学校 – 能力:家长、学校
问卷设计
• 问卷的主题
– 社会:人生活在社会中的,社会也是人建构的 – 经济:经济生活是基础性的 – 教育:个体获得能力的必经之路 – 健康:个体生活在社会中的基本条件和前提 – 心理:个体生活在社会中的充分条件 – 人口:人生活的目的与后果 – 环境:人与自然关系的直接后果
问卷设计
• 问卷
– 村居问卷:生活的初级环境(孟母三迁) – 住宅过滤模块:获得准确的目标住宅 – 住户过滤问卷:获得准确的目标家户 – 家庭问卷(一):家庭成员问卷 – 家庭问卷(二):生活的与建设的环境 – 少儿问卷:天赋的和养生的因素与过程 – 成人问卷:建设的生活与感受
cfps 个体固定效应
cfps 个体固定效应
CFPS是中国家庭追踪调查的缩写,个体固定效应是指在分析过程中,将个体差异作为固定影响因素进行控制,以避免因个体差异导致的偏差。
在CFPS个体固定效应分析中,需要注意以下几点:
- 数据来源:采用2010-2014年三期CFPS面板数据。
- 分析方法:通过加入个体固定效应的再中心化影响函数回归,消除“不可争辩的口味”;再在此基础上进行无条件分位数分解,将相同特征条件下系数不同导致的不平等定义为“可争辩的口味”效应。
- 结果显示:在包含收入阶层流动的情况下,“可争辩的口味”和社会经济地位分别可以解释膳食健康不平等的54.3%和44.5%;在不包含收入阶层流动的情况下,二者分别可以解释37.1%和62.3%。
人口学特征、个体健康、供给因素的作用很小。
在使用CFPS个体固定效应进行分析时,需要注意数据的可靠性和完整性,以确保分析结果的准确性和可靠性。
同时,可以结合其他方法进行综合分析,以获得更全面的结论。
CFPS家庭关系库的应用及常见问题
1
Байду номын сангаас
2.2012年间接获取:新增在婚成员 (_p)如果配偶缺失,很可能配偶当时
在异地,没有回到家庭中。
判断父母与子女是否异地、兄弟姐妹是否同住的情况也都类似
09/13/2015
1
09/13/2015
isssdailh@
2015.9.13
1
2010年家庭成员问卷中T1“同住家庭成员表”,T2“家庭成员直 系亲属关系表”,T3“家庭成员不同住直系亲属列表”分别代表 了哪些家庭成员,如何使用?
…… A成员3
…… A成员1
……
……
家庭成员 及离家人
员信息
家庭关系 网及关系 人信息
09/13/2015
6
成 员 变 量 组
09/13/2015
成员编码 家庭编码
家庭人员的 信息变量名
变量名 pid fid12 fid10 code_a_p
cfps_interv_p
TB1A_A_p TB1B_A_p TB1Y_A_p TB1M_A_p TB2_A_p ALIVE_A_p deathreason_ p TB3_A12_p TB4_A12_p qa301_a12_p qa302_a12_p
戴利红
中国社会科学调查中心
北京大学 2015 年 9 月
一.家庭层面
原家庭:调查前确定的追访家庭 另组家庭:调查中由原家庭分裂出来、且经济独立的新家庭样本
二、个人层面
基因成员:2010年所有家庭成员 + … + 往期调查的基因成员 在当期追访时的新生或是不超过10岁的领养子女
核心成员:关系人(父母、配偶、子女)中至少有一个是基因成 员的非基因成员。
中国家庭动态跟踪调查2010年基线调查末端抽样框制作
中国家庭动态跟踪调查2010年基线调查末端抽样框制作丁华2012.12.20CFPS China Family Panel Studies中国家庭动态跟踪调查 技术报告系列:CFPS-2系列编辑:谢宇责任编辑:胡婧炜1.概要CFPS采取地图地址法构建末端抽样框。
地图地址法是指通过绘制样本村/居的地图,确定每一个住址的地图信息和住户信息,以此来构建末端抽样框的方法。
在样本村/居中抽取家庭户样本时,需要建立一个完整的覆盖该村/居所有住户的末端抽样框。
在我国目前人口流动性大、人户分离状况严重的情况下,如果仅利用村/居委会的户籍花名册进行抽样,势必会遗漏掉很大一部分住户的信息,也无法保证抽样框的完整性和末端抽样的有效性。
采用地图地址法构建末端抽样框,能够通过实地绘图过程,绘制出村居所有建筑物,并通过进一步的核查措施,排除非住户信息和特殊地址信息,最终形成住址和住户信息相结合的抽样框,大幅提高抽样的精度。
CFPS全部的地图绘制工作通过纸笔方式完成,由北京大学中国社会科学调查中心(以下简称“中心”)执行部负责具体实施。
本报告将重点阐述绘图的工作流程与操作方案。
12.末端抽样框制作方案制定自2009年初至2009年8月,中心多名工作人员在北京、河北的四个村/居进行了多次现场绘图试点,针对各种类型村/居在建筑物特征、建筑物编号规则、住户列表清单制作方法、村居配合和协调人员选择、村居现有地图和住户清单可用性等方面进行了细致了解和实验,获得了宝贵的一线绘图和住户列表制作经验。
在充分总结试点经验并大量查阅国内外大型调查绘图文献的基础上,中心根据中国村居居住特点制定了村居抽样框制作方案。
2009年11月至12月,中心在甘肃和浙江两省各抽取了4个村居进行了预调查。
预调查的一个重要目的就是测试末端抽样框制作方案的可行性。
在预调查的8个村居中,工作人员根据既定方案进行了绘图和住户清单列表的制作工作。
甘肃和浙江两省的经济发展情况差异较大,村居建筑物特征迥异,尤其是浙江省所抽取的4个村居极具南方城镇居住格局复杂的特点,对抽样框制作方案的修订起到了非常大的作用。
cfps调研的流程
cfps调研的流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!CFPS 是中国家庭追踪调查(China Family Panel Studies)的缩写,是一项全国性的家庭追踪调查项目。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
表 3. 样本区/县的村居数据统计表 村居数 100 以下 100~200 200~300 300~400 400~500 500~600 600 以上 合计 区县数 31 41 38 22 11 8 11 162
45 40 35 30 25 20 15 10 5 0 100以下 100~200 200~300 300~400 400~500 500~600 600以上
3.1.2 “小省”的抽样 对于作为 CFPS 样本剩余组成部分的“小省”的样本,这些省份中的区(若为城市)或 者县(若为农村)构成了一个抽样框。为了形成内隐分层,区/县按照辅助信息进行以下排 序: ⑴ 20 个省级行政区按照社会经济地位(SES)降序排列。 ⑵ 每个省内,将全省所有市级行政区以省会城市居首、其它地级市按照社会经济地位 (SES)降序排列。 ⑶ 将每个地级市或同级行政区划区分成三个部分:区、县级市和县。在每一部分内,
1
最初我们还要求受访家庭户中至少有一名成员在抽样社区居住时间满 6 个月,但在执行过程中,这一条 件被取消,实际被这一条件过滤掉的仅有极少数家户。 1
由上,本次基线调查共有 6 个子总体,即 5 个“大省”和 其它“小省” 。根据中国和 世界上一些大型的抽样调查的经验及 2008、2009 年对北京市、上海市、广东省三个省市预 调查的经验, 在考虑调查经费和估计量精度的基础上, 确定两类省市的样本量: 5个 “大省” 的目标样本量分别是 1600 户, “小省”的目标样本量总共是 8000 户,共 16000 户。
6
将上述合并后的村居视为抽样框中的虚拟村居,其人口数为合并村居的人口数和,区 域面积为合并村居的区域面积和。由此,得到样本区/县或样本街道/乡镇的村居抽样框。
3.2.2 村/居抽样 为了提高样本的代表性,我们在理想情况下也可以借助辅助信息对村居抽样框进行排 序。 但在村居层面上, 我们并没有 SES 信息可以利用, 所以基本是按照计生委提供的顺序, 不做更改。 有些地方提供的村居委会的排名是按照国统局的代码, 这些代码在制作时有一定 的经济发展意义。 在除上海外的所有省份中,从每个 PSU 中随机抽取 4 个村/居。在上海,从每个 PSU 中 的中随机抽取 2 个村/居。为了形成内隐分层,村/居按照辅助信息进行以下排序: ⑴ 在合适的情况下,将一个 PSU 划分成三个部分:街道办事处、镇和乡。 ⑵ 在每个部分中,将所有街道办事处/镇/乡分成两部分:居委会和村委会。在居委会 和村委会内部,进行排序。 从每个被抽取的 PSU 组成的抽样框内,采用系统 PPS 抽样方式(见附录 A)抽出 2 个 (上海)或 4 个(其他 24 个省份)社区。 最终共得到 640 个村/居样本,其中合并村/居有 8 个,占 1.25%。 需要注意的是, 由于从获得各级抽样框到抽取样本会有一定的时间间隔, 期间会有极少 部分样本村/居拆迁、搬迁、取消等,此时需要在相同乡镇/街道中用相同规模的邻近村/居对 其进行替换。在实际调查中,替换的村居共有 11 个(样本区/县更新时在样本区/县的重新抽 样的情况不计算在内) 。
2
我们对大社区进行了抽样后的事后拆分,具体见下文。 5
则与邻近人口数比较少的村委会合并;若合并一个后还是不到 300,则按照相同的原则继续 合并,直到人口数大于或等于 300 为止;若周围没有村委会,可以与邻近的居委会合并。② 若此小村/居是居委会,则与邻近人口数比较少的居委会合并;若合并一个后还是不到 300, 则按照相同的原则继续合并;若周围没有居委会,可以与邻近的村委会进行合并。 ⑶ 若小村/居人口数很少,邻近的村/居都十分远,则不进行合并。若某村/居与邻近村/ 居合并后人口数接近 300, 则无需再次合并。 若整个乡镇/街道合并后仍不到 300 也无需再次 进行合并。 表 4 是最终合并村居情况的统计表:
青海省、内蒙古自治区、宁夏回族自治区、海南省)25 个省/市/自治区的满足项目访问条件 的家户和样本家户中满足项目访问条件的家庭成员。在 2010 年的基线调查中,居住在传统 居民住宅内的、 家中至少有一人拥有中国国籍的一个独立经济单元, 便可视为一个满足项目 访问条件的家户。1 满足项目访问条件的家庭成员则指样本家户中经济上联系在一起的: A.与该家庭有血缘/婚姻/领养关系的直系亲属;B.与该家庭有血缘/婚姻/领养关系且居住满 3 个月的非直系亲属;C.与该家庭没有血缘/婚姻/领养关系但居住满 6 个月的其他成员。 CFPS 样本所在的 25 个省/市/自治区的人口覆盖了中国除香港、澳门、台湾外总人口数 的 94.5%,由于覆盖范围如此广泛,因此可以将 CFPS 样本视为一个全国代表性样本。 CFPS 重点关注中国社会经济、教育、家庭、人口和健康等方面的变迁,为了更好的了 解这一点, 不仅需要从宏观层面上把握中国的整体变迁, 还需要在微观层面上了解中国的几 个典型省/市的在这些方面的变化状况。因此,在抽样设计上,我们首先将全国 25 个省/市/ 自治区分成两类:一类省市为在省级层次的推断样本,用以满足省级推断的要求。我们选择 了 5 个省/市,分别为辽宁、上海、河南、广东、甘肃,也称为大样本省(以下简称为“大 省” ) 。二类省市为上述 5 个省/市外的 20 个省/市/自治区,这一类省市的样本量不能够在省 级层次进行推断,也称小样本省(以下简称为“小省” ) 。从这两类样本数据的加权可以得到 对 25 个省/市/自治区总体的有效估计, 进而用来推断全国。 25 个省/市/自治区的分类见表 1。
表 1. 全国 25 个省市的分类 类型 省市自治区 上海市 一类省市 (自我 代表省市, “大省”) 辽宁省 河南省 甘肃省 广东省 二类省市 (非自 我代表省市, “小省”) 江苏省、浙江省、福建省、江西省、安徽省、山东省、河北省、山西省、 吉林省、黑龙江省、广西壮族自治区、湖北省、湖南省、四川省、贵州 省、云南省、天津市、北京市、重庆市、陕西省
3.
3.1
各阶段抽样
第一阶段抽样
3.1.1 “大省”的抽样 对辽宁、河南、甘肃和广东这 4 个“大省” ,每个省内的所有区(若为城市)或县(若 为农村)构成了一个抽样框(sampling frame) 。为了形成内隐分层,区/县按照辅助信息进行
2
以下排序: ⑴ 全省所有市级行政区以省会城市为首、其它所有地级市按照社会经济地位( SES) 降序排列。 ⑵ 每个市级行政区被区分成三个部分:区、县级市和县。在上述各部分的内部,区 / 县级市/县各自按照社会经济地位(SES)降序排列。这些区/县级市/县构成了本调查的初级 抽样单位(PSU) 。 对于上述 4 个抽样框, 采用如附录 A 所描述的系统 PPS 抽样方式 (systematic probability proportional to size sampling)从每个抽样框中抽取 16 个 PSU。附录 B 给出了用于构建这些 抽样框的资料来源。 上海市只有 19 个区县。第一阶段的抽样在比区/县低一级的行政区划上实施,即街道办 事处(若为城市)和乡镇(若为农村)层次上。为形成内隐分层,所有的街道办事处、乡镇 按照辅助信息进行以下排序: ⑴ 全市 19 个区县按照社会经济地位(SES)降序排列。 ⑵ 每个区/县分成街道、镇和乡区三个部分。 ⑶ 每个区/县的每一部分内,街道、镇和乡——上海的初级抽样单位(PSU)——按照 社会经济地位(SES)降序排列 在这个抽样框中, 采用与规模成比例 (proportional-to-size) 的系统抽样方式 (见附录 A) 抽取 32 个 PSU(参见附录 A) 。附录 C 给出了用于构建该抽样框的资料来源。
3
所有的区/县级市/县——20 个小省的初级抽样单位(PSU)——按照社会经济地位(SES) 降序排列。 在这个大抽样框中,采用附录 A 给出的与规模成比例(PPS)的系统抽样方式抽出 80 个 PSU。 附录 D 给出了用于构建该抽样框的资料来源。 小省的样本区县的分布如表 2 所示。
表 2. “小省”的样本区县在各省市的分配 省市 北京市 福建省 黑龙江省 山西省 安徽省 浙江省 天津市 江苏省 吉林省 河北省 样本区/县数 1 2 5 7 3 3 1 3 3 8 省市 重庆市 江西省 陕西省 广西省 湖北省 云南省 贵州省 湖南省 山东省 四川省 样本区/县数 2 3 3 3 3 4 5 6 7 8
China Family Panel Studies
CFPS
中国家庭动态跟踪调查
技术报告系列:CFPS-1 系列编辑:谢宇 责任编辑:胡婧炜
中国家庭动态跟踪调查 抽样设计
谢宇
邱泽奇
吕萍
2012.12PS 调查的对象为中国 (不含香港、 澳门、 台湾以及新疆维吾尔自治区、 西藏自治区、
2.
抽样设计总原则
CFPS 样本是一个采用内隐分层(implicit stratification)方法抽取的多阶段等概率样本
(multi-stage probability sample) 。采用多阶段抽样设计既是为了减少调查的运作成本,也 是考虑到中国社会的社会背景差异。CFPS 中的每个子样本都通过三个阶段抽取得到。 抽样过程中的前两个阶段使用官方的行政区划资料。中国的行政区划结构有两个重要 特征:首先它是严格分等级的;其次,它覆盖了中国所有人口。由于上海不同于其它“大 省” ,所以,上海样本的抽取被作为特例处理。 因为中国的经济发展一直存在地理上的差异,所以抽样设计中需要着重强调的就是地 理代表性(geographic representation) 。通过内隐分层,可以确保样本很好地代表了这 25 个 省份。而且,在每个省份中,省会城市作为隐含分层被挑选出来。当城乡差异存在且有意义 时, 城–乡区别总是被用来进行多阶段的区域层次上的隐含分层。 一般地, 区、 街道办事处、 或居委会指的是城市地区;相应地,县、乡镇或者村则指的是农村地区。除城–乡区别外, 一个用于测量社会经济地位(SES)的连续变量也被用于进行内隐分层。根据数据的可获得 性,所选用的排序变量依次为地方人均 GDP、非农人口比例或人口密度。 第三个阶段在入选的样本村/居中,利用村级调查地图得到的住户列表清单制作末端抽 样框,按照随机起点的循环等距抽样方式,以扩大样本量的方法抽取家户样本,以确保每个 样本村居的能够完成目标的 25 户家庭。