人口的乡城流动对生育水平的影响

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2018 年第1期 ,-.1 2018第33 南方人口V-1. +9
%145 期) SOUTH CHINA POPULATION G eneral N o. 145人口的乡城流动对生育水平的影响!
梁同贵
(复旦大学人口研究所,上海200433)
[摘要]在总结了我国迁移流动人口生育水平研究中存在的不足后,选取“中国家庭追踪调查(C FP S)
2010”中的成人问卷数据库与国家卫生计生委组织实施的2014年全国流动人口卫生计生动态监测调查
项目中的全国个人数据库,采用C〇x回归模型分析了人口流动对各孩次递进生育的影响过程。

研究结果
显示,流人地居住时长越长则乡城流动人口二孩、三孩递进生育的概率越大,中断理论在我国这一问
题的研究中适用。

中断效应将会推迟流动妇女生育孩子的年龄,人口流动对生育水平影响的进度效应
存在。

相比较于农村本地人口,人口流动确实降低了乡城流动人口在二孩及更高孩次递进生育的概率,
人口流动对生育水平影响的数量效应存在,这或许可以从融合理论来解释。

[关键词]乡城流动人口;农村本地人口;城镇本地人口;进度效应;数量效应
[中图分类号]C92-05 [文献标识码]A[文章编号]1004-1613 (2018)01-0030-18
1研究背景
国内对于流动人口生育问题的研究,溯源于将流动人口视为“超生游击队”一说,当然这种 说法在当时的学术界也存在着争论。

有部分学者认为流动人口存在着计划外超生的现象(廖学斌,1988; Yang,2000;武俊青等,2008;高春凤、卢亚贞,2009;叶菊英,2010);另一部分学者认 为迁移流动将会降低生育率(杨子慧,1991;周祖根,1995; Goldstein 4Goldstein,1997)。

近期,基于全国范围的人口普查、小普查与流动人口动态监测数据的研究结果均显示了迁移流动对 生育水平降低有着显著性影响作用(李丁、郭志刚,2014;周皓,2015;陈卫、吴丽丽,2006; 郭志刚,2010)。

阅读下来,认为仍然存在着一些不足的 。

1.1常用的生育率指标在研究我国迁移流动人口生育水平上存在着缺陷
国内学者通常根据普查前一年的生育情况来计算“总和生育率”、“分孩次总和生育率”、“一般生育率”等作为生育水平指标,但“处于流动状态的人口倾向于推迟生育,而推迟生育产生 的时期进度效应会显著地降低当年的总和生育率”%郭志刚2010)。

理论上,婚育年龄的推迟使得总和生育率这一时期生育水平指标并不能反映流动人口真实的终身生育水平,而流动人口与非
[收稿日期]2017-08-25
①[基金项目]国家社科基金重点项目“家庭为中心的迁移和福利政策研究”(编号17A R K002);国家哲学社会科学重“提高户籍人口城镇化率研究”(批准号15ZD C035 );国哲学社会科学重点项目“新生代民工
市民化研究”(批准号14A Z D027);国社科基金青“新型城镇化背景下特市人口空间分异与结构优化研
究< (批准号16C R K006)”
[作者简介]梁同贵,男,复旦大学人口研究所博士研究生,研究方向:人口迁移与社会政策。

30
人口的乡城流动对生育水平的影响
流动人口所受时期进度效应影响的差异,使得时期总和生育率在流动人口与非流动人口之间比较
时又产生了误差。

流动妇女存在着生育推迟的时期效应已经得以证实(李丁、郭志刚,2014;梁
同贵,2016),流动推迟生育可以用中断理论(Disruption theory)②来解释。

事实上,国外一些研
究也指出通常使用的时期总和生育率在研究移民生育率上并不是一个可靠的指标(AndersS〇n,2004; Sobotka,2008; Roba+d* <Be+rington,2016)。

Ande+**on(2004)在研究瑞典移民的生育模
式时提到,“基 ,总和生育率是 生育率的测量,在生育 动力的研究上并不适用,如
并不能测量迁人以来一段时间内的生育发展状况。

对于来自国外的且来源国范围不断扩大的育龄
妇女,用此指标去理解生育动力便不准确”。

Sobotka (2008)认为时期总和生育率在反应国外移民
中在迁人地居留时间较短的那部分妇女的生育水平时,在的失真也就更为严重。

所以时期
总和生育率并不能够检验中断效应之后,究竟是“追赶理论+(Catch-up theory)③还是融合理论 (Assimilation theory)④起作用,此指标存在的缺陷要求米用另外的生育率指标或者研究方法以考察
人口流动对生育 的影响。

这也提示我们,结合迁移后在迁人地居住时长来分析移民生育率的 动也的。

另外,国内学者往往采用“曾生子女数”以及由此衍生出来的“分年龄的平均生育子女数”、“按出生队列的平均子女数”等作为累计生育水平来比较流动人口与非流动人口之间的差异,但这
些研究并没有区分流动与孩子生育在时间上的先后关系,严格意义上不能作为衡量流动人口生育
水平的指标。

而且,这类指标也不能求证人口流动对生育水平影响的因果关系。

1.2截面数据制约着流动对生育影响的因果关系分析
国内学者对于这一问题的研究目前仍停留在均采用截面数据的阶段,对流迁人口的数据资料
统计均来自一次性全国的抽样调查或者地方抽样调查(李丁、郭志刚,2014;周皓,2015;廖学 斌,1988;武俊青等,2008;叶菊英,2010;杨子慧,1991;陈卫、吴丽丽,2006;郭志刚,2010;陈颐,200:),但截面数据对于解释因果关系的有效性较差(郭志刚,2001)。

由于这样的
调查少对流迁人口迁人地与生育孩次的跟踪,也即并不能明确调查时点上流动人口曾生子女究
竟是在流动前生育还是流动后生育的,这两者不能一一对应起来,所以人口流动对生育水平影响
作用是否存在着因果关系还不得证。

近期,国外越来越多的研究开始使用纵向数据来分析迁移对
生育行为的影响作用(Charle* <Ayiemba,2011;Nadja,2007;Reed et al.,2010;Choi,2014),因此在我
②“中断理论”认为迁移过程带来的变化将会干扰移民的生育,也包括迁移前与迁移后这两段时间。

最常见的中断包括择偶的中断与夫妻离的中,夫妻之间的离造成婚生育的中断主受到离、产后闭经与受孕的时间
长度的影响,或者流迁过程中遇到的困难将会导致生育孩子的中断,流动迁移人口迫于迁移后的压力而延缓生育孩。

中理论并不考察移民在长时间的生育率。

③“追赶理论”流动移人口原出的生育率较高,他们的生育意愿同样保持在较高的水平,经过一段时
间的调应了的生活,生育变的,可会中生育率一个的 ,或
“追赶行为”(catch in g-u p behavior),生育率相应地也会提高。

④V理论”移后移民的生育度与生育将会为适应迁人地的社会经济、文化与物质环境而发生
改变。

间的移民原民将会生育,并在现代化媒介的用应较的生育。

基的社会经济基的 移民通过的 来应的生,的 变了生育的会成本,开始变得的民样少生育。

31
2018年第1期 南方人口
国现有调查数据库中,选取并且构建一套纵向数据也成为了后续研究的数据基础工作。

1.3流动人口类型的界定杂乱
在流迁人口内部类型的区分上,国际上一般采用乡村-城镇迁移,乡村-乡村迁移,城镇-城 镇迁移,城镇-乡村迁移四种口径来划分。

而国内相关的研究中往往不对流动人口内部类型进行区 分,统称为“迁移妇女”,“流动人口”(李丁、郭志刚,2014;周皓,2015;杨子慧,1991);或者采用其它方式,如“城市外来”与“农村外来”(陈卫、吴丽丽,2006),“农业流动”与 “非农业流动”(郭志刚,2010)。

这样的区分模式使得流动人口缺少严格意义上与之对应的非流 动人口参照群体,这也是石人、熊波(2011)在其研究评述中提出“中国‘流动人口生育水平 更低’的结论有进一步检验”的,“国外的许多研究是将迁移流动人口的生育行为与原居住地非迁移流动人口进行比较,而国内研究者们要么将迁(流)人人口的生育率与全国平均 生育率相比,要么将迁(流)人人口的生育率与目的地妇女生育率相比。

严格地说,这样的比较 是不能反映迁移流动对生育行为的影响的”。

1.4违法生育、计划外生育与多育在概念上混淆
有部分学者认为人口流迁将会提高生育水平,这些研究主要集中在区域调查的违法生育与计 划外生育上(廖学斌,1988;武俊青等,2008;高春凤、卢亚贞,2009;叶菊英,2010),但这些 研究中有些并没有严格区分 划外 上的不同。

“计划外 四种情况: (1)早育;(2)间隔不足生育;(3)多育;(4)其他未获得当年指标的生育(阎海琴,1999)。

见,流动人口的“”与“计划外 ”中只有“多育”是与生育水平有关系的。

陈文金(1999)对1996年以来繁昌县161例计划外生育进行了一次回顾性的问卷调查,发现“早婚早 育的有21例,占13.04/; —女户间隔期未到而抢生的有93例,占计划外生育总数的57.76%; 一男孩户超生二孩的有22例,占13.66/;纯女户超生多孩的有25例,占15.53%”。

据此计算,计划外生育中仅有29.2/与生育水平相关,一调查并没有区分是否为迁移流动人口,迁移流动 人口计划外生育的内部结构还不知道。

另外,类似研究往往取自局部范围的调查数据,这个范围 小到一个社区、一个镇,大到一个地级市,这类研究结果能否代表全国还尚待进一步考究。

基于以上理论与文献回顾,构建一个纵向数据用以分析人口流动对生育水平影响的因果关系,找到一个更为合适的生育率指标或研究方法,增加对流动人口在居住地时间长度的研究,重新划 分流动人口类型这四个方面是本文在研究我国人口流动对生育水平影响问题上进一步继续推进的 方面。

文章只选取了乡城流动人口,并做研究假设如下,(1)人口流动将会延缓孩次递进生育,人口流动对生育水平影响的进度效应存在;(2)人口流动将会降低生育水平,人口流动对生育水 平影响的数量效应存在。

2数据基础
2.1数据库介绍
文章采用“中国家庭追踪调查(CFPS)2010”中的成人问卷数据库与国家卫生计生委组织实 施的2014年全国流动人口卫生计生动态监测调查项目中的“2014年全国个人A卷”数据库作为 研究基础。

CFPS2010年成人数据库记录了 16岁及以上人群的基本信息,详细统计了每个样本1 32
人口的乡城流动对生育水平的影响
孩到10孩的生育史信息。

CFPS2010年的样本覆盖中国除香港、澳门、台湾、新疆、青海、内蒙
古、宁夏和海南之外的25个省/市/自治区的人口。

这25个省/市/自治区的人口约占全国总人口 (不含港、澳、台)的95%,因此,CFPS的样本可以视为一个全国代表性样本⑤。

2014年全国流 动人口动态监测个人A卷的调查对象为“在流人地居住一个月以上,非本区(县、市)户口的 15-59周岁流人人口”⑥,记录了每个样本1孩到5孩的生育史信息。

CFPS成人问卷数据库样本 量33600份,通过这个数据库选取农村本地人口与城镇本地人口。

流动人口动态监测数据库样本
量为200937份,用来选取乡城流动人口。

2.2数据库可信性评价
将两个不同时间上调查得来的数据结合起来使用是否具有可信性,文章认为需要搞清楚这三 个问题:一是依据2014年流动监测数据与2010年的CFPS数据计算的生育率直接比较是否具有可 信性?二是2010CFPS数据代表2010年全国育龄妇女是否具有可信性?三是2014年流动监测数据 代表2014年全国流动人口数据是否具有可信性?
2.2.1 2014动态监测与CFPS2010在生育率上相比较的可信性
笔者试图将CFPS2010调查得到的农村本地妇女的生育当作2014年调查的,这样就可以直接 与2014年流动监测数据中的乡城流动人口进行比较。

这里用到的一个假设就是2010年与2014年 同为X岁的农村本地妇女平均曾生子女数上没有明显的差异。

但现实中很难找到全国范围的2010 年与2014年农村本地人口分年龄的曾生子女数数据,根据可找到的数据,笔者比较了 2010年与 2014年全国15-59岁妇女按出生队列的平均活产子女数。

从图1中看到,2014年全国15-59岁妇 女的平均活产子女数在大部分年龄上低于2010年的,两者存在着一定的差异(2015年全国1+人 口抽样调查资料直接给出的数据也显示2015年的妇女在较高年龄段上也低于2010年的$。

经过进 一步计算,发现两者差异的区间范围在(-0.299~0.013)之间,2014年减去2010年分年龄的平均 活产子女数的均值为-0.094,标准差为0.011,在同一年龄上平均活产子女数差异在-0.094上下,浮动范围很小。

在20-59岁年龄段上,两者在23岁相差最大,2014年23岁妇女的 曾生子女数比2010年的下降了 18.5%。

(15-19岁年龄段上曾生子女数过少,下文中co x回归并 不包含该年龄段妇女,所以不再计算)所以,如果下文根据678回归求得的乡城流动人口在各孩 次上递进生育的概率比农村本地人口 18.5%或者降低幅度更大,那么就可以得出乡城流动降低生育水平的结论,由此认为2014动态监测与CFPS2010在生育率上具有可以直接比较的基础。

2.2.2 CFPS2010育龄妇女数据代表六普全国育龄妇女的可信性
从CFPS2010年数据库中选取20~59岁女性样本后(之所以没有选取15-19岁育龄妇女,一 是因为CFPS2010年数据库调查对象都在16岁及以上,而流动监测数据调查对象年龄在15-59周岁之间,两者在最低年龄的调查对象不一致;二是因为CFPS2010年数据库中16 —19岁育龄妇女 中初婚仅有40人,占16-19岁育龄妇女总人数913人中的4.38%,40个样本对孩次递进生育的 影响作用可以忽略不计),对样本数据进行了检验(见图2)。

对比发现六普与CFPS2010年两者年
⑤中国家庭动态跟踪调查(2010 )用户手册V2,P16
⑥ 2014年流动人口卫生计生动态监测调查技术文件,P1
33
2018年第1期南方人口
图1 2010年、2014年与2015年全国15岁-59岁妇女按出生队列的平均活产子女数®
龄结构的相关系数仅为0.590,
样本出现了一定的偏差,
CFPS 2010年数据中相对年长
者所占比例较大,CFPS 2010
年数据中20~35岁所占比例均
低于六普数据,36~59岁所占
比例基本均高于六普数据,后 又继续计算了两者在各年龄上 离差的绝对值,发现相差最大
的为0.012。

另外两者累计平均绝对误差⑧仅为0.0042。

所以即便存在偏差,但每个年龄上的样本 仍能代表大部分原始数据。

从年龄结构看,CFPS 2010育龄妇女数据代表六普全国育龄妇女具有可 信性,所以不再根据年龄结构差异对CFPS 2010样本数据进行加权。

对比六普与CFPS 2010年两者分年龄婚姻结构时,只选取未婚与在婚两种婚姻结构(因为六普 数据没有对在婚区分
为初婚与再婚),而将
离婚与丧偶剔 %
从图3看,两者在婚
姻结构上也出现了偏
差,CFPS 2010年妇女
在低年龄段未婚的比
例均低于普查数据,
但两者分年龄 占
比的相关系数为
0.991,累计平均绝对
⑦ 注:2010数据根据中国2010年人口普查资料中“3-1全国分年龄、性别的人口表”与表“6-12全国按年 龄分的15-64岁妇女平均活产子女数和平均存活子女数”计算(h ttp ://w w w .stats .gov .cn /tjs j /pcsj /rk p c /6rp /in d e x c h.h tm ); 2014年数据在不 因的 据2010年 普中“3-1全分年龄、性的 表”、中国2010年普 表“6-12全 年龄分的15-64岁妇女平均 女数和平均存 女数 2012、2013、2014
2015中 计年中的“全育龄妇女分年龄 的育 中的年龄 育 个数据计算得2015年全国1C 样 表“8-7全 年龄分的15-50岁妇女平均 女数和平均存 女数” (h ttp ://p a n .xiaze .org /n j /2015qg rkcydczl /in d e xch.h tm )
⑧ 累计平均绝对误差的计算 A V a b e rr = n ^l X [-X \ |
⑨ 六普全国20-59岁妇女数39139655,六普全国 后的妇女人数占比95.01%。

六普数据来源于h ttp : //w w w .stats .gov .cn /tjs j /pcsj /rk p c /6rp /in d e x c h .h tm 。

除去的五省份数据分别来源于宁夏回族自治区2010年人口普查资料, p 1863,p 1871;青海省2010年人口普查资料,p 1863,p 1871;新疆维吾尔自治区2010年人口普查资料,p 1587,p 1595 ;内
区2010年人口普查资料,p 2356-2357 2010年人口普查资料,p 1851-1859。

以上数据均为普查长表
数据
34
人口的乡城流动对生育水平的影响
误差为0.034,
从分年龄的婚姻
结构看,样本仍
具有代表性。

2.2.3 2014
年流动监测数据
代表2014年全
国流动人口数据
的可信性
最好最直接
的方式就是将
2014年流动监
测数据与2014年全国流动人口实际分布数据做对比,但2014年全国流动人口实际分布数据或许 是未知的。

如果将2014年流动监测数据与2010年六普数据进行比对,时间上相差的四年一定会 带来偏差。

受限于数据,这一部分本文采用了间接比对的方式。

李丁、郭志刚(2014)在文中比 对了监测样本年龄结构的特点,发现“该调查数据仍具有明显的自身系统性特征”。

如对比年龄结 构,发现2010、2011和2012年3轮监测调查的流动育龄妇女中各年龄组人数的占比的样本结构 上具有较高的一致性,但它们与六普长表样本数据中流动育龄妇女的年龄结构存在较大的差异。

“监测数据中的育龄妇女更多集中在23!40岁生育旺盛期”。

另外,“监测样本流动距离偏远,流 人时间偏长”;&2012年监测调查流动育龄妇女已婚比例比六普高出12个百分点”。

李丁、郭志 刚依据2012年流动人口监测数据中育龄妇女样本计算出的其在2009年、2010年与2011年的总和 生育率为1.943、1.639与1.743,这一
水平远高于依据六普流动人口数据计算
出的1.143。

文章认为2014年监测数据
可 在 这样的 ,
样框同样为卫计委系统的全流动人口
年报数据。

文章对2014年与2010年流
动人口监测数据两者16-49岁育龄妇女
年龄结构进行了检验(见图4),相关
系数为0.855,且相关性显著。

2014年
流动人口动态监测样本中的育龄妇女
(CFPS2010:12413;六普全国出去五省份(35845951®)
⑩六普全国20-59岁未婚与在婚妇女人数37693682,六普全国除去五省份后的未婚在婚妇女人数占比95.10%。

数据来 ⑨
⑪2014年流动监测16-49岁育龄妇女样本量79318份;2010年流动监测16-49岁育龄妇女样本量59427份.由于2010年流动监样本所有性在16 上 龄 年龄结构的比较 16
35
2018年第1期 南方人口
(样本量79677份)在2013年的总和生育率为1.563,这一水平仍显著高于六普计算结果。

李丁、郭志刚认为“监测样本过多收集近期生育案例是导致监测生育率偏高”的重要原因,“即使调整过已婚结构和控制了孩次结构的生育率指标仍然很可能高估了流动人口实际的生育水平。

因为已婚结构、孩次结构偏差还只是推高生育率估计的部分原因,更重要的原因则是监测样本中生 育者与未生育者的比值本身偏高。

”因为本文最终要讨论的中心问题是乡城流动人口与农村本地人口 生育水平差异的问题,是乡城流动对生育水平究竟有着怎样的影响的问题,而不是乡城流动人口一 个真实的生育水平的问题。

如果根据流动人口监测数据计算出的乡城流动人口生育水平仍要比农村 本地人口低,那么就更有理由相信乡城流动降低了生育水平。

所以文章不再对数据库进行加权调整。

流动人口监测数据与普查数据相比,虽然存在着以上几种结构性偏差,但是从李丁、郭志刚 原文所画图形上看,监测数据与六普流动人口资料在各种属性结构上重合部分仍然占绝大多数,也就是说虽然抽样结构出现了偏差,但监测数据还是能够代表各年龄组原始数据的绝大部分信息,由此推断2014年监测数据女性年龄结构与分年龄婚姻结构与2014年现实分布中的流动育龄妇女 也应该接近。

另外“流动人口监测数据是目前除人口普查外关于流动人口样本规模最大的全国性 代表数据’(李丁、郭志刚,2014),而且受限于数据资料,尚未发现比流动人口动态监测更为详 细的记录流动人口生育史的数据库,所以仍使用监测数据做这个研究。

3.研究设计
3.1相关人口类型在数据库中的定义
乡城流动人口 :根据2014年全国流动人口动态监测个人A卷数据库中的内容将户口性质为 农业且样本点类型为居委会的定义为乡城流动人口。

农村本地人口 :根据CFPS2010成人数据库中的内容将出生地与现住地(调查地)的省国标码 与区县顺序码一致,且户口状况为农业,且现住地是基于国家统计局资料的城乡分类的农村区域 的定义为农村本地人口。

城镇本地人口 :根据CFPS2010成人数据库中的内容将出生地与现住地(调查地)的省国标码 与区县顺序码一致,且户口状况为非农业,且现住地是基于国家统计局资料的城乡分类的城镇区 域的定义为城镇本地人口。

3.2相关人口类型在数据库中的选取
3.2.1乡城流动人口
流动人口动态监测数据中个别样本孩次出生信息并不是严格按照出生顺序填写的,所以首先 根据每个孩次的出生年月重新对孩次顺序进行排序。

随后选取年龄在20~59岁、婚姻状况为初婚、至少生育1个孩子、第一次离开户籍地年龄大于等于15岁、本次流动即为第一次流动的乡城流动 人口。

并删除掉户籍地来自香港、澳门、台湾、新疆、青海、内蒙古、宁夏和海南的样本的乡城 流动人口®。

这样就可以通过第一次离开户籍地时间与各孩次生育时间的对比,来确定流动在前、生育在后的一个时间上的先后顺序。

之所以选取只流动过一次的,是因为只有这部分人口才可以 根据其户籍性质(农业与非农业)与调查地类型(居委会与村委会)严格区分出乡城流动、城城 流动、城乡流动与乡乡流动四类人口,而对于流动过多次的育龄妇女并不能明确她们在本次流动36
之前的流动方向。

初步选取样本量15638份。

3.2.2农村本地人口
CFPS2010成人数据库中,有个别样本各孩次出生信息同样不是严格按照出生顺序填写的,所 以首先根据每个孩次的出生年月重新对孩次顺序进行排序。

但又有些样本,各孩次信息只填写了 孩子性别,没有填写出生年份也没有填写出生月份,又或者只填写了出生月份,对于这样的样本,将相应孩次保留了其在原来数据库中的位置,这一部分样本并不能根据其出生年月来计算各孩次 的生育年龄;对于那些只填写了出生年份的样本,将月份视为0来计算各孩次生育年龄。

在是否 生育了该孩次的选择上,主要是根据样本填写的孩次性别来识别,只要填写了该孩次的性别,就 将其视作生育了该孩次。

因为,对于有些样本,孩子的出生年月可能记不清楚了,但有几个孩几个女孩还是能记准确的。

随后选取年龄在20~59岁、婚姻状况为初婚、至少生育1个孩子的农 村本地女性,初步选取样本量4571份。

3.2.3城镇本地人口
城镇本地人口选取过程与农村本地人口类似,将类别换成城镇本地女性,初步选取样本量 1216 份。

对上面三类人口初步选取后,进一步分析了每个样本在各孩次出生年份漏填以及根据样本填 写信息计算出来的生育年龄不在15-49岁之间的情况,并将这两类样本视为无效样本,最后选取 的实际有效样本见表1。

表1中“实际有效样本”指的是各递进生育孩次前一孩次填写过出生年 份且经计算的生育年龄处于岁之间的样本,实际有效样本是下文模型分析中真实用到的。

通过出生年份计算各孩次生育年龄的目的是为了考察对下一孩次递进生育的影响作用,而不 是为了计算平均生育年龄,所以不再对无效样本进行插补调整,而是直接删去(无效样本见表 2)。

经计算,发现无论农村本地人口与城镇本地人口,各孩次无效样本的平均年龄均比有效样本
,这应该是在搜集数据时年龄较大的被访者漏填或者填错的可能性造成的。

理论上,出生年代 较早的妇女倾向于多育;实际上,无论农村本地还是城镇本地,无效样本的平均生育子女数均比 有效样本高,所以 样本直接删去,意味着据此计算出的农村本地人口与城镇本地人口
的生育水平比实际要低些。

但如果下文中co x回归模型得出的结果仍是乡城流动人口的生育水平 低于农村本地人口,那么我们就更有理由相信乡城流动降低了生育水平。

而城镇本地人口一孩、二孩的无效样本占并不大,我们也可以将无效样本带来的误差略去。

3.3模型选取
人口的乡城流动对生育水平的影响
表1模型中实际用到的样本量
生育孩次
乡城流动人口农村本地人口城镇本地人口
实际有效样本样本量占比(%)实际有效样本样本量占比%%)实际有效样本样本量占比%%)
一孩156071563899.84171457191.21180121697.0二孩68346834100.03258346394.128129296.2三孩820820100.010********.3525889.7四孩2929100.027628796.2111478.6
⑫为了在调查区域上尽可能地做到匹配,删除掉C F P S数据库中并没有调查的这些省、市、自治区的样本
37。

相关文档
最新文档