数学建模人口模型人口预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于计划生育政策调整对人口数量、结构及其影响的研究
【摘要】
本文着重于讨论两个问题:1、从目前中国人口现状出发,对于中国未来人口数量进行预测。
2、针对深圳市讨论单独二胎政策对未来人口数量、结构及其对教育、劳动力供给与就业、养老等方面的影响。
对于问题1从中国的实际情况和人口增长的特点出发,针对中国未来人口的老龄化、出生人口性别比以及乡村人口城镇化等,提出了 Logistic 、灰色预测、等方法进行建模预测。
首先,本文建立了 Logistic 阻滞增长模型,在最简单的假设下,依照中国人口的历
史数据,运用线形最小二乘法对其进行拟合, 对 2014 至 2040 年的人口数目进行了预测, 得出在 2040 年时,中国人口有 14.32 亿。
在此模型中,由于并没有考虑人口的年龄、 出生人数男女比例等因素,只是粗略的进行了预测,所以只对中短期人口做了预测,理 论上很好,实用性不强,有一定的局限性。
然后, 为了减少人口的出生和死亡这些随机事件对预测的影响, 本文建立了 GM(1,1) 灰色预测模型,对 2014 至 2040 年的人口数目进行了预测,同时还用 2002 至 2013 年的 人口数据对模型进行了误差检验,结果表明,此模型的精度较高,适合中长期的预测, 得出 2040 年时,中国人口有 14.22 亿。
与阻滞增长模型相同,本模型也没有考虑年龄 一类的因素,只是做出了人口总数的预测,没有进一步深入。
对于问题2针对深圳市人口结构中非户籍人口比重大,流动人口多这一特点,我们采用了灰色GM(1,1)模型,通过matlab 对深圳市自2001至2010年的数据进行拟合,发现其人口变化近似呈线性增长,线性相关系数高达0.99,我们就此认定其为线性相关并给出线性方程。
同理,针对其非户籍人口,我们进行matlab 拟合发现,其为非线性相关,并得出相关函数。
并做出了拟合函数
0.0419775(1)17255.816531.2t X t e ⨯+=⨯-。
对于新政策的实施,我们做出了两个假设。
在假设只有出生率改变的情况,人口呈现一次函数线性增加。
并拟合出一次函数0.032735617965.017372.5t Y e ⨯=⨯-;在假设人口增长率增长20%时,做出了预测如果单独二胎政策实施,到2021年,深圳市常住人口数将会到达1137.98千万人。
关键词:GM(1,1)灰色模型 Logistic 阻滞增长模型 线性拟合 非线性拟合
【目录】
一、问题重述--------------------------------------------------------------------------------------(4) 二、符号定义与说明-----------------------------------------------------------------------------(4) 三、模型假设--------------------------------------------------------------------------------------(4) 四、问题分析及模型建立及求解
A 、问题一:1、问题背景----------------------------------------------------- -------------(5) 2、问题分析-------------------------------------------------------------------(5) 3、模型建立
模型一:阻滞增长模型的建立--------------------------------------(6) 阻滞增长模型的求解--------------------------------------(6) 阻滞增长模型的分析--------------------------------------(7)
阻滞增长模型的优化--------------------------------------(7)
阻滞增长模型优化后的分析-----------------------------(9)
模型二:GM(1.1)灰色预测模型的建立----------------------------(9)
GM(1.1)灰色预测模型的求解---------------------------(10)
GM(1.1)灰色预测模型的分析---------------------------(11)
B、问题二:1、问题重述------------------------------------------------------------------(11)
2、问题假设------------------------------------------------------------------(11)
3、问题背景------------------------------------------------------------------(12)
4、灰色预测模型的建立---------------------------------------------------(14)
5、灰色预测模型的求解---------------------------------------------------(14)
6、模型的优化(新政策实施后的预测)------------------------------(15)
新政策下的建模--------------------------------------------------(16)
假设拟合成一次线性函数------------------------------(16)
假设按比例增长------------------------------------------(17)
数据分析及评价--------------------------------------------------(17)
五、模型总评价-----------------------------------------------------------------------------------(18)
六、参考文献--------------------------------------------------------------------------------------(19)
七、附录--------------------------------------------------------------------------------------------(19)
【问题重述】
人口的数量和结构是影响经济社会发展的重要因素。
从20世纪70年代后期以来,我国鼓励晚婚晚育,提倡一对夫妻生育一个孩子。
此计划生育是我国的一项基本国策。
近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素。
党的十八届三中全会提出了开放单独二孩,今年以来许多省、市、自治区相继出台了具体的政策。
收集一些典型的研究评论报告,根据每十年一次的全国人口普查数据,建立模型,对报告的假设和某些结论发表自己的独立见解,并针对深圳市或其他某个区域,讨论计划生育新政策(可综合考虑城镇化、延迟退休年龄、养老金统筹等政策因素,但只须选择某一方面作重点讨论)对未来人口数量、结构及其对教育、劳动力供给与就业、养老等方面的影响。
【符号定义与说明】
【模型假设】
1.不考虑我国人口向国外搬迁,同时也不考虑外国人口向国内搬迁;
2.不考虑战争、灾害、疾病对人口数目的影响;
3.假设一年内,各个地区,各个年龄段的死亡率不会发生变化;
4.假设在一年内,处于生育年龄的妇女生育率不会发生变化;
5.假设附件中所给数据真实可靠具有预测性;
6.假设影响中国总人口数的主要因素是死亡率和出生率。
【问题分析】
问题一:对中国未来的人口数量进行预测。
一、问题背景
中国是世界上人口最多的发展中国家,人口多,底子薄,人均耕地少,人均占有资源相对不足,是我国的基本国情,人口问题一直是制约中国经济发展的首要因素。
人口数量、质量和年龄分布直接影响一个地区的经济发展、资源配置、社会保障、社会稳定和城市活力。
在我国现代化进程中,必须实现人口与经济、社会、资源、环境协调发展和可持续发展,进一步控制人口数量,提高人口质量,改善人口结构。
对此,单纯的人口数量控制(如已实施多年的计划生育)不能体现人口规划的科学性。
政府部门需要更详细、更系统的人口分析技术,为人口发展策略的制定提供指导和依据。
长期以来,对人口年龄结构的研究仅限于粗线条的定性分析,只能预测年龄结构分布的大致范围,无法用于分析年龄结构的具体形态。
随着对人口规划精准度要求的提高,通过数学方法来定量计算各种人口指数的方法日益受到重视,这就是人口控制和预测。
二、问题分析
本题需要结合中国的实际情况和人口增长的特点来对中国人口增长的中短期和长期
趋势做出预测。
首先,我们从简单模型入手,利用已有年份的人口总量数据预测将来的人口总量的
变化趋势,从总体上对人口发展做出预测。
其次,把人口的增长特点考虑在内,利用动态模型并进行计算机模拟,得到符合中
国实际情况的模型,包含了老龄化水平、性别比例、城镇化等更细致的结果。
最后,我们对每个模型的预测结果进行对比,评判其各自的优点及缺点,并对政府
部门提出一些建设性的意见。
三、模型建立及求解
A.阻滞增长模型
针对未来中国人口总数,我们建立简单的预测模型---阻滞增长模型。
(具体建立方法见附录1)我们可以得到以下等式:
表3 阻滞增长模型预测2014~2040年的人口数据 下图是优化后阻滞增长模型拟合中国人散点图。
图2 优化后阻滞增长模型拟合中国人散点图
优化后的模型分析: 对于优化后的模型,在2002到2010年间坐到了高度符合。
但是在2010年后的数据的拟合中还是出现一些小问题。
1.3.2模型二:GM(1.1)灰色预测模型
由于人的出生和死亡是随机的,因为我们利用灰色预测模型中的累加效果,尽量减少这种随机的影响,在此我们采用GM(1.1)灰色预测模型(具体参考附录)。
为了使预测结果效果更佳,并不直接用总人口序列建模,而是先求出各年的净增人口序列,即2002~2013年各年的净增人口数据如表4,然后应用净增人口序列建模计算净增人口预测值。
表4 2002年~2013年各年净增人口数据。
1设(0)
(0)(0)(0)(1)(1)(1)(1)((1),(2),,,()),((1),(2),,,())X x x x n X x x x n ==
称
为(1,1)GM 模型的原始形式。
则此题中原始样本序列为:
=)0(q [827 774 761 768 692 681 673 648 641 644 669 668]通过灰色GM(1.1)模型,我们得到未来t
年的较2001年的累计人口净增量(记2002年t=1,2003年t=2,之后以此类推)
)
1(049579.0)1(4.313254.32954)(---=t e
t q (5)
利用
)1()()()1()1()0(--=t q t q t q 以及(5)式,得到人口的净增量)()
0(t x 后,利用
)1()()()1()0(--=t q t q t x 迭代可得出未来第t 年的人口数量记2002年t=1,2003年t=2,之后以
此类推)为
)
1(049579.04.31325145660)(---=t e
t x (6)
由(6)式预测从2014年到2040年的人口预测如下表5
表5 灰色GM(1.1)模型预测2005~2040年的人口数据
对我国2010 年实际总人口数进行检验性预测,预测值为13.40亿,实际值为13.4091亿,相对误差为0.06%。
然后进行后误差检验,检验合格后的模型即可用于预测。
对2005~2013年数据进行检验,得到1990~2005年人口计算与实际数据的相对误差(如表6) 表6 2005~2013年人口计算与实际数据的相对误差
S1=246.9858, S2=8.0308, C=S2/S1=0.0325<0.35,表明模型预测的精度很高。
根据
灰色系统理论,当发展系数)2,2(-∈a 且3.0-≥a 时,所建GM(1,1)模型可用于中长期预测。
但是由于中国的人口发展特点并不能保证很长时间预测的准确性,比如对中国100年后的人口数量便难以预测。
问题二 计划生育新政策对深圳人口数量的影响
一、问题重述
人口问题有着悠久的研究历史,也有不少经典的理论和模型。
这些理论和模型都依赖生育模式、生育率、死亡率和性别比等多个因素。
这些因素与政策及人的观念、社会文化习俗有着紧密的关系,后者又受社会经济发展水平的影
响。
研究中用到的数据的置信水平也与调查统计有关。
根据每十年一次的全国人口普查数据,建立模型,对报告的假设和某些结论发表自己的独立见解,并针对深圳市或其他某个区域,讨论计划生育新政策对未来人口数量、结构及其对教育、劳动力供给与就业、养老等方面的影响。
二、模型假设
1.不考虑深圳市的迁入和迁出情况,只考虑常住人口
2.不考虑战争、灾害、疾病等对人口的影响
3.假设一年内,各个地区,各个年龄的死亡率不变化
三、问题背景
1、对于深圳的人口,做如下分析
普查资料显示:全市常住人口中,0-14岁人口为101.88万人,占9.84%;15-64岁人口为915.64万人,占88.40%;65岁及以上人口为18.28万人,占1.76%。
深圳人口年龄分布饼图,如图3
图3深圳人口年龄分布饼图
深圳仍属于年轻人城市,据初步统计测算,全市人口平均年龄为30岁左右;深圳还处于旺盛的“人口红利”期,15-64岁人口占总人口的88.40%,比广东省的76.36%高出12个百分点,比上海市的81.25%高出7.2个百分点,比北京市的82.70%高出5.7个百分点;按照国家65岁及以上人口占7%以上即达到老年社会的标准,深圳离进入老龄化社会还较远。
2、模型的建立与求解人民网强国论坛近日针对“单独家庭”做了一项生育意愿的调查。
结果显示,在符合“单独两孩”条件者中,愿意生第二孩的超过一半,达50.73%。
其中,50.41%的人表示新政一实施就生,49.59%的人表示过几年再生。
与此同时,不愿生两孩的占1/3,为33.46%。
不愿意生两孩的原因中,“经济成本太高”是主要因素,占56.16%。
3、在深圳新闻网发起的“你会选择生二胎吗?”的调查中,截至昨晚7时,有76.08%的受访网友表示会生二胎,表示不会的网友有23.92%。
其中57.81%的受访网友都选择在“30~40岁选择生二胎”。
此外,有87.24%的网友表示生二胎是因为“觉得一个小孩太孤单了”,而在选择不会生二胎的网友中,60.18%的网友是因为“养不起”。
4、通过收集的数据分析运用Excel画出1979年到2012年的常住人口的变化如图4。
图4 1979-2012年深圳常住人口数目变化曲线
通过这张图表可看出,深圳市的常住人口在2011年已经突破了1000万,当政策新出之后,势必会对这样的一种平稳发展的格局有一定的冲击,或多或少,都会使这样的数量有所增长。
在此,收集到一些出生率和死亡率的图表
图5深圳市人口出生率和死亡率变化曲线
分析:从这张图可以看出,最近几年的深圳,出生率在不断提高,而死亡率在不断下降,从而导致了人口的激增。
但是,新政策的实行,对于出生率有促进作用,死亡率却不会有明显变化,所以,人口将会呈现更快的增长,但是这样的增
长是在前期,随着时间推移,累计效应释放后,波动在1.6—1.7。
四、模型建立
首先,我们采用灰色GM(1,1)模型.采用原因:灰色模型适用于小样本、贫信息、内在规律未充分外露的系统,按适当办法处理原始数据后得到规律性较强的生成函数.本题给出的常住人口、非常住人口数据受到难以区分的多重因素影响,且数据量较小,适用于灰色模型.
由于常住人口数量受历史影响较大,不易发生较大变化,且在数据处理中发现了较强的线性关系,我们之后采用了一元线性拟合来简化模型;而非常住人口受各方面因素影响较大,仍保持灰色模型不变。
最后我们得出了与常住/非常住人口相关的人口结构变化规律。
灰色模型的详细做法见问题一以及附录
此预测模型是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线拟合得到预测值.
建立过程如下: 1) 设原始数据序列(0)X 有n 个观察值,(0)(0)(0)(0){(1),(2),,()}X X X X n =,通过累加生成新序
列(0)(1)(1)(1){(1),(2),
,()}X X X X n =,利用新生成的序列(1)X 拟合函数曲线.
2) 利用拟合出的函数求出新生序列(1)X 的预测值序列(1)X . 3) 利用(0)(1)(1)()()(1)X k X k X k =--累减还原,得到灰色预测值序列
0000{(1),(2),
,()}X X X X n m =+(共n+m 个,m 个未来预测值).将序列(0)X 分为0Y 和0Z ,其中0
Y 反映(0)X 的确定性增长趋势,0Z 反映(0)X 的平稳周期变化趋势. 4) 对(0)X 序列的确定增长趋势进行预测.
五、模型求解
整理得深圳市2001年~2010年常住人口数,见下表7.
表7:深圳市2001~2010年年末常住人口数 根据上述数据建立含有10个观察值的原始数据序列(0)X : 使用Matlab 软件对(0)X 进行一次累加,得到新数列(1)X ,见表8.
拟合函数:0.0419775(1)17255.816531.2t X t e ⨯+=⨯- 六、模型优化
A.假设新政策推出后,对于人口的变化很小,除了出生率改变,其他条件都不改变。
猜想新政策实施后,人口按线性增长,即用简单的一次函数进行拟合。
由表7作出年份-常住人口数(单位:万人)曲线如下图:
图6
由图可见数据的线性关系很强,且在一段时间内仍保持线性增长趋势。
由最小二乘法得拟合函数为35.21569759X t =-,相关系数为0.99388r =。
常住人口拟合函数为0.032735617965.017372.5t Y e ⨯=⨯-。
在这种情况下,深圳人口预测变化如下图: 图7
B.假设实行新政策后,出身率有所提升,并且,出生率提高了20%,这样的话,在未来的几年,在人口数量,人口结构分布都会发生一定的影响,深圳市的总体人口也将相应地出现一些变化。
当出生率提高20后,后10年的常住人口数表如下
表9
变化曲线如下
图8
七、数据分析
在“单独二孩”政策落地之前,省卫计委组织了全国着名专家来广东调研,对于实施“单独二孩”后对我省人口会有那些影响做了评估。
调查认为,广东放开“单独二孩”政策后对出生人口的数量影响并不大,对总人口的影响也微乎其微。
2010年广东全省独生子女人口总数是732.25万,其中户籍人口中法定婚龄的独生子女家庭24.35万(男满22周岁,女满20周岁)。
包括已婚单独未生育家庭5.1万,单独生育一孩的家庭14.59万,单独生育二孩的3.41万,单独生育三孩的1.25万。
也就是说,全省符合“单独二孩”政策的家庭不超过15万。
如果实施“单独二孩”政策后,2014年广东全省预计新增人口1-1.5万人,2015预计新增人口7万人,2016年预计新增8.19万人,2017年预计新增7.8万人,2018年预计新增6.96万人,呈逐渐平稳趋势。
所以,由人口增长模型可以分析,如果婴儿出生率有所增加,那人口的结构也将变化。
在人口构成方面,由于现在的深圳还未进入老龄化,并且新政策的实施,使得婴幼儿的数量增加,使人口构成方面呈现出成长型的格局。
可以看到,在不久的将来,会是一个稳定型的人口城市。
人口的增加同时也给公共资源带来了压力,而且,对教育事业也是一个不小的挑战。
“单独二胎”放开有望在5年内新增750万新生儿,这些新生儿在2015~2019年将拉动上万亿元的市场消费。
从政策影响的先后时间来看,首先是母婴医药,其次是奶粉、尿不湿等初生婴儿用品相关产业,再次是儿童服饰、家具、童车、玩具,最后是动漫、钢琴、文具等文化教育相关产业。
同时,这样的情况也使得就业岗位有所增加,在短期内解决了人们的就业问题。
但是长远来看,当这些孩子长大,不得不面临就业更加艰难的局面。
【模型总评价】
本文首先从最简单的情况入手,不考虑人口的年龄层次和男女出生比例,采用Logistic 模型和灰色预测模型对人口的总数进行预测。
由于这两个模型对于种群数量是单调改变的情况预测准确度很高,而人口总数的变化并不总是单调的,所以只能对人口行短期或中短期预测,长期预测结果只可作为参考。
在第二问中,本文也从相对简单的灰色预测模型入手,对深圳在单独二胎政策不实施的情况下,未来人口数量进行了拟合估计。
在对单独二胎政策实施后,深圳的人口数量变化做了预测。
但是由于时间匆忙,对于深圳实施单独二胎之后的对深圳人口数量,结构以及教育、劳动力供给与就业、养老等方面的影响没有深入讨论。
【参考文献】
[1]《数学模型》姜启源高等教育出版社
[2]中国统计年鉴2013 中华人民共和国国家统计局
[3]深圳统计年鉴2013 深圳统计局
[4]数学建模全国赛07年A题一等奖论文
【附录】
1.模型一 阻滞增长模型
分析人口增长对一定数量后增长率下降的主要原因,人们注意到,自然资源、环境条件等因素对人口的增长起着阻滞作用,并且随着人口的增长,阻滞的作用越来越大。
所谓阻滞增长模型就是考虑到这个因素,对指数增长模型的基本假设进行修改后得到的。
阻滞作用体现在对人口增长率r 的影响上,是的r 随着人口数量x 的增长而下降。
若将r 表示为x 的函数r (x ),则它应是减函数。
于是有方程写作
0)0(,)(x x x x r dt
dx == ——(1) 对)(x r 的一个简单的假定是,设)(x r 为x 的线性函数,即
sx r x r -=0)( )0,0(0>>s r ——(2)
这里的0r 称固有增长率,表示人口很少时(理论上是x =0)的增长率。
为了确定系数s 的意义,引入自然资源和环境条件所能容纳的最大人口数量m x ,称人口容量。
当x =m x 时,人口不再增长,即人口增长率0)(=m x r ,代入(2)式得m
x r s =,于是(2)式为 )1()(0m
x x r x r -= ——(3) (3)式的另一种解释是,增长率)(x r 与人口尚未实现部分的比例m m x x x /)(-成正比,比例系数为固有增长率0r 。
将(3)代入(1)得
00)0(),1(x x x x x r dt dx m
=-= ——(4) 方程(4)右端的因子x r 0体现人口自身的增长趋势,因子)1(m
x x -则体现了资源和环境对人口增长的阻滞作用。
显然,x 越大,前一因子越大,后一因子越小,人口增长是两个因子共同作用的结果。
2 灰色预测模型
运用(1,1)GM 模型、灰色Verhulst 模型、离散灰色模型三个模型对深圳人口数量进行预测研究。
3.2.1 (1,1)GM 模型
定义3.2.1设(0)(0)(0)(0)(1)(1)(1)(1)((1),(2),,,()),((1),(2),,,())X
x x x n X x x x n == 称
为(1,1)GM 模型的原始形式。
其中G 表示灰色(grey),M 表示模型(Model),第一个1表示一阶方程,第二l 表示1个变量。
GM(1,1)模型首先对原始数据进行一阶累加生成,然后利用指数曲线拟合并预测,最后通过累减还原得到预测值。
一般将原始数据序列记为(0)X ,将一阶累加生成序列记为(1)X 。
建(1,1)GM 模型的步骤如下:
(1) 假定原始数据序列为
对原始数据序列进行一阶累加生成
其中,
(2) 构造(1)Z
序列 令(1)(1)(1)1()()(1)2x k x k x k ⎡⎤=+-⎣
⎦,得 (3) 建立白化方程
(4) 求参数a 和b
若[]ˆ,T a a b =为参数序列,且(1)(1)(1)1(2)121(3)121()12
z z B z n --=-, (0)(0)(0)(2)(3)()n x x Y x n ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦ 用最小二乘法求解 []1,()T
T T n a a b B B B Y -== (5) 将白化方程离散化,微分变差分,得GM(1,1)灰微分方程
称为(1,1)GM 模型的基本形式。
(6) 白化微分方程求解
求得到微分方程的解为:
(1,1)GM 灰色预测模型(0)(1)()()x k az k b +=的时间响应方程为:
还原值为
其中a 为发展系数,[]2,2a ∈-,反映了(1)ˆ()x
k 及(0)ˆx 的发展态势。
b 为灰色作用量。
(1,1)GM 模型中的灰色作用量是从背景值挖掘出来的数据,它反映数据变化的关系,其确切内涵是灰色的。
灰色模型预测检验一般有残差检验和后验差检验。
一、 残差检验
按预测模型计算(1)ˆ()x
k ,累减(1)ˆ()x
k 生成(0)ˆ()x k ,再计算原始序列(0)()x k 和(0)ˆ()x k 的绝对误差和相对误差序列: 二、 后验差检验法
后验差检验其检验步骤是:
(1) 计算原始序列均值及均方差分别为:
(2) 计算残差均值及均方差分别为:
(3) 计算后验差比值:21
S C S = (4) 1(()0.6745)p P k S εε=-<称为小误差概率。
等级说明: C值越小越好,即1S较0S小得多,表示原始数据离散大,而预测误差离散性小,则预测精度高;P越大越好,即小误差的概率大,直接表示拟合精度较高。
若残差检验、后验差检验都能通过,则可以用其模型进行预测,否则进行残差修正。
3 问题一中画出人口实际曲线和预测曲线的matlab程序
>> t=1:1:11;
>> x=[12.9256 13.0078 13.0869 13.1627 13.2356 13.3054 13.3724 13.4366 13.4981 13.5570 13.6133];
>> plot(t,x,'o')
>> hold on
>> t=1:1:11;
>> x=[12.92,12.99,13.07,13.14,13.21,13.28,13.34,13.40,13.47,13.54,13.60];
>> plot(t,x,'or’)。