中国人口增长趋势预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国人口增长趋势预测
摘要
人口总数的预测对未来资源分配,划分有着重要的意义,本文根据人口预测模型结合所给数据进行人口预测,并进行模型改进结合最小二乘法拟合出较理想的人口变化趋势。
第一问中,采用Logistic模型描述了人口的增长规律,通过简要的假设设置相应的预测系数
第二问中,根据表中所给的数据,运用Matlab以及Excel得出人口随时间变化的曲线
第三问中,通过运用非线性最小二乘法拟合,Matlab编程得到相关的系数x
=r
万人,并判断模型的可用性。
.0
248205=
0253
m
第四问中,根据所得的模型,带入相关数值得到2030年人口数量将达到144210万人
第五问中,通过改进求解拟合参数的方法,将非线性最小二乘法改为线性最小二乘法估计模型参数,通过分析可知2030年可能会达到我国人口数量的峰值近似为145168万人,与国家人口预测结果基本相符合。
关键词:Logistic模型;最小二乘估计;Matlab;线性拟合
一. 问题提出
中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。关于中国人口问题已有多方面的研究,并积累了大量数据资料,对于表中所给出的数据,研究人口增长的规律。
问题一,作出适当的简化假设,在此基础上建立中国大陆人口群体增长的数学模型。
问题二,对表中所给出的数据,画出1949~2017年中国大陆人口总数随时间变化的曲线;
问题三,对第1问模型中的参数进行估计
问题四,预测2030年中国大陆的人口总数。
问题五,模型的评价与改进。
二.问题分析
由于人口的增长受到自然资源,环境条件等因素的影响,因此第一问的模型选取应该选用能够反映阻滞作用对人口增长率的影响,使增长率r能够随着人口数量的增长而下降,基于此选择了典型的人口增长模型logistic函数,并对相应的参数进行设置。
第二问中由Matlab能够得到表中数据的变化趋势。
第三问中对于大数据处理要得到模型中的相应参数需要用最小二乘法进行系数估计,通过分析曲线的特点评价模型的可用性。
在第四问,根据模型带入相应的时间预测对应的人口总数。
第五问中,由分析可知,线性最小二乘法估计参数要比非线性最小二乘法估计参数的精度要更高,因此通过观察人口增长率的曲线可以近似拟合成一次函数的现象,将估计参数的方法改为线性最小二乘法估计参数,并结合数据实际曲线,确定相应的模型参数。
三.模型的基本假设
(1)生育模式相对不变
(2)所用数据真实可靠
(3)不考虑生存空间等自然资源的制约,不考虑意外灾难等因素对人口变化的影
(4)较短的时期内的死亡率是稳定的
四.符号约定
五 .模型的建立及求解
5.1问题一模型的建立
5.1.1 Logistic 人口阻滞增长模型
对于问题一人口增长受到自然资源/环境条件等影响因素对人口增长的阻滞作用,并且此阻滞作用体现子啊增长率r 上,使得r 随人口数量增长而下降,若将r 表示为x 的函数r(x)。则他应该是一个减函数。于是有:
⎪⎩⎪⎨⎧=⎪⎪⎭⎫ ⎝⎛-=0)0(1x x x x x r dt dx m
(1) 设增长率)(x r 为x 的线性函数,sx r x r -=)(。
(2) (2)自然资源与环境条件所能容纳的最大人口数为m x ,即当m x x =时,增长率0)(=m x r 。
模型的建立与求解
可以求得模型假设中增长率
⎪⎪⎭⎫ ⎝
⎛=m x x r x r -1)(
于是得
⎪⎩⎪⎨⎧=⎪⎪⎭⎫ ⎝⎛-=0)0(1x x x x x r dt dx m
可以得到人口增长模型为
rt m m
e x x x t x -⎪⎪⎭⎫ ⎝⎛-+=11)(0 设⎪⎪⎭
⎫ ⎝⎛-=10x x a m ,r b -= 故中国大陆人口群体增长的数学模型。
bt m ae
x t x +=1)( 5.2问题二模型的建立与求解
5.2.1 图像的描绘
针对问题二有假设数据可靠,运用excel 划归并根据matlab 中的plot 绘画工具对表中所给出的数据,画出1949~2017年中国大陆人口总数随时间变化的曲线;
(图1) 1949~2017年中国大陆人口总数随时间变化的曲线
5.3问题三的模型的建立与求解
5.3.1 曲线最小二乘法
设初始人口m x x 0〈由公式可以看出,要想预测出人口数量,需求出参数b a r x m ,,或。根据科学实验的统计方法研究,根据一组数据寻找自变量时间与因变量人口总数之间的函数关系,通常采用误差的平方和作为最小误差的度量标准。关于最小二乘法的一般标准,在此实验中对给定一组数据,即),(r x E m 取最小值拟合出相应系数,公式为:
()2
101/1),(∑⎪⎪⎭⎫ ⎝⎛--+=-n i rt m m m y e x x x r x E
根据1949~2017年中国大陆人口总数随时间变化的数据,拟合出m x 为180987.1万人,r=0.0336其曲线为:
根据图可知拟合出来的曲线要比数据曲线相差比较大,因为从1970年至2010年期间国家生育政策逐渐得到完善和落实,这个时期的人口增长受到国家计划生育政策的控制,人口增长方式与采用1949年至2017年的阶段数据不同。因此数据从1970年取值得到系数分别为:
0253.0r 248205==,m x 得到曲线图为
结果分析这段时期的拟合基本符合客观实际情况,这一段时间国家虽然对人口增长进行了干预,但国家的生育政策基本是稳定的,因此参数比较可信。 则模型为t e t x 0253.01-829922482051248205)(-⎪⎭
⎫ ⎝⎛+= 5.4问题四的模型的建立与求解
根据问题三所建立的模型
rt m m
e x x x t x -⎪⎪⎭⎫ ⎝⎛-+=11)(0
参数为0253.0r 248205==万人,m x
得到中国大陆人口群体增长的数学模型为: t e t x 0477.01-98.7055351.15315351.153)(-⎪⎭
⎫ ⎝⎛+= 因此当时间t=2030时,人口总数为210144万人
5.5问题五模型的建立与求解
5.5.1改进的logistic 模型
在logistic 函数中主要通过非线性最小二乘法拟合求解系数,但是通过图像也可以观察到拟合程度尽管接近,但还是存在不足,究其原因主要运用非线性最小二乘法扩大了误差的影响范围,因此考虑将系数分开来求解。根据人口增长的表格数据,可以求出人口年增长率,人口增长率是指一定时间内(通常为一年)人口增长数量与人口总数之比。通过EXCEL 表格计算出1949至2016的增长率,由于增长率同每一年的下一年有关,因此2017的增长率暂不考虑。则得到1949至2016