长沙市人口数量演化分析与预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
长沙市人口数量演化分析与预测模型
摘要本文依据往年长沙市人口的统计数据,根据长沙市人口增长的特点,基
于 Logistic 模型建立了符合实际情况的预测模型。
模型一:基于 Logistic 模型,采用多项式拟合估计,根据搜集的数据用MATLAB求解。
由从1999年到2060年的拟合曲线,可知长沙人口在长期内持续增长,符合实际情况,预测得出长沙市总人口到本世纪中叶将达到1374.2万人。
根据数据画出散点图和Logistic模型拟合曲线,可以看出数据和函数的拟合效果良好,结果较为可靠。
模型二:考虑到人口年龄结构对总人口数量有较大影响,根据往年各年龄段人口比例数据,仍然采用多项式拟合估计,用MATLAB进行曲线拟合,求解得知在未来十年里,长沙人口总量仍然是增长趋势,但各年龄段人口变化趋势不同。
其中0-14岁呈增长趋势,十年后占比19.03%与2015年占比16.50%相比增加了2.47%;15-64岁劳动力人口呈下降趋势,十年后占比69.95%与2015年占比73%相比下降了3.05%;65岁及以上老龄人口呈增长趋势,十年后占比11.02%与2015年占比10.05%相比下降了0.97%。
模型三:由于城区土地资源对人口增长的限制,我们建立了微分方程模型,采用数据拟合、最小二乘法等方法,使用MATLAB编程求解得知以长沙现有城区面积最多可承载的最大人口数为759.63万人。
根据拟合所得曲线分析,再与目前实际情况相比较,所得数据结果较为合理。
若长沙全面实现城镇化,根据长沙现有城区面积与总面积的比例求出长沙最多可承载4087.53万人口。
模型的建立较为简单,虽然对将来人口变化进行了预测,但是假设过于理想化,若综合考虑政治、经济因素对人口增长的影响,预测结果将更加准确。
关键字:Logistic模型、多项式拟合估计、微分方程
一、问题的重述
中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一,根据已有数据,运用数学建模的方法,对长沙市人口进行分析与预测是一个重要的问题。
长沙下辖岳麓区、开福区、芙蓉区、天心区、雨花区、望城区等城区,、代管宁乡市、长沙县和浏阳县三个郊区县级市,总面积约1.1819 万平方公里,其中城区面积约 2000 余平方千米:据人口普查显示,2016 年长沙市拥有常住人口 764.52 万。
依据长沙的实际情况和人口增长特点来建立相关模型,求解下列问题:长沙市总人口到本世纪中叶将达到多少?未来十年长沙市不同年龄段人口的比例将如何变化?以长沙现有城区面积,最多可承载多少人口?若长沙全境实现城镇化,最多可承载多少人口?
二、问题的分析
2.1 问题一
要求2050年的常住人口,可以在长沙统计信息网中查找1999年至2016年的常住人口数据,所以这是对人口数进行长期预测。
当时间足够长时,因资源、环境等因素的影响,人口增长到一定数量后增长率下降,所以考虑阻滞增长模型。
首先运用多项式拟合的方法使用MATLAB来求解模型,预测长沙市总人口到本世纪中叶将达到多少。
其次根据表中的数据,做出散点图,用MATLAB进行回归分析拟合计算,可以得出Logistic模型拟合曲线,与散点图进行比较,比较得出拟合效果的优劣。
2.2 问题二
要求未来十年长沙市不同年龄段人口的比例将如何变化,传统的马尔萨斯模型不适用,考虑到不同年龄的人在死亡、生育方面存在差异,首先需查找相关数据,因为人口普查报告中将全年龄段分为0-14岁、15-64岁,65岁及以上,所以本题据此将全年龄段也分为相同的三个年龄段。
根据查找的数据绘制散点图,可以看出发展趋势,猜测函数并用数据拟合检验、分析。
使用MATLAB预测未来十年的总人数与各年龄段人口数,分别除以总人口数即可得到未来十年后各年龄段的比例,与现在的比例比较得出变化规律。
2.3问题三
要求以长沙现有城区面积,最多可承载多少人口,就是求人口承载力,在长沙统计信息网中收集城区人口,考虑到土地资源有限,假设每个人占有的资源相同,依据逻辑斯蒂模型,建立本题的相关模型,采用最小二乘法,使用MATLAB 求解,根据已有的数据进行拟合分析,得到最大人口数,即市区最大人口承载力,分析所得曲线的趋势,判断是否符合所建立的模型。
2.4 问题四
若长沙全境实现城镇化,求最多可承载多少人口,城镇人口的出生率、死亡率、生育率等都与农村人口不同。
城镇拥有更加完备的基础设施建设,可以容纳更多的人口,也有更多的人愿意住在城市。
城市里的大医院设备高端,医生的水
平也更好,所以城镇人口死亡率低于农村人口,出生率高于农村人口。
城市里一对夫妇大多生育1-2个孩子,而农村夫妇则相信多子多福。
这些因素都影响城镇人口数和农村人口数。
若是全部考虑,则未免太过复杂,所以将问题进行简化,若是将长沙全部城镇化,则城镇面积由原先2000余平方千米变为1.1819万平方公里,假设影响城镇人口因素不变,则城镇面积扩大,城镇人口数也会扩大相应人数。
三、 问题的假设与符号的说明
3.1模型的假设 1、生育模式不改变。
2、预测期内迁入迁出人口总数保持动态平衡。
3、人口总数只受出生率、死亡率影响,不考虑经济、自然灾害等因素对人口预测的影响。
4、十五年以内是中短期,十五年及以上是长期。
5、所收集的数据均正确。
3.2符号的说明
1、()t x 表示第t 年的人口数量;
2、r 表示人口增长率,()r x 表示人口增长率关于人口的函数;
3、m x 表示自然资源与环境条件所能容纳的最大人口数;
4、()m X t 表示长沙城市的极限承载人口数为,()z m X t 表示全部城镇化后长沙的极限承载人口数;
5、1S 表示市区的面积;0S 表示长沙总的面积;
四、 模型的建立与求解
4.1. 问题一
4.1.1模型的建立
阻滞作用体现在对人口增长率r 的影响,随着时间的推移,增长率随着人口数量的增加而减小,假定()r x 为线性函数,设为()r x r sx =-,设当m x x =
时,不
再增长,增长率()0m r
x =, 求得/m s r x =,即()()1/m
r x r r x =-。
建立Logistic 模型:
(1/)m dx
r x x x dt
=- (4.1.1) 0()o x t x = (4.1.2)
4.1.2模型的求解
预测到本世纪中叶长沙市总人口将达到多少,是对参数的估计,运用多项式拟合估计。
根据收集的数据(见表1),用MATLAB 程序
t=1999:2016;
x=[582.47,583.19,587.10,595.50,601.76,610.38,639.3,646.5,652.92,658.56,664.22,704.41,709.07,714.66,722.14,731.15,743.18,764.52]; y=ployfit(t,x,2) z=ployval(y,t);
plot(t,x,'k+',t,z,'r') b=polyval(y,2050) t=1999:2060; z=polyval(y,t); plot(t,z,'r') y =
1.0e+05 *
0.0000 -0.0052 5.1380 b =
1.3742e+03
所以根据MATLAB 求解,预测得出长沙市总人口到本世纪中叶将达到1374.2万人。
可以由从1999年到2060年的拟合曲线(见图1),看出增长率大于0,人口一直
增长,符合实际情况。
根据数据画出散点图和Logistic模型拟合曲线(见图2),可以看出数据和函数的拟合效果良好,可见结果比较可靠。
图1:1999年到2060年的Logistic模型拟合曲线
图2:1999到2060年的散点图与Logistic模型拟合曲线
表1 长沙市1999年-2016年人口变化数据
4.2问题二
4.2.1模型的建立
根据收集的数据(见表2),可绘制出长沙1999年至2015年不同年龄段比例的散点图(见图3),从图中可以看出0-14岁所占比例自1999年至2015总体下降,15-64岁所占比例自1999年至2015总体上升但近几年趋于平缓,65岁及以上所占比例自1999年至2015总体上升。
综合分析图表和材料可以发现,总人口变化的趋势比较符合发展的规律.而各年龄段的人口数量和比例中,0—14岁的少儿人口受出生率的影响较大,65岁及以上的老年人口则与死亡率关系较大,因此这两组数据的变化趋势比较符合发展规律.115-64岁总体上升但近几年有下降趋势。
因此选择总人口数,0—14岁的少儿人口数和65岁及以上的老年人口数进行分析,并依据以上分析预测数据推算出15—64岁的劳动年龄人口数,再拟合函数并分析。
表2:1999年—2015年长沙人口的数量及各年龄段的人口数量
图3
表3:1999-2015年各年龄段人口占总人口比例表
4.2.2模型的求解
使用MATLAB编程:
a=1999:1:2015;
b=[147.95,133.55,132.10,133.39,132.99,131.23,129.78,128.01,126.67,125 .13,122.88,116.93,117.00,117.92,118.43,120.64,122.62];
c=[40.19,40.82,41.68,43.47,45.13,46.39,49.23,51.07,52.89,54.66,56.46, 62.69,64.53,67.18,70.05,73.85,78.03];
d=[582.47,583.19,578.10,595.50,601.76,610.38,639.30,646.50,652.92,658 .56,664.22,704.41,709.07,714.66,722.14,731.15,743.18];
x=polyfit(a,b,3)
y=polyfit(a,c,1)
z=polyfit(a,d,2)
x1=polyval(x,a);
y1=polyval(y,a);
z1=polyval(z,a);
plot(a,b,'+',a,x1,'r')
hold on
plot(a,c,'.',a,y1,'b')
hold on
plot(a,d,'+',a,z1,'y')
hold on
t=2015:2025;
a1=polyval(x,t);
plot(t,a1,'r')
hold on
b1=polyval(y,t);
plot(t,b1,'b')
hold on
c1=polyval(z,t);
x =
1.0e+07 *
0.0000 -0.0000 0.0087 -5.8299 y =
1.0e+03 *
0.0024 -4.7028
z =
1.0e+05 *
0.0000 -0.0042 4.1067
q =
169.0828
w =
97.8681
e =
888.2945
由MATLAB求解可得未来10年后总人口数为888.2945万人,其中0-14岁有169.0828万人,占比19.03%,65岁及以上有97.8681万人,占比11.02%,15-64岁有621.3436万人,占比69.95%。
而2015年有743.18万人,其中0-14岁有122.62万人,占比16.50%,65岁及以上有78.03万人,占比10.05%,15-64岁有542.52万人,占比73%。
对比2015与十年后的比例(见图4、图5)
图4 图5
结合1999至2025年间的散点图与拟合曲线(见图6)可知,拟合效果良好,函数较符合,结果也符合实际情况。
比较并从图中可以看出0-14岁的年龄段十年间有上升缓慢,比例增加;65岁及以上人群增加,进一步老龄化,比例增加;15-64岁年龄段的占比则减少。
图6
4.3 问题三
4.3.1模型的建立
长沙土地资源有限,不妨设为1;而一个人的正常生存需要占用资源1()
m X t ; 在时刻t ,人口增长的速率与当时人口数成正比,为简单起见也假设与当时剩余资源()1()m X t S X t =-成正比;比例系数r 表示人口的固有增长率;设人口数()X t 足够大,可以视做连续变量处理,且()X t 关于t 连续可微。
因此可将人口数的增长率()r t 视为人口数()X t 的函数,由于资源对人口增长的限制,()r t 为t 的线性递减函数()r t r st =-,特别是当()X t 达到极限承载人口数()m X t 时,应有净增长率()0r t =,当人口数()X t 超过()m X t 时,应当发生负增长。
所以建立等式:
()()(1)()
m X t r t r X t =-
(4.3.1)
指数增长模型:
dx rx dy
= (4.3.2) 用()r t 代替指数增长模型中的
r ,用()X t 代替指数增长模型中的x 导出如下微
分方程模型: ()()()dX t r t X t dt
= (4.3.3) 代入式(4.3.1)得:
()()1()()m dX t X t r X t dt X t ⎡⎤=-⎢⎥⎣⎦
(4.3.4)
根据收集到的城市人口数(见表4),采用数据拟合、最小二乘法,使用MATLAB 编程:
t=[2002:1:2015]';
x=[294.01,308.89,321.99,344.39,365.27,393.06,403.37,416,476.58,485.64,495.64,509.86,528.88,552.78]';
a=[ones(13,1),-x(2:end)];
b=diff(x)./x(2:end);
cs=a\b;
r=cs(1);
xm=cs(2);
r =0.0705
xm =759.63
t=[2002:1:2100];
plot(t,xm./(1+(xm/x(1)-1)*exp(-r*(t-t(1)))));
由此可知最大人口数为759.63万人,根据拟合所得曲线分析,结果较为合理,现在城区有522.78万人,所以所得数据也较为符合实际情况。
图7
表4:2002年至2015年城镇人口数
4.4 问题四
4.4.1模型的建立
已知市区与全部面积,建立相关比例求解:
01
()()z m m X t S X t S (4.4.1)
4.4.2模型的求解
因为全部面积为1.1819万平方公里,现在市区面积为2196.45平方千米。
现在城镇人口最大为759.63,所以若全面城镇化,最多可承载4087.53万人口数
五、 模型的评价与改进
5.1 优点
1、模型假设合理、简洁易懂,易于建立与使用。
2、我们在对收集到的各种数据基础上建立模型,并通过对结果的分析,得出相关结论,因而对问题的考虑较为全面。
3、模型建立数据拟合对人口数进行预测,得到结果,适用于人口预测问题。
5.2 缺点
1、依赖于收集的数据,若数据不准确,则预测的结果也会与实际相差较大。
2、未考虑政策的改变,由计划生育变为单独二胎。
未考虑迁入迁出所带来的人口数的改变。
未考虑经济、自然灾害等因素对人口预测的影响。
这些会导致模型不完善,从而导致预测结果的不准确。
3、第四问城镇与农村人口数差别未考虑细致,假设太过理想化。
4、未考虑生育率、人口老龄化、人口性别比持续升高等因素。
5.3模型的改进
在预测未来人口总数时,将年龄结构、生育模式、人口性别比、生育率、人口持续老龄化等考虑其中。
使用人口分布函数和密度函数,结合出生率、死亡率、生育率,使用莱斯利模型研究任意时刻不同年龄的人口数量。
参考文献:
[1] 姜启源,谢金星,叶俊数学模型(第三版)[M] 北京:高等教育出版社 2003 年。
[2] 韩中庚,马晓军,胡宗云数学建模竞赛——获奖论文精选与点评(第二卷),北京:科学出版社,2015.1
[3] 司守奎,孙玺,数学建模算法与应用,北京,国防工业出版社,2016.2
[4]卓金武,李必文、魏永生、秦健,MATLAB在数学建模中的应用(第二版),北京,北京航空航天大学出版社,2016.6
[5]刘卫国,MATLAB程序设计与应用(第二版),北京,高等教育出版社,2011.12
[6]长沙统计信息网,/tjgb/index.jhtml。