基于BP神经网络和GM(1,1)灰色模型的中国人口预测分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一, 问题重述
1.1, 问题背景 中国自古以来是一个人口大国. 新中国成立后, 我国人口进入飞速发展阶段. 1949 年到 1957 年 8 年时间, 人口增长了 1 亿;1964 年总人口超过 7 亿,1969 年总人口超过 8 亿, 1974 年总人口超过 9 亿. 这一时期每增长1亿人时间间隔为 5 年. 中国人口净增长率 波动比较剧烈. 80 年代以后, 由于我国实行了计划生育, 人口膨胀得到了有效的控制. 实行近 30 年来, 使我国少生了 4 亿多人, 为中国现代化建设, 全面实现小康社会打下了 坚实的基础, 同时也为世界人口控制做出了杰出贡献. 但是由于中国人口基数大, 人口 增长问题依然十分严峻. 在我国现代化进程中必须实现人口与经济, 社会, 资源, 环境协调发展和可持续发 展, 而人口问题始终是制约我国发展的关键因素之一. 要发展, 必须进一步控制人口数 量, 提高人口质量, 改善人口结构. 对中国未来人口的准确预测, 能够为中国经济和社 会发展的重大决策提供科学依据, 这对加速推进我国现代化建设有着极为重要的现实意 义. 因此, 根据已有数据, 运用数学建模的方法, 对中国人口做出分析和预测是一个重 要问题. 1.2, 问题提出 近年来中国的人口发展出现了一些新的特点, 例如, 老龄化进程加速, 出生人口性 别比持续升高, 以及乡村人口城镇化等因素, 这些都影响着中国人口的增长. 2007 年初 发布的《国家人口发展战略研究报告》(附录 1) 还做出了进一步的分析. 关于中国人口问题已有多方面的研究, 并积累了大量数据资料. 现在得到了《中国 人口统计年鉴》上收集到的部分数据(见附录 2). 其中包含 2001 至 2005 年的市, 镇和乡 人口不同性别的人在该类人口中所占的百分比, 死亡率, 生育率, 每年人口抽样调查的 样本容量( 人数) 数据. 1994 至 2005 年的市, 镇和乡男女出生比例. 1995 至 2005 年的市, 镇和乡育龄妇女生育率的千分比( ‰) . 根据已知数据( 或搜索相关文献和补充新的数据) , 解决以下的问题: 从中国的实际 情况和人口增长的上述特点出发, 建立中国人口增长的数学模型, 并由此对中国人口增 长的中短期和长期趋势做出预测.
于是可得到灰色预测的离散时间响应函数为:
u u X (1) t 1 X (0) 1 e at a a
X (1) t 1 为所得的累加的预测值, 将预测值还原即为:
( 3)
ˆ (1) t , t 1, 2, 3L n ˆ (0) t 1 X ˆ (1) t 1 X X
人口自然增长率=
年出生人数-本年死亡人数 1000 0 00 =人口出生率-人口死亡率 年平均人数
预测时期 短期( <10 年) , 中期( 10-25 年) , 长期( >25 年) ; 出生人口性别比 是活产男婴数与活产女婴数的比值, 通常用女婴数量为 100 时所 对应的男婴数来表示. 正常情况下, 出生性别比是由生物学规律决定的, 保持在 103~ 107 之间. 人口抚养比 指人口总体中处于供养年龄( 一般指 15 岁以下和 64 岁以上) 的人口 与处于“经济活动”年龄( 15-64 岁) 人口的比率. 用百分铝表示. 计算公式为:
1 X (1) 1 X (1) 2 2 1 X (1) 2 X (1) 3 2 LL 1 X (1) n 1 X (1) n 2 1 1 L 1
B
X (0) 2 X (0) 3 y L (0) X n
3
( 4)
( 3) GM(1,1)预测模型的 MATLAB 程序 根据上述 GM(1,1)模型的数学思想, 结合 MATLAB 语言的特点编制了一套可读性强, 容易理解的预测程序. 该程序操作简单灵活, 稳定性好, 直接面向用户. 4.2, BP神经网络模型的基本原理 ( 1) 神经网络的定义简介[2] 神经网络是由多个神经元组成的广泛互连的神经网络, 能够模拟生物神经系统真实 世界及物体之间所做出的交互反应. 人工神经网络处理信息是通过信息样本对神经网络 的训练, 使其具有人的大脑的记忆, 辨识能力, 完成名种信息处理功能. 它不需要任何 先验公式, 就能从已有数据中自动地归纳规则, 获得这些数据的内在规律, 具有良好的 自学习, 自适应, 联想记忆, 并行处理和非线性形转换的能力, 特别适合于因果关系复 杂的非确定性推理, 判断, 识别和分类等问题. 对于任意一组随机的, 正态的数据, 都可 以利用人工神经网络算法进行统计分析, 做出拟合和预测. 基于误差反向传播(Back propagation)算法的多层前馈网络(Multiple-layer feedforward network, 简记为BP网络), 是目前应用最成功和广泛的人工神经网络. ( 2) BP模型的基本原理[3] 学习过程中由信号的正向传播与误差的逆向传播两个过程组成. 正向传播时, 模式 作用于输入层, 经隐层处理后, 传入误差的逆向传播阶段, 将输出误差按某种子形式, 通过隐层向输入层逐层返回, 并“分摊”给各层的所有单元, 从而获得各层单元的参考误 差或称误差信号, 以作为修改各单元权值的依据. 权值不断修改的过程, 也就是网络学 习过程. 此过程一直进行到网络输出的误差准逐渐减少到可接受的程度或达到设定的学 习次数为止. BP网络模型包括其输入输出模型, 作用函数模型, 误差计算模型和自学习 模型. BP网络由输入层, 输出层以及一个或多个隐层节点互连而成的一种多层网, 这种结 构使多层前馈网络可在输入和输出间建立合适的线性或非线性关系, 又不致使网络输出 限制在-1和1之间. 见图( 1) .
此组合模型兼有灰色预测和bp神经网络预测的优点既利用灰色系统理论具有所需要的样本数据少原理简单运算方便短期预测精度高可检验等优点也发挥神经网络并行计算容错能力强自适应能力强等优点模型既克服了原始数据少数据波动性大对预测精度的影响也增强了预测的自适应性
基于 BP 神经网络和 GM(1,1)灰色模型的中国人口预测分析
2
来的 GM 模型, 从而确定系统在未来发展变化的趋势, 为规划决策提供依据. 在灰色预 测模型中, 对时间序列进行数量大小的预测, 随机性被弱化了, 确定性增强了. 此时在 生成层次上求解得到生成函数, 据此建立被求序列的数列预测, 其预测模型为一阶微分 方程, 即只有一个变量的灰色模型, 记为 GM(1,1)模型. 灰色 GM(1,1)预测模型在计算过程中主要是以矩阵为主, 它和 MATLAB 的结合可以 有效的解决了灰色系统理论在矩阵计算中的问题, 为灰色系统理论的应用提供了一种新 的方法. ( 2) GM(1,1)预测模型的基本原理 GM(1,1)模型是灰色预测的核心, 它是一个单个变量预测的一阶微分方程模型, 其 离散时间响应函数近似呈指数规律. 建立 GM(1,1)模型的方法是: 设 X (0) X (0) 1 , X (0) 2 ,L , X (0) n 为原始非负时间序列, X (1) t 为累加生成序 列, 即
出生率
年出生人数 1000 0 00 年平均人数
死亡率 指在一定时期内 ( 通常为一年) 一定地区的死亡人数与同期内平均人数 ( 或期中人数) 之比, 用千分率表示. 其计算公式为:
死亡率
年死亡人数 1000 0 00 年平均人数
人口自然增长率 是指在一定时期内( 通常为一年) 人口自然增加数( 出生人数减 死亡人数) 与该时期内平均人数( 或期中人数) 之比, 用千分率表示. 计算公式为:
二, 问题的分析
一个国家人口的准确预测, 是制定相应宏观经济政策的重要依据, 对我国经济的发 展有着巨大的作用. 预测是控制和规划的基础 , 预测的精度是控制和规划成功的前提 , 而选择预测的方法是提高预测精度的关键. 传统的人口预测方法主要有逻辑方法, 常微 分方程方法和动态预测方法等. 这些方法在人口预测领域起到了一定的作用, 但采用这 些方法时都要对数据进行模型假设. 由于真实模型往往是非线性的, 如果在一些简单的 模型假设下就进行数据模拟, 常常不能达到较好的模拟效果. 神经网络对复杂非线性系 统具有曲线拟合能力, 基于 BP 神经网络和 GM(1,1)模型的组合模型进行动态预测. 既利 用灰色预测的需要数据资料少的优点, 又吸收了 BP 神经网络容错能力, 自适应能力强 的优点. 由于神经网络的功能之强大, 型式之多样, 若能将其它网络形式同灰色模型相 结合, 则有可能进一步提高预测精度.
三, 模型的假设与符号说明
3.1, 模型假设与约定 ( 1) 未来人口的死亡模式保持不变;
1
( 2) 所研究的人口为封闭人口; ( 3) 农村人口一旦迁入城镇或者城镇化, 其人口行为和特征即与城镇人口相同, 即忽略 城镇人口与迁入城镇人口或城镇化人口的差别. ( 4) 人口数据质量高, 无误报和漏报等. ( 5) 在分析老年人口问题时, 是以 65 岁作为老年人口的起点年龄; 3.2, 名词定义 主要统计指标解释 人口数 指一定时点, 一定地区范围内有生命的个人总和. 出生率 指在一定时期内 ( 通常为一年) 一定地区的出生人数与同期内平均人数 ( 或期中人数) 之比, 用千分率表示. 其计算公式为:
黄俸强 李晶 邓健萍
摘 要
人口预测对国民经济的发展有着非常重要的作用. 如何用操作性强, 可信度高的方 法来预测人口的变化, 这是一个值得探讨的问题. 本文主要根据《中国人口统计年鉴》上收集到的 2001 年到 2005 年部分数据, 在灰 色预测的基础上, 引入 BP 神经网络模型, 建立了中国人口增长的 GM(1,1)和 BP 神经网 络组合模型, 并由此对中国人口增长的中短期和长期趋势做出预测. 我们通过输入原始数据资料, 应用灰色模型进行预测, 得到预测数列, 然后将预测 值作为输入量, 原始数据作为期望值, 对BP神经网络进行训练, 得到相应的权值和阀值, 最后输入预测年份, 即可得到具有较高精度的预测量. 由此可以知道, 中国人口增长的 中短期和长期趋势为: 人口总量在中短期内继续增长, 增速较为平稳, 每年以0.11亿人口数增长. 人口总 量在未来30年还将净增2亿人左右, 总人口将于2010年, 2020年分别达到13.63亿人和 14.67亿人, 2033年前后达到峰值15.01亿人, 之后人口总量缓慢下降. 我国育龄妇女( 15-49岁) 人数在短期内持续增加, 在2014年达到顶峰, 之后开始缓 慢下降, 到2033年左右, 下降速度加快;我国生育旺盛期育龄妇女( 20-29岁) 人数在短 期内持续下降, 在2015年达到低谷, 之后开始缓慢回升, 但是一段时期后, 又开始缓 慢下降, 如此波动变化. 全国人口死亡率继续保持较低水平( 维持在7‰以下) , 并缓慢下降, 从1990年的 6.67‰下降到2050年的5.66‰, 减少了1.01个千分点;我国男性人口死亡率高于女性人口 死亡率, 乡人口死亡率高于城镇人口死亡率. 我国人口城镇化速度在未来 20 年里每年增长 1.10-1.50 个百分点, 之后人口城镇化 开始放慢增长速度, 2021-2050 年间仅增加 11.41 个百分点. 到本世纪中叶, 城镇化水平 在 75%左右. 2005 年我国老年人口已超过 1 亿人, 到 2020 年, 65 岁以上老年人口将达到 1.74 亿 人, 比重从 2005 年的 8.09%增长到 12.02%. 预计 2050 年, 65 岁以上老年人口达 3.38 亿 多人, 比重达 23.23%. 老龄化进程加速. 老年人口数量多, 老龄化速度快, 高龄趋势明 显. 出生人口性别比总体呈上升趋势. 中短期变化不大, 都在初始值附近波动;从 2010 年到 2050 年平均每年增长了 0.75. 此组合模型兼有灰色预测和 BP 神经网络预测的优点, 既利用灰色系统理论具有所 需要的样本数据少, 原理简单, 运算方便, 短期预测精度高, 可检验等优点, 也发挥神经 网络并行计算, 容错能力强, 自适应能力强等优点, 模型既克服了原始数据少, 数据波 动性大对预测精度的影响, 也增强了预测的自适应性. 关键词:BP 神经网络 GM(1,1)灰色预测模型 人口预测
人口抚养比=
15岁以下人口 64岁以上人口 100 0 0 15-64岁人口
总和生育率:一定时期( 如某一年) 各年龄组妇女生育率的合计数, 说明每名妇女 按照某一年的各年龄组生育率度过育龄期, 平均可能生育的子女数, 是衡量生育水平最 常用的指标之一.
四, 模型的建立和求解
4.1, GM(1,1)预测模型的基本原理 ( 1) GM(1,1)灰色系统[1] 所谓灰色系统是指既含有已知信息 , 又含有未知信息的系统 , 是由邓聚龙教授在 1986 年提出的. 灰色理论自诞生以来, 发展很快, 由于它所需因素少, 模型简单, 特别 是对于因素空间难以穷尽, 运行机制尚不明确, 又缺乏建立确定关系的信息系统, 灰色 系统理论及方法为解决此类问题提供了新的思路和有益的尝试. 灰色预测方法是根据过去及现在已知的或非确知的信息, 建立一个从过去引申到将
i
X
(1)
t X (0) m , t 1, 2,L
m 1
,n
( 1)
GM(1,1)模型的白化微分方程为:
dX (1) aX (1) u dt
( 2)
ቤተ መጻሕፍቲ ባይዱ
式( 2) 中, a 为待辨识参数, 亦称发展系数;u 为待辨识内生变量,亦称灰作用量. 设待辨 a ˆ , 按最小二乘法求得 a ˆ ( BT B)1 BT y 式中 识向量 a u
相关文档
最新文档