实验步骤:中国人口预测的模型选择
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Case1 中国人口预测的模型选择
2016.9.21 X4243
实验目的:
通过本次实验,理解可线性化的非线性回归的基本原理;明确指数模型、对数模型、幂指数模型、双曲线模型、抛物线模型、正态分布模型等常用的非线性数学模型;掌握这些模型的数学表达式和变换为线性关系的数学转换方法,利用最小二乘技术进行回归运算;比较各非线性数学模型间的差异,利用相关系数检验、F检验和DW检验评估整个模型,为观测数据选配最可取的非线性分析或预测模型。
实验数据:
中国人口时间序列(1949-2000).xls
实验软件:
Excel和统计软件SPSS;
在电子表格Excel 里就可以开展工作,复杂的数学计算可以借助于数学软件Mathcad,大型的统计分析可以借助于统计软件SPSS
实验原理:
线性模型在现实中比较少出现的,大量的规律都表现为非线性模型。线性模
型不仅处理线性问题,主要是处理线性化的非线性模型;线性线性是简单的比例关系,要求各个自变量彼此独立,才能利用最小二乘技术求线性模型的参数;而非线性则是对简单比例关系的偏离,各变量相互作用。
指数模型、对数模型、幂指数模型、双曲线模型、抛物线模型、正态分布模型等常用的非线性数学模型,可以借助对数变换或者变量替换表示为线性函数形式;本实验主要利用线性函数、指数函数、双曲线函数和Logistic 增长函数的线性化模型预测中国人口。
开展一般的回归分析,首先要作散点图(scatter plot ),然后选择表达式,最后采用适当的拟合方法。预测结果不能出现违背基本逻辑的结论,同时预测结果要有现实意义。
实验内容:
注:有一些模型,如指数模型、Logistic 模型等,采用时序为自变量比较容易表示;为了处理方便,首先定义一个代表时序的变量
01949
k t t t =-=-
式中t 表示年份,t0=1949表示初始年份,显然,k=0,1,2,…,51表示时序。
DW 检验即Durbin-Watson 检验,又叫残差序列相关检验。
12
2
1()n
i i i n
i
i DW εεε
-==-=∑∑ (i ε表示残差)
利用三点法计算Logistic 增长函数的人口饱和值m P ,取三个等间隔的时序点(a t ,()a P t )、(b t ,()b P t )、(c t ,()c P t ),则m P 可以表示为:
22()(()())2()()()()()()b a c a b c m b b c P t P t P t P t P t P t P P t P t P t +-=- (2a b c t t t =+)
第一步,考察中国人口变化的散点分布是否具有线性特征(线性回归)。 1. 打开中国人口时间序列(1949-2000).xls ,选中表中的数据,单击插
入 散点图。
2.右键单击数据→添加趋势线。
3.设置坐标轴的起始值,右键单击坐标轴→设置坐标轴格式。
中国人口的准线性变化趋势
4.添加分析工具库,文件→Excel选项,选择Excel选项框中的加载项→
分析工具→转到(加载宏)→分析工具库→确定。
5.回归分析,数据 数据分析,在数据分析框中选择回归,单击确认打开回归窗口。
6. 在回归窗口,单击红色箭头选择X 、Y 值输入区域,选择残差、置信度等,单击确
定进入回归分析。
7. 利用回归分析的结果计算DW 检验值:
12
2
1()n
i i i n
i i DW εεε-==-=∑∑ (i ε表示残差)
第二步,采用各种可能的非线性模型进行回归分析,看看是否可以拟合某种简单的非线性函数。
1.中国人口变化的指数函数拟合。
指数模型、Logistic 模型等,采用时序为自变量比较容易表示,为了处理方便,首先定义一个代表时序的变量
k = t - t0 = t - 1949
1.中国人口变化的指数函数拟合结果
2.中国人口变化的双曲函数拟合(先进行线性化,再拟合)。
中国人口变化的双曲函数拟合结果
3. 利用回归分析的结果计算DW 检验值: 第三步,中国人口变化Logistic 增长函数拟合。
1. 利用三点法计算Logistic 增长函数的人口饱和值m P ,取三个等间隔的
时序点(a t ,()a P t )、(b t ,()b P t )、(c t ,()c P t ),则m P 可以表示为:
22()(()())2()()()()()()
b a
c a b c m b b c P t P t P t P t P t P t P P t P t P t +-=- (2a b c t t t =+)
2. Logistic 增长函数线性化拟合。
3. 利用回归分析的结果计算DW 检验值:
第四步,三个预测模型的比较。
三个预测模型的比较图
指数模型人口预测值计算公式:51571.89+1507.53*(A2-1949)
双曲线模型人口预测值计算公式:3066101.819-(5875946062.724/A2) Logistic 模型人口预测值计算公式:183075/(1+2.476*EXP(-0.034*(A2-1949)))