计量经济学我国人口总数模型分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
—
R2=0.997208 R 2 =0.996823 F=2589.208 DW=0.959985
(1)怀特检验
由上图可知 TR2=34*0.66938=22.75892=Obs*R=22.75892 对于给定显著性水平α=0.05, 2 0。05(14)=23.685。
因为 TR2=22.75892< 2 0。05(14)=23.685 表明模型不存在异方差。
五,自相关检验
(1)DW 检验 已知DW=0.959985,若给定α=0.05,查表可知DW检验临界值为dL=1.21,dU=1.73。 因为DW=0.959985< dL=1.21,根据判断规则,认为误差项存在严重正自相关。 (2)LM 检验
滞后 1 期,输出结果为
LM=TR2=11.03058> 20.05(1) =3.841 所以 LM 检验结果也说明误差项存在一阶正自相关。 (3)用广义最小二乘法估计回归参数 ρ=1-DW/2=0.52 对原变量做广义差分变换,令 GDYt=Yt-0.52Yt-1 GDX1t=X1t-0.52X1t-1 GDX3t=X3t-0.52X3t-1 GDX4t=X4t-0.52X4t-1 以 GDYt,GDX1t,GDX2t,GDX3t,GDX4t,生成新变量,再次回归
—
R2=0.962380 R 2 =0.956592 F=166.2799 DW=1.723812 六,多重共线性检验
分别计算 x1,x3,x4,x5 的两两相关系数
r13= -0.724270 r14= -0.596661 r15= -0.582055 r34= 0.828727 r35= 0.797890 r45= 0.718312 可以看出有不同程度的多重共线性,为了检验和处理多重共线性,采用修正 Frisch 法。 对 Y 分别关于 x1,x3,x4,x5 作最小二乘回归,得
所以说总体回归方程是显著地。
四,异方差检验
剔出 x2 建立新模型为
^
Yi =-120976-3426.777log(X1)+5982.305log(X3)-9.785X4+21098.53log(X5) t =(-5.5438) (-2.1135) (7.94011) (-8.7940) (6.75967)
t=(-4.076836) (15.09690) (-1.064171)
R2=0.958474
—
R2
=0.955508
F=46.92159
DW=1.618292
可以看出加入 x4 以后 R2 均有所增加,并且没有影响 x3 的显著性,因此可以保 留 x4。
继续加入 x5,对 y 关于 x3,x4,x5 进作最小二乘回归,得到
我国人口数量的相关分析
一,寻找相关数据
二,进行模型的建立
打开Eviews,建立一个新的Workfile。数据类型为时间序列,1979~2012年。
输入被解释变量y与5个解释变量(如图所示) 将数据导入group中
分别观察y与x1,x2,x3,x4,x5的散点图, Y与x1的散点图:
Y与x2的散点图:
LM=TR2=4.677395> 20.05(1) =3.841
所以 LM 检验结果也说明误差项存在一阶正自相关。
此时ρ=1-DW/2=0.3582785
对原变量做广义差分变换,令
GDYt=Yt-0.3582785Yt-1
GDX1t=X1t-0.3582785X1t-1
GDX3t=X3t-0.3582785X3t-1
Y与x3的散点图: Y与x4的散点图:
Y与x5的散点图:
观察上述散点图发现y与x1,x2,x3,x4,x5为非线性关系,因此对其进行 非线性模型的线性化处理。
三,对模型进行参数估计
首先对模型进行线性化处理
对其进行模型回归,输入 ls y c z1 z2 z3 z4 z5 得到如下图所示回归结果
回归结果为
—
可决系数 R2=0.997258,修正后的可决系数R 2 =0.996769,表明拟合结果相当好。
○2 T-检验 由表可知各参数的 t 统计量为 1 为 t1=-2.2016 2 为 t2=0.7198 3 为 t3=7.8404
4 为 t4=-5.3888 5 为 t5=6.2395 对于给定的显著性水平 =0.05,查出 t
GDX5t=X5t-0.52X5t-1
得到回归结果如下图所示
—
R2=0.990567 R 2 =0.989219,显然方程拟合效果较好,且 DW=1.132237,查表
可得 dl=1.19,dU=1.73,因为 DW=1.132237<dl=1.19,因此模型依旧存在自相关。 继续对模型进行 LM 检验,得到
t=(7.180762) (12.51168) (-1.079298) (-1.613871)
R2=0.962127
—
R2
=0.957919
F=228.6383
DW=1.686107
可以看出 R-squared 与 Adjusted R-squared 都有所增加且各系数显著,因此应 带保留 x1 在模型中
(34-5-1)=2.05
可以看出 t2=0.7198< 2.05,所以认为死亡率对我国人口总数没有显著影响,因 此可以将 x2 剔出模型。
○3 F 检验
由图可得 F 统计量为 F=2037.054 对于给定的显著性水平 =0.05,查出分子自由度
为 5,分母自由度为 34-5-1=28 的 F0.05(5,28)=2.56.因为 F=2037.054>>2.56,
R2=0.956794
—
R2
=0.955305
F=642.2087
DW=1.405409
^
(3)Yi =20351.63+31.71404log(X4)
t=(76.18635) (6.885316)
R2=0.620457
—
R2
=0.607369
F=47.40758
DW=0.187778
^
(4)Yi =-31856.09+31495.49log(X5)
LM=TR2=0.574736< 20.05(1) =3.841 所以 LM 检验结果说明误差项不在存在自相关。 由最新的回归模型可知0=9566.853 则变换后模型中0=9566.853/(1-ρ)=14908.107
^
Yi =14908.107-2980.780log(X1)+ 7873.197log(X3) -3.104568X4+1071.770log(X5) t =(2.301578) (-1.583988) (10.74845) (-1.118066) (0.417804)
GDX4t=X4t-0.3582785X4t-1
GDX5t=X5t-0.3582785X5t-1
以 GDYt,GDX1t,GDX2t,GDX3t,GDX4t,生成新变量,再次回归
—
R2=0.962380 R 2 =0.956592,显然方程拟合效果较好,且 DW=1.723812,查表
可得 dl=1.16,dU=1.74,因为 DW=1.723812>dl=1.16,但是 DW=1.723812<dU=1.74 因此不能确定是否存在自相关。 继续对模型进行 LM 检验,得到
^
Yi =-123441.8-3988.052Z1+5043.003Z2+6105.032Z3-11.015X4+20443.4Z5
^
Yi =-123441.8-3988.05log(X1)+5043.0log(X2)+6105.03log(X3)-11.015X4+20443.4 log(X5)
t =(-5.5428) (-2.2016) (0.7198) (7.8404) (-5.3888) (6.2395)
^
Yi =7292.392+8394.135log(X3) -3.153323X4+1119.541log(X5)
t=(1.819332) (12.48092) (-1.105229) (0.424748)
R2=0.958750
—
R2
=0.954166
F=209.1793
DW=1.649241
可以看出在加入
—
R2=0.997258 R 2 =0.996769 F=2037.054 DW=0.981736
(1)经济意义检验 1=-3988.052,说明出生率每增加单 1%,我国总人口减少 3988.052 单位; 2=5043.003,说明死亡率每增加单 1%,我国总人口增加 5043.003 单位; 3=6105.032,说明人均可支配收入每增加 1 个单位,我国总人口增加 6105.032 单位; 1=-11.015,说明受高等教育人数每增加 1 个单位,我国总人口减少 11.015 单 位; 1=20443.4,说明医疗机构数每增加 1 个单位,我国总人口增加 20443.4 单位; (2)统计检验 ○1 拟合优度检验
^
(1),Yi =33794.86-25593.87log(X1)
t=(16.92794) (-6.113403)
R2=0.563080
—
R2
=0.548014
F=37.37370
DW=1.015654
^
(2)Yi =9590.486+8043.744log(X3)
t=(19.97036) (25.34184)
t=(-4.076836) (6.849933)
R2=0.618027
—
R2
=0.604855百度文库
F=46.92159
DW=1.618292
可知 x3 为最重要的解释变量,所以选取第二个方程为基本回归方程。
加入 x4,对 y 关于 x3,x4 作最小二乘回归得,
^
Yi =8963.104+8542.782log(X5)-2.948288X4
LM=4.43514> 20.05(1) =3.841。因此存在一阶正自相关
此时,ρ’=1-DW/2=0.4338815
对原变量做广义差分变换,令
GDYt=Yt-0.4338815Yt-1
GDX1t=X1t-0.4338815X1t-1
GDX3t=X3t-0.4338815X3t-1
GDX4t=X4t-0.4338815X4t-1
GDX5t=X5t-0.4338815X5t-1
以 GDYt,GDX1t,GDX2t,GDX3t,GDX4t,生成新变量,再次回归
—
R2=0.984409 R 2 =0.982100,显然方程拟合效果较好,且 DW=1.283443,查表
可得 dl=1.18,dU=1.73,因为 DW=1.283443>dl=1.18,但是 DW=1.283443<dU=1.73 因此不能确定是否存在自相关。 继续对模型进行 LM 检验,得到
x5
以后
—
R2
=0.954166
有所减小,且
x4,x5
的系数均不显著,
所以说明存在严重的多重共线性,因此在模型中保留 x4,忽略 x5。
继续加入 x1,对 Y 关于 x3,x4,x1 作最小二乘回归,得到
^
Yi =11173.11+8013.867log(X3) -2.908158X4-2990.024log(X1)
综合上述可以得到最终模型为
^
Yi =11173.11+8013.867log(X3) -2.908158X4-2990.024log(X1)
R2=0.997208 R 2 =0.996823 F=2589.208 DW=0.959985
(1)怀特检验
由上图可知 TR2=34*0.66938=22.75892=Obs*R=22.75892 对于给定显著性水平α=0.05, 2 0。05(14)=23.685。
因为 TR2=22.75892< 2 0。05(14)=23.685 表明模型不存在异方差。
五,自相关检验
(1)DW 检验 已知DW=0.959985,若给定α=0.05,查表可知DW检验临界值为dL=1.21,dU=1.73。 因为DW=0.959985< dL=1.21,根据判断规则,认为误差项存在严重正自相关。 (2)LM 检验
滞后 1 期,输出结果为
LM=TR2=11.03058> 20.05(1) =3.841 所以 LM 检验结果也说明误差项存在一阶正自相关。 (3)用广义最小二乘法估计回归参数 ρ=1-DW/2=0.52 对原变量做广义差分变换,令 GDYt=Yt-0.52Yt-1 GDX1t=X1t-0.52X1t-1 GDX3t=X3t-0.52X3t-1 GDX4t=X4t-0.52X4t-1 以 GDYt,GDX1t,GDX2t,GDX3t,GDX4t,生成新变量,再次回归
—
R2=0.962380 R 2 =0.956592 F=166.2799 DW=1.723812 六,多重共线性检验
分别计算 x1,x3,x4,x5 的两两相关系数
r13= -0.724270 r14= -0.596661 r15= -0.582055 r34= 0.828727 r35= 0.797890 r45= 0.718312 可以看出有不同程度的多重共线性,为了检验和处理多重共线性,采用修正 Frisch 法。 对 Y 分别关于 x1,x3,x4,x5 作最小二乘回归,得
所以说总体回归方程是显著地。
四,异方差检验
剔出 x2 建立新模型为
^
Yi =-120976-3426.777log(X1)+5982.305log(X3)-9.785X4+21098.53log(X5) t =(-5.5438) (-2.1135) (7.94011) (-8.7940) (6.75967)
t=(-4.076836) (15.09690) (-1.064171)
R2=0.958474
—
R2
=0.955508
F=46.92159
DW=1.618292
可以看出加入 x4 以后 R2 均有所增加,并且没有影响 x3 的显著性,因此可以保 留 x4。
继续加入 x5,对 y 关于 x3,x4,x5 进作最小二乘回归,得到
我国人口数量的相关分析
一,寻找相关数据
二,进行模型的建立
打开Eviews,建立一个新的Workfile。数据类型为时间序列,1979~2012年。
输入被解释变量y与5个解释变量(如图所示) 将数据导入group中
分别观察y与x1,x2,x3,x4,x5的散点图, Y与x1的散点图:
Y与x2的散点图:
LM=TR2=4.677395> 20.05(1) =3.841
所以 LM 检验结果也说明误差项存在一阶正自相关。
此时ρ=1-DW/2=0.3582785
对原变量做广义差分变换,令
GDYt=Yt-0.3582785Yt-1
GDX1t=X1t-0.3582785X1t-1
GDX3t=X3t-0.3582785X3t-1
Y与x3的散点图: Y与x4的散点图:
Y与x5的散点图:
观察上述散点图发现y与x1,x2,x3,x4,x5为非线性关系,因此对其进行 非线性模型的线性化处理。
三,对模型进行参数估计
首先对模型进行线性化处理
对其进行模型回归,输入 ls y c z1 z2 z3 z4 z5 得到如下图所示回归结果
回归结果为
—
可决系数 R2=0.997258,修正后的可决系数R 2 =0.996769,表明拟合结果相当好。
○2 T-检验 由表可知各参数的 t 统计量为 1 为 t1=-2.2016 2 为 t2=0.7198 3 为 t3=7.8404
4 为 t4=-5.3888 5 为 t5=6.2395 对于给定的显著性水平 =0.05,查出 t
GDX5t=X5t-0.52X5t-1
得到回归结果如下图所示
—
R2=0.990567 R 2 =0.989219,显然方程拟合效果较好,且 DW=1.132237,查表
可得 dl=1.19,dU=1.73,因为 DW=1.132237<dl=1.19,因此模型依旧存在自相关。 继续对模型进行 LM 检验,得到
t=(7.180762) (12.51168) (-1.079298) (-1.613871)
R2=0.962127
—
R2
=0.957919
F=228.6383
DW=1.686107
可以看出 R-squared 与 Adjusted R-squared 都有所增加且各系数显著,因此应 带保留 x1 在模型中
(34-5-1)=2.05
可以看出 t2=0.7198< 2.05,所以认为死亡率对我国人口总数没有显著影响,因 此可以将 x2 剔出模型。
○3 F 检验
由图可得 F 统计量为 F=2037.054 对于给定的显著性水平 =0.05,查出分子自由度
为 5,分母自由度为 34-5-1=28 的 F0.05(5,28)=2.56.因为 F=2037.054>>2.56,
R2=0.956794
—
R2
=0.955305
F=642.2087
DW=1.405409
^
(3)Yi =20351.63+31.71404log(X4)
t=(76.18635) (6.885316)
R2=0.620457
—
R2
=0.607369
F=47.40758
DW=0.187778
^
(4)Yi =-31856.09+31495.49log(X5)
LM=TR2=0.574736< 20.05(1) =3.841 所以 LM 检验结果说明误差项不在存在自相关。 由最新的回归模型可知0=9566.853 则变换后模型中0=9566.853/(1-ρ)=14908.107
^
Yi =14908.107-2980.780log(X1)+ 7873.197log(X3) -3.104568X4+1071.770log(X5) t =(2.301578) (-1.583988) (10.74845) (-1.118066) (0.417804)
GDX4t=X4t-0.3582785X4t-1
GDX5t=X5t-0.3582785X5t-1
以 GDYt,GDX1t,GDX2t,GDX3t,GDX4t,生成新变量,再次回归
—
R2=0.962380 R 2 =0.956592,显然方程拟合效果较好,且 DW=1.723812,查表
可得 dl=1.16,dU=1.74,因为 DW=1.723812>dl=1.16,但是 DW=1.723812<dU=1.74 因此不能确定是否存在自相关。 继续对模型进行 LM 检验,得到
^
Yi =-123441.8-3988.052Z1+5043.003Z2+6105.032Z3-11.015X4+20443.4Z5
^
Yi =-123441.8-3988.05log(X1)+5043.0log(X2)+6105.03log(X3)-11.015X4+20443.4 log(X5)
t =(-5.5428) (-2.2016) (0.7198) (7.8404) (-5.3888) (6.2395)
^
Yi =7292.392+8394.135log(X3) -3.153323X4+1119.541log(X5)
t=(1.819332) (12.48092) (-1.105229) (0.424748)
R2=0.958750
—
R2
=0.954166
F=209.1793
DW=1.649241
可以看出在加入
—
R2=0.997258 R 2 =0.996769 F=2037.054 DW=0.981736
(1)经济意义检验 1=-3988.052,说明出生率每增加单 1%,我国总人口减少 3988.052 单位; 2=5043.003,说明死亡率每增加单 1%,我国总人口增加 5043.003 单位; 3=6105.032,说明人均可支配收入每增加 1 个单位,我国总人口增加 6105.032 单位; 1=-11.015,说明受高等教育人数每增加 1 个单位,我国总人口减少 11.015 单 位; 1=20443.4,说明医疗机构数每增加 1 个单位,我国总人口增加 20443.4 单位; (2)统计检验 ○1 拟合优度检验
^
(1),Yi =33794.86-25593.87log(X1)
t=(16.92794) (-6.113403)
R2=0.563080
—
R2
=0.548014
F=37.37370
DW=1.015654
^
(2)Yi =9590.486+8043.744log(X3)
t=(19.97036) (25.34184)
t=(-4.076836) (6.849933)
R2=0.618027
—
R2
=0.604855百度文库
F=46.92159
DW=1.618292
可知 x3 为最重要的解释变量,所以选取第二个方程为基本回归方程。
加入 x4,对 y 关于 x3,x4 作最小二乘回归得,
^
Yi =8963.104+8542.782log(X5)-2.948288X4
LM=4.43514> 20.05(1) =3.841。因此存在一阶正自相关
此时,ρ’=1-DW/2=0.4338815
对原变量做广义差分变换,令
GDYt=Yt-0.4338815Yt-1
GDX1t=X1t-0.4338815X1t-1
GDX3t=X3t-0.4338815X3t-1
GDX4t=X4t-0.4338815X4t-1
GDX5t=X5t-0.4338815X5t-1
以 GDYt,GDX1t,GDX2t,GDX3t,GDX4t,生成新变量,再次回归
—
R2=0.984409 R 2 =0.982100,显然方程拟合效果较好,且 DW=1.283443,查表
可得 dl=1.18,dU=1.73,因为 DW=1.283443>dl=1.18,但是 DW=1.283443<dU=1.73 因此不能确定是否存在自相关。 继续对模型进行 LM 检验,得到
x5
以后
—
R2
=0.954166
有所减小,且
x4,x5
的系数均不显著,
所以说明存在严重的多重共线性,因此在模型中保留 x4,忽略 x5。
继续加入 x1,对 Y 关于 x3,x4,x1 作最小二乘回归,得到
^
Yi =11173.11+8013.867log(X3) -2.908158X4-2990.024log(X1)
综合上述可以得到最终模型为
^
Yi =11173.11+8013.867log(X3) -2.908158X4-2990.024log(X1)