立用多元线性回归研究国家婴儿死亡率与妇女文盲率之间的关系讲解

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

熟练应用EViews软件作多元线性回归分析。

立用多元线性回归分析研究国家婴儿死亡率与妇女文盲率之间的关系。

、先验的预期CM和各个变量之间的关系。
、做CM对FLR的回归,得到回归结果。
、做CM对FLR和PGNP的回归,得到回归结果。
、做CM对FLR,PGNP和TFR的回归结果,并给出ANOVA。
、根据各种回归结果,选择哪个模型?为什么?
、如果回归模型(4)是正确的模型,但却估计了(2)或(3),会有什么后果?
、假定做了(2)的回归,如何决定增加变量PGNP和TFR?使用了哪种检验?给出必


:
、问题提出2、指标选择 3、数据选择
、数据处理5、数据分析6、建立模型
以及模型检验 7、报告结论 8、实验总结
、问题提出
反映了国家人民的健康水平与国家
这一指标也是政府采取相关政策的一个重要依据。在社会学中,一个国家的婴

、指标选择
CM,女性识字率FLR进行分析。考虑到影响婴儿死亡
尤其是经济发展状况、总生育率等也会对其产生重要影响,考虑到实验的
GNP(PGNP)和总生育率(TFR)对婴儿死亡率的影响。

)预期CM与FLR存在负相关关系。
另一方面,女性教育程度越高,其就业机会与收入获得途径就越多,可
FLR的提高会导致CM降低。
)预期CM与PGNP存在负相关关系。
GNP的提高使人们的物质生活水平得到提高,改善了人民、食、住、行等诸方面
从而增加人们的体质;使人们
有充足的精力和时间来关心自己及其后代
PGNP的提高会导致CM降低。
)预期CM与TFR存在正相关关系。
GNP,
TFR的提
CM降低。
、数据选择
64个国家的各项指标数据作为样本进行
1
婴儿死亡率CM 女性识字率FLR 人均GNP(PGNP) 总生育率TFR
128 37 1870 6.66
204 22 130 6.15
202 16 310 7.00
197 65 570 6.25
96 76 2050 3.81
209 26 200 6.44
170 45 670 6.19
240 29 300 5.89
241 11 120 5.89
55 55 290 2.36
75 87 1180 3.93
129 55 900 5.99
24 93 1730 3.50
165 31 1150 7.41
94 77 1160 4.21
96 80 1270 5.00
148 30 580 5.27
98 69 660 5.21
161 43 420 6.50
118 47 1080 6.12
269 17 290 6.19
189 35 270 5.05
126 58 560 6.16
12 81 4240 1.80
167 29 240 4.75
135 65 430 4.10
107 87 3020 6.66
72 63 1420 7.28
128 49 420 8.12
27 63 19830 5.23
152 84 420 5.79
224 23 530 6.50
142 50 8640 7.17
104 62 350 6.60
287 31 230 7.00
41 66 1620 3.91
312 11 190 6.70
77 88 2090 4.20
142 22 900 5.43
262 22 230 6.50
215 12 140 6.25
246 9 330 7.10
191 31 1010 7.10
182 19 300 7.00
37 88 1730 3.46
103 35 780 5.66
67 85 1300 4.82
143 78 930 5.00
83 85 690 4.74
223 33 200 8.49
240 19 450 6.50
312 21 280 6.50
12 79 4430 1.69
52 83 270 3.25
79 43 1340 7.17
61 88 670 3.52
168 28 410 6.09
28 95 4370 2.86
121 41 1310 4.88
115 62 1470 3.89
186 45 300 6.90
47 85 3630 4.10
178 45 220 6.09
142 67 56

0 7.20
1
数据处理
1中的实验数据可直接应用于研究分析,无需经过其他处理。
数据分析
、观察表1数据,婴儿死亡率CM,女性识字率FLR,人均GNP(PGNP)和总生育率(TFR)

、通过EViews软件分析进行相关分析:
与FLR的相关性
4080120160200240280320
20406080100
CM
1)和相关系数(表2)知,这两组数据的相关性较高,且CM与FLR之间

2)CM与PGNP的相关性
4080120160200240280320
4,0008,00012,00016,00020,000
CM
2)和相关系数(表3)知,这两组数据有一定的相关性,且CM与PGNP

)CM与TFR的相关性
PGNP CM PGNP 1.000000 -0.407697 CM -0.407697 1.000000
PGNP CM FLR CM FLR 1.000000 -0.818285 CM -0.818285 1.000000 表2 表3 图1 图2
4080120160200240280320
23456789
CM
3)和相关系数(表3)知,这两组数据具有一定的相关性,且CM与TFR

CM与FLR之间存在负相关关系,与PGNP之间存在负相关关系,
TFR之间存在正相关关系。
建立模型以及模型检验
、分别做出CM对FLR、CM对FLR和PGNP以及CM对FLR,PGNP和TFR进行回
、分别对各个模型进行检验,包括经济检验及统计检验
给出CM对FLR,PGNP和TFR回归结果的ANOVA
.1 CM对FLR的回归模型建立及检验
1)建立回归模型
1,建立如下线性模型:
iiFLRCM10


Time: 11:44




Coefficient Std. Error t-Statistic Prob.


-2.390496 0.213263 -11.20917 0.0000
263.8635 12.22499 21.58395 0.0000


0.669590 Mean dependent var 141.5000 PGNP 1.000000 -0.407697 CM -0.407697 1.000000 图3 表4
0.664261 S.D. dependent var 75.97807
44.02399 Akaike info criterion 10.43810
120163.0 Schwarz criterion 10.50556
-332.0191 Hannan-Quinn criter. 10.46468
125.6455 Durbin-Watson stat 2.314744
0.000000


8635.263*390496.2FLRCM
Se=(0.213263) (12.22499)
)0000.0)(0000.0(p 669590.02R 6455.125F
(2)模型检验
对FLR的回归模型的检验
斜率值为 - 2.390496,说明女性识字率(FLR)与婴儿死亡率(CM)负 相
FLR)增加1%,可导致婴儿死亡率(CM)
2.390496%。

1)拟合优度检验:
R2=0.669590,说明所建模型整体上对样本数据还不算很好,即解释变量
对 FLR的大部分差异作出了解释,但可能还有其他因素影响婴儿死亡率。
检验:
变量β
和β2的原假设与备择假设为:H0:β0=0,β1≠0;H0:β1=0,β1≠0。
5%的显著水平下,自由度为n-2=64-2=62的t的临界值为2.000。因为计
β
的估计值的t值21.58395>2.000,所以拒绝原假设H0:β0=0,β1的估计值
t值-11.20917<-2.000,所以拒绝原假设H
:β1=0。这说明在95%的置信水平下,解释
(FLR)通过了显著性检验,即解释变量女性识字率(FLR)对婴儿死亡率
CM)有显著影响。
对FLR和PGNP的回归模型建立及检验
1)建立回归模型
2,建立如下线性模型:

iiiPGNPFLRCM210



Time: 11:49




Coefficient Std. Error t-Statistic Prob.


263.6416 11.59318 22.74109 0.0000 Dependent Variable: CM
-2.231586 0.209947 -10.62927 0.0000
-0.005647 0.002003 -2.818703 0.0065


0.707665 Mean dependent var 141.5000
0.698081 S.D. dependent var 75.97807
41.74780 Akaike info criterion 10.34691
106315.6 Schwarz criterion 10.44811
-328.1012 Hannan-Quinn criter. 10.38678
73.83254 Durbin-Watson stat 2.186159
0.000000


6416.263*005647.0*231586.2PGNPFLRCM
其中:
)59318.11)(002003.0)(209947.0(Se
)74109.22)(818703.2)(62927.10(t
)0000.0)(0065.0)(0000.0(p 707665.02R 83254.73F
2)模型检验
β
和β2的估计值均为负数,说明女性识字率(FLR)和人均
与婴儿 的死亡率(CM)负相关,与预期假设相同。β
的估计值为-2.231586,
变的情况下,女性识字率每增加1%,婴儿死亡率减少2.231586%。
的估计值为- 0.005647,表示在其他变量保持不变的条件下,人均GNP每增加1%,
0.005647%。

(1)拟合优度检验:
R2=0.707665,说明所建模型整体上对样本数据还不算很好,即解释变量CM
FLR的大部分差异作出了解释,但可能还有其他因素影响婴儿死亡率。
2)t检验:
5%的显著水平下,自由度为n-3 = 64-3 = 61的t的临界值为2.000,
的估计值的t值为-10.62927<-2.000,β2的估计值为-2.818703<-2.000,说明在95%
(FLR) 和人均GNP(PGNP)均通过了显著性检验,即
(FLR) 和人均GNP(PGNP)对婴儿死亡率(CM)有显著影响。
对FLR、PGNP和TFR的回归模型建立及检验
1)建立回归模型
3,建立如下线性模型:
iiiTFRPGNPFLRCM3210



Time: 11:31
.16886864.12005511.0768029.1TFPPGNPFLRCM
Se= (0.248017)(0.001878)(4.190533)(32.89165)
)117003.5)(070883.3)(934275.2)(128663.7(t
)0000.0)(0032.0)(0047.0)(0000.0(p
.02R
16767.59F
模型检验

β1和β2的估计值为负数,β3的估计值为正数,说明女性的文化率(FLR)
GNP(PGNP)与婴儿的死亡率(CM)负相关,总生育率(TFR)和婴儿的死亡率(CM)正
与预期假设相同。β1的估计值为– 1.768029,表示在其他变量保持不变的情况下,
每增加1%,婴儿死亡率减少 1.768029%;β2的估计值为- 0.005511,表明在
GNP每增加1%,婴儿死亡率减少- 0.005511%;β3的估
12.86864,表明总生育率增加1%,婴儿死亡率增加12.86864%。

(1)拟合优度检验:
R2=0.747372 ,说明所做模型整体对样本数据拟合较好,即解释变量 FLR、PGNP
TFR对CM的大多数差异作了解释,但该模型仍有进一步改良的空间。
2)t检验:
查表可得,在5%的显著水平下,自由度为n-4 = 64-4 = 60的t的临界值为2.000,
1的估计值的t值为-7.128663<-2.000,β2的估计值为-2.934275<-2.000,β3的估计值
3.070883>2.000,说明在95%的置信水平下,解释变

量女性识字率(FLR) ,人均GNP(PGNP)
(TFR)均通过了显著性检验,即解释变量女性识字率(FLR) 、人均GNP(PGNP) 、Sample: 1 64 Included observations: 64 Variable Coefficient Std. Error t-Statistic Prob. C 168.3067 32.89165 5.117003 0.0000 FLR -1.768029 0.248017 -7.128663 0.0000 PGNP -0.005511 0.001878 -2.934275 0.0047 TFR 12.86864 4.190533 3.070883 0.0032 R-squared 0.747372 Mean dependent var 141.5000 Adjusted R-squared 0.734740 S.D. dependent var 75.97807 S.E. of regression 39.13127 Akaike info criterion 10.23218 Sum squared resid 91875.38 Schwarz criterion 10.36711 Log likelihood -323.4298 Hannan-Quinn criter. 10.28534 F-statistic 59.16767 Durbin-Watson stat 2.170318 Prob(F-statistic) 0.000000
(TFR)对婴儿死亡率(CM)均有显著影响。

报告结论
1)根据各种回归结果,应选择CM对FLR,PGNP和TFR的回归模型。
看,CM对FLR的回归模型中 =0.669590 ,CM对FLR
PGNP回归模型中 =0.707665,CM对FLR,PGNP和TFR的回归模型中 =0.747372,因
CM对FLR,PGNP和TFR的回归模型中 最大,对样本数据的拟合程度最高
2) 如果回归模型CM对FLR,PGNP和TFR是正确的模型,但却估计了前两种回归模
就忽略了影响婴儿死亡率的其他重要因素,而且根据上面各模型的分析可知正确回归模
FLR,PGNP和TFR这三个解释变量的系数的绝对值都小于其他模型,采用前两种回归
使回归模型的误差可能很大,失

)在实际中,为了解释某个现象,往往面临着在若干解释变量间进行取舍的问题。通常
只要调整的可决系数值增加,就可以增加新的解释变量。在上述三个回归模型中,
对FLR的回归模型中的调整的可决系数值为0.664261,CM对FLR和PGNP回归模型
0.698081,CM对FLR,PGNP和TFR的回归模型中的调整可决系数
0.734740。因此CM对FLR,PGNP和TFR的回归模型中引入PGNP和TFR提高了模
PGNP和TFR应该作为重要的解释变量引入到模型中来。
、报告结论
、婴儿死亡率受多个因素的影响,包括女性识字率FLR,人均GNP(PGNP)和总生育
TFR)等。尽管这三项是决定婴儿死亡率的重要因素,但现实生活中一定还存在其他的

、婴儿死亡率受女性识字率FLR,人均GNP(PGNP)和总生育率(TFR)的影响较大,

、EViews的应用能力还有待提高,应在多次运用中渐渐熟练。

相关文档
最新文档