2019年南开大学《计量经济学》案例分析.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
南开大学
《计量经济学》案例分析
案例一:用回归模型预测木材剩余物(file:b1c3)
伊春林区位于黑龙江省东北部。
全区有森林面积218.9732万公顷,木材蓄积量为2.324602亿m3。
森林覆盖率为62.5%,是我国主要的木材工业基地之一。
1999年伊春林区木材采伐量为532万m3。
按此速度44年之后,1999年的蓄积量将被采伐一空。
所以目前亟待调整木材采伐规划与方式,保护森林生态环境。
为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。
因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。
下面,利用一元线性回归模型预测林区每年的木材剩余物。
显然引起木材剩余物变化的关键因素是年木材采伐量。
给出伊春林区16个林业局1999年木材剩余物和年木材采伐量数据如表1.1。
散点图见图1.1。
观测点近似服从线性关系。
建立一元线性回归模型如下:
y t = β0 + β1 x t + u t
表1.1 年剩余物y t和年木材采伐量x t数据
林业局名年木材剩余物
y t(万m3)
年木材采伐量
x t(万m3)
乌伊岭26.13 61.4 东风23.49 48.3 新青21.97 51.8 红星11.53 35.9 五营7.18 17.8 上甘岭 6.80 17.0 友好18.43 55.0 翠峦11.69 32.7 乌马河 6.80 17.0 美溪9.69 27.3 大丰7.99 21.5 南岔12.15 35.5 带岭 6.80 17.0 朗乡17.20 50.0 桃山9.50 30.0 双丰 5.52 13.8
合计202.87 532.00
图1.1 年剩余物y t和年木材采伐量x t散点图
图1.2 EViews输出结果
EViews估计结果见图1.2。
在已建立Eviews数据文件的基础上,进行OLS估计的操作步骤如下:打开工作文件,从主菜单上点击Quick键,选Estimate Equation 功能。
在出现的对话框中输入y c x。
点击Ok键。
立即会得到如图1.2所示的结果。
下面分析EViews输出结果。
先看图1.2的最上部分。
被解释变量是y t。
估计方法是最小二乘法。
本次估计用了16对样本观测值。
输出格式的中间部分给出5列。
第1列给出截距项(C)和解释变量x t。
第2列给出第1列相应项的回归参数估计值(0ˆβ和1ˆβ)。
第3列给出相应回归参数估计值的样本标准差(s(0ˆβ), s(1ˆβ))。
第4列给出相应t值。
第5列给出t统计量取值大于用样本计算的t值(绝对值)的概率值。
以t = 12.11266为例,相应概率0.0000表示统计量t取值(绝对值)大于12.1的概率是一个比万分之一还小的数。
换句话说,若给定检验水平为0.05,则临界值为t0.05(14) = 2.15。
t = 12.1>2.15落在了H0的拒绝域,所以结论是β1不为零。
输出格式的最下部分给出了评价估计的回归函数的若干个统计量的值。
依纵向顺序,这些统计量依次是可决系数R2、调整的可决系数2R(第3章介绍)、回归函数的
标准差(s.e.,即均方误差的算术根σˆ)、残差平方和、对数极大似然函数值(第2章介绍)、DW 统计量的值、被解释变量的平均数(y )、被解释变量的标准差()(t y s )、赤池(Akaike )信息准则(是一个选择变量最优滞后期的统计量)、施瓦茨(Schwatz )准则(是一个选择变量最优滞后期的统计量)、F 统计量(第3章介绍)的值以及F 统计量取值大于该值的概率。
注意:S.D.和s.e.的区别。
s.e.和SSE 的关系。
根据EViews 输出结果(图1.2),写出OLS 估计式如下:
t y
ˆ= -0.7629 + 0.4043 x t
(1.1)
(-0.6) (12.1) R 2 = 0.91, s. e . = 2.04
其中括号内数字是相应t 统计量的值。
s.e .是回归函数的标准误差,即σˆ=)216(ˆ2
-∑t u 。
R 2是可决系数。
R 2 = 0.91说明上式的拟合情况较好。
y t 变差的91%由变量x t 解释。
检验回归系数显著性的原假设和备择假设是(给定α = 0.05)
H 0:β1 = 0; H 1:β1 ≠ 0
图1.3 残差图
因为t = 12.1 > t 0.05 (14) = 2.15,所以检验结果是拒绝β1 = 0,即认为年木材剩余物和年木材采伐量之间存在回归关系。
上述模型的经济解释是,对于伊春林区每采伐1 m 3木材,将平均产生0.4 m 3的剩余物。
图1.3给出相应的残差图。
Actual 表示y t 的实际观测值,Fitted
表示y t 的拟合值t y
ˆ,Residual 表示残差t u ˆ。
残差图中的两条虚线与中心线的距离表示残差的一个标准差,即s.e .。
通过残差图可以看到,大部分残差值都落在了正、负一个标准差之内。
估计β1的置信区间。
由
t = P {
)
ˆ
(1
11
ˆβββs -≤ t 0.05 (14) } = 0.95
得
1
1ˆββ-≤ t 0.05 (14)
)ˆ(1βs
β1的置信区间是
[1ˆβ
- t 0.05 (14) )ˆ(1βs , 1ˆ
β+ t 0.05 (14) )ˆ(1βs ] [0.4043 - 2.15 ⨯ 0.0334, 0.4043 + 2.15 ⨯ 0.0334]
[0.3325, 0.4761]
以95%的置信度认为,β1的真值范围应在[0.3325, 0.4761 ]范围中。
下面求y t 的点预测和平均木材剩余物产出量的置信区间预测。
假设乌伊岭林业局2000年计划采伐木材20万m 3,求木材剩余物的点预测值。
y
ˆ2000 = - 0.7629 + 0.4043 x 2000
= -0.7629 + 0.4043 ⨯ 20 = 7.3231万m 3
s
2
(E (y ˆ2000)) =
2
ˆσ
(T 1
+ ∑--2
2
)()(x x x x F )
= 4.1453 (161+2606
.3722)25.3320(2
-) = 0.4546
s (E (y ˆ2000)) =4546.0= 0.6742
因为
E (y ˆ2000) = E(0ˆβ+1ˆβx 2000 ) = β0 + β1 x 2000 = E(y 2000)
t = )ˆ()(ˆ200020002000y s y E y
-~ t
(T -2)
则置信度为0.95的2000年平均木材剩余物E(y 2000)的置信区间是
y
ˆ2000 ± t 0.05 (14) s (E (
y
ˆ2000)) = 7.3231 ± 2.15 ⨯ 0.6742
= 5.8736, 8.7726
从而得出预测结果,2000年若采伐木材20万m 3,产生木材剩余物的
点估计值是7.3231万m 3。
平均木材剩余物产出量的置信区间估计是在 [5.8736, 8.7726] 万m 3之间。
从而为恰当安排2000年木材剩余物的加工生产提供依据。
木材剩余物产出量单点的置信区间的计算。
s 2(y
ˆ2000) =
2
ˆσ
(1+T 1
+ ∑--2
2
)()(x x x x F )
= 4.1453 (1+161+2606
.3722)25.3320(2
-) = 4.5999
s (y ˆ2000)
EViews 通过预测程序计算的结果是
,
木材剩余物产出量单点的置信区间的估计结果是
y
ˆ2000 ± t 0.05 (14) s (
y
ˆ2000) = 7.3231 ± 2.15 ⨯ 2.145 = [2.71,11.93]
问题:估计结果中0ˆ
β
没有显著性,去掉截距项 β0可以吗? 答:依据实际意义可知,没有木材采伐量就没有木材剩余物,所以理论上β0是可以取零的。
而有些问题就不可以。
例如家庭消费和收入的关系。
即使家庭收入为零,消费仍然非零。
一般来说,截距项的估计量没有显著性时,也不做剔出处理。
本案例剔出截距项后的估计结果是
t y
ˆ= 0.3853 x t
(28.3) R 2 = 0.91, s. e . = 2.0
点预测值是
y
ˆ2000 = 0.3853 x 2000 = 0.3853 ⨯ 20 = 7.7060
万m 3
案例二:中国国债发行额模型(多元回归,file:b1c4)
首先分析中国国债发行额序列的特征。
1980年国债发行额是43.01亿元(占GDP 的1%),2001年国债发行额是4604亿元(占GDP 的4.8%)。
以当年价格计算,21年间(1980-2001)增长了106倍。
平均年增长率是24.9%。
1000
2000
3000
4000
5000
80
82
84
86
88
90
92
94
96
98
00
DEBT
中国当前正处在社会主义市场经济逐步完善,宏观经济平稳运行的阶段。
国债发行总量(DEBT t ,亿元)应该与经济总规模,财政赤字的多少,每年的还本付息能力有关系。
选择3个解释变量,国内生产总值(百亿元),财政赤字额(亿元),年还本付息额(亿元),根据散点图建立中国国债发行额(DEBT t ,亿元)模型如下(数据见表
2.1):
DEBT t = β0 +β1 GDP t +β2 DEF t +β3 REP AY t + u t 其中GDP t 表示年国内生产总值(百亿元),DEF t 表示年财政赤字额(亿元),REP AY t 表示年还本付息额(亿元)。
用1980-2000年数据得输出结果如下;
变量的相关系数阵:
DEBT t = 4.38 +0.34 GDP t +1.00 DEF t +0.88 REP AY t
(0.2) (2.1) (26.6) (17.2)
R 2 = 0.9986, DW=2.12, T =21, (1980-2000)
预测2001年的国债发行额(DEBT t ,亿元)。
DEBT 2001 = 4608.71 预测误差是 η =
46044604
71.4608-= 0.001
表2.1
obs DEBT DEF GDP REPAY 1980 43.01 68.9 45.178 28.58 1981 121.74 -37.38 48.624 62.89 1982 83.86 17.65 52.947 55.52 1983 79.41 42.57 59.345 42.47 1984 77.34 58.16 71.71 28.9 1985 89.85 -0.57 89.644 39.56 1986 138.25 82.9 102.022 50.17 1987 223.55 62.83 119.625 79.83 1988 270.78 133.97 149.283 76.76 1989 407.97 158.88 169.092 72.37 1990 375.45 146.49 185.479 190.07 1991 461.4 237.14 216.178 246.8 1992 669.68 258.83 266.381 438.57
1993 739.22 293.35 346.344 336.22 1994 1175.25 574.52 467.594 499.36 1995 1549.76 581.52 584.781 882.96 1996 1967.28 529.56 678.846 1355.03 1997 2476.82 582.42 744.626 1918.37 1998 3310.93 922.23 783.452 2352.92 1999 3715.03 1743.59 820.6746 1910.53 2000 4180.1 2491.27 894.422 1579.82 2001 4604 2516.54 959.333 2007.73
案例三:中国铅笔需求预测模型(非线性模型案例,file:nonli6)
中国从上个世纪30年代开始生产铅笔。
1985年全国有22个厂家生产铅笔。
产量居世界首位(33.9亿支),占世界总产量的1/3。
改革开放以后,铅笔生产增长极为迅速。
1979-1983年平均年增长率为8.5%。
铅笔销售量时间序列见图4.21。
1961-1964年的销售量平稳状态是受到了经济收缩的影响。
文革期间销售量出现两次下降,是受到了当时政治因素的影响。
1969-1972年的增长是由于一度中断了的中小学教育逐步恢复的结果。
1977-1978年的增长是由于高考正式恢复的结果。
1981年中国开始生产自动铅笔,对传统铅笔市场冲击很大。
1979-1985年的缓慢增长是受到了自动铅笔上市的影响。
初始确定的影响铅笔销量的因素有全国人口、各类在校人数、设计人员数、居民消费水平、社会总产值、自动铅笔产量、价格因素、原材料供给量、政策因素等。
经过多次筛选、组合和逐步回归分析,最后确定的被解释变量是y t(铅笔年销售量,千万支);解释变量分别是x t1(自动铅笔年产量,百万支);x t2(全国人口数,百万人);x t3(居民年均消费水平,元);x t4(政策变量)。
因政策因素影响铅笔销量出现大幅下降时,政策变量取负值。
例如1967、1968年的x t4值取-2,1966、1969-1971、1974-1977年的x t4值取-1)。
数据见表3.1。
由图3.2知中国自生产自动铅笔起,自动铅笔产量与铅笔销量存在线性关系。
由图3.3知全国人口与铅笔销量存在线性关系。
说明人口越多,对铅笔的需求就越大。
由图3.4知居民年均消费水平与铅笔销量存在近似对数的关系。
散点图说明居民年均消费水平越高,则铅笔销量就越大。
但这种增加随着居民消费水平的增加变得越来越缓慢。
图3.5显示政策变量与铅笔销量也呈线性关系。
50
10015020025030035062
64
66
68
70
72
74
76
78
80
82
84
Y
图3.1 铅笔销售量时间序列(1961-1985)(文件名nonli6)
100200300
400
10
20
30
40
X 1
Y
100
200
300400
600
700
800
900
1000
1100
X 2
Y
图3.2 Y , X1散点图 图3.3 Y , X2散点
图
100
200300
400
100200
300
400
500
X 3
Y
100
200
300400
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
X 4
Y
图3.4 Y , X3散点图 图3.5 Y , X4
散点图
基于上述分析建立的模型形式是
y t = β0 + β1 x t 1 + β2 x t 2 + β3 Ln (x t 3) + β4 x t 4 + u t
(3.1)
y t与x t 3呈非线性关系。
估计结果如下。
yˆ= -907.94 - 2.95x t 1 + 0.31 x t 2 + 170.19 Ln x t 3 + 45.51 x t 4
t
(3.2)
(-6.4) (-3.7) (4.8) (4.4) (12.6)
R 2 = 0.9885, DW = 2.09, F = 429, s.e. = 10.34
上式说明,在上述期间自动铅笔年产量每增加1百万支,平均使铅笔的年销售量减少2950万支。
全国人口数每增加1百万人,平均使铅笔的年销售量增加310万支。
对数的居民年均消费水平每增加1个单位,平均使铅笔的年销售量增加17亿支。
一般性政策负面变动使铅笔的年销售量减少4.551亿支。
当政策出现大的负面变动时,铅笔的年销量会减少9.102亿支。
当y t对所有变量都进行线性回归时(见下式),显然估计结果不如(3.2)式好。
yˆ= -254.26 - 3.29x t1+ 0.42 x t2+ 0.66 x t3+ 40.74 x t4
t
(3.3)
(-12.0) (-3.0) (8.6) (3.5) (11.7)
R 2 = 0.9857, DW = 1.77, F = 346, s.e. = 11.5
表3.1
obs X1 X2 X3 X4 Y 1961 0 658.59 114 0 107.4 1962 0 672.95 117 0 105.8 1963 0 691.72 116 0 105.7 1964 0 704.99 120 0 117.3 1965 0 725.38 125 0 134.1 1966 0 745.42 132 -1 119.7 1967 0 763.68 137 -2 70.6 1968 0 785.34 132 -2 77.3 1969 0 806.71 135 -1 118.9
1970 0 829.92 140 -1 137.8 1971 0 852.29 142 -1 174.6 1972 0 871.77 147 0 223 1973 0 892.11 155 0 228.9 1974 0 908.59 155 -1 161.9 1975 0 924.2 158 -1 192.8 1976 0 937.17 161 -1 198.4 1977 0 949.74 165 -1 208.1 1978 0 962.59 175 0 257.2 1979 0 975.42 197 0 304.3 1980 0.1 987.05 227 0 312.5 1981 11.09 1000.72 249 0 304.1 1982 15.27 1015.41 267 0 310.7 1983 20.45 1024.95 290 0 319 1984 25.98 1033.41 330 0 312.1 1985 33.81 1045.32 407 0 338.6
案例四:市场用煤销售量模型(虚拟变量,file: Dummy1)
我国市场用煤销量的季节性数据(1982-1988,《中国统计年鉴》1987,1989)见下图与表4.1。
由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。
鉴于是季节数据可设三个季节变量如下:
1 (4季度) 1 (3季度)
1 (2季度)
D1= D2=
D 3 =
0 (1, 2, 3季度) 0 (1, 2, 4季度) 0 (1, 3, 4季度)
2500
300035004000450050005500
82
83
84
85
86
87
88
Y
2500
30003500400045005000550082838485868788
Y
2731.03+57.15*T
图4.1 图4.2
以时间t 为解释变量(1982年1季度取t = 1)的煤销售量(y )模型如下:
y = 2431.20 + 49.00 t + 1388.09 D 1 + 201.84 D 2 + 85.00 D 3 (4.1)
(26.04) (10.81) (13.43) (1.96) (0.83)
R 2 = 0.95, DW = 1.2, s.e. = 191.7, F=100.4, T =28, t 0.05 (28-5) = 2.07
由于D 2,D 3的系数没有显著性,说明第2,3季度可以归并入基础类别第1季度。
于是只考虑加入一个虚拟变量D 1,把季节因素分为第四季度和第一、二、三季度两类。
从上式中剔除虚拟变量D 2,D 3,得煤销售量(y )模型如下:
y = 2515.86 + 49.73 t + 1290.91 D 1 (4.2)
(32.03 (10.63) (14.79)
R 2 = 0.94, DW = 1.4, s.e. = 198.7, F = 184.9, T =28, t 0.05 (25) = 2.06
进一步检验斜率是否有变化,在上式中加入变量t D 1,
y = 2509.07 + 50.22 t + 1321.19 D 1 - 1.95 t D 1 (4.3)
(28.24) (9.13) (6.85) (-0.17)
R 2 = 0.94, DW = 1.4, s.e. = 202.8, F = 118.5, T =28, t 0.05 (24) = 2.06 由于回归系数 -1.95所对应的t 值是 -0.17,可见斜率未发生变化。
因此以模型 (2) 作为最后确立的模型。
若不采用虚拟变量,得回归结果如下,
y= 2731.03 + 57.15 t
(4.4)
(11.6) (4.0)
R2 = 0.38, DW = 2.5, s.e. = 608.8, T = 28, t0.05 (26) = 2.06 与(2)式相比,回归式(4)显得很差。
表4.1 全国按季节市场用煤销售量数据(file: Dummy1)
t 12 3 t 12 3 1982.2 2647.2 2 0 0 1 1985.4 4483.2 16 1 0 0 1982.3 2912.7 3 0 1 0 1986.1 2881.8 17 0 0 0
1983.2 2672.1 6 0 0 1 1986.4 4946.8 20 1 0 0 1983.3 2943.6 7 0 1 0 1987.1 3209.0 21 0 0 0 1984.2 2969.5 10 0 0 1 1987.4 5332.3 24 1 0 0 1984.3 3287.5 11 0 1 0 1988.1 3929.8 25 0 0 0
1985.2 3078.8 14 0 0 1 1988.4 4904.2 28 1 0 0 数据来源:《中国统计年鉴》1989。
注:以季节数据D1为例,EViews 命令是D1= @seas(4)。
案例五:农作物产值模型—检验(异方差,file:hete01,hete02)
取1986年中国29个省市自治区农作物种植业产值y t(亿元)和农作物播种面积x t(万亩)数据(见表5.1)研究二者之间的关系。
得估计的线性模型如下,
y t= -5.6610 + 0.0123 x t (5.1)
(12.4) R2 = 0.85, F = 155.0, T = 29
100
200
300
5000
10000
15000
20000
X
Y
图5.1 农作物产值y t 和播种面积x t (file:hete01)
-50
50
5000
10000
15000
20000
X
R ESID
图5.2 残差图(file:hete02)
无论是从y t 和x t 观测值的散点图(见图5.1)还是模型的残差图(见图5.2)都可以发现数据中存在异方差。
(1)用White 方法检验是否存在异方差。
在上式回归的基础上,做White 检验。
得,
注意:输出结果中的概率是指χ2 (2)统计量取值大于8.02的概率为0.018
因为TR2α (2)
(2)用Goldfeld-Quandt方法检验是否存在异方差。
①首先以x t为基准对成对样本数据(y t,x t)按取值大小排序。
②去掉中间7个数据,按x t取值大小分成样本容量各为11的两个子样本。
③用两个子样本各自回归得结果如下,
y t= 2.7202 + 0.0106 x t, (t= 1, …, 11) (5.2)
(5.8) R2 = 0.80, F = 33.8, SSE = 1266,
y t= 5.8892 + 0.0118 x t, (t= 19, …, 29) (5.3)
(3.0) R2= 0.50, F= 9.1, SSE= 14174
F =
)211/(1266)211/(14174--
= 11.2,
因为F
下面克服异方差。
(1)对y t 和x t 同取对数。
得两个新变量Lny t 和Lnx t (见图5.3)。
用Lny t 对Lnx t 回归,得 Lny t = - 4.1801 + 0.9625 Lnx t . (5.4)
(16.9) R 2 = 0.91, F = 285.6, (t = 1, …, 29)
因为TR 2 = 2.58 < χ20.05 (2) = 6.0,所以经White 检验不存在异方差。
12
3
4
5
6
5
6
7
8
9
10
LOG(X )
LOG(Y )
-2
-1
1
2
010
20
30
T
RES2
图 5.3
Ln
y t
和 Ln
x t
图5.4 残差图
去掉中间7个观测值,仍按x t 大小分成两个T = 7的子样本,并回归(结果略),得SSE 1 = 1.17,SSE 2 = 0.65,经Goldfeld-Quandt 检验,有
F = 17.165
.0
= 0.56,
因为0.56小于F 0..05 (9, 9) = 3.18,所以取对数后,模型中不存在递增型异方差(残差见图5.4)。
(2)通过Glejser 法克服异方差。
用 (5.1) 式, y t = -5.6610 + 0.0123 x t , 的残差的绝对值对x t 回归,得
|t u ˆ| = 0.0024 x t
(8.0) R 2 = 0.22
所以,误差项的异方差形式是Var(u t ) = E(u t )2 = |t u ˆ|2 = 5.76⨯10-6 x t
2。
克服异方差的方法是用x t 分别除(5.1) 式两侧,得变换变量y t * = y t / x t ,x t * = 1 / x t 。
用y t * 对x t * 回归(见图5.5),得
y t * = 0.0113 + 0.8239 x t *
(5.5)
(13.8) (0.8) R 2 = 0.63, F = 46.1
0.01
0.02
0.000
0.001
0.002
0.003
0.004
1/X
Y/X
-0.01
0.00
0.01
0102030
T
RES3
图5.5 y t * 和 x t * 图5.6 残差图
注意,回归系数0.8239没有显著性,截距项0.0113却有很强的显著性,而0.0113正是还原后模型的回归系数,所以模型通过检验。
把y t * = y t / x t ,x t * = 1 / x t 代入上式并整理得广义最小二乘估计结果如下:
y t = 0.8239 + 0.0113 x t (5.6)
(0.8) (13.8) R 2 = 0.63, F = 46.1 由式 (5.6) 得到的残差见图5.6。
经检验已不存在异方差。
(5.6) 式中的回归参数具有最佳线性无偏特性。
(5.1) 式是最小二乘估计结果。
比较(5.1)和 (5.6) 式, y t =
-5.6610
+
0.0123
x t
(5.1)
虽然0.0113和0.0123相差不多,但从估计原理分析,0.0113有比0.0123更大的可能性接近回归参数真值。
经济含义是平均每一万亩耕地的农业产出值是113万元人民币。
通过这个例子说明,在实际中直接用解释变量除原变量的变换方法克服异方差是可行的。
表5.1
obs X Y 1 907.5 16.31 2 873.2 17.14 3 13159.2 125.24 4 5928.1 42.24 5
6834.4
40.28
6 5495.5 84.47
7 6055.2 70.7
8 12694.6 101.67
9 1018.5 16.83
10 12770.9 211.51
11 6542.7 101
12 12244.3 155.87
13 3601.5 49.72
14 8158.1 69.7
15 16564.5 255.92
16 17729.2 183.65
17 11061.5 146.79
18 11304.7 129.63
19 9166.2 154.28
20 6821.7 61.24
21 17779.6 206.5
22 4701.3 44.37
23 6036.1 51.79
24 316.5 3.53
25 7016.5 59.45
26 5252.5 37.29
27 761.7 6.33
28 1235.2 10.07 29
4275.1
44.78
案例六:中国宏观消费分析(自相关,file:china )
按照我国现行国民经济核算体系,国内生产总值(按支出法计算)是由最终消费、资本形成总额和货物与服务的净出口之和三部分组成。
前两部分占绝大多数。
其中最终消费又分为居民消费和政府消费两类。
而居民消费又可分为农村居民消费和城镇居民消费。
在这种核算体系下,居民消费包括居民个人日常生活中衣、食、住、用等物质消费以及在文化生活服务性支出中属于物质产品的消费。
政府消费包括国家机关、国防、治安、文教、卫生、科研事业单位,经济建设部门的事业单位,人民团体等非生产机构使用的燃料、电力、办公用品、图书、设备等物质消费。
国内生产总值中最终消费与资本形成总额的比例关系,即旧核算体系下国民收入中消费与积累的比例关系是国民经济正常运行的最基本的比例关系。
如果这一比例关系发生严重失调,最终会成为制约经济正常运行的严重障碍。
下面分析中国的消费问题。
为消除物价变动因素以及异方差的影响,以下分析所用的数据均为不变价格数据(1952 = 1)以及分别取自然对数后的数据,见附表。
图1.1给出不变价格的国内生产总值与消费曲线,图1.2和图1.3分别给出国内生产总值与消费的年增长率曲线。
5000
10000
15000
20000
25000
55
60
65
70
75
80
85
90
95
00
CONSP
GDPP
-0.3
-0.2-0.1
0.00.10.20.3
55
606570758085909500
growth of consumption
growth of GDP
图1.1 国内生产总值与消费(不变价格)曲线 图1.2 国
内生产总值年增长率曲线 由图1.1、1.2可以看出国内生产总值与消费的增长都很快。
国内生产总值曲线的波动幅度相比较大。
消费曲线的波动幅度相对较小。
这与宏观消费行为具有“惯性”有关。
他既不可能随时间突然大幅增
加,也不可能随时间突然大幅减少。
-0.3
-0.2-0.10.00.10.20.3
growth rate of GDP
-0.3
-0.2-0.10.00.10.20.3
growth rate of consumption
图1.3 国内生产总值年增长率曲线 图1.4 消费额年增长率曲线
首先结合图1.3对国内生产总值序列的增长率变化做进一步分析。
1952-1957年国民收入呈较稳步发展。
以不变价格计算,平均年增长率为7.97%。
1958年开始的大跃进使经济发展速度突然加快。
在计划经济体制下,这种人为的提高经济发展速度超出了国家物质基础所能承受的限度,所以在维持了短短两年超高速增长(1958年的年增长率为16.9%,1959年的年增长率为11.4%)之后,经济发展便出现了大倒退。
1960年几乎为零增长。
1961和1962年连续2年出现建国以来从未有过的负增长(分别为-27.2% 和 -11.1%)。
由于国家及时采取了一系列经济调整措施,1963-1966年国民经济迅速得到恢复,并出现持续高增长态势。
上述4年的增长率分别为17.8%, 15.8%, 16.1% 和12.5%。
1966年开始的文化革命使中国经济进入一个很不稳定的发展阶段。
1967和1968年国民经济再度出现负增长,随后经济发展出现“振荡”现象。
自1978年实行改革开放政策以来,在由计划经济向市场经济转变过程中,经济发展突飞猛进。
1952-1978年国民收入年平均增长率为5.76%。
1978-2002年的年平均增长率为9.15%。
后一时期是前一时期的1.6倍(不变价格)。
年增长率的标准差却比前一时期减小了一倍多。
说明经济波动减小,宏观管理更加成熟。
在后一时期里,经济增长速度如此之高,持续时间如此之长,发展趋势如此之稳定,在我国的经济发展史上是没有先例的。
0.4
0.5
0.6
0.7
0.8
0.9
RATIO
HOURATIO
0.75
0.80
0.85
0.90
0.95
household/total
图1.5 消费率、居民消费率曲线 图1.6 居民消费
与总消费比的变化曲线 下面分析消费率(消费额 / 国内生产总值,1952-2002)序列的变化。
见图1.5,总的来说变化幅度较大。
(1)从趋势看,中国宏观消费比率、居民消费率值的变化是逐年下降。
消费比率数据对时间t (1952 =1)的回归结果如下:
ratio = 0.7581 – 0.0036t
(62.9) (-8.8) R 2 = 0.61 (1952-2002) 51年间消费比率值平均每年减少0.0036。
居民消费率数据对时间t (1952 =1)的回归结果如下:
houratio = 0.7117 – 0.0049 t
(59.4) (-12.1) R 2 = 0.75 (1952-2002)
51年间居民消费率平均每年减少0.0049。
居民消费率下降快,是由于居民消费对总消费比的下降造成的。
(2)以1978年为界,改革开放之前(1949~1978)消费比率曲线波动大,改革开放之后(1979~2002)消费比率曲线波动小(见图1.5和表1)。
1952~1978年宏观消费比率值的均值是0.7057,标准差是0.0656。
1979-2002年宏观消费比值的均值是0.6206。
标准差是0.0324。
改革开放以后宏观消费比率值平均比改革开放前下降0.085。
随着时间的推移,消费比率的均值减小,标准差减小。
改革开放之后标准差减小说明宏观消费比率值的波动在减小,中央政府调控宏观经济的能力逐步在提高。
(3)宏观消费比率的最小值是0.5660,最大值是0.8379。
都发生在上世纪50年代末和60年代初的经济困难时期。
最小值0.5660发生在1959年是由于基本建设投资的极度扩张造成的(1958和1959年基本建设投资的年增长率分别是87.7%和30.0%)。
最大值是0.8379发生在1962年是由于执行经济调整政策,首先解决人民生活所致。
(4)中国宏观消费比率值自1993年起跌破0.60大关。
1995年达到最低点0.575。
近10年来,宏观消费比率值基本上在0.60以下
徘徊,平均值是0.5876。
在中央政府努力扩大消费的政策下虽然宏观消费比率值在1999和2000年回升至0.60以上,但2001和2002年又跌落到0.60以下。
当然这并不意味着中国宏观消费绝对值的减少。
相反,宏观消费总量一直在快速提高。
因为固定资产投资以更快的速度增长,所以导致宏观消费比率值偏低。
表2 中国消费比率数据的特征数
特征数名称
消费比率的特征
数(1952~1978)
消费比率的特征数
(1979~2002)
均值0.7057 0.6206
标准差0.0656 0.0324
极大值0.8379 0.6751
极小值0.5660 0.5749
变异系数0.0930 0.0522
样本容量27 24
注:(1)消费比率= 中国宏观消费/ GDP。
(2)1952~1999年消费和GDP数据摘自《新中国五十年统计资料汇编》,1999
中国统计出版社。
2000~2002年消费和GDP数据摘自《中国统计年鉴》,
2003,中国统计出版社。
(3)消费比率数据的特征数用消费比率数据计算。
(5)图1.6给出居民消费占总消费的比率曲线。
该比值从0.91直线下降至0.76。
这一方面反映出政府消费越削越增的过程,同时也反映出居民消费占总消费的比率变得更小。
中国宏观消费比率的国际比较
共选择6个工业发达国家和4个发展中国家和地区的GDP和宏观消费数据经计算后,与中国进行宏观消费比率的对比。
6个工业发达国家是英国、美国、法国、意大利、加拿大和日本(GDP和消费均为年度数据,德国由于数据不全未选)。
4个发展中国家和地区是菲律宾、墨西哥、香港(GDP和消费均为季节数据)和韩国(GDP 和消费为年度数据)。
上述10个国家和地区的宏观消费比率曲线与中国宏观消费比率曲线的对比分别见图1.7和图1.8。
11个国家和地区宏观消费比数据的5个特征数见表2。
结合图1.7和图1.8以及表2,分析如下:
图1.7 美国、英国、加拿大、法国、意大利、日本与中国的消费比
率曲线比较
图1.8 墨西哥、香港、菲律宾、韩国与中国大陆的消费比率曲线比
较
(1)在这11个国家和地区中,无论是和工业发达国家还是发展中国家和地区相比,中国的宏观消费比率是最低的。
(2)年平均消费比率在0.7以上的国家按消费比率值大小顺序排列是英国、菲律宾、美国、法国、意大利、加拿大和墨西哥。
年平均消费比率在0.6~0.7之间的国家是日本、香港、韩国和中国。
显然,这种差别与文化传统有着密切的联系。
前7个国家都是具有西方文化色彩的国家;而后4个国家都是具有东方文化色彩的国家。
(3)从消费比率的标准差和变异系数来看,排除菲律宾、墨西哥和香港(这3个国家的数据为季节数据,他们的方差与其他国家无可比性),中国和韩国是消费比率值变化最大的国家。
中国消费比率标准差是变化最小的法国和意大利的3倍多。
在消费比率低于0.7的国家与地区中,日本和韩国的消费比率曲线是先降后升;香港呈震荡
变化特征;而中国则是呈逐年下降趋势。
(4)中国的消费比率值为什么呈一路下滑趋势?主要原因是全国固定资产投资增长率(2002年是13.1%)多年来远远高于消费的增长率(2002年是5.8%),从而导致消费比率值连年下滑。
(5)中国目前的宏观消费比率这样低好不好?从长期看不好,应该改变消费与GDP之间的这种低比例关系。
原因有四。
①宏观消费和固定资产投资是维持经济高增长的两个最重要因素。
在经济高增长条件下,消费比率偏低是靠连年的固定资产投资高增长率维持的。
而连年的固定资产投资高增长率必然带来人力、物力和财力的瓶颈现象。
中国近年来之所以没有出现像大跃进时期的物力和财力的瓶颈现象,主要是依靠外国直接投资和借外债支撑的。
但长期借外债后,还款将成为一个沉重负担,同时经济长期超高速发展,高素质人才的缺乏将变得越来越突出。
这些因素制约固定资产投资的超高速增长将随着时间的延长越来越突出。
②若没有一个合理的消费比率做支撑,高投资比率将得不到延续,最终导致产品相对过剩和积压,经济发展速度下降。
③提高消费比率,维持消费的高增长同样能带来经济的高增长。
因为提高消费比率主要刺激的是第三产业的发展。
第三产业的发展在促进经济增长的同时,还可以扩大劳动力的就业。
为人民政府解决待业问题减轻压力。
目前在这方面还有很大的潜力。
以2002年为例,全国第三产业产值占GDP的比例只有0.34。
④以经济建设为中心,不断提高中国人民的物质与精神生活水平是我们党和国家的工作重心,宏观消费比率长期保持低位不是我们的目的。
基于我国54年经济发展经验以及目前的经济发展规模,把年消费率平均值控制在0.65-0.70是比较合理的模式。
下面通过建立宏观消费计量经济模型进一步分析我国消费与国民收入的定量关系。
(以下所用数据(1952-2002,file:China)均以不变价格(1952 = 1)计算。
)
1952-2002年国内生产总值与消费额散点图见图1.10。
说明消费与国内生产总值之间存在高度的线性关系。
(1)OLS估计
用CP t表示消费额(不变价格),GDP t表示国内生产总值(不变价格),用1952-2002年数据得消费函数的OLS估计结果如下:
CP= 164.0124 + 0.5919GDP t t
(1.1)
(5.2) (159.9)
R2 = 0.998, DW = 0.67, s.e. = 167.45
2000
40006000
800010000120001400016000
500010000150002000025000
G D P
C O N S
-600
-400
-200
0200400600800RESID
图 1.10 国内生产总值与消费额散点图 图
1.11 (1.1)式残差图
2000
4000
6000
8000
2000
4000
6000
8000
10000
GGDP P
GCONS P
-400
-200
200
400
600
55
606570758085909500
RESID
图 1.12 广义差分变量散点图 图
1.13 (1.4)式残差图
(2)GLS 估计
以上模型的DW 值很小,严格地说模型存在自相关(见图1.11)。
为消除自相关(ρ = 0.67),对变量进行广义差分。
定义 GCP t = CP t - 0.665 CP t -1 (1.2)
GGDP t = GDP t - 0.665 GDP t -1 (1.3)
得估计的回归模型为,
∧t GDCP = 45.4845 +
0.5998 GGDP t
(1.4)
(1.8) (80.4)
R 2 = 0.9926, DW = 1.63, s.e. = 131.4 上模型中不存在自相关。
消费函数的GLS 估计结果是 ∧t CP = 135.7746 + 0.5998GDP t (1.5)
(3)时间序列模型估计
消费函数的时间序列模型估计结果是
CP t = 129.0977 + 0.6018GDP t + u t , u t = 0.7370 u t -1 + v t (1.6)
(1.28) (54.8) (5.4) R 2 = 0.999, DW = 1.7, s.e. = 132.3 则长期关系是 CP t = 129.0977 + 0.6018GDP t (1.7)
综上消费与国内生产总值的真实比值是0.60。
下面研究消费(不变价格)对国内生产总值的弹性系数。
对消费和国内生产总值取自然对数并回归,得如下结果,
∧
t LnCP = 0.1932 + 0.9256 LnGDP t (1.8)
(3.0) (118.8)
R 2 = 0.9965, DW = 0.77, s.e. = 0.0584
对变量进行广义差分。
定义 GLnCP t = LnCP t - 0.615 LnCP t -1 (1.9)
GLnGDP t = LnGDP t - 0.615 LnGDP t -1 (1.10)
得估计结果如下: G ∧
t LnCP = 0.0814 + 0.9234 G LnGDP t
(1.11)
(1.6) (57.6)
R 2 = 0.9857, DW = 1.34, s.e. = 0.047 原模型(1.8)的最小二乘估计结果是
∧
t LnCP = 0.2114 + 0.9234 LnGDP t (1.12)
综上消费对国内生产总值的真实弹性是0.9234。
-0.3
-0.2
-0.1
0.0
0.1
0.2
RESID
-0.2
-0.1
0.0
0.10.2
RESID
图1.14 (1.8)式残差图 图1.15 (1.11)式残差图
附表
obs
GDPP
CONSP
1952 692.2000 546.3000 1953 806.8749 623.2173 1954 830.0418 618.1604 1955 874.6596 675.7585 1956 967.5612 722.8174 1957 1015.601 752.4610 1958 1187.139 783.8872 1959 1322.374 748.5224 1960 1332.762 824.2267 1961 969.8460 756.8176 1962 861.8710 722.1577 1963 1006.745 789.6848 1964 1165.533 871.9268 1965 1353.229 962.3438 1966 1522.296 1042.439 1967 1433.340 1070.745 1968 1433.103 1064.406 1969 1575.803 1153.118 1970 1876.370 1241.023 1971 2049.667 1334.661 1972 2107.026 1411.926 1973 2278.330 1494.621
1974 2324.880 1536.168 1975 2500.794 1599.783 1976 2508.359 1664.324 1977 2621.917 1704.163 1978 2966.196 1842.026 1979 3286.162 2112.907 1980 3463.821 2264.996 1981 3643.461 2459.823 1982 4003.213 2653.080 1983 4365.876 2888.765 1984 5006.125 3280.282 1985 5645.932 3707.188 **** ****.092 3964.204 1987 6653.794 4207.294 1988 7007.277 4460.610 1989 6660.271 4269.959 1990 7257.492 4502.585 1991 8192.661 5060.990 1992 9446.424 5826.347 1993 11131.80 6511.858 1994 12489.92 7215.488 1995 13512.65 7767.802
1996 14874.10 8708.014
1997 16173.81 9411.197
1998 17702.95 10287.88
1999 18901.54 11368.09
2000 20743.52 12678.88
2001 23075.66 13794.27
2002 24275.01 15148.47
案例七:中国私人轿车拥有量决定因素分析(多重共线性特征,file:nonli14)
1985-2002年中国私人轿车拥有量以年增长率23%,年均增长55万辆的速度飞速增长。
1000
Y
800
600
400
200
868890929496980002
考虑到目前农村家庭购买私人轿车的现象还很少,在建立中国私人轿车拥有量模型时,主要考虑如下因素:(1)城镇居民家庭人均可支配收入;(2)城镇总人口;(3)轿车产量;(4)公路交通完善程度;(5)轿车价格。
“城镇居民家庭人均可支配收入”、“城镇总人口数”和“轿车产量”可以直接从统计年鉴上获得。
“公路交通完善程度”用全国公路里程度量,也可以从统计年鉴上获得。
由于国产轿车价格与进口轿车价格差距较大,而且轿车种类很多,做分种类的轿车销售价格与销售量统计非常困难,所以因素“轿车价格”暂且略去不用。
定义变量名如下:
Y:中国私人轿车拥有量(万辆)
X1:城镇居民家庭人均可支配收入(元),。