财政收入多元化线性回归分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Value
Std.Residual -1.261
2.750
0.000
0.874
18
说明:a. Dependent Variable:Y 运行结果显示:软件将四个自变量一次性地、不加选择地加入到回归方程中,
表 8—7
方差分析表(ANOVA b )
Model
Sum of df
Mean
Squares
Square
1
3.7E+07 4
9161986
Regression
Residual 250675.9 13
19282.76
Total
3.7E+07 17
说明:a.Predictors/Constant),X4 X1 X3 X2
变量顺序和样本数;
表 8-1
T 年份
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995
财政收入等五项指标观测数据
Y 财政收入 (亿元)
X 国民生产总 X 税收

(亿元)
X 其他收入 (亿元)
Model
R
R Square Adjusted Std.Error of Durbin-Watson
R Square the
Estimate
1
0.997
0.993
0.991
138.8624 2.313
说明:a.Predictors:(Constant),X4,X1,X3,X2
b.Dependent Variable:Y
二 案例数据的描述 本案例的样本数据来自中国统计出版社出版的有关年份的《中国统计年鉴》 和《改革开放十七年的中国地区经济》,数据时限为 1978-1995 年。案例数据如 表 8-1。 表 8-1 的数据已经制成数据文件存入磁盘。该文件数据在磁盘中的位置是: 人数多少 a:\case08\data1.txt 数据的排列格式及其变量名与表 8-1 相同。 本案例的数据可以使用 TSP 软件,SPSS 软件和 SAS 软件进行分析。我门建 议使用 SPSS 软件进行分析。用 SPSS forWIN.7.5 软件读取本案例数据的基本步 骤是: 第一,用 OPEN 命令打开软件中的数据文件 a:\case08\data1.txt,杂 SPSS 句 法编辑器(SPSS Synax Editor)中观察文件中的数据结构,包括变量名,变量数,
图形显示变量之间的关系基本上是线性关系,于是可据此建立多元线性回归 方程。
4.求解回归方程。 SPSS 软件中的线性回归分析功能中提供了四种回归分析方法,分别为: ENTER( 一 次 进 入 法 ) 、 STEPWISE( 逐 步 回 归 法 ) 、 FORWARD( 向 前 进 入 法 ) 及 BACKWARD(向后剔除法)。四种方法虽然原理不尽相同,但殊途同归,得出 的结论一般都会一致。我们首先用最简单的全部变量一次进入法(ENTER)对
b.Dependent Variable:Y
F 475.139
Sig 0.000
表 8—7 时回归模型的方差分析表、F 检验值和显著性水平。回归方程的参
数(非标准化方程和标准化方程的参数)、t 检验值和显著性水平见表 8—8。
表 8—8
回归方程参数及检验表(Coefficients)
M o d e l Unstandardized
1.101
0.628
0.058
1.755
0.103
X4
-3.7E-03
0.007
-0.025
-0.534
说明:a. Dependent Variable:Y
表 8-9 是回归模型预测值及其残差的统计数据。
0.602
表 8-9
残差分析表(Residuals Statistics a )
Minimum Maximum Mean
案例 08
财政收入多元化线性回归分析
一、案例简析 本案例来自作者主持,参与的财政部“九五”科研课题《我国财政收支决定 因素的统计分析》(该课题现已通过接题鉴定),作者从中选取了财政收入线性回 归分析问题进行提炼,归纳,形成了本案例。我们试图通过对财政收入及其影响 因素问题的研究,从教学上来说明 如何利用多元回归分析这一常用的统计方法,解决现实问题的实证分析过程。 财政收入是指一个国家政府凭借政府的特殊权力,按照有关的法律和法规在 一定时期内(一般为一年)取得的各种形式收入的总和,包括税收,企事业收入, 国家能源交通重点建设基金收入,债务收入,规费收入,罚没收入等。财政收入 水平高低是反映一国经济实力的重要标志。 在一定时期内,财政收入规模大小受许多因素的影响,如国民生产总值大小, 社会从业人数多少,税收规模大小,税率高低等。在本案例中,我们认为,一个 国家税收水平高低,国民生产总值规模的大小,社会从业人数多少,其他收入的 多少,是决定一个国家一定时期内财政收入规模的主要影响因素。
18
18
18
18
X4 18
18
18
18
18
用一次进入法各变量的进入次序如表 8—5 所示,即 X4、X1、X3 和 X2。 表 8—5 一次进入法变量进入次序(Variables Entered/Removed )
Model
Variables Entered Variables Removed Method
样本数据进行回归分析,得出的分析结果如下(见表 8—3):
表 8—3
回归方程变量基本信息(未标准化)(Descriptive Statistics)
Mean
Std.Deviation
N
Y
2559.13
1473.26
18
X1
16881.37
15469.46
18
X2
2254.48
1656.49
18
X3
Standardized t
Sig
Coefficients
coefficients
B
Std.Error Beta
(Constant) 767.775
241.368
3.181
0.007
X1
5.43E-02
0.013
0.570
4.109
0.001
X2
0.368
0.135
0.141
2.718
0.018
X3
0.985
0.612
.0605
Correlation
0.992
1.000
0.973
0.579
0.553
X1
0.985
0.973
1.000
0.576
0.677
X2 0.612
0.579
0.576
1.000
0.602
X3 0.605
0.553
0.677
0.602
1.000
X4
Sig.
Y 0.000
0.000
(亿元)
1132.62
3624.10
519.28
40.99
1146.38
4038.20
537.82
113.53
1159.93
4517.80
571.70
152.99
1175.79
4860.30
629.89
192.22
1212.33
5301.80
700.02
215.84
1866.95
5957.10
755.59
280.18
6242.20
57277.30
6038.04
369.19
X 社会从业 人数 (万人) 40152 40581 42361 43280 44706 46004 47597 79873 51282 52783 54334 55329 56740 88360 59482 60220 61470 62388
3.对原始数据中的变量进行趋势分析。鉴于变量自身水平和计量单位等差 异,要先对数据进行标准化处理,本案例中取变量的自然对数进行标准化。以 X 轴表示时间、Y 轴表示财政收入等标准化后的变量,在 SPSS 软件运行中可知, 其趋向基本是一致的,只是其他收入(X3)曲线波动较大,但因其值相对较小, 权且保留,见图 8—1。
五 本案例的解析过程及参照结果
1.收集有关数据.可根据表 8-1 数据直接录入,也可以从数据文件中读取原始 数据文件 a:/case08/data1>txt.
2 . 对 样 本 数 据 进 行 初 步 的 描 述 统 计 分 析 . 具 体 可 使 用 SPSS 软 件 中 STATISTICS 功能中 SUMMARIZE 菜单下的 DESCRIPTIVES 选项进行分析.其运 算结果如下(见表 8-2):
217.80
77.68
X
18
40152.00 79873.00
53163.44
10007.39
Y
18
1132.62 6242.20
2559.13
1473.26
Valid
18
N(listwise)
从描述统计量中并不能清楚地看到变两间的关系,需进行进一步的分析.但是 统计量表明,五个变量的取值范围差别较大,因此在下面的分析过程中要考虑对变 量进行标准化处理。
0.000
0.003
0.004
(1-tailed)
0.000
0.000
0.000
0.006
0.009
X1
0.003
0.006
0.006
来自百度文库
0.006
0.001
X2 0.004
0.009
0.001
0.004
0.004
X3
X4
N
Y 18
18
18
18
18
X1 18
18
18
18
18
X2 18
18
18
18
18
X3 18
1
X4,X1,X3,X
Enter
说明:a.All Requested Variables Entered
b.Dependent Variable:Y 表 8—6 是回归模型的决定系数、估计值的标准误差和 Durbin-Watson 检验值。 表 8—6 模型拟和效果分析表(Model Summary )
217.80
77.68
18
X4
53163.44
10007.39
18
表 8—3 是五个变量的三个描述统计信息,包括均值、标准离差和样本数。表 8
—4 是五个变量之间的皮尔逊相关系数、单尾显著性水平和样本数。
表 8—4
相关分析表(Correlations)
Y
X1
X2
X3
X4
Pearson
Y 1.000
0.992
Std.
N
deviation
Predicted 1054.031 6276.457 2559.132 1468.251 18
Value
Residual
-175.1748 381.9245 6.32E-14 121.4316 18
Std.Perdicted -1.025
2.532
0.000
1.000
18
四 组织本案例教学的一些建议 1.在进行本案例教学前,应先将本案例所涉及的统计理论和方法作义介绍, 尤其是对回归方程的显著性检验(F 检验),回归系数显著性检验和 D.W 检验要给 以详细讲述. 2.结合样本数据的时间序列土,启发学生就建立经济模型的形式进行分析. 如旧本案例的资料而言,是建立线性回归模型还是建立非线性回归模型?为什莫 要建立线性模型?最好通过图形来接解释说明. 3.本案例已在机房讲授,可以一边上机,以便演示整个回归分析和汴梁筛选的 过程,教学效果会更好.
第二,用 READ ASCII DATA(读文本数据)命令以自由格式读取本案例的数据 文件,并对每一变量进行定义,否则,读入后的数据结构会发生混乱,无法进行分析. 还需注意的是:说句文件中包含了六个变量名,即 T,Y,X,X,X,X,而变量名本身是字 符不是数值,因而不能直接进行运算.处理方法是:读入文件后,把第一个样本继第
一行的变量删去,即可进行分析. 第三,用其它软件读取本案例数据的程序和思路参照以上程序进行.
三 案例所涉及的统计理论和统计方法 本案例主要涉及的理论和方法包括:多元线性回归分析建模方法,多元线性回 归方程的统计检验,回归方程的评价与预测方法,非线性统计方法及其他统计建模 方法.具体方法的原理与说明倾向间隔终于回归分析相关的统计学教材.
16917.80
2727.40
179.41
2937.10
18598.40
2821.86
299.53
3149.48
21662.50
2990.17
240.10
3483.87
26651.90
3296.91
295.15
4348.95
34650.50
4255.30
191.04
5218.10
46532.90
5126.88
描述统计量表(Discriptive Statistics) 标 8-2
N
Miximum Maximum Mean
Std.Deviation
X
18
3624.10 57277.30
16881.37
15469.46
X
18
519.28
6038.04
2254.48
1656.49
X
18
40.99
369.19
257.84
1642.86
7206.70
947.35
296.29
2004.82
8989.10
2040.79
280.51
2122.01
10201.40
2090.73
156.95
2199.35
11954.50
2140.36
212.38
2357.24
14922.30
2390.47
176.86
2664.90
相关文档
最新文档