第8章 回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

电子工业出版社
8.2线性回归分析
8.2.2 SPSS实例分析
【例8-1】现有1992年-2006年国家财政收入和国内生产总值的 数据如下表所示,请研究国家财政收入和国内生产总值之间的 线性关系。
年份 1992 1993 1994 1995 1996 1997 1998 1999 财政收入 国内生产总值 (单位:亿元) (单位:亿元) 26923.5 35333.9 48197.9 60793.7 71176.6 78973.0 84402.3 89677.1 3483.37 4348.95 5218.10 6242.20 7407.99 8651.14 9875.95 11444.08 年份 2000 2001 2002 2003 2004 2005 2006 财政收入 国内生产总值 (单位:亿元) (单位:亿元) 99214.6 109655.2 120332.7 135822.8 159878.3 183867.9 210871.0 13395.23 16386.04 18903.64 21715.25 26396.47 31649.29 38760.20
6
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.2线性回归分析
(2) 统计原理
一元回归方程和多元回归方程
E( y) 0 1 x
E ( y) 0 1x1 2 x2
p xp
一元线性和多元线性回归分析的核心任务就是估计其中的参 数。
7
SPSS 23(中文版)统计分析实用教程(第2版)
11
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.2 线性回归分析
方差分析表
模型 1 回归 残差 总计 a. 因变量:财政收入 b. 预测变量:(常量),国内生产总值 平方和 1557492999.819 34187286.770 1591680286.589 自由度 1 13 14 均方 1557492999.819 2629791.290 F 592.250 显著性 .000b
10
ቤተ መጻሕፍቲ ባይዱ
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.2 线性回归分析
第5步 主要结果及分析: 变量输入和移去表
模型 1 输入的变量 国内生产总值 移去的变量 . 方法 输入
表中显示回归模型编号、进入模 型的变量、移出模型的变量和变 量的筛选方法。可以看出,进入 模型的自变量为“国内生产总 值” 。
1981
1982 1983 1984 1985
7.8
10.3 13.2 20 33.1
4860.3
5301.8 5957.4 7206.7 8989.1
1992
1993 1994 1995 1996
378
525 630 683 776
26651.9
34560.5 46670 57494.9 66850.5
16
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.3 曲线回归分析
8.3.2 SPSS实例分析
【例8-3】 表8.16是1989~2001年国家保费收入与国内生产总值的数据, 试研究保费收入与国内生产总值的关系。
年度 1980 保费收入 4.6 国民生产总值 4517.8 年度 1991 保费收入 239.7 国民生产总值 21662.5
表中显示回归模型的常数项、非标准化的回归系数B值及其标准误差、标 准化的回归系数值、统计量t值以及显著性水平(Sig.)。从表中可看出, 回归模型的常数项为-4993.281,自变量“国内生产总值”的回归系数为 0.197。因此,可以得出回归方程:财政收入=-4993.281 + 0.197 × 国内生 产总值。 回归系数的显著性水平为0.000,明显小于0.05,故应拒绝T检验的原假设, 这也说明了回归系数的显著性,说明建立线性模型是恰当的。
15
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.3 曲线回归分析 8.3.1 基本概念及统计原理
(1) 统计原理 在曲线估计中,有很多的数学模型,选用哪一种形式的回归 方程才能最好地表示出一种曲线的关系往往不是一个简单的问 题,可以用数学方程来表示的各种曲线的数目几乎是没有限量 的。在可能的方程之间,以吻合度而论,也许存在着许多吻合 得同样好的曲线方程。因此,在对曲线的形式的选择上,对采 取什么形式需要有一定的理论,这些理论是由问题本质决定的 。 (3) 分析步骤 首先,在不能明确究竟哪种模型更接近样本数据时,可在上 述多种可选择的模型中选择几种模型; 其次,SPSS自动完成模型参数的估计,并输出回归方程显著 性检验的F值和概率P值、决定系数R2等统计量; 最后,以判定系数为主要依据选择其中的最优模型,并进行 预测分析等。
第5步 利用回归方程进行预测。
4
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
主要内容
8.1 回归分析简介 8.2 线性回归分析 8.3 曲线回归分析 8.4非线性回归分析 8.4 二元Logistic回归分析
5
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
电子工业出版社
8.1 回归分析简介
(1)确定性关系与非确定性关系
变量与变量之间的关系分为确定性关系和非确定性关系, 函数表达确定性关系。研究变量间的非确定性关系,构造变量 间经验公式的数理统计方法称为回归分析。
(2)回归分析基本概念
回归分析是指通过提供变量之间的数学表达式来定量描述 变量间相关关系的数学过程,这一数学表达式通常称为经验公 式。我们不仅可以利用概率统计知识,对这个经验公式的有效 性进行判定,同时还可以利用这个经验公式,根据自变量的取 值预测因变量的取值。如果是多个因素作为自变量的时候,还 可以通过因素分析,找出哪些自变量对因变量的影响是显著的 ,哪些是不显著的。
a. 已输入所有请求的变量。 b. 因变量: 财政收入。
模型综述表
模型 1 R R方 调整 R 方 标准估计的误差 .977 1621.66312
.989a .979
a. 预测变量:(常量),国内生产总值。b. 因变量: 财政收入。
R=0.989,说明自变量与因变 量之间的相关性很强。R方 (R2) =0.979,说明自变量 “国内生产总值”可以解释 因变量“财政收入”的97.9% 的差异性。
(1) 基本概念
• 曲线回归(曲线拟合、曲线估计)是研究一个自变量和一个 因变量之间非线性关系的一种方法。指选定一种用方程表达 的曲线,使得实际数据与理论数据之间的差异尽可能小。如 果曲线选择得好,那么可以揭示因变量与自变量的内在关系 ,并对因变量的预测有一定意义。 • 在曲线回归中,需要解决两个问题:一是选用哪种理论模型 ,即用哪种方程来拟合观测值;二是当模型确定后,如何选 择合适的参数,使得理论数据和实际数据的差异最小。
表中显示因变量的方差来源、方差平方和、自由度、均方、F检验统 计量的观测值和显著性水平。方差来源有回归、残差。从表中可以看 出,F统计量的观测值为592.25,显著性概率为0.000,即检验假设 “H0:回归系数B = 0”成立的概率为0.000,从而应拒绝原假设,说明 因变量和自变量的线性关系是非常显著的,可建立线性模型。
12
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.2 线性回归分析
回归系数表
未标准化系数 模型 1 (常量) 国内生产总值 a. 因变量:财政收入 B 4993.281 .197 标准误差 919.356 .008 .989 标准化系数 Beta t 5.431 24.336 显著性 .000 .000
76967.2 80579.4 88228.1 94346.4
17
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.3 曲线回归分析
第1步 分析:先用散点图的形式进行分析,看究竟是否具有一 元线性关系,如果具有一元线性关系,则用一元线性回归分析, 否则采用曲线估计求解。 第2步 数据组织:定义为三个变量,分别是“year”(年度)、 “y”(保费收入)和“x”(国内生产总值),输入数据并保存。 第3步 作散点图初步判定变量的分布趋势:
8.2线性回归分析 8.2.1 基本概念及统计原理
1.基本概念
线性回归假设因变量与自变量之间为线性关系,用一定的 线性回归模型来拟合因变量和自变量的数据,并通过确定模型 参数来得到回归方程。根据自变量的多少,线性回归可有不同 的划分。当自变量只有一个时,称为一元线性回归,当自变量 有多个时,称为多元线性回归。
保费收入y随国内生产总值 x的提高而逐渐提高,而且 当国内生产总值达到一定 水平后,保费收入的增幅 更加明显。因此用线性回 归模型表示x,y的关系是 不恰当的。于是应找拟合 效果好的模型。
18
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.3 曲线回归分析
第4步 进行曲线估计:依次选择菜单“分析→回归→曲线估计”
3
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.1 回归分析简介 (3)回归分析的一般步骤
第1步 确定回归方程中的因变量和自变量。 第2步 确定回归模型。 第3步 建立回归方程。 第4步 对回归方程进行各种检验。
拟合优度检验 回归方程的显著性检验 回归系数的显著性检验
1986
1987 1988 1989 1990
45.8
71.04 109.5 142.6 178.5
10201.4
11954.5 14922.3 16917.8 18598.4
1997
1998 1999 2000 2001
1080
1247.3 1393.22 1595.9 2109.36
73142.7
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
第八章
回归分析
1
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
主要内容
8.1 回归分析简介 8.2 线性回归分析 8.3 曲线回归分析 8.4 非线性回归分析 8.5 二元Logistic回归分析
2
SPSS 23(中文版)统计分析实用教程(第2版)
13
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
主要内容
8.1 回归分析简介 8.2 线性回归分析 8.3 曲线回归分析 8.4非线性回归分析 8.4 二元Logistic回归分析
14
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.3 曲线回归分析 8.3.1 基本概念及统计原理
8
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.2 线性回归分析
第1步 分析:这是一个因变量和一个自变量之间的问题,故应 该考虑用一元线性回归解决。 第2步 数据组织:定义三个变量,分别为“year”(年份)、 “x”(国内生产总值)、“y”(财政收入)。 第3步 作散点图,观察两个变量的相关性:依次选择菜单“图 形→旧对话框→散点/点状→简单分布”,并将“国内生产总值 ”作为x轴,“财政收入”作为y轴,得到如下所示图形。
可以看出两变量具有较强 的线性关系,可以用一元 线性回归来拟合两变量。
9
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
8.2 线性回归分析
第4步 一元线性回归分析设置: 选择菜单“分析→回归→线性”,打开“线性回归”对话框 ,将变量“财政收入”作为因变量 ,“国内生产总值”作为 自变量。 打开“统计量”对话框,选上“估计”和“模型拟合度”。 单击“绘制(T)…”按钮,打开“线性回归:图”对话框 ,选用DEPENDENT作为y轴,*ZPRED为x轴作图。并且选择“直 方图”和“正态概率图” 作相应的保存选项设置,如预测值、残差和距离等。
,将所有模型全部选上,看哪种模型拟合效果更好(主要看决定系数 R2),其所有模型的拟合优度R2如下表所示。
因变量: 保费收入 模型摘要 方程 线性 对数 逆 二次 三次 复合 幂 S 增长 指数 R 方 .941 .772 .481 .973 .990 .789 .972 .946 .789 .789 F 316.551 67.889 18.572 336.771 617.659 74.788 700.929 347.778 74.788 74.788 自由度 1 1 1 1 2 3 1 1 1 1 1 自由度 2 20 20 20 19 18 20 20 20 20 20 显著性 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 常量 -154.292 -4576.241 966.105 23.846 -166.430 23.315 2.521E-6 7.069 3.149 23.315 参数估算值 b1 .019 508.979 6138735.913 .003 .029 1.000 1.796 27064.140 5.450E-5 5.450E-5 1.756E-7 5.364E-7 5.022E-12 b2 b3
相关文档
最新文档