SPSS统计分析第8章回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

8.2 线性回归分析
方差分析表
模型 1 回归 残差 平方和 1.557E9 34187286.770 df 1 13 均方 F Sig. 1.557E9 592.250 2629791.290
1.592E9 14 总计 a. 预测变量:(常量),国内生产总值。b. 因变量:财政收入。
表中显示因变量的方差来源、方差平方和、自由度、均方、F检验统 计量的观测值和显著性水平。方差来源有回归、残差。从表中可以看 出,F统计量的观测值为592.25,显著性概率为0.000,即检验假设 “H0:回归系数B = 0”成立的概率为0.000,从而应拒绝原假设,说明 因变量和自变量的线性关系是非常显著的,可建立线性模型。
(2)回归分析基本概念
回归分析是指通过提供变量之间的数学表达式来定量描述 变量间相关关系的数学过程,这一数学表达式通常称为经验公 式。我们不仅可以利用概率统计知识,对这个经验公式的有效 性进行判定,同时还可以利用这个经验公式,根据自变量的取 值预测因变量的取值。如果是多个因素作为自变量的时候,还 可以通过因素分析,找出哪些自变量对因变量的影响是显著的 ,哪些是不显著的。
从决定系数(R方即R2)来看, 三次曲线效果最好(因为其 R2值最大),并且方差分析 的显著性水平(Sig.)为0。 故重新进行上面的过程,只 选“三次曲线(Cubic)”一 种模型。
8.3 曲线回归分析
第5步 结果与分析。 三次曲线模型拟合效果的检验表
R .995 R方 .990 调整R方 .989 估计值的标准误 64.883
第八章
回归分析
主要内容
8.1 回归分析简介 8.2 线性回归分析 8.3 曲线回归分析 8.4 非线性回归分析 8.5 二元Logistic回归分析
8.1 回归分析概念
(1)确定性关系与非确定性关系
变量与变量之间的关系分为确定性关系和非确定性关系, 函数表达确定性关系。研究变量间的非确定性关系,构造变量 间经验公式的数理统计方法称为回归分析。
8.2 线性回归分析
第5步 主要结果及分析: 变量输入和移去表
模型 1 输入的变量 国内生产总值 移去的变量 . 方法 输入
表中显示回归模型编号、进入模 型的变量、移出模型的变量和变 量的筛选方法。可以看出,进入 模型的自变量为“国内生产总 值” 。
a. 已输入所有请求的变量。 b. 因变量: 财政收入。
8.1 回归分析概念
(3)回归分析的一般步骤
第1步 确定回归方程中的因变量和自变量。 第2步 确定回归模型。 第3步 建立回归方程。 第4步 对回归方程进行各种检。
拟合优度检验 回归方程的显著性检验 回归系数的显著性检验
第5步 利用回归方程进行预测。
主要内容
8.1 回归分析简介 8.2 线性回归分析 8.3 曲线回归分析 8.4 非线性回归分析 8.5 二元Logistic回归分析
保费收入y随国内生产总值 x的提高而逐渐提高,而且 当国内生产总值达到一定 水平后,保费收入的增幅 更加明显。因此用线性回 归模型表示x,y的关系是 不恰当的。于是应找拟合 效果好的模型。
8.3 曲线回归分析
第4步 进行曲线估计:依次选择菜单“分析→回归→曲线估计 ”,将所有模型全部选上,看哪种模型拟合效果更好(主要看决 定系数R2),其所有模型的拟合优度R2如下表所示。
(3) 分析步骤
首先,在不能明确究竟哪种模型更接近样本数据时,可在上 述多种可选择的模型中选择几种模型; 其次,SPSS自动完成模型参数的估计,并输出回归方程显著 性检验的F值和概率p值、决定系数R2等统计量; 最后,以判定系数为主要依据选择其中的最优模型,并进行 预测分析等。
8.3 曲线回归分析
模型名称 直线(Linear) 二次曲线(Quadratic) 复合曲线(Compound) 生长曲线(Growth) 对数曲线(Logarithmic) 三次曲线(Cubic) S曲线(S) 指数曲线(Exponential) 逆函数(Inverse) 幂函数(Power) 逻辑函数(Logistic) R Square(R2) 0.941 0.973 0.789 0.789 0.772 0.990 0.946 0.789 0.481 0.972 0.789
年份 1992 1993 1994 1995 1996 1997 1998 1999 财政收入 国内生产总值 (单位:亿元 (单位:亿元) ) 26923.5 3483.37 35333.9 4348.95 48197.9 5218.10 60793.7 6242.20 71176.6 7407.99 78973.0 8651.14 84402.3 9875.95 89677.1 11444.08 年份 2000 2001 2002 2003 2004 2005 2006 财政收入 国内生产总值 (单位:亿元 (单位:亿元) ) 99214.6 13395.23 109655.2 16386.04 120332.7 18903.64 135822.8 21715.25 159878.3 26396.47 183867.9 31649.29 210871.0 38760.20
可以看出两变量具有较强 的线性关系,可以用一元 线性回归来拟合两变量。
8.2 线性回归分析
第4步 一元线性回归分析设置: 选择菜单“分析→回归→线性”,打开“线性回归”对话框 ,将变量“财政收入”作为因变量 ,“国内生产总值”作为 自变量。 打开“统计量”对话框,选上“估计”和“模型拟合度”。 单击“绘制(T)…”按钮,打开“线性回归:图”对话框 ,选用DEPENDENT作为y轴,*ZPRED为x轴作图。并且选择“直 方图”和“正态概率图” 作相应的保存选项设置,如预测值、残差和距离等。
模型综述表
模型 1 R R方 调整 R 方 标准估计的误差 .977 1621.66312
.989a .979
a. 预测变量:(常量),国内生产总值。b. 因变量: 财政收入。
R=0.989,说明自变量与因变 量之间的相关性很强。R方 (R2) =0.979,说明自变量 “国内生产总值”可以解释 因变量“财政收入”的97.9% 的差异性。
8.2线性回归分析 8.2.1 基本概念及统计原理
1.基本概念
线性回归假设因变量与自变量之间为线性关系,用一定的 线性回归模型来拟合因变量和自变量的数据,并通过确定模型 参数来得到回归方程。根据自变量的多少,线性回归可有不同 的划分。当自变量只有一个时,称为一元线性回归,当自变量 有多个时,称为多元线性回归。
相伴概率Sig.=0.000 说明模型具有显著的 统计学意义。
8.3 曲线回归分析
回归系数表
未标准化系数
B 内民生产总值 国内生产总值 ** 2 国内生产总值 ** 3 (常数) .029 -5.364E-7 5.022E-12 -166.430 标准误 .005 .000 .000 45.399
复相关系数R = 0.995,R2 = 0.990,经校正后的R平方值为 0.989。故可判断保费收入与国 内生产总值之间有较显著的三次 曲线关系
自变量为 国内生产总值。
方差分析表
平方和 均方 df F 回归 7800612.559 3 2600204.186 617.659 残差 75775.960 18 4209.776 总计 7876388.518 21 自变量为 国内生产总值。 Sig. .000
8.2 线性回归分析
第1步 分析:这是一个因变量和一个自变量之间的问题,故应 该考虑用一元线性回归解决。 第2步 数据组织:定义三个变量,分别为“year”(年份)、 “x”(国内生产总值)、“y”(财政收入)。 第3步 作散点图,观察两个变量的相关性:依次选择菜单“图 形→旧对话框→散点/点状→简单分布”,并将“国内生产总值 ”作为x轴,“财政收入”作为y轴,得到如下所示图形。
主要内容
8.1 回归分析简介 8.2 线性回归分析 8.3 曲线回归分析 8.4 非线性回归分析 8.5 二元Logistic回归分析
8.3 曲线回归分析 8.3.1 基本概念及统计原理
(1) 基本概念
曲线估计(曲线拟合、曲线回归)则是研究两变量间非线 性关系的一种方法,选定一种用方程表达的曲线,使得实际数 据与理论数据之间的差异尽可能地小。如果曲线选择得好,那 么可以揭示因变量与自变量的内在关系,并对因变量的预测有 一定的意义。 在曲线估计中,需要解决两个问题:一是选用哪种理论模 型,即用哪种方程来拟合观测值;二是当模型确定后,如何选 择合适的参数,使得理论数据和实际数据的差异最小。
标准化系数
Beta 1.506 -2.554 2.093
8.2线性回归分析
(2) 统计原理
一元回归方程和多元回归方程
E( y) 0 1 x
E ( y) 0 1x1 2 x2
p xp
一元线性和多元线性回归分析的核心任务就是估计其中的参 数。
8.2线性回归分析 8.2.2 SPSS实例分析
【例8-1】现有1992年-2006年国家财政收入和国内生产总值的 数据如下表所示,请研究国家财政收入和国内生产总值之间的 线性关系。
8.3 曲线回归分析
第1步 分析:先用散点图的形式进行分析,看究竟是否具有一 元线性关系,如果具有一元线性关系,则用一元线性回归分析, 否则采用曲线估计求解。 第2步 数据组织:定义为三个变量,分别是“year”(年度)、 “y”(保费收入)和“x”(国内生产总值),输入数据并保存。 第3步 作散点图初步判定变量的分布趋势:
8.3 曲线回归分析
(2) 统计原理
在曲线估计中,有很多的数学模型,选用哪一种形式的回 归方程才能最好地表示出一种曲线的关系往往不是一个简单的 问题,可以用数学方程来表示的各种曲线的数目几乎是没有限 量的。在可能的方程之间,以吻合度而论,也许存在着许多吻 合得同样好的曲线方程。因此,在对曲线的形式的选择上,对 采取什么形式需要有一定的理论,这些理论是由问题本质决定 的。
8.3.2 SPSS实例分析
【例8-3】 表8.16是1989~2001年国家保费收入与国内生产总值的数据 ,试研究保费收入与国内生产总值的关系。
年度 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 保费收入 4.6 7.8 10.3 13.2 20 33.1 45.8 71.04 109.5 142.6 178.5 国民生产总值 4517.8 4860.3 5301.8 5957.4 7206.7 8989.1 10201.4 11954.5 14922.3 16917.8 18598.4 年度 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 保费收入 239.7 378 525 630 683 776 1080 1247.3 1393.22 1595.9 2109.36 国民生产总值 21662.5 26651.9 34560.5 46670 57494.9 66850.5 73142.7 76967.2 80579.4 88228.1 94346.4
8.2 线性回归分析
回归系数表
模型 1 (常量) 国内生产总值 非标准化系数 B 标准误差 -4993.281 919.356 .197 .008 标准系数 试用版 t -5.431 24.336 Sig. .000 .000
.989
表中显示回归模型的常数项、非标准化的回归系数B值及其标准误差、标 准化的回归系数值、统计量t值以及显著性水平(Sig.)。从表中可看出, 回归模型的常数项为-4993.281,自变量“国内生产总值”的回归系数为 0.197。因此,可以得出回归方程:财政收入=-4993.281 + 0.197 × 国内生 产总值。 回归系数的显著性水平为0.000,明显小于0.05,故应拒绝T检验的原假设, 这也说明了回归系数的显著性,说明建立线性模型是恰当的。
相关文档
最新文档