曲线回归与非线性回归资料
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实例详解
对GDP(国内生产总值)的拟合。选取GDP指 标为因变量,单位为百万美元,请根据图27-1所示 中1993-2010年GDP数据,建立t-GDP曲线。
(1)用原始数据绘制散点图,如图27-2所示。
由图27-2所示可以看出,两个变量分布曲线类 似于指数曲线y=b0b1t,由图27-3所示观测GDP与Lgt 的散点图,两者成直线趋势,可以考虑用最小二乘法 拟合GDP与Lgt的直线回归方程。
对拟合的模型进行假设检验(见结果图275所示),F值为167.361,P值为0.000,说明这 个回归模型试验统计学意义的。
结果图27-6所示中给出了包括常数项在内的参 数及检验结果,进行的是t检验,可见常数项和 Lgt均有统计学意义。 建立回归方程为:y=5.820*1.875t
曲线回归
曲线直线化变化方法尽管有可能通过一些函数转化 方法在一定范围内将他们的关系转变为线性关系, 但这种转化有可能导致更为复杂的计算或数据关系 失真,这时我们可以通过进行曲线拟合(Curve Fitting),曲线拟合是求解反应变量间曲线关系的 曲线回归方程的过程。
实例详解
研究发现,锡克氏试验阴性率随儿童年龄增长 而升高。查得山东某地1~7岁儿童的资料如图 27-10所示,试用曲线回归分析方法拟合曲线。
(1)打开数据文件“锡克氏试验阴性率与儿童 年龄.sav”,数据库构建如图27-11所示。
(2)单击“图形”|“旧对话框”|“散点/点状 ”命令,弹出“散点/点状”对话框,如图27-12 所示。
(3)从图27-12所示看到,随着儿童年龄的增 加,阴性率呈显著的上升趋势。但是这种上升 趋势并不是线性的,而表现为非线性的关 系。 故可以考虑采用曲线拟合的方法。这里选用二 次曲线模型、三次曲线模型和对数曲线模型。 拟合三个模型,将三者拟合情况进行比较,选 择拟合度较好的模型。
计算t的指数值生成新的变量Lgt,操作部骤如下 :在菜单中单击“转换”→计算变量,在“目 标变量”框中输入“Lgt”作为新变量名,在“ 数字表达式”中输入LG10(GDP)作为新的变 量值,单击“确定”按钮。 (2)拟合GDP与Lgt的直线回归方程结果解释 如图27-4所示为模型的拟合优度情况,显示模 型的相关系数R为0.995,决定系数R2为0.913, 说明该模型回归的贡献很大,表示回归模型拟 合结果好。
IBM-SPSS
第27章 曲线回归与非线性回归
曲线直线化变化方法
曲线直线化法,即利用变量变换的方法,使变 换后的两个变量之间呈直线关系。求出直线回归方 程后,再将方程中的变量通过逆变换还原,求得所 求的曲线回归方程。
1.多项式曲线y=a+bx+cx2 2.对数函数 y = a + blnx 3.指数函数y = aebx或y = aeb/x(a > 0)
(1)选择因变量 在“非线性回归”对话框左侧的候选变量列表 框中选择一个变量,将其添加至“自变量”列 表框中,即选择该变量作为非线性回归分析的 因变量。 (2)模式表达式选项框:用于定义非线性回归 模型的表达式。输入的模型至少应包含一个自 变量。 (3)函数组选项框:给出了各种可能用到的函 数类型。
(2)模型汇总及参数估计 图27-14所示模型描述是对进行拟合的样本例数 进行说明的信息。
图27-16所示给出了样本数据分别进行三种曲线方程 拟合的检验统计量和相应方程中的参数估计值。对于 对数拟合,它的可决系数R2为0.914,F统计量等于 52.999,概率P值小于显著性水平0.05,说明该模型 有统计学意义。 对于二次曲线方程和三次方程拟合来说,它对应的可 决系数R2分别为0.971和0.995,模型也显著有效。 虽然上述模型都有显著的统计学意义,但从可决系数 的大小可以清晰看到三种曲线函数方程较其他两种曲 线方程拟合效果更好,因此选择三种曲线方程来描述 锡克氏试验阴性率与儿童年龄的关系。
(3)拟合曲线图,如图27-17所示。 最后给出的是实际数据的散点图和三种估计曲 线方程的预测图。从图27-8所示中也进一步说 明三次曲线曲线方程的拟合效果最好。
非线性回归
因变量与自变量之间的相互关系可以用线性方程来 近似的反应。但是,在现实生活中,非线性关系大 量存在。线性回归模型要求变量之间必须是线性关 系,曲线估 计只能处理能够通过变量变换化为线性 关系的非线性问题,因此这些 方法都有一定的局限 性。相反的,非线性回归可以估计因变量和自变 量 之间具有任意关系的模型,用户根据自身需要可随 意设定估计方程的具体形式。
4.幂函数y=axb (a > 0)
5.双曲线函数 1/y = a+b/x
变量变换后实现线性回归的步骤
对于可以通过变量变换实现线性化的资料,回 归的步骤如下: (1)绘制散点图,观测散点图分布特征类似于 何种函数类型, (2)按照所选定的函数进行相应的变量转换 (3)对变换后的数据建立直线回归模型 (4)拟合多个相近的模型,然后通过比较各模 型的拟合优度挑选较为合适的模型。
实例详解
假定数据文件图27-24所示中是一家公司在8个周 期间的广告费用与公司收入。公司的老板希望建立 一个回归模型用电视广告费用和报纸广告费用来预 测公司收入。以往8周的样本数据如图27-24所示 (单 位:千美元)。请建立回归模型分析。
SPSS模块说明
1.非线性回归
单击“分析”|“回归”|“非线性”命令,弹出 单“非线性回归”对话框,如图27-18所示。
1.操作步骤 在菜单中单击“分析”|“回归”|“曲线估计” 命令,在“曲线估计”对话框选择“阴性率” 作为因变量,“儿童年龄”作为“自变量”, 从模型栏中选取“cubic”、“quadratic”、 “logarithmic”,单击“确定”按钮。
2.实例结SPSS对曲线拟合结果的初步描 述统计,例如自变量和因变量、估计方程的类 型等。