试验数据及图像的计算机处理7(第二篇8章)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2) Y窗口和X窗口:在这两个窗口中分别输入变量名,则对应变量的数据作为图形
Y 轴和X轴的度量。
(2) Next按钮和Previous按钮: 单击“Next”按钮,可以输入下一个图形的坐标变
量:单击“previous”按钮,在“Y”窗口和“X”窗口中分别显示上一组坐标变量的变量 名。
(2) Standardized Residual Plots方框:在该方框内选择将要生成的图形的类型。
“Estimates” 核选框:计算并显示回归系数(缺省时选择此项)。 “Confidence interval”核选框:计算井显示预测区间。 “Covariance matrix”核选框:计算并显示回归系数的方差-协方差矩阵,矩阵 的对角线上为方差,对角线上下为协方差。
(2) Residuals方框:有关残差的设置。
“Linear Regression:Options”对话框。
(2) Stepping Method Criteria方框:选择该方框内的单选钮,并进 行相关输入,确定设置进入值和剔除值的标准。(也是对变量的剔除 或选定的方法) “Use probability of F”单选钮:为缺省选项。选择此项,用变量的F 显著性概率作为评判标准。在“Entry”窗口中输入数值,作为评判 进入值的标准值,当某变量的F显著性概率小于该数值时,此变量进 入回归方程式;在“Removal”窗口中输入数值,作为评判剔除值的 标准值,当变量的F显著性概率大于该数值时,从回归方程式中剔除 该变量。 “ Use F value单选钮”:选择此项,用变量的F值作为评判标准。 在“Entry”窗口中输入数值,当某变量的F值小于该数值时,此变量 进入回归方程式,在“Removal” 窗口中输入数值,当变量的F值大 于该数值时,从回归方程式中剔除该变量。
例:某种水泥在凝固时放出的热量Y(单位:卡/克)与 水泥中4种化学成分X1、X2、X3、和X4所占的百分比有关 。现测得13组数据如下表,要求建立热量与水泥化学成分 之间的经验回归关系式。
•采用全回归(Enter)法
Y=1.551X1 + 0.510X2 + 0.102X3 – 0.144X4 + 62.405
(一)曲线拟合的SPSS过程
SPSS中提供了11种基本模型,用户可以在对话 框中选择模型并通过比较拟合结果来得到最优拟合 函数。
“Analyze”
“Regression”
“Curve
Estimation” 选 项 , 打 开 如 图 2.70 所 示 的 “ Curve
Estimation”对话框。对话框中各选项的意义为:
(二)SPSS过程 SPSS提供了进行回归分析的专门过程,利用 这些过程,可以对数据的回归作更深入的分析。 方法及步骤如下: (1)建立数据表; (2)点击菜单“Analyze → Regression → Linear”,打开“Linear Regression”对话框, (如图2.64所示)。
§8.1一元及多元线性回归
1.回归模型与参数的确定 一无线性回归研究因变量与一个自变量之间的线性关系。其回归 模型为
y a bx
通常采用最小二乘法来确定上面两个待定参数,即要求观测值与利 用上面回归模型得到的拟合值之间差值的平方和最小。差值平方和 达到最小时的模型参数便作为待定参数的最终取值,代入模型,便 可以确定回归方程。 2.回归系数的显著性检验 给定以上模型和实测数据以后,总可以得到待定参数的拟合值, 但由此确定的回归方程式不一定有意义。因此,需要对得到的回归 系数b作显著性检验,即检验回归系数是否为0,如果为0,则说明因 变量与自变量无关,回归方程无意义。回归系数的显著性检验采用F 检验法、t检验法和相关系数检验法等。
“Durbin-Watson”核选框: 计算并显示系列相关残差的Durbin-Watson检验和残 差与预测值的综述统计。 “Casewise diagnostics”核选框:在下面的两个单选钮中进行选择,确定进行残差 分析的个案范围。 “Outlier outside n standard deviations”核选框:在中间的窗口中输入一个正数, 则只对绝对标准残差大于该值的个案数据进行残差诊断分析、 “All Cases”单选钮:对所有个案数据进行残差诊断分析。
Less than or equal to 小于或等于 Greater than or equal to大于或等于
Greater than 大于
l Case Labels 窗口:在该窗口中输入变量名,用对应变量的值作为 标签进行标注。 l WLS 按钮: “ Linear Regression”对话框向下扩展,扩展部分 如下图。
Plots”对话框
在该对话框中进行设置,可以生成残差图、直方图、正态P-P概率图和局 部回归图(Partial Regression Plot)。对话框中各选项的意义为:
(2) 左侧列表框:该列表框中列出了7个变量名
DEPENDNT 因变量 ZRESID 标准化残差 ADJPRED 调节预测值 ZPRED SRESID 标准化预测值 学生化残差 SDRESID 学生化剔除残差 DRESID 剔除残差
由交互图创建的回归直线具体过程如下: ( 1 ) 按 “ Graphs → Interactive → Scatterplot” 的 顺 序 打 开 “Create Scatterplot”对话框 (2) 在“Assign Variables”选项卡中确定x轴与y轴的变量,在 “ Fit”选 项卡 中 的 “ Method” 方框 内 的下拉 式 列表框 中 选 择 “Regression”选项;并选定“Include Constant in equ:”,其 余按缺省选项则可。
l Selection Variable窗口:在该窗口中输入变量名,然后用“Rule”按钮输入选择
数据的规则,确定对哪些个案的数据进行回归分析。
l Rule按钮:单击该按钮,打开如图2.65所示的“Linear
框。
Regression:Set Rule”对话
“Linear Regression:Set Rule”对话框。 对话框中左侧标签显示选择变量的变量名;在中间的下拉式列表框中选择一种关系类 型;在“Value”窗口中输入一个数值。可供选择的关系类型有: Equal to Less than 相等 小于 not equal to 不相等
(2) Include constant in equation核选框:方程式中包含有常数项 。
(2) Missing values方框:设置缺失值的处理方式。
“Exclude cases pairwise”单选钮:为缺省选项。选择此项,剔除所 有含有缺失值的个案。 “Exclude cases pairwise单选钮:选择此项,剔除成对数据中至少含 有一个缺失值的个案数据。 “ Replace with mean单选钮”:选择此项,用均值代替缺失值。
关矩阵。
(2) Part and partial correlation核选框:显示部分相关和偏相关矩阵 (2) Collinearity diagnostic核选框:进行共线性诊断。
l Plots按钮: 打开 “Linear Regression Plots”对话框。
“Linear Regression
next
分析实例 例 合金钢的强度y与钢材中的碳含量x有密切关 系,为了冶炼出符合要求强度的钢,常常通过控 制钢水中的碳含量来达到目的,因此需要了解y 与x之间的关系。 (1)建立如右图所示的数据文件 (2)分别点击菜单“Analyze → Regression → Linear” , 打 开 如 图 2.64 所 示 的 “ Linear Regression”对话框。 (3)基本按缺省设置,运行SPSS,得到如下结 果:
(2) Model fit核选框: 计算并显示相关系数、相关系数的平方、调整的相关
系数、标准误差和ANOVA表。
(2) R squared change核选框: 显示增删一个独立变量时相关系数 的变化。如果增删某变量时相关系数变化较大,则说明该变量对因变量的 影响较大 (2) Descriptives核选框:显示变量数据逐步回归法
表中给出了每一步进入方 程式的变量和剔除的变量 ,以及采用的多元回归方 法和相应的准则。从表中 可以看出,本次回归共分 4步完成,前3步先后输入 l逐步回归法 变量X4、X1和X2,第4步 剔除变量X4。采用的准则 是:F>4.000时对应变 量进入方程式,F<3.8时 变量被剔除。利用该准则 进行判别以后,最后只剩 下变量X1和X2。
用逐步回归法求得的多元回归方程式为: y=1.468X1 + 0.662X2 + 52.577
§8.3 曲线拟合
曲线拟合的基本思想与前面讲的线性回归基本 相同,都是希望通过构造一个逼近函数来表达样本 数据的总体趋势和特征。所不同的是,曲线拟合适 用于样本数据不具有线性特征,呈曲线分布的情况 。进行曲线回归时用得较多的还是最小二乘法,即 通过使实测值与模型拟合值差值的平方和最小来求 得模型参数,得到最佳的拟合函数表达式。
图2.66 WLS扩展部分
在扩展部分的“WLS Weight”窗口中输入变量名,对应变量的值作 为加权处理的权重。
l
Statistics按钮:打开 “Linear Regression:Statistics”对话框。
该对话框中提供了多个统计量的显示控制。
(2) Regression Coefficients方框:有关回归系数统计量的显示。包括:
3.回归系数的区间估计 前面由最小二乘法得到的是回归系数的点估计(称为最小二乘 估计),实际问题中常要求给出回归系数的置信区间。 4.预测及其精度 经检验回归系数为显著以后,便可以利用回归方程式作预测了。 只要输入自变量的一个取值,便可以获得一个因变量的估计值。当 给定预测精度时,可以获得回归系数的预测区间。 5.假设的检验 进行线性回归时,有4个基本假定,即因变量与自变量之间线性 关系的假定、残差的独立性假定、残差的方差齐性假定和残差正态 分布的假定。在实际工作中应对这些假定逐一进行检验,对于不符 合假定的,应采取相应的措施进行处理。
“Histogram”核选框:选择此项,将生成直方图。 “Normal probability”核选框:选择此项,将生成正态P-P概率图。
(2) Produce all partial plots”核选框:选择此项,生成所有的局部回归图。
l Options按钮: 打开“Linear Regression:Options”对 话框。
当某个现象的发生或某种结果的得出往往与其他某个或某些因素有关但这种关系又不是确定的只是从数据上可以看出有有关的趋势都可以用回归分析来解决
第八章 回归分析
如前所述,回归分析用于研究自变量为确定值, 因变量为随机变量的相关关系,在实际生活中,这 类问题比比皆是。当某个现象的发生或某种结果的 得出往往与其他某个或某些因素有关,但这种关系 又不是确定的,只是从数据上可以看出有“有关” 的趋势,都可以用回归分析来解决。SPSS在回归 分析方面的功能相当完善,且易于操作。
图2.64 Linear Regression 对话框
l Dependent窗口:对应变量作为因变量。
l Independent(s)列表框:对应变量作为自变量。进行一 元回归时,在该窗口中输入一个变量名;进行多元回归时, 在该窗口中输入多个变量名。 l Next按钮:在“Independent(s)”列表框中输入新的自 变量集合,以便同时研究不同自变量集合与因变量之间的 关系。 l Previous按钮:“Independent(s)”列表框中显示前一 套自变量集合。 l Method下拉式列表框 (主要针对多元线性回归分析而 言 ) 在 该 控 件 中 选 择 进 行 回 归 分 析 的 方 法 。 有 Enter 、 Remove、Stepwise、Backward和Forward等五种方法,各 方法的基本原理和实例分析请参见多元回归部分的内容。