多元线性回归实习实际例题分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元线性回归分析实习
线性回归过程(Linear Regression)可用于分析一个或多个自变量与一个因变量之间的线性数量关系,并可进行回归诊断分析。
[例题3.1]
某地29名13岁男童身高x1(cm),体重x2(kg),肺活量y(L)的实测值数据见表3.1,试建立肺活量与身高、体重的回归关系。
[ 操作过程]
①[ 数据格式] 见数据文件< 多元线性回归例题.sav >
该数据库有4列29行,即4个变量、29个记录(Observation),每个变量占1列,每个记录占1行,该数据格式为一般多元分析的数据格式。
②[ 过程]
单击后可弹出线性回归对话框。该对话框内有诸多选项,现分别介绍。
③[ 选项]
◆因变量。只能选入1个因变量,本例选入变量“肺活量”。
◆自变量。可以是1个或多个,本例选入变量“身高、体重”。
◆当选择不同组合的自变量进行回归分析时,可保存每次选择的自
变量,用按钮和按钮可分别向前、向后翻找各种自变量的
组合。
◆选择回归模型拟合的分析方法,有5种可供选择。
Enter 强迫引入法,即一般回归分析,所选自变量全部进入方程,为系统默认方式。
Stepwise
加入有显著性意义的变量和剔除无显著性意义的变量,直到所建立的方程式
中不再有可加入和可剔除的变量为止。
Remove 强迫剔除法。根据设定的条件剔除自变量。
Backward向后逐步法。所选自变量全部进入方程,根据Options对话框中设定的标准在计算过程中逐个剔除变量,直到所建立的方程式中不再含有可剔除
的变量为止。
Forward:向前逐步法。根据Options对话框中设定的标准在计算过程中逐个加入单个变量,直到所建立的方程式中不再有可加入的变量为止。
◆选择符合某变量条件的观察单位进行分析,每次只能选入1
位范围,有6种方式供选择,在Value框内输入设定值。
equal to 等于设定值。
not equal to不等于设定值。
less than小于设定值。
Less than or equal to 小于或等于设定值。
greater than 大于设定值。
greater than or equal to大于或等于设定值。
◆对话框。
Regression coefficient回归系数
Estimate一般回归系数和标准回归系数及其标准误和显著性检验。
Confidence interval 输出一般回归系数的95%可信区间。
Covarience matrix 方差及协方差知阵和相关矩阵。
Model fit 模型检验,给出复相关系数R,决定系数R2及方差分析结果。
R squared change 输出调整R2及相应的F值和P值。
Descriptive 输出每个变量的均数,标准差,样本容量,相关系及单侧检验P值的矩阵。
Part and partial correlation 输出简单相关系数及偏相关系数。
Collinearity 共线性诊断。
◆残差
☐Dubin-Watson 对残差的顺序相关的Dubin-Watson检验(检验残差间是否独立)。
☐Casewise diagnostics 个体诊断,给出残差和预测值、标准化残差和标准化预测值的统计量。选此项后,激活以下选项。
⊙Outliers outside standard deviations凡个体观察值超出均数加
减n倍标准差被视为离群点,系统默认此项n为3。
○All cases 给出所有观察单位的残差、标准化残差和预测值。
◆残差散点图、正态概率图、离群点图及直方图。
◆选项对话框。
⊙Use probability of F:
Entry选入变量的显著性水准。系统默认0.05,即对回归方程
检验时,若P≤0.05,则该变量被选入方程。
Removal剔除变量的显著性水准。系统默认0.1,即对回归方
程检验时,若P≥0.1,则该变量剔除出方程。
○Use F value 以F值为剔选变量准则。
Entry 选入变量的F界值,系统默认3.84,即对回归方程检验
时,若P≥3.84,则该变量被选入方程。
Removal 剔除变量的F界值,系统默认2.71,即对回归方程
检验时,若P≤2.71, 则该变量剔除出方程。
☐Include constant in equation 回归方程中含有常数项。
◆缺失值处理。
⊙Exclude case listwise仅剔除所有变量中有缺失值的观察单位。
○Exclude case pairwise仅剔除正在参与运算的一对变量中有缺失值的观察单位。
○Replace with mean
◆Save(存新
变量/文件)对话框
☐预测值。
Unstandardized非标准化预测值。
Standardized标准化预测值
Adjusted去掉当前记录时,当前模型对该记录的预测值。
S.E. of mean prediction预测值均数的标准误。
☐残差。
Unstandardized非标准化残差。
Standardized标准化残差。
Studentized学生化残差。
Deleted剔除残差。
Studentized Deleted剔除学生化残差。
☐距离。
Mahalanobis马氏距离。
C ook’s Cook 距离。
Leverage values Leverage值。
☐判断强影响点的影响统计量。
DfBeta(s)剔除某一观察值所引起的回归系数的变化。
DfBeta(s) 标准化DfBeta。
DfFit所引起的预测值的变化。
Standardized DfFit标准化DfFit。
Covariance ratio剔除某一观察值的协方差阵与含全部观察值的协方差阵的比率。
☐预测值的可信区间。
Mean预测值均数的可信区间。