SPSS多元线性回归分析教程.doc

合集下载

SPSS—回归—多元线性回归结果分析

SPSS—回归—多元线性回归结果分析

SPSS—回归—多元线性回归结果分析(二),最近一直很忙,公司的潮起潮落,就好比人生的跌岩起伏,眼看着一步步走向衰弱,却无能为力,也许要学习“步步惊心”里面“四阿哥”的座右铭:“行到水穷处”,”坐看云起时“。

接着上一期的“多元线性回归解析”里面的内容,上一次,没有写结果分析,这次补上,结果分析如下所示:结果分析1:由于开始选择的是“逐步”法,逐步法是“向前”和“向后”的结合体,从结果可以看出,最先进入“线性回归模型”的是“price in thousands"建立了模型1,紧随其后的是“Wheelbase"建立了模型2,所以,模型中有此方法有个概率值,当小于等于0.05时,进入“线性回归模型”(最先进入模型的,相关性最强,关系最为密切)当大于等0.1时,从“线性模型中”剔除结果分析:1:从“模型汇总”中可以看出,有两个模型,(模型1和模型2)从R2 拟合优度来看,模型2的拟合优度明显比模型1要好一些(0.422>0.300)2:从“Anova"表中,可以看出“模型2”中的“回归平方和”为115.311,“残差平方和”为153.072,由于总平方和=回归平方和+残差平方和,由于残差平方和(即指随即误差,不可解释的误差)由于“回归平方和”跟“残差平方和”几乎接近,所有,此线性回归模型只解释了总平方和的一半,3:根据后面的“F统计量”的概率值为0.00,由于0.00<0.01,随着“自变量”的引入,其显著性概率值均远小于0.01,所以可以显著地拒绝总体回归系数为0的原假设,通过ANOVA方差分析表可以看出“销售量”与“价格”和“轴距”之间存在着线性关系,至于线性关系的强弱,需要进一步进行分析。

结果分析:1:从“已排除的变量”表中,可以看出:“模型2”中各变量的T检的概率值都大于“0.05”所以,不能够引入“线性回归模型”必须剔除。

从“系数a” 表中可以看出:1:多元线性回归方程应该为:销售量=-1.822-0.055*价格+0.061*轴距但是,由于常数项的sig为(0.116>0.1) 所以常数项不具备显著性,所以,我们再看后面的“标准系数”,在标准系数一列中,可以看到“常数项”没有数值,已经被剔除所以:标准化的回归方程为:销售量=-0.59*价格+0.356*轴距2:再看最后一列“共线性统计量”,其中“价格”和“轴距”两个容差和“vif都一样,而且VIF 都为1.012,且都小于5,所以两个自变量之间没有出现共线性,容忍度和膨胀因子是互为倒数关系,容忍度越小,膨胀因子越大,发生共线性的可能性也越大从“共线性诊断”表中可以看出:1:共线性诊断采用的是“特征值”的方式,特征值主要用来刻画自变量的方差,诊断自变量间是否存在较强多重共线性的另一种方法是利用主成分分析法,基本思想是:如果自变量间确实存在较强的相关关系,那么它们之间必然存在信息重叠,于是就可以从这些自变量中提取出既能反应自变量信息(方差),而且有相互独立的因素(成分)来,该方法主要从自变量间的相关系数矩阵出发,计算相关系数矩阵的特征值,得到相应的若干成分。

SPSS多元线性回归分析实例操作步骤

SPSS多元线性回归分析实例操作步骤

SPSS 统计剖析多元线性回归剖析办法操纵与剖析试验目标:引入1998~上海市城市生齿密度.城市居平易近人均可安排收入.五年以上平均年贷款利率和衡宇空置率作为变量,来研讨上海房价的变动身分.试验变量:以年份.商品房平均售价(元/平方米).上海市城市生齿密度(人/平方公里).城市居平易近人均可安排收入(元).五年以上平均年贷款利率(%)和衡宇空置率(%)作为变量. 试验办法:多元线性回归剖析法 操纵进程:第一步:导入Excel 数据文件 第二步:进入如下界面: 输出成果剖析:该表显示模子最先引入变量城市生齿密度 (人/平方公里),第二个 Variables Entered/RemovedaModel Variables Entered Variables RemovedMethod1城市生齿密度 (人/平方公里). Stepwise (Criteria: ProbabilityofFtoenter <= .050,ProbabilityofFtoremove >= .100).2城市居平易近人均可安排收入(元). Stepwise (Criteria: ProbabilityofFtoenter <= .050,ProbabilityofFtoremove >= .100).a. Dependent Variable: 商品房平均售价(元/平方米)该表显示各模子的方差剖析成果.从表中可以看出,模子的F统计量的不雅察值为23832.156,概率p值为0.000,在明显性程度为0.05的情况下,可以以为:商品房平均售价(元/平方米)与城市生齿密度 (人/平方公里),和城市居平易近人均可安排收入(元)之间有线性关系.3.回归系数Residual.00011 Std. Predicted Value.00011 Std. Residual.000.89411 a. Dependent Variable: 商品房平均售价(元/平方米)该表为回归模子的残差统计量,尺度化残差(Std. Residual)的绝对值最大为1.659,没有超出默认值3,不克不及发明奇怪值.7.回归尺度化残差的直方图该图为回归尺度化残差的直方图,正态曲线也被显示在直方图上,用以断定尺度化残差是否呈正态散布.但是因为样本数只有11个,所以只能精确断定其呈正态散布.该图回归尺度化的正态PP图,该图给出了不雅测值的残差散布与假设的正态散布的比较,由图可知尺度化残差散点散布接近直线,因而可断定尺度化残差呈正态散布.该图显示的是因变量与回归尺度化猜测值的散点图,个中DEPENDENT为x轴变量,*ZPRED为y轴变量.由图可见,两变量呈直线趋向.附件:原始数据:自变量散点图:由散点图可以看出,可进入剖析的变量为城市生齿密度.城市居平易近人均可安排收入.。

SPSS多元线性回归分析教程

SPSS多元线性回归分析教程

线性回归分析的SPSS操作本节内容主要介绍如何确定并建立线性回归方程。

包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。

为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。

也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。

另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。

一、一元线性回归分析1.数据以本章第三节例3的数据为例,简单介绍利用SPSS如何进行一元线性回归分析。

数据编辑窗口显示数据输入格式如下图7-8(文件7-6-1.sav):图7-8:回归分析数据输入2.用SPSS进行回归分析,实例操作如下:2.1.回归方程的建立与检验(1)操作①单击主菜单Analyze / Regression / Linear…,进入设置对话框如图7-9所示。

从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。

在方法即Method一项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。

所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。

具体如下图所示:图7-9 线性回归分析主对话框②请单击Statistics…按钮,可以选择需要输出的一些统计量。

如Regression Coefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。

Model fit项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。

上述两项为默认选项,请注意保持选中。

设置如图7-10所示。

设置完成后点击Continue返回主对话框。

图7-10:线性回归分析的Statistics选项图7-11:线性回归分析的Options选项回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。

spss多元线性回归研究分析

spss多元线性回归研究分析

spss多元线性回归分析作者: 日期:SPSS多元线性回归分析试验在科学研究中,我们会发现某些指标通常受到多个因素的影响,如血压值除了受年龄影响之外,还受到性别、体重、饮食习惯、吸烟情况等因素的影响,用方程定量描述一个因变量y与多个自变量x1、x2、x3 之间的线性依存关系,称为多元线性回归。

有学者认为血清中低密度脂蛋白增高是引起动脉硬化的一个重要原因。

现测量30名怀疑患有动脉硬化的就诊患者的载脂蛋白A、载脂蛋白B、载脂蛋白E、载脂蛋白C、低密度脂蛋白中的胆固醇含量。

资料如下表所示。

求低密度脂蛋白中的胆固醇含量对载脂蛋白A、载脂蛋白E、载脂蛋白E、载脂蛋白C的线性回归方程。

表1 30名就诊患者资料表spss数据处理步骤:(1)打开spss输入数据后,点击“分析”—“回归”—“线性”。

然后将“低密度脂蛋白”选入因变量框,将“载脂蛋白A” “载脂蛋白E” “载脂蛋白E” “载脂蛋白C”依次选入自变量框。

方法选为“逐步”。

(2)单击“统计量”选项,原有选项基础上选择“R方变化”。

在残差中选“Durbin-Watson”,单击“继续”。

i [粘贴(E)] i ss (印11取消i L帮助(3)单击“绘制”,将“DEPENDNT ”选入“X2”中,将“*SRESID ”选入“Y 中,在标准残差图选项中选择“直方图”和“正态概率图”。

单击“继续”。

S3闵蠢墨fD):制IKDEPEHDNT T ZPRED *ZF?ESID PRESID •ADdPRED怡尺匚SID 怡口穆ESILJ呵直方便(比“正态槪率副曰继续将(3),,取卷 帮肋銭性回归册回归:圏踰点1的1厂产空所有制分團(巳(4)单击“选项”,在原有选项的基础上单击“继续”,最后单击“确定”,就完 成了。

数据处理结果如下:a.因变量低密度脂蛋白上图为统计的基本信息ca. 预测变量:(常量),载脂蛋白Bb. 预测变量:(常量),载脂蛋白B,载脂蛋白Cc. 因变量:低密度脂蛋白上图列出了模型的R、R方、调整R方。

SPSS多元线性回归分析实例操作步骤

SPSS多元线性回归分析实例操作步骤

SPSS多元线性回归分析实例操作步骤多元线性回归是一种常用的统计分析方法,用于探究多个自变量对因变量的影响程度。

SPSS(Statistical Package for the Social Sciences)是一款常用的统计软件,可以进行多元线性回归分析,并提供了简便易用的操作界面。

本文将介绍SPSS中进行多元线性回归分析的实例操作步骤,帮助您快速掌握该分析方法的使用。

步骤一:准备数据在进行多元线性回归分析之前,首先需要准备好相关的数据。

数据应包含一个或多个自变量和一个因变量,以便进行回归分析。

数据可以来自实验、调查或其他来源,但应确保数据的质量和可靠性。

步骤二:导入数据在SPSS软件中,打开或创建一个新的数据集,然后将准备好的数据导入到数据集中。

可以通过导入Excel、CSV等格式的文件或手动输入数据的方式进行数据导入。

确保数据被正确地导入到SPSS中,并正确地显示在数据集的各个变量列中。

步骤三:进行多元线性回归分析在SPSS软件中,通过依次点击"分析"-"回归"-"线性",打开线性回归分析对话框。

在对话框中,将因变量和自变量移入相应的输入框中。

可以使用鼠标拖拽或双击变量名称来快速进行变量的移动。

步骤四:设置分析选项在线性回归分析对话框中,可以设置一些分析选项,以满足具体的分析需求。

例如,可以选择是否计算标准化回归权重、残差和预测值,并选择是否进行方差分析和共线性统计检验等。

根据需要,适当调整这些选项。

步骤五:获取多元线性回归分析结果点击对话框中的"确定"按钮后,SPSS将自动进行多元线性回归分析,并生成相应的分析结果。

结果包括回归系数、显著性检验、残差统计和模型拟合度等信息,这些信息可以帮助我们理解自变量对因变量的贡献情况和模型的拟合程度。

步骤六:解读多元线性回归分析结果在获取多元线性回归分析结果之后,需要对结果进行解读,以得出准确的结论。

SPSS多元线性回归分析

SPSS多元线性回归分析

SPSS多元线性回归分析[转载]SPSS19.0实战之多元线性回归分析(2016-08-12 20:31:47)[删除]转载▼标签:转载原文地址:SPSS19.0实战之多元线性回归分析作者:建模手线性回归数据(全国各地区能源消耗量与产量)来源,可点击协会博客数据挖掘栏:国泰安数据服务中心的经济研究数据库。

1.1 数据预处理数据预处理包括的内容非常广泛,包括数据清理和描述性数据汇总,数据集成和变换,数据归约,数据离散化等。

本次实习主要涉及的数据预处理只包括数据清理和描述性数据汇总。

一般意义的数据预处理包括缺失值填写和噪声数据的处理。

于此我们只对数据做缺失值填充,但是依然将其统称数据清理。

1.1.1 数据导入与定义单击“打开数据文档”,将xls格式的全国各地区能源消耗量与产量的数据导入SPSS中,如图1-1所示。

图1-1 导入数据导入过程中,各个字段的值都被转化为字符串型(String),我们需要手动将相应的字段转回数值型。

单击菜单栏的“”-->“”将所选的变量改为数值型。

如图1-2所示:图1-2 定义变量数据类型1.1.2 数据清理数据清理包括缺失值的填写和还需要使用SPSS分析工具来检查各个变量的数据完整性。

单击“”-->“”,将检查所输入的数据的缺失值个数以及百分比等。

如图1-3所示:图1-4 描述性数据汇总得到如表1-2所示的描述性数据汇总。

N极小值极大值均值标准差方差能源消费总量30911261649638.506175.92438142034.412煤炭消费量30332290019728.997472.25955834651.378焦炭消费量30195461874.611053.0081108824.853原油消费量30055551099.011273.2651621202.562汽油消费量3018771230.05170.27028991.746煤油消费量30026242.3764.8964211.520柴油消费量30271368392.34300.97990588.441燃料油消费量3001574141.00313.46798261.261天然气消费量30110619.5622.044485.947电力消费量30983004949.64711.664506464.953原煤产量300581427909.1711741.388 1.379E8焦炭产量3009202992.281707.9982917256.193原油产量2904341637.121085.3791178048.432燃料油产量30049775.60126.79116075.971汽油产量3001032186.49208.77143585.122煤油产量30021932.3055.3943068.535柴油产量3001911388.52420.216176581.285天然气产量30016419.5242.3711795.341电力产量30972536954.74675.230455935.003有效的N (列表状态)29表1-2 描述性数据汇总标准化后得到的数据值,以下的回归分析将使用标准化数据。

SPSS多元回归分析-11页word资料

SPSS多元回归分析-11页word资料

多元回归分析影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。

可以建立因变量y与各自变量x j(j=1,2,3,…,n)之间的多元线性回归模型:其中:b0是回归常数;b k(k=1,2,3,…,n)是回归参数;e是随机误差。

多元回归在病虫预报中的应用实例:某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y (头/m2)。

分级别数值列成表2-1。

预报量y:每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。

预报因子:x1诱蛾量0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;x2卵量0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;x3降水量0~10.0毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;x4雨日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。

表2-1数据保存在“DATA6-5.SAV”文件中。

1)准备分析数据在SPSS数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量,并输入数据。

再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量“x1”、“x2”、“x3”、“x4”和“y”,它们对应的分级数值可以在SPSS数据编辑窗口中通过计算产生。

编辑后的数据显示如图2-1。

图2-1或者打开已存在的数据文件“DATA6-5.SAV”。

2)启动线性回归过程单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图2-2所示的线性回归过程窗口。

图2-2 线性回归对话窗口3) 设置分析变量设置因变量:用鼠标选中左边变量列表中的“幼虫密度[y]”变量,然后点击“Dependent”栏左边的向右拉按钮,该变量就移到“Dependent”因变量显示栏里。

spss多元线性回归分析

spss多元线性回归分析
量(independent variable,IV)

因变量:度量变量

自变量:度量变量(e.g., 收入)或非度量变量
(e.g.,职位)

建立统计关系(statistical relationship)
Total cost
=fixed cost + variable cost
Байду номын сангаас
No. Credit Card
自变量解释的变异=因变量总变异-SSE= 22-5.5=16.5
R方=自变量解释的变异/因变量总变异=16.5/22=0.75

回归方程:Y = b0 +b1 V1 +b2 V2 + ε


预测值 ෠ = 0.482 +0.63 V1+0.216 V2
对于第1个家庭:
෠ = 0.482 + 0.63*2 +0.216*14 = 4.76



回归方程: ෠ = 2.87 + 0.97 V1
对于第1个家庭:
෠ = 2.87 + 0.97*2 = 4.81

实际观测值 Y = 4
残差:4-4.81 = -0.81
残差平方:(-0.81)* (-0.81)= 0.66
SSE
残差平方和


R方:自变量解释了多少因变量的总变异

1 线性回归基本理论

2 多元线性回归的步骤

3 使用SPSS进行多元线性回归

4 回归值预测和残差分析

5 多重共线性分析

6 逐步回归

7 层次线性回归

SPSS多元线性回归分析实例操作步骤(精编文档).doc

SPSS多元线性回归分析实例操作步骤(精编文档).doc

【最新整理,下载后即可编辑】SPSS 统计分析多元线性回归分析方法操作与分析实验目的:引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。

实验变量:以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。

实验方法:多元线性回归分析法软件:spss19.0操作过程:第一步:导入Excel数据文件1.open data document——open data——open;2. Opening excel data source——OK.第二步:1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent (因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method选择Stepwise.进入如下界面:2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue.3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.4.点击右侧Save,勾选Predicted Vaniues(预测值)和Residuals(残差)选项组中的Unstandardized;点击Continue.5.点击右侧Options,默认,点击Continue.6.返回主对话框,单击OK.输出结果分析:1.引入/剔除变量表Variables Entered/Removed aModel Variables Entered Variables Removed Method1 城市人口密度(人/平方公里) . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).2 城市居民人均可支配收入(元) . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).a. Dependent Variable: 商品房平均售价(元/平方米)该表显示模型最先引入变量城市人口密度(人/平方公里),第二个引入模型的是变量城市居民人均可支配收入(元),没有变量被剔除。

SPSS多元线性回归分析教程.doc

SPSS多元线性回归分析教程.doc

SPSS多元线性回归分析教程.doc
1. 软件安装和数据导入
安装完SPSS软件,打开软件,在主界面中选择“Open an existing data source”选项,找到导入的数据文件,点击“Open”按钮将数据导入SPSS。

2. 变量检查和描述性统计分析
在“Variable View”选项卡中,查看每个变量的数据类型和属性是否正确。

在“Data View”选项卡中,选中变量列表,点击“Analyze”菜单中的“Descriptive Statistics”选项,进行数据描述性统计分析。

3. 模型构建和回归分析
在“Regression”菜单中,选择“Linear”选项,进入线性回归分析设置页面。

将自
变量和因变量移动到变量框中,点击“OK”按钮进行回归分析。

在分析结果界面中,查看
回归分析的显著性和方程式,判断回归模型的拟合程度和自变量对因变量的解释度。

4. 结果解释和模型优化
根据分析结果,解释各个变量对因变量的影响程度和统计显著性。

如果存在模型缺陷,可以考虑添加、删除或转换自变量,优化回归模型并重新进行分析。

同时,需要注意验证
模型的可靠性和稳定性,避免过度拟合或欠拟合的情况。

5. 结果呈现和报告撰写
将回归分析结果进行图表制作和文字描述,清晰、简洁地呈现分析结果。

在报告撰写
过程中,需要注意逻辑性和一致性,避免遗漏关键内容和出现明显错误。

总之,SPSS多元线性回归分析需要掌握数据导入、变量检查、描述性统计分析、模型构建、回归分析、结果解释、模型优化、结果呈现和报告撰写等技能,才能有效地进行数
据分析研究。

SPSS多元线性回归分析实例操作步骤-spss做多元线性回归

SPSS多元线性回归分析实例操作步骤-spss做多元线性回归

SPSS 统计分析多元线性回归分析方法操作与分析实验目的:引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。

实验变量:以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。

实验方法:多元线性回归分析法软件:spss19.0操作过程:第一步:导入Excel数据文件1.open data document——open data——open;2.Opening excel data s ource——OK.第二步:1.在最上面菜单里面选中Analyze——Regression——Linear,Depende n(t因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择Stepwise.进入如下界面:2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewise diagnostics 默认;接着选择Model fit、Collinearity diagnotics;点击Continue.3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDN T(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plo t(s标准化残差图)中的Histogram、Normal probability plot;点击Continue.4.点击右侧Save,勾选Predicted Vaniues(预测值)和Residuals(残差)选项组中的Unstandardized;点击Continue.5.点击右侧Options,默认,点击Continue.a. Predictors: (Constant), 城市人口密度 (人/平方公里)b. Predictors: (Constant), 城市人口密度 (人/平方公里), 城市居民人均可支配收入(元)c. Dependent Variable: 商品房平均售价(元/平方米)Variables Entered/Removed aModel 1Variables Entered 城市人口密度 (人/平方公里)Variables Removed2城市居民人均可支配收入(元)Method. Stepwise (Criteria: Probability-of-F-to-enter <= .050,Probability-of-F-to-remove >= .100).. Stepwise (Criteria: Probability-of-F-to-enter <= .050,Probability-of-F-to-remove >= .100).a. Dependent Variable: 商品房平均售价(元/平方米)该表显示模型的拟合情况。

SPSS多元线性回归分析研究实例操作步骤

SPSS多元线性回归分析研究实例操作步骤

SPSS 统计分析多元线性回归分析方法操作与分析实验目地:引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价地变动因素.实验变量:以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量.实验方法:多元线性回归分析法软件:spss19.0操作过程:第一步:导入Excel数据文件;1.open data document——open data——openi me an dAl l th i ng si nt he i r b ei n ga 2. Opening excel data source——OK.第二步:1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent (因变量)选择商品房平均售价,Independents (自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择Stepwise.DXDiTa9E3d进入如下界面:2.点击右侧Statistics ,勾选Regression Coefficients (回归系数)选项组中地Estimates ;勾选Residuals (残差)选项组中地Durbin-i me an dAl l th i ng si nt he i r b ei n ga r e go od f o rs Watson 、Casewise diagnostics 默认;接着选择Model fit 、Collinearity diagnotics ;点击Continue.3.点击右侧Plots ,选择*ZPRED (标准化预测值)作为纵轴变量,选择DEPENDNT (因变量)作为横轴变量;勾选选项组中地StandardizedResidual Plots (标准化残差图)中地Histogram 、Normal probability plot ;点击Continue.5PCzVD7HxAAl l th i ng si nt he i r b ei n ga r e go od f o r4.点击右侧Save ,勾选Predicted Vaniues (预测值)和Residuals (残差)选项组中地Unstandardized ;点击Continue.5.点击右侧Options ,默认,点击Continue.t i mer b ei n ga r e go od f o rs om 6.返回主对话框,单击OK.输出结果分析:1.引入/剔除变量表该表显示模型最先引入变量城市人口密度 (人/平方公里),第二个引入模型地是变量城市居民人均可支配收入(元),没有变量被剔除.2.模型汇总Model Summary ct me an dAi n ga r e g该表显示模型地拟合情况.从表中可以看出,模型地复相关系数(R )为1.000,判定系数(R Square )为1.000,调整判定系数(Adjusted R Square )为1.000,估计值地标准误差(Std. Error of the Estimate )为28.351,Durbin-Watson 检验统计量为2.845,当DW≈2时说明残差独立.LDAYtRyKfE3.方差分析表该表显示各模型地方差分析结果.从表中可以看出,模型地F 统计量地观察值为23832.156,概率p 值为0.000,在显著性水平为0.05地情形下,可以认为:商品房平均售价(元/平方米)与城市人口密度 (人/平方公里),和城市居民人均可支配收入(元)之间有线性关系.Zzz6ZB2Ltk4.回归系数Coefficients ant he i r b e该表显示地是回归方程外地各模型变量地有关统计量,可见模型方程外地各变量偏回归系数经重检验,概率p 值均大于0.10,故不能引入方程.6ewMyirQFL6.共线性诊断i ng si n该表是多重共线性检验地特征值以及条件指数.对于第二个模型,最大特征值为2.891,其余依次快速减小.第三列地各个条件指数,可以看出有多重共线性.7.残差统计量该表为回归模型地残差统计量,标准化残差(Std. Residual )地绝对值最大为1.659,没有超过默认值3,不能发现奇异值.y6v3ALoS898.回归标准化残差地直方图t he i r b ei 该图为回归标准化残差地直方图,正态曲线也被显示在直方图上,用以判断标准化残差是否呈正态分布.但是由于样本数只有11个,所以只能大概判断其呈正态分布.M2ub6vSTnP9.回归标准化地正态P-P 图该图回归标准化地正态P-P图,该图给出了观测值地残差分布与假设地正态分布地比较,由图可知标准化残差散点分布靠近直线,因而可判断标准化残差呈正态分布.10.因变量与回归标准化预测值地散点图附件:原始数据:自变量散点图:由散点图可以看出,可进入分析地变量为城市人口密度、城市居民人均可支配收入.版权申明本文部分内容,包括文字、图片、以及设计等在网上搜集整理.版权为个人所有This article includes some parts, including text, pictures, and design. Copyright is personal ownership.用户可将本文地内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律地规定,不得侵犯本网站及相关权利人地合法权利.除此以外,将本文任何内容或服务用于其他用途时,须征得本人及相关权利人地书面许可,并支付报酬.Users may use the contents or services of this article for personal study, research or appreciation, and other non-commercial or non-profit purposes, but at the same time, they shall abide by the provisions of copyright law and other relevant laws, and shall not infringe upon the legitimate rights of this website and its relevant obligees. In addition, when any content or service of this article is used for other purposes, written permission and remuneration shall be obtained from the person concerned and the relevant obligee.转载或引用本文内容必须是以新闻性或资料性公共免费信息为使用目地地合理、善意引用,不得对本文内容原意进行曲解、修改,并自负版权等法律责任.Reproduction or quotation of the content of this article must be reasonable and good-faith citation for the use of news or informative public free information. It shall notmisinterpret or modify the original intention of the content of this article, and shall bear legal liability such ascopyright.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性回归分析的SPSS操作本节内容主要介绍如何确定并建立线性回归方程。

包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。

为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。

也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。

另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。

一、一元线性回归分析1.数据以本章第三节例3的数据为例,简单介绍利用SPSS如何进行一元线性回归分析。

数据编辑窗口显示数据输入格式如下图7-8(文件7-6-1.sav):图7-8:回归分析数据输入2.用SPSS进行回归分析,实例操作如下:2.1.回归方程的建立与检验(1)操作①单击主菜单Analyze / Regression / Linear…,进入设置对话框如图7-9所示。

从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。

在方法即Method一项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。

所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。

具体如下图所示:图7-9 线性回归分析主对话框②请单击Statistics…按钮,可以选择需要输出的一些统计量。

如Regression Coefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。

Model fit项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。

上述两项为默认选项,请注意保持选中。

设置如图7-10所示。

设置完成后点击Continue返回主对话框。

图7-10:线性回归分析的Statistics选项图7-11:线性回归分析的Options选项回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。

由于此部分内容较复杂而且理论性较强,所以不在此详细介绍,读者如有兴趣,可参阅有关资料。

③用户在进行回归分析时,还可以选择是否输出方程常数。

单击Options…按钮,打开它的对话框,可以看到中间有一项Include constant in equation可选项。

选中该项可输出对常数的检验。

在Options对话框中,还可以定义处理缺失值的方法和设置多元逐步回归中变量进入和排除方程的准则,这里我们采用系统的默认设置,如图7-11所示。

设置完成后点击Continue返回主对话框。

④在主对话框点击OK得到程序运行结果。

(2)结果及解释上面定义的程序运行结果如下所示:①方程中包含的自变量列表同时显示进入方法。

如本例中方程中的自变量为x,方法为Enter。

Variables Entered/RemovedModel Variables Entered Variables Removed Method1 X . Entera All requested variables entered.b Dependent Variable: Y②模型拟合概述列出了模型的R、R2、调整R2及估计标准误。

R2值越大所反映的两变量的共变量比率越高,模型与数据的拟合程度越好。

Model SummaryModel R R Square Adjusted R Square Std. Error of the Estimate1 .859 .738 .723 6.2814a Predictors: (Constant), X本例所用数据拟合结果显示:所考察的自变量和因变量之间的相关系数为0.859,拟合线性回归的确定性系数为0.738,经调整后的确定性系数为0.723,标准误的估计为6.2814。

③方差分析表列出了变异源、自由度、均方、F值及对F的显著性检验。

ANOVAModel Sum of Squares df Mean Square F Sig.1 Regression 1995.791 1 1995.791 50.583 .000Residual 710.209 18 39.456Total 2706.000 19a Predictors: (Constant), Xb Dependent Variable: Y本例中回归方程显著性检验结果表明:回归平方和为1995.791,残差平方和为710.209,总平方和为2706.000,对应的F统计量的值为50.583,显著性水平小于0.05,可以认为所建立的回归方程有效。

④回归系数表列出了常数及非标准化回归系数的值及标准化的回归系数,同时对其进行显著性检验。

CoefficientsUnstandardized Coefficients StandardizedCoefficientst Sig.Model B Std. Error Beta1 (Constant) -7.080 11.068 -.640 .530X .730 .103 .859 7.112 .000a Dependent Variable: Y本例中非标准化的回归系数B的估计值为0.730,标准误为0.103,标准化的回归系数为0.859,回归系数显著性检验t统计量的值为7.112,对应显著性水平Sig.=0.000<0.05,可以认为方程显著。

因此,本例回归分析得到的回归方程为:Y=-7.08+0.73X对方程的方差分析及对回归系数的显著性检验均发现,所建立的回归方程显著。

2.2.回归方程的预测(1)通过因变量的观测值和回归预测值的比较,可以了解许多关于模型和各种假定对数据的适合程度,上面回归方程的检验结果表明,所得到的回归直线是有效的。

在回归方程有效的前提下,研究者往往希望对于给定的预测变量X的一个具体数值(如X0),预测因变量Y的平均值或者预测某一个观测的y0的值。

如对于上面的例子,我们可以用回归方程来预测智商x0=120的被试,这次的平均成绩;也可以用来预测假如一名工作人员的智商是120,那么他参加这次考试,将会得多少分。

上面两种情况下,点预测值是相同的,不同的是标准误。

Y0=A+BX0=-7.08+0.73×120=86.52在X0点,Y的预测均值的估计标准误为公式(7-24);在X0点,Y的个体预测值的估计标准误为公式(7-25)。

(2)SPSS可以提供上述两类预测值,具体操作如下:在如图7-9的线性回归模型定义的主对话框中,单击save,出现如下对话框(图7-12):图7-12:预测值的定义选择窗口在上面的窗口,可以选择输出变量的点预测值和平均值及其个体值预测的区间估计,如上图,我们在Predicted Values选择区选择复选项Unstandardized,以输出非标准化的点预测值;在下面的Prediction Intervals选择区选择复选项Means和Individual,下面的置信水平采用系统默认的95%,然后点击Continue返回主对话框,在主对话框中点击Ok,得到的输出结果。

(3)结果及解释除了上面介绍的回归方程建立和检验的结果外,在数据编辑结果,因为选择了需要保存的预测变量的信息,数据编辑窗口数据显示如下:图7-13:保存预测之后的数据窗口从上面的结果可以看出,在以前的数据的基础上,新生成了五列数据,第一列命名为pre_1的变量对应的数据表示预测变量对应的因变量非标准化的预测值,例如,智商为120 的被试,用回归方程预测的这次考试的点预测值为80.49;均值预测的区间估计的上下限分别用变量lmci_1和umci_1表示,个体预测值的区间估计的上下限分别用变量lici_1 和uici_1表示,例如,智商为120 的被试,均值95%的预测区间为:(76.42,84.56); 个体预测95%的预测区间为:(66.68,94.30)。

二、多元线性回归1.数据以本章第四节例4为例,简单说明多元线性回归方程的建立与检验。

数据输入如图7-14(文件7-6-2.sav):图7-14:多元回归分析所用数据2.SPSS操作(1)多元线性回归所用命令语句与一元线性回归相同,同样可以通过单击主菜单Analyze / Regression / Linear…,进入设置对话框如图7-9所示。

从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x1和x2选入到自变量(Independent)框中。

(2)点击Method后面的下拉框,在Method框中选择一种回归分析的方法。

SPSS提供下列几种变量进入回归方程的方法:·Enter选项,强行进入法,即所选择的自变量全部进入回归模型,该选项是默认方式。

·Remove选项,消去法,建立回归方程时,根据设定的条件剔除部分自变量。

·Forward选项,向前选择法,根据在Option对话框中所设定的判据,从无自变量开始,在拟合过程中,对被选择的自变量进行方差分析,每次加入一个F值最大的变量,直到所有符合判据的变量都进入模型为止。

第一个引入回归模型的变量应该与因变量相关程度最大。

·Backward选项,向后剔除法,根据在Option对话框中所设定的判据,先建立全模型,然后根据设置的判据,每次剔除一个使方差分析中的F值最小的自变量,直到回归方程中不再含有不符合判据的自变量为止。

·Stepwise选项,逐步进入法,是向前选择法和向后剔除法的结合。

根据在Option对话框中所设定的判据,首先根据方差分析结果选择符合判据的自变量且对因变量贡献最大的进入回归方程。

根据向前选择法则进入自变量;然后根据向后剔除法,将模型中F值最小的且符合剔除判据的变量剔除模型,重复进行直到回归方程中的自变量均符合进入模型的判据,模型外的自变量都不符合进入模型的判据为止。

这里我们采用系统默认的强行进入法,其他选项均采用系统默认的设置。

(3)点击OK,得到上面定义模型的输出结果为:3.结果及解释(1)方程中包含的自变量列表同时显示进入方法。

如本例中方程中的自变量为x1和x2,选择变量进入方程的方法为Enter。

Variables Entered/RemovedModel Variables Entered Variables Removed Method1 X2, X1 . Entera All requested variables entered.b Dependent Variable: Y(2)模型概述列出了模型的R、R2、调整R2及估计标准误。

相关文档
最新文档