SPSS线性回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
点击“OK”,结果一:确定系数表
结果一告诉我们什么?
表格中的R、R Square和Adjusted R Square都 是用于表示模型的解释能力
通常选择Adjusted R Square作为我们的结论依 据,调整后的R平方越大,说明性别和收入的线 性关系越强,即性别对收入的解释力越强
表中调整后的 R 平方= 0.033 ,表示性别能够解 释收入3.3%的变化
步骤8:将原变量的其余取值都设为“0”
步骤9:点击“Continue”,回到主对话框
步骤10:点击“OK”,生成表示小学的虚拟变量edu1
步骤11:重新点击“Recode”,弹出对话框
步骤12:将四分类的教育变量拖入中间空白框
步骤13:在Name栏中填写第二个虚拟变量edu2
步骤14:在Label栏中填写变量名标签-初中
结果二:方差分析表
结果二告诉我们什么?
结果二是对回归方程进行显著度检验的方 差分析,即判断总体回归系数中至少有一 个不等于0
表中显著度(Sig)<0.001,表明性别与收 入之间具有显著的线性关系。
结果三:回归系数表
结果三告诉我们什么?
与结果一中的确定系数不同,回归系数是回归方 程中 x 的斜率,表示 x 每变化一个单位, y 的平均 变化。
步骤21:重新点击“Recode”,弹出对话框
步骤22:将四分类的教育变量拖入中间空白框
步骤23:在Name栏中填写第二个虚拟变量edu3
步骤24:在Label栏中填写变量名标签-高中
步骤25:点击“Change”按钮
步骤26:点击“Old and New Values”按 钮
步骤27:将原变量中代表高中的“3”设为新变量的 “1”
从表中显著度<0.001,可以发现性别对收入的影 响是非常显著的。
多元线性回归
实例2 将受访者的性别、教育程度 (四分类的教育程度)和年龄作为 自变量,通过多元线性回归,分析 其对月收入的影响。
注意
由于例题中的教育变量是个四分类的定 序变量,因此我们需要设置三个“1”、“0” 取值的虚拟教育变量:edu1、edu2和edu3, 分别用来表示“小学”、“初中”和“高 中”,将“大专及以上”教育类别作为参照 项,其余三个类别分别与其进行比较。
第十讲 线性回归分析
线性回归的作用
用变量的观测数据拟合所关注的变量和影 响其变化的变量之间的线性关系式 检验影响变量的显著程度 比较影响变量的作用大小 用一个或多个变量的变化解释和预测另一 个变量的变化
线性回归的类型
一元线性回归,针对一个影响变量 (自变量)的回归分析 多元线性回归,针对多个影响变量 (自变量)的回归分析
步骤28:将原变量的其余取值都设为“0”
步骤29:点击“Continue”,回到主对话框
步骤30:点击“OK”,生成表示高中的虚拟变量edu3
步骤31:点击“Regression”中的“Linear”,弹出对话 框
步骤32:选择因变量“月收入”
步骤32:选择自变量“虚拟性别”,“edu1”,“edu2”,“edu3”和年龄
变量的测量尺度
因变量:定距变量 自变量:定类、定序变量或定距变量, 对于分类变量需要转换成虚拟变量
回归方程
一元线性Βιβλιοθήκη Baidu归
Y=A+BX+ε
多元线性回归
Y=B0+B1X1+B2X2 +…+ BnXn +ε
线性回归的位置
一元线性回归
实例1 对受访者的性别和月收入进行 一元线性回归分析
注意
当自变量是分类变量时,需要将原 变量转换成虚拟变量,所有虚拟变量都 是 “1”和“0”取值的二分变量。(当原 变量是二分类变量时,我们只需要设定 一个“1”、“0”取值的虚拟变量,并且 把取值为“0”的那个类别作为参照项)
结果三告诉我们什么?
由此我们可以得到回归方程式: y=534.493+137.048×性别-112.371× 小学- 79.864×初中- 65.704×高中- 1.749×年龄
结果三告诉我们什么?
表中 Beta 栏的标准化回归系数的绝对值可 以用于比较各个自变量之间对因变量的贡 献大小:
性别(0.184) > 小学(0.117) > 初中(0.103) > 高中(0.082) > 年龄(0.061)
步骤1:点击“Recode”,弹出对话框
注 意
通常选择Recode into Different Variable
步骤2:将性别拖入中间空白框
步骤3:在Name栏中填写虚拟变量名
步骤4:点击“Change”按钮
步骤5:点击“Old and New Values”按 钮
步骤6:将原变量的“1”设为新变量的“1”
步骤15:点击“Change”按钮
步骤16:点击“Old and New Values”按 钮
步骤17:将原变量中代表初中的“2”设为新变量的 “1”
步骤18:将原变量的其余取值都设为“0”
步骤19:点击“Continue”,回到主对话框
步骤20:点击“OK”,生成表示初中的虚拟变量edu2
– 用一元线性回归分析种族对职业声望的影响 – 用一元线性回归分析教育对职业声望的影响 – 用多元线性回归分析种族、性别、年龄和教育对职 业声望的影响
步骤1:点击“Recode”,弹出对话框
步骤2:将四分类的教育变量拖入中间空白框
步骤3:在Name栏中填写第一个虚拟变量edu1
步骤4:在Label栏中填写变量名标签-小学
步骤5:点击“Change”按钮
步骤6:点击“Old and New Values”按 钮
步骤7:将原变量中表示小学的“1”设为新变量的“1”
结果三告诉我们什么?
Sig栏中每个回归系数的显著度水平,表明 各自所对应的那个自变量与因变量之间是 否存在显著的线性相关关系
从结果看,所有回归系数的显著度(即P值) 都小于 0.05 ,由此,我们可以认为性别、 教育和年龄都会影响受访者的月收入。
练习题
利用 spss 自带的 1991 的美国 GSS 数据,进 行以下分析:
结果三:回归系数表
结果三告诉我们什么?
表中B栏的非标准化回归系数表明:
– 第一,在控制了其他变量之后,男性比女性 的月收入高约137元;
– 第二,小学、初中和高中程度的受访者的月 收入,与大专及以上教育程度的受访者月收 入相比,分别低了约112元、80元和66元;
– 第三,年龄每增加一年,月收入就降低约2元
步骤7:将原变量的“2”设为新变量的“0”
步骤8:点击“Continue”,回到主对话框
步骤8:点击“OK”,生成新的虚拟性别变量
注意
在设置完虚拟变量后,我们才 能正式开始回归分析。
步骤9:点击“Regression”中的“Linear”,弹出对话框
步骤10:选择因变量“月收入”和自变量“性 别”
点击“OK”,结果一:确定系数表
结果一告诉我们什么?
表中调整后的R平方=0.044,表示整 个方程能够解释收入变化的4.4%。 与例1中的确定系数相比,提高了1.1 个百分点。
结果二:方差分析表
结果二告诉我们什么?
表中显著度(Sig)<0.001,表明整个方程 是显著的,也就是说自变量与因变量之间 具有显著的线性关系。 但这并不意味着每个自变量与因变量都具 有显著的线性关系,具体的结论还需要看 后面对每个自变量的回归系数的检验结果。
从表中B=135.406,可以发现男性比女性的平均 月收入多 135.406 元(由于在设定虚拟变量时, 将女性取值为“0” ,因此这里以女性为参照项)。 由此我们可以得到回归方程: y=396.656+135.406X
结果三告诉我们什么?
表中的t检验是针对回归系数的显著度检验,而结 果二中的方差分析是对整个回归方程的检验,在 一元回归分析中,这两种检验结果是等同的。而 在多元回归分析中,则有可能是不同的。整体方 程的显著并不意味着每个回归系数都显著,但每 个系数的显著一定意味着整体方程是显著的。