Spss线性回归分析讲稿
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.创建一个数据文件 数据文件的创建分成三个步骤:
(1)选择菜单 【文件】→【新建】→【数据】新建 一个数据文件,进入数据
编辑窗口。窗口顶部标题为“spss 数据编辑器”。 (2)单击左下角【变量视窗】标签进入变量视图界
面,根据试验的设计定义每个变量类型。
(3)变量定义完成以后,单击【数据视窗】标签进 入数据视窗界面,将每个具体的变量值录入数据库 单元格内。
管理学分析方法
——spss线性回归分析
行者管理 杨燕
回归分析
(一)回归分析内涵
1、含义:回归分析是指通过一个变量或一些变量的变化解释 另一个变量的变化。因果关系预测一般采用回归分析方法 预测。
2、回归的分类 (1)按自变量的个数分 ①一元线性回归:y=a+bx (有一个自变量) ②多元线性回归:
(有两个或两个以上的自变量) (2)按回归曲线的形态分 ①线性(直线)回归 ②非线性(曲线)回归
重叠散点图
三维散点图
多元线性回归分析
2、在【线性回归】对话框中【方法】
自变量筛选方法 ������ 全回归法-Enter ������ 向前删除法-Forward ������ 向后删除法- Backward ������ 逐步回归法- Stepwise ������ 强迫剔除法-Remove
多元线性回归
回归分析
(二)回归分析的主要内容
1、从一组数据出发,确定因变量和自变量的关系式; 2、对关系式中的参数进行估计,并进行统计检验; 3、筛选自变量,即从大量自变量中找出影响显著的,剔除不
显著的; 4、用求得的回归模型进行预测; 5、对预测结果进行分析、评价。 (三)回归分析的作用 通过回归分析找出变量之间的关系,并确定之间的因果关系,
多元线性回归
(二)回归直线意义的F检验 1、������ 统计量F=平均回归平方和/平均残差平方和。若F值过
小说明自变量对因变量的解释力度很差,拟合的回归直线 没有意义,相反若概率值(SPSS中以sig表示,越小越好) 2、F>Fa且P<Pa,说明回归模型解释力度强,反之亦然。 3、F假设 H0:所有的B值都低于0,H1:至少有一个B不等于0 (1)F(K-1,n-k)>Fa,则拒绝H0假设,即P<Pa(sig) (2)F(K-1,n-k)<Fa,则不拒绝H0假设,即P>=Pa(sig) 注:可查F-分布表得Fa的值。
(三)T检验 1、是对回归方程每一个回归系数检验。 2、T检验方法与F检验方法差不多,在spss分析结果表中以sig 表示,即P值越小就说明回归系数与因变量的相关度高。 3、假设检验 H0:B1=0 B2=0, H1:B1≠0 B2 ≠0 注:查T-分布表
(四)残差的独立性检验
Durbin-Watson检验的参数D的取值范围是 0<D<4,与2越接近表示残差与自变量越独立。 见下图
多重共线性问题
1、多重共线性的标志 R平方较大但没有几个显著的t统计量,预示着多重共线性的
存在。实际上,有可能回归方程的F统计量高度显著,而每 个t统计量不显著 一对或多对解释变量的简单相关系数相对比较高可能意味着 多重共线的存在
2、多重共线性克服在运用spss分析时,可采用逐步回 归法来克服多重共线性问题
图1 奖金-销售量表
一元线性回归
以奖金-销售量表图1做回归分析
2、绘制散点图 打开数据文件,选择【图形】-【旧对话框】-【散点/点状】
图2
选择简单分布,单 击定义,打开子 对话框,选择X 变量和Y变量, 如图3
单击确定提交系统 运行,结果见图4 所示
图3
一元线性回归
从图上可直观地看出奖金与销售量之间存在线性相关关系
表1
一元线性回归
4、线性回归分析
步骤1:选择菜单栏 “【分析】—>【回 归】—>【线性】”, 打开线性回归 对话框。 将变量销售量y移入 【因变量】列表框中, 将奖金x移入【自变量】 列表框中。在【方法】 框中选择【进入】 选 项,表示所选自变量 全部进入回归模型。
Hale Waihona Puke Baidu
一元线性回归分析
步骤2:单击 【统计量】 按钮,如图 在【统计量】 子对话框。 该对话框中 设置要输出 的统计量。 这里选中估 计、模型拟 合度复选框。
销 售 量
图4 散点图
奖金
一元线性回归分析
3、简单相关分析
选择【分析】—>【相关】—>【双变量】,打开对话框,将 变量“销售量”与“奖金”移入变量(variables)列表框
点击确定运行,结果如表5 所示
一元线性回归分析
从表中可得到两变量之间的皮尔逊相关系数为0.995, 双尾检验概率p值尾0.000<0.05,故变量之间显著相关。 根据奖金与销售量之间的散点图与相关分析显示,奖 金与销售量之间存在显著的正相关关系。在此前提下 进一步进行回归分析,建立一元线性回归方程。
表3
一元线性回归分析
表4给出了回归模型的方差分析表,可以看到,F统计量为 734.627,对应的p值为0,所以,拒绝模型整体不显著的 原假设,即该模型的整体是显著的。
表4
一元线性回归分析
表5给出了回归系数、回归系数的标准差、标准化的回归系数值以及 各个回归系数的显著性t检验。从表中可以看到解释变量x及常量其t统 计量对应的p值都小于显著性水平0.05,因此,在0.05的显著性水平 下都通过了t检验。变量x的回归系数为2.964,即奖金每增加1%,销 售量就增加2.964。
通过数学模型预测因变量的发展。
一元线性回归
一、一元线性回归模型
存在偏差
最小二乘法
Y a bX
Y a b Xi i
Yˆ a bX
X为自变量的取值,Yˆ 为因变量的取值,a为拟合线上经过Y轴上的 点截距,b为拟合线上的斜率
Y Y=a+bx
X
一元线性回归
二、一元线性回归spss操作过程
表5
为了判断随机扰动项是否服从正态分布,观察图5所示的标准化残差 的P-P图,可以发现,各观测的散点基本上都分布在对角线上,据 此可以初步判断残差服从正态分布。
图5
一元线性回归分析
4、建立回归模型: 根据一元回归模型:
Yˆ a bX 把表5中“非标准化回归系数”栏目中的“B”
一元线性回归分析
其余保持Spss默认选项。在主对话框中单击确定按钮,执行线性回归 命令,其结果如下:
表2 •表3给出了回归模型的拟和优度(R Square)、调整的拟和优度(Adjusted RSquare)、估计标准差(Std. Error of the Estimate)以及Durbin-Watson统 计量。从结果来看,回归的确定系数和调整的可决系数分别为0.989和0.988, 即销售量的95%以上的变动都可以被该模型所解释,拟和优度较高。
多元线性回归
三、线性回归检验
(一)复相关系数R及判定系数R2 确定系数又叫判定系数,为回归的误差平方和占总误差平方和
的比例,是对线性方程拟合优度的检验。 R=S回/S总 (-1<R<1) 1、R=1时,样本点完全落在回归直线上,表示y与x完全线性
正相关,R=-1时,表示y与x完全线性负相关 2、当0<R<1时,表示y与x有一定线性正相关 3、当-1<R<0时,表示y与x有一定线性负相关 4、当R=0时,表示y与x之间不存在线性相关关系 总结:R越接近1拟合度就越好
看例子 “农民工流动的问题及需求分析——基于多元线性回归分 析” “云南主要农产品出口贸易对云南经济增长的影响——基于
多元线性回归模型的实证分析”
一元线性回归分析
步骤3:单击 【绘制】 按钮,在 【图】子 对话框中 的标准化 残差图选 项栏中选 中正态概 率图复选 框,以便 对残差的 正态性进 行分析
步骤4:单击 【保存】按 钮,在【保 存】子对话 框中【残差】 选项栏中选 中【未标准 化】复选框, 单击【继续】 这样可以在 数据文件中 生成一个变 量名尾res_1 的残差变量, 以便对残差 进行进一步 分析。
列系数代入上式得预报方程:
Yˆ 2.16 296 X
多元线性回归分析 一、多元线性回归模型
影响因变量的自变量有两个或两个以上的时候,称之为 多元,如果他们之间有线性关系,就是多元线性回归。
多元线性回归分析在spss分析过程和一元线性回 归分析差不多,下面列出不同点
多元线性回归分析
1、做散点图 多个变量则做出散点图矩阵、重叠散点图和三维散点图
二、多元线性回归分析的要点
在多元线性回归中,有多个自变量,应当首先 绘制各自变量与因变量之间的关系散点图,观 察其与因变量之间是否具有线性关系。然后, 将自变量进行组合,生成若干自变量的子集,再 针对每一个自变量的子集生成回归分析报告。 比较调整后的R2值,挑选最优的自变量子集, 生成回归分析模型。
(1)选择菜单 【文件】→【新建】→【数据】新建 一个数据文件,进入数据
编辑窗口。窗口顶部标题为“spss 数据编辑器”。 (2)单击左下角【变量视窗】标签进入变量视图界
面,根据试验的设计定义每个变量类型。
(3)变量定义完成以后,单击【数据视窗】标签进 入数据视窗界面,将每个具体的变量值录入数据库 单元格内。
管理学分析方法
——spss线性回归分析
行者管理 杨燕
回归分析
(一)回归分析内涵
1、含义:回归分析是指通过一个变量或一些变量的变化解释 另一个变量的变化。因果关系预测一般采用回归分析方法 预测。
2、回归的分类 (1)按自变量的个数分 ①一元线性回归:y=a+bx (有一个自变量) ②多元线性回归:
(有两个或两个以上的自变量) (2)按回归曲线的形态分 ①线性(直线)回归 ②非线性(曲线)回归
重叠散点图
三维散点图
多元线性回归分析
2、在【线性回归】对话框中【方法】
自变量筛选方法 ������ 全回归法-Enter ������ 向前删除法-Forward ������ 向后删除法- Backward ������ 逐步回归法- Stepwise ������ 强迫剔除法-Remove
多元线性回归
回归分析
(二)回归分析的主要内容
1、从一组数据出发,确定因变量和自变量的关系式; 2、对关系式中的参数进行估计,并进行统计检验; 3、筛选自变量,即从大量自变量中找出影响显著的,剔除不
显著的; 4、用求得的回归模型进行预测; 5、对预测结果进行分析、评价。 (三)回归分析的作用 通过回归分析找出变量之间的关系,并确定之间的因果关系,
多元线性回归
(二)回归直线意义的F检验 1、������ 统计量F=平均回归平方和/平均残差平方和。若F值过
小说明自变量对因变量的解释力度很差,拟合的回归直线 没有意义,相反若概率值(SPSS中以sig表示,越小越好) 2、F>Fa且P<Pa,说明回归模型解释力度强,反之亦然。 3、F假设 H0:所有的B值都低于0,H1:至少有一个B不等于0 (1)F(K-1,n-k)>Fa,则拒绝H0假设,即P<Pa(sig) (2)F(K-1,n-k)<Fa,则不拒绝H0假设,即P>=Pa(sig) 注:可查F-分布表得Fa的值。
(三)T检验 1、是对回归方程每一个回归系数检验。 2、T检验方法与F检验方法差不多,在spss分析结果表中以sig 表示,即P值越小就说明回归系数与因变量的相关度高。 3、假设检验 H0:B1=0 B2=0, H1:B1≠0 B2 ≠0 注:查T-分布表
(四)残差的独立性检验
Durbin-Watson检验的参数D的取值范围是 0<D<4,与2越接近表示残差与自变量越独立。 见下图
多重共线性问题
1、多重共线性的标志 R平方较大但没有几个显著的t统计量,预示着多重共线性的
存在。实际上,有可能回归方程的F统计量高度显著,而每 个t统计量不显著 一对或多对解释变量的简单相关系数相对比较高可能意味着 多重共线的存在
2、多重共线性克服在运用spss分析时,可采用逐步回 归法来克服多重共线性问题
图1 奖金-销售量表
一元线性回归
以奖金-销售量表图1做回归分析
2、绘制散点图 打开数据文件,选择【图形】-【旧对话框】-【散点/点状】
图2
选择简单分布,单 击定义,打开子 对话框,选择X 变量和Y变量, 如图3
单击确定提交系统 运行,结果见图4 所示
图3
一元线性回归
从图上可直观地看出奖金与销售量之间存在线性相关关系
表1
一元线性回归
4、线性回归分析
步骤1:选择菜单栏 “【分析】—>【回 归】—>【线性】”, 打开线性回归 对话框。 将变量销售量y移入 【因变量】列表框中, 将奖金x移入【自变量】 列表框中。在【方法】 框中选择【进入】 选 项,表示所选自变量 全部进入回归模型。
Hale Waihona Puke Baidu
一元线性回归分析
步骤2:单击 【统计量】 按钮,如图 在【统计量】 子对话框。 该对话框中 设置要输出 的统计量。 这里选中估 计、模型拟 合度复选框。
销 售 量
图4 散点图
奖金
一元线性回归分析
3、简单相关分析
选择【分析】—>【相关】—>【双变量】,打开对话框,将 变量“销售量”与“奖金”移入变量(variables)列表框
点击确定运行,结果如表5 所示
一元线性回归分析
从表中可得到两变量之间的皮尔逊相关系数为0.995, 双尾检验概率p值尾0.000<0.05,故变量之间显著相关。 根据奖金与销售量之间的散点图与相关分析显示,奖 金与销售量之间存在显著的正相关关系。在此前提下 进一步进行回归分析,建立一元线性回归方程。
表3
一元线性回归分析
表4给出了回归模型的方差分析表,可以看到,F统计量为 734.627,对应的p值为0,所以,拒绝模型整体不显著的 原假设,即该模型的整体是显著的。
表4
一元线性回归分析
表5给出了回归系数、回归系数的标准差、标准化的回归系数值以及 各个回归系数的显著性t检验。从表中可以看到解释变量x及常量其t统 计量对应的p值都小于显著性水平0.05,因此,在0.05的显著性水平 下都通过了t检验。变量x的回归系数为2.964,即奖金每增加1%,销 售量就增加2.964。
通过数学模型预测因变量的发展。
一元线性回归
一、一元线性回归模型
存在偏差
最小二乘法
Y a bX
Y a b Xi i
Yˆ a bX
X为自变量的取值,Yˆ 为因变量的取值,a为拟合线上经过Y轴上的 点截距,b为拟合线上的斜率
Y Y=a+bx
X
一元线性回归
二、一元线性回归spss操作过程
表5
为了判断随机扰动项是否服从正态分布,观察图5所示的标准化残差 的P-P图,可以发现,各观测的散点基本上都分布在对角线上,据 此可以初步判断残差服从正态分布。
图5
一元线性回归分析
4、建立回归模型: 根据一元回归模型:
Yˆ a bX 把表5中“非标准化回归系数”栏目中的“B”
一元线性回归分析
其余保持Spss默认选项。在主对话框中单击确定按钮,执行线性回归 命令,其结果如下:
表2 •表3给出了回归模型的拟和优度(R Square)、调整的拟和优度(Adjusted RSquare)、估计标准差(Std. Error of the Estimate)以及Durbin-Watson统 计量。从结果来看,回归的确定系数和调整的可决系数分别为0.989和0.988, 即销售量的95%以上的变动都可以被该模型所解释,拟和优度较高。
多元线性回归
三、线性回归检验
(一)复相关系数R及判定系数R2 确定系数又叫判定系数,为回归的误差平方和占总误差平方和
的比例,是对线性方程拟合优度的检验。 R=S回/S总 (-1<R<1) 1、R=1时,样本点完全落在回归直线上,表示y与x完全线性
正相关,R=-1时,表示y与x完全线性负相关 2、当0<R<1时,表示y与x有一定线性正相关 3、当-1<R<0时,表示y与x有一定线性负相关 4、当R=0时,表示y与x之间不存在线性相关关系 总结:R越接近1拟合度就越好
看例子 “农民工流动的问题及需求分析——基于多元线性回归分 析” “云南主要农产品出口贸易对云南经济增长的影响——基于
多元线性回归模型的实证分析”
一元线性回归分析
步骤3:单击 【绘制】 按钮,在 【图】子 对话框中 的标准化 残差图选 项栏中选 中正态概 率图复选 框,以便 对残差的 正态性进 行分析
步骤4:单击 【保存】按 钮,在【保 存】子对话 框中【残差】 选项栏中选 中【未标准 化】复选框, 单击【继续】 这样可以在 数据文件中 生成一个变 量名尾res_1 的残差变量, 以便对残差 进行进一步 分析。
列系数代入上式得预报方程:
Yˆ 2.16 296 X
多元线性回归分析 一、多元线性回归模型
影响因变量的自变量有两个或两个以上的时候,称之为 多元,如果他们之间有线性关系,就是多元线性回归。
多元线性回归分析在spss分析过程和一元线性回 归分析差不多,下面列出不同点
多元线性回归分析
1、做散点图 多个变量则做出散点图矩阵、重叠散点图和三维散点图
二、多元线性回归分析的要点
在多元线性回归中,有多个自变量,应当首先 绘制各自变量与因变量之间的关系散点图,观 察其与因变量之间是否具有线性关系。然后, 将自变量进行组合,生成若干自变量的子集,再 针对每一个自变量的子集生成回归分析报告。 比较调整后的R2值,挑选最优的自变量子集, 生成回归分析模型。