SPSS线性回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i
_ y y i
2
2
二元线性回归方程检验
ANOVAb
Mod el 1 Reg ression Resid ual Total Sum of Sq uares 1 76 2.5 8 2 5 84 0.7 2 4 7 60 3.3 0 5 df 2 9 70 9 72 Mean Sq uare 8 81 .29 1 6 .02 1 F 1 46 .36 1 Sig. .0 00 a
a. Predictors: (Const ant ), Highest Year School Com pleted, Father b. Dependent Variabl e: Highest Year of School Com pl eted
• • • •
Total Sum of Squares = Residual Sum of Squares = y a bx Regression Sum of Squares R2 = SSR/TSS
一、线性回归分析的基本原理
• • • • (一)相关与回归的关系 (二)回归分析的含义与类型 (三)消减误差比例思想与判定系数 (四)回归分析的逻辑
(一)相关与回归的关系
• • • • 1、相关与回归的关系 (1)函数关系 (2)统计相关:线性相关;非线性相关 (3)因果关系
相关类型
图1
图2
图5
(Wonnacott,R. M. & T. H. Wonnacott, 1979)
(四)多元线性回归分析的逻辑
x1
x11 x12 x13 … x1n
x2
x21 x22 x23 … x2n
x3
x31 x32 x33 … x3n
…
… … … … …
xk
xk1 xk2 xk3 … xkn
y
y1 y2 y3 … yn
如何判定线性拟合(fitness)
1、散点图
2、线性拟合优度指标:判定 系数R2 (0~1)
调整的R2系数:
• 如果增加自变量,不管增加后的自变量是否 与因变量有关系,都会使判定系数(R2)增 大,如果自变量的数目(K)接近样本的个 案数(n), R2将会必然接近于1.0,解决 这一问题的方法是使用“校正的” R2 。
图3
图4
来自百度文库图6
讨论:
• 统计上相关与实际相关?
• • • • • 相关关系 统计相关 因果关系 统计因果关系 相关是回归的基础
(二)回归分析的含义与类型
• (1)含义:自变量每改变一个单位,因变量的均 值变化情况。 • (2)回归模型设定:统计上的“因果”关系,确 定了自变量与因变量(假设)。 • (3)类型: • 根据自变量的多少,可分为一元回归分析、多元 回归分析; • 根据关系类型,可分为线性回归、非线性回归; • 本课程讲解一元线性回归、多元线性回归。
ANOVAb
Mo del 1 Regressio n Resid ual To tal Su m of Squares 28 20.0 28 55 25.4 45 83 45.4 73 df 3 25 28 Mean Square 94 0.00 9 22 1.01 8 F 4.2 53 Sig . .01 5 a
2
• • • •
Total Sum of Squares = Residual Sum of Squares = y a b x Regression Sum of Squares R2 = SSR/TSS
i
_ y y i
1 1
b2 x2
2
三元线性回归方程检验
消减误差比例表达式:
E1
不知道X与Y的关系,在预测Y 值时所产生的全部误差是E1 。
E2
E1-E2
知道X与Y之间的关系,据此 来预测Y值,误差总数是E2 。
在知道X与Y的关系模式的情况下,所消 解掉的的误差=E1-E2
E1 — E2 PRE E1
消减误差比例 (PRE的取值及其意义)
1、PRE数值的取值范围是[o,1] 2、PRE=1,或E2=o,即以X预测Y不会产生任何误 差,则反映X与Y是完全相关 3、PRE=o ,或E2=E1,即以X预测Y所产生的误差相 等于不以X来预测y所产的误差,反映X与Y是不相关。 4、PRE数值越接近1,就表示以X预测Y可以减少的 误差越多,反映二者的相关程度越高;PRE值越 接近0,反映二者的相关程度越低。
a. Predicto r s: (Constant ), 社会资本存量, 集体资产, 治理水平 b. Depend ent V ariable: 总水平
a. Predictors: (Constant), Highest Year School Completed, Mother, Highest Year School Completed, Father b. Dependent Variable: Highest Year of School Completed
一元线性回归方程求解
• Y=aX+b Y
• 最小二乘法求a、b
X
最小二乘法图示
二元线性回归方程
Y Y
X1
自变量X1与Y的散点图
X2
自变量X2与Y的散点图
• Y=a1X1+a2X2+b
(三)“消减误差比例”思想
——用“已知”来估计“未知”、减少犯错概率 • 1、要预测或理解社会现象Y变化的情况难免会有 误差。 • 2、如果知道X与Y有关系,根据X的值来预测Y的 值,可以减少若干误差。 • 3、X与Y的关系愈强,所能减少的预测误差就会 愈多。 • 4、 所削减的误差的多少,可以反映X与Y相关的 强弱程度 。 • 5、消减误差比例:表示用一个现象(如变量X)来 解释另一个现象(如变量Y)时能够消减的总误差的 比例,即减少的误差与原来的全部误差之比。
y′
y 1′ y 2′ y 3′ … yn′
一元线性回归方程检验
ANOVAb
Mod el 1 Reg ression Resid ual Total Sum of Sq uares 1 86 7.8 9 6 6 82 9.9 6 3 8 69 7.8 5 9 df 1 1 06 3 1 06 4 Mean Sq uare 1 86 7.8 9 6 6 .42 5 F 2 90 .71 5 Sig. .0 00 a
_ y y i
2
2
二元线性回归方程检验
ANOVAb
Mod el 1 Reg ression Resid ual Total Sum of Sq uares 1 76 2.5 8 2 5 84 0.7 2 4 7 60 3.3 0 5 df 2 9 70 9 72 Mean Sq uare 8 81 .29 1 6 .02 1 F 1 46 .36 1 Sig. .0 00 a
a. Predictors: (Const ant ), Highest Year School Com pleted, Father b. Dependent Variabl e: Highest Year of School Com pl eted
• • • •
Total Sum of Squares = Residual Sum of Squares = y a bx Regression Sum of Squares R2 = SSR/TSS
一、线性回归分析的基本原理
• • • • (一)相关与回归的关系 (二)回归分析的含义与类型 (三)消减误差比例思想与判定系数 (四)回归分析的逻辑
(一)相关与回归的关系
• • • • 1、相关与回归的关系 (1)函数关系 (2)统计相关:线性相关;非线性相关 (3)因果关系
相关类型
图1
图2
图5
(Wonnacott,R. M. & T. H. Wonnacott, 1979)
(四)多元线性回归分析的逻辑
x1
x11 x12 x13 … x1n
x2
x21 x22 x23 … x2n
x3
x31 x32 x33 … x3n
…
… … … … …
xk
xk1 xk2 xk3 … xkn
y
y1 y2 y3 … yn
如何判定线性拟合(fitness)
1、散点图
2、线性拟合优度指标:判定 系数R2 (0~1)
调整的R2系数:
• 如果增加自变量,不管增加后的自变量是否 与因变量有关系,都会使判定系数(R2)增 大,如果自变量的数目(K)接近样本的个 案数(n), R2将会必然接近于1.0,解决 这一问题的方法是使用“校正的” R2 。
图3
图4
来自百度文库图6
讨论:
• 统计上相关与实际相关?
• • • • • 相关关系 统计相关 因果关系 统计因果关系 相关是回归的基础
(二)回归分析的含义与类型
• (1)含义:自变量每改变一个单位,因变量的均 值变化情况。 • (2)回归模型设定:统计上的“因果”关系,确 定了自变量与因变量(假设)。 • (3)类型: • 根据自变量的多少,可分为一元回归分析、多元 回归分析; • 根据关系类型,可分为线性回归、非线性回归; • 本课程讲解一元线性回归、多元线性回归。
ANOVAb
Mo del 1 Regressio n Resid ual To tal Su m of Squares 28 20.0 28 55 25.4 45 83 45.4 73 df 3 25 28 Mean Square 94 0.00 9 22 1.01 8 F 4.2 53 Sig . .01 5 a
2
• • • •
Total Sum of Squares = Residual Sum of Squares = y a b x Regression Sum of Squares R2 = SSR/TSS
i
_ y y i
1 1
b2 x2
2
三元线性回归方程检验
消减误差比例表达式:
E1
不知道X与Y的关系,在预测Y 值时所产生的全部误差是E1 。
E2
E1-E2
知道X与Y之间的关系,据此 来预测Y值,误差总数是E2 。
在知道X与Y的关系模式的情况下,所消 解掉的的误差=E1-E2
E1 — E2 PRE E1
消减误差比例 (PRE的取值及其意义)
1、PRE数值的取值范围是[o,1] 2、PRE=1,或E2=o,即以X预测Y不会产生任何误 差,则反映X与Y是完全相关 3、PRE=o ,或E2=E1,即以X预测Y所产生的误差相 等于不以X来预测y所产的误差,反映X与Y是不相关。 4、PRE数值越接近1,就表示以X预测Y可以减少的 误差越多,反映二者的相关程度越高;PRE值越 接近0,反映二者的相关程度越低。
a. Predicto r s: (Constant ), 社会资本存量, 集体资产, 治理水平 b. Depend ent V ariable: 总水平
a. Predictors: (Constant), Highest Year School Completed, Mother, Highest Year School Completed, Father b. Dependent Variable: Highest Year of School Completed
一元线性回归方程求解
• Y=aX+b Y
• 最小二乘法求a、b
X
最小二乘法图示
二元线性回归方程
Y Y
X1
自变量X1与Y的散点图
X2
自变量X2与Y的散点图
• Y=a1X1+a2X2+b
(三)“消减误差比例”思想
——用“已知”来估计“未知”、减少犯错概率 • 1、要预测或理解社会现象Y变化的情况难免会有 误差。 • 2、如果知道X与Y有关系,根据X的值来预测Y的 值,可以减少若干误差。 • 3、X与Y的关系愈强,所能减少的预测误差就会 愈多。 • 4、 所削减的误差的多少,可以反映X与Y相关的 强弱程度 。 • 5、消减误差比例:表示用一个现象(如变量X)来 解释另一个现象(如变量Y)时能够消减的总误差的 比例,即减少的误差与原来的全部误差之比。
y′
y 1′ y 2′ y 3′ … yn′
一元线性回归方程检验
ANOVAb
Mod el 1 Reg ression Resid ual Total Sum of Sq uares 1 86 7.8 9 6 6 82 9.9 6 3 8 69 7.8 5 9 df 1 1 06 3 1 06 4 Mean Sq uare 1 86 7.8 9 6 6 .42 5 F 2 90 .71 5 Sig. .0 00 a