SAS统计之第五章-线性回归分析报告
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归方程: yˆ = a + b x
a 称为回归截距 b 称为回归系数 i 称为随机误差
第二节 线性回归方程
回归参数的计算——最小二乘法
期望拟合的线性回归方程与试验资料的误差
最小,拟合的误差也称作离回归平方和或残 差 ,可以利用数学中求极值的方法解出 a 和 b 而使得误差平方和为最小。
误差平方和:
对于任一个点有:( y y) ( y yˆ) ( yˆ y) 两边平方得:
( y y)2 ( y yˆ)2 2( y yˆ)( yˆ y) ( yˆ y)2
对数据资料所有点的求和得:
(y y)2 (y yˆ)2 2(y yˆ)( yˆ y) (yˆ y)2
三个平方和的计算公式:
总平方和: T SSy (y y)2 y2 ( y)2 / n 回归平方和: U SSr (yˆ y)2
a y bx, yˆ a bx, yˆ y bx bx, yˆ y b(x x), (yˆ y)2 b2 (x x)2 ,
Βιβλιοθήκη Baidu
(3)式各项乘 x:a x b( x)2 / n x y / n (5)
(2)-(5)式得:b[ x2 ( x)2 / n] xy x y / n
即:b (x x)2 (x x)( y y)
于是:b (x x)( y y) / (x x)2 SPxy / SSx
第三节 回归关系的显著性检验
对所有点求和得:
(y
yˆ)( yˆ
y)
b[SPxy
SPxy SS x
SSx ]
0
于是:y 的总平方和便分解为两个部分:
(y y)2 (y yˆ)2 (yˆ y)2
y 的总平方和 误差平方和 回归平方和
T SSy
Q SSe U SSr
第三节 回归关系的显著性检验
H0 : =0 vs HA: ≠0
只有在此检验结果为显著时,用 a 估计 ,用 b
估计 ,用 yˆ 估计 y 才是有意义的。
对此统计假设有两种检验方法:
F 检验法 和 t 检验法
注:df1=1,df2=n-2的一尾F值等于df=n-2的两尾t值的平方
第三节 回归关系的显著性检验
1.F检验法
第三节 回归关系的显著性检验
2.t 检验法
H0: =0 vs HA:≠0
选择 t 统计量: t b
其中回归系数 b
sb
其标准误:
sb
se SSx
Q n2 SSx
y yˆ 2
n2
x x 2
实例:
研究光照强度与净光合强度的关系
光照 强度X
300 700 1000 1500 2200 3000 4000 5000 6000 7000
利用下图说明F检验法的基本原理。
当自变量为 x ,对应的
y
因变量的实测值为 y,
yˆ
y y
y yˆ 因变量的预测值为 yˆ 。 yˆ y 于是 y的离均差 y y
y
可分解为两个部分:
y y ( y yˆ) ( yˆ y)
xx
离均差 随机误差 回归引起的偏差
第三节 回归关系的显著性检验
U b2 (x x)2 b2SSx bSPxy SPx2y / SSx
误差平方和: SSe SS y SSr
或 Q T U
第三节 回归关系的显著性检验
利用方差分析表
变异来源 自由度 平方和
回归
1
U
误差
n-2
Q
总变异 n-1
T
均方
sU2 se2
F值
F0.05
sU2 se2
检验结论:若F > F0.05,则存在显著的线性回归关系。
)
0
整理得正规方程组:
na b x y
a x b x2 xy
第二节 线性回归方程
解正规方程组: na b x y (1) a x b x2 xy (2)
(1)式除以 n 得: a b( x / n) y / n
(3)
于是: a y / n b( x / n) y bx (4)
证明:上式右边的中间项为0:
yˆ a bx ( y bx) bx y b(x x) 即 ( yˆ y) b(x x)
y yˆ y [( y bx) bx] 即( y yˆ) ( y y) b(x x)
( y yˆ)( yˆ y) b(x x)[( y y) b(x x)] b[(x x)( y y) b(x x)2 ]
一个变量来预测另一个变量。
一元线性回归:最简单的回归关系,即一个
变量y在一个变量x上的回归关系,称x为自变 量,y为因变量(或称响应变量、依赖变量)
第一节 一元线性回归
如果两个变量x,y之间存在线性回归关系,
则有回归模型:
总体:yi = + xi + i 样本:yi = a + b xi + i
净光合 强度Y
140 260 300 380 410 492 580 690 740 830
一级计算: x 30700 y 4822 x2 143670000 y2 2780764 xy 19492000 n 10
第五章 线性回归分析
一、一元线性回归 二、一元线性回归方程 三、回归关系的显著性检验 四、置信区间 五、多元线性回归 六、回归诊断
第一节 一元线性回归
生产实践中,常常能找到一个变量与另外一
个变量之间的关系:小麦的施肥量与产量、 水稻的株高和穗长、冬天的温度与来年病虫 害的发生程度等等。
回归分析就是找出合适的回归方程,从而用
线性回归方程便已求出为: yˆ a bx
第三节 回归关系的显著性检验
如果在模型 yi= + xi +i 中, = 0,这就意味
着不管 xi为什么值, yi 都不发生实质性变化;换言 之,x和 y 之间没有显著的回归关系。
检验线性回归关系是否存在,就是检验建立回归
模型的样本是否来自存在回归关系的总体,即
n
n
Q yi yˆi 2 (yi a bxi )2
i 1
i 1
第二节 线性回归方程
n
n
Q yi yˆi 2 (yi a bxi )2
i 1
i 1
分别求Q 对a 和b 的偏导数,令其等于 0:
Q a
2
(y
a
bx)
2(
y
na
b
x)
0
Q b
2
(y
a
bx) x
2(
xy
a
x
b
x2
a 称为回归截距 b 称为回归系数 i 称为随机误差
第二节 线性回归方程
回归参数的计算——最小二乘法
期望拟合的线性回归方程与试验资料的误差
最小,拟合的误差也称作离回归平方和或残 差 ,可以利用数学中求极值的方法解出 a 和 b 而使得误差平方和为最小。
误差平方和:
对于任一个点有:( y y) ( y yˆ) ( yˆ y) 两边平方得:
( y y)2 ( y yˆ)2 2( y yˆ)( yˆ y) ( yˆ y)2
对数据资料所有点的求和得:
(y y)2 (y yˆ)2 2(y yˆ)( yˆ y) (yˆ y)2
三个平方和的计算公式:
总平方和: T SSy (y y)2 y2 ( y)2 / n 回归平方和: U SSr (yˆ y)2
a y bx, yˆ a bx, yˆ y bx bx, yˆ y b(x x), (yˆ y)2 b2 (x x)2 ,
Βιβλιοθήκη Baidu
(3)式各项乘 x:a x b( x)2 / n x y / n (5)
(2)-(5)式得:b[ x2 ( x)2 / n] xy x y / n
即:b (x x)2 (x x)( y y)
于是:b (x x)( y y) / (x x)2 SPxy / SSx
第三节 回归关系的显著性检验
对所有点求和得:
(y
yˆ)( yˆ
y)
b[SPxy
SPxy SS x
SSx ]
0
于是:y 的总平方和便分解为两个部分:
(y y)2 (y yˆ)2 (yˆ y)2
y 的总平方和 误差平方和 回归平方和
T SSy
Q SSe U SSr
第三节 回归关系的显著性检验
H0 : =0 vs HA: ≠0
只有在此检验结果为显著时,用 a 估计 ,用 b
估计 ,用 yˆ 估计 y 才是有意义的。
对此统计假设有两种检验方法:
F 检验法 和 t 检验法
注:df1=1,df2=n-2的一尾F值等于df=n-2的两尾t值的平方
第三节 回归关系的显著性检验
1.F检验法
第三节 回归关系的显著性检验
2.t 检验法
H0: =0 vs HA:≠0
选择 t 统计量: t b
其中回归系数 b
sb
其标准误:
sb
se SSx
Q n2 SSx
y yˆ 2
n2
x x 2
实例:
研究光照强度与净光合强度的关系
光照 强度X
300 700 1000 1500 2200 3000 4000 5000 6000 7000
利用下图说明F检验法的基本原理。
当自变量为 x ,对应的
y
因变量的实测值为 y,
yˆ
y y
y yˆ 因变量的预测值为 yˆ 。 yˆ y 于是 y的离均差 y y
y
可分解为两个部分:
y y ( y yˆ) ( yˆ y)
xx
离均差 随机误差 回归引起的偏差
第三节 回归关系的显著性检验
U b2 (x x)2 b2SSx bSPxy SPx2y / SSx
误差平方和: SSe SS y SSr
或 Q T U
第三节 回归关系的显著性检验
利用方差分析表
变异来源 自由度 平方和
回归
1
U
误差
n-2
Q
总变异 n-1
T
均方
sU2 se2
F值
F0.05
sU2 se2
检验结论:若F > F0.05,则存在显著的线性回归关系。
)
0
整理得正规方程组:
na b x y
a x b x2 xy
第二节 线性回归方程
解正规方程组: na b x y (1) a x b x2 xy (2)
(1)式除以 n 得: a b( x / n) y / n
(3)
于是: a y / n b( x / n) y bx (4)
证明:上式右边的中间项为0:
yˆ a bx ( y bx) bx y b(x x) 即 ( yˆ y) b(x x)
y yˆ y [( y bx) bx] 即( y yˆ) ( y y) b(x x)
( y yˆ)( yˆ y) b(x x)[( y y) b(x x)] b[(x x)( y y) b(x x)2 ]
一个变量来预测另一个变量。
一元线性回归:最简单的回归关系,即一个
变量y在一个变量x上的回归关系,称x为自变 量,y为因变量(或称响应变量、依赖变量)
第一节 一元线性回归
如果两个变量x,y之间存在线性回归关系,
则有回归模型:
总体:yi = + xi + i 样本:yi = a + b xi + i
净光合 强度Y
140 260 300 380 410 492 580 690 740 830
一级计算: x 30700 y 4822 x2 143670000 y2 2780764 xy 19492000 n 10
第五章 线性回归分析
一、一元线性回归 二、一元线性回归方程 三、回归关系的显著性检验 四、置信区间 五、多元线性回归 六、回归诊断
第一节 一元线性回归
生产实践中,常常能找到一个变量与另外一
个变量之间的关系:小麦的施肥量与产量、 水稻的株高和穗长、冬天的温度与来年病虫 害的发生程度等等。
回归分析就是找出合适的回归方程,从而用
线性回归方程便已求出为: yˆ a bx
第三节 回归关系的显著性检验
如果在模型 yi= + xi +i 中, = 0,这就意味
着不管 xi为什么值, yi 都不发生实质性变化;换言 之,x和 y 之间没有显著的回归关系。
检验线性回归关系是否存在,就是检验建立回归
模型的样本是否来自存在回归关系的总体,即
n
n
Q yi yˆi 2 (yi a bxi )2
i 1
i 1
第二节 线性回归方程
n
n
Q yi yˆi 2 (yi a bxi )2
i 1
i 1
分别求Q 对a 和b 的偏导数,令其等于 0:
Q a
2
(y
a
bx)
2(
y
na
b
x)
0
Q b
2
(y
a
bx) x
2(
xy
a
x
b
x2