第十章简单回归与相关(2讲课)PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例10.7
某地连续几年测定3月下旬至4月中旬旬平均温 度累积值与一代三化螟盛发期的关系如下:
旬平均温度 34.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2 累积值(℃)
一代三化螟 盛发期(天)
12
16
9
2
7
3
13
9 -1
以5月10日为0。试求盛发期对温度累计值的一 元线性回归方程。
无效假设的总体中获得现样本的概率<0.05。
回归截距的意义为:旬平均温度累积值为0时, 一代三代螟的平均盛发期。
也可将回归方程用图形表示。 因为两点决定一条直线,所以只要取一大一小
两个 x值代人回归方程求出相应的 yˆ 值,根据点
x1,yˆ1 和 x2,yˆ2 即可绘出回归直线。
更简单的方法是根据回归方程的特性(3),直接
用(0,a)和 x,y 两个点绘出回归直线。
[例10.8]
试求例10.7中Q和 s y x 。
用式(10.19)计算分别为
Q24 .595 51 65 .094247 4.6 4670
14 .64356
2.5 4 5 9 1 .0 5 9 1 6 .0 9 54 6 9 7 .6 4 4 7 404
2 . 5 4 5 1 . 9 0 5 2 9 1 6 . 6 9 4 3 6 7 4 . 6 5 4 7 648
x33 .7/3 93.0 7778
y70/97.7778
b 159.0444 1.099(6 天/ 度) 144.6356
a 7 .77 7 1 .08 9 3 9 .0 7 6 778
48.548(5天)
得一元线性回归方程
yˆ4.8 54 81.0 59x96
其中回归系数的意义为:旬平均温度累积值每 增加1℃,一代三化螟盛发期平均将提前 1.0996 天;
794
xy 414.0 545.6 285.3 80.6 257.6 120.6 412.1 352.8 -44.2 2436.4
SxS 12.4 5 9 3 1.3 7 2/3 9 1.4 64 356 SyS797 420/924.59556 S 2 P.4 3 3 .7 3 7 6 /3 9 0 1.0 54 94
有1个自由度。
后者即离差平方和,它反映了实际观察值Y对
回归估计值 yˆ 的偏离,因此也称离回归平方和。
直接计算离差平方和既麻烦又易引入计算误差,
所以一般可用下面4式之一来求
Q
SSy
SP2 SSx
QSSy bSP
(10.19A) (10.19B)
QSSy b2SSx
(10.19C)
Q y2a y b xy(10.19D)
x
y
x2
y2
34.5
12
1190.25
144
34.1
16
1162.81
256
31.7
9
1004.89
81
40.3
2
1624.09
4
36.8
7
1354.24
49
40.2
3
1616.04
9
31.7
13
1004.89
169
39.2
9
1536.64
81
44.2
-1
1953.64
1
∑ 333.7
70
12517.49
7 4 9 . 5 8 4 7 4 1 0 8 . 0 5 9 2. 4 9 4 7 . 6 6 3 4 7 60
显然以(10.19A)的最为精确。
sy/x
百度文库
74.66703.26( 6 天) 92
s y / x =3.266天的统计意义为在 yˆ ±3.266天的 范围内大约有68.27%的观察点,在多 yˆ ±6.532
例10.7的回归直线及实际观察点示于图10.6。
二、回归方程的假设测验
根据样本观察值求出的一元线性回归方程
yˆ abx是总体回归方程 yˆx
的一个估计。
由抽样误差的存在,样本回归方程的 b0
不等于总体回归方程也成立。 因此,必须通过对样本回归方程的假设测验
来判断其所估计的总体回归方程是否成立。
1.回归的估计标准误
天的范围内大约有95.45%的观察点。
2.t测验
对一元线性回归方程进行t测验的统计假设为
H 0 : 0 , H A : 0
回归系数的标误为:
sb
Q
n2SSx
sy/x SSx
(10.20)
t b
sb
服从自由度n2的t分布。
0
表示总体回归方程不存在,样本回归方 程不显著没有意义。
0
。
表示总体回归方程成立,样本回归系数
解:
旬平均温度累积值可以测量和计算,虽然也有 误差,但较小。
一代三化螟盛发期与旬平均温度累积值之间可 能有因果关系,前者是果后者是因。
并且盛发期还受其它许多因素影响,有较大的 随机误差。因此,此资料基本符合回归模型的要 求,可做回归分析。
以温度累积值为X,盛发期为Y,得相关计算表。
表10.3 温度累积值x(℃)与盛发期y(天)的相关计算表
10.3 一元线性回归分析
一、回归方程
由样本观察值求得的样本回归方程为
yˆ abx
(10.13)
其中 a是α的估计值, b是β的估计值。
在平面直角坐标系中此方程的图形是一条直
线,其斜率为b,在y轴上的位置由a 确定,见
图10.5。
aybx
bxxy2x x2y//nn
SP SS x
如此求得的回归方程有3个特性
离差平方和Q是回归估计值 yˆ 与实测值 y吻
合程度的度量,因为计算回归方程用了a和b两个
统计数,所以其自由度 n2。
定义
Q sy x n 2
(10.18)
为回归的估计标准误,也称离差标准误。
实际上Y变数的平方和SSy可以分解为 yˆy2
和 yyˆ2两部分。
前者由Y对X的回归引起,称回归平方和记为U,
(1)离差平方和 Qyy ˆ2最小。
(2) yyˆ0,即回归直线上方各实际观察
点距直线的距离(平行于 y轴的距离)之和与下方 各实际观察点距直线的距离之和相等。
。
据此可知如果在X=x处进行多次试验,观察值
y1,y2, ,ym的平均值应等于 yˆ 。
(3)回归直线必经过点 x,y ,也就是说当
Xx时, yˆy。
b显著,可用于估计总体回归系数 。
[例10.9]
对例10.7的回归方程进行t测验。
解:
(1)H 0 : 0 , H A : 0
(2)α=0.05
(3) sb
3.266 0.2715 144.6356
t 1.0 9 964.0 5 0.2715
查 t0.05, 7 2.365,现 4.052.365,表明在