选修2-3回归分析的基本思想及其初步应用(精华)学习资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
散点图 施化肥量
10 20 30 40 50
x
发现:图中各点,大致分布在某条直线附近。
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
探究
对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),...,(xn,yn),
xiyi 9 14 15 12 5 5 15 12 14 9
x0,y0,
x y xy 10
10
2110,
2
10
330,
110.
i
i
ii
i1
i1
i1
10
xy 10xy
ii
b
i1 10
210 2
1101001 110100
x x i
i1
a y b x 0 b 0 0
所求回归直线方程为 y x .
选修2-3回归分析的基本思想及 其初步应用(精华)
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
施化肥量
10 20 30 40 50
x
1、定义:
自变量取值一定时,因变量的取值带有一定 随机性的两个变量之间的关系叫做相关关系。
(二)
8
( yi yˆ i ) 2
R2
1
i1 8
( yi y)2
i1
例2 在一段时间内,某中商品的价格x元和需求量Y件之
间的一组数据为:
价格x 14 16
18
20
22
需求量Y 12 10
7
ቤተ መጻሕፍቲ ባይዱ
5
3
求出Y对的回归直线方程,并说明拟合效果的好坏。 列出残差表为
y i yˆ i 0
0.3
-0.4
-0.1
ei= yiyi i= 1 ,2 ,3 , … … n
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
编号 1
2
身高 165 165 /cm
体重/kg 48 57
残差 -6.373 2.627
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
(1)求x1 n ni1
xi,y1 ni n1
yi
n
n
(2)求 xi2, xi yi. n
n
i1
i1
y (xi x)(yi y)
xi
nxy
i
b i1 n
(3)代入公式
(xi x)2
i1
i1 n
xi2
n
2
x
,
i1
^
a y bx,......(1)
(4)写出直线方程为y^=bx+a,即为所求的回归直线方程。
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
61 43 59
6.627 -2.883 0.382
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。
0.2
yi y
4.6
2.6
-0.4 -2.4
-4.4
5
5
( yi yˆi )2 0 . 3 , ( yi y)2 5 3 . 2 ,
i1
5
i 1
( yi yˆi ) 2
假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散 点图中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落 在回归直线上。这些点散布在回归直线附近。
那么,数据点和它在回归直线上相应位置的差异
( y y ) 是随机误差的效应,称 ei =y y 为残差。
3、残差分析:
我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:
^
^
a ybx,......(1)
n
n
y ^
(xi x)(yi y)
xi
nxy
i
bi1 n
(xi x)2
i1 n
xi2
2
nx
,......(2)
i1
i1
其中x1nin1xi,y1nin1yi. ( x , y ) 称为样本点的中心。
注 1):相关关系是一种不确定性关系; 2): 对具有相关关系的两个变量进行统计 分析的方法叫回归分析。
现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
探索:水稻产量y与施肥量x之间大致有何规 律?
施化肥量x 15 20 25 30 35 40 45
探 究 身 高172 cm的
女大学生的体重一定
是 60.316 kg 吗? 如 果 70 65
不 是,其 原 因 是 什 么? 60
显然,身高172cm的女
55 50
大学生的体重不一定 45
40
是60.316kg但一般可
150 155 160 165 170 175 180
以认为她的体重接近于60.316kg. 图1.12
例1、观察两相关量得如下数据:
x -1 -2 -3 -4 -5 5 3 4 2 1
y -9 -7 -5 -3 -1 1 5 3 7 9 求两变量间的回归方程.
No 解:列表:
i 1 2 3 4 5 6 7 8 9 10
xi -1 -2 -3 -4 -5 5 3 4 2 1
Image yi -9 -7 -5 -3 -1 1 5 3 7 9
1、回归直线方程 1、所求直线方程叫做回归直线方程; yˆ bˆx aˆ
相应的直线叫做回归直线。 2、对两个变量进行的线性分析叫做线性回归分析。
n
n
y bˆ
i1
(xi
n
x)(yi (xi x)2
y)
xi
i1
n
xi2
nxy
i
,
2
nx
i1
i1
aˆ y bˆx
2、求回归直线方程的步骤:
61 43 59
6.627 -2.883 0.382
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。
残差图的制作及作用
1、坐标纵轴为残差变量,横轴可以有不同的选择; 2、若模型选择的正确,残差图中的点应该分布在以横
轴为心的带形区域; 3、对于远离横轴的点,要特别注意。
身
高
异
与
常
体 重
点
残
差
• 错误数据
图
• 模型问题
3、残差分析:
ei=yiyi i= 1 ,2 ,3 , … … n
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
编号 1
2
身高 165 165 /cm
体重/kg 48 57
残差 -6.373 2.627