选修2-3回归分析的基本思想及其初步应用(精华)(课堂PPT)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
那么,数据点和它在回归直线上相应位置的差异
(y $y ) 是随机误差的效应,称 e$i =y $ y 为残差。
3、残差分析:
e $ i= y i $ y i i= 1 ,2 ,3 , … … n
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
编号 1
2
身高 165 165 /cm
到如下所示的一组数据:
施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。
(二)
8
( yi yˆ i ) 2
R2
1
i1 8
( yi y)2
大学生的体重不一定 45
40
是60.316kg但一般可
150 155 160 165 170 175 180
以认为她的体重接近于60.316kg. 图1.12
假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点 图中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落在 回归直线上。这些点散布在回归直线附近。
探索:水稻产量y与施肥量x之间大致有何规 律?
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
散点图 施化肥量
10 20 30 40 50
x
发现:图中各点,大致分布在某条直线附近。
·
350 · · ·
300
施化肥量
10 20 30 40 50
x
1、定义:
自变量取值一定时,因变量的取值带有一定 随机性的两个变量之间的关系叫做相关关系。
注 1):相关关系是一种不确定性关系; 2): 对具有相关关系的两个变量进行统计 分析的方法叫回归分析。
现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
高二数学 选修2-3
3.1回归分析的基 本思想及其初步
应用
复习 变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间
的函数关系是
y = x2
确定性关系
问题2:某水田水稻产量y与施肥量x之间是否
有一个确定性的关系? 例如:在 7 块并排、形状大小相同的试验田上
进行施肥量对水稻产量影响的试验,得
nxy
i
bi1 n
(xi x)2
i1 n
xi2
2
nx
,......(2)
i1
i1
其中x1nin1xi,y1nin1yi. ( x , y ) 称为样本点的中心。
1、回归直线方程 1、所求直线方程叫做回归直线方程; yˆ bˆx aˆ
相应的直线叫做回归直线。 2、对两个变量进行的线性分析叫做线性回归分析。
残差图的制作及作用 1、坐标纵轴为残差变量,横轴可以有不同的选择; 2、若模型选择的正确,残差图中的点应该分布在以横
轴为心的带形区域;
3、对于远离横轴的点,要特别注意。
身
高
异
与
常
体 重
点
残
差
• 错误数据
图
• 模型问题
3、残差分析:
e $ i= y i $ y i i= 1 ,2 ,3 , … … n
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
探究
对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),...,(xn,yn),
我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:
^
^
a ybx,......(1)
n
n
y ^
(xi x)(yi y)
xi
体重/kg 48 57
残差 -6.373 2.627
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
61 43 59
6.627 -2.883 0.382
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
编号 1
2
身高 165 165 /cm
体重/kg 48 57
残差 -6.373 2.627
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
61 43 59
6.627 -2.883 0.382
ii
b
i1 10
210 2
1101001 110100
x x i
i1
a y b x 0 b 0 0
所求回归直线方程为 $y x .
探 究 身 高172 cm的
女大学生的体重一定
是 60.316 kg 吗? 如 果 70 65
不 是,其 原 因 是 什 么? 60
显然,身高172cm的女
源自文库55 50
i 1 2 3 4 5 6 7 8 9 10
xi -1 -2 -3 -4 -5 5 yi -9 -7 -5 -3 -1 1 xiyi 9 14 15 12 5 5
3421 5379 15 12 14 9
x0,y0,
x y xy 10
10
2110,
2
10
330,
110.
i
i
ii
i1
i1
i1
10
xy 10xy
i
b i1 n
(3)代入公式
(xi x)2
i1
i1 n
xi2
n
2
x
,
i1
^
a y bx,......(1)
(4)写出直线方程为y^=bx+a,即为所求的回归直线方程。
例1、观察两相关量得如下数据:
x -1 -2 -3 -4 -5 5 3 4 2 1
y -9 -7 -5 -3 -1 1 5 3 7 9 求两变量间的回归方程. 解:列表:
n
n
y bˆ
i1
(xi
n
x)(yi (xi x)2
y)
xi
i1
n
xi2
nxy
i
,
2
nx
i1
i1
aˆ y bˆx
2、求回归直线方程的步骤:
(1)求x1 n ni1
xi,y1 ni n1
yi
n
n
(2)求 xi2, xi yi. n
n
i1
i1
y (xi x)(yi y)
xi
nxy