12回归分析的基本思想及其初步应用1PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
到如下所示的一组数据:
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
y=bx+a+e, (3)
其中a和b为模型的未知参数,e称为随机误差。
统计中,我们把自变量x称为解释变量,因变量y 称为预报变量
思考: 产生随机误差项e的原因是什么?
随机误差e的来源(可以推广到一般):
1、忽略了其它因素的影响:影响身高 y 的因素不只 是体重 x,可能还包括遗传基因、饮食习惯、生 长环境等因素;
i= 1
x
i
y
i
-n
x
y
n
x i2 -n x 2
i= 1
,
aˆ = y - bˆ x .
其
中
x=
1 n
n x i,y = i= 1
1 n
n y i. i= 1
( x , y ) 称为样本点的中心。
1、定义: 自变量取值一定时,因变量的取值带有一定
随机性的两个变量之间的关系叫做相关关系。
注 1):相关关系是一种不确定性关系; 2): 对具有相关关系的两个变量进行统计 分析的方法叫回归分析。
i1
5
x
2 i
2
5x
6205187.4 16605182 1.15.
i1
a ˆ 7 .4 1 .1 5 1 8 2 8 .1 .
回 归 直 线 方 程 为 : y ˆ 1 . 1 5 x 2 8 . 1 .
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
高二数学 选修1-2
3.1回归分析的基 本思想及其初步
应用
复习、变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间
的函数关系是
y = x2
确定性关系
问题2:某水田水稻产量y与施肥量x之间是否
有一个确定性的关系? 例如:在 7 块并排、形状大小相同的试验田上
进行施肥量对水稻产量影响的试验,得
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
散点图 施化肥量
10 20 30 40 50
x
发现:图中各点,大致分布在某条直线附近。
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
2、回归直线方程: 1、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。
解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。
3、从散点图还看到,样本点散布在 某一条直线的附近,而不是在一条 直线上,所以不能用一次函数 y=bx+a描述它们关系。
我们可以用下面的线性回归模型来表示:
编号 1 2 3 4 5 6 7 8
身高cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。
例2、在一段时间内,某中商品的价格x元和需求量Y件之间 的一组数据为:
价格x 14 16
18
20
22
需求量Y 12 10
7
5
3
试建立Y与x的回归直线方程。
5
5
5
解: x18, y 7.4, xi21660, yi2327, xiyi620,
i 1
i 1
i 1
5
bˆ
xi yi 5x y
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
2、对两个变量进行的线性分析叫做线性回归分析。
n
n
y bˆ
i1
(xiຫໍສະໝຸດ Baidu
n
x)(yi (xi x)2
y)
xi
i1
n
xi2
nxy
i
,
2
nx
i1
i1
aˆ y bˆx
最小二乘法: yˆ bˆx aˆ
n
n
bˆ
=
(x
i= 1 n
i= 1
i-x )(y i-y) (x i-x )2
=
年
1999
2000
2001
分析:由于问题中 要求根据身高预报 体重,因此选取身 高为自变量,体重 为因变量.
1. 散点图;
2.回归方程: yˆ0.84x 98.5 172 身 高 172cm女 大 学 生 体 重 y ˆ=0.849× 172-85.712=60.316(kg)
本例中, r=0.798>0.75.这表明体重与身高有很强的线性相关关 系,从而也表明我们建立的回归模型是有意义的。
350 · · ·
300
施化肥量
10 20 30 40 50
x
2、现实生活中存在着大量的相关关系。
如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
探索:水稻产量y与施肥量x之间大致有何规 律?
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
2、用线性回归模型近似真实模型所引起的误差; 3、身高 y 的观测误差。
以上三项误差越小,说明我们的回归模型的拟合 效果越好。
函数模型与回归模型之间的差别
120000
中国GDP散点图
100000
80000
GDP
60000
40000
20000
0 1992
1993
1994
1995
1996
1997
1998
探究: 身高为172cm的女大学生的体重一定是60.316kg 吗?如果不是,你能解析一下原因吗?
答:身高为172cm的女大学生的体重不一定是 60.316kg,但一般可以认为她的体重接近于 60.316kg。
即,用这个回归方程不能给出每个身高为172cm 的女大学生的体重的预测值,只能给出她们平均 体重的值。