8.5一元线性回归分析案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5、残差分析与残差图的定义:
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是 否线性相关,是否可以用回归模型来拟合数据。
判断然原后始,数我据们中可是以否通存过在残可差疑e数$1据, e$,2 ,这L方,面e$n的来分判析断工模作型称拟为合残的差效分果析,。
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
课题:选修2-3 8.5 回归分析案例
4、两个指标:
再冷的石头,坐上三年也会暖 !
(1)类比样本方差估计总体方差的思想,可以用作
ˆ 2 1
n
eˆ2
1
Q(aˆ,bˆ)(n 2)
n 2 i1
n2
为 2 的估计量, 2越小,预报精度越高。
(2)我们可以用相关指数R2来刻画回归的效果,其
水稻产量y 330 345 365 405 445 450 455
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
445 450 455 散点图
施化肥量
10 20 30 40 50
x
发现:图中各点,大致分布在某条直线附近。
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
探究: 身高为172cm的女大学生的体重一定是60.316kg 吗?如果不是,你能解析一下原因吗?
答:身高为172cm的女大学生的体重不一定是 60.316kg,但一般可以认为她的体重接近于 60.316kg。
即,用这个回归方程不能给出每个身高为172cm 的女大学生的体重的预测值,只能给出她们平均 体重的值。
1. 散点图;
再冷的石头,坐上三年也会暖 !
2.回归方程: yˆ 0.849x 85.172 身高172cm女大学生体重 yˆ = 0.849×172 - 85.712 = 60.316(kg)
本例中, r=0.798>0.75.这表明体重与身高有很强的线性相关关 系,从而也表明我们建立的回归模型是有意义的。
课题:选修2-3 8.5 回归分析案例
解:(1)列出下表,并计算
再冷的石头,坐上三年也会暖 !
i
1
2
3
4
5
6
7
8
9
10
xi 104 180 190 177 147 134 150 191 204 121
yi 100 200 210 185 155 135 170 205 235 125
xiyi 10400 36000 39900 32745 22785 18090 25500 39155 47940 15125
我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:
^
^
a y b x,......(1)
n
n
y ^
(xi x)( yi y)
xi
nx y
i
b i1 n
(xi x)2

i 1 n
xi2

2
nx
,......(2)
i 1
i 1
其中x

1 n
x 159.8, y 172,
x y x y 10
10
2 265448,
2
10
312350,
287640
i
i
ii
i1
i1
i1
10
xi yi 10x y
于是,r
i 1
0.9906.
10
(
xi2
2
10x )(
10
yi2
10
2
y
)
i 1
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
比《数学3》中“回归”增加的内容
数学3——统计
1. 画散点图 2. 了解最小二乘法
的思想 3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
选修2-3——统计案例
5. 引入线性回归模型
y=bx+a+e
6. 了解模型中随机误差项e产 生的原因
x(0.01%) 104 180 190 177 147 134 150 191 204 121
y(min)
100 200 210 185 155 135 170 205 235 125
(1)y与x是否具有线性相关关系;
(2)如果具有线性相关关系,求回归直线方程;
(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟
计算公式是:
n
n
( yi $yi )2
( $yi y)2
R2
1
i 1 n
i1 n
( yi y)2
( yi y)2
i 1
i 1
R2 1,说明回归方程拟合的越好;R20,说明回归
方程拟合的越差。
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
复习 变量之间的两种关系
再冷的石头,坐上三年也会暖 !
问题1:正方形的面积y与正方形的边长x之间
的函数关系是
y = x2
确定性关系
问题2:某水田水稻产量y与施肥量x之间是否
有一个确定性的关系? 例如:在 7 块并排、形状大小相同的试验田上
进行施肥量对水稻产量影响的试验,得
到如下所示的一组数据:
施化肥量x 15 20 25 30 35 40 45
i 1
.
n
n
(xi x)2 ( yi y)2
i 1
i 1
当r [0.75,1], 表明两个变量正相关很强; 当r [1, 0.75], 表明两个变量负相关很强; 当r [0.25, 0.25], 表明两个变量相关性较弱。
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
小结:回归分析的内容与步骤:
回归分析通过一个变量或一些变量的变化解释 另一变量的变化。
其主要内容和步骤是:
首先根据理论和对问题的分析判断,将变量分为自变量和因变 量;
其次,设法找出合适的数学方程式(即回归模型)描述变量间 的关系;
由于涉及到的变量具有不确定性,接着还要对回归模型进行 统计检验;
统计检验通过后,最后是利用回归模型,根据自变量去估计、 预测因变量。
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。
课题:选修2-3 8.5 回归分析案例
分析:由于问题中 要求根据身高预报 体重,因此选取身 高为自变量,体重 为因变量.
(4)
其中a和b为模型的未知参数,e称为随机误差。
2是、随数机据误点差和的它效在应回,归称直e$线i =上y相i 应$y位i 为置残的差差。异(yi $yi )
3、对每名女大学生计算这个差异,然后分别将所得
的值平方后加起来,用数学符号表示为:n ( yi $yi )2 i 1
称为残差平方和,它代表了随机误差的效应。
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
i 1
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
(2)设所求的回归方程为 yˆ bˆx aˆ
10
^ xi yi 10x y
b
i 1 10
1.267

x
2 i

10
x
2
i 1
^
a y bx 30.51.
所以回归直线的方程为 yˆ=1.267x-30.51
4、求回归直线方程的步骤:
(1)求x
1 n
n i 1
xi , y
1 n
n i 1
yi
n
n
(2)求 xi2 , xi yi. n
n
i 1
i 1
y (xi x)(yi y)
xi
nxy
i
b i1 n
(3)代入公式
(xi x)2
i1

i1 n
n i 1
xi ,
y

1 n
n i 1
yi .
(x, y) 称为样本点的中心。
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
1、回归直线方程
1、所求直线方程叫做回归直线方程;
相应的直线叫做回归直线。
2、对两个变量进行的线性分析叫做线性回归分析。
n
n
y bˆ
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
y 水稻产量
500
450
· ·· y x
400
·
350 ···
300
施化肥量
10 20 30 40 50
x
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
对于一组具有线性相关关系的数据 (x1, y1), (x2 , y2 ),..., (xn , yn ),
300
施化肥量
10 20 30 40 50
x
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
1、相关关系的定义:
自变量取值一定时,因变量的取值带有一定 随机性的两个变量之间的关系叫做相关关系。
注 1):相关关系是一种不确定性关系; 2): 对具有相关关系的两个变量进行统计 分析的方法叫回归分析。
xi2

2
nx
,
i1
^
a y bx,......(1)
(4)写出直线方程为y^=bx+a,即为所求的回归直线方程。
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
应用:利用回归直线方程对总体进行线性相关性的检验
例1、炼钢是一个氧化降碳的过程,钢水含碳量的多少 直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼 时间的关系。如果已测得炉料熔化完毕时,钢水的含碳 量x与冶炼时间y(从炉料熔化完毕到出刚的时间)的一 列数据,如下表所示:
i=1(xi -x)(yi -y)
n
(xi -x)2
i=1
=
i=1
xi
yi
-n xy
n
xi2-nx 2
i=1
,
aˆ=y-bˆ x.
其中x=
1 n
n xi i=1
,y=
1 n
n yi. i=1
(x , y ) 称为样本点的中心。
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
(3)当x=160时,yˆ 1.267.160-30.51=172
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
5.如何描述两个变量之间线性相关关系的强弱?
在《数学3》中,我们学习了用相关系数r来衡量两个变量 之间线性相关关系的方法。
相关系数r
nwk.baidu.com
(xi x)( yi y)
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
探索:水稻产量y与施肥量x之间大致有何规 律?
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
(xi
i1 n
x)( yi (xi x)2
y)

xi
i1
n
xi2
nx y
i
,
2
nx
i1
i1
aˆ y bˆx
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
2.求回归直线的方法——最小二乘法:
yˆ bˆx aˆ
n
n
bˆ =
7. 了解相关指数 R2 和模型拟 合的效果之间的关系
8. 了解残差图的作用 9. 利用线性回归模型解决一类
非线性回归问题 10. 正确理解分析方法与结果
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
1、线性回归模型:
y=bx+a+e, (3)
y=bx+a+e, E(e)=0,D(e)= 2.
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
8.5一元线性回归分析案例
课题:选修2-3 8.5 回归分析案例
数学3——统计内容
再冷的石头,坐上三年也会暖 !
1. 画散点图
2. 了解最小二乘法的思想
3. 求回归直线方程
y=bx+a
4. 用回归直线方程解决应用问题
课题:选修2-3 8.5 回归分析案例
相关文档
最新文档