最新2013-2014高二数学课件:第一章 1.1回归分析的基本思想及其初步应用8 (新人教a版选修
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
探究编:号 1 2 3 4 5 6 7 8 身身高高为/c1m72c1m65的女16大5 学15生7 的17体0重1一75定1是65601.35156k1g70 吗体?重如/k果g不是48,你57能解5析0 一5下4 原因64吗?61 43 59
2、回归直线方程:
1、所求直线方程 yˆ = bˆ x + aˆ 叫做回归直
---线方程;其中
n
n
y bˆ =
(xi - x)(yi -y)
i=1 n
=
(xi - x)2
xi
- nxy
i
i=1
n xi2 - nx2
,
i=1
i=1
aˆ = y-bˆx
2.相应的直线叫做回归直线。
3、对两个变量进行的线性分析叫做线性 回归分析。
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
以上三项误差越小,说明我们的回归模型的拟合 效果越好。
函数模型与回归模型之间的差别
120000
中国GDP散点图
100000
80000
GDP
60000
40000
20000
0 1992
1993
1994
1995
1996
1997
1998
年
1999
2000
2001
2002
2003
函数模型: ybxa 可以提供
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。
3、从散点图还看到,样本点散布在 某一条直线的附近,而不是在一条 直线上,所以不能用一次函数 y=bx+a描述它们关系。
解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。
分析:由于问题中 要求根据身高预报 体重,因此选取身 高为自变量,体重 为因变量.
1. 散点图;
2.回归方程: yˆ0.84x 98.5 172 身 高 172cm女 大 学 生 体 重 y ˆ=0.849× 172-85.712=60.316(kg)
最小二乘法:yˆ = bˆ x + aˆ
n
n
bˆ
=
i
=
( 1
x
i
-
x
)
(
y
i
i
n
=
( 1
x
i
-
Hale Waihona Puke Baidu
x
)2
-
y
)
=
x iy i - n x y
i=1 n
x i2 - n x 2
,
i=1
aˆ = y - bˆ x .
其
中x=
1 n
n
i=1
xi
,y
=
1 n
n
i=
1
y
i
.
( x , y ) 称为样本点的中心。
问题2:某水田水稻产量y与施肥量x之间是否
-------有一个确定性的关系?
例如:在 7 块并排、形状大小相同的试验田 上 进行施肥量对水稻产量影响的试验,得到 如下所示的一组数据:
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为
y 0 .8 4 9 7 2 8 5 .7 1 2 6 0 .3 1 6 ( k g )
对回归模型进行统计检验
假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相 同。在体重不受任何变量影响的假设下,设8名女大学生的体重都是她们的平均值, 即8个人的体重都为54.5kg。
2013-2014学年高二数学课件: 第一章 1.1回归分析的基本思想 及其初步应用8 (新人教A版选
修1-2)
比《数学3》中“回归”增加的内容
数学3——统计
1. 画散点图 2. 了解最小二乘法
的思想 3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
选修1-2——统计案例
5. 引入线性回归模型
相关系数
• 1.计算公式
n
(xi - x)(yi - y)
r=
i=1
n
n
(xi - x)2 (yi - y)2
i=1
i=1
• 2.相关系数的性质
• (1)|r|≤1.
• (2)|r|越接近于1,相关程度越大;|r|越接 近于0,相关程度越小.
• 问题:达到怎样程度,x、y线性相关呢?它 们的相关程度怎样呢?
y=bx+a+e 6. 了解模型中随机误差项e产
生的原因
7. 了解相关指数 R2 和模型拟
合的效果之间的关系
8. 了解残差图的作用
9. 利用线性回归模型解决一类 非线性回归问题
10.正确理解分析方法与结果
复习、变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间
的函数关系是 y = x2
确定性关系
我们可以用下面的线性回归模型来表示:
y=bx+a+e,其中a和b为模型的未知参数,e称为随
机误差。
思考: 产生随机误差项e的原因是什么?
随机误差e的来源(可以推广到一般):
1、忽略了其它因素的影响:影响身高 y 的因素不只 是体重 x,可能还包括遗传基因、饮食习惯、生 长环境等因素;
2、用线性回归模型近似真实模型所引起的误差; 3、身高 y 的观测误差。
回归模型: ybxae 选择模型的准则
函数模型与回归模型之间的差别
函数模型: ybxa 回归模型: ybxae
线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和 随机误差项e共同确定,即自变量x只能解析部分y的变化。
在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。
负相关
正相关
相关系数
n
r=
i=1(xi - x)(yi - y)
n i=1(xi
- x)2×i=n1( yi - y)2
r>0正相关;r<0负相关.通常,
r∈[-1,-0.75]--负相关很强;
r∈[0.75,1]—正相关很强; r∈[-0.75,-0.3]--负相关一般; r∈[0.3, 0.75]—正相关一般; r∈[-0.25, 0.25]--相关性较弱;