回归分析的基本思想及其初步应用教程PPT课件
合集下载
回归分析的基本思想及其初步应用PPT优秀课件
80
90 100
加工时 62 68 75 81 89 95 102 108 115 122 间y
(1)y与x是否具有线性相关?
(2)若y与x具有线性相关关系,求回归直线方程
(3)预测加工200个零件需花费多少时间?
分析:这是一个回归分析问题,应先进行 线性相关检验或作散点图来判断x与y是否 具有线性相关才可以求解后面的问题。
时刻 x/s 位置观 测值 y/cm
1
2
3
44
7.52 10.02 11.73 15.69 16.12 16.98 21.06
25 20 15 10 5 0 0 2 4 6 8 10 系列1
i xi yi x iy i x i2
1
1 5.54 5.54 1
2
2 7.52 15.04 4
新课标人教版课件系列
《数学》
选修1-2
1.1《回归分析的 基本思想及其初步应用》
审校:王伟
教学目标
通过典型案例,掌握回归分析的 基本步骤。 教学重点:熟练掌握回归分析的 步骤。 教学难点:求回归系数 a , b 教学方法:讲练。
必修3(第二章 统计)知识结构
收集数据
(随机抽样)
问题1:现实生活中两个变量间的关系有哪 些呢? 不相关 1、两个变量的关系
函数关系 相关 关系
线性相关 非线性相关
相关关系:对于两个变量,当自变量取值一定 时,因变量的取值带有一定随机性的两个变量 之间的关系。
思考:相关关系与函数关系有怎样的不同?
函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一 般的情况
《回归分析的基本思想及其初步应用》PPT精品课件人教版1
所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为
y 0 .8 4 9 7 2 8 5 .7 1 2 6 0 .3 1 6 (k g )
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
案例1:女大学生的身高与体重
n
( yi y ) 2 表示总的效应,称为总偏差平方和。
i1
在例1中,总偏差平方和为354。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的
线性相关关系,因此思可考以用P线4性回归方程
刻 3直、画 线从它 的散们 附点之 近图间 ,还的 而产看的关 不生到原系是,随因。在样机一是本条误什点直差散么线项布?上在e,某所一以条
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
y 0 .8 4 9 7 2 8 5 .7 1 2 6 0 .3 1 6 (k g )
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
案例1:女大学生的身高与体重
n
( yi y ) 2 表示总的效应,称为总偏差平方和。
i1
在例1中,总偏差平方和为354。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的
线性相关关系,因此思可考以用P线4性回归方程
刻 3直、画 线从它 的散们 附点之 近图间 ,还的 而产看的关 不生到原系是,随因。在样机一是本条误什点直差散么线项布?上在e,某所一以条
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
回归分析的基本思想及其初步应用课件PPT
返回
[导入新知]
1.残差平方和法
(1)^e i=yi-^y i=yi-^b xi-^a (i=1,2,…,n),称为相应于点
(xi,yi)的残差. n
(2)残差平方和
i=1
(yi-^y i)2
越小,模型拟合效果越好.
2.残差图法
残差点 比较均匀地 落在水平的带状区域内,说明选用的
模型比较合适,其中这样的带状区域宽度 越窄 ,说明模型的
年序 1 2 3 4 5
最大积雪深度x/尺 15.2 10.4 21.2 18.6 26.4
灌溉面积y/千亩 28.6 19.3 40.5 35.6 48.9
返回
年序 6 7 8 9 10
最大积雪深度x/尺 23.4 13.5 16.7 24.0 19.1
灌溉面积y/千亩 45.0 29.2 34.1 46.7 37.4
y =110(28.6+19.3+…+37.4)=36.53,
返回
10
x2i -10 x 2=227.845,
i=1
10
xiyi-10 x y =413.065,
i=1
^b=∑i=n1x∑i=niy1xi-2i -1010--xx 2
-y ≈1.813,
^a=36.53-1.813×18.85≈2.355.
返回
解:对 U=Aebt 两边取对数得 ln U=ln A+bt,令 y=ln U, a=ln A,x=t,则 y=a+bx,y 与 x 的数据如下表:
x 0 1 2 3 4 5 6 7 8 9 10 y 4.6 4.3 4.0 3.7 3.4 3.0 2.7 2.3 2.3 1.6 1.6 根据表中数据画出散点图,如图所示,从图中
因此电压 U 对时间 t 的回归方程为U^=e-0.313t·e4.61.
[导入新知]
1.残差平方和法
(1)^e i=yi-^y i=yi-^b xi-^a (i=1,2,…,n),称为相应于点
(xi,yi)的残差. n
(2)残差平方和
i=1
(yi-^y i)2
越小,模型拟合效果越好.
2.残差图法
残差点 比较均匀地 落在水平的带状区域内,说明选用的
模型比较合适,其中这样的带状区域宽度 越窄 ,说明模型的
年序 1 2 3 4 5
最大积雪深度x/尺 15.2 10.4 21.2 18.6 26.4
灌溉面积y/千亩 28.6 19.3 40.5 35.6 48.9
返回
年序 6 7 8 9 10
最大积雪深度x/尺 23.4 13.5 16.7 24.0 19.1
灌溉面积y/千亩 45.0 29.2 34.1 46.7 37.4
y =110(28.6+19.3+…+37.4)=36.53,
返回
10
x2i -10 x 2=227.845,
i=1
10
xiyi-10 x y =413.065,
i=1
^b=∑i=n1x∑i=niy1xi-2i -1010--xx 2
-y ≈1.813,
^a=36.53-1.813×18.85≈2.355.
返回
解:对 U=Aebt 两边取对数得 ln U=ln A+bt,令 y=ln U, a=ln A,x=t,则 y=a+bx,y 与 x 的数据如下表:
x 0 1 2 3 4 5 6 7 8 9 10 y 4.6 4.3 4.0 3.7 3.4 3.0 2.7 2.3 2.3 1.6 1.6 根据表中数据画出散点图,如图所示,从图中
因此电压 U 对时间 t 的回归方程为U^=e-0.313t·e4.61.
31回归分析的基本思想及其初步应用(优质课)PPT课件
.
10
问题呈现:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重 数据如表1-1所示。
求根据女大学生的身高预报她的体重的回归方程, 并预报一名身高为172cm的女大学生的体重。
.
11
解; 1.由于问题中要 求根据身高预报体重 ,因此选取身高为解 释变量x,体重为预报 变量y.
n
xiyi - n xy
=
i= 1 n
xi2 - n x 2
,
i= 1
其
中
x
=
1 n
n
i= 1
xi ,y
=
1 n
n
i= 1
yi .
x , y 称为样本点的中心.
对两0个4.02.2变021 量进行的线性分.析叫做线性回归分析5.
相关系数
1.计算公式
n
( xi - x)( yi - y)
y ˆ=0. 849× 172-85. 712=60. 316( kg)
.
15
从散点图中还看到,样本点散布在某一条直
线 的 附 近 ,而 不 是 在 一 条 直 线 上 , 所 以 不 能 用 一 次
函数
y = bx + a
来描述它们之间的关系.这时我们把身高和体重
的关系用下面的线性回归模型
y = bx + a + e (3) 来表示,这里a和b为模型的未知参数,e是y与bx + a 之间的误差.通常e为随机变量,称为随机误差,它的
04.02.2021
.
3
2、现实生活中存在着大量的相关关系. 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入.等等
回归分析的基本思想及其初步应用PPT教学课件
就转换为z=bx+a.
温度xoC z=lny 产卵数y/个
21
1.946
7
23
2.398
11
25
3.045
21
27
3.178
24
29
4.190
66
32
4.745
115
35
5.784
325
由计算器得:z关于x的线性回归方程
z
为
zˆ=0.272x-3.849
,
yˆ
e0.272x-3.849
.
2.8 2.4
温度xoC 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325
(1)试建立产卵数y与温度x之间的回归方程;并 预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了 产卵数的变化?
探索新知
选变量
一元线性模型
方案1
解:选取气温为解释变量x,产卵数 为预报变量y。
数据的散点图; (2) 描述解释变量与预报变量
繁殖个数
之间的关系;
(3) 计算残差、相关指数R2.
解:(1)散点图如右所示
天数
的周(围2,)于由是散令点Z图=l看ny出,样则本点分布在一条指数函数Cy=1eC2x
x
1
2
3
4
5
6
Z 1.79 2.48 3.22 3.89 4.55 5.25
由计数器算得 Zˆ =0.69X 1.112 则有 yˆ=e0.69x1.112
其中a和b为模型的未知参数,e称为随机误差。
2是、随数机据误点差和的它效在应回,归称直e$线i =上y相i 应$y位i 为置残的差差。异(yi $yi )
温度xoC z=lny 产卵数y/个
21
1.946
7
23
2.398
11
25
3.045
21
27
3.178
24
29
4.190
66
32
4.745
115
35
5.784
325
由计算器得:z关于x的线性回归方程
z
为
zˆ=0.272x-3.849
,
yˆ
e0.272x-3.849
.
2.8 2.4
温度xoC 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325
(1)试建立产卵数y与温度x之间的回归方程;并 预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了 产卵数的变化?
探索新知
选变量
一元线性模型
方案1
解:选取气温为解释变量x,产卵数 为预报变量y。
数据的散点图; (2) 描述解释变量与预报变量
繁殖个数
之间的关系;
(3) 计算残差、相关指数R2.
解:(1)散点图如右所示
天数
的周(围2,)于由是散令点Z图=l看ny出,样则本点分布在一条指数函数Cy=1eC2x
x
1
2
3
4
5
6
Z 1.79 2.48 3.22 3.89 4.55 5.25
由计数器算得 Zˆ =0.69X 1.112 则有 yˆ=e0.69x1.112
其中a和b为模型的未知参数,e称为随机误差。
2是、随数机据误点差和的它效在应回,归称直e$线i =上y相i 应$y位i 为置残的差差。异(yi $yi )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13
函数模型与“回归模型”的关系
函数模型:因变量y完全由自变量x确定 回归模型: 预报变量y完全由解释变量x和随机误差e确定
2020/1/7
14
思考:产生随机误差项e的原因
是什么?
注:e 产生的主要原因: (1)所用确定性函数不恰当; (2)忽略了某些因素的影响; (3)观测误差。
2020/1/7
随机误差 e y y e的估计量 eˆ y yˆ
样本点:( x1 , y1 ),( x2 , y2 ), ... ,( xn , yn )
相应的随机误差为:
ei yi yi yi bxi a, i 1, 2,..., n
随机误差的估计值为:
eˆi yi yˆi yi bˆxi aˆ, i 1, 2, ..., n
8. 了解残差图的作用
9. 利用线性回归模型解决一类非 线性回归问题
10. 正确理解分析方法与结果
9
教学情境设计
问题一:结合例1得出线性回归模型及随机误归模型中,e是用bx+a预报真实值y的随机误差, 它是一个不可观测的量,那么应如何研究随机误差呢?
eˆi 称为相应于点 ( xi , yi )的残差.
2020/1/7
17
问题三:如何发现数据中的错误?如何衡量随机模型的拟合效果?
(1)我们可以通过分析发现原始数据中的可疑数据,判断建立模型的拟合效果。
ei 称为相应于点(xi,yi)的残差。
结合例1除了身高影响体重外的其他因素是不可测量的,不能希望有某种方法获 取随机误差的值以提高预报变量的估计精度,但却可以估计预报变量观测值中所包 含的随机误差,这对我们查找样本数据中的错误和模型的评价极为有用,因此在此 我们引入残差概念。
2020/1/7
16
解:1、选取身高为自变量x,体重为因变量y,作散点图:
2020/1/7
11
2.回归方程:
yˆ 0.849x 85.172
身高172cm女大学生体重 yˆ = 0.849×172 - 85.712 = 60.316(kg)
探究:身高为172cm的女大学生的体重一定是60.316kg吗?如果 不是,你能解析一下原因吗?
1.1回归分析的基本 思想及其初步应用
2020/1/7
1
必修3(第二章 统计)知识结构
收集数据
(随机抽样)
整理、分析数据估 计、推断
用样本估计总体 变量间的相关关系
简分 系 单层 统 随抽 抽 机样 样 抽 样
2020/1/7
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
15
问题二:在线性回归模型中,e是用bx+a预报真实值y的随机误差, 它是一个不可观测的量,那么应如何研究随机误差呢?
e=y-(bx+a)
残差:一般的对于样本点(x1,y1),(x2,y2 ),...,(xn,yn ),它们的随机误差为
ei yi bxi a,i 1, 2,...n,其估计值为ei yi yi yi b xi a,i 1, 2,...n
问题三:如何发现数据中的错误?如何衡量随机模型的拟合效果?
问题四:结合例1思考:用回归方程预报体重时应注意什么?
问题五:归纳建立回归模型的基本步骤。
问题六:若两个变量呈现非线性关系,如何解决?(分析例2)
2020/1/7
10
问题一:结合例1得出线性回归模型及随机误差。并且区 分函数模型和回归模型。
i1
2020/1/7
aˆ Y bˆX
5
yˆ bˆx aˆ
n
xi yi n x y
b^ i1
n
2
xi2 n x
i 1
a^ y b^ x
x
1 n
n i 1
xi
回归直线必过样本点的中心 (x, y)
y
1 n
n i 1
yi
2020/1/7
线
性
回
归
分
析
2
问题1:现实生活中两个变量间的关系有哪些呢? 不相关
1、两个变量的关系
函数关系
线性相关 相关关
系 非线性相关
相关关系:对于两个变量,当自变量取值一定时,
因变量的取值带有一定随机性的两个变量之间的关
系。 2020/1/7
3
思考:相关关系与函数关系有怎样的不同?
函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系
答:用这个回归方程不能给出每个身高为172cm的女大学生的体重的预测值, 只能给出她们平均体重的估计值。
2020/1/7
12
由于所有的样本点不共线,而只是散布在某一直线的附近,所 以身高和体重的关系可以用线性回归模型来表示:
y bx a e
其中a和b为模型的未知参数,e称为随机误差.
2020/1/7
8
比《数学3》中“回归”增加的内容
数学3——统计
1. 画散点图 2. 了解最小二乘法的
思想 3. 求回归直线方程
y=bx+a
4. 用回归直线方程解 决应用问题
2020/1/7
选修1-2——统计案例
5. 引入线性回归模型
y=bx+a+e
6. 了解模型中随机误差项e产生 的原因
7. 了解相关指数 R2 和模型拟合 的效果之间的关系
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号
1
2
3
4
5
6
7
8
身高/cm 165 165 157 170 175 165 155 170
体重/kg
48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
6
3、回归分析的基本步骤:
画散点图
求回归方程
预报、决策
这种方法称为回归分析.
回归分析是对具有相关关系的两个变量进行统计
202分0/1/析7 的一种常用方法.
7
回归分析知识结构图
问题背景分析 散点图
两个变量线性相关 线性回归模型
最小二乘法 残差分析
R2
两个变量非线性相关 非线性回归模型
应用
2020/1/7
函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般 的情况
2020/1/7
4
问题2:对于线性相关的两个变量用什么方法来刻 划之间的关系呢?
2、最小二乘估计 最小二乘估计下的线性回归方程:
yˆ bˆx aˆ
n
(xi X )( yi Y )
bˆ i1 n
(Xi X )2