高中数学选修《回归分析》(课堂PPT)
合集下载
高中数学北师大版选修2-1第一章《回归分析》ppt课件
由置换后的数值表作散点图如下: 由散点图可以看出y与t呈近似的线性相关关系.列表如下
i
ti
yi
tiyi
1
4
16
64
t2
y2
i
i
16
256
2
2
12
24
4
144
3
1
5
5
1
25
4
0.5
2
1
0.25
4
5 0.25 1
0.25
0.ห้องสมุดไป่ตู้625
1
∑ 7.75 36 94.25 21.312 5 430
所以-t =1.55,-y =7.2.
答案:C
3.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升) 与消光系数如下表:
汞含量x
2
4
6
8
10
消光系数y 64 138 205 285 360
(1)作散点图; (2)如果y与x之间具有线性相关关系,求线性回归方程.
解:(1)散点图如图. (2)由散点图可知,y 与 x 呈相关关系,设线性 回归方程为 y=bx+a.
③n=17,r=0.499 1;④n=3,r=0.995 0.
则变量y和x线性相关程度最高的两组是
()
A.①和②
B.①和④
C.②和④
D.③和④
解析:相关系数r的绝对值越大,变量x,y的线性相 关程度越高,故选B. 答案:B
5.某厂的生产原料耗费x(单位:百万元)与销售额y(单位: 百万元)之间有如下的对应关系:
[例1] 某班5名学生的数学和物理成绩如下表:
学生 学科 数学成绩(x) 物理成绩(y)
苏教版高中数学选修(2-3)课件3.2《回归分析》
高中数学课件
灿若寒星整理制作
3.1回归分析的基本思想及 其初步应用
比《数学3》中“回归”增加的内
数学3——统计
容 选修2-3——统计案例
5. 引入线性回归模型
1. 画散点图
2. 了解最小二乘法 的思想
y=bx+a+e
6. 了解模型中随机误差项e产 生的原因
3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
i=1
i 1
i 1
i=1
R2 1 3.1643 0.9999. 25553.3
即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.
练习假设关于某设备的使用年限x和所支出的维修费用y(万
元),有如下的统计资料。
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系。试求:
两个含有未知参数的模型:y(1) f (x, a)和y(2) g(x, b),
其中a和b都是未知参数。拟合效果比较的步骤为:
(1)分别建立对应于两个模型的回归方程 yˆ (1) f (x, aˆ)
与其yˆ (中2) 和分g别(x是, bˆ参),数a和abˆ的估bˆ计值;
n
(2)分别计算两个回归方程的残差平方和 Qˆ (1) ( yi yˆi(1) )2
最好的模型是哪个?
产卵数
400
300
200
100
0
0
5
10
15
20
25
30
35
40
-100
线性模型
灿若寒星整理制作
3.1回归分析的基本思想及 其初步应用
比《数学3》中“回归”增加的内
数学3——统计
容 选修2-3——统计案例
5. 引入线性回归模型
1. 画散点图
2. 了解最小二乘法 的思想
y=bx+a+e
6. 了解模型中随机误差项e产 生的原因
3. 求回归直线方程
y=bx+a
4. 用回归直线方程 解决应用问题
i=1
i 1
i 1
i=1
R2 1 3.1643 0.9999. 25553.3
即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.
练习假设关于某设备的使用年限x和所支出的维修费用y(万
元),有如下的统计资料。
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系。试求:
两个含有未知参数的模型:y(1) f (x, a)和y(2) g(x, b),
其中a和b都是未知参数。拟合效果比较的步骤为:
(1)分别建立对应于两个模型的回归方程 yˆ (1) f (x, aˆ)
与其yˆ (中2) 和分g别(x是, bˆ参),数a和abˆ的估bˆ计值;
n
(2)分别计算两个回归方程的残差平方和 Qˆ (1) ( yi yˆi(1) )2
最好的模型是哪个?
产卵数
400
300
200
100
0
0
5
10
15
20
25
30
35
40
-100
线性模型
高中数学选修一《回归分析》课件
解:画出散点图
y/cm
x/cm
列表:
i
xi
yi
xi2
yi2
1
154 155 23 716 24 025
2
157 156 24 649 24 336
3
158 159 24 964 25 281
4
159 162 25 281 26 244
5
160 161 25 600 25 921
6
161 164 25 921 26 896
例 始祖鸟是一种已经灭绝的动物.在一次考古活动中,
科学家发现了始祖鸟的化石标本共6个,其中5个同时
保有股骨(一种腿骨)和肱骨(上臂的骨头).科学家检
查了这5个标本股骨和肱骨的长度如下:
编号
1
2
3
4
5
股骨长度x/cm 38 56 59
64
74
肱骨长度y/cm 41 63 70
72
84
(1)求出肱骨长度y对股骨长度x的线性回归方程.
得 Q(a,b) ( y1 a bx1 )2 ( y2 a bx2 )2 ( yn a bxn )2 达到最小.此时
n
n
b lxy lxx
(xi x)(yi y)
i1
n
(xi x)2
xiyi nxy
i1 n
,
x
2 i
nx 2
i1
i1
a y bx.
解(1)画散点图如下,两个变量呈现出近似的线性关
【提升总结】 线性回归方程的求解步骤:
(1)画散点图,通过图形来判断是否线性相关.
(2)求回归系数 a,b:
n
n
(xi x)(yi y)
高中数学选修1-2-回归分析第一节.ppt
=
,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
i=1
i=1
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
课前探究学习
课堂讲练互动
(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e, 因变量y由 自变量x 和 随机误差e 共同确定,即自变量x只解 释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.
课前探究学习
课堂讲练互动
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x 的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及其初步应用
课前探究学习
课堂讲练互动
【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
课前探究学习
课堂讲练互动
【核心扫描】 1.利用散点图分析两个变量是否存在相关关系,求线性回归方
6
所以
(yi-y^ i)2≈0.013
6
18,
(yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.
,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
i=1
i=1
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
课前探究学习
课堂讲练互动
(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e, 因变量y由 自变量x 和 随机误差e 共同确定,即自变量x只解 释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.
课前探究学习
课堂讲练互动
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x 的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及其初步应用
课前探究学习
课堂讲练互动
【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
课前探究学习
课堂讲练互动
【核心扫描】 1.利用散点图分析两个变量是否存在相关关系,求线性回归方
6
所以
(yi-y^ i)2≈0.013
6
18,
(yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.
人教版高中数学选修《回归分析》课件ppt课件
3.相关系数与R2 (1)R2是相关系数的平方,其变化范围为[0,1],而相 关系数的变化范围为[-1,1]. (2)相关系数可较好地反映变量的相关性及正相关或 负相关,而R2反映了回归模型拟合数据的效果. (3)当|r|接近于1时说明两变量的相关性较强,当|r| 接近于0时说明两变量的相关性较弱,而当R2接近于1 时,说明线性回归方程的拟合效果较好.
②观测与计算(用 $b $a 代替b a)产生的误差;
③省略了一些因素的影响(如生活习惯等) 产生的误差.
在线性回归模型中,e为用bx+a的预报真实值y的随机 误差,它是一个不可观测的量,那么应该怎样研究随 机误差?
在实际应用中,我们用 $y $bx $a 估计 bx+a
所以 e y-bx a 的估计量为 $e y $y
具有较好的线性相关关系
2.根据线性回归的系数公式, 求回归直线方程 $y =0.849x-85.712
3.由线性回归方程可以估计其位 置值为 $y =60.316(千克)左右。
ቤተ መጻሕፍቲ ባይዱ
$b
n i1
xi x yi y
n
2
xi x
i1
$a y $bx.
4
6
8
10
12
-4000
通过残差 eˆ1,eˆ2,eˆ3,.....eˆn,来判断模型拟合的效果这种
分析工作称为残差分析
通过残差表或残差图判断模型拟合的效果是直观判 断,如何精确判断模型拟合的效果?
n yi $yi 2
引入参数R2R2
1
i1 n
来精确该画模型拟合效果
2
yi y
最新-高中数学 18《回归分析》课件 北师大版选修1-2 精品
i 1
i1
i1
上式中三项平方和的意义如下:
m
( yi y)2
i1
m
( yˆi y)2
i1
m
( yi yˆi )2
i1
代表在试验范围内,观测值 yi 总 的波动情况,称此为总平方和。
代表 x 变化所引起的 y 值变化大小的量, 即yi 波动中,可以通过回归方程计算出 来的那一部分,称之为回归平方和。
如果误差服从正态分布,则概率 P(e1, e2, …, em)为:
P(e1, e2 ,, em )
1
2
exp
m(
i 1
yi
2
yˆi )2
2
(5—6)
当P最大时,求得的曲线就应当是最佳形式。从图5-1a中可以看
出,显然,此时下式应最小:
S
m
( yi
yˆi
)2
m
ei
2
i 1
i 1
(5—7)
即残差平方和最小,这就是最小二乘法原理的由来。
m
m
m
( xi )2
lxx (xi x)2 xi 2
i 1
i 1
i 1
m
m
令
m
m
( yi )2
l yy ( yi y)2 yi 2
i 1
i 1
i 1
m
5-21
m
m
m
m
( xi )( yi )
lxy (xi x)(yi y) xi yi i1
i 1
i 1
i 1
完成表5-2的计算,就可得到回归直线方程:
yˆ 3.21x 45.01 5-23
编号 1 2 3 4 5 6 7 8 9 10 11
高中数学 北师大选修4-4 1.1《回归分析》课时2 课件
观察它们之间的关系.
100 50
0
20 22 24 26 28 30 32 34 36 温度
(1)是否存在线性关系?
图1.1 4
非线性关系
(2)散点图具有哪种函数特征?
指数函数、二次函数、三次函数
(3)以指数函数模型为例,如何设模型函数?
非线性回归模型
设指数函数曲线 y c1其ec中2x 和 c是1 待c定2 参数。 现在问题变为如何估计待定参数 c和1 ?c2 我们可以通过对数变换把指数关系变为线性关系 令 z ln y 则变换后样本点分布在直线的周围。 z bx a(a lnc1,b c2 ) 这样就可以利用线性回归模型来建立z与 x回归模型, 进而找到y与x的非线性回归方程 。
xi x yi y
i1
xiyi nx y
i1
.
n
2n
2
xi x yi y
(
n
x
2 i
n
x
2
)(
n
yi2
Hale Waihona Puke n2y)
i1
i1
i1
i1
(7)相关系数r与R2 (1)R2是相关系数的平方,其变化范围为[0,1],而相关系 数的变化范围为[-1,1]. (2)相关系数可较好地反映变量的相关性及正相关或负 相关,而R2反映了回归模型拟合数据的效果. (3)当|r|接近于1时说明两变量的相关性较强,当|r|接 近于0时说明两变量的相关性较弱,而当R2接近于1时,说 明线性回归方程的拟合效果较好.
表 1-5 是 红 铃 虫 的 产 卵 数 和 对 应 的 温 度 的 平 方 , 图 1.1-6是相应的散点图.
表1 5
t 441 529 625 729 841 1024 1225 y 7 11 21 24 66 115 325
【高中课件】高中数学北师大版选修21第一章回归分析课件ppt.ppt
2.相关系数
r=
lxy = lxxlyy
n
xi- x yi- y
i=1
n
xi- x 2
i=1
n
yi- y 2
i=1
计算
n
xiyi-n x y
i=1
n
xi2-n x 2
n
y2i -n y 2
i=1
i=1
=
范围
r∈ [-1,1]
(1)|r|越大,线性相关程度 越高 ;
则 y 对 x 的线性回归方程为
()
A.y=-1+x
B.y=1+x
C.y=88+12x
D.y=176
解析:设 y 对 x 的线性回归方程为 y=a+bx, 因为 b=-2×-1+0×--212++02×2 0+0×1+2×1=12, a=176-12×176=88,所以 y 对 x 的线性回归方程为 y=12x+88.
线性 (2)|r|越接近于0,线性相关程度 越低 ; 性 相关 (3)当r>0时,两个变量 正 相关; 质 程度 (4)当r<0时,两个变量 负 相关;
(5)当r=0时,两个变量线性 不相关
1.回归分析是对具有相关关系的两个变量进行统计分 析的一种常用方法.
2.回归直线 y=a+bx 过点( x , y ),其中 x =n1i=n1xi, y
i=1
∴r=
7 xiyi-7-x -y
i=1
7 x2i -7-x 27 y2i -7-y 2
i=1
i=1
= 5 414-178×54227-.427× ×2172.44×39831-.37×81.32≈0.837 5.
经计算,得-x =6,-y =210.4,5 x2i =220,5 x
相关主题