多彩课堂20192019学年高中数学人教A版选修12课件:11回归分析-课时2
合集下载
高中数学人教A版选修1-2第一章回归分析的基本思想及其初步应用课件
高中数学人教A版选修1-2第一章回归 分析的 基本思 想及其 初步应 用课件 【精品 】
高中数学人教A版选修1-2第一章回归 分析的 基本思 想及其 初步应 用课件 【精品 】
残差图的制作及作用
1、坐标纵轴为残差变量,横轴可以有不同的选择; 2、若模型选择的正确,残差图中的点应该分布在以横
轴为心的带形区域; 3、对于远离横轴的点,要特别注意。
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
61 43 59
6.627 -2.883 0.382
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
探究
对于一组具有线性相关关系的数据 (x1, y1), (x2 , y2 ),..., (xn , yn ),
我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:
^
^
a y b x,......(1)
n
n
y ^
编号 1
2
身高 165 165 /cm
体重/kg 48 57
残差 -6.373 2.627
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
61 43 59
6.627 -2.883 0.382
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。
2019年人教版选修1-2高中数学1.1回归分析的基本思想及其初步应用优质课课件
回顾复 习
必修3(第二章 统计)知识结构
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系
收集数据
(随机抽样)
简 单 随 机 抽 样
分 层 抽 样
系 统 抽 样
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
线 性 回 归 分 析
回顾复 习 问题1:现实生活中两个变量间的关系有哪些呢?
法一:我们可以通过残差分析发现原始数据中的可疑数据, 判断建立模型的拟合效果。
(1)计算 ei yi b xi a (i=1,2,...n) 残差分析( 2)画残差图 ①查找异常样本数据 3)分析残差图 ( ②残差点分布在以x轴为中心的水平带状区域,并沿 水平方向散点的分布规律相同。
3.
7.
y=bx+a
4.
用回归直线方程 解决应用问题
8. 9.
自学指 导
阅读课本1页—6页思考回答下列问题
(注意:时间12分钟)
1:结合例1得出线性回归模型及随机误差,并且区分 函数模型和回归模型。
2:在线性回归模型中,e是用bx+a预报真实值y的随 机误差,它是一个不可观测的量,那么应如何研究随机 误差呢? 3:如何发现数据中的错误?如何衡量随机模型的拟合效 果? 4:结合例1思考:用回归方程预报体重时应注意什 么? 5:归纳建立回归模型的基本步骤。
残差图的制作和作用: 制作:坐标纵轴为残差变量, 横轴可以有不同的选择.可以为编号;可以为解释变 量 作用:判断模型的适用性若模型选择的正确,残差图中 的点应该分布在以横轴为中心的水平带状区域.
下面表格列出了女大学生身高和体重的原始数据以及相应的残差数
必修3(第二章 统计)知识结构
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系
收集数据
(随机抽样)
简 单 随 机 抽 样
分 层 抽 样
系 统 抽 样
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
线 性 回 归 分 析
回顾复 习 问题1:现实生活中两个变量间的关系有哪些呢?
法一:我们可以通过残差分析发现原始数据中的可疑数据, 判断建立模型的拟合效果。
(1)计算 ei yi b xi a (i=1,2,...n) 残差分析( 2)画残差图 ①查找异常样本数据 3)分析残差图 ( ②残差点分布在以x轴为中心的水平带状区域,并沿 水平方向散点的分布规律相同。
3.
7.
y=bx+a
4.
用回归直线方程 解决应用问题
8. 9.
自学指 导
阅读课本1页—6页思考回答下列问题
(注意:时间12分钟)
1:结合例1得出线性回归模型及随机误差,并且区分 函数模型和回归模型。
2:在线性回归模型中,e是用bx+a预报真实值y的随 机误差,它是一个不可观测的量,那么应如何研究随机 误差呢? 3:如何发现数据中的错误?如何衡量随机模型的拟合效 果? 4:结合例1思考:用回归方程预报体重时应注意什 么? 5:归纳建立回归模型的基本步骤。
残差图的制作和作用: 制作:坐标纵轴为残差变量, 横轴可以有不同的选择.可以为编号;可以为解释变 量 作用:判断模型的适用性若模型选择的正确,残差图中 的点应该分布在以横轴为中心的水平带状区域.
下面表格列出了女大学生身高和体重的原始数据以及相应的残差数
2019-2020学年高二数学人教A版选修1-2课件:1.1 回归分析的基本思想及其初步应用
质量的6个物体进行测量,数据如下表所示:
x/g 5 10 15 20 25 30
y/cm 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图,并求线性回归方程;
(2)求出R2;
(3)进行残差分析.
分析:作出散点图→求回归方程→计算R2→进行残差分析
-17-
第十七页,编辑于星期日:点 十五分。
i=1
的贡献率, 2 越接近于 1, 表示回归的效果越好
第八页,编辑于星期日:点 十五分。
-8-
目标导航
【做一做3】 下列四个命题中正确的是(
知识梳理
知识梳理
重难聚焦
典例透析
)
①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观
测的量;
②残差平方和越小的模型,拟合的效果越好;
③用R2来刻画回归方程,R2越小,拟合的效果越好;
-2-
目标导航
知识梳理
知识梳理
重难聚焦
典例透析
1.回归分析
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.当自
变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关
系叫做相关关系.
(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方
法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用
答案:B
第九页,编辑于星期日:点 十五分。
-9-
目标导航
知识梳理
重难聚焦
典例透析
1.相关关系与函数关系的区别与联系是什么?
剖析:(1)两者之间的区别.
①相关关系是一种非确定性关系.如人的身高与年龄、商品的销售额
x/g 5 10 15 20 25 30
y/cm 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图,并求线性回归方程;
(2)求出R2;
(3)进行残差分析.
分析:作出散点图→求回归方程→计算R2→进行残差分析
-17-
第十七页,编辑于星期日:点 十五分。
i=1
的贡献率, 2 越接近于 1, 表示回归的效果越好
第八页,编辑于星期日:点 十五分。
-8-
目标导航
【做一做3】 下列四个命题中正确的是(
知识梳理
知识梳理
重难聚焦
典例透析
)
①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观
测的量;
②残差平方和越小的模型,拟合的效果越好;
③用R2来刻画回归方程,R2越小,拟合的效果越好;
-2-
目标导航
知识梳理
知识梳理
重难聚焦
典例透析
1.回归分析
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.当自
变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关
系叫做相关关系.
(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方
法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用
答案:B
第九页,编辑于星期日:点 十五分。
-9-
目标导航
知识梳理
重难聚焦
典例透析
1.相关关系与函数关系的区别与联系是什么?
剖析:(1)两者之间的区别.
①相关关系是一种非确定性关系.如人的身高与年龄、商品的销售额
高中数学11回归分析的基本思想及初步应用(2课时)新人教A版选修12PPT课件
线的附,所 近以身高和体重的 可关 用系 下面的线
回归模型来表 : y示bxae,
3
线性回归模型:
y=bx+a+e,其中a和b为模型的未知参数,e称为随
机误差。
思考:产生随机误差项e的原因是什么?
随机误差e的来源(可以推广到一般):
1、忽略了其它因素的影响:影响身高 y 的因素不只 是体重 x,可能还包括遗传基因、饮食习惯、生 长环境等因素;
回顾复习
回归分析方法研究问题的步骤:
(1)根据抽样的数据(xi,yi),画出散点图。
(2)求回归直线方程。yˆ bˆxaˆ
(3)用回归直线方程进行预报 yˆ bˆx aˆ
n
(xi x)( yi y)
bˆ i1 n
(xi x)2
i 1
aˆ y bˆx
( x , y ) 样本点中心
解 由于问题中要求根
70 y
65
据身高预报体重 ,因此选 60
取身高为自变量 x , 真实 体重为因变量 y .作散点
55
50
45
40
x
150 155 160 165 170 175 180
图 (图1 .1 1) :
图1.11
从图 1 .1 1中可以看出 ,
y
70
样本点呈条状分布
,身
65
60
高和体 重有比 较好的
线
单层 统 随抽 抽 机样 样 抽
的频率 分布估 计总体
数字特 征估计 总体数
性 回 归 分
样
分布
字特征
析
回顾复习
两个变量x,y的关系:函数关系 相关关系
脂肪含量 40 35 30 25 20 15 10 5 0
最新-2021学年高中数学人教A版选修12课件:11回归分析的基本思想及其初步应用 精品
解析:散点图能直观形象地反映两个变量间的关系,可以粗略地
判断两个变量间是否存在线性关系.故选D.
答案:D
【做一做1-2】 在下列各组量中:①正方体的体积V与棱长a;②一块
农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收
入;⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关
系的是(
)
A.①②
来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比
较均匀地落在水平的带状区域中,说明选用的模型比较合适.带状
区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越
高.
A.①③ B.②④
C.①④ D.②③
解析:e是一个不可观测的量,故①不正确;R2越小,残差平方和越大,
即模型的拟合效果越差,故③不正确;②④是正确的.故选B.
1.1
回归分析的基本思想及其初步应用
1.了解随机误差、残差、残差图的概念.
2.会用残差分析判断线性回归模型的拟合效果.
3.掌握建立回归模型的步骤.
4.通过对典型案例的探究,了解回归分析的基本思想方法和初步
应用.
1.回归分析
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,
即自变量取值一定时,因变量的取值带有一定的随机性的两个变量
B.①④
C.③④
D.②③④
解析:①是函数关系V=a3;⑤电价是统一规定的,与用电量的关系
是确定的关系.②③④中的两个量之间的关系都是相关关系,因为
水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不
确定;人的身高一开始随着年龄的增大而增加,之后则不变化或降
低,在身高增加时,也不是均匀增加的;家庭的支出与收入有一定的
判断两个变量间是否存在线性关系.故选D.
答案:D
【做一做1-2】 在下列各组量中:①正方体的体积V与棱长a;②一块
农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收
入;⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关
系的是(
)
A.①②
来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比
较均匀地落在水平的带状区域中,说明选用的模型比较合适.带状
区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越
高.
A.①③ B.②④
C.①④ D.②③
解析:e是一个不可观测的量,故①不正确;R2越小,残差平方和越大,
即模型的拟合效果越差,故③不正确;②④是正确的.故选B.
1.1
回归分析的基本思想及其初步应用
1.了解随机误差、残差、残差图的概念.
2.会用残差分析判断线性回归模型的拟合效果.
3.掌握建立回归模型的步骤.
4.通过对典型案例的探究,了解回归分析的基本思想方法和初步
应用.
1.回归分析
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,
即自变量取值一定时,因变量的取值带有一定的随机性的两个变量
B.①④
C.③④
D.②③④
解析:①是函数关系V=a3;⑤电价是统一规定的,与用电量的关系
是确定的关系.②③④中的两个量之间的关系都是相关关系,因为
水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不
确定;人的身高一开始随着年龄的增大而增加,之后则不变化或降
低,在身高增加时,也不是均匀增加的;家庭的支出与收入有一定的
多彩课堂20152016学年高中数学人教A版选修12课件:11《讲义回归分析》课时1
yi2ny2)
i1
i1
i1
i1
建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量 是预报变量. (2)画出确定好的解释变量和预报变量的散点图,观察它 们之间的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线 性关系,则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应 残差过大,或残差呈现不随机的规律性等).若存在异 常,则检查数据是否有误,或模型是否合适等.
残差的作用
1.通过残差表或残差图发现原始数据中的可疑数据 坐标纵轴为残差变量,横轴可以有不同的选择;
若模型选择的正确,残差图中的点应该分布在以横轴 为中心的带形区域;
对于远离横轴的点,要特别注意。
身
高
异
与
常
体
点
重
残 差 图
•错误数据 •模型问题
残差
6000
4000
2000 0
残差
-2000 0
2
①线性回归模型中的预报值 y 与真实情况y
引起的误差;
②观测与计算(用 b a 代替b a)产生的误差;
③省略了一些因素的影响(如生活习惯等) 产生的误差.
在线性回归模型中,e为用bx+a的预报真实值y的随机 误差,它是一个不可观测的量,那么应该怎样研究随机 误差?
在实际应用中,我们用 y bx a 估计 bx+a
本节内容学生内容不易掌握,通过知识整理与比较 引导学生进行区分、理解。通过对典型案例的探究, 练习进行巩固了解回归分析的基本思想方法和初步应 用.
从某大学中随机选取8名女大学生,其身高和体重数 据如下表所示:
高中数学人教A版选修1-2第一章 1.1 回归分析的基本思想及其初步应用课件
判断力.
[解] (1)散点图如图:
n
(2) xiyi=6×2+8×3+10×5+12×6=158,
i=1
x =6+8+410+12=9, y =2+3+4 5+6=4,
n
xi2=62+82+102+122=344.
i=1
^b=15384-4-4×4×9×924=1240=0.7,^a= y -^b x =4-0.7×9=-2.3, 故线性回归方程为^y=0.7x-2.3. (3)由(2)中线性回归方程知,当 x=9 时,^y=0.7×9-2.3=4, 故预测记忆力为 9 的同学的判断力约为 4.
求线性回归方程
[典例] 某研究机构对高三学生的记忆力 x 和判断力 y 进行 统计分析,得下表数据
x6
8
10 12
y2
3
5
6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的
线性回归方程 ^y=^bx+^a; (3)试根据求出的线性回归方程,预测记忆力为 9 的同学的
回归分析
题点一:线性回归分析
1.在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组 数据为:
x 14 16 18 20
22
y 12 10 7 5
3
求出 y 对 x 的回归直线方程,并说明拟合效果的程度.
解: x =15(14+16+18+20+22)=18,
y =15(12+10+7+5+3)=7.4.
(2)非线性回归方程的求法 ①根据原始数据(x,y)作出散点图; ②根据散点图,选择恰当的拟合函数; ③作恰当的变换,将其转化成线性函数,求线性回归方程; ④在③的基础上通过相应的变换,即可得非线性回归方程.
[解] (1)散点图如图:
n
(2) xiyi=6×2+8×3+10×5+12×6=158,
i=1
x =6+8+410+12=9, y =2+3+4 5+6=4,
n
xi2=62+82+102+122=344.
i=1
^b=15384-4-4×4×9×924=1240=0.7,^a= y -^b x =4-0.7×9=-2.3, 故线性回归方程为^y=0.7x-2.3. (3)由(2)中线性回归方程知,当 x=9 时,^y=0.7×9-2.3=4, 故预测记忆力为 9 的同学的判断力约为 4.
求线性回归方程
[典例] 某研究机构对高三学生的记忆力 x 和判断力 y 进行 统计分析,得下表数据
x6
8
10 12
y2
3
5
6
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的
线性回归方程 ^y=^bx+^a; (3)试根据求出的线性回归方程,预测记忆力为 9 的同学的
回归分析
题点一:线性回归分析
1.在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组 数据为:
x 14 16 18 20
22
y 12 10 7 5
3
求出 y 对 x 的回归直线方程,并说明拟合效果的程度.
解: x =15(14+16+18+20+22)=18,
y =15(12+10+7+5+3)=7.4.
(2)非线性回归方程的求法 ①根据原始数据(x,y)作出散点图; ②根据散点图,选择恰当的拟合函数; ③作恰当的变换,将其转化成线性函数,求线性回归方程; ④在③的基础上通过相应的变换,即可得非线性回归方程.
高中数学 2、11回归分析的基本思想及其初步应用课件 新人教A版选修12
由残差图也可以观察到,第4个样本点和第5个样本点 的残差比较大,需要确认在采集在这两个样本点的过程中 是否有人为的错误.
[点评] 本题涉及公式多且复杂,计算量也很大,需 首先了解公式,明白原理.
(1)求解两个变量的回归直线方程、相关指数 R2 的计算量 较大,需要细心、谨慎地计算.如果会使用有统计功能的科学 计算器,能很容易得到∑n i=1xi,∑n i=1yi,∑n i=1x2i ,∑n i=1y2i ,∑n i=1 xiyi 这些量的值,也就无需有制表这一步,直接代入公式算出 结果就可以了.
[答案] D [解析] 只有对两个变量具有线性相关性作出判断时, 利用最小乘法求出线性方程才有意义.
[例2] 某种产品的广告费支出x(单位:百万元)与销售 额y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图; (2)求y关于x的回归直线方程.
[解析] (1)散点图如图所示.
i
1
2
3
4
xiห้องสมุดไป่ตู้个)
10
20
30
40
yi(min) 62
68
75
81
xiyi
620 1360 2250 3240
x xi(个) yi(min)
xiyi
6 60 95 5700
7 70 102 7140
8 80 108 8640
9 90 115 10350
5 50 89 4450 续表 10 100 122 12200
下列有关线性回归的说法,不正确的是 ( ) A.变量取值一定时,因变量的取值带有一定随机性 的两个变量之间的关系叫做相关关系 B.在平面直角坐标系中用描点的方法得到表示具有 相关关系的两个量的一组数据的图形叫做散点图 C.线性回归方程最能代表具有线性相关关系的x,y 之间的关系 D.任何一组观测值都能得到具有代表意义的线性回 归方程
[点评] 本题涉及公式多且复杂,计算量也很大,需 首先了解公式,明白原理.
(1)求解两个变量的回归直线方程、相关指数 R2 的计算量 较大,需要细心、谨慎地计算.如果会使用有统计功能的科学 计算器,能很容易得到∑n i=1xi,∑n i=1yi,∑n i=1x2i ,∑n i=1y2i ,∑n i=1 xiyi 这些量的值,也就无需有制表这一步,直接代入公式算出 结果就可以了.
[答案] D [解析] 只有对两个变量具有线性相关性作出判断时, 利用最小乘法求出线性方程才有意义.
[例2] 某种产品的广告费支出x(单位:百万元)与销售 额y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图; (2)求y关于x的回归直线方程.
[解析] (1)散点图如图所示.
i
1
2
3
4
xiห้องสมุดไป่ตู้个)
10
20
30
40
yi(min) 62
68
75
81
xiyi
620 1360 2250 3240
x xi(个) yi(min)
xiyi
6 60 95 5700
7 70 102 7140
8 80 108 8640
9 90 115 10350
5 50 89 4450 续表 10 100 122 12200
下列有关线性回归的说法,不正确的是 ( ) A.变量取值一定时,因变量的取值带有一定随机性 的两个变量之间的关系叫做相关关系 B.在平面直角坐标系中用描点的方法得到表示具有 相关关系的两个量的一组数据的图形叫做散点图 C.线性回归方程最能代表具有线性相关关系的x,y 之间的关系 D.任何一组观测值都能得到具有代表意义的线性回 归方程
相关主题