高中数学选修2-3第3章3.1回归分析的基本思想及其初步应用课件人教A版
合集下载
数学:3.1《回归分析的基本思想及其初步应用》PPT课件(新人教A-选修2-3)
断模型拟合的效果,判断原始数据中是否存在可 疑数据,这方面的分析工作称为残差分析。
我们可以利用图形来分析残差特性,作图时纵坐标 为残差,横坐标可以选为样本编号,或身高数据,或 体重估计值等,这样作出的图形称为残差图。
非线性回归问题
案例2 一只红铃虫的产卵数y和温度x有关。现
收集了7组观测数据列于表中:
(4)
其中a和b为模型的未知参数,e称为随机误差。
2是、随数机据误点差和的它效在应回,归称直e$线i =上y相i 应$y位i 为置残的差差。异(yi $yi )
3、对每名女大学生计算这个差异,然后分别将所得
的值平方后加起来,用数学符号表示为:n ( yi $yi )2 i 1
称为残差平方和,它代表了随机误差的效应。
新课标人教版课件系列
《高中数学》
选修2-3
3.1《回归分析的基本思想 及其初步应用》
教学目标
• 通过典型案例的探究,进一步了解回归分 析的基本思想、方法及初步应用.
• 教学重点:通过探究使学生体会有些非线 性模型通过变换可以转化为线性回归模型 ,了解在解决实际问题的过程中寻找更好 的模型的方法,了解可用残差分析的方法 ,比较两种模型的拟合效果.
29 841 66
32 1024 115
35 1225 325
作散点图,并由计算器得:y和t之间的线性回归方程为 y=0.367t-202.543,相关指数R2=0.802
将t=x2代入线性回归方程得: y=0.367x2 -202.543
当x=28时,y=0.367×282-
202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。
-30
-20
我们可以利用图形来分析残差特性,作图时纵坐标 为残差,横坐标可以选为样本编号,或身高数据,或 体重估计值等,这样作出的图形称为残差图。
非线性回归问题
案例2 一只红铃虫的产卵数y和温度x有关。现
收集了7组观测数据列于表中:
(4)
其中a和b为模型的未知参数,e称为随机误差。
2是、随数机据误点差和的它效在应回,归称直e$线i =上y相i 应$y位i 为置残的差差。异(yi $yi )
3、对每名女大学生计算这个差异,然后分别将所得
的值平方后加起来,用数学符号表示为:n ( yi $yi )2 i 1
称为残差平方和,它代表了随机误差的效应。
新课标人教版课件系列
《高中数学》
选修2-3
3.1《回归分析的基本思想 及其初步应用》
教学目标
• 通过典型案例的探究,进一步了解回归分 析的基本思想、方法及初步应用.
• 教学重点:通过探究使学生体会有些非线 性模型通过变换可以转化为线性回归模型 ,了解在解决实际问题的过程中寻找更好 的模型的方法,了解可用残差分析的方法 ,比较两种模型的拟合效果.
29 841 66
32 1024 115
35 1225 325
作散点图,并由计算器得:y和t之间的线性回归方程为 y=0.367t-202.543,相关指数R2=0.802
将t=x2代入线性回归方程得: y=0.367x2 -202.543
当x=28时,y=0.367×282-
202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。
-30
-20
高中数学人教A版选修2-3课件:3.1回归分析的基本思想及其初步应用
问题导学
Байду номын сангаас
当堂检测
解:(1)由表画出散点图,如图所示.
问题导学
当堂检测
(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为 x 和 y 线性相关关系显著,下面求其回归方程,首先列出下表.
序号 1 2 3 4 5 6 7 8 ∑ xi 5 .6 6 .0 6 .1 6 .4 7 .0 7 .5 8 .0 8 .2 54.8 yi 130 136 143 149 157 172 183 188 1 258 x2 i 31.36 36.00 37.21 40.96 49.00 56.25 64.00 67.24 382.02 y2 i 16 900 18 496 20 449 22 201 24 649 29 584 33 489 35 344 201 112 xiyi 728.0 816.0 872.3 953.6 1 099.0 1 290.0 1 464.0 1 541.6 8 764.5
例 1 某工厂 1~8 月份某种产品的产量与成本的统计数据见 下表:
月份 产量 (t) 成本 (万元) 1 5 .6 130 2 6 .0 136 3 6 .1 143 4 6 .4 149 5 7 .0 157 6 7 .5 172 7 8.0 183 8 8 .2 188
以产量为 x,成本为 y. (1)画出散点图; (2)y 与 x 是否具有线性相关关系?若有,求出其回归方程. 思路分析:画出散点图,观察图形的形状得 x 与 y 是否具有线性相关 关系.把数值代入回归系数公式求回归方程 . x
3.回归模型拟合效果的刻画
类 别 残差图法 残差点比较均匀地落在 特 点 水平的带状区域内,说明 选用的模型比较适合,这 样的带状区域的宽度越 窄,说明模型拟合精度越 高 残差平方和法 残差平方和
人教A版高中数学选修2-3课件3.1回归分析的基本思想及其初步应用(一)
(x1, y1)
o
(x2 , y2 )
x
•
a ^
易知,截距 ^ 和斜率 b 分别是使
Q( , ) yi yi yi ( xi )
取最小值时 , 的值。由于
n
Q( , ) [ yi xi ( y x) ( y x) ]2
n
xi2
nx y
i
,
2
nx
i1
i1
aˆ y bˆx
•
最小二乘法: yˆ bˆx aˆ
n
n
bˆ =
i=1(xi -x)(yi -y)
n
(xi -x)2
i=1
=
i=1xi yi -nxy
n
xi2-nx 2
i=1
,
aˆ=y-bˆ x.
其中x
2): 对具有相关关系的两个变量进行统计 分析的方法叫回归分析。
•
现实生活中存在着大量的相关关系。 如:人的身高与年龄;
产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
探索:水稻产量y与施肥量x之间大致有何规 律?
•
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
( y ix1 )[ yi i1 xi n( y x)] i1
(
y
x
i 1
)n[n
y
i1
n2
x
n n((xiyx)(yix)y]) 2
n
0,[
( xi
人教A版数学选修2-3全册课件:第三章 3.1 回归分析的基本思想及其初步应用
3.1
回归
第 三
分析 的基 本思
章 想及
其初
步应
用
1 理解教 材新知
2 突破常 考题型
3 跨越高 分障碍
4 应用落 实体验
知识点一 知识点二
题型一 题型二 题型三
随堂即时演练 课时达标检测
3.1 回归分析的基本思想及其初步应用
回归直线方程 [提出问题] 《必修 3》中,求出回归直线方程^y=^bx+^a. 问题 1:回归直线方程准确的反映了 x,y 之间的关系吗? 提示:不是. 问题2:所有的两个相关变量都可以求回归方程吗?
∴
(yi-^y i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,
i=1
5
(yi--y )2=(-20)2+(-10)2+102+02+202=1 000.
i=1
5
yi-^y i2
i=1
∴R12=1- 5
=1-1105050=0.845. yi--y 2
i=1
由(2)可得 yi-^yi 与 yi--y 的关系如下表:
n
n
xi- x yi- y xiyi-n x y
^b=i=1
n
xi- x 2
i=1
=
,
n
x2i -n x 2
i=1
i=1
^a= y -^b x ,
其中 x =n1i=n1xi, y =n1i=n1yi,( x , y ) 称为样本点的中心.
[化解疑难] 线性回归方程中系数^b的含义
(1)^b是回归直线的斜率的估计值,表示 x 每增加一个 单位,y 的平均增加单位数,而不是增加单位数.
[导入新知]
1.残差平方和法
回归
第 三
分析 的基 本思
章 想及
其初
步应
用
1 理解教 材新知
2 突破常 考题型
3 跨越高 分障碍
4 应用落 实体验
知识点一 知识点二
题型一 题型二 题型三
随堂即时演练 课时达标检测
3.1 回归分析的基本思想及其初步应用
回归直线方程 [提出问题] 《必修 3》中,求出回归直线方程^y=^bx+^a. 问题 1:回归直线方程准确的反映了 x,y 之间的关系吗? 提示:不是. 问题2:所有的两个相关变量都可以求回归方程吗?
∴
(yi-^y i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,
i=1
5
(yi--y )2=(-20)2+(-10)2+102+02+202=1 000.
i=1
5
yi-^y i2
i=1
∴R12=1- 5
=1-1105050=0.845. yi--y 2
i=1
由(2)可得 yi-^yi 与 yi--y 的关系如下表:
n
n
xi- x yi- y xiyi-n x y
^b=i=1
n
xi- x 2
i=1
=
,
n
x2i -n x 2
i=1
i=1
^a= y -^b x ,
其中 x =n1i=n1xi, y =n1i=n1yi,( x , y ) 称为样本点的中心.
[化解疑难] 线性回归方程中系数^b的含义
(1)^b是回归直线的斜率的估计值,表示 x 每增加一个 单位,y 的平均增加单位数,而不是增加单位数.
[导入新知]
1.残差平方和法
新人教A版选修(2-3)3.1《回归分析的基本思想及其初步应用》ppt课件1
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。
2020/9/26
郑平正 制作
残差分析与残差图的定义:
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关, 是否可以用回归模型来拟合数据。
然后,我们可以通过残差 e1, e2, , en 来判断模型拟合的效果,判断原始
数据中是否存在可疑数据,这方面的分析工作称为残差分析。
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
即,用这个回归方程不能给出每个身高为172cm 的女大学生的体重的预测值,只能给出她们平均 体重的值。
2020/9/26
郑平正 制作
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号
n
表示为: ( yi yi )2 称为残差平方和,它代表了随机误差的效应。 i 1
202在0/例9/126中,残差平方和约为128.36郑1平。正 制作
由于解析变量和随机误差的总效应(总偏差平方和)为354,而随机误差的效应为 128.361,所以解析变量的效应为
所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。
2020/9/26
郑平正 制作
残差分析与残差图的定义:
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关, 是否可以用回归模型来拟合数据。
然后,我们可以通过残差 e1, e2, , en 来判断模型拟合的效果,判断原始
数据中是否存在可疑数据,这方面的分析工作称为残差分析。
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
即,用这个回归方程不能给出每个身高为172cm 的女大学生的体重的预测值,只能给出她们平均 体重的值。
2020/9/26
郑平正 制作
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号
n
表示为: ( yi yi )2 称为残差平方和,它代表了随机误差的效应。 i 1
202在0/例9/126中,残差平方和约为128.36郑1平。正 制作
由于解析变量和随机误差的总效应(总偏差平方和)为354,而随机误差的效应为 128.361,所以解析变量的效应为
所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为
高中数学人教A版选修2-3 第三章 3.1回归分析的基本思想及其初步应用名校课件(集体备课)
β
i=1
n i=1
n
(xi - x)2
i=1
n
2
+ (yi - y)
i=1
在上式中,后两项和 α, β 无关,而前两
项为非负数,因此要使Q取得最小值,当且仅 当前两项的值均为0,即有
n
(xi - x)(yi - y)
β = i=1 n
(xi - x)2
i =1
这正是我们所要推导的公式.
继续
n
n
= [yi - βxi - (y - βx)]2 + 2 [yi - βxi - (y - βx)](y - βx - α)
i=1
i=1
+n(y - βx - α)2,
注意到
n
[y
i
-
βxi
-
(y
-
βx)](y
-
βx
-
α)
i =1
n
= (y - βx - α) [yi - βxi - (y - βx)] i =1
n
n
= (y - βx - α)[ yi - β xi - n(y - βx)]
i =1
i =1
= (y - βx - α)[ny - nβx - n(y - βx)] = 0,
继续
因此,Q(α,β) = n [yi - βxi - (y - βx)]2 + n(y - βx - α)2
i =1
函数关系),在散点图上各个点均在一条直线上 A. ① ② B. ② ③ C. ① ③ D. ① ② ③
解析:
若r>0,表示两个相关变量正相关,x增大 时,y也相应增大,故①正确. r<0,表示两个变 量负相关,x增大时,y也相应减小,故②错误. |r|越接近1,表示两个变量相关性越高,|r|=1表 示两个变量有确定的关系(即函数关系),故 ③正确.
数学:3.1《回归分析的基本思想及其初步应用》课件(新人教A版选修2-3)
yβ xα yβ xα 2
n
n
yi βxi yβx22 yi βxi yβx
i1
i1
yβxαnyβxα2,
n
注 意 y i β 到 x i y β x y β x α i 1 n
yβ xα yiβ xiyβ x i 1
y β x α ny i β nx i n y β x
i 1
i 1
探 究 在 线 性 回 归 模 型 中 ,e是 用 y预 报 真 实 值 y的 误 差 ,它 是 一 个 不 可 观 测 的 量 ,那 么 应 该 怎 样 研 究 随 机 误 差 ?如 何 衡 量 预 报 的 精 度 ?
因 为 随 机 误 差 是 随量机,因变此 可 以 通 过 这 个 随 机 变 量 的 数 字 特 征画来它刻的 一 些 总 体.特 均征 值 是 反 映 随 机 变 量平取均值水 平 的 数 字,特 方征 差 是 反 映 随 机 变 量于集均中值 程 度 的 数 字, 特 征 而 随 机 误 差 的 均0值,因为此 可 以 用 方σ2差 来 衡 量 随 机 误 差 的 大. 小
预报其体重为
y0.84917285.71260.31k6g.
探 究 身 高172 cm的 70
女 大 学 生 的 体 重 一 定 65
是 60.316 kg 吗?如 果
60 55
不 是,其 原 因 是 什 么? 50
显然 ,身高 172cm的女45 40
大学生的体重不一定 150 155 160 165 170 175 180
为了衡量预报的,需 精要 度估σ计2的值.一个自然 的想法是通过样本来方估差计总体方.如差何得
到随机变e量 的样本呢 ?由于模型 3或4中的e
隐含在预报变 y中量 ,我们无法精确地把y中 它从 分离出,来 因此也就无法得到变随量e机的样本 .
n
n
yi βxi yβx22 yi βxi yβx
i1
i1
yβxαnyβxα2,
n
注 意 y i β 到 x i y β x y β x α i 1 n
yβ xα yiβ xiyβ x i 1
y β x α ny i β nx i n y β x
i 1
i 1
探 究 在 线 性 回 归 模 型 中 ,e是 用 y预 报 真 实 值 y的 误 差 ,它 是 一 个 不 可 观 测 的 量 ,那 么 应 该 怎 样 研 究 随 机 误 差 ?如 何 衡 量 预 报 的 精 度 ?
因 为 随 机 误 差 是 随量机,因变此 可 以 通 过 这 个 随 机 变 量 的 数 字 特 征画来它刻的 一 些 总 体.特 均征 值 是 反 映 随 机 变 量平取均值水 平 的 数 字,特 方征 差 是 反 映 随 机 变 量于集均中值 程 度 的 数 字, 特 征 而 随 机 误 差 的 均0值,因为此 可 以 用 方σ2差 来 衡 量 随 机 误 差 的 大. 小
预报其体重为
y0.84917285.71260.31k6g.
探 究 身 高172 cm的 70
女 大 学 生 的 体 重 一 定 65
是 60.316 kg 吗?如 果
60 55
不 是,其 原 因 是 什 么? 50
显然 ,身高 172cm的女45 40
大学生的体重不一定 150 155 160 165 170 175 180
为了衡量预报的,需 精要 度估σ计2的值.一个自然 的想法是通过样本来方估差计总体方.如差何得
到随机变e量 的样本呢 ?由于模型 3或4中的e
隐含在预报变 y中量 ,我们无法精确地把y中 它从 分离出,来 因此也就无法得到变随量e机的样本 .
高中数学第3章统计案例3.1回归分析的基本思想及其初步应用课件新人教A版选修2-3
阶
阶
段
段
1
3
3.1 回归分析的基本思想及其初步应用
学阶 段业 分Fra bibliotek层2测
评
1.通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用. 2.会求回归直线方程,并用回归直线方程进行预报.(重点) 3.了解最小二乘法的思想方法,理解回归方程与一般函数的区别与联系.(难 点)
[ 基础·初探]
教材整理 1 回归直线方程 阅读教材 P80~P82 探究上面倒数第一行,完成下列问题. 1.回归分析
作残差图如图所示:
由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比 较合适.
非线性回归分析
[探究共研型]
探究 1 如果两个相关变量 x,y 满足回归方程 y=c1x2+c2,那么 x,y 具有 线性相关关系吗?如何把它化归为线性回归方程问题?
【提示】 x,y 不具有线性相关关系,但是若令 z=x2,则 y=c1x2+c2 可变 换为 y=c1z+c2,即化归为线性回归方程问题.
回归分析是对具有___相__关__关__系_____的两个变量进行统计分析的一种常用方
法.
教材整理 2 线性回归分析
阅读教材 P82 探究~P89,完成下列问题. 1.线性回归模型 (1)表达式Ey=e_=_b_x_+_0___a_,+__De__e,=_σ_2__.
(2)基本概念:
①a 和 b 为模型的未知参数. ②e 是 y 与 bx+a 之间的误差.通常 e 为随机变量,称为__随__机__误__差___. ③x 称为__解__释__变__量__,y 称为___预__报__变__量____.
(2016·临沂高二检测)下表提供了某厂节能降耗技术改造后生产甲 产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据:
阶
段
段
1
3
3.1 回归分析的基本思想及其初步应用
学阶 段业 分Fra bibliotek层2测
评
1.通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用. 2.会求回归直线方程,并用回归直线方程进行预报.(重点) 3.了解最小二乘法的思想方法,理解回归方程与一般函数的区别与联系.(难 点)
[ 基础·初探]
教材整理 1 回归直线方程 阅读教材 P80~P82 探究上面倒数第一行,完成下列问题. 1.回归分析
作残差图如图所示:
由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比 较合适.
非线性回归分析
[探究共研型]
探究 1 如果两个相关变量 x,y 满足回归方程 y=c1x2+c2,那么 x,y 具有 线性相关关系吗?如何把它化归为线性回归方程问题?
【提示】 x,y 不具有线性相关关系,但是若令 z=x2,则 y=c1x2+c2 可变 换为 y=c1z+c2,即化归为线性回归方程问题.
回归分析是对具有___相__关__关__系_____的两个变量进行统计分析的一种常用方
法.
教材整理 2 线性回归分析
阅读教材 P82 探究~P89,完成下列问题. 1.线性回归模型 (1)表达式Ey=e_=_b_x_+_0___a_,+__De__e,=_σ_2__.
(2)基本概念:
①a 和 b 为模型的未知参数. ②e 是 y 与 bx+a 之间的误差.通常 e 为随机变量,称为__随__机__误__差___. ③x 称为__解__释__变__量__,y 称为___预__报__变__量____.
(2016·临沂高二检测)下表提供了某厂节能降耗技术改造后生产甲 产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据:
人教版高中数学选修2-3第三章1回归分析的基本思想及其初步应用(共33张PPT)教育课件
女大学生身高体重原始数据和相应的残差数据表
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
体重/kg
残差_e
48
-6.373
57
2.627
50
2.419
54
-4.618
64
1.137
61
6.627
43
-2.883
58
0.382
利用图形分析
7 6 5 4 3 2 1 0
20 22 24 26 28 30 32 34 36 温度
得到线性回归方程为 z 0 .2x 7 3 2 .843
红铃虫的35产0 卵数对温度的非线性回归方程为
300 250
y1 e0.27x 23.843
200
产卵数
150
100
50
0
20 22 24 26 28 30 32 34 36
y
与
y
a,
b 与a,
b
线性回归模型
之间
存在误差
ybxae,
误差
随机
Ee0,De2.
原因
误差e
2越小 ~ ybxa预报 y值越精确
产生随机误差e的原因是什么?
一个人的体重值除了受身高的影响外,
还有 饮食
运动
度量误差
线性模型只是近似模型
怎样研究随机误差?如何衡量预报的精度? 随机变量数字特征
均值 反映随机变量取值平均水平 方差 反映随机变量集中于均值程度
函数关系是一种确定性关系 相关关系是一种非确定性关 系 回归分析是对具有相关关系的两个变量进行统
计分析的一种常用方法.
高中数学人教A版选修2-3第三章:3.1回归分析的基本思想及其初步应用 课件
从散点图可以看到,样本点散布在某一条直线的 附近,而不是一条直线上,所以不能用一次函数 y=bx+a来描述它们之间的关系。
这时我们用下面的线性回归模型来描述身高和体
重的关系:y=bx+a+e
其中a和b为模型的未知参数,
e是y与 yˆ 之间的误差,通常e称为随机误差。
产生随机误差e的原因是什么?
(1)所用确定性函数模拟不恰当; (2)忽略了某些因素的影响; (3)观测误差,如使用的测量工具不同等。
4.线性回归模型y=bx+a+e中, 把自变量x称为解释变量, 把因变量y称为预报变量。
^
^
5.残差: ei yi yi
n
^
6.残差平方和:
( yi yi )2
i 1
n
7.总偏差平方和: ( yi y)2
i 1
n
^
( yi y)2
8.相关指数:R2
1
i 1 n
( yi y)2
新课讲解
例 从某大学中随机选出8名女大学生,其 身高和体重数据如下表:
编号 1 2 3 4 5 6 7 8 身高 165 165 157 170 175 165 155 170 体重 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的 回归方程,并预报一名身高为172cm的女 大学生的体重。
三、回归直线方程:最小二乘法
1、所求回归直线方程为 yˆ = bˆ x + aˆ ,其中:
n
n
y bˆ =
(xi - x)(yi - y)
i=1 n
=
(xi - x)2
xi
- nxy
i
i=1
2017-2018学年人教A版高中数学选修2-3课件:第三章统计案例3.1回归分析的基本思想及其初步应用课件
������ ������
^
2
2
. ∑ (yi-������������ )2 越小,也就是说,模型拟
������
(6)R2 越大,意味着残差平方和 合的效果越好.
^
������ =1
1
2
3
4
知识拓展在线性回归模型中,R2表示解释变量对于预报变量变化 的贡献率.R2越接近于1,表示回归的效果越好(因为R2越接近于1,表 示解释变量和预报变量的相关性越强).如果对某组数据可以采取 几种不同的回归方程进行回归分析,也可以通过比较几个R2,选择 其值大的模型.
1
2
3
4
1.回归分析 (1)函数关系是一种确定性关系,而相关关系是一种非确定性关 系. (2)回归分析是对具有相关关系的两个变量进行统计分析的一 种常用方法. (3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回 归直线 y=bx+a 的斜率和截距的最小二乘估计公式分别为
1
2
3
4
3.r=
������=1 n i=1 ������
Байду номын сангаас
∑ (xi -x)(yi -y)
2 ������ 2 ������=1
������
∑ (������������ -������) ∑ (������������ -������)
������=1
=
∑ ������������ ������������ -������������ ������
1
2
3
4
2.随机误差 (1)随机误差的均值E(e)=0,方差D(e)=σ2. ������ = ������������ + ������ + ������, (2)线性回归模型的完整表达式是 2 . 在此线性 ������(������) = 0,������(������) = ������ 回归模型中,随机误差e的方差σ2越小,通过回归直线预报真实值y的 精度越高. 知识拓展随机误差的主要来源: (1)用线性回归模型近似地逼近真实模型所引起的误差; (2)忽略了某些因素的影响所产生的误差; (3)观测误差.
^
2
2
. ∑ (yi-������������ )2 越小,也就是说,模型拟
������
(6)R2 越大,意味着残差平方和 合的效果越好.
^
������ =1
1
2
3
4
知识拓展在线性回归模型中,R2表示解释变量对于预报变量变化 的贡献率.R2越接近于1,表示回归的效果越好(因为R2越接近于1,表 示解释变量和预报变量的相关性越强).如果对某组数据可以采取 几种不同的回归方程进行回归分析,也可以通过比较几个R2,选择 其值大的模型.
1
2
3
4
1.回归分析 (1)函数关系是一种确定性关系,而相关关系是一种非确定性关 系. (2)回归分析是对具有相关关系的两个变量进行统计分析的一 种常用方法. (3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回 归直线 y=bx+a 的斜率和截距的最小二乘估计公式分别为
1
2
3
4
3.r=
������=1 n i=1 ������
Байду номын сангаас
∑ (xi -x)(yi -y)
2 ������ 2 ������=1
������
∑ (������������ -������) ∑ (������������ -������)
������=1
=
∑ ������������ ������������ -������������ ������
1
2
3
4
2.随机误差 (1)随机误差的均值E(e)=0,方差D(e)=σ2. ������ = ������������ + ������ + ������, (2)线性回归模型的完整表达式是 2 . 在此线性 ������(������) = 0,������(������) = ������ 回归模型中,随机误差e的方差σ2越小,通过回归直线预报真实值y的 精度越高. 知识拓展随机误差的主要来源: (1)用线性回归模型近似地逼近真实模型所引起的误差; (2)忽略了某些因素的影响所产生的误差; (3)观测误差.
高中数学人教A版选修2-3第三章3.1回归分析的基本思想及其初步应用 课件(共46张PPT)
现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
探索:水稻产量y与施肥量x之间大致有何规 律?
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
(3)预报一名身高为172cm的女大学生的体重?
【解】列出下表
编号i 1
23 4
5
6
7
8
身高xi 165 165 157 170 175 165 155 170
体重yi 48 57 50 54 64 61 43 59
xiyi 7920 9405 7850 9180 11200 10065 6665 10030
-1.0 -0.75 -0.25 0 0.25 0.5 1.0
r
负相关程度增加 正相关程度增加
6、用相关指数R2来刻画拟合效果
n
n
( yi yi )2
(yi y)2
R2
1
i 1 n
i1 n
[0,1]
残差平 方和
( yi y)2
( yi y)2
总偏差
i 1
i 1
平方和
1、R2 1,说明回归方程拟合的越好; R20,说明回归方程拟合的越差。
型来拟合
z ax b e
(2) ②用模型y c3 x2 c4来拟合,令t x2, 则y c3t c4,
列出变换后数据表并画出y与t 的散点图:
t 441 529 625 729 841 1024 1225
y 7 11 21 24 66 115 325
环境等因素; 3、身高 y 的观测误差。
高中新课标数学人教A版选修2-3课件:3.1 回归分析的基本思想及其初步应用 (共55张PPT)
^ +b ^x 中的b ^表示 x 增加 1 个单位时, (3)线性回归方程^ y=a y 的平均 ^,而a ^表示 y 不随 x 的变化而变化的量. 变化量为b ^ +b ^x 预测在 x 取某一个值时 y 的估计 (4)可以用线性回归方程^ y=a 值.
【练习 4】 有下列说法: ①在残差图中,残差点比较均匀地落在水平的带状区域内,说明 选用的模型比较合适; ②用 R2 可以刻画回归的效果,R2 值越大,说明模型的拟合效果越 好; ③对于已获取的样本数据,残差平方和越小,即模型的拟合效果 越好. 其中说法正确的有( ) A.0 个 B.1 个 C.2 个 D.3 个
Байду номын сангаас
n
.②
【练习 2】 观察两个相关变量的如下数据: x -1 -2 -3 3 2 1 -4 -5 5 4 y -0.9 -2 -3.1 -3.9 -5.1 5 4.1 2.9 2.1 0.9 则两个变量间的回归直线方程为( ) A.^ y=0.5x-1 C.^ y=2x+0.3 B.^ y =x D.^ y=x+1
y=bx+a+e, Ee=0, 在此线性回归的模型中, 随机误差 e 的方差 σ2 越小, De=σ2.
用 bx+a 预报真实值 y 的精度越高.
2.残差分析 (1)残差:对于样本点(x1,y1),(x2,y2),„,(xn,yn)而言,对应 于它们的随机误差为 ei=yi-^ y=yi-bxi-a,i=1,2,„,n,其估计值 ^xi-a ^,i=1,2,„,n,^ 为^ ei=yi-^ yi=yi-b ei 称为对应于点(xi,yi)的残 差. (2)利用残差图进行残差分析的具体步骤如下: ①计算每组观测数据的残差,^ ei=yi-^ y i(i=1,2,„,n),即残差 等于观测值减预测值; ②画残差图.残差图的纵坐标为残差,横坐标通常可以是观测样 本的编号、自变量 x 或因变量的预测值等,残差图是一种散点图; ③分析残差图.
2019-2020人教A版数学选修2-3 第3章 3.1 回归分析的基本思想及其初步应用课件PPT
栏目导航
1.在如图所示的四个散点图中,适合用线性回
B [结
归模型拟合其中两个变量的是( )
合散点图可
知①③中的
散点大体分
布在一条直
A.①② C.②③
B.①③ D.③④
线的左右两 侧,故选 B.]
栏目导航
2.在两个变量 y 与 x 的回归模型中,分别选择了 4 个不同模型, 它们的相关指数 R2 如下,其中拟合效果最好的模型是( )
栏目导航
n
nn
b^=i=1
xi- x yi- y xiiyii-n ii==11 =
x
y ,
n
xi- x 2
i=1
nn x2i2i -n x 22
ii==11
a^= y -b^ x ,
其中 x =1nn xi, y =1nn yi,_(_x_,__y__) _称为样本点的中心.
x/百万元 2 4 5 6 8 y/百万元 30 40 60 50 70 (1)画出散点图; (2)求线性回归方程; (3)试预测广告费用支出为 10 百万元时的销售额.
第三章 统计案例
3.1 回归分析的基本思想及其初步应用
栏目导航
学习目标
核心素养
1.了解随机误差、残差、残差图的 1.通过回归分析的学习,培
概念.(重点) 养了学生数据分析的素养.
2.会通过分析残差判断线性回归 2.借助回归模型的建立,
模型的拟合效果.(重点) 培养学生数学建模、数据分
3.了解常见的非线性回归模型转 析及数学运算的素养.
栏目导航
3.刻画回归效果的方式
作图时纵坐标为_残__差__,横坐标可以选为_样__本__编__号__,或 残差图 _身__高__数__据__,或_体__重__的__估__计__值___等,这样作出的图形称为
人教A版高中数学选修2-3课件3.1回归分析的基本思想及其初步应用2新
2018/12/5
探究 对于一组具有线性相关关系的数据 x1, y1 , x 2 , y 2 , , xn , yn , 我们知道其回归方程的截距和斜率的最小 二乘估计公式分别为: n
ˆx ˆ y b a
1
n
ˆ b
n
x
i1 n
i
x y i y
β
x
i1 n
n
i
x y i y
i
x
i1
x
, α y βx .
2
这正是我们所要推导的 公式.
下面我们通过案例 , 进一步学习回归分析的 基本思想及其应用 .
2018/12/5
例1 从某大学中随机选取 8名女大学生 , 其身高和体 重数据如表3 1所示. 编号 1 2 3 4 5 6 7 8 身高/ cm 165 165 157 170 175 165 155 170 体重 / kg 48 57 50 54 64 61 43 59 求根据一名女大学生的 身高预报她的体重的回 归方程, 并预报一名身高为 172cm的女大学生的体重 .
2 n i1
由于Qα,β yi βxi y βx y βx α
n
2
y βx α y βx α
2 n 2
yi βxi y βx 2yi βxi y βx
解 由于问题中要求根 据身高预报体重 ,因此选 取身高为自变量 x , 真实 体重为因变量 y .作散点 图 (图3.1 1) :
2018/12/5
70 65 60 55 50 45 40
y
x
150 155 160 165 170 175 180
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D典例透析
IANLI TOUXI
1
(3)对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,它们的随机误差为 ei=yi-bxi-a,i=1,2,…,n,其估计值为
知识拓展1.当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关. 2.|r|越接近于1,表明两个变量的线性相关性越强; |r|越接近于0,表明两个变量之间几乎不存在线性相关关系. 通常,当|r|不小于0.75时,我们认为两个变量存在着很强的线性相 关关系.
-5-
3.1
回归分析的基本 思想及其初步应用
-3-
3.1
回归分析的基本 思想及其初步应用
2 3 4
M 目标导航
UBIAODAOHANG
Z 知识梳理
HISHI SHULI
Z 重难聚焦
HONGNAN JVJIAO
D典例透析
IANLI TOUXI
1
1.回归分析 (1)函数关系是一种确定性关系,而相关关系是一种非确定性关 系. (2)回归分析是对具有相关关系的两个变量进行统计分析的一 种常用方法. (3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回 归直线 y=bx+a 的斜率和截距的最小二乘估计公式分别为
-4-
^
^
其中������ =
1 ������ ∑ xi,������ ������ ������ =1
=
3.1
回归分析的基本 思想及其初步应用
2 3 4
M 目标导航
������
UBIAODAOHANG
Z 知识梳理
HISHI SHULI
Z 重难聚焦
HONGNAN JVJIAO
D典例透析
IANLI TOUXI
M 目标导航
UBIAODAOHANG
Z 知识梳理
HISHI SHULI
Z 重难聚焦
HONGNAN JVJIAO
D典例透析
IANLI TOUXI
1
【做一做1-2】 若分别计算具有线性相关关系的甲组数据和乙 组数据,得相关系数r甲=0.8,r乙=-0.9,则相关关系较强的是( ) A.甲组数据 B.乙组数据 C.甲、乙两组数据一样强 D.不确定 解析:∵|r乙|=0.9>|r甲|=0.8更接近于1,∴乙组数据相关性强. 答案:B
2 3 4
M 目标导航
UBIAODAOHANG
Z 知识梳理
HISHI SHULI
Z 重难聚焦
HONGNAN JVJIAO
D典例透析
IANLI TOUXI
1
3.r=
������=1 n i=1 ������
∑ (xi -x)(yi -y)
2 ������ 2 ������=1
������
∑ (������������ -������) ∑ (������������ -������)
精度越高.
知识拓展随机误差的主要来源: (1)用线性回归模型近似地逼近真实模型所引起的误差; (2)忽略了某些因素的影响所产生的误差; (3)观测误差.
-9-
3.1
回归分析的基本 思想及其初步应用
2 3 4
M 目标导航
UBIAODAOHANG
Z 知识梳理
HISHI SHULI
Z 重难聚焦
HONGNAN JVJIAO
^
������ =
i=1
∑ (������������ -������)(������������ -������)
������=1
n
∑ (������������ -������)2
������
, ������ = ������ − ������ ������ .
1 ������ ∑ yi,(������ , ������)称为样本点的中心. ������ ������ =1
-8-
3.1
回归分析的基本 思想及其初步应用
2 3 4
M 目标导航
UBIAODAOHANG
Z 知识梳理
HISHI SHULI
Z 重难聚焦
HONGNAN JVJIAO
D典例透析
IANLI TOUXI
1
2.随机误差 (1)随机误差的均值E(e)=0,方差D(e)=σ2. ������ = ������������ + ������ + ������, (2)线性回归模型的完整表达式是 2 . 在此线性 ������(������) = 0,������(������) = ������ 回归模型中,随机误差e的方差σ2越小,通过回归直线预报真实值y的
1
(4)用相关系数 r=
������=1
∑ (������������ -������) ∑ (������������ -������)
������=1
������=1 ������
∑ (������������ -������)(������������ -������)
2 ������ 2
来描述线性相关.
������=1
=
∑ ������������ ������������ -������������ ������
2 ������ 2
2 ( ∑ ������2 ������ -������������ )( ∑ ������������ -������������ ) ������=1 ������=1
������
.
-6-
3.1
回归分析的基本 思想及其初步应用
2 3 4
M 目标导航
UBIAODAOHANG
Z 知识梳理
HISHI SHULI
Z 重难聚焦
HONGNAN JVJIAO
D典例透析
IANLI TOUXI
1
【做一做1-1】 下表是x与y之间的一组数据,则y关于x的线性回 归直线必过点( )
x y 0 1 1 3 2 5 3 7
A.(2,2) C.(1,2) 解析: ∵ ������ = 答案:D
B.(1.5,2) D.(1.5,4)
0+1+2+3 =1.5,������ 4
=
∴样本点的中心为(1.5,4),而回归直线过样本点的中心,故选D.
1+3+5+7 =4, 4
ቤተ መጻሕፍቲ ባይዱ-7-
3.1
回归分析的基本 思想及其初步应用
2 3 4
第三章
统计案例
-1-
3.1
回归分析的基本思想及其初步应用
-2-
3.1
回归分析的基本 思想及其初步应用
M 目标导航
UBIAODAOHANG
Z 知识梳理
HISHI SHULI
Z 重难聚焦
HONGNAN JVJIAO
D典例透析
IANLI TOUXI
1.了解回归分析的基本思想,会对两个变量进行回归分析,会求两 个具有线性相关关系的变量的回归直线方程,并用回归直线方程进 行预报. 2.了解最小二乘法的思想方法,理解回归方程与一般函数的区别 与联系. 3.通过典型案例的分析,了解回归分析的初步应用——相关检验.