数学高考总复习重点精品回归分析的基本思想及其初步应用(新课标人教A版)1PPT课件
合集下载
新课标人教A版高中数学选修1-2 《1.1 回归分析的基本思想及其初步应用》(共45张PPT)
在本例中,根据上面的公式,可以得到 ˆ = 0.849,a ˆ = -85.712. b ˆ = 0.849 x - 85.712. 于是得到线性回归方程y
n
n
ˆ = 0.849是回归直线的斜率的估计值,说明身高x b 每增加1个单位,体重y就增加0.849个单位,这表明体重 与身高具有正的线性相关关系.
图1.1 1
ˆ 和a ˆ, 未知参数 b 和 a 的最小二乘估计分别为 b 其计算公式如下:
ˆ b
x
i 1 n
n
i
x yi y
i
x
i 1
x
,
2
ˆ x, ˆ = y-b a
1 1 其中 x = xi ,y = yi . x,y 称为样本点 的 中心 . n i=1 n i=1
思考:如何发现数据中的错误?如何衡量模型的拟 合效果? 可以通过残差发现原始数据中的可疑数据,判 断所建立模型的拟合效果.下表列出了女大学生身 高和体重的原始数据以及相应的残差数据.
编号 1 2 3 4 170 5 6 7 155 8 170
身 高 / cm 165
165 157
175 165
体 重 / kg 48 57Fra bibliotek50 54 64 61 43 59 ˆ 6 .373 2 .627 2 .419 4 .618 1 .137 6 .627 2 .883 0 .382 残 差e
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号, 或身高数据, 或 体重估计值等, 这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
所以 ,对身高为 172 cm的女大学生 , 由回归方程可以 预报其体重为 ˆ = 0.849 172 - 85.712 = 60.316 ( kg) . y
n
n
ˆ = 0.849是回归直线的斜率的估计值,说明身高x b 每增加1个单位,体重y就增加0.849个单位,这表明体重 与身高具有正的线性相关关系.
图1.1 1
ˆ 和a ˆ, 未知参数 b 和 a 的最小二乘估计分别为 b 其计算公式如下:
ˆ b
x
i 1 n
n
i
x yi y
i
x
i 1
x
,
2
ˆ x, ˆ = y-b a
1 1 其中 x = xi ,y = yi . x,y 称为样本点 的 中心 . n i=1 n i=1
思考:如何发现数据中的错误?如何衡量模型的拟 合效果? 可以通过残差发现原始数据中的可疑数据,判 断所建立模型的拟合效果.下表列出了女大学生身 高和体重的原始数据以及相应的残差数据.
编号 1 2 3 4 170 5 6 7 155 8 170
身 高 / cm 165
165 157
175 165
体 重 / kg 48 57Fra bibliotek50 54 64 61 43 59 ˆ 6 .373 2 .627 2 .419 4 .618 1 .137 6 .627 2 .883 0 .382 残 差e
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号, 或身高数据, 或 体重估计值等, 这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
所以 ,对身高为 172 cm的女大学生 , 由回归方程可以 预报其体重为 ˆ = 0.849 172 - 85.712 = 60.316 ( kg) . y
数学:3.1《回归分析的基本思想及其初步应用》PPT课件(新人教A-选修2-3)
断模型拟合的效果,判断原始数据中是否存在可 疑数据,这方面的分析工作称为残差分析。
我们可以利用图形来分析残差特性,作图时纵坐标 为残差,横坐标可以选为样本编号,或身高数据,或 体重估计值等,这样作出的图形称为残差图。
非线性回归问题
案例2 一只红铃虫的产卵数y和温度x有关。现
收集了7组观测数据列于表中:
(4)
其中a和b为模型的未知参数,e称为随机误差。
2是、随数机据误点差和的它效在应回,归称直e$线i =上y相i 应$y位i 为置残的差差。异(yi $yi )
3、对每名女大学生计算这个差异,然后分别将所得
的值平方后加起来,用数学符号表示为:n ( yi $yi )2 i 1
称为残差平方和,它代表了随机误差的效应。
新课标人教版课件系列
《高中数学》
选修2-3
3.1《回归分析的基本思想 及其初步应用》
教学目标
• 通过典型案例的探究,进一步了解回归分 析的基本思想、方法及初步应用.
• 教学重点:通过探究使学生体会有些非线 性模型通过变换可以转化为线性回归模型 ,了解在解决实际问题的过程中寻找更好 的模型的方法,了解可用残差分析的方法 ,比较两种模型的拟合效果.
29 841 66
32 1024 115
35 1225 325
作散点图,并由计算器得:y和t之间的线性回归方程为 y=0.367t-202.543,相关指数R2=0.802
将t=x2代入线性回归方程得: y=0.367x2 -202.543
当x=28时,y=0.367×282-
202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。
-30
-20
我们可以利用图形来分析残差特性,作图时纵坐标 为残差,横坐标可以选为样本编号,或身高数据,或 体重估计值等,这样作出的图形称为残差图。
非线性回归问题
案例2 一只红铃虫的产卵数y和温度x有关。现
收集了7组观测数据列于表中:
(4)
其中a和b为模型的未知参数,e称为随机误差。
2是、随数机据误点差和的它效在应回,归称直e$线i =上y相i 应$y位i 为置残的差差。异(yi $yi )
3、对每名女大学生计算这个差异,然后分别将所得
的值平方后加起来,用数学符号表示为:n ( yi $yi )2 i 1
称为残差平方和,它代表了随机误差的效应。
新课标人教版课件系列
《高中数学》
选修2-3
3.1《回归分析的基本思想 及其初步应用》
教学目标
• 通过典型案例的探究,进一步了解回归分 析的基本思想、方法及初步应用.
• 教学重点:通过探究使学生体会有些非线 性模型通过变换可以转化为线性回归模型 ,了解在解决实际问题的过程中寻找更好 的模型的方法,了解可用残差分析的方法 ,比较两种模型的拟合效果.
29 841 66
32 1024 115
35 1225 325
作散点图,并由计算器得:y和t之间的线性回归方程为 y=0.367t-202.543,相关指数R2=0.802
将t=x2代入线性回归方程得: y=0.367x2 -202.543
当x=28时,y=0.367×282-
202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。
-30
-20
2013年数学高考总复习重点精品课件: 回归分析的基本思想及其初步应用 (新课标人教A版) 课件1
[思路探索] 作残差分析时,一般从以下几个方面予以说
明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样 本点的带状分布区域的宽窄.
课前探究学习 课堂讲练互动 活页规范训练
[自主解答] (1)散点图如图
-=1(5+10+15+20+25+30)=17.5, x 6 -=1(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487, y 6 x2=2 i i=1
活页规范训练
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的 面积x的数据:
房屋面积/m2 销售价格/万元
115 24.8
110 21.6
80 18.4
135 29.2
105 22
(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
点)
课前探究学习
课堂讲练互动
活页规范训练
自学导引
回归分析 1.
相关关系 回归分析是对具有_________的两个变量进行统计分析的一 种常用方法. 线性回归模型 2. (1)由散点图易发现,样本点散布在某一条直线附近,而不
是一条直线上,不能用一次函数y=bx+a描述它们之间的
关系,因此用线性回归模型y=bx+a+e来表示,其中a、b 随机误差 为未知参数,e为_________ .
课前探究学习
课堂讲练互动
活页规范训练
题型一
求线性回归方程
【例1】 某班5名学生的数学和物理成绩如下表: 学生
学科 数学成绩(x) 物理成绩(y)
A
88 78
B
76 65
C
73 71
新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》ppt课件2
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系。试求:
(1)线性回归方程 yˆ bˆx aˆ 的回归系数 aˆ、bˆ ;
(2)求残差平方和;
R (3)求相关系数 2;
(4)估计使用年限为10年时,维修费用是多少?
一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解析变量,哪个变量 是预报变量。
线性关系
方案2
产卵数
400
300
200
100
气
温
0
-40 -30 -20 -10 0 -100
10 20 30 40
-200
方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
温度
21
23
25
27
29
32
35
温度的平方t 441
在统计中,我们也把自变量x称为解析变量,因变 量y为预报变量。
残差
数据点和它在回归直线上相应位置的差异 称为相应于点(xi,yi ) 的残差。
ei =yi
yi
例:编号为6的女大学生,计算随机误差的效应(残差)
61 (0.849165 85.712) 6.627
残差平方和
把每一个n 残差所得的值平方后加起来,用数学符号表
身
高
异
与
常
体 重
点
残
差
• 错误数据
图
• 模型问题
我们可以用相关指数R2来刻画回归的效果,其计算公式是
新人教A版选修(2-3)3.1《回归分析的基本思想及其初步应用》ppt课件1
体重/kg 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。
2020/9/26
郑平正 制作
残差分析与残差图的定义:
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关, 是否可以用回归模型来拟合数据。
然后,我们可以通过残差 e1, e2, , en 来判断模型拟合的效果,判断原始
数据中是否存在可疑数据,这方面的分析工作称为残差分析。
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
即,用这个回归方程不能给出每个身高为172cm 的女大学生的体重的预测值,只能给出她们平均 体重的值。
2020/9/26
郑平正 制作
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号
n
表示为: ( yi yi )2 称为残差平方和,它代表了随机误差的效应。 i 1
202在0/例9/126中,残差平方和约为128.36郑1平。正 制作
由于解析变量和随机误差的总效应(总偏差平方和)为354,而随机误差的效应为 128.361,所以解析变量的效应为
所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图: 2、由散点图知道身高和体重有比较 好的线性相关关系,因此可以用线性 回归方程刻画它们之间的关系。
2020/9/26
郑平正 制作
残差分析与残差图的定义:
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关, 是否可以用回归模型来拟合数据。
然后,我们可以通过残差 e1, e2, , en 来判断模型拟合的效果,判断原始
数据中是否存在可疑数据,这方面的分析工作称为残差分析。
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
即,用这个回归方程不能给出每个身高为172cm 的女大学生的体重的预测值,只能给出她们平均 体重的值。
2020/9/26
郑平正 制作
案例1:女大学生的身高与体重
例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。
编号 1 2 3 4 5 6 7 8
身高/cm 165 165 157 170 175 165 155 170
对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号
n
表示为: ( yi yi )2 称为残差平方和,它代表了随机误差的效应。 i 1
202在0/例9/126中,残差平方和约为128.36郑1平。正 制作
由于解析变量和随机误差的总效应(总偏差平方和)为354,而随机误差的效应为 128.361,所以解析变量的效应为
所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为
【高中课件】高中数学人教A版选修233.1回归分析的基本思想及其初步应用(1)课件ppt.ppt
故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千 元.
进行线性回归分析的关键是画出样本点的散点图,确定出 变量具有线性相关关系,再求出回归直线方程.如果 x,y 的 线性相关关系具有统计意义,就可以用线性回归方程来作预测 和控制.
某工厂 1~8 月份某种产品的产量与成本
的统计数据见下表:
4 6.4 149 40.96 22 201 953.6
2.线性回归方程中的回归截距a^和回归系数b^都是通过样 本估计得来的,存在着误差,这种误差可能导致预测结果的偏 差.
3.线性回归方程^y=a^+b^x 中的b^表示 x 增加 1 个单位时, ^y的平均变化量为b^,而a^表示^y不随 x 的变化而变化的部分.
4.可以利用线性回归方程^y=a^+b^x 预测在 x 取某一个值 时 y 的估计值.
(2)在线性回归方程^y=b^x+a^中
n
xiyi-n
x
y
n
xi--x yi--y
i=1
b^=
=
n
xi--x 2
i=1
n
x2i -n x 2
i=1
,a^= -y -b^-x.
i=1
1n
1n
其中-x = ni=1xi ,-y = ni=1yi ,(-x ,-y )称为样本点的中
i=1
相关
指数 R2 R2=1-
n
yi--y 2
i=1
,R2 表示 解释 变量
对预报变量变化的贡献率,R2 越接近于 1,
表示回归的效果越好
问题思考 2:在回归分析中,相关指数 R2 的值越大,则残 差平方和越大还是越小?
提示:相关指数 R2 的值越大,说明回归模型拟合的效果 越好,残差平方和越小,反之,相关指数 R2 的值越小,残差 平方和越大.
进行线性回归分析的关键是画出样本点的散点图,确定出 变量具有线性相关关系,再求出回归直线方程.如果 x,y 的 线性相关关系具有统计意义,就可以用线性回归方程来作预测 和控制.
某工厂 1~8 月份某种产品的产量与成本
的统计数据见下表:
4 6.4 149 40.96 22 201 953.6
2.线性回归方程中的回归截距a^和回归系数b^都是通过样 本估计得来的,存在着误差,这种误差可能导致预测结果的偏 差.
3.线性回归方程^y=a^+b^x 中的b^表示 x 增加 1 个单位时, ^y的平均变化量为b^,而a^表示^y不随 x 的变化而变化的部分.
4.可以利用线性回归方程^y=a^+b^x 预测在 x 取某一个值 时 y 的估计值.
(2)在线性回归方程^y=b^x+a^中
n
xiyi-n
x
y
n
xi--x yi--y
i=1
b^=
=
n
xi--x 2
i=1
n
x2i -n x 2
i=1
,a^= -y -b^-x.
i=1
1n
1n
其中-x = ni=1xi ,-y = ni=1yi ,(-x ,-y )称为样本点的中
i=1
相关
指数 R2 R2=1-
n
yi--y 2
i=1
,R2 表示 解释 变量
对预报变量变化的贡献率,R2 越接近于 1,
表示回归的效果越好
问题思考 2:在回归分析中,相关指数 R2 的值越大,则残 差平方和越大还是越小?
提示:相关指数 R2 的值越大,说明回归模型拟合的效果 越好,残差平方和越小,反之,相关指数 R2 的值越小,残差 平方和越大.
最新《1.1回归分析的基本思想及其初步应用》ppt课件课件PPT
差.
n
(yi-y^ i)2
称为残差平方和
i=1
利用图形来分析残差特性,作图时纵坐标为 残差 ,横 残差图 坐标可以选为样本编号 ,或 身高数据 ,或体重估计值
等,这样作出的图形称为残差图
残差 图法
残差点比较均匀地落在水平的带状区域内,说明选 用的模型比较适合,这样的带状区域的宽度越窄, 说明模型拟合精度越高
(3)求线性回归方程的步骤: ①先把数据制成表,从表中计算出 x , y , x12+x22+…+x2n,x1y1+x2y2+…+xnyn 的值; ②计算未知参数a^,b^; ③写出线性回归方程^y=b^x+a^.
2.线性回归分析 (1)由线性回归方程给出的是一个预报值而非精确值. (2)随机误差的主要来源 ①线性回归模型与真实情况引起的误差; ②省略了一些因素的影响产生的误差; ③观测与计算产生的误差. (3)残差分析是回归分析的一种方法. (4)用相关指数R2来刻画回归效果. R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2 越小,残差平方和越大,即模型的拟合效果越差.
e为
随机误.差
(2)对参数 a 和 b 的估计,由《数学必修 3》可知:最小二乘法估 计a^和b^就是未知参数 a、b 的最好估计,其计算公式为
n
n
xi- x yi- y xiyi-n x y
i=1
b^ =
i=1
=
,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
i=1
i=1
3.建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报 变量. (2)画出确定好的解释变量和预报变量的散点图,观察它们之间 的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系, 则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残差过大 或残差呈现不随机的规律性等).若存在异常,则检查数据是否 有误,或模型是否合适等.
《命题回归分析的基本思想及其初步应用》人教版高中数学选修1-2PPT课件(第1.1课时)
24
66
115
325
1.制作散点图
350
300
250
个
解
温度x/℃
200
150
100
50
0
20
22
24
26
28
℃
30
32
34
36
新知探究
2.观察模拟
样本点不能直接利用线性回归,根据我们的函数知识,它应该是一个指数模型:y=c1ec2x其中c1c2为
参数或二次函数模型,根据对数回归知识我们知道:令z=lny将其变换到样本点的分布直线z=a+bx
用回归模型拟合,如果没有错误,则需要找其他原因。
新知探究
残差图:
编号
1
2
3
4
5
6
7
8
身高/
cm
165
165
157
170
175
165
155
170
体重/
kg
48
57
50
54
64
61
43
59
残差
-6.373
2.627
2.419
-4.618
1.137
6.627
-2.883
0.382
8
6
4
2
0
-2 0
-4
-6
人教版高中数学选修1-2
第1章 统计案例
1.1命题回归分析的基本思想及其初步应用
PEOPLE'S EDUCATION PRESS HIGH SCHOOL MATHEMATICS ELECTIVE 1-2
讲解人: 时间:2020.6.1
高中数学人教A版选修2-3第三章回归分析的基本思想及其初步应用课件(共46张PPT)
2 i 1 ( x i x n) 2n( x i x ) ( y i y ) ( y i y ) i n 1 ( y x ) 2
(yi x 1 )[ yii 1xin(yx)]i 1
(y x i) n 1 [ n y n 2 i 1x n n (( x iy x )(y ix ) y ] ) 20 ,[n(x i x )(y i y )]2 n
高中数学人教A版选修2-3第三章回归 分析的 基本思 想及其 初步应 用课件 (共46 张PPT)
2、回归直线方程
1、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。
据(x1,y1),(x2,y2),...,(xn,yn)且回归方程是:y bx a
其中,a,b是待定参数。当变量x取 xi(i1,2,...,n)时 它与实际收集到的 y i 之间的偏差是
yi yi yi (bxi a)
y
(xi, yi)
yi yi
( x1, y1 )
高中数学人教A版选修2-3第三章回归 分析的 基本思 想及其 初步应 用课件 (共46 张PPT)
i 1
i 1
n
因 此 , n Q (,)[y ix i (y x ) ] 2 n (y n x )2 注 意 到 , n [ y i x i 2 ( y i n 1 x ) ] ( y x ) n ( y x 2 )[ y i x i ( y x ) ]
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
散点图 施化肥量
(yi x 1 )[ yii 1xin(yx)]i 1
(y x i) n 1 [ n y n 2 i 1x n n (( x iy x )(y ix ) y ] ) 20 ,[n(x i x )(y i y )]2 n
高中数学人教A版选修2-3第三章回归 分析的 基本思 想及其 初步应 用课件 (共46 张PPT)
2、回归直线方程
1、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。
据(x1,y1),(x2,y2),...,(xn,yn)且回归方程是:y bx a
其中,a,b是待定参数。当变量x取 xi(i1,2,...,n)时 它与实际收集到的 y i 之间的偏差是
yi yi yi (bxi a)
y
(xi, yi)
yi yi
( x1, y1 )
高中数学人教A版选修2-3第三章回归 分析的 基本思 想及其 初步应 用课件 (共46 张PPT)
i 1
i 1
n
因 此 , n Q (,)[y ix i (y x ) ] 2 n (y n x )2 注 意 到 , n [ y i x i 2 ( y i n 1 x ) ] ( y x ) n ( y x 2 )[ y i x i ( y x ) ]
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
散点图 施化肥量
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.非线性回归分析 (1)非线性相关关系:样本点分布在某一条曲线的周围, 而不是一条直线附近.我们就称这两个变量之间不具有线 性相关关系而是非线性相关关系. (2)非线性回归方程线性化 ①y=axn(其中a,x,y均为正值)(幂函数型函数) lg y=lg a+n lg x,令u=lg y,v=lg x,b=lg a, 则u=nv+b,图象为一直线. ②y=cax(a>0,c>0)(指数型函数) lg y=x lg a+lg c,令u=lg y,b=lg c,d=lg a, 则u=dx+b,图象为一直线.
课前探究学习
课堂讲练互动
活页规范训练
3.刻画回归效果的方式
数据点和它在回归直线上相应位置的差异(yi-y^i)是随
残差
机误差.称e^i=yi-y^i 为残差,e^i 称为相应于点(xi,yi)的
n
残差. (yi-y^i)2 称为残差平方和
i=1
残差 图
利用图形来分析残差特性,作图时纵坐标为__残__差_,
2.回归模型的选择,特别是非线性回归模型.(难点、易错 点)
课前探究学习
课堂讲练互动
活页规范训练
自学导引
1.回归分析 回归分析是对具有_相__关__关__系__的两个变量进行统计分析的一 种常用方法.
2.线性回归模型 (1)由散点图易发现,样本点散布在某一条直线附近,而不 是一条直线上,不能用一次函数y=bx+a描述它们之间的 关系,因此用线性回归模型y=bx+a+e来表示,其中a、b 为未知参数,e为_随__机__误__差__ .
横坐标可以选为_样__本__编__号__,或_身__高__数__据__,或 _体__重__估__计__值__等,这样作出的图形称为残差图
残差 图法
残差点比较均匀地落在水平的带状区域内,说明选 用的模型比较适合,这样的带状区域的宽度越窄, 说明模型拟合精度越高
课前探究学习
课堂讲练互动
活页规范训练
残差平 方和
自变量x只解释部分y的变化,在统计中,我们也把自变量
x称为解释变量,因变量y称为预报变量.
试一试:下表是x和y之间的一组数据,则y关于x的线性回
归方程必过
( ).
x
1
2
3
4
y
1
3
5
7
A.点(2,3) B.点(1.5,4) C.点(2.5,4) D.点(2.5,5)
提示 选 C.线性回归方程必过样本点的中心(-x ,-y ),即(2.5,4).
(2)随机误差的主要来源
①线性回归模型与真实情况引起的误差;
②省略了一些因素的影响产生的误差;
③观测与计算产生的误差.
(3)残差分析是回归分析的一种方法.
课前探究学习
课堂讲练互动
活页规范训练
(4)用相关指数R2来刻画回归效果. R2越大,意味着残差平方和越小,即模型的拟合效果越 好;R2越小,残差平方和越大,即模型的拟合效果越差. 3.建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量 是预报变量. (2)画出确定好的解释变量和预报变量的散点图,观察它 们之间的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性 关系,则选用线性回归方程).
活页规范训练
想一想:回归分析中,利用线性回归方程求出的函数值一 定是真实值吗?为什么? 提示 不一定是真实值,利用线性回归方程求的值,在很 多时候是个预报值,例如,人的体重与身高存在一定的线 性关系,但体重除了受身高的影响外,还受其他因素的影 响,如饮食,是否喜欢运动等.
课前探究学习
课堂讲练互动
活页规范训练
i=1
i=1
其中-x =__n1_i_=n_1x_i_,-y =__n1_i_=n_1y_i_,(-x ,-y )称为样本点的中心.
课前探究学习
课堂讲练互动
活页规范训练
(3)解释变量和预报变量
线性回归模型与一次函数模型的不同之处是增加了随机误
差项e,因变量y由_自__变__量__x__和_随__机__误__差__e_共同确定,即
课前探究学习
课堂讲练互动
活页规范训练
名师点睛
1.线性回归方程 (1)在分析两个变量的相关关系时,可根据样本数据散点 图确定两个变量之间是否存在相关关系,然后利用最小二 乘法求出回归直线方程.
(2)求线性回归方程^y =^b x+^a 的关键是求未知参数^a 和^b ,其中^b 可借助于计算器求出,因为^a=-y -^b-x ,即-y =^b-x +^a,所以 点(-x ,-y )一定满足线性回归方程,即回归直线一定过点(-x , -y ).
课前探究学习
课堂讲练互动
活页规范训练
(2)对参数a和b的估计,由《数学必修3》可知:最小二乘法 估计 ^a 和 ^b就是未知参数a、b的最好估计,其计算公式为
n
xi--x yi--y
n xiyi-n-x -y
i=1
^b=
i=1
=
,^a=-y -^b-x ,
n
xi--x 2
n x2i -n-x 2
3.1 回归分析的基本思想及其初步应用
【课标要求】
1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法和
初步应用.
课前探究学习
课堂讲练互动
活页规范训练
【核心扫描】
1.利用散点图分析两个变量是否存在相关关系,求线性回归 方程.(重点)
n
残差平方和为__i=_1__(y_i_-__^y_)2,残差平方和_越__小__,
模型拟合效果越好
相关指 数R2
n
yi-^yi2
i=1
R2 = 1 -
,R2 表示_解__释__变量对
n
yi--y 2
i=1
_预__报__变量变化的贡献率,R2 越接近于 1,表 示回归的效果越好
课前探究学习
课堂讲练互动
课前探究学习
课堂讲练互动
活页规范训练
(3)求线性回归方程的步骤:
①先把数据制成表,从表中计算出-x ,-y ,
x21+x22+…+xn2,x1y1+x2y2+…+xnyn 的值; ②计算未知参数^a,^b;
③写出线性回归方程^y =^b x+^a .
2.线性回归分析
(1)由线性回归方程给出的是一个预报值而非精确值.
课前探究学习
课堂讲练互动
活页规范训练
(4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残 差过大,或残差呈现不随机的规律性等).若存在异常, 则检查数据是否有误,或模型是否合适等.