2015-2016学年高中数学 1.1回归分析的基本思想及其初步应用课件 新人教A版选修1-2
合集下载
人教版回归分析的基本思想及其初步应用-课件
些呢?
不相关
函数关系 1、两个变量的关系
相关 关系
线性相关 非线性相关
相关关系:对于两个变量,当自变量取值一定 时,因变量的取值带有一定随机性的两个变量 之间的关系。
思考:相关关系与函数关系有怎样的不同?
函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系
函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一 般的情况
例1.下表给出我国从1949至1999年人口数 据资料,试根据表中数据估计我国2004年 的人口数。
年份 49 54 59 64 69 74 79 84 89 94 99
人口 542 603 672 705 807 909 975 1035 1107 1177 1246 数/ 百万
分析:先画图 年份 0 5
整理、分析数据 估计、推断
用样本估计总体 变量间的相关关系
简 分 系 用样本 用样本
线
单层 统 随抽 抽 机样 样 抽
的频率 分布估 计总体
数字特 征估计 总体数
性 回 归 分
样
分布
字特征
析
统计的基本思想 样本 实际
抽样
y = f(x)
分析
y = f(x)
模拟
y = f(x)
问题1:现实生活中两个变量间的关系有哪
请看下节课分解
•
9、有时候读书是一种巧妙地避开思考 的方法 。2021/2/272021/2/27Saturday, February 27, 2021
•
10、阅读一切好书如同和过去最杰出 的人谈 话。2021/2/272021/2/272021/2/272/27/2021 4:24:37 PM
《1.1 回归分析的基本思想及其初步应用》PPT课件(河北省县级优课)
人教A版高中数学选修1-2
非线性相关问题
建立回归方程的一般步骤:
1.确定变量 2.制作散点图,观察是否相关 3.确定回归方程的类型(线性回归、指数回归、对数回归等) 4.利用公式确定回归参数 5.利用残差分析回归是否合理或模型是否合适
例1 一只红蛉虫的产卵数y与温度x有关,现收集了7组数据,请建立y 与x的回归方程
为什么这样说?
4.残差分析:
X
21
23
25
27
29
32
35 合计(残差 R2
Y
7
平方和)
11
21
24
66
115
329
e(1) 0.518 -0.167 1.760 -9.149 8.889
- 32.928 1450.673
14.153
e(2) 47.693 19.397 -5.835
-
-
- 77.965 15448.43
y=c e 函数模型:
1 c2x其中c1、c2为参数或二次函数y=c3x2+c4模型,
根据对数知识我们知道:令z=lny将其变换到直线z=a+bx
x 21 23 25 27 29 32 35
产卵数的对数
z
7 6 5 4 3 2 1 0
20 22
1.9 2.39 3.0 46 8 45
24 26 28 30 32 34 36 温度
年宣传费x=49时,年销售量及年利润的预报值是多少? 年宣传费x为何值时,年利率的预报值最大? 附:对于一组数据(u1 v1),(u2 v2)…….. (un vn),其回归 直线v=u的斜率和截距的最小二乘估计分别为:
感受真题
回归 分基本思想Fra bibliotek回归分析
非线性相关问题
建立回归方程的一般步骤:
1.确定变量 2.制作散点图,观察是否相关 3.确定回归方程的类型(线性回归、指数回归、对数回归等) 4.利用公式确定回归参数 5.利用残差分析回归是否合理或模型是否合适
例1 一只红蛉虫的产卵数y与温度x有关,现收集了7组数据,请建立y 与x的回归方程
为什么这样说?
4.残差分析:
X
21
23
25
27
29
32
35 合计(残差 R2
Y
7
平方和)
11
21
24
66
115
329
e(1) 0.518 -0.167 1.760 -9.149 8.889
- 32.928 1450.673
14.153
e(2) 47.693 19.397 -5.835
-
-
- 77.965 15448.43
y=c e 函数模型:
1 c2x其中c1、c2为参数或二次函数y=c3x2+c4模型,
根据对数知识我们知道:令z=lny将其变换到直线z=a+bx
x 21 23 25 27 29 32 35
产卵数的对数
z
7 6 5 4 3 2 1 0
20 22
1.9 2.39 3.0 46 8 45
24 26 28 30 32 34 36 温度
年宣传费x=49时,年销售量及年利润的预报值是多少? 年宣传费x为何值时,年利率的预报值最大? 附:对于一组数据(u1 v1),(u2 v2)…….. (un vn),其回归 直线v=u的斜率和截距的最小二乘估计分别为:
感受真题
回归 分基本思想Fra bibliotek回归分析
《回归分析的基本思想及其初步应用》PPT精品课件人教版1
所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为
y 0 .8 4 9 7 2 8 5 .7 1 2 6 0 .3 1 6 (k g )
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
案例1:女大学生的身高与体重
n
( yi y ) 2 表示总的效应,称为总偏差平方和。
i1
在例1中,总偏差平方和为354。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的
线性相关关系,因此思可考以用P线4性回归方程
刻 3直、画 线从它 的散们 附点之 近图间 ,还的 而产看的关 不生到原系是,随因。在样机一是本条误什点直差散么线项布?上在e,某所一以条
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
y 0 .8 4 9 7 2 8 5 .7 1 2 6 0 .3 1 6 (k g )
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
案例1:女大学生的身高与体重
n
( yi y ) 2 表示总的效应,称为总偏差平方和。
i1
在例1中,总偏差平方和为354。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的
线性相关关系,因此思可考以用P线4性回归方程
刻 3直、画 线从它 的散们 附点之 近图间 ,还的 而产看的关 不生到原系是,随因。在样机一是本条误什点直差散么线项布?上在e,某所一以条
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
2015-2016学年高二数学人教A版选修1-2课件:1.1 回归分析的基本思想及其初步应用
������ =1
8
i=1
∑
8
������������2 =13
8 ������ =1
731, ∑ xiyi=13 180,
������ =1
8
8
∴������ =
^
^
∑ (������ ������ -������ )(������ ������ -������ )
������ =1
∑ (������ ������ -������ )
预习新知
知识精要
导学探究
典题例解
触类旁通
一
二
三
迁移应用
【例1】 某班5名学生的数学和物理成绩如下表:
学生 学科成绩 数学成绩 x 物理成绩 y
(1)画出散点图;
A 88 78
B 76 65
C 73 71
D 66 64
E 63 61
(2)求物理成绩y对数学成绩x的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. 思路分析:先画散点图,分析物理与数学成绩是否有线性相关关系,若相关,再利 用线性回归模型求解预报变量.
(1)画出数据对应的散点图; (2)求回归直线方程;
80 28
100 120 34 39
(3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及 其初步应用
预习新知
知识精要
导学探究
典题例解
触类旁通
一
二
三
迁移应用
解:(1)数据对应的散点图如图所示. 1 (2)������ = 5×(110+90+80+100+120)=100, ������ =
8
i=1
∑
8
������������2 =13
8 ������ =1
731, ∑ xiyi=13 180,
������ =1
8
8
∴������ =
^
^
∑ (������ ������ -������ )(������ ������ -������ )
������ =1
∑ (������ ������ -������ )
预习新知
知识精要
导学探究
典题例解
触类旁通
一
二
三
迁移应用
【例1】 某班5名学生的数学和物理成绩如下表:
学生 学科成绩 数学成绩 x 物理成绩 y
(1)画出散点图;
A 88 78
B 76 65
C 73 71
D 66 64
E 63 61
(2)求物理成绩y对数学成绩x的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. 思路分析:先画散点图,分析物理与数学成绩是否有线性相关关系,若相关,再利 用线性回归模型求解预报变量.
(1)画出数据对应的散点图; (2)求回归直线方程;
80 28
100 120 34 39
(3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及 其初步应用
预习新知
知识精要
导学探究
典题例解
触类旁通
一
二
三
迁移应用
解:(1)数据对应的散点图如图所示. 1 (2)������ = 5×(110+90+80+100+120)=100, ������ =
高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用课件2 新人教A版选修1-2
另外, 我们还可以用相关指数R2来刻画回归的效果,
n
yi yˆi 2
其计算公式是 : R2
1
i 1 n
.
yi y 2
i 1
显然, R 2取值越大,意味着残差平方和越小,也就
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号,或身高数据,或 体重估计值等,这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
残差
编号
图1.14
从图1.1-4中可以看出,第1个样本点和第6个样本 点的残差比较大,需要确认在采集这两个样本点的过程 中是否有人为的错误.如果数据采集有错误,就予以纠 正,然后再重新利用线性回归模型拟合数据;如果数据 采集没有错误,则需要寻找其他的原因.另外,残差点 比较均匀地落在水平的带状区域中,说明选用的模型比 较合适.这样的带状区域的宽度越窄,说明模型拟合精 度越高,回归方程的预报精度越高.
从图1.1 - 1中可以看出,
样本点呈条状分布 ,身高和体
·
体重/kg
重有比 较好的线性相关关系 ,
因此可以用回归直线y = bx + a
来近似刻画它们之间的关系.
身高/cm 图1.11
未知参数b和a的最小二乘估计分别为bˆ 和aˆ,
其计算公式如下:
n
xi x yi y
bˆ i1 n
,
xi x 2
随机
思考:在线性回归模型中,e是用bx + a预报真实值y的 随机误差,它是一个不可观测的量,那么应该怎样研究 随机误差呢?
在实际应用中,我们用回归方程yˆ bˆx aˆ中 的yˆ估计(1)中的bx a.由于随机误差e y (bx a), 所以eˆ y yˆ是e的估计量.对于样本点
高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用课件 新人教A版选修1-2
【解题策略】
残差分析的思路
(1)要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来
拟合数据.
(2)通过残差
eˆ
,
1
,e…ˆ 2 ,
来判eˆ 断n 模型拟合的效果,判断原始数据中是否存在可
疑数据,这种分析工作称为残差分析,可以借助残差图来进行观察.
【跟踪训练】 假设关于某设备的使用年限x(单位:年)和支出的维修费用y(单位:万元),有如表的 统计资料:
5
(yi- )2yˆ =i 0.651.
i 1
5
(4)R2=1- i 1 ( y i yˆ=i ) 12 5 (yi y)2 i1
≈0 0. 6 .591 58 7,模型的拟合效果较好,使用年限解
1 5 .7 8
释了95.87%的维修费用支出.
类型三 非线性回归分析(数据分析、数学运算) 【典例】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位: 千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和 年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
,aybx,
i1
i1
其中 xn 1i n1xi,yn 1i n1yi( , x,y) 称为变量样本点的中心,回归直线过样本点的中
心.
(2)线性回归模型y=bx+a+e,其中e称为随机误差,自变量x称为解释变量,因变量
y称为预报变量.
【思考】 (1)预报值y与真实值y之间误差大了好还是小了好? 提示:越小越好. (2)随机误差产生的原因是什么? 提示:主要有:所用的拟合函数不恰当;忽略了某些因素的影响;存在观测误差等.
高中数学 1.1回归分析的基本思想及其初步应用课件 新人教A版选修1-2
测一测 2-1
散点图在回归分析过程中的作用是( ) A .查找个体个数 B.比较个体数据的大小关系 C.探究个体分类 D.粗略判断变量是否线性相关 解析 :散点图能直观形象地反映两个变量间的关系,可以粗略判断两个 变量间是否存在线性相关关系.故选 D. 答案 :D
首页 1 2 3 4 5
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
首页 1 2 3 4 5
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
5 .建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量. (2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存 在线性关系等). (3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性 回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差 呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合 适等.
答案 :C
5
首页 1 2 3 4 5
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
3 .线性回归模型 (1)线性回归模型 y=bx+a+e,其中 a 和 b 是模型的未知参数,e 称为随机 误差.在统计中,自变量 x 又称为解释变量,因变量 y 又称为预报变量. (2)随机误差产生的原因.
首页 1
残差
XINZHIDAOXUE 新知 ZHONGNANTANJIU 重难探究 DANGTANGJ 当堂 导学 检测
(教师用书)高中数学 1.1 回归分析的基本思想及其初步应用课件 新人教A版选修1-2
刻画回归效果的方式
残差 对于样本点(xi,yi)(i=1,2,…,n)的随机误差的估 计值^ ei=yi-^ yi,称为相应于点(xi,yi)的残差 利用图形来分析残差特性,作图时纵坐标为 残差 , 残差图 横坐标可以选为 样本编号 ,或 身高数据 ,
或 体重估计值 等,这样作出的图形称为残差图 残差 图法 残差点比较均匀地落在水平的带状区域内,说明选 用的模型比较适合,这样的带状区域的宽度越窄, 说明模型拟合精度越高
【思路探究】 可借助于线性相关概念及性质逐一作出 判断.
【自主解答】 ①反映的正是最小二乘法思想,故正 确.②反映的是画散点图的作用,也正确.③解释的是回归 ^ x+ a ^ 的作用,故也正确.④是不正确的,在求回归 方程 ^ y =b 方程之前必须进行相关性检验,以体现两变量的关系.
【答案】 C
关于变量y与x之间的回归直线方程叙述正确的是( A.表示y与x之间的一种确定性关系 B.表示y与x之间的相关关系 C.表示y与x之间的最真实的关系 D.表示y与x之间真实关系的一种效果最好的拟合
)
【解析】
回归直线方程能最大可能地反映y与x之间的
真实关系,故选项D正确.
【答案】 D
线性回归分析
已知某种商品的价格x(元)与需求量y(件)之间的 关系有如下一组数据: x 14 16 18 20 22 y 12 10 7 5 3
i=1
xi- x yi- y
n
n
1n xi ^= y a n ^ , -b x , x = i=1,
xi- x 2
yi n y = i=1 .
i=1 1n
(2)变量样本点中心: ( x , y ) ,回归直线过样本点的中 心. (3)线性回归模型:y=bx+a+e,其中e称为 随机误差, a和b是模型的未知参数,自变量x称为 解释变量 ,因变量y称 为 预报变量 .
高中数学 1.1 回归分析的基本思想及其初步应用课件 新人教A版选修12
关系做一下调整来模拟回归关系:
Y=bx+a+e 其中a和b为模型的未知参数,e称为随机误差
如何产 生的?
第七页,共26页。
质量误差
身高(shēn ɡāo)X(cm) 体重(tǐzhòng)y(kg)
饮食习惯
运动(yùndòng)习惯
第八页,共26页。
线性回归模型y=bx+a+e与我们了的一次函数模型不同之处在 于(zàiyú)多了一个随机误差e,y的值有它们一起决定
关指数R2来刻画回归的效果:
n
( yi yˆ )2
残差平方和
R2
1
i 1 n
( yi y)2
i 1
总体(zǒngtǐ)偏差
平方和
显然,当R2的值越大,说明残差所占的比例越小,回归效果约好;反 之,回归效果越差。一般(yībān)的,当R2越接近于1,说明解释变量和预 报变量之间的相关性越强,如果同一个问题,采用不同的回归方法分析, 我们可以通过选择R2大的来作为回归模型
回归平方和
(regression sun of squares)
第十五页,共26页。
你会计算上面的总体偏差(piānchā)平方和、残差平方和、回归平方和吗
354
128.361
225.639
第十六页,共26页。
有了这些评估效应的方法,我们就可以利用它们来刻画总体
(zǒngtǐ)效应,事实上,为了将我们的计算简化,我们又引入相
50 0 400 500 600 700 800 900 1000 1100 1200 1300 温度的平方
y=0.367t-202.54 不适合利用(lìyòng)线性回归
为什么这样(zhèyàng)
最新-高中数学《回归分析的基本思想及其初步应用》教学课件 新人教A版选修1-1 精品
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
根据相关变量数据 画散点图
观察相关变量是否线性相关 求线性回归方程 进行预报 求相关系数
判断线性相关关系强弱
回归分析的基本思想及其初步应用
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析
肇庆市第十二中学信息技术科 上机实践报告及自评表
班级: 学号: 姓名: 教师评分:
实践内容 (问题)
相关学科 (知识)
个人或 小组完 成
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
小组评价 自我评价
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
实际问题 (采集数据)
画图分析 建立数学模型
数学分析
解决实际问题
回归分析的基本思想及其初步应用
重点: (1)通过实际操作进一 步理解建立两相关变量的 线性回归模型的思想。
(2)求线性回归方程。
(3)判断回归模型似合 好坏 。
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
根据相关变量数据 画散点图
观察相关变量是否线性相关 求线性回归方程 进行预报 求相关系数
判断线性相关关系强弱
回归分析的基本思想及其初步应用
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析
肇庆市第十二中学信息技术科 上机实践报告及自评表
班级: 学号: 姓名: 教师评分:
实践内容 (问题)
相关学科 (知识)
个人或 小组完 成
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
小组评价 自我评价
回归分析的基本思想及其初步应用
一、教材分析 二、目的分析 三、过程分析 四、教法分析 五、评价分析
实际问题 (采集数据)
画图分析 建立数学模型
数学分析
解决实际问题
回归分析的基本思想及其初步应用
重点: (1)通过实际操作进一 步理解建立两相关变量的 线性回归模型的思想。
(2)求线性回归方程。
(3)判断回归模型似合 好坏 。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[解 ]
(1)根据表中数据画出散点图,如图所示.
由图可看出,这些点在一条直线附近,可以用线性回 归模型来拟合数据.计算得加工时间对零件数的线性回归 方程为^ y =0.668x+54.93.
残差数据如下表: 编号 残差 编号 残差 1 0.39 6 -0.01 2 -0.29 7 0.31 3 0.03 8 -0.37 4 -0.65 9 -0.05 5 0.67 10 0.27
[解] 作出变量y与x之间的散点图如图所示.
由图可知变量 y 与 x 近似地呈反比例函数关系. k 1 设 y=x,令 t=x,则 y=kt.由 y 与 x 的数据表可得 y 与 t 的数据表:
t y 4 16 2 12 1 5 0.5 2 0.25 1
作出y与t的散点图如图所示.
由图可知 y 与 t 呈近似的线性相关关系. 又 t =1.55, y =7.2, tiyi=94.25, t2 i =21.312 5,
(2)求回归方程; (3)预测当钢水含碳量为160时,应冶炼多少分钟? [解 ] (1)以x轴表示含碳量,y轴表示冶炼时间,作散点图 如图所示:
从图中可以看出,各点散布在一条直线附近,即它们线性 相关. (2)列出下表,并用科学计算器进行计算:
i xi yi 1 104 100 2 180 200 36 000 3 4 5 6 7 150 170 25 500 8 191 205 39 155 9 204 235 47 940 10 121 125 15 125 190 177 147 134 210 185 155 135 39 32 22 18 900 745 785 090
线性回归分析
[导入新知] 1.残差分析 (1)残差: 样本点(xn,yn)的随机误差 ei= yi-bxi-a ,其估计值为^ e
^ ^ ^ y - b x - a i i = y - y = i i i
,^ e i 称 为 相 应 于 点 (xi , yi) 的 残 差
(residual).(以上 i=1,2,…,n) (2)残差图: 作图时,纵坐标为 残差 ,横坐标可以选为样本编号,或 xi 数 据,或 yi 数据,这样作出的图形称为残差图.
i=1 i=1
i=1
y i2 yi-^
5
5
R2=1-
≈0.994,
i=1
y 2 yi--
所以回归模型的拟合效果很好.
非线性回归分析 [例3] 如下表: x y 0.25 16 0.5 12 1 5 2 2 4 1 在一次抽样调查中测得样本的5个样本点,数值
试建立y与x之间的回归方程.
他原因. (2)残差图有异常,即残差呈现不随机的规律性,此时需
要考虑所采用的线性回归模型是否合适.
线性回归分析 [例1] 炼钢是一个氧化降碳的过程,钢水含碳量的多少
直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼 时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x 与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如
^ a =7.4+1.15×18=28.1,
所以所求回归直线方程是^ y =-1.15x+28.1.列出残差表:
yi-^ yi yi- y
5
0 4.6
2
0.3 -0.4 2.6 -0.4
5
-0.1 -2.4
0.2 -4.4
所以 (yi-^ y i) =0.3, (yi-- y )2=53.2,
t/s 0 1 U/V 100 75
2 55
3 40
4 30
5 20
6 15
7 10
8 10
9 5
10 5
试求:电压U对时间t的回归方程.(提示:对公式两边取自然
对数,把问题转化为线性回归分析问题)
解:对 U=Aebt 两边取对数得 ln U=ln A+bt,令 y=ln U,a =ln A,x=t,则 y=a+bx,y 与 x 的数据如下表:
2.线性回归模型 (1)线性回归模型y= bx+a+e ,其中 a 和 b 是模型的 未知参数, e 称为随机误差.自变量x称为 解释变量 ,因变 量y称为 预报变量 .
(2)在回归方程^ y =^ b x+^ a 中,
i=1
xiyi-n x y xi2-n x 2
n
n
^ b=
i=1
xi- x yi- y xi- x 2
1.1
回归 分析 的基 本思 想及 其初 步应 用
1 理解教 材新知
知识点一
知识点二
题型一 题型二 题型三
第 一 章
2 突破常 考题型 3 跨越高 分障碍
4 应用落 实体验
随堂即时演练 课时达标检测
1.1
线性回归方程
[导入新知] 1.回归分析 (1)函数关系是一种 确定性 关系,而相关关系是一种 非确定性 关系,即自变量取值一定时,因变量的取值带有一 定的随机性的两个变量之间的关系叫做 相关关系 . (2)回归分析是对具有 相关 关系的两个变量进行统计分析 的一种常用方法,回归分析的基本步骤 是 画出两个变量的散点图 , 求回归直线方程 ,并用 回归直线方程 进行预报.
(3)残差分析:
残差分析即通过残差发现原始数据中的可疑数据,判断
所建立模型的拟合效果,其步骤为:计算残差——画残差 图——在残差图中分析残差特性. 残差点比较均匀地落在水平的带状区域中,说明选用的 模型比较合适,这样的带状区域的宽度越窄,说明模型拟合
越高 精度
越高 ,回归方程的预报精度
.
2.相关指数 我们可以用相关指数 R2 来刻画回归的效果,其计算公式是:
下表所示:
10 18 19 17 14 13 15 19 20 12 4 0 0 7 7 4 0 1 4 1 10 20 21 18 15 13 17 20 23 12 y(min) (1)作出散点图,你能从散点图中发现含碳量与冶炼时间的 0 0 0 5 5 5 0 5 5 5 一般规律吗?
x(0.01%)
[类题通法] 求线性回归方程的步骤 (1)列表表示 xi,yi,xiyi; (2)计算- x
n 2 - y , xi , xiyi; i=1 i=1
n
(3)代入公式计算^ a ,^ b 的值; (4)写出回归直线方程.
[活学活用]
某种产品的广告费支出x(单位:百万元)与销售额y(单位:百
万元)之间有如下对应数据: x y 2 30 4 40 5 60 6 50 8 70
n
n
=
i=1
bx ,^ a = y -^
.
1n 1n xi yi n n 其中 x = i=1 ,y = i=1
i =1
, ( x ,y )称为样本点的 中心
.
[化解疑难] 线性回归方程中系数^ b 的含义 (1)^ b 是回归直线的斜率的估计值,表示 x 每增加一 个单位,y 的平均增加单位数,而不是增加单位数. (2)当^ b >0 时, 变量 y 与 x 具有正的线性相关关系; 当^ b <0 时,变量 y 与 x 具有负的线性相关关系.
[类题通法]
非线性回归分析的步骤 非线性回归问题有时并不给出经验公式.这时我们可以画 出已知数据的散点图,把它与学过的各种函数(幂函数、指数函 数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好 的函数,然后采用适当的变量变换,把问题化为线性回归分析 问题,使之得到解决.其一般步骤为:
[活学活用] 某电容器充电后,电压达到 100 V,然后开始放电,由经验知 道, 此后电压 U 随时间 t 变化的规律用公式 U=Aebt(b<0)表示, 现测得时间 t(s)时的电压 U(V)如下表:
(1)试根据数据预报广告费支出1 000万元的销售额; (2)若广告费支出1 000万元的实际销售额为8 500万元,求误 差.
解:(1)从画出的散点图(图略)可看出,这些点在一条直线附近, 可以建立销售额 y 对广告费支出 x 的线性回归方程.由题中数据 计算可得- x =5,- y =50,由公式计算得^ b =6.5,^ a =17.5,所以 y 对 x 的线性回归方程为^ y =6.5x+17.5. 因此,对于广告费支出为 1 000 万元(即 10 百万元),由线性回归 方程可以预报销售额为^ y =6.5×10+17.5=82.5(百万元). (2)8 500 万元即 85 百万元,实际数据与预报值的误差为 85-82.5 =2.5(百万元).
[活学活用]
已知某种商品的价格x(元)与需求量y(件)之间的关系有如下 一组数据: x y 14 12 16 10 18 7 20 5 22 3
求y关于x的回归直线方程,并说明回归模型拟合效果的 好坏.
1 解: x = (14+16+18+20+22)=18, 5 1 y = (12+10+7+5+3)=7.4, 5
i=1
y i2 yi-^
n
n
1-
R2=
2
i=1
yi- y 2
.
n
R 越大,残差平方和 (yi-^ y i)2 越小,即模型的拟合效果 越好 ;R2 越小,
i=1
残差平方和 (yi-^ y i)2 越大,即模型的拟合效果 越差 .在线性回归模型中,
i=1
n
R2 的取值范围为 [0,1] ,R2 表示解释变量对于预报变量变化的贡献率,1-R2 表示随机误差对于预报变量变化的贡献率. R2 越接近于 1 , 表示回归的效果越 好.
残差分析 [例2] 某车间为了规定工时定额,需要确定加工零件所
花费的时间,为此进行了10次试验,测得的数据如下: 编号 1 2 3 4 5 6 7 8 9 10
10 零件数x/个 10 20 30 40 50 60 70 80 90 0 10 10 12 115 加工时间y/分 62 68 75 81 89 95 2 8 2 (1)建立零件数为解释变量,加工时间为预报变量的回归模 型,并计算残差; (2)你认为这个模型能较好地刻画零件数和加工时间的关系 吗?