2021_2022学年高中数学第一章统计案例1.3可线性化的回归分析课件北师大版选修1_2
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.47
y
1.19
1.25
0.59
0.79
1.29
0.10
0.37
试求y对x的回归方程.
思路分析:对题中所给的公式 y=Ae (b<0)两边取自然对数,通过
换元将其转化为含有x的一次方程,即两个新变量形成的线性回归
方程,求出回归方程中的参数值,再通过一次变换把原参数值求出
来即得要求的回归方程.
探究一
当 x0=0.038 时,y0≈41.95,即 y0 的值约为 41.94.
44.444 4
49.2
探究一
探究二
思维辨析
未知函数类型的非线性回归分析
【例2】为了研究某种细菌繁殖的个数y随时间x变化的情况,收
集数据如下:
天数 x
繁殖个数 y
1
6
2
12
3
25
4
49
5
95
6
190
(1)用天数作为解释变量,繁殖个数作为预报变量,作出这些数据
状,有时不太容易辨别,可采用多种模型拟合,并转变为线性回归关
系.利用线性相关系数来检验用哪一种拟合效果较好,就用哪一种
模型.
【做一做】 (1)下列两个变量之间的关系不是函数关系的是
(
)
A.角度和它的余弦值
B.正方形的边长和面积
C.正n边形的边数和各内角度数之和
D.人的年龄和身高
(2)两个变量的散点图如图所示,可应用的函数类型是(
探究二
思维辨析
已知模拟函数类型的可线性化回归分析
【例1】 在彩色显影中,由经验可知,形成染料的光学密度y与析
出银的光学密度x由公式 y=Ae (b<0) 表示,现测得试验数据如下:
x
y
0.05
0.10
0.06
0.14
0.25
1.00
0.31
1.12
0.07
0.23
x
0.38
0.43
0.14
0.20
所以 y 与 x 的回归方程是 y=
7.
纠错心得平时学习时一定要对每一个基础知识理解透彻.
探究一
探究二
思维辨析
跟踪训练电容器充电后,电压达到100 V,然后开始放电,由经验知
道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得
时间t(s)时的电压U(V)如下表:
t/s
U/V
0
100
答案:A
1
2
3
4
5
3.x,y满足如下表的关系:
x 0.2
y 0.04
0.6
0.36
1.0
1
1.2
1.4
则符合x,y之间的函数模型为
答案:y=x2
1.4
1.9
1.6
2.5
1.8
3.2
.
解析:y的值与x2的值近似相等,所以用y=x2模拟.
2.0
3.98
2.2
4.82
1
2
3
4
5
4.某地今年上半年患某种传染病的人数y(单位:人)与月份x(单位:月)
1
为 2,3,4,5,则 y 与 的回归方程为 (
1
A.y= +1
C.y=2x+1
)
2
B.y= +3
D.y=x-1
答案:A
1
解析:由数据可得,四个点都在曲线y= +1上.
1
2
3
4
5
2.根据统计资料,我国能源生产发展迅速.下面是我国能源生产总量
(单位:亿吨标准煤)的几个统计数据:
年份
产量
1996
的线性回归方程为 y=4.61-0.313x.
由y=ln U,得U=ey,U=e4.61-0.313x=e4.61·e-0.313x,因此电压U对时间t的
回归方程为U=e4.61·e-0.313x.
1
2
3
4
5
1 1 1
2 3 4
1.在一次试验中,当变量 x 的取值分别为 1, , , 时,变量 y 的值分别
变为如下所示的数据.
u 20.000 16.667 4.000
v -2.303
-1.966
0
3.226
0.113
14.286
-1.470
u 2.632
2.326
7.143
5.000
2.128
v
0.223
-0.528
-0.236
0.255
0.174
10.000
-0.994
探究一
探究二
思维辨析
可以求得 r=-0.998,
1.3
可线性化的回归分析
一、非线性回归分析
对于一些特殊的非线性函数,可以通过变量替换,把非线性回归
转化为线性回归,然后用线性回归的方法进行研究,最后再通过相
应的变换得到非线性回归方程.
名师点拨非线性相关的变量,确定回归模型的方法:
首先要作出散点图,如果散点图中的样本点并没有分布在某个带
状区域内,则两个变量不呈现线性相关关系,不能直接利用线性回
的散点图;
(2)描述解释变量与预报变量之间的关系.
思路分析:画出散点图,根据散点图选择恰当的函数模型,进行回
归分析.
探究一
Байду номын сангаас
探究二
思维辨析
解:(1)作出散点图如图所示.
x
u
1
1.79
2
2.48
3
3.22
4
3.89
5
4.55
由计算器算得u=0.69x+1.115,则有y≈e0.69x+1.115.
6
5.25
易错分析:本题易出现不画出散点图或求出相关系数r来进行相
关性检验,而直接利用已知数据求回归方程,而本题的样本点不是
线性相关的.
探究一
探究二
思维辨析
解:画出散点图如图①所示,观察可知y与x近似是反比例函数关系.
1
设 y= (k≠0),令 t= ,则 y=kt.
可得到y关于t的数据如下表:
探究一
探究一
探究二
思维辨析
变式训练1在试验中得到变量y与x的数据如下表:
x
y
0.066 7
39.4
1
0.038 8
42.9
0.033 3
41.0
0.027 3
43.1
0.022 5
49.2
由经验知,y 与 之间具有线性相关关系,试求 y 与 x 之间的曲线回归
方程,当 x0=0.038 时,预测 y0 的值.
的身高,故选D.
思考辨析
判断下列说法是否正确,正确的在后面的括号内打“√”,错误的打
“×”.
(1)通过回归方程y=bx+a及其回归系数b,可以估计和观测变量的
取值和变化趋势. (
)
(2)因为由任何一组观测值都可以求得一个线性回归方程,所以没
有必要进行相关性检验. (
)
答案:(1)√ (2)×
探究一
之间满足函数关系,模型为y=aebx,确定这个函数解析
式
.
1
2
3
4
5
答案:y=e3.911 58+0.09x
解析:设u=ln y,c=ln a,得u=c+bx,
则u与x的数据关系如下表:
6
由上表,得 ∑ xi=21,
6
=1
6
∑ ui=25.359 5, ∑
i=1
6
=1
2 =91,
6
∑ 2 =107.334,
i=1
2
5 =6 548.634 4,5 =4 612.899 4.
5
∑ -5
=1
于是有 b=
5
2
∑ 2 -5
=
6 693.027 2-6 548.634 4
≈0.29.
5 107.903 7-4 612.899 4
=1
a=-b ≈34.31.
0.29
故 y 与 x 之间的曲线回归方程是 y=34.31+ .
曲线图形
b
x
y=a+
bln x
变换
公式
变换后的
线性函数
c=ln a
1
v=
x
u=ln y
u=c+bv
v=ln x
u=y
u=a+bv
特别提醒常见的几种函数模型的解析式在转变为线性相关关系
时,要根据函数式的特点,灵活地换元转变为线性函数关系.在使用
常见的几种模型时要注意散点图的形状符合哪一种类型曲线的形
探究二
思维辨析
解:由题意知,对于给定的公式
得 ln y=ln
y=Ae (b<0)两边取自然对数,
A+ .
与线性回归方程相对照可以看出,只要令
1
u= ,v=ln
y,a=ln A,
就有 v=a+bu.
这是 v 对 u 的线性回归方程,对此我们再套用相关性检验,求
1
回归系数 b 和 a,题目中所给的数据由变量替换 u= ,v=ln y,
故 u=3.911 58+0.09x.
所以 y=e3.911 58+0.09x.
1
2
3
4
5
5.某种书每册的成本费y(单位:元)与印刷册数x(单位:千册)有关,经
统计得到的数据如下表:
-
故回归方程为 y=1.73e
0.146
.
探究一
探究二
思维辨析
反思感悟已知曲线类型进行回归分析的步骤:
(1)将非线性函数通过变量代换转化为线性函数.
(2)将所给数据点加以转换.
(3)按最小二乘法原理求线性回归方程并进行检验.
(4)将线性回归方程转换为关于原始变量x,y的回归方程.
(5)依据回归方程作出预报.
所以y关于x的指数回归方程为y=e0.277x-3.998.
所以,当x=40时,y=e0.277×40-3.998≈1 190.347.
探究一
探究二
思维辨析
因选错函数模型而致误
【典例】 在一次抽样调查中测得样本的5个样本点,数值如下表:
x
y
0.25
16
0.5
12
1
5
2
2
4
1
如何建立y与x之间的回归方程?
1
75
2
55
3
40
4
30
5
20
6
15
7
10
8
10
9 10
5 5
试求电压U对时间t的回归方程.(提示:对公式两边取自然对数,把
问题转化为线性回归分析问题)
探究一
探究二
思维辨析
解:对U=Aebt两边取对数得ln U=ln A+bt,令y=ln U,a=ln A,x=t,则
y=a+bx,得y与x的数据如下表:
变化把指数关系变为线性关系,令z=ln y,则z=bx+a(a=ln c1,b=c2).
探究一
探究二
思维辨析
列表:
x
z
19
1.386
23
2.398
27
3.178
31
4.691
35
5.784
作散点图如图所示,
从散点图可以看出,两个变量x,z呈很强的线性相关关系.由表中
的数据得到线性回归方程为z=0.277x-3.998.
=1
∑ xiui=90.341 3,=3.5,=4.226 58,
=1
1
2
3
4
5
6
则
∑ -6
b==16
2
∑ 2 -6
=1
90.341 3-6×3.5×4.226 58
=
2
91-6×3.5
≈0.09,
c=-b =4.226 58-0.09×3.5≈3.911 58,
探究一
探究二
思维辨析
反思感悟非线性回归方程的求法
探究一
探究二
思维辨析
变式训练2在试验中得到变量y与x的数据如下表:
试求y与x之间的回归方程,并预测x=40时,y的值.
x
y
19
4
23
11
27
24
31
109
35
325
解:作散点图如图所示,
从散点图可以看出,两个变量x,y不呈线性相关关系,根据学过的
函数知识,样本点分布的曲线符合指数型函数y=c1 e2 ,通过对数
探究一
探究二
思维辨析
1
1
解:令 z=,则 y=a+bz,由已知数据制成下表:
z=x
14.992 5
39.4
y
25.773 2
42.9
30.030 0
41.0
36.630 0
43.1
5
计算得=30.374 0,=43.12, ∑ ziyi=6 693.022 3,
=1
5
∑ 2 =5 107.903 7.
)
A.y=a·xb
B.y=a+bln x
C.y=a·ebx
D.y= a·e
答案:(1)D
(2)B
解析:(1)函数关系就是一种变量之间的确定性的关系,A,B,C三项
都是函数关系,它们的函数表达式分别为f(θ)=cos θ,g(a)=a2,
h(n)=nπ-2π.D项不是函数关系,对于年龄确定的人群,仍可以有不同
归方程来建立两个变量之间的关系,这时可以根据已有函数知识,
观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归
模型.
二、非线性回归方程
曲线
方程
变换
公式
变换后的
线性函数
y=axb
c=ln a
v=ln x
u=ln y
u=c+bv
y=aebx
c=ln a
u=ln y
u=c+bx
曲线图形
曲线
方程
y=a
探究二
思维辨析
画出散点图如图②所示,观察可知 t 和 y 有较强的线性相关性,
因此可利用线性回归模型进行拟合,易得
5
∑ ti yi -5t y
b==15
∑
i=1
2
2 -5
≈4.134 4,
a=-b ≈0.791 7,
所以 y=4.134 4t+0.791 7,
4.134 4
+0.791
12.9
2001
16.1
2006
19.3
2011
22.3
根据有关专家预测,到2020年我国能源生产总量将达到27.6亿吨左
右,则专家所选择的回归模型是下列四种模型中的哪一种(
)
A.y=ax+b(a≠0)
B.y=ax2+bx+c(a≠0)
C.y=ax(a>0且a≠1)
D.y=logax(a>0且a≠1)
由|r|=0.998,可知,u 与 v 具有很强的线性相关关系.