北京海淀区2016-2017学年高二数学练习:第一章 统计案例 1.3 Word版含解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.3 可线性化的回归分析
明目标、知重点 1.进一步体会回归分析的基本思想.2.通过非线性回归分析,判断几种不同模型的拟合程度.
1.常见的非线性回归模型
幂函数曲线y =ax b ,指数曲线y =a e bx .
倒指数曲线y =a e ,对数曲线y =a +b ln_x .
b x 2.非线性函数可以通过变换转化成线性函数,得到线性回归方程,再通过相应变换得到非线性回归方程.
探究点一 非线性回归模型
思考1 有些变量间的关系并不是线性相关,怎样确定回归模型?
答 首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,这时可以根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.思考2 如果两个变量呈现非线性相关关系,怎样求出回归方程?
答 可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.
例1 某地区不同身高的未成年男性的体重平均值如下表:
身高x /cm 60708090100110体重y /kg
6.13
7.90
9.99
12.15
15.02
17.50
身高x /cm 120130140150160170体重y /kg
20.92
26.86
31.11
38.85
47.25
55.05
试建立y 与x 之间的回归方程.
解
根据表中数据画出散点图如图所示.
由图看出,样本点分布在某条指数函数曲线
y =c 1e c 2x 的周围,于是令z =ln y .x 60708090100110120130140150160170z
1.81
2.07
2.30
2.50
2.71
2.86
3.04
3.29
3.44
3.66
3.86
4.01
画出散点图如图所示.
由表中数据可得=115,=2.962 5,i y i =4 370.5,=173 000,x y 12∑i =1x 12
∑i =1x
2
i ∴b =≈0.020,
12
∑i =1xiyi -12 x y
12
∑i =1
x 2
i -12(x )2∴a =-b ≈0.663,
y x ∴z 与x 之间的线性回归方程为z =0.663+0.020x ,则有y =e 0.663+0.020x .
反思与感悟 根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y =c 1e c 2x 的周围,其中c 1和c 2是待定参数;可以通过对x 进行对数变换,转化为线性相关关系.跟踪训练1 在彩色显影中,由经验知:形成染料光学密度y 与析出银的光学密度x 由公式
y =A e (b <0)表示.现测得试验数据如下:
b x x i 0.050.060.250.310.070.10y i
0.10
0.14
1.00
1.12
0.23
0.37
x i 0.380.430.140.200.47y i
1.19
1.25
0.59
0.79
1.29
试求y 对x 的回归方程.
解 由题给的公式y =A e ,两边取自然对数,便得ln y =ln A +,与线性回归方程相对照,
b
x b
x 只要取u =,v =ln y ,a =ln A .1x 就有v =a +bu .
题给数据经变量置换u =,v =ln y 变成如下表所示的数据:
1
x u i 20.00016.667 4.000 3.22614.28610.000v i -2.303-1.96600.113-1.470-0.994
u i 2.632 2.3267.143 5.000 2.128v i
0.1740.223
-0.528
-0.236
0.255
可得ln y =0.548-,
0.146
x 即y =e0.548-=e 0.548·e -≈1.73e -,
0.146x 0.146x 0.146
x 这就是y 对x 的回归方程.探究点二 非线性回归分析
思考 对于两个变量间的相关关系,是否只有唯一一种回归模型来拟合它们之间的相关关系?
答 不一定.我们可以根据已知数据的散点图,把它与幂函数、指数函数、对数函数、二次函数图像进行比较,挑选一种拟合比较好的函数,作为回归模型.
例2 对两个变量x ,y 取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:甲 y =0.1x +1,
乙 y =-0.05x 2+0.35x +0.7,
丙 y =-0.8·0.5x +1.4,试判断三人谁的数学模型更接近于客观实际.解 甲模型,当x =1时,y =1.1;当x =2时,y =1.2;
当x =3时,y =1.3;当x =4时,y =1.4.乙模型,当x =1时,y =1;当x =2时,y =1.2;当x =3时,y =1.3;当x =4时,y =1.3.丙模型,当x =1时,y =1;当x =2时,y =1.2;
当x=3时,y=1.3;当x=4时,y=1.35.
观察4组数据并对照知,丙的数学模型更接近于客观实际.
跟踪训练2 根据统计资料,我国能源生产自1986年以来发展很快.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:
年份1986199119962001
产量8.610.412.916.1
根据有关专家预测,到2010年我国能源生产总量将达到21.7亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种( )
A.y=bx+a(b≠0)
B.y=ax2+bx+c(a≠0)
C.y=a x(a>0且a≠1)
D.y=log a x(a>0且a≠1)
答案 A
1.散点图在回归分析中的作用是( )
A.查找个体个数
B.比较个体数据大小关系
C.探究个体分类
D.粗略判断变量是否相关
答案 D
2.变量x与y之间的回归方程表示( )
A.x与y之间的函数关系
B.x与y之间的不确定性关系
C.x与y之间的真实关系形式
D.x与y之间的真实关系达到最大限度的吻合
答案 D
3.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为( )
A .1
B .-0.5
C .0
D .0.5答案 C
4.某种产品的广告费支出x 与销售额y 之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是____________.
x /万元24568y /万元
30
40
60
50
70
答案 (6,50)[呈重点、现规律]
1.对于确定具有非线性相关关系的两个变量,可以通过对变量进行变换,转化为线性回归问题去解决.建立回归模型的步骤
①确定研究对象,明确变量关系;②画出散点图,观察变量之间的关系;③由经验确定回归方程的类型;④按一定规则估计回归方程中的参数2.常见曲线方程的变换公式
曲线方程变换公式
变换后的线性方程=a +1y b x y ′=,x ′=1y 1x y ′=a +bx ′y =ax b y ′=ln y ,x ′=ln x y ′=A +bx ′(A =ln a )
y =a +b ln x y ′=y ,x ′=ln x y ′=a +bx ′y =a e bx
y ′=ln y ,x ′=x
y ′=A +bx ′(A =ln a )
一、基础过关
1.下列说法正确的是( )
①线性回归方程适用于一切样本和总体;
②线性回归方程一般都有时间性;
③样本的取值范围会影响线性回归方程的适用范围;④根据线性回归方程得到的预测值是预测变量的精确值.A .①③④ B .②③ C .①② D .③④答案 B
2.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( )A .y =-10x +200 B .y =10x +200C .y =-10x -200 D .y =10x -200答案 A
3.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点
图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =x +1上,则这组样本数据的样本12相关系数为( )
A .-1
B .0 C. D .11
2答案 D
4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x 1.9934 5.1 6.12y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( )
A .y =2x -2
B .y =()x
12C .y =log 2x D .y =(x 2-1)12答案 D
解析 可以代入检验,当x 取相应的值时,所求y 与已知y 相差最小的便是拟合程度最高的.
5.对于指数曲线y =a e bx ,令u =ln y ,c =ln a ,经过非线性化回归分析之后,可以转化成的形式为( )
A .u =c +bx
B .u =b +cx
C .y =b +cx
D .y =c +bx 答案 A
解析 对方程y =a e bx 两边同时取对数,然后将u =ln y ,c =ln a 代入,不难得出u =c +bx .6.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =e bx +a 的周围,令z =ln y ,求得线性回归方程为z =0.25x -2.58,则该模型的回归方程为
________.答案 y =e 0.25x -2.58
解析 ∵z =0.25x -2.58,z =ln y ,∴y =e 0.25x -2.58.
7.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号12345工作年限x /年35679推销金额y /万元
2
3
3
4
5
(1)求年推销金额y 关于工作年限x 的线性回归方程;
(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.解 (1)设所求的线性回归方程为y =bx +a ,
则b =
==0.5,a =-b =0.4.
5
∑i =1xiyi -5x y
5
∑i =1
x 2
i -5x 210
20y x ∴年推销金额y 关于工作年限x 的线性回归方程为y =0.5x +0.4.(2)当x =11时,y =0.5x +0.4=0.5×11+0.4=5.9(万元).∴可以估计第6名推销员的年推销金额为5.9万元.二、能力提升
8.研究人员对10个家庭的儿童问题行为程度(X )及其母亲的不耐心程度(Y )进行了评价结果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.
下列哪个方程可以较恰当的拟合( )A .y =0.771 1x +26.528B .y =36.958ln x -74.604C .y =1.177 8x 1.014 5D .y =20.924e 0.019 3x
答案 B
解析 可以通过画散点图观察知两个变量x 、y 之间大致呈现对数函数关系.9.已知x ,y 之间的一组数据如下表:
x 1.08 1.12 1.19 1.25y
2.25
2.37
2.43
2.55
则y 与x 之间的线性回归方程y =bx +a 必过点
________________________________________________________________________.答案 (1.16,2.4)
解析 回归方程y =bx +a 必过样本点的中心(,),
x y ∵=
=1.16,x 1.08+1.12+1.19+1.254=
=2.4,
y 2.25+2.37+2.43+2.554
∴样本点的中心为(1.16,2.4).
10.已知线性回归方程为y =0.50x -0.81,则x =25时,y 的估计值为________.答案 11.69
解析 当x =25时,y =0.50×25-0.81=11.69.
11.在一次抽样调查中测得样本的5个样本点,数值如下表:
x 0.250.5124y
16
12
5
2
1
如何建立y 与x 之间的回归方程.
解 画出散点图如图(1)所示,观察可知y 与x 近似是反比例函数关系.
设y = (k ≠0),令t =,则y =kt .
k x 1x 可得到y 关于t 的数据如下表:
t 4210.50.25y
16
12
5
2
1
画出散点图如图(2)所示,观察可知t 和y 有较强的线性相关性,因此可利用线性回归模型进行拟合,易得:
=1.55,=7.2,i y i =94.25,=21.312 5,
t y 5
∑i =1t 5
∑i =1t
2i b =≈4.134 4,a =-b ≈0.791 7,∑5
i =1tiyi -5t y ∑5 i =1t 2i -5t 2y t 所以y =4.134 4t +0.791 7,
所以y 与x 的回归方程是y =
+0.791 7.
4.134 4
x
12.某地区六年来轻工业产品利润总额y 与年次x 的试验数据如下表所示:
年次x 123456利润总额y
11.35
11.85
12.44
13.07
13.59
14.41
由经验知,年次x 与利润总额y (单位:亿元)有如下关系:y =ab x e 0.其中a 、b 均为正数,求y 关于x 的回归方程.(保留三位有效数字)解 对y =ab x e 0两边取对数,得ln y =ln a e 0+x ln b ,令z =ln y ,则z 与x 的数据如下表:
x 123456z
2.43
2.47
2.52
2.57
2.61
2.67
由z =ln a e 0+x ln b 及最小二乘法公式,得ln b ≈0.047 7,ln a e 0≈2.38,即z =2.38+0.047 7x ,所以y =10.8×1.05x .三、探究与拓展
13.某商店各个时期的商品流通率y (%)和商品零售额x (万元)资料如下:
x 9.511.513.515.517.5y
6
4.6
4
3.2
2.8
x 19.521.523.525.527.5y
2.5
2.4
2.3
2.2
2.1
散点图显示出x 与y 的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通率y
决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +.试根据b x 上表数据,求出a 与b 的估计值,并估计商品零售额为30万元时的商品流通率.
解 设u =,则y ≈a +bu ,得下表数据:
1x u 0.105 30.087 00.074 10.064 50.057 1y
6
4.6
4
3.2
2.8
u 0.051 30.046 50.042 60.039 20.036 4y
2.5
2.4
2.3
2.2
2.1
进而可得n =10,≈0.060 4,=3.21,
u y -102≈0.004 557 3,
10
∑i =1u
2i u i y i -10 ≈0.256 35,
10
∑i =1u
u y b ≈≈56.25,0.256 35
0.004 557 3a =-b ·≈-0.187 5,
y u 所求的回归方程为y =-0.187 5+.
56.25
x 当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.。