高中数学第八章成对数据的统计分析8.2一元线性回归模型及其应用教师用书教案新人教A版选择性必修第三册

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

8.2 一元线性回归模型及其应用
必备知识·素养奠基
1.一元线性回归模型
一元线性回归模型的完整表达式为其中Y称为因变量或响应变量,x称为自变量或解释变量;a,b为模型的未知参数,e是Y与bx+a之间的随机误差.
具有相关关系的两个变量,其样本点散布在某一条直线y=bx+a的附近,可以用一次函数y=bx+a来描述两个变量之间的关系吗?
提示:不能.
2.最小二乘法与经验回归方程
(1)最小二乘法
=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计. (2)经验回归方程的系数计算公式
经验回归方程的计算公式的计算公式
=
= x+
=-
=
(3)经验回归方程的性质
①经验回归方程一定过点__(,)__;
②一次函数=x+的单调性由的符号决定,函数递增的充要条件是>0__;
③的实际意义:当x增大一个单位时,增大个单位.
正相关、负相关与的符号有何关系?
提示:Y与x正相关的充要条件是>0,Y与x负相关的充要条件是<0.
3.残差
(1)残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
(2)决定系数:R2=1-越接近1,表示回归的效果越好.
1.思维辨析(对的打“√”,错的打“×”)
(1)经验回归方程一定过样本中的某一个点.( )
(2)选取一组数据中的部分点得到的经验回归方程与由整组数据得到的经验回归方程是同一个方程.( )
(3)在经验回归模型中,R2越接近于1,表示解释变量和响应变量的线性相关性越强.( )
(4)在画两个变量的散点图时,响应变量在x轴上,解释变量在y轴上.( )
提示:(1)×.经验回归方程一定过点(,),可能过样本中的某个或某些点,也可能不过样本中的任意一个点.
(2)×.选取一组数据中的部分点得到的经验回归方程与由整组数据得到的经验回归方程不一定是同一个方程.
(3)√.
(4)×.在画两个变量的散点图时,解释变量在x轴上,响应变量在y轴上.
2.若某地财政收入x与支出Y满足经验回归方程=x++e i(单位:亿元)(i=1,2,…),其中=0.8,=2,|e i|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿元
B.9亿元
C.10.5亿元
D.9.5亿元
【解析】选C.=0.8×10+2+e i=10+e i,
因为|e i|<0.5,所以9.5<<10.5.
3.若施肥量x(kg)与水稻产量Y(kg)的经验回归方程为=5x+250,当施肥量为
80 kg时,预计水稻产量约为________kg.
【解析】把x=80代入经验回归方程可得其预测值=5×80+250=650(kg).
答案:650
关键能力·素养形成
类型一求经验回归方程
【典例】某种产品的广告费用支出x与销售额Y(单位:百万元)之间有如下的对应数据:
x/百万元 2 4 5 6 8
Y/百万元30 40 60 50 70
(1)画出散点图;
(2)求经验回归方程;
(3)试预测广告费用支出为10百万元时,销售额多大?
【思维·引】(1)按表中的数据在平面直角坐标系中描点即得散点图;
(2)由公式求出,,写出经验回归方程;
(3)利用经验回归方程分析.
【解析】(1)散点图如图所示:
(2)列出下表,并用科学计算器进行有关计算:
i 1 2 3 4 5 合计
x i 2 4 5 6 8 25
y i30 40 60 50 70 250
x i y i60 160 300 300 560 1 380
4 16 2
5 3
6 64 145 所以==5,==50,=145,x i y i=1 380.于是可得=
==6.5,=-=50-6.5×5=17.5.
所以所求的经验回归方程为=6.5x+17.5.
(3)根据上面求得的经验回归方程,当广告费用支出为10百万元时,=6.5×10+17.5=82.5(百万元),
即广告费用支出为10百万元时,销售额大约为82.5百万元.
【内化·悟】
求经验回归方程前应注意什么问题?
提示:对于性质不明确的两组数据,要先作散点图,从图中看它们有无线性相关关系,有相关关系的求出的经验回归方程才有实际意义.
【类题·通】
求经验回归方程的步骤
(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.
(2)求回归系数:若存在线性相关关系,则求回归系数.
(3)写方程:写出经验回归方程,并利用经验回归方程进行预测说明.
【习练·破】
某公司的生产部门调研发现,该公司第二,三季度的月用电量Y与月份x线性相关,且数据统计如下:
月份 4 5 6 7 8 9
月用电量
6 16 2
7 55 46 56
(千瓦时)
但核对电费报表时发现一组数据统计有误.
(1)请指出哪组数据有误,并说明理由;
(2)在排除有误数据后,求月用电量与月份之间的经验回归方程=x+,并预测统计有误那个月份的用电量.(结果精确到0.1)
【解析】(1)作散点图如图所示.因为用电量与月份之间线性相关,所以散点图的样本点分布在经验回归直线附近比较窄的带状区域内,而点(7,55)离其他点所在区域较远,故(7,55)这组数据有误.
(2)排除(7,55)这一组有误数据后,计算得=6.4,=30.2.
因为=≈9.98,
=-≈-33.67,
所以经验回归方程为=9.98x-33.67,
当x=7时,≈36.2,
即7月份的用电量大约为36.2千瓦时.
类型二线性检验回归分析
【典例】某运动员训练次数与训练成绩之间的数据关系如表:
次数(x) 30 33 35 37 39 44 46 50
成绩(Y) 30 34 37 39 42 46 48 51
(1)作出散点图;
(2)求出经验回归方程;
(3)作出残差图;
(4)计算R2,并说明运动员的训练次数对成绩的影响占百分之几.
【思维·引】根据题意先作散点图再求经验回归方程、残差及R2.
【解析】(1)作出该运动员训练次数x与成绩Y的散点图,如图所示.由散点图可知,它们之间具有相关关系.
(2)=39.25,=40.875,=12 656,x i y i=13 180,
所以=≈1.041 5,=-=-0.003 875,
所以经验回归方程为=1.041 5x-0.003 875.
(3)残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以及相应的残差数据.
x Y
30 30 -1.241 1
33 34 -0.365 6
35 37 0.551 4
37 39 0.468 4
39 42 1.385 4
44 46 0.177 9
46 48 0.094 9
50 51 -1.071 1
作残差图如图所示.
由图可知,残差点比较均匀地分布在水平带状区域内,说明选择的模型比较合适.
(4)计算R2≈0.985 5,说明了该运动员的训练次数对成绩的影响占98.55%.
【类题·通】
“R2、残差图”在回归分析中的作用
(1)R2是用来刻画回归效果的,由R2=1-可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.
(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.
【习练·破】
为研究质量x(单位:g)对弹簧长度Y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如表所示:
x 5 10 15 20 25 30
Y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求经验回归方程;
(2)求出R2并说明回归模型拟合的程度;
(3)进行残差分析.
【解析】(1)散点图如图.
=×(5+10+15+20+25+30)=17.5,
=×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,计算得≈0.183,≈6.285.
故所求经验回归方程为=6.285+0.183x.
(2)列出残差表为
y i-i0.05 0.005 -0.08 -0.045 0.04 0.025
y i--2.237 -1.367 -0.537 0.413 1.413 2.313
所以(y i-i)2≈0.013 18,(y i-)2=14.678 3.
所以,R2=1-≈0.999 1,回归模型的拟合效果较好.
(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个样本点的时候是否有人为的错误,如果有的话,需要纠正,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与所挂物体的质量成线性关系.
类型三非线性经验回归问题
【典例】为了研究某种细菌随时间x的变化繁殖个数Y的变化,收集数据如下:
时间x/天 1 2 3 4 5 6
繁殖个数Y 6 12 25 49 95 190
(1)将天数做解释变量,繁殖个数做响应变量,作出这些数据的散点图;
(2)描述解释变量与响应变量之间的关系.
【思维·引】先由散点图确定相应的函数模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.
【解析】(1)由表中数据作散点图如图所示.
(2)由散点图看出样本点分布在一条指数函数y=c1的图象的周围,其中c1和c2是待定系数.于是令Z=ln Y,则=x+(=ln c1,=c2),因此变换后的样本点应该分布在直线=x+的周围,因此可以用经验回归模型来拟合Z与x的关系,则变换后的样本数据如表:
x 1 2 3 4 5 6
Z 1.79 2.48 3.22 3.89 4.55 5.25
由表中数据得到经验回归方程=0.69x+1.115.
因此细菌繁殖个数关于时间的非线性经验回归方程为=e0.69x+1.115.
【内化·悟】
将非线性相关问题转化为线性相关问题的依据是什么?
提示:根据散点图确定.
【类题·通】
1.非线性经验回归问题的解题步骤
2.常见转化类型
(1)反比例函数y=a+可作变换t=,得y=a+bt.
(2)幂函数型y=ax b(a>0)可作变换Y=ln y,m=ln a,t=ln x,则有Y=m+bt.
(3)指数型函数y=ka bx(a>0且a≠1,k>0)可作变换Y=ln y,m=ln k,则有:Y=m+
(bln a)x.
【习练·破】
某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量Y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2, (8)
数据作了初步处理,得到下面的散点图及一些统计量的值.
(x i-
)2(w i-
)2
(x i-)(y i-
)
(w i-)(y i-
)
46.
563 6.8 289.8 1.6 1 469 108.8
6
表中w i=,=w i.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量Y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线=+u的斜率和截距的最小二乘估计分别为
=,=-.
【解析】(1)由散点图可以判断,y=c+d适宜作为年销售量Y关于年宣传费x的回归方程类型.
(2)令w=,先建立Y关于w的经验回归方程.
由于===68,=-=563-68×6.8=100.6,
所以Y关于w的经验回归方程为=100.6+68w,
因此Y关于x的经验回归方程为=100.6+68.
(3)①由(2)知,当x=49时,年销售量Y的预报值=100.6+68=576.6,
年利润z的预报值=576.6×0.2-49=66.32.
②根据(2)的结果知,年利润z的预报值=0.2(100.6+68)-x=-x+13.6+20.12. 所以当==6.8,
即x=46.24时,取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
【加练·固】
如表是某年美国旧轿车价格的调查资料.
使用
1 2 3 4 5 6 7 8 9 10
年数
平均价
2 651 1 94
3 1 49
4 1 087 76
5 538 484 290 22
6 204
格(美元)
观察表中的数据,试问平均价格与使用年数间存在什么样的关系?
【解析】设x表示轿车的使用年数,Y表示相应的平均价格,作出散点图.
由散点图可以看出Y与x具有指数关系,
令Z=ln Y,变换得
x 1 2 3 4 5 6 7 8 9 10 Z 7.883 7.572 7.309 6.991 6.640 6.288 6.182 5.670 5.421 5.318 作出散点图:
由图可知各点基本上处于一直线附近,由表中数据可求出经验回归方程:=8.166-0.298x.
因为旧车的平均价格与使用年数具有指数关系,所以其非线性经验回归方程为=e8.166-0.298x.
课堂检测·素养达标
1.关于回归分析,下列说法错误的是( )
A.回归分析是研究两个具有相关关系的变量的方法
B.散点图中,解释变量在x轴,响应变量在y轴
C.回归模型中一定存在随机误差
D.散点图能明确反映变量间的关系
【解析】选D.用散点图反映两个变量间的关系时,存在误差.
2.关于残差图的描述错误的是( )
A.残差图的横坐标可以是样本编号
B.残差图的横坐标也可以是解释变量或预报变量
C.残差点分布的带状区域的宽度越窄相关指数越小
D.残差点分布的带状区域的宽度越窄残差平方和越小
【解析】选C.残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时,相关指数R2的值越大.
3.根据如下样本数据:
x 2 3 4 5 6
Y 4 2.5 -0.5 -2 -3
得到的经验回归方程为=x+,则( )
A.>0,>0
B.>0,<0
C.<0,>0
D.<0,<0
【解析】选B.由题干表中的数据可得,变量Y随着x的增大而减小,则<0,
又回归方程为=x+经过(2,4),(3,2.5),可得>0.
4.某种产品的广告支出费用x(单位:万元)与销售额Y(单位:万元)的数据如表:
x 2 4 5 6 8
Y 30 40 60 50 70
已知Y关于x的经验回归方程为=6.5x+17.5,则当广告支出费用为5万元时,残差为________.
【解析】当x=5时,=6.5×5+17.5=50,表格中对应y=60,于是残差为60-50=10.
答案:10
【新情境·新思维】
已知变量x,Y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为( )
A.=1.5x+2
B.=-1.5x+2
C.=1.5x-2
D.=-1.5x-2
【解析】选B.设经验回归方程为=x+,由题干中散点图可知变量x,Y之间负相关,经验回归直线在Y轴上的截距为正数,所以<0,>0,因此方程可能为=-1.5x+2.。

相关文档
最新文档