8.2 一元线性回归模型及其应用(精讲)(解析版)
(新教材学案)8.2一元线性回归模型及其应用含解析
8.2 一元线性回归模型及其应用最新课标(1)结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.(2)针对实际问题,会用一元线性回归模型进行预测. [教材要点]要点一 一元线性回归模型我们称⎩⎪⎨⎪⎧Y =bx +a +e E (e )=0,D (e )=σ2 为Y 关于x 的一元线性回归模型,其中,Y 称为因变量或响应变量,x 称为自变量或解释变量;a 和b 为模型的未知参数,a 称为________参数,b 称为________参数;e 是Y 与bx +a 之间的随机误差.要点二 一元线性回归模型参数的最小二乘估计1.经验回归方程:将y ^=________称为Y 关于x 的经验回归方程,也称经验回归函数或经验回归公式,其图形称为________________.这种求经验回归方程的方法叫做最小二乘法,求得的b ^ ,a ^叫做b ,a 的最小二乘估计,其中⎩⎪⎪⎨⎪⎪⎧b ^=∑i =1n(x i-x -)(y i-y -)∑i =1n(x i-x -)2,a ^=y --b ^x -.2.残差:对于响应变量Y ,通过观测得到的数据称为观测值,通过经验回归方程得到的y ^称为预测值,观测值减去预测值称为残差.3.用决定系数R 2决定模型的拟合效果:R 2=1-∑i =1n(y i -y ^i )2∑i =1n (y i -y -)2.R 2越大,表示残差平方和越小,即模型的拟合效果越好;R 2越小,表示残差平方和越大,即模型的拟合效果越差. [基础自测]1.判断正误(正确的画“√”,错误的画“×”) (1)经验回归方程适用于一切样本和总体.( ) (2)经验回归方程一般都有局限性.( )(3)样本取值的范围会影响经验回归方程的适用范围.( ) (4)经验回归方程得到的预测值是预测变量的精确值.( ) 2.如果记录了x ,y 的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y 关于x 的经验回归直线必过点( )A .(2,2)B .(1.5,2)C .(1,2)D .(1.5,4)3.已知经验回归方程y ^=2x +1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.044.已知变量x ,y 线性相关,由观测数据算得样本的平均数x -=4,y - =5,经验回归方程y ^ =b ^ x +a ^ 中的系数b ^ ,a ^ 满足b ^ +a ^=4,则经验回归方程为________.题型一 经验回归方程的求解及应用——微点探究 微点1 公式法求经验回归方程例1某种产品的广告费用支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:(1)画出散点图; (2)求经验回归方程;(3)试预测广告费用支出为10百万元时,销售额是多少.(参考数据:∑i =15x 2i=145,∑i =15x i y i =1 380)状元随笔 注意经验回归方程中的一次项系数为b ^,常数项为a ^,这与一次函数的表示习惯不同.微点2 利用样本点中心(x -,y -)求经验回归方程例2某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中的数据得到的经验回归方程为y ^=b ^x +a ^,其中b ^=-20,预测当产品单价定为9.5元时,销量约为________件.状元随笔 样本点的中心(x - ,y -)在经验回归直线上. 方法归纳求经验回归方程的步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量;(2)画出解释变量和响应变量的散点图,观察它们之间的关系(如是否存在线性相关关系等);(3)由经验确定回归方程的类型(如我们观察到数据呈线性相关关系,则选用经验回归方程);(4)用最小二乘法求经验回归方程中的参数; (5)写出经验回归方程.跟踪训练1某个体服装店经营某种服装在某周内获得的纯利润y (元)与该周每天销售这种服装的件数x 之间有如下一组数据:已知∑i =17x 2i=280,∑i =17y 2i=45 309,∑i =17x i y i =3 487.(1)求x -,y -;(2)求纯利润y 与每天销售件数x 的经验回归方程; (3)估计每天销售10件这种服装时,纯利润是多少元? 题型二 经验回归分析——师生共研例3已知某种商品的单价x (单位:元)与需求量y (单位:件)之间的关系有如下一组数据:求y 关于x 的经验回归方程,并说明回归模型拟合效果的好坏.方法归纳R 2越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R 2表示解释变量对于响应变量变化的贡献率,R 2越接近于1,回归的效果越好(因为R 2越接近于1,解释变量和响应变量的相关性越强).若对某组数据可以采取几种不同的回归方程进行回归分析,则可以通过比较几个R 2,选择R 2大的模型作为这组数据的回归模型.跟踪训练2某公司为提高市场销售业绩,促进某产品的销售,随机调查了该产品的月销售单价x (单位:元/件)及相应月销量y (单位:万件),对近5个月的月销售单价x i 和月销售量y i (i =1,2,3,4,5)的数据进行了统计,得到如表数据:(1)建立y 关于x 的经验回归方程;(2)该公司开展促销活动,当该产品月销售单价为7元/件时,其月销售量达到18万件,若由回归直线方程得到的预测数据与此次促销活动的实际数据之差的绝对值不超过0.5万件,则认为所得到的经验回归方程是理想的,试问:(1)中得到的经验回归方程是否理想?(3)根据(1)的结果,若该产品成本是5元/件,月销售单价x 为何值时(销售单价不超过11元/件),公司月利润的预计值最大?参考公式:经验回归方程y ^=b ^x +a ^,其中b ^=∑i =1nx i y i-n x - y -∑i =1nx 2i-n x -2,a^=y --b ^x -.参考数据:∑i =15x i y i =392,∑i =15x 2i =502.5.题型三 非线性经验回归方程的求解——师生共研例4为了研究某种细菌繁殖的个数y 随时间x 变化的情况,收集如表数据:(1)用天数作解释变量,繁殖个数作响应变量,作出这些数据的散点图.(2)观察散点图是否可用曲线y =c 1e c 2x 拟合,描述解释变量与响应变量之间的关系.方法归纳求非线性经验回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性经验回归问题转化为经验回归问题,并求出经验回归方程.(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性经验回归方程.跟踪训练3电容器充电后,电压达到100 V ,然后开始放电.由经验知道,此后电压U 随时间t 变化的规律用公式U =A e bt (b<0)表示.现测得时间t(s )时的电压U(V )如下所示:试求电压U 对时间t 的回归方程. 易错辨析 缺失基本解题步骤致错例5在一次抽样检查中,抽得5个样本点,数据如下表:试建立y 关于x 的回归方程.解析:作出散点图,如图(1)所示,由散点图可以看出,图象近似反比例函数在第一象限的部分,因此令u =1x ,由已知数据,可得变换后的样本数据:作出散点图,如图(2)所示,可以看出,变换后的样本点分布在一条直线的附近,因此可以用经验回归方程拟合.计算得u - =1.55,y -=7.2,∑i =15u i y i =94.25,∑i =15u 2i =21.3125,则b ^=∑i =15u i y i-5u - y -∑i =15u 2i -5u-2 ≈4.13,a ^ =y - -b ^ u -≈0.8.从而得到y 关于u 的回归方程为y ^=4.13u +0.8,则y 关于x 的回归方程为y ^=4.13x +0.8.【易错警示】 易错原因解决此题易出现如下错误:根据数据计算得x - =1.55,y -=7.2,∑i =15x i y i =23,∑i =15x2i=21.312 5,代入公式计算得b ^≈-3.53,a ^ ≈12.67,从而得到y 关于x 的回归方程为y ^=-3.53x +12.67.事实上,由散点图可知样本点并没有呈线状分布,两个变量不具有很强的线性相关关系.错解是由于没有按照建立回归模型的基本步骤解题,忽略了画散点图,没有观察数据之间的关系造成错误.(2)一些非线性回归问题可通过中间量变换,转化为经验回归问题求解.纠错心得(1)解决这类问题必须严格按照建立回归模型的基本步骤,不能主观臆断,必须按部就班,依照步骤解题.温馨提示:请完成课时作业(十五) 8.2 一元线性回归模型及其应用 新知初探·课前预习要点一 截距 斜率 要点二1.b ^ x +a ^经验回归直线 [基础自测]1.(1)×(2)√(3)√(4)×2.解析:因为x - =0+1+2+34 =1.5,y - =1+3+5+74 =4,所以样本点的中心为(1.5,4),而经验直线过样本点的中心.故选D .答案:D3.解析:因为残差e ^ i =y i -y ^i ,所以残差的平方和为(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.故选C .答案:C4.解析:经验回归方程y ^ =b ^ x +a ^过样本中心点(4,5),所以4b ^ +a ^=5; 又a ^ +b ^=4,解方程组⎩⎪⎨⎪⎧4b ^+a ^=5,a ^+b ^=4,得b ^ =13 ,a ^ =113 ,所以经验回归方程为:y ^=13 x +113 . 答案:y ^=13 x +113 题型探究·课堂解透题型一例1 解析:(1)散点图如图所示. (2)x - =255 =5,y -=2505 =50.∴b ^=∑i =15x i y i -5x - y-∑i =15x 2i -5x-2=1 380-5×5×50145-5×52=6.5, a ^=y --b ^x -=50-6.5×5=17.5, 所以所求的经验回归方程为y ^=6.5x +17.5.(3)根据(2)中求得的经验回归方程,当x =10时,y ^=6.5×10+17.5=82.5,即广告费用支出为10百万元时,销售额大约为82.5百万元.例2 解析:因为b ^ =-20,所以y ^ =-20x +a ^. x - =8+8.2+8.4+8.6+8.8+96 =8.5, y - =90+84+83+80+75+686 =80, 将(8.5,80)代入y ^ =-20x +a ^ ,得a ^=250,所以经验回归方程为y ^=-20x +250,当x =9.5时,y ^=-20×9.5+250=60.所以当产品单价定为9.5元时,销量约为60件. 答案:60跟踪训练1 解析:(1)x - =17 (3+4+5+6+7+8+9)=6, y -=17 (66+69+73+81+89+90+91)≈79.86.(2)设经验回归方程为y ^ =b ^ x +a ^ ,则b ^=∑i =17x i y i -7x - y-∑i =17x 2i -7x -2=3 487-7×6×79.86280-7×62≈4.75a ^ =y - -b ^ x -=79.86-4.75×6=51.36.∴所求经验回归方程为y ^=4.75x +51.36.(3)当x =10时,y ^=98.86,估计每天销售10件这种服装时,可获纯利润为98.86元.题型二例3 解析:计算可得x - =15 ×(14+16+18+20+22)=18, y -=15 ×(12+10+7+5+3)=7.4,∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,所以b ^=∑i =15x i y i -5x - y-∑i =15x 2i -5x-2=620-5×18×7.41 660-5×182=-1.15, a ^=y --b ^x -=7.4+1.15×18=28.1, 所以所求经验回归方程是y ^=-1.15x +28.1. 方法一 列出残差表:所以∑i =15(y i -y ^i )2=0.3,又∑i =15(y i -y -)2=53.2,所以R 2=1-∑i =15(y i -y ^i )2∑i =15 (y i -y -)2≈0.994.故回归模型的拟合效果很好. 方法二∑i =15y 2i =122+102+72+52+32=327,则r =∑i =15x i y i -5x - y-(∑i =15x 2i -5x -2)(∑i =15y 2i -5y -2)=620-5×18×7.4(1 660-5×182)×(327-5×7.42)≈-4646.13≈-1.所以回归模型的拟合效果很好.跟踪训练2 解析:(1)因为x -=15(11+10.5+10+9.5+9)=10,y -=15(5+6+8+10+11)=8.所以b ^=392-5×10×8502.5-5×102=-3.2,所以a ^=8-(-3.2)×10=40, 所以y 关于x 的经验回归方程为:y ^=-3.2x +40.(2)当x =7时,y =-3.2×7+40=17.6,即|17.6-18|=0.4<0.5,所以可以认为所得到的经验回归方程是理想的.(3)设销售利润为M,则M=(x-5)(-3.2x+40)(5<x≤11),M =-3.2x2+56x-200,所以x=8.75时,M取最大值,所以该产品单价定为8.75元时,公司才能获得最大利润.题型三例4解析:(1)作出散点图,如图:(2)由散点图可以看出样本点分布在一条指数型函数y=c1e c2x 曲线的周围,于是令z=ln y,则z^=b^x+a^,a^=ln c1,b^=c2,由计算得z=0.69x+1.115,则有y=e0.69x+1.115.跟踪训练3解析:对U=A e bt两边取自然对数得ln U=ln A +bt令y=ln U,a=ln A,即y^=a^+b^t,即ln U=-0.3t+4.6,所以U^=e-0.3t+4.6.。
8.2.2一元线性回归模型的应用-【新教材】人教A版高中数学选择性必修第三册课件
x
y
14
12
16
10
18
7
20
5
22
3
求y对x的回归直线方程,并说明回归模型拟合效果的好坏.
建立线性回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量.
(2)画出解释变量与响应变量的散点图,视察它们之间的关系 (如是否存
在线性关系等).
(3)由经验确定回归方程的类型.
例1.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号
工作年限x/年
推销金额y/万元
1
3
2
2
5
3
(1)画出散点图.
(2)建立年推销金额y关于工作年限x的经验回归方程;
3
6
3
4
7
4
5
9
5
=
参考数据:
(3)说明回归模型拟合效果的好坏;
(4)若第6名推销员的工作年限为11年,预测他的年推销金额.
4
5
9
5
题型一:线性回归分析
例1.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:
推销员编号
工作年限x/年
推销金额y/万元
1
3
2
2
5
3
(1)画出散点图.
(2)建立年推销金额y关于工作年限x的经验回归方程;
3
6
3
(3)说明回归模型拟合效果的好坏;
(4)若第6名推销员的工作年限为11年,预测他的年推销金额.
根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到0.1)以及相应
的残差,如下表所示.
2024春高中数学第8章成对数据的统计分析8-2一元线性回归模型及其应用8-2-1一元线性回归模型8
(2)通过(1)中的方程,求出y关于x的回归方程.
[解]
=1.2t-1.4,代入t=x-2
Ƹ
017,z=y-5,
得-5=1.2(x-2
ො
017)-1.4,
即=1.2x-2
ො
416.8.
故y关于x的经验回归方程为=1.2x-2
ො
416.8.
◆ 类型3 利用经验回归方程进行预测
【例3】 (源自湘教版教材)一个车间为了估计加工某种新型零件所
(√ )
(2)经验回归方程最能代表观测值x,y之间的线性关系,且回归直线
过样本点的中心(,
ҧ ).
ത
(√ )
(3)求经验回归方程前可以不进行相关性检验.
( × )
(4)利用经验回归方程求出的值是准确值.
( × )
①④
2.下列有关经验回归方程=
ො +
叙述正确的是______(填序号).
位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并
由调查数据得到y对x的经验回归方程:=0.254x+0.321.由经验回
ො
归方程可知,家庭年收入每增加1万元,年饮食支出平均增加
0.254
________万元.
0.254
[由于=0.254x+0.321知,当x增加1万元时,年饮食支出y增
ො
①反映与x之间的函数关系;
ො
②反映与x之间的函数关系;
③表示与x之间不确定关系;
ො
④表示最接近与x之间真实关系的一条直线.
①④
[=
ො +
表示
ො
与x之间的函数关系,而不是y与x之间的函数
ො
关系,但它反映的关系最接近y与x之间的真实关系,故①④正确.]
新教材2023版高中数学第八章成对数据的统计分析8.2一元线性回归模型及其应用课件
巩固训练1 (1)为了解儿子身高与其父亲身高的关系,随机抽取5对 父子的身高数据如下:
父亲身高x/cm 174 176 176 176 178 儿子身高y/cm 175 175 176 177 177
则y对x的经验回归方程为( ) A.yො=x-1 B.yො=x+1 C.yො=88+12x D.yො=176
教材要点
要点一 一元线性回归模型
我们称ቊE
Y e
= bx + a = 0,D
+ e
e=,σ2为Y关于x的一元线性回归模型❶,其中
Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未 知参数,a称为___截__距___参数,b称为___斜__率___参数;e是Y与bx+a之 间的_随__机_误__差__.
2.某商品销售量y(件)与销售价格x(元/件)负相关,则其经验回归方 程可能是( )
A.yො=-10x+200 B.yො=10x+200 C.yො=-10x-200 D.yො=10x-200
答案:A
解析:∵y与x负相关,∴排除B,D,又∵C项中x>0时,yො <0不合题意,∴C 错.故选A.
3.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选 择了4种不同模型,计算可得它们的R2分别如下表:
8.2 一元线性回归模型及其应用
新知初探·课前预习
题型探究·课堂解透
课标解读 1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的 统计意义. 2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计 方法,会使用相关的统计软件. 3.针对实际问题,会用一元线性回归模型进行预测.
新知初探·课前预习
解析:令x=15,所以yො=0.76×15+0.4=11.8.
高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精练)(含答案)
8.2 一元线性回归模型及其应用(精练)【题组一 样本中心求参数】1.(2021·全国·高二单元测试)某公司生产某种婴幼儿纸尿裤的产量x 与相应的生产能耗y 有如下样本数据:已知这组样本数据具有线性相关关系,由表中数据,求得回归直线的斜率为0.72,则这组样本数据的回归直线方程是( )A .ˆ0.72 2.05yx =+ B .ˆ0.720.35yx =+ C .ˆ0.720.26yx =+ D .ˆ0.350.72yx =+ 【答案】C【解析】设回归直线方程为ˆˆ0.72yx a =+,由样本数据,可得 4.5x =, 3.5y =, 因为回归直线经过点(),x y ,所以ˆ3.50.72 4.5a=⨯+,解得ˆ0.26a =, 所以回归直线方程为ˆ0.720.26yx =+. 故选:C .2.(2021·江西·吉安一中高二开学考试 )已知x 与y 之间的一组数据:()()()()13253749,,,,,,,,则y 与x 的线性回归方程为y bx a =+必过( )A .()26,B .()38,C .()2.56,D .()3.58,【答案】C【解析】由题意可知:1234 2.54x +++==,357964y +++==, ∴y 与x 的线性回归方程必过点()2.5,6.故选:C.3(2021·河南·孟津县第一高级中学 )为了庆祝建党100周年,某网站从7月1日开始推出党史类书籍免费下载活动,已知活动推出时间x (单位:天)与累计下载量y (单位:万次)的统计数据如表所示:根据上表,利用最小二乘法得到回归直线方程 1.4ˆˆyx a =+,据此模型预测,活动推出11天的累计下载量约A .13.8万次B .14.6万次C .16万次D .18万次【答案】C【解析】由表格数据知4567868910126,955x y ++++++++====,由回归直线方程的性质,得ˆ1.469a⨯+=,所以ˆ0.6a =,故ˆ 1.40.6y x =+, 所以当11x =时, 1.4110.616y =⨯+=(万次), 故选:C.4.(2021·河北·藁城新冀明中学高二月考)(多选)随着养生观念的深入,国民对餐饮卫生条件和健康营养的要求逐渐提高.据了解,烧烤食品含有强致癌物,因此吃烧烤的人数日益减少,烧烤店也随之减少.某市对2014年至2018年这五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如下表所示:根据所给数据,得出y 关于t 的回归直线方程为273y bt =+,则下列说法正确的是( ) A .该市2014年至2018年全市烧烤店盈利店铺个数的平均数219y = B .y 关于t 的回归直线方程为18273y t =-+ C .估计该市2020年烧烤店盈利店铺的个数为147D .预测从2025年起,该市烧烤店盈利店铺的个数将不超过100 【答案】ABC【解析】由已知数据得3t =,219y =,故A 正确;因为y 关于t 的回归直线过点()3,219,所以2193273b =+,所以18b =-, 所以y 关于t 的回归直线方程为18273y t =-+.故B 正确;2020年的年份代码为7,故2020年该市烧烤店盈利店铺的个数约为187273147y =-⨯+=.故C 正确; 令18273100t -+≤,由*t N ∈,得10t ≥,故从2023年起,该市烧烤店盈利店铺的个数将不超过100.故D 不正确,故选:ABC.5.(2021·广东惠州 )(多选)某种产品的价格x (单位:元/kg )与需求量y (单位:kg )之间的对应数据如根据表中的数据可得回归直线方程为14.4y bx =+,则以下结论正确的是( ) A .y 与x 正相关 B .y 与x 负相关C .样本中心为()20,8D .该产品价格为35元/kg 时,日需求量大约为3.4kg【答案】BC【解析】由表格数据,随着价格x 的增加,需求量y 随之减少,所以y 与x 负相关. 因为1015202530205x ++++==,111086585y ++++==,故样本中心为()20,8由回归直线14.4y bx =+必过样本点的中心()20,8, 所以有82014.4b =⨯+,解得0.32b =-,所以当35x =时,0.323514.4 3.2y =-⨯+=,日需求量不为最大 故选:BC6.(2021·重庆市秀山高级中学校 )(多选)已知变量x ,y 之间的线性回归方程为0.710.3y x =-+,且变量x ,y 之间的一组相关数据如表所示,则下列说法正确的是( )A .变量x ,y 之间呈负相关关系B .可以预测,当20x 时, 3.7y =-C .4m =D .该回归直线必过点()9,4 【答案】ABD【解析】对于A :由线性回归方程为0.710.3y x =-+可知:0.70-<,所以变量x ,y 之间呈负相关关系,故对于B :当20x 时,0.72010.3 3.7y =-⨯+=-,故选项B 正确;对于C :68101294x +++==,6321144m m y ++++==,因为回归直线过样本中心点,所以110.7910.34m+=-⨯+,解得:5m =,故选项C 不正确; 对于D :由C 可知5m =,所以11544y +==,所以该回归直线必过样本中心点()9,4,故选项D 正确; 故选:ABD.7.(2021·贵州·贵阳一中 )某产品的广告费用x 与销售额y 的统计数据如下表:根据上表已得回归方程为8.6.8ˆ5yx =-,表中一数据模糊不清,请推算该数据的值为___________. 【答案】12【解析】由题中数据可得3,8.63 5.820x y ==⨯-=,故空白数据为12. 故答案为:128.(2021·全国·高二课时练习)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且回归直线方程为ˆ0.95 2.6yx =+,那么表格中的数据m 的值为______.【答案】6.7 【解析】013424x +++==, 2.2 4.3 4.811.344m m y ++++==, 把(),x y 的坐标代入回归直线方程得11.30.952 2.64m+=⨯+, 解得 6.7m =. 故答案为:6.79.(2021·全国·高二课时练习)蟋蟀鸣叫的频率P (每分钟鸣叫的次数)与气温T (单位:℃)有着很大的关系.某观测人员根据下表中的观测数据计算出P 关于T 的线性回归方程ˆ 5.2168PT =-,则下表中k 的值为______.【答案】51【解析】计算()138414239404T =⨯+++=,()110929443644k P k +=⨯+++=, 将点10940,4k +⎛⎫ ⎪⎝⎭的坐标代入P 与T 的线性回归方程ˆ 5.2168P T =-中,得109 5.2401684k +=⨯-, 解得51k =. 故答案为:51.10.(2021·福建宁德·高三期中)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:由最小二乘法得到回归方程ˆ0.6754.9yx =+,则a =___________. 【答案】75 【解析】1020304050305x ++++==,62688189600.25a y a ++++==+,因为线性回归方程过样本中心点,所以600.20.673054.975a a +=⨯+⇒=,故答案为:75 【题组二 线性回归方程】1.(2021·河北·藁城新冀明中学高二月考)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件;(3)各组残差见解析,残差平方和为3.8182. 【解析】(1)解:散点图如下:(2)解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818i i i y y=--+++--==++∑. 2.(2021·甘肃张掖)某家庭2015~2019年的年收入和年支出情况统计如表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(系数精确到0.01);(2)假设受新冠肺炎疫情影响,该家庭2021年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2021年的年支出金额.附:回归方程ˆˆˆybx a =+中的斜率的最小二乘估计公式为()()()1122211ˆnni iiii i nniii i x ynx y xxy y b xnxxx====---==--∑∑∑∑.【答案】(1)ˆ0.780.24yx =+;(2)7.65万元. 【解析】(1)依题意,1(99.61010.411)105x =++++=,1(7.37.588.58.7)85y =++++=,则()5212.32i i x x=-=∑,()()511.8i ii x xy y =--=∑,则有()()()125151.8ˆ0.782.32iii ii x x y y bx x ==--==≈-∑∑,则ˆˆ0.24a y bx =-≈, 所以y 关于x 的线性回归方程为ˆ0.780.24yx =+; (2)当2021年的年收入为9.5万元时,即9.5x =,ˆ0.789.50.247.65y=⨯+=, 所以预测该家庭2021年的年支出金额为7.65万元.3.(2021·云南师大附中)大气污染物PM 2.5的浓度超过一定的限度会影响人的健康.为了研究PM 2.5的浓度是否受到汽车流量的影响,研究人员选择了24个社会经济发展水平相近的城市,在每个城市选择一个交通点统计24小时内过往的汽车流量x (单位:千辆),同时在低空相同的高度测定该时间段空气中的PM 2.5的平均浓度y(单位:μg/m 3),制作了如图所示的散点图:(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明(精确到0.01); (2)建立y 关于x 的回归方程;(3)我国规定空气中的PM 2.5浓度的安全标准为24小时平均依度75μg/m 3,某城市为使24小时的PM 2.5浓度的平均值在60~130μg/m 3,根据上述回归方程预测汽车的24小时流量应该控制在什么范围内?附:参考数据: 1.4x =,95y =,2421() 2.1i i x x =-=∑,2421()60343i i y y =-=∑,241()()294i i i x x y y =--=∑,357.参考公式:相关系数()()nii xx y y r --∑,回归方程ˆˆˆya bx =+中斜率和截距的最小二乘估计公式分别为:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =-. 【答案】(1)答案见解析;(2)140101y x =-;(3)24小时的车流量应该控制在1150~1650辆. 【解析】1)由题得2940.82357r =≈, 因为y 与x 的相关系数近似为0.82,说明y 与x 具有很强的相关性, 从而可以用线性回归模型拟合y 与x 的关系.(2)由95y =得2412421()()ˆ()iii ii x x y y bx x ==--=-∑∑2941402.1==,95140 1.4101a y bx =-=-⨯=-, 所以y 关于x 的回归方程为140101y x =-. (3)当60y =时,由14010160x -=得 1.15x =; 当130y =时,由140101130x -=得 1.65x =. 所以24小时的车流量应该控制在1150~1650辆.4.(2021·全国·高三专题练习)实施新规后,某商场2020年1月份至10月份的收入情况如表.并计算得101890i i i x y ==∑,1021385i i x ==∑,101150i i y ==∑75.99.(1)是否可用线性回归模型拟合y 与x 的关系?请用相关系数r 加以说明;(当0.751r ≤≤时,那么变量x ,y 有较强的线性相关关系)(2)建立y 关于x 的回归方程ˆˆˆybx a =+(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)附:()()()1122211ˆn niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)y 与x 有较强的线性相关关系,可用线性回归模型拟合,说明答案见解析;(2)ˆ0.810.7yx =+,预测该商场12月份的收入为20万元.【解析】(1)由题中数据得1011155 5.51010i i x x ===⨯=∑,10111150151010i i y y ===⨯=∑,1010 5.515825x y =⨯⨯=,于是得1010111()()1089082565i i i i i x x y y x y y x ==--=-=-=∑∑,75.99,从而10()()650.8675.99iix x y y r --==≈∑,0.75||1r ≤≤, 所以y 与x 有较强的线性相关关系,可用线性回归模型拟合;(2)由(1)知1011065i i i x y x y =-=∑,而1021385i i x ==∑,221010 5.5302.5x =⨯=,从而得10122110106565ˆ0.8385302.582.510i ii i i x y ybx xx ==-===≈--∑∑,65ˆˆ15 5.510.782.5ay bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆ0.810.7yx =+,当12x =时,ˆ0.81210.720y =⨯+≈, 从而预测该商场12月份的收入为20万元.5(2021·河南许昌 )某新型外贸出口公司对2021年过去9个月的出口销售数据进行整理,得到了今年第x 个月份与截止该月底的销售额y (单位:万元)之间的关系,如下表:(1)若y 与x 满足线性关系,求出y 关于x 的回归方程;(ˆa,ˆb 精确到整数位) (2)预测该公司10月份的销售额附:参考数据:913087i i y ==∑;9117524i i i x y ==∑;921285i i x ==∑;参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ35169yx =+;(2)答案见解析. 【解析】(1)5x =,343y =,919175249534317524154352089i i i x y xy =∴-=-⨯⨯=-=∑92221952859560ii x=-⨯=-⨯=∑,2089ˆ3560b ∴=≈, 2089ˆ343516960a=-⨯≈, ˆ35169yx ∴=+ (2)当10x =时,ˆ3510169519y=⨯+=, 所以预测该公司10月份销售额为519万元.6.(2021·福建·莆田第二十五中学高三月考)2021年东京奥运会,中国举重选手8人参赛,7金1银,在全世界面前展现了真正的中国力量;举重比赛根据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最大者获胜,在该次举重比赛中,获得金牌的运动员的体重以及举重成绩如下表 (1)根据表中的数据,求出运动员举重成绩y 与运动员的体重x 的回归直线方程(保留1位小数); (2)某金牌运动员抓举成绩为170公斤,挺举成绩为204公斤,则该运动员最有可能是参加的哪个级别的举重?参考数据:()()()992112620,7076i i i i i x x x x y y ==-=--=∑∑;参考公式:()()()121ˆˆˆ,niii nii x x yy bay bx xx ==--==--∑∑. 【答案】(1) 2.7155.4y x =+;(2)83公斤级举重. 【解析】(1)依题意,5459647076839199106789x ++++++++==,2913043373533633894064214303669y ++++++++==,()()()1217076ˆ 2.702620nii i nii xx y y bxx ==--===-∑∑, 则366 2.778155.4a y bx =-=-⨯=, 故回归方程为: 2.7155.4y x =+.(2)该运动员的抓举和挺举的总成绩为374公斤,根据回归方程可知:374 2.7155.4x =+, 解得81x ≈,即该运动员的体重应该在81公斤左右,即参加的应该是83公斤级举重.7.(2021·西藏·拉萨中学高二月考)珠海国际赛车场(简称ZIC)位于珠海经济特区金鼎镇.创建于1996年,是中国国内第一座符合国际汽车联盟一级方程式标准的国际级赛车场.目前该赛事已打造成集赛车竞技运动、汽车文化极致体验、主题休闲度假为一体的超级汽车文化赛事娱乐综合体.为了减少对环境的污染,某环保部门租用了特制环保车清洁现场垃圾.通过查阅近5年参会人数(万人)与所需环保车辆数量(辆),得到如下统计表:(1)根据统计表所给5组数据,求出关于,x y 的线性回归方程ˆˆy bxa =+. (2)已知租用的环保车平均每辆的使用成本费用C (元)与数量(辆)的关系为3000200035,N 2900t t 35,N t t t C t +<<∈⎧=⎨≥∈⎩,主办方根据实际参会人数投入所需环保车,租车每辆支付费用6000元,超出实际需要的车辆,主办方不支付任何费用.预计本次赛车会大约有14万人参加,根据(1)中求出的线性回归方程,预测环保部门在确保清洁任务完成的前提下,应租用多少辆环保车?获得的利润是多少? (注:利润L =主办方支付费用-使用成本费用C ).参考公式:()()()1122211ˆ,ˆˆn niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑ 【答案】(1) 2.32y x =+;(2)为确保完成任务,需要租用35辆环保车,获得的利润108500元. 【解析】(1)11981012105x ++++==2823202529255y ++++== ()()()()()()()()()22222131******** 2.310111091081010101210ˆb ⨯+-⨯-+-⨯-++⨯===-+-+-+-+- ˆˆ2ay bx =-= 关于,x y 的线性回归方程 2.32y x =+ (2)将14x =代入 2.32y x =+得34.2y =为确保完成任务,需要租用35辆环保车, 所以290035101500C =⨯=获得的利润600035101500108500L =⨯-=元8.(2021·江西·新余市第一中学高二月考)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 中至少有一个数小于25”的概率;(2)请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程y bx a =+.(参考公式:回归直线方程为y bx a =+,其中()1221ni ii nii x y nxyb xn x==-=-∑∑,a y bx =-)【答案】(1)710(2)532y x =-【解析】(1)从3月1日至3月5日中任选2天,m ,n 构成的基本事件(m ,n )有:(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个.记“m ,n 至少有一个数小于25”为事件A ,包括:(23,25),(23,30),(23,26),(23,16),(25,16),30,16),(26,16),共有7个基本事件 由古典概型概率公式:7()10P A = (2)11131225302612,27,33x y ++++==== 22221125133012263122751113123122b ⨯+⨯+⨯-⨯⨯==++-⨯. 于是,5271232a =-⨯=-故所求线性回归方程为532y x =- 9.(2021·全国·高二单元测试)某地区2013年至2019年居民纯收入y (单位:千元)的部分数据如表所示:2018和2019年的居民纯收入y (单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5 2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7 (1)求y 关于t 的线性回归方程;(2)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设X 为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量X 的分布列和数学期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121()()()niii nii t t y y b tt ==--=-∑∑,a y bt =-.【答案】(1)ˆ0.5 3.3yt =+;(2)分布列见解析;期望为98. 【解析】(1)根据2018年的抽样数据可得2018年的人均纯收入为1(5.2 4.8 6.5 5.6 6.07.1 6.17.3 5.97.5) 6.210+++++++++= 千元,根据2019年的抽样数据可得2019年的人均纯收入为1(6.27.8 6.6 5.87.1 6.87.27.9 5.97.75) 6.910+++++++++=千元,由所给的数据得1(1234567)47t =++++++=,1(3.9 4.3 4.6 5.4 5.8 6.2 6.9) 5.37y =++++++=, ∴721()941014928i i t t =-=++++++=∑,71()()(3)( 1.4)(2)(1)(1)(0.7)00.110.520.93 1.614ii i tt y y =--=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯=∑,∴71721()()14ˆ0.528()ii i ii tt y y btt ==--===-∑∑, 则ˆˆ 5.30.54 3.3ay bt =-=-⨯=, 则所求y 关于t 的线性回归方程为ˆ0.5 3.3yt =+; (2)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X 的可能取值为0,1,2,3,则35385(0)28C P X C ===,12353815(1)28C C P X C ===,21353815(2)56C C P X C ===,33381(1)56C P X C ===,∴随机变量X 的分布列为则X 的分布列为:则5151519()0123282856568E X =⨯+⨯+⨯+⨯= 【题组三 非线性回归方程】1.(2021·福建·泉州科技中学 )数独是源自18世纪瑞士的一种数学游戏,玩家需要根据99⨯盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(33⨯)内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP 上进行一段时间的训练,每天的解题平均速度y (秒)与训练天数x (天)有关,经统计得到如表的数据:现用by a x=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP 上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为34,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1i t x =)参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-⋅.【答案】(1)1000130y x=+,经过100天训练后,每天解题的平均速度y 约为140秒;(2)243256.【解析】(1)由题意,1(990990450320300240210)5007y =++++++=,令1t x=,设y 关于t 的线性回归方程为y bt a =+,则 717221184570.3750010000.5577i ii i i t y t yb t t==-⨯-⨯-===⋅∑∑,则50010000.37130a =-⨯=. ∴1000130y t =+,又1t x=,∴y 关于x 的回归方程为1000130y x=+, 故100x =时,140y =.∴经过100天训练后,每天解题的平均速度y 约为140秒.(2)设比赛再继续进行X 局小明最终赢得比赛,则最后一局一定是小明获胜, 由题意知,最多再进行4局就有胜负.当2X =时,小明4:1胜,∴339(2)4416P X ==⨯=;当3X =时,小明4:2胜,∴123339(3)144432P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭;当4X =时,小明4:3胜,∴21333327(4)1444256P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭.∴小明最终赢得比赛的概率为99272431632256256++=. 2.(2021·云南大理 )2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.y x =+,模型②:ˆ14.4y =;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7yx a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)模型②拟合精度更高、更可靠,72.93亿;(2)投入17亿元比投入20亿元时收益小. 【解析】(1)对于模型①, 对应的15222740485460=387y ++++++=,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ14.472.93=≈y. (2)当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.3.(2021·全国·高二单元测试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产的产品数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了如下散点图.参考数据:(其中1iu x =) (1)观察散点图判断,by a x=+与y c dx =+哪一个适宜作为非原料成本y 与生产的产品数量x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)试预测生产该产品10千件时,每件产品的非原料成本为多少元? 【答案】(1)b y a x =+;(2)100ˆ11y x=+;(3)21元.【解析】(1)由题意,根据题设中的散点图,可得这些点分布在b y a x =+的两侧,所以选择函数by a x=+作为非原料成本y 与生产的产品数量x 的回归方程类型. (2)令1u x =,则by a x=+可转化为y a bu =+,则y 与u 的关系可看成线性相关关系. 因为360458y ==,所以8182218183.480.344561ˆ1001.5380.1150.618i ii ii u yu y b uu==-⋅-⨯⨯====-⨯-∑∑,则ˆˆ451000.3411a y bu =-=-⨯=,所以ˆ11100y u =+,代入1u x =,得100ˆ11y x=+.(3)当10x =时,100ˆ112110y=+=,所以预测生产该产品10千件时,每件产品的非原料成本为21元. 4.(2021·全国·高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量x (单位:亿元)对年销售额y (单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①2y x αβ=+,②e x t y λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.现该公司对收集的近12年的年研发资金投入量i x 和年销售额i y (1,2,,12i =⋅⋅⋅)的数据作了初步处理,令2u x =,ln v y =,经计算得到如下数据:(1)设u 和y 的样本相关系数为1r ,x 和v 的样本相关系数为2r ,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好;(2)(i)根据(1)的选择及表中数据,建立y 关于x 的非线性经验回归方程;(ii)若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 约为多少亿元? 参考数据为308477=⨯9.4868, 4.4998e 90≈.【答案】(1)模型e x t y λ+=的拟合效果更好;(2)(i)0.018 3.84ˆe x y+=;(ii)36.66亿元. 【解析】(1)()()121215000.8625000iiu u y y r --====∑,()()12214100.91770.211iix x v v r --====≈⨯∑,因为12r r <,所以从样本相关系数的角度判断,模型e x t y λ+=的拟合效果更好. (2)(i)先建立v 关于x 的经验回归方程. 由e x t y λ+=,得ln y x t λ=+,即v λx t =+.()()()121122114ˆ0.018770iii ii x x v v x x λ==--==≈-∑∑, ˆˆ 4.20.01820 3.84tv x λ=-=-⨯=, 所以v 关于x 的经验回归方程为0.01838ˆ.4vx +=, 所以0.0134ˆln 8.8x y=+,即0.018 3.84ˆe x y +=.(ii)若下一年销售额y 需达到90亿元,则由0.018 3.84ˆe x y+=,得0.018 3.8490e x +=, 又 4.4998e 90≈,所以4.49980.018 3.84x ≈+, 所以 4.4998 3.8436.660.018x -≈≈,所以预测下一年的研发资金投入量约为36.66亿元.5.(2021·全国·高二课时练习)噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了解声音强度D (单位:dB )与声音能量I (单位:2W cm -⋅)之间的关系,将测量得到的声音强度D 和声音能量I 的数据作了初步处理,得到如图所示的散点图:参考数据:111.0410I -⨯=,45.7D =,11.5W =-,()1022111.5610i i I I-=-=⨯∑,()10210.51i i W W=-=∑,()()101116.8810iii IID D -=--=⨯∑,()()1015.1i i i W W D D =-⋅-=∑,其中lg i i W I =,101110i i W W ==∑.(1)根据散点图判断,11D a b I =+与22lg D a b I =+哪一个适宜作为声音强度D 关于声音能量I 的回归模型?(给出判断即可,不必说明理由)(2)求声音强度D 关于声音能量I 的非线性经验回归方程.(3)假定当声音强度大于60dB 时,会产生噪声污染.城市中某点P 处共受到两个声源的影响,这两个声源的声音能量分别是a I 和b I ,且101410a bI I +=.已知点P 处的声音能量等于a I 与b I 之和.请根据(2)中的非线性经验回归方程,判断点P 处是否受到噪声污染,并说明理由.【答案】(1)22lg D a b I =+更适合;(2)ˆ10lg 160.7DI =+;(3)P 会受到噪声污染,理由见解析. 【解析】(1)22lg D a b I =+更适合. (2)设ˆˆD bW a =+,则 ∵()()()10110215.1ˆ100.51iii i i W W D D bW W==--===-∑∑, ∴ˆˆ160.7a D bW=-=, ∴D 关于W 的经验回归方程是ˆ10160.7DW =+,则D 关于I 的非线性经验回归方程是ˆ10lg 160.7DI =+. (3)设点P 处的声音能量为1I ,则1a b I I I =+. ∵101410a bI I +=, ∴()101010141410105910b a a b a b a b a b I I I I I I I I I I I ---=+=++=++≥⎛⎫⎛⎫ ⎪⎝⨯ ⎪⎝⎭⎭(当且仅当10310a I =,93510bI =⨯时等号成立) 根据(2)中非线性经验回归方程,知点P 处的声音强度D 的预报值的最小值,()10min 10lg 910160.710lg960.760D -=⨯+=+>,∴点P 会受到噪声污染.6.(2021·福建·福州三中高二期中)某地从2月20日开始的连续7天的某传染病累计确诊人数如下表:由上述表格得到如下散点图.(1)根据散点图判断lg =+y a b x 与x y c d =⋅(,c d 均为大于0的常数)哪一个更适合作为累计确诊人数y 与天数x 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)3月20日,该地的疾控中心接受了1000份血液样本,假设每份样本的检验结果是阳性还是阴性是相互独立的,且每份样本是阳性的概率是0.6,试剂把阳性样本检测出阳性结果的概率是0.99(试剂存在阳性样本检测不出来的情况,但不会把阴性样本检测呈阳性样本),求这1000份样本中检测出呈阳性的份数的期望.参考数据:其中11lg ,7i i i i v y v v ===∑参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线ˆvu αβ=+的斜率和截距的最小二乘估计公式分别为1221,ni i i ni i u v nuvv u unuβαβ==-==--∑∑,v u αβ=-.【答案】(1)0.253.4710x x y c d y =⋅=⨯; (2)594【解析】(1)由散点图可知,x y c d =⋅更适合作为累计确诊人数y 与天数x 的回归方程类型. 把x y c d =⋅两边取对数,得lg lg lg y c x d =+, 令lg v y =,则lg lg v c x d =+,1(1234567)47x =++++++=,7211.54140i i v x ===∑,, 7172221750.1274 1.54lg 0.25140747i i i i i x v xvd x x==--⨯⨯===-⨯-∑∑,所以lg 1.540.2540.54c =-⨯=,则0.540.25v x =+, 所以y 关于x 的回归方程为0.253.4710x y =⨯; (2)设这1000份样本中检测出呈阳性的份数为X , 每份样本检测出阳性的概率为0.60.990.594P =⨯=, 由题意可知,(10000.594)XB ,,所以()10000.594594E X =⨯=份.故这1000份样本中检测出呈阳性的份数的期望为594.7.(2021·山西太原·高二期中(文))为了更好的指导青少年健康饮食,某机构调查了本地区不同身高的未成年男性,得到他们的体重的平均值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.表中ln i i w y =(1)根据散点图判断,可采用x y a b =⋅作为这个地区未成年男性体重y 千克与身高x 厘米的回归方程.利用表中数据建立y 关于x 的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么该地区一名身高为175厘米,体重为78千克的在校男生的体重是否正常? 参考数据:0.020.71751.02,2,1.0231.99e e ===. 参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆˆˆ,nii i nii uu v v v u uu βαβ==--==--∑∑.【答案】(1)2 1.02x y =⨯;(2)体重偏胖. 【解析】(1)由x y a b =⋅,得ln ln ln y a x b =+⋅, 设ˆˆˆw cx d=+,由表格中数据,得801ˆ0.02400050c ===, ˆ 3.40.021350.7d=-⨯=, 则0.70.02ln 0.7,ln 0.02,2, 1.02a b a e b e ======, 则y 关于x 的回归方程为2 1.02x y =⨯.(2)当175x =时,1752 1.02231.9963.98y =⨯=⨯=,因为63.98 1.276.77678⨯=<,所以该名在校男生的体重偏胖.。
人教A版高中数学选择性必修第三册8-2一元线性回归模型及其应用课件
n
验回归方程无关,残差平方和 (yi-^yi)2 与经验回归方程有关.因此 R2 越大,
i=1
表示残差平方和 越小,即模型的拟合效果 越好;R2 越小,表示残差平方和越大, 即模型的拟合效果 越差 ,R2 越接近 1,拟合效果越好.
(二)基本知能小试
1.判断正误
(1)在一元线性回归模型中,e 是 bx+a 预报真实值 y 的随机误差,它是一
[方法技巧]
解决非线性经验回归问题的方法及步骤
[对点练清]
x 6 8 10 12 y23 5 6 (1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的经验回归方程 ^y
=^bx+^a; (3)试根据求出的经验回归方程,预测记忆力为 7 的同学的判断力.
[解] (1)作出散点图如图所示.
(2) x =6+8+410+12=9, y =2+3+4 5+6=4,
yi-^yi2
i=1
所以 R21=1-
5
=1-1105050=0.845.
yi- y 2
i=1
由(2)得 yi-^yi 与 yi- y 的关系如表所示.
yi-^y i
-1
-5
8
yi- y
-20
-10
10
-9
-3
0
20
5
所以 (yi-^yi)2=(-1)2+(-5)2+82+(-9)2+(-3)2=180.
n
u2i -n u 2
i=1
[解] (1)^y=cxd.
(2)根据散点图,呈现非线性的变化趋势,故^y=cxd 更适合作为 y 关于 x 的经验回归方程类型.
对^y=cxd 两边取对数,得 ln y=ln c+dln x,即 z=ln c+dt, 由表中数据得 z = t =1.5,
2022年秋高中数学第八章成对数据的统计分析8.2一元线性回归模型及其应用8.2.2一元线性回归模型
5 , 则 b^ =
i=1
i=1
5
uiyi-5 u y
i=1
≈4.13,a^= y -b^ u ≈0.8.
5
u2i -5 u 2
i=1
从而得到 y 关于 u 的经验回归方程为^y=4.13u+0.8,则 y 关于 x 的回 归方程为^y=4.x13+0.8.
| 素养达成 |
1.检验回归模型的拟合效果一般有三种方法: (1)残差分析:通过残差分析发现原始数据中的可疑数据,判断所建 立模型的拟合效果.其步骤是:计算残差、画残差图、在残差图中分析 残差特性.
5
yi-^yi2
i=1
R2=1-
≈0.994,
5
yi- y 2
i=1
所以回归模型的拟合效果很好.
题型2 非线性回归
下表为收集到的一组数据:
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
(1)作出 x 与 y 的散点图,并猜测 x 与 y 之间的关系;
(2)建立 x 与 y 的关系,预报回归模型并计算残差; (3)利用所得模型,预报 x=40 时 y 的值.
n
(2)残差平方法: (yi- y i)2 表示残差平方和,残差平方和越小,模
i=1
型的拟合效果越好;残差平方和越大,模型的拟合效果越差.
n
yi-^yi2
i=1
(3)R2 法:通过公式 R2=1-
计算 R2,R2 越大,模型的拟
n
yi- y 2
i=1
合效果越好;R2 越小,模型的拟合效果越差. 2.常见误区:不判断变量间是否具有线性相关关系,盲目求解经验
8.2+一元线性回归模型及其应用(第2课时)
年宣传费 x 的经验回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的经验回归方程; (3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x,根据(2)的结果回 答问题:
①年宣传费 x=49 时,年销售量及年利润的预报值是多少? ②年宣传费为多少时,年利润的预报值最大?
残差图.根据收集到的数据,计算得到如下值:
-x
-z
25
2.89
∑8
i=1
(zi--z )(xi--x )
48.48
-t
∑8
i=1
(xi--x )2
∑8
i=1
(ti--t )2
646
168
422 688
∑8
i=1
(yi--y )(ti--t )
70 308
其中 z=ln y,t=x2.
(1)根据残差图判断应选择哪个模型,并说明理由;
-x
-y
-w
∑
i=1
(xi--x )2
∑8
i=1
(wi--w )2
46.6
563
6.8
∑8
i=1
(xi--x )(yi--y )
1.469
表中 wi= xi,-w =18∑ i=81wi.
289.8
1.6
∑8
i=1
(wi--w )(yi--y )
108.8
(1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适宜作为年销售量 y 关于
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线v^=α^ +β^
n
∑
u 的斜率和截距的最小二乘估计分别为β^ =i=1
人教版数学选择性必修三8.2一元线性回归模型及其应用课件
(2)用公式计算,
ො 的值时,要先计算
)
[例1] 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x
6
8
10
12
y
2
3
5
6
(1)请画出上表数据的散点图;
样本点分布在一条直线附近,
y与x具有线性相关关系.
[例1] 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x
6
8
10
12
y
2
3
5
6
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 ො = x+
总结提升
求线性回归方程的一般步骤
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出).
(2)作出散点图,确定x,y具有线性相关关系.
(3)把数据制成表格xi,yi,2 ,xiyi.
n
n
(4)计算,
ҧ ,
ത xi ,
xi yi .
n
xi yi nx y
5
i
i
x
i 1
2
i
5x
2
1380 5 5 50
6.5
2
145 5 5
ො = ത − =
ҧ 50-6.5×5=17.5
于是所求的回归直线方程是=6.5x+17.5
ො
题型二
利用回归直线方程对总体进行估计
[例2] 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,
每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为
8.2 一元线性回归模型及其应用(精讲)(解析版)
8.2 一元线性回归模型及其应用(精讲)考点一 样本中心解小题【例1】(2021·江西赣州市)某产品在某零售摊位上的零售价x (元)与每天的销售量y (个)统计如下表:据上表可得回归直线方程为 6.4151y x =-+,则上表中的m 的值为( ) A .38B .39C .40D .41【答案】D 【解析】由题意1617181917.54x +++==,50343111544m my ++++==,所以115 6.417.51514m+=-⨯+,解得41m =.故选:D . 【一隅三反】1.(2021·江西景德镇市·景德镇一中)随机变量x 与y 的数据如表中所列,其中缺少了一个数值,已知y关于x 的线性回归方程为ˆ0.93yx =+,则缺少的数值为( )A .6B .6.6C .7.5D .8【答案】A【解析】设缺少的数值为m ,由于回归方程为ˆ0.93yx =+过样本中心点(),x y , 且2345645x ++++==,代入0.943 6.6y =⨯+=,所以5679 6.65my ++++==,解得6m =.故选:A.2.(2021·河南信阳市)根据如下样本数据:得到的回归方程为y bx a =+,则( ) A .0a >,0b > B .0a >,ˆ0b < C .0a <,0b > D .0a <,ˆ0b< 【答案】B【解析】由图表中的数据可得,变量y 随着x 的增大而减小,则ˆ0b<, 2345645x ++++==,4 2.50.5230.25y +---==,又回归方程y bx a =+经过点(4,0.2),可得0a >,故选:B .3.(2021·安徽六安市·六安一中)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y (单位:C )存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y 关于x 的线性回归方程0.25y x k =+.则当蟋蟀每分钟鸣叫62次时,该地当时的气温预报值为( ) A .33C B .34CC .35CD .35.5C【答案】D【解析】由表格中的数据可得2030405060405x ++++==,2527.52932.536305y ++++==,由于回归直线过样本中心点(),x y ,可得300.2540k =⨯+,解得20k =.所以,回归直线方程为0.2520y x =+.在回归直线方程中,令62x =,可得0.25622035.5y =⨯+=.故选:D.考点二一元线性方程【例2】(2021·兴义市第二高级中学)在2010年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示: 通过分析,发现销售量y 对商品的价格x 具有线性相关关系,求 (1)销售量y 对商品的价格x 的回归直线方程; (2)若使销售量为12,则价格应定为多少.附:在回归直线ˆˆy bxa =+中1221ˆni ii nii x y nxyb xnx ==-=-∑∑,ˆˆay bx =- 【答案】(1) 3.240y x =-+ (2) 8.75 【解析】(1)由题意知10x =,8y =,∴999580635551083.28190.25100110.25121ˆ5100b++++-⨯⨯==-++++-⨯,8(3.2)1040a =--⨯=,∴线性回归方程是 3.240y x =-+;(2)令 3.24012y x =-+=,可得8.75x =,∴预测销售量为12件时的售价是8.75元.【一隅三反】1.(2020·河南开封市)配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一个马拉松跑者的心率y (单位:次/分钟)和配速x (单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,求y 与x 的线性回归方程;(2)该跑者如果参加本次比赛,将心率控制在160左右跑完全程,估计他跑完全程花费的时间,并估计他能获得的名次.参考公式:线性回归方程ˆˆˆybx a =+中,12()()ˆ()nii i nixx y y b xx =--=-∑∑,ˆˆay bx =- 参考数据:135y =.【答案】(1)25285x y ∧=-+;(2)210分钟,192名. 【解析】(1)由散点图中数据和参考数据得 4.55677.565x ++++==,1001091301651711355y ++++==,()()()51522222211.536(1)300(5)1(26) 1.5(35)25( 1.5)(1)01 1.5ˆiii i i x x y y bx x ==---⨯+-⨯+⨯-+⨯-+⨯-===--+-+++-∑∑,135(25)62ˆ85ˆay bx =-=--⨯=, 所以y 与x 的线性回归方程为25285x y ∧=-+. (2)将160y =代入回归方程得5x =,所以该跑者跑完马拉松全程所花的时间为425210⨯=分钟. 从马拉松比赛的频率分布直方图可知成绩好于210分钟的累积频率为()0.0008500.00242102000.064⨯+⨯-=,有6.4%的跑者成绩超过该跑者,则该跑者在本次比赛获得的名次大约是0.0643000192⨯=名.2.(2020·云南红河哈尼族彝族自治州)随着电商事业的快速发展,网络购物交易额也快速提升,特别是每年的“双十一”,天猫的交易额数目惊人.2020年天猫公司的工作人员为了迎接天猫“双十一”年度购物狂欢节,加班加点做了大量准备活动,截止2020年11月11日24时,2020年的天猫“双十一”交易额定格在3700多亿元,天猫总公司所有员工对于新的战绩皆大欢喜,同时又对2021年充满了憧憬,因此公司工作人员反思从2014年至2020年每年“双十一”总交易额(取近似值),进行分析统计如下表:(1)通过分析,发现可用线性回归模型拟合总交易额y 与年份代码t 的关系,请用相关系数加以说明; (2)利用最小二乘法建立y 关于t 的回归方程(系数精确到0.1),预测2021年天猫“双十一”的总交易额. 参考数据:71()()138.5ii i tt y y =--=∑26.7= 2.646≈;参考公式:相关系数()()niit t y y r --=∑;回归方程y bt a ∧∧∧=+中,斜率和截距的最小二乘估计公式分别为:()()()711722211niii ii i niii i tty y t y nx yb tttnx∧====---==--∑∑∑∑,=a y bt ∧∧-.【答案】(1)答案见解析;(2)回归方程为ˆ 4.9 1.2yt =-,预测2021年天猫“双十一”的总交易额约为38百亿.【解析】(1)4t =,721()28ii tt =-=∑,17()()138.5i ii t t yy =--=∑26.7=所以()()138.50.982 2.64626.7niit t y y r --=≈≈⨯⨯∑因为总交易额y 与年份代码t 的相关系数近似为0.98, 说明总交易额y 与年份代码t 的线性相关性很强,从而可用线性回归模型拟合总交易额y 与年份代码t 的关系. (2)因为18.4y =,721()28ii tt =-=∑,所以()()71271()138.5ˆ 4.928i ii i i t t yy bt t ==--==≈-∑∑, ˆˆay b =-,18.4 4.94 1.2b ≈-⨯=- 所以y 关于t 的回归方程为ˆ 4.9 1.2yt =- 又将2021年对应的8t =代入回归方程得:ˆ 4.98 1.238y=⨯-=. 所以预测2021年天猫“双十一”的总交易额约为38百亿.3.(2021·湖北省武昌实验中学高二期末)根据统计,某蔬菜基地西红柿亩产量的增加量y (百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若0.75r>,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式()()n ni i i ix x y y x y nx y r---==∑∑0.55≈0.95≈.回归方程y bx a=+中斜率和截距的最小二乘估计公式分别为()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y xb=-.【答案】(1)0.95;答案见解析;(2)0.3 2.5y x=+;610千克.【解析】(1)由已知数据可得2456855x++++==,3444545y++++==,所以()()()()()5131100010316i iix x y y=--=-⨯-+-⨯+⨯+⨯+⨯=∑,====所以相关系数()()50.95iix x y y r --===≈∑.因为0.75r >,所以可用线性回归模型拟合y 与x 的关系.(2)()()()5152160.320iii ii x x y y b x x ==--===-∑∑,450.3 2.5a =-⨯=, 所以回归方程为0.3 2.5y x =+. 当12x =时,0.312 2.5 6.1y =⨯+=,即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为610千克.考点三 非一元线性方程【例3】(2020·全国高二课时练习)在一次抽样调查中测得5个样本点,得到下表及散点图.(1)根据散点图判断y a bx =+与1y c k x -=+⋅哪一个适宜作为y 关于x 的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立y 与x 的回归方程;(计算结果保留整数) (3)在(2)的条件下,设=+z y x 且[)4,x ∈+∞,试求z 的最小值.参考公式:回归方程ˆˆˆybx a =+中,()()()1122211ˆn niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)1y c k x -=+⋅;(2)41y x=+;(3)6. 【解析】(1)由题中散点图可以判断,1y c k x -=+⋅适宜作为y 关于x 的回归方程; (2)令1t x -=,则y c kt =+,原数据变为由表可知y 与t 近似具有线性相关关系,计算得4210.50.251.555t ++++==,16125217.25y ++++==,222222416212150.520.2515 1.557.238.4544210.50.255 1.559.3k ⨯+⨯+⨯+⨯+⨯-⨯⨯==≈++++-⨯,所以,7.24 1.551c y kt =-=-⨯=,则41y t =+. 所以y 关于x 的回归方程是41y x=+. (3)由(2)得41z y x x x=+=++,[)4,x ∈+∞, 任取1x 、24x ≥,且12x x >,即124x x >≥,可得()()()21121212121212124444411x x z z x x x x x x x x x x x x -⎛⎫⎛⎫⎛⎫-=++-++=-+-=-+ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭()()1212124x x x x x x --=,因为124x x >≥,则120x x ->,1216>x x ,所以,12z z >,所以,函数41z x x =++在区间[)4,+∞上单调递增,则min 44164z =++=. 【一隅三反】1.(2020·江苏省如皋中学高二月考)某种新产品投放市场一段时间后,经过调研获得了时间x (天数)与销售单价y (元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).表中10111,10i i i i w w w x ===∑.(1)根据散点图判断y a bx =+,与dy c x=+哪一个更适合作价格y 关于时间x 的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y 关于x 的回归方程. (3)若该产品的日销售量()g x (件)与时间x 的函数关系为()()100120g x x N x-=+∈,求该产品投放市场第几天的销售额最高?最高为多少元?附:对于一组数据()()()()112233,,,,,,...,,n n u v u v u v u v ,其回归直线vu αβ=+的斜率和截距的最小二乘法估计分别为121()(),()nii i nii vv u u v u u u βαβ==--==--∑∑.【答案】(1)dy c x =+更适合作价格y 关于时间x 的回归方程;(2)120(1)y x=+;(3)第10天,最高销售额为2420元;【解析】(1)根据散点图知dy c x=+更适合作价格y 关于时间x 的回归方程类型; (2)令1w x=,则y c dw =+, 而1011021()()18.4200.92()iii ii w w yy d w w ==--===-∑∑, 37.8200.8920c y dw =-=-⨯=,即有120(1)y x=+;(3)由题意结合(2)知:日销售额为1100()()20(1)(120)f x y g x x x=⋅=+-, ∴2110015()20(1)(120)400(6)f x x x x x=+-=+-, 若1t x =,令221121()655()1020h t t t t =+-=--+, ∴110t =时,max 1121()()1020h t h ==,即10x =天,max 121()(10)400242020f x f ==⨯=元, 所以该产品投放市场第10天的销售额最高,最高销售额为2420元.2.(2021·江苏苏州市)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x t y e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10i i v y i ==⋅⋅⋅,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据(1)的选择及表中数据,建立y 关于x 的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额y 为250亿元,请预测2021年的研发资金投入额x 为多少亿元?(结果精确到0.01)附:①相关系数()()niix x y y r --=∑,回归直线ˆˆˆya bx =+中:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =- ②参考数据:ln 20.693≈,ln5 1.609≈. 【答案】(1)模型x ty eλ+=的拟合程度更好;(2)(ⅰ)0.180.56ˆx ye +=;(ⅱ)27.56.【解析】(1)设{}i u 和{}i y 的相关系数为1r ,{}i x 和{}i v 的相关系数为2r ,由题意,()()101130.8715iiu u y y r --===≈∑,()()102120.9213iix x v v r --===≈∑,则12r r <,因此从相关系数的角度,模型x ty e λ+=的拟合程度更好.(2)(ⅰ)先建立v 关于x 的线性回归方程,由x ty eλ+=,得ln y t x λ=+,即v t x λ=+,()()()101102112ˆ65iii ii x x v v x x λ==--==-∑∑, 12ˆˆ 5.36260.5665tv x λ=-=-⨯=, 所以v 关于x 的线性回归方程为ˆ0.180.56vx =+, 所以ˆln 0.180.56yx =+,则0.180.56ˆx y e +=.(ⅱ)2021年盈利额250y =(亿元), 所以0.180.56250x e +=,则0.180.56ln 250x +=, 因为ln 2503ln5ln 23 1.6090.693 5.52=+≈⨯+=, 所以 5.520.5627.560.18x -≈≈.所以2021年的研发资金投入量约为27.56亿元.。
高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精讲)(含答案)
8.2 一元线性回归模型及其应用(精讲)考点一样本中心求参数【例1-1】(2021·全国·高二课时练习)若两个变量x,y是线性相关的,且样本()(),1,2,,i ix y i n=的中心点为()3,2.5,则由这组样本数据算得的回归直线方程不可能是( )A.ˆ0.51y x=+B.ˆ0.60.7y x=+C.ˆ0.2 1.9y x=+D.ˆ 1.5y x=-【答案】D【解析】因为0.531 2.5⨯+=,即点()3,2.5在回归直线ˆ0.51y x=+上,所以A有可能;因为0.630.7 2.5⨯+=,即点()3,2.5在回归直线ˆ0.60.7y x=+上,所以B有可能;因为0.23 1.9 2.5⨯+=,即点()3,2.5在回归直线ˆ0.2 1.9y x=+上,所以C有可能;因为3 1.5 1.5 2.5-=≠,即点()3,2.5不在回归直线ˆ 1.5y x=-上,所以D没有可能.故选:D.【例1-2】(2021·广西河池)根据下表中数据求得的线性回归方程是4y x a=-+,则=a( )A .98B .107C .110D .106【答案】D【解析】由已知得,139(456789)66x =+++++=,1(908483807568)806y =+++++=, ∴398046a =-⨯+,即106a =.故选:D 【一隅三反】1.(2021·河北·藁城新冀明中学高二月考)实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .ˆ1yx =+ B .ˆ2y x =+ C .ˆ21y x =+ D .ˆ1y x =- 【答案】A【解析】由已知可得11(1234) 2.5,(2345) 3.544x y =⨯+++==⨯+++=, 所以这组数据的样本中心点为(2.5,3.5), 因为样本中心必在回归直线上,所以把样本中心点代入四个选项中验证,可得只有1y x =+成立, 故选:A.2.(2021·陕西·西北工业大学附属中学 )为了研究某班学生的听力成绩x (单位:分)与笔试成绩y (单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x 与y 之间有线性关系,设其回归直线为y bx a =+,已知201400i i x ==∑,2011580i i y ==∑,1a =-,若该班某学生的听力成绩为26,据此估计其笔试成绩约为( )A .99B .101C .103D .105【答案】C【解析】201400i i x ==∑,故4002020x ==;2011580i i y ==∑,故15807920y ==, 故点()20,79在回归直线上,即79201b =-,得4b =, 即41y x =-,当26x =时,代入计算得到103y =. 故选:C.3.(2021·广东肇庆 )某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间x (单位:小时)与工资y (单位:元)之间的关系如下表:若y 与x 的线性回归方程为ˆ 6.5yx a =+,预测当工作时间为9小时时,工资大约为( ) A .75元 B .76元C .77元D .78元【答案】B【解析】由表格数据知:2456855x ++++==,3040506070505y ++++==,6.55032.517.5a y x ∴=-=-=,∴线性回归方程为ˆ 6.517.5yx =+, 6.5917.576∴⨯+=,即当工作时间为9小时时,工资大约为76元.故选:B.4.(2021·全国·高三专题练习)为了研究某种细菌在特定环境下随时间变化的繁殖情况,得到的实验数据如下表,并由此计算得到回归直线方程ˆ0.850.25yx =-,后来工作人员不慎将下表中的实验数据c 丢失.则上表中丢失的实验数据c 的值为( ) A .1 B .1.5 C .2 D .2.5【答案】D【解析】由表中数据可得3456755x ++++==,34 4.5617.555c c y +++++==,将点17.5(5,)5c +代入ˆ0.850.25yx =-中,得17.50.8550.255c +=⨯-,解得 2.5c =, 所以丢失的实验数据c 的值为2.5.故选:D考点二 线性回归方程【例2】(2021·江西赣州)某特色餐馆开通了美团外卖服务,在一周内的某特色菜外卖份数x (份)与收入y (元)之间有如下的对应数据:(1)画出散点图;(2)请根据以上数据用最小二乘法原理求出收入y 关于份数x 的线性回归方程; (3)据此估计外卖份数为12份时,收入为多少元.注:①参考方式:线性回归方程系数公式1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-;②参考数据:521145ii x ==∑,52113500ii y ==∑,511380i i i x y ==∑.【答案】(1)图象见解析(2) 6.517.5y x =+(3)95.5 【解析】(1)解:作出散点图如下图所示:(2)解:2456855x ++++==,3040605070505y ++++==,已知521145i i x ==∑,511380i i i x y ==∑,则1222551513805550ˆ 6.5145555i iiii x y x ybx x==--⨯⨯===-⨯-∑∑,50 6.5517.5a y bx =-=-⨯=, 因此,线性回归方程为 6.517.5y x =+. (3)解:12x =时,12 6.517.595.5y =⨯+=, 即外卖份数为12份时,收入大约为95.5元. 【一隅三反】1.(2021·贵州·凯里一中 )凯里市2017至2021年农村居民家庭纯收入y (单位:千元)的数据如下表:从表出看出,人均纯收入y 与年份代号t 线性相关,已知516470.i i i t y ==∑.(1)求y 关于t 的线性回归方程y bt a =+;(2)预测2025年的人均纯收入为多少.(附:参考公式:1122211()()()nnii i ii i nniii i tt y y t y nt yb tt tnt====---==--∑∑∑∑,a y bt =-).【答案】(1)0.47 2.59y t =+(2)6.82【解析】(1)由题中表格知,5n =,1(12345)35t =++++=,1(3.1 3.5 3.9 4.6 4.9)45y =++++=,522222211234555i i t==++++=∑,则5152221564.75340.4755535i ii i i t y t yb t t==--⨯⨯===-⨯-∑∑,40.473 2.59a y bt =-=-⨯=,故回归直线方程为0.47 2.59y t =+.(2)当年份为2025年时,对应的年份代码9t =, 所以0.479 2.59 6.82y =⨯+=, 故2025年的人均纯收入约为6.82千元.2.(2021·福建宁德)近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,我市一家新能源企业近5个月的产值如下表:(1)根据上表数据,计算y 与x 的线性相关系数r ,并说明y 与x 的线性相关性强弱;(0.75||1r ≤≤,则认为y 与x 线性相关性很强;0.75r <,则认为y 与x 线性相关性不强) (2)求出y 关于x 的线性回归方程,并预测10月该企业的产值.参考公式:1221,nni ii ii nii x ynx yx ynx y r b a y bx xnx==--===--∑∑∑;参考数据:55522111442,55,52.3i i ii i i i x y x y ======≈∑∑∑.【答案】(1)0.993r =;相关系数较强;(2) 5.210.4y x =+;10月该企业的产值约为41.6亿元 【解析】(1)1234535x ++++==,16+20+27+30+37=265y =,0.993ni ix ynx yr -==≈∑,因为[]0.75,1r ∈,所以y 与x 线性相关性较强. (2)设线性回归方程为:y bx a =+;122144253265.25559ni ii n i i x ynx yb x nx==--⨯⨯===-⨯-∑∑,26 5.2310.4a y bx =-=-⨯=,即 5.210.4y x =+, 10月份对应的代码为6, 5.2610.441.6y =⨯+=,10月该企业的产值约为41.6亿元.3(2021·河南·高二月考 )有时候一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同品牌的一些食品所含热量的百分比记为()1,2,3,,10i x i =⋅⋅⋅和一些美食家以百分制给出的对此种食品口味的评价分数记为()123,,10i y i =⋅⋅⋅,,:参考数据:1220i i x ==∑,1720i i y ==∑,()21272i i x x=-=∑,()()1429i ii x xy y =--=∑参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-(1)已知这些品牌食品的所含热量的百分比i x 与美食家以百分制给出的对此种食品口味的评价分数i y 具有相关关系.试求出回归方程(最后结果精确到0.1);(2)某人只能接受食品所含热量的百分比为20及以下的食品.现在他想从这些食品中随机选取两种购买,求他所选取的两种食品至少有一种是美食家以百分制给出的对此种食品口味的评价分数为75分以上的概率.【答案】(1) 1.637.3y x =+(2)35【解析】(1)解:设所求的回归方程为y bx a =+,由()()()10110214291.6272iii i i x x y y b x x==--==≈-∑∑, 10112210i i x x ==⨯=∑,10117210i i y y ==⨯=∑, 429722237.3272a y bx ∴=-=-⨯≈, ∴所求的回归方程为: 1.637.3y x =+.(2)解:由表可知某人只能接受的食品共有6种,其中美食家以百分制给出的对此种食品口味的评价为75分以上的有2种可记为a ,b ,另外4种记为1,2,3,4.任选两种分别为:(),a b ,(),1a ,(),2a ,(),3a ,(),4a ,(),1b ,(),2b ,(),3b ,(),4b ,()1,2,()1,3,()1,4,()2,3,()2,4,()3,4,共15个基本事件.记“所选取的两种食品至少有一种是美食家以百分制给出的对此食品口味的评价分数为75分以上”为事件A ,则事件A 包含(),a b ,(),1a ,(),2a ,(),3a ,(),1b ,(),2b ,(),3b ,(),4b ,共9个基本事件, 故事件A 发生的概率为()93155P A ==. 4.(2021·陕西·西安中学 )某连锁经营公司所属5个零售店某月的销售额和利润额资料如表.(1)画出销售额和利润额的散点图;(2)若销售额和利润额具有相关关系,用最小二乘法计算利润额y 对销售额x 的回归直线方程.(参考公式1221ni ii nii x y n x yb xn x ==-⋅⋅=-⋅∑∑,ˆˆay bx =-) (3)若该公司计划再开一个店想达到预期利润为8百万,请预估销售额需要达到多少.【答案】(1)答案见解析(2)ˆy=0.5x +0.4(3)8百万 【解析】(1)(2)由表中的数据可得,()13567965x =⨯++++=,()123345 3.45y =⨯++++=,515221511256 3.40.520056ˆ65i ii ii x y x ybxx ==-⋅⋅-⨯⨯===-⨯⨯-⋅∑∑,∵回归直线方程恒过样本中心,∴ˆ 3.40.560.4a=-⨯=, 故利润额y 对销售额x 的回归直线方程为ˆy =0.5x +0.4. (3)∵该公司计划再开一个店想达到预期利润为8百万,即0.8千万, ∴0.8=0.5x +0.4,解得x =0.8, 故预计销售额需要达到8百万.考点三 非线性回归方程【例3】(2021·黑龙江·哈尔滨市第六中学校高二期中)某公司在市场调查中,发现某产品的单位定价x (单位:万元)对月销售量y (单位:吨)有影响对不同定价i x 和月销售量i y (1,2,8)i =数据作了初步处理,表中1z x =.经过分析发现可以用by a x=+来拟合y 与x 的关系. (1)求ˆy关于x 的回归方程; (2)若生产1吨产品的成本为0.9万元,那么预计单位定价为多少时,该产品的月利润取最大值,求此时的月利润.附:对于一组数据11(),v ω,22(,)v ω,,(,)n n v ω,其回归直线ˆˆˆvαβω=+的斜率和截距的最小二乘法估计分别为:1122211()()ˆ()nniii i i i nniii i v v v n vn ωωωωβωωωω====---==--∑∑∑∑,ˆˆv αβω=- 【答案】(1)^52y x=-+(2)单位定价为1.5万元时,月利润最大,最大值为0.8万元.【解析】(1)令1z x=,则y a b z =+⋅,则8^1822123956894358208988i ii i i z y z yb z z==-⨯⨯===-⨯--∑∑,^^2a y b z =-⋅=-,∴^52y x=-+. (2)设月利润为W ,则由已知()59934340.92260.810255W y x x x x x ⎛⎫⎛⎫=-=-+-=--+≤-+= ⎪⎪⎝⎭⎝⎭, 当且仅当922x x-=-即 1.5x =时取等号所以单位定价为1.5万元时,月利润最大,最大值为0.8万元. 【一隅三反】1.(2021·重庆市实验中学)某电器企业统计了近10年的年利润额y (千万元)与投入的年广告费用x (十万元)的相关数据,散点图如图,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关数据如表所示:(1)从①y bx a =+;②()0,0ky m x m k =⋅>>;③2y cx dx e =++三个函数中选择一个作为年广告费用x 和年利润额y 的回归类型,判断哪个类型符合,不必说明理由; (2)根据(1)中选择的回归类型,求出y 与x 的回归方程;(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元) 参考数据:3103.67883.678849.787e≈≈, 参考公式:回归方程ˆˆˆv bu a =+中斜率和截距的最小二乘估计公式分别为1221ˆni i i ni i u v nxybunu==-=-∑∑【答案】(1)选择回归类型k y m x =⋅更好;(2)13y ex =;(3)下一年应至少投入498万元广告费用. 【解析】(1)由散点图知,年广告费用x 和年利润额y 的回归类型并不是直线型的,而是曲线型的, 所以选择回归类型k y m x =⋅更好.(1)对k y m x =⋅两边取对数,得:ln ln ln y k x m =+,即ln v ku m =+,由表中数据得:101102211030.510 1.5 1.51ˆ46.510 1.5 1.5310i i i ii u v uvkuu ==--⨯⨯===-⨯⨯-∑∑,1ˆln 1.5 1.513m v ku ∴=-=-⨯=,m e ∴=, ∴年广告费用x 和年利润额y 的回归方程为13y ex =.(3)由(2)知:13y e x =⋅, 令1310y e x =⋅>得:1310x e>,解得:13 3.6788x >, 33.678849.787x ∴>≈,49.8x ∴≈(十万元),49.8十万元498=万元∴下一年应至少投入498万元广告费用.2.(2021·全国·高二课时练习)某地区不同身高的未成年男性的平均体重如下表,并由表中数据作出如图所示的散点图.(1)根据散点图,判断y a bx =+与x y a b =⋅哪一个能比较近似地反映这个地区未成年男性平均体重y 与身高x 的关系?(给出判断即可,不必说明理由)(2)令ln u y =,根据(1)的判断结果及下表数据,建立y 关于x 的非线性经验回归方程(参考数据:0.66e 1.93≈,0.02e 1.02≈).【答案】(1)x y a b =⋅;(2)ˆ 1.93 1.02x y=⨯. 【解析】(1)根据散点图,知x y a b =⋅能比较近似地反映这个地区未成年男性平均体重y 与身高x 的高度. (2)由ln u y =和x y a b =⋅,得12u c x c =+(1ln c b =,2ln c a =),()()()12111221282ˆ0.0214300iii ii xx uucx x ==--==≈-∑∑,又 2.96u =, 所以21ˆˆ 2.960.021150.66cu c x =-=-⨯=,ˆ0.020.66u x =+, 所以0.020.660.660.02ˆe e e 1.93 1.02x x x y+==⨯=⨯, 所以y 关于x 的非线性经验回归方程为ˆ 1.93 1.02x y=⨯. 3.(2021·黑龙江肇州 )如图是某小区2020年1月至2021年1月当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2020年1月~2021年1月).根据散点图选择y a =+ln y c d x =+两个模型进行拟合,经过数据处理得到两个回归方程分别为0.9369y =+0.95540.0306ln y x =+,并得到以下一些统计量的值:(1)请利用相关指数2R 判断哪个模型的拟合效果更好;(2)估计该小区2021年6月份的二手房均价.(精确到0.001万元/平方米)参考数据:ln 20.69≈,ln3 1.10≈,ln17 2.83≈,ln192.94≈ 1.41≈ 1.73≈ 4.12≈ 4.36≈.参考公式:相关指数()()221211niii nii y y R y y==-=--∑∑.【答案】(1)模型0.95540.0306ln y x =+;(2)1.044(万元/平方米).【解析】(1)设模型0.9369y =+0.95540.0306ln y x =+的相关指数分别为21R 和22R ,则210.00059110.00605R =-,220.00016410.00605R =-.因为0.0005910.000164>,所以2212R R <.所以模型0.95540.0306ln y x =+的拟合效果更好.(2)由(1)知,模型0.95540.0306ln y x =+的拟合效果更好,利用该模型预测可得,这个小区2021年6月份的在售二手房均价为:0.95540.0306ln18y =+()0.95540.0306ln 22ln3=++ 1.044≈(万元/平方米).。
人教A版高中数学选择性必修第三册精品课件 第8章 成对数据的统计分析 一元线性回归模型及其应用
请问如何表示年推销金额y与工作年限x之间的相关关系?
提示:画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直
线表示变量之间的相关关系.
2.(1)用 x 表示父亲的身高,Y 表示儿子的身高,e 表示随机误差.假定随机误差
e 的均值为 0,方差为与父亲身高无关的定值 σ2,则它们之间的关系可以表示
n
∑
(2) 决定系数 R2 的计算公式为 R2=1-i=1
^ 2
( - )
2
2
.在
R
表达式中,
∑
(y
i-) 与经
2
∑ ( -)
=1
验回归方程无关,残差平方和 ∑
=1
=1
^ 2
(yi- ) 与经验回归方程有关.因此
R2 越大,表
示残差平方和 越小 ,即模型的拟合效果 越好 ;R2 越小,表示残差平方和越大,
即模型的拟合效果 越差 .
3.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的决定
系数R2如下,其中拟合效果最好的模型是(
)
模型
模型1
模型2
模型3
模型4
R2
0.98
0.80
0.50
0.25
A.模型1
答案:A
B.模型2
C.模型3 D.模型4
合作探究 释疑解惑
探究一
经验回归方程
【例1】 随着智能手机的普及,使用手机上网成为人们日常生活的一部分,
^ ^
最小二乘法,求得的, 叫做 b,a 的 最小二乘估计 .
3.(1)在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y关于x
课件1:§8.2 一元线性回归模型及其应用
.
≈1 530(人).
反思感悟
刻画回归效果的三种方法
(1)残差图法,残差点比较均匀地落在水平的带状区域内说明
选用的模型比较合适.
n
(2)残差平方和法:残差平方和
i=1
果越好.
^ 2
(yi-yi) 越小,模型的拟合效
n
^ 2
yi-yi
i=1
(3)R2 法:R2=1-
越接近 1,表明模型的拟合效果越好.
=1
∑ 2 -
=1
2
^
, = − .
解:(1)根据数据画出散点图(略),由散点图可知y与t线性相关.列表计算如下:
i
1
2
3
4
5
∑
ti
1
2
3
4
5
15
yi
5
6
7
8
10
36
i2
1
4
9
16
25
55
tiyi
5
12
21
32
50
120
这里 n=5, =
1
15
1
36
=1
^
故所求经验回归方程为 =1.2t+3.6.
^
^
(2)将 t=6 代入 =1.2t+3.6,可得 =1.2×6+3.6=10.8(千亿元),
所以预测该地区的居民 2021 年的人民币储蓄存款为 10.8 千亿元.
反思感悟
求经验回归方程可分如下四步来完成
(1)列:列表表示 xi,yi,x2i ,xiyi.
因变量
2
Ee=0,De=σ
课件2:§8.2 一元线性回归模型及其应用
^
(3)代:代入公式计算a,b的值.
(4)写:写出经验回归方程.
跟踪训练 1.某商场经营一批进价是 30 元/台的小商品,
在市场调查中发现,此商品的销售单价 x(x 取整数)元
与日销售量 y 台之间有如下关系:
x
35
40
45
50
y
56
41
28
11
(1)y 与 x 是否具有线性相关关系?如果具有线性相关
^ 2
yi-yi
i=1
可以用 R2=1-
来比较两个模型的拟合效果,
n
yi-y2
i=1
R2 越 大 ,模型拟合效果越好,R2 越 小 ,模型拟合效果越差.
思考
利用经验回归方程求得的函数值一定是真实
值吗?
答案
不一定,他只是真实值的一个预测估计值.
题型探究
探究一 求经验回归方程
例 1.某工厂 1~8 月份某种产品的产量与成本的统计数据
见下表:
月份
1
2
3
产量
(吨)
5.6
6.0
6.1
成本
130
(万元)
136
143 149 157 172 183 188
4
5
6
6.4 7.0 7.5
7
8
8.0
8.2
以产量为 x,成本为 y.
(1)画出散点图;
(2)y 与 x 是否具有线性相关关系?若有,求出其经验回归
方程.
解:(1)由表画出散点图,如图所示.
学习目标
1.结合实例,了解一元线性回归模型的含义,了解模
型参数的统计意义.
2.了解最小二乘原理,掌握一元线性回归模型参数的
8.2 一元线性回归模型及其应用
2500 2000 1500 1000 500
0
.
.............................................................................................112-55050000000 ... .
i 1
n
n
(xi x)2 ( yi y)2
i 1
i 1
n
xi yi nx y
i 1
n
(
xi2
2
nx )(
n
yi2
2
ny )
i 1
i 1
当r [0.75,1], 表明两个变量正相关很强;
当r [1, 0.75], 表明两个变量负相关很强;
当r [0.25, 0.25], 表明两个变量相关性较弱。
•几点坐说标明纵:轴为残差变量,横轴可以有不同的选择; 的错第•误一。个如若样果模本数点据型和采第选集6有个择错样的误本,点正就的确予残以差,纠比正残较,大差然,后图需再要中重确新认的利在点用采线集应性过该回程归中分模是型布否拟有在合人数以为 据;如果数横据轴采集为没心有错的误带,则形需区要寻域找其;他的原因。 样的另•带外状,区对残域差于的点宽远比度较离越均窄横匀,地轴说落明的在模水点型平拟的,合带精要状度区特越域高别中,,注回说归意明方选。程用的的预模报型精计度较越合高适。,这
的估计值eˆi yi yˆi程称相应残差 n Q(aˆ,bˆ)= ( yi yˆi )2为残差平方和。 i1
3.相关指数R2
n
(yi - yi)2
R2= 1-Fra biblioteki=1 n
(yi - y)2
i=1
R2越大 模型越
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.2 一元线性回归模型及其应用(精讲)考点一 样本中心解小题【例1】(2021·江西赣州市)某产品在某零售摊位上的零售价x (元)与每天的销售量y (个)统计如下表:据上表可得回归直线方程为 6.4151y x =-+,则上表中的m 的值为( ) A .38B .39C .40D .41【答案】D 【解析】由题意1617181917.54x +++==,50343111544m my ++++==,所以115 6.417.51514m+=-⨯+,解得41m =.故选:D . 【一隅三反】1.(2021·江西景德镇市·景德镇一中)随机变量x 与y 的数据如表中所列,其中缺少了一个数值,已知y关于x 的线性回归方程为ˆ0.93yx =+,则缺少的数值为( )A .6B .6.6C .7.5D .8【答案】A【解析】设缺少的数值为m ,由于回归方程为ˆ0.93yx =+过样本中心点(),x y , 且2345645x ++++==,代入0.943 6.6y =⨯+=,所以5679 6.65my ++++==,解得6m =.故选:A.2.(2021·河南信阳市)根据如下样本数据:得到的回归方程为y bx a =+,则( ) A .0a >,0b > B .0a >,ˆ0b < C .0a <,0b > D .0a <,ˆ0b< 【答案】B【解析】由图表中的数据可得,变量y 随着x 的增大而减小,则ˆ0b<, 2345645x ++++==,4 2.50.5230.25y +---==,又回归方程y bx a =+经过点(4,0.2),可得0a >,故选:B .3.(2021·安徽六安市·六安一中)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y (单位:C )存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y 关于x 的线性回归方程0.25y x k =+.则当蟋蟀每分钟鸣叫62次时,该地当时的气温预报值为( ) A .33C B .34CC .35CD .35.5C【答案】D【解析】由表格中的数据可得2030405060405x ++++==,2527.52932.536305y ++++==,由于回归直线过样本中心点(),x y ,可得300.2540k =⨯+,解得20k =.所以,回归直线方程为0.2520y x =+.在回归直线方程中,令62x =,可得0.25622035.5y =⨯+=.故选:D.考点二一元线性方程【例2】(2021·兴义市第二高级中学)在2010年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示: 通过分析,发现销售量y 对商品的价格x 具有线性相关关系,求 (1)销售量y 对商品的价格x 的回归直线方程; (2)若使销售量为12,则价格应定为多少.附:在回归直线ˆˆy bxa =+中1221ˆni ii nii x y nxyb xnx ==-=-∑∑,ˆˆay bx =- 【答案】(1) 3.240y x =-+ (2) 8.75 【解析】(1)由题意知10x =,8y =,∴999580635551083.28190.25100110.25121ˆ5100b++++-⨯⨯==-++++-⨯,8(3.2)1040a =--⨯=,∴线性回归方程是 3.240y x =-+;(2)令 3.24012y x =-+=,可得8.75x =,∴预测销售量为12件时的售价是8.75元.【一隅三反】1.(2020·河南开封市)配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一个马拉松跑者的心率y (单位:次/分钟)和配速x (单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,求y 与x 的线性回归方程;(2)该跑者如果参加本次比赛,将心率控制在160左右跑完全程,估计他跑完全程花费的时间,并估计他能获得的名次.参考公式:线性回归方程ˆˆˆybx a =+中,12()()ˆ()nii i nixx y y b xx =--=-∑∑,ˆˆay bx =- 参考数据:135y =.【答案】(1)25285x y ∧=-+;(2)210分钟,192名. 【解析】(1)由散点图中数据和参考数据得 4.55677.565x ++++==,1001091301651711355y ++++==,()()()51522222211.536(1)300(5)1(26) 1.5(35)25( 1.5)(1)01 1.5ˆiii i i x x y y bx x ==---⨯+-⨯+⨯-+⨯-+⨯-===--+-+++-∑∑,135(25)62ˆ85ˆay bx =-=--⨯=, 所以y 与x 的线性回归方程为25285x y ∧=-+. (2)将160y =代入回归方程得5x =,所以该跑者跑完马拉松全程所花的时间为425210⨯=分钟. 从马拉松比赛的频率分布直方图可知成绩好于210分钟的累积频率为()0.0008500.00242102000.064⨯+⨯-=,有6.4%的跑者成绩超过该跑者,则该跑者在本次比赛获得的名次大约是0.0643000192⨯=名.2.(2020·云南红河哈尼族彝族自治州)随着电商事业的快速发展,网络购物交易额也快速提升,特别是每年的“双十一”,天猫的交易额数目惊人.2020年天猫公司的工作人员为了迎接天猫“双十一”年度购物狂欢节,加班加点做了大量准备活动,截止2020年11月11日24时,2020年的天猫“双十一”交易额定格在3700多亿元,天猫总公司所有员工对于新的战绩皆大欢喜,同时又对2021年充满了憧憬,因此公司工作人员反思从2014年至2020年每年“双十一”总交易额(取近似值),进行分析统计如下表:(1)通过分析,发现可用线性回归模型拟合总交易额y 与年份代码t 的关系,请用相关系数加以说明; (2)利用最小二乘法建立y 关于t 的回归方程(系数精确到0.1),预测2021年天猫“双十一”的总交易额. 参考数据:71()()138.5ii i tt y y =--=∑26.7= 2.646≈;参考公式:相关系数()()niit t y y r --=∑;回归方程y bt a ∧∧∧=+中,斜率和截距的最小二乘估计公式分别为:()()()711722211niii ii i niii i tty y t y nx yb tttnx∧====---==--∑∑∑∑,=a y bt ∧∧-.【答案】(1)答案见解析;(2)回归方程为ˆ 4.9 1.2yt =-,预测2021年天猫“双十一”的总交易额约为38百亿.【解析】(1)4t =,721()28ii tt =-=∑,17()()138.5i ii t t yy =--=∑26.7=所以()()138.50.982 2.64626.7niit t y y r --=≈≈⨯⨯∑因为总交易额y 与年份代码t 的相关系数近似为0.98, 说明总交易额y 与年份代码t 的线性相关性很强,从而可用线性回归模型拟合总交易额y 与年份代码t 的关系. (2)因为18.4y =,721()28ii tt =-=∑,所以()()71271()138.5ˆ 4.928i ii i i t t yy bt t ==--==≈-∑∑, ˆˆay b =-,18.4 4.94 1.2b ≈-⨯=- 所以y 关于t 的回归方程为ˆ 4.9 1.2yt =- 又将2021年对应的8t =代入回归方程得:ˆ 4.98 1.238y=⨯-=. 所以预测2021年天猫“双十一”的总交易额约为38百亿.3.(2021·湖北省武昌实验中学高二期末)根据统计,某蔬菜基地西红柿亩产量的增加量y (百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若0.75r>,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式()()n ni i i ix x y y x y nx y r---==∑∑0.55≈0.95≈.回归方程y bx a=+中斜率和截距的最小二乘估计公式分别为()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y xb=-.【答案】(1)0.95;答案见解析;(2)0.3 2.5y x=+;610千克.【解析】(1)由已知数据可得2456855x++++==,3444545y++++==,所以()()()()()5131100010316i iix x y y=--=-⨯-+-⨯+⨯+⨯+⨯=∑,====所以相关系数()()50.95iix x y y r --===≈∑.因为0.75r >,所以可用线性回归模型拟合y 与x 的关系.(2)()()()5152160.320iii ii x x y y b x x ==--===-∑∑,450.3 2.5a =-⨯=, 所以回归方程为0.3 2.5y x =+. 当12x =时,0.312 2.5 6.1y =⨯+=,即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为610千克.考点三 非一元线性方程【例3】(2020·全国高二课时练习)在一次抽样调查中测得5个样本点,得到下表及散点图.(1)根据散点图判断y a bx =+与1y c k x -=+⋅哪一个适宜作为y 关于x 的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立y 与x 的回归方程;(计算结果保留整数) (3)在(2)的条件下,设=+z y x 且[)4,x ∈+∞,试求z 的最小值.参考公式:回归方程ˆˆˆybx a =+中,()()()1122211ˆn niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)1y c k x -=+⋅;(2)41y x=+;(3)6. 【解析】(1)由题中散点图可以判断,1y c k x -=+⋅适宜作为y 关于x 的回归方程; (2)令1t x -=,则y c kt =+,原数据变为由表可知y 与t 近似具有线性相关关系,计算得4210.50.251.555t ++++==,16125217.25y ++++==,222222416212150.520.2515 1.557.238.4544210.50.255 1.559.3k ⨯+⨯+⨯+⨯+⨯-⨯⨯==≈++++-⨯,所以,7.24 1.551c y kt =-=-⨯=,则41y t =+. 所以y 关于x 的回归方程是41y x=+. (3)由(2)得41z y x x x=+=++,[)4,x ∈+∞, 任取1x 、24x ≥,且12x x >,即124x x >≥,可得()()()21121212121212124444411x x z z x x x x x x x x x x x x -⎛⎫⎛⎫⎛⎫-=++-++=-+-=-+ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭()()1212124x x x x x x --=,因为124x x >≥,则120x x ->,1216>x x ,所以,12z z >,所以,函数41z x x =++在区间[)4,+∞上单调递增,则min 44164z =++=. 【一隅三反】1.(2020·江苏省如皋中学高二月考)某种新产品投放市场一段时间后,经过调研获得了时间x (天数)与销售单价y (元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).表中10111,10i i i i w w w x ===∑.(1)根据散点图判断y a bx =+,与dy c x=+哪一个更适合作价格y 关于时间x 的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y 关于x 的回归方程. (3)若该产品的日销售量()g x (件)与时间x 的函数关系为()()100120g x x N x-=+∈,求该产品投放市场第几天的销售额最高?最高为多少元?附:对于一组数据()()()()112233,,,,,,...,,n n u v u v u v u v ,其回归直线vuαβ=+的斜率和截距的最小二乘法估计分别为121()(),()nii i nii vv u u v u u u βαβ==--==--∑∑.【答案】(1)dy c x =+更适合作价格y 关于时间x 的回归方程;(2)120(1)y x=+;(3)第10天,最高销售额为2420元;【解析】(1)根据散点图知dy c x=+更适合作价格y 关于时间x 的回归方程类型; (2)令1w x=,则y c dw =+, 而1011021()()18.4200.92()iii ii w w yy d w w ==--===-∑∑, 37.8200.8920c y dw =-=-⨯=,即有120(1)y x=+;(3)由题意结合(2)知:日销售额为1100()()20(1)(120)f x y g x x x=⋅=+-, ∴2110015()20(1)(120)400(6)f x x x x x=+-=+-, 若1t x =,令221121()655()1020h t t t t =+-=--+, ∴110t =时,max 1121()()1020h t h ==,即10x =天,max 121()(10)400242020f x f ==⨯=元, 所以该产品投放市场第10天的销售额最高,最高销售额为2420元.2.(2021·江苏苏州市)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x t y e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10i i v y i ==⋅⋅⋅,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据(1)的选择及表中数据,建立y 关于x 的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额y 为250亿元,请预测2021年的研发资金投入额x 为多少亿元?(结果精确到0.01)附:①相关系数()()niix x y y r --=∑,回归直线ˆˆˆya bx =+中:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =- ②参考数据:ln 20.693≈,ln5 1.609≈. 【答案】(1)模型x ty eλ+=的拟合程度更好;(2)(ⅰ)0.180.56ˆx ye +=;(ⅱ)27.56.【解析】(1)设{}i u 和{}i y 的相关系数为1r ,{}i x 和{}i v 的相关系数为2r ,由题意,()()101130.8715iiu u y y r --===≈∑,()()102120.9213iix x v v r --===≈∑,则12r r <,因此从相关系数的角度,模型x ty e λ+=的拟合程度更好.(2)(ⅰ)先建立v 关于x 的线性回归方程, 由x ty eλ+=,得ln y t x λ=+,即v t x λ=+,()()()101102112ˆ65iii ii x x v v x x λ==--==-∑∑, 12ˆˆ 5.36260.5665tv x λ=-=-⨯=, 所以v 关于x 的线性回归方程为ˆ0.180.56vx =+, 所以ˆln 0.180.56yx =+,则0.180.56ˆx y e +=.(ⅱ)2021年盈利额250y =(亿元), 所以0.180.56250x e +=,则0.180.56ln 250x +=, 因为ln 2503ln5ln 23 1.6090.693 5.52=+≈⨯+=, 所以 5.520.5627.560.18x -≈≈.所以2021年的研发资金投入量约为27.56亿元.。