线性回归方程高考的题目讲解

合集下载

2025高考数学一轮复习-9.1.2-线性回归方程【课件】

2025高考数学一轮复习-9.1.2-线性回归方程【课件】

(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出). 根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概 率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千 件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料 成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选 择100元还是90元,请说明理由.
因为 y =3860=45,
8
uiyi-8 u y
i=1
所以b^ =
8
u2i -8 u 2
i=1
=1831..45- 3-8×8×0.03.411×545=06.611=100,
则a^ = y -b^ u =45-100×0.34=11, 所以y^ =11+100u, 所以 y 关于 x 的回归方程为y^=11+10x0.
三、非线性回归问题
知识梳理
解非线性回归分析问题的一般步骤 有些非线性回归分析问题并不给出函数,这时我们可以根据已知数据 画出散点图,与学过的各种函数(幂函数、指数函数、对数函数等)的图 象进行比较,挑选一种跟这些散点拟合得最好的函数,用适当的变量 进行变换,把问题转化为线性回归分析问题,使之得到解决.
n
v2i -n
v
2
i=1
i=1
解 ①当产品单价为100元,设订单数为m千件,因为签订9千件订单的 概率为0.8,签订10千件订单的概率为0.2, 所以E(m)=9×0.8+10×0.2=9.2, 所以企业利润为 100×9.2-9.2×190.20+21=626.8(千元). ②当产品单价为90元,设订单数为n千件, 因为签订10千件订单的概率为0.3,签订11千件订单的概率为0.7, 所以E(n)=10×0.3+11×0.7=10.7,

高考数学复习典型题型专题讲解与练习94 一元线性回归模型及其应用

高考数学复习典型题型专题讲解与练习94 一元线性回归模型及其应用

高考数学复习典型题型专题讲解与练习 专题94 一元线性回归模型及其应用题型一 求回归直线方程例1.(2022·甘肃·临泽县第一中学高二阶段练习(文))已知变量x 和y 正相关,则由如下表所示的观测数据算得的线性回归方程为【答案】B 【解析】 【分析】先求出样本的中心点的坐标,再代入选项检验即得正确答案. 【详解】 由题得12345543210,10x -----+++++==0.92 3.1 3.9 5.1 4.15 2.9 2.10.9010y -----+++++==,所以样本中心点的坐标为(0,0),代入选项检验得选B. 故答案为B 【点睛】(1)本题主要考查回归方程直线的性质,意在考查学生对该知识的掌握水平.(2) (,)x y 称为样本点的中心,回归直线过样本点的中心.这是回归方程的一个重要考点,要理解掌握并灵活运用.规律方法 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x -,y -,∑n i =1x 2i ,∑ni =1x i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑n i =1x i y i -n x - y -∑n i =1x 2i -nx -2,a ^=y --b ^x -.(6)写出线性回归方程y ^=b ^x +a ^.例2.(2019·新疆·乌鲁木齐市第二十中学高二期中)随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y (万元)有如表的数据资料:(1) 在给出的坐标系中作出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa 、ˆb ; (3)估计使用年限为12年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆn i i i n ii x y nxy bx nx==-=-∑∑, ˆˆay bx =-.) 【答案】(1)见解析; (2) 1.23b =0.08a =; (3)估计使用12年时,支出总费用是14.84万元.. 【解析】 【分析】(1)在坐标系中描点可得散点图;(2)代入公式可求;(3)根据方程代入x=12可得费用. 【详解】(1)散点图如图,由图知y 与x 间有线性相关关系.(2)∵4x =,5y =,51112.3i i i x y ==∑,52190i i x ==∑,∴2112.354512.31.2390541ˆ0b-⨯⨯===-⨯;5 1.2340.ˆ0ˆˆ8ay bx =-=-⨯=. (3)线性回归直线方程是 1.2308ˆ.0yx =+, 当12x =(年)时, 1.23120.0814.8ˆ4y =⨯+=(万元).即估计使用12年时,支出总费用是14.84万元. 【点睛】本题主要考查回归直线在生活中的应用,明确所给公式中各个模块的含义,代入公式可求.题目难度不大,侧重于应用性.例3.(2022·全国·高二单元测试)有一位同学家里开了一个小卖部,他为了研究气温对热茶销售的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表如下: 气温x/℃ -5 0 4 7 12 15 19 23 27 31 36热茶销售杯数y/杯 156 150 132 128 130 116 104 89 93 76 54(1)画出散点图;(2)你能从散点图中发现气温与热茶的销售杯数之间关系的一般规律吗? (3)如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系; (4)试求出回归直线方程;(5)利用(4)的回归方程,若某天的气温是2 ℃,预测这一天卖出热茶的杯数.【答案】(1)见解析;(2)见解析;(3)见解析;(4) 2.354774ˆ1.y x =-+;(5)143【解析】 【详解】分析:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图;(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少;(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系; (4)由题中所给的数据求得回归方程即可;(5)结合回归方程的预测作用和(4)中的结论整理计算即可求得最终结果. 详解:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图如下图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系,如图所示.(4)因112i i 1169x ,x 411∑===为335,11i 11228y ,xiyi 1411∑===778. 所2169122814778-111111b 1694335-1111⨯⨯=⎛⎫⨯ ⎪⎝⎭^以≈-2.35, 1228169a 2.35147.74.1111=+⨯=^所以回归直线方程y 2.35x 147.74.=-+^为(5)由(4)的方程,当x=2,y 4.70147.74143.04,=-+=^时因此若某天的气温为2 ℃,这一天大约可以卖出143杯热茶.点睛:(1)正确运用计算^a ,^b 的公式和准确的计算,是求线性回归方程的关键. (2)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.题型二 利用回归直线方程对总体进行估计例4.(2022·江西抚州·高二期末(理))保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新能源汽车,每年抽样1000汽车调查,得到新能源汽车y 辆与年份代码x 年的数据如下表:(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源汽车.参考公式:回归方程y bx a =+斜率和截距的最小二乘估计公式分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【答案】(1)219y x =+ (2)27900 【解析】【分析】(1)第一步分别算第x ,y 的平均值,第二步利用1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-即可得到方程.(2)由第一问的结果,带入方程即可算出预估的结果. (1)3x =,305070+100+110=725y ++=,1222222221130+250+370+4100+5110-5372==211+2+3+4+5-53ni ii ni i x y nx yb x nx==-⨯⨯⨯⨯⨯⨯⨯=⨯-∑∑,因为a y bx =-,所以72213=9a =-⨯,所以219y x =+(2)预测该地区2022年抽样1000汽车调查中新能源汽车数,当7x =时,217993y =⨯+=,该地区2022年共有30万辆汽车,所以新能源汽车93300000279001000N =⨯=. 规律方法 本题已知y 与x 是线性相关关系,所以可求出回归方程进行估计和预测.否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.例5.(2022·陕西·西安中学高二期中(理))偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差(实际成绩-平均分=偏差).在某次考试成绩统计中,某老师为了对学生数学偏差x (单位:分)与物理偏差y (单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:(1)若x 与y 之间具有线性相关关系,求y 关于x 的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.(下面是参考数据和参考公式)()()()()()()()()()818222222222120 6.515 3.513 3.53 1.520.550.510 2.518 3.532420151332510181256i ii ii x yx===⨯+⨯+⨯+⨯+⨯+-⨯-+-⨯-+-⨯-==+++++-+-+-=∑∑,回归直线方程为ˆˆˆy bx a =+,其中()()()1122211ˆˆˆnni i iii i nni ii i x y nxy x x y y b x nx x x ay bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑【答案】(1)11ˆ42yx =+ (2)94 【解析】 【分析】(1)根据最小二乘法即可求出y 关于x 的线性回归方程;(2)设该同学的物理成绩为ω,则物理偏差为91.5ω-,数学偏差为8,根据回归方程可知,1191.5842ω-=⨯+,即可解出.(1)由题意可得,20151332(5)(10)(18)582x +++++-+-+-==,()()()6.5 3.5 3.5 1.50.50.5 2.5 3.5988y +++++-+-+-==, 1222159324ˆ81285412568()2ni ii nii x y nxybxnx ==--⨯⨯===-⨯-∑∑,所以9151ˆˆ8422a y bx =-=-⨯=,故线性回归方程为11ˆ42yx =+. (2)由题意,设该同学的物理成绩为ω,则物理偏差为:91.5ω-. 而数学偏差为128-120=8,∴1191.5842ω-=⨯+,解得94ω=, 所以,可以预测这位同学的物理成绩为94.例6.(2022·广东揭阳·高二期末)从2018年1月1日起,广东、等18个保监局所辖地区将纳入商业车险改革试点范围,其中最大的变化是上一年的出险次数决定了下一年的保费倍率,具体关系如下表:有评估机构从以往购买了车险的车辆中随机抽取1000 辆调查,得到一年中出险次数的频数分布如下(并用相应频率估计车辆每年出险次数的概率):(1)求某车在两年中出险次数不超过2次的概率;(2)经验表明新车商业车险保费与购车价格有较强的线性相关关系,估计其回归直线方程为:1201600y x =+.(其中x (万元)表示购车价格,y (元)表示商业车险保费).李先生2016 年1月购买一辆价值20万元的新车.根据以上信息,试估计该车辆在2017 年1月续保时应缴交的保费,并分析车险新政是否总体上减轻了车主负担.(假设车辆下一年与上一年都购买相同的商业车险产品进行续保) 【答案】(1)0.8744;(2)3846元,减轻了车主负担. 【解析】 【分析】(1)利用互斥事件的概率公式列式计算即得;(2)求出下一年车险保费倍率X 的分布列,并求出期望,即可得出车主下一年的保费,并根据期望是否大于1得出结论. 【详解】(1)设某车在两年中出险次数为N , 则(2)(0)(1)(2)P N P N P N P N ≤==+=+=5005005003805001003803802210001000100010001000100010001000=⋅+⋅⋅+⋅⋅+⋅0.8744=, 所以某车在两年中出险次数不超过2次的概率为0.8744; (2)设该车辆2017 年的保费倍率为X ,则X 为随机变量,X 的取值为0.85 ,1,1.25 ,1.5 ,1.75 , 2, X 的分布列为:下一年保费倍率X 的期望为:()0.850.510.38 1.250.1 1.50.015 1.750.00420.0010.9615+E X =⨯⨯+⨯+⨯+⨯+⨯=,该车辆估计2017年应缴保费为:()1202016000.96153846⨯+⨯=元, 因0.96151<,则车险新政总体上减轻了车主负担.题型三 线性回归分析例7.(2022·山东·日照青山学校高二期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下,用两种模型①y bx a =+;②y a =分别进行拟合,得到相应的回归方程1ˆ10.7 3.4yx =+,2ˆ22.8y =,进行残差分析得到如表所示的残差值及一些统计量的值:(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.(参考公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆay bx =-) 【答案】(1)该选模型①,理由见解析 (2)111y x =+ 【解析】 【分析】(1)求出两模型的残差值的绝对值之和进行比较即可,(2)先剔除异常数据,然后利用回归方程的公式结合已知数据进行计算即可 (1)应该选择模型①模型①的残差值的绝对值之和为1.1+2.8+7.5+1.2+1.9+0.4=14.9 模型②的残差值的绝对值之和为0.3+5.4+4.3+3.2+1.6+3.8=18.6. ∵14.9<18.6,∴模型①的拟合效果较好,应该选模型①.(2)剔除异常数据,即剔除第3天的数据后,得()1 3.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.2ˆ11825 3.6 3.617.25i ii ii x y xybxx ==--⨯⨯====-⨯⨯-∑∑, ˆˆ40.611 3.61ay bx =-=-⨯=. ∴y 关于x 的回归方程为111y x =+.规律方法 (1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.(2)刻画回归效果的三种方法①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适. ②残差平方和法:残差平方和∑ni =1 (y i -y ^i )2越小,模型的拟合效果越好. ③决定系数法:R 2=1-∑ni =1(y i -y ^i )2∑ni =1 (y i -y -)2越接近1,表明回归的效果越好. 例8.(2022·河南·南阳中学高三阶段练习(文))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附: 刻画回归效果的相关指数()()22121ˆ1niii nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-4.1≈ 【答案】(1)对A 型材料进行应用改造的投入为17亿元时的直接收益为72.93(亿元); (2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据模型和相关系数公式计算比较即可,然后将x =17代入较好的模型即可预测直接收益;(2)根据回归方程过样本中心点(,x y )求出ˆa,再令x =20算出预测的直接收益,即可算出投入20亿元时的总收益,与(1)中的投入17亿元的直接收益比较即可. (1)对于模型①,对应的15222740485460=387y ++++++=,故对应的()772221171750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为21.314.472.9ˆ3y=≈(亿元).另解:本题也可以根据相关系数的公式,直接比较79.13和20.2的大小,从而说明模型②拟合精度更高、更可靠. (2) 当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.例9.(2022·陕西·高新一中高三阶段练习(理))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造.根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+.(1)根据表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益; (2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好 4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)2221R R >,模型②拟合精度更高、更可靠,收益为72.93;(2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据题意求得()1221i i y y =-∑,再根据2R 的计算公式,即可分别求得2212,R R ,则可判断不同模型的拟合度;(2)根据题意,求得回归直线方程,即可代值计算,求得预测值. (1)对于模型①,对应的15222740485460387y ++++++==,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ21.314.472.93y=≈. (2) 当17x >时, 后五组的212223242568.56867.5666523,6755x y ++++++++====,由最小二乘法可得67(0.7)238ˆ 3.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1574.172.93-⨯++=>,故投入17亿元比投入20亿元时收益小.题型四 残差分析与相关指数的应用例10.(2022·河北·藁城新冀明中学高二阶段练习)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和; 【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件; (3)各组残差见解析,残差平方和为3.8182. 【解析】 【分析】(1)根据表中数据描点即可求解;(2)根据表中数据,求出x ,y ,612i i x =∑,61i i i x y =∑,代入公式求出线性回归方程的系数ˆb,进而求出ˆa即可得回归直线方程; (3)根据残差的定义及残差平方和公式即可求解. (1)解:散点图如下:(2) 解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818ii i y y=--+++--==++∑. 规律方法 (1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.例11.(2022·河北·大名县第一中学高二阶段练习)随着中美贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.华为技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x (亿元)与科技升级直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①:ˆ 4.111.8yx =+;模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①、②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对“麒麟”手机芯片科技升级的投入为17亿元时的直接收益. (附:刻画回归效果的相关指数,()()22121ˆ1niii nii y yR y y ==-=--∑∑ 4.1≈)(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.附:用最小二乘法求线性回归方程ˆˆˆybx a =+的系数:()()()1122211ˆˆˆ,nni iii i i nniii i x ynx yxx y y bay bx xnx xx ====-⋅--===---∑∑∑∑ 【答案】(1)回归模型②,72.93(亿元);(2)投入20亿元时,公司的实际收益更大. 【解析】 【分析】(1)根据表中数据比较21R 和22R 可判断拟合效果,进而求出预测值; (2)求出,x y ,进而求出a ,得出回归方程得求出结果. 【详解】解:(1)由表格中的数据,182.479.2>,∴()()772211182.479.2iii i y y y y ==>--∑∑,∴()()772211182.479.211iit t y y y y ==-<---∑∑可见模型①的相关指数21R 小于模型②的相关指数22R . 所以回归模型②的拟合效果更好.所以当17x =亿元时,科技升级直接收益的预测值为ˆ21.314.421.3 4.114.472.93y=≈⨯-=(亿元). (2)当17x >时,由已知可得2122232425235x ++++==,68.56867.5666667.25y ++++==.∴0.767.20.72383.3a y x =+=+⨯=.∴当17x >时,y 与x 满足的线性回归方程为ˆ0.783.3yx =-+. 当20x时,科技升级直接收益的预测值为ˆ0.72083.369.3y=-⨯+=亿元.当20>亿元,x亿元时,实际收益的预测值为69.3574.3+=亿元72.93∴技术升级投入20亿元时,公司的实际收益更大.题型五非线性回归分析例12.(2022·全国·模拟预测)某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:根据以上数据,绘制了如图所示的散点图.(1)根据散点图,判断在推广期内,y a bx=+与x=⋅(c,d均为大于零的常数)哪一个y c d适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及题干中表格内的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:其中lg i i v y =,7117i i v v ==∑.参考公式:对于一组数据)()()(1122,,,,,,n n u v u v u v ⋅⋅⋅,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为1221ˆni i i nii uv nuvunuβ==-=-∑∑,ˆav u β=-. (3)推广期结束后,为更好地服务乘客,车队随机调查了100人次的乘车支付方式,得到如下结果: 已知该线路公交车票价2元,使用现金支付的乘客无优惠,使用公交卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据调查结果发现:使用扫码支付的乘客中有5人次乘客享受7折优惠,有10人次乘客享受8折优惠,有15人次乘客享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据所给数据,以事件发生的频率作为相应事件发生的概率,在不考虑其他因素的条件下,按照上述收费标准,试估计该车队一辆车一年的总收入.【答案】(1)x y c d =⋅适宜(2))(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347(3)199200元 【解析】 【分析】(1)根据散点图即可判断回归方程类型;(2)根据题意中的数据,利用最小二乘法求出ˆb ,进而求出ˆa,即可得出回归方程,令8x =求解即可;(3)根据题意分别求出享受7折优惠、8折优惠、9折优惠的收入,进而加起来即可. (1)根据散点图判断,x y c d =⋅适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型. (2)∵x y c d =⋅,∴两边同时取常用对数,得lg lg lg y c x d =+. 设lg a c =,lg b d =,则v a bx =+.∵4x =, 1.54v =,721140i i x ==∑,∴7172221750.1274 1.547ˆ0.2514074287i i i i i x v xvbx x==--⨯⨯====-⨯-∑∑,ˆˆ0.54av bx =-=,∴ˆ0.540.25v x =+,∴)(0.540.250.25ˆ10 3.4710xx y +==⨯,把8x =代入上式,得0.540.258 2.5420.54ˆ10101010347y+⨯===⨯=, ∴y 关于x 的回归方程为)(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347. (3)由题意,可知一个月中使用现金的乘客有1000人次,共收入100022000⨯=(元);使用公交卡的乘客有6000人次,共收入6000 1.69600⨯=(元).使用扫码支付的乘客有3000人次,其中,享受7折优惠的有500人次,共收入500 1.4700⨯=(元),享受8折优惠的有1000人次,共收入1000 1.61600⨯=(元),享受9折优惠的有1500人次,共收入1500 1.82700⨯=(元),故该车队一辆车一个月的收入为200096007001600270016600++++=(元).∴估计该车队一辆车一年的收入为1660012199200⨯=(元).规律方法求非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性回归方程.例13.(2022·黑龙江·哈尔滨市第六中学校高二期末)区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,居世界前列现收集我国近5年区块链企业总数量相关数据,如表注:参考数据5174.691i i y ==∑,51312.761i i i x y ==∑,5110.980i i z ==∑,5140.457i i i x z ==∑(其中ln z y =).附:样本()(),1,2,,i i x y i n =⋅⋅⋅的最小二乘法估计公式为1221ni ii nii x ynxy b xnx==-=-∑∑,a y bx =-(1)根据表中数据判断,y a bx =+与e dx y c =(其中e 2.71828=⋅⋅⋅,为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由)(2)根据(1)的结果,求y 关于x 的回归方程;(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”,已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,则求甲公司获得“优胜公司”的概率. 【答案】(1)dx y ce = (2)0.75170.0591x y e -= (3)310【解析】【分析】(1)根据表中数据判断y 关于x 的回归方程为非线性方程;(2)令ln z y =,将y 关于x 的非线性关系,转化为z 关于x 的线性关系,利用最小二乘法求解;(3)利用相互独立事件的概率相乘求求解; (1)根据表中数据e dx y c =适宜预测未来几年我国区块链企业总数量. (2)e dx y c =,ln ln y dx c ∴=+,令ln z y =,则ln z dx c =+,5110.980 2.19655ii zz ====∑,5112345355ii xx =++++===∑由公式计算可知122140.457310.980.7517,5545ni ii n i i x znxzb x nx==-⨯==--=-∑∑ˆln 2.1960.751730.0591c z dx =-=-⨯=- ln 0.75170.0591y x ∴=-,即ln 0.75170.0591y x ∴=-,即0.75170.0591x y e -=所以y 关于x 的回归方程为0.75170.0591x y e -= (3)设甲公司获得“优胜公司”为A 事件. 则11123112113232352253210()P A ⨯+⨯⨯⨯+⨯⨯⨯==所以甲公司获得“优胜公司”的概率为310.例14.(2022·湖南·长沙一中高三阶段练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1-9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:现用by ax=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为23,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1iitx =)。

高考数学一轮复习(共节).线性回归方程及应用

高考数学一轮复习(共节).线性回归方程及应用

18、统计18.4 线性回归方程及应用【知识网络】1.能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。

2.了解线性回归的方法;了解用最小二乘法研究两个变量的线性相关问题的思想方法;会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式)。

【典型例题】[例1](1)为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值为s与t,那么下列说法正确的是()A.直线l1和l2一定有公共点(s,t) B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2D.直线l1和l2必定重合(2)工人工资(元)依劳动生产率(千元)变化的回归方程为ˆy=50+80x,下列判断正确的是()A.劳动生产率为1000元时,工资为130元B.劳动生产率提高1000元时,工资提高80元C.劳动生产率提高1000元时,工资提高130元D.当月工资250元时,劳动生产率为2000元(3)下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究。

其中正确的命题为()A.①③④B。

②④⑤C。

③④⑤D。

②③⑤(4)一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y (小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是___________。

(5)上题中,若该公司预计下周签发新保单1000张,则需要加班的时间是。

[例2]其中x(血球体积,mm),y(血红球数,百万).①画出上表的散点图;②求出回归直线并且画出图形。

线性回归方程高考题讲解

线性回归方程高考题讲解

线性回归方程高考题讲解线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 62.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 2 2.22 3 3.83 4 5.54 5 6.55 6 7.0∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 2.5 3 4 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 306 10 10 13 16深度y(m)(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。

高考数学一轮复习专题05 回归直线方程(解析版)

高考数学一轮复习专题05 回归直线方程(解析版)

概率与统计 专题五:回归直线方程一、知识储备 1.两个变量线性相关(1)散点图:将样本中n 个数据点(,)i i x y (i =1,2,…,n )描在平面直角坐标系中得到的图形. (2)正相关与负相关①正相关:散点图中的点散布在从左下角到右上角的区域. ②负相关:散点图中的点散布在从左上角到右下角的区域. 2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据11(,)x y ,22(,)x y ,33(,)xy (,)n n x y .②设所求回归方程为y bx a =+,其中,a b 是待定参数. ③由最小二乘法得1122211()(),()nnii i ii i nniii i xx y y x ynx yb a y bx xx xnx ====---===---∑∑∑∑其中,b 是回归方程的斜率,a 是截距. 二、例题讲解1.(2022·哈尔滨市呼兰区第一中学校高三模拟预测(文))十三届全国人大三次会议表决通过了《中华人民共和国民法典》这部法律自2021年1月1日起施行,某市相关部门进行法律宣传,某宣传小分队记录了前5周每周普及宣传的人数与时间的数据,得到下表:(1)若可用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程; (2)利用(1)的回归方程,预测该宣传小分队第7周普及宣传(民法典)的人数.参考公式及数据:回归方程ˆˆˆybx a =+中斜率和截距的最小二乘估计公式分别为()()()121ˆniii nii x x y y b x x ==--=-∑∑,ˆa y bx=-,()()51430i ii x x y y =--=∑.【答案】(1)4341y x =+;(2)预测该宣传小分队第7周普及宣传《民法典》的人数为342. 【分析】(1)求出x 、y 的值,将表格中的数据代入最小二乘法公式,求出b 、a 的值,可得出y 关于x 的线性回归方程;(2)将7x =代入回归直线方程,可得出结果. 【详解】(1)由题意得()11234535x =++++=,()1901201702102601705y =++++=, ()()()()()()52222221132333435310i i x x=-=-+-+-+-+-=∑,所以()()()51521430ˆ4310iii i i x x y y bx x==--===-∑∑,所以ˆ17043341a y bx=-=-⨯=, 所以线性回归方程为4341y x =+;(2)由(1)知4341y x =+,令7x =,解得43741342y =⨯+=, 故预测该宣传小分队第7周普及宣传《民法典》的人数为342.2.(2022·合肥市第六中学高三模拟预测(文))树木根部半径与树木的高度呈正相关,即树木根部越粗,树木的高度也就越高.某块山地上种植了A 树木,某农科所为了研究A 树木的根部半径与树木的高度之间的关系,从这些地块中用简单随机抽样的方法抽取6棵A 树木,调查得到A 树木根部半径x (单位:米)与A 树木高度y (单位:米)的相关数据如表所示:(1)求y 关于x 的线性回归方程;(2)对(1)中得到的回归方程进行残差分析,若某A 树木的残差为零则认为该树木“长势标准”,在此片树木中随机抽取1棵A 树木,估计这棵树木“长势标准”的概率.参考公式:回归直线方程为y bx a =+,其中()()()1122211n ni iiii i b nnixii i x y nxy x x y y xnx x ==-==---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ 20.9y x =+;(2)12【分析】(1)由最小二乘法先求样本点中心(),x y ,再代入公式求ˆ2b=,即可得到答案; (2)先计算6棵A 树木中残差为零的有3棵,占比为3162=,即可得到答案;【详解】(1)由1(0.10.20.30.40.50.6)0.356x =⨯+++++=,1(1.1 1.3 1.6 1.5 2.0 2.1) 1.66y =⨯+++++=,610.1 1.10.2 1.30.3 1.60.4 1.50.5 2.00.6 2.1 3.71i ii x y==⨯+⨯+⨯+⨯+⨯+⨯=∑,6222222210.10.20.30.40.50.60.91ii x==+++++=∑,有62261216 3.7160.35 1.6ˆ20.9160.356i ii ii x yxybxx ==--⨯⨯===-⨯-∑∑,ˆˆ 1.6020.350.9ay bx =-=-⨯=, 故y 关于x 的回归方程为:ˆ 20.9yx =+. (2)当0.1x =时,ˆ20.10.9 1.1y=⨯+=,残差为1.1 1.10-=, 当0.2x =时,ˆ20.20.9 1.3y=⨯+=,残差为1.3 1.30-=, 当0.3x =时,ˆ20.30.9 1.5y=⨯+=,残差为1.6 1.50.1-=, 当0.4x =时,ˆ20.40.9 1.7y=⨯+=,残差为1.5 1.70.2-=-, 当0.5x =时,ˆ20.50.9 1.9y=⨯+=,残差为2.0 1.90.1-=, 当0.6x =时,ˆ20.60.9 2.1y=⨯+=,残差为2.1 2.10-=, 由这6棵A 树木中残差为零的有3棵,占比为3162=,∴这棵树木“长势标准”的概率为12.1.(2022·湖南师大附中高三月考)今年五月,某医院健康管理中心为了调查成年人体内某种自身免疫力指标,从在本院体检的人群中随机抽取了100人,按其免疫力指标分成如下五组:(10,20],(20,30],(30,40],(40,50],(50,60],其频率分布直方图如图1所示.今年六月,某医药研究所研发了一种疫苗,对提高该免疫力有显著效果.经临床检测,将自身免疫力指标比较低的成年人分为五组,各组分别按不同剂量注射疫苗后,其免疫力指标y与疫苗注射量x个单位具有相关关系,样本数据的散点图如图2所示.(1)健管中心从自身免疫力指标在(40,60]内的样本中随机抽取3人调查其饮食习惯,记X表示这3人中免疫力指标在(40,50]内的人数,求X的分布列和数学期望;(2)由于大剂量注射疫苗会对身体产生一定的副作用,医学部门设定:自身免疫力指标较低的成年人注射疫苗后,其免疫力指标不应超过普通成年人群自身免疫力指标平均值的3倍.以健管中心抽取的100人作为普通人群的样本,据此估计疫苗注射量不应超过多少个单位.附:对于一组样本数据()()()1122,,,,,,n nx y x y x y⋅⋅⋅,其回归直线ˆy bx a=+的斜率和截距的最小二乘估计值分别为()()()1122211,nniii ii i nniii i x x yy x ynxyb a y bx x x xnx====---===---∑∑∑∑. 【答案】(1)分布列见解析,125;(2)疫苗注射量不应超过80个单位. 【分析】(1)根据频率分布直方图分别求出自身免疫力指标在(40,50]内和在(50,60]内的人数,写出X 的可能取值,求出对应概率,即可写出分布列,再根据期望公式即可求得数学期望;(2)根据最小二乘法求得回归方程,然后求出免疫力指标的平均值,根据题意列出不等式,从而可得答案. 【详解】解:(1)由直方图知,自身免疫力指标在(40,50]内的人数为0.008101008⨯⨯=,在(50,60]内的人数为0.002101002⨯⨯=,则X 的可能取值为1,2,3.其中122130828282233101010177(1),(2),(3)151515C C C C C C P X P X P X C C C =========.所以X 的分布列为()177121231515155E X =⨯+⨯+⨯=. (2)由散点图知,5组样本数据(,)x y 分别为(10,30),(30,50),(50,60),(70,70),(90,90),且x 与y 具有线性相关关系. 因为50,60x y ==,则22222210303050506070709090550607103050709055010b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯,760502510a =-⨯=,所以回归直线方程为ˆ0.725yx =+. 由直方图知,免疫力指标的平均值为26402482152535455527100100100100100⨯+⨯+⨯+⨯+⨯=. 由27381ˆy≤⨯=,得0.72581x +≤,解得80x ≤. 据此估计,疫苗注射量不应超过80个单位.2.(2022·安徽师范大学附属中学(理))根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村200名居民(未接种)的一个样本,5天内每天新接种疫苗的情况,如下统计表:(1)建立y 关于x 的线性回归方程;(2)假设全村共计2000名居民(均未接种过疫苗),用样本估计总体来预测该村80%居民接种新冠疫苗需要几天?参考公式:回归方程y bx a =+中斜率和截距的最小二乘估计公式分别为:1221ˆi ii nii x ynxybxnx π==-=-∑∑,ˆˆay bx =-. 【答案】(1)222955y x =+;(2)7. 【分析】(1)根据公式求线性回归方程即可; (2)根据线性回归方程可设222955n a n ,求出67,S S ,与200080%1600⨯=比较即可求解. 【详解】 (1)1234535x ++++==,1015192328195y ++++==,则51522222222110305792140531922ˆ12345535i ii ii x y nxybxnx ==-++++-⨯⨯===++++-⨯-∑∑,222919355ˆa =-⨯=,故y 关于x 的线性回归方程222955y x =+. (2)设222955na n ,数列{}n a 的前n 项和为n S ,易知数列{}n a 是等差数列, 则()12222922291155558225n n n a a S n n n n⎛⎫+++ ⎪+⎝⎭=⋅=⋅=+, 因为6127.2S ,7163.8S , 所以6101272S =,7101638S =200080%1600⨯=(人),所以预测该村80%居民接种新冠疫苗需要7天.3.(2022·九龙坡·重庆市育才中学高三月考)随着城市规模的扩大和人们生活水平的日益提高,某市近年机动车保有量逐年递增.根据机动车管理部门的统计数据,以5年为一个研究周期,得到机动车每5年纯增数据情况为:其中1,2,3,i =,时间变量i x 对应的机动车纯增数据为i y ,且通过数据分析得到时间变量x 与对应的机动车纯增数量y (单位:万辆)具有线性相关关系.(1)求机动车纯增数量y (单位:万辆)关于时间变量x 的回归方程,并预测2025~2030年间该市机动车纯增数量的值;附:回归直线方程y bx a =+中斜率和截距的最小二乘估计公式分别为:()()()1122211n ni iiii i nniii i x y nx y x x y y b xnxx x ====-⋅--==--∑∑∑∑;a y bx =-.(2)该市交通管理部门为了了解市民对“单双号限行”的赞同情况,随机采访了200名市民,将他们的意见和是否拥有私家车情况进行了统计,得到如下的22⨯列联表: 根据上面的列联表判断,能否有95%的把握认为“对限行的意见与是否拥有私家车”有关. 附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.【答案】(1) 5.7 5.1y x =-,2025~2030年间,机动车纯增数量的值约为34.8万辆;(2)没有95%的把握认为“对限行的意见与是否拥有私家车有关”. 【分析】(1)根据最小二乘法求得线性回归方程,再求估计值即可; (2)根据列联表求得卡方观测值,再对照表即可得解. 【详解】 (1)由所以3x =,12y =,51132639415527237i ii x y=⨯+⨯+⨯+=⨯+⨯=∑.()12222222212375312575.755451234553ni ii ni i x y nx yb x nx==-⋅-⨯⨯====-++++-⨯-∑∑. 因为y bx a =+过点(),x y ,所以 5.7y x a =+,5.1a =-,所以 5.7 5.1y x =-.2025~2030年时,7x =,所以 5.77 5.134.8y =⨯-=, 所以2025~2030年间,机动车纯增数量的值约为34.8万辆. (2)根据列联表,由()()()()()22n ad bc K a b c d a c b d -=++++得观测值为()2220025 3.12510085251575100160084K ⨯⨯-⨯⨯=⨯⨯==,3.125 3.841<,所以没有95%的把握认为“对限行的意见与是否拥有私家车有关”.4.(2022·贵州贵阳·高三月考(理))据贵州省气候中心报,2022年6月上旬,我省降水量在15.2-170.3mm之间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足50mm ,其余均在50mmm 以上,局地超过100mm.若我省某地区2022年端午节前后3天,每一天下雨的概率均为50%.通过模拟实验的方法来估计该地区这3天中恰好有2天下雨的概率,利用计算机或计算器可以产生0到9之间取整数值的随机数x (x ∈N ,且09x ≤≤)表示是否下雨:当[]()0,x k k Z ∈∈时表示该地区下雨,当[]1,9x k ∈+时,表示该地区不下雨.因为是3天,所以每三个随机数作为一组,从随机数表中随机取得20组数如下: 332 714 740 945 593 468 491 272 073 445 992 772 951 431 169 332 435 027 898 719(1)求出k 的值,使得该地区每一天下雨的概率均为50%;并根据上述20组随机数估计该地区这3天中恰好有2天下雨的概率;(2)2016年到2021年该地区端午节当天降雨量(单位:mm )如表:经研究表明:从2016年到2021年,该地区端午节有降雨的年份的降雨量y 与年份t 具有线性相关关系,求回归直线方程y bt a =+.并预测该地区2022年端午节有降雨的话,降雨量约为多少?参考公式:()()()1122211nniii ii i nniii i tty y t y nt yb tttnt====---==--∑∑∑∑,a y bt =-.【答案】(1)4, 25;(2)814955y t =-+,935mm .【分析】(1)由于该地区每一天下雨的概率均为50%,所以150%10k +=,从而可求出k 的值,在所给的20组数据中找出有两天小于等于k 的数,从而利用古典概型的概率公式可求出概率,(2)直接利用所给的数据和公式求出回归直线方程。

专题01 线性回归方程(解析版)

专题01 线性回归方程(解析版)

【解析】解: x 0 1 2 3 3 , y m 3 5.5 7 m 15.5 ,
4
2
4
4
这组数据的样本中心点是 ( 3 , m 15.5) , 24
关于 y 与 x 的线性回归方程 yˆ 2.1x 0.85 ,
m 15.5 2.1 3 0.85 ,解得 m 0.5 ,
x (次数 / 分
20
30
40
50
60
钟)
y( C)
25
27.5
29
32.5
36
A. 33 C
B. 34 C
C. 35 C
【解析】解:由题意,得 x 20 30 40 50 60 40 , 5
y 25 27.5 29 32.5 36 30 , 5
则 k y 0.25x 30 0.25 40 20 ;
故答案为:10.
例 7.已知一组数据点:
x
x1
x2
x8
y
y1
y2
y8
8
用最小二乘法得到其线性回归方程为 yˆ 2x 4 ,若数据 x1 , x2 , , x8 的平均数为 1,则 yi i 1
16 .
3
原创精品资源学科网独家享有版权,侵权必究!
【解析】解:由题意, x 1 ,设样本点的中心为 (1, y) , 又线性回归方程为 yˆ 2x 4 ,则 y 2 1 4 2 ,
购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用 Y (单位:万元)的分布列为:
Y
30
20
70
120
P
0.3
0.4
0.2
0.1
E(Y ) 30 0.3 20 0.4 70 0.2 120 0.1 25 (万元)

(完整)线性回归方程高考题

(完整)线性回归方程高考题

线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 62.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 2 2.22 3 3.83 4 5.54 5 6.55 6 7.0∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 2.5 3 4 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图;(1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;(3)据此估计广告费用为10时,销售收入的值.6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 306 10 10 13 16深度y(m)(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。

模板18 线性回归方程(解析版).

模板18 线性回归方程(解析版).

(2020·山东省高三三模)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅰ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑y i 7i=1=9.32,∑t i y i 7i=1=40.17,√∑(y i −y ̅)27i=1=0.55,√7≈2.646. 参考公式:相关系数r =∑(t i −t )(y i −y ̅)ni=1√∑(t i −t )2∑(y i −¯)2ni=1n i=1,(Ⅰ)由折线图中数据和附注中参考数据得t =4,∑(t i −t )27i=1=28,√∑(y i −y ̅)27i=1=0.55,,.因为与的相关系数近似为0.99,说明与的线性相关相当高,从而可以用线性回归模型拟合与的关系.(Ⅰ)由y ̅=9.327≈1.331及(Ⅰ)得b̂=∑(t i −t )(y i −y ̅)7i=1∑(t i −t )27i=1=2.8928≈0.103,a ̂=y ̅−b ̂t ≈1.331−0.103×4≈0.92. 所以,关于的回归方程为:.将2016年对应的代入回归方程得:.所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.y bt a =+的斜率和截距的最小二乘估计()()()121niii nii t t y y b a y bt t t ==--==--∑∑, 【答案】(1)0.25;(2)Ⅰ理由见解析,不能利用线性回归模型描述∑b=a yb t=-=0.21+0.86所以所求回归直线方程y bx a=+,并推测当产量为y bx a=+中的斜率和截距的最小二乘估计公式分别为((11iinix b== =∑∑a y bx=-;相关系数((11niiniix rx===-∑∑参考数据:1021iix=-∑ 1.22b≈.;具有很强的相关性(3 1.22y x=+4.731a y bx=≈--所以所求回归直线方程为 1.22 1.75y x =+,故当 3.2x =时, 1.22 3.2 1.75 5.65y =⨯+≈.3.(2020·安徽省高三三模)随着网购人数的日益增多,网上的支付方式也呈现一种多样化的状态,越来越多的便捷移动支付方式受到了人们的青睐,更被网友们评为“新四大发明”之一.随着人们消费观念的进步,许多人喜欢用信用卡购物,考虑到这一点,一种“网上的信用卡”横空出世——蚂蚁花呗.这是一款支付宝和蚂蚁金融合作开发的新支付方式,简单便捷,同时也满足了部分网上消费群体在支付宝余额不足时的“赊购”消费需求.为了调查使用蚂蚁花呗“赊购”消费与消费者年龄段的关系,某网站对其注册用户开展抽样调查,在每个年龄段的注册用户中各随机抽取100人,得到各年龄段使用蚂蚁花呗“赊购”的人数百分比如图所示.(1)由大数据可知,在18到44岁之间使用花呗“赊购”的人数百分比y 与年龄x 成线性相关关系,利用统计图表中的数据,以各年龄段的区间中点代表该年龄段的年龄,求所调查群体各年龄段“赊购”人数百分比y 与年龄x 的线性回归方程(回归直线方程的斜率和截距保留两位有效数字);(2)该网站年龄为20岁的注册用户共有2000人,试估算该网站20岁的注册用户中使用花呗“赊购”的人数; (3)已知该网店中年龄段在18-26岁和27-35岁的注册用户人数相同,现从18到35岁之间使用花呗“赊购”的人群中按分层抽样的方法随机抽取8人,再从这8人中简单随机抽取2人调查他们每个月使用花呗消费的额度,求抽取的两人年龄都在18到26岁的概率.参考答案:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-.【答案】(1)0.023 1.0y x =-+;(2)1080人;(3)514.220.5b ⨯=22 3.7875162+⨯)由(1)知,该网站20000.541080⨯=y bx a =+;之间是正相关还是负相关,用所求回归方程预测该店营业y bx a =+中,121ni ii nii x y nx b xnx==-=-∑∑bx .11920=.1521i ii ii x y b x===∑∑750.67bx =-所以回归直线方程为0.67b =>之间是正相关.代入回归方程可预测该店营业湖南省高三二模)热、咳嗽、气促和呼吸困难等,严重时会危及生命.随着疫情的发展,自出仓人数y3 8 17 31 68 168根据散点图和表中数据,某研究人员对出仓人数y 与日期序号x 进行了拟合分析.从散点图观察可得,研究人员分别用两种函数Ⅰ2ˆymx p =+Ⅰtx y ke =分析其拟合效果.其相关指数R 2可以判断拟合效果,R 2越大拟合效果越好.已知2y mx p =+的相关指数为20.89R =.(1)试根据相关指数判断.上述两类函数,哪一类函数的拟合效果更好?(注:相关系数r 与相关指数R 2满足22R r =,参考数据表中2ln ,u y v x ==)(2)Ⅰ根据(1)中结论,求拟合效果更好的函数解析式;(结果保留小数点后三位) Ⅰ3月3日实际总出仓人数为216人,按Ⅰ中的回归模型计算,差距有多少人?(附:对于一组数据(1,,,))(2,i i x y i n =⋅⋅⋅,其回归直线为ˆˆˆy bx a =+相关系数()()()()()()()11222111ˆˆ,,,ˆnniiiii i nnnii i i i i x x yy x x yy r by bx x x x y a x y =====----===---⋅-∑∑∑∑∑参考数据:xyv u(61ii v =∑ 1(b ii y =-∑ (61ii u =∑()()61i i i x u u x =--∑ ()()61i ii v yy v =--∑Ⅰi t b ===∑ˆˆb a u ===0.775x =+Ⅰ当序号7x =时,0.7757 5.4251.520 1.520 1.520227345y e e ⨯==⨯=⨯≈, 而3月3日实际出仓人数为216人,相差129人.6.(2020·陕西省西安中学高三三模)近期,西安公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,x 表示活动推出的天数,y 表示每天使用扫码支付的人次(单位:十人次),统计数据如表下所示:根据以上数据,绘制了散点图.(1)根据散点图判断,在推广期内,y a bx =+与x y c d =⋅(,c d 均为大于零的常数),哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型?(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表1中的数据,建立y 与x 的回归方程,并预测活动推出第8天使用扫码支付的人次;(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下表:西安公交六公司车队为缓解周边居民出行压力,以80万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为0.66万元.已知该线路公交车票价为2元,使用现金支付的乘客无优惠,使用,,作了初步处理,得到散点图和统计量表.x yln y1x21()ni i x x =-∑ 2111()ni i x x=-∑ 1()()ni i i x x y y =--∑ 111()(ln ln )ni i i y y x x=--∑ 1()(ln ln )niii x x y y =--∑5.825 3.612 0.154- 1.077 328 27.87 150.80 55.74- 126.56(1)根据散点图判断:ln y a b x =+与e ba x y +=哪一个适宜作为年产能y 关于投入的人力x 的回归方程类型?并说明理由?(2)根据(1)的判断结果及相关的计算数据,建立y 关于x 的回归方程;(3)现该企业共有2000名生产工人,资金非常充足,为了使得年产能达到最大值,则下一年度共需投入多少资金(单位:千万元)?附注:对于一组数据11(,)s t ,22(,)s t ,…,(,)n n s t ,其回归直线t bs a =+的斜率和截距的最小二乘估计分别为121()(),()niii nii s s tt b a t bs s s ==--==--∑∑,(说明:()eb axf x +=的导函数为2e()b a xb f x x +-⋅'=)【答案】(1)选择ebaxy +=,理由见解析;(2)22ex y -+=;(3)20千万【解析】(1)由图可知e ba x y +=适宜作为年产能y 关于投入的人力x 的回归方程类型 若选择ln y ab x =+,则0b >,此时当x 接近于0时,y 必小于0,02<<x∴∈(0,2) x∴当x=8.(2020·湖南省长郡中学高三三模)某企业积极响应国家“科技创新”的号召,大力研发新产品,为了对新研发的一批产品进行合理定价将该产品按事先拟定的价格进行试销,得到一组销售数据(),(1,2,3,4,5,6)i i x y i = 如下表所示:(1)求P 的值;(2)已知变量,x y 具有线性相关关系,求产品销量y (件)关于试销单价x (百元)的线性回归方程(计算结果精确到整数位)(3)用i y 表示用正确的线性回归方程得到的与i x 对应的产品销量的估计值,当销量数据(),i i x y 的残差的绝对值1i i y y -<时,则将销售数据称为一个“有效数据”现从这6组数据中任取2组,求抽出的2组销售数据都是“有效数据”的概率附参考公式:6662111180,1606,916i i i i i i i y y x y x =======∑∑∑,66116622211()()()iii ii i iii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-【答案】(1)82p =(2)495y x =-+或494y x =-+(3)25【解析】(1)由611806i i y y ===∑得9186787370806p +++++=. 求得82p =.(2) 3.5x =,6662111180,1606,916i i i i i i i y y x y x =======∑∑∑216066 3.580-744916 3.517.5b -⨯⨯∴==≈--⨯,804 3.594a =+⨯=(或7480 3.595175a ⎛⎫=--⨯≈ ⎪⎝⎭)所以回归方程为495y x =-+或494y x =-+.(3)当11ˆ1,90x y ==,当22ˆ2,86x y ==,当33ˆ3,82x y ==,当44x =,4ˆ78y =;当55x =,5ˆ74y=;当66x =,6ˆ70y=,根据题意则“有效数据”有()()()()2,86,3,82,4,78,6,704个,从6组销售数据中任意抽取2组的所有可能结果有2615C =种,抽取的2组销售数据都是“有效数据”的有246C =种,所以抽取的2组销售数据都是“有效数据”的概率为62155=. 9.(2020·湖南省长郡中学高三三模)为提供市民的健身素质,某市把,,,A B C D 四个篮球馆全部转为免费民用(1)在一次全民健身活动中,四个篮球馆的使用场数如图,用分层抽样的方法从,,,A B C D 四场馆的使用场数中依次抽取1234,,,a a a a 共25场,在1234,,,a a a a 中随机取两数,求这两数和ξ的分布列和数学期望;(2)设四个篮球馆一个月内各馆使用次数之和为x ,其相应维修费用为y 元,根据统计,得到如下表的数据:x 10 15 20 25 30 35 40y 10000 11761 13010 13980 14771 15440 1602043430.12yz e=+2.993.494.05 4.50 4.995.49 5.99Ⅰ用最小二乘法求z 与x 的回归直线方程; Ⅰ40yx +叫做篮球馆月惠值,根据Ⅰ的结论,试估计这四个篮球馆月惠值最大时x 的值 参考数据和公式:7723114.5,()700,()()70,20ii i i i z x x x x z z e ===-=--==∑∑71721()()()iii ii x x zz b x x ==--=-∑∑,a z bx =-【答案】(1)见解析,12.5(2)Ⅰ0.12z x =+Ⅰ20【解析】(1)抽样比为2511004=,所以1234,,,a a a a 分别是,6,7,8,5 所以两数之和所有可能取值是:10,12,13,15()1106p ξ==,()1123p ξ==,()1133p ξ==,()1156p ξ==所以分布列为期望为1111()1012131512.56336E ξ=⨯+⨯+⨯+⨯= (2)因为77211()700,()()70,ii i i i x x x x z z ==-=--=∑∑所以71721()()()iii ii x x zz b x x ==--=-∑∑,701, 4.50.125270010a ===-⨯=, 0.12z x ∴=+;y bx a =+月初购入进口猪肉,如果猪肉单价超过量以调控猪肉价格,试判断自受影响后第几周开始需要释放进口猪肉?·ni ix y nx y -∑2.56y x =12x ++=22345+++2.56y x =2)当6x =28.68y =,当31.24y =,所以应从第7周开始释放进口猪肉。

高考数学复习考点32 线性回归方程与列联表(讲解) (解析版)

高考数学复习考点32 线性回归方程与列联表(讲解) (解析版)

考点32 回归方程与独立性检验【思维导图】【常见考法】考法一 回归方程1.某工厂某产品产量x (千件)与单位成本y (元)满足回归直线方程77.36 1.82y x =-,则以下说法中正确的是( )A .当产量为1千件时,单位成本为75.54元B .当产量为2千件时,单位成本为73.72元C .产量每增加1000件,单位成本约下降1.82元D .产量每减少1000件,单位成本约下降1.82元【答案】C【解析】令()77.36 1.82f x x =-,因为()()()177.36 1.82177.36 1.82 1.82f x f x x x +-=-+-+=-, 所以产量每增加1000件,单位成本约下降1.82元.故选:C2.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元 D .105万元【答案】B【解析】由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50),∴ˆ5075a =⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+.当10x =时,710158ˆ5y =⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元.故选B .3.某企业为了参加上海的进博会,大力研发新产品,为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据(i x ,i y )(1,2,,6i =⋅⋅⋅),如表所示:已知611806i i y y ===∑.(1)求q 的值;(2)已知变量x ,y 具有线性相关关系,求产品销量y (件)关于试销单价x (元)的线性回归方程ˆˆˆy bx a =+;(3)用ˆi y表示用正确的线性回归方程得到的与i x 对应的产品销量的估计值,当ˆ1i i y y -≤时,将销售数据(i x ,i y )称为一个“好数据”,现从6个销售数据中任取2个,求抽取的2个销售数据中至少有一个是“好数据”的概率.参考公式:()()()1122211ˆnni iiii i nniii i x y nx y x x y y bxnxx x =-==---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)90;(2)ˆ4106y x =-+;(3)45. 【解析】(1)由611806i i y y -==∑,得8483807568806q +++++=,解得90q =. (2)经计算,613050i ii x y-=∑, 6.5x =,621271i i x -=∑,所以230506 6.580ˆ42716 6.5b-⨯⨯==--⨯, ˆ804 6.5106a=+⨯=,所以所求的线性回归方程为ˆ4106y x =-+. (3)由(2)知,当14x =时,1ˆ90y =;当25x =时,2ˆ86y =;当36x =时,3ˆ82y =;当47x =时,4ˆ78y=;当58x =时,5ˆ74y=;当69x =时,6ˆ70y =.与销售数据对比可知满足ˆ1i i y y -≤(1,2,,6i =⋅⋅⋅)的共有3个:()4,90,()6,83,()8,75.从6个销售数据中任取2个的所有可能结果有2665C 152⨯==(种),其中2个销售数据中至少有一个是“好数据”的结果有112333C C C 33312+=⨯+=(种),于是抽取的2个销售数据中至少有一个是“好数据”的概率为124155=. 考法二 非线性回归方程1.某同学的父亲决定今年夏天卖西瓜赚钱,根据去年6月份的数据统计连续五天内每天所卖西瓜的个数与温度之间的关系如下表:(1)求这五天内所卖西瓜个数的平均值和方差;(2)求变量x,y 之间的线性回归方程,并预测当温度为30 °C 时所卖西瓜的个数.附:b ̂=∑x i y i ni=1−nx̅y̅∑x i 2n i=1−nx̅2,a ̂=y ̅−b ̂x̅(精确到0.1). 【答案】(1)26,27.2(2)y ̂=2.2x −51,15 【解析】(1)y ̅=15×(20+22+24+30+34)=26,方差为s 2=15×[(20−26)2+(22−26)2+(24−26)2+(30−26)2+(34−26)2]=27.2. (2)x̅=15×(32+33+35+37+38)=35,∑x i 25i=1=6 151,∑x i y i 5i=1=4 608, 所以b ̂=∑x i y i 5i=1−5x̅y ̅∑x i 25i=1−5x̅2=4 608−5×35×266 151−5×352=5826≈2.2,a ̂=y ̅−b ̂x̅=26−2.2×35=−51, 所以回归直线方程为y ̂=2.2x −51,当x =30时,y =15,所以预测当温度为30 °C 时所卖西瓜的个数为15.2.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量()y g 与尺寸()mm x 之间近似满足关系式b y c x =⋅(b ,c 为大于0的常数).按照某指标测定,当产品质量与尺寸的比在区间()0.302,0.388内时为优等品.现随机抽取6件合格产品,测得数据如下:(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率; (2)根据测得数据作了初步处理,得相关统计量的值如下表:根据所给统计量,求y 关于x 的回归方程. 附:对于样本(),(1,2,,6)i i v u i =,其回归直线u b v a =⋅+的斜率和截距的最小二乘法估计公式分别为:()()()1122211ˆnniii i i i nniii i v v u u v u nv ubvv vnv ====---==--∑∑∑∑,ˆˆa u bv=-, 2.7183e ≈.【答案】(1)15;(2)0.5ˆyex =. 【解析】(1)由已知,优等品的质量与尺寸的比(0.302,0.388)yx∈ 则随机抽取的6件合格产品中,有3件为优等品,记为a ,b ,c , 有3件为非优等品,记为d ,e ,f ,现从抽取的6件合格产品中再任选2件,基本事件为:(,),(,),(,),(,)a b a c a d a e (, ),(, ),(, ),(,),(,),(,)a f b c b d b e b f c d(,),(,),(,),(,),(,)c e c f d e d f e f ,选中的两件均为优等品的事件为(,),(,),(,)a b a c b c ,所以所求概率为31155=. (2)对b y c x =⋅两边取自然对数得ln ln ln y c b x =+令ln ,ln i i i i v x u y ==,则u b v a =⋅+,且ln a c = 由所给统计量及最小二乘估计公式有:11222175.324.618.360.271ˆ101.424.660.542ni i nii v u nuvbvnv ==--⨯÷====-÷-∑∑ 118.324.62ˆˆ16au bv ⎛⎫-⨯ ⎪⎝⎭=-==, 由ˆˆln ac =得ˆc e =,所以y 关于x 的回归方程为0.5ˆyex =.3.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:经计算:611266i i x x ===∑,611336i i y y ===∑,61()()557i i i x x y y =--=∑,621()84i i x x =-=∑,621()3930ii y y =-=∑,621()23.6ˆ64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程^^^y b x a =+(结果精确到0.1);(2)若用非线性回归模型求得y 关于x 的回归方程0.23030.06ˆxye =,且相关指数为20.9522R =.(i)试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好;(ii )用拟合效果好的模型预测温度为35C 时该紫甘薯死亡株数(结果取整数). 附:对于一组数据11(,)u v ,22(,)u v ,,(,)n n u v ,其回归直线ˆˆv u αβ∧=+的斜率和截距的最小二乘估计分别为:121()()()niii ni i u u v v u u β∧==--=-∑∑,a v u β∧∧=-;相关指数为:22121()1()niii niii v v R v v ∧==-=--∑∑.【解析】(Ⅰ)由题意得,()()()121557= 6.6384ˆni i i n i i x x y y b x x ==--=≈-∑∑ ∴ˆa =33−6.63⨯26=−139.4,∴y 关于x 的线性回归方程为:ˆy =6.6x −139.4.(注:若用ˆ 6.6b≈计算出18.6ˆ3a =-,则酌情扣1分) (Ⅱ) (i )线性回归方程ˆy =6.6x −138.6对应的相关指数为:()()6221621236.641110.06020.93983930ˆi i i i ii y y R y y ==-=-=-≈-=-∑∑,因为0.9398<0.9522,所以回归方程0.2303ˆ0.06xye =比线性回归方程ˆy =6.6x −138.6拟合效果更好.(ii )由(i )知,当温度35x C =时,0.2303358.06050.060.060.063167190ˆye e ⨯==≈⨯≈, 即当温度为35︒C 时该批紫甘薯死亡株数为190.考法三 独立性检验1.为大力提倡“厉行节约,反对浪费”,某市通过随机调查100名性别不同的居民是否做到“光盘”行动,得到如下列联表:经计算()()()()()22 3.03n ad bcKa b c d a c b d-=≈++++.附表:参照附表,得到的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别无关”【答案】C【解析】由题意可知2 3.03K≈,结合临界值表可知2.706 3.03 3.841<<,因而在犯错误的概率不超过10%的前提下,认为“该市居民能否做到‘光盘’行动与性别有关”,或表述为有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别有关”;结合选项可知,C为正确选项,故选:C.2.2020年寒假,因为“新冠”疫情全体学生只能在家进行网上学习,为了研究学生网上学习的情况,某学校随机抽取100名学生对线上教学进行调查,其中男生与女生的人数之比为9:11,抽取的学生中男生有30人对线上教学满意,女生中有10名表示对线上教学不满意.(1)完成22⨯列联表,并回答能否有90%的把握认为“对线上教学是否满意与性别有关”;(2)从被调查的对线上教学满意的学生中,利用分层抽样抽取5名学生,再在这5名学生中抽取2名学生,作线上学习的经验介绍,求其中抽取一名男生与一名女生的概率.附:()()()()()22n ad bcKa b c d a c b d⋅=++++.【答案】(1)填表见解析;有90%的把握认为“对线上教学是否满意与性别有关”;(2)35.【解析】(1)22⨯列联表如下:又()22100301045153.03 2.70675254555K⨯-⨯=≈>⨯⨯⨯,这说明有90%的把握认为“对线上教学是否满意与性别有关”.(2)方法一:由题可知,从被调查中对线上教学满意的学生中,利用分层抽样抽取5名学生,其中男生2名,设为A、B;女生3人设为,,a b c,则从这5名学生中抽取2名学生的基本事件有:(),A B,(),A a,(),A b,(),A c,(),B a,(),B b,(),B c,(),a b,(),a c,(),b c,共10个基本事件,其中抽取一名男生与一名女生的事件有(),A a,(),A b,(),A c,(),B a,(),B b,(),B c,共6个基本事件,根据古典概型,从这5名学生中抽取一名男生与一名女生的概率为63 105=.方法二:由题可知,从被调查中对线上教学满意的学生中,利用分层抽样抽取5名学生,其中男生2名,设为;女生3人,根据古典概型,从这5名学生中抽取一名男生与一名女生的概率为11 22 2 563 105C CC==3.“微信运动”是一个类似计步数据库的公众账号,用户只需以运动手环或手机协处理器的运动数据为介,然后关注该公众号,就能看见自己与好友每日行走的步数,并在同一排行榜上得以体现.现随机选取朋友圈中的50人记录了他们某一天的走路步数,并将数据整理如下:规定:人一天行走的步数超过8000步时被系统评定为“积极性”,否则为“懈怠性”.(1)填写下面22⨯列联表(单位:人),并根据列联表判断是否有90%的把握认为“评定类型与性别有关”;附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (2)为了进一步了解“懈怠性”人群中每个人的生活习惯,从步数在3001~6000的人群中再随机抽取3人,求选中的人中男性人数超过女性人数的概率.【答案】(1)列联表见解析;没有90%的把握认为“评定类型与性别有关”;(2)310. 【解析】(1)22⨯列联表如下:根据列联表中的数据,得的观测值2K 的观测值()225020810120.231 2.70630203218K ⨯⨯-⨯=≈<⨯⨯⨯, 所以没有90%的把握认为“评定类型与性别有关”.(2)由已知可得从步数在3001~6000的人群有男性2人,女性3人.设步数在3001~6000中的男性的编号为1,2,女性的编号为a ,b ,c .设选中的人中男性人数超过女性人数为事件A .选取三人的所有情况为()1,2,a ,()1,2,b ,()1,2,c ,()1,,a b ,()1,,a c ,()1,,b c ,()2,,a b ,()2,,a c ,()2,,b c ,(),,a b c ,共10种情况.符合条件的情况有()1,2,a ,()1,2,b ,()1,2,c ,共3种情况.故所求概率为()310P A =. 4.为了提高生产效益,某企业引进一批新的生产设备,为了解设备生产产品的质量情况,分别从新、旧设备所生产的产品中,各随机抽取100件产品进行质量检测,所有产品质量指标值均在(]15,45以内,规定质量指标值大于30的产品为优质品,质量指标值在(]15,30以内的产品为合格品.旧设备所生产的产品质量指标值如频率分布直方图所示,新设备所生产的产品质量指标如频数分布表所示.(1)请分别估计新、旧设备所生产的产品优质品率;(2)优质品率是衡量一台设备性能高低的重要指标,优质品率越高说明设备的性能越高.根据已知图表数据填写下面列联表(单位:件),并判断是否有95%的把握认为“产品质量高低与新设备有关”;(3)已知每件产品的纯利润y (单位:元)与产品质量指标t 的关系式为2,30451,1530t y t <≤⎧=⎨<≤⎩.若每台新设备每天可以生产1000件产品,买一台新设备需要80万元,请估计至少需要生产多少天才可以收回设备成本.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)估计新、旧设备所生产的产品优质品率分别为70%、55%;(2)列联表见解析,有95%的把握认为“产品质量高低与新设备有关”,理由见解析;(3)471.【解析】(1)估计新设备所生产的产品优质品率为302515100%70%100++⨯=,估计旧设备所生产的产品优质品率为()50.060.030.02100%55%⨯++⨯=;(2)根据题中所给数据可得到如下22⨯列联表:()22220030557045 4.8 3.84110075125K ⨯⨯-⨯==>⨯⨯, 因此,有95%的把握认为“产品质量高低与新设备有关”; (3)新设备所生产的产品的优质品率为0.7,∴每台新设备每天所生产的1000件产品中,估计有10000.7700⨯=件优质产品,有300件合格品,则每台新设备每天所生产的产品的纯利润为700230011700⨯+⨯=(元), 8000001700471÷≈(天),因此,估计至少需要471天方可收回成本.。

高中数学选择性必修三 8 2 一元线性回归模型及其应用(精讲)(含答案)

高中数学选择性必修三 8 2 一元线性回归模型及其应用(精讲)(含答案)

8.2 一元线性回归模型及其应用(精讲)考点一 样本中心解小题【例1】(2021·江西赣州市)某产品在某零售摊位上的零售价x (元)与每天的销售量y (个)统计如下表:据上表可得回归直线方程为 6.4151y x =-+,则上表中的m 的值为( ) A .38B .39C .40D .41【答案】D 【解析】由题意1617181917.54x +++==,50343111544m my ++++==,所以115 6.417.51514m+=-⨯+,解得41m =.故选:D . 【一隅三反】1.(2021·江西景德镇市·景德镇一中)随机变量x 与y 的数据如表中所列,其中缺少了一个数值,已知y关于x 的线性回归方程为ˆ0.93yx =+,则缺少的数值为( )A .6B .6.6C .7.5D .8【答案】A【解析】设缺少的数值为m ,由于回归方程为ˆ0.93yx =+过样本中心点(),x y , 且2345645x ++++==,代入0.943 6.6y =⨯+=,所以5679 6.65my ++++==,解得6m =.故选:A.2.(2021·河南信阳市)根据如下样本数据:得到的回归方程为y bx a =+,则( ) A .0a >,0b > B .0a >,ˆ0b < C .0a <,0b > D .0a <,ˆ0b< 【答案】B【解析】由图表中的数据可得,变量y 随着x 的增大而减小,则ˆ0b<, 2345645x ++++==,4 2.50.5230.25y +---==,又回归方程y bx a =+经过点(4,0.2),可得0a >,故选:B .3.(2021·安徽六安市·六安一中)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y (单位:C )存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y 关于x 的线性回归方程0.25y x k =+.)C则当蟋蟀每分钟鸣叫62次时,该地当时的气温预报值为( ) A .33C B .34CC .35CD .35.5C【答案】D【解析】由表格中的数据可得2030405060405x ++++==,2527.52932.536305y ++++==,由于回归直线过样本中心点(),x y ,可得300.2540k =⨯+,解得20k =.所以,回归直线方程为0.2520y x =+.在回归直线方程中,令62x =,可得0.25622035.5y =⨯+=.故选:D.考点二一元线性方程【例2】(2021·兴义市第二高级中学)在2010年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x 元和销售量y 件之间的一组数据如下表所示: 通过分析,发现销售量y 对商品的价格x 具有线性相关关系,求 (1)销售量y 对商品的价格x 的回归直线方程; (2)若使销售量为12,则价格应定为多少.附:在回归直线ˆˆy bxa =+中1221ˆni ii nii x y nxyb xnx ==-=-∑∑,ˆˆay bx =- 【答案】(1) 3.240y x =-+ (2) 8.75 【解析】(1)由题意知10x =,8y =,∴999580635551083.28190.25100110.25121ˆ5100b++++-⨯⨯==-++++-⨯,8(3.2)1040a =--⨯=,∴线性回归方程是 3.240y x =-+;(2)令 3.24012y x =-+=,可得8.75x =,∴预测销售量为12件时的售价是8.75元.【一隅三反】1.(2020·河南开封市)配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一个马拉松跑者的心率y (单位:次/分钟)和配速x (单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,求y 与x 的线性回归方程;(2)该跑者如果参加本次比赛,将心率控制在160左右跑完全程,估计他跑完全程花费的时间,并估计他能获得的名次.参考公式:线性回归方程ˆˆˆybx a =+中,12()()ˆ()nii i nixx y y b xx =--=-∑∑,ˆˆay bx =- 参考数据:135y =.【答案】(1)25285x y ∧=-+;(2)210分钟,192名. 【解析】(1)由散点图中数据和参考数据得 4.55677.565x ++++==,1001091301651711355y ++++==,()()()51522222211.536(1)300(5)1(26) 1.5(35)25( 1.5)(1)01 1.5ˆiii i i x x y y bx x ==---⨯+-⨯+⨯-+⨯-+⨯-===--+-+++-∑∑,135(25)62ˆ85ˆay bx =-=--⨯=, 所以y 与x 的线性回归方程为25285x y ∧=-+. (2)将160y =代入回归方程得5x =,所以该跑者跑完马拉松全程所花的时间为425210⨯=分钟. 从马拉松比赛的频率分布直方图可知成绩好于210分钟的累积频率为()0.0008500.00242102000.064⨯+⨯-=,有6.4%的跑者成绩超过该跑者,则该跑者在本次比赛获得的名次大约是0.0643000192⨯=名.2.(2020·云南红河哈尼族彝族自治州)随着电商事业的快速发展,网络购物交易额也快速提升,特别是每年的“双十一”,天猫的交易额数目惊人.2020年天猫公司的工作人员为了迎接天猫“双十一”年度购物狂欢节,加班加点做了大量准备活动,截止2020年11月11日24时,2020年的天猫“双十一”交易额定格在3700多亿元,天猫总公司所有员工对于新的战绩皆大欢喜,同时又对2021年充满了憧憬,因此公司工作人员反思从2014年至2020年每年“双十一”总交易额(取近似值),进行分析统计如下表:(1)通过分析,发现可用线性回归模型拟合总交易额y 与年份代码t 的关系,请用相关系数加以说明; (2)利用最小二乘法建立y 关于t 的回归方程(系数精确到0.1),预测2021年天猫“双十一”的总交易额. 参考数据:71()()138.5ii i tt y y =--=∑26.7= 2.646≈;参考公式:相关系数()()niit t y y r --=∑;回归方程y bt a ∧∧∧=+中,斜率和截距的最小二乘估计公式分别为:()()()711722211niii ii i niii i tty y t y nx yb tttnx∧====---==--∑∑∑∑,=a y bt ∧∧-.【答案】(1)答案见解析;(2)回归方程为ˆ 4.9 1.2yt =-,预测2021年天猫“双十一”的总交易额约为38百亿.【解析】(1)4t =,721()28ii tt =-=∑,17()()138.5i ii t t yy =--=∑26.7=所以()()138.50.982 2.64626.7niit t y y r --=≈≈⨯⨯∑因为总交易额y 与年份代码t 的相关系数近似为0.98, 说明总交易额y 与年份代码t 的线性相关性很强,从而可用线性回归模型拟合总交易额y 与年份代码t 的关系. (2)因为18.4y =,721()28ii tt =-=∑,所以()()71271()138.5ˆ 4.928i ii i i t t yy bt t ==--==≈-∑∑, ˆˆay b =-,18.4 4.94 1.2b ≈-⨯=- 所以y 关于t 的回归方程为ˆ 4.9 1.2yt =- 又将2021年对应的8t =代入回归方程得:ˆ 4.98 1.238y=⨯-=. 所以预测2021年天猫“双十一”的总交易额约为38百亿.3.(2021·湖北省武昌实验中学高二期末)根据统计,某蔬菜基地西红柿亩产量的增加量y (百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若0.75r>,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式()()n ni i i ix x y y x y nx y r---==∑∑0.55≈0.95≈.回归方程y bx a=+中斜率和截距的最小二乘估计公式分别为()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y xb=-.【答案】(1)0.95;答案见解析;(2)0.3 2.5y x=+;610千克.【解析】(1)由已知数据可得2456855x++++==,3444545y++++==,所以()()()()()5131100010316i iix x y y=--=-⨯-+-⨯+⨯+⨯+⨯=∑,====所以相关系数()()50.95iix x y y r --===≈∑.因为0.75r >,所以可用线性回归模型拟合y 与x 的关系.(2)()()()5152160.320iii ii x x y y b x x ==--===-∑∑,450.3 2.5a =-⨯=, 所以回归方程为0.3 2.5y x =+. 当12x =时,0.312 2.5 6.1y =⨯+=,即当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为610千克.考点三 非一元线性方程【例3】(2020·全国高二课时练习)在一次抽样调查中测得5个样本点,得到下表及散点图.(1)根据散点图判断y a bx =+与1y c k x -=+⋅哪一个适宜作为y 关于x 的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立y 与x 的回归方程;(计算结果保留整数) (3)在(2)的条件下,设=+z y x 且[)4,x ∈+∞,试求z 的最小值.参考公式:回归方程ˆˆˆybx a =+中,()()()1122211ˆn niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)1y c k x -=+⋅;(2)41y x=+;(3)6. 【解析】(1)由题中散点图可以判断,1y c k x -=+⋅适宜作为y 关于x 的回归方程; (2)令1t x -=,则y c kt =+,原数据变为由表可知y 与t 近似具有线性相关关系,计算得4210.50.251.555t ++++==,16125217.25y ++++==,222222416212150.520.2515 1.557.238.4544210.50.255 1.559.3k ⨯+⨯+⨯+⨯+⨯-⨯⨯==≈++++-⨯,所以,7.24 1.551c y kt =-=-⨯=,则41y t =+. 所以y 关于x 的回归方程是41y x=+. (3)由(2)得41z y x x x=+=++,[)4,x ∈+∞, 任取1x 、24x ≥,且12x x >,即124x x >≥,可得()()()21121212121212124444411x x z z x x x x x x x x x x x x -⎛⎫⎛⎫⎛⎫-=++-++=-+-=-+ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭()()1212124x x x x x x --=,因为124x x >≥,则120x x ->,1216>x x ,所以,12z z >,所以,函数41z x x =++在区间[)4,+∞上单调递增,则min 44164z =++=. 【一隅三反】1.(2020·江苏省如皋中学高二月考)某种新产品投放市场一段时间后,经过调研获得了时间x (天数)与销售单价y (元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).表中10111,10i i i i w w w x ===∑.(1)根据散点图判断y a bx =+,与dy c x=+哪一个更适合作价格y 关于时间x 的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y 关于x 的回归方程. (3)若该产品的日销售量()g x (件)与时间x 的函数关系为()()100120g x x N x-=+∈,求该产品投放市场第几天的销售额最高?最高为多少元?附:对于一组数据()()()()112233,,,,,,...,,n n u v u v u v u v ,其回归直线vu αβ=+的斜率和截距的最小二乘法估计分别为121()(),()nii i nii vv u u v u u u βαβ==--==--∑∑.【答案】(1)dy c x =+更适合作价格y 关于时间x 的回归方程;(2)120(1)y x=+;(3)第10天,最高销售额为2420元;【解析】(1)根据散点图知dy c x=+更适合作价格y 关于时间x 的回归方程类型; (2)令1w x=,则y c dw =+, 而1011021()()18.4200.92()iii ii w w yy d w w ==--===-∑∑, 37.8200.8920c y dw =-=-⨯=,即有120(1)y x=+;(3)由题意结合(2)知:日销售额为1100()()20(1)(120)f x y g x x x=⋅=+-, ∴2110015()20(1)(120)400(6)f x x x x x=+-=+-, 若1t x =,令221121()655()1020h t t t t =+-=--+, ∴110t =时,max 1121()()1020h t h ==,即10x =天,max 121()(10)400242020f x f ==⨯=元, 所以该产品投放市场第10天的销售额最高,最高销售额为2420元.2.(2021·江苏苏州市)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①2y x αβ=+,②x t y e λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.令2i i u x >,()ln 1,2,,10i i v y i ==⋅⋅⋅,经计算得如下数据:(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据(1)的选择及表中数据,建立y 关于x 的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额y 为250亿元,请预测2021年的研发资金投入额x 为多少亿元?(结果精确到0.01)附:①相关系数()()niix x y y r --=∑,回归直线ˆˆˆya bx =+中:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =- ②参考数据:ln 20.693≈,ln5 1.609≈. 【答案】(1)模型x ty eλ+=的拟合程度更好;(2)(ⅰ)0.180.56ˆx ye +=;(ⅱ)27.56.【解析】(1)设{}i u 和{}i y 的相关系数为1r ,{}i x 和{}i v 的相关系数为2r ,由题意,()()101130.8715iiu u y y r --===≈∑,()()102120.9213iix x v v r --===≈∑,则12r r <,因此从相关系数的角度,模型x ty e λ+=的拟合程度更好.(2)(ⅰ)先建立v 关于x 的线性回归方程,由x ty eλ+=,得ln y t x λ=+,即v t x λ=+,()()()101102112ˆ65iii ii x x v v x x λ==--==-∑∑, 12ˆˆ 5.36260.5665tv x λ=-=-⨯=, 所以v 关于x 的线性回归方程为ˆ0.180.56vx =+, 所以ˆln 0.180.56yx =+,则0.180.56ˆx y e +=.(ⅱ)2021年盈利额250y =(亿元), 所以0.180.56250x e +=,则0.180.56ln 250x +=, 因为ln 2503ln5ln 23 1.6090.693 5.52=+≈⨯+=, 所以 5.520.5627.560.18x -≈≈.所以2021年的研发资金投入量约为27.56亿元.。

高考数学二轮复习考点题型专题讲解与练习31 线性和非线性回归7种题型归纳

高考数学二轮复习考点题型专题讲解与练习31 线性和非线性回归7种题型归纳

高考数学二轮复习考点题型专题讲解与练习第31讲线性和非线性回归7类【题型一】 线性回归【典例分析】如图是某地2014年至2020年生活垃圾无害化处理量(单位:万吨)的折线图.注:年份代码1~7分别对应年份2014~2020.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以证明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2022年某地生活垃圾无害化处理量. 附注:参考数据:719.32i i y ==∑,7140.17i i i t y ==∑0.55= 2.646.参考公式:相关系数()()nii tty y r --=∑ˆˆˆya bt =+中斜率和截距的最小二乘法估计公式分别为()()()121ˆniii ni i t t y y bt t ==--=-∑∑,ˆˆay bt =-.【变式演练】1.2020年全面建成小康社会取得伟大历史成就,决战脱贫攻坚取得决定性胜利.某市积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收,某商家统计了7个月的月广告投入x (单位:万元)与月销量y (单位:万件)的数据如表所示:(1)已知可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明,并求y 关于x 的线性回归方程;(2)根据(1)的结论,预计月广告投入大于多少万元时,月销量能突破70万件. 参考数据:()()71150i i i x x y y =--=∑,()721820i i y y=-=∑37.88.参考公式:相关系数()()niix x y y r --∑回归直线y bx a =+$$$的斜率和截距的最小二乘估计分别为()()()121niii nii x x yyb x x ==--=-∑∑,a y bx =-$$.2.根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村200名居民(未接种)5天内每天新接种疫苗的情况,得如下统计表:(1)建立y 关于x 的线性回归方程;(2)预测该村80%居民接种新冠疫苗需要几天?参考公式:回归方程y bx a =+$$$中斜率和截距的最小二乘估计公式分别为: 1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【题型二】 残差【典例分析】2018年9月17日,世界公众科学素质促进大会在北京召开,国家主席习近平向大会致贺信中指出,科学技术是第一生产力,创新是引领发展的第一动力某企业积极响应国家“科技创新”的号召,大力研发新产品,为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据{xi ,yi )(i =1,2,3,4,5,6),如表(1)求出p 的值;(2)已知变量x ,y 具有线性相关关系,求产品销量y (件)关于试销单价:x (百元)的线性国归方程y bx a =+$$$(计算结果精确到整数位); (3)用表示用正确的线性回归方程得到的与x 对应的产品销的估计值当销售数据(xi ,yi )的残差的绝对值|yi ﹣y |<1时,则将销售数据称为一个“有效数据”现从这6组销售数中任取2组,求抽取的2组销售数据都是“有效数据”的概率.参考公式及数据611 6i y ==∑yi =80,61i i i x y ==∑1606,621 i i x ==∑91,()()()1122211n niii ii i nniii i x x y y x y nxy b x x x nx====---==--∑∑∑∑,a y bx =-.【变式演练】1.“大众创业,万众创新”是李克强总理在本届政府工作报告中向全国人民发出的口号.某生产企业积极响应号召,大力研发新产品.为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据(,)(1,2,,6)i i x y i =,如下表所示:已知611806i i y y ===∑.(1)求出q 的值;(2)已知变量x ,y 具有线性相关关系,求产品销量y (件)关于试销单价x (元)的线性回归方程ˆˆˆybx a =+;(3)用ˆi y表示用正确的线性回归方程得到的与i x 对应的产品销量的估计值.当销售数据(,)i i x y 的残差的绝对值ˆ||1i i y y -≤时,则将销售数据(,)i i x y 称为一个“好数据”.现从6个销售数据中任取2个,求抽取的2个销售数据中至少有1个是“好数据”的概率.2..医学中判断男生的体重是否超标有一种简易方法,就是用一个人身高的厘米数减去105所得差值即为该人的标准体重.比如身高175cm 的人,其标准体重为175-105=70公斤,一个人实际体重超过了标准体重,我们就说该人体重超标了.已知某班共有30名男生,从这30名男生中随机选取6名,其身高和体重的数据如表所示:(1)从这6人中任选2人,求恰有1人体重超标的概率;(2)依据上述表格信息,用最小二乘法求出了体重y 对身高x 的线性回归方程:0.65y x a =+,但在用回归方程预报其他同学的体重时,预报值与实际值吻合不好,需要对上述数据进行残差分析.按经验,对残差在区间[]3.5,3.5-之外的同学要重新采集数据.问上述随机抽取的编号为3,4,5,6的四人中,有哪几位同学要重新采集数据? 参考公式:残差i i i e y bx a =--.【题型三】 剔除数据重新计算【典例分析】习近平总书记在党的十九大报告中指出,要在“幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶”上不断取得新进展,保证全体人民在共建共享发展中有更多获得感.现S 市政府针对全市10所由市财政投资建设的敬老院进行了满意度测评,得到数据如下表:(1)求投资额y 关于满意度x 的相关系数;(2)我们约定:投资额y 关于满意度x 的相关系数r的绝对值在0.75以上(含0.75)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则采取“末位淘汰”制(即满意度最低的敬老院市财政不再继续投资,改为区财政投资).求在剔除“末位淘汰”的敬老院后投资额y 关于满意度x 的线性回归方程(系数精确到0.1) 参考数据:21.9,72.1x y ==,1022110288.9=-=∑ii x x 37.16≈,10110452.1i i i x y x y =-⋅=∑,17≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为:1221ˆˆˆ,ni ii nii x y nx ybay bx xnx==-⋅==--∑∑.线性相关系数ni ix y nx yr -⋅∑专题18 概率与统计综合-2020年高考数学(文)母题题源解密(全国Ⅱ专版)【变式演练】1.BMI 指数是用体重公斤数除以身高米数的平方得出的数值,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.对于高中男体育特长生而言,当BMI 数值大于或等于20.5时,我们说体重较重,当BMI 数值小于20.5时,我们说体重较轻,身高大于或等于170cm 时,我们说身高较高,身高小于170cm 时,我们说身高较矮.某中小学生成长与发展机构从某市的320名高中男体育特长生中随机选取8名,其身高和体重的数据如表所示:(1)根据最小二乘法的思想与公式求得线性回归方程ˆ0.875.9yx =-.利用已经求得的线性回归方程,请完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值2R (保留两位有效数字);(2)通过残差分析,对于残差的最大(绝对值)的那组数据,需要确认在样本点的采集中是否有人为的错误.已知通过重新采集发现,该组数据的体重应该为58(kg ).请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.参考公式: ()()()()221112222111ˆ1.()ˆnnniiiii ii i i nnniiii i i y yx x yy x ynxy R y y x x n bxx ======----=-==---∑∑∑∑∑∑,ˆˆa y bx =-.ˆˆˆi i ie y bx a =--. 参考数据:8178880i i i x y ==∑,821226112ii x ==∑,168x =,58.5y =,()821226i i y y =-=∑.河北省石家庄市第二中学(南校区)2019-2020学年高三下学期教学质量检测模拟数学(理)试题2.某手机公司生产某款手机,如果年返修率不超过千分之一,则生产部门当年考核优秀,现获得该公司2010-2018年的相关数据如下表所示:(1)(理)专题1.5 概率与统计-回归分析、独立性检验-2021年高考数学解答题挑战满分专项训练(新高考地区专用)从该公司2010-2018年的相关数据中任意选取3年的数据,以X 表示3年中生产部门获得考核优秀的次数,求X 的分布列和数学期望;(2)根据散点图发现2015年数据偏差较大,如果去掉该年的数据,试用剩下的数据求出年利润y (千万元)关于年生产量x (万台)的线性回归方程(精确到0.01).部分计算结果:911 6.29i i y y ===∑,921509ii x==∑,91434.1i i i x y ==∑.附:()()=年返修量台年返修率年生产量台;线性回归方程y bx a =+$$$中,()()()1122211n niii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【题型四】 非线性回归1:指数型【典例分析】从集市上买回来的蔬菜仍存有残留农药,食用时需要清洗数次,统计表中的x 表示清洗的次数,y 表示清洗x 次后1千克该蔬菜残留的农药量(单位:微克).(1)在如图的坐标系中,描出散点图,并根据散点图判断,y bx a =+$$$与ˆˆˆx yme n -=+哪一个适宜作为清洗x 次后1千克该蔬菜残留的农药量的回归方程类型;(给出判断即可,不必说明理由)(2)根据判断及下面表格中的数据,建立y 关于x 的回归方程; 表中ix i eω-=,5115i i ωω==∑.(3)对所求的回归方程进行残差分析.附:①线性回归方程y bx a =+$$$中系数计算公式分别为121()()()ˆniii ni i x x y y bx x ==--=-∑∑,a y bx =-$$;②22121()1()nii i n ii yy R yy ==-=--∑∑,20.95R >说明模拟效果非常好;③10.37e ≈,210.14e ≈,310.05e ≈,410.02e ≈,510.01e≈.【变式演练】1.为了研究一种昆虫的产卵数y 和温度x 是否有关,现收集了7组观测数据列于下表中,并做出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈现线性相关关系,现分别用模型①212y C x C =+与模型;②34C x C y e +=作为产卵数y 和温度x 的回归方程来建立两个变量之间的关系.其中2i i t x =,7117i i t t ==∑,ln i iz y =,7117i i z z ==∑. 附:对于一组数据()()()1122,,,,,n n μνμνμν,其回归直线νβμα=+的斜率和截距的最小二乘估计分别为:()()()121n i iin i iμμννμβμ==---=∑∑,ανβμ=-.(1)根据表中数据,模型①、②的相关指数计算分别为210.82R =,220.96R =,请根据相关指数判断哪个模型的拟合效果更好.(2)根据(1)中的判断,在拟合效果更好的模型下求y 关于x 的回归方程;并估计温度为30℃时的产卵数.(1C ,2C ,3C ,4C 与估计值均精确到小数点后两位) (参考数据: 4.6518e 04.5≈, 4.8514e 27.7≈, 5.0512e 56.0≈)2.近年来,由于耕地面积的紧张,化肥的施用量呈增加趋势.一方面,化肥的施用对粮食增产增收起到了关键作用,另一方面,也成为环境污染、空气污染、土壤污染的重要来源之一如何合理地施用化肥,使其最大程度地促进粮食增产,减少对周围环境的污染成为需要解决的重要问题研究粮食产量与化肥施用量的关系,成为解决上述问题的前提某研究团队收集了10组化肥施用量和粮食亩产量的数据并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值化肥施用量为x (单位:公斤),粮食亩产量为y (单位:百公斤).参考数据:表中ln ,ln (1,2,,10)i i i i t x z y i ===.(1)根据散点图判断,y a bx =+与d y cx =,哪一个适宜作为粮食亩产量y 关于化肥施用量x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)根据(2)的回归方程,并预测化肥施用量为27公斤时,粮食亩产量y 的值; 附:①对于一组数据(),(1,2,3,,)i i u v i n =,其回归直线ˆˆˆv u βα=+的斜率和截距的最小二乘估计分别为1221,ˆˆˆni i i ni i u v nuvav u unu ββ==-==--∑∑;②取 2.7e ≈.【题型五】 非线性回归2:反比例型【典例分析】为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量y (单位:3g/m )与样本对原点的距离x (单位:m )的数据,并作了初步处理,得到了下面的一些统计量的值.(表中1i i u x =,9119i i u u ==∑).(1)利用样本相关系数的知识,判断y a bx =+与dy c x=+哪一个更适宜作为平均金属含量y 关于样本对原点的距离x 的回归方程类型? (2)根据(1)的结果回答下列问题: (i )建立y 关于x 的回归方程;(ii )样本对原点的距离20x =时,金属含量的预报值是多少?(iii )已知该金属在距离原点m x 时的平均开采成本W (单位:元)与x ,y 关系为()1000ln W y x =-()1100x ≤≤,根据(2)的结果回答,x 为何值时,开采成本最大?附:对于一组数据()()()1122,,,,,,n n t s t s t s ⋅⋅⋅,其线性相关系数()()niit t s s r --=∑,其回归直线s t αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii tts s ttβ==--=-∑∑,ˆˆs t αβ=-.【变式演练】1.近年来,政府相关部门引导乡村发展旅游的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲,乙两同学一起收集6家农户的数据,进行回归分析,得到两个回归摸型:模型①:(1) 1.6285ˆ5.7yx =-+,模型②: (2)26.6 3.ˆ7150y x=+,对以上两个回归方程进行残差分析,得到下表:(1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好;(2)视残差i e 的绝对值超过1.5的数据视为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求回归方程.附:()()()121nii i nii xx y yb x x ==--=-∑∑, a y bx =-$$;222220.270.380.97 1.020.28 2.277++++=2.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额x (单位:亿元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额i x 和年盈利额i y 的数据.通过对比分析,建立了两个函数模型:①y a bx =+;②dy c x=+,若对于任意一点(,)(12......)i i i P x y i n =,,,过点i P 作与x 轴垂直的直线,交函数y a bx =+的图象于点(',')i i i A x y ,交函数dy c x =+的图象于点('','')i i i B x y ,定义:11'ni i i Q y y ==-∑,21''ni i i Q y y ==-∑,若12Q Q <则用函数y a bx =+来拟合y 与x 之间的关系更合适,否则用函数dy c x=+来拟合y 与x 之间的关系.(1)给定一组变量123456(1,4),(2,5),(3,6),(4,6.5),(5,7),(6,8)P P P P P P ,对于函数23x y +=与函数52x y x-=,试利用定义求1Q ,2Q 的值,并判断哪一个更适合作为点(,)(1,2,......6)i i i P x y i =中的y 与x 之间的拟合函数;(2)若一组变量的散点图符合dy c x=+图象,试利用下表中的有关数据与公式求y 与x 的回归方程,并预测当=10x 时,y 的值为多少.表中的1=x ω,811=8i i ωω=∑附:对于一组数据11(,)u v ,22(,)u v ,⋅⋅⋅(,)n n u v ,其回归直线方程v u αβ=+的斜率和截距的最小二乘估计分别为121()()=()niii nii u u v v u u β==---∑∑,v u αβ=-【题型六】 非线性回归3:对数型【典例分析】某投资公司2012年至2021年每年的投资金额x (单位:万元)与年利润增量y (单位:万元)的散点图如图:该投资公司为了预测2022年投资金额为20万元时的年利润增量,建立了y 关于x 的两个回归模型;模型①:由最小二乘公式可求得y 与x 的线性回归方程: 2.5020ˆ.5yx =-;模型②:由图中样本点的分布,可以认为样本点集中在由线:ln y b x a =+的附近,对投资金额x 做换元,令ln t x =,则y b t a =⋅+,且有101010102111122.00,230,569.00,50.92i i i i i i i i i t y t y t ========∑∑∑∑,(1)根据所给的统计量,求模型②中y 关于x 的回归方程;(2)分别利用这两个回归模型,预测投资金额为20万元时的年利润增量(结果保留两位小数);附:样本()()1,1,2,,i t y i n =⋯的最小乘估计公式为()()()121ˆˆˆ,niii ni i t t y y bay bt t t ==--==--∑∑;参考数据:ln20.6931,ln5 1.6094≈≈.【变式演练】1.有一种速度叫中国速度,有一种骄傲叫中国高铁.中国高铁经过十几年的发展,取得了举世瞩目的成就,使我国完成了从较落后向先进铁路国的跨越式转变.中国的高铁技术不但越来越成熟,而且还走向国外,帮助不少国家修建了高铁.高铁可以说是中国一张行走的名片.截至到2020年,中国高铁运营里程已经达到3.9万公里.下表是2013年至2020年中国高铁每年的运营里程统计表,它反映了中国高铁近几年的飞速发展:根据以上数据,回答下面问题.(1)甲同学用曲线y =bx +a 来拟合,并算得相关系数r 1=0.97,乙同学用曲线y =cedx 来拟合,并算得转化为线性回归方程所对应的相关系数r 2=0.99,试问哪一个更适合作为y 关于x 的回归方程类型,并说明理由;(2)根据(1)的判断结果及表中数据,求y 关于x 的回归方程(系数精确到0.01).参考公式:用最小二乘法求线性回归方程的系数公式:121()()ˆˆ,()niii nii x x y y ba y bxx x ==--==--∑∑;参考数据:882112.48,()()15.50,()42.00,i i i i i y x x y y x x ===--=-=∑∑令()()()8820.1411ln ,0.84, 6.50, 1.01, 1.15.i i i i i w y w x x w w w w e ====--=-==∑∑2.某电器企业统计了近10年的年利润额y (千万元)与投入的年广告费用x (十万元)的相关数据,散点图如图,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关数据如表所示:(1)从①y bx a =+;②()0,0ky m x m k =⋅>>;③2y cx dx e =++三个函数中选择一个作为年广告费用x 和年利润额y 的回归类型,判断哪个类型符合,不必说明理由; (2)根据(1)中选择的回归类型,求出y 与x 的回归方程;(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元) 参考数据:3103.67883.678849.787e≈≈, 参考公式:回归方程ˆˆˆv bu a =+中斜率和截距的最小二乘估计公式分别为1221ˆni i i ni i u v nxybunu==-=-∑∑【题型七】 非线性回归4:其他函数型【典例分析】光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能.近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如下表:某位同学分别用两种模型:①2y bx a =+,②y dx c =+进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差等于i i y y -):经过计算得()()8172.8i i i x x y y =--=∑,()82142i i x x=-=∑,()()81686.8i ii t ty y =--=∑,()8213570i i t t =-=∑,其中2i it x =,8118i i t t ==∑.(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由.(2)根据(1)的判断结果及表中数据建立y 关于x 的回归方程,并预测该地区2020年新增光伏装机量是多少.(在计算回归系数时精确到0.01)附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-$$.【变式演练】1.2021年11月4日,第四届中国国际进口博览会在上海开幕,共计2900多家参展商参展,420多项新产品,新技术,新服务在本届进博会上亮相.某投资公司现从中选出20种新产品进行投资.为给下一年度投资提供决策依据,需了解年研发经费对年销售额的影响,该公司甲、乙两部门分别从这20种新产品中随机地选取10种产品,每种产品被甲、乙两部门是否选中相互独立.(1)求20种新产品中产品A 被甲部门或乙部门选中的概率;(2)甲部门对选取的10种产品的年研发经费i x (单位:万元)和年销售额()1,2,,10i y i =(单位:十万元)数据作了初步处理,得到下面的散点图及一些统计量的值.根据散点图现拟定y 关于x 的回归方程为()23y b x a =-+.求a 、b 的值(结果精确到0.1);(3)甲、乙两部门同时选中了新产品A ,现用掷骰子的方式确定投资金额.若每次掷骰子点数大于2,则甲部门增加投资1万元,乙部门不增加投资;若点数小于3,则乙部门增加投资2万元,甲部门不增加投资,求两部门投资资金总和恰好为100万元的概率.附:对于一组数据()11,vu 、()22,v u 、L 、(),n n v u ,其回归直线u v αβ=+的斜率和截距的最小二乘估计分别为()()()121niii ni i v v u u v vβ==--=-∑∑,µµu v αβ=-,20162057.529877320520.5277-⨯=-⨯,2016657.51019877365 6.55567-⨯=-⨯.2.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:吨)的影响,对近8年的年宣传费i x 和年销售量i y ()1,2,3,,8i =数据作了初步处理,得到下面的散点图及一些统计量的值.表中:1w =8118i i w w ==∑(1)根据散点图判断,y a bx =+与y c =+y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)根据(2)中的回归方程,求当年宣传费36x =千元时,年销售预报值是多少?附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归线v u αβ=+的斜率和截距的最小二乘估计分别为:()()()81821iii ii u u v v u u β==--=-∑∑,v u αβ=-.【课后练习】1.某课外活动兴趣小组为了解某种植物的生长情况,收集了该种植物月生长量()cm y 与月平均气温x (℃)的6组数据.(1)请根据上面的数据求y 关于x 的线性回归方程(结果保留1位小数);(2)利用(1)中求出的线性回归方程进行残差分析.若用ˆˆˆy bx a =+中的ˆy 估计回归方程y bx a e =++中的bx a +,由于随机误差()e y bx a =-+,所以ˆˆey y =-是e 的估计值,ˆi e 为相应点(),i i x y 的残差.请填写下面的残差表,并绘制残差图,根据得到的残差图,分析该回归方程的拟合效果. 残差表:残差图:参考数据:61105i i x ==∑,6144i i y ==∑,61815i i i x y ==∑,()621375i i x x=-=∑..参考公式:线性回归方程ˆˆˆybx a =+中,()121ˆni ii nii x y nxyb x x ==-=-∑∑,ˆˆay bx =-.2.某新兴环保公司为了确定新开发的产品下一季度的营销计划,需了解月宣传费x (单位:千元)对月销售量y (单位:t )和月利润z (单位:千元)的影响,收集了2019年12月至2020年5月共6个月的月宣传费i x 和月销售量i y (1,2,,6i =⋯)的数据如下表:现分别用两种模型①y bx a =+,②bx y ae =分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:(注残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.)(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;(2)残差绝对值大于2的数据被认为是异常数据,需要剔除,剔除异常数据后求出(1)中所选模型的回归方程;(3)已知该产品的月利润z 与x ,y 的关系为()2253z y x =-,根据(2)的结果回答下列问题: (i )若月宣传费15x =时,该模型下月销售量y 的预报值为多少? (ii )当月宣传费x 为何值时,月利润z 的预报值最大?附:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+$$$的斜率和截距的最小二乘估计分别为()()()1122211nniii ii i nn i i ii x x y y x y nx yb x nx x x ====---==--∑∑∑∑$,a y bx =-$$3.(衡水金卷高三一轮复习摸底测试卷数学(三))千百年来,人们一直在通过不同的方式传递信息.在古代,烽火狼烟、飞鸽传书、快马驿站等通信方式被人们广泛应用;第二次工业革命后,科技的进步带动了电讯事业的发展,电报电话的发明让通信领域发生了翻天覆地的变化;之后,计算机和互联网的出现则使得“千里眼”“顺风耳”变为现实.现在,5G 的到来给人们的生活带来颠覆性的变革,某科技创新公司基于领先技术的支持,5G 经济收入在短期内逐月攀升,该创新公司在第1月份至6月份的5G 经济收入y (单位:百万元)关于月份x 的数据如表:根据以上数据绘制散点图,如图.(1)根据散点图判断,y ax b =+与,,,(dx y ce a b c d =均为常数)哪一个适宜作为5G 经济收入y 关于月份x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的结果及表中的数据,求出y 关于x 的回归方程,并预测该公司8月份的5G 经济收入; (3)从前6个月的收入中抽取3个﹐记月收入超过16百万的个数为X ,求X 的分布列和数学期望. 参考数据:其中设()ln ,ln 1,2,3,4,5,6i i u y u y i ===参考公式和数据:对于一组具有线性相关关系的数据()()1,2,,3,,i i x v i n =⋯,其回归直线v x βα=+的斜率和截距的最小二乘估计公式分别为:()()()121ˆniii nii x x v v x x β==--=-∑∑,4.56 4.58,95.58,97.51.a v x e e β=-≈≈4.某保险公司根据官方公布的历年营业收入,制成表格如下: 表1由表1,得到下面的散点图:根据已有的函数知识,某同学选用二次函数模型2y bx a =+(b 和a 是待定参数)来拟合y 和x 的关系.这时,可以对年份序号做变换,即令2t x =,得y bt a =+,由表1可得变换后的数据见表2. 表2(1)根据表中数据,建立y 关于t 的回归方程(系数精确到个位数);(2)根据(1)中得到的回归方程估计2021年的营业收入,以及营业收入首次超过4000亿元的年份.附:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线ˆˆv u βα=+的斜率和截距的最小二乘估计分别为()()()121ˆ niii nii u u v v u u β==--=-∑∑,ˆˆv u αβ=-. 参考数据:()()()10102451138.5,703.45, 1.05110, 2.32710i i ii i t y t tt ty y ===≈-≈⨯--≈⨯∑∑.5.自从新型冠状病毒爆发以来,美国疫情持续升级,以下是美国2020年4月9日-12月14日每隔25天统计1次共计11次累计确诊人数(万).(1)将4月9日作为第1次统计,若将统计时间序号作为变量x ,每次累计确诊人数作为变量x ,得到函数关系()0,0bxy aea b =>>,对上表的数据作初步处理,得到部分数据已作近似处理的一些统计量的值6x =,603.09y =,1111ln 5.9811i i y ==∑,()()11115835.70i i i x y x y =--=∑,()1121110i i x x=-=∑,()1121ln ln 11.90ii y y =-=∑,()()111ln ln 35.10i i i x x y y =--=∑, 4.0657.97e ≈, 4.0758.56e ≈, 4.0859.15e ≈,根据相关数据,确定该函数关系式(参数a ,b 的取值精确到0.01);(2)为了了解患新冠肺炎与年龄的关系,已知某地曾患新冠肺炎的老年、中年、青年的人数分别为45人,30人,15人,按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少有一人是老年人的概率.参考公式:线性回归方程y bx a =+$$$中,()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-$$;6.2020年新型冠状病毒肺炎疫情席卷金球,我国在全力保障口罩、防护服等医疗物资供给基础上,重点开展医疗救治急需的呼吸机、心电监护仪等医疗设备的组织生产和及时供应,统筹协调医用物资生产企业高速生产,支援世界各国抗击肺炎疫情.我市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1目~9月9日连续9天的呼吸机日生产量为i y (单位:百台.., ),数据作了初步处理;得到如图所示的散点图.注:图中日期代码1~9分别对应9月1日~9月9日;表中,(1)从9个样本点中任意选取2个,在2个样本点的生产量都不高于300台的条件下,求2个样本点都高于200台的概率;(2)由散点图分析,样本点都集中在曲线的附近,求y关于t的方程,并估计该公司从生产之日起,需要多少天呼吸机日生产量可超过500台.参考公式:回归直线方程是;,,参考数据:.7.(四川省成都市郫都区高三上学期阶段性检测(二)文科数学试题)某公司对某产品作市场调研,获得了该产品的定价x(单位:万元/吨)和一天销售量y(单位:吨)的一组数据,制作了如下的数据统计表,并作出了散点图.。

线性回归方程的高考题

线性回归方程的高考题

线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:已知:.(Ⅰ)画出散点图;(1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:(1)画出散点图:(2)求回归直线方程;(3)据此估计广告费用为10时,销售收入的值.6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。

高三数学 线性回归分析

高三数学 线性回归分析
xi yi 4950 6900 9125 12150 15575 18000 20475
x 30,
y 399.3,
7
7
xi2 7000,
yi2 1132725,
i 1
i 1
7
xi yi 87175.
i 1
由上表所可知:
n
b
i1 n
xi yi nxy xi2 nx2
87175 730399.3 7000 7302
二、现实生活中存在着大量的相关关系。
如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等
三、回归分析
定义:对具有相关关系的两个变量 进行统计分析的方法。
实质:通俗地讲,回归分析是寻找
相关关系中非确定性关系的某种确定性。
例1:在7块并排、形状大小相同的试验田 上进行施化肥量对水稻产量影响的试验, 得到如下表所示的一组数据(单位:kg) :
xi yi nxy xi2 nx2
87175 730399.3 7000 7302
4.75,
i1
a y bx 399.34.7530 257.
因此所求回归直线方程是:
yˆ 4.75x 257
(5)回归直线方程的用途:
可以利用它求出相应于x的估计值。 例如:当x=28kg时,y的估计值是多少呢?
1、定义:
自变量取值一定时,因变量的取值带有一 定随机性的两个变量之间的关系叫做相关关系。
注 1):相关关系是一种不确定性关系;
2):对具有相关关系的两个变量进行 统计分析的方法叫回归分析。
相关关系
函数关系
相同点
均是指两个变量的关系
非确定关系

线性回归方程

线性回归方程

线性回归方程知识定位线性回归方程在全国卷中有所考察,往往以解答题形式出现,考察难度中等,主要掌握以下内容即可:①会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系. ②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.知识梳理知识梳理1:相关关系和函数关系在实际问题中,变量之间的常见关系有两类: 一类是确定性函数关系,变量之间的关系可以用函数表示。

例如正方形的面积S 与其边长之间的函数关系(确定关系);一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达。

例如一块农田的水稻产量与施肥量的关系(非确定关系) 相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。

相关关系与函数关系的异同点:相同点:均是指两个变量的关系。

不同点:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。

知识梳理2:求回归直线方程的思想方法观察散点图的特征,发现各点大致分布在一条直线的附近,思考:类似图中的直线可画几条?引导学生分析,最能代表变量x 与y 之间关系的直线的特征:即n 个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为,其中a 、b 是待定系数。

则,于是得到各个偏差。

显见,偏差的符号有正负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n 个偏差的平方和表示n 个点与相应直线在整体上的接近程度。

记。

x 2x S =ˆybx a =+ˆ(1,2,,)i i ybx a i n =+=⋅⋅⋅⋅ˆˆ(),(1,2,...)i i i yy y bx a i n -=-+=ˆˆi yy -2221122()()....()n n Q y bx x y bx a y bx a =--+--++--21()nii i Q ybx a ==--∑上述式子展开后,是一个关于a ,b 的二次多项式,应用配方法,可求出使Q 为最小值时的a ,b 的值,即其中例题精讲【试题来源】【题目】下列各组变量哪个是函数关系,哪个是相关关系? (1)电压U 与电流I (2)圆面积S 与半径R(3)自由落体运动中位移s 与时间t (4)粮食产量与施肥量 (5)人的身高与体重(6)广告费支出与商品销售额 【答案】见解析【解析】分析:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。

高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精讲)(含答案)

高中数学选择性必修三 精讲精炼 8  一元线性回归模型及其应用(精讲)(含答案)

8.2 一元线性回归模型及其应用(精讲)考点一样本中心求参数【例1-1】(2021·全国·高二课时练习)若两个变量x,y是线性相关的,且样本()(),1,2,,i ix y i n=的中心点为()3,2.5,则由这组样本数据算得的回归直线方程不可能是( )A.ˆ0.51y x=+B.ˆ0.60.7y x=+C.ˆ0.2 1.9y x=+D.ˆ 1.5y x=-【答案】D【解析】因为0.531 2.5⨯+=,即点()3,2.5在回归直线ˆ0.51y x=+上,所以A有可能;因为0.630.7 2.5⨯+=,即点()3,2.5在回归直线ˆ0.60.7y x=+上,所以B有可能;因为0.23 1.9 2.5⨯+=,即点()3,2.5在回归直线ˆ0.2 1.9y x=+上,所以C有可能;因为3 1.5 1.5 2.5-=≠,即点()3,2.5不在回归直线ˆ 1.5y x=-上,所以D没有可能.故选:D.【例1-2】(2021·广西河池)根据下表中数据求得的线性回归方程是4y x a=-+,则=a( )A .98B .107C .110D .106【答案】D【解析】由已知得,139(456789)66x =+++++=,1(908483807568)806y =+++++=, ∴398046a =-⨯+,即106a =.故选:D 【一隅三反】1.(2021·河北·藁城新冀明中学高二月考)实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .ˆ1yx =+ B .ˆ2y x =+ C .ˆ21y x =+ D .ˆ1y x =- 【答案】A【解析】由已知可得11(1234) 2.5,(2345) 3.544x y =⨯+++==⨯+++=, 所以这组数据的样本中心点为(2.5,3.5), 因为样本中心必在回归直线上,所以把样本中心点代入四个选项中验证,可得只有1y x =+成立, 故选:A.2.(2021·陕西·西北工业大学附属中学 )为了研究某班学生的听力成绩x (单位:分)与笔试成绩y (单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x 与y 之间有线性关系,设其回归直线为y bx a =+,已知201400i i x ==∑,2011580i i y ==∑,1a =-,若该班某学生的听力成绩为26,据此估计其笔试成绩约为( )A .99B .101C .103D .105【答案】C【解析】201400i i x ==∑,故4002020x ==;2011580i i y ==∑,故15807920y ==, 故点()20,79在回归直线上,即79201b =-,得4b =, 即41y x =-,当26x =时,代入计算得到103y =. 故选:C.3.(2021·广东肇庆 )某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间x (单位:小时)与工资y (单位:元)之间的关系如下表:若y 与x 的线性回归方程为ˆ 6.5yx a =+,预测当工作时间为9小时时,工资大约为( ) A .75元 B .76元C .77元D .78元【答案】B【解析】由表格数据知:2456855x ++++==,3040506070505y ++++==,6.55032.517.5a y x ∴=-=-=,∴线性回归方程为ˆ 6.517.5yx =+, 6.5917.576∴⨯+=,即当工作时间为9小时时,工资大约为76元.故选:B.4.(2021·全国·高三专题练习)为了研究某种细菌在特定环境下随时间变化的繁殖情况,得到的实验数据如下表,并由此计算得到回归直线方程ˆ0.850.25yx =-,后来工作人员不慎将下表中的实验数据c 丢失.则上表中丢失的实验数据c 的值为( ) A .1 B .1.5 C .2 D .2.5【答案】D【解析】由表中数据可得3456755x ++++==,34 4.5617.555c c y +++++==,将点17.5(5,)5c +代入ˆ0.850.25yx =-中,得17.50.8550.255c +=⨯-,解得 2.5c =, 所以丢失的实验数据c 的值为2.5.故选:D考点二 线性回归方程【例2】(2021·江西赣州)某特色餐馆开通了美团外卖服务,在一周内的某特色菜外卖份数x (份)与收入y (元)之间有如下的对应数据:(1)画出散点图;(2)请根据以上数据用最小二乘法原理求出收入y 关于份数x 的线性回归方程; (3)据此估计外卖份数为12份时,收入为多少元.注:①参考方式:线性回归方程系数公式1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-;②参考数据:521145ii x ==∑,52113500ii y ==∑,511380i i i x y ==∑.【答案】(1)图象见解析(2) 6.517.5y x =+(3)95.5 【解析】(1)解:作出散点图如下图所示:(2)解:2456855x ++++==,3040605070505y ++++==,已知521145i i x ==∑,511380i i i x y ==∑,则1222551513805550ˆ 6.5145555i iiii x y x ybx x==--⨯⨯===-⨯-∑∑,50 6.5517.5a y bx =-=-⨯=, 因此,线性回归方程为 6.517.5y x =+. (3)解:12x =时,12 6.517.595.5y =⨯+=, 即外卖份数为12份时,收入大约为95.5元. 【一隅三反】1.(2021·贵州·凯里一中 )凯里市2017至2021年农村居民家庭纯收入y (单位:千元)的数据如下表:从表出看出,人均纯收入y 与年份代号t 线性相关,已知516470.i i i t y ==∑.(1)求y 关于t 的线性回归方程y bt a =+;(2)预测2025年的人均纯收入为多少.(附:参考公式:1122211()()()nnii i ii i nniii i tt y y t y nt yb tt tnt====---==--∑∑∑∑,a y bt =-).【答案】(1)0.47 2.59y t =+(2)6.82【解析】(1)由题中表格知,5n =,1(12345)35t =++++=,1(3.1 3.5 3.9 4.6 4.9)45y =++++=,522222211234555i i t==++++=∑,则5152221564.75340.4755535i ii i i t y t yb t t==--⨯⨯===-⨯-∑∑,40.473 2.59a y bt =-=-⨯=,故回归直线方程为0.47 2.59y t =+.(2)当年份为2025年时,对应的年份代码9t =, 所以0.479 2.59 6.82y =⨯+=, 故2025年的人均纯收入约为6.82千元.2.(2021·福建宁德)近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,我市一家新能源企业近5个月的产值如下表:(1)根据上表数据,计算y 与x 的线性相关系数r ,并说明y 与x 的线性相关性强弱;(0.75||1r ≤≤,则认为y 与x 线性相关性很强;0.75r <,则认为y 与x 线性相关性不强) (2)求出y 关于x 的线性回归方程,并预测10月该企业的产值.参考公式:1221,nni ii ii nii x ynx yx ynx y r b a y bx xnx==--===--∑∑∑;参考数据:55522111442,55,52.3i i ii i i i x y x y ======≈∑∑∑.【答案】(1)0.993r =;相关系数较强;(2) 5.210.4y x =+;10月该企业的产值约为41.6亿元 【解析】(1)1234535x ++++==,16+20+27+30+37=265y =,0.993ni ix ynx yr -==≈∑,因为[]0.75,1r ∈,所以y 与x 线性相关性较强. (2)设线性回归方程为:y bx a =+;122144253265.25559ni ii n i i x ynx yb x nx==--⨯⨯===-⨯-∑∑,26 5.2310.4a y bx =-=-⨯=,即 5.210.4y x =+, 10月份对应的代码为6, 5.2610.441.6y =⨯+=,10月该企业的产值约为41.6亿元.3(2021·河南·高二月考 )有时候一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同品牌的一些食品所含热量的百分比记为()1,2,3,,10i x i =⋅⋅⋅和一些美食家以百分制给出的对此种食品口味的评价分数记为()123,,10i y i =⋅⋅⋅,,:参考数据:1220i i x ==∑,1720i i y ==∑,()21272i i x x=-=∑,()()1429i ii x xy y =--=∑参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-(1)已知这些品牌食品的所含热量的百分比i x 与美食家以百分制给出的对此种食品口味的评价分数i y 具有相关关系.试求出回归方程(最后结果精确到0.1);(2)某人只能接受食品所含热量的百分比为20及以下的食品.现在他想从这些食品中随机选取两种购买,求他所选取的两种食品至少有一种是美食家以百分制给出的对此种食品口味的评价分数为75分以上的概率.【答案】(1) 1.637.3y x =+(2)35【解析】(1)解:设所求的回归方程为y bx a =+,由()()()10110214291.6272iii i i x x y y b x x==--==≈-∑∑, 10112210i i x x ==⨯=∑,10117210i i y y ==⨯=∑, 429722237.3272a y bx ∴=-=-⨯≈, ∴所求的回归方程为: 1.637.3y x =+.(2)解:由表可知某人只能接受的食品共有6种,其中美食家以百分制给出的对此种食品口味的评价为75分以上的有2种可记为a ,b ,另外4种记为1,2,3,4.任选两种分别为:(),a b ,(),1a ,(),2a ,(),3a ,(),4a ,(),1b ,(),2b ,(),3b ,(),4b ,()1,2,()1,3,()1,4,()2,3,()2,4,()3,4,共15个基本事件.记“所选取的两种食品至少有一种是美食家以百分制给出的对此食品口味的评价分数为75分以上”为事件A ,则事件A 包含(),a b ,(),1a ,(),2a ,(),3a ,(),1b ,(),2b ,(),3b ,(),4b ,共9个基本事件, 故事件A 发生的概率为()93155P A ==. 4.(2021·陕西·西安中学 )某连锁经营公司所属5个零售店某月的销售额和利润额资料如表.(1)画出销售额和利润额的散点图;(2)若销售额和利润额具有相关关系,用最小二乘法计算利润额y 对销售额x 的回归直线方程.(参考公式1221ni ii nii x y n x yb xn x ==-⋅⋅=-⋅∑∑,ˆˆay bx =-) (3)若该公司计划再开一个店想达到预期利润为8百万,请预估销售额需要达到多少.【答案】(1)答案见解析(2)ˆy=0.5x +0.4(3)8百万 【解析】(1)(2)由表中的数据可得,()13567965x =⨯++++=,()123345 3.45y =⨯++++=,515221511256 3.40.520056ˆ65i ii ii x y x ybxx ==-⋅⋅-⨯⨯===-⨯⨯-⋅∑∑,∵回归直线方程恒过样本中心,∴ˆ 3.40.560.4a=-⨯=, 故利润额y 对销售额x 的回归直线方程为ˆy =0.5x +0.4. (3)∵该公司计划再开一个店想达到预期利润为8百万,即0.8千万, ∴0.8=0.5x +0.4,解得x =0.8, 故预计销售额需要达到8百万.考点三 非线性回归方程【例3】(2021·黑龙江·哈尔滨市第六中学校高二期中)某公司在市场调查中,发现某产品的单位定价x (单位:万元)对月销售量y (单位:吨)有影响对不同定价i x 和月销售量i y (1,2,8)i =数据作了初步处理,表中1z x =.经过分析发现可以用by a x=+来拟合y 与x 的关系. (1)求ˆy关于x 的回归方程; (2)若生产1吨产品的成本为0.9万元,那么预计单位定价为多少时,该产品的月利润取最大值,求此时的月利润.附:对于一组数据11(),v ω,22(,)v ω,,(,)n n v ω,其回归直线ˆˆˆvαβω=+的斜率和截距的最小二乘法估计分别为:1122211()()ˆ()nniii i i i nniii i v v v n vn ωωωωβωωωω====---==--∑∑∑∑,ˆˆv αβω=- 【答案】(1)^52y x=-+(2)单位定价为1.5万元时,月利润最大,最大值为0.8万元.【解析】(1)令1z x=,则y a b z =+⋅,则8^1822123956894358208988i ii i i z y z yb z z==-⨯⨯===-⨯--∑∑,^^2a y b z =-⋅=-,∴^52y x=-+. (2)设月利润为W ,则由已知()59934340.92260.810255W y x x x x x ⎛⎫⎛⎫=-=-+-=--+≤-+= ⎪⎪⎝⎭⎝⎭, 当且仅当922x x-=-即 1.5x =时取等号所以单位定价为1.5万元时,月利润最大,最大值为0.8万元. 【一隅三反】1.(2021·重庆市实验中学)某电器企业统计了近10年的年利润额y (千万元)与投入的年广告费用x (十万元)的相关数据,散点图如图,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关数据如表所示:(1)从①y bx a =+;②()0,0ky m x m k =⋅>>;③2y cx dx e =++三个函数中选择一个作为年广告费用x 和年利润额y 的回归类型,判断哪个类型符合,不必说明理由; (2)根据(1)中选择的回归类型,求出y 与x 的回归方程;(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元) 参考数据:3103.67883.678849.787e≈≈, 参考公式:回归方程ˆˆˆv bu a =+中斜率和截距的最小二乘估计公式分别为1221ˆni i i ni i u v nxybunu==-=-∑∑【答案】(1)选择回归类型k y m x =⋅更好;(2)13y ex =;(3)下一年应至少投入498万元广告费用. 【解析】(1)由散点图知,年广告费用x 和年利润额y 的回归类型并不是直线型的,而是曲线型的, 所以选择回归类型k y m x =⋅更好.(1)对k y m x =⋅两边取对数,得:ln ln ln y k x m =+,即ln v ku m =+,由表中数据得:101102211030.510 1.5 1.51ˆ46.510 1.5 1.5310i i i ii u v uvkuu ==--⨯⨯===-⨯⨯-∑∑,1ˆln 1.5 1.513m v ku ∴=-=-⨯=,m e ∴=, ∴年广告费用x 和年利润额y 的回归方程为13y ex =.(3)由(2)知:13y e x =⋅, 令1310y e x =⋅>得:1310x e>,解得:13 3.6788x >, 33.678849.787x ∴>≈,49.8x ∴≈(十万元),49.8十万元498=万元∴下一年应至少投入498万元广告费用.2.(2021·全国·高二课时练习)某地区不同身高的未成年男性的平均体重如下表,并由表中数据作出如图所示的散点图.(1)根据散点图,判断y a bx =+与x y a b =⋅哪一个能比较近似地反映这个地区未成年男性平均体重y 与身高x 的关系?(给出判断即可,不必说明理由)(2)令ln u y =,根据(1)的判断结果及下表数据,建立y 关于x 的非线性经验回归方程(参考数据:0.66e 1.93≈,0.02e 1.02≈).【答案】(1)x y a b =⋅;(2)ˆ 1.93 1.02x y=⨯. 【解析】(1)根据散点图,知x y a b =⋅能比较近似地反映这个地区未成年男性平均体重y 与身高x 的高度. (2)由ln u y =和x y a b =⋅,得12u c x c =+(1ln c b =,2ln c a =),()()()12111221282ˆ0.0214300iii ii xx uucx x ==--==≈-∑∑,又 2.96u =, 所以21ˆˆ 2.960.021150.66cu c x =-=-⨯=,ˆ0.020.66u x =+, 所以0.020.660.660.02ˆe e e 1.93 1.02x x x y+==⨯=⨯, 所以y 关于x 的非线性经验回归方程为ˆ 1.93 1.02x y=⨯. 3.(2021·黑龙江肇州 )如图是某小区2020年1月至2021年1月当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2020年1月~2021年1月).根据散点图选择y a =+ln y c d x =+两个模型进行拟合,经过数据处理得到两个回归方程分别为0.9369y =+0.95540.0306ln y x =+,并得到以下一些统计量的值:(1)请利用相关指数2R 判断哪个模型的拟合效果更好;(2)估计该小区2021年6月份的二手房均价.(精确到0.001万元/平方米)参考数据:ln 20.69≈,ln3 1.10≈,ln17 2.83≈,ln192.94≈ 1.41≈ 1.73≈ 4.12≈ 4.36≈.参考公式:相关指数()()221211niii nii y y R y y==-=--∑∑.【答案】(1)模型0.95540.0306ln y x =+;(2)1.044(万元/平方米).【解析】(1)设模型0.9369y =+0.95540.0306ln y x =+的相关指数分别为21R 和22R ,则210.00059110.00605R =-,220.00016410.00605R =-.因为0.0005910.000164>,所以2212R R <.所以模型0.95540.0306ln y x =+的拟合效果更好.(2)由(1)知,模型0.95540.0306ln y x =+的拟合效果更好,利用该模型预测可得,这个小区2021年6月份的在售二手房均价为:0.95540.0306ln18y =+()0.95540.0306ln 22ln3=++ 1.044≈(万元/平方米).。

高考线性回归方程总结

高考线性回归方程总结

第二讲 线性回归方程一、相关关系:1、⎩⎨⎧<=1||1||r r 不确定关系:相关关系确定关系:函数关系2、相关系数:∑∑∑===-⋅---=ni ini ini iiy y x x y y x x r 12121)()())((,其中:(1)⎩⎨⎧<>负相关正相关00r r ;2相关性很弱;相关性很强;3.0||75.0||<>r r例题1:下列两个变量具有相关关系的是A.正方形的体积与棱长;B.匀速行驶的车辆的行驶距离与行驶时间;C.人的身高和体重;D.人的身高与视力;例题2:在一组样本数据),,,2)(,(),,(),,(212211不全相等n n n x x x n y x y x y x ≥的散点图中,若所有样本点),2,1)(,(n i y x i i =都在直线121+-=x y 上,则样本相关系数为 例题3:r 是相关系数,则下列命题正确的是:(1)]75.0,1[--∈r 时,两个变量负相关很强;2]1,75.0[∈r 时,两个变量正相关很强; (3))75.0,3.0[]3.0,75.0(或--∈r 时,两个变量相关性一般; (4)41.0=r 时,两个变量相关性很弱; 3、散点图:初步判断两个变量的相关关系;例题4:在画两个变量的散点图时,下列叙述正确的是 A.预报变量在x 轴上,解释变量在y 轴上; B.解释变量在x 轴上,预报变量在y 轴上; C.可以选择两个变量中的任意一个变量在x 轴上;D.可以选择两个变量中的任意一个变量在y 轴上; 例题5:散点图在回归分析过程中的作用是A.查找个体个数B.比较个体数据的大小C.研究个体分类D.粗略判断变量是否线性相关二、线性回归方程:1、回归方程:a x b yˆˆˆ+= 其中2121121)())((ˆxn xy x n yx x x y yx x bni ini ii ni ini ii--=---=∑∑∑∑====,x b y aˆˆ-=代入样本点的中心 例题1:设),(),,(),,(2211n n y x y x y x 是变量n y x 的和个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线过一、二、四象限,以下结论正确的是 A.直线l 过点),(y x B.当n 为偶数时,分布在l 两侧的样本点的个数一定相同 C.的和y x 相关系数在0到1之间 D.的和y x 相关系数为直线l 的斜率例题2:工人月工资y 元依劳动生产率x 千元变化的回归直线方程为x y9060ˆ+=,下列判断正确的是A.劳动生产率为1000元时,工资为150元;B.劳动生产率提高1000元时,工资平均提高150元;C.劳动生产率提高1000元时,工资平均提高90元;D.劳动生产率为1000元时,工资为90元;例题3:设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据)2,1)(,(n i y x i i =,用最小二乘法建立的回归方程为71.8585.0ˆ-=x y,则不正确的是 A.y 与x 具有正的线性相关关系; B.回归直线过样本点的中心),(y xC.若该大学某女生身高增加1cm,则其体重约增加D.若该大学某女生身高为170cm,则可断定其体重必为例题4:为了了解儿子的身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为 A.1-=x y B.1+=x y C.x y 2188+= D.176=y 2、残差:(1)残差图:横坐标为样本编号,纵坐标为每个编号样本对应的残差; (2)残差图呈带状分布在横轴附近,越窄模型拟合精度越高; 3残差平方和∑=-ni i iyy12)ˆ(越小,模型拟合精度越高; 3、相关指数:∑∑==---=n i ini i iy yyyR 12122)()ˆ(1(1)其中:∑=-ni i iyy12)ˆ(为残差平方和;∑=-ni i y y 12)(为总偏差平方和; (2))1,0(2∈R ,越大模型拟合精度越高; 例题5:下列说法正确的是(1)残差平方和越小,相关指数2R 越小,模型拟合效果越差; (2)残差平方和越大,相关指数2R 越大,模型拟合效果越好; (3)残差平方和越小,相关指数2R 越大,模型拟合效果越好; (4)残差平方和越大,相关指数2R 越小,模型拟合效果越差; A.12 B.34 C.14 D.23例题6:关于回归分析,下列说法错误的是A.在回归分析中,变量间的关系若是非确定关系,则因变量不能由自变量唯一确定;B.线性相关系数r 可以是正的,也可以是负的C.样本点的残差可以是正的,也可以是负的D.相关指数2R 可以是正的,也可以是负的 例题7:下列命题正确的是(1)线性相关系数r 越大,两个变量的线性相关性越强,反之,线性相关性越弱; (2)残差平方和越小的模型,拟合的效果越好;(3)用相关指数2R 来刻画回归效果,2R 越小,说明模型的拟合效果越好; (4)随机误差e 是衡量预报精确度的一个量,但它是一个不可观测的量;(5)i eˆ表示相应于点),(i i y x 的残差,且0ˆ1=∑=ni ie;A.135B.245C.124D.23例题8:已知x 与y 之间的几组数据如下表:a xb yˆˆˆ+=;若某同学根据上表中的前两个数据)2,2(),0,1(求得的直线方程为a x b y '+'=,则下列结论正确的是A.a a b b'>'>ˆ,ˆ B.a a b b '<'>ˆ,ˆ C.a a b b '>'<ˆ,ˆ D.a a b b '<'<ˆ,ˆ 例题9:关于某设备的使用年限x年和所支出的维修费用y 万元有下表所示的资料:(1)线性回归方程a x b yˆˆˆ+=中的回归系数b a ˆ,ˆ; (2)残差平方和与相关指数2R ,作出残差图,并对该回归模型的拟合精度作出适当判断; (3)使用年限为10年时,维修费用大约是多少 三、非线性回归模型:例题1:如果样本点分布在某一条指数函数曲线bx ae y =的周围,其中a 和b 是参数,通过两边取自然对数的方法,把指数关系式变成对数关系式后,下列哪个变换结果是正确的 A.a bx y ln ln ⋅= B.a bx y ln ln += C.a bx y ln ln ln ⋅= D.a bx y ln ln ln += 例题2:下列回归方程中, 是线性回归方程; 是非线性回归方程;(1)27.3688.0ˆ+=x y28.1225.0ˆ2-=x y 3x e y 3.16.2ˆ= (4)x y5.14ˆ-= 5xe y 185.038.1ˆ-=例题3:某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x 单位:千元对年销售量y 单位:t 和年利润z 单位:千元的影响,对近8年的年宣传费和年销售量i=1,2,···,8数据作了初步处理,得到下面的散点图及一些统计量的值;表中w 1 w =1881i w=∑1Ⅰ根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型给出判断即可,不必说明理由Ⅱ根据Ⅰ的判断结果及表中数据,建立y 关于x 的回归方程;Ⅲ以知这种产品的年利率z 与x 、y 的关系为z=;根据Ⅱ的结果回答下列问题:(i ) 年宣传费x=49时,年销售量及年利润的预报值是多少 (ii )年宣传费x 为何值时,年利率的预报值最大附:对于一组数据u 1 v 1,u 2 v 2…….. u n v n ,其回归线v=αβ+u 的斜率和截距的最小二乘估计分别为:四、独立性检验:例题1:下表是一个22⨯列联表:的值分别为 ;例题2:可以粗略的判断两个分类变量是否有关系的是 A.散点图 B.残差图 C.等高条形图 D.以上都不对例题3:在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大A.d c c b a a ++与 B.d a c d c a ++与 C.c b c d a a ++与 D.ca cd b a ++与例题4:在判断两个分类变量是否有关系的常用方法中,最为精确的方法是 A.考察随机误差e B.考察线性相关系数r C.考察相关指数2R D.考察独立性检验中的2K例题5:在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是;①若2k 的观测值满足635.62≥k ,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有 99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99&的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误;A.①B. ①③C. ③D. ②例题6:在调查学生数学成绩与物理成绩之间的关系时,得到如下数据人数:数学成绩与物理成绩之间有把握有关;A. B. C. D.。

高考数学总复习考点知识讲解与提升练习70 一元线性回归模型及其应用

高考数学总复习考点知识讲解与提升练习70 一元线性回归模型及其应用

高考数学总复习考点知识讲解与提升练习专题70 一元线性回归模型及其应用考点知识1.了解样本相关系数的统计含义.2.了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.知识梳理1.变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.2.样本相关系数(1)r=i=1n(x i-x)(y i-y)i=1n(x i-x)2i=1n(y i-y)2.(2)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.3.一元线性回归模型(1)我们将y ^=b ^x +a ^称为Y 关于x 的经验回归方程,其中⎩⎪⎨⎪⎧b ^=i =1n(x i -x )(y i -y )i =1n(x i-x )2,a ^=y -b ^x .(2)残差:观测值减去预测值称为残差. 常用结论1.经验回归直线过点(x ,y ).2.求b ^时,常用公式b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2.3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误. 思考辨析判断下列结论是否正确(请在括号中打“√”或“×”) (1)相关关系是一种非确定性关系.(√)(2)散点图是判断两个变量相关关系的一种重要方法和手段.(√)(3)经验回归直线y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点.(×) (4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.(√) 教材改编题1.在对两个变量x ,y 进行回归分析时有下列步骤:①对所求出的经验回归方程作出解释;②收集数据(x i ,y i ),i =1,2,…,n ;③求经验回归方程;④根据所收集的数据绘制散点图. 则下列操作顺序正确的是() A .①②④③B.③②④① C .②③①④D.②④③① 答案D解析根据回归分析的思想,可知对两个变量x ,y 进行回归分析时,应先收集数据(x i ,y i ),然后绘制散点图,再求经验回归方程,最后对所求的经验回归方程作出解释. 2.对于x ,y 两变量,有四组成对样本数据,分别算出它们的样本相关系数r 如下,则线性相关性最强的是()A .-0.82B .0.78C .-0.69D .0.87 答案D解析由样本相关系数的绝对值|r |越大,变量间的线性相关性越强知,各选项中r =0.87的绝对值最大.3.某单位为了了解办公楼用电量y (度)与气温x (℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:由表中数据得到经验回归方程y ^=-2x +a ^,当气温为-4℃时,预测用电量约为() A .68度B .52度C .12度D .28度 答案A解析由表格可知x =10,y =40,根据经验回归直线必过(x ,y )得a ^=40+20=60,∴经验回归方程为y ^=-2x +60,因此当x =-4时,y ^=68.题型一成对数据的相关性例1(1)(2023·保定模拟)已知两个变量x 和y 之间有线性相关关系,经调查得到如下样本数据:根据表格中的数据求得经验回归方程为y ^=b ^x +a ^,则下列说法中正确的是()A.a ^>0,b ^>0 B.a ^>0,b ^<0C.a ^<0,b ^>0 D.a ^<0,b ^<0 答案B解析由已知数据可知y 随着x 的增大而减小,则变量x 和y 之间存在负相关关系,所以b ^<0.又x =15×(3+4+5+6+7)=5,y =15×(3.5+2.4+1.1-0.2-1.3)=1.1,即1.1=5b ^+a ^,所以a ^=1.1-5b ^>0.(2)(2022·大同模拟)如图是相关变量x ,y 的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程y ^=b ^1x +a ^1,样本相关系数为r 1;方案二:剔除点(10,21),根据剩下的数据得到经验回归方程y ^=b ^2x +a ^2,样本相关系数为r 2.则()A .0<r 1<r 2<1B .0<r 2<r 1<1C .-1<r 1<r 2<0D .-1<r 2<r 1<0 答案D解析根据相关变量x ,y 的散点图知,变量x ,y 具有负线性相关关系,且点(10,21)是离群值;方案一中,没剔除离群值,线性相关性弱些; 方案二中,剔除离群值,线性相关性强些; 所以样本相关系数-1<r 2<r 1<0. 思维升华 判定两个变量相关性的方法(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.(2)样本相关系数:当r >0时,正相关;当r <0时,负相关;|r |越接近1,相关性越强.(3)经验回归方程:当b ^>0时,正相关;当b ^<0时,负相关.跟踪训练1(1)某公司2017~2022年的年利润x (单位:百万元)与年广告支出y (单位:百万元)的统计资料如表所示:根据统计资料,则利润中位数() A.是16,x与y有正相关关系B.是17,x与y有正相关关系C.是17,x与y有负相关关系D.是18,x与y有负相关关系答案B解析由题意知,利润中位数是16+182=17,而且随着年利润x的增加,广告支出y也在增加,故x与y有正相关关系.(2)已知相关变量x和y的散点图如图所示,若用y=b1·ln(k1x)与y=k2x+b2拟合时的样本相关系数分别为r1,r2则比较r1,r2的大小结果为()A.r1>r2B.r1=r2C.r1<r2D.不确定答案C解析由散点图可知,用y=b1ln(k1x)拟合比用y=k2x+b2拟合的程度高,故|r1|>|r2|;又因为x ,y 负相关,所以-r 1>-r 2,即r 1<r 2. 题型二回归模型命题点1一元线性回归模型例2(2023·蚌埠模拟)某商业银行对存款利率与日存款总量的关系进行调研,发现存款利率每上升一定的百分点,日均存款总额就会发生一定的变化,经过统计得到下表:(1)在给出的坐标系中画出上表数据的散点图;(2)根据上表提供的数据,用最小二乘法求出y 关于x 的经验回归方程y ^=b ^x +a ^; (3)已知现行利率下的日均存款总额为0.625亿元,试根据(2)中的经验回归方程,预测日均存款总额为现行利率下的2倍时,利率需上升多少个百分点?参考公式及数据:①b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x ,②∑i =15x i y i =0.9,∑i =15x 2i =0.55.解(1)如图所示.(2)由表格数据可得x =15×(0.1+0.2+0.3+0.4+0.5)=0.3,y =15×(0.2+0.35+0.5+0.65+0.8)=0.5,所以b ^=∑5i =1x i y i -5x y∑5i =1x 2i -5x2=0.9-5×0.3×0.50.55-5×0.3×0.3=1.5, a ^=y -b ^x =0.5-1.5×0.3=0.05,故y ^=1.5x +0.05.(3)设利率需上升x 个百分点,由(2)得,0.625×2=1.5x +0.05,解得x =0.8, 所以预测利率需上升0.8个百分点. 命题点2非线性回归模型例3(2023·保山模拟)某印刷企业为了研究某种图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的关系,收集了一些数据并进行了初步整理,得到了如图所示的散点图及一些统计量的值.表中u i =1x i ,u =17∑i =17u i .(1)根据散点图判断y =a +bx 与y =c +dx哪一个模型更适合作为该图书每册的成本费y 与印刷数量x 的经验回归方程?(只要求给出判断,不必说明理由) (2)根据(1)的判断结果及表中数据求出y 关于x 的经验回归方程;(3)若该图书每册的售价为9元,则预测至少应该印刷多少册,才能使销售利润不低于80000元(假设能够全部售出).附:对于一组数据(ω1,v 1),(ω2,v 2),…,(ωn ,v n ),其经验回归方程v ^=β^ω+α^的斜率和截距的最小二乘估计分别为β^=i =1n (ωi -ω)(v i -v )i =1n(ωi -ω)2,α^=v -β^ω.解(1)由散点图判断y =c +d x更适合作为该图书每册的成本费y 与印刷数量x 的经验回归方程.(2)先建立y 关于u 的经验回归方程得y ^=c ^+d ^u ,由于d ^=i =17(u i -u )(y i -y )i =17(u i -u )2=70.7=10,故c ^=y -d ^u =3.5-10×0.2=1.5,所以预测y 关于u 的经验回归方程为y ^=1.5+10u ,从而y 关于x 的经验回归方程为y ^=1.5+10x.(3)假设印刷x 千册,依据题意得9x -⎝ ⎛⎭⎪⎫1.5+10x x ≥80,解得x ≥12,所以预测至少应该印刷12 000册图书,才能使销售利润不低于80 000元. 思维升华 求经验回归方程的步骤跟踪训练2(2022·南充模拟)某特色餐馆开通了某APP 的外卖服务,在一周内的某特色菜外卖份数x (单位:份)与收入y (单位:元)之间有如下的对应数据:(1)在给出的坐标系中画出数据散点图;(2)请根据以上数据用最小二乘法求出收入y 关于份数x 的经验回归方程; (3)据此估计外卖份数为12时,收入为多少元.参考数据公式:∑i =15x 2i =145,∑i =15x i y i =1380,b ^=i =1n(x i -x )(y i -y )i =1n(x i -x )2=∑i =1nx i y i -n xy∑i =1nx 2i -n x2,a ^=y -b ^x .解(1)作出散点图如图所示.(2)由表格数据得,x =2+4+5+6+85=5,y =30+40+60+50+705=50,则b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=1 380-5×5×50145-5×52=6.5,a ^=y -b ^x =50-6.5×5=17.5,因此,所求经验回归方程为y ^=6.5x +17.5.(3)当x =12时,y ^=12×6.5+17.5=95.5,即外卖份数为12时,预测收入为95.5元. 题型三残差分析例4(1)(多选)下列说法正确的是()A .在经验回归方程y ^=-0.85x +2.3中,当解释变量x 每增加1个单位时,响应变量y ^平均减少2.3个单位B .在经验回归方程y ^=-0.85x +2.3中,相对于样本点(1,1.2)的残差为-0.25 C .在残差图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好 D .若两个变量的决定系数R 2越大,表示残差平方和越小,即模型的拟合效果越好 答案BCD解析对于A ,根据经验回归方程,当解释变量x 每增加1个单位时,响应变量y ^平均减少0.85个单位,故A 错误;对于B ,当解释变量x =1时,响应变量y ^=1.45,则样本点(1,1.2)的残差为-0.25,故B 正确;对于C ,在残差图中,残差分布的水平带状区域的宽度越窄,说明拟合精度越高,即拟合效果越好,故C 正确;对于D ,由决定系数R 2的意义可知,R 2越大,表示残差平方和越小,即模型的拟合效果越好,故D 正确.(2)新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,如表是2022年某企业的前5个月碳酸锂的价格与月份的统计数据:根据表中数据,得出y 关于x 的经验回归方程为y ^=0.28x +a ^,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m =________. 答案1.4解析由题设,1.5-y ^=1.5-(0.28×5+a ^)=-0.06,可得a ^=0.16.又x =1+2+3+4+55=3,y =0.5+0.6+1+m +1.55=3.6+m 5,所以0.28×3+0.16=3.6+m5, 可得m =1.4.思维升华 检验回归模型的拟合效果的两种方法(1)残差分析:通过残差分析发现原始数据中的可疑数据,判断所建立模型的拟合效果. (2)R 2分析:通过公式计算R 2,R 2越大,残差平方和越小,模型的拟合效果越好;R 2越小,残差平方和越大,模型的拟合效果越差. 跟踪训练3(1)下列命题是真命题的为()A .经验回归方程y ^=b ^x +a ^一定不过样本点B .可以用样本相关系数r 来刻画两个变量x 和y 线性相关程度的强弱,r 的值越小,说明两个变量线性相关程度越弱C .在回归分析中,决定系数R 2=0.80的模型比决定系数R 2=0.98的模型拟合的效果要D .残差平方和越小的模型,拟合的效果越好 答案D解析对于A ,经验回归方程不一定经过其样本点,但一定经过(x ,y ),所以A 是假命题;对于B ,由样本相关系数的意义,当|r |越接近0时,表示变量y 与x 之间的线性相关程度越弱,所以B 是假命题;对于C ,用决定系数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好,所以C 是假命题;对于D ,由残差的统计学意义知,D 是真命题. (2)两个线性相关变量x 与y 的统计数据如表:其经验回归方程是y ^=b ^x +40,则相应于点(9,11)的残差为________. 答案-0.2解析因为x =15×(9+9.5+10+10.5+11)=10,y =15×(11+10+8+6+5)=8,所以8=10b ^+40,解得b ^=-3.2,所以y ^=-3.2x +40,当x =9时,y ^=11.2, 所以残差为11-11.2=-0.2.课时精练1.下列有关线性回归的说法,不正确的是()A.具有相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有经验回归方程答案D解析根据两个变量具有相关关系的概念,可知A正确;散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B,C正确;具有相关关系的成对样本数据才有经验回归方程,所以D不正确.2.对于样本相关系数,下列说法错误的是()A.样本相关系数可以用来判断成对样本数据相关的正负性B.样本相关系数可以是正的,也可以是负的C.样本相关系数r∈[-1,1]D.样本相关系数越大,成对样本数据的线性相关程度也越强答案D解析样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强,故D错误.3.(2023·运城模拟)在线性回归模型中,变量x 与y 的一组样本数据对应的点均在直线y =12x +1上,R 2=1-i =1n(y i -y ^i )2i =1n (y i -y )2,则R 2等于() A.14 B.12 C .1 D.52 答案C解析因为样本数据对应的点均在一条直线上, 所以R 2=1.4.(多选)某工厂研究某种产品的产量x (单位:吨)与所需某种材料y (单位:吨)之间的相关关系,在生产过程中收集4组数据如表所示.根据表中数据可得经验回归方程为y ^=0.7x +a ^,则下列四个说法中正确的为()A.变量x 与y 正相关 B .y 与x 的样本相关系数r <0C.a ^=0.35D .当产量为8吨时,预测所需材料约为5.95吨 答案ACD解析因为经验回归方程y ^=0.7x +a ^, 所以变量x 与y 呈正相关,所以样本相关系数r >0,故A 正确,B 错误; 由表格可得x =3+4+6+74=5,y =2.5+3+4+5.94=3.85, 则0.7×5+a ^=3.85,解得a ^=0.35,故C 正确;所以经验回归方程为y ^=0.7x +0.35,当x =8时,y ^=0.7×8+0.35=5.95,即产量为8吨时,预测所需材料约为5.95吨,故D 正确.5.(多选)(2023·唐山模拟)某制衣品牌为使成衣尺寸更精准,选择了10名志愿者,对其身高(单位:cm)和臂展(单位:cm)进行了测量,这10名志愿者身高和臂展的折线图如图所示.已知这10名志愿者身高的平均值为176 cm ,根据这10名志愿者的数据求得臂展u 关于身高v 的经验回归方程为u ^=1.2v -34,则下列结论正确的是()A .这10名志愿者身高的极差小于臂展的极差B .这10名志愿者的身高和臂展呈负相关C .这10名志愿者臂展的平均值为176.2 cmD .根据经验回归方程可估计身高为160 cm 的人的臂展为158 cm 答案AD解析对于选项A ,因为这10名志愿者臂展的最大值大于身高的最大值,而臂展的最小值小于身高的最小值,所以这10名志愿者身高的极差小于臂展的极差,故A 正确; 对于选项B ,因为1.2>0,所以这10名志愿者的身高和臂展呈正相关关系,故B 错误;对于选项C ,因为这10名志愿者身高的平均值为176cm ,所以这10名志愿者臂展的平均值为1.2×176-34=177.2(cm),故C 错误;对于选项D ,若一个人的身高为160 cm ,则由经验回归方程u ^=1.2v -34,可得这个人的臂展的估计值为158 cm ,故D 正确.6.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中:已知该产品的色度y 和色差x 之间满足线性相关关系,且y ^=0.8x +a ^,现有一对测量数据为(30,23.6),则该数据的残差为()A.-0.96B .-0.8C .0.8D .0.96 答案C解析由题意可知,x =21+23+25+274=24,y =15+18+19+204=18,将(24,18)代入y ^=0.8x +a ^,即18=0.8×24+a ^,解得a ^=-1.2,所以y ^=0.8x -1.2,当x =30时,y ^=0.8×30-1.2=22.8, 所以该数据的残差为23.6-22.8=0.8.7.某智能机器人的广告费用x (万元)与销售额y (万元)的统计数据如表所示:根据此表可得经验回归方程为y ^=5x +a ^,据此模型预测广告费用为8万元时销售额为________万元. 答案57解析由表格,得x =2+3+5+64=4,y =28+31+41+484=37, 所以37=5×4+a ^,即a ^=17,所以预测当广告费用为8万元时,销售额为5×8+17=57(万元).8.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y =2e 2x +1的图象附近,设z =ln y ,将其变换后得到经验回归方程为z =mx +n ,则mn =________. 答案2ln2+2解析由z =ln y ,则ln y =ln2e 2x +1,即z =ln2+lne 2x +1=ln2+2x +1,则z =2x +ln2+1,故m =2,n =ln2+1,所以mn =2ln2+2.9.假设关于某种设备的使用年限x (单位:年)与所支出的维修费用y (单位:万元)有如下统计资料:已知∑i =15x 2i =90,∑i =15y 2i ≈140.8,∑i =15x i y i =112.3,79≈8.9,2≈1.4.(1)求x ,y ;(2)计算y 与x 的样本相关系数r (精确到0.001),并判断该设备的使用年限与所支出的维修费用的相关程度.附:样本相关系数r =∑ni =1(x i -x )(y i -y )∑ni =1 (x i -x )2∑ni =1(y i -y )2=∑ni =1x i y i -n x y (∑ni =1x 2i -n x 2)(∑ni =1y 2i -n y 2).解(1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5.0.(2)∑i =15x i y i -5x y =112.3-5×4×5=12.3,∑i =15x 2i -5x 2=90-5×42=10,∑i =15y 2i -5y2≈140.8-5×52=15.8,所以r =∑i =15x i y i -5x y∑i =15x 2i -5x2∑i =15y 2i -5y2≈12.310×15.8=12.32×79≈12.31.4×8.9≈0.987,r 接近1,说明该设备的使用年限与所支出的维修费用之间具有很高的相关性. 10.(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m 2)和材积量(单位:m 3),得到如下数据:并计算得∑10i =1x 2i =0.038,∑10i =1y 2i =1.6158,∑10i =1x i y i =0.2474. (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01); (3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m 2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:样本相关系数r =∑ni =1(x i -x )(y i -y )∑ni =1 (x i -x )2∑ni =1(y i -y )2=∑ni =1x i y i -n x y (∑ni =1x 2i -n x 2)(∑ni =1y 2i -n y 2),1.896≈1.377.解(1)样本中10棵这种树木的根部横截面积的平均值x =0.610=0.06(m 2),样本中10棵这种树木的材积量的平均值y =3.910=0.39(m 3), 据此可估计该林区这种树木平均一棵的根部横截面积为0.06 m 2,平均一棵的材积量为0.39 m 3.(2)r=∑i=110xiyi-10x y(∑i=110x2i-10x2)(∑i=110y2i-10y2)=0.2474-10×0.06×0.39 (0.038-10×0.062)×(1.6158-10×0.392)=0.01340.0001896≈0.01340.01377≈0.97.(3)设该林区这种树木的总材积量的估计值为Y m3,又已知树木的材积量与其根部横截面积近似成正比,可得0.060.39=186Y,解得Y=1209.则该林区这种树木的总材积量的估计值为1209m3.11.(多选)针对某疾病,各地医疗机构采取了各种有针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示,由表格可得y 关于x的经验回归方程为y^=6x2+a^,则下列说法正确的是()A.a^=4B.a^=-8C .此回归模型第4周的残差为5D .估计第6周治愈人数为220 答案BC解析设t =x 2,则y ^=6t +a ^,由已知得t =15×(1+4+9+16+25)=11,y =15×(2+17+36+93+142)=58,所以a ^=58-6×11=-8,故A 错误,B 正确; 在y ^=6x 2-8中,令x =4, 得y ^4=6×42-8=88,所以此回归模型第4周的残差为y 4-y ^4=93-88=5,故C 正确; 在y ^=6x 2-8中,令x =6, 得y ^6=6×62-8=208,故D 错误.12.2020年,全球开展了某疫苗研发竞赛,我国处于领先地位,为了研究疫苗的有效率,在某地进行临床试验,对符合一定条件的10000名试验者注射了该疫苗,一周后有20人感染,为了验证疫苗的有效率,同期,从相同条件下未注射疫苗的人群中抽取2500人,分成5组,各组感染人数如下:并求得y 与x 的经验回归方程为y ^=0.011x +a ^,同期,在人数为10000的条件下,以拟合结果估算未注射疫苗的人群中感染人数,记为N ;注射疫苗后仍被感染的人数记为n ,则估计该疫苗的有效率为________.(疫苗的有效率为1-n N,结果保留3位有效数字) 答案0.818解析 由表格中的数据可得x =500,y =5,故a ^=5-0.011×500=-0.5,故N =0.011×10 000-0.5=110-0.5=109.5≈110,而n =20,故疫苗的有效率为1-20110≈0.818.13.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 7,y 7)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,7)都在曲线y =a ln(x -1895)+12.15附近波动,经计算i =17(x i -1895)=210.77,i =17y i =73.50,i =17ln(x i -1895)=23.10,则实数a 等于()A .-0.5B .0.5C .-1D .1 答案A解析因为17i =17ln(x i -1895)=23.107=3.3,17i =17y i =73.507=10.5,所以10.5=3.3a +12.15,解得a =-0.5.14.(多选)已知由样本数据(x i ,y i )(i =1,2,3,…,10)组成的一个样本,得到经验回归方程为y ^=2x -0.4,且x =2,去除两个歧义点(-2,1)和(2,-1)后,得到新的经验回归直线的斜率为3.则下列说法正确的是() A .相关变量x ,y 具有正相关关系B .去除两个歧义点后,新样本中变量x j (j =1,2,…,8)的平均值变大C .去除两个歧义点后的经验回归方程为y ^1=3x -3 D .去除两个歧义点后,样本数据(4,8.9)的残差为0.1 答案ABC解析对于A ,因为经验回归直线的斜率大于0,所以相关变量x ,y 具有正相关关系,故A 正确;对于B ,将x =2代入y ^=2x -0.4得y =3.6,则去除两个歧义点后,得到新的相关变量的平均值分别为X =2×10-(-2+2)8=52,Y =3.6×10-(1-1)8=92,故B 正确;对于C ,a ^=92-3×52=-3,新的经验回归方程为y ^1=3x -3,故C 正确;对于D ,当x =4时,y ^1=3×4-3=9,残差为8.9-9=-0.1,故D 错误.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性回归方程高考题
1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:
3 4 5 6
2.5 3 4 4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)
2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:
使用年限x 2 3 4 5 6
维修费用y 2.2 3.8 5.5 6.5 7.0
若有数据知y对x呈线性相关关系.求:
(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;
序号x y xy x2
1 2 2.2
2 3 3.8
3 4 5.5
4 5 6.5
5 6 7.0

(2) 估计使用10年时,维修费用是多少.
3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:
零件的个数x(个) 2 3 4 5
加工的时间y(小时) 2.5 3 4 4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少时间?
(注:
4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:
3 4 5 6 7 8 9
66 69 73 81 89 90 91
已知:.
(Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程.
5、某种产品的广告费用支出与销售额之间有如下的对应数据:
2 4 5 6 8
30 40 60 50 70
(1)画出散点图:
(2)求回归直线方程;
(3)据此估计广告费用为10时,销售收入的值.
6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x 3 4 5 6
y 2.5 3 4 4.5
(I)请画出上表数据的散点图;
(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准
煤?
(参考公式及数据: ,)
7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:
广告费支出x 2 4 5 6 8
销售额y 30 40 60 50 70
(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支
出x与销售额y(单位:百万元)之间的一般规律吗?
(2)求y关于x的回归直线方程;
(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)
8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:
时间t(s) 5 10 15 20 30
6 10 10 13 16
深度y(m)
(1)画出散点图;
(2)试求腐蚀深度y对时间t的回归直线方程。

参考答案
一、计算题
1、解:(1)
(2)
序号
l 3 2.5 7.5 9
2 4
3 12 16
3 5
4 20 25
4 6 4.
5 27 36
18 14 66.5 86
所以:
所以线性同归方程为:
(3)=100时,,所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.
2、解:(1) 填表
序号x y xy x2
1 2 2.2 4.4 4
2 3 3.8 11.4 9
3 4 5.5 22.0 16
4 5 6.5 32.5 25
5 6 7.0 42.0 36
∑20 25 112.3 90
所以
将其代入公式得
(2) 线性回归方程为=1.23x+0.08
(3) x=10时,=1.23x+0.08=1.23×10+0.08=12.38 (万元)
答:使用10年维修费用是12.38(万元)。

3、解:(1)散点图如图
(2)由表中数据得:
回归直线如图中所示。

(3)将x=10代入回归直线方程,得(小时)
∴预测加工10个零件需要8.05小时。

4、解:(Ⅰ)散点图如图:
(Ⅱ)由散点图知,与有线性相关关系,设回归直线方程:,

,∵,∴.

故回归直线方程为.5、解:(1)作出散点图如下图所示:
(2)求回归直线方程.
=(2+4+5+6+8)=5,
×(30+40+60+50+70)=50,
=22+42+52+62+82=145,
=302+402+602+502+702=13500
=1380.
=6.5.
因此回归直线方程为
(3)=10时,预报y的值为y=10×6.5+17.5=82.5.6、解:(I)如下图
(II)=3 2.5+43+54+6 4.5=66.5 ==4.5 ,==3. 5
故线性回归方程为
(III)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为
0.7100+0.35=70.35.
故耗能减少了90-70.35=19.65(吨).
7、解:(1)(略)(2)y=6.5x+17.5
(3) 30.5(百万元) 8、(1)略(2)y=14/37x+183/37。

相关文档
最新文档