线性回归方程高考题
高考数学复习典型题型专题讲解与练习94 一元线性回归模型及其应用
高考数学复习典型题型专题讲解与练习 专题94 一元线性回归模型及其应用题型一 求回归直线方程例1.(2022·甘肃·临泽县第一中学高二阶段练习(文))已知变量x 和y 正相关,则由如下表所示的观测数据算得的线性回归方程为【答案】B 【解析】 【分析】先求出样本的中心点的坐标,再代入选项检验即得正确答案. 【详解】 由题得12345543210,10x -----+++++==0.92 3.1 3.9 5.1 4.15 2.9 2.10.9010y -----+++++==,所以样本中心点的坐标为(0,0),代入选项检验得选B. 故答案为B 【点睛】(1)本题主要考查回归方程直线的性质,意在考查学生对该知识的掌握水平.(2) (,)x y 称为样本点的中心,回归直线过样本点的中心.这是回归方程的一个重要考点,要理解掌握并灵活运用.规律方法 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x -,y -,∑n i =1x 2i ,∑ni =1x i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑n i =1x i y i -n x - y -∑n i =1x 2i -nx -2,a ^=y --b ^x -.(6)写出线性回归方程y ^=b ^x +a ^.例2.(2019·新疆·乌鲁木齐市第二十中学高二期中)随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y (万元)有如表的数据资料:(1) 在给出的坐标系中作出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa 、ˆb ; (3)估计使用年限为12年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆn i i i n ii x y nxy bx nx==-=-∑∑, ˆˆay bx =-.) 【答案】(1)见解析; (2) 1.23b =0.08a =; (3)估计使用12年时,支出总费用是14.84万元.. 【解析】 【分析】(1)在坐标系中描点可得散点图;(2)代入公式可求;(3)根据方程代入x=12可得费用. 【详解】(1)散点图如图,由图知y 与x 间有线性相关关系.(2)∵4x =,5y =,51112.3i i i x y ==∑,52190i i x ==∑,∴2112.354512.31.2390541ˆ0b-⨯⨯===-⨯;5 1.2340.ˆ0ˆˆ8ay bx =-=-⨯=. (3)线性回归直线方程是 1.2308ˆ.0yx =+, 当12x =(年)时, 1.23120.0814.8ˆ4y =⨯+=(万元).即估计使用12年时,支出总费用是14.84万元. 【点睛】本题主要考查回归直线在生活中的应用,明确所给公式中各个模块的含义,代入公式可求.题目难度不大,侧重于应用性.例3.(2022·全国·高二单元测试)有一位同学家里开了一个小卖部,他为了研究气温对热茶销售的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表如下: 气温x/℃ -5 0 4 7 12 15 19 23 27 31 36热茶销售杯数y/杯 156 150 132 128 130 116 104 89 93 76 54(1)画出散点图;(2)你能从散点图中发现气温与热茶的销售杯数之间关系的一般规律吗? (3)如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系; (4)试求出回归直线方程;(5)利用(4)的回归方程,若某天的气温是2 ℃,预测这一天卖出热茶的杯数.【答案】(1)见解析;(2)见解析;(3)见解析;(4) 2.354774ˆ1.y x =-+;(5)143【解析】 【详解】分析:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图;(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少;(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系; (4)由题中所给的数据求得回归方程即可;(5)结合回归方程的预测作用和(4)中的结论整理计算即可求得最终结果. 详解:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图如下图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系,如图所示.(4)因112i i 1169x ,x 411∑===为335,11i 11228y ,xiyi 1411∑===778. 所2169122814778-111111b 1694335-1111⨯⨯=⎛⎫⨯ ⎪⎝⎭^以≈-2.35, 1228169a 2.35147.74.1111=+⨯=^所以回归直线方程y 2.35x 147.74.=-+^为(5)由(4)的方程,当x=2,y 4.70147.74143.04,=-+=^时因此若某天的气温为2 ℃,这一天大约可以卖出143杯热茶.点睛:(1)正确运用计算^a ,^b 的公式和准确的计算,是求线性回归方程的关键. (2)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.题型二 利用回归直线方程对总体进行估计例4.(2022·江西抚州·高二期末(理))保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新能源汽车,每年抽样1000汽车调查,得到新能源汽车y 辆与年份代码x 年的数据如下表:(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源汽车.参考公式:回归方程y bx a =+斜率和截距的最小二乘估计公式分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【答案】(1)219y x =+ (2)27900 【解析】【分析】(1)第一步分别算第x ,y 的平均值,第二步利用1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-即可得到方程.(2)由第一问的结果,带入方程即可算出预估的结果. (1)3x =,305070+100+110=725y ++=,1222222221130+250+370+4100+5110-5372==211+2+3+4+5-53ni ii ni i x y nx yb x nx==-⨯⨯⨯⨯⨯⨯⨯=⨯-∑∑,因为a y bx =-,所以72213=9a =-⨯,所以219y x =+(2)预测该地区2022年抽样1000汽车调查中新能源汽车数,当7x =时,217993y =⨯+=,该地区2022年共有30万辆汽车,所以新能源汽车93300000279001000N =⨯=. 规律方法 本题已知y 与x 是线性相关关系,所以可求出回归方程进行估计和预测.否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.例5.(2022·陕西·西安中学高二期中(理))偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差(实际成绩-平均分=偏差).在某次考试成绩统计中,某老师为了对学生数学偏差x (单位:分)与物理偏差y (单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:(1)若x 与y 之间具有线性相关关系,求y 关于x 的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.(下面是参考数据和参考公式)()()()()()()()()()818222222222120 6.515 3.513 3.53 1.520.550.510 2.518 3.532420151332510181256i ii ii x yx===⨯+⨯+⨯+⨯+⨯+-⨯-+-⨯-+-⨯-==+++++-+-+-=∑∑,回归直线方程为ˆˆˆy bx a =+,其中()()()1122211ˆˆˆnni i iii i nni ii i x y nxy x x y y b x nx x x ay bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑【答案】(1)11ˆ42yx =+ (2)94 【解析】 【分析】(1)根据最小二乘法即可求出y 关于x 的线性回归方程;(2)设该同学的物理成绩为ω,则物理偏差为91.5ω-,数学偏差为8,根据回归方程可知,1191.5842ω-=⨯+,即可解出.(1)由题意可得,20151332(5)(10)(18)582x +++++-+-+-==,()()()6.5 3.5 3.5 1.50.50.5 2.5 3.5988y +++++-+-+-==, 1222159324ˆ81285412568()2ni ii nii x y nxybxnx ==--⨯⨯===-⨯-∑∑,所以9151ˆˆ8422a y bx =-=-⨯=,故线性回归方程为11ˆ42yx =+. (2)由题意,设该同学的物理成绩为ω,则物理偏差为:91.5ω-. 而数学偏差为128-120=8,∴1191.5842ω-=⨯+,解得94ω=, 所以,可以预测这位同学的物理成绩为94.例6.(2022·广东揭阳·高二期末)从2018年1月1日起,广东、等18个保监局所辖地区将纳入商业车险改革试点范围,其中最大的变化是上一年的出险次数决定了下一年的保费倍率,具体关系如下表:有评估机构从以往购买了车险的车辆中随机抽取1000 辆调查,得到一年中出险次数的频数分布如下(并用相应频率估计车辆每年出险次数的概率):(1)求某车在两年中出险次数不超过2次的概率;(2)经验表明新车商业车险保费与购车价格有较强的线性相关关系,估计其回归直线方程为:1201600y x =+.(其中x (万元)表示购车价格,y (元)表示商业车险保费).李先生2016 年1月购买一辆价值20万元的新车.根据以上信息,试估计该车辆在2017 年1月续保时应缴交的保费,并分析车险新政是否总体上减轻了车主负担.(假设车辆下一年与上一年都购买相同的商业车险产品进行续保) 【答案】(1)0.8744;(2)3846元,减轻了车主负担. 【解析】 【分析】(1)利用互斥事件的概率公式列式计算即得;(2)求出下一年车险保费倍率X 的分布列,并求出期望,即可得出车主下一年的保费,并根据期望是否大于1得出结论. 【详解】(1)设某车在两年中出险次数为N , 则(2)(0)(1)(2)P N P N P N P N ≤==+=+=5005005003805001003803802210001000100010001000100010001000=⋅+⋅⋅+⋅⋅+⋅0.8744=, 所以某车在两年中出险次数不超过2次的概率为0.8744; (2)设该车辆2017 年的保费倍率为X ,则X 为随机变量,X 的取值为0.85 ,1,1.25 ,1.5 ,1.75 , 2, X 的分布列为:下一年保费倍率X 的期望为:()0.850.510.38 1.250.1 1.50.015 1.750.00420.0010.9615+E X =⨯⨯+⨯+⨯+⨯+⨯=,该车辆估计2017年应缴保费为:()1202016000.96153846⨯+⨯=元, 因0.96151<,则车险新政总体上减轻了车主负担.题型三 线性回归分析例7.(2022·山东·日照青山学校高二期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下,用两种模型①y bx a =+;②y a =分别进行拟合,得到相应的回归方程1ˆ10.7 3.4yx =+,2ˆ22.8y =,进行残差分析得到如表所示的残差值及一些统计量的值:(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.(参考公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆay bx =-) 【答案】(1)该选模型①,理由见解析 (2)111y x =+ 【解析】 【分析】(1)求出两模型的残差值的绝对值之和进行比较即可,(2)先剔除异常数据,然后利用回归方程的公式结合已知数据进行计算即可 (1)应该选择模型①模型①的残差值的绝对值之和为1.1+2.8+7.5+1.2+1.9+0.4=14.9 模型②的残差值的绝对值之和为0.3+5.4+4.3+3.2+1.6+3.8=18.6. ∵14.9<18.6,∴模型①的拟合效果较好,应该选模型①.(2)剔除异常数据,即剔除第3天的数据后,得()1 3.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.2ˆ11825 3.6 3.617.25i ii ii x y xybxx ==--⨯⨯====-⨯⨯-∑∑, ˆˆ40.611 3.61ay bx =-=-⨯=. ∴y 关于x 的回归方程为111y x =+.规律方法 (1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.(2)刻画回归效果的三种方法①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适. ②残差平方和法:残差平方和∑ni =1 (y i -y ^i )2越小,模型的拟合效果越好. ③决定系数法:R 2=1-∑ni =1(y i -y ^i )2∑ni =1 (y i -y -)2越接近1,表明回归的效果越好. 例8.(2022·河南·南阳中学高三阶段练习(文))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附: 刻画回归效果的相关指数()()22121ˆ1niii nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-4.1≈ 【答案】(1)对A 型材料进行应用改造的投入为17亿元时的直接收益为72.93(亿元); (2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据模型和相关系数公式计算比较即可,然后将x =17代入较好的模型即可预测直接收益;(2)根据回归方程过样本中心点(,x y )求出ˆa,再令x =20算出预测的直接收益,即可算出投入20亿元时的总收益,与(1)中的投入17亿元的直接收益比较即可. (1)对于模型①,对应的15222740485460=387y ++++++=,故对应的()772221171750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为21.314.472.9ˆ3y=≈(亿元).另解:本题也可以根据相关系数的公式,直接比较79.13和20.2的大小,从而说明模型②拟合精度更高、更可靠. (2) 当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.例9.(2022·陕西·高新一中高三阶段练习(理))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造.根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+.(1)根据表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益; (2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好 4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)2221R R >,模型②拟合精度更高、更可靠,收益为72.93;(2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据题意求得()1221i i y y =-∑,再根据2R 的计算公式,即可分别求得2212,R R ,则可判断不同模型的拟合度;(2)根据题意,求得回归直线方程,即可代值计算,求得预测值. (1)对于模型①,对应的15222740485460387y ++++++==,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ21.314.472.93y=≈. (2) 当17x >时, 后五组的212223242568.56867.5666523,6755x y ++++++++====,由最小二乘法可得67(0.7)238ˆ 3.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1574.172.93-⨯++=>,故投入17亿元比投入20亿元时收益小.题型四 残差分析与相关指数的应用例10.(2022·河北·藁城新冀明中学高二阶段练习)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和; 【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件; (3)各组残差见解析,残差平方和为3.8182. 【解析】 【分析】(1)根据表中数据描点即可求解;(2)根据表中数据,求出x ,y ,612i i x =∑,61i i i x y =∑,代入公式求出线性回归方程的系数ˆb,进而求出ˆa即可得回归直线方程; (3)根据残差的定义及残差平方和公式即可求解. (1)解:散点图如下:(2) 解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818ii i y y=--+++--==++∑. 规律方法 (1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.例11.(2022·河北·大名县第一中学高二阶段练习)随着中美贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.华为技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x (亿元)与科技升级直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①:ˆ 4.111.8yx =+;模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①、②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对“麒麟”手机芯片科技升级的投入为17亿元时的直接收益. (附:刻画回归效果的相关指数,()()22121ˆ1niii nii y yR y y ==-=--∑∑ 4.1≈)(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.附:用最小二乘法求线性回归方程ˆˆˆybx a =+的系数:()()()1122211ˆˆˆ,nni iii i i nniii i x ynx yxx y y bay bx xnx xx ====-⋅--===---∑∑∑∑ 【答案】(1)回归模型②,72.93(亿元);(2)投入20亿元时,公司的实际收益更大. 【解析】 【分析】(1)根据表中数据比较21R 和22R 可判断拟合效果,进而求出预测值; (2)求出,x y ,进而求出a ,得出回归方程得求出结果. 【详解】解:(1)由表格中的数据,182.479.2>,∴()()772211182.479.2iii i y y y y ==>--∑∑,∴()()772211182.479.211iit t y y y y ==-<---∑∑可见模型①的相关指数21R 小于模型②的相关指数22R . 所以回归模型②的拟合效果更好.所以当17x =亿元时,科技升级直接收益的预测值为ˆ21.314.421.3 4.114.472.93y=≈⨯-=(亿元). (2)当17x >时,由已知可得2122232425235x ++++==,68.56867.5666667.25y ++++==.∴0.767.20.72383.3a y x =+=+⨯=.∴当17x >时,y 与x 满足的线性回归方程为ˆ0.783.3yx =-+. 当20x时,科技升级直接收益的预测值为ˆ0.72083.369.3y=-⨯+=亿元.当20>亿元,x亿元时,实际收益的预测值为69.3574.3+=亿元72.93∴技术升级投入20亿元时,公司的实际收益更大.题型五非线性回归分析例12.(2022·全国·模拟预测)某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:根据以上数据,绘制了如图所示的散点图.(1)根据散点图,判断在推广期内,y a bx=+与x=⋅(c,d均为大于零的常数)哪一个y c d适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及题干中表格内的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:其中lg i i v y =,7117i i v v ==∑.参考公式:对于一组数据)()()(1122,,,,,,n n u v u v u v ⋅⋅⋅,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为1221ˆni i i nii uv nuvunuβ==-=-∑∑,ˆav u β=-. (3)推广期结束后,为更好地服务乘客,车队随机调查了100人次的乘车支付方式,得到如下结果: 已知该线路公交车票价2元,使用现金支付的乘客无优惠,使用公交卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据调查结果发现:使用扫码支付的乘客中有5人次乘客享受7折优惠,有10人次乘客享受8折优惠,有15人次乘客享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据所给数据,以事件发生的频率作为相应事件发生的概率,在不考虑其他因素的条件下,按照上述收费标准,试估计该车队一辆车一年的总收入.【答案】(1)x y c d =⋅适宜(2))(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347(3)199200元 【解析】 【分析】(1)根据散点图即可判断回归方程类型;(2)根据题意中的数据,利用最小二乘法求出ˆb ,进而求出ˆa,即可得出回归方程,令8x =求解即可;(3)根据题意分别求出享受7折优惠、8折优惠、9折优惠的收入,进而加起来即可. (1)根据散点图判断,x y c d =⋅适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型. (2)∵x y c d =⋅,∴两边同时取常用对数,得lg lg lg y c x d =+. 设lg a c =,lg b d =,则v a bx =+.∵4x =, 1.54v =,721140i i x ==∑,∴7172221750.1274 1.547ˆ0.2514074287i i i i i x v xvbx x==--⨯⨯====-⨯-∑∑,ˆˆ0.54av bx =-=,∴ˆ0.540.25v x =+,∴)(0.540.250.25ˆ10 3.4710xx y +==⨯,把8x =代入上式,得0.540.258 2.5420.54ˆ10101010347y+⨯===⨯=, ∴y 关于x 的回归方程为)(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347. (3)由题意,可知一个月中使用现金的乘客有1000人次,共收入100022000⨯=(元);使用公交卡的乘客有6000人次,共收入6000 1.69600⨯=(元).使用扫码支付的乘客有3000人次,其中,享受7折优惠的有500人次,共收入500 1.4700⨯=(元),享受8折优惠的有1000人次,共收入1000 1.61600⨯=(元),享受9折优惠的有1500人次,共收入1500 1.82700⨯=(元),故该车队一辆车一个月的收入为200096007001600270016600++++=(元).∴估计该车队一辆车一年的收入为1660012199200⨯=(元).规律方法求非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性回归方程.例13.(2022·黑龙江·哈尔滨市第六中学校高二期末)区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,居世界前列现收集我国近5年区块链企业总数量相关数据,如表注:参考数据5174.691i i y ==∑,51312.761i i i x y ==∑,5110.980i i z ==∑,5140.457i i i x z ==∑(其中ln z y =).附:样本()(),1,2,,i i x y i n =⋅⋅⋅的最小二乘法估计公式为1221ni ii nii x ynxy b xnx==-=-∑∑,a y bx =-(1)根据表中数据判断,y a bx =+与e dx y c =(其中e 2.71828=⋅⋅⋅,为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由)(2)根据(1)的结果,求y 关于x 的回归方程;(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”,已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,则求甲公司获得“优胜公司”的概率. 【答案】(1)dx y ce = (2)0.75170.0591x y e -= (3)310【解析】【分析】(1)根据表中数据判断y 关于x 的回归方程为非线性方程;(2)令ln z y =,将y 关于x 的非线性关系,转化为z 关于x 的线性关系,利用最小二乘法求解;(3)利用相互独立事件的概率相乘求求解; (1)根据表中数据e dx y c =适宜预测未来几年我国区块链企业总数量. (2)e dx y c =,ln ln y dx c ∴=+,令ln z y =,则ln z dx c =+,5110.980 2.19655ii zz ====∑,5112345355ii xx =++++===∑由公式计算可知122140.457310.980.7517,5545ni ii n i i x znxzb x nx==-⨯==--=-∑∑ˆln 2.1960.751730.0591c z dx =-=-⨯=- ln 0.75170.0591y x ∴=-,即ln 0.75170.0591y x ∴=-,即0.75170.0591x y e -=所以y 关于x 的回归方程为0.75170.0591x y e -= (3)设甲公司获得“优胜公司”为A 事件. 则11123112113232352253210()P A ⨯+⨯⨯⨯+⨯⨯⨯==所以甲公司获得“优胜公司”的概率为310.例14.(2022·湖南·长沙一中高三阶段练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1-9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:现用by ax=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为23,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1iitx =)。
线性回归方程高考题讲解
线性回归方程高考题讲解线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 62.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 2 2.22 3 3.83 4 5.54 5 6.55 6 7.0∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 2.5 3 4 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 306 10 10 13 16深度y(m)(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。
线性回归方程高考题
线性回归方程高考题 Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 63 4(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤(参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 22 33 44 55 6∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 3 4(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图;(1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;(3)据此估计广告费用为10时,销售收入的值.6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 3 4(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 30深度y(m) 6 10 10 13 16(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。
专题01 线性回归方程(解析版)
【解析】解: x 0 1 2 3 3 , y m 3 5.5 7 m 15.5 ,
4
2
4
4
这组数据的样本中心点是 ( 3 , m 15.5) , 24
关于 y 与 x 的线性回归方程 yˆ 2.1x 0.85 ,
m 15.5 2.1 3 0.85 ,解得 m 0.5 ,
x (次数 / 分
20
30
40
50
60
钟)
y( C)
25
27.5
29
32.5
36
A. 33 C
B. 34 C
C. 35 C
【解析】解:由题意,得 x 20 30 40 50 60 40 , 5
y 25 27.5 29 32.5 36 30 , 5
则 k y 0.25x 30 0.25 40 20 ;
故答案为:10.
例 7.已知一组数据点:
x
x1
x2
x8
y
y1
y2
y8
8
用最小二乘法得到其线性回归方程为 yˆ 2x 4 ,若数据 x1 , x2 , , x8 的平均数为 1,则 yi i 1
16 .
3
原创精品资源学科网独家享有版权,侵权必究!
【解析】解:由题意, x 1 ,设样本点的中心为 (1, y) , 又线性回归方程为 yˆ 2x 4 ,则 y 2 1 4 2 ,
购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用 Y (单位:万元)的分布列为:
Y
30
20
70
120
P
0.3
0.4
0.2
0.1
E(Y ) 30 0.3 20 0.4 70 0.2 120 0.1 25 (万元)
(完整)线性回归方程高考题
线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 62.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 2 2.22 3 3.83 4 5.54 5 6.55 6 7.0∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 2.5 3 4 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图;(1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;(3)据此估计广告费用为10时,销售收入的值.6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 306 10 10 13 16深度y(m)(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。
线性回归方程高考的题目讲解
线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 62.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 2 2.22 3 3.83 4 5.54 5 6.55 6 7.0∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 2.5 3 4 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;(3)据此估计广告费用为10时,销售收入的值.6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 306 10 10 13 16深度y(m)(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。
线性回归方程(人教A版)(含答案)
线性回归方程(人教A版)一、单选题(共8道,每道12分)1.人的年龄与人体脂肪的百分数的回归方程为:,如果某人36岁,那么这个人的脂肪含量( )A.一定是B.在附近的可能性比较大C.无任何参考数据D.以上解释均无道理答案:B解题思路:试题难度:三颗星知识点:可线性化的回归分析2.根据如下样本数据:得到的回归方程为,则( )A. B.C. D.答案:A解题思路:试题难度:三颗星知识点:可线性化的回归分析3.已知变量与负相关,且由观测数据算得样本平均数,,则由该观测数据算得的线性回归方程可能是( )A. B.C. D.答案:D解题思路:试题难度:三颗星知识点:可线性化的回归分析4.对具有线性相关关系的变量,测得一组数据如下表:根据上表,利用最小二乘法得到它们的回归直线方程为,则的值为( )A.1B.1.5C.2D.2.5答案:B解题思路:试题难度:三颗星知识点:可线性化的回归分析5.某单位为了解办公楼用电量与气温之间的关系,随机统计了四个用电量与当地平均气温,并制作了对照表:由表中数据得到线性归回方程,当气温为时,预测用电量为( )A.68度B.52度C.12度D.28度答案:A解题思路:试题难度:三颗星知识点:可线性化的回归分析6.根据如下样本数据:得到回归方程,则( )A.,B.,C.,D.,答案:A解题思路:试题难度:三颗星知识点:可线性化的回归分析7.某样本数据如下表所示:假设根据表中数据所得线性回归直线方程为,某同学根据表中的两组数据和求得的直线方程为,根据散点图的分布情况,判断以下结论正确的是( )A.,B.,C.,D.,答案:D解题思路:试题难度:三颗星知识点:可线性化的回归分析8.实验测得四组的值分别为,,,,则与间的线性回归方程是( )A. B.C. D.答案:C解题思路:试题难度:三颗星知识点:可线性化的回归分析。
线性回归方程高考真题教师版
线性回归方程一.选择题(共11小题)1.(2017•山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+,已知101225ii x==∑,1011600i i y ==∑,ˆ4b=,该班某学生的脚长为24,据此估计其身高为( ) A .160 B .163 C .166 D .1702.(2015•福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆy bx a =+,其中ˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元3.(2014•重庆)已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能是( ) A .ˆ0.4 2.3yx =+ B .ˆ2 2.4yx =- C .ˆ29.5yx =-+ D .ˆ0.3 4.4yx =-+ 4.(2014•湖北)根据如下样本数据:得到了回归方程ˆˆy bx a =+,则( ) A .ˆ0a>,ˆ0b < B .ˆ0a>,ˆ0b > C .ˆ0a<,ˆ0b < D .ˆ0a<,ˆ0b > 5.(2014•湖北)根据如下样本数据,得到回归方程ˆybx a =+,则( )6.(2013•湖北)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且ˆ 2.347 6.423yx =-; ②y 与x 负相关且ˆ 3.476 5.648yx =-+; ③y 与x 正相关且ˆ 5.4378.493yx =+; ④y 与x 正相关且ˆ 4.326 4.578yx =--. 其中一定不正确的结论的序号是( )A .①②B .②③C .③④D .①④7.(2013•福建)已知x 与y 之间的几组数据如表:假设根据上表数据所得线性回归直线方程为ˆˆy bx a =+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y b x a ='+',则以下结论正确的是( ) A .ˆbb >',ˆa a >' B .ˆbb >',ˆa a <' C .ˆbb <',ˆa a >' D .ˆbb <',ˆa a <' 8.(2011•陕西)设1(x ,1)y ,2(x ,2)y ,⋯,(n x ,)n y 是变量x 和y 的n 次方个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )A .直线l 过点(,)x yB .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同9.(2011•江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下A .1y x =-B .1y x =+C .1882y x =+D .176y =10.(2011•陕西)设1(x ,1)y ,2(x ,2)y ,⋯,(n x ,)n y 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,)y11.(2011•山东)某产品的广告费用x 与销售额y 的统计数据如下表根据上表可得回归方程ˆˆybx a =+的b 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元二.填空题(共3小题)12.(2011•辽宁)调查了某地若干户家庭的年收x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程ˆ0.2540.321yx =+.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元.13.(2011•广东)某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm .14.(2011•广东)工人月工资y (元)与劳动生产率x (千元)变化的回归方程为ˆ5080yx =+,下列判断正确的是 ①劳动生产率为1千元时,工资为130元;②劳动生产率提高1千元,则工资提高80元;③劳动生产率提高1千元,则工资提高130元;④当月工资为210元时,劳动生产率为2千元.三.解答题(共2小题)15.(2013•重庆)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180i i x ==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑.(Ⅰ)求家庭的月储蓄y 对月收入x 的线性回归方程y bx a =+; (Ⅱ)判断变量x 与y 之间是正相关还是负相关;(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y bx a =+中,1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,其中x ,y 为样本平均值,线性回归方程也可写为ˆˆˆybx a =+. 16.(2012•福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:bx (Ⅱ)预计在今后的销售中,销量与单价仍然服从()I 中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)线性回归方程参考答案与试题解析一.选择题(共11小题)1.(2017•山东)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+,已知101225ii x==∑,1011600i i y ==∑,ˆ4b=,该班某学生的脚长为24,据此估计其身高为( ) A .160 B .163 C .166 D .170【解答】解:由线性回归方程为ˆˆ4y x a =+, 则101122.510i i x x ===∑,101116010i i y y ===∑,则数据的样本中心点(22.5,160),由回归直线方程样本中心点,则ˆˆ4160422.570ay x =-=-⨯=, ∴回归直线方程为ˆ470yx =+, 当24x =时,ˆ42470166y=⨯+=, 则估计其身高为166, 故选:C .2.(2015•福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆy bx a =+,其中ˆˆ0.76,b a y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元【解答】解:由题意可得1(8.28.610.011.311.9)105x =++++=,1(6.27.58.08.59.8)85y =++++=,代入回归方程可得ˆ80.76100.4a=-⨯=, ∴回归方程为ˆ0.760.4yx =+, 把15x =代入方程可得0.76150.411.8y =⨯+=, 故选:B .3.(2014•重庆)已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能是( )A .ˆ0.4 2.3y x =+B .ˆ2 2.4y x =-C .ˆ29.5y x =-+D .ˆ0.3 4.4yx =-+ 【解答】解:变量x 与y 正相关, ∴可以排除C ,D ;样本平均数3x =, 3.5y =,代入A 符合,B 不符合, 故选:A .4.(2014•湖北)根据如下样本数据:得到了回归方程ˆˆy bx a =+,则( ) A .ˆ0a>,ˆ0b < B .ˆ0a>,ˆ0b > C .ˆ0a<,ˆ0b < D .ˆ0a<,ˆ0b > 【解答】解:样本平均数 5.5x =,0.25y =,∴61()()24.5i i i x x y y =--=-∑,621()17.5i i x x =-=∑,24.51.417.5b ∴=-=-, 0.25( 1.4)5.57.95a ∴=--=,故选:A .5.(2014•湖北)根据如下样本数据,得到回归方程ˆybx a =+,则( )【解答】解:由题意可知:回归方程经过的样本数据对应的点附近,是减函数,所以0b <,且回归方程经过(3,4)与(4,2.5)附近,所以0a >. 故选:B .6.(2013•湖北)四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且ˆ 2.347 6.423yx =-; ②y 与x 负相关且ˆ 3.476 5.648yx =-+; ③y 与x 正相关且ˆ 5.4378.493yx =+; ④y 与x 正相关且ˆ 4.326 4.578yx =--. 其中一定不正确的结论的序号是( ) A .①②B .②③C .③④D .①④【解答】解:①y 与x 负相关且ˆ 2.347 6.423yx =-;此结论误,由线性回归方程知,此两变量的关系是正相关; ②y 与x 负相关且ˆ 3.476 5.648yx =-+;此结论正确,线性回归方程符合负相关的特征; ③y 与x 正相关且ˆ 5.4378.493yx =+; 此结论正确,线性回归方程符合正相关的特征; ④y 与x 正相关且ˆ 4.326 4.578yx =--.此结论不正确,线性回归方程符合负相关的特征.综上判断知,①④是一定不正确的 故选:D .7.(2013•福建)已知x 与y 之间的几组数据如表:假设根据上表数据所得线性回归直线方程为ˆˆy bx a =+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y b x a ='+',则以下结论正确的是( ) A .ˆbb >',ˆa a >' B .ˆbb >',ˆa a <' C .ˆbb <',ˆa a >' D .ˆbb <',ˆa a <' 【解答】解:由题意可知6n =,1121762n ii x x n ====∑,11136n i i y y n ===∑, 故22217916()222nii x nx =-=-⨯=∑,171325586262ni i i x y nxy =-=-⨯⨯=∑,故可得12215ˆ7ni ii nii x ynxybxnx ==-==-∑∑,13571ˆ6723a y bx =-=-⨯=-, 而由直线方程的求解可得02212b -'==-,把(1,0)代入可得2a '=-, 比较可得?b b <',?a a >', 故选:C .8.(2011•陕西)设1(x ,1)y ,2(x ,2)y ,⋯,(n x ,)n y 是变量x 和y 的n 次方个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )A .直线l 过点(,)x yB .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 【解答】解:回归直线一定过这组数据的样本中心点,故A 正确, 两个变量的相关系数不是直线的斜率,而是需要用公式做出,故B 不正确, 直线斜率为负,相关系数应在(1,0)-之间,故C 不正确,所有的样本点集中在回归直线附近,不一定两侧一样多,故D 不正确, 故选:A .9.(2011•江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下A .1y x =-B .1y x =+C .1882y x =+D .176y =【解答】解:1741761761761781765x ++++==,1751751761771771765y ++++==,∴本组数据的样本中心点是(176,176),根据样本中心点一定在线性回归直线上,把样本中心点代入四个选项中对应的方程,只有1882y x =+适合, 故选:C .10.(2011•陕西)设1(x ,1)y ,2(x ,2)y ,⋯,(n x ,)n y 是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A .x 和y 的相关系数为直线l 的斜率B .x 和y 的相关系数在0到1之间C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同D .直线l 过点(x ,)y【解答】解:直线l 是由这些样本点通过最小二乘法得到的线性回归直线,回归直线方程一定过样本中心点, 故选:D .11.(2011•山东)某产品的广告费用x 与销售额y 的统计数据如下表根据上表可得回归方程ˆˆybx a =+的b 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .63.6万元 B .65.5万元 C .67.7万元D .72.0万元【解答】解:42353.54x +++==, 49263954424y +++==,数据的样本中心点在线性回归直线上, 回归方程ˆˆˆybx a =+中的ˆb 为9.4, ˆ429.4 3.5a ∴=⨯+, ∴ˆ9.1a=, ∴线性回归方程是9.49.1y x =+,∴广告费用为6万元时销售额为9.469.165.5⨯+=,故选:B .二.填空题(共3小题)12.(2011•辽宁)调查了某地若干户家庭的年收x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程ˆ0.2540.321yx =+.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 0.254 万元. 【解答】解:对x 的回归直线方程ˆ0.2540.321y x =+. ∴1ˆ0.254(1)0.321yx =++, ∴1ˆˆ0.254(1)0.3210.2540.3210.254yy x x -=++--=. 故答案为:0.254.13.(2011•广东)某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 185 cm .【解答】解:设X 表示父亲的身高,Y 表示儿子的身高则Y 随X 的变化情况如下;建立这种线性模型:求解得线性回归方程3y x =+ 当182x =时,185y = 故答案为:185.14.(2011•广东)工人月工资y (元)与劳动生产率x (千元)变化的回归方程为ˆ5080yx =+,下列判断正确的是 ②①劳动生产率为1千元时,工资为130元;②劳动生产率提高1千元,则工资提高80元;③劳动生产率提高1千元,则工资提高130元;④当月工资为210元时,劳动生产率为2千元. 【解答】解::对x 的回归直线方程ˆ5080y x =+, ∴1ˆ80(1)50yx =++, ∴1ˆˆ80(1)50805080yy x x -=++--=.所以劳动生产率提高1千元,则工资提高80元,②正确,③不正确. ①④不满足回归方程的意义. 故答案为:②.三.解答题(共2小题)15.(2013•重庆)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180i i x ==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑.(Ⅰ)求家庭的月储蓄y 对月收入x 的线性回归方程y bx a =+; (Ⅱ)判断变量x 与y 之间是正相关还是负相关;(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y bx a =+中,1221ni ii nii x ynxyb xnx==-=-∑∑,a y bx =-,其中x ,y 为样本平均值,线性回归方程也可写为ˆˆˆybx a =+. 【解答】解:(Ⅰ)由题意可知10n =,1180810n ii x x n ====∑,1120210n i i y y n ====∑, 故222172010880nxx ii l x nx ==-=-⨯=∑,1184108224nxy i i i l x y nxy ==-=-⨯⨯=∑,故可得240.380xy xxl b l ====,20.380.4a y bx =-=-⨯=-, 故所求的回归方程为:0.30.4y x =-;(Ⅱ)由(Ⅰ)可知0.30b =>,即变量y 随x 的增加而增加,故x 与y 之间是正相关;(Ⅲ)把7x =代入回归方程可预测该家庭的月储蓄为0.370.4 1.7y =⨯-=(千元).16.(2012•福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:bx (Ⅱ)预计在今后的销售中,销量与单价仍然服从()I 中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 【解答】解:88.28.48.68.89()8.56I x +++++==,1(908483807568)806y =+++++=20b =-,a y bx =-,11 / 11 80208.5250a ∴=+⨯=∴回归直线方程ˆ20250yx =-+; ()II 设工厂获得的利润为L 元,则233(20250)4(20250)20()361.254L x x x x =-+--+=--+ ∴该产品的单价应定为334元,工厂获得的利润最大.。
线性回归方程题型
欢迎阅读线性回归方程
1.【2014高考全国2第19题】某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:
∧
b
2.【2016年全国3】下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1–7分别对应年份2008–2014.
(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
欢迎阅读
(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:7
1
9.32 i
i
y =
=
∑,7
1
40.17
i i
i
t y =
=
∑
0.55
=,≈2.646.
3.【2015全国1】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x
8
(I关于年宣传费x
(II
(III)已知这种产品的年利润z与x,y的关系为0.2
z y x
=-,根据(II)的结果回答下列问题:
(i)当年宣传费x=49时,年销售量及年利润的预报值时多少?
(ii)当年宣传费x为何值时,年利润的预报值最大?。
高考数学复习考点32 线性回归方程与列联表(讲解) (解析版)
考点32 回归方程与独立性检验【思维导图】【常见考法】考法一 回归方程1.某工厂某产品产量x (千件)与单位成本y (元)满足回归直线方程77.36 1.82y x =-,则以下说法中正确的是( )A .当产量为1千件时,单位成本为75.54元B .当产量为2千件时,单位成本为73.72元C .产量每增加1000件,单位成本约下降1.82元D .产量每减少1000件,单位成本约下降1.82元【答案】C【解析】令()77.36 1.82f x x =-,因为()()()177.36 1.82177.36 1.82 1.82f x f x x x +-=-+-+=-, 所以产量每增加1000件,单位成本约下降1.82元.故选:C2.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元 D .105万元【答案】B【解析】由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50),∴ˆ5075a =⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+.当10x =时,710158ˆ5y =⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元.故选B .3.某企业为了参加上海的进博会,大力研发新产品,为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据(i x ,i y )(1,2,,6i =⋅⋅⋅),如表所示:已知611806i i y y ===∑.(1)求q 的值;(2)已知变量x ,y 具有线性相关关系,求产品销量y (件)关于试销单价x (元)的线性回归方程ˆˆˆy bx a =+;(3)用ˆi y表示用正确的线性回归方程得到的与i x 对应的产品销量的估计值,当ˆ1i i y y -≤时,将销售数据(i x ,i y )称为一个“好数据”,现从6个销售数据中任取2个,求抽取的2个销售数据中至少有一个是“好数据”的概率.参考公式:()()()1122211ˆnni iiii i nniii i x y nx y x x y y bxnxx x =-==---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)90;(2)ˆ4106y x =-+;(3)45. 【解析】(1)由611806i i y y -==∑,得8483807568806q +++++=,解得90q =. (2)经计算,613050i ii x y-=∑, 6.5x =,621271i i x -=∑,所以230506 6.580ˆ42716 6.5b-⨯⨯==--⨯, ˆ804 6.5106a=+⨯=,所以所求的线性回归方程为ˆ4106y x =-+. (3)由(2)知,当14x =时,1ˆ90y =;当25x =时,2ˆ86y =;当36x =时,3ˆ82y =;当47x =时,4ˆ78y=;当58x =时,5ˆ74y=;当69x =时,6ˆ70y =.与销售数据对比可知满足ˆ1i i y y -≤(1,2,,6i =⋅⋅⋅)的共有3个:()4,90,()6,83,()8,75.从6个销售数据中任取2个的所有可能结果有2665C 152⨯==(种),其中2个销售数据中至少有一个是“好数据”的结果有112333C C C 33312+=⨯+=(种),于是抽取的2个销售数据中至少有一个是“好数据”的概率为124155=. 考法二 非线性回归方程1.某同学的父亲决定今年夏天卖西瓜赚钱,根据去年6月份的数据统计连续五天内每天所卖西瓜的个数与温度之间的关系如下表:(1)求这五天内所卖西瓜个数的平均值和方差;(2)求变量x,y 之间的线性回归方程,并预测当温度为30 °C 时所卖西瓜的个数.附:b ̂=∑x i y i ni=1−nx̅y̅∑x i 2n i=1−nx̅2,a ̂=y ̅−b ̂x̅(精确到0.1). 【答案】(1)26,27.2(2)y ̂=2.2x −51,15 【解析】(1)y ̅=15×(20+22+24+30+34)=26,方差为s 2=15×[(20−26)2+(22−26)2+(24−26)2+(30−26)2+(34−26)2]=27.2. (2)x̅=15×(32+33+35+37+38)=35,∑x i 25i=1=6 151,∑x i y i 5i=1=4 608, 所以b ̂=∑x i y i 5i=1−5x̅y ̅∑x i 25i=1−5x̅2=4 608−5×35×266 151−5×352=5826≈2.2,a ̂=y ̅−b ̂x̅=26−2.2×35=−51, 所以回归直线方程为y ̂=2.2x −51,当x =30时,y =15,所以预测当温度为30 °C 时所卖西瓜的个数为15.2.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量()y g 与尺寸()mm x 之间近似满足关系式b y c x =⋅(b ,c 为大于0的常数).按照某指标测定,当产品质量与尺寸的比在区间()0.302,0.388内时为优等品.现随机抽取6件合格产品,测得数据如下:(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率; (2)根据测得数据作了初步处理,得相关统计量的值如下表:根据所给统计量,求y 关于x 的回归方程. 附:对于样本(),(1,2,,6)i i v u i =,其回归直线u b v a =⋅+的斜率和截距的最小二乘法估计公式分别为:()()()1122211ˆnniii i i i nniii i v v u u v u nv ubvv vnv ====---==--∑∑∑∑,ˆˆa u bv=-, 2.7183e ≈.【答案】(1)15;(2)0.5ˆyex =. 【解析】(1)由已知,优等品的质量与尺寸的比(0.302,0.388)yx∈ 则随机抽取的6件合格产品中,有3件为优等品,记为a ,b ,c , 有3件为非优等品,记为d ,e ,f ,现从抽取的6件合格产品中再任选2件,基本事件为:(,),(,),(,),(,)a b a c a d a e (, ),(, ),(, ),(,),(,),(,)a f b c b d b e b f c d(,),(,),(,),(,),(,)c e c f d e d f e f ,选中的两件均为优等品的事件为(,),(,),(,)a b a c b c ,所以所求概率为31155=. (2)对b y c x =⋅两边取自然对数得ln ln ln y c b x =+令ln ,ln i i i i v x u y ==,则u b v a =⋅+,且ln a c = 由所给统计量及最小二乘估计公式有:11222175.324.618.360.271ˆ101.424.660.542ni i nii v u nuvbvnv ==--⨯÷====-÷-∑∑ 118.324.62ˆˆ16au bv ⎛⎫-⨯ ⎪⎝⎭=-==, 由ˆˆln ac =得ˆc e =,所以y 关于x 的回归方程为0.5ˆyex =.3.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:经计算:611266i i x x ===∑,611336i i y y ===∑,61()()557i i i x x y y =--=∑,621()84i i x x =-=∑,621()3930ii y y =-=∑,621()23.6ˆ64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程^^^y b x a =+(结果精确到0.1);(2)若用非线性回归模型求得y 关于x 的回归方程0.23030.06ˆxye =,且相关指数为20.9522R =.(i)试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好;(ii )用拟合效果好的模型预测温度为35C 时该紫甘薯死亡株数(结果取整数). 附:对于一组数据11(,)u v ,22(,)u v ,,(,)n n u v ,其回归直线ˆˆv u αβ∧=+的斜率和截距的最小二乘估计分别为:121()()()niii ni i u u v v u u β∧==--=-∑∑,a v u β∧∧=-;相关指数为:22121()1()niii niii v v R v v ∧==-=--∑∑.【解析】(Ⅰ)由题意得,()()()121557= 6.6384ˆni i i n i i x x y y b x x ==--=≈-∑∑ ∴ˆa =33−6.63⨯26=−139.4,∴y 关于x 的线性回归方程为:ˆy =6.6x −139.4.(注:若用ˆ 6.6b≈计算出18.6ˆ3a =-,则酌情扣1分) (Ⅱ) (i )线性回归方程ˆy =6.6x −138.6对应的相关指数为:()()6221621236.641110.06020.93983930ˆi i i i ii y y R y y ==-=-=-≈-=-∑∑,因为0.9398<0.9522,所以回归方程0.2303ˆ0.06xye =比线性回归方程ˆy =6.6x −138.6拟合效果更好.(ii )由(i )知,当温度35x C =时,0.2303358.06050.060.060.063167190ˆye e ⨯==≈⨯≈, 即当温度为35︒C 时该批紫甘薯死亡株数为190.考法三 独立性检验1.为大力提倡“厉行节约,反对浪费”,某市通过随机调查100名性别不同的居民是否做到“光盘”行动,得到如下列联表:经计算()()()()()22 3.03n ad bcKa b c d a c b d-=≈++++.附表:参照附表,得到的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别无关”【答案】C【解析】由题意可知2 3.03K≈,结合临界值表可知2.706 3.03 3.841<<,因而在犯错误的概率不超过10%的前提下,认为“该市居民能否做到‘光盘’行动与性别有关”,或表述为有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别有关”;结合选项可知,C为正确选项,故选:C.2.2020年寒假,因为“新冠”疫情全体学生只能在家进行网上学习,为了研究学生网上学习的情况,某学校随机抽取100名学生对线上教学进行调查,其中男生与女生的人数之比为9:11,抽取的学生中男生有30人对线上教学满意,女生中有10名表示对线上教学不满意.(1)完成22⨯列联表,并回答能否有90%的把握认为“对线上教学是否满意与性别有关”;(2)从被调查的对线上教学满意的学生中,利用分层抽样抽取5名学生,再在这5名学生中抽取2名学生,作线上学习的经验介绍,求其中抽取一名男生与一名女生的概率.附:()()()()()22n ad bcKa b c d a c b d⋅=++++.【答案】(1)填表见解析;有90%的把握认为“对线上教学是否满意与性别有关”;(2)35.【解析】(1)22⨯列联表如下:又()22100301045153.03 2.70675254555K⨯-⨯=≈>⨯⨯⨯,这说明有90%的把握认为“对线上教学是否满意与性别有关”.(2)方法一:由题可知,从被调查中对线上教学满意的学生中,利用分层抽样抽取5名学生,其中男生2名,设为A、B;女生3人设为,,a b c,则从这5名学生中抽取2名学生的基本事件有:(),A B,(),A a,(),A b,(),A c,(),B a,(),B b,(),B c,(),a b,(),a c,(),b c,共10个基本事件,其中抽取一名男生与一名女生的事件有(),A a,(),A b,(),A c,(),B a,(),B b,(),B c,共6个基本事件,根据古典概型,从这5名学生中抽取一名男生与一名女生的概率为63 105=.方法二:由题可知,从被调查中对线上教学满意的学生中,利用分层抽样抽取5名学生,其中男生2名,设为;女生3人,根据古典概型,从这5名学生中抽取一名男生与一名女生的概率为11 22 2 563 105C CC==3.“微信运动”是一个类似计步数据库的公众账号,用户只需以运动手环或手机协处理器的运动数据为介,然后关注该公众号,就能看见自己与好友每日行走的步数,并在同一排行榜上得以体现.现随机选取朋友圈中的50人记录了他们某一天的走路步数,并将数据整理如下:规定:人一天行走的步数超过8000步时被系统评定为“积极性”,否则为“懈怠性”.(1)填写下面22⨯列联表(单位:人),并根据列联表判断是否有90%的把握认为“评定类型与性别有关”;附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (2)为了进一步了解“懈怠性”人群中每个人的生活习惯,从步数在3001~6000的人群中再随机抽取3人,求选中的人中男性人数超过女性人数的概率.【答案】(1)列联表见解析;没有90%的把握认为“评定类型与性别有关”;(2)310. 【解析】(1)22⨯列联表如下:根据列联表中的数据,得的观测值2K 的观测值()225020810120.231 2.70630203218K ⨯⨯-⨯=≈<⨯⨯⨯, 所以没有90%的把握认为“评定类型与性别有关”.(2)由已知可得从步数在3001~6000的人群有男性2人,女性3人.设步数在3001~6000中的男性的编号为1,2,女性的编号为a ,b ,c .设选中的人中男性人数超过女性人数为事件A .选取三人的所有情况为()1,2,a ,()1,2,b ,()1,2,c ,()1,,a b ,()1,,a c ,()1,,b c ,()2,,a b ,()2,,a c ,()2,,b c ,(),,a b c ,共10种情况.符合条件的情况有()1,2,a ,()1,2,b ,()1,2,c ,共3种情况.故所求概率为()310P A =. 4.为了提高生产效益,某企业引进一批新的生产设备,为了解设备生产产品的质量情况,分别从新、旧设备所生产的产品中,各随机抽取100件产品进行质量检测,所有产品质量指标值均在(]15,45以内,规定质量指标值大于30的产品为优质品,质量指标值在(]15,30以内的产品为合格品.旧设备所生产的产品质量指标值如频率分布直方图所示,新设备所生产的产品质量指标如频数分布表所示.(1)请分别估计新、旧设备所生产的产品优质品率;(2)优质品率是衡量一台设备性能高低的重要指标,优质品率越高说明设备的性能越高.根据已知图表数据填写下面列联表(单位:件),并判断是否有95%的把握认为“产品质量高低与新设备有关”;(3)已知每件产品的纯利润y (单位:元)与产品质量指标t 的关系式为2,30451,1530t y t <≤⎧=⎨<≤⎩.若每台新设备每天可以生产1000件产品,买一台新设备需要80万元,请估计至少需要生产多少天才可以收回设备成本.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)估计新、旧设备所生产的产品优质品率分别为70%、55%;(2)列联表见解析,有95%的把握认为“产品质量高低与新设备有关”,理由见解析;(3)471.【解析】(1)估计新设备所生产的产品优质品率为302515100%70%100++⨯=,估计旧设备所生产的产品优质品率为()50.060.030.02100%55%⨯++⨯=;(2)根据题中所给数据可得到如下22⨯列联表:()22220030557045 4.8 3.84110075125K ⨯⨯-⨯==>⨯⨯, 因此,有95%的把握认为“产品质量高低与新设备有关”; (3)新设备所生产的产品的优质品率为0.7,∴每台新设备每天所生产的1000件产品中,估计有10000.7700⨯=件优质产品,有300件合格品,则每台新设备每天所生产的产品的纯利润为700230011700⨯+⨯=(元), 8000001700471÷≈(天),因此,估计至少需要471天方可收回成本.。
【2022 高考数学一轮复习(学科版)】考点32 线性回归方程与列联表(讲解) (解析版)
考点32 回归方程与独立性检验【思维导图】【常见考法】考法一 回归方程1.某工厂某产品产量x (千件)与单位成本y (元)满足回归直线方程77.36 1.82y x =-,则以下说法中正确的是( )A .当产量为1千件时,单位成本为75.54元B .当产量为2千件时,单位成本为73.72元C .产量每增加1000件,单位成本约下降1.82元D .产量每减少1000件,单位成本约下降1.82元【答案】C【解析】令()77.36 1.82f x x =-,因为()()()177.36 1.82177.36 1.82 1.82f x f x x x +-=-+-+=-, 所以产量每增加1000件,单位成本约下降1.82元.故选:C2.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元 D .105万元【答案】B【解析】由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50),∴ˆ5075a =⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+.当10x =时,710158ˆ5y =⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元.故选B .3.某企业为了参加上海的进博会,大力研发新产品,为了对新研发的一批产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据(i x ,i y )(1,2,,6i =⋅⋅⋅),如表所示:已知611806i i y y ===∑.(1)求q 的值;(2)已知变量x ,y 具有线性相关关系,求产品销量y (件)关于试销单价x (元)的线性回归方程ˆˆˆy bx a =+;(3)用ˆi y表示用正确的线性回归方程得到的与i x 对应的产品销量的估计值,当ˆ1i i y y -≤时,将销售数据(i x ,i y )称为一个“好数据”,现从6个销售数据中任取2个,求抽取的2个销售数据中至少有一个是“好数据”的概率.参考公式:()()()1122211ˆnni iiii i nniii i x y nx y x x y y bxnxx x =-==---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)90;(2)ˆ4106y x =-+;(3)45. 【解析】(1)由611806i i y y -==∑,得8483807568806q +++++=,解得90q =. (2)经计算,613050i ii x y-=∑, 6.5x =,621271i i x -=∑,所以230506 6.580ˆ42716 6.5b-⨯⨯==--⨯, ˆ804 6.5106a=+⨯=,所以所求的线性回归方程为ˆ4106y x =-+. (3)由(2)知,当14x =时,1ˆ90y =;当25x =时,2ˆ86y =;当36x =时,3ˆ82y =;当47x =时,4ˆ78y=;当58x =时,5ˆ74y=;当69x =时,6ˆ70y =.与销售数据对比可知满足ˆ1i i y y -≤(1,2,,6i =⋅⋅⋅)的共有3个:()4,90,()6,83,()8,75.从6个销售数据中任取2个的所有可能结果有2665C 152⨯==(种),其中2个销售数据中至少有一个是“好数据”的结果有112333C C C 33312+=⨯+=(种),于是抽取的2个销售数据中至少有一个是“好数据”的概率为124155=. 考法二 非线性回归方程1.某同学的父亲决定今年夏天卖西瓜赚钱,根据去年6月份的数据统计连续五天内每天所卖西瓜的个数与温度之间的关系如下表:(1)求这五天内所卖西瓜个数的平均值和方差;(2)求变量x,y 之间的线性回归方程,并预测当温度为30 °C 时所卖西瓜的个数.附:b ̂=∑x i y i ni=1−nx̅y̅∑x i 2n i=1−nx̅2,a ̂=y ̅−b ̂x̅(精确到0.1). 【答案】(1)26,27.2(2)y ̂=2.2x −51,15 【解析】(1)y ̅=15×(20+22+24+30+34)=26,方差为s 2=15×[(20−26)2+(22−26)2+(24−26)2+(30−26)2+(34−26)2]=27.2. (2)x̅=15×(32+33+35+37+38)=35,∑x i 25i=1=6 151,∑x i y i 5i=1=4 608, 所以b ̂=∑x i y i 5i=1−5x̅y ̅∑x i 25i=1−5x̅2=4 608−5×35×266 151−5×352=5826≈2.2,a ̂=y ̅−b ̂x̅=26−2.2×35=−51, 所以回归直线方程为y ̂=2.2x −51,当x =30时,y =15,所以预测当温度为30 °C 时所卖西瓜的个数为15.2.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量()y g 与尺寸()mm x 之间近似满足关系式b y c x =⋅(b ,c 为大于0的常数).按照某指标测定,当产品质量与尺寸的比在区间()0.302,0.388内时为优等品.现随机抽取6件合格产品,测得数据如下:(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率; (2)根据测得数据作了初步处理,得相关统计量的值如下表:根据所给统计量,求y 关于x 的回归方程. 附:对于样本(),(1,2,,6)i i v u i =,其回归直线u b v a =⋅+的斜率和截距的最小二乘法估计公式分别为:()()()1122211ˆnniii i i i nniii i v v u u v u nv ubv v vnv ====---==--∑∑∑∑,ˆˆa u bv=-, 2.7183e ≈.【答案】(1)15;(2)0.5ˆyex =. 【解析】(1)由已知,优等品的质量与尺寸的比(0.302,0.388)yx∈ 则随机抽取的6件合格产品中,有3件为优等品,记为a ,b ,c , 有3件为非优等品,记为d ,e ,f ,现从抽取的6件合格产品中再任选2件,基本事件为:(,),(,),(,),(,)a b a c a d a e (, ),(, ),(, ),(,),(,),(,)a f b c b d b e b f c d(,),(,),(,),(,),(,)c e c f d e d f e f ,选中的两件均为优等品的事件为(,),(,),(,)a b a c b c ,所以所求概率为31155=. (2)对b y c x =⋅两边取自然对数得ln ln ln y c b x =+令ln ,ln i i i i v x u y ==,则u b v a =⋅+,且ln a c = 由所给统计量及最小二乘估计公式有:11222175.324.618.360.271ˆ101.424.660.542ni i nii v u nuvbvnv ==--⨯÷====-÷-∑∑ 118.324.62ˆˆ16au bv ⎛⎫-⨯ ⎪⎝⎭=-==, 由ˆˆln ac =得ˆc e =, 所以y 关于x 的回归方程为0.5ˆyex =.3.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数: C )死亡数经计算:611266i i x x ===∑,611336i i y y ===∑,61()()557i i i x x y y =--=∑,621()84i i x x =-=∑,621()3930ii y y =-=∑,621()23.6ˆ64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程^^^y b x a =+(结果精确到0.1);(2)若用非线性回归模型求得y 关于x 的回归方程0.23030.06ˆxye =,且相关指数为20.9522R =.(i)试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好;(ii )用拟合效果好的模型预测温度为35C 时该紫甘薯死亡株数(结果取整数).附:对于一组数据11(,)u v ,22(,)u v ,,(,)n n u v ,其回归直线ˆˆv u αβ∧=+的斜率和截距的最小二乘估计分别为:121()()()ni i i ni i u u v v u u β∧==--=-∑∑,a v u β∧∧=-;相关指数为:22121()1()ni i i niii v v R v v ∧==-=--∑∑.【解析】(Ⅰ)由题意得,()()()121557= 6.6384ˆni i i n i i x x y y b x x ==--=≈-∑∑∴ˆa =33−6.63⨯26=−139.4,∴y 关于x 的线性回归方程为:ˆy =6.6x −139.4.(注:若用ˆ 6.6b≈计算出18.6ˆ3a =-,则酌情扣1分) (Ⅱ) (i )线性回归方程ˆy =6.6x −138.6对应的相关指数为:()()6221621236.641110.06020.93983930ˆi i i i i i y yR y y ==-=-=-≈-=-∑∑,因为0.9398<0.9522,所以回归方程0.2303ˆ0.06xye =比线性回归方程ˆy =6.6x −138.6拟合效果更好.(ii )由(i )知,当温度35x C =时,0.2303358.06050.060.060.063167190ˆye e ⨯==≈⨯≈, 即当温度为35︒C 时该批紫甘薯死亡株数为190.考法三 独立性检验1.为大力提倡“厉行节约,反对浪费”,某市通过随机调查100名性别不同的居民是否做到“光盘”行动,得到如下列联表:经计算()()()()()223.03n ad bc K a b c d a c b d -=≈++++. 附表:参照附表,得到的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别无关”【答案】CK≈,【解析】由题意可知2 3.03<<,结合临界值表可知2.706 3.03 3.841因而在犯错误的概率不超过10%的前提下,认为“该市居民能否做到‘光盘’行动与性别有关”,或表述为有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别有关”;结合选项可知,C为正确选项,故选:C.2.2020年寒假,因为“新冠”疫情全体学生只能在家进行网上学习,为了研究学生网上学习的情况,某学校随机抽取100名学生对线上教学进行调查,其中男生与女生的人数之比为9:11,抽取的学生中男生有30人对线上教学满意,女生中有10名表示对线上教学不满意.(1)完成22⨯列联表,并回答能否有90%的把握认为“对线上教学是否满意与性别有关”;(2)从被调查的对线上教学满意的学生中,利用分层抽样抽取5名学生,再在这5名学生中抽取2名学生,作线上学习的经验介绍,求其中抽取一名男生与一名女生的概率.附:()()()()()22n ad bcKa b c d a c b d⋅=++++.【答案】(1)填表见解析;有90%的把握认为“对线上教学是否满意与性别有关”;(2)35.【解析】(1)22⨯列联表如下:又()22100301045153.03 2.70675254555K⨯-⨯=≈>⨯⨯⨯,这说明有90%的把握认为“对线上教学是否满意与性别有关”.(2)方法一:由题可知,从被调查中对线上教学满意的学生中,利用分层抽样抽取5名学生, 其中男生2名,设为A 、B ;女生3人设为,,a b c ,则从这5名学生中抽取2名学生的基本事件有:(),A B ,(),A a ,(),A b ,(),A c ,(),B a ,(),B b ,(),B c ,(),a b ,(),a c ,(),b c ,共10个基本事件,其中抽取一名男生与一名女生的事件有(),A a ,(),A b ,(),A c ,(),B a ,(),B b ,(),B c ,共6个基本事件,根据古典概型,从这5名学生中抽取一名男生与一名女生的概率为63105=. 方法二:由题可知,从被调查中对线上教学满意的学生中,利用分层抽样抽取5名学生,其中男生2名,设为;女生3人,根据古典概型,从这5名学生中抽取一名男生与一名女生的概率为11222563105C C C == 3.“微信运动”是一个类似计步数据库的公众账号,用户只需以运动手环或手机协处理器的运动数据为介,然后关注该公众号,就能看见自己与好友每日行走的步数,并在同一排行榜上得以体现.现随机选取朋友圈中的50人记录了他们某一天的走路步数,并将数据整理如下:规定:人一天行走的步数超过8000步时被系统评定为“积极性”,否则为“懈怠性”.(1)填写下面22⨯列联表(单位:人),并根据列联表判断是否有90%的把握认为“评定类型与性别有关”;附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (2)为了进一步了解“懈怠性”人群中每个人的生活习惯,从步数在3001~6000的人群中再随机抽取3人,求选中的人中男性人数超过女性人数的概率. 【答案】(1)列联表见解析;没有90%的把握认为“评定类型与性别有关”;(2)310. 【解析】(1)22⨯列联表如下:根据列联表中的数据,得的观测值2K 的观测值()225020810120.231 2.70630203218K ⨯⨯-⨯=≈<⨯⨯⨯, 所以没有90%的把握认为“评定类型与性别有关”.(2)由已知可得从步数在3001~6000的人群有男性2人,女性3人.设步数在3001~6000中的男性的编号为1,2,女性的编号为a ,b ,c .设选中的人中男性人数超过女性人数为事件A .选取三人的所有情况为()1,2,a ,()1,2,b ,()1,2,c ,()1,,a b ,()1,,a c ,()1,,b c ,()2,,a b ,()2,,a c ,()2,,b c ,(),,a b c ,共10种情况.符合条件的情况有()1,2,a ,()1,2,b ,()1,2,c ,共3种情况.故所求概率为()310P A =. 4.为了提高生产效益,某企业引进一批新的生产设备,为了解设备生产产品的质量情况,分别从新、旧设备所生产的产品中,各随机抽取100件产品进行质量检测,所有产品质量指标值均在(]15,45以内,规定质量指标值大于30的产品为优质品,质量指标值在(]15,30以内的产品为合格品.旧设备所生产的产品质量指标值如频率分布直方图所示,新设备所生产的产品质量指标如频数分布表所示.(1)请分别估计新、旧设备所生产的产品优质品率;(2)优质品率是衡量一台设备性能高低的重要指标,优质品率越高说明设备的性能越高.根据已知图表数据填写下面列联表(单位:件),并判断是否有95%的把握认为“产品质量高低与新设备有关”;(3)已知每件产品的纯利润y(单位:元)与产品质量指标t的关系式为2,30451,1530tyt<≤⎧=⎨<≤⎩.若每台新设备每天可以生产1000件产品,买一台新设备需要80万元,请估计至少需要生产多少天才可以收回设备成本.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)估计新、旧设备所生产的产品优质品率分别为70%、55%;(2)列联表见解析,有95%的把握认为“产品质量高低与新设备有关”,理由见解析;(3)471.【解析】(1)估计新设备所生产的产品优质品率为302515100%70%100++⨯=, 估计旧设备所生产的产品优质品率为()50.060.030.02100%55%⨯++⨯=;(2)根据题中所给数据可得到如下22⨯列联表:()22220030557045 4.8 3.84110075125K ⨯⨯-⨯==>⨯⨯, 因此,有95%的把握认为“产品质量高低与新设备有关”;(3)新设备所生产的产品的优质品率为0.7,∴每台新设备每天所生产的1000件产品中,估计有10000.7700⨯=件优质产品,有300件合格品,⨯+⨯=(元),则每台新设备每天所生产的产品的纯利润为700230011700÷≈(天),因此,估计至少需要471天方可收回成本.8000001700471。
第42讲 回归直线方程(解析版)-【高考艺术生专用】2022年高考数学复习(,全国通用版)
第42讲 回归直线方程一、单选题1.(2021·陕西王益·高一期中)下表是某厂1~4月份用水量(单位:百吨)的一组数据:用水量与月份之间有较好的线性相关关系,其线性回归方程是ˆ525ybx =+.,则b 等于( ) A .1- B .0.9- C .0.8- D .0.7-【答案】D 【详解】由于回归直线必经过点(),x y ,而 2.5x =, 3.5y =,∴3.5 2.5 5.5ˆ2b=⨯+,∴0.7b =-. 故选:D .2.(2021·河南许昌·(文))下表是某产品1~4月份销量(单位:百件)的一组数据,分析后可知,销量y 与月份)(17x x <<之间有较好的线性相关关系,其线性回归方程是0.6ˆˆ=-+yx a ,则预测5月份的销量是( )A .2B .1.5C .2.5D .1.6【答案】A 【详解】 由数表得1234 4.543 2.52.5,3.544x y ++++++====, 由此得样本点的中心(2.5,3.5),并且该点在回归直线0.6ˆˆ=-+yx a 上, 则有ˆ3.50.6 2.5a=-⨯+,解得ˆ5a =,即回归直线方程为0.65ˆy x =-+, 当5x =时,0.6552ˆy=-⨯+=, 所以预测5月份的销量是2. 故选:A3.(2021·安徽黄山·高二期末(文))如果某地的财政收入x 与支出y 满足线性回归方程ˆˆybx a e =++(单位:亿元),其中,ˆ0.8b=,2a =,0.5e ≤.若今年该地区财政收入为10亿元,则年支出预计不会超过( )A .9亿元B .9.5亿元C .10亿元D .10.5亿元【答案】D 【详解】因为ˆˆ0.82ybx a e x e =++=++,所以当10x =时, 8210100.510.5y e e =++=+≤+=.故选:D .4.(2021·云南保山·(文))某种产品的投入x (单位:万元)与收入y (单位:万元)之间的关系如表:若已知与的线性回归方程为 6.517.5y x =+,那么当投入为4万元时,收入的随机误差为( )万元.(随机误差=真实值-预测值) A .-4.5 B .4.5 C .3.5 D .-3.5【答案】D 【详解】取4x =,得 6.517.543.5y x =+=,∴当投入为4万元时,随机误差4043.5 3.5=-=-, 故选:D .5.(2021·河北运河·沧州市一中)下表记录了某产品的广告支出费用x (万元)与销售额y (万元)的几组数据:) A .30 B .26 C .23 D .20【答案】D 【详解】解:由已知可得:1(2356)44x =+++=,代入ˆ72yx =+,得30y =, 154045304t ∴+++=⨯,解得:20t =,故选:D .6.(2021·江苏盐城·高二期中)已知某品牌的新能源汽车的使用年限x (单位:年)与维护费用y (单位:千元)之间有如下数据:7年时,维护费用约为( )千元.附:线性回归方程y bx a =+中的系数,()()()121,niii nii x x y y b a y bx x x ==--==--∑∑A .4B .5C .8.2D .8.3【答案】C 【详解】解:由题意得1(24568)55x =++++=,1(3 4.5 6.57.59) 6.15y =++++=,因为y 关于x 的线性回归方程为 1.05y x a =+, 所以6.1 1.055a =⨯+,解得0.85a =,所以y 关于x 的线性回归方程为 1.050.85y x =+, 所以当7x =时, 1.0570.858.2y =⨯+=,所以当使用年限为7年时,维护费用约为8.2千元, 故选:C7.(2021·安徽谯城·亳州二中高二期末(理))某商店对每天进店人数x 与某种商品成交量y (单位:件)进行了统计,得到如下对应数据:由表中数据,得线性回归方程为.253ˆybx =-.如果某天进店人数是人,预测这一天该商品销售的件数为( ) A .48 B .52C .57D .59【答案】D 【详解】因为10152025303540257x ++++++==,561214202325157y ++++++==所以样本中心点为()25,15,代入.25ˆ3ˆybx =-可得1525.ˆ325b =-解得:0.73b =, 回归方程为0.7335ˆ.2yx =- 将85x =代入可得0.7385 3.2558.859ˆy=⨯-=≈, 故选:D.8.(2021·全国高三专题练习(文))恩格尔系数(Engel ’sCoefficien )是食品支出总额占个人消费支出总额的比重.居民可支配收入是居民可用于最终消费支出和储蓄的总和,即居民可用于自由支配的收入.如图为我国2013年至2019年全国恩格尔系数和居民人均可支配收入的折线图.给出三个结论:①恩格尔系数与居民人均可支配收入之间存在负相关关系; ②一个国家的恩格尔系数越小,说明这个国家越富裕;③一个家庭收入越少,则家庭收入中用来购买食品的支出所占的比重就越小. 其中正确的是( ) A .① B .②C .①②D .②③【答案】C 【详解】由折线图可知,恩格尔系数在逐年下降,居民人均可支配收入在逐年增加, 故两者之间存在负相关关系,结论①正确;恩格尔系数越小,居民人均可支配收入越多,经济越富裕,结论②正确; 家庭收入越少,人们为解决温饱问题,收入的大部分用来购买食品,结论③错误. 故选:C 二、多选题9.(2021·渝中·重庆巴蜀中学高三月考)中国茶文化博大精深,茶水的口感与茶叶类型和水的温度有关为了建立茶水温度y 随时间x 变化的函数模型,小明每隔1分钟测量一次茶水温度,得到若干组数据()11,x y ,()22,x y ,⋅⋅⋅,(),n n x y ,绘制了如图所示的散点图.小明选择了如下2个函数模型来拟合茶水温度y 随时间x 的变化情况,函数模型一:()0,0y kx b k x =+<≥;函数模型二:()0,01,0x y ka b k a x =+><<≥,下列说法正确的是( )A .变量y 与x 具有负的相关关系B .由于水温开始降得快,后面降得慢,最后趋于平缓,因此模型二能更好的拟合茶水温度随时间的变化情况C .若选择函数模型二,利用最小二乘法求得到x y ka b =+的图象一定经过点(),x yD .当5x =时,通过函数模型二计算得65.1y =,用温度计测得实际茶水温度为65.2,则残差为0.1 【答案】ABD 【详解】观察散点图,变量x 与y 具有负的相关关系,A 正确;由于函数模型二中的函数()0,01,0xy ka b k a x =+><<≥,在0x ≥时,函数单调递减,可得B 正确;若选择函数模型二,利用最小二乘法求出的回归方程一定经过(),xa y ,C 错误;由于残差=真实值-预测值,因此残差为65.265.10.1-=,故D 正确. 故选: ABD.10.(2021·全国)由一组样本数据()11,x y ,()22,x y ,…,(),n n x y 得到的经验回归方程为y b x a ∧∧∧=+,那么下面说法正确的是( ) A .直线y b x a ∧∧∧=+必经过点(),x yB .直线y b x a ∧∧∧=+至少经过点()11,x y ,()22,x y ,…,(),n n x y 中的一个C .直线y b x a ∧∧∧=+的斜率为1221ni ii nii x ynx y xnx==--∑∑D .经验回归方程y b x a ∧∧∧=+最能代表样本数据中x ,y 之间的线性关系,b ∧大于0时x 与y 正相关,b ∧小于0时x 与y 负相关 【答案】ACD 【详解】回归直线一定过样本点的中心,故A 正确; 回归直线可以不经过所有的样本点,故B 不正确; 通过最小二乘法知,C 是正确的;回归方程是一次函数,由一次函数的性质可知,D 是正确的. 故选:ACD .11.(2021·珠海市第二中学高二期中)下列说法正确的是( )A .从匀速传递的产品生产流水线上,质检员每10分钟抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样.B .在回归分析模型中,残差平方和越小,说明模型的拟合效果越好.C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于±1.D .在回归直线方程0.110y x =-+中,当解释变量x 每增加1个单位时,预报变量就增加0.1个单位. 【答案】ABC 【详解】解:对于A ,从匀速传递的产品生产流水线上,质检员每10分钟抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样,所以A 正确;对于B ,在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,所以B 正确; 对于C ,因为r 越接近1,说明线性相关性越强,所以C 正确;对于D ,因为回归方程是用来估计取值,所以当解释变量x 每增加1个单位时,预报变量估计增加0.1个单位,所以D 错误, 故选:ABC12.(2021·重庆市秀山高级中学校高三月考)已知变量x ,y 之间的线性回归方程为0.710.3y x =-+,且变量x ,y 之间的一组相关数据如表所示,则下列说法正确的是( )A .变量x ,y 之间呈负相关关系B .可以预测,当20x 时, 3.7y =-C .4m =D .该回归直线必过点()9,4 【答案】ABD 【详解】对于A :由线性回归方程为0.710.3y x =-+可知:0.70-<,所以变量x ,y 之间呈负相关关系,故选项A 正确; 对于B :当20x 时,0.72010.3 3.7y =-⨯+=-,故选项B 正确;对于C :68101294x +++==,6321144m m y ++++==,因为回归直线过样本中心点,所以110.7910.34m+=-⨯+,解得:5m =,故选项C 不正确; 对于D :由C 可知5m =,所以11544y +==,所以该回归直线必过样本中心点()9,4,故选项D 正确; 故选:ABD. 三、填空题13.(2021·全国)如图是一组数据(),x y 的散点图,经最小二乘法计算,y 与x 之间的经验回归方程为1y b x ∧∧=+,则b ∧=______.【答案】0.8 【详解】013424x +++==,0.9 1.9 3.2 4.42.64y +++==, 将(2,6)的坐标代入1y b x ∧∧=+,解得0.8b ∧=. 故答案为:0.814.(2021·衡水市第十四中学)已知x 与y 之间的一组数据如下,且它们之间存在较好的线性关系.则y与x 的回归直线方程y bx a =+必过定点___________.【答案】73,4⎛⎫⎪⎝⎭【详解】根据表格中的数据,可得024634x +++==,12123744m m m y +++-+-==, 即样本中心为73,4⎛⎫ ⎪⎝⎭,所以y 与x 的回归直线方程y bx a =+必过定点73,4⎛⎫⎪⎝⎭.故答案为:73,4⎛⎫⎪⎝⎭.15.(2021·湖北高三开学考试)海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x (‰)对亩产量y (吨)的影响,测得了某种海水稻的亩产量与海水浓度的数据如下表.绘制散点图发现,可用线性回归模型拟合亩产量y 与海水浓度x 之间的相关关系,最小二乘法计算得y 与x 之间的线性回归方程为.88ˆ0ˆybx =+,则ˆb =___________【答案】ˆ0.1b =- 【详解】由表格中的数据,可得3456755x ++++==,0.520.480.390.30.210.385y ++++==,把点(5,0.38)代入回归方程.88ˆ0ˆybx =+,可得50.880.38b +=,解得0.1b =-. 故答案为:ˆ0.1b=-. 16.(2021·浙江丽水·高二课时练习)某市农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温度与实验室每天每100颗种子中的发芽数,得到如下数据:由表中根据12月2日至12月4的数据,求的线性回归方程ybx a =+中的3b =,则a 为______,若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过1颗,则认为得到的线性回归方程是可靠的,则求得的线性回归方程____.(填“可靠”或“不可幕”)【答案】ˆ8a=- 可靠 【详解】 (1)由题得11121326263212,2833x y ++++====, 所以样本中心点为(12,28),所以ˆ28=312+a⨯, 所以ˆ8a=-. 所以ˆ38y x =-. (2)由题得ˆ38yx =-. 12月1日的估计值为:ˆ310822y=⨯-=,23-22=1,没有超过1. 12月5日的估计值为:ˆ38816y=⨯-=,16-16=0,没有超过1. 所以求得的线性回归方程可靠.故答案为(1). ˆ8a=- (2). 可靠 四、解答题17.(2021·全国高二课时练习)有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出热饮杯数与当天气温的对比表:(2)你能从散点图中发现气温与热饮销售杯数之间关系的一般规律吗? 【答案】(1)图见解析;(2)答案见解析. 【详解】(1)以x 轴表示温度,以y 轴表示热饮杯数,可作散点图如图.(2)从图中可以看出,各点散布在从左上角到右下角的区域里, 因此,气温与热饮销售杯数之间是具有相关关系, 即气温越高,卖出去的热饮杯数越少.18.(2021·全国高三月考(文))某科技公司研发了一项新产品A ,经过市场调研,对公司1月份至6月份销售量及销售单价进行统计,销售单价x (千元)和销售量y (千件)之间的一组数据如下表所示: 月份i 12 3 4 5 6 销售单价i x 9 9.51010.5 118 销售量i y1110 86515y x (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过065.千元,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?参考公式:回归直线方程ˆˆˆybx a =+,其中i ii 122ii 1ˆnnx y n x yb xnx==-⋅⋅=-∑∑.参考数据:5i i i 1392x y ==∑,52i i 1502.5x ==∑.【答案】(1)ˆ3240yx =-+.;(2)是. 【详解】 (1)因为()199.51010.511105x =++++=,()1111086585y =++++=, 所以23925108ˆ 3.2502.5510b-⨯⨯==--⨯,得()ˆ8 3.21040a=--⨯=, 于是y 关于x 的回归直线方程为 3.240ˆyx =-+; (2)当8x =时,ˆ 3.284014.4y=-⨯+=, 则ˆ14.4150.60.65yy -=-=<, 故可以认为所得到的回归直线方程是理想的.19.(2021·全国高一期末)农民脱贫致富,已经成为当下中国社会的大政方针,如何精准脱贫,已经成为各政府部门最关注的事情.某县因地制宜,选择了有机蔬菜种植项目进行发展经济.在有机蔬菜的种植过程中,有机肥料使用是必不可少的,根据统计某种有机蔬菜0.5亩的产量増加量y (百斤)与有机肥料x (千克)的使用量之间有如下关系表:(1)依据表中的数据,求出关于的线性回归方程ˆˆybx a =+; (2)根据所求线性回归方程,估计如果有机蔬菜使用有机肥料12千克,则有机蔬菜0.5亩产量增加量y 是多少百斤?附:回归方程系数公式1122211()(),()in niii ii i nnii i x x y y x y nx yy bx a b x x xnx====---=+==--∑∑∑∑.【答案】(1)6ˆ.ˆ0.6807yx =+;(2)8.92百斤. 【详解】 解:(1)1234535x ++++==,1.42.1 2.93.54.12.85y ++++==,∴51()()iii x x y y =--∑(13)(1.4 2.8)=--(23)(2.1 2.8)+--(33)(2.9 2.8)+--(43)(3.5 2.8)+--(53)(4.1 2.8)+--6.8=;521()ii x x =-∑411410=+++=,则 6.80.681ˆ0b==,则知6ˆˆ0.7a y bx =-=, 所以y 关于x 的线性回归方程为:6ˆ.ˆ0.6807yx =+; (2)当x =12时,y =0.68×12+0.76=8.92(百斤), ∴如果有机蔬菜使用有机肥料12千克,估计有机蔬菜0.5亩产量的增加量y 是8.92百斤.20.(2021·崇仁县第二中学(文))某厂家营销人员收集了日平均气温x (单位:C ︒)与某款取暖器的日销售额y (单位:万元)的有关数据如下表:已知日销售额y 与日平均气温x 之间具有线性相关关系.(1)根据上表数据,用最小二乘法求出y 关于x 的线性回归方程;(2)根据(1)求出的线性回归方程,预测日平均气温为7C -时该取暖器的日销售额为多少万元.参考公式:在线性回归方程ˆˆˆybx a =+中,1221ˆni ii nii x y nxyb xnx ==-=-∑∑,ˆˆay bx =-. 参考依据:51524i i i x y ==-∑.【答案】(1)ˆ 2.415.4yx =-+;(2)32.2万元. 【详解】解:(1)由已知条件可得2345645x -----==-,2023252730255y ++++==,51524i ii x y==-∑,52190i i x ==∑,则152215ˆ 2.45ni ii ii x y xybxx==-==--∑∑.再由25( 2.4)(4)ˆa=--⨯-,可得ˆ15.4a =. 所以回归直线方程为ˆ 2.415.4yx =-+. (2)由回归直线方程为ˆ 2.415.4yx =-+可得, 当7x =-时,ˆ32.2y =,即预测日平均气温为 7C -时,该取暖器的日销售额为32.2万元.。
竞赛班高考数学练习专题(9)--线性回归分析
竞赛班高考数学练习(9)——线性回归分析1.在两个变量的回归分析中,作散点图是为了( )A. 直接求出回归直线方程B. 直接求出回归方程C. 根据经验选定回归方程的类型D. 估计回归方程的参数 2.下列四个结论:①在回归分析模型中,残差平方和越大,说明模型的拟合效果越好;②某学校有男教师60名、女教师40名,为了解教师的体育爱好情况,在全体教师中抽取20名调查,则宜采用的抽样方法是分层抽样;③线性相关系数|r|越大,两个变量的线性相关性越弱;反之,线性相关性越强;④在回归方程0.52y x =+中,当解释变量x 每增加一个单位时,预报变量y 增加0.5个单位. 其中正确的结论是( ) A. ①② B. ①④C. ②③D. ②④3.某同学在只听课不做作业的情况下,数学总不及格.后来他终于下定决心要改变这一切,他以一个月为周5一个月内每天做题数x 5 8 6 4 7 数学月考成绩y8287848186ˆˆ1.6yx a =+题数为( ) A. 8 B. 9 C. 10 D. 11 4.下列关于回归分析的说法中错误的有( )个(1).残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高.(2).回归直线一定过样本中心(),x y 。
(3)两个模型中残差平方和越小的模型拟合的效果越好。
(4) 甲、乙两个模型的2R 分别约为0.88和0.80,则模型乙的拟合效果更好。
A. 4 B. 3 C. 2 D. 15.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下,其中拟合效果最好的模型是( )A. 模型3的相关指数2R 为0.50B. 模型2的相关指数2R 为0.80C. 模型1的相关指数2R 为0.98D. 模型4的相关指数2R 为0.256.相关变量x ,y 的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程11y b x a =+,相关系数为1r ;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程:22y b x a =+,相关系数为2r .则( ) A. 1201r r <<< B. 2101r r <<< C. 1210r r -<<<D. 2110r r -<<<7(补).2019年是新中国成立七十周年,新中国成立以来,我国文化事业得到了充分发展,尤其是党的十八大以来,文化事业发展更加迅速,下图是从2013 年到 2018 年六年间我国公共图书馆业机构数(个)与对应年份编号的散点图(为便于计算,将 2013 年编号为 1,2014 年编号为 2,…,2018年编号为 6,把每年的公共图书馆业机构个数作为因变量,把年份编号从 1 到 6 作为自变量进行回归分析),得到回归直线ˆ13.7433095.7yx =+,其相关指数2R 0.9817=,给出下列结论,其中正确的个数是( D )①公共图书馆业机构数与年份的正相关性较强 ②公共图书馆业机构数平均每年增加13.743个 ③可预测 2019 年公共图书馆业机构数约为3192个 A. 0 B. 1 C. 2 D. 37.某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的周数有5周,不低于50小时且不超过70小时的周数有35周,超过70小时的周数有10周.根据统计,该基地的西红柿增加量y(百斤)与使用某种液体肥料x(千克)之间对应数据为如图所示的折线图.(1)依据数据的折线图,是否可用线性回归模型拟合y 与x 的关系?请计算相关系数r 并加以说明(精确到0.01)(若0.75r >,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量X 限制,并有如表关系:周光照量X (单位:小时) 3050X <<5070X ≤≤70X >光照控制仪最多可运行台数321若某台光照控制仪运行,则该台光照控制仪周利润为元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.以过去50周的周光照量的频率作为周光照量发生的概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?附:相关系数12211()()()()niii nniii i x x yy r x x yy ===--=--∑∑∑,参考数据:51()()6i i i x x y y =--=∑,521()25ii x x =-=∑,521()2,0.30.55ij y y =-=≈∑,0.90.95≈8.东莞市公交公司为了方便广大市民出行,科学规划公交车辆的投放,计划在某个人员密集流动地段增设一个起点站,为了研究车辆发车的间隔时间x 与乘客等候人数y 之间的关系,选取一天中的六个不同的调查小组先从这组数据中选取其中的组数据求得线性回归方程,再用剩下的组数据进行检验,检验方法如下:先用求得的线性回归方程计算间隔时间对应的等候人数ˆy,再求ˆy 与实际等候人数y 的差,若两组差值的绝对值均不超过1,则称所求的回归方程是“理想回归方程”.(1)若选取的是前4组数据,求y 关于x 的线性回归方程ˆy bxa =+; (2)判断(1)中的方程是否是“理想回归方程”:(3)为了使等候的乘客不超过38人,试用(1)中方程估计间隔时间最多可以设置为多少分钟? 参考公式:用最小二乘法求线性回归方程˙ˆˆˆy bx a =+的系数公式:()()()1122211ˆˆˆ,n niii ii i nnii i ix x y y x y n x ybay bx x x xnx ====---••===---∑∑∑∑,9.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局和某医院抄录了1至该兴趣小组确定的研究方案是先从这组数据中选取组,用剩下的组数据求线性回归方程,再用被选出的2组数据进行检验.(1)若选取的是1月和6月的两组数据,请根据2月至5月的数据求出y 关x 于的线性回归方程;(2)若由线性回归方程得到的估计数,与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的.试问:该小组所得的线性回归方程是否理想?附;()()()1122211=nni i i ii i nni i i i x x y y x y nxyb x x x nx a y bx====⎧---⎪⎪=⎪⎨--⎪⎪=-⎪⎩∑∑∑∑10.某羽绒服卖场为了解气温对营业额的影响,随机记录了该店3月份上旬中某5天的日营业额y(单元:千元)与该地当日最低气温x(单位:°C)的数据,如表:(1)求y 关于x 的回归直线方程ˆˆˆybx a =+; (2)设该地3月份的日最低气温2~(,)X N μσ,其中μ近似为样本平均数,2σ近似为样本方差,求()0.6 3.8P X <<参考公式:()()()1122211ˆnni iiii i nniii i x ynxyx x yy bxnx x x ====---==--∑∑∑∑,ˆˆay bx =- 计算参考值:22222258911295,2125108898117287++++=⨯+⨯+⨯+⨯+⨯=.3.2,()0.6827,(22)0.9545P X P X μσμσμσμσ≈-<<+=-<<+=.竞赛班高考数学练习(9)——参考答案更正第7题第(2)问答案选择题1--6 CDC CCD解答题7.【详解】(1)由已知数据可得2456855x++++==,3444545y++++==所以相关系数()()0.95ni ix x y yr--===≈∑因为0.75r>,所以可用线性回归模型拟合y与x的关系。
高考线性回归方程总结学习资料
高考线性回归方程总结第二讲 线性回归方程一、相关关系:1、⎩⎨⎧<=1||1||r r 不确定关系:相关关系确定关系:函数关系2、相关系数:∑∑∑===-⋅---=ni ini ini iiy y x x y y x x r 12121)()())((,其中:(1)⎩⎨⎧<>负相关正相关00r r ;(2)相关性很弱;相关性很强;3.0||75.0||<>r r例题1:下列两个变量具有相关关系的是( )A.正方形的体积与棱长;B.匀速行驶的车辆的行驶距离与行驶时间;C.人的身高和体重;D.人的身高与视力。
例题2:在一组样本数据),,,2)(,(),,(),,(212211不全相等n n n x x x n y x y x y x ΛΛ≥的散点图中,若所有样本点),2,1)(,(n i y x i i Λ=都在直线121+-=x y 上,则样本相关系数为( )21.21.1.1.--D C B A 例题3:r 是相关系数,则下列命题正确的是:(1)]75.0,1[--∈r 时,两个变量负相关很强;(2)]1,75.0[∈r 时,两个变量正相关很强;(3))75.0,3.0[]3.0,75.0(或--∈r 时,两个变量相关性一般; (4)(4)1.0=r 时,两个变量相关性很弱。
3、散点图:初步判断两个变量的相关关系。
例题4:在画两个变量的散点图时,下列叙述正确的是( ) A.预报变量在x 轴上,解释变量在y 轴上; B.解释变量在x 轴上,预报变量在y 轴上; C.可以选择两个变量中的任意一个变量在x 轴上;D.可以选择两个变量中的任意一个变量在y 轴上; 例题5:散点图在回归分析过程中的作用是( )A.查找个体个数B.比较个体数据的大小C.研究个体分类D.粗略判断变量是否线性相关二、线性回归方程:1、回归方程:a x b yˆˆˆ+= 其中2121121)())((ˆxn x yx n yx x x y yx x bn i i ni ii n i i ni ii--=---=∑∑∑∑====,x b y aˆˆ-=(代入样本点的中心) 例题1:设),(),,(),,(2211n n y x y x y x Λ是变量n y x 的和个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(过一、二、四象限),以下结论正确的是( )A.直线l 过点),(y xB.当n 为偶数时,分布在l 两侧的样本点的个数一定相同C.的和y x 相关系数在0到1之间D.的和y x 相关系数为直线l 的斜率例题2:工人月工资y (元)依劳动生产率x (千元)变化的回归直线方程为x y9060ˆ+=,下列判断正确的是( ) A.劳动生产率为1000元时,工资为150元; B.劳动生产率提高1000元时,工资平均提高150元; C.劳动生产率提高1000元时,工资平均提高90元; D.劳动生产率为1000元时,工资为90元;例题3:设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据)2,1)(,(n i y x i i Λ=,用最小二乘法建立的回归方程为71.8585.0ˆ-=x y,则不正确的是( ) A.y 与x 具有正的线性相关关系; B.回归直线过样本点的中心),(y x C.若该大学某女生身高增加1cm,则其体重约增加0.85kg D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg例题4:为了了解儿子的身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( )A.1-=x y B.1+=x y C.x y 2188+= D.176=y2、残差:(1)残差图:横坐标为样本编号,纵坐标为每个编号样本对应的残差。
(完整)线性回归方程高考题
线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 62.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 2 2.22 3 3.83 4 5.54 5 6.55 6 7.0∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 2.5 3 4 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图;(1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;(3)据此估计广告费用为10时,销售收入的值.6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 306 10 10 13 16深度y(m)(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归方程高考题
1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:
3 4 5 6
2.5 3 4 4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)
2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:
使用年限x 2 3 4 5 6
维修费用y 2.2 3.8 5.5 6.5 7.0
若有数据知y对x呈线性相关关系.求:
(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;
序号x y xy x2
1 2 2.2
2 3 3.8
3 4 5.5
4 5 6.5
5 6 7.0
∑
(2) 估计使用10年时,维修费用是多少.
3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:
零件的个数x(个) 2 3 4 5
加工的时间y(小时) 2.5 3 4 4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少时间?
(注:
4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:
3 4 5 6 7 8 9
66 69 73 81 89 90 91
已知:.
(Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程.
5、某种产品的广告费用支出与销售额之间有如下的对应数据:
2 4 5 6 8
30 40 60 50 70
(1)画出散点图:
(2)求回归直线方程;
(3)据此估计广告费用为10时,销售收入的值.
6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x 3 4 5 6
y 2.5 3 4 4.5
(I)请画出上表数据的散点图;
(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?
(参考公式及数据: ,)
7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:
广告费支出x 2 4 5 6 8
销售额y 30 40 60 50 70
(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?
(2)求y关于x的回归直线方程;
(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:
时间t(s) 5 10 15 20 30
6 10 10 13 16
深度y(m)
(1)画出散点图;
(2)试求腐蚀深度y对时间t的回归直线方程。
参考答案
一、计算题
1、解:(1)
(2)
序号
l 3 2.5 7.5 9
2 4
3 12 16
3 5
4 20 25
4 6 4.
5 27 36
18 14 66.5 86
所以:
所以线性同归方程为:
(3)=100时,,所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤.
2、解:(1) 填表
序x y xy x2
号
1 2 2.2 4.4 4
2 3 3.8 11.4 9
3 4 5.5 22.0 16
4 5 6.5 32.5 25
5 6 7.0 42.0 36
∑20 25 112.3 90
所以
将其代入公式得
(2) 线性回归方程为=1.23x+0.08
(3) x=10时,=1.23x+0.08=1.23×10+0.08=12.38 (万元) 答:使用10年维修费用是12.38(万元)。
3、解:(1)散点图如图
(2)由表中数据得:
回归直线如图中所示。
(3)将x=10代入回归直线方程,得(小时)
∴预测加工10个零件需要8.05小时。
4、解:(Ⅰ)散点图如图:
(Ⅱ)由散点图知,与有线性相关关系,设回归直线方程:,
,
,
∵,
∴.
,
故回归直线方程为.
5、解:(1)作出散点图如下图所示:
(2)求回归直线方程.
=(2+4+5+6+8)=5,
×(30+40+60+50+70)=50,
=22+42+52+62+82=145,
=302+402+602+502+702=13500
=1380.
=6.5.
因此回归直线方程为
(3)=10时,预报y的值为y=10×6.5+17.5=82.5.6、解:(I)如下图
(II)=3 2.5+43+54+6 4.5=66.5
==4.5 ,==3. 5
故线性回归方程为
(III)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7100+0.35=70.35.
故耗能减少了90-70.35=19.65(吨).
7、解:(1)(略)(2)y=6.5x+17.5
(3) 30.5(百万元) 8、(1)略(2)y=14/37x+183/37。