高中数学线性回归方程讲解练习题只是分享
高考数学复习典型题型专题讲解与练习94 一元线性回归模型及其应用
高考数学复习典型题型专题讲解与练习 专题94 一元线性回归模型及其应用题型一 求回归直线方程例1.(2022·甘肃·临泽县第一中学高二阶段练习(文))已知变量x 和y 正相关,则由如下表所示的观测数据算得的线性回归方程为【答案】B 【解析】 【分析】先求出样本的中心点的坐标,再代入选项检验即得正确答案. 【详解】 由题得12345543210,10x -----+++++==0.92 3.1 3.9 5.1 4.15 2.9 2.10.9010y -----+++++==,所以样本中心点的坐标为(0,0),代入选项检验得选B. 故答案为B 【点睛】(1)本题主要考查回归方程直线的性质,意在考查学生对该知识的掌握水平.(2) (,)x y 称为样本点的中心,回归直线过样本点的中心.这是回归方程的一个重要考点,要理解掌握并灵活运用.规律方法 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x -,y -,∑n i =1x 2i ,∑ni =1x i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑n i =1x i y i -n x - y -∑n i =1x 2i -nx -2,a ^=y --b ^x -.(6)写出线性回归方程y ^=b ^x +a ^.例2.(2019·新疆·乌鲁木齐市第二十中学高二期中)随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y (万元)有如表的数据资料:(1) 在给出的坐标系中作出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa 、ˆb ; (3)估计使用年限为12年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆn i i i n ii x y nxy bx nx==-=-∑∑, ˆˆay bx =-.) 【答案】(1)见解析; (2) 1.23b =0.08a =; (3)估计使用12年时,支出总费用是14.84万元.. 【解析】 【分析】(1)在坐标系中描点可得散点图;(2)代入公式可求;(3)根据方程代入x=12可得费用. 【详解】(1)散点图如图,由图知y 与x 间有线性相关关系.(2)∵4x =,5y =,51112.3i i i x y ==∑,52190i i x ==∑,∴2112.354512.31.2390541ˆ0b-⨯⨯===-⨯;5 1.2340.ˆ0ˆˆ8ay bx =-=-⨯=. (3)线性回归直线方程是 1.2308ˆ.0yx =+, 当12x =(年)时, 1.23120.0814.8ˆ4y =⨯+=(万元).即估计使用12年时,支出总费用是14.84万元. 【点睛】本题主要考查回归直线在生活中的应用,明确所给公式中各个模块的含义,代入公式可求.题目难度不大,侧重于应用性.例3.(2022·全国·高二单元测试)有一位同学家里开了一个小卖部,他为了研究气温对热茶销售的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表如下: 气温x/℃ -5 0 4 7 12 15 19 23 27 31 36热茶销售杯数y/杯 156 150 132 128 130 116 104 89 93 76 54(1)画出散点图;(2)你能从散点图中发现气温与热茶的销售杯数之间关系的一般规律吗? (3)如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系; (4)试求出回归直线方程;(5)利用(4)的回归方程,若某天的气温是2 ℃,预测这一天卖出热茶的杯数.【答案】(1)见解析;(2)见解析;(3)见解析;(4) 2.354774ˆ1.y x =-+;(5)143【解析】 【详解】分析:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图;(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少;(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系; (4)由题中所给的数据求得回归方程即可;(5)结合回归方程的预测作用和(4)中的结论整理计算即可求得最终结果. 详解:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图如下图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系,如图所示.(4)因112i i 1169x ,x 411∑===为335,11i 11228y ,xiyi 1411∑===778. 所2169122814778-111111b 1694335-1111⨯⨯=⎛⎫⨯ ⎪⎝⎭^以≈-2.35, 1228169a 2.35147.74.1111=+⨯=^所以回归直线方程y 2.35x 147.74.=-+^为(5)由(4)的方程,当x=2,y 4.70147.74143.04,=-+=^时因此若某天的气温为2 ℃,这一天大约可以卖出143杯热茶.点睛:(1)正确运用计算^a ,^b 的公式和准确的计算,是求线性回归方程的关键. (2)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.题型二 利用回归直线方程对总体进行估计例4.(2022·江西抚州·高二期末(理))保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新能源汽车,每年抽样1000汽车调查,得到新能源汽车y 辆与年份代码x 年的数据如下表:(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源汽车.参考公式:回归方程y bx a =+斜率和截距的最小二乘估计公式分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【答案】(1)219y x =+ (2)27900 【解析】【分析】(1)第一步分别算第x ,y 的平均值,第二步利用1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-即可得到方程.(2)由第一问的结果,带入方程即可算出预估的结果. (1)3x =,305070+100+110=725y ++=,1222222221130+250+370+4100+5110-5372==211+2+3+4+5-53ni ii ni i x y nx yb x nx==-⨯⨯⨯⨯⨯⨯⨯=⨯-∑∑,因为a y bx =-,所以72213=9a =-⨯,所以219y x =+(2)预测该地区2022年抽样1000汽车调查中新能源汽车数,当7x =时,217993y =⨯+=,该地区2022年共有30万辆汽车,所以新能源汽车93300000279001000N =⨯=. 规律方法 本题已知y 与x 是线性相关关系,所以可求出回归方程进行估计和预测.否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.例5.(2022·陕西·西安中学高二期中(理))偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差(实际成绩-平均分=偏差).在某次考试成绩统计中,某老师为了对学生数学偏差x (单位:分)与物理偏差y (单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:(1)若x 与y 之间具有线性相关关系,求y 关于x 的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.(下面是参考数据和参考公式)()()()()()()()()()818222222222120 6.515 3.513 3.53 1.520.550.510 2.518 3.532420151332510181256i ii ii x yx===⨯+⨯+⨯+⨯+⨯+-⨯-+-⨯-+-⨯-==+++++-+-+-=∑∑,回归直线方程为ˆˆˆy bx a =+,其中()()()1122211ˆˆˆnni i iii i nni ii i x y nxy x x y y b x nx x x ay bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑【答案】(1)11ˆ42yx =+ (2)94 【解析】 【分析】(1)根据最小二乘法即可求出y 关于x 的线性回归方程;(2)设该同学的物理成绩为ω,则物理偏差为91.5ω-,数学偏差为8,根据回归方程可知,1191.5842ω-=⨯+,即可解出.(1)由题意可得,20151332(5)(10)(18)582x +++++-+-+-==,()()()6.5 3.5 3.5 1.50.50.5 2.5 3.5988y +++++-+-+-==, 1222159324ˆ81285412568()2ni ii nii x y nxybxnx ==--⨯⨯===-⨯-∑∑,所以9151ˆˆ8422a y bx =-=-⨯=,故线性回归方程为11ˆ42yx =+. (2)由题意,设该同学的物理成绩为ω,则物理偏差为:91.5ω-. 而数学偏差为128-120=8,∴1191.5842ω-=⨯+,解得94ω=, 所以,可以预测这位同学的物理成绩为94.例6.(2022·广东揭阳·高二期末)从2018年1月1日起,广东、等18个保监局所辖地区将纳入商业车险改革试点范围,其中最大的变化是上一年的出险次数决定了下一年的保费倍率,具体关系如下表:有评估机构从以往购买了车险的车辆中随机抽取1000 辆调查,得到一年中出险次数的频数分布如下(并用相应频率估计车辆每年出险次数的概率):(1)求某车在两年中出险次数不超过2次的概率;(2)经验表明新车商业车险保费与购车价格有较强的线性相关关系,估计其回归直线方程为:1201600y x =+.(其中x (万元)表示购车价格,y (元)表示商业车险保费).李先生2016 年1月购买一辆价值20万元的新车.根据以上信息,试估计该车辆在2017 年1月续保时应缴交的保费,并分析车险新政是否总体上减轻了车主负担.(假设车辆下一年与上一年都购买相同的商业车险产品进行续保) 【答案】(1)0.8744;(2)3846元,减轻了车主负担. 【解析】 【分析】(1)利用互斥事件的概率公式列式计算即得;(2)求出下一年车险保费倍率X 的分布列,并求出期望,即可得出车主下一年的保费,并根据期望是否大于1得出结论. 【详解】(1)设某车在两年中出险次数为N , 则(2)(0)(1)(2)P N P N P N P N ≤==+=+=5005005003805001003803802210001000100010001000100010001000=⋅+⋅⋅+⋅⋅+⋅0.8744=, 所以某车在两年中出险次数不超过2次的概率为0.8744; (2)设该车辆2017 年的保费倍率为X ,则X 为随机变量,X 的取值为0.85 ,1,1.25 ,1.5 ,1.75 , 2, X 的分布列为:下一年保费倍率X 的期望为:()0.850.510.38 1.250.1 1.50.015 1.750.00420.0010.9615+E X =⨯⨯+⨯+⨯+⨯+⨯=,该车辆估计2017年应缴保费为:()1202016000.96153846⨯+⨯=元, 因0.96151<,则车险新政总体上减轻了车主负担.题型三 线性回归分析例7.(2022·山东·日照青山学校高二期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下,用两种模型①y bx a =+;②y a =分别进行拟合,得到相应的回归方程1ˆ10.7 3.4yx =+,2ˆ22.8y =,进行残差分析得到如表所示的残差值及一些统计量的值:(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.(参考公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆay bx =-) 【答案】(1)该选模型①,理由见解析 (2)111y x =+ 【解析】 【分析】(1)求出两模型的残差值的绝对值之和进行比较即可,(2)先剔除异常数据,然后利用回归方程的公式结合已知数据进行计算即可 (1)应该选择模型①模型①的残差值的绝对值之和为1.1+2.8+7.5+1.2+1.9+0.4=14.9 模型②的残差值的绝对值之和为0.3+5.4+4.3+3.2+1.6+3.8=18.6. ∵14.9<18.6,∴模型①的拟合效果较好,应该选模型①.(2)剔除异常数据,即剔除第3天的数据后,得()1 3.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.2ˆ11825 3.6 3.617.25i ii ii x y xybxx ==--⨯⨯====-⨯⨯-∑∑, ˆˆ40.611 3.61ay bx =-=-⨯=. ∴y 关于x 的回归方程为111y x =+.规律方法 (1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.(2)刻画回归效果的三种方法①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适. ②残差平方和法:残差平方和∑ni =1 (y i -y ^i )2越小,模型的拟合效果越好. ③决定系数法:R 2=1-∑ni =1(y i -y ^i )2∑ni =1 (y i -y -)2越接近1,表明回归的效果越好. 例8.(2022·河南·南阳中学高三阶段练习(文))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附: 刻画回归效果的相关指数()()22121ˆ1niii nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-4.1≈ 【答案】(1)对A 型材料进行应用改造的投入为17亿元时的直接收益为72.93(亿元); (2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据模型和相关系数公式计算比较即可,然后将x =17代入较好的模型即可预测直接收益;(2)根据回归方程过样本中心点(,x y )求出ˆa,再令x =20算出预测的直接收益,即可算出投入20亿元时的总收益,与(1)中的投入17亿元的直接收益比较即可. (1)对于模型①,对应的15222740485460=387y ++++++=,故对应的()772221171750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为21.314.472.9ˆ3y=≈(亿元).另解:本题也可以根据相关系数的公式,直接比较79.13和20.2的大小,从而说明模型②拟合精度更高、更可靠. (2) 当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.例9.(2022·陕西·高新一中高三阶段练习(理))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造.根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+.(1)根据表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益; (2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好 4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)2221R R >,模型②拟合精度更高、更可靠,收益为72.93;(2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据题意求得()1221i i y y =-∑,再根据2R 的计算公式,即可分别求得2212,R R ,则可判断不同模型的拟合度;(2)根据题意,求得回归直线方程,即可代值计算,求得预测值. (1)对于模型①,对应的15222740485460387y ++++++==,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ21.314.472.93y=≈. (2) 当17x >时, 后五组的212223242568.56867.5666523,6755x y ++++++++====,由最小二乘法可得67(0.7)238ˆ 3.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1574.172.93-⨯++=>,故投入17亿元比投入20亿元时收益小.题型四 残差分析与相关指数的应用例10.(2022·河北·藁城新冀明中学高二阶段练习)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和; 【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件; (3)各组残差见解析,残差平方和为3.8182. 【解析】 【分析】(1)根据表中数据描点即可求解;(2)根据表中数据,求出x ,y ,612i i x =∑,61i i i x y =∑,代入公式求出线性回归方程的系数ˆb,进而求出ˆa即可得回归直线方程; (3)根据残差的定义及残差平方和公式即可求解. (1)解:散点图如下:(2) 解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818ii i y y=--+++--==++∑. 规律方法 (1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.例11.(2022·河北·大名县第一中学高二阶段练习)随着中美贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.华为技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x (亿元)与科技升级直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①:ˆ 4.111.8yx =+;模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①、②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对“麒麟”手机芯片科技升级的投入为17亿元时的直接收益. (附:刻画回归效果的相关指数,()()22121ˆ1niii nii y yR y y ==-=--∑∑ 4.1≈)(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.附:用最小二乘法求线性回归方程ˆˆˆybx a =+的系数:()()()1122211ˆˆˆ,nni iii i i nniii i x ynx yxx y y bay bx xnx xx ====-⋅--===---∑∑∑∑ 【答案】(1)回归模型②,72.93(亿元);(2)投入20亿元时,公司的实际收益更大. 【解析】 【分析】(1)根据表中数据比较21R 和22R 可判断拟合效果,进而求出预测值; (2)求出,x y ,进而求出a ,得出回归方程得求出结果. 【详解】解:(1)由表格中的数据,182.479.2>,∴()()772211182.479.2iii i y y y y ==>--∑∑,∴()()772211182.479.211iit t y y y y ==-<---∑∑可见模型①的相关指数21R 小于模型②的相关指数22R . 所以回归模型②的拟合效果更好.所以当17x =亿元时,科技升级直接收益的预测值为ˆ21.314.421.3 4.114.472.93y=≈⨯-=(亿元). (2)当17x >时,由已知可得2122232425235x ++++==,68.56867.5666667.25y ++++==.∴0.767.20.72383.3a y x =+=+⨯=.∴当17x >时,y 与x 满足的线性回归方程为ˆ0.783.3yx =-+. 当20x时,科技升级直接收益的预测值为ˆ0.72083.369.3y=-⨯+=亿元.当20>亿元,x亿元时,实际收益的预测值为69.3574.3+=亿元72.93∴技术升级投入20亿元时,公司的实际收益更大.题型五非线性回归分析例12.(2022·全国·模拟预测)某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:根据以上数据,绘制了如图所示的散点图.(1)根据散点图,判断在推广期内,y a bx=+与x=⋅(c,d均为大于零的常数)哪一个y c d适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及题干中表格内的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:其中lg i i v y =,7117i i v v ==∑.参考公式:对于一组数据)()()(1122,,,,,,n n u v u v u v ⋅⋅⋅,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为1221ˆni i i nii uv nuvunuβ==-=-∑∑,ˆav u β=-. (3)推广期结束后,为更好地服务乘客,车队随机调查了100人次的乘车支付方式,得到如下结果: 已知该线路公交车票价2元,使用现金支付的乘客无优惠,使用公交卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据调查结果发现:使用扫码支付的乘客中有5人次乘客享受7折优惠,有10人次乘客享受8折优惠,有15人次乘客享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据所给数据,以事件发生的频率作为相应事件发生的概率,在不考虑其他因素的条件下,按照上述收费标准,试估计该车队一辆车一年的总收入.【答案】(1)x y c d =⋅适宜(2))(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347(3)199200元 【解析】 【分析】(1)根据散点图即可判断回归方程类型;(2)根据题意中的数据,利用最小二乘法求出ˆb ,进而求出ˆa,即可得出回归方程,令8x =求解即可;(3)根据题意分别求出享受7折优惠、8折优惠、9折优惠的收入,进而加起来即可. (1)根据散点图判断,x y c d =⋅适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型. (2)∵x y c d =⋅,∴两边同时取常用对数,得lg lg lg y c x d =+. 设lg a c =,lg b d =,则v a bx =+.∵4x =, 1.54v =,721140i i x ==∑,∴7172221750.1274 1.547ˆ0.2514074287i i i i i x v xvbx x==--⨯⨯====-⨯-∑∑,ˆˆ0.54av bx =-=,∴ˆ0.540.25v x =+,∴)(0.540.250.25ˆ10 3.4710xx y +==⨯,把8x =代入上式,得0.540.258 2.5420.54ˆ10101010347y+⨯===⨯=, ∴y 关于x 的回归方程为)(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347. (3)由题意,可知一个月中使用现金的乘客有1000人次,共收入100022000⨯=(元);使用公交卡的乘客有6000人次,共收入6000 1.69600⨯=(元).使用扫码支付的乘客有3000人次,其中,享受7折优惠的有500人次,共收入500 1.4700⨯=(元),享受8折优惠的有1000人次,共收入1000 1.61600⨯=(元),享受9折优惠的有1500人次,共收入1500 1.82700⨯=(元),故该车队一辆车一个月的收入为200096007001600270016600++++=(元).∴估计该车队一辆车一年的收入为1660012199200⨯=(元).规律方法求非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性回归方程.例13.(2022·黑龙江·哈尔滨市第六中学校高二期末)区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,居世界前列现收集我国近5年区块链企业总数量相关数据,如表注:参考数据5174.691i i y ==∑,51312.761i i i x y ==∑,5110.980i i z ==∑,5140.457i i i x z ==∑(其中ln z y =).附:样本()(),1,2,,i i x y i n =⋅⋅⋅的最小二乘法估计公式为1221ni ii nii x ynxy b xnx==-=-∑∑,a y bx =-(1)根据表中数据判断,y a bx =+与e dx y c =(其中e 2.71828=⋅⋅⋅,为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由)(2)根据(1)的结果,求y 关于x 的回归方程;(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”,已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,则求甲公司获得“优胜公司”的概率. 【答案】(1)dx y ce = (2)0.75170.0591x y e -= (3)310【解析】【分析】(1)根据表中数据判断y 关于x 的回归方程为非线性方程;(2)令ln z y =,将y 关于x 的非线性关系,转化为z 关于x 的线性关系,利用最小二乘法求解;(3)利用相互独立事件的概率相乘求求解; (1)根据表中数据e dx y c =适宜预测未来几年我国区块链企业总数量. (2)e dx y c =,ln ln y dx c ∴=+,令ln z y =,则ln z dx c =+,5110.980 2.19655ii zz ====∑,5112345355ii xx =++++===∑由公式计算可知122140.457310.980.7517,5545ni ii n i i x znxzb x nx==-⨯==--=-∑∑ˆln 2.1960.751730.0591c z dx =-=-⨯=- ln 0.75170.0591y x ∴=-,即ln 0.75170.0591y x ∴=-,即0.75170.0591x y e -=所以y 关于x 的回归方程为0.75170.0591x y e -= (3)设甲公司获得“优胜公司”为A 事件. 则11123112113232352253210()P A ⨯+⨯⨯⨯+⨯⨯⨯==所以甲公司获得“优胜公司”的概率为310.例14.(2022·湖南·长沙一中高三阶段练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1-9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:现用by ax=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为23,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1iitx =)。
线性回归方程高考题讲解
线性回归方程高考题讲解线性回归方程高考题1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据:3 4 5 62.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)2、假设关于某设备的使用年限x和所支出的维修费用y(万元)统计数据如下:使用年限x 2 3 4 5 6维修费用y 2.2 3.8 5.5 6.5 7.0若有数据知y对x呈线性相关关系.求:(1) 填出下图表并求出线性回归方程=bx+a的回归系数,;序号x y xy x21 2 2.22 3 3.83 4 5.54 5 6.55 6 7.0∑(2) 估计使用10年时,维修费用是多少.3、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四实试验,得到的数据如下:零件的个数x(个) 2 3 4 5加工的时间y(小时) 2.5 3 4 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:4、某服装店经营的某种服装,在某周内获纯利(元)与该周每天销售这种服装件数之间的一组数据关系如下表:3 4 5 6 7 8 966 69 73 81 89 90 91已知:.(Ⅰ)画出散点图; (1I)求纯利与每天销售件数之间的回归直线方程.5、某种产品的广告费用支出与销售额之间有如下的对应数据:2 4 5 6 830 40 60 50 70(1)画出散点图:(2)求回归直线方程;6、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)7、以下是测得的福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间,有如下的对应数据:广告费支出x 2 4 5 6 8销售额y 30 40 60 50 70(1)画出数据对应的散点图,你能从散点图中发现福建省某县某种产品的广告费支出x与销售额y(单位:百万元)之间的一般规律吗?(2)求y关于x的回归直线方程;(3)预测当广告费支出为2(百万元)时,则这种产品的销售额为多少?(百万元)8、在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:时间t(s) 5 10 15 20 306 10 10 13 16深度y(m)(1)画出散点图;(2)试求腐蚀深度y对时间t的回归直线方程。
专题01 线性回归方程(解析版)
【解析】解: x 0 1 2 3 3 , y m 3 5.5 7 m 15.5 ,
4
2
4
4
这组数据的样本中心点是 ( 3 , m 15.5) , 24
关于 y 与 x 的线性回归方程 yˆ 2.1x 0.85 ,
m 15.5 2.1 3 0.85 ,解得 m 0.5 ,
x (次数 / 分
20
30
40
50
60
钟)
y( C)
25
27.5
29
32.5
36
A. 33 C
B. 34 C
C. 35 C
【解析】解:由题意,得 x 20 30 40 50 60 40 , 5
y 25 27.5 29 32.5 36 30 , 5
则 k y 0.25x 30 0.25 40 20 ;
故答案为:10.
例 7.已知一组数据点:
x
x1
x2
x8
y
y1
y2
y8
8
用最小二乘法得到其线性回归方程为 yˆ 2x 4 ,若数据 x1 , x2 , , x8 的平均数为 1,则 yi i 1
16 .
3
原创精品资源学科网独家享有版权,侵权必究!
【解析】解:由题意, x 1 ,设样本点的中心为 (1, y) , 又线性回归方程为 yˆ 2x 4 ,则 y 2 1 4 2 ,
购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用 Y (单位:万元)的分布列为:
Y
30
20
70
120
P
0.3
0.4
0.2
0.1
E(Y ) 30 0.3 20 0.4 70 0.2 120 0.1 25 (万元)
(完整版)数学必修三回归分析经典题型(带答案)
数学必修三回归分析经典题型1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7ˆ+=x y用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm B.身高在145.83cm 以上 C.身高在145.83cm 以下 D.身高在145.83cm 左右 【答案】D【解析】解:把x=10代入可以得到预测值为145.83,由于回归模型是针对3-9岁的孩子的,因此这个仅仅是估计值,只能说左右,不能说在上或者下,没有标准。
选D2.对有线性相关关系的两个变量建立的线性回归方程$y =$a+b $x ,关于回归系数b $,下面叙述正确的是________.①可以小于0;②大于0;③能等于0;④只能小于0. 【答案】①【解析】由b$和r 的公式可知,当r =0时,这两变量不具有线性相关关系,但b 能大于0也能小于0.3.对具有线性相关关系的变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是$y =3x +20,若101i i x =∑=18,则101i i y =∑=________.【答案】254【解析】由101i i x =∑=18 1.8.因为点在直线$y =3x +2025.4. 所以101i i y =∑=25.4×10=254.4.下表是某厂1~4由散点图可知,用水量其线性回归直线方程是y =-0.7x +a ,则a 等于________. 【答案】5.252.53.5,∵回归直线方程过定点, ∴3.5=-0.7×2.5+a. ∴a =5.25.5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到线性回归方程$y =b$x +$a ,那么下列说法正确的是________.①直线$y =b$x +$a 必经过点(x ,y ); ②直线$y =b$x +$a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; ③直线$y =b$x +$a 的斜率为1221ni ii nii x ynx y xnx==--∑∑;④直线$y =b $x +$a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差$21()ni i i b a y x =⎡⎤⎣⎦∑$-+是该坐标平面上的直线与这些点的最小偏差.【答案】①③④【解析】回归直线的斜率为b ,故③正确,回归直线不一定经过样本点,但一定经过样本中心,故①正确,②不正确.6.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm. 【答案】185【解析】设父亲身高为173176,b$= $a=-b $ 176-1×173=3, ∴$y =x +3,当x =182时,$y =185.7.下表是关于宿州市服装机械厂某设备的使用年限(年)和所需要的维修费用y (万元)的几组统计数据:)请根据上表提供的数据,用最小二乘法求出y 关于的线性回归方程;(2)估计使用年限为10年时,维修费用为多少?【答案】解:(1)0.08 1.23yx =+线性回归方程为 (2)估计使用年限为10年时,维修费用为12.38万元. 【解析】(1)先求然后利用公可求出回归直线y ax b =+方程.(2)把x=10代入回归直线方程可得y 的值,就可得所求的值.解:(1906543222222512=++++=∑=i ixΘ又x y 23.108.0+=∴线性回归方程为 (2)把10=x 代入回归方程得到:38.121023.108.0=⨯+=y∴估计使用年限为10年时,维修费用为12.38万元.。
最新苏教版高中数学必修三《线性回归方程》课时同步练习及解析.docx
(新课标)2018-2019学年苏教版高中数学必修三2.4 线性回归方程课时目标 1.理解两个变量的相关关系的概念.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求线性回归方程.1.与函数关系不同,相关关系是一种有关系,但不是确定性的关系.2.能用直线方程________近似表示的相关关系叫做线性相关关系,该方程叫______,给出一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),线性回归方程中的系数a ,b 满足⎩⎪⎨⎪⎧b = a =.上式还可以表示为⎩⎪⎨⎪⎧b = ,a = .一、填空题1.下列两个变量之间的关系,不是函数关系的为______.(填序号) ①匀速行驶车辆的行驶距离与时间; ②圆半径与圆的面积;③正n 边形的边数与内角度数之和; ④人的年龄与身高.2.下列有关线性回归的说法,不正确的是________.①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x 、y 之间的关系; ④任何一组观测值都能得到具有代表意义的线性回归方程.3.工人月工资(元)依劳动生产率(千元)变化的线性回归方程为 =60+90x ,下列判断正确的是________.①劳动生产率为1千元时,工资为50元; ②劳动生产率提高1千元时,工资提高150元;③劳动生产率提高1千元时,工资约提高90元;④劳动生产率为1千元时,工资90元.4.某商品销售量y(件)与销售价格x(元/件)在实际生活中的回归方程可能是________.①=-10x+200;②=10x+200;③=-10x-200;④=10x-200.5.给出两组数据x、y的对应值如下表,若已知x、y是线性相关的,且线性回归方程:y=a+bx,经计算知:b=-1.4,则a=________.x 45678y 121098 66.线性回归方程表示的直线=a+bx必经过点____________.7.若对某个地区人均工资x与该地区人均消费y进行调查统计得y与x具有相关关系,且线性回归方程=0.7x+2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为________.8.设有一个回归方程=3-2.5x,当变量x增加一个单位时,变量y________个单位.9.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的线性回归方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差______分.二、解答题10.下表是某旅游区游客数量与平均气温的对比表:平均气温(℃)-1410131826数量(百个)202434385064若已知游客数量与平均气温是线性相关的,求回归方程.11.5个学生的数学和物理成绩(单位:分)如下表:学生A B C D E学科数学8075706560物理7066686462画出散点图,判断它们是否具有相关关系,若相关,求出回归方程.能力提升12.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:温度x(℃)010205070溶解度y 66.776.085.0112.3128.0则由此得到回归直线的斜率约为________.13.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x(0.01% )104181917714713415191204121y(min)10202118515513517205235125若由数据知y对x呈线性相关关系.(1)求线性回归方程.(2)预测当钢水含碳量为160时,应冶炼多少分钟?1.线性回归方程=bx+a中的系数a,b的计算公式为:⎩⎪⎨⎪⎧b =∑ni =1(x i -x )(y i -y )∑n i =1 (x i -x )2=∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2a =y -b x其中:b 是回归方程的斜率,a 是截距. 2.回归方程的求解过程 计算x ,y ,∑ni =1x 2i ,∑ni =1x i y i ⇓计算b =∑ni =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x⇓3.在回归方程 =bx +a 中,当回归系数b >0时,说明两个变量呈正相关关系,它的意义是:当x 每增加一个单位时y 就增加b 个单位;当b <0时,说明两个变量呈负相关关系,它的意义是:当x 每增加一个单位时,y 就减少b 个单位.2.4 线性回归方程知识梳理2. =bx +a 线性回归方程 n ∑ni =1x i y i -(∑ni =1x i )(∑ni =1y i )n ∑ni =1x 2i -(∑ni =1x i )2y -b x∑ni =1x i y i -n x y ∑ni =1x 2i -n x2=∑ni =1(x i -x )(y i -y )∑ni =1(x i -x )2y -b x作业设计 1.④解析 人的年龄与身高具有相关关系. 2.④解析 只有所有的数据点都分布在一条直线附近时,才能得到回归直线. 3.③解析 因工人月工资与劳动生产率变化的线性回归方程为 =60+90x ,当x 由a 提高到a +1时, 2- 1=60+90(a +1)-60-90a =90. 4.①解析 ∵在实际生活中,当销售价格提高时,商品销售量一般要降低,∴排除②、④,又∵③中x>0时 <0不合题意,∴③错. 5.17.4 解析x =15(4+5+6+7+8)=6,y =15(12+10+9+8+6)=9.a =y -b x =9+1.4×6=9+8.4=17.4. 6.(x ,y )解析 由a =y -b x 得y =b x +a , 即点(x ,y )适合方程 =a +bx. 7.87.5%解析 设该地区人均工资收入为y , 则y =0.7x +2.1,当y =10.5时,x =10.5-2.10.7=12.10.512×100%=87.5%. 8.减少2.5解析′=3-2.5(x+1)=3-2.5x-2.5=-2.5,因此,y的值平均减少2.5个单位.9.20解析令两人的总成绩分别为x1,x2.则对应的数学成绩估计为=6+0.4x1,2=6+0.4x2,所以| 1-2|=|0.4(x1-x2)|=0.4×50=20.10.解x=706=353,y=2306=1153,∑6i=1x2i=1+16+100+169+324+676=1 286,∑6i=1x i y i=-20+96+340+13×38+18×50+26×64=3 474.b=∑6i=1x i y i-6x y∑6 i=1x2i-6x2=3 474-6×353×11531 286-6×(353)2≈1.68,a=y-b x≈18.73,即所求的回归方程为=1.68x+18.73.11.解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为线性相关.列表,计算i 1 2 3 4 5x i80 75 70 65 60y i70 66 68 64 62x i y i 56004950476041603720x2i 64005625490042253600x=70,y=66,∑5i=1x2i=24 750,∑5i=1x i y i=23 190设所求回归方程为=bx+a,则由上表可得b=∑5i=1x i y i-5x y∑5 i=1x2i-5x2=90250=0.36,a =y -b x =40.8.∴所求回归方程为 =0.36x +40.8. 12.0.880 9 解析x =30,y =93.6,∑5i =1x 2i =7 900,∑5i =1x i y i =17 035,所以回归直线的斜率b =∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=17 035-5×30×93.67 900-4 500≈0.880 9.13.解 (1)列出下表,并用科学计算器进行计算: i 1 2 3 4 5 6 7 8 9 10 x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i10400360003990032745227851809025500391554794015 125x =159.8,y =172,∑10i =1x 2i =265 448,∑10i =1y 2i =312 350,∑10i =1x i y i =287 640 设所求线性回归方程为 =bx +a ,b =∑10i =1x i y i -10x y∑10i =1x 2i -10x2≈1.27,a =y -b x ≈-30.95.即所求的线性回归方程为 =1.27x -30.95.(2)当x =160时, =1.27×160-30.95≈172(min ),即大约冶炼172 min .。
高二线性回归方程试题及答案
高二线性回归方程试题及答案回归直线方程某公司为了研究广告投入对销售收益的影响,在若干地区各投入4万元广告费用,并将各地的销售收益绘制成频率分布直方图。
由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从开始计数的。
根据频率分布直方图计算图中各小长方形的宽度,然后试估计该公司投入4万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值)。
该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入x(单位:万元) 1 2 3 4 5销售收益y(单位:万元) 2 3 2 3 4由表中的数据显示,x与y之间存在着线性相关关系。
根据回归直线的斜率和截距的最小二乘估计公式,计算得到y关于x的回归直线方程为y=0.4x+1.6.某校课程设置调研某校在规划课程设置方案的调研中,随机抽取160名理科学生,想调查男生、女生对“坐标系与参数方程”与“不等式选讲”这两道题的选择倾向性。
调研中发现选择“坐标系与参数方程”的男生人数与选择“不等式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多25人,根据调研情况制成如下图所示的列联表:男生女生合计选择坐标系与参数方程 60 85 145选择不等式选讲 45 30 75合计 105 115 220完成列联表,并使用卡方检验判断在犯错误的概率不超过0.025的前提下,能否认为选题与性别有关。
从选择“坐标系与参数方程”与选择“不等式选讲”的学生中共抽取8人进行问卷,按照分层抽样的方法。
若从这8人中任选3人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数的差为ξ,求ξ的分布列及数学期望Eξ。
根据给出的数据,完成列联表如上所示。
使用卡方检验判断选题与性别是否有关,得到卡方值K=18.75,自由度df=1,查卡方分布表可得在显著性水平为0.025时的临界值为3.84.由于K>3.84,因此可以认为选题与性别有关。
高二数学回归直线方程的练习题
高二数学回归直线方程的练习题1. 已知直线L1过点A(2,3),斜率为3,求直线L1的方程。
我们可以使用直线的点斜式来求解直线L1的方程,点斜式的一般形式为:y - y1 = m(x - x1),其中m为直线的斜率,(x1, y1)为直线上的一点。
代入已知条件,可以得到直线L1的方程为:y - 3 = 3(x - 2)化简得:y - 3 = 3x - 6进一步整理得:y = 3x - 3所以,直线L1的方程为 y = 3x - 3。
2. 已知直线L2过点B(4,5),斜率为-2,求直线L2的方程。
同样地,我们使用直线的点斜式来求解直线L2的方程。
代入已知条件,可以得到直线L2的方程为:y - 5 = -2(x - 4)化简得:y - 5 = -2x + 8进一步整理得:y = -2x + 13所以,直线L2的方程为 y = -2x + 13。
3. 直线L1和直线L2的交点坐标是多少?为了找到直线L1和直线L2的交点坐标,我们可以将两个方程联立起来,求解其解。
将直线L1和L2的方程联立得到:3x - 3 = -2x + 13整理得:5x = 16解得:x = 16/5将x的值代入其中一个方程,例如直线L1的方程,可以解出y的值:y = 3(16/5) - 3= 48/5 - 3= 48/5 - 15/5= 33/5所以,直线L1和直线L2的交点坐标为 (16/5, 33/5)。
总结:通过解题,我们找到了直线L1和直线L2的方程,并求得它们的交点坐标 (16/5, 33/5)。
这些练习题帮助我们熟悉了直线的方程和求解交点的方法,提高了我们对回归直线方程的理解和运用能力。
高中数学回归分析精选题
回归分析精选题20道一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-3.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R 依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R 为( )A .0.95B .0.81C .0.74D .0.365.已知四个命题:①在回归分析中,2R 可以用来刻画回归效果,2R 的值越大,模型的拟合效果越好; ②在独立性检验中,随机变量2K 的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212yx =+中,当解释变量x 每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1; 其中真命题是( )A .①④B .②④C .①②D .②③6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+ D .210xy=7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好 D .若12a a <,则12b b >,B 的拟合效果更好8.下列结论正确的是( )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32yx =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A .总偏差平方和B .残差平方和C .回归平方和D .相关指数二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A .运用最小二乘法求得的回归直线一定经过样本点的中心(x ,)yB .若相关系数r 的绝对值越接近于1,则相关性越强C .若相关指数2R 的值越接近于0,表示回归模型的拟合效果越好D .在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高 三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是 .15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 .17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 . 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y对x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380 i iix y==∑,521145)iix==∑回归分析精选题20道参考答案与试题解析一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g【分析】根据回归方程为ˆ0.8585.71yx =-,0.85>,可知A ,B ,C 均正确,对于D 回归方程只能进行预测,但不可断定. 【解答】解:对于A ,0.85>,所以y 与x 具有正的线性相关关系,故正确;对于B ,回归直线过样本点的中心(x ,)y ,故正确;对于C ,回归方程为ˆ0.8585.71yx =-,∴该大学某女生身高增加1c m ,则其体重约增加0.85k g,故正确;对于D ,170xc m=时,ˆ0.8517085.7158.79y =⨯-=,但这是预测值,不可断定其体重为58.79k g,故不正确故选:D .【点评】本题考查线性回归方程,考查学生对线性回归方程的理解,属于中档题. 2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-【分析】本题考查的知识点是回归分析的基本概念,根据某商品销售量y (件)与销售价格x(元/件)负相关,故回归系数应为负,再结合实际进行分析,即可得到答案.【解答】解:由x 与y 负相关, 可排除B 、D 两项,而C 项中的ˆ102000yx =--<不符合题意.故选:A .【点评】两个相关变量之间的关系为正相关关系,则他们的回归直线方程中回归系数为正;两个相关变量之间的关系为负相关关系,则他们的回归直线方程中回归系数为负.3.有一散点图如图所示,在5个(,)D后,下列说法正确的是()x y数据中去掉(3,10)A.残差平方和变小B.相关系数r变小C.相关指数2R变小D.解释变量x与预报变量y的相关性变弱【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和,的变化情况.【解答】解:从散点图可分析得出:只有D点偏离直线远,去掉D点,变量x与变量y的线性相关性变强,相关系数变大,相关指数变大,残差的平方和变小,故选:A.【点评】本题考查了利用散点图分析数据,判断变量的相关性问题,属于运用图形解决问题的能力,属于容易出错的题目.4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R为()A.0.95B.0.81C.0.74D.0.36【分析】根据两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,由此选出选项中的答案.【解答】解:两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,在所给的四个选项中0.95是相关指数最大的值,∴其拟合效果也最好.故选:A.【点评】本题考查了相关指数,这里不用求相关指数,而是根据所给的相关指数判断模型的拟合效果,解题的关键是理解相关指数越大拟合效果越好.5.已知四个命题:①在回归分析中,2R可以用来刻画回归效果,2R的值越大,模型的拟合效果越好;②在独立性检验中,随机变量2K的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212y x=+中,当解释变量x每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1;其中真命题是()A.①④B.②④C.①②D.②③【分析】对4个选项分别进行判断,即可得出结论.【解答】解:①相关指数2R是用来刻画回归效果的,2R表示解释变量对预报变量的贡献率,2R越接近于1,表示解释变量和预报变量的线性相关关系越强,越趋近0,关系越弱,故2R的值越大,说明回归模型的拟合效果越好,故①正确.②由2K的计算公式可知,对分类变量X与Y的随机变量2K的观测值k来说,k越小,判断“X与Y有关系”的把握越小,随机变量2K的值越大,说明两个分类变量有关系的可能性越大,故②正确;③在回归直线方程ˆ0.212=+中,当解释变量x每增加一个单位时,预报变量ˆy平均增加y x0.2个单位,故③错误.④两个随机变量相关性越强,则相关系数的绝对值越接近于1;两个随机变量相关性越弱,则相关系数的绝对值越接近于0,故④不正确.故选:C.【点评】本题以命题的真假判断为载体,考查了抽样方法,相关系数,回归分析,独立性检验等知识点,难度不大,属于基础题.6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+D .210xy=【分析】将(1,0.2),(2,0.39),(3,0.78)分别代入0.2y x=,20.10.1yx x=+,40.2lo g yx=+和210xy=中,验证即可.【解答】解:将(1,0.2),(2,0.39),(3,0.78)代入0.2y x=,当3x=时,0.6y=,和0.78相差较大;将(1,0.2),(2,0.39),(3,0.78)代入20.10.1y x x=+,当2x=时,0.6y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入40.2lo g y x=+,当2x=时,0.7y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入210xy =,当1x =时,0.2y =,当2x =时,0.4y =,与0.39相差0.01, 当3x=时,0.8y=,和0.78相差0.02;综合以上分析,选用函数关系210xy =较为近似.故选:D .【点评】本题考查了函数模型的应用问题,也考查了运算求解能力,是基础题.7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好D .若12a a <,则12b b >,B 的拟合效果更好【分析】比较两个模型的拟合效果时,如果模型残差平方和越小,则相应的相关指数2R 越大,该模型拟合的效果越好,即可得出结论.【解答】解:比较两个模型的拟合效果时,如果模型残差平方和越小, 则相应的相关指数2R 越大,该模型拟合的效果越好. 故选:C .【点评】本题是基础题.考查残差平方和、相关指数. 8.下列结论正确的是()①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④【分析】本题是一个对概念进行考查的内容,根据相关关系的定义与回归分析的统计意义进行判断.【解答】解:①函数关系是一种确定性关系,这是一个正确的结论. ②相关关系是一种非确定性关系,是一个正确的结论.③回归分析是对具有相关关系的两个变量进行统计分析的一种方法,所以③不对. 与③对比,依据定义知④是正确的, 故选:C .【点评】本题的考点是相关关系,对本题的正确判断需要对相关概念的熟练掌握. 9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟【分析】根据表中所给的数据,做出横标和纵标的平均数,得到样本中心点,代入样本中心点求出a 的值,写出线性回归方程.将100x=代入回归直线方程,得y ,可以预测加工100个零件需要102分钟,这是一个预报值,不是生产100个零件的准确的时间数. 【解答】解:由表中数据得:20x =,30y=,又ˆb 值为0.9,故300.92012a=-⨯=,0.912y x ∴=+.将100x=代入回归直线方程,得0.910012102y =⨯+=(分钟).∴预测加工100个零件需要102分钟.故选:C .【点评】本题考查线性回归方程的求法和应用,解题的关键是正确应用最小二乘法求出线性回归方程的系数的运算,再一点就是代入样本中心点可以求出字母a 的值,是一个中档题目. 10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =【分析】根据回归分析中相关指数2R 越接近于1,拟合效果越好,即可得出答案. 【解答】解:回归分析中,相关指数2R 越接近于1,拟合效果越好; 越接近0,拟合效果越差,由模型2对应的2R 最大,其拟合效果最好. 故选:C .【点评】本题考查了利用相关指数判断模型拟合效果的应用问题,是基础题. 11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32y x =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 【分析】根据题意,对选项种的命题分析判断正误即可.【解答】解:对于A ,在残差图中,纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,所以A 正确;对于B,散点图中的一组点全部位于直线ˆ32=-+的图象上,则x,y成负相关,且相关y x关系最强,此时相关系数1r=-,所以B错误;对于C,若残差平方和越小,则残差点分布的带状区域的宽度越窄,其相关性越强,相关指数2R越大,所以C正确;对于D,回归分析中,变量间的关系若是非确定关系,即变量间的关系不是函数关系,因变量不能由自变量唯一确定,所以D正确.故选:B.【点评】本题考查了统计知识的概念与应用问题,掌握相关概念的含义是解题的关键,是基础题.12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是() A.总偏差平方和B.残差平方和C.回归平方和D.相关指数【分析】本题考查的回归分析的基本概念,根据拟合效果好坏的判断方法我们可得,数据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.【解答】解:拟合效果好坏的是由残差的平方和来体现的,而拟合效果即数据点和它在回归直线上相应位置的差异故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.故选:B.【点评】拟合效果好坏的是由残差的平方和来体现的,也可以理解为拟合效果即数据点和它在回归直线上相应位置的差异,故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A.运用最小二乘法求得的回归直线一定经过样本点的中心(x,)yB.若相关系数r的绝对值越接近于1,则相关性越强C.若相关指数2R的值越接近于0,表示回归模型的拟合效果越好D.在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高【分析】利用回归分析中的相关知识对四个选项逐一分析判断即可.【解答】解:对于A,回归方程必定经过样本中心(x,)y,故选项A正确;对于B,由相关系数的意义可知,相关系数r的绝对值越接近于1,则相关性越强,故选项B正确;对于C ,若相关指数2R 的值越接近于1,表示回归模型的拟合效果越好,故选项C 错误; 对于D ,在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高,故选项D 正确. 故选:A B D .【点评】本题考查了回归分析的理解,主要考查了回归方程的性质,相关系数的意义等,属于基础题.三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是13(2,8).【分析】根据回归方程必过点(,)x y ,计算出,x y 即可求得答案. 【解答】解:35289121362x+++++==,4639121486y+++++==,回归方程必过点(,)x y ,∴该直线必过的定点是13(2,8).故答案为:13(2,8).【点评】本题考查了回归方程,线性回归方程必过样本中心点(,)x y ,这是线性回归中最常考的知识点,希望大家熟练掌握.属于基础题.15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是 106.5【分析】根据表中数据计算x 、y ,代入回归直线方程求得ˆa的值, 写出回归直线方程,利用方程求出10x =时ˆy的值即可. 【解答】解:根据表中数据,计算1(24568)55x=⨯++++=,1(2040607080)545y =⨯++++=,代入回归直线方程ˆˆ10.5y x a=+中,求得ˆ5410.55 1.5a =-⨯=,∴回归直线方程为ˆ10.5 1.5yx =+,据此模型预测,10x=时,ˆ10.510 1.5106.5y=⨯+=,即y 的估计值是106.5. 故答案为:106.5.【点评】本题考查了线性回归方程的应用问题,是基础题. 16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 0.5 .【分析】首先求出这组数据的横标和纵标的平均数,写出这组数据的样本中心点,把样本中心点代入线性回归方程求出m 的值. 【解答】解:0123342x +++==,3 5.5715.544m m y++++==,∴这组数据的样本中心点是3(2,15.5)4m +, 关于y 与x 的线性回归方程ˆ 2.10.85y x =+,∴15.532.10.8542m +=⨯+,解得0.5m =,m∴的值为0.5.故答案为:0.5.【点评】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是一个运算量比较小的题目,并且题目所用的原理不复杂,是一个好题.17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 75%.【分析】根据y 与x 具有线性相关关系,且满足回归方程,和该城市居民人均消费水平为,把消费水平的值代入线性回归方程,可以估计该市的职工均工资水平,做出人均消费额占人均工资收入的百分比. 【解答】解:y与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,该城市居民人均消费水平为7.5y=,∴可以估计该市的职工均工资水平7.50.6 1.5x =+,10x ∴=,∴可以估计该城市人均消费额占人均工资收入的百分比约为7.5100%75%10⨯=,故答案为:75%【点评】本题考查线性回归方程的应用,考查用线性回归方程估计方程中的一个变量,利用线性回归的知识点解决实际问题. 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-【分析】(1)用数组(,)m n 表示选出2天的发芽情况,用列举法可得m ,n 的所有取值情况,分析可得m ,n 均不小于25的情况数目,由古典概型公式,计算可得答案;(2)根据所给的数据,先做出x ,y 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程.(3)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的.【解答】解:(1)用数组(,)m n 表示选出2天的发芽情况,m,n 的所有取值情况有(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(30,26),共有10个设“m ,n 均不小于25”为事件A ,则包含的基本事件有(25,30),(25,26),(30,26) 所以3()10P A =,故事件A 的概率为310(2)由数据得12,27xy ==,3972x y=,31977i i i x y ==∑,321434i i x ==∑,23432x =由公式,得9779725ˆ4344322b -==-,5ˆ271232a=-⨯=-所以y 关于x 的线性回归方程为5ˆ32yx =-(3)当10x =时,ˆ22y=,|2223|2-<,当8x=时,ˆ17y=,|1716|2-<所以得到的线性回归方程是可靠的.【点评】本题考查回归直线方程的计算与应用,涉及古典概型的计算,是基础题,在计算线性回归方程时计算量较大,注意正确计算.19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.【分析】(1)利用描点法作出散点图;(2)把数据代入公式,利用最小二乘法求回归方程的系数,可得回归直线方程; (3)把10x=代入回归方程得y 值,即为预报变量.【解答】解:(1)散点图如图,由图知y 与x 间有线性相关关系.(2)4x=,5y=,52190i i x ==∑,51112.3i i i x y ==∑,∴112.354512.3ˆ 1.239054210a-⨯⨯===-⨯;ˆˆ5 1.2340.08a y b x =-=-⨯=.(3)线性回归直线方程是ˆ 1.230.08y x =+,当10x=(年)时,ˆ 1.23100.0812.38y=⨯+=(万元),即估计使用10年时,支出总费用是12.38万元.【点评】本题考查了线性回归直线方程的求法及利用回归方程估计预报变量,解答此类问题的关键是利用公式求回归方程的系数,计算要细心.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y 对x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380i i i x y ==∑,521145)i i x ==∑【分析】(1)根据表格数据,可得散点图;(2)先求出横标和纵标的平均数,代入求系数b 的公式,利用最小二乘法得到系数,再根据公式求出a 的值,写出线性回归方程,得到结果.(3)允许每小时的产品中有缺点的零件最多为89个,即线性回归方程的预报值不大于89,写出不等式,解关于x 的一次不等式,得到要求的机器允许的转数. 【解答】解:(1)散点图如图;(2)5x =,50y=,511380i i i x y ==∑,521145i i x ==∑∴13805550ˆ 6.5145555b-⨯⨯==-⨯⨯,ˆˆ17.5ay b x =-=∴回归直线方程为:ˆ 6.517.5yx =+;(3)由89y …得6.517.589x+…,解得11x …∴机器的运转速度应控制11转/秒内【点评】本题考查线性回归分析,考查线性回归方程,考查线性回归方程的应用,考查不等式的解法,是一个综合题目.。
高中线性回归习题含答案
高二选修1—2线性回归习题1. 独立性检验,适用于检查______变量之间的关系 ( )A.线性B.非线性C.解释与预报D.分类2. 样本点),(,),,(),,(2211n n y x y x y x 的样本中心与回归直线a x b yˆˆˆ+=的关系( ) A.在直线上 B.在直线左上方 C. 在直线右下方 D.在直线外3 已知数列 ,11,22,5,2,则52是这个数列的 ( )A.第6项B.第7项C.第19项D.第11项4 用数学归纳法证明)5,(22≥∈>*n N n n n 成立时,第二步归纳假设正确写法是( )A.假设k n =时命题成立B.假设)(*∈=N k k n 时命题成立C.假设)5(≥=n k n 时命题成立D.假设)5(>=n k n 时命题成立5 .确定结论“X 与Y 有关系”的可信度为5.99℅时,则随即变量2k 的观测值k 必须( )A.大于828.10B.小于829.7C.小于635.6D.大于706.26.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是 ( )A .①②③B .①②C .②③D .①③④ 7.在线性回归模型y bx a e =++中,下列说法正确的是A .y bx a e =++是一次函数B .因变量y 是由自变量x 唯一确定的C .因变量y 除了受自变量x 的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e 的产生D .随机误差e 是由于计算不准确造成的,可以通过精确计算避免随机误差e 的产生8.对相关系数r ,下列说法正确的是 ( )A .||r 越大,线性相关程度越大B .||r 越小,线性相关程度越大C .||r 越大,线性相关程度越小,||r 越接近0,线性相关程度越大D .||1r ≤且||r 越接近1,线性相关程度越大,||r 越接近0,线性相关程度越小9.在独立性检验中,统计量2K 有两个临界值:3.841和6.635;当2K >3.841时,有95%的把握说明两个事件有关,当2K >6.635时,有99%的把握说明两个事件有关,当2K ≤3.841时,认N M PCBA 为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2000人,经计算的2K =20.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者有关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病10必过点 .11.已知,x y R +∈,且2x y +>, 求证:1x y +与1y x +中至少有一个小于212. 如图P 是ABC ∆所在平面外一点,,PA PB CB =⊥平面PAB ,M 是PC 的中点,N 是AB 上的点,3AN NB =。
高学期线性回归方程同步练习题(文科)(教师版)
高二第二学期第一章线性回归方程同步练习题(文科)(1)一、选择题1 . 下列两个变量之间的关系哪个不是函数关系( D ) A .角度和它的余弦值 B.正方形边长和面积 C .正n边形的边数和它的内角和 D.人的年龄和身高2.某市纺织工人的月工资(元)依劳动生产率(千元)变化的回归方程为y=50+80x ,则下列说法中正确的是( C )A .劳动生产率为1000元时,月工资为130元B .劳动生产率提高1000元时,月工资提高约为130元C .劳动生产率提高1000元时,月工资提高约为80元D .月工资为210元时,劳动生产率为2000元 3.设有一个回归方程为y=2-1.5x ,则变量x 每增加一个单位时,y 平均 ( C ) A .增加1.5单位 B .增加2单位 C .减少1.5单位 D .减少2单位4.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( A )A.y ^=x +1 B.y ^=x +2 C.y ^=2x +1 D.y ^=x -15.由一组样本(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=a +bx ,下面有四种关于回归直线方程的论述:(1)直线y ^=a +bx 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;(2)直线y ^=a +bx 的斜率是∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2;(3)直线y ^=a +bx 必过(x ,y )点; (4)直线y ^=a +bx 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑ni =1 (y i -a -bx i )2是该坐标平面上所有的直线与这些点的偏差中最小的直线.其中正确的论述有( D )A .0个 B .1个C .2个 D .3个解析 线性回归直线不一定过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的任何一点;b =∑ni =1x i y i -n x y∑ni =1x 2i -n x 2就是线性回归直线的斜率,也就是回归系数;线性回归直线过点(x ,y );线性回归直线是平面上所有直线中偏差∑ni =1(y i -a -bx i )2取得最小的那一条.故有三种论述是正确的,选D. 6.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i =478,∑8i =1x i y i =1849,则其线性回归方程为( A ) A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x解析 利用回归系数公式计算可得a =11.47,b =2.62,故y ^=11.47+2.62x . 7. 下列变量之间的关系是函数关系的是( A )A .已知二次函数c bx ax y ++=2,其中a ,b 是已知常数,取b 为自变量,因变量是这个函数的判别式ac b Δ42-=B .光照时间和果树的亩产量C .降雪量和交通事故发生率D .每亩用肥料量和粮食亩产量 8. 列有关线性回归的说法,不正确是( D )A.变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C.线性回归直线方程最能代表观测值x ,y 之间的关系D.任何一组观测值都能得到具有代表意义的回归直线方程 9.已知x 与y 之间的一组数据:则y 对x 的线性回归方程y =bx +A. (2,2) B. (1.5,3.5) C. (1,2) D. (1.5,4)10. 设回归直线方程为y =2-1.5x ,若变量x 增加1个单位,则( C ). A. y 平均增加1.5个单位 B. y 平均增加2个单位 C. y 平均减少1.5个单位 D. y 平均减少2个单位二、填空题11.下列关系中,是相关关系的为 (填序号).①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系. 答案 ①②12.下列有关线性回归的说法,正确的是 (填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度 ③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程 答案 ①②③13.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=b ˆx +a ˆ及回归系数b ˆ,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 .答案 ①②③14.下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其截面直径与高度之间的关系;⑤学生的身高与其学号之间的关系,其中有相关关系的是___①③④_____(填序号).15.已知回归方程为yˆ=0.50x-0.81,则x=25时,y ˆ的估计值为 .答案 11.69 16.下表是某厂1~4由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是y ^=-0.7x +a ,则a 等于______.解析 x =2.5,y =3.5,∵回归直线方程过定点(x ,y ),∴3.5=-0.7×2.5+a .∴a =5.25. 17.某服装商场为了了解毛衣的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程y =bx +a 中的b ≈-2,气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为________件.答案 46解析 由所提供数据可计算得出x =10,y =38,又b ≈-2代入公式a =y -b x 可得a =58,即线性回归方程y ^=-2x +58,将x =6代入可得.18.正常情况下,年龄在18岁到38岁的人们,体重y (kg )依身高x (cm )的回归方程为y=0.72x-58.5。
《9.1 线性回归分析》(同步训练)高中数学选择性必修第二册_苏教版_2024-2025学年
《9.1 线性回归分析》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、某地区近五年内每年的GDP(单位:亿元)如下表所示:年份 | GDP–|—– 2016 | 300 2017 | 320 2018 | 350 2019 | 370 2020 | 400若要用线性回归分析预测该地区2021年的GDP,以下哪项说法是正确的?A、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为410亿元B、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为420亿元C、根据2016年到2020年的数据,拟合直线y=10x+280,则预测2021年GDP为400亿元D、根据2016年到2020年的数据,拟合直线y=10x+290,则预测2021年GDP为400亿元2、已知一组数据的线性回归方程为(y=1.5x+20),若将(x)的值增加 2,则(y)的值将()。
A、减少 3B、减少 2C、增加 3D、增加 23、(单选题)若线性回归方程为y = 3x + 1,当x增加1个单位时,y大约增加多少个单位?A. 1个单位B. 3个单位C. 4个单位D. 2个单位4、给定一组数据点((x1,y1),(x2,y2),...,(x n,y n)),假设我们已经计算出了线性回归方程(y=ax+b)中的斜率(a)和截距(b)。
如果增加一个新数据点((x n+1,y n+1))到这组数据中,那么新的线性回归方程中的斜率(a′)相对于原来的斜率(a):A. 一定会变大B. 一定会变小C. 可能会变大,可能会变小,也可能会不变D. 一定不会改变5、某校为研究学生身高与体重之间的关系,随机抽取了10名学生的身高和体重数据,并建立了线性回归方程y=50x+35(其中x为身高,y为体重),若某学生的身高为1.75米,则该学生的预测体重约为:A. 70千克B. 75千克C. 80千克D. 85千克6、某研究机构对两种不同品牌的学习卡片销售情况进行了统计,得到了两组数据,为了找到哪种学习卡片的销售趋势更好的线性回归方程,第一组(品牌A)的广告费用与销售额数据如下:广告费用x(元)分别为100、200、300、400、500,对应的销售额y(万元)分别为15、25、35、45、55。
(完整版)线性回归方程必练题(强烈推荐)
《线性回归方程》强化训练1、(门槛题) 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x (个) 23 4 5 加工的时间y (小时)2.5344.5(Ⅰ)在给定的坐标系中画出表中数据的散点图;(Ⅱ)求出y 关于x 的线性回归方程ˆˆˆybx a =+,并在坐标系中画出回归直线; (Ⅲ)试预测加工10个零件需要多少时间?附录:参考公式:()()()121ˆniii nii x x y y bx x ==--=-∑∑ ,ˆˆay bx =-.2、(泸州市2017届高三一诊第20题) 某班主任为了解本班学生的数学和物理考试成绩间关系,在某次阶段性测试中,他在全班学生中随机抽取一个容量(Ⅱ)建立y 与x 的线性回归方程(系数精确到0.01),并预测该班数学分数为88的学生的物理分数.附录:参考数据:51450i i y ==∑,5141880i i i x y ==∑ 4.90=;参考公式:相关系数()()niix x y y r --=∑; 回归直线的方程是ˆˆˆybx a =+, 其中对应的回归估计值:()()()121ˆniii ni i x x y y bx x==--=-∑∑ ,ˆˆay bx =- 3.87=.3、(2016年全国新课标高考Ⅲ卷第18题) 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:参考数据:,2.646≈. 参考公式:相关系数()()nii y y r t t --=∑,回归方程中斜率和截距的最小二乘估计公式分别为:719.32ii y==∑7140.17i i i t y ==∑0.55=y a bt =+)))121()()()nii i nii tt y y b tt ==--=-∑∑),=.a y bt -)))4、(2015年全国新课标高考Ⅰ卷第19题)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的宣传费i x 和年销售量()1,2,,8i y i =L 数据作了初步处理,得到下面的散点图及一些统计量的值.x ry u r w u r821()ii x x =-∑821()ii w w =-∑81()()iii x x y y =--∑ 81()()iii w w yy =--∑46.6 563 6.8289.8 1.6 1469 108.8表中i i w x =,w u r =811.8i i w =∑(Ⅰ)根据散点图判断,y a bx =+与y c d x =+,哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)已知这种产品的年利润z 与x ,y 的关系为0.2z y x =- ,根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费49x =时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x 为何值时,年利润的预报值最大? 附:对于一组数据11(,)u v ,22(,)u v ,…,(,)n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为:µ121()()=()niii ni i u u v v u u β==---∑∑,µµ=v u αβ-.。
高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精讲)(含答案)
8.2 一元线性回归模型及其应用(精讲)考点一样本中心求参数【例1-1】(2021·全国·高二课时练习)若两个变量x,y是线性相关的,且样本()(),1,2,,i ix y i n=的中心点为()3,2.5,则由这组样本数据算得的回归直线方程不可能是( )A.ˆ0.51y x=+B.ˆ0.60.7y x=+C.ˆ0.2 1.9y x=+D.ˆ 1.5y x=-【答案】D【解析】因为0.531 2.5⨯+=,即点()3,2.5在回归直线ˆ0.51y x=+上,所以A有可能;因为0.630.7 2.5⨯+=,即点()3,2.5在回归直线ˆ0.60.7y x=+上,所以B有可能;因为0.23 1.9 2.5⨯+=,即点()3,2.5在回归直线ˆ0.2 1.9y x=+上,所以C有可能;因为3 1.5 1.5 2.5-=≠,即点()3,2.5不在回归直线ˆ 1.5y x=-上,所以D没有可能.故选:D.【例1-2】(2021·广西河池)根据下表中数据求得的线性回归方程是4y x a=-+,则=a( )A .98B .107C .110D .106【答案】D【解析】由已知得,139(456789)66x =+++++=,1(908483807568)806y =+++++=, ∴398046a =-⨯+,即106a =.故选:D 【一隅三反】1.(2021·河北·藁城新冀明中学高二月考)实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A .ˆ1yx =+ B .ˆ2y x =+ C .ˆ21y x =+ D .ˆ1y x =- 【答案】A【解析】由已知可得11(1234) 2.5,(2345) 3.544x y =⨯+++==⨯+++=, 所以这组数据的样本中心点为(2.5,3.5), 因为样本中心必在回归直线上,所以把样本中心点代入四个选项中验证,可得只有1y x =+成立, 故选:A.2.(2021·陕西·西北工业大学附属中学 )为了研究某班学生的听力成绩x (单位:分)与笔试成绩y (单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x 与y 之间有线性关系,设其回归直线为y bx a =+,已知201400i i x ==∑,2011580i i y ==∑,1a =-,若该班某学生的听力成绩为26,据此估计其笔试成绩约为( )A .99B .101C .103D .105【答案】C【解析】201400i i x ==∑,故4002020x ==;2011580i i y ==∑,故15807920y ==, 故点()20,79在回归直线上,即79201b =-,得4b =, 即41y x =-,当26x =时,代入计算得到103y =. 故选:C.3.(2021·广东肇庆 )某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间x (单位:小时)与工资y (单位:元)之间的关系如下表:若y 与x 的线性回归方程为ˆ 6.5yx a =+,预测当工作时间为9小时时,工资大约为( ) A .75元 B .76元C .77元D .78元【答案】B【解析】由表格数据知:2456855x ++++==,3040506070505y ++++==,6.55032.517.5a y x ∴=-=-=,∴线性回归方程为ˆ 6.517.5yx =+, 6.5917.576∴⨯+=,即当工作时间为9小时时,工资大约为76元.故选:B.4.(2021·全国·高三专题练习)为了研究某种细菌在特定环境下随时间变化的繁殖情况,得到的实验数据如下表,并由此计算得到回归直线方程ˆ0.850.25yx =-,后来工作人员不慎将下表中的实验数据c 丢失.则上表中丢失的实验数据c 的值为( ) A .1 B .1.5 C .2 D .2.5【答案】D【解析】由表中数据可得3456755x ++++==,34 4.5617.555c c y +++++==,将点17.5(5,)5c +代入ˆ0.850.25yx =-中,得17.50.8550.255c +=⨯-,解得 2.5c =, 所以丢失的实验数据c 的值为2.5.故选:D考点二 线性回归方程【例2】(2021·江西赣州)某特色餐馆开通了美团外卖服务,在一周内的某特色菜外卖份数x (份)与收入y (元)之间有如下的对应数据:(1)画出散点图;(2)请根据以上数据用最小二乘法原理求出收入y 关于份数x 的线性回归方程; (3)据此估计外卖份数为12份时,收入为多少元.注:①参考方式:线性回归方程系数公式1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-;②参考数据:521145ii x ==∑,52113500ii y ==∑,511380i i i x y ==∑.【答案】(1)图象见解析(2) 6.517.5y x =+(3)95.5 【解析】(1)解:作出散点图如下图所示:(2)解:2456855x ++++==,3040605070505y ++++==,已知521145i i x ==∑,511380i i i x y ==∑,则1222551513805550ˆ 6.5145555i iiii x y x ybx x==--⨯⨯===-⨯-∑∑,50 6.5517.5a y bx =-=-⨯=, 因此,线性回归方程为 6.517.5y x =+. (3)解:12x =时,12 6.517.595.5y =⨯+=, 即外卖份数为12份时,收入大约为95.5元. 【一隅三反】1.(2021·贵州·凯里一中 )凯里市2017至2021年农村居民家庭纯收入y (单位:千元)的数据如下表:从表出看出,人均纯收入y 与年份代号t 线性相关,已知516470.i i i t y ==∑.(1)求y 关于t 的线性回归方程y bt a =+;(2)预测2025年的人均纯收入为多少.(附:参考公式:1122211()()()nnii i ii i nniii i tt y y t y nt yb tt tnt====---==--∑∑∑∑,a y bt =-).【答案】(1)0.47 2.59y t =+(2)6.82【解析】(1)由题中表格知,5n =,1(12345)35t =++++=,1(3.1 3.5 3.9 4.6 4.9)45y =++++=,522222211234555i i t==++++=∑,则5152221564.75340.4755535i ii i i t y t yb t t==--⨯⨯===-⨯-∑∑,40.473 2.59a y bt =-=-⨯=,故回归直线方程为0.47 2.59y t =+.(2)当年份为2025年时,对应的年份代码9t =, 所以0.479 2.59 6.82y =⨯+=, 故2025年的人均纯收入约为6.82千元.2.(2021·福建宁德)近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,我市一家新能源企业近5个月的产值如下表:(1)根据上表数据,计算y 与x 的线性相关系数r ,并说明y 与x 的线性相关性强弱;(0.75||1r ≤≤,则认为y 与x 线性相关性很强;0.75r <,则认为y 与x 线性相关性不强) (2)求出y 关于x 的线性回归方程,并预测10月该企业的产值.参考公式:1221,nni ii ii nii x ynx yx ynx y r b a y bx xnx==--===--∑∑∑;参考数据:55522111442,55,52.3i i ii i i i x y x y ======≈∑∑∑.【答案】(1)0.993r =;相关系数较强;(2) 5.210.4y x =+;10月该企业的产值约为41.6亿元 【解析】(1)1234535x ++++==,16+20+27+30+37=265y =,0.993ni ix ynx yr -==≈∑,因为[]0.75,1r ∈,所以y 与x 线性相关性较强. (2)设线性回归方程为:y bx a =+;122144253265.25559ni ii n i i x ynx yb x nx==--⨯⨯===-⨯-∑∑,26 5.2310.4a y bx =-=-⨯=,即 5.210.4y x =+, 10月份对应的代码为6, 5.2610.441.6y =⨯+=,10月该企业的产值约为41.6亿元.3(2021·河南·高二月考 )有时候一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同品牌的一些食品所含热量的百分比记为()1,2,3,,10i x i =⋅⋅⋅和一些美食家以百分制给出的对此种食品口味的评价分数记为()123,,10i y i =⋅⋅⋅,,:参考数据:1220i i x ==∑,1720i i y ==∑,()21272i i x x=-=∑,()()1429i ii x xy y =--=∑参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-(1)已知这些品牌食品的所含热量的百分比i x 与美食家以百分制给出的对此种食品口味的评价分数i y 具有相关关系.试求出回归方程(最后结果精确到0.1);(2)某人只能接受食品所含热量的百分比为20及以下的食品.现在他想从这些食品中随机选取两种购买,求他所选取的两种食品至少有一种是美食家以百分制给出的对此种食品口味的评价分数为75分以上的概率.【答案】(1) 1.637.3y x =+(2)35【解析】(1)解:设所求的回归方程为y bx a =+,由()()()10110214291.6272iii i i x x y y b x x==--==≈-∑∑, 10112210i i x x ==⨯=∑,10117210i i y y ==⨯=∑, 429722237.3272a y bx ∴=-=-⨯≈, ∴所求的回归方程为: 1.637.3y x =+.(2)解:由表可知某人只能接受的食品共有6种,其中美食家以百分制给出的对此种食品口味的评价为75分以上的有2种可记为a ,b ,另外4种记为1,2,3,4.任选两种分别为:(),a b ,(),1a ,(),2a ,(),3a ,(),4a ,(),1b ,(),2b ,(),3b ,(),4b ,()1,2,()1,3,()1,4,()2,3,()2,4,()3,4,共15个基本事件.记“所选取的两种食品至少有一种是美食家以百分制给出的对此食品口味的评价分数为75分以上”为事件A ,则事件A 包含(),a b ,(),1a ,(),2a ,(),3a ,(),1b ,(),2b ,(),3b ,(),4b ,共9个基本事件, 故事件A 发生的概率为()93155P A ==. 4.(2021·陕西·西安中学 )某连锁经营公司所属5个零售店某月的销售额和利润额资料如表.(1)画出销售额和利润额的散点图;(2)若销售额和利润额具有相关关系,用最小二乘法计算利润额y 对销售额x 的回归直线方程.(参考公式1221ni ii nii x y n x yb xn x ==-⋅⋅=-⋅∑∑,ˆˆay bx =-) (3)若该公司计划再开一个店想达到预期利润为8百万,请预估销售额需要达到多少.【答案】(1)答案见解析(2)ˆy=0.5x +0.4(3)8百万 【解析】(1)(2)由表中的数据可得,()13567965x =⨯++++=,()123345 3.45y =⨯++++=,515221511256 3.40.520056ˆ65i ii ii x y x ybxx ==-⋅⋅-⨯⨯===-⨯⨯-⋅∑∑,∵回归直线方程恒过样本中心,∴ˆ 3.40.560.4a=-⨯=, 故利润额y 对销售额x 的回归直线方程为ˆy =0.5x +0.4. (3)∵该公司计划再开一个店想达到预期利润为8百万,即0.8千万, ∴0.8=0.5x +0.4,解得x =0.8, 故预计销售额需要达到8百万.考点三 非线性回归方程【例3】(2021·黑龙江·哈尔滨市第六中学校高二期中)某公司在市场调查中,发现某产品的单位定价x (单位:万元)对月销售量y (单位:吨)有影响对不同定价i x 和月销售量i y (1,2,8)i =数据作了初步处理,表中1z x =.经过分析发现可以用by a x=+来拟合y 与x 的关系. (1)求ˆy关于x 的回归方程; (2)若生产1吨产品的成本为0.9万元,那么预计单位定价为多少时,该产品的月利润取最大值,求此时的月利润.附:对于一组数据11(),v ω,22(,)v ω,,(,)n n v ω,其回归直线ˆˆˆvαβω=+的斜率和截距的最小二乘法估计分别为:1122211()()ˆ()nniii i i i nniii i v v v n vn ωωωωβωωωω====---==--∑∑∑∑,ˆˆv αβω=- 【答案】(1)^52y x=-+(2)单位定价为1.5万元时,月利润最大,最大值为0.8万元.【解析】(1)令1z x=,则y a b z =+⋅,则8^1822123956894358208988i ii i i z y z yb z z==-⨯⨯===-⨯--∑∑,^^2a y b z =-⋅=-,∴^52y x=-+. (2)设月利润为W ,则由已知()59934340.92260.810255W y x x x x x ⎛⎫⎛⎫=-=-+-=--+≤-+= ⎪⎪⎝⎭⎝⎭, 当且仅当922x x-=-即 1.5x =时取等号所以单位定价为1.5万元时,月利润最大,最大值为0.8万元. 【一隅三反】1.(2021·重庆市实验中学)某电器企业统计了近10年的年利润额y (千万元)与投入的年广告费用x (十万元)的相关数据,散点图如图,对数据作出如下处理:令ln i i u x =,ln i i v y =,得到相关数据如表所示:(1)从①y bx a =+;②()0,0ky m x m k =⋅>>;③2y cx dx e =++三个函数中选择一个作为年广告费用x 和年利润额y 的回归类型,判断哪个类型符合,不必说明理由; (2)根据(1)中选择的回归类型,求出y 与x 的回归方程;(3)预计要使年利润额突破1亿,下一年应至少投入多少广告费用?(结果保留到万元) 参考数据:3103.67883.678849.787e≈≈, 参考公式:回归方程ˆˆˆv bu a =+中斜率和截距的最小二乘估计公式分别为1221ˆni i i ni i u v nxybunu==-=-∑∑【答案】(1)选择回归类型k y m x =⋅更好;(2)13y ex =;(3)下一年应至少投入498万元广告费用. 【解析】(1)由散点图知,年广告费用x 和年利润额y 的回归类型并不是直线型的,而是曲线型的, 所以选择回归类型k y m x =⋅更好.(1)对k y m x =⋅两边取对数,得:ln ln ln y k x m =+,即ln v ku m =+,由表中数据得:101102211030.510 1.5 1.51ˆ46.510 1.5 1.5310i i i ii u v uvkuu ==--⨯⨯===-⨯⨯-∑∑,1ˆln 1.5 1.513m v ku ∴=-=-⨯=,m e ∴=, ∴年广告费用x 和年利润额y 的回归方程为13y ex =.(3)由(2)知:13y e x =⋅, 令1310y e x =⋅>得:1310x e>,解得:13 3.6788x >, 33.678849.787x ∴>≈,49.8x ∴≈(十万元),49.8十万元498=万元∴下一年应至少投入498万元广告费用.2.(2021·全国·高二课时练习)某地区不同身高的未成年男性的平均体重如下表,并由表中数据作出如图所示的散点图.(1)根据散点图,判断y a bx =+与x y a b =⋅哪一个能比较近似地反映这个地区未成年男性平均体重y 与身高x 的关系?(给出判断即可,不必说明理由)(2)令ln u y =,根据(1)的判断结果及下表数据,建立y 关于x 的非线性经验回归方程(参考数据:0.66e 1.93≈,0.02e 1.02≈).【答案】(1)x y a b =⋅;(2)ˆ 1.93 1.02x y=⨯. 【解析】(1)根据散点图,知x y a b =⋅能比较近似地反映这个地区未成年男性平均体重y 与身高x 的高度. (2)由ln u y =和x y a b =⋅,得12u c x c =+(1ln c b =,2ln c a =),()()()12111221282ˆ0.0214300iii ii xx uucx x ==--==≈-∑∑,又 2.96u =, 所以21ˆˆ 2.960.021150.66cu c x =-=-⨯=,ˆ0.020.66u x =+, 所以0.020.660.660.02ˆe e e 1.93 1.02x x x y+==⨯=⨯, 所以y 关于x 的非线性经验回归方程为ˆ 1.93 1.02x y=⨯. 3.(2021·黑龙江肇州 )如图是某小区2020年1月至2021年1月当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2020年1月~2021年1月).根据散点图选择y a =+ln y c d x =+两个模型进行拟合,经过数据处理得到两个回归方程分别为0.9369y =+0.95540.0306ln y x =+,并得到以下一些统计量的值:(1)请利用相关指数2R 判断哪个模型的拟合效果更好;(2)估计该小区2021年6月份的二手房均价.(精确到0.001万元/平方米)参考数据:ln 20.69≈,ln3 1.10≈,ln17 2.83≈,ln192.94≈ 1.41≈ 1.73≈ 4.12≈ 4.36≈.参考公式:相关指数()()221211niii nii y y R y y==-=--∑∑.【答案】(1)模型0.95540.0306ln y x =+;(2)1.044(万元/平方米).【解析】(1)设模型0.9369y =+0.95540.0306ln y x =+的相关指数分别为21R 和22R ,则210.00059110.00605R =-,220.00016410.00605R =-.因为0.0005910.000164>,所以2212R R <.所以模型0.95540.0306ln y x =+的拟合效果更好.(2)由(1)知,模型0.95540.0306ln y x =+的拟合效果更好,利用该模型预测可得,这个小区2021年6月份的在售二手房均价为:0.95540.0306ln18y =+()0.95540.0306ln 22ln3=++ 1.044≈(万元/平方米).。
高中数学选修2-3统计案例之线性回归方程习题课解析
1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^其中,b是回归方程的斜率,a是在y轴上的截距.4.样本相关系数r=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.考向一相关关系的判断例1.下列选项中,两个变量具有相关关系的是( )A.正方形的面积与周长B.匀速行驶车辆的行驶路程与时间C.人的身高与体重D.人的身高与视力答案:C例2.对变量x、y有观测数据(x i,y i)(i =1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关.例3.下面哪些变量是相关关系().A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案 C例4.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.解析:因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.答案:D例5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v 有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断().A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案 C例6.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.球的体积与半径之间的关系C.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D.一个家庭的收入与支出解析:选C.A、D中的两个变量属于线性正相关,B中两个变量是函数关系.例7.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):(1)画出散点图;(2)判断是否具有相关关系.[审题视点] (1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解(1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.例8. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二线性回归方程例9.对有线性相关关系的两个变量建立的回归直线方程y^=a+bx中,回归系数b( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0解析:选C.∵b=0时,r=0,这时不具有线性相关关系,但b能大于0也能小于0.例10.已知回归方程y^=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.答案:5 22例11.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是().A.y^=-10x+200 B.y^=10x+200 C.y^=-10x-200 D.y^=10x-200 解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案 A例12.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a ^、b ^,即可求出线性回归方程.(3)问将x =100代入回归直线方程即可. 解 (1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得: i =14x 2i =86, x =3+4+5+64= 4.5(吨),y =2.5+3+4+4.54=3.5(吨).已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b ^=∑i =14x i y i -4x ·y ∑i =14x 2i -4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为: 90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.例13.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为().A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案 C例14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y^=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:对预处理后的数据,容易算得,x=0,y=3.2,b=26040=6.5,a=y-b x=3.2.由上述计算结果,知所求回归直线方程为y -257=b(x-2 006)+a=6.5(x-2 006)+3.2,即y^=6.5(x-2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).例15.下列有关回归直线方程y^=bx+a 的叙述正确的是( )①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①② B.②③C.③④ D.①④解析:选D.y^=bx+a表示y^与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系,故选D.例16.设有一个回归方程y^=3-5x,变量x增加一个单位时( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:选B.∵-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.例17.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不.正确的是( ) A.由样本数据得到的回归方程y^=b^x+a^必过样本中心(x,y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r =-0.9362,则变量y和x之间具有线性相关关系解析:选C.C中应为R2越大拟合效果越好.例18.已知回归方程y^=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.04解析:选C.当x =2时,y ^=5, 当x =3时,y ^=7,当x =4时,y ^=9.∴e ^1=4.9-5=-0.1,e ^2=7.1-7=0.1, e ^3=9.1-9=0.1.∴ i =13e ^i 2=(-0.1)2+(0.1)2+(0.1)2=0.03.例19.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②回归方程y ^=bx +a 必过点(x ,y ); ③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是 90%.其中错误的是________.解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.答案:③④例20.在2009年十一国庆8天黄金周期间,某市物价部门,对本市五个商场销售的某商品的一天销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:9通过分析,发现销售量对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.解析:由数据表可得x=10,y=8,离差x-x:-1,-0.5,0,0.5,1;离差y-y:3,2,0,-2,-3.∴b^=-1×3-0.5×2-0.5×2-1×3 1+0.25+0+0.25+1=-3.2,a ^=y -b ^x =40,∴回归直线方程为y ^=-3.2x +40. 答案:y ^=-3.2x +40例21.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.解:以x 轴表示身高,y 轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=b^ x+a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解:(1)设抽到不相邻2组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻2组数据的情况有4种,所以P(A)=1-410=35.(2)由数据求得,x=12,y=27,由公式求得.b^=52,a^=y-b^x=-3.所以y关于x的线性回归方程为y^=5 2 x-3.(3)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.。
苏教版高中数学必修三练习:2.4线性回归方程(一)含答案
2.4线性回归方程(一)【新知导读】1.下列两个变量之间的关系中,哪个不是函数关系 ( ) A .角度和它的余弦值 B .正方形边长和面积 C .正n 边形的边数和其内角和 D .人的年龄和身高2.回归直线方程y bx a ∧=+中的y ∧是预测值,与实际中的y 关系为 ( ) A .y y ∧-越小,说明回归偏差越小 B .y y ∧-越大,说明回归偏差越小 C .y y ∧-越小,说明回归偏差越小D .y y ∧-越小,说明回归偏差越小3.回归直线方程的系数a ,b 的最小二乘法估计中,使函数(,)Q a b 最小,Q 函数指( )A .21()niii y a bx =--∑ B .1niii y a bx=--∑C .2()i i y a bx -- D .i i y a bx --【范例点睛】例1.以下是收集到的新房屋销售价格y 与房屋的大小x 的数据:(3)计算此时(,)Q a b 和(2,0.2)Q 的值,并作比较. 【课外链接】1.假设学生在初一和初二数学成绩是线性相关的.若10个学生初一()x 和初二()y 数学分数如下:【随堂演练】1.下列说法错误的是( )A .如果变量η和ξ之间存在线性相关关系,那么根据它们的一组数据得到一列点(,)i i x y (1,2,3,...,i n =)将散步在某一直线的附近B .如果变量η和ξ之间不存在线性相关关系,那么根据它们的一组数据(,)i i x y (1,2,3,...,i n =)不能写出一个线性方程C .设x ,y 是具有线性相关关系的两个变量,且x 关于y 的线性回归方程为y bx a ∧=+,其中,a b 叫做回归系数D .在回归分析中,变量间的关系若是非确定性的关系,则因变量不能由自变量唯一确定 2.三点(3,10),(7,20),(11,24)的线性回归方程是 ( ) A . 5.75 1.75y x ∧=- B . 1.75 5.75y x ∧=+ C . 1.75 5.75y x ∧=- D . 5.75 1.75y x ∧=+ 3.已知x ,y 之间的一组数据:则y 与x 的线性回归方程y bx a =+必过 ( )A .(2,2)点B .(1.5,0)点C .(1,2)点D .(1.5,4)点4.设有一个回归方程为32y x ∧=+,变量x 增加一个单位时,则y 平均增加______个单位.5.已知线性回归方程为0.500.81y x ∧=-,则25x =时,y 的估计值为_____________. 6.某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病人数的线性回归分析如下表表示:如不加控制,仍按这个趋势发展下去,请预测从2006年初到2009年底的四年时间里,该地区这种病的新发病总人数为_______________.7.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:64y x =+;模型2:64y x δ=++. (1) 如果3x =,1δ=,分别求两个模型中的y 值; (2) 分别说明以上两个模型是确定性模型还是随机性模型.8.在10年期间,某城市居民的年收入与某种商品的销售额之间的关系如下表所示:(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线附近,求y与x间的线性回归方程.9.已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料:设y 对x 呈线性相关关系.试求:(1)线性回归方程y bx a ∧=+的回归系数a ,b ; (2)估计使用年限为10年,维修费用是多少?10.在钢线含量对于电阻的效应的研究中,得到以下的数据:(1)画出散点图(2)求线性回归方程.2.4线性回归方程(一) 【新知导读】 1.D 2.C 3.A 【范例点睛】 例1.(1)(2)5n =,51545ii x==∑,109x =,51116i i y ==∑,23.2y =,55160952i i x ==∑,5112592i i i x y ==∑,25129525451160.1962560952545b ⨯-⨯=≈⨯-,23.20.1962109 1.8166a =-⨯≈, ∴线性回归方程为0.1962 1.8166y x =+;(3)(1.8166,0.1962) 5.1771Q ≈,(2,0.2)7.0Q ≈,由此可知,求得的 1.8166a =,0.1962b =是使函数(,)Q a b 取最小值的a ,b 值. 【课外链接】 解:71x =Q ,52150520ii x==∑,72.3y =,10151467i ii x y==∑,所以210514677107231.21821050520710b ⨯-⨯=≈⨯-,72.3 1.21827114.912a =-⨯=-,所以回归直线方程为1.218214.192y x ∧=-.【随堂演练】1. B2. D3.B4. 35. 11.696.139497.解:(1)模型1:6464318y x =+=+⨯=;模型2:64643119y x δ=++=+⨯+=. (2)模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型. 8. 解:(1)(2)由题意:37.97x =,39.1y =;102114633.67ii x==∑,10115202.9i ii x y==∑,于是1011022211015202.91037.9739.11.44714663.671037.9710i ii i i x y x yb x x==--⨯⨯==≈-⨯-∑∑,39.1 1.447a y bx =-=-⨯37.9715.843≈-.所以所求线性回归方程为 1.44715.843y bx a x ∧=+=-.9.解:(1)4x =,5y =,52190i i x ==∑,51112.3i i i x y ==∑,于是回归系数2112.35459054b -⨯⨯=-⨯ 1.23=,5 1.2340.08a y bx =-=-⨯=;(2)线性回归方程是 1.230.08y x ∧=+,当10x =年时,1.23100.0812.38y ∧=⨯+=(万),即估计使用10年时,维修费用是12.38万元.10.解:(1)(2)可求得13.958412.5503y x ∧=+。
高一数学苏教版必修3同步练习:2.4 线性回归方程
2.4 线性回归方程1、某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( )A. 63.6万元B. 65.5万元C. 67.7万元D. 72.0万元2、某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为0.66.52ˆ16yx =+,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A.83%B.72%C.67%D.66%3、变量X 与Y 相对应的一组数据为()()()()()10,1,11.3,2,11.8,3,12.5,4,13,5,变量U 与V 相对应的一组数据为()()()()()10,5,11.3,4,11.8,3,12.5,2,13,1.1r 表示变量X 与Y 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则( ) A.210r r <<B.210r r <<C.210r r <<D.21r r =4、四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且 2.34.4ˆ7623yx =-; ②y 与x 负相关且 3.476 5.6ˆ48yx =-+; ③y 与x 正相关且 5.43.4ˆ7893yx =+; ④y 与x 正相关且 4.326 4.5ˆ78yx =--. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆyx =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆyx =-+ 6、为了解某社区居民的家庭年收入与年支出的关系,随机调査了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y bx a =+,其中0.76,b a y bx ==-,据此估计,该社区一户年收入为15万元家庭的年支出为( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元7、为了考察两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为1l 和2l ,已知两个人在试验中发现对变量x 的观测数据的平均值恰好相等,都是s ,对变量y 的观测数据的平均值也恰好相等,都是t ,那么下列说法正确的是( ) A.直线1l 和2l 有交点(),s tB.直线1l 和2l 相交,但是交点未必是(),s tC.直线1l 和2l 由于斜率相等,所以必定平行D.直线1l 和2l 必定重合 8、根据如下样本数据y4.0 2.5 0.5- 0.5 2.0- 3.0-得到的回归方程为ˆybx a =+,则( ) A. 0a >,0b < B. 0a >,0b > C. 0a <,0b < D. 0a <,0b >9、某校金融专业的学生学习《统计学》的时间x 与考试成绩y 之间可建立线性回归方程ˆya bx =+,经计算,方程为200.8ˆy x =-,则该方程参数中( ) A. a 值错误 B.b 值错误 C. a 、b 值都错误 D. a 、b 值都正确10、如图,有5组数据,为使剩下的4组数据的线,性相关性最大,则应去掉( ).A.(1,2)B.(3,5)C.(4,10)D.(5,10)11、调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:0.25402ˆ.31yx =+,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加__________万元.12、某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm ,170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm .13、在一组样本数据11(,)x y ,22(,)x y ,…(),n n x y ,(2n ≥,12,,,n x x x ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i x y ()1,2,,i n =⋅⋅⋅都在直线112y x =+上,则这组样本数据的样本相关系数为__________. 14已知与之间的几组数据如下表: x 1 2 3 4 5 6 y 0 2 1 3 3 4假设根据上表数据所得线性回归直线方程为.若某同学根据上表中的前两组数据和求得的直线方程为则以下结论正确的是①;②;③;④15、某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: 单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件)908483807568(1)求回归直线方程ˆˆˆybx a =+,其中ˆ20b =-,ˆˆa y bx =-; (2)预计在今后的销售中,销量与单价仍然服从题(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)答案以及解析1答案及解析: 答案:B解析:由表可计算4235742x +++==, 49263954424y +++==,∵点7,422⎛⎫ ⎪⎝⎭在回归直线ˆˆˆy bx a =+上,且ˆb 为9.4,所以7429.4ˆ2a =⨯+, 解得ˆ9.1a=, 故回归方程为9.4.1ˆ9y x =+, 令6x =,得ˆ65.5y=。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教学步骤及教学内容
线性回归方程
(参考公式:b=
∑
i=1
n
x i y i-n x y
∑
i=1
n
x2i-n x2
,a=y-b x)
1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()
A.y
^
=x+1 B.y
^
=x+2 C.y
^
=2x+1 D.y
^
=x-1
2.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是()
A.甲B.乙C.甲、乙相同D.不确定
3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得∑
8
i=1
x i=52,∑
8
i=1
y i=228,∑
8
i=1
x2i=478,∑
8
i=1
x i y i=1849,则其线性回归方程为()
A.y
^
=11.47+2.62x B.y
^
=-11.47+2.62x
C.y
^
=2.62+11.47x D.y
^
=11.47-2.62x
4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x 123 4
用水量y 4.543 2.5
由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y
^
=-0.7x+a,则a等于______.
5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x (个) 2 3 4 5 加工的时间y (小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y 关于x 的线性回归方程y ^
=bx +a ,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少小时?
作业 布置
家长意见
家长签名:
2013 年_月_日(第_次)
审阅人:。