线性回归分析练习题分析
线性模型练习题(含答案)
线性模型练习题(含答案)练题一设有线性回归模型:$ y = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_3 $,其中 $x_1$、$x_2$ 和 $x_3$ 是自变量,$y$ 是因变量。
已知模型的参数估计值如下:$ \hat{\beta}_0 = 2.5 $$ \hat{\beta}_1 = 0.8 $$ \hat{\beta}_2 = -1.2 $$ \hat{\beta}_3 = 1.3 $请判断以下哪个自变量与因变量的关系最为显著:A. $x_1$B. $x_2$C. $x_3$D. 无法确定答案:B. $x_2$练题二下面是一个简单的线性回归模型:$ y = 3x_1 + 4x_2 + 2x_3 + 1 $已知模型的参数估计值如下:$ \hat{\beta}_1 = 2.1 $$ \hat{\beta}_2 = 1.8 $$ \hat{\beta}_3 = 0.9 $请根据模型参数估计值计算预测值 $ \hat{y} $,当 $x_1 = 2$,$x_2 = 3$,$x_3 = 1$ 时的结果。
答案:$ \hat{y} = 3(2) + 4(3) + 2(1) + 1 = 23 $练题三某研究人员运用线性回归模型分析了一个因变量 $y$ 和四个自变量 $x_1$、$x_2$、$x_3$ 和 $x_4$ 的关系,得到模型方程如下:$ y = 2.6x_1 + 1.9x_2 - 1.4x_3 + 0.5x_4 - 1 $已知 $x_1 = 3$,$x_2 = 2$,$x_3 = 4$,$x_4 = 1$,请计算对应的预测值 $ \hat{y} $。
答案:$ \hat{y} = 2.6(3) + 1.9(2) - 1.4(4) + 0.5(1) - 1 = 2.9 $练题四以下是一个多元线性回归模型的参数估计值摘录:$ \hat{\beta}_0 = 1.2 $$ \hat{\beta}_1 = -0.8 $$ \hat{\beta}_2 = 0.5 $$ \hat{\beta}_3 = 1.0 $$ \hat{\beta}_4 = 0.3 $$ \hat{\beta}_5 = -0.6 $请写出该线性回归模型的方程。
高考数学复习典型题型专题讲解与练习94 一元线性回归模型及其应用
高考数学复习典型题型专题讲解与练习 专题94 一元线性回归模型及其应用题型一 求回归直线方程例1.(2022·甘肃·临泽县第一中学高二阶段练习(文))已知变量x 和y 正相关,则由如下表所示的观测数据算得的线性回归方程为【答案】B 【解析】 【分析】先求出样本的中心点的坐标,再代入选项检验即得正确答案. 【详解】 由题得12345543210,10x -----+++++==0.92 3.1 3.9 5.1 4.15 2.9 2.10.9010y -----+++++==,所以样本中心点的坐标为(0,0),代入选项检验得选B. 故答案为B 【点睛】(1)本题主要考查回归方程直线的性质,意在考查学生对该知识的掌握水平.(2) (,)x y 称为样本点的中心,回归直线过样本点的中心.这是回归方程的一个重要考点,要理解掌握并灵活运用.规律方法 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x -,y -,∑n i =1x 2i ,∑ni =1x i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑n i =1x i y i -n x - y -∑n i =1x 2i -nx -2,a ^=y --b ^x -.(6)写出线性回归方程y ^=b ^x +a ^.例2.(2019·新疆·乌鲁木齐市第二十中学高二期中)随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y (万元)有如表的数据资料:(1) 在给出的坐标系中作出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa 、ˆb ; (3)估计使用年限为12年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆn i i i n ii x y nxy bx nx==-=-∑∑, ˆˆay bx =-.) 【答案】(1)见解析; (2) 1.23b =0.08a =; (3)估计使用12年时,支出总费用是14.84万元.. 【解析】 【分析】(1)在坐标系中描点可得散点图;(2)代入公式可求;(3)根据方程代入x=12可得费用. 【详解】(1)散点图如图,由图知y 与x 间有线性相关关系.(2)∵4x =,5y =,51112.3i i i x y ==∑,52190i i x ==∑,∴2112.354512.31.2390541ˆ0b-⨯⨯===-⨯;5 1.2340.ˆ0ˆˆ8ay bx =-=-⨯=. (3)线性回归直线方程是 1.2308ˆ.0yx =+, 当12x =(年)时, 1.23120.0814.8ˆ4y =⨯+=(万元).即估计使用12年时,支出总费用是14.84万元. 【点睛】本题主要考查回归直线在生活中的应用,明确所给公式中各个模块的含义,代入公式可求.题目难度不大,侧重于应用性.例3.(2022·全国·高二单元测试)有一位同学家里开了一个小卖部,他为了研究气温对热茶销售的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表如下: 气温x/℃ -5 0 4 7 12 15 19 23 27 31 36热茶销售杯数y/杯 156 150 132 128 130 116 104 89 93 76 54(1)画出散点图;(2)你能从散点图中发现气温与热茶的销售杯数之间关系的一般规律吗? (3)如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系; (4)试求出回归直线方程;(5)利用(4)的回归方程,若某天的气温是2 ℃,预测这一天卖出热茶的杯数.【答案】(1)见解析;(2)见解析;(3)见解析;(4) 2.354774ˆ1.y x =-+;(5)143【解析】 【详解】分析:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图;(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少;(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系; (4)由题中所给的数据求得回归方程即可;(5)结合回归方程的预测作用和(4)中的结论整理计算即可求得最终结果. 详解:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图如下图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系,如图所示.(4)因112i i 1169x ,x 411∑===为335,11i 11228y ,xiyi 1411∑===778. 所2169122814778-111111b 1694335-1111⨯⨯=⎛⎫⨯ ⎪⎝⎭^以≈-2.35, 1228169a 2.35147.74.1111=+⨯=^所以回归直线方程y 2.35x 147.74.=-+^为(5)由(4)的方程,当x=2,y 4.70147.74143.04,=-+=^时因此若某天的气温为2 ℃,这一天大约可以卖出143杯热茶.点睛:(1)正确运用计算^a ,^b 的公式和准确的计算,是求线性回归方程的关键. (2)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.题型二 利用回归直线方程对总体进行估计例4.(2022·江西抚州·高二期末(理))保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新能源汽车,每年抽样1000汽车调查,得到新能源汽车y 辆与年份代码x 年的数据如下表:(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源汽车.参考公式:回归方程y bx a =+斜率和截距的最小二乘估计公式分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【答案】(1)219y x =+ (2)27900 【解析】【分析】(1)第一步分别算第x ,y 的平均值,第二步利用1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-即可得到方程.(2)由第一问的结果,带入方程即可算出预估的结果. (1)3x =,305070+100+110=725y ++=,1222222221130+250+370+4100+5110-5372==211+2+3+4+5-53ni ii ni i x y nx yb x nx==-⨯⨯⨯⨯⨯⨯⨯=⨯-∑∑,因为a y bx =-,所以72213=9a =-⨯,所以219y x =+(2)预测该地区2022年抽样1000汽车调查中新能源汽车数,当7x =时,217993y =⨯+=,该地区2022年共有30万辆汽车,所以新能源汽车93300000279001000N =⨯=. 规律方法 本题已知y 与x 是线性相关关系,所以可求出回归方程进行估计和预测.否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.例5.(2022·陕西·西安中学高二期中(理))偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差(实际成绩-平均分=偏差).在某次考试成绩统计中,某老师为了对学生数学偏差x (单位:分)与物理偏差y (单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:(1)若x 与y 之间具有线性相关关系,求y 关于x 的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.(下面是参考数据和参考公式)()()()()()()()()()818222222222120 6.515 3.513 3.53 1.520.550.510 2.518 3.532420151332510181256i ii ii x yx===⨯+⨯+⨯+⨯+⨯+-⨯-+-⨯-+-⨯-==+++++-+-+-=∑∑,回归直线方程为ˆˆˆy bx a =+,其中()()()1122211ˆˆˆnni i iii i nni ii i x y nxy x x y y b x nx x x ay bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑【答案】(1)11ˆ42yx =+ (2)94 【解析】 【分析】(1)根据最小二乘法即可求出y 关于x 的线性回归方程;(2)设该同学的物理成绩为ω,则物理偏差为91.5ω-,数学偏差为8,根据回归方程可知,1191.5842ω-=⨯+,即可解出.(1)由题意可得,20151332(5)(10)(18)582x +++++-+-+-==,()()()6.5 3.5 3.5 1.50.50.5 2.5 3.5988y +++++-+-+-==, 1222159324ˆ81285412568()2ni ii nii x y nxybxnx ==--⨯⨯===-⨯-∑∑,所以9151ˆˆ8422a y bx =-=-⨯=,故线性回归方程为11ˆ42yx =+. (2)由题意,设该同学的物理成绩为ω,则物理偏差为:91.5ω-. 而数学偏差为128-120=8,∴1191.5842ω-=⨯+,解得94ω=, 所以,可以预测这位同学的物理成绩为94.例6.(2022·广东揭阳·高二期末)从2018年1月1日起,广东、等18个保监局所辖地区将纳入商业车险改革试点范围,其中最大的变化是上一年的出险次数决定了下一年的保费倍率,具体关系如下表:有评估机构从以往购买了车险的车辆中随机抽取1000 辆调查,得到一年中出险次数的频数分布如下(并用相应频率估计车辆每年出险次数的概率):(1)求某车在两年中出险次数不超过2次的概率;(2)经验表明新车商业车险保费与购车价格有较强的线性相关关系,估计其回归直线方程为:1201600y x =+.(其中x (万元)表示购车价格,y (元)表示商业车险保费).李先生2016 年1月购买一辆价值20万元的新车.根据以上信息,试估计该车辆在2017 年1月续保时应缴交的保费,并分析车险新政是否总体上减轻了车主负担.(假设车辆下一年与上一年都购买相同的商业车险产品进行续保) 【答案】(1)0.8744;(2)3846元,减轻了车主负担. 【解析】 【分析】(1)利用互斥事件的概率公式列式计算即得;(2)求出下一年车险保费倍率X 的分布列,并求出期望,即可得出车主下一年的保费,并根据期望是否大于1得出结论. 【详解】(1)设某车在两年中出险次数为N , 则(2)(0)(1)(2)P N P N P N P N ≤==+=+=5005005003805001003803802210001000100010001000100010001000=⋅+⋅⋅+⋅⋅+⋅0.8744=, 所以某车在两年中出险次数不超过2次的概率为0.8744; (2)设该车辆2017 年的保费倍率为X ,则X 为随机变量,X 的取值为0.85 ,1,1.25 ,1.5 ,1.75 , 2, X 的分布列为:下一年保费倍率X 的期望为:()0.850.510.38 1.250.1 1.50.015 1.750.00420.0010.9615+E X =⨯⨯+⨯+⨯+⨯+⨯=,该车辆估计2017年应缴保费为:()1202016000.96153846⨯+⨯=元, 因0.96151<,则车险新政总体上减轻了车主负担.题型三 线性回归分析例7.(2022·山东·日照青山学校高二期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下,用两种模型①y bx a =+;②y a =分别进行拟合,得到相应的回归方程1ˆ10.7 3.4yx =+,2ˆ22.8y =,进行残差分析得到如表所示的残差值及一些统计量的值:(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.(参考公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆay bx =-) 【答案】(1)该选模型①,理由见解析 (2)111y x =+ 【解析】 【分析】(1)求出两模型的残差值的绝对值之和进行比较即可,(2)先剔除异常数据,然后利用回归方程的公式结合已知数据进行计算即可 (1)应该选择模型①模型①的残差值的绝对值之和为1.1+2.8+7.5+1.2+1.9+0.4=14.9 模型②的残差值的绝对值之和为0.3+5.4+4.3+3.2+1.6+3.8=18.6. ∵14.9<18.6,∴模型①的拟合效果较好,应该选模型①.(2)剔除异常数据,即剔除第3天的数据后,得()1 3.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.2ˆ11825 3.6 3.617.25i ii ii x y xybxx ==--⨯⨯====-⨯⨯-∑∑, ˆˆ40.611 3.61ay bx =-=-⨯=. ∴y 关于x 的回归方程为111y x =+.规律方法 (1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.(2)刻画回归效果的三种方法①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适. ②残差平方和法:残差平方和∑ni =1 (y i -y ^i )2越小,模型的拟合效果越好. ③决定系数法:R 2=1-∑ni =1(y i -y ^i )2∑ni =1 (y i -y -)2越接近1,表明回归的效果越好. 例8.(2022·河南·南阳中学高三阶段练习(文))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附: 刻画回归效果的相关指数()()22121ˆ1niii nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-4.1≈ 【答案】(1)对A 型材料进行应用改造的投入为17亿元时的直接收益为72.93(亿元); (2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据模型和相关系数公式计算比较即可,然后将x =17代入较好的模型即可预测直接收益;(2)根据回归方程过样本中心点(,x y )求出ˆa,再令x =20算出预测的直接收益,即可算出投入20亿元时的总收益,与(1)中的投入17亿元的直接收益比较即可. (1)对于模型①,对应的15222740485460=387y ++++++=,故对应的()772221171750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为21.314.472.9ˆ3y=≈(亿元).另解:本题也可以根据相关系数的公式,直接比较79.13和20.2的大小,从而说明模型②拟合精度更高、更可靠. (2) 当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.例9.(2022·陕西·高新一中高三阶段练习(理))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造.根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+.(1)根据表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益; (2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好 4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)2221R R >,模型②拟合精度更高、更可靠,收益为72.93;(2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据题意求得()1221i i y y =-∑,再根据2R 的计算公式,即可分别求得2212,R R ,则可判断不同模型的拟合度;(2)根据题意,求得回归直线方程,即可代值计算,求得预测值. (1)对于模型①,对应的15222740485460387y ++++++==,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ21.314.472.93y=≈. (2) 当17x >时, 后五组的212223242568.56867.5666523,6755x y ++++++++====,由最小二乘法可得67(0.7)238ˆ 3.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1574.172.93-⨯++=>,故投入17亿元比投入20亿元时收益小.题型四 残差分析与相关指数的应用例10.(2022·河北·藁城新冀明中学高二阶段练习)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和; 【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件; (3)各组残差见解析,残差平方和为3.8182. 【解析】 【分析】(1)根据表中数据描点即可求解;(2)根据表中数据,求出x ,y ,612i i x =∑,61i i i x y =∑,代入公式求出线性回归方程的系数ˆb,进而求出ˆa即可得回归直线方程; (3)根据残差的定义及残差平方和公式即可求解. (1)解:散点图如下:(2) 解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818ii i y y=--+++--==++∑. 规律方法 (1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.例11.(2022·河北·大名县第一中学高二阶段练习)随着中美贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.华为技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x (亿元)与科技升级直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①:ˆ 4.111.8yx =+;模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①、②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对“麒麟”手机芯片科技升级的投入为17亿元时的直接收益. (附:刻画回归效果的相关指数,()()22121ˆ1niii nii y yR y y ==-=--∑∑ 4.1≈)(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.附:用最小二乘法求线性回归方程ˆˆˆybx a =+的系数:()()()1122211ˆˆˆ,nni iii i i nniii i x ynx yxx y y bay bx xnx xx ====-⋅--===---∑∑∑∑ 【答案】(1)回归模型②,72.93(亿元);(2)投入20亿元时,公司的实际收益更大. 【解析】 【分析】(1)根据表中数据比较21R 和22R 可判断拟合效果,进而求出预测值; (2)求出,x y ,进而求出a ,得出回归方程得求出结果. 【详解】解:(1)由表格中的数据,182.479.2>,∴()()772211182.479.2iii i y y y y ==>--∑∑,∴()()772211182.479.211iit t y y y y ==-<---∑∑可见模型①的相关指数21R 小于模型②的相关指数22R . 所以回归模型②的拟合效果更好.所以当17x =亿元时,科技升级直接收益的预测值为ˆ21.314.421.3 4.114.472.93y=≈⨯-=(亿元). (2)当17x >时,由已知可得2122232425235x ++++==,68.56867.5666667.25y ++++==.∴0.767.20.72383.3a y x =+=+⨯=.∴当17x >时,y 与x 满足的线性回归方程为ˆ0.783.3yx =-+. 当20x时,科技升级直接收益的预测值为ˆ0.72083.369.3y=-⨯+=亿元.当20>亿元,x亿元时,实际收益的预测值为69.3574.3+=亿元72.93∴技术升级投入20亿元时,公司的实际收益更大.题型五非线性回归分析例12.(2022·全国·模拟预测)某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:根据以上数据,绘制了如图所示的散点图.(1)根据散点图,判断在推广期内,y a bx=+与x=⋅(c,d均为大于零的常数)哪一个y c d适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及题干中表格内的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:其中lg i i v y =,7117i i v v ==∑.参考公式:对于一组数据)()()(1122,,,,,,n n u v u v u v ⋅⋅⋅,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为1221ˆni i i nii uv nuvunuβ==-=-∑∑,ˆav u β=-. (3)推广期结束后,为更好地服务乘客,车队随机调查了100人次的乘车支付方式,得到如下结果: 已知该线路公交车票价2元,使用现金支付的乘客无优惠,使用公交卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据调查结果发现:使用扫码支付的乘客中有5人次乘客享受7折优惠,有10人次乘客享受8折优惠,有15人次乘客享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据所给数据,以事件发生的频率作为相应事件发生的概率,在不考虑其他因素的条件下,按照上述收费标准,试估计该车队一辆车一年的总收入.【答案】(1)x y c d =⋅适宜(2))(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347(3)199200元 【解析】 【分析】(1)根据散点图即可判断回归方程类型;(2)根据题意中的数据,利用最小二乘法求出ˆb ,进而求出ˆa,即可得出回归方程,令8x =求解即可;(3)根据题意分别求出享受7折优惠、8折优惠、9折优惠的收入,进而加起来即可. (1)根据散点图判断,x y c d =⋅适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型. (2)∵x y c d =⋅,∴两边同时取常用对数,得lg lg lg y c x d =+. 设lg a c =,lg b d =,则v a bx =+.∵4x =, 1.54v =,721140i i x ==∑,∴7172221750.1274 1.547ˆ0.2514074287i i i i i x v xvbx x==--⨯⨯====-⨯-∑∑,ˆˆ0.54av bx =-=,∴ˆ0.540.25v x =+,∴)(0.540.250.25ˆ10 3.4710xx y +==⨯,把8x =代入上式,得0.540.258 2.5420.54ˆ10101010347y+⨯===⨯=, ∴y 关于x 的回归方程为)(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347. (3)由题意,可知一个月中使用现金的乘客有1000人次,共收入100022000⨯=(元);使用公交卡的乘客有6000人次,共收入6000 1.69600⨯=(元).使用扫码支付的乘客有3000人次,其中,享受7折优惠的有500人次,共收入500 1.4700⨯=(元),享受8折优惠的有1000人次,共收入1000 1.61600⨯=(元),享受9折优惠的有1500人次,共收入1500 1.82700⨯=(元),故该车队一辆车一个月的收入为200096007001600270016600++++=(元).∴估计该车队一辆车一年的收入为1660012199200⨯=(元).规律方法求非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性回归方程.例13.(2022·黑龙江·哈尔滨市第六中学校高二期末)区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,居世界前列现收集我国近5年区块链企业总数量相关数据,如表注:参考数据5174.691i i y ==∑,51312.761i i i x y ==∑,5110.980i i z ==∑,5140.457i i i x z ==∑(其中ln z y =).附:样本()(),1,2,,i i x y i n =⋅⋅⋅的最小二乘法估计公式为1221ni ii nii x ynxy b xnx==-=-∑∑,a y bx =-(1)根据表中数据判断,y a bx =+与e dx y c =(其中e 2.71828=⋅⋅⋅,为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由)(2)根据(1)的结果,求y 关于x 的回归方程;(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”,已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,则求甲公司获得“优胜公司”的概率. 【答案】(1)dx y ce = (2)0.75170.0591x y e -= (3)310【解析】【分析】(1)根据表中数据判断y 关于x 的回归方程为非线性方程;(2)令ln z y =,将y 关于x 的非线性关系,转化为z 关于x 的线性关系,利用最小二乘法求解;(3)利用相互独立事件的概率相乘求求解; (1)根据表中数据e dx y c =适宜预测未来几年我国区块链企业总数量. (2)e dx y c =,ln ln y dx c ∴=+,令ln z y =,则ln z dx c =+,5110.980 2.19655ii zz ====∑,5112345355ii xx =++++===∑由公式计算可知122140.457310.980.7517,5545ni ii n i i x znxzb x nx==-⨯==--=-∑∑ˆln 2.1960.751730.0591c z dx =-=-⨯=- ln 0.75170.0591y x ∴=-,即ln 0.75170.0591y x ∴=-,即0.75170.0591x y e -=所以y 关于x 的回归方程为0.75170.0591x y e -= (3)设甲公司获得“优胜公司”为A 事件. 则11123112113232352253210()P A ⨯+⨯⨯⨯+⨯⨯⨯==所以甲公司获得“优胜公司”的概率为310.例14.(2022·湖南·长沙一中高三阶段练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1-9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:现用by ax=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为23,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1iitx =)。
回归分析练习试题和参考答案解析
1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归方程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
α=)。
(5)检验回归方程线性关系的显著性(0.05(6)如果某地区的人均GDP为5000元,预测其人均消费水平。
(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
解:(1)可能存在线性关系。
(2)相关系数:系数a模型非标准化系数标准系数t Sig.相关性B标准误差试用版零阶偏部分1(常量).003人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平有很强的线性关系。
(3)回归方程:734.6930.309y x=+系数a模型非标准化系数标准系数t Sig.相关性回归系数的含义:人均GDP没增加1元,人均消费增加元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)人均GDP(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型R R 方调整 R 方标准估计的误差1.998a.996.996a. 预测变量: (常量), 人均GDP。
人均GDP对人均消费的影响达到%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
模型摘要模型R R 方调整的 R 方估计的标准差1.998(a)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(5)F检验:Anova b模型平方和df均方F Sig.1回归.6801.680.000a 残差5总计.7146a. 预测变量: (常量), 人均GDP。
多元线性回归模型习题及答案
多元线性回归模型习题及答案TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8-多元线性回归模型一、单项选择题1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为,则调整后的多重决定系数为( D )2.下列样本模型中,哪一个模型通常是无效的(B )A. i C (消费)=500+i I (收入)B. d i Q (商品需求)=10+i I (收入)+i P (价格)C. s i Q (商品供给)=20+i P (价格)D. iY (产出量)=0.6i L (劳动)0.4i K (资本)3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显着性水平上对1b 的显着性作t 检验,则1b 显着地不等于零的条件是其统计量t 大于等于( C )A. )30(05.0tB. )28(025.0tC. )27(025.0tD. )28,1(025.0F4.模型t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B )A.x 关于y 的弹性B. y 关于x 的弹性C. x 关于y 的边际倾向D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( C )A.异方差性B.序列相关C.多重共线性D.高拟合优度6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...)t H b i k ==时,所用的统计量 服从( C )(n-k+1) (n-k-2)(n-k-1) (n-k+2)7. 调整的判定系数 与多重判定系数 之间有如下关系( D ) A.2211n R R n k -=-- B. 22111n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。
线性回归分析练习题
§1回归剖析一.基本过关1.下列变量之间的关系是函数关系的是( )A.已知二次函数y=ax2+bx+c,个中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时光和果树亩产量C.降雪量和交通变乱产生率D.每亩施用肥料量和食粮产量2.在以下四个散点图中,个中实用于作线性回归的散点图为( )A.①②B.①③C.②③D.③④3.下列变量中,属于负相干的是( )A.收入增长,储蓄额增长B.产量增长,临盆费用增长C.收入增长,支出增长D.价钱降低,花费增长4.已知对一组不雅察值(x i,y i)作出散点图后肯定具有线性相干关系,若对于y =bx+a,求得b=0.51,x=61.75,y=38.14,则线性回归方程为A.yx+6.65 B.yxC.yx+42.30 D.yx5.对于回归剖析,下列说法错误的是( )A.在回归剖析中,变量间的关系若长短肯定关系,那么因变量不克不及由自变量独一肯定B.线性相干系数可所以正的,也可所以负的C.回归剖析中,假如r2=1,解释x与y之间完整相干D.样底细关系数r∈(-1,1)6.下表是x 和y 之间的一组数据,则y 关于x 的回归方程必过( )A.点B .点(1.5,4)C .点D .点(2.5,5)7.若线性回归方程中的回归系数b =0,则相干系数r =________. 二.才能晋升8.若施化肥量x (kg)与小麦产量y (kg)之间的线性回归方程为y =250+4x ,当施化肥量为50 kg 时,估计小麦产量为________ kg.9.某车间为了划定工时定额,需肯定加工零件所花费的时光,为此做了4次实验,得到的数据如下:若加工时光y (1)求加工时光与零件个数的线性回归方程; (2)试预告加工10个零件须要的时光.10.在一段时光内,分5次测得某种商品的价钱x (万元)和需求量y (t)之间的一组数据为:已知∑5i =1x i y i =62,∑i =1x 2i =16.6. (1)画出散点图;(2)求出y 对x 的线性回归方程;(3)假如价钱定为1.9万元,猜测需求量大约是若干?(准确到0.01 t). 11.某运发动练习次数与活动成绩之间的数据关系如下:(1)(2)求出回归方程;(3)盘算相干系数并进行相干性磨练;(4)试猜测该运发动练习47次及55次的成绩.答案1.7.0 8.yx 9.45010.解 (1)由表中数据,应用科学盘算器得x =2+3+4+54=3.5,y =2.5+3+4+4.54=3.5,∑4i =1x i y i =52.5,∑4i =1x 2i =54, b =∑4i =1xiyi -4x y ∑4i =1x2i -4x 2=52.5-4××3.554-4×3.52=0.7,a =y -b x =1.05,是以,所求的线性回归方程为yx +1.05.(2)将x =10代入线性回归方程,得y ×10+1.05=8.05(小时),即加工10个零件的预告时光为8.05小时. 11.解 (1)散点图如下图所示:(2)因为x =15×9=1.8,y =15×37=7.4,∑5i =1x i y i =62,∑5i =1x 2i =16.6,所以b =∑5i =1xiyi -5x y ∑5i =1x2i -5x 2=62-5××7.416.6-5×1.82=-11.5,a =y -b x ×1.8=28.1,故y 对x 的线性回归方程为yx . (3)y ×1.9=6.25(t).所以,假如价钱定为1.9万元,则需求量大约是6.25 t.12.解 (1)作出该运发动练习次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相干关系. (2)列表盘算:由上表可求得x =39.25,y =40.875, ∑8i =1x 2i =12 656,∑8i =1y 2i =13 731,∑8i =1x i y i =13 180, ∴b =∑8i =1xiyi -8x y ∑8i =1x2i -8x 2≈1.041 5,a =y -b x =-0.003 88,∴线性回归方程为y =1.041 5x -0.003 88.(3)盘算相干系数r =0.992 7,是以运发动的成绩和练习次数两个变量有较强的相干关系.(4)由上述剖析可知,我们可用线性回归方程y =1.041 5x -0.003 88作为该运发动成绩的预告值.将x =47和x =55分离代入该方程可得y =49和y =57.故猜测该运发动练习47次和55次的成绩分离为49和57. 13.解 ∵s x =lxyn ,s y =lxyn, ∴lxy n=r lxyn·lyy n ××15.2=57.76.∴β1=lxy n lxy n=57.767.62=1, β0=y -β1x =72-1×172=-100.故由身高估量平均体重的回归方程为y =x -100. 由x ,y 地位的对称性,得b =lxyn lxy n =57.7615.22=0.25,∴a =x -b y ×72=154.故由体重估量平均身高的回归方程为xy +154.可线性化的回归剖析一.基本过关1.某商品发卖量y(件)与发卖价钱x(元/件)负相干,则其线性回归方程可能是()A.y=-10x+200 B.y=10x+200C.y=-10x-200 D.y=10x-200 2.在线性回归方程y=a+bx中,回归系数b暗示()A.当x=0时,y的平均值 B.x变动一个单位时,y 的现实变动量C.y变动一个单位时,x的平均变动量 D.x变动一个单位时,y 的平均变动量3.对于指数曲线y=a e bx,令u=ln y,c=ln a,经由非线性化回归剖析之后,可以转化成的情势为()A.u=c+bx B.u=b+cx C.y=b+cx D.y=c+bx4.下列说法错误的是()A.当变量之间的相干关系不是线性相干关系时,也能直接用线性回归方程描写它们之间的相干关系B.把非线性回归化为线性回归为我们解决问题供给一种办法C.当变量之间的相干关系不是线性相干关系时,也能描写变量之间的相干关系D.当变量之间的相干关系不是线性相干关系时,可以经由过程恰当的变换使其转换为线性关系,将问题化为线性回归剖析问题来解决5.每一吨铸铁成本y c(元)与铸件废品率x%树立的回归方程y c=56+8x,下列说法准确的是 ()A.废品率每增长1%,成本每吨增长64元 B.废品率每增长1%,成本每吨增长8%C.废品率每增长1%,成本每吨增长8元 D.假如废品率增长1%,则每吨成本为56元6.为了考核两个变量x和y之间的线性相干性,甲.乙两个同窗各自自力地做10次和15次实验,并且应用线性回归办法,求得回归直线分离为l1和l2.已知在两小我的实验中发明对变量x的不雅测数据的平均值正好相等,都为s,对变量y的不雅测数据的平均值也正好相等,都为t.那么下列说法准确的是 ()A.直线l1和l2有交点(s,t)B.直线l1和l2订交,但是交点未必是点(s,t) C.直线l1和l2因为斜率相等,所以肯定平行 D.直线l1和l2肯定重合二.才能晋升7.研讨人员对10个家庭的儿童问题行动程度(X)及其母亲的不耐烦程度(Y)进行了评价成果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.下列哪个方程可以较恰当的拟合()A.y=0.771 1x+.y=36.958ln x-C.y=1.177 8x1.014 5D.y=20.924e0.019 3x8.已知x,y之间的一组数据如下表:则y与x.9.已知线性回归方程为y=x-,则x=25时,y的估量值为________.10.在一次抽样查询拜访中测得样本的5个样本点,数值如下表:(1)树立y与x(211.某地区六年来轻工业产品利润总额y 与年次x 的实验数据如下表所示:由经验知ab xe 0.个中a .b 均为正数,求y 关于x 的回归方程.(保存三位有用数字)三.探讨与拓展12.某市肆各个时代的商品流畅率y (%)和商品零售额x (万元)材料如下:散点图显示出x 都证实,流畅率y 决议于商品的零售额x ,表现着经营范围效益,假定它们之间消失关系式:y =a +bx .试依据上表数据,求出a 与b 的估量值,并估量商品零售额为30万元时的商品流畅率.答案1. 8.10.解 画出散点图如图(1)所示,不雅察可知y 与x 近似是反比例函数关系.设y =k x (k ≠0),令t =1x ,则y =kt .可得到y 关于t 的数据如下表:画出散点图如图(2),是以可应用线性回归模子进行拟合,易得: b =∑5i =1tiyi -5t y ∑5i =1t2i -5t 2≈4.134 4,a =y -b t ≈0.791 7,所以y =4.134 4t +0.791 7,所以y 与x 的回归方程是y =4.134 4x +0.791 7.11.解 对y =ab xe 0双方取对数,得ln y =ln a e 0+x ln b ,令z =ln y , 则z 与x 的数据如下表:由z =ln a e 0+a e 0≈, 即z =+0.047 7x ,所以y =×x.12.解 设u =1x,则y ≈a +bu ,得下表数据:进而可得n =10,u ≈0.060 4,y =, ∑i =110u2i -10u 2≈0.004 557 3, ∑i =110u i y i -10u y ≈0.256 35,b ≈0.256 350.004 557 3≈,a =y -b ·u ≈-0.187 5,所求的回归方程为y =-0.187 5+56.25x.当x =30时,y =1.687 5,即商品零售额为30万元时,商品流畅率为1.687 5%.。
线性回归分析经典例题
1. “团购”已经渗透到我们每个人的生活,这离不开快递行业的发展,下表是2013-2017年全国快递业务量(x 亿件:精确到0.1)及其增长速度(y %)的数据(Ⅰ)试计算2012年的快递业务量;(Ⅱ)分别将2013年,2014年,…,2017年记成年的序号t :1,2,3,4,5;现已知y 与t 具有线性相关关系,试建立y 关于t 的回归直线方程a x b yˆˆˆ+=; (Ⅲ)根据(Ⅱ)问中所建立的回归直线方程,估算2019年的快递业务量附:回归直线的斜率和截距地最小二乘法估计公式分别为:∑∑==--=ni ini ii x n xy x n yx b1221ˆ, x b y aˆˆ-=2.某水果种植户对某种水果进行网上销售,为了合理定价,现将该水果按事先拟定的价格进行试销,得到如下数据:单价元 7 8 9 11 12 13 销量120118112110108104已知销量与单价之间存在线性相关关系求y 关于x 的线性回归方程; 若在表格中的6种单价中任选3种单价作进一步分析,求销量恰在区间内的单价种数的分布列和期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:, .3. (2018年全国二卷)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.4.(2014年全国二卷) 某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.93.33.64.44.85.25.9(Ⅰ)求y 关于t 的线性回归方程;(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:()()()121niii ni i t t y y b t t ∧==--=-∑∑,ˆˆay bt =-5(2019 2卷)18.11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10∶10平后,甲先发球,两人又打了X 个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.。
回归分析练习题(有答案)
回归分析练习题(有答案)1.1回归分析的基本思想及其初步应用一、选择题1.某同学由某与均值为2,数据y之间的一组数据求得两个变量间的线性回归方程为yb某a,已知:数据某的平y的平均值为3,则()A.回归直线必过点(2,3)B.回归直线一定不过点(2,3)C.点(2,3)在回归直线上方D.点(2,3)在回归直线下方2.在一次试验中,测得(某,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y与某之间的回归直线方程为()A.y某1B.y2某1某2C.yD.y某13.在对两个变量某,y进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(某i、,2,i1yi),…,n;③求线性回归方程;④求未知参数;⑤根据所搜集的数据绘制散点图如果根据可行性要求能够作出变量某,y具有线性相关结论,则在下列操作中正确的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①4.下列说法中正确的是()A.任何两个变量都具有相关关系B.人的知识与其年龄具有相关关系C.散点图中的各点是分散的没有规律D.根据散点图求得的回归直线方程都是有意义的5.给出下列结论:(1)在回归分析中,可用指数系数R的值判断模型的拟合效果,R 越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.以上结论中,正确的有()个.A.1B.2C.3D.46.已知直线回归方程为A.7.下面的各图中,散点图与相关系数r不符合的是()22y21.5某,则变量某增加一个单位时()D.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位y平均减少2个单位8.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为据此可以预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83cmB.身高超过146.00cmC.身高低于145.00cmD.身高在145.83cm左右9.在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在某轴上,解释变量在7.19某73.93,yy轴上(B)解释变量在某轴上,预报变量在y轴上(C)可以选择两个变量中任意一个变量在某轴上(D)可以选择两个变量中任意一个变量在10.两个变量22y轴上y与某的回归模型中,通常用R2来刻画回归的效果,则正确的叙述是()22A.R越小,残差平方和小B.R越大,残差平方和大C.R于残差平方和无关D.R越小,残差平方和大11.两个变量y与某的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果2222最好的模型是()A.模型1的相关指数R为0.98B.模型2的相关指数R为0.80C.模型3的相关指数R为0.50D.模型4的相关指数R为0.2512.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R213.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为y6090某,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元14.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②15.已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程为()A.y1.23某4B.y1.23某5C.y1.23某0.08D.y0.08某1.23二、填空题16.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R的值分别约为0.96和0.85,则拟合效果好的模型是.17.在回归分析中残差的计算公式为.18.线性回归模型yb某ae(a和b为模型的未知参数)中,e称为.19.若一组观测值(某1,y1)(某2,y2)…(某n,yn)之间满足yi=b某i+a+ei(i=1、2.…n)若ei恒为0,则R为_____2B.①②③C.①②④D.①②③④2三、解答题20.调查某市出租车使用年限某和该年支出维修费用y(万元),得到数据如下:n(某i)(yi))(2)由(1)中结论预测第10年所支出的维修费用.(bi1 (某i)2i1a21.以下是某地搜集到的新房屋的销售价格y和房屋的面积某的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m时的销售价格.(4)求第2个点的残差。
一元线性回归模型典型例题分析
第二章 一元线性回归模型典型例题分析例1、令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数.生育率对教育年数的简单回归模型为μββ++=educ kids 10(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释.例2.已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年).随机扰动项μ的分布未知,其他所有假设都满足。
如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化?例3.对于人均存款与人均收入之间的关系式t t t Y S μβα++=使用美国36年的年度数据得如下估计模型,括号内为标准差:)011.0()105.151(067.0105.384ˆtt Y S +=2R =0.538 023.199ˆ=σ(1)β的经济解释是什么?(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗? (4)检验统计值?例4.下列方程哪些是正确的?哪些是错误的?为什么?⑴ y x t n t t =+=αβ12,,, ⑵ y x t n t t t =++=αβμ12,,,⑶ y x t n t t t=++= ,,,αβμ12⑷ ,,,y x t n t t t =++=αβμ12 ⑸ y x t n t t =+= ,,,αβ12 ⑹ ,,,y x t n t t =+=αβ12⑺ y x t n t t t =++= ,,,αβμ12 ⑻ ,,,y x t n t tt =++=αβμ12其中带“^”者表示“估计值”.例5.对于过原点回归模型i i i u X Y +=1β ,试证明∑=∧221)(iu XVar σβ例6、对没有截距项的一元回归模型i i i X Y μβ+=1称之为过原点回归(regression through the origin )。
回归分析练习题
1. 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。
要检验x 与y 之间的线性关系是否显著,即检验假设:01:0H β=。
(1)线性关系检验的统计量F 值是多少? (2)给定显著性水平a =0.05,F a 是多少? (3)是拒绝原假设还是不拒绝原假设?(4)假定x 与y 之间是负相关,计算相关系数r 。
(5)检验x 与y 之间的线性关系是否显著?解:(1)SSR 的自由度为k=1;SSE 的自由度为n-k-1=18;因此:F=1SSR k SSE n k --=6014018=27 (2)()1,18F α=()0.051,18F =4.41 (3)拒绝原假设,线性关系显著。
(4),由于是负相关,因此r=-0.7746(5)从F 检验看线性关系显著。
2. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:(1)完成上面的方差分析表。
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显著性(a=0.05)。
(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。
(3)r=0.9877。
(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。
(5)回归系数的检验:p=2.17E—09<α,回归系数不等于0,显著。
回归直线的检验:p=2.17E—09<α,回归直线显著。
3. 根据两个自变量得到的多元回归方程为12ˆ18.4 2.014.74yx x =-++,并且已知n =10,SST =6 724.125,SSR =6 216.375,1ˆ0.0813s β=,2ˆs β=0.056 7。
要求:(1)在a=0.05的显著性水平下,12,x x 与y 的线性关系是否显著? (2)在a =0.05的显著性水平下,1β是否显著?(3)在a =0.05的显著性水平下,2β是否显著?解(1)回归方程的显著性检验:假设:H 0:1β=2β=0 H 1:1β,2β不全等于0 SSE=SST-SSR=6 724.125-6 216.375=507.75 F=1SSR p SSE n p --=6724.1252507.751021--=42.85()2,7F α=4.74,F>()2,7F α,认为线性关系显著。
多元线性回归模型(习题与解答)
多元线性回归模型(习题与解答)第三章多元线性回归模型一、习题(一)基本知识类题型3-1.解释下列概念:1)多元线性回归2)虚变量3)正规方程组4)无偏性5)一致性6)参数估计量的置信区间7)被解释变量预测值的置信区间8)受约束回归9)无约束回归10)参数稳定性检验3-2.观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?1)i i i X Yεββ++=3102)i i i X Yεββ++=log103)i i i X Yεββ++=log log104)i i i X Yεβββ++=)(2105)i ii X Yεββ+=106)i i i X Yεββ+−+=)1(1107)i i i i X X Yεβββ+++=10221103-3.多元线性回归模型与一元线性回归模型有哪些区别?3-4.为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么?3-5.多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?3-6.请说明区间估计的含义。
(二)基本证明与问答类题型3-7.什么是正规方程组?分别用非矩阵形式和矩阵形式写出模型:i ki k i i i u x x x y+++++=ββββL22110,n i,,2,1L =的正规方程组,及其推导过程。
3-8.对于多元线性回归模型,证明:(1)∑=0i e(2)0)ˆˆˆ(ˆ110=+++=∑∑iki k i i i e x x e yβββL3-9.为什么从计量经济学模型得到的预测值不是一个确定的值?预测值的置信区间和置信度的含义是什么?在相同的置信度下如何才能缩小置信区间?为什么?3-10.在多元线性回归分析中,t检验与F检验有何不同?在一元线性回归分析中二者是否有等价的作用?3-11.设有模型:u x x y+++=22110βββ,试在下列条件下:(1)121=+ββ(2)21ββ=分别求出1β和2β的最小二乘估计量。
多元线性回归实习实际例题分析
多元线性回归分析实习线性回归过程(Linear Regression)可用于分析一个或多个自变量与一个因变量之间的线性数量关系,并可进行回归诊断分析。
●[例题3.1]某地29名13岁男童身高x1(cm),体重x2(kg),肺活量y(L)的实测值数据见表3.1,试建立肺活量与身高、体重的回归关系。
[ 操作过程]①[ 数据格式] 见数据文件< 多元线性回归例题.sav >该数据库有4列29行,即4个变量、29个记录(Observation),每个变量占1列,每个记录占1行,该数据格式为一般多元分析的数据格式。
②[ 过程]单击后可弹出线性回归对话框。
该对话框内有诸多选项,现分别介绍。
③[ 选项]◆因变量。
只能选入1个因变量,本例选入变量“肺活量”。
◆自变量。
可以是1个或多个,本例选入变量“身高、体重”。
◆当选择不同组合的自变量进行回归分析时,可保存每次选择的自变量,用按钮和按钮可分别向前、向后翻找各种自变量的组合。
◆选择回归模型拟合的分析方法,有5种可供选择。
Enter 强迫引入法,即一般回归分析,所选自变量全部进入方程,为系统默认方式。
Stepwise 逐步回归法,加入有显著性意义的变量和剔除无显著性意义的变量,直到所建立的方程式中不再有可加入和可剔除的变量为止。
Remove 强迫剔除法。
根据设定的条件剔除自变量。
Backward向后逐步法。
所选自变量全部进入方程,根据Options对话框中设定的标准在计算过程中逐个剔除变量,直到所建立的方程式中不再含有可剔除的变量为止。
Forward:向前逐步法。
根据Options对话框中设定的标准在计算过程中逐个加入单个变量,直到所建立的方程式中不再有可加入的变量为止。
◆选择符合某变量条件的观察单位进行分析,每次只能选入1位范围,有6种方式供选择,在Value框内输入设定值。
equal to 等于设定值。
not equal to不等于设定值。
less than小于设定值。
第11章 多重线性回归分析思考与练习参考答案
第11章多重线性回归分析思考与练习参考答案一、最佳选择题1.逐步回归分析中,若增加自变量的个数,则(D)。
A.回归平方和与残差平方和均增大B.回归平方和与残差平方和均减小C.总平方和与回归平方和均增大D.回归平方和增大,残差平方和减小E.总平方和与回归平方和均减小2.下面关于自变量筛选的统计学标准中错误的是(E)。
A.残差平方和(SS残差)缩小B.确定系数(R)增大2C.残差的均方(MS残差)缩小D.调整确定系数(Rad)增大2E.Cp统计量增大3.多重线性回归分析中,能直接反映自变量解释因变量变异百分比的指标为(C)。
A.复相关系数B.简单相关系数C.确定系数D.偏回归系数E.偏相关系数4.多重线性回归分析中的共线性是指(E)。
A.Y关于各个自变量的回归系数相同B.Y关于各个自变量的回归系数与截距都相同C.Y变量与各个自变量的相关系数相同D.Y与自变量间有较高的复相关E.自变量间有较高的相关性5.多重线性回归分析中,若对某一自变量的值加上一个不为零的常数K,则有(D)。
A.截距和该偏回归系数值均不变B.该偏回归系数值为原有偏回归系数值的K 倍C.该偏回归系数值会改变,但无规律D.截距改变,但所有偏回归系数值均不改变E.所有偏回归系数值均不会改变二、思考题1.多重线性回归分析的用途有哪些?答:多重线性回归在生物医学研究中有广泛的应用,归纳起来,可以包括以下几个方面:定量地建立一个反应变量与多个解释变量之间的线性关系,筛选危险因素,通过较易测量的变量估计不易测量的变量,通过解释变量预测反应变量,通过反应变量控制解释变量。
2.多重线性回归模型中偏回归系数的含义是什么?答:偏回归系数的含义是:在控制其他自变量的水平不变的情况下,该自变量每改变一个单位,反应变量平均改变的单位数。
3.请解释用于多重线性回归参数估计的最小二乘法的含义。
答:最小二乘法的含义是:残差的平方和达到最小。
4.如何判断和处理多重共线性?答:如果自变量之间存在较强的相关,则存在多重共线性。
回归分析习题及答案.doc
1.1回归分析的基本思想及其初步应用例题:1.在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在X轴上,预报变量在y轴上(0可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上解析:通常把自变量X称为解析变量,因变量y称为预报变量.选B2,若一组观测值(xi, yi) (x2, y2) ••- (x…, y n)之间满足 y-bxi+a+e;(i=l> 2. •••!!)若巳恒为0,则仁为_____________解析:e』亘为0,说明随机误差对方贡献为0.答案:1.3.假设关于某设备的使用年限x和所支出的维修费用y (万兀),有如下的统计资料:X 2 3 4 5 6y 22 38 55 65 70若由资料可知y对x呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?解:(1)列表如下:i 1 2 3 4 5X] 2 3 4 5 622 38 55 65 70时•44 114 220 325 420X; 4 9 16 25 36_ _ 5 5x = 4, y = 5,»;=9o, »,北=112.3z'=l z'=l5 ___况一5xy干旱,仃112.3-5x4x5 …c十正方= ------------- = ------------ -- = 1.23,S,厂2 90 —5x42小「- 5x<=|a = y -bx = 5-1.23x4 = 0.08线性回归方程为:y =bx + a = 1.23x + Q.QS ( 2 )当 x=10 时,y = 1.23x10 + 0.08 = 12.38 (万兀)即估计使用10年时维修费用是1238万元课后练习:1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7. 19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145. 83cm;B.身高在145. 83cm以上;C.身高在145. 83cm以下;D.身I W J在 145. 83cm 左右.2.两个变量y与x的回归模型中,分别选择了 4个不同模型,它们的相关指数人2如下,其中拟合效果最好的模型是()A.模型1的相关指数人2为0. 98B.模型2的相关指数R2为。
一元线性回归分析例题
SPSS一元线性回归分析例题(体检数据中的体重和肺活量的分析)某单位对12名女工进行体检,体检项目包括体重(kg)和肺活量(L),数据如下:X(体重:kg) 42.00 42.00 46.00 46.00 46.00 50.0050.00 50.00 52.00 52.00 58.00 58.00Y(肺活量:L) 2.55 2.20 2.75 2.40 2.80 2.813.41 3.10 3.46 2.85 3.50 3.00用x表示体重,y表示肺活量,建立数据文件。
利用一元线性回归分析描述其关系。
基本操作提示:Step 1 建立数据文件,并打开该数据文件。
Step 2 选择菜单Analyz e→Regressio n→Linear,打开主对话框。
在“Dependent”(因变量)列表框中选择变量“肺活量”,作为线性回归分析的被解释变量;在“Independent”(自变量)列表框中选择变量“体重”,作为解释变量。
Step 3 单击“Statistics”按钮,在打开的对话框中,依次选择“Estimates”(显示回归系数的估计值)、“Confidence intervals”、“Model fit”(模型拟合)、“Descriptives”、“Casewise diagnostic”(个案诊断)和“All Cases”选项。
选择完毕后,单击“Continue”按钮,返回主对话框。
Step 4 单击“Plots”(图形)按钮,在打开的主对话框中,选择“DEPENDENT”(因变量)作为y轴变量,“*ZPRED”(标准化预测值)作为x轴变量;并在“Standardized Residual Plots”(标准化残差图)中选择“Histogram”(直方图)和“Normal probabilityplot”(正态概率图,即P-P图)选项。
选择完毕后,单击“Continue”按钮,返回主对话框。
Step 5 单击“Save”(保存)按钮,在打开的主对话框中,在“Predicted Values”(预测值)选项区域中选择“Unstandardized”和“S. E. ofmean predictions”(预测值均数的标准误差)选项;“PredictionIntervals”(预测区间)选项区域中选择“Mean”和“Individual”选项;“Residuals”(残差)选项区域中选择“Unstandardized”选项。
线性回归分析练习题分析
§1回归分析1.1回归分析1.2相关系数一、基础过关1.下列变量之间的关系是函数关系的是() A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食产量2.在以下四个散点图中,其中适用于作线性回归的散点图为()A.①②B.①③C.②③D.③④3.下列变量中,属于负相关的是() A.收入增加,储蓄额增加B.产量增加,生产费用增加C.收入增加,支出增加D.价格下降,消费增加4.已知对一组观察值(x i,y i)作出散点图后确定具有线性相关关系,若对于y=bx+a,求得b=,x=,y=,则线性回归方程为()A.y=+B.y=+C.y=+D.y=+5.对于回归分析,下列说法错误的是() A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的C.回归分析中,如果r2=1,说明x与y之间完全相关D.样本相关系数r∈(-1,1)6.下表是x和y之间的一组数据,则y关于x的回归方程必过()A.点(2,3)C.点,4) D.点,5)7. 若线性回归方程中的回归系数b =0,则相关系数r =________. 二、能力提升8. 某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:若y 与x 9. 若施化肥量x (kg)与小麦产量y (kg)之间的线性回归方程为y =250+4x ,当施化肥量为50 kg 时,预计小麦产量为________ kg.10.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:若加工时间y (1)求加工时间与零件个数的线性回归方程; (2)试预报加工10个零件需要的时间.11.在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (t)之间的一组数据为:已知∑5i =1x i y i =62,∑5i =1x 2i =. (1)画出散点图;(2)求出y 对x 的线性回归方程;(3)如果价格定为万元,预测需求量大约是多少?(精确到 t). 12.某运动员训练次数与运动成绩之间的数据关系如下:(1)(2)求出回归方程;(3)计算相关系数并进行相关性检验;(4)试预测该运动员训练47次及55次的成绩. 三、探究与拓展13.从某地成年男子中随机抽取n 个人,测得平均身高为x =172 cm ,标准差为s x =7.6 cm ,平均体重y=72 kg ,标准差s y =15.2 kg ,相关系数r =l xyl xx l yy=,求由身高估计平均体重的回归方程y =β0+β1x ,以及由体重估计平均身高的回归方程x =a +by .答案1.A 7.0 =-+ 9.45010.解 (1)由表中数据,利用科学计算器得x =2+3+4+54=,y =错误!=, ∑4i =1x i y i =,∑4i =1x 2i =54, b =∑4i =1x i y i -4x y ∑4i =1x 2i -4x 2=错误!=, a =y -b x =,因此,所求的线性回归方程为y =+.(2)将x =10代入线性回归方程,得y =×10+=(小时),即加工10个零件的预报时间为小时. 11.解 (1)散点图如下图所示:(2)因为x =15×9=,y =15×37=,∑5i =1x i y i=62,∑5i =1x 2i =, 所以b =∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=错误!=-,a =y -b x =+×=,故y 对x 的线性回归方程为y =-. (3)y =-×=(t).所以,如果价格定为万元,则需求量大约是 t.12.解 (1)作出该运动员训练次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系. (2)列表计算:由上表可求得x =,y =, ∑8i =1x 2i =12 656,∑8i =1y 2i =13 731, ∑8i =1x i y i =13 180,∴b =∑8i =1x i y i -8x y ∑8i =1x 2i -8x 2≈ 5,a =y -b x =- 88, ∴线性回归方程为y = 5x - 88.(3)计算相关系数r = 7,因此运动员的成绩和训练次数两个变量有较强的相关关系. (4)由上述分析可知,我们可用线性回归方程y = 5x - 88作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y =49和y =57.故预测该运动员训练47次和55次的成绩分别为49和57. 13.解 ∵s x =l xyn,s y =l xy n, ∴l xyn=r l xy n ·l yyn =××=.∴β1=l xy n l xyn=错误!=1, β0=y -β1x =72-1×172=-100.故由身高估计平均体重的回归方程为y =x -100. 由x ,y 位置的对称性,得b =l xy nl xy n =错误!=,∴a =x -b y =172-×72=154.故由体重估计平均身高的回归方程为x =+154.可线性化的回归分析一、基础过关1.某商品销售量y(件)与销售价格x(元/件)负相关,则其线性回归方程可能是() A.y=-10x+200 B.y=10x+200 C.y=-10x-200 D.y=10x-200 2.在线性回归方程y=a+bx中,回归系数b表示() A.当x=0时,y的平均值B.x变动一个单位时,y的实际变动量C.y变动一个单位时,x的平均变动量D.x变动一个单位时,y的平均变动量3.对于指数曲线y=a e bx,令u=ln y,c=ln a,经过非线性化回归分析之后,可以转化成的形式为()A.u=c+bx B.u=b+cx C.y=b+cx D.y=c+bx4.下列说法错误的是()A.当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系B.把非线性回归化为线性回归为我们解决问题提供一种方法C.当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系D.当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决5.每一吨铸铁成本y c(元)与铸件废品率x%建立的回归方程y c=56+8x,下列说法正确的是() A.废品率每增加1%,成本每吨增加64元B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元D.如果废品率增加1%,则每吨成本为56元6.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是()A.直线l1和l2有交点(s,t) B.直线l1和l2相交,但是交点未必是点(s,t) C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合二、能力提升7.研究人员对10个家庭的儿童问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价结果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.下列哪个方程可以较恰当的拟合()A.y=1x+B.y=x-C.y= 5 D.y=x8.已知x,y之间的一组数据如下表:则y与x之间的线性回归方程y=bx+a必过点________.9.已知线性回归方程为y=-,则x=25时,y的估计值为________.10.在一次抽样调查中测得样本的5个样本点,数值如下表:(1)建立y与x(2)当8x 时,y大约是多少11.某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:y关于x 的回归方程.(保留三位有效数字)三、探究与拓展12.某商店各个时期的商品流通率y(%)和商品零售额x(万元)资料如下:散点图显示出x与y y决定于商品的零售额x,体现着经营规模效益,假定它们之间存在关系式:y=a+bx.试根据上表数据,求出a与b的估计值,并估计商品零售额为30万元时的商品流通率.答案1.A 8.,10.解 画出散点图如图(1)所示,观察可知y 与x 近似是反比例函数关系.设y =k x (k ≠0),令t =1x ,则y =kt .可得到y 关于t 的数据如下表:画出散点图如图(2)易得:b =∑5i =1t i y i -5t y ∑5i =1t 2i -5t 2≈ 4,a =y -b t ≈ 7, 所以y = 4t + 7,所以y 与x 的回归方程是y =错误!+ 7. 11.解 对y =ab x e 0两边取对数,得ln y =ln a e 0+x ln b ,令z =ln y , 则z 与x 的数据如下表:由z =ln a e 0+x ln b 及最小二乘法公式,得ln b ≈ 7,ln a e 0≈, 即z =+ 7x ,所以y =×.12.解 设u =1x,则y ≈a +bu ,得下表数据:进而可得n =10,u ≈ 4,y =,∑i =110u 2i -10u 2≈ 557 3, ∑i =110u i y i -10u y ≈ 35,b ≈错误!≈,a =y -b ·u ≈- 5,所求的回归方程为y =- 5+错误!.当x =30时,y = 5,即商品零售额为30万元时,商品流通率为 5%.。
简单线性回归分析思考与练习参考答案
简单线性回归分析思考与练习参考答案第10章简单线性回归分析思考与练习参考答案⼀、最佳选择题1.如果两样本的相关系数21r r =,样本量21n n =,那么( D )。
A. 回归系数21b b = B .回归系数12b b < C. 回归系数21b b > D .t 统计量11r b t t = E. 以上均错2.如果相关系数r =1,则⼀定有( C )。
A .总SS =残差SSB .残差SS =回归SSC .总SS =回归SSD .总SS >回归SS E.回归MS =残差MS3.记ρ为总体相关系数,r 为样本相关系数,b 为样本回归系数,下列( D )正确。
A .ρ=0时,r =0B .|r |>0时,b >0C .r >0时,b <0D .r <0时,b <0 E. |r |=1时,b =14.如果相关系数r =0,则⼀定有( D )。
A .简单线性回归的截距等于0B .简单线性回归的截距等于Y 或XC .简单线性回归的残差SS 等于0D .简单线性回归的残差SS 等于SS 总E .简单线性回归的总SS 等于05.⽤最⼩⼆乘法确定直线回归⽅程的含义是( B )。
A .各观测点距直线的纵向距离相等B .各观测点距直线的纵向距离平⽅和最⼩C .各观测点距直线的垂直距离相等D .各观测点距直线的垂直距离平⽅和最⼩E .各观测点距直线的纵向距离等于零⼆、思考题1.简述简单线性回归分析的基本步骤。
答:①绘制散点图,考察是否有线性趋势及可疑的异常点;②估计回归系数;③对总体回归系数或回归⽅程进⾏假设检验;④列出回归⽅程,绘制回归直线;⑤统计应⽤。
2.简述线性回归分析与线性相关的区别与联系。
答:区别:(1)资料要求上,进⾏直线回归分析的两变量,若X 为可精确测量和严格控制的变量,则对应于每个X 的Y 值要求服从正态分布;若X 、Y 都是随机变量,则要求X 、Y 服从双变量正态分布。
直线相关分析只适⽤于双变量正态分布资料。
一元线性回归模型习题及答案解析
⼀元线性回归模型习题及答案解析⼀元线性回归模型⼀、单项选择题1、变量之间的关系可以分为两⼤类__________。
AA 函数关系与相关关系B 线性相关关系和⾮线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________。
DA 变量间的⾮独⽴关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进⾏相关分析时的两个变量__________。
AA 都是随机变量B 都不是随机变量C ⼀个是随机变量,⼀个不是随机变量D 随机的或⾮随机都可以 4、表⽰x 和y 之间真实线性关系的是__________。
C A 01t tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量?β具备有效性是指__________。
B A ?var ()=0βB ?var ()β为最⼩C ?()0ββ-= D ?()ββ-为最⼩ 6、对于01??i i iY X e ββ=++,以σ?表⽰估计标准误差,Y ?表⽰回归值,则__________。
B A i i ??0Y Y 0σ∑=时,(-)=B 2ii0Y Y σ∑=时,(-)=0 C ii ??0Y Y σ∑=时,(-)为最⼩ D 2ii0Y Yσ∑=时,(-)为最⼩ 7、设样本回归模型为i 01i iY =X +e ββ+,则普通最⼩⼆乘法确定的i ?β的公式中,错误的是__________。
D A ()()()ii12i X X Y -Y ?X X β--∑∑=B ()i iii122iin X Y -X Y ?n X -X β∑∑∑∑∑=C ii 122iX Y -nXY ?X -nX β∑∑= D i i ii12xn X Y -X Y ?βσ∑∑∑=8、对于i 01i i ??Y =X +e ββ+,以σ表⽰估计标准误差,r 表⽰相关系数,则有__________。
线性回归分析法例题
线性回归分析法例题一、单选题1.相关分析研究的是()A、变量间相互关系的紧密程度B、变量之间因果关系C、变量之间严苛的相依关系D、变量之间的线性关系2.若变量X的值减少时,变量Y的值也减少,那么变量X和变量Y之间存有着()。
A、正相关关系B、负相关关系C、直线有关关系D、曲线有关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着()。
A、正有关关系B、负相关关系C、直线相关关系D、曲线相关关系4.相关系数等于零说明两变量()。
A.是严格的函数关系B.不存在相关关系C.不存有线性相关关系D.存在曲线线性相关关系5.有关关系的主要特征就是()。
A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的`标志之间存有着一定的依存关系,但它们不是确认的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存有着不确认的直线关系6.时间数列自身相关是指()。
A、两变量在相同时间上的依存关系B、两变量静态的依存关系C、一个变量随其时间相同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,表明两个变量之间()。
A、不存在相关关系B、相关程度很低C、有关程度很高D、全然负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间()。
A、并无有关B、存有正有关C、存在负相关D、无法判断是否相关9.有关分析对资料的建议就是()。
A.两变量均为随机的B.两变量均不是随机的C、自变量就是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10.重回分析中直观重回就是指()。
A.时间数列自身回归B.两个变量之间的回归C.变量之间的线性重回D.两个变量之间的线性重回11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为时,其生产成本为元,其中不随产量变化的成本为元,则成本总额对产量的回归方程为()A. y=+24xB. y=6+0.24xC. y=+6xD. y=24+x12.直线回归方程中,若回归系数为负,则()A.表明现象正相关B.表明现象负相关C.说明有关程度较弱D.无法表明有关方向和程度二、多项选择题1.以下属有关关系的存有()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归分析练习题分析TTA standardization office【TTA 5AB- TTAK 08- TTA 2C】§1回归分析1.1回归分析1.2相关系数一、基础过关1.下列变量之间的关系是函数关系的是()A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食产量2.在以下四个散点图中,其中适用于作线性回归的散点图为()A.①②B.①③C.②③D.③④3.下列变量中,属于负相关的是()A.收入增加,储蓄额增加B.产量增加,生产费用增加C.收入增加,支出增加D.价格下降,消费增加4.已知对一组观察值(x i,y i)作出散点图后确定具有线性相关关系,若对于y=bx+a,求得b=,x=,y=,则线性回归方程为()A.y=+B.y=+C.y=+D.y=+5.对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的C.回归分析中,如果r2=1,说明x与y之间完全相关D.样本相关系数r∈(-1,1)6.下表是x和y之间的一组数据,则y关于x的回归方程必过()A.点(2,3)C.点,4) D.点,5)7.若线性回归方程中的回归系数b=0,则相关系数r=________.二、能力提升8.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:若y与x.9.若施化肥量x(kg)与小麦产量y(kg)之间的线性回归方程为y=250+4x,当施化肥量为50 kg时,预计小麦产量为________ kg.10.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:若加工时间y(1)求加工时间与零件个数的线性回归方程;(2)试预报加工10个零件需要的时间.11.在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (t)之间的一组数据为:已知∑5i =1x i y i =62,∑i =1x 2i=. (1)画出散点图;(2)求出y 对x 的线性回归方程;(3)如果价格定为万元,预测需求量大约是多少(精确到 t). 12.某运动员训练次数与运动成绩之间的数据关系如下:(1)(2)求出回归方程;(3)计算相关系数并进行相关性检验; (4)试预测该运动员训练47次及55次的成绩. 三、探究与拓展13.从某地成年男子中随机抽取n 个人,测得平均身高为x =172 cm ,标准差为s x =7.6 cm ,平均体重y =72 kg ,标准差s y =15.2 kg ,相关系数r =l xyl xx l yy=,求由身高估计平均体重的回归方程y =β0+β1x ,以及由体重估计平均身高的回归方程x =a +by .答案1.A 7.0 =-+ 9.45010.解 (1)由表中数据,利用科学计算器得x =2+3+4+54=,y =错误!=, ∑4i =1x i y i =,∑4i =1x 2i =54, b =∑4i =1x i y i -4x y ∑4i =1x 2i -4x 2=错误!=, a =y -b x =,因此,所求的线性回归方程为y =+.(2)将x =10代入线性回归方程,得y =×10+=(小时),即加工10个零件的预报时间为小时.11.解 (1)散点图如下图所示:(2)因为x =15×9=,y =15×37=,∑5i =1x i y i =62,∑5i =1x 2i =, 所以b =∑5i =1x i y i-5x y∑5i =1x 2i -5x2=错误!=-,a =y -b x =+×=,故y 对x 的线性回归方程为y =-. (3)y =-×=(t).所以,如果价格定为万元,则需求量大约是 t.12.解 (1)作出该运动员训练次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系. (2)列表计算:由上表可求得x =,y =,∑8i =1x 2i =12 656,∑8i =1y 2i =13 731, ∑8i =1x i y i=13 180, ∴b =∑8i =1x i y i -8x y∑8i =1x 2i -8x2≈ 5,a =y -b x =- 88, ∴线性回归方程为y = 5x - 88.(3)计算相关系数r = 7,因此运动员的成绩和训练次数两个变量有较强的相关关系.(4)由上述分析可知,我们可用线性回归方程y = 5x - 88作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y =49和y =57.故预测该运动员训练47次和55次的成绩分别为49和57. 13.解 ∵s x =l xyn ,s y =l xy n ,∴l xyn =rl xy n ·l yyn =××=.∴β1=l xy n l xy n=错误!=1,β0=y -β1x =72-1×172=-100.故由身高估计平均体重的回归方程为y =x -100. 由x ,y 位置的对称性,得b =l xy nl xy n =错误!=,∴a =x -b y =172-×72=154.故由体重估计平均身高的回归方程为x =+154.可线性化的回归分析一、基础过关1. 某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( )A .y =-10x +200B .y =10x +200C .y =-10x -200D .y =10x -2002. 在线性回归方程y =a +bx 中,回归系数b 表示( )A .当x =0时,y 的平均值B .x 变动一个单位时,y 的实际变动量C .y 变动一个单位时,x 的平均变动量D .x 变动一个单位时,y 的平均变动量3. 对于指数曲线y =a e bx ,令u =ln y ,c =ln a ,经过非线性化回归分析之后,可以转化成的形式为 ( ) A .u =c +bxB .u =b +cxC .y =b +cxD .y =c +bx4.下列说法错误的是()A.当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系B.把非线性回归化为线性回归为我们解决问题提供一种方法C.当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系D.当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决5.每一吨铸铁成本y c(元)与铸件废品率x%建立的回归方程y c=56+8x,下列说法正确的是 ()A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8%C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元6.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是 ()A.直线l1和l2有交点(s,t) B.直线l1和l2相交,但是交点未必是点(s,t)C.直线l1和l2由于斜率相等,所以必定平行 D.直线l1和l2必定重合二、能力提升7.研究人员对10个家庭的儿童问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价结果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.下列哪个方程可以较恰当的拟合()A.y= 1x+ B.y=x-C.y= 5 D.y=x8.已知x,y之间的一组数据如下表:则y与x9.已知线性回归方程为y=-,则x=25时,y的估计值为________.10.在一次抽样调查中测得样本的5个样本点,数值如下表:(1)建立y与x(2)当8x 时,y大约是多少11.某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:a、b均为正数,求y关于x的回归方程.(保留三位有效数字)三、探究与拓展12.某商店各个时期的商品流通率y(%)和商品零售额x(万元)资料如下:散点图显示出x流通率y决定于商品的零售额x,体现着经营规模效益,假定它们之间存在关系式:y=a+bx.试根据上表数据,求出a与b的估计值,并估计商品零售额为30万元时的商品流通率.答案1.A8.,10.解画出散点图如图(1)所示,观察可知y与x近似是反比例函数关系.设y=kx (k≠0),令t=1x,则y=kt.可得到y关于t的数据如下表:画出散点图如图(2)归模型进行拟合,易得:b=∑5i=1t i y i-5t y∑5i=1t2i-5t2≈ 4,a=y-b t≈ 7,所以y= 4t+ 7,所以y与x的回归方程是y=错误!+ 7.11.解对y=ab x e0两边取对数,得ln y=ln a e0+x ln b,令z=ln y,则z与x的数据如下表:由z=ln a e0+x ln b及最小二乘法公式,得ln b≈ 7,ln a e0≈,即z=+ 7x,所以y=×.12.解设u=1x,则y≈a+bu,得下表数据:进而可得n =10,u ≈ 4,y =,∑i =110u 2i -10u 2≈ 557 3, ∑i =110u i y i -10u y ≈ 35,b ≈错误!≈, a =y -b ·u ≈- 5,所求的回归方程为y =- 5+错误!.当x =30时,y = 5,即商品零售额为30万元时,商品流通率为 5%.。