一元线性回归模型练习题(无计算)

合集下载

线性模型练习题(含答案)

线性模型练习题(含答案)

线性模型练习题(含答案)练题一设有线性回归模型:$ y = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_3 $,其中 $x_1$、$x_2$ 和 $x_3$ 是自变量,$y$ 是因变量。

已知模型的参数估计值如下:$ \hat{\beta}_0 = 2.5 $$ \hat{\beta}_1 = 0.8 $$ \hat{\beta}_2 = -1.2 $$ \hat{\beta}_3 = 1.3 $请判断以下哪个自变量与因变量的关系最为显著:A. $x_1$B. $x_2$C. $x_3$D. 无法确定答案:B. $x_2$练题二下面是一个简单的线性回归模型:$ y = 3x_1 + 4x_2 + 2x_3 + 1 $已知模型的参数估计值如下:$ \hat{\beta}_1 = 2.1 $$ \hat{\beta}_2 = 1.8 $$ \hat{\beta}_3 = 0.9 $请根据模型参数估计值计算预测值 $ \hat{y} $,当 $x_1 = 2$,$x_2 = 3$,$x_3 = 1$ 时的结果。

答案:$ \hat{y} = 3(2) + 4(3) + 2(1) + 1 = 23 $练题三某研究人员运用线性回归模型分析了一个因变量 $y$ 和四个自变量 $x_1$、$x_2$、$x_3$ 和 $x_4$ 的关系,得到模型方程如下:$ y = 2.6x_1 + 1.9x_2 - 1.4x_3 + 0.5x_4 - 1 $已知 $x_1 = 3$,$x_2 = 2$,$x_3 = 4$,$x_4 = 1$,请计算对应的预测值 $ \hat{y} $。

答案:$ \hat{y} = 2.6(3) + 1.9(2) - 1.4(4) + 0.5(1) - 1 = 2.9 $练题四以下是一个多元线性回归模型的参数估计值摘录:$ \hat{\beta}_0 = 1.2 $$ \hat{\beta}_1 = -0.8 $$ \hat{\beta}_2 = 0.5 $$ \hat{\beta}_3 = 1.0 $$ \hat{\beta}_4 = 0.3 $$ \hat{\beta}_5 = -0.6 $请写出该线性回归模型的方程。

高考数学复习典型题型专题讲解与练习94 一元线性回归模型及其应用

高考数学复习典型题型专题讲解与练习94 一元线性回归模型及其应用

高考数学复习典型题型专题讲解与练习 专题94 一元线性回归模型及其应用题型一 求回归直线方程例1.(2022·甘肃·临泽县第一中学高二阶段练习(文))已知变量x 和y 正相关,则由如下表所示的观测数据算得的线性回归方程为【答案】B 【解析】 【分析】先求出样本的中心点的坐标,再代入选项检验即得正确答案. 【详解】 由题得12345543210,10x -----+++++==0.92 3.1 3.9 5.1 4.15 2.9 2.10.9010y -----+++++==,所以样本中心点的坐标为(0,0),代入选项检验得选B. 故答案为B 【点睛】(1)本题主要考查回归方程直线的性质,意在考查学生对该知识的掌握水平.(2) (,)x y 称为样本点的中心,回归直线过样本点的中心.这是回归方程的一个重要考点,要理解掌握并灵活运用.规律方法 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x -,y -,∑n i =1x 2i ,∑ni =1x i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑n i =1x i y i -n x - y -∑n i =1x 2i -nx -2,a ^=y --b ^x -.(6)写出线性回归方程y ^=b ^x +a ^.例2.(2019·新疆·乌鲁木齐市第二十中学高二期中)随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y (万元)有如表的数据资料:(1) 在给出的坐标系中作出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa 、ˆb ; (3)估计使用年限为12年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆn i i i n ii x y nxy bx nx==-=-∑∑, ˆˆay bx =-.) 【答案】(1)见解析; (2) 1.23b =0.08a =; (3)估计使用12年时,支出总费用是14.84万元.. 【解析】 【分析】(1)在坐标系中描点可得散点图;(2)代入公式可求;(3)根据方程代入x=12可得费用. 【详解】(1)散点图如图,由图知y 与x 间有线性相关关系.(2)∵4x =,5y =,51112.3i i i x y ==∑,52190i i x ==∑,∴2112.354512.31.2390541ˆ0b-⨯⨯===-⨯;5 1.2340.ˆ0ˆˆ8ay bx =-=-⨯=. (3)线性回归直线方程是 1.2308ˆ.0yx =+, 当12x =(年)时, 1.23120.0814.8ˆ4y =⨯+=(万元).即估计使用12年时,支出总费用是14.84万元. 【点睛】本题主要考查回归直线在生活中的应用,明确所给公式中各个模块的含义,代入公式可求.题目难度不大,侧重于应用性.例3.(2022·全国·高二单元测试)有一位同学家里开了一个小卖部,他为了研究气温对热茶销售的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表如下: 气温x/℃ -5 0 4 7 12 15 19 23 27 31 36热茶销售杯数y/杯 156 150 132 128 130 116 104 89 93 76 54(1)画出散点图;(2)你能从散点图中发现气温与热茶的销售杯数之间关系的一般规律吗? (3)如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系; (4)试求出回归直线方程;(5)利用(4)的回归方程,若某天的气温是2 ℃,预测这一天卖出热茶的杯数.【答案】(1)见解析;(2)见解析;(3)见解析;(4) 2.354774ˆ1.y x =-+;(5)143【解析】 【详解】分析:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图;(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少;(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系; (4)由题中所给的数据求得回归方程即可;(5)结合回归方程的预测作用和(4)中的结论整理计算即可求得最终结果. 详解:(1)以x 轴表示气温,以y 轴表示热茶杯数,可作散点图如下图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系,如图所示.(4)因112i i 1169x ,x 411∑===为335,11i 11228y ,xiyi 1411∑===778. 所2169122814778-111111b 1694335-1111⨯⨯=⎛⎫⨯ ⎪⎝⎭^以≈-2.35, 1228169a 2.35147.74.1111=+⨯=^所以回归直线方程y 2.35x 147.74.=-+^为(5)由(4)的方程,当x=2,y 4.70147.74143.04,=-+=^时因此若某天的气温为2 ℃,这一天大约可以卖出143杯热茶.点睛:(1)正确运用计算^a ,^b 的公式和准确的计算,是求线性回归方程的关键. (2)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.题型二 利用回归直线方程对总体进行估计例4.(2022·江西抚州·高二期末(理))保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新能源汽车,每年抽样1000汽车调查,得到新能源汽车y 辆与年份代码x 年的数据如下表:(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源汽车.参考公式:回归方程y bx a =+斜率和截距的最小二乘估计公式分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【答案】(1)219y x =+ (2)27900 【解析】【分析】(1)第一步分别算第x ,y 的平均值,第二步利用1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-即可得到方程.(2)由第一问的结果,带入方程即可算出预估的结果. (1)3x =,305070+100+110=725y ++=,1222222221130+250+370+4100+5110-5372==211+2+3+4+5-53ni ii ni i x y nx yb x nx==-⨯⨯⨯⨯⨯⨯⨯=⨯-∑∑,因为a y bx =-,所以72213=9a =-⨯,所以219y x =+(2)预测该地区2022年抽样1000汽车调查中新能源汽车数,当7x =时,217993y =⨯+=,该地区2022年共有30万辆汽车,所以新能源汽车93300000279001000N =⨯=. 规律方法 本题已知y 与x 是线性相关关系,所以可求出回归方程进行估计和预测.否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.例5.(2022·陕西·西安中学高二期中(理))偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差(实际成绩-平均分=偏差).在某次考试成绩统计中,某老师为了对学生数学偏差x (单位:分)与物理偏差y (单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:(1)若x 与y 之间具有线性相关关系,求y 关于x 的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.(下面是参考数据和参考公式)()()()()()()()()()818222222222120 6.515 3.513 3.53 1.520.550.510 2.518 3.532420151332510181256i ii ii x yx===⨯+⨯+⨯+⨯+⨯+-⨯-+-⨯-+-⨯-==+++++-+-+-=∑∑,回归直线方程为ˆˆˆy bx a =+,其中()()()1122211ˆˆˆnni i iii i nni ii i x y nxy x x y y b x nx x x ay bx ====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑【答案】(1)11ˆ42yx =+ (2)94 【解析】 【分析】(1)根据最小二乘法即可求出y 关于x 的线性回归方程;(2)设该同学的物理成绩为ω,则物理偏差为91.5ω-,数学偏差为8,根据回归方程可知,1191.5842ω-=⨯+,即可解出.(1)由题意可得,20151332(5)(10)(18)582x +++++-+-+-==,()()()6.5 3.5 3.5 1.50.50.5 2.5 3.5988y +++++-+-+-==, 1222159324ˆ81285412568()2ni ii nii x y nxybxnx ==--⨯⨯===-⨯-∑∑,所以9151ˆˆ8422a y bx =-=-⨯=,故线性回归方程为11ˆ42yx =+. (2)由题意,设该同学的物理成绩为ω,则物理偏差为:91.5ω-. 而数学偏差为128-120=8,∴1191.5842ω-=⨯+,解得94ω=, 所以,可以预测这位同学的物理成绩为94.例6.(2022·广东揭阳·高二期末)从2018年1月1日起,广东、等18个保监局所辖地区将纳入商业车险改革试点范围,其中最大的变化是上一年的出险次数决定了下一年的保费倍率,具体关系如下表:有评估机构从以往购买了车险的车辆中随机抽取1000 辆调查,得到一年中出险次数的频数分布如下(并用相应频率估计车辆每年出险次数的概率):(1)求某车在两年中出险次数不超过2次的概率;(2)经验表明新车商业车险保费与购车价格有较强的线性相关关系,估计其回归直线方程为:1201600y x =+.(其中x (万元)表示购车价格,y (元)表示商业车险保费).李先生2016 年1月购买一辆价值20万元的新车.根据以上信息,试估计该车辆在2017 年1月续保时应缴交的保费,并分析车险新政是否总体上减轻了车主负担.(假设车辆下一年与上一年都购买相同的商业车险产品进行续保) 【答案】(1)0.8744;(2)3846元,减轻了车主负担. 【解析】 【分析】(1)利用互斥事件的概率公式列式计算即得;(2)求出下一年车险保费倍率X 的分布列,并求出期望,即可得出车主下一年的保费,并根据期望是否大于1得出结论. 【详解】(1)设某车在两年中出险次数为N , 则(2)(0)(1)(2)P N P N P N P N ≤==+=+=5005005003805001003803802210001000100010001000100010001000=⋅+⋅⋅+⋅⋅+⋅0.8744=, 所以某车在两年中出险次数不超过2次的概率为0.8744; (2)设该车辆2017 年的保费倍率为X ,则X 为随机变量,X 的取值为0.85 ,1,1.25 ,1.5 ,1.75 , 2, X 的分布列为:下一年保费倍率X 的期望为:()0.850.510.38 1.250.1 1.50.015 1.750.00420.0010.9615+E X =⨯⨯+⨯+⨯+⨯+⨯=,该车辆估计2017年应缴保费为:()1202016000.96153846⨯+⨯=元, 因0.96151<,则车险新政总体上减轻了车主负担.题型三 线性回归分析例7.(2022·山东·日照青山学校高二期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下,用两种模型①y bx a =+;②y a =分别进行拟合,得到相应的回归方程1ˆ10.7 3.4yx =+,2ˆ22.8y =,进行残差分析得到如表所示的残差值及一些统计量的值:(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.(参考公式:1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆay bx =-) 【答案】(1)该选模型①,理由见解析 (2)111y x =+ 【解析】 【分析】(1)求出两模型的残差值的绝对值之和进行比较即可,(2)先剔除异常数据,然后利用回归方程的公式结合已知数据进行计算即可 (1)应该选择模型①模型①的残差值的绝对值之和为1.1+2.8+7.5+1.2+1.9+0.4=14.9 模型②的残差值的绝对值之和为0.3+5.4+4.3+3.2+1.6+3.8=18.6. ∵14.9<18.6,∴模型①的拟合效果较好,应该选模型①.(2)剔除异常数据,即剔除第3天的数据后,得()1 3.563 3.65x =⨯-=,()14164340.65y =⨯-=, 511049343920i ii x y==-⨯=∑,522191382i i x ==-=∑.∴51522159205 3.640.6189.2ˆ11825 3.6 3.617.25i ii ii x y xybxx ==--⨯⨯====-⨯⨯-∑∑, ˆˆ40.611 3.61ay bx =-=-⨯=. ∴y 关于x 的回归方程为111y x =+.规律方法 (1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.(2)刻画回归效果的三种方法①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适. ②残差平方和法:残差平方和∑ni =1 (y i -y ^i )2越小,模型的拟合效果越好. ③决定系数法:R 2=1-∑ni =1(y i -y ^i )2∑ni =1 (y i -y -)2越接近1,表明回归的效果越好. 例8.(2022·河南·南阳中学高三阶段练习(文))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附: 刻画回归效果的相关指数()()22121ˆ1niii nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-4.1≈ 【答案】(1)对A 型材料进行应用改造的投入为17亿元时的直接收益为72.93(亿元); (2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据模型和相关系数公式计算比较即可,然后将x =17代入较好的模型即可预测直接收益;(2)根据回归方程过样本中心点(,x y )求出ˆa,再令x =20算出预测的直接收益,即可算出投入20亿元时的总收益,与(1)中的投入17亿元的直接收益比较即可. (1)对于模型①,对应的15222740485460=387y ++++++=,故对应的()772221171750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为21.314.472.9ˆ3y=≈(亿元).另解:本题也可以根据相关系数的公式,直接比较79.13和20.2的大小,从而说明模型②拟合精度更高、更可靠. (2) 当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.例9.(2022·陕西·高新一中高三阶段练习(理))2022年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造.根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.yx =+,模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7y x a =-+.(1)根据表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益; (2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,回归方程的拟合效果越好 4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)2221R R >,模型②拟合精度更高、更可靠,收益为72.93;(2)投入17亿元比投入20亿元时收益小. 【解析】 【分析】(1)根据题意求得()1221i i y y =-∑,再根据2R 的计算公式,即可分别求得2212,R R ,则可判断不同模型的拟合度;(2)根据题意,求得回归直线方程,即可代值计算,求得预测值. (1)对于模型①,对应的15222740485460387y ++++++==,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ21.314.472.93y=≈. (2) 当17x >时, 后五组的212223242568.56867.5666523,6755x y ++++++++====,由最小二乘法可得67(0.7)238ˆ 3.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1574.172.93-⨯++=>,故投入17亿元比投入20亿元时收益小.题型四 残差分析与相关指数的应用例10.(2022·河北·藁城新冀明中学高二阶段练习)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和; 【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件; (3)各组残差见解析,残差平方和为3.8182. 【解析】 【分析】(1)根据表中数据描点即可求解;(2)根据表中数据,求出x ,y ,612i i x =∑,61i i i x y =∑,代入公式求出线性回归方程的系数ˆb,进而求出ˆa即可得回归直线方程; (3)根据残差的定义及残差平方和公式即可求解. (1)解:散点图如下:(2) 解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818ii i y y=--+++--==++∑. 规律方法 (1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差e ^1,e ^2,…,e ^n 来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.例11.(2022·河北·大名县第一中学高二阶段练习)随着中美贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.华为技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x (亿元)与科技升级直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①:ˆ 4.111.8yx =+;模型②:ˆ14.4y=;当17x >时,确定y 与x 满足的线性回归方程为0.7y x a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①、②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对“麒麟”手机芯片科技升级的投入为17亿元时的直接收益. (附:刻画回归效果的相关指数,()()22121ˆ1niii nii y yR y y ==-=--∑∑ 4.1≈)(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.附:用最小二乘法求线性回归方程ˆˆˆybx a =+的系数:()()()1122211ˆˆˆ,nni iii i i nniii i x ynx yxx y y bay bx xnx xx ====-⋅--===---∑∑∑∑ 【答案】(1)回归模型②,72.93(亿元);(2)投入20亿元时,公司的实际收益更大. 【解析】 【分析】(1)根据表中数据比较21R 和22R 可判断拟合效果,进而求出预测值; (2)求出,x y ,进而求出a ,得出回归方程得求出结果. 【详解】解:(1)由表格中的数据,182.479.2>,∴()()772211182.479.2iii i y y y y ==>--∑∑,∴()()772211182.479.211iit t y y y y ==-<---∑∑可见模型①的相关指数21R 小于模型②的相关指数22R . 所以回归模型②的拟合效果更好.所以当17x =亿元时,科技升级直接收益的预测值为ˆ21.314.421.3 4.114.472.93y=≈⨯-=(亿元). (2)当17x >时,由已知可得2122232425235x ++++==,68.56867.5666667.25y ++++==.∴0.767.20.72383.3a y x =+=+⨯=.∴当17x >时,y 与x 满足的线性回归方程为ˆ0.783.3yx =-+. 当20x时,科技升级直接收益的预测值为ˆ0.72083.369.3y=-⨯+=亿元.当20>亿元,x亿元时,实际收益的预测值为69.3574.3+=亿元72.93∴技术升级投入20亿元时,公司的实际收益更大.题型五非线性回归分析例12.(2022·全国·模拟预测)某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x 表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:根据以上数据,绘制了如图所示的散点图.(1)根据散点图,判断在推广期内,y a bx=+与x=⋅(c,d均为大于零的常数)哪一个y c d适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及题干中表格内的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:其中lg i i v y =,7117i i v v ==∑.参考公式:对于一组数据)()()(1122,,,,,,n n u v u v u v ⋅⋅⋅,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为1221ˆni i i nii uv nuvunuβ==-=-∑∑,ˆav u β=-. (3)推广期结束后,为更好地服务乘客,车队随机调查了100人次的乘车支付方式,得到如下结果: 已知该线路公交车票价2元,使用现金支付的乘客无优惠,使用公交卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据调查结果发现:使用扫码支付的乘客中有5人次乘客享受7折优惠,有10人次乘客享受8折优惠,有15人次乘客享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据所给数据,以事件发生的频率作为相应事件发生的概率,在不考虑其他因素的条件下,按照上述收费标准,试估计该车队一辆车一年的总收入.【答案】(1)x y c d =⋅适宜(2))(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347(3)199200元 【解析】 【分析】(1)根据散点图即可判断回归方程类型;(2)根据题意中的数据,利用最小二乘法求出ˆb ,进而求出ˆa,即可得出回归方程,令8x =求解即可;(3)根据题意分别求出享受7折优惠、8折优惠、9折优惠的收入,进而加起来即可. (1)根据散点图判断,x y c d =⋅适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型. (2)∵x y c d =⋅,∴两边同时取常用对数,得lg lg lg y c x d =+. 设lg a c =,lg b d =,则v a bx =+.∵4x =, 1.54v =,721140i i x ==∑,∴7172221750.1274 1.547ˆ0.2514074287i i i i i x v xvbx x==--⨯⨯====-⨯-∑∑,ˆˆ0.54av bx =-=,∴ˆ0.540.25v x =+,∴)(0.540.250.25ˆ10 3.4710xx y +==⨯,把8x =代入上式,得0.540.258 2.5420.54ˆ10101010347y+⨯===⨯=, ∴y 关于x 的回归方程为)(0.25ˆ 3.4710xy=⨯,活动推出第8天使用扫码支付的人次为347. (3)由题意,可知一个月中使用现金的乘客有1000人次,共收入100022000⨯=(元);使用公交卡的乘客有6000人次,共收入6000 1.69600⨯=(元).使用扫码支付的乘客有3000人次,其中,享受7折优惠的有500人次,共收入500 1.4700⨯=(元),享受8折优惠的有1000人次,共收入1000 1.61600⨯=(元),享受9折优惠的有1500人次,共收入1500 1.82700⨯=(元),故该车队一辆车一个月的收入为200096007001600270016600++++=(元).∴估计该车队一辆车一年的收入为1660012199200⨯=(元).规律方法求非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性回归方程.例13.(2022·黑龙江·哈尔滨市第六中学校高二期末)区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,居世界前列现收集我国近5年区块链企业总数量相关数据,如表注:参考数据5174.691i i y ==∑,51312.761i i i x y ==∑,5110.980i i z ==∑,5140.457i i i x z ==∑(其中ln z y =).附:样本()(),1,2,,i i x y i n =⋅⋅⋅的最小二乘法估计公式为1221ni ii nii x ynxy b xnx==-=-∑∑,a y bx =-(1)根据表中数据判断,y a bx =+与e dx y c =(其中e 2.71828=⋅⋅⋅,为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由)(2)根据(1)的结果,求y 关于x 的回归方程;(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”,已知在每场比赛中,甲胜乙的概率为12,甲胜丙的概率为13,乙胜丙的概率为35,若首场由甲乙比赛,则求甲公司获得“优胜公司”的概率. 【答案】(1)dx y ce = (2)0.75170.0591x y e -= (3)310【解析】【分析】(1)根据表中数据判断y 关于x 的回归方程为非线性方程;(2)令ln z y =,将y 关于x 的非线性关系,转化为z 关于x 的线性关系,利用最小二乘法求解;(3)利用相互独立事件的概率相乘求求解; (1)根据表中数据e dx y c =适宜预测未来几年我国区块链企业总数量. (2)e dx y c =,ln ln y dx c ∴=+,令ln z y =,则ln z dx c =+,5110.980 2.19655ii zz ====∑,5112345355ii xx =++++===∑由公式计算可知122140.457310.980.7517,5545ni ii n i i x znxzb x nx==-⨯==--=-∑∑ˆln 2.1960.751730.0591c z dx =-=-⨯=- ln 0.75170.0591y x ∴=-,即ln 0.75170.0591y x ∴=-,即0.75170.0591x y e -=所以y 关于x 的回归方程为0.75170.0591x y e -= (3)设甲公司获得“优胜公司”为A 事件. 则11123112113232352253210()P A ⨯+⨯⨯⨯+⨯⨯⨯==所以甲公司获得“优胜公司”的概率为310.例14.(2022·湖南·长沙一中高三阶段练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1-9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:现用by ax=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为23,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1iitx =)。

简单线性回归模型试题及答案

简单线性回归模型试题及答案

第二章 简单线性回归模型一、单项选择题:1、回归分析中定义的( B )。

A 、解释变量和被解释变量都是随机变量B 、解释变量为非随机变量,被解释变量为随机变量C 、解释变量和被解释变量都为非随机变量D 、解释变量为随机变量,被解释变量为非随机变量2、最小二乘准则是指使( D )达到最小值的原则确定样本回归方程。

A 、1ˆ()n t t t Y Y =-∑B 、1ˆn t t t Y Y =-∑C 、ˆmax t t Y Y -D 、21ˆ()n t tt Y Y =-∑ 3、下图中“{”所指的距离是( B )。

A 、随机误差项i 、ˆiY 的离差 4、参数估计量ˆβ是iY 的线性函数称为参数估计量具有( A )的性质。

A 、线性 B 、无偏性 C 、有效性 D 、一致性5、参数β的估计量βˆ具备有效性是指( B )。

A 、0)ˆ(=βVarB 、)ˆ(βVar 为最小C 、0ˆ=-ββD 、)ˆ(ββ-为最小6、反映由模型中解释变量所解释的那部分离差大小的是( B )。

A 、总体平方和B 、回归平方和C 、残差平方和D 、样本平方和7、总体平方和TSS 、残差平方和RSS 与回归平方和ESS 三者的关系是( B )。

A 、RSS=TSS+ESSB 、TSS=RSS+ESSC 、ESS=RSS-TSSD 、ESS=TSS+RSS8、下面哪一个必定是错误的( C )。

A 、 i i X Y 2.030ˆ+= ,8.0=XY r B 、 i i X Y 5.175ˆ+-= ,91.0=XY r C 、 i i X Y 1.25ˆ-=,78.0=XY r D 、 i i X Y 5.312ˆ--=,96.0-=XY r9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为ˆ356 1.5Y X =-,这说明( D )。

A 、产量每增加一台,单位产品成本增加356元B 、产量每增加一台,单位产品成本减少1.5元C 、产量每增加一台,单位产品成本平均增加356元D 、产量每增加一台,单位产品成本平均减少1.5元10、回归模型i i i X Y μββ++=10,i = 1,…,25中,总体方差未知,检验010=β:H 时,所用的检验统计量1ˆ11ˆβββS -服从( D )。

南财计量经济学答案第二章 一元线性回归模型

南财计量经济学答案第二章 一元线性回归模型

五、计算分析题 1.解:(1)收入、年龄、家庭状况、政府的相关政 策等也是影响生育率的重要的因素,在上述简单 回归模型中,它们被包含在了随机扰动项之中。 有些因素可能与受教育水平相关,如收入水平与 教育水平往往呈正相关、年龄大小与教育水平呈 负相关等。 (2)当归结在随机扰动项中的重要影响因素与模 型中的教育水平educ相关时,上述回归模型不能 够揭示教育对生育率在其他条件不变下的影响, 因为这时出现解释变量与随机扰动项相关的情形, 基本假设3不满足。
ˆ ei2 回归估计的标准误差:
(n 2) 58.3539 (12 2) 2.4157
(3) 对进行显著水平为5%的显著性检验
t
*
^
ˆ 2 2
^
ˆ) SE ( 2
ˆ

ˆ 2
ˆ) SE ( 2

^
~ t (n 2)
ˆ ) SE ( 2
4、解: (1)这是一个横截面序列回归。 (2)截距2.6911表示咖啡零售价为每磅0美元时, 每天每人平均消费量为2.6911杯,这个数字没有 经济意义;斜率-0.4795表示咖啡零售价与消费量 负相关,价格上升1美元/杯,则平均每天每人消 费量减少0.4795杯; (3)不能; (4)不能;在同一条需求曲线上不同点的价格弹性 不同,若要求出,须给出具体的值及与之对应的 值。
2 i

334229.09 0.7863 425053.73
ˆ Y ˆ X 549.8 0.7863 647.88 66.2872 1 2
ˆ 66.2872 0.7863 X 估计结果为: Y i i 说明该百货公司销售收入每增加1元,平均说来销售成本将增 加0.7863元。 (2)计算可决系数和回归估计的标准误差 2 ˆ x )2 ˆ 2 x2 ˆ y ( i 可决系数为:R 2 i 2 i 2

第十章 一元线性回归

第十章 一元线性回归

第十一章 一元线性回归一、填空题1、对回归系数的显著性检验,通常采用的是 检验。

2、若回归方程的判定系数R 2=0.81,则两个变量x 与y 之间的相关系数r 为_________________。

3、若变量x 与y 之间的相关系数r=0.8,则回归方程的判定系数R 2为____________。

4、对于直线趋势方程bx a y c +=,已知∑=,0x ∑=130xy ,n=9,1692=∑x, a=b ,则趋势方程中的b=______。

5、回归直线方程bx a y c +=中的参数b 是_____________。

估计待定参数a 和 b 常用的方法是-_________________。

6、相关系数的取值范围_______________。

7、在回归分析中,描述因变量y 如何依赖于自变量x 和误差项的方程称为 。

8、在回归分析中,根据样本数据求出的方程称为 。

9、在回归模型εββ++=x y 10中的ε反映的是 。

10、在回归分析中,F 检验主要用来检验 。

11、说明回归方程拟合优度检验的统计量称为 。

二、单选题1、年劳动生产率(x :千元)和工人工资(y :元)之间的回归方程为1070y x =+,这意味着年劳动生产率没提高1千元,工人工资平均( )A 、 增加70元B 、 减少70元C 、增加80元D 、 减少80元 2、两变量具有线形相关,其相关系数r=-0.9,则两变量之间( )。

A 、强相关B 、弱相关C 、不相关D 、负的弱相关关系 3、变量的线性相关关系为0,表明两变量之间( )。

A 、完全相关B 、无关系C 、不完全相关D 、不存在线性关系 4、相关关系与函数关系之间的联系体现在( )。

A 、相关关系普遍存在,函数关系是相关关系的特例 B 、函数关系普遍存在,相关关系是函数关系的特例C 、相关关系与函数关系是两种完全独立的现象D 、相关关系与函数关系没有区别 5、已知x 和y 两变量之间存在线形关系,且δx =10, δy =8, δxy2=-7,n=100,则x 和y 存在着( )。

一元线性回归模型练习题

一元线性回归模型练习题

一元线性回归模型练习题P55 3.1实验问题:实验步骤与内容:1、导入数据资料2、定义样本区间3、建立一元线性回归模型4、根据一元线性回归模型解释斜率系数的经济意义以及相关系数r5、对参数进行检验6、通过计算预测2010年财政收入问题解释与结论:(1):建立深圳地方预算内财政收入对GDP的一元线性回归模型。

通过对数据的运用,可以得出一元线性回归方程为Y=26.020961+0.08882X 其中,可以得到散点图为:一元线性回归拟合图为:(2)估计所建立模型的参数,解释斜率系数的经济意义;斜率系数和简单相关系数r的正负号相同吗?=26.02096是样本回归方程的截距,它表示不受国内生产总值影响的地方预算β=0.08882表示国内生产总值每增加一个单位的地方预财政收入为26.0296,β1算财政收入平均增加0.8882个单位,从回归模型不难看出,随着变量X的增大,Y变量的值也在增大。

根据简单相关系数的概念,且从第一题所求出来的回归结果可知,r>0,两个变量之间是正相关,即斜率系数和简单相关系数r的正负号相同。

(3)对回归参数进行t检验。

由此得到t=4.081 p=0.0006808,给定显著性水平 =0.05,查表得t(19)=2.0930,由于t=4.081>2.0930,拒绝原假设,说明斜率在5%的显著性0.05/2水平下显著不为0,这表明,国内生产总值对深圳市地方预算内财政收入有显著影响。

(4)拟合优度R2是多少?由第一题求出的线性回归可得:由上图中数据分析结果可以看出R2=0.9607,说明GDP解释了地方预算内财政收入的96%,模型拟合程度较好。

(6)若2010年的国内生产总值为11000亿元,试预测2010年的财政收入。

由一元线性回归模型可知,当2010年国内生产总值为11000亿元时,地方财政收入为:Y=26.020961+0.08882X=26.020961+0.08882*11000=1003.040961(亿元)3.6实验问题题表3.6是64个国家的儿童死亡率与人均GNP 数据,请用合适的模型作儿童死亡率对人均GNP 的一元线性回归,解释回归结果的含义,画出儿童死亡率对人均GNP 倒数的散点图,并与回归结果对应解释。

一元线性回归补充习题

一元线性回归补充习题

线性回归模型补充习题1, 判断以下模型哪一些是线性回归模型?模型 名称(1)i ii u X Y ++=)1(21ββ 倒数 (2)i i i u X Y ++=ln 21ββ 半对数(3)i i i u X Y ++=21ln ββ 逆向半对数 (4)i i i u X Y ++=ln ln 21ββ 双对数(5)i ii u X Y +-=)1(ln 21ββ (6)i i X Y 221ββ+=2, 下面的模型是线性回归模型吗?为什么是或为什么不是?(1)i i u X i e Y ++=21ββ (2) ii u X i e Y +++=2111ββ (3) i ii u X Y ++=)1(ln 21ββ (4) i X i u e Y i +-+=--)2(112)75.0(βββ (5) i i i u X Y ++=321ββ3, 如果上题(4)中的8.02=β,这个模型会变成一个线性回归模型吗?为什么? 4, 建立如下的双变量PRF :模型I :i i i u X Y ++=21ββ模型 II :i i i u X X Y +-+=)(21αα(1) 求11,αβ的估计量。

它们是否相同?它们的方差是否相同?(2) 求22,αβ的估计量。

它们是否相同?它们的方差是否相同?(3) 如果模型II 比模型I 好,好在哪里?5, 如果321,,X X X 是有同样的标准差但互不相关的变量,试说明21X X +和23X X +的相关系数等于0.5,为什么这个相关系数不是零?6,假使在回归模型 i i i u X Y ++=21ββ中我们用常数2去乘每一个X 值,问这会不会改变Y 的残差一拟合值?为什么?如果我们给每个X 值都加大一个常数2,又会怎么样?7,证明:),(ˆ22222y x S S R β= 22,y x S S 是Y X ,的方差。

8,下面的陈述是正确的,错误的或者不能肯定的?试述理由。

计量经济学复习资料——概论一元和多元线性回归习题

计量经济学复习资料——概论一元和多元线性回归习题

计量经济学复习资料——概论⼀元和多元线性回归习题概论、⼀元线性回归、多元线性回归习题⼀、单项选择题1. 总体回归线是指( ) A )样本观测值拟合的最好的曲线 B )使残差平⽅和最⼩的曲线C )解释变量X 取给定值时,被解释变量Y 的样本均值的轨迹D )解释变量X 取给定值时,被解释变量Y 的条件均值或期望值的轨迹2. 指出下列哪⼀变量关系是确定函数关系⽽不是相关关系? () A. 商品销售额与销售价格 B. 学习成绩总分与各门课程成绩分数 C. 物价⽔平与商品需求量 D. ⼩麦亩产量与施肥量3. 经济计量分析⼯作的基本⼯作步骤是-() A .设定理论模型→收集样本资料→估计模型参数→检验模型B .设定模型→估计参数→检验模型→应⽤模型C .理论分析→数据收集→计算模拟→修正模型D .确定模型导向→确定变量及⽅程式→应⽤模型4. 若⼀元线性回归模型Y=β1+β2X +u 满⾜经典假定,那么参数β1、β2的普通最⼩⼆乘估计量β^1、β^2是所有线性估计量中( )A )⽆偏且⽅差最⼤的B )⽆偏且⽅差最⼩的C )有偏且⽅差最⼤的D )有偏且⽅差最⼩的5. 在⼀元线性回归模型Y=β1+β2X +u 中,若回归系数β2通过了t 检验,则表⽰( ) A )β^2≠0 B )β2≠0 C )β2=0 D )β^=06. 在多元线性回归模型Y=β1+β2X 2+β3X 3 +β4X 4+u 中,对回归系数βj (j=2,3,4)进⾏显著性检验时,t 统计量为( )A )()jjSe ββ?? B )()j j Se ββ C )()j j Var ββ D )()j j Var ββ??7. 在⼆元线性回归模型中,回归系数的显著性t 检验的⾃由度为( )。

A. n B. n-1 C. n-2 D. n-38. 普通最⼩⼆乘法要求模型误差项u i 满⾜某些基本假定,下列结论中错误的是( )。

A. E(u i )=0 B. E(2i u )=2i σC. E(u i u j )=0D. u i ~N(0.σ2)9. 对模型Yi=β0+β1X1i+β2X2i+µi 进⾏总体显著性F 检验,检验的零假设是( ) A. β1=β2=0 B. β1=0 C. β2=0 D. β0=0或β1=010. 在多元线性回归中,判定系数R 2随着解释变量数⽬的增加⽽() A.减少 B .增加 C .不变 D .变化不定11. 已知三元线性回归模型估计的残差平⽅和为8002=∑te,估计⽤样本容量为24=n ,则随机误差项t u 的⽅差估计量2S 为( )。

一元线性回归案例

一元线性回归案例

例8. 集装箱吞吐量与外贸额
2001-2006年中国集装箱吞吐量增长与外贸 额增长的弹性分析.以Y表示集装箱吞吐量 (百万标准箱),X表示外贸额(百亿美元). OLS回归方程为 Y=3.7667+0.509X (2.06) (31.78) t (5)=2.776 n=6 R^2=0.996
0.1
例8. 集装箱吞吐量与外贸额
例8. 集装箱吞吐量与外贸额
2001-2007年中国集装箱吞吐量增长与外贸 额增长的弹性分析.以Y表示集装箱吞吐量 增长率(%),X表示外贸额增长率(%). OLS回归方程为 Y=18.449+0.3155X (2.3982) (1.078) t (5)=2.015 n=7 R^2=0.1887
0.1
例4. 考试分数与出勤率
假如期末考试的分数(score)取决于出勤率 (attend)和影响考试成绩的其他无法观测因素 (如学生能力等): score= β1+β2 attend+u 许多不加分析的回归发现: 这一回归中β2 〈0,即分数与出勤率负相关. 这一模型在什么情况下满足均值独立条件? 除非学生学习能力、学习攻击、年龄及其他因素与 出勤率无关,但这几乎不可能.
例3. 静态菲利普斯曲线
时间序列数据 令inf(t)表示年通货膨胀率,unem(t)表示事业率, 下 列菲利普斯曲线假定了一个不变的自然失业率和 固定的通货膨胀率预期. Inf(t)=β1+β2 unem(t)+u 依据1948-1996年美国经济数据, OLS回归方程为 Inf(t)=1.42+0.468 unem(t) (1.72) (0.289) n=49 R^2=0.053
例5. 学校的数学成绩与学校午餐项目

一元线性回归分析案例

一元线性回归分析案例

求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的线性相 关关系,因此可以用线性回归方程刻画它们之间 的关系。
第17页/共39页
课题:选修2-3 8.5 回归分析案例
分析:由于问题中要求根 据身高预报体重,因此选 取身高为自变量,体重为 因变量.
再冷的石头,坐上三年也会暖 !
1. 散点图;
2.回归方程: yˆ 0.849x 85.172 身高172cm女大学生体重 yˆ = 0.849×172 - 85.712 = 60.316(kg)
本例中, r=0.798>0.75.这表明体重与身高有很强的线性相关关系,从而也表明我们 建立的回归模型是有意义的。
xi2
2
nx
,......(2)
i 1
i 1
其中x
1 n
n i 1
xi ,
y
1 n
n i 1
yi .
(x, y) 称为样本点的中心。
第8页/共39页
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
1、回归直线方程
1、所求直线方程叫做回归直线方程;
相应的直线叫做回归直线。
2、对两个变量进行的线性分析叫做线性回归分析。
然后,我们可以通过残差 e1, e2 , , en 来判断模型拟合的效果,
判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析。
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
编号 1
2
3
4
5

一元线性回归模型及其应用

一元线性回归模型及其应用

题型二 一元线性回归模型的应用
[探究发现]
(1)残差平方和与R2有怎样的关系?
n
yi-^yi2
i=1
提示:R2=1-
,即残差平方和越小,R2 越大.
n
yi--y 2
i=1
(2)R2的大小对模型的拟合效果有怎样的影响?
提示:R2越大,说明残差平方和越小,即模型的拟合效果越好.
[学透用活] [典例2] 假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5 组数据如下:
解:(1) x =16×(8+8.2+8.4+8.6+8.8+9)=8.5, y =16×(90+84+83+80+75+68)=80, ^a= y +20 x =80+20×8.5=250, 所以经验回归方程为^y=-20x+250. (2)工厂获得的利润 z=(x-4)y=-20x2+330x-1 000, 由二次函数知识可知当 x=343时,zmax=361.25(元). 故该产品的单价应定为 8.25 元.
2.一元线性回归模型参数的最小二乘估计 (1)经验回归方程:
对于一组具有线性相关关系的成对样本数据(x1,y1),(x2,y2),…,(xn,yn),
n
xi--x yi--y
n xiyi-n-x -y
i=1
i=1
由最小二乘法得^b=


n
xi--x 2
n x2i -n-x 2
i=1
i=1
^a=-y -^b-x .
(二)基本知能小试
1.判断正误
(1)在一元线性回归模型中,e 是 bx+a 预报真实值 y 的随机误差,它是一个
可观测的量.
()
(2)用最小二乘法求出的^b可能是正的,也可能是负的. (3)残差平方和越大,线性回归模型的拟合效果越好. (4)经验回归方程^y=^bx+^a必过点(-x ,-y =1 076.2.

贾俊平第四版统计学-第十一章一元线性回归练习答案

贾俊平第四版统计学-第十一章一元线性回归练习答案

第十一章一元线性回归练习题答案二.填空题 1. 不能;因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验;t 检验;2.图1;不能;因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。

三.计算题1.(1) SSR 的自由度是1,SSE 的自由度是18。

(2)2418/6080220/1/==-=SSE SSR F(3)判定系数%14.57140802===SST SSR R 在y 的总变差中,由57.14%的变差是由于x 的变动说引起的。

(4)7559.05714.02-=-=-=R r相关系数为-0.7559。

(5)线性关系显著和:线性关系不显著和y x y x H 10H :因为414.424=>=αF F,所以拒绝原假设,x 与y 之间的线性关系显著。

2.(1)方差分析表df SS MS F Significance F回归分析 1 425 425 85 0.017 残差 15 75 5 - - 总计16500---(2)判定系数%8585.05004252====SST SSR R表明在维护费用的变差中,有85%的变差可由使用年限来解释。

(3)9220.085.02===R r二者相关系数为0.9220,属于高度相关(4)x y248.1388.6ˆ+= 分布;显著。

的自由度为t n r n r t 2);12||2---=回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。

(5)线性关系显著性检验:线性关系显著:生产费用和产量之间性关系不显著生产费用和产量之间线10:H H因为Significance F=0.017<05.0=α,所以线性关系显著。

(6)348.3120248.1388.6248.1388.6ˆ==⨯++=x y当产量为10时,生产费用为31.348万元。

计量经济学章节练习题(第二章 一元线性回归模型)已改

计量经济学章节练习题(第二章  一元线性回归模型)已改

第二章 一元线性回归模型一、单项选择题1、表示X 与Y 之间真实线性关系的是【 】A tt X Y 10ˆˆˆββ+= B E t t X X Y 10)(ββ+= C t t t u X Y ++=10ββ D t t X Y 10ββ+=2、参数β的估计量βˆ具备有效性是指【 】 A Var(βˆ)=0 B Var(βˆ)为最小 C (βˆ-β)=0 D (βˆ-β)为最小 3、设样本回归模型为i i i e X Y ++=10ˆˆββ,则普通最小二乘法确定的iβˆ的公式中,错误的是【 】 A∑∑---=21)())((ˆX X Y Y X X ii iβ B ∑∑∑∑∑--=221)(ˆi ii i i i X X n Y X Y X n βC ∑∑-⋅-=221)(ˆX n X YX n Y X ii i β D 21ˆxii i i Y X Y X n σβ∑∑∑-= 4、对于ii i e X Y ++=10ˆˆββ,以σˆ表示估计标准误差,r 表示相关系数,则有【 】 A σˆ=0时,r =1 B σˆ=0时,r =-1 C σˆ=0时,r =0 D σˆ=0时,r =1 或r =-1 5、产量(X ,台)与单位产品成本(Y , 元/台)之间的回归方程为Yˆ=356-1.5X ,这说明【 】A 产量每增加一台,单位产品成本增加356元B 产量每增加一台,单位产品成本减少1.5元C 产量每增加一台,单位产品成本平均增加356元D 产量每增加一台,单位产品成本平均减少1.5元6、在总体回归直线E X X Y 10)(ββ+=中,1β表示【 】 A 当X 增加一个单位时,Y 增加1β个单位B 当X 增加一个单位时,Y 平均增加1β个单位C 当Y 增加一个单位时,X 增加1β个单位D 当Y 增加一个单位时,X 平均增加1β个单位7、对回归模型t t t u X Y ++=10ββ进行统计检验时,通常假定t u 服从【 】 A N (0,2i σ) B t(n-2) C N (0,2σ) D t(n)8、以Y 表示实际观测值,Yˆ表示回归估计值,则普通最小二乘法估计参数的准则是使【 】 A )ˆ(iiYY -∑=0 B 2)ˆ(iiY Y -∑=0 C)ˆ(iiYY -∑为最小 D 2)ˆ(iiY Y -∑为最小9、设Y 表示实际观测值,Yˆ表示OLS 回归估计值,则下列哪项成立【 】 A Y Y=ˆ B Y Y =ˆ C Y Y=ˆ D Y Y =ˆ 10、用普通最小二乘法估计经典线性模型t t t u X Y ++=10ββ,则样本回归线通过点【 】A (X ,Y )B (X ,Y ˆ)C (X ,Yˆ) D (X ,Y ) 11、以Y 表示实际观测值,Yˆ表示回归估计值,则用普通最小二乘法得到的样本回归直线 ii X Y 10ˆˆˆββ+=满足【 】 A )ˆ(iiYY -∑=0 B 2)ˆ(Y Y i-∑=0 C2)ˆ(iiY Y -∑=0 D2)(Y Y i-∑=012、用一组有30个观测值的样本估计模型t t t u X Y ++=10ββ,在0.05的显著性水平下对1β的显著性作t 检验,则1β显著地不等于零的条件是其统计量t 大于【 】A 05.0t (30)B 025.0t (30)C 05.0t (28)D 025.0t (28)13、已知某一直线回归方程的判定系数为0.64,则解释变量与被解释变量间的相关系数可能为【 】A 0.64B 0.8C 0.4D 0.32 14、相关系数r 的取值范围是【 】A r ≤-1B r ≥1C 0≤ r ≤1D -1≤ r ≤1 15、判定系数2R 的取值范围是【 】A 2R ≤-1B 2R ≥1C 0≤2R ≤1D -1≤2R ≤1 16、某一特定的X 水平上,总体Y 分布的离散度越大,即2σ越大,则【 】 A 预测区间越宽,精度越低 B 预测区间越宽,预测误差越小 C 预测区间越窄,精度越高 D 预测区间越窄,预测误差越大 17、在缩小参数估计量的置信区间时,我们通常不采用下面的那一项措施【 】 A 增大样本容量 n B 提高置信水平C 提高模型的拟合优度D 提高样本观测值的分散度18、对于总体平方和TSS 、回归平方和ESS 和残差平方和RSS 的相互关系,正确的是【 】 A TSS>RSS+ESS B TSS=RSS+ESS C TSS<RSS+ESS D TSS 2=RSS 2+ESS 219、对样本相关系数r ,以下结论中错误..的是【 】 A r 越接近于1,Y 与X 之间线性相关程度越高 B r 越接近于0,Y 与X 之间线性相关程度越弱 C -1≤r ≤1D 若r=0,则X 与Y 独立20、若两变量x 和y 之间的相关系数为-1,这说明两个变量之间【 】 A 低度相关 B 不完全相关 C 弱正相关 D 完全相关21、普通最小二乘法要求模型误差项u i 满足某些基本假定,下列结论中错误的是【 】。

一元线性回归模型(习题与解答)

一元线性回归模型(习题与解答)

要求: ,即条件期望值; (1)对每一收入水平,计算平均的消费支出,E(Y︱Xi)
5
(2)以收入为横轴、消费支出为纵轴作散点图; (3)在散点图中,做出(1)中的条件均值点; (4)你认为 X 与 Y 之间、X 与 Y 的均值之间的关系如何? (5)写出其总体回归函数及样本回归函数;总体回归函数是线性的还是非线性的? 2-24.根据上题中给出的数据,对每一个 X 值,随机抽取一个 Y 值,结果如下:


∑ ( n − xW ) y
i =1 i
n
Байду номын сангаас
1
i

里 Wi =
xi
∑ xi

2
,i=1,2,…,n。 2-15.已知两个量 X 和 Y 的一组观察值(xi,yi) 证明:Y 的真实值和拟合值有共同的均值。 因为散点图上的点 ( Ci , Yi ) 2-16. 一个消费分析者论证了消费函数 C i = a + bYi 是无用的, 不在直线 C i = a + bYi 上。他还注意到,有时 Yi 上升但 Ci 下降。因此他下结论:Ci 不是 Yi 的函数。请你评价他的论据(这里 Ci 是消费,Yi 是收入) 。 2-17.证明:仅当 R2=1 时,y 对 x 的线性回归的斜率估计量等于 x 对 y 的线性回归的斜率 估计量的倒数。 2-18.证明:相关系数的另一个表达式是: r = 系数的估计值,Sx、Sy 分别为样本标准差。 2-19.对于经济计量模型: Yi = b0 + b1 X i + u i ,其 OLS 估计参数 b1 的特性在下列情况下 会受到什么影响: (1)观测值数目 n 增加; (2)Xi 各观测值差额增加; (3)Xi 各观测值近 似相等; (4)E(u2)=0 。 2-20.假定有如下的回归结果: Yt = 2.6911 − 0.4795 X t ,其中,Y 表示美国的咖啡的消费 量(每天每人消费的杯数) ,X 表示咖啡的零售价格(美元/杯) ,t 表示时间。

一元线性回归模型案例

一元线性回归模型案例

一元线性回归模型案例一元线性回归模型是统计学中最基本、应用最广泛的一种回归分析方法,可以用来探究自变量与因变量之间的线性关系。

一元线性回归模型的数学公式为:y = β0 + β1x,其中y表示因变量,x表示自变量,β0和β1分别为截距和斜率。

下面以一个实际案例来说明一元线性回归模型的应用。

假设我们有一组数据,其中x表示一个房屋的面积,y表示该房屋的售价,我们想利用一元线性回归模型来预测房屋的售价。

首先,我们需要收集一组已知数据,包括房屋的面积和售价。

假设我们收集了10个不同房屋的面积和售价数据,如下所示:房屋面积(x)(平方米)售价(y)(万元)80 12090 130100 140110 150120 160130 170140 180150 190160 200170 210我们可以根据这组数据绘制散点图,横坐标表示房屋面积x,纵坐标表示售价y,如下所示:(插入散点图)接下来,我们可以利用最小二乘法来拟合一条直线,使其能够最好地拟合这些散点。

最小二乘法是一种最小化误差平方和的方法,可以得到最优的拟合直线。

根据一元线性回归模型的公式,可以通过计算拟合直线的斜率β1和截距β0来实现最小二乘法。

其中,斜率β1可以通过下式计算得到:β1 = n∑(xiyi) - (∑xi)(∑yi)n∑(xi^2) - (∑xi)^2截距β0可以通过下式计算得到:β0 = (1/n)∑yi - β1(1/n)∑xi通过带入已知数据,我们可以计算得到斜率β1和截距β0的具体值。

在本例中,计算结果如下:β1 ≈ 1.0667β0 ≈ 108.6667最后,利用得到的斜率β1和截距β0,我们可以得到一元线性回归模型的具体公式为:y ≈ 108.6667 + 1.0667x我们可以利用这个回归模型进行预测。

例如,如果有一个房屋的面积为130平方米,那么根据回归模型,可以预测该房屋的售价为170 + 108.6667 ≈ 278.6667万元。

一元线性回归习题答案

一元线性回归习题答案

一元线性回归习题答案一元线性回归是统计学中常用的一种回归分析方法,用于研究两个变量之间的关系。

在实际应用中,我们常常需要根据给定的数据集来建立一元线性回归模型,并通过该模型来预测或解释变量之间的关系。

本文将通过一些习题来解答一元线性回归的相关问题。

假设我们有一组数据集,包含了自变量x和因变量y的取值。

我们的目标是建立一个线性回归模型,用于预测y在给定x值时的取值。

首先,我们需要计算相关系数r来衡量x和y之间的线性关系强度。

相关系数的取值范围为-1到1,接近1表示正相关,接近-1表示负相关,接近0表示无相关。

接下来,我们可以使用最小二乘法来估计回归方程的参数。

最小二乘法的基本思想是通过最小化误差平方和来确定回归方程的参数。

回归方程的一般形式为y = a + bx,其中a为截距,b为斜率。

我们可以通过计算公式来求解a和b的值。

在实际计算中,我们可以使用统计软件或编程语言来进行计算。

例如,使用Python中的scikit-learn库可以很方便地进行一元线性回归分析。

以下是一个使用Python进行一元线性回归的示例代码:```pythonimport numpy as npfrom sklearn.linear_model import LinearRegression# 定义自变量和因变量的取值x = np.array([1, 2, 3, 4, 5])y = np.array([2, 4, 6, 8, 10])# 将自变量转换为二维数组X = x.reshape(-1, 1)# 创建线性回归模型model = LinearRegression()# 拟合数据model.fit(X, y)# 输出回归方程的参数print("截距a =", model.intercept_)print("斜率b =", model.coef_)```运行以上代码,我们可以得到回归方程的参数值。

应用回归分析-第2章课后习题参考答案

应用回归分析-第2章课后习题参考答案

第二章 一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答: 假设1、解释变量X 是确定性变量,Y 是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=σ2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, σ2 ) i=1,2, …,n 2.2 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n误差εi (i=1,2, …,n )仍满足基本假定。

求β1的最小二乘估计 解: 得:2.3 证明(2.27式),∑e i =0 ,∑e i X i =0 。

证明:∑∑+-=-=nii i ni X Y Y Y Q 121021))ˆˆ(()ˆ(ββ其中: 即: ∑e i =0 ,∑e i X i =02.4回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。

答:由于εi ~N(0, σ2 ) i=1,2, …,n所以Y i =β0 + β1X i + εi ~N (β0+β1X i , σ2 ) 最大似然函数:使得Ln (L )最大的0ˆβ,1ˆβ就是β0,β1的最大似然估计值。

同时发现使得Ln (L )最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。

值得注意的是:最大似然估计是在εi ~N (0, σ2 )21112)ˆ()ˆ(i ni i ni ii e X Y Y Y Q β∑∑==-=-=01ˆˆˆˆi ii i iY X e Y Y ββ=+=-0100ˆˆQQββ∂∂==∂∂的假设下求得,最小二乘估计则不要求分布假设。

一元线性回归模型练习题(无计算)

一元线性回归模型练习题(无计算)

一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类()。

A 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系2、进行相关分析时的两个变量()。

A 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以3、参数?的估计量βˆ具备有效性是指()AVar(βˆ)=0BVar(βˆ)为最小C(βˆ-?)=0D(βˆ-?4、产量(X ,台)与单位产品成本(Y ,元/A 产量每增加一台,单位产品成本增加356元B 产量每增加一台,单位产品成本减少1.5元C 产量每增加一台,单位产品成本平均增加356D 产量每增加一台,单位产品成本平均减少1.55、对于YAˆ0σ=C ˆ0σ= 6、对于r 表示相关系数,则有()。

A ˆ0σ=r=1r=-1时,或 7、设Y 。

8、用。

9t ε服从()AN (0,i σ)Bt(n-2)CN (0,)Dt(n)10、以y 表示实际观测值,yˆ表示回归估计值,则普通最小二乘法估计参数的准则是使()A )ˆ(i i y y -∑=0B 2)ˆ(i i y y -∑=0C )ˆ(i i y y -∑为最小D 2)ˆ(i i y y -∑为最小11、下列各回归方程中,哪一个必定是错误的?()A.Y i =50+0.6X i r XY =0.8B.Y i =-14+0.8X i r XY =0.87C.Y i =15-1.2X i r XY =0.89D.Y i =-18-5.3X i r XY =-0.9612、已知某一直线回归方程的可决系数为0.81,则解释变量与被解释变量间的线性相关系数的绝对值为()A.0.81B.0.90C.0.66D.0.3213、对于线性回归模型Y i =β0+β1X i +μi ,要使普通最小二乘估计量具备无偏性,则模型必须满足()A.E(μi )=0B.Var(μi )=σ2C.Cov(μi ,μj )=0D.μi 服从正态分布 14、用一组有30个观测值的样本估计模型tt t u x y ++=10ββ,在0.05的显着性水平下对1β的显着性作t 检验,则1β显着地不等于零的条件是其统计量t 大于()A 05.0t (30)B 025.0t (30)C 05.0t (28)D 025.0t (28)15、某一特定的x 水平上,总体y 分布的离散度越大,即2σ越大,则()A 预测区间越宽,精度越低BC 预测区间越窄,精度越高D 16、回归模型i i i u X Y ++=10ββ中,关于检验0H 的是()。

一元线性回归模型习题与答案

一元线性回归模型习题与答案

一元线性回归模型习题与答案1、为什么模型中要引入随机扰动项?2、令kid表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。

生育率对教育年数的简单回归模型为:kid01educ(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。

3、已知回归模型EN,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。

随机扰动项的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释和满足线性、无偏性及有效性吗?简单陈述理由。

和(2)OLS估计量(3)对参数的假设检验还能进行吗?简单陈述理由。

2.690.48某,其中,Y表示墨西哥的咖啡消费量4、假定有如下的回归结果:Ytt(每天每人消费的杯数),某表示咖啡的零售价格(单位:美元/杯),t表示时间。

问:(1)这是一个时间序列回归还是横截面序列回归做出回归线。

(2)如何解释截距的意义它有经济含义吗如何解释斜率(3)能否求出真实的总体回归函数(4)根据需求的价格弹性定义:弹性=斜率某某/Y,依据上述回归结果,你能求出对咖啡需求的价格弹性吗如果不能,计算此弹性还需要其他什么信息5、选择一个经济问题,建立一元线性回归模型,利用EView软件进行回归分析,写出详细的分析步骤。

6、令Y表示一名妇女生育孩子的生育率,某表示该妇女接受教育的年数。

生育率对教育年数的简单回归模型为:Y01某(1)随机干扰项包含什么样的因素?他们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其它条件不变下的影响吗?请解释?Y,使用美国36年的年度7、对于人均存款与人均收入之间的关系式Sttt数据,得到如下估计模型(括号内为标准差)384.1050.067YStt(151.105)(0.011)R0.538(1)的经济解释是什么?(2)和的符号是什么?为什么?(3)你对于拟合优度的看法?2答:1、随机扰动项是模型中表示其它多种因素的综合影响。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一元线性回归模型
一、单项选择题
1、变量之间的关系可以分为两大类( )。

A 函数关系与相关关系
B 线性相关关系和非线性相关关系
C 正相关关系和负相关关系
D 简单相关关系和复杂相关关系 2、进行相关分析时的两个变量( )。

A 都是随机变量
B 都不是随机变量
C 一个是随机变量,一个不是随机变量
D 随机的或非随机都可以
3、参数β的估计量βˆ
具备有效性是指( )
A Var(βˆ)=0
B Var(βˆ)为最小
C (βˆ-β)=0
D (βˆ
-β)为最小
4、产量(X ,台)与单位产品成本(Y , 元/台)之间的回归方程为Ŷi =356-1.5X i ,这说明( )
A 产量每增加一台,单位产品成本增加356元
B 产量每增加一台,单位产品成本减少1.5元
C 产量每增加一台,单位产品成本平均增加356元
D 产量每增加一台,单位产品成本平均减少1.5元
5、对于01ˆˆi i i Y X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示估计值,则( )。

A i i ˆˆ0Y Y 0σ∑=时,(-)=
B
2i i ˆˆ0Y Y σ∑=时,(-)=0
C
i i ˆˆ0Y Y σ∑=时,(-)为最小
D
2i i ˆˆ0Y Y σ∑=时,(-)为最小
6、对于i 01i i ˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有( )。

A ˆ0r=1σ
=时, B ˆ0r=-1σ=时, C ˆ0r=0σ=时, D ˆ0r=1r=-1σ=时,或 7、设Y 表示实际观测值,ˆY 表示OLS 估计回归值,则下列哪项成立( )。

ˆˆA Y
Y B Y Y ˆˆC Y Y D Y Y = = = = ˆˆA Y
Y B Y Y ˆˆ
C Y Y
D Y Y = = = =
8、用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点( )。

ˆA X Y B X Y ˆC X Y D X Y (,) (,) (,) (,) ˆA X Y B X Y
ˆ
C X Y
D X Y (,) (,) (,) (,)
9、对回归模型t t t x y εββ++=10进行统计检验时,通常假定t ε服从( )
A N (0,2i σ)
B t(n-2)
C N (0,2σ)
D t(n)
10、以y 表示实际观测值,y ˆ表示回归估计值,则普通最小二乘法估计参数的准则是使( )
A )ˆ(i i
y
y
-∑=0 B 2)ˆ(i i
y
y -∑
=0 C )ˆ(i i
y
y
-∑
为最小 D 2)ˆ(i i
y
y -∑
为最小
11、下列各回归方程中,哪一个必定是错误的?( ) A. Y i =50+0.6X i r XY =0.8
B.Y i =-14+0.8X i r XY =0.87
C. Y i =15-1.2X i r XY =0.89
D. Y i =-18-5.3X i r XY =-0.96
12、已知某一直线回归方程的可决系数为0.81,则解释变量与被解释变量间的线性相关系数的绝对值为( ) A. 0.81
B. 0.90
C. 0.66
D. 0.32
13、对于线性回归模型Y i =β0+β1X i +μi ,要使普通最小二乘估计量具备无偏性,则模型必须满足( ) A. E(μi )=0
B. Var(μi )=σ2
C. Cov(μi ,μj )=0
D. μi 服从正态分布
14、用一组有30个观测值的样本估计模型
t
t t u x y ++=10ββ,在0.05的显著性水平下对1
β的显著性作t 检验,则1β显著地不等于零的条件是其统计量t 大于( ) A
05
.0t (30) B
025
.0t (30) C
05
.0t (28) D
025
.0t (28)
15、某一特定的x 水平上,总体y 分布的离散度越大,即2
σ越大,则( ) A 预测区间越宽,精度越低 B 预测区间越宽,预测误差越小 C 预测区间越窄,精度越高 D 预测区间越窄,预测误差越大
16、回归模型
i
i i u X Y ++=10ββ中,关于检验
10=β:H 所用的统计量
)ˆ(ˆ1
1
1
βββ
Var -,下列说
法正确的是( )。

A 服从)(22-n χ
B 服从)(1-n t
C 服从)(12
-n χ D 服从)(2-n t
17、对于总体平方和TSS 、回归平方和RSS 和残差平方和ESS 的相互关系,正确的是( )A TSS>RSS+ESS B TSS=RSS+ESS C TSS<RSS+ESS D TSS 2=RSS 2+ESS 2
18、对于随机误差项εi ,Var(εi )=E(ε2i
)=σ2内涵指( )
A .随机误差项的均值为零
B .所有随机误差都有相同的方差
C .两个随机误差互不相关
D .误差项服从正态分布
19、在古典假设成立的条件下用OLS 方法估计线性回归模型参数,则参数估计量具有( )的统计性质。

A .有偏特性 B. 非线性特性 C .最小方差特性 D. 非一致性特性 20、关于可决系数2
R ,以下说法中错误的是( )
A.可决系数2
R 的定义为被回归方程已经解释的变差与总变差之比 B. []20,1R ∈
C.可决系数2R 反映了样本回归线对样本观测值拟合优劣程度的一种描述
D.可决系数2R 的大小不受到回归模型中所包含的解释变量个数的影响 二、多项选择题
1、指出下列哪些现象是相关关系( )。

A 家庭消费支出与收入
B 商品销售额与销售量、销售价格
C 物价水平与商品需求量
D 小麦高产与施肥量
E 学习成绩总分与各门课程分数 2、一元线性回归模型
i 01i i
Y X u ββ+=+的经典假设包括( )。

A ()0
t E u = B 2
var()t u σ= C cov(,)0t s u u = D (,)0
t t Cov x u = E 2~(0,)t u N σ
3、以Y 表示实际观测值,ˆY 表示OLS 估计回归值,e 表示残差,则回归直线满足( )。

i
i
2i i 2i i i i A X Y ˆB Y Y
ˆC Y Y 0
ˆD Y Y 0E cov(X ,e )=0∑∑∑∑ 通过样本均值点(,)
= (-)= (-)= i
i 2
i
i 2
i
i
i i A X Y ˆB Y Y
ˆC Y Y 0ˆD Y Y 0
E cov(X
,e )=0∑∑
∑∑ 通过样本均值点(,) = (-)= (-)= 
4、ˆY 表示OLS 估计回归值,u 表示随机误差项,e 表示残差。

如果Y 与X 为线性相关关系,
则下列哪些是正确的( )。

i 01i
i
1
i
i 01i i i 01i i
i 01i A E Y X ˆˆB Y X ˆˆC Y X e ˆˆˆD Y X e ˆˆE E(Y )X βββ
βββββββ+++++++ ()= = === i
1
i
i 01i i
i
1
i
i
i 01i A E Y X ˆˆB Y X ˆˆC Y X e ˆˆˆD Y
X e ˆˆE E(Y )X ββββββββββ+++++++ ()= = ===
5、ˆY 表示OLS 估计回归值,u 表示随机误差项。

如果Y 与X 为线性相关关系,则下列哪些
是正确的( )。

i 01i
i 01i i i 01i i i 01i i i 01i A Y X B Y X u ˆˆC Y X u ˆˆˆD Y X u ˆˆˆE Y X ββββββββββ+++++++ = =+ === i 01i i i 01i i i 01i i i 01i A Y X B Y X u ˆˆC Y X u ˆˆˆD Y X u ˆˆˆE Y X ββββββββββ+++++++ = =+ ===
6、由回归直线i 01i ˆˆˆY X ββ+=估计出来的i ˆY 值( )。

A 是一组估计值
B 是一组平均值
C 与实际值Y 的离差之和等于零
D 可能等于实际值Y 7、判定系数R 2可表示为( )。

A
2RSS R =
TSS B 2ESS R =TSS C 2RSS R =1-TSS D 2ESS R =1-TSS E 2ESS
R =
ESS+RSS
8、线性回归模型的变通最小二乘估计的残差i e
满足( )。

A i e 0

= B i i e Y 0

= C i i
ˆe Y 0∑
= D i i e X 0

= E
i i cov(X ,e )=0
三、判断题
⒈随机误差项μi 与残差项e i 是一回事。

( )
⒉对一元线性回归模型,假定误差项μi 服从正态分布。

( ) ⒊线性回归模型意味着因变量和自变量线性相关。

( )
⒋在线性回归模型中,解释变量是原因,被解释变量是结果。

( )。

相关文档
最新文档