应用回归分析第章课后习题参考答案Word版

合集下载

《应用回归分析》课后习题部分答案-何晓群版

《应用回归分析》课后习题部分答案-何晓群版

第二章 一元线性回归2.14 解答:(1)散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑ 2n 01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363110/3=++++=6.1σ∧=(5)由于211(,)xxN L σββ∧t σ∧==服从自由度为n-2的t 分布。

因而/2||(2)1P t n αασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(p t t ααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为(7-2.3537+2.353 即为:(2.49,11.5)2201()(,())xxx Nn L ββσ-∧+t ∧∧==服从自由度为n-2的t 分布。

因而/2|(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1p βσββσα∧∧∧∧-<<+=- 可得195%7.77,5.77β∧-的置信度为的置信区间为()(6)x 与y 的决定系数22121()490/6000.817()ni i nii y y r y y ∧-=-=-==≈-∑∑(7)由于(1,3)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。

(8)t σ∧==其中2221111()22n ni i i i i e y y n n σ∧∧====---∑∑ 7 3.661==≈/2 2.353t α= /23.66t t α=>∴接受原假设01:0,H β=认为1β显著不为0,因变量y 对自变量x 的一元线性回归成立。

应用回归分析人大前四章课后习题答案详解Word版

应用回归分析人大前四章课后习题答案详解Word版
3.9证明y与自变量 的偏决定系数与(3.42)偏F检验值 是等价的。37
3.10验证决定系数 与F值之间的关系式: 38
3.11研究货运总量y(万吨)与工业总产值38
1)计算出y, x1 ,x2, x3的相关系数矩阵39
2)求y关于x1, x2, x3的三元线性回归方程40
3)对所求的的方程作拟合优度检验41
③不论是时间序列数据还是横截面数据的手机,样本容量的多少一般要与设置的解释变量数目相配套。
4)统计数据的整理中不仅要把一些变量数据进行折算,差分,甚至把数据对数化,标准化等,有时还须注意剔除个别特别大或特别小的“野值”,有时需要利用差值的方法把空缺的数据补齐。
1.7构造回归理论模型的基本根据是什么?
1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?31
2)建立y对x的线性回归;32
3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。32
3多元线性回归34
3.1写出多元线性回归模型的矩阵表示形式,并给出多元线性回归模型的基本假设。34
3.2讨论样本容量n与自变量个数p的关系,它们对模型的参数估计有何影响?35
由于许多经济变量的前后期之间总是有关联的,因此时间序列数据容易产生模型中随机误差项的序列相关。对于具有随机误差项序列相关的情况,就要通过对数据的某种计算整理来消除序列相关性,最常用的处理方法是差分法。
②横截面数据是在同一时间截面上的统计数据。由于一个回归模型往往涉及众多解释变量,如果其中某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同影响,就产生异方差。因此当用截面数据作样本时,容易产生异方差。对于具有异方差性的建模问题,数据整理就是注意消除异方差性,这常与模型参数估计方法结合起来考虑。

应用回归分析第四版答案

应用回归分析第四版答案

应用回归分析第四版答案【篇一:应用回归分析人大版前四章课后习题答案详解】应用回归分析(1-4章习题详解)(21世纪统计学系列教材,第二(三)版,何晓群,刘文卿编著中国人民大学出版社)目录1 回归分析概述 ....................................................................................................... (6)1.1 变量间统计关系和函数关系的区别是什么? (6)1.2 回归分析与相关分析的区别与联系是什么? (7)1.3回归模型中随机误差项?的意义是什么? (7)1.4线性回归模型的基本假设是什么? (7)1.5 回归模型的设置理论根据是什么?在回归变量设置中应该注意哪些问题? (8)1.6收集,整理数据包括哪些内容? (8)1.7构造回归理论模型的基本根据是什么? (9)1.8为什么要对回归模型进行检验? (9)1.9回归模型有哪几个方面的应用? (10)1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合? (10)2 一元线性回归 ....................................................................................................... . (10)2.1一元线性回归模型有哪些基本假定? (10)2.2考虑过原点的线性回归模型足基本假定,求ny??*x??i1ii,i?1,2,...n 误差?1,?2,...?n仍满?1的最小二乘估计。

.............................................................................. 11 n2.3证明?e?o,?xe?0. .................................................................................. . (11)i?1ii?1ii2.4回归方程e(y)????x的参数?,?o101的最小二乘估计与最大似然估计在什么条件下等价?给出理由? (12)2.5证明??0是??0的无偏估计。

应用回归分析课后习题

应用回归分析课后习题
合理的解释,不妨在学过第 6 章多重共线性后再来解释这个问题,在学过第七章岭回归后再 来改进这个问题。
#;
.
第四章 习题
4.1 试举例说明产生异常差的原因。 4.2 异常差性带来的后果有哪些? 4.3 阐述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。 4.4 阐述用加权最小二乘法消除多元线性回归中异常差性的思想与方法。 4.5 验证(4.5)式一元加权最小二乘回归系数估计公式。 4.6 验证(4.8)式多元加权最小二乘回归系数估计公式。 4.7 有同学认为当数据存在异常差时,加权最小二乘回归方程与普通最小二乘回归方程之间 必然有很大的差异,异常差越严重,两者之间的差异就越大。你是否同意这位同学的观点? 说明原因。
(8) 做回归系数 1 显著性的检验
(9) 做相关系数的显著性检验 (10) 对回归方程做残差图并作相应的分析
#;
. (11) 该公司预计下一周签发新保单 x0 1000 ,需要的加班时间是多少。 (12) 给出 y0 的置信度为 95%的精确预测区间和近似预测区间。 (13) 给出 Ey0 的置信度为 95%的区间估计。
3.9 证明 y 与自变量 x j 的偏决定系数与(3.42)式的偏 F 检验值 Fj 是的等价的。
3.10* 验证决定系数与 F 值之间的关系式
R2
F
n
F p
1
p
3.11 研究货运总量 y(万吨)与工业总产值 x1 (亿元)、农业总产值 x2 (亿元)、居民非商
品支出 x3 (亿元)的关系。数据见表 3.9。
2.16* 表 2.8 是 1985 年美国 50 个州和哥伦比亚特区公立学校中教师的人均年工资 y(美元) 和对学生的人均经费收入 x(美元)。 (1)绘制 y 对 x 的散点图,可以用直线回归描述两者之间的关系吗? (2)建立 y 对 x 的线性回归。 (3)用线性回归的 Plots 功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假 设。

应用回归分析-课后习题答案-何晓群

应用回归分析-课后习题答案-何晓群

第二章 一元线性回归解答:(1)散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑ 2n 01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363110/3=++++=6.1σ∧=≈(5)由于2 11(,)xxNLσββ∧tσ∧==服从自由度为n-2的t分布。

因而/2|(2)1P t nαασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(p t tααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为(7-2.3537+2.353即为:(,)22001()(,())xxxNn Lββσ-∧+t∧∧==服从自由度为n-2的t分布。

因而/2(2)1P t nαα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1pβσββσα∧∧∧∧-<<+=-可得195%7.77,5.77β∧-的置信度为的置信区间为()(6)x与y的决定系数22121()490/6000.817()niiniiy yry y∧-=-=-==≈-∑∑(7)ANOVAx平方和df 均方F显著性组间(组合) 2 .100线性项加权的1.056偏差.8331 .833 .326组内2 .500总数4由于(1,3)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。

(8)t σ∧==其中2221111()22n ni i i i i e y y n n σ∧∧====---∑∑ 7 3.661==≈/2 2.353t α= /23.66t t α=>∴接受原假设01:0,H β=认为1β显著不为0,因变量y 对自变量x 的一元线性回归成立。

2019-2020学年高中数学人教A版选修2-3课时训练:3.1 回归分析的基本思想及其初步应用 Word版含答案

2019-2020学年高中数学人教A版选修2-3课时训练:3.1 回归分析的基本思想及其初步应用 Word版含答案

3.1 回归分析的基本思想及其初步应用[学习目标]1.了解随机误差、残差、残差图的概念.2.会通过分析残差判断线性回归模型的拟合效果. 3.掌握建立线性回归模型的步骤. [知识链接]1.什么叫回归分析?答 回归分析是对具有相关关系的两个变量进行统计分析的一种方法. 2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?答 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等. [预习导引] 1.线性回归模型(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系. (2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (3)对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),回归直线的斜率和截距的最小二乘估计公式分别为b ^=∑ni =1 (x i -x -)(y i -y -)∑ni =1 (x i -x -)2=∑ni =1x i y i-nx -y-∑n i =1x 2i -nx -2,a ^=y --b ^x -,其中(x -,y -)称为样本点的中心.(4)线性回归模型y =bx +a +e ,其中a 和b 是模型的未知参数,e 称为随机误差,自变量x 称为解释变量,因变量y 称为预报变量. 2.残差的概念对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )而言,它们的随机误差为e i =y i -bx i -a ,i =1,2,…,n ,其估计值为e ^i =y i -y ^i =y i -b ^x i -a ^,i =1,2,…,n ,e ^i 称为相应于点(x i ,y i )的残差. 3.刻画回归效果的方式 (1)残差图法作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高. (2)残差平方和法残差平方和∑ni =1(y i -y ^i )2,残差平方和越小,模型拟合效果越好. (3)利用R 2刻画回归效果R 2=1-∑ni =1(y i -y ^i )2∑n i =1 (y i -y -)2;R 2表示解释变量对于预报变量变化的贡献率.R 2越接近于1,表示回归的效果越好.要点一 求线性回归方程例1 某班5名学生的数学和物理成绩如下表:(1)画出散点图;(2)求物理成绩y 对数学成绩x 的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. 解 (1)散点图如图.(2)x -=15×(88+76+73+66+63)=73.2, y -=15×(78+65+71+64+61)=67.8.∑5i =1x i y i=88×78+76×65+73×71+66×64+63×61=25 054. ∑5i =1x 2i =882+762+732+662+632=27 174. 所以b ^=∑5i =1x i y i -5x -y -∑5i =1x 2i -5x -2=25 054-5×73.2×67.827 174-5×73.22≈0.625. a ^=y --b ^x -≈67.8-0.625×73.2=22.05.所以y 对x 的回归直线方程是y ^=0.625x +22.05. (3)x =96,则y ^=0.625×96+22.05≈82, 即可以预测他的物理成绩是82.规律方法 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.跟踪演练1 以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m 2时的销售价格. 解 (1)数据对应的散点图如下图所示:(2)x -=15∑5i =1x i =109,∑5i =1(x i -x -)2=1 570, y -=23.2,∑5i =1(x i -x -)(y i -y -)=308.设所求回归直线方程为y ^=b^x +a ^, 则b^=∑5i =1(x i -x -)(y i -y -)∑5i =1(x i -x -)2=3081 570≈0.196 2,a ^=y --b ^x -=0.181 42.故所求回归直线方程为y ^=0.196 2x +1.814 2. 回归直线如上图所示.(3)据(2),当x =150 m 2时,销售价格的估计值为 y ^=0.196 2×150+1.814 2=31.244 2(万元). 要点二 线性回归分析例2 为研究重量x (单位:克)对弹簧长度y (单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:(1)作出散点图并求线性回归方程; (2)求出R 2; (3)进行残差分析. 解 (1)散点图如图x -=16(5+10+15+20+25+30)=17.5,y -=16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,∑6i =1x 2i=2 275,∑6i =1x i y i =1 076.2 计算得,b^≈0.183,a ^≈6.285, 所求回归直线方程为y ^=0.183x +6.285. (2)列表如下:所以∑6i =1(y i -y ^i )2≈0.013 18,∑6i =1(y i -y -)2=14.678 4.所以,R 2=1-0.013 1814.678 4≈0.999 1, 回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.规律方法 在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,通过残差e ^1,e ^2,…,e^n来判断模型拟合的效果,判断原始数据中是否存在可疑数据.若残差点比较均匀地分布在水平带状区域内,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.跟踪演练2 已知某种商品的价格x (元)与需求量y (件)之间的关系有如下一组数据:求y 对x 的回归直线方程,并说明回归模型拟合效果的好坏.解 x -=15(14+16+18+20+22)=18, y -=15(12+10+7+5+3)=7.4,∑5i =1x 2i =142+162+182+202+222=1 660, ∑5i =1x i y i=14×12+16×10+18×7+20×5+22×3=620, 所以b^=∑5i =1x i y i-5x -y -∑5i =1x 2i -5x -2=620-5×18×7.41 660-5×182=-1.15.a^=7.4+1.15×18=28.1, 所以所求回归直线方程是y ^=-1.15x +28.1. 列出残差表:所以,∑5i =1(y i -y ^i )2=0.3,∑5i =1(y i -y -)2=53.2,R 2=1-∑5i =1 (y i -y ^i )2∑5i =1 (y i -y -)2≈0.994,所以回归模型的拟合效果很好. 要点三 非线性回归分析 例3 下表为收集到的一组数据:(1)作出x 与y 的散点图,并猜测x 与y 之间的关系; (2)建立x 与y 的关系,预报回归模型并计算残差; (3)利用所得模型,预报x =40时y 的值.解 (1)作出散点图如下图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y =c 1e c 2x 的周围,其中c 1,c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a (a =ln c 1,b =c 2)的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程了,数据可以转化为求得回归直线方程为z ^=0.272x -3.849, ∴y ^=e 0.272x -3.849. 残差(3)当x=40时,y=e0.272x-3.849≈1 131.规律方法解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,预报变量为y;(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;(4)分析拟合效果:通过计算相关指数等来判断拟合效果;(5)写出非线性回归方程.跟踪演练3为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系;(3)计算相关指数.解(1)作散点图如图所示.(2)由散点图看出样本点分布在一条指数函数y=c1e c2x的周围,于是令z=ln y,则有变换后的样本点应分布在直线z=bx+a(a=ln c1,b=c2)的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程了,数据可以转化为由计算器得:z ^=0.69x +1.115,则有y ^=e 0.69x +1.115. (3)y -=3776,∑n i =1e ^21=∑n i =1(y i -y ^)2=4.816 1, ∑n i =1(y i-y -)2=24 642.8,R 2=1-4.816 124 642.8≈0.999 8, 即解释变量天数对预报变量繁殖细菌个数解释了99.98%.1.下列各组变量之间具有线性相关关系的是( ) A .出租车费与行驶的里程 B .学习成绩与学生身高 C .身高与体重 D .铁的体积与质量 答案 C2.若劳动生产率x (千元)与月工资y (元)之间的线性回归方程为y ^=50+80x ,则下列判断正确的是( )A .劳动生产率为1 000元时,月工资为130元B .劳动生产率提高1 000元时,月工资平均提高80元C .劳动生产率提高1 000元时,月工资平均提高130元D .月工资为210元时,劳动生产率为2 000元 答案 B3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )A.y^=-10x+200B.y^=10x+200C.y^=-10x-200D.y^=10x-200答案 A解析由于销售量y与销售价格x成负相关,故排除B、D.又当x=10时,A中y=100,而C中y=-300,C不符合题意,故选A.4.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:(1)求年推销金额y关于工作年限x的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.解(1)设所求的线性回归方程为y^=b^x+a^,则b^=∑5i=1(x i-x-)(y i-y-)∑5i=1(x i-x-)2=1020=0.5,a^=y--b^x-=0.4.所以年推销金额y关于工作年限x的线性回归方程为y^=0.5x+0.4.(2)当x=11时,y^=0.5x+0.4=0.5×11+0.4=5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元.回归分析的基本思路(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y ^=b ^x +a^); (4)按一定规则估计回归方程中的参数;(5)提出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.一、基础达标1.在下列各量之间,存在相关关系的是( )①正方体的体积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的支出与收入之间的关系;⑤某户家庭用电量与电价之间的关系.A .②③B .③④C .④⑤D .②③④ 答案 D2.设某大学的女生体重y (单位:kg)与身高x (单位:cm)有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,下列结论中不正确的是( ) A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 由回归方程为y ^=0.85x -85.71知y 随x 的增大而增大,所以y 与x 具有正的线性相关关系;由最小二乘法建立回归方程的过程知y ^=b ^x +a ^=b ^x +y --b ^x -(a^=y --b ^x -),所以回归直线过样本点的中心(x -,y -);利用回归方程可以估计总体,所以D 不正确.3.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元 答案 B解析 ∵x -=4+2+3+54=72,y -=49+26+39+544=42,又y ^=b ^x +a ^必过(x -,y -),∴42=72×9.4+a^,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6(万元)时,y ^=9.4×6+9.1=65.5(万元).4.甲、乙、丙、丁四位同学各自对A ,B 两变量做回归分析,分别得到散点图与残差平方和∑ni =1(y i -y ^i )2如下表哪位同学的实验结果体现拟合A ,B 两变量关系的模型拟合精度高?( ) A .甲 B .乙 C .丙 D .丁 答案 D5.如果散点图的所有点都在一条直线上,则残差均为________,残差平方和为________,相关指数为________. 答案 0 0 16.对具有线性相关关系的变量x 和y ,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________. 答案 y ^=-10+6.5x解析 由题意知x -=2,y -=3,b ^=6.5,所以a ^=y --b ^x -=3-6.5×2=-10,即回归直线的方程为y ^=-10+6.5x .7.某个服装店经营某种服装,在某周内纯获利y (元)与该周每天销售这种服装件数x 之间的一组数据如下表:(1)求样本中心点; (2)画出散点图;(3)求纯获利y 与每天销售件数x 之间的回归方程. 解 (1)x -=6,y -=79.86,中心点(6,79.86). (2)散点图如下:(3)因为b ^=∑7i =1 (x i -x -)(y i -y -)∑7i =1(x i -x -)2≈4.75, a ^=y --b ^x -≈51.36,所以y ^=4.75x +51.36.二、能力提升8.(2013·福建)已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A.b^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′ 答案 C解析 x -=1+2+3+4+5+66=72,y -=0+2+1+3+3+46=136,b^=∑ni =1x i y i-nx - y -∑n i =1x 2i -nx -2=57,a ^=y --b ^x -=-13,b ′=2-02-1=2>b^,a ′=-2<a ^. 9.下表是x 和y 之间的一组数据,则y 关于x 的回归方程必过( )A.点(2,3) B .点(1.5,4) C .点(2.5,4) D .点(2.5,5) 答案 C解析 回归方程必过样本点的中心(x -,y -),即(2.5,4).10.如图是x 和y 的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.答案 D (3,10)解析 去掉D (3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大. 11.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y ^=b ^x +a ^;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,先将数据处理如下:对处理的数据,容易算得x -=0,y -=3.2,b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×29-5×0×3.2(-4)2+(-2)2+22+42-5×02=26040=6.5,a ^=y --b ^x -=3.2.由上述计算结果,知所求回归直线方程为y ^-257=6.5(x -2 006)+3.2.即y ^=6.5(x -2 006)+260.2.(2)利用所求得的直线方程,可预测2012年的粮食需求量为6.5×(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y ^=b ^x +a ^,其中b ^=-20,a ^=y --b ^x -;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入—成本)解 (1)x -=8+8.2+8.4+8.6+8.8+96=8.5,y -=16(90+84+83+80+75+68)=80∵b ^=-20,a ^=y ^-b ^x -, ∴a^=80+20×8.5=250 ∴回归直线方程y ^=-20x +250;(2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20(x -334)2+361.25∴该产品的单位应定为334元,工厂获得的利润最大. 三、探究与创新13.(2013·重庆卷)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i=184,∑10i =1x 2i =720. (1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x -+a^;(2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y ^=b ^x +a ^中,b ^=∑ni =1x i y i -nx - y -∑n i =1x 2i-nx -2,a ^=y --bx -, 其中x -,y -为样本平均值. 解 (1)由题意知n =10,x -=1n ∑n i =1x i =8010=8,y -=1n ∑n i =1y i =2010=2,又l xx =∑ni =1x 2i -nx -2=720-10×82=80,l xy =∑ni =1x i y i -nx -y -=184-10×8×2=24,由此得b ^=l xy l xx=2480=0.3,a ^=y --b ^x -=2-0.3×8=-0.4,故所求回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元).2016-2017学年湖南省衡阳市衡阳县四中高二(下)第一次模拟数学试卷一、选择题:本大题共10小题,每小题4分,满分40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.已知集合M={0,1,2},N={x },若M ∪N={0,1,2,3},则x 的值为( )A .3B .2C .1D .02.如图是一个几何体的三视图,则该几何体为( )A .球B .圆柱C .圆台D .圆锥3.在区间[0,5]内任取一个实数,则此数大于3的概率为( )A .B .C .D .4.某程序框图如图所示,若输入x 的值为1,则输出y 的值是( )A.2 B.3 C.4 D.55.已知向量=(1,2),=(x,4),若∥,则实数x的值为()A.8 B.2 C.﹣2 D.﹣86.某学校高一、高二、高三年级的学生人数分别为600,400,800.为了了解教师的教学情况,该校采用分层抽样的方法从这三个年级中抽取45名学生进行座谈,则高一、高二、高三年级抽取的人数分别为()A.15,5,25 B.15,15,15 C.10,5,30 D.15,10,207.如图,在正方体ABCD﹣A1B1C1D1中,直线BD与A1C1的位置关系是()A.平行B.相交C.异面但不垂直D.异面且垂直8.不等式(x+1)(x﹣2)≤0的解集为()A.{x|﹣1≤x≤2}B.{x|﹣1<x<2}C.{x|x≥2或x≤﹣1}D.{x|x>2或x <﹣1}9.已知两点P(4,0),Q(0,2),则以线段PQ为直径的圆的方程是()A.(x+2)2+(y+1)2=5 B.(x﹣2)2+(y﹣1)2=10 C.(x﹣2)2+(y﹣1)2=5 D.(x+2)2+(y+1)2=1010.如图,在高速公路建设中需要确定隧道的长度,工程技术人员已测得隧道两端的两点A、B到点C的距离AC=BC=1km,且∠ACB=120°,则A、B两点间的距离为()A.km B.km C.1.5km D.2km二、填空题:本大题共5小题,每小题4分,满分20分.11.计算:log21+log24=.12.已知1,x,9成等比数列,则实数x=.13.已知点(x,y)在如图所示的平面区域(阴影部分)内运动,则z=x+y的最大值是.14.已知a是函数f(x)=2﹣log2x的零点,则a的值为•15.如图1,在矩形ABCD中,AB=2BC,E、F分别是AB、CD的中点,现在沿EF 把这个矩形折成一个直二面角A﹣EF﹣C(如图2),则在图2中直线AF与平面EBCF所成的角的大小为.三、解答题:本大题共5小题,满分40分.解答应写出文字说明、证明过程或演算步骤.16.已知,<θ<π.(1)求tanθ;(2)求的值.17.某公司为了了解本公司职员的早餐费用情况,抽样调査了100位职员的早餐日平均费用(单位:元),得到如图所示的频率分布直方图,图中标注a的数字模糊不清.(1)试根据频率分布直方图求a的值,并估计该公司职员早餐日平均费用的众数;(2)已知该公司有1000名职员,试估计该公司有多少职员早餐日平均费用不少于8元?18.已知等比数列{a n}的公比q=2,且a2,a3+1,a4成等差数列.(1)求a1及a n;(2)设b n=a n+n,求数列{b n}的前5项和S5.19.已知二次函数f(x)=x2+ax+b满足f(0)=6,f(1)=5(1)求函数f(x)解析式(2)求函数f(x)在x∈[﹣2,2]的最大值和最小值.20.已知圆C:x2+y2+2x﹣3=0.(1)求圆的圆心C的坐标和半径长;(2)直线l经过坐标原点且不与y轴重合,l与圆C相交于A(x1,y1)、B(x2,y2)两点,求证:为定值;(3)斜率为1的直线m与圆C相交于D、E两点,求直线m的方程,使△CDE 的面积最大.2016-2017学年湖南省衡阳市衡阳县四中高二(下)第一次模拟数学试卷参考答案与试题解析一、选择题:本大题共10小题,每小题4分,满分40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.已知集合M={0,1,2},N={x},若M∪N={0,1,2,3},则x的值为()A.3 B.2 C.1 D.0【考点】并集及其运算.【分析】根据M及M与N的并集,求出x的值,确定出N即可.【解答】解:∵集合M={0,1,2},N={x},且M∪N={0,1,2,3},∴x=3,故选:A.2.如图是一个几何体的三视图,则该几何体为()A.球B.圆柱C.圆台D.圆锥【考点】由三视图求面积、体积.【分析】由三视图可知该几何体为圆锥.【解答】解:根据三视图可知,该几何体为圆锥.故选D.3.在区间[0,5]内任取一个实数,则此数大于3的概率为()A.B.C.D.【考点】几何概型.【分析】由题意,要使此数大于3,只要在区间(3,5]上取即可,利用区间长度的比求.【解答】解:要使此数大于3,只要在区间(3,5]上取即可,由几何概型的个数得到此数大于3的概率为为;故选B.4.某程序框图如图所示,若输入x的值为1,则输出y的值是()A.2 B.3 C.4 D.5【考点】程序框图.【分析】根据题意,模拟程序框图的运行过程,即可得出正确的答案.【解答】解:模拟程序框图的运行过程,如下;输入x=1,y=1﹣1+3=3,输出y的值为3.故选:B.5.已知向量=(1,2),=(x,4),若∥,则实数x的值为()A.8 B.2 C.﹣2 D.﹣8【考点】平面向量共线(平行)的坐标表示.【分析】根据向量平行的坐标公式建立方程进行求解即可.【解答】解:∵∥,∴4﹣2x=0,得x=2,故选:B6.某学校高一、高二、高三年级的学生人数分别为600,400,800.为了了解教师的教学情况,该校采用分层抽样的方法从这三个年级中抽取45名学生进行座谈,则高一、高二、高三年级抽取的人数分别为()A.15,5,25 B.15,15,15 C.10,5,30 D.15,10,20【考点】分层抽样方法.【分析】根据分层抽样的定义,建立比例关系即可等到结论.【解答】解:∵高一、高二、高三年级的学生人数分别为600,400,800.∴从这三个年级中抽取45名学生进行座谈,则高一、高二、高三年级抽取的人数分别,高二:,高三:45﹣15﹣10=20.故选:D7.如图,在正方体ABCD﹣A1B1C1D1中,直线BD与A1C1的位置关系是()A.平行B.相交C.异面但不垂直D.异面且垂直【考点】空间中直线与直线之间的位置关系.【分析】连接AC,则AC∥A1C1,AC⊥BD,即可得出结论.【解答】解:∵正方体的对面平行,∴直线BD与A1C1异面,连接AC,则AC∥A1C1,AC⊥BD,∴直线BD与A1C1垂直,∴直线BD与A1C1异面且垂直,故选:D.8.不等式(x+1)(x﹣2)≤0的解集为()A.{x|﹣1≤x≤2}B.{x|﹣1<x<2}C.{x|x≥2或x≤﹣1}D.{x|x>2或x <﹣1}【考点】一元二次不等式的解法.【分析】根据一元二次不等式对应方程的实数根,即可写出不等式的解集.【解答】解:不等式(x+1)(x﹣2)≤0对应方程的两个实数根为﹣1和2,所以该不等式的解集为{x|﹣1≤x≤2}.故选:A.9.已知两点P(4,0),Q(0,2),则以线段PQ为直径的圆的方程是()A.(x+2)2+(y+1)2=5 B.(x﹣2)2+(y﹣1)2=10 C.(x﹣2)2+(y﹣1)2=5 D.(x+2)2+(y+1)2=10【考点】圆的标准方程.【分析】求出圆心坐标和半径,因为圆的直径为线段PQ,所以圆心为P,Q的中点,应用中点坐标公式求出,半径为线段PQ长度的一半,求出线段PQ的长度,除2即可得到半径,再代入圆的标准方程即可.【解答】解:∵圆的直径为线段PQ,∴圆心坐标为(2,1)半径r===∴圆的方程为(x﹣2)2+(y﹣1)2=5.故选:C.10.如图,在高速公路建设中需要确定隧道的长度,工程技术人员已测得隧道两端的两点A、B到点C的距离AC=BC=1km,且∠ACB=120°,则A、B两点间的距离为()A.km B.km C.1.5km D.2km【考点】解三角形的实际应用.【分析】直接利用与余弦定理求出AB的数值.【解答】解:根据余弦定理AB2=a2+b2﹣2abcosC,∴AB===(km).故选:A.二、填空题:本大题共5小题,每小题4分,满分20分.11.计算:log21+log24=2.【考点】对数的运算性质.【分析】直接利用对数的运算法则化简求解即可.【解答】解:log21+log24=0+log222=2.故答案为:2.12.已知1,x,9成等比数列,则实数x=±3.【考点】等比数列.【分析】由等比数列的性质得x2=9,由此能求出实数x.【解答】解:∵1,x,9成等比数列,∴x2=9,解得x=±3.故答案为:±3.13.已知点(x,y)在如图所示的平面区域(阴影部分)内运动,则z=x+y的最大值是5.【考点】简单线性规划.【分析】利用目标函数的几何意义求最大值即可.【解答】解:由已知,目标函数变形为y=﹣x+z,当此直线经过图中点(3,2)时,在y轴的截距最大,使得z最大,所以z的最大值为3+2=5;故答案为:5.14.已知a是函数f(x)=2﹣log2x的零点,则a的值为4•【考点】函数的零点.【分析】根据函数零点的定义,得f(a)=0,从而求出a的值.【解答】解:a是函数f(x)=2﹣log2x的零点,∴f(a)=2﹣log2a=0,∴log2a=2,解得a=4.故答案为:4.15.如图1,在矩形ABCD中,AB=2BC,E、F分别是AB、CD的中点,现在沿EF 把这个矩形折成一个直二面角A﹣EF﹣C(如图2),则在图2中直线AF与平面EBCF所成的角的大小为45°.【考点】直线与平面所成的角.【分析】由题意,AE⊥平面EFBC,∠AFE是直线AF与平面EBCF所成的角,即可得出结论.【解答】解:由题意,AE⊥平面EFBC,∴∠AFE是直线AF与平面EBCF所成的角,∵AE=EF,∴∠AFE=45°.故答案为45°.三、解答题:本大题共5小题,满分40分.解答应写出文字说明、证明过程或演算步骤.16.已知,<θ<π.(1)求tanθ;(2)求的值.【考点】三角函数的化简求值.【分析】(1)由,<θ<π结合同角平方关系可求cosθ,利用同角基本关系可求(2)结合(1)可知tanθ的值,故考虑把所求的式子化为含“切”的形式,从而在所求的式子的分子、分母同时除以cos2θ,然后把已知tanθ的值代入可求.【解答】解:(1)∵sin2θ+cos2θ=1,∴cos2θ=.又<θ<π,∴cosθ=∴.(2)=.17.某公司为了了解本公司职员的早餐费用情况,抽样调査了100位职员的早餐日平均费用(单位:元),得到如图所示的频率分布直方图,图中标注a的数字模糊不清.(1)试根据频率分布直方图求a的值,并估计该公司职员早餐日平均费用的众数;(2)已知该公司有1000名职员,试估计该公司有多少职员早餐日平均费用不少于8元?【考点】频率分布直方图.【分析】(1)由频率分布直方图中各小长方形的面积之和等于1,求出a的值,频率分布直方图中最高的小长方体的底面边长的中点即是众数;(2)求出本公司职员平均费用不少于8元的频率就能求出公司有多少职员早餐日平均费用不少于8元.【解答】解:(1)据题意得:(0.05+0.10+a+0.10+0.05+0.05)×2=1,解得a=0.15,众数为:;(2)该公司职员早餐日平均费用不少于8元的有:×2=200,18.已知等比数列{a n}的公比q=2,且a2,a3+1,a4成等差数列.(1)求a1及a n;(2)设b n=a n+n,求数列{b n}的前5项和S5.【考点】数列的求和;等比数列的通项公式.【分析】(1)运用等比数列的通项公式和等差数列的中项的性质,解方程可得首项,进而得到所求通项公式;(2)求得b n=2n﹣1+n,再由数列的求和方法:分组求和,结合等差数列和等比数列的求和公式,计算即可得到所求和.【解答】解:(1)由已知得a2=2a1,a3+1=4a1+1,a4=8a1,又a2,a3+1,a4成等差数列,可得:2(a3+1)=a2+a4,所以2(4a1+1)=2a1+8a1,解得a1=1,故a n=a1q n﹣1=2n﹣1;(2)因为b n=2n﹣1+n,所以S5=b1+b2+b3+b4+b5=(1+2+...+16)+(1+2+ (5)=+=31+15=46.19.已知二次函数f(x)=x2+ax+b满足f(0)=6,f(1)=5(1)求函数f(x)解析式(2)求函数f(x)在x∈[﹣2,2]的最大值和最小值.【考点】二次函数的性质;二次函数在闭区间上的最值.【分析】(1)利用已知条件列出方程组求解即可.(2)利用二次函数的对称轴以及开口方向,通过二次函数的性质求解函数的最值即可.【解答】解:(1)∵;(2)∵f(x)=x2﹣2x+6=(x﹣1)2+5,x∈[﹣2,2],开口向上,对称轴为:x=1,∴x=1时,f(x)的最小值为5,x=﹣2时,f(x)的最大值为14.20.已知圆C:x2+y2+2x﹣3=0.(1)求圆的圆心C的坐标和半径长;(2)直线l经过坐标原点且不与y轴重合,l与圆C相交于A(x1,y1)、B(x2,y2)两点,求证:为定值;(3)斜率为1的直线m与圆C相交于D、E两点,求直线m的方程,使△CDE 的面积最大.【考点】直线与圆的位置关系.【分析】(1)把圆C的方程化为标准方程,写出圆心和半径;(2)设出直线l的方程,与圆C的方程组成方程组,消去y得关于x的一元二次方程,由根与系数的关系求出的值;(3)解法一:设出直线m的方程,由圆心C到直线m的距离,写出△CDE的面积,利用基本不等式求出最大值,从而求出对应直线方程;解法二:利用几何法得出CD⊥CE时△CDE的面积最大,再利用点到直线的距离求出对应直线m的方程.【解答】解:(1)圆C:x2+y2+2x﹣3=0,配方得(x+1)2+y2=4,则圆心C的坐标为(﹣1,0),圆的半径长为2;(2)设直线l的方程为y=kx,联立方程组,消去y得(1+k2)x2+2x﹣3=0,则有:;所以为定值;(3)解法一:设直线m的方程为y=kx+b,则圆心C到直线m的距离,所以,≤,当且仅当,即时,△CDE的面积最大,从而,解之得b=3或b=﹣1,故所求直线方程为x﹣y+3=0或x﹣y﹣1=0.解法二:由(1)知|CD|=|CE|=R=2,所以≤2,当且仅当CD⊥CE时,△CDE的面积最大,此时;设直线m的方程为y=x+b,则圆心C到直线m的距离,由,得,由,得b=3或b=﹣1,故所求直线方程为x﹣y+3=0或x﹣y﹣1=0.2017年5月5日。

应用回归分析_整理课后习题参考题答案

应用回归分析_整理课后习题参考题答案

第二章 一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答: 假设1、解释变量X 是确定性变量,Y 是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=σ2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n 假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, σ2 ) i=1,2, …,n 2.2 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n误差εi (i=1,2, …,n)仍满足基本假定。

求β1的最小二乘估计 解: 得:2.3 证明(2.27式),∑e i =0 ,∑e i X i =0 。

证明:其中:即: ∑e i =0 ,∑e i X i =0∑∑+-=-=nii i ni X Y Y Y Q 121021))ˆˆ(()ˆ(ββ21112)ˆ()ˆ(ini i ni i i e X Y Y Y Q β∑∑==-=-=01ˆˆˆˆi ii i iY X e Y Y ββ=+=-0100ˆˆQQββ∂∂==∂∂2.4回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。

答:由于εi ~N(0, σ2 ) i=1,2, …,n所以Y i =β0 + β1X i + εi ~N (β0+β1X i , σ2 ) 最大似然函数:使得Ln (L )最大的0ˆβ,1ˆβ就是β0,β1的最大似然估计值。

同时发现使得Ln (L )最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。

值得注意的是:最大似然估计是在εi ~N (0, σ2 )的假设下求得,最小二乘估计则不要求分布假设。

应用回归分析第章课后习题参考答案

应用回归分析第章课后习题参考答案

第二章 一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答: 假设1、解释变量X 是确定性变量,Y 是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=σ2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, σ2 ) i=1,2, …,n 2.2 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n误差εi (i=1,2, …,n )仍满足基本假定。

求β1的最小二乘估计 解: 得:2.3 证明(2.27式),∑e i =0 ,∑e i X i =0 。

证明:∑∑+-=-=nii i ni X Y Y Y Q 121021))ˆˆ(()ˆ(ββ其中: 即: ∑e i =0 ,∑e i X i =02.4回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。

答:由于εi ~N(0, σ2 ) i=1,2, …,n所以Y i =β0 + β1X i + εi ~N (β0+β1X i , σ2 ) 最大似然函数:21112)ˆ()ˆ(ini i ni i i e X Y Y Y Q β∑∑==-=-=01ˆˆˆˆi ii i iY X e Y Y ββ=+=-0100ˆˆQQββ∂∂==∂∂使得Ln (L )最大的0ˆβ,1ˆβ就是β0,β1的最大似然估计值。

同时发现使得Ln (L )最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。

值得注意的是:最大似然估计是在εi ~N (0, σ2 )的假设下求得,最小二乘估计则不要求分布假设。

《应用回归分析》课后题答案解析

《应用回归分析》课后题答案解析

(8) t
1
2
/ Lxx
1
Lxx
2
其中
1 n2
n i1
ei 2
1 n2
n i1
( yi
2
yi )
0.0036 1297860 8.542 0.04801
t /2 1.895
t 8.542 t /2
接受原假设 H 0: 1 0, 认为 1 显著不为 0,因变量 y 对自变量 x 的一元线性回归成立。
( yi
2
yi )
1 n-2
n i=1
( yi
( 0 1
2
x))
=
1 3
( 10-(-1+71))2 (10-(-1+7 (20-(-1+7 4))2 (40-(-1+7
2))2 (20-(-1+7 5))2
3))2
1 16 9 0 49 36
3
110 / 3
1
330 6.1
《应用回归分析》部分课后习题答案
第一章 回归分析概述
变量间统计关系和函数关系的区别是什么 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量 唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另 外一个变量的确定关系。
回归分析与相关分析的联系与区别是什么 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 a. 在回归分析中,变量 y 称为因变量,处在被解释的特殊地位。在相关分析中,变 量 x 和变量 y 处于平等的地位,即研究变量 y 与变量 x 的密切程度与研究变量 x 与变量 y 的密切程度是一回事。b.相关分析中所涉及的变量 y 与变量 x 全是随机 变量。而在回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量也可以 是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的 密切程度。而回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归 方程进行预测和控制。

应用回归分析_整理课后习题参考答案

应用回归分析_整理课后习题参考答案

第二章 一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定答: 假设1、解释变量X 是确定性变量,Y 是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=?2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, ?2 ) i=1,2, …,n 2.2 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n误差εi (i=1,2, …,n )仍满足基本假定。

求β1的最小二乘估计 解: 得:2.3 证明(2.27式),?e i =0 ,?e i X i =0 。

证明:∑∑+-=-=nii i ni X Y Y Y Q 121021))ˆˆ(()ˆ(ββ其中: 即: ?e i =0 ,?e i X i =02.4回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价给出证明。

答:由于εi ~N(0, ?2 ) i=1,2, …,n所以Y i =β0 + β1X i + εi ~N (β0+β1X i , ?2 ) 最大似然函数:21112)ˆ()ˆ(ini i ni i i e X Y Y Y Q β∑∑==-=-=01ˆˆˆˆi ii i iY X e Y Y ββ=+=-0100ˆˆQQββ∂∂==∂∂使得Ln (L )最大的0ˆβ,1ˆβ就是β0,β1的最大似然估计值。

同时发现使得Ln (L )最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。

值得注意的是:最大似然估计是在εi ~N (0, ?2 )的假设下求得,最小二乘估计则不要求分布假设。

(完整word版)应用回归分析整理(word文档良心出品)

(完整word版)应用回归分析整理(word文档良心出品)

1. OLSE 估计量的性质线性、无偏、最小方差。

4.在一元线性回归中,SST 自由度为n-1, SSE 自由度为n-2, SSR 自 由度为1。

A-2 _ 1 SSE1.证明: n -p -1是误差项方差二2的无偏估计证明: D(e)=(1—h ii );「2(i =1,2, ,n)二2 n(n - h ii ) n - p -1 i =1_ 2(n _ P -1) n - p -1答案:5.在多元线性回归中,样本决定系数空1 一空R 2 = SST SST 1n - p -1 n l 2 E E(e ) i 4n 2 '、(D(e) E (ej)=i 11 n - p -1 n '、D (e)id n“Li 2(1 — h in 2.证明ei =4n二 o,二 X i e = 0An n A' e 7 (w -yji 4 i 4n A A八(% -飞-也)i 4n A A n八y i _n 1, X ii 4 i 4A A二n y「n( y「訂x)「訂n x-0n n A A7 X i e =為焉⑶—飞—X i) i=4 i 4n An An-、■ Xiyi —:o 7 Xi —:i v x2i=4 i 4 i =4n _ A _ _ A n_ \ xy _(y_ x)n x_ :「X i2 i吕in ___ _2 A A n八X i y i _nxy nx :〔一「X ji =4 i =4n _ _ A n _二' (X i - x)( y i - y) - r ' 化-x) i=4 i =4xyXXxyXX2. H是帽子矩阵,则tr(H)=p+l5. Cov(e) »;2(l -H ) (e为多元回归的残差阵)。

引起异常值消除的方法(至少5个)?答案:异常值消除方法:(D重新核实数据;重新测量数据;删除或重新观测异常值数据;增加必要的自变量;增加观测数据,适当扩大自变量取值范围;(2)采用加权线性回归;改用非线性回归模型;叙述一元回归模型的建模过程?答案:第一步:提出因变量与自变量;第二步:收集数据;第三步:画散点图;第四步:设定理论模型;第五步:用软件计算,输出计算结果;第六步:回归诊断,分析输出结果。

《应用回归分析》课后题答案解析

《应用回归分析》课后题答案解析

《应用回归分析》部分课后习题答案第一章回归分析概述1.1 变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。

1.2 回归分析与相关分析的联系与区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。

区别有 a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。

在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。

b.相关分析中所涉及的变量y与变量x全是随机变量。

而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。

C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。

而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。

1.3 回归模型中随机误差项ε的意义是什么?答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数,即n>p.1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。

应用回归分析-课后习题答案-何晓群.doc

应用回归分析-课后习题答案-何晓群.doc

第二章 一元线性回归2.14 解答:(1)散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑ 2n 01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363110/3=++++=1330 6.13σ∧=≈ (5)由于211(,)xxN L σββ∧1112()/xxxxL t L ββσσ∧∧-==服从自由度为n-2的t 分布。

因而1/2()|(2)1xx L P t n αββασ∧⎡⎤-⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(xxxxp t t L L ααβββ∧∧∧∧-<<+=1α-可得11195%333333β∧的置信度为的置信区间为(7-2.353,7+2.353)即为:(2.49,11.5)2201()(,())xxx N n L ββσ-∧+00002221()1()()xxxxt x x n L n L σσ∧∧--∧∧==++服从自由度为n-2的t 分布。

因而00/22(2)11()xx P t n x n L αασ∧-∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥+⎢⎥⎣⎦即220/200/21()1()()1xxxxx x p t t n L n L βσββσα--∧∧∧∧-+<<++=- 可得195%7.77,5.77β∧-的置信度为的置信区间为()(6)x 与y 的决定系数22121()490/6000.817()nii nii y y r y y ∧-=-=-==≈-∑∑(7)ANOV Ax平方和df均方 F 显著性组间(组合) 9.000 2 4.500 9.000 .100 线性项加权的 8.167 1 8.167 16.333 .056 偏差.833 1 .833 1.667.326组内 1.000 2 .500总数10.0004由于(1,3)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。

应用回归分析课后习题答案部分-实用回归分析

应用回归分析课后习题答案部分-实用回归分析

第二章 一元线性回归2.14 解答:(1)散点图为:(2)x 与y 之间大致呈线性关系。

(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑2n01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75))[]1169049363110/3=++++=6.1σ∧= (5)由于211(,)xxN L σββ∧t σ∧==服从自由度为n-2的t 分布。

因而/2||(2)1P t n αασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(p t t ααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为(7-2.3537+2.353 即为:(2.49,11.5)22001()(,())xxx N n L ββσ-∧+t ∧∧==服从自由度为n-2的t 分布。

因而/2|(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1p βσββσα∧∧∧∧-<<+=- 可得195%7.77,5.77β∧-的置信度为的置信区间为()(6)x 与y 的决定系数22121()490/6000.817()nii nii y y r y y ∧-=-=-==≈-∑∑(7)由于(1,3)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。

(8)t σ∧==其中2221111()22n ni i i i i e y y n n σ∧∧====---∑∑ 7 3.661==≈/2 2.353t α= /23.66t t α=>∴接受原假设01:0,H β=认为1β显著不为0,因变量y 对自变量x 的一元线性回归成立。

应用回归分析第四版课后习题答案_全_何晓群_刘文卿

应用回归分析第四版课后习题答案_全_何晓群_刘文卿

实用回归分析第四版第一章回归分析概述1.3回归模型中随机误差项ε的意义是什么?答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数,即n>p.第二章一元线性回归分析思考与练习参考答案2.1一元线性回归有哪些基本假定?答:假设1、解释变量X是确定性变量,Y是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性:E(εi)=0 i=1,2, …,nVar (εi)=σ2i=1,2, …,nCov(εi,εj)=0 i≠j i,j= 1,2, …,n假设3、随机误差项ε与解释变量X之间不相关:Cov(X i, εi)=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0, σ2) i=1,2, …,n2.3 证明(2.27式),∑e i =0 ,∑e i X i=0 。

证明:∑∑+-=-=niiiniXYYYQ12121))ˆˆ(()ˆ(ββ其中:即: ∑e i =0 ,∑e i X i =02.5 证明0ˆβ是β0的无偏估计。

证明:)1[)ˆ()ˆ(1110∑∑==--=-=ni i xxi n i i Y L X X X Y n E X Y E E ββ )] )(1([])1([1011i i xx i n i i xx i ni X L X X X n E Y L X X X n E εββ++--=--=∑∑==1010)()1(])1([βεβεβ=--+=--+=∑∑==i xx i ni i xx i ni E L X X X nL X X X n E 2.6 证明 证明:)] ()1([])1([)ˆ(102110i i xxi ni ixx i ni X Var L X X X n Y L X X X n Var Var εβββ++--=--=∑∑== 222212]1[])(2)1[(σσxx xx i xx i ni L X n L X X X nL X X X n +=-+--=∑=2.7 证明平方和分解公式:SST=SSE+SSR证明:2.8 验证三种检验的关系,即验证: (1)21)2(r r n t --=;(2)2221ˆˆ)2/(1/t L n SSE SSR F xx ==-=σβ 01ˆˆˆˆi i i i iY X e Y Y ββ=+=-())1()1()ˆ(222122xx ni iL X n X XX nVar +=-+=∑=σσβ()()∑∑==-+-=-=n i ii i n i i Y Y Y Y Y Y SST 1212]ˆ()ˆ[()()()∑∑∑===-+--+-=ni ii ni i i i ni iY Y Y Y Y Y Y Y 12112)ˆˆ)(ˆ2ˆ()()SSESSR )Y ˆY Y Y ˆn1i 2ii n1i 2i +=-+-=∑∑==0100ˆˆQQββ∂∂==∂∂证明:(1)ˆt======(2)2222201111 1111ˆˆˆˆˆˆ()()(())(()) n n n ni i i i xxi i i iSSR y y x y y x x y x x Lβββββ=====-=+-=+--=-=∑∑∑∑2212ˆ/1ˆ/(2)xxLSSRF tSSE nβσ∴===-2.9 验证(2.63)式:2211σ)L)xx(n()e(Varxxii---=证明:0112222222ˆˆˆvar()var()var()var()2cov(,)ˆˆˆvar()var()2cov(,())()()11[]2[]()1[1]i i i i i i ii i i ii ixx xxixxe y y y y y yy x y y x xx x x xn L n Lx xn Lβββσσσσ=-=+-=++-+---=++-+-=--其中:222221111))(1()(1))(,()()1,())(ˆ,(),())(ˆ,(σσσββxxixxiniixxiiiniiiiiiiiLxxnLxxnyLxxyCovxxynyCovxxyCovyyCovxxyyCov-+=-+=--+=-+=-+∑∑==2.10 用第9题证明是σ2的无偏估计量证明:2221122112211ˆˆ()()()22()111var()[1]221(2)2n ni ii in niii i xxE E y y E en nx xen n n Lnnσσσσ=====-=---==----=-=-∑∑∑∑第三章2ˆ22-=∑neiσ1.一个回归方程的复相关系数R=0.99,样本决定系数R 2=0.9801,我们能判断这个回归方程就很理想吗? 答:不能断定这个回归方程理想。

第一章 课后习题解答(应用回归分析)

第一章 课后习题解答(应用回归分析)

1、变量间统计关系和函数关系的区别是什么?答:函数关系是一种确定性的关系,一个变量的变化能完全决定另一个变量的变化;统计关系是非确定的,尽管变量间的关系密切,但是变量不能由另一个或另一些变量唯一确定。

2、回归分析与相关分析的区别和联系是什么?答:联系:刻画变量间的密切联系;区别:一、回归分析中,变量y 称为因变量,处在被解释的地位,而在相关分析中,变量y 与x 处于平等地位;二、相关分析中y 与x 都是随机变量,而回归分析中y 是随机的,x 是非随机变量。

三、回归分析不仅可以刻画线性关系的密切程度,还可以由回归方程进行预测和控制。

3、回归模型中随机误差项ε的意义是什么?主要包括哪些因素?答:随机误差项ε的引入,才能将变量间的关系描述为一个随机方程。

主要包括:时间、费用、数据质量等的制约;数据采集过程中变量观测值的观测误差;理论模型设定的误差;其他随机误差。

4、线性回归模型的基本假设是什么?答:1、解释变量非随机;2、样本量个数要多于解释变量(自变量)个数;3、高斯-马尔科夫条件;4、随机误差项相互独立,同分布于2(0,)N σ。

5、回归变量设置的理论根据?在设置回归变量时应注意哪些问题?答:因变量与自变量之间的因果关系。

需注意问题:一、对所研究的问题背景要有足够了解;二、解释变量之间要求不相关;三、若某个重要的变量在实际中没有相应的统计数据,应考虑用相近的变量代替,或者由其他几个指标复合成一个新的指标;四、解释变量并非越多越好。

6、收集、整理数据包括哪些内容?答:一、收集数据的类型(时间序列、截面数据);二、数据应注意可比性和数据统计口径问题(统计范围);三、整理数据时要注意出现“序列相关”和“异方差”的问题;四、收集数据的样本量应大于解释变量;四、整理数据包括:拆算、差分、对数化、标准化以及提出极端值,有缺失值时的处理。

7、构造回归理论模型的基本根据是什么?答:收集到的数据变量之间的数学关系(线性、非线性)以及所研究问题背景的相关模型,例如数理经济中的投资函数、生产函数、需求函数、消费函数等。

应用回归分析课后习题参考答案

应用回归分析课后习题参考答案

第二章 一元线性回归分析思考与练习参考答案一元线性回归有哪些基本假定答: 假设1、解释变量X 是确定性变量,Y 是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n 假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, 2 ) i=1,2, …,n 考虑过原点的线性回归模型Y i =β1X i +εi i=1,2, …,n误差εi (i=1,2, …,n)仍满足基本假定。

求β1的最小二乘估计 解: 得:证明(式),e i =0 ,e i X i =0 。

证明:∑∑+-=-=nii i ni X Y Y Y Q 121021))ˆˆ(()ˆ(ββ其中:即: e i =0 ,e i X i =021112)ˆ()ˆ(ini i ni i i e X Y Y Y Q β∑∑==-=-=0)ˆ(2ˆ111=--=∂∂∑=ii ni i eX X Y Q ββ)()(ˆ1211∑∑===ni i ni ii X Y X β01ˆˆˆˆi ii i iY X e Y Y ββ=+=-0100ˆˆQQββ∂∂==∂∂回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价给出证明。

答:由于εi ~N(0, 2 ) i=1,2, …,n所以Y i =β0 + β1X i + εi ~N (β0+β1X i , 2 ) 最大似然函数:使得Ln (L )最大的0ˆβ,1ˆβ就是β0,β1的最大似然估计值。

同时发现使得Ln (L )最大就是使得下式最小,∑∑+-=-=nii i n i X Y Y Y Q 121021))ˆˆ(()ˆ(ββ上式恰好就是最小二乘估计的目标函数相同。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章 一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答: 假设1、解释变量X 是确定性变量,Y 是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=s 2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n 假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, s 2 ) i=1,2, …,n 2.2 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n误差εi (i=1,2, …,n)仍满足基本假定。

求β1的最小二乘估计 解: 得:2.3 证明(2.27式),S e i =0 ,S e i X i =0 。

证明:∑∑+-=-=nii i ni X Y Y Y Q 121021))ˆˆ(()ˆ(ββ其中:即: S e i =0 ,S e i X i =021112)ˆ()ˆ(ini i ni i i e X Y Y Y Q β∑∑==-=-=0)ˆ(2ˆ111=--=∂∂∑=ii ni i eX X Y Q ββ)()(ˆ1211∑∑===ni i ni ii X Y X β01ˆˆˆˆi ii i iY X e Y Y ββ=+=-0100ˆˆQQββ∂∂==∂∂2.4回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。

答:由于εi ~N(0, s 2 ) i=1,2, …,n所以Y i =β0 + β1X i + εi ~N (β0+β1X i , s 2 ) 最大似然函数:使得Ln (L )最大的0ˆβ,1ˆβ就是β0,β1的最大似然估计值。

同时发现使得Ln (L )最大就是使得下式最小,∑∑+-=-=nii i n i X Y Y Y Q 121021))ˆˆ(()ˆ(ββ上式恰好就是最小二乘估计的目标函数相同。

值得注意的是:最大似然估计是在εi ~N (0, s 2 )的假设下求得,最小二乘估计则不要求分布假设。

所以在εi ~N(0, s 2 ) 的条件下, 参数β0,β1的最小二乘估计与最大似然估计等价。

2.5 证明0ˆβ是β0的无偏估计。

证明:)1[)ˆ()ˆ(1110∑∑==--=-=ni i xx i n i iY L X X X Y n E X Y E E ββ )] )(1([])1([1011i i xx i n i i xx i ni X L X X X n E Y L X X X n E εββ++--=--=∑∑==1010)()1(])1([βεβεβ=--+=--+=∑∑==i xx i ni i xx i ni E L X X X nL X X X n E 2.6 证明 证明:)] ()1([])1([)ˆ(102110i i xx i ni i xx i ni X Var L X X X nY L X X X n Var Var εβββ++--=--=∑∑==())1()1()ˆ(222122xx ni iL X n X XX nVar +=-+=∑=σσβ222212]1[])(2)1[(σσxx xx i xx i ni L X n L X X X nL X X X n +=-+--=∑=2.7 证明平方和分解公式:SST=SSE+SSR证明:2.8 验证三种检验的关系,即验证: (1)21)2(r r n t --=;(2)2221ˆˆ)2/(1/t L n SSE SSR F xx ==-=σβ 证明:(1)ˆt ======(2)22222011111111ˆˆˆˆˆˆ()()(())(())nnnni i ii xx i i i i SSR y y x y y x x y x x L βββββ=====-=+-=+--=-=∑∑∑∑2212ˆ/1ˆ/(2)xx L SSR F t SSE n βσ∴===-2.9 验证(2.63)式:2211σ)L )x x (n ()e (Var xx i i ---=证明:112222222ˆˆˆvar()var()var()var()2cov(,)ˆˆˆvar()var()2cov(,())()()11[]2[]()1[1]i i i i i i i iiiii i xx xxi xxe y yy y y y y x y y x x x x x x n L n L x x n L βββσσσσ=-=+-=++-+---=++-+-=--()()∑∑==-+-=-=n i ii i n i i Y Y Y Y Y Y SST 1212]ˆ()ˆ[()()()∑∑∑===-+--+-=ni ii ni i i i ni iY Y Y Y Y Y Y Y 12112)ˆˆ)(ˆ2ˆ()()SSESSR )Y ˆY Y Y ˆn1i 2ii n1i 2i +=-+-=∑∑==其中:222221111))(1()(1))(,()()1,())(ˆ,(),())(ˆ,(σσσββxxi xx i ni i xx ii i ni i i ii i i i L x x n L x x n y L x x y Cov x x y n y Cov x x y Cov y y Cov x x y y Cov -+=-+=--+=-+=-+∑∑==2.10 用第9题证明2ˆ22-=∑n e iσ是s 2的无偏估计量证明:2221122112211ˆˆ()()()22()111var()[1]221(2)2n n i i i i n n i i i i xx E E y y E e n n x x e n n n L n n σσσσ=====-=---==----=-=-∑∑∑∑ 2.11 验证决定系数与F 值之间的关系式22-+=n F Fr证明:211/121/(/(2))1221SSR SSR r SST SSR SSE SSE SSRn SSR SSE n F n F n F ===++=-+-==-+-+2.14 为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y (万元)和广告费用x (万元),数据见表2.6,要求用手工计算: 表2.6(1) 画散点图(略)(2) X 与Y 是否大致呈线性关系? 答:从散点图看,X 与Y 大致呈线性关系。

(3) 用最小二乘法估计求出回归方程。

计算表(4) 求回归标准误差先求SSR (Q e )见计算表。

所以(5) 给出 的置信度为95%的区间估计; 由于(1-a)的置信度下,的置信区间是 查表可得 915.110667.36ˆ2ˆ1===xxL S σβ 所以 的95%的区间估计为:(7—3.182*1.915,7+3.182*1.915),即(0.906,13.094)。

351.6)102551(667.36)1(ˆ22ˆ=+=+=xx L X n S σβ 所以 的95%的区间估计为:(-1-3.182*6.351,-1+3.182*6.351), 即(-21.211, 19.211)。

^0β的置信区间包含0,表示^0β不显著。

(6) 计算x 和y 的决定系数10ˆ,ˆββ22ˆˆˆˆ(,)iii i t s t s ααββββ-⨯+⨯iβˆ182.3)3()2(025.02/==-t n t α1ˆβ0ˆβ说明回归方程的拟合优度高。

(7) 对回归方程作方差分析方差分析表F 值=13.364>F 0.05(1,3)=10.13(当n 1=1,n 2=8时,α=0.05查表得对应的值为10.13),所以拒绝原假设,说明回归方程显著。

(8)做回归系数β1的显著性检验H0: β1=0656.3915.1/7/ˆ1ˆ1===ββS t t 值=3.656>t 0.05/2(3)=3.182,所以拒绝原假设,说明x 对Y 有显著的影响。

(8) 做相关系数R 的显著性检验R 值=0.904>R 0.05(3)=0.878,所以接受原假设,说明x 和Y 有显著的线性关系。

(9) 对回归方程作残差图并作相应的分析残差图(略) .从残差图上看出,残差是围绕e=0在一个固定的带子里随机波动,基本满足模型的假设e i ~N(0, s 2 ), 但由于样本量太少, 所以误差较大.(10) 求广告费用为4.2万元时,销售收入将达到多少?并给出置信度为95%的置信区间. 解: 当X 0=4.2时,所以广告费用为4.2万元时, 销售收入将达到28.4万元. 由于置信度为1-α时,Y 0估计值的置信区间为:022ˆ000ˆ0ˆˆYY Y Y S t Y Y S t Y --⨯+<<⨯-αα)1044.1511(667.36)(11(ˆ202ˆ0++=-++=-xx YY L X X n S σ所以求得Y 0的95%的置信区间为: [6.05932 ,50.74068] 预测误差较大.2.15 一家保险公司十分关心其总公司营业部加班的制度,决定认真调查一下现状。

经过十周时间,收集了每周加班工作时间的数据和签发的新保单数目,x 为每周新签发的保单数目,y 为每周加班工作时间(小时)。

见表2.7。

表2..72、由散点图可以看出, x 与y 之间大致呈线性关系。

4.282.471ˆˆˆ0100=⨯+-=+=X Y ββ3、用最小二乘法求出回归系数由表可知:118.0β= 00359.0β1= 回归方程为: x 00359.0118.0y ˆ+=4、求回归标准误差σˆ由方差分析表可以得到:SSE=1.843故回归标准误差2^2SSEn σ=-,^σ=0.48。

5、给出回归系数的置信度为95%的区间估计由回归系数显著性检验表可以看出,当置信度为95%时:^0β的预测区间为[-0.701,0.937], ^1β的预测区间为[0.003,0.005].^0β的置信区间包含0,表示^0β不拒绝为零的假设。

6、决定系数由模型概要表得到决定系数为0.9接近于1,说明模型的拟合优度高。

7. 对回归方程作方差分析 由方差分析表可知:F 值=72.396>5.32(当n 1=1,n 2=8时,查表得对应的值为5.32) P 值≈0,所以拒绝原假设,说明回归方程显著。

8、对^1β的显著性检验从上面回归系数显著性检验表可以得到^1β的t 统计量为t=8.509,所对应的p 值近似为0,通过t 检验。

相关文档
最新文档