第6章 相关与回归分析习题解答
统计学:相关回归分析习题与答案
一、单选题1、下列哪种关系属于相关关系而非函数关系?()A.销售总额与销售量B.价格与销售量C.工资总额与人均工资D.圆的面积与半径正确答案:B解析: B、函数关系是指现象之间存在的确定性的数量依存关系。
2、若两个变量之间的线性相关系数为0.9,则()。
A.回归系数为0.81B.判定系数为0.81C.回归估计标准误为0.81D.判定系数为0.95正确答案:B3、下列指标一定非负的是()。
A.回归系数bB.相关系数rC.回归估计标准误S yxD.回归常数a正确答案:C4、在回归直线方程中y c=a+bx,b 是直线的斜率,表明()。
A.当x 增加一个单位时,y 增加a的数量B.当y 增加一个单位时,x 的平均增加量C.当y 增加一个单位时,x 增加b的数量D.当x 增加一个单位时,y 的平均增加量正确答案:D5、相关系数r与回归系数b的关系是()。
A. b=r×S x/S yB. b=r×S y/S xC. r=b×S y/S xD. 以上都不对正确答案:B6、当所有的观察值y都落在直线y c=a+bx上时,x与y之间的相关系数是()。
A. r=1B.r=-1C. |r|=1D.r=0正确答案:C解析:当r=1或r=-1时,表示变量之间为完全相关7、相关系数r=0表示()。
A.不存在相关关系B.两变量独立C.不存在线性相关关系D.存在平衡关系正确答案:C8、对相关系数的显著性检验,通常采用的是()。
A.Z检验B.F检验C.χ2检验D.T检验正确答案:D9、线性回归的检验中,检验整个方程显著性的是()。
A.F检验B.DW检验C.t检验D.R检验正确答案:A10、下列现象的相关密切程度高的是A.商品销售额与商业利润率之间的相关系数是0.62B.商品销售额与流通费用率之间的相关系数为-0.76C.某商店职工人数与商品销售额之间的相关系数为0.79D.流通费用率与商业利润率之间的相关系数是-0.89正确答案:D二、多选题1、下列属于负相关的现象是()。
统计学课后习题答案-相关分析与回归分析
、 单项选择题1. 相关分析是研究变量之间的 A. 数量关系 C •因果关系2. 在相关分析中要求相关的两个变量3. 下列现象之间的关系哪一个属于相关关系?A. 播种量与粮食收获量之间关系 C •圆半径与圆面积之间关系 D. 单位产品成本与总成本之间关系 4. 正相关的特点是A •两个变量之间的变化方向相反 C. 两个变量之间的变化方向一致 5. 相关关系的主要特点是两个变量之间A. 存在着确定的依存关系 C. 存在着严重的依存关系 B. 存在着不完全确定的关系 D. 存在着严格的对应关系6.当自变量变化时 , 因变量也相应地随之等量变化 ,则两个变量 之间存在着A. 直线相关关系B.负相关关系C.曲线相关关系 D.正相关关系 7. 当变量 X 值增加时 ,变量 Y 值都随之下降 ,则变量 X 和 Y 之间存 在着 A. 正相关关系 C.负相关关系D.曲线相关关系8. 当变量 X 值增加时 ,变量 Y 值都随之增加 ,则变量 X 和 Y 之间存 在着 A. 直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系9. 判定现象之间相关关系密切程度的最主要方法是 A. 对现象进行定性分析 B.计算相关系数C.编制相关表 D.绘制相关图10. 相关分析对资料的要求是A. 自 变量不是随机的,因变量是随机的B. 两个变量均不是随机的C. 自变量是随机的,因变量不是随机的D. 两个变量均为随机的 11. 相关系数第七章相关分析与回归分析B.变动关系D. 相互关系的密切程度 A. 都是随机变量C. 都不是随机变量B. 自变量是随机变量 D. 因变量是随机变量B •圆半径与圆周长之间关系B.两个变量一增一减 D. 两个变量一减一增 B.直线相关关系A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为C. 不相关D.负相关B.-1w rw 0 D. r=0 ,则相关系数 B.愈趋近于0D. 愈小于 1 ,则相关系数 B.愈趋近于0D. 愈小于116. 相关系数越接近于- 1,表明两变量间C. 负相关关系越强 D.负相关关系越弱17. 当相关系数 r=0 时 , A. 现象之间完全无关 B.相关程度较小 B. 现象之间完全相关D.无直线相关关系18. 假设产品产量与产品单位成本之间的相关系数为 -0.89,则说明这两个变量之间存在A.高度相关 B.中度相关 C. 低度相关D.显著相关19. 从变量之间相关的方向看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关20. 从变量之间相关的表现形式看可分为 A. 正相关与负相关 B.直线相关和曲线相关C. 单相关与复相关D.完全相关和无相关21. 物价上涨 ,销售量下降 ,则物价与销售量之间属于 A. 无相关 B.负相关 C.正相关D.无法判断22. 配合回归直线最合理的方法是 A.随手画线法 B.半数平均法 C.最小平方法D.指数平滑法A.单相关B.复相关 13. 相关系数的取值范围是 A.-1W r < 1C.OW rw 114. 两变量之间相关程度越强 A.愈趋近于1 C.愈大于115. 两变量之间相关程度越弱 A.愈趋近于1 A. 没有相关关系B. 有曲线相关关系23.在回归直线方程y= a+ bx 中 b 表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时,x的平均增加量24.计算估计标准误差的依据是A.因变量的数列C.因变量的回归变差25.估计标准误差是反映A.平均数代表性的指标B.因变量的总变差D.因变量的剩余变差B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中 ,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程 y=10+70x, 这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为 1000件时,其生产成本为 30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数G剩余变差B.回归参数D.估计标准误差、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系2.直线相关分析的特点是A.相关系数有正负号C.只有一个相关系数E.年龄与血压之间的关系B.两个变量是对等关系D. 因变量是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量 x 与 y 之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=85-5.6x,则B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加 5.6元D.产量为 1 千件时,单位成本为 79.4 元E.产量每增加1千件,单位成本平均减少 5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关16用最小平方法配合的回归直线 A . (y-y c )=最小值 C. (y-y c )2=最小值 E.(y-y c )2=最大值D.计算相关系数 8•当现象之间完全相关的A.0B.— 1E.计算估计标准误差 ,相关系数为C.1D.0.5E. — 0.59•相关系数r =0说明两个变量之间是 A •可能完全不相关 B •可能是曲线相关 C.肯定不线性相关 D.肯定不曲线相关E. 高度曲线相关 10下列现象属于正相关的有A. 家庭收入愈多,其消费支出也愈多B. 流通费用率随商品销售额的增加而减少D. 生产单位产品耗用工时,随劳动生产率的提高而减少E. 工人劳动生产率越高,则创造的产值就越多 11直线回归分析的特点有 A •存在两个回归方程 B •回归系数有正负值C. 两个变量不对等关系D. 自变量是给定的,因变量是随机的E. 利用一个回归方程,两个变量可以相互计算 12直线回归方程中的两个变量C. 必须确定哪个是自变量,哪个是因变量D. 一个是随机变量,另一个是给定变量E. 一个是自变量,另一个是因变量13. 从现象间相互关系的方向划分,相关关系可以分为 A.直线相关 B.曲线相关 D. 负相关 E.单相关14. 估计标准误差是A. 说明平均数代表性的指标B. 说明回归直线代表性指标C. 因变量估计值可靠程度指标D. 指标值愈小,表明估计值愈可靠C.正相关Ar D.r(x x)(y y)B rL xyC.rL xyL yyL xy LXX(X X)(y y) Er■(X X)2 (y y)2n xy x y、n x 2 ( x)2 、n y 2 ( y)217 方程 y c=a+bx,必须满足以下条件B. (y-y c)=02A.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E.其数值大小受计量单位的影响19相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值一致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.__________________________________________________ 研究现象之间相关关系称作相关分析。
《应用回归分析》课后题答案解析
.
《应用回归分析》部分课后习题答案
第一章 回归分析概述
1.1 变量间统计关系和函数关系的区别是什么? 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量 唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另 外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么? 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 a. 在回归分析中,变量 y 称为因变量,处在被解释的特殊地位。在相关分析中,变 量 x 和变量 y 处于平等的地位,即研究变量 y 与变量 x 的密切程度与研究变量 x 与变量 y 的密切程度是一回事。b.相关分析中所涉及的变量 y 与变量 x 全是随机 变量。而在回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量也可以 是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的 密切程度。而回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归 方程进行预测和控制。
1 3
即为:(2.49,11.5)
33,7+2.353 1 3
33)
0
N
(0
,
(
1 n
(x)2 Lxx
)
2
)
t
0 0
0 0
(
1
(
x)2
)
2
1 (x)2
n Lxx
n Lxx
服从自由度为 n-2 的 t 分布。因而
P |
0 0
1 (x)2
| t /2 (n 2) 1
n Lxx页脚源自 ..1330 6.1
3
(5)由于 1
N
(1,
01练习题6(相关系数与回归分析)
练习题6(相关系数与回归分析)1某电视台非常关心新闻节目的受欢迎程度;电视节目的受欢迎程度由一套评估体系来决定,这个评估体系对每个被评估的节目评级:由1(最低)到10(最高)。
某电视台认为在新闻节目之前的节目的受欢迎程度会影响到新闻节目的受欢迎程度。
为此,他们搜集了一组30个样本,其中包含两个变量:x-新闻节目之前的节目评级;y-新闻节目的评级,数据列于为研究x与y二者之间的关系,计算相关系数,并对其进行检验。
3 使用四川绵阳地区3年生中山柏的数据“中山柏.sav”,分析月生长量与平均气温、月降雨量、月平均日照时数、月平均湿度这4个气候因素哪个因素有关?回归分析:4 零售商要了解每周的广告费X及消费额Y之间关系,记录如下数据:画出散点图,并在Y对X回归为线性的假定下,用最小二乘法算出一元回归方程.5 某厂生产某产品,其成本费用(Y,万元)与劳动量(X1,千小时)及原材料价格(X 2,万元/万吨)有密切关系。
下面列出了2002年1月~2003年6月的成本、劳动量、原材料价格资料。
要求:(1)建立二元线性回归方程,对回归系数b1、b2进行合理的解释。
(2)对所建立的回归方程进行显著性检验;(3)假定2003年7月份劳动量X1=1.19千小时,X2=2.31万元/万吨,试预测2003年7月份的成本费用。
6 用第2题资料,计算身高与坐高、体重、胸围、肩宽和骨盆宽等变量的Pearson相关关系,并用逐步回归建立方程。
(引入原则P<0.05,剔除原则P>0.051)7用第1题资料,假定模型为:y=β0+β1Xi+εi i= 1,…,30用最小二乘法估计模型参数,建立线性回归模型,对回归系数进行显著性检验,对β1的置信水平作95%的区间估计。
对x=8时的y值作预测,并作95%的预测区间。
8 家庭信用卡消费多寡与家庭年收入及家庭人口有关,具体数据如下表,要求:①做消费金额与家庭人口,消费金额与年收入的散点图;②因变量、自变量分别是什么;③建立回归方程,讨论这三者之间的关系;④讨论哪个因素对因变量影响大,理由是什么?被调查对象的家庭年收入(万元)、家庭人口和信用卡消费的金额(元)。
计量第六章习题
自相关性一、单项选择题1、如果模型t t t u X b b Y ++=10存在序列相关,则【 】A cov (t x ,t u )=0B cov (t u ,s u )=0(ts )C cov (t x ,t u )0D cov (t u ,s u )0(ts ) 2、DW 检验的零假设是(为随机项的一阶自相关系数)【 】A DW=0B =0C DW=1D =13、下列哪种形式的序列相关可用DW 统计量来检验(i v 为具有零均值,常数方差,且不存在序列相关的随机变量)【 】A t t t v u u +=-1ρB t t t t v u u u +++=--Λ221ρρC t t v u ρ=D Λ++=-12t t t v v u ρρ4、DW 值的取值范围是【 】A -1DW0B -1DW1C -2DW2D 0 DW4 5、当DW =4是时,说明【 】A 不存在序列相关B 不能判断是否存在一阶自相关C 存在完全的正的一阶自相关D 存在完全的负的一阶自相关6、根据20个观测值估计的结果,一元线性回归模型的DW =。
在样本容量n=20,解释变量k=1,显着性水平=时,查得L d =1,U d =,则可以判断【 】A 不存在一阶自相关B 存在正的一阶自相关C 存在负的一阶自相关D 无法确定 7、当模型存在序列相关现象时,适宜的参数估计方法是【 】A 加权最小二乘法B 间接最小二乘法C 广义差分法D 工具变量法 8、对于原模型t t t u X b b Y ++=10,一阶广义差分模型是指【 】A)()()(1)(1t t t t t t t X f u X f X b X f b X f Y ++=B tt t u X b Y ∆+∆=∆1C t t t u X b b Y ∆+∆+=∆10D )()()1(11101----+-+-=-t t t t t t u u X X b b Y Y ρρρρ9、采用一阶差分模型克服一阶线性自相关问题适用于下列哪种情况【 】 A 0 B 1 C -1<<0 D 0<<110、假定某企业的生产决策由模型t t t u P b b S ++=10描述(其中t S 为产量,t P 为价格),如果该企业在t-1期生产过剩,经济人员会削减t 期的产量。
回归分析习题及答案
回归分析习题及答案回归分析习题及答案回归分析是统计学中一种常用的分析方法,用于研究变量之间的关系。
它可以帮助我们了解变量之间的相关性,并预测未来的趋势。
在本文中,我们将提供一些回归分析的习题及其详细解答,帮助读者更好地理解和应用这一方法。
习题一:某公司想要了解其销售额与广告投入之间的关系。
公司收集了过去12个月的数据,包括每个月的广告投入(单位:万元)和当月的销售额(单位:万元)。
请利用这些数据进行回归分析,并给出相关的统计结果。
解答一:首先,我们需要将数据导入统计软件,比如SPSS或Excel。
然后,我们可以使用线性回归模型来分析销售额与广告投入之间的关系。
在SPSS中,可以选择“回归”分析,将销售额作为因变量,广告投入作为自变量,进行线性回归分析。
回归分析的结果包括回归方程、相关系数、显著性检验等。
回归方程可以用来描述销售额与广告投入之间的关系。
相关系数可以告诉我们这两个变量之间的相关程度,取值范围为-1到1,越接近1表示相关性越强。
显著性检验可以告诉我们回归方程是否显著,即广告投入是否对销售额有显著影响。
习题二:某研究人员想要了解学生的考试成绩与他们的学习时间之间的关系。
研究人员随机选择了100名学生,记录了他们的学习时间(单位:小时)和考试成绩(百分制)。
请利用这些数据进行回归分析,并给出相关的统计结果。
解答二:同样地,我们需要将数据导入统计软件,然后进行回归分析。
这次,我们将考试成绩作为因变量,学习时间作为自变量。
除了之前提到的回归方程、相关系数和显著性检验之外,我们还可以通过回归分析的结果来进行预测。
例如,我们可以利用回归方程来预测一个学生在给定学习时间下的考试成绩。
习题三:某研究人员想要了解一个人的身高与体重之间的关系。
研究人员随机选择了200名成年人,记录了他们的身高(单位:厘米)和体重(单位:千克)。
请利用这些数据进行回归分析,并给出相关的统计结果。
解答三:同样地,我们将数据导入统计软件,然后进行回归分析。
统计学第六章课后题与答案解析
文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.第六章、单项选择题1.下面的函数关系是()A现代化水平与劳动生产率圆周的长度决定于它的半径C家庭的收入和消费的关系亩产量与施肥量2.相关系数r的取值范围B -1C -1< r < +13.年劳动生产率x(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均()A增加70元 B 减少70元C增加80元D减少80元4.若要证明两变量之间线性相关程度高, 则计算出的相关系数应接近于A +1B -1C 0.5 D5.回归系数和相关系数的符号是一致的, 其符号均可用来判断现象A线性相关还是非线性相关 B 正相关还是负相关C完全相关还是不完全相关 D 单相关还是复相关6.某校经济管理类的学生学习统计学的时间(X)与考试成绩(y)之间建立线性回归方程? =a+bx。
经计算,方程为? =200— 0.8X,该方程参数的计算()Aa值是明显不对的值是明显不对的C a值和b值都是不对的D a 值和b值都是正确的7.在线性相关的条件下, 自变量的均方差为2,因变量均方差为5,而相关系数为0.8 时,则其回归系数为:()A 8B 0.32C 2D 12&进行相关分析,要求相关的两个变量A都是随机的C一个是随机的,一个不是随机的随机或不随机都可以都不是随机的9.下列关系中,属于正相关关系的有A合理限度内,施肥量和平均单产量之间的关系B产品产量与单位产品成本之间的关系C商品的流通费用与销售利润之间的关系D流通费用率与商品销售量之间的关系10.相关分析是研究 ( )A变量之间的数量关系变量之间的变动关系C变量之间的相互关系的密切程度 D 变量之间的因果关系11.在回归直线 y c=a+bx ,b<0,则x与y之间的相关系数()A r=0B r=lC 0< r<1D -1< r <012.当相关系数 r=0 时,表明 (A现象之间完全无关 B 相关程度较小C现象之间完全相关 D 无直线相关关系13.下列现象的相关密切程度最高的是 ( )A某商店的职工人数与商品销售额之间的相关系数0.87B流通费用水平与利润率之间的相关系数为-0.94C商品销售额与利润率之间的相关系数为0.51D商品销售额与流通费用水平的相关系数为-0.8114.估计标准误差是反映 ( )A平均数代表性的指标相关关系的指标C回归直线方程的代表性指标D序时平均数代表性指标二、多项选择题1.下列哪些现象之间的关系为相关关系( )A 家庭收入与消费支出关系B 圆的面积与它的半径关系C广告支出与商品销售额关系D商品价格一定,商品销售与额商品销售量关系2.相关系数表明两个变量之间的( )A因果关系 C变异程度 D 相关方向 E 相关的密切程度3.对于一元线性回归分析来说( )A两变量之间必须明确哪个是自变量,哪个是因变量B回归方程是据以利用自变量的给定值来估计和预测因变量的平均可能值C 可能存在着 y 依 x 和 x 依 y 的两个回归方程D回归系数只有正号4.可用来判断现象线性相关方向的指标有( )A相关系数 B 回归系数 C 回归方程参数a D 估计标准误5.单位成本 ( 元)依产量 (千件 )变化的回归方程为 y c=78- 2x ,这表示 ( ) A产量为1000件时,单位成本 76元B产量为1000件时,单位成本 78元C产量每增加1000件时,单位成本下降 2元D产量每增加1000件时,单位成本下降 78元6.估计标准误的作用是表明 ( )A样本的变异程度回归方程的代表性C估计值与实际值的平均误差D样本指标的代表性7.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属于A完全相关 B 单相关 C 负相关 D 复相关8.在直线相关和回归分析中 ( )A据同一资料, 相关系数只能计算一个B据同一资料, 相关系数可以计算两个C据同一资料, 回归方程只能配合一个D据同一资料, 回归方程随自变量与因变量的确定不同,可能配合两个9.相关系数 r 的数值 ( )A可为正值 B 可为负值 C 可大于1 D 可等于-110.从变量之间相互关系的表现形式看,相关关系可分为A正相关 B 负相关 C直线相关 D 曲线相关11.确定直线回归方程必须满足的条件是 ( )A现象间确实存在数量上的相互依存关系B 相关系数 r 必须等于 1C y与x必须同方向变化D现象间存在着较密切的直线相关关系12.当两个现象完全相关时,下列统计指标值可能为A r=1B r=0C r=-1D S y=013.在直线回归分析中,确定直线回归方程的两个变量必须是A一个自变量,一个因变量均为随机变量C对等关系一个是随机变量,一个是可控制变量14.配合直线回归方程是为了A确定两个变量之间的变动关系用因变量推算自变量C用自变量推算因变量两个变量都是随机的15.在直线回归方程中 ( )A在两个变量中须确定自变量和因变量 B 一个回归方程只能作一种推算C要求自变量是给定的,而因变量是随机的。
最新应用回归分析-第6章课后习题参考答案
第6章多重共线性的情形及其处理思考与练习参考答案6.1 试举一个产生多重共线性的经济实例。
答:例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。
由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差。
再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供应都与企业的生产规模有关,往往出现高度相关情况,大企业二者都大,小企业都小。
6.2多重共线性对回归参数的估计有何影响?答:1、完全共线性下参数估计量不存在;2、近似共线性下OLS估计量非有效;3、参数估计量经济含义不合理;4、变量的显著性检验失去意义;5、模型的预测功能失效。
6.3 具有严重多重共线性的回归方程能不能用来做经济预测?答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。
但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。
6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系?答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。
当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。
6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能避免多重共线性的出现?答:请参考第三次上机实验题——机场吞吐量的多元线性回归模型,注意利用二手数据很难避免多重共线性的出现,所以一般利用逐步回归和主成分回归消除多重共线性。
如果进行自己进行试验设计如正交试验设计,并收集数据,选择向量使设计矩阵X 的列向量(即X 1,X 2, X p )不相关。
6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量。
统计学第六章课后题及答案解析
第六章一、单项选择题1.下面的函数关系是( )A现代化水平与劳动生产率 B圆周的长度决定于它的半径C家庭的收入和消费的关系 D亩产量与施肥量2.相关系数r的取值范围( )A -∞< r <+∞B -1≤r≤+1C -1< r < +1D 0≤r≤+13.年劳动生产率x(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元 B减少70元 C增加80元 D减少80元4.若要证明两变量之间线性相关程度高,则计算出的相关系数应接近于( )A +1B -1C 0.5D 15.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关 B正相关还是负相关C完全相关还是不完全相关 D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程ŷ=a+bx。
经计算,方程为ŷ=200—0.8x,该方程参数的计算( )A a值是明显不对的B b值是明显不对的C a值和b值都是不对的D a值和b值都是正确的7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( )A 8B 0.32C 2D 12.58.进行相关分析,要求相关的两个变量( )A都是随机的 B都不是随机的C一个是随机的,一个不是随机的 D随机或不随机都可以9.下列关系中,属于正相关关系的有( )A合理限度内,施肥量和平均单产量之间的关系B产品产量与单位产品成本之间的关系C商品的流通费用与销售利润之间的关系D流通费用率与商品销售量之间的关系10.相关分析是研究( )A变量之间的数量关系 B变量之间的变动关系C变量之间的相互关系的密切程度 D变量之间的因果关系11.在回归直线y c=a+bx,b<0,则x与y之间的相关系数 ( )A r=0B r=lC 0< r<1D -1<r <012.当相关系数r=0时,表明( )A现象之间完全无关 B相关程度较小C现象之间完全相关 D无直线相关关系13.下列现象的相关密切程度最高的是( )A某商店的职工人数与商品销售额之间的相关系数0.87B流通费用水平与利润率之间的相关系数为-0.94C商品销售额与利润率之间的相关系数为0.51D商品销售额与流通费用水平的相关系数为-0.8114.估计标准误差是反映( )A平均数代表性的指标 B相关关系的指标C回归直线方程的代表性指标 D序时平均数代表性指标二、多项选择题1.下列哪些现象之间的关系为相关关系( )A家庭收入与消费支出关系 B圆的面积与它的半径关系C广告支出与商品销售额关系D商品价格一定,商品销售与额商品销售量关系2.相关系数表明两个变量之间的( )A因果关系 C变异程度 D相关方向 E相关的密切程度3.对于一元线性回归分析来说( )A两变量之间必须明确哪个是自变量,哪个是因变量B回归方程是据以利用自变量的给定值来估计和预测因变量的平均可能值C可能存在着y依x和x依y的两个回归方程D回归系数只有正号4.可用来判断现象线性相关方向的指标有( )A相关系数 B回归系数 C回归方程参数a D估计标准误5.单位成本(元)依产量(千件)变化的回归方程为y c=78- 2x,这表示( ) A产量为1000件时,单位成本76元B产量为1000件时,单位成本78元C产量每增加1000件时,单位成本下降2元D产量每增加1000件时,单位成本下降78元6.估计标准误的作用是表明( )A样本的变异程度 B回归方程的代表性C估计值与实际值的平均误差 D样本指标的代表性7.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属于( ) A完全相关 B单相关 C负相关 D复相关8.在直线相关和回归分析中( )A据同一资料,相关系数只能计算一个B据同一资料,相关系数可以计算两个C据同一资料,回归方程只能配合一个D据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个9.相关系数r的数值( )A可为正值 B可为负值 C可大于1 D可等于-110.从变量之间相互关系的表现形式看,相关关系可分为( )A正相关 B负相关 C直线相关 D曲线相关11.确定直线回归方程必须满足的条件是( )A现象间确实存在数量上的相互依存关系B相关系数r必须等于1C y与x必须同方向变化D现象间存在着较密切的直线相关关系12.当两个现象完全相关时,下列统计指标值可能为( )A r=1B r=0C r=-1D S y=013.在直线回归分析中,确定直线回归方程的两个变量必须是( )A一个自变量,一个因变量 B均为随机变量C对等关系 D一个是随机变量,一个是可控制变量14.配合直线回归方程是为了( )A确定两个变量之间的变动关系 B用因变量推算自变量C用自变量推算因变量 D两个变量都是随机的15.在直线回归方程中( )A在两个变量中须确定自变量和因变量 B一个回归方程只能作一种推算C要求自变量是给定的,而因变量是随机的。
《统计学》(第8版)笔记和课后习题详解
《统计学》(第8版)笔记和课后习题详解统计学 (第8版) 笔记和课后题详解
1. 简介
本文档为《统计学》第8版的笔记和课后题详解。
主要内容包括统计学的基本概念、统计学的应用和解决问题的方法等。
2. 章节概述
第一章:统计学导论
该章节介绍了统计学的基本定义和应用领域,以及统计学在科学研究中的作用。
第二章:数据描述
该章节重点介绍了统计学中常用的数据描述方法,包括数据的图形展示、数据的中心趋势和数据的离散程度等。
第三章:概率与概率分布
该章节讲解了概率的概念和性质,以及常见的概率分布如二项分布、正态分布等。
第四章:统计推断的基本原理
该章节介绍了统计推断的基本原理,包括参数估计和假设检验等内容。
第五章:单因素方差分析
该章节讲解了单因素方差分析的原理和应用,以及一些统计学中常见的假设检验方法。
第六章:相关与回归分析
该章节重点介绍了相关与回归分析的原理和应用,包括线性回归和多元回归等内容。
3. 课后题详解
本文档还包含了每章的课后题详解,帮助读者巩固所学知识。
针对题中的难点和常见错误,给出了详细的解答和解题思路。
4. 结语
通过阅读本文档的《统计学》笔记和课后题详解,读者将更好地理解统计学的基本概念和方法,掌握统计分析的基本技能。
以上是《统计学》(第8版)笔记和课后习题详解的概述。
希望对您有所帮助!。
统计学原理-第六章--相关与回归分析习题
A+1 B 0 C 0.5 D [1]5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关B正相关还是负相关C完全相关还是不完全相关D单相关还是复相关6.某校经济管理类的学生学习统计学的时间()与考试成绩(y)之x间建立线性回归方程y c=a+b。
经计算,方程为y c=200—0.8x,该方程参数x的计算( )A a值是明显不对的B b值是明显不对的C a值和b值都是不对的 C a值和6值都是正确的7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( )A 8B 0.32C 2D 12.58.进行相关分析,要求相关的两个变量( )A都是随机的B都不是随机的C一个是随机的,一个不是随机的D随机或不随机都可以9.下列关系中,属于正相关关系的有( )A合理限度内,施肥量和平均单产量之间的关系B产品产量与单位产品成本之间的关系C商品的流通费用与销售利润之间的关系D流通费用率与商品销售量之间的关系10.相关分析是研究( )A变量之间的数量关系B变量之间的变动关系C变量之间的相互关系的密切程度D变量之间的因果关系11.在回归直线y c=a+bx,b<0,则x与y之间的相关系数( )A =0B =lC 0<<1D -1<<0r r r r12.在回归直线yc=a+bx中,b表示( )A当x增加一个单位,,y增加a的数量B当y增加一个单位时,x增加b的数量C当x增加一个单位时,y的均增加量D当y增加一个单位时,x的平均增加量13.当相关系数r=0时,表明( )A现象之间完全无关B相关程度较小C现象之间完全相关D无直线相关关系14.下列现象的相关密切程度最高的是( )A某商店的职工人数与商品销售额之间的相关系数0.87B流通费用水平与利润率之间的相关关系为-0.94C商品销售额与利润率之间的相关系数为0.51D商品销售额与流通费用水平的相关系数为-0.8115.估计标准误差是反映( )A平均数代表性的指标B相关关系的指标C回归直线的代表性指标D序时平均数代表性指标三、多项选择题1.下列哪些现象之间的关系为相关关系( )A家庭收入与消费支出关系B圆的面积与它的半径关系C广告支出与商品销售额关系D单位产品成本与利润关系E在价格固定情况下,销售量与商品销售额关系2.相关系数表明两个变量之间的( )A线性关系B因果关系C变异程度D相关方向E相关的密切程度3.对于一元线性回归分析来说( )A两变量之间必须明确哪个是自变量,哪个是因变量B回归方程是据以利用自变量的给定值来估计和预测因变量的平均可能值C可能存在着y依x和x依y的两个回归方程D回归系数只有正号E 确定回归方程时,尽管两个变量也都是随机的,但要求自变量是给定的。
北方民族大学计量期末习题第六章 自相关
一、单项选择题1.在给定的显著性水平之下,若DW 统计量的下和上临界值分别为dL 和dU,则当L U d d d <<时,可认为随机误差项( )A.存在一阶正自相关B.存在一阶负相关C.不存在序列相关D.存在序列相关与否不能断定2.在序列自相关的情况下,参数估计值的方差不能正确估计的原因是( )A22() i E u σ≠ B ()0() i j E u u i j ≠≠ C ()0 i i E x u ≠ D ()0 i E u ≠ 3.在检验异方差的方法中,不正确的是( )A. Goldfeld-Quandt 方法B. X-Y 散点图检验法C. White 检验法D. DW 检验法4.在DW 检验中,当d 统计量为0时,表明( )A.存在完全的正自相关B.存在完全的负自相关C.不存在自相关D.不能判定5.在下列产生序列自相关的原因中,不正确的是( )A.经济变量的惯性作用B.经济行为的滞后作用C.设定偏误D.解释变量的共线性6.加权最小二乘法是( )的一个特例A.广义差分法B.普通最小二乘法C.广义最小二乘法D.两阶段最小二乘法8.设为随机误差项,则一阶线性自相关是指( )A cov(,)0()t s u u t s ≠≠B 1t t t u u ρε-=+C 1122t t t t u u u ρρε--=++ D21t t t u u ρε-=+ 9.在自相关情况下,常用的估计方法( )A .普通最小二乘法 B. 广义差分法 C .工具变量法 D. 加权最小二乘法10.在DW 检验中,不能判定的区域是( )A 0,44l l d d d d <<-<<B 4u u d d d <<-C ,44l u u l d d d d d d <<-<<-D 上述都不对11.用于检验序列相关的DW 统计量的取值范围是( )。
A.0≤DW ≤1B.-1≤DW ≤1C.-2≤DW ≤2D.0≤DW ≤412.已知DW 统计量的值接近于2,则样本回归模型残差的一阶自相关系数ρˆ近似等于( )。
回归分析练习题及参考答案
回归分析练习题及参考答案求:(1)⼈均GDP 作⾃变量,⼈均消费⽔平作因变量,绘制散点图,并说明⼆者之间的关系形态。
(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
(3)求出估计的回归⽅程,并解释回归系数的实际意义。
(4)计算判定系数,并解释其意义。
(5)检验回归⽅程线性关系的显著性(0.05α=)。
(6)如果某地区的⼈均GDP 为5000元,预测其⼈均消费⽔平。
(7)求⼈均GDP 为5000元时,⼈均消费⽔平95%的置信区间和预测区间。
解:(1)可能存在线性关系。
(2)相关系数:(3)回归⽅程:734.6930.309y x=+回归系数的含义:⼈均GDP没增加1元,⼈均消费增加0.309元。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型⾮标准化系数标准化系数t 显著性B 标准误Beta1 (常量)734.693 139.540 5.265 0.003⼈均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: ⼈均消费⽔平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%⼈均GDP对⼈均消费的影响达到99.6%。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
模型摘要模型R R ⽅调整的R ⽅估计的标准差1 .998(a) 0.996 0.996 247.303a. 预测变量:(常量), ⼈均GDP(元)。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(5)F 检验:回归系数的检验:t 检验注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。
系数(a)模型⾮标准化系数标准化系数t 显著性B 标准误 Beta1(常量) 734.693 139.540 5.2650.003 ⼈均GDP (元)0.3090.0080.99836.4920.000a. 因变量: ⼈均消费⽔平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(6)某地区的⼈均GDP 为5000元,预测其⼈均消费⽔平为 734.6930.30950002278.693y =+?=(元)。
应用回归分析,第6章课后习题参考答案
第6章多重共线性的情形及其处理思考与练习参考答案6.1 试举一个产生多重共线性的经济实例。
答:例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。
由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差。
再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供应都与企业的生产规模有关,往往出现高度相关情况,大企业二者都大,小企业都小。
6.2多重共线性对回归参数的估计有何影响?答:1、完全共线性下参数估计量不存在;2、近似共线性下OLS估计量非有效;3、参数估计量经济含义不合理;4、变量的显著性检验失去意义;5、模型的预测功能失效。
6.3 具有严重多重共线性的回归方程能不能用来做经济预测?答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。
但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。
6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系?答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。
当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。
6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能避免多重共线性的出现?答:请参考第三次上机实验题——机场吞吐量的多元线性回归模型,注意利用二手数据很难避免多重共线性的出现,所以一般利用逐步回归和主成分回归消除多重共线性。
如果进行自己进行试验设计如正交试验设计,并收集数据,选择向量使设计矩阵X的列向量(即X1,X2,X p)不相关。
6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量。
6回归分析 习题 简单 (2)
回归分析习题一、选择题(共14小题;共70分)1. 在一组样本数据,,,(不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为A. B. C. D.2. 已知回归方程,则该方程在样本处的残差为A. B. C. D.3. 对两个变量进行回归分析,则下列说法中不正确的是A. 由样本数据得到的回归方程必经过样本中心B. 残差平方和越大,模型的拟合效果越好C. 用来刻画回归效果,越大,说明模型的拟合效果越好D. 若散点图中的样本呈条状分布,则变量和之间具有线性相关关系4. 对两个变量与进行回归分析,分别选择不同的模型,它们的相关系数如下,其中拟合效果最好的模型是A. 模型Ⅰ的相关系数为B. 模型Ⅱ的相关系数为C. 模型Ⅲ的相关系数为D. 模型Ⅳ的相关系数为5. 在两个变量与的回归模型中,选择了个不同模型,其中拟合效果最好的模型是A. 相关指数为的模型B. 相关指数为的模型C. 相关指数为的模型D. 相关指数为的模型6. 甲、乙、丙、丁四位同学各自对,两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数与残差平方和,如下表:甲乙丙丁则哪位同学的试验结果体现,两变量有更强的线性相关性A. 甲B. 乙C. 丙D. 丁7. 由一组样本数据得到的回归直线方程,那么下面说法不正确的是A. 直线必经过点B. 直线至少经过点中的一个点C. 直线的斜率为D. 直线和各点的偏差是该坐标平面上所有直线与这些点的偏差中最小的直线.8. 甲、乙、丙、丁四位同学在建立变量,的回归模型时,分别选择了种不同模型,计算可得它们的相关指数分别如表:甲乙丙丁建立的回归模型拟合效果最差的同学是A. 甲B. 乙C. 丙D. 丁9. 设两个变量和之间具有线性相关关系,它们的相关系数是,关于的回归直线的斜率是,纵截距是,那么必有A. 与的符号相同B. 与的符号相同C. 与的相反D. 与的符号相反10. 若要有的把握作出两个变量具有线性相关关系的推断,则要求A. 两个相关变量的散点图必须近似的在一条直线上B. 回归系数C. 回归系数D. 线性相关系数满足11. 已知变量与之间的相关系数,查表得到相关系数临界值,若要使可靠性不低于,则可以认为变量与之间A. 不具有线性相关关系B. 具有线性相关关系C. 它们的线性关系还要进一步确定D. 不确定12. 下列说法正确的是A. 对于相关系数来说,,越接近,相关程度越大;越接近相关程度越小B. 对于相关系数来说,,越接近,相关程度越大;越大,相关程度越小C. 对于相关系数来说,,越接近,相关程度越大;越接近相关程度越小D. 对于相关系数来说,,越接近,相关程度越小;越大,相关程度越大13. 某商品的销售量(件)与销售价格(元/件)存在线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,则下列结论正确的是A. 与具有正的线性相关关系B. 若表示变量与之间的线性相关系数,则C. 当销售价格为元时,销售量为件D. 当销售价格为元时,销售量为件左右14. 两个变量与的回归模型中,分别选择了个不同的模型,它们的相关指数如下,其中拟合效果最好的模型是A. 模型的相关指数为B. 模型的相关指数为C. 模型的相关指数为D. 模型的相关指数为二、填空题(共4小题;共22分)15. 回归分析(1)回归分析是对具有⑧的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据,,,,我们知道,,则将⑨称为样本点的中心.(3)相关系数:.当时,表明两个变量⑩;当时,表明两个变量⑪.的绝对值越接近于,表明两个变量的线性相关性⑫.的绝对值越接近于,表明两个变量之间⑬.通常大于或等于⑭时,认为两个变量有很强的线性相关性.16. 若某函数模型相对一组数据的残差平方和为,其相关指数为,则总偏差平方和为,回归平方和为.17. 如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于,解释变量和预报变量之间的相关系数等于.18. 和的散点图如图,则下列说法中所有正确命题的序号为.①、是负相关关系;②在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则;③、之间不能建立回归直线方程.三、解答题(共2小题;共26分)19. 某种书每册的成本费元与印刷千册有关,经统计得到如下数据:试判断关于是否具有线性回归关系.20. 某公司为确定下一年度投入某产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响.对近年的宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.表中,.(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立关于的回归方程;(3)已知这种产品的年利润与,的关系为.根据(2)的结果回答下列问题:①年宣传费时,年销售量及年利润的预报值是多少?②年宣传费为何值时,年利润的预报值最大?附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,.第一部分1. D 【解析】所有样本点均在同一条斜率为正数的直线上,则样本相关系数最大,为.2. C3. B 【解析】样本中心点在直线上,故A正确,残差平方和越小的模型,拟合效果越好,故B不正确,越大拟合效果越好,故C正确,当散点图中的样本呈条状分布,表示两个变量具有线性相关关系,D正确.4. A 【解析】因为相关系数的绝对值越大,越具有强大相关性,A相关系数的绝对值约接近,所以A拟合程度越好.5. A6. D 【解析】越大,越小,线性相关性越强.7. B 【解析】由知所以必定过点.8. C9. A10. D11. B12. C13. D 【解析】当销售价格为元时,,即销售量为件左右.14. A 【解析】两个变量与的回归模型中,它们的相关指数越接近于,这个模型的拟合效果越好,在所给的四个选项中,是相关指数最大的值,因此拟合效果最好的是模型.第二部分15. 相关关系,,正相关,负相关,越强,几乎不存在线性相关关系,16. ,【解析】由题中条件可知,残差平方和占总偏差平方和的比例为,所以总偏差平方和为,回归平方和为或.17. ,或【解析】设样本点为,,回归直线为;若散点图中所有的样本点都在一条直线上,则此直线方程就是回归直线方程.所以有;残差平方和;解释变量和预报变量之间的相关系数满足,所以.18. ①②第三部分19. ,,计算,,,由公式计算的,因为,所以没有充分的理由认为与具有线性相关关系.20. (1)由散点图可以判断,适合作为年销售关于年宣传费用的回归方程类型.(2)令,先建立关于的线性回归方程,由于,所以.所以关于的线性回归方程为,所以关于的回归方程为.(3)①由(2)知,当时,年销售量的预报值,.②根据(2)的结果知,年利润的预报值,所以当,即,取得最大值.故宣传费用为千元时,年利润的预报值最大.。
第六章相关与回归分析习题答
第六章 相关与回归分析一、单项选择题1、相关关系是指变量间的( ④ )①严格的函数关系 ②简单关系和复杂关系 ③严格的依存关系 ④不严格的依存关系 2、单相关也叫简单相关,所涉及变量的个数为(② )①一个 ②两个 ③三个 ④多个 3、直线相关即( ① )①线性相关 ②非线性相关 ③曲线相关 ④正相关 4、相关系数的取值范围是( ④ )①(0,1) ②[0,1] ③(-1,1) ④[-1,1] 5、相关系数为零时,表明两个变量间( ② )①无相关关系 ②无直线相关关系 ③无曲线相关关系 ④中度相关关系 6、相关系数的值越接近-1,表明两个变量间( ② ) ①正线性相关关系越弱 ②负线性相关关系越强 ③线性相关关系越弱 ④线性相关关系越强 7、进行简单直线回归分析时,总是假定( ① )①自变量是非随机变量、因变量是随机变量 ②两变量都是随机变量 ③自变量是随机变量、因变量是确定性变量 ④两变量都不是随机变量 8、回归方程i i x y5.1123ˆ+=中的回归系数数值表明:当自变量每增加一个单位时,因变量( ② )①增加1.5个单位 ②平均增加1.5个单位 ③增加123个单位 ④平均增加123个单位 9、下列现象的相关密切程度高的是(② )。
①某商店的职工人数与商品销售额之间的相关系数为0.87②流通费用率与商业利润率之间的相关系数为-0.94 ③商品销售额与商业利润率之间的相关系数为0.51 ④商品销售额与流通费用率之间的相关系数为-0.81 10、从变量之间相关的表现形式看,可分为(② )。
①正相关与负相关 ②线性相关和非线性相关 ③简单相关与多元相关 ④完全相关和不完全相关 二、多项选择题1、下列表述正确的有( ③④⑤ ) ①具有明显因果关系的两变量一定不是相关关系②只要相关系数较大,两变量就一定存在密切关系③相关关系的符号可以说明两变量相互关系的方向④样本相关系数和总体相关系数之间存在抽样误差⑤相关系数的平方就是判定系数2、下列各组变量之间属于相关关系的有(①②③⑤)①家庭收入越多与其消费支出也越多②人口数与消费品的需求量③人的身高与体重④一般地说,一个国家文化素质提高,则人口的平均寿命也越长⑤在一定的施肥量范围内,施肥量增加,农作物收获量也增加3、判断现象之间有无相关关系的方法有(①②④⑤)①编制相关表②绘制相关图③计算估计标准误差④对客观现象作定性分析⑤计算相关系数4、相关分析是(①②③)①研究两个变量之间是否存在着相关关系②测定相关关系的密切程度③判断相关关系的形式④配合相关关系的方程式⑤进行统计预测或推断5、应用相关分析与回归分析需注意(①②③④⑤)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 相关与回归分析思考与练习一、判断题1.产品的单位成本随着产量增加而下降,这种现象属于函数关系。
答:错。
应是相关关系。
单位成本与产量间不存在确定的数值对应关系。
2.相关系数为0表明两个变量之间不存在任何关系。
答:.错。
相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。
3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。
答:对,因果关系的判断还有赖于实质性科学的理论分析。
4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。
答:错。
两者是精确的函数关系。
5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。
答:对。
6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。
答:对。
因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样。
二、选择题1.变量之间的关系按相关程度分可分为:b 、c 、da.正相关;b. 不相关;c. 完全相关;d.不完全相关; 2.复相关系数的取值区间为:aa. 10≤≤R ;b.11≤≤-R ;c.1≤≤∞-R ;d.∞≤≤-R 1 3.修正自由度的决定系数a 、b 、da.22R R ≤; b.有时小于0 ; c. 102≤≤R ;d.比2R 更适合作为衡量回归方程拟合程度的指标 4.回归预测误差的大小与下列因素有关:a 、b 、c 、da 样本容量;b 自变量预测值与自变量样本平均数的离差c 自变量预测误差;d 随机误差项的方差三、问答题1.请举一实例说明什么是单相关和偏相关?以及它们之间的差别。
答:例如夏季冷饮店冰激凌与汽水的消费量,简单地就两者之间的相关关系进行考察,就是一种单相关,考察的结果很可能存在正相关关系,即冰激凌消费越多,汽水消费也越多。
然而,如果我们仔细观察,可以发现一般来说,消费者会在两者中选择一种消费,也就是两者之间事实上应该是负相关。
两者之间的单相关关系出现正相关是因为背后还有天气等因素的影响,天气越热,两种冷饮的消费量都越多。
如果设法将天气等因素固定不变,单纯考察冰激凌与汽水的消费量,则可能出现负相关关系。
像这种假定其他影响因素不变专门考察其中两个因素之间的关系就成为偏相关。
2.讨论以下几种场合,回归方程t t t t u X X Y +++=33221βββ中回归系数的经济意义和应取的符号。
(1)Y t 为商业利润率;X 2t 为人均销售额;X 3t 为流通费用率。
(2)Y t 为粮食销售量;X 2t 为人口数;X 3t 为人均收入。
(3)Y t 为工业总产值;X 2t 为占用的固定资产;X 3t 为职工人数。
(4)Y t 为国内生产总值;X 2t 为工业总产值;X 3t 为农业总产值。
答: (1)02>β,03<β人均销售额越大,企业利润越高,故此商业利润率越高,从而商业利润率与人均销售额呈正相关关系;而流通费用率越高,反映商业企业的经营成本越高,其商业利润率就越低。
(2)02>β,03>β人口数量越多,对粮食的消费量就越大;人均收入越多,对粮食的购买力就越强,故此这两个变量皆与粮食销售量呈正相关关系。
(3)02>β,03>β固定资产和职工人数是两大生产要素,数量越多,说明生产要素越密集,工业总产值就越高,所以它们与工业总产值的关系为正相关。
(4)01>β,02>β,03>β因为国内生产总值包括三次产业,所以工业总产值、农业总产值和全部的国内生产总值为正相关关系,同时即便某些特殊地区没有工业和农业,仍然有国内生产总值,所以,01>β。
四、计算题1.设销售收入X为自变量,销售成本Y为因变量。
现根据某百货公司12个月的有关资料计算出以下数据:(单位:万元) ∑-2)(X X t =425053.73 ; X = 647.88; ∑-2)(Y Y t = 262855.25 ; Y = 549.8; ∑--))((X XY Y tt= 334229.09(1) 拟合简单线性回归方程,并对方程中回归系数的经济意义做出解释。
(2) 计算决定系数和回归估计的标准误差。
(3) 对β2进行显著水平为5%的显著性检验。
(4)假定明年1月销售收入为800万元,利用拟合的回归方程预测相应的销售成本,并给出置信度为95%的预测区间。
解:(1)7863.073.42505309.334229)())((ˆ22==---=∑∑X X X X Y Y tt tβ3720.4088.647*7863.08.549ˆˆ21=-=-=X Y ββ (2)∑∑∑----=2222)()(]))(([Y Y X X X X Y Y r tttt999834.025.262855*73.42505309.3342292== 6340.43)()1(222=--=∑∑Y Y r et0889.222=-=∑n eS te(3)0:,0:2120≠=ββH H003204.073.4250530889.2)(2ˆ2==-=∑X XS S teβ4120.245003204.07863.0ˆ22ˆ2ˆ===βββS t228.2)10()2(05.02/==-t n t αt 值远大于临界值2.228,故拒绝零假设,说明2β在5%的显著性水平下通过了显著性检验。
(4)41.669800*7863.03720.40=+=f Y (万元)1429.273.425053)88.647800(12110089.2)()(11222=-++=--++=∑X X X X n S S t f e f所以,Y f 的置信度为95%的预测区间为:3767.241.6690667.1*228.214.696)2(2/±=±=-±f e f S n t Y α所以,区间预测为: 18.46764.466≤≤f Y2. 对9位青少年的身高Y 与体重X 进行观测,并已得出以下数据:i13.54Y =∑ ,∑=9788.22Y2i,i472X=∑,228158i X =∑,803.02i iX Y =∑要求:(1)以身高为因变量,体重为自变量,建立线性回归方程;(2)计算残差平方和决定系数;(3)计算身高与体重的相关系数并进行显著性检验;(自由度为7,显著水平为0.05的t 分布双侧检验临界值为2.365。
)(4)对回归系数2ˆβ进行显著性检验。
解:(1)2222)())())((ˆ∑∑∑∑∑∑∑--=---=tttttt tttX X N Y X Y X N X X X X Y Y β0273.0472*47228158*9472*54.1302.803*9=--=0727.09/472*0273.09/54.13ˆˆ21=-=-=X Y ββ (2)决定系数:9723.0)()(]))(([2222=----=∑∑∑Y X X X Y Y r t t t t残差平方和0722.0)()1(222=--=∑∑Y Y r et(3)身高与体重的相关系数:9861.09723.02===R r不同时为零和211210:,0:ββββH H ==1016.022=-=∑n e S te检验统计量9134.245)(ˆ2222=-=∑etS X X F β)2(2,1-=-N t F NF 值远大于临界值2.365,故拒绝零假设,说明回归方程在5%的显著性水平下通过了显著性检验。
(4)0:,0:2120≠=ββH H0005.03404.2220273.0)(2ˆ2==-=∑X XS S teβ6.540005.00273.0ˆ22ˆ2ˆ===βββS t365.2)7()2(05.02/==-t n t αt 值远大于临界值2.365,故拒绝零假设,说明2β在5%的显著性水平下通过了显著性检验。
资料来源:厦门市统计局网站,其中人均储蓄根据储蓄额与人口数推算。
试根据该表的资料,(1) 拟合以下形式的消费函数:Y t =β1+β2X 1t +β3X 2t +U t (2) 计算随机误差项的标准差估计值、修正自由度的决定系数,并对整个回归方程进行显著性检验。
(3) 假设某一居民家庭人均可支配收入为12,000元,人均储蓄为40000元,试预测其人均消费支出,并给出置信度为95%的预测区间。
解:(1)回归分析的EXCEL 操作步骤为:步骤一:首先将数据粘贴导入EXCEL 数据表中。
步骤二:进行回归分析选择“工具” →“数据分析” →“回归”,在该窗口中选定自变量和因变量的数据区域,最后点击“确定”完成操作:得到回归分析的输出结果见下图。
因此回归方程为:t t t X X Y 210245.05879.00116.1596-+=(2)随机误差项的标准差估计值为:S =369.3716,修正的决定系数为:9633.02=R 。
不同时为零和、32113210:,0:ββββββH H ===F=145.4606远大于F 统计量的临界值4.10,说明回归方程在5%的显著性水平下通过检验。
(3)预测 点估计值为:158.963140000*0245.012000*5879.00116.1596=-+=f C使用EXCEL 进行区间估计步骤如下: 步骤一:构造工作表步骤二:为方便后续步骤书写公式,定义某些单元格区域的名称首先,定义F6、F7、F8的名称:选定E6:F8区域,然后执行菜单命令“插入”→“名称”→“指定”,在调出的对话框中选中“最左列”,单击“确定”:其次,定义B2:D13的名称:先选定该区域,然后执行然后执行菜单命令“插入”→“名称”→“定义”:调出“定义名称”对话框,输入名称“X ”,单击“确定”。
最后,采用同样方法,将B15:D15定义为“Xf ”,将F2:F4定义为“B ”。
步骤三:计算点预测值f C在F6中输入公式“=MMULT(Xf,B)”,按回车键即可。
步骤四:计算t 临界值在F7中输入公式“=TINV(1-0.95,12-3)”,按回车键即可。
步骤五:计算预测估计误差的估计值f e S在F5中输入公式:“=MMULT(MMULT(Xf,MINVERSE(MMULT(TRANSPOSE(X),X))),TRANSPOSE(Xf))”然后按“Ctrl+Shift+Enter ”组合键即可。
再计算f e S ,在F8中输入公式“=369.3716*SQRT(1+F5)”。
369.3716为回归估计标准差。
步骤六:计算置信区间上下限在F9、F10中分别输入公式“=Cf-t 临界值*Sef ”和“=Cf+t 临界值*Sef ”。