第7章 相关与回归分析课后习题解答
第七章 相关回归分析 思考题及练习题
实用价值越小。
13、在相关分析中,要求相关的两个变量( )
A、都是随机变量
B、都不是随机变量
C、其中因变量是随机变量 D、其中自变量是随机变量
14、在简单回归直线
中,
表示( ) A、当
增加一个单位时,
增加
的数量 B、当
增加一个单位时,
增加
的数量 C、当
增加一个单位时,
的平均增加值 D、当
增加一个单位时,
按一定数额变化时,变量
也随之近似地按固定的数额变化,那么,这时变量
和
之间存在着( )
A、正相关关系
B、负相关关系
C、直线相关关系 D、曲线相关关系
18、两个变量间的相关关系称为( )
A、单相关
B、无相关
C、复相关
D、多相关
19、如果两个变量之间的相关系数
,说明这两个变量之间存在( )。 A、低度相关关系 B、高度相关关系 C、完全相关关系 D、显著相关关系 20、已知
第七章 思考题及练习题
(一) 填空题
1、 1、 在相关关系中,把具有因果关系相互联系的两个变
量中起影响作用的变量称为_______,把另一个说明观察结果的
变量称为________。
2、 2、 现象之间的相关关系按相关的程度分有________相
关、________相关和_______相关;按相关的方向分有________
E、 E、回归方程实用价值大小的指标 10、现象之间相互联系的类型有( )
A、函数关系 B、回归关系 C、相关关系 D、随机关系 E、结构关系 11、相关关系种类( ) A、从相关方向分为正相关和负相关 B、从相关形态分为线性相关和非线性相关 C、从相关程度分为完全相关、不完全相关和零相关
统计学高教版相关与回归分析课后习题答案
第7章 相关与回归分析课后习题答案7.2 (1)数据散点图如下:(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。
(3)设投诉率为Y ,航班正点率为X建立回归方程 12i i i Y X u ββ=++估计参数为 ^6.01780.07i i Y X =-(4)参数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。
(5)航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为: 4187.08007.00178.6ˆ=⨯-=i Y (次/10万)7.3 由Excel 回归输出的结果可以看出:(1)回归结果为^23332.993090.0716190.1687270.179042i i i i Y X X X =+++(2)由Excel 的计算结果已知:1234,,,ββββ对应的 t 统计量分别为0.51206、4.853871、4.222811、3.663731 ,其绝对值均大于临界值0.025(224) 2.101t -=,所以各个自变量都对Y 有明显影响。
由F=58.20479, 大于临界值0.05(41,224) 3.16F --=,说明模型在整体上是显著的。
7.6(1)用Excel 输入Y 和X 数据,生成2X 和3X 的数据,用Y 对X 、2X 、3X 回归,估计参数结果为^231726.737.8796468740.00895 3.7124906i i Y X X E X =-+-+- t =(-1.9213) (2.462897) (-2.55934) (3.118062)20.973669R = 20.963764R =(2)检验参数的显著性:当取0.05α=时,查t 分布表得0.025(124) 2.306t -=,与t 统计量对比,除了截距项外,各回归系数对应的t 统计量的绝对值均大于临界值,表明在这样的显著性水平下,回归系数显著不为0。
应用回归分析-第7章课后习题参考答案
应⽤回归分析-第7章课后习题参考答案第7章岭回归思考与练习参考答案7.1 岭回归估计是在什么情况下提出的?答:当⾃变量间存在复共线性时,|X’X |≈0,回归系数估计的⽅差就很⼤,估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。
7.2岭回归的定义及统计思想是什么?答:岭回归法就是以引⼊偏误为代价减⼩参数估计量的⽅差的⼀种回归⽅法,其统计思想是对于(X ’X )-1为奇异时,给X’X 加上⼀个正常数矩阵D, 那么X’X+D接近奇异的程度就会⽐X ′X 接近奇异的程度⼩得多,从⽽完成回归。
但是这样的回归必定丢失了信息,不满⾜blue 。
但这样的代价有时是值得的,因为这样可以获得与专业知识相⼀致的结果。
7.3 选择岭参数k 有哪⼏种⽅法?答:最优k 是依赖于未知参数β和2σ的,⼏种常见的选择⽅法是:○1岭迹法:选择0k 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平⽅和增⼤不太多;○2⽅差扩⼤因⼦法:11()()()c k X X kI X X X X kI --'''=++,其对⾓线元()jj c k 是岭估计的⽅差扩⼤因⼦。
要让()10jj c k ≤;○3残差平⽅和:满⾜()SSE k cSSE <成⽴的最⼤的k 值。
7.4 ⽤岭回归⽅法选择⾃变量应遵循哪些基本原则?答:岭回归选择变量通常的原则是:1. 在岭回归的计算中,我们通常假定涉及矩阵已经中⼼化和标准化了,这样可以直接⽐较标准化岭回归系数的⼤⼩。
我们可以剔除掉标准化岭回归系数⽐较稳定且绝对值很⼩的⾃变量;2. 当k 值较⼩时,标准化岭回归系数的绝对值并不很⼩,但是不稳定,随着k的增加迅速趋近于零。
像这样岭回归系数不稳定、震动趋于零的⾃变量,我们也可以予以剔除;3.去掉标准化岭回归系数很不稳定的⾃变量。
第七章相关与回归分析习题答案
第七章 相关与回归分析习题答案一、填空题1.完全相关、不完全相关 、不相关2.—1≤r ≤1 3.函数、1=r4.无线性相关、完全正相关、完全负相关5. 密切程度6. 正相关、负相关7. 直线相关、曲线相关8.回归系数9.随机的、给定的10.最小二乘法,残差平方和二、单项选择题1.B 2.B 3.A 4.A 5.B6.C 7.D 8.B 9. A 10.C11.C 12.B 13.D 14.B 15.C三、多项选择题1.BCD 2.ACD 3.ABD 4.ABCD 5.ACE四、计算题1解:(1)7863.073.42505309.334229)())((ˆ22==---=∑∑X X X X Y Y ttt β 3720.4088.647*7863.08.549ˆˆ21=-=-=X Y ββ (2)∑∑∑----=2222)()(]))(([Y Y X X X X Y Y r t t t t999834.025.262855*73.42505309.3342292== 6340.43)()1(222=--=∑∑Y Y r e t0889.222=-=∑n e S te(3)0:,0:2120≠=ββH H003204.073.4250530889.2)(2ˆ2==-=∑X XS S t e β 4120.245003204.07863.0ˆ22ˆ2ˆ===βββS t 228.2)10()2(05.02/==-t n t αt 值远大于临界值2.228,故拒绝零假设,说明2β在5%的显著性水平下通过了显著性检验。
(4)41.669800*7863.03720.40=+=f Y (万元)1429.273.425053)88.647800(12110089.2)()(11222=-++=--++=∑X X X X n S S t f e f 所以,Y f 的置信度为95%的预测区间为:3767.241.6690667.1*228.214.696)2(2/±=±=-±f e f S n t Y α所以,区间预测为:18.46764.466≤≤f Y2解:(1)2222)())())((ˆ∑∑∑∑∑∑∑--=---=tt tt t t t t t X X N Y X Y X N X X X X Y Y β 0273.0472*47228158*9472*54.1302.803*9=--= 0727.09/472*0273.09/54.13ˆˆ21=-=-=X Y ββ (2)决定系数:9723.0)()(]))(([2222=----=∑∑∑Y X X X Y Y r t t t t 残差平方和 0722.0)()1(222=--=∑∑Y Y r e t (3)身高与体重的相关系数:9861.09723.02===R r不同时为零和211210:,0:ββββH H ==1016.022=-=∑n e S t e 检验统计量9134.245)(ˆ2222=-=∑e tS X F β)2(2,1-=-N t F NF 值远大于临界值2.365,故拒绝零假设,说明回归方程在5%的显著性水平下通过了显著性检验。
统计学第七章相关与回归分析试题及答案
统计学第七章相关与回归分析试题及答案第七章相关与回归分析(⼆) 单项选择题1、当⾃变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( B )A 、相关关系B 、函数关系C 、回归关系D 、随机关系2、测定变量之间相关密切程度的代表性指标是(C )A 、估计标准误B 、两个变量的协⽅差C 、相关系数D 、两个变量的标准差3、现象之间的相互关系可以归纳为两种类型,即( A )A 、相关关系和函数关系B 、相关关系和因果关系C 、相关关系和随机关系D 、函数关系和因果关系4、相关系数的取值范围是( C )A 、10≤≤γB 、11<<-γC 、11≤≤-γD 、01≤≤-γ5、变量之间的相关程度越低,则相关系数的数值(B )A 、越⼩B 、越接近于0C 、越接近于-1D 、越接近于16、在价格不变的条件下,商品销售额和销售量之间存在着( D )A 、不完全的依存关系B 、不完全的随机关系C 、完全的随机关系D 、完全的依存关系7、下列哪两个变量之间的相关程度⾼( C )A 、商品销售额和商品销售量的相关系数是0.9;B 、商品销售额与商业利润率的相关系数是0.84;C 、平均流通费⽤率与商业利润率的相关系数是-0.94;D 、商品销售价格与销售量的相关系数是-0.918、回归分析中的两个变量(D )A 、都是随机变量B 、关系是对等的C 、都是给定的量D 、⼀个是⾃变量,⼀个是因变量9、每⼀吨铸铁成本(元)倚铸件废品率(%)变动的回归⽅程为:x y c 856+=,这意味着( C )A 、废品率每增加1%,成本每吨增加64元B 、废品率每增加1%,成本每吨增加8%C 、废品率每增加1%,成本每吨增加8元D 、如果废品率增加1%,则每吨成本为56元。
10、某校对学⽣的考试成绩和学习时间的关系进⾏测定,建⽴了考试成绩倚学习时间的直线回归⽅程为:x y c 5180-=,该⽅程明显有错,错误在于( C )A 、a 值的计算有误,b 值是对的B 、b 值的计算有误,a 值是对的C 、a 值和b 值的计算都有误D 、⾃变量和因变量的关系搞错了11、配合回归⽅程对资料的要求是(B )A 、因变量是给定的数值,⾃变量是随机的B 、⾃变量是给定的数值,因变量是随机的C 、⾃变量和因变量都是随机的D 、⾃变量和因变量都不是随机的。
第7章 相关与回归分析课后习题解答
所以,Yf的置信度为 95%的预测区间为
所以,区间预测为
3.讨论以下几种场合的回归方程:
中回归系数的经济意义和应取的
符号。
(1)Yt为商业利润率;X2t他为人均销售额;X3t为流通费用率; (2)Yt为粮食销售量;X2t为人口数;X3t为人均收入; (3)Yt为工业总产值;X2t为占用的固定资产;X3t为职工人数; (4)Yt为国内生产总值;X2t为工业总产值;X3t为农业总产值。 答:
图 7—1
1 如果“数据分析命令”没有出现在“工具”菜单,则需要先运行“加载宏”命令,加载“分析工具库”。
图 7—2 在“回归”窗口中确定因变量 Y 值和自变量 X 值的区域后,点击“确定”。见图 7—3。回归结果见图 7—4。
图 7—3
图 7—4
从计算结果可知,拟合的样本回归方程为 (2)由图 7—4 可知,回归估计的标准误差为 638.7076;决定系数为 0.9987。 (3)回归系数的 5%显著性检验。 首先对β1的显著性进行检验2:
构造 t 统计量: 查t分布表可知:显著性水平为 5%,自由度为 21 的双测t检验的临界值为 2.080,t值小于临界值,故 无法拒绝零假设,说明β1在 5%的显著性水平下没有通过检验。 同理,可对β2进行显著性检验: t值远大于临界值 2.080,故拒绝零假设,说明β2在 5%的显著性水平下通过了显著性检验。 (4)预测: 点估计:Xf=104880 亿元,代入回归方程,Yf=62024.16 亿元。 置信度 95%的预测区间为: 计算Sef:
图 7—5 的消费” 步骤二:进行回归分析。 选择“工具”→“数据分析”→“回归”,在该窗口中选定自变量和因变量的数据区域,最后点击“确 定”完成操作。 得到回归分析的输出结果见图 7—6。
《统计学》 第七章 相关与回归分析
第七章相关与回归分析(一)填空题1、相关关系按其相关的程度不同,可分为、和。
2、相关系数的正负表示相关关系的方向,r为正值,两变量是;r为负数,两变量是。
3、r=0,说明两个变量之间;r=+1,说明两个变量之间;r=-1说明两个变量之间。
4、一元线性回归方程中的参数a代表,数学上称为;b代表,数学上称为。
5、分析要根据研究的目的确定哪一个为自变量,哪一个为因变量,在这一点与分析时不同。
6、相关关系按方向不同,可分为和。
7、完全线性相关的相关系数r值等于。
8、计算回归方程要注意资料中因变量是的,自变量是的。
9、回归方程只能用于由推算。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、相关分析研究的是( )A. 变量之间关系的密切程度B. 变量之间的因果关系C. 变量之间严格的相互依存关系D. 变量之间的线性关系2、相关关系是()A、现象间客观存在的依存关系B、现象间的一种非确定性的数量关系C、现象间的一种确定性的数量关系D、现象间存在的函数关系3、下列情形中称为正相关的是( )A. 随着一个变量的增加,另一个变量也增加B. 随着一个变量的减少,另一个变量增加C. 随着一个变量的增加,另一个变量减少D. 两个变量无关4、当自变量x的值增加,因变量y的值也随之增加,两变量之间存在着()A、曲线相关B、正相关C、负相关D、无相关5、相关系数r的取值范围是( )A. B. C. D.6、当自变量x的值增加,因变量y的值也随之减少,两变量之间存在着()A、曲线相关B、正相关C、负相关D、无相关7、相关系数等于零表明两变量( )A. 是严格的函数关系B. 不存在相关关系C. 不存在线性相关关系D. 存在曲线相关关系8、相关系数r的取值范围是()A、从0到1B、从-1到0C、从-1到1D、无范围限制9、相关分析对资料的要求是( )A. 两变量均为随机的B. 两变量均不是随机的C. 自变量是随机的,因变量不是随机的D. 自变量不是随机的,因变量是随机的10、相关分析与回归分析相比,对变量的性质要求是不同的,回归分析中要求()A、自变量是给定的,因变量是随机的B、两个变量都是随机的C、两个变量都是非随机的D、因变量是给定的,自变量是随机的11、回归方程中的回归系数b说明自变量变动一个单位时,因变量( )A. 变动b个单位B. 平均变动b个单位C. 变动a+b个单位D. 变动a个单位12、一般来说,当居民收入减少时,居民储蓄存款也会相应减少,二者之间的关系是()A、负相关B、正相关C、零相关 D曲线相关13、回归系数与相关系数的符号是一致的,其符号均可判断现象( )A. 线性相关还是非线性相关B. 正相关还是负相关C. 完全相关还是不完全相关D. 简单相关还是复相关14、配合回归方程比较合理的方法是()A、移动平均法B、半数平均法C、散点法D、最小平方法15、在相关分析中不能把两个变量区分为确定性的自变量和随机性的因变量,在回归分析中( )A. 也不能区分自变量和因变量B. 必须区分自变量和因变量C. 能区分,但不重要D. 可以区分,也可以不区分16、价格愈低,商品需求量愈大,这两者之间的关系是()A、复相关B、不相关C、正相关D、负相关17、按最小平方法估计回归方程中参数的实质是使( )A. B.C. D.18、判断现象之间相关关系密切程度的方法是()A、作定性分析B、制作相关图C、计算相关系数D、计算回归系数19、在线性相关条件下,自变量的标准差为2,因变量的标准差为5,而相关系数为0.8,其回归系数为( )A. 8B. 12.5C. 0.32D. 2.020、已知某产品产量与生产成本有直线关系,在这条直线上,当产量为1000件时,其生产成本为50000元,其中不随产量变化的成本为12000元,则成本总额对产量的回归方程是()A、Y=12000+38XB、Y=50000+12000XC、Y=38000+12XD、Y=12000+50000X21、已知,则相关系数为( )A.不能计算B.C.D.22、相关图又称()A、散布表B、折线图C、散点图D、曲线图23、工人的出勤率与产品合格率之间的相关系数如果等于0.85,可以断定两者是()A、显著相关B、高度相关C、正相关D、负相关24、相关分析与回归分析的一个重要区别是()A、前者研究变量之间的关系程度,后者研究变量间的变动关系,并用方程式表示B、前者研究变量之间的变动关系,后者研究变量间的密切程度C、两者都研究变量间的变动关系D、两者都不研究变量间的变动关系25、当所有观测值都落在回归直线上,则这两个变量之间的相关系数为()A、1B、-1C、+1或-1D、大于-1,小于+126、一元线性回归方程y=a+bx中,b表示()A、自变量x每增加一个单位,因变量y增加的数量B、自变量x每增加一个单位,因变量y平均增加或减少的数量C、自变量x每减少一个单位,因变量y减少的数量D、自变量x每减少一个单位,因变量y增加的数量(三)多项选择题(在每小题备选答案中,至少有两个答案是正确的)1、直线回归方程中,两个变量x和y ( )A. 前一个是自变量,后一个是因变量B. 两个变量都是随机变量C. 两个都是给定的量D. 前一个是给定的量,后一个是随机变量E. 前一个随机变量,后一个是给定的量2、相关分析()A、分析对象是相关关系B、分析方法是配合回归方程C、分析方法主要是绘制相关图和计算相关系数D、分析目的是确定自变量和因变量E、分析目的是判断现象之间相关的密切程度,并配合相应的回归方程以便进行推算和预测3、相关分析的特点有 ( )A. 两个变量是对等的关系B. 它只反映自变量和因变量的关系C. 可以计算出两个相关系数D. 相关系数的符号都是正的E. 相关的两个变量必须都是随机的4、下列现象中存在相关关系的有()A、职工家庭收入不断增长,消费支出也相应增长B、产量大幅度增加,单位成本相应下降C、税率一定,纳税额随销售收入增加而增加D、商品价格一定,销售额随销量增加而增加E、农作物收获率随着耕作深度的加深而提高5、相关关系与函数关系的区别在于( )A. 相关关系是变量间存在相互存在依存关系,而且函数关系是因果关系B. 相关关系的变量间是确定不变的,而函数关系值是变化的C. 相关关系是模糊的,函数关系是确定的D. 两种关系没有区别6、商品流通费用率与商品销售额之间的关系是()A、相关关系B、函数关系C、正相关D、负相关E、单相关7、为了揭示变量x与y之间的相互关系,可运用( )A. 相关表B. 回归方程C.相关系数D. 散点图8、相关系数()A、是测定两个变量间有无相关关系的指标B、是在线性相关条件下测定两个变量间相关关系密切程度的指标C、也能表明变量之间相关的方向D、其数值大小决定有无必要配合回归方程E、与回归系数密切相关9、可以借助回归系数来确定( )A. 两变量之间的数量因果关系B. 两变量之间的相关方向C. 两变量之间的相关的密切程度D. 揭示它与相关系数的数量关系,即10、直线回归方程()A、建立前提条件是现象之间具有较密切的直线相关关系B、关键在于确定方程中的参数a和bC、表明两个相关变量间的数量变动关系D、可用来根据自变量值推算因变量值,并可进行回归预测E、回归系数b=0时,相关系数r=011、可用来判断现象相关方向的指标有( )A. 相关系数B. 回归系数C. 回归参数aD. 协方差E. 估计标准误差12、某种产品的单位成本y(元)与工人劳动生产率x(件/人)之间的回归直线方程Y=50-0.5X,则()A、0.5为回归系数B、50为回归直线的起点值C、表明工人劳动生产率每增加1件/人,单位成本平均提高0.5元D、表明工人劳动生产率每增加1件/人,单位成本平均下降0.5元E、表明工人劳动生产率每减少1件/人,单位成本平均提高50元13、对于回归系数,下列说法中正确的有( )A. b是回归直线的斜率B. b的绝对值介于0-1之间C. b接近于零表明自变量对因变量影响不大D. b与相关系数具有以下关系:E. b满足方程组14、相关关系的特点是()A、现象之间确实存在数量上的依存关系B、现象之间不确定存在数量上的依存关系C、现象之间的数量依存关系值是不确定的D、现象之间的数量依存关系值是确定的E、现象之间不存在数量上的依存关系15、回归方程可用于( )A. 根据自变量预测因变量B. 给定因变量推算自变量C. 给定自变量推算因变量D. 推算时间数列中缺失的数据E. 用于控制因变量16、建立一元线性回归方程是为了()A、说明变量之间的数量变动关系B、通过给定自变量数值来估计因变量的可能值C、确定两个变量间的相关程度D、用两个变量相互推算E、用给定的因变量数值推算自变量的可能值17、在直线回归方程中,两个变量x和y()A、一个是自变量,一个是因变量B、一个是给定的变量,一个是随机变量C、两个都是随机变量D、两个都是给定的变量E、两个是相关的变量18、在直线回归方程中()A、在两个变量中须确定自变量和因变量B、回归系数只能取正值C、回归系数和相关系数的符号是一致的D、要求两个变量都是随机的E、要求因变量是随机的,而自变量是给定的19、现象间的相关关系按相关形式分为()A、正相关B、负相关C、直线相关D、曲线相关E、不相关20、配合一元线性回归方程须具备下列前提条件()A、现象间确实存在数量上的相互依存关系B、现象间的关系是直线关系,这种直线关系可用散点图来表示C、具备一组自变量与因变量的对应资料,且能明确哪个是自变量,哪个是因变量D、两个变量之间不是对等关系E、自变量是随机的,因变量是给定的值21、由直线回归方程y=a+bx所推算出来的y值()A、是一组估计值B、是一组平均值C、是一个等差级数D、可能等于实际值E、与实际值的离差平方和等于0(四)是非题1、判断现象之间是否存在相关关系必须计算相关系数。
统计学课后习题答案第七章相关分析与回归分析
第七章相关分析与回归分析一、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.自变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪一个属于相关关系?A.播种量与粮食收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆面积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化方向相反B.两个变量一增一减C.两个变量之间的变化方向一致D.两个变量一减一增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存在着A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要方法是A.对现象进行定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.自变量不是随机的,因变量是随机的B.两个变量均不是随机的C.自变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是A.-1≤r≤1B.-1≤r≤0C.0≤r≤1D. r=014.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全无关B.相关程度较小B.现象之间完全相关 D.无直线相关关系18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说明这两个变量之间存在A.高度相关B.中度相关C.低度相关D.显著相关19.从变量之间相关的方向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关21.物价上涨,销售量下降,则物价与销售量之间属于A.无相关B.负相关C.正相关D.无法判断22.配合回归直线最合理的方法是A.随手画线法B.半数平均法C.最小平方法D.指数平滑法23.在回归直线方程y=a+bx中b表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程y=10+70x,这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差二、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系E.年龄与血压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有一个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=85-5.6x,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加5.6元D.产量为1千件时,单位成本为79.4元E.产量每增加1千件,单位成本平均减少5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关7.判断现象之间有无相关关系的方法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差8.当现象之间完全相关的,相关系数为A.0B.--0.59.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.高度曲线相关10.下列现象属于正相关的有A.家庭收入愈多,其消费支出也愈多B.流通费用率随商品销售额的增加而减少C.产量随生产用固定资产价值减少而减少D.生产单位产品耗用工时,随劳动生产率的提高而减少E.工人劳动生产率越高,则创造的产值就越多11.直线回归分析的特点有A.存在两个回归方程B.回归系数有正负值C.两个变量不对等关系D.自变量是给定的,因变量是随机的E.利用一个回归方程,两个变量可以相互计算12.直线回归方程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是自变量,哪个是因变量D.一个是随机变量,另一个是给定变量E.一个是自变量,另一个是因变量13.从现象间相互关系的方向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈小,表明估计值愈可靠E.指标值愈大,表明估计值愈可靠15.下列公式哪些是计算相关系数的公式16.用最小平方法配合的回归直线,必须满足以下条件A.∑(y-y c )=最小值B.∑(y-y c )=0C.∑(y-y c )2=最小值D.∑(y-y c )2=0E.∑(y-y c )2=最大值17.方程y c =a+bx222222)()(.)()())((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xy yy xx xy yx ∑-∑⋅∑-∑∑⋅∑-∑=-∑⋅-∑--∑===--∑=σσA.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18.直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E. 其数值大小受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20.配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值一致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.研究现象之间相关关系称作相关分析。
计量经济学课后答案
计量经济学课后答案计量经济学课后答案第⼀章绪论(⼀)基本知识类题型 1-1.什么是计量经济学?1-2.简述当代计量经济学发展的动向。
1-3.计量经济学⽅法与⼀般经济数学⽅法有什么区别?1-4.为什么说计量经济学是经济理论、数学和经济统计学的结合?试述三者之关系。
1-5.为什么说计量经济学是⼀门经济学科?它在经济学科体系中的作⽤和地位是什么? 1-6.计量经济学的研究的对象和内容是什么?计量经济学模型研究的经济关系有哪两个基本特征?1-7.试结合⼀个具体经济问题说明建⽴与应⽤计量经济学模型的主要步骤。
1-8.建⽴计量经济学模型的基本思想是什么?1-9.计量经济学模型主要有哪些应⽤领域?各⾃的原理是什么?1-10.试分别举出五个时间序列数据和横截⾯数据,并说明时间序列数据和横截⾯数据有和异同?1-11.试解释单⽅程模型和联⽴⽅程模型的概念,并举例说明两者之间的联系与区别。
1-12.模型的检验包括⼏个⽅⾯?其具体含义是什么? 1-13.常⽤的样本数据有哪些?1-14.计量经济模型中为何要包括随机误差项?简述随机误差项形成的原因。
1-15.估计量和估计值有何区别?哪些类型的关系式不存在估计问题? 1-16.经济数据在计量经济分析中的作⽤是什么?1-17.下列假想模型是否属于揭⽰因果关系的计量经济学模型?为什么?⑴其中为第t 年农村居民储蓄增加额(亿元)、为第t 年城镇居民可⽀配收⼊总额(亿元)。
⑵其中为第(1 t )年底农村居民储蓄余额(亿元)、为第t 年农村居民纯收⼊总额(亿元)。
1-18.指出下列假想模型中的错误,并说明理由:(1)其中,为第t 年社会消费品零售总额(亿元),为第t 年居民收⼊总额(亿元)(城镇居民可⽀配收⼊总额与农村居民纯收⼊总额之和),为第t 年全社会固定资产投资总额(亿元)。
(2)t t Y C 2.1180+=其中,C 、Y 分别是城镇居民消费⽀出和可⽀配收⼊。
(3)t t t L K Y ln 28.0ln 62.115.1ln -+=其中,Y 、K 、L 分别是⼯业总产值、⼯业⽣产资⾦和职⼯⼈数。
统计学课后习题答案第七章相关分析与回归分析
统计学课后习题答案第七章相关分析与回归分析第七章相关分析与回归分析⼀、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.⾃变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪⼀个属于相关关系?A.播种量与粮⾷收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆⾯积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化⽅向相反B.两个变量⼀增⼀减C.两个变量之间的变化⽅向⼀致D.两个变量⼀减⼀增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当⾃变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要⽅法是A.对现象进⾏定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.⾃变量不是随机的,因变量是随机的B.两个变量均不是随机的C.⾃变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适⽤于直线相关,⼜适⽤于曲线相关B.只适⽤于直线相关C.既不适⽤于直线相关,⼜不适⽤于曲线相关D.只适⽤于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是A.-1≤r≤1B.-1≤r≤0C.0≤r≤114.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全⽆关B.相关程度较⼩B.现象之间完全相关 D.⽆直线相关关系18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说明这两个变量之间存在A.⾼度相关B.中度相关C.低度相关D.显著相关19.从变量之间相关的⽅向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关21.物价上涨,销售量下降,则物价与销售量之间属于A.⽆相关B.负相关C.正相关D.⽆法判断22.配合回归直线最合理的⽅法是A.随⼿画线法B.半数平均法C.最⼩平⽅法D.指数平滑法23.在回归直线⽅程y=a+bx中b表⽰A.当x增加⼀个单位时,y增加a的数量B.当y增加⼀个单位时,x增加b的数量C.当x增加⼀个单位时,y的平均增加量D.当y增加⼀个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动⽣产率(千元)和⼯⼈⼯资(元)之间存在回归⽅程y=10+70x,这意味着年劳动⽣产率每提⾼⼀千元时,⼯⼈⼯资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其⽣产成本为30000元,其中固定成本6000元,则总⽣产成本对产量的⼀元线性回归⽅程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.⽤来反映因变量估计值代表性⾼低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差⼆、多项选择题1.下列现象之间属于相关关系的有A.家庭收⼊与消费⽀出之间的关系B.农作物收获量与施肥量之间的关系C.圆的⾯积与圆的半径之间的关系D.⾝⾼与体重之间的关系E.年龄与⾎压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有⼀个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的⼀元线性回归⽅程为y=85-5.6x,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加5.6元D.产量为1千件时,单位成本为79.4元E.产量每增加1千件,单位成本平均减少5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.⾮线性相关7.判断现象之间有⽆相关关系的⽅法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差 8.当现象之间完全相关的,相关系数为A.0B.-1C.1D.0.5E.-0.5 9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.⾼度曲线相关10.下列现象属于正相关的有A.家庭收⼊愈多,其消费⽀出也愈多B.流通费⽤率随商品销售额的增加⽽减少C.产量随⽣产⽤固定资产价值减少⽽减少D.⽣产单位产品耗⽤⼯时,随劳动⽣产率的提⾼⽽减少E.⼯⼈劳动⽣产率越⾼,则创造的产值就越多 11.直线回归分析的特点有A.存在两个回归⽅程B.回归系数有正负值C.两个变量不对等关系D.⾃变量是给定的,因变量是随机的E.利⽤⼀个回归⽅程,两个变量可以相互计算 12.直线回归⽅程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是⾃变量,哪个是因变量D.⼀个是随机变量,另⼀个是给定变量E.⼀个是⾃变量,另⼀个是因变量13.从现象间相互关系的⽅向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关 14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈⼩,表明估计值愈可靠E.指标值愈⼤,表明估计值愈可靠 15.下列公式哪些是计算相关系数的公式16.⽤最⼩平⽅法配合的回归直线,必须满⾜以下条件A.∑(y-y c )=最⼩值B.∑(y-y c )=0C.∑(y-y c )2=最⼩值D.∑(y-y c )2=0E.∑(y-y c )2=最⼤值 17.⽅程y c =a+bx222222)()(.)()())((...))((.y y n x x n yx xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xyyy xx xy y x ∑-∑?∑-∑∑?∑-∑=-∑?-∑--∑===--∑=σσA.这是⼀个直线回归⽅程B.这是⼀个以X为⾃变量的回归⽅程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18.直线回归⽅程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动⽅向D.其数值⼤⼩不受计量单位的影响E. 其数值⼤⼩受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数⼤于零则相关系数⼤于零B.回归系数⼩于零则相关系数⼩于零C.回归系数等于零则相关系数等于零D.回归系数⼤于零则相关系数⼩于零E.回归系数⼩于零则相关系数⼤于零20.配合直线回归⽅程的⽬的是为了A.确定两个变量之间的变动关系B.⽤因变量推算⾃变量C.⽤⾃变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值⼀致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;⽽回归分析中⾃变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;⽽相关分析中⾃变量是给定的数值,因变量是随机的C.相关系数有正负号;⽽回归系数只能取正值D.相关分析中的两个变量是对等关系;⽽回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出⼀个相关系数;⽽回归分析中根据两个变量只能计算出⼀个回归系数三、填空题1.研究现象之间相关关系称作相关分析。
回归分析知识及习题.doc
A.(0,0 )点C・(0,D.(xJ) 归分析的基本知识点及习题1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。
2.线性回归方程y = hx^a中系数计算公式:-无)(月-顼)一亦顼/;= ---------- = -------- , a = y-bx9其中元,"表示样本均值.支3-元)2 力;-济/=! /=!3.回归直线必过样本点中心(% ,顼)A卷一、选择题:1 .炼钢时钢水的含碳量与冶炼时间有()A.确定性关系B.相关关系C.函数关系D.无任何关系2.对相关性的描述正确的是()A.相关性是一种因果关系B.相关性是一种函数关系C.相关性是变量与变量之间带有随机性的关系D.以上都不正确3.£时等于()/=!+X2y2+••・ D.X1- +工2>2 +••・+ "”4.设有-一个回归方程为y =2--2.5% ,则变量x增加一个单位时()A. y平均增加2.5个单位B. y平均增加2个单位C.y平均减少2.5个单位D.y平均减少2个单位A.3| +x2+••• + ◎'B.()\ +)Z +•.. + )'〃)5. y^jx之间的线性回归方程y =bx +a必定过()A.y = 11.47+ 2.62] C.y = 11.47x + 2.62 y = —11.47 +2.62工D. y = 11.47 -2.62x则系数的值为()£(玉—元)3,.-力/=!T)()f C. ----------------/=!已知x、y之间的一组数据:ZST)()',7)B. -----------------------n/=!£(气-玲26.某化工厂为预测某产品的问收率y,需要研究它和原料有效成分含量x之间8 8的相关关系,现取了8对观测值,计算得£兀=52, £乂=228,/=1 /=18 8£对二478,£易力=1849,则y与x的回归方程是()/=! /=!7•线性回归方程y = bx + a有一组独立的观测数据(为必),(方况),…,"〃,)%),贝,J y -W x的线性回归方程y = bx-\-a必过点()A.(2, 2)B.( 1.5,0)C. (1,2)D.(1.5,4)二、填空题:9.线性回归方程y = hx +a中,/?的意义是.10.有下列关系:⑴人的年龄与他(她)拥有的财富之间的关系;⑵曲线上的点写该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系.其中有相关关系的是.11.若施化肥量尤与水稻产量y的回归直线方程为y = 5x + 250 ,当施化肥量为SO kg时,预计的水稻产量为E(.v; - .y)2 i=l12.己知线性回归方程y = 1.5、+ 45(券{1,5,7,13,19}),则亍=.13.对于线性回归方程y = 4.75x + 257,当x = 28时,y的估计值是.三、解答题:14.为了研究三月下旬的平均气温(x°C)与四月二十号前棉花害虫化蛹高峰日(),)的关系,某地区观察了1996年至2001年的情况,得到下面的数据:(1)据气象预测,该地区在2002年三刀下旬平均气温为27°C,试估计2002年四月化蛹高峰日为哪天?(2)对变量心y进行相关性判断.•、选择题:1 .变量y与工之间的回归方程()A.表示y与工之间的函数关系B.表示y与尤之间的不确定性关系C.反映y与x之间真实关系的形式D.反映y-^x之间的真实关系达到最大限度的吻合3.由一组样本数据(羽,)\), (了2, ),2),…,(%)%)得到的回归直线方程y = bx + a , 那么下面说法不正确的是()A.直线y = bx + a必经过点(克力B.直线y=bx +a至少经过点(叫,)、),(^,/,…,(知)'〃)中的一个点Z也月—亦》C.直线y^bx + a的斜率为----------〃 2 -2Xj 一心D.直线)>= bx + a和各点(%], y)), (x2, ),•••, (x n, )的偏差[y y - (bx f +。
《应用回归分析》课后题答案[整理版]
《应用回归分析》课后题答案[整理版] 《应用回归分析》部分课后习题答案第一章回归分析概述 1.1 变量间统计关系和函数关系的区别是什么, 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么, 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。
区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。
在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。
b.相关分析中所涉及的变量y与变量x全是随机变量。
而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。
C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。
而回归分析不仅可以揭示变量x 对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么, 答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么,答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。
2.等方差及不相关的假定条件为{E(εi)=0 i=1,2….Cov(εi,εj)=,σ^23.正态分布的假定条件为相互独立。
4.样本容量的个数要多于解释变量的个数,即n>p.1.5 回归变量的设置理论根据是什么,在回归变量设置时应注意哪些问题,答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。
统计学习题 第七章相关与回归分析答案
第七章相关与回归分析习题一、填空题1、客观现象之间的数量联系有两种不同的类型:一种函数关系;另一种是相关关系。
2、现象之间是否存在相关关系是进行相关与回归分析的基础,其主要测定方法是计算相关系数。
3、若估计标准误差愈小,则根据直线回归方程计算的估计值就越能代表实际值。
4、对某实验结果做线性回归分析,得到形如y=a+bx的方程,现对回归系数b做显著性检验,该假设检验中原假设为 H0:b=0 ,备择假设为 H1:b≠0 ,若拒绝原假设,则认为 x 对y有显著的影响。
二、选择题单选题:1、相关分析对资料的要求是((1))(1)两变量均为随机的(2)两变量都不是随机的(3)自变量是随机的,因变量不是随机的(4)因变量是随机的,自变量不是随机的2、回归方程Y=a+bx中的回归系数b说明自变量变动一个单位时,因变量((4))(1)变动a+b个单位(2)变动1/b个单位(3)变动b个单位(4)平均变动b个单位3、相关系数r的取值范围((2))(1)-∞<r<+∞(2)-1≤r≤+1(3)-1<r<+1 (4)0≤r≤+1多选题:1、下列现象之间的相互关系,属于相关关系的有((1)(2)(4))(1)生产费用与生产量(2)设备的使用年限与维修费用(3)圆的半径与面积(4)身高与体重(5)一定价格下的销售量与销售收入2、相关系数r=0.9,这表明现象之间存在((1)(3))(1)高度相关关系(2)低度相关关系(3)正相关关系(3)负相关关系(5)函数关系3、回归模型可用于((1)(2)(4))(1)反映变量之间一般的数量变动关系(2)预测(3)反映变量之间相互关系的密切程度(4)反映变量之间的变动方向三、简答题1、什么是相关关系?相关关系有什么特点?答:相关关系是指变量之间所存在的一种不严格的数量依存关系。
表现在给确定自变量一个值,因变量有若干个数值与之对应。
并且因变量y总是遵循一定的规律围绕着这些数的平均数上下波动。
第七章期末复习总结与习题相关与回归分析
第七章期末复习总结与习题相关与回归分析第七章相关与回归分析相关分析一、函数关系、相关关系的概念1、函数关系:函数关系是一种严格的依存关系,这种关系可以用y = f (x )的方程来表现。
2、相关关系:相关关系是一种不完全确定的随机关系。
函数关系与相关关系的联系:对具有相关关系的现象进行分析时,必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式。
四、相关关系的判别方法(一)相关图表利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,在将两变量相对应的变量值用坐标点形式描绘出来即可。
利用相关图可以:判断现象之间有无相关关系、观察相关关系的类型、观察相关关系的密切程度(二)相关系数相关系数是测定变量之间相关密切程度的统计指标。
1.简单线性相关系数1. 对变量之间关系密切程度的度量2. 对两个变量之间线性相关程度的度量称为简单相关系数3. 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ4. 若是根据样本数据计算的,则称为样本相关系数,记为 r样本相关系数的定义公式实质总体相关系数的定义式是:ρ=)()(),(Y Var X Var Y X Cov (7.1)式中,Cov (X ,Y )是变量X 和Y 的协方差;Var(X )和Var(Y )分别为变量X 和Y 的方差。
总体相关系数是反映两变量之间线性相关程度的一种特征值,表现为一个常数。
y x xy r σσσ2=式中:n y y x x xy ))((2-∑-=σ,是变量 x 和y 的协方差。
n x x x ∑-=2)(σ,是变量 x 的标准差。
n y y y ∑-=2)(σ,是变量y 的标准差。
相关系数按“之间的相关程度。
积差法公式为:相关系数的性质1. r 的取值范围是 [-1,1]2. |r |=1,为完全相关r =1,为完全正相关r = -1,为完全负正相关3 .r = 0,不存在线性相关关系,它并不意味着X与Y之间不存在其他类型的关系。
计量经济学---第三版-李子奈---课后习题--答案
ÿÿÿÿÿ************************************************************************* *****************************************************************************ÿÿÿÿÿÿÿÿÿÿÿÿ第一章绪论(一)基本知识类题型1-1.什么是计量经济学1-3.计量经济学方法与一般经济数学方法有什么区别它在经济学科体系中的作用和地位是什么1-6.计量经济学的研究的对象和内容是什么计量经济学模型研究的经济关系有哪两个基本特征1-7.试结合一个具体经济问题说明建立与应用计量经济学模型的主要步骤。
1-9.计量经济学模型主要有哪些应用领域各自的原理是什么1-12.模型的检验包括几个方面其具体含义是什么1-17.下列假想模型是否属于揭示因果关系的计量经济学模型为什么⑴ S t其中S t为第t年农村居民储蓄增加额(亿元)、R t为第t年城镇居民可支配收入总额(亿元)。
⑵ S t1其中S t1为第(t1)年底农村居民储蓄余额(亿元)、R t为第t年农村居民纯收入总额(亿元)。
1-18.指出下列假想模型中的错误,并说明理由:(1)RS t RI t其中,RS t为第t年社会消费品零售总额(亿元),RI t为第t 年居民收入总额(亿元)(城镇居民可支配收入总额与农村居民纯收入总额之和),IV t为第t年全社会固定资产投资总额1(亿元)。
(2)C t 180其中,C、Y分别是城镇居民消费支出和可支配收入。
(3) ln Y t ln K t L t其中,Y、K、L分别是工业总产值、工业生产资金和职工人数。
1-19.下列假想的计量经济模型是否合理,为什么(1) GDP i GDP i其中, GDP i (i 1,2,3) 是第i产业的国内生产总值。
资源包 7相关与回归分析习题答案
章后习题参考答案第七章相关与回归分析1.单项选择题(1)A,(2)C,(3)D,(4)B,(5)A2.多项选择题(1)AB,(2)BE,(3)ABE,(4)BD,(5)ABCDE3.判析题(1)×,(2)√,(3)√,(4)√,(5)×4.简答题(1)什么是相关分析?相关分析的主要内容是什么?相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的关系的一种统计方法。
相关分析的内容:①确定现象之间有无相关关系②确定相关关系的表现形式③判定相关关系的密切程度和方向(2)什么是回归分析?回归分析的主要内容是什么?回归分析就是对具有相关关系的两个或两个以上变量之间的数量变化关系进行测定,建立因变量和自变量之间数量变动关系的数学表达式(回归方程),以便利用自变量的数值去估计或预测因变量数值的统计分析方法。
①根据研究的目的和现象之间的内在联系,确定自变量和因变量②确定回归分析模型的类型及数学表达式③对回归分析模型进行评价和诊断④根据给定的自变量数值推断因变量的数值(3)相关分析和回归分析有什么关系?①回归分析与相关分析的区别从广义上来说,相关分析包括回归分析,从狭义上说,相关分析与回归分析又有一定的区别。
狭义的相关分析和回归分析的区别主要有以下三个方面:第一,在相关分析中涉及的变量不存在自变量和因变量的划分问题,变量之间的关系是对等的;而在回归分析中,则必须根据研究对象的性质和研究分析的目的,对变量进行自变量和因变量的划分。
因此,在回归分析中,变量之间的关系是不对等的。
第二,在相关分析中所有的变量都必须是随机变量;而在回归分析中,自变量是给定的,因变量才是随机的。
第三,相关分析主要是通过一个指标即相关系数来反映变量之间相关密切程度的大小,由于变量之间是对等的,因此相关系数是惟一确定的;而在回归分析中,对于互为因果关系的两个变量,则有可能存在两个回归方程。
统计学课后习题答案第七章相关分析与回归分析
第七章相关分析与回归分析一、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.自变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪一个属于相关关系A.播种量与粮食收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆面积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化方向相反B.两个变量一增一减C.两个变量之间的变化方向一致D.两个变量一减一增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存在着A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要方法是A.对现象进行定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.自变量不是随机的,因变量是随机的B.两个变量均不是随机的C.自变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是≤r≤1 ≤r≤0≤r≤1 D. r=014.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全无关B.相关程度较小B.现象之间完全相关 D.无直线相关关系18.假设产品产量与产品单位成本之间的相关系数为,则说明这两个变量之间存在A.高度相关B.中度相关C.低度相关D.显着相关19.从变量之间相关的方向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关21.物价上涨,销售量下降,则物价与销售量之间属于A.无相关B.负相关C.正相关D.无法判断22.配合回归直线最合理的方法是A.随手画线法B.半数平均法C.最小平方法D.指数平滑法23.在回归直线方程y=a+bx中b表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程y=10+70x,这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:=6+ =6000+24x=24000+6x =24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差二、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系E.年龄与血压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有一个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加元D.产量为1千件时,单位成本为元E.产量每增加1千件,单位成本平均减少元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关7.判断现象之间有无相关关系的方法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差8.当现象之间完全相关的,相关系数为B.-1 E.-9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.高度曲线相关10.下列现象属于正相关的有A.家庭收入愈多,其消费支出也愈多B.流通费用率随商品销售额的增加而减少C.产量随生产用固定资产价值减少而减少D.生产单位产品耗用工时,随劳动生产率的提高而减少E.工人劳动生产率越高,则创造的产值就越多11.直线回归分析的特点有A.存在两个回归方程B.回归系数有正负值C.两个变量不对等关系D.自变量是给定的,因变量是随机的E.利用一个回归方程,两个变量可以相互计算12.直线回归方程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是自变量,哪个是因变量D.一个是随机变量,另一个是给定变量E.一个是自变量,另一个是因变量13.从现象间相互关系的方向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈小,表明估计值愈可靠E.指标值愈大,表明估计值愈可靠15.下列公式哪些是计算相关系数的公式16.用最小平方法配合的回归直线,必须满足以下条件A.?(y-y c )=最小值B.?(y-y c )=0C.?(y-y c )2=最小值D.?(y-y c )2=0E.?(y-y c )2=最大值17.方程y c =a+bx222222)()(.)()())((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xy yy xx xy yx ∑-∑⋅∑-∑∑⋅∑-∑=-∑⋅-∑--∑===--∑=σσA.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数是估计值18.直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E. 其数值大小受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20.配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在的所有理论值同它的平均值一致和y是函数关系与y不相关与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.研究现象之间相关关系称作相关分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D.比R2更适合作为衡量回归方程拟合程度的指标
4.下列各项中,与回归预测误差的大小有关的是( ABCD )。
A.样本容量 B.自变量预测值与自变量样本平均数的离差
C.自变量预测误差 D.随机误差项的方差项的方差
三、问答题
请举一实例说明什么是单相关和偏相关,以及它们之间的差别。
答:例如夏季冷饮店冰激凌与汽水的消费量,简单地就两者之间的相关关系进行考察,就是一种单相 关,考察的结果很可能存在正相关关系,即冰激凌消费越多,汽水消费也越多。然而,如果我们仔细观察, 可以发现一般来说,消费者会在两者中选择一种消费,也就是两者之问事实上应该是负相关。两者之间的 单相关关系出现正相关是因为背后还有天气等因素的影响,天气越热,两种冷饮的消费量都越多。如果设 法将天气等因素固定不变,单纯考察冰激凌与汽水的消费量,则可能出现负相关关系。像这种假定其他影 响因素不变专门考察其中两个因素之间的关系就成为偏相关。
第七章 相关与回归分析
一、判断题
1.产品的单位成本随着产量增加而下降,这种现象属于函数关系。( × ) 答:错。应是相关关系。单位成本与产量间不存在确定的数值对应关系。 2.相关系数为 0 表明两个变量之间不存在任何关系。( × ) 答:错。相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的 关系。 3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。( √ ) 答:对。因果关系的判断还有赖于实质性科学的理论分析。 4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。( × ) 答:错。两者是精确的函数关系。 5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。( √ ) 答:对。 6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。( √ ) 答:对。因为估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同, 估计的结果仍然不一样。
在 F5 中输入公式“=MMULT(MMULT(Xf,MINVERSE(MMULT(TRANsPC)SE(X),X))), TRANSPOSE(Xf))”
然后按“Ctr1+Shift 十 Enter”组合键即可。 再计算Sef在F8 中输入公式“=442.22*SQRT(1+F5)”。442.22 为回归估计标准差。 步骤六:计算置信区间上下限。 在 F9、F10 中分别输入公式“=Cf—t 临界值*Sef”和“=Cf+t 临界值*Sef”。结果见图 7—12。
二、选择题
1.变量之间的关系按相关程度分可分为( BCD )。
A.正相关 B.不相关 C.完全相关 D.不完全相关
2.复相关系数的取值区间为( A )。
A.0≤R≤1 B.-1≤R≤1 C.-∞≤R≤1 D.-1≤R≤∞
3.修正自由度的决定系数( ABD )。
A.
2
R
≤
R
2
2
B.有时小于 0 C.0≤ R ≤1
图 7—10
图 7—11
图 7—12 最终得出Cf的区间预测结果为 5.见教材 P207 页表 7—9 的资料。要求: (1)试拟合以下总成本函数: (2)根据总成本函数推导出平均成本函数,并描出平均成本函数的图形; (3)试根据以上结果推算总产量为 1550 时的单位产品平均成本。 解:(1)构造 Excel 数据表(见图 7 一 13),并以前面所述的同样步骤进行回归分析,得到相应的回 归分析结果,见图 7—14。
四、证明题
1.试证明教材P171 的(7.21)式给出的S2是标准一元线性回归模型中随机误差项的方差σ2的无偏估计 量。
证明:总体回归函数为
Yt = β1 + β2 X t + ut (7.1)
求样本平均数,有
Y = β1 + β2 X + u (7.2)
(7.1)-(7.2)式,得
( ) ( ) Yt − Y = β2 Xt − X + ut − u (7.3)
图 7—13
得到的回归方程为
图 7—14
(2)求平均成本函数: 因为平均成本 yt 与总成本 Yt 的关系为
所以, 将产量从 1 到 2000 取值,代入上式,获得 2000 个平均成本的数据点,描出平均成本函数的图形,见 图 7—15。 由图 7 一 15 可知,平均成本随着产量的增加显示下降,达到一最低值之后,又会随着产量的增加而 提高。
(注意:由于 t=1,…,n,未必代表总体中全部的随机误差项,故 u ≠0)
样本回归函数为 (7.4)
求平均数,有 (7.5)
(注意,根据假定条件: e =0)
(7.4)-(7.5)式,得 (7.6)
将(7.6)式代入(7.3)式,经整理后可得
平方后再求和:
取上式数学期望:
令
则(7.7)式等于: 教材 P173 页公式 7.30 为
人均销售额越大,企业利润越高,故此商业利润率越高,从而商业利润率与人均销售额呈正相关关系;
而流通费用率越高,反映商业企业的经营成本越高,其商业利润率就越低。
人口数量越多,对粮食的消费量就越大;人均收入越多,对粮食的购买力就越强,故此这两个变量皆 与粮食销售量呈正相关关系。
固定资产和职工人数是两大生产要素,数量越多,说明生产要素越密集,工业总产值就越高,所以它 们与工业总产值的关系为正相关。
2 由回归估计结果中,可以直接查出回归系数的t值检验值。这里,为帮助读者理解,列出计算步骤。
(3)对β2进行显著水平为 5%的显著性检验; (4)假定明年 1 月销售收入为 800 万元,利用拟合的回归方程预测相应的销售成本,并给出置信度 为 95%的预测区间。
解:
t值远大于临界值 2.228,故拒绝零假设,说明β2在 5%的显著性水平下通过了显著性检验。 (4)Yf=40.3720+0.7863×800=669.41(万元)
因为国内生产总值包括三次产业,所以工业总产值、农业总产值和全部的国内生产总值为正相关关系, 同时即便某些特殊地区没有工业和农业,仍然有国内生产总值,所以β1>0。
4.利用本章计算题 1 图 7—1 中给出的我国 GDP 和消费的资料,要求: (1)拟合以下形式的消费函数:
式中,Ct是t期消费;Ct-1是t-1 期的消费,Yt是t期的GDP; (2)计算随机误差项的方差估计值; (3)计算修正自由度的 t 统计量; (4)计算各回归系数的 t 统计量; (5)对整个回归方程进行显著性检验; (6)假设 2001 年的国内生产总值为 95350 亿元,试利用拟合的消费函数预测当年的消费总额,并给 出置信度为 95%的预测区间。 解:(1)回归分析的 Excel 操作步骤如下: 步骤一:首先对原 Excel 数据表作适当修改,添加“滞后一期的消费”数据见图 7—5。
因为 代入(7.8)式,得 所以,有 又因为 所以,
又因为
将(7.9)式代入(7.10)式,得
将(7.11)式代人 B,得
(7.7) (7.8)
(7.9) (7.11)
(7.10)
又因为 所以, 将所求得的 A、B、c 数值一起代人(7.7)式,得
所以,
证毕。
2.试证明最小二乘估计量 βl 2 是标准一元线性回归模型中总体回归系数 βl 2 的最优线性无偏估计量。
证明: (1)无偏性:
,证明略,参见教材 P173 页,公式 7.29 式的证明。 (2)线性:
令
,则
由此可见, βl 2 是Yt的一个线性函数。它是以kt为权的Yt的一个加权平均,从而 βl 2 是一个线性统计量。
(3)最小方论
的取值情况。
因为
也即作为β2的任意线性无偏估计量,必须满足下列约束条件:
所以,Yf的置信度为 95%的预测区间为:
所以,区间预测为: 2.设销售收入 X 为自变量,销售成本 Y 为因变量。现已根据某百货公司 12 个月的有关资料计算出以 下数据(单位:万元):
利用以上数据,要求: (1)拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释; (2)计算决定系数和回归估计的标准误差;
图 7—7
步骤二:为方便后续步骤书写公式,定义某些单元格区域的名称。 首先,定义 F6、F7、F8 的名称:选定 E6:F8 区域,然后执行菜单命令“插入”→“名称”→“指定”, 见图 7—8。
图 7—8 在调出的对话框中选中“最左列”,单击“确定”,见图 7—9。 其次,定义 B2:D23 的名称: 先选定该区域,然后执行菜单命令“插入”→“名称”→“定义”,见图 7 一 10。 调出“定义名称”对话框,输入名称“X”,单击“确定”,见图 7—11。
图 7—1
1 如果“数据分析命令”没有出现在“工具”菜单,则需要先运行“加载宏”命令,加载“分析工具库”。
图 7—2 在“回归”窗口中确定因变量 Y 值和自变量 X 值的区域后,点击“确定”。见图 7—3。回归结果见图 7—4。
图 7—3
图 7—4
从计算结果可知,拟合的样本回归方程为 (2)由图 7—4 可知,回归估计的标准误差为 638.7076;决定系数为 0.9987。 (3)回归系数的 5%显著性检验。 首先对β1的显著性进行检验2:
所以,Yf的置信度为 95%的预测区间为
所以,区间预测为
3.讨论以下几种场合的回归方程:
中回归系数的经济意义和应取的
符号。
(1)Yt为商业利润率;X2t他为人均销售额;X3t为流通费用率; (2)Yt为粮食销售量;X2t为人口数;X3t为人均收入; (3)Yt为工业总产值;X2t为占用的固定资产;X3t为职工人数; (4)Yt为国内生产总值;X2t为工业总产值;X3t为农业总产值。 答: