应用回归分析含定性变量的回归模型第九章课后答案
《应用回归分析》部分课后习题答案-何晓群版
《应用回归分析》部分课后习题答案
第一章回归分析概述
1.1 变量间统计关系和函数关系的区别是什么?
答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量
唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另
外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么?
答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 a.
在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变
量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x
与变量y的密切程度是一回事。b.相关分析中所涉及的变量y与变量x全是随机
变量。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以
是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的
密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归
方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么?
答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为
一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,
由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,
随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑
的种种偶然因素。
1.4 线性回归模型的基本假设是什么?
答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值
xi1.xi2…..xip是常数。2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^2
第9章回归分析
5. Logarithmic模型 Logarithmic模型又叫做对数函数,其公式如下:
精通SPSS统计分析 6. Cubic模型 Cubic模型又叫做三次函数,其公式如下:
7. S:S形曲线模型 S:S形曲线模型的公式如下:
8. Exponential模型
Exponential模型又叫做指数函数,其公式如下:
9.3 线性回归分析应用实例
一元线性回归分析实例 多元线性回归分析实例
精通SPSS统计分析
9.3.1 一元线性回归实例
本例将使用一元线性回归分析研究某厂生产的橡皮的韧性和拉伸倍数是否 存在着显著的线性关系。
9.3.2 多元线性回归实例
某厂在一次选举活动前,对该厂的10名高级干部进行心理素质调查,希望 用多元线性回归分析来观测其效果。
精通SPSS统计分析
9.4 非线性回归分析
非线性回归分析概念 非线性回归分析的计算公式
非线性回归分析应用实例
精通SPSS统计分析
9.4.1 非线性回归分析概念
非线性回归分析主要研究在非线性相关条件下,自变量对因变量的数量变化关 系。在实际问题中,变量之间的相关关系往往不是线性的,而是非线性的,因而不能 用线性回归方程来描述它们之间的相关关系,Βιβλιοθήκη Baidu要采用适当的非线性回归分析。 非线性回归问题大多数年可以化为线性回归问题来求解,也就是通过对非线性回归模 型进行适当的变量变换,使其化为线性模型来求解。一般步骤为: (1)根据经验或绘制散点图,选择适当的非线性回归方程; (2)通过变量转换,把非线性回归方程化为线性回归; (3)对各系数进行显著性检验。
《应用回归分析》课后题答案解析(Word最新版)
《应用回归分析》课后题答案解析通过整理的《应用回归分析》课后题答案解析相关文档,希望对大家有所帮助,谢谢观看!
《应用回归分析》部分课后习题答案第一章
回归分析概述 1.1 变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。b.相关分析中所涉及的变量y与变量x全是随机变量。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么?答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机
方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。
《应用回归分析》课后题答案
、
《应用回归分析》部分课后习题答案
第一章回归分析概述
1.1 变量间统计关系和函数关系的区别是什么?
答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么?
答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x 与变量y的密切程度是一回事。b.相关分析中所涉及的变量y与变量x全是随机变量。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么?
答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么?
答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^2
《应用回归分析》课后题答案
、
《应用回归分析》部分课后习题答案
第一章回归分析概述
1.1 变量间统计关系和函数关系的区别是什么?
答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么?
答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x 与变量y的密切程度是一回事。b.相关分析中所涉及的变量y与变量x全是随机变量。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么?
答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么?
答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^2
第9章 定性数据的建模分析(含SPSS)
1,建筑业 0,其他
D3 1,房地产业
D3
0,其他
D4
D4
1,社会服务业 0,其他
❖ 可是这样作却产生了一个新的问题,即4个 自变量之和恒等于1,构成完全多重共线性。 解决这个问题的方法很简单,我们只需去掉一 个0-1型变量,只保留3个0-1型解释变量即可
。所以,对于具有 个k 分类的变量,当确定
❖ 假设以采掘业、建筑业、房地产业和社会服务业4个行业
的上市公司为例,研究企业资本结构问题,其中 y 为企业资
本结构,
❖ x 为企业规模,D1i 为审计意见,另外再考虑行业差异D2i 。
为了用虚拟变量反映这4个行业,我们初步设想引入如下4个
0-1型解释变量:
❖ ❖
D1 D1
1,采掘业 0,其他
D2 D2
时,几率的变化值为 expi 。解释变量的系数为正值,意味
着事件发生的几率会增加,expi 的值大于1;解释变量的 系数为负值,意味着事件发生的几率会减少,expi 的值小
于1;当为0时,此值等于1。
❖ (四)二项Logistic回归模型的检验 ❖ 1、回归模型的显著性检验 ❖ Logistic回归模型显著性检验的目的是检验解释变
❖ 回归系数显著性检验采用的检验统计量是统计量, 数学定义为
❖ ❖
Wald i
( i
SI
应用回归分析第四版答案
应用回归分析第四版答案
【篇一:应用回归分析人大版前四章课后习题答案详解】应用回归分析(1-4章习题详解)
(21世纪统计学系列教材,第二(三)版,何晓群,
刘文卿编著中国人民大学出版社)
目录
1 回归分析概
述 ....................................................................................................... (6)
1.1 变量间统计关系和函数关系的区别是什
么? (6)
1.2 回归分析与相关分析的区别与联系是什
么? (7)
1.3回归模型中随机误差项?的意义是什
么? (7)
1.4线性回归模型的基本假设是什
么? (7)
1.5 回归模型的设置理论根据是什么?在回归变量设置中应该注意哪
些问题? (8)
1.6收集,整理数据包括哪些内
容? (8)
1.7构造回归理论模型的基本根据是什
么? (9)
1.8为什么要对回归模型进行检
验? (9)
1.9回归模型有哪几个方面的应
用? (10)
1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析
相结合? (10)
2 一元线性回
归 ....................................................................................................... . (10)
2.1一元线性回归模型有哪些基本假
定? (10)
2.2考虑过原点的线性回归模型
足基本假定,求
ny??*x??i1ii,i?1,2,...n 误差?1,?2,...?n仍满?1的最小二乘估
《应用回归分析》课后习题答案
=
小于表中 的相应值同时大于表中 的相应值, x与y有显著的线性关系.
(10)
序号
1
1
10
6
4
2ห้องสมุดไป่ตู้
2
10
13
-3
3
3
20
20
0
4
4
20
27
-7
5
5
40
34
6
残差图为:
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)当广告费 =4.2万元时,销售收入
,即(17.1,39.7)
(11)
(12) ,
即为(2.7,4.7)
近似置信区间为: ,即(2.74,4.66)
(13)可得置信水平为 为 ,即为(3.33,4.07).
2.16 (1)散点图为:
可以用直线回归描述y与x之间的关系.
(2)回归方程为:
(3)
从图上可看出,检验误差项服从正态分布。
第三章 多元线性回归
3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:
1.8为什么要对回归模型进行检验?
答:我们建立回归模型的目的是为了应用它来研究经济问题,但如果马上就用这个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。
(整理)统计学原理第九章相关与回归习题答案
第九章相关与回归
一.判断题部分
题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。()
答案:×
题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。()
答案:√
题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。()
答案:×
题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。()
答案:×
题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。()
答案:×
题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。()
答案:√
题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。()
答案:×
题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。()
答案:×
题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。()
答案:√
题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。()
答案:×
题目11:完全相关即是函数关系,其相关系数为±1。()
答案:√
题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。()
答案×
二.单项选择题部分
题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A.相关关系
B.函数关系
C.回归关系
D.随机关系
答案:B
题目2:现象之间的相互关系可以归纳为两种类型,即()。
第九章含虚拟变量的回归模型
第九章含虚拟变量的回归模型
目前为止,在已学习的线性回归模型中,解释变量X都是定量变量。但有时候,解释变量是定性变量。
9.1 虚拟变量的性质
通常在回归分析中,应变量不仅受一些定量变量的影响,还受一些定性变量的影响(性别、种族、肤色、XX、民族、罢工、政团关系、婚姻状况)。
如:
美国黑人的收入比相应的白人的收入低。
女学生的S.A.T.的数学平均分数比相应的男生低。
定性变量通常表明了具备或不具备某种性质,比如,男性或女性,黑人或白人,佛教徒或非佛教徒,本国公民或非本国公民。
把定性因素“定量化”的一个方法是建立人工变量,并赋值0和1,0表示变量不具备某种属性,1表示变量具备某种属性,该变量称为虚拟变量(dummy variable),用符号D表示。
虚拟变量一样可用于回归分析,一个回归模型的解释变量可以仅仅是虚拟变量,称为方差分析模型( ANOVA )。
Yi=B1+B2Di+ui ( 9 - 1 )
其中Y= 初职年薪
Di =1,大学毕业
=0,非大学毕业
假定随机扰动项满足古典线性回归模型的基本假定,根据模型( 9 - 1 )得到:
非大学毕业生的初职年薪的期望为:
E(Yi|Di=0) =B1+B2( 0 ) =B1( 9 - 2 )
大学毕业生的初职年薪的期望为:
E(Yi|Di=1) =B1+B2( 1 ) =B1+B2 ( 9 - 3 )
可以看出:
截距B1表示非大学毕业生的平均初职年薪,
“斜率”系数B2表明大学毕业生的平均初职年薪与非大学生的差距是多少;
(B1+B2)表示大学毕业生的平均初职年薪。
定性数据的建模分析(含SPSS)
• 7.单击Options按钮,展开如图9-4所示对话框。 • 图9-4 Options 选择项对话框
• (1)Statistics and Plot栏,输出统计量和图形。 包括Classification plots复选项、Correlations of esti复选项、Hosmer-Lemeshow goodness-of-f复选 项、Iteration history复选项、Casewise listing of residuals复选项、CI for exp(B) 复选项。
• (2)Display栏中,At each step选项,表示对每一 步计算过程输出表、统计量和图形。At last step选项, 表示只输出最终方程的表、统计量和图形。
• (3)Probability for Stepwise栏,设置变量进入模 型及从模型中删除的判据。
• (4)Classification 栏,被解释变量分类界限。
• 复杂情况是指定定性变量可能取多类值的情况。
• 假设以采掘业、建筑业、房地产业和社会服务业4个行业
的上市公司为例,研究企业资本结构问题,其中 y 为企业资
本结构,
• x 为企业规模,D1i 为审计意见,另外再考虑行业差异D2i 。
为了用虚拟变量反映这4个行业,我们初步设想引入如下4个
0-1型解释变量:
“是”或“否”两个可能结果,就需要设置虚拟变量。当被 解释变量为虚拟变量时,建立一般的多元线性回归模型就会 出现以下问题:(1)残差不再满足且的假设条件。(2)残 差不再服从正态分布。(3)被解释变量的取值区间受限制。 由此可见,当被解释变量是0-1型变量时,无法直接采用一般 的多元线性回归模型建模,通常应采用Logistic回归模型。 本章只介绍二项Logistic回归模型。
《应用回归分析》课后题答案[整理版]
《应用回归分析》课后题答案[整理版] 《应用回归分析》部分课后习题答案
第一章回归分析概述 1.1 变量间统计关系和函数关系的区别是什么, 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么, 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。b.相关分析中所涉及的变量y与变量x全是随机变量。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量x 对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么, 答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么,
答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值
《应用回归分析》课后题答案[整理版]
《应用回归分析》课后题答案[整理版] 《应用回归分析》部分课后习题答案
第一章回归分析概述 1.1 变量间统计关系和函数关系的区别是什么, 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么, 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。b.相关分析中所涉及的变量y与变量x全是随机变量。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量x 对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么, 答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么,
答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值
《应用回归分析》课后题答案
《使用回归分析》部分课后习题答案
第一章回归分析概述
1.1 变量间统计关系和函数关系的区别是什么?
答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量
唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另
外一个变量的确定关系。
1.2 回归分析和相关分析的联系和区别是什么?
答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 a.
在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变
量x和变量y处于平等的地位,即研究变量y和变量x的密切程度和研究变量x
和变量y的密切程度是一回事。b.相关分析中所涉及的变量y和变量x全是随机
变量。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以
是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的
密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归
方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么?
答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为
一个随机方程,使得我们可以借助随机数学方法研究y和x1,x2…..xp的关系,
由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,
随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑
的种种偶然因素。
1.4 线性回归模型的基本假设是什么?
答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值
xi1.xi2…..xip是常数。2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^2
应用回归分析含定性变量的回归模型第九章课后答案
第9章 含定性变量的回归模型
思考与练习参考答案
9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。出现这种情况的原因是什么? 答:假如这个含有季节定性自变量的回归模型为:
其中含有k 个定量变量,记为x i 。对春夏秋冬四个季节引入4个0-1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:
显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。
当某自变量x j 对其余p-1个自变量的复判定系数2
j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型。称Tol j =1-2
j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0.0001。也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。
而在这个模型中出现了完全共线性,所以SPSS 软件计算的结果中总是自动删除了其中的一个定性自变量。
9.2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?
答:原因有两个,以例9.1说明。一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他
统计学原理第九章(相关与回归)习题答案
第九章相关与回归
一.判断题部分
题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。()
答案:×
题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。()
答案:√
题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。()
答案:×
题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。()
答案:×
题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。()
答案:×
题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。()
答案:√
题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。()
答案:×
题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。()
答案:×
题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。()
答案:√
题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。()
答案:×
题目11:完全相关即是函数关系,其相关系数为±1。()
答案:√
题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。()
答案×
二.单项选择题部分
题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A.相关关系
B.函数关系
C.回归关系
D.随机关系
答案:B
题目2:现象之间的相互关系可以归纳为两种类型,即()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第9章 含定性变量的回归模型
思考与练习参考答案
9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。出现这种情况的原因是什么? 答:假如这个含有季节定性自变量的回归模型为:
其中含有k 个定量变量,记为x i 。对春夏秋冬四个季节引入4个0-1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:
显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。
当某自变量x j 对其余p-1个自变量的复判定系数2
j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型。称Tol j =1-2
j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0.0001。也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。
而在这个模型中出现了完全共线性,所以SPSS 软件计算的结果中总是自动删除了其中的一个定性自变量。
9.2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?
答:原因有两个,以例9.1说明。一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他
t
t t t kt k t t D D D X X Y μαααβββ++++++=332211110 ⎪⎪⎪⎪⎪
⎪
⎪⎪
⎭⎫
⎝
⎛=00011001011000101001
0010100011
)(6
165154143
132121
11k k k k k k X X X X X X X X X X X X
D X,⎪⎪⎪
⎪⎪⎭
⎫ ⎝⎛=k βββ 10β⎪⎪⎪
⎪⎪⎭
⎫ ⎝⎛=4321ααααα
统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。
9.3 研究者想研究采取某项保险革新措施的速度y对保险公司的规模x
1
和保险公司类型的关系(参见参考文献【3】)。因变量的计量是第一个公司采纳这项革新和给定公司采纳这项革新在时间上先后间隔的月数。第一个自变量公司的规模是数量型的,用公司的总资产额(百万美元)来计量;第二个自变量公司是定性变量,由两种类型构成,即股份公司和互助公司。数据资料见表9.8,试建立y对公司规模和公司类型的回归。
表9.8
i y x
1
公司类型
1 17 151 互助
2 26 92 互助
3 21 175 互助
4 30 31 互助
5 22 104 互助
6 0 27
7 互助
7 12 210 互助
8 19 120 互助
9 4 290 互助
10 16 238 互助
11 28 164 股份
12 15 272 股份
13 11 295 股份
14 38 68 股份
15 31 85 股份
16 21 224 股份
17 20 166 股份
18 13 305 股份
19 30 124 股份
20 14 246 股份
解:对定型变量“公司类型”进行数量化处理:
引入虚拟变量x
2:公司类型为“互助”时,x
2
=1,为“股份”时, x
2
=0。
则表9.5中数据转换成以下数据:
i y x
1
公司类型
1 17 151 1
2 26 92 1
4 30 31 1
5 22 104 1
6 0 27
7 1
7 12 210 1
8 19 120 1
9 4 290 1
10 16 238 1
11 28 164 0
12 15 272 0
13 11 295 0
14 38 68 0
15 31 85 0
16 21 224 0
17 20 166 0
18 13 305 0
19 30 124 0
20 14 246 0 建立回归方程 y=b0+b1x1+b2x2+ε
用SPSS软件作线性回归,得到输出结果如下:
R检验:拟合优度R2=0.883,接近1,说明回归拟合的效果较好。
F检验:F值=72.497,Sig.值为0,说明回归方程通过F检验。
T 检验:回归系数通过t 检验,回归方程为:
y= 41.930-0.102 x 1-8.055 x 2
说明:若引入虚拟变量x 2,当公司类型为“互助”时,x 2=0,为“股份”时, x 2=1。 则回归方程为:
y= 33.874-0.102x 1 + 8.055x 2
结果分析:
(1)股份制公司采取保险革新措施的积极性比互助型公司高,原因可能在于股份制公司建立在共同承担风险上,所以更愿意革新;
(2)公司规模越大,采取保险革新措施的倾向越大:大规模公司的保险制度的更新对公司的影响程度比小规模公司大,因此大规模公司更倾向于比较更新措施和现有政策带来的效益,最终表现在采纳革新措施的时间间隔较短。
9.4.表9.9的数据是我国历年铁路里程数据,根据散点图观察在某时间点有折点,用折线回归拟合这个数据。
解:由散点图9(见下图)可看出在1995年(t=16)有折点,考虑由两段构成的分段线性回归,这可以通过引入一个0-1型虚拟自变量实现。 由散点图可知该折点为t=16,则引入虚拟自变量x ,
⎩⎨
⎧>-≤=16
,16t 16
,0t t x 由SPSS 输出的调整后的决定系数20.980R =,说明拟合优度较好。
由输出的系数表可以得出回归方程为:x t y
106.0055.0183.5ˆ++= 由SPSS 输出方程分析表可知,F 值为594.524,且P 值约为零,说明回归方程非常显著;