42虚拟变量回归分析汇总
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 x2 0
2
虚拟变量X2从0变为1时,在其他自变量不变的情况下 X2对Y的边际贡献。
线性回归中的虚拟变量的处理
只有两个水平的虚拟自变量
数据文件:
CH9公司CEO年收入年龄MBA虚拟.sav
获MBA是个虚拟变量
Y 0 D获MBA 2年龄
获MBA
1,获得 0,没获得
释变量; (3)解释变量分别为一个定性变量(两种以上属性)和一个定
量解释变量; (4)解释变量分别为两个定性变量(各自分别是两种属性)和
一个定量解释变量;
只有两个水平的虚拟自变量
虚拟变量的取值为0,1
1 男 x 0 女
Y 1 2 X 2 k X k
是二值 名ቤተ መጻሕፍቲ ባይዱ变量
Sta n d a rd i ze d Co e ffi ci en ts
Beta
.710 .383
t .452 4.158 2.244
Sig. .659 .001 .043
有两个以上水平的虚拟自变量
若虚拟变量具有k个水平,则需要设置k-1 个二值虚拟变量;
例如,如果X2取值是a,b,c三种激励方案, 则虚拟变量设置为:
4.33560
回归系数的显著性检验
Coefficientsa
Un sta n d a rd i ze d Co e ffi ci en ts
Model 1
(Constant) 年龄 获 MBA
B 2.165
.427 4.911
Std. Error 4.791 .103 2.188
a. Dependent Variable: 万 元
可以应用它们的信息进行线性回归。 但是,必须先将定性变量转换为哑变量
(也称虚拟变量),然后再将它们引入方 程,所得的回归结果才有明确的解释意义。
虚拟自变量 (dummy variable)
也叫“哑变量”,是指测度级别为名义 和序次层级的自变量。
虚拟自变量可有不同的水平
只有两个水平的虚拟自变量
•实质:加法方式引入虚拟变量改变的是截距; 乘法方式引入虚拟变量改变的是斜率。
一、加法类型
以加法方式引入虚拟变量时,主要考虑的问题是定性因 素的属性和引入虚拟变量的个数。通长可以分为:
(1)解释变量只有一个定性变量(两种属性)而无定量变量; (2)解释变量分别为一个定性变量(两种属性)和一个定量解
ANOVAb
M od e l
1
Re gre ssi o n
Sum of Squares
18.586
df
Mean Square
6
3.098
Re si du a l
.851
9
.095
T o ta l
19.438
15
a. Pred ict ors: (Con stant), AREA, ED3, 年 龄 , ED2, ED4, ED5
D1 1,若X2 a D1 0,若X2 a
D2 1,若X2 b D2 0,若X2 b
D1 0且D2 0, 若X2 c
有两个以上水平的虚拟自变量
Y 1 D1D1 D2D2 k X k
X2从c变为a的边际贡献
即从所有虚拟变量为0的状态, 变为该虚拟变量为1时的边际贡献
b. Dep enden t Vari able: 生 子 女 数
F 32.759
Si g. .000a
SPSS输出结果
Coefficientsa
Un stan d ard i ze d Co effi ci e nts
M od e l
1
(Constant)
年龄
B 1.409
哑变量的建立
原变量编码值
文化程度=1(文盲) 文化程度=2(小学) 文化程度=3(初中) 文化程度=4(高中) 文化程度=5(大学) 地区=1(城市) 地区=2(农村)
哑变量赋值的操作
所有EDU=0 EDU2=1,其他EDU=0 EDU3=1,其他EDU=0 EDU4=1,其他EDU=0 EDU5=1,其他EDU=0 AREA=1
哑变量的建立
对于具有k类的定性变量来说,当回归模型有截 距项时,设哑变量时,我们只设k-1个哑变量。
当回归模型无截距项时,则可引入k个虚拟变量; 否则,就会陷入“虚拟变量陷阱
例: 分析某地区妇女的年龄、文化程度、及居住 地状况对其曾生子女数的影响。
定量变量: 年龄 定性变量:文化程度、地区
AREA=0
建立回归方程
SPSS回归结果:
SPSS输出结果
M odel Summary
M odel 1
R
R Square
.9 78 a
.956
Adj usted R Square
.927
Std. Error of the Esti mate
.30751
a. Predi ct ors: (Con stant), AREA, ED3, 年 龄 , ED2, ED4, ED5
操作过程与不含有虚拟变量 的线性回归完全相同
回归方程的拟合优度检验
Model Summary
M od e l 1
R
R Square
.789a
.622
Ad j uste d R Square
.564
a. Predict ors: (Con stant), 获 MBA, 年 龄
Std. Error of the Estimate
回归分析
虚拟解释变量的回归
回归分析的类型
因变量与自变量都是定量变量的回归分 析——即我们常做的回归分析
因变量是定量变量,自变量中有定性变 量的回归分析—即含有虚拟变量的回归 分析
因变量是定性变量的回归分析— Logistic回归分析
自变量中有定性变量的回归
在社会经济研究中,有许多定性变量,比 如地区、民族、性别、文化程度、职业和 居住地等。
比如,性别(男,女)
有两个以上水平的虚拟自变量
文化程度(小学及以下,中学,大学等)
回归分析中引入虚拟变量的方式
加法方式和乘法方式两种:即
Yt 0 Xt ut 1D Yt 1Xt ut 2 Xt D
原模型: Yi = + βX i + ui 加法方式引入 = 0 +1D 乘法方式引入 = 1 + 2D