虚拟变量的回归分析PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t 2 .06 6 5 .18 3 -3 .8 20 -3 .7 23 -4 .1 27 -4 .2 40 -2 .9 89
Sig. .0 69 .0 01 .0 04 .0 05 .0 03 .0 02 .0 15
9
回归方程的解释
当案例在两个分类变量都等于0时,即文 化程度为文盲,居住地在农村时,此种情 况称为参照类(其他情况将于此进行比 较),其回归方程为:
表明所有参照类妇女年龄每上升1岁,其 曾生子女数的平均变化量为0.068个。
CHENLI
10
回归方程的解释
当文化程度为小学,居住地为农村时:
表明,对于相同年龄和居住地而言,小学 文化程度妇女比文盲妇女曾生子女数多出
b2个部分,即少生1.13个子女。
CHENLI
11
回归方程的解释
当教育程度为文盲、居住地为城市时,
1
.857a .734 .717 6.27071
a.Predictors: (Constant), IN3, j3, IN2
ANOVbA
Sum of
Model
Squares
1
Regre5s0s0io1n.195
df Mean Square F 3 1667.065 42.395
Resid1u8a0l 8.805
对于具有k类的定性变量来说,设哑变量 时,我们只设k-1个哑变量。
例7.4 分析某地区妇女的年龄、文化程度、 及居住地状况对其曾生子女数的影响。
定量变量: 年龄
定性变量:文化程度、地区
Spss数据:妇女生育子女数.SAV
CHENLI
5
哑变量的建立
原变量编码值
文化程度=1(文盲) 文化程度=2(小学) 文化程度=3(初中) 文化程度=4(高中) 文化程度=5(大学) 地区=1(城市) 地区=2(农村)
第七章 回归分析5—
虚拟变量的回归
CHENLI
1
回归分析的类型
因变量与自变量都是定量变量的回归分 析——即我们常做的回归分析
因变量是定量变量,自变量中有定性变量 的回归分析—即含有虚拟变量的回归分析
因变量是定性变量的回归分析—Logistic 回归分析
CHENLI
2
自变量中有定性变量 的回归分析
表明,对于相同年龄和文化程度而言,城 市妇女比农村妇女曾生子女数多出b6个部 分,即少生0.49个子女。
CHENLI
12
回归方程的解释
总之,该回归方程表示:
参照类妇女曾生子女数对年龄的回归直线 的截据为1.41,年龄每上升1岁,参照类 妇女的平均曾生子女数上升0.068个。
城市妇女比农村妇女的平均曾生子女数少 0.49个。
46 39.322
Total 6810.000
49
a.Predictors: (Constant), IN3, j3, IN2
b.Dependent Variable: sC1HENLI
Sig. .000a
16
SPSS输出结果
Coe f ficie nats
UnstandardizedStandardized Coefficients Coefficients
AdjustedStd. Err or of
R R SquareR Squartehe Estimate
.978a
.956
.927
.30751
a.Pr edict ors: ( Co nstant), AREA, ED3, 年 龄 , E ED5
ANOVbA
Sum of
Model
Squares
1
Regress1io8n.586
CHENLI
14
回归分析
利用同样的方法我们可以对例7.2进行回 归分析。
例7.2的数据中,还有一个自变量是定性变 量“收入”,以虚拟变量或哑元(dummy variable)的方式出现。
CHENLI
15
SPSS输出结果
Model Su mmary
AdjusteSdtd. Error of
Model R R SquaR reSquathre Esti mate
CHENLI
3
自变量中有定性变量的回归
在社会经济研究中,由许多定性变量,比 如地区、民族、性别、文化程度、职业和 居住地等。
可以应用它们的信息进行线性回归。
但是,必须现将定性变量转换为哑变量 (也称虚拟变量),然后再将它们引入方 程,所得的回归结果才有明确的解释意义。
CHENLI
4
哑变量的建立
小学、初中、高中和大学文化程度妇女的
平均曾生子女数分别比文盲妇女少1.13、
1.31、1.58、1.57个(在年龄和居住地相
同时)。
CHENLI
13
回归方程的解释
文化程度在实际中是一个序次变量。可以
用
表示序次变量个相邻分类的
实际效应,如初中的边际效应为:
类似,可以计算下面的边际效应: 小学= -1.13 初中= -0.18 高中= -0.27 大学= 0.01
CHENLI
8
SPSS输出结果
Coef fic ientas
Unstandardized Standardized Coefficients Coefficients
Mo de l
B Std. Error
1
(Cons tant) 1.409
.6 82
年龄
.0 68
.0 13
Be ta .5 69
来自百度文库ED2
哑变量赋值的操作
所有EDU=0 EDU2=1,其他EDU=0 EDU3=1,其他EDU=0 EDU4=1,其他EDU=0 EDU5=1,其他EDU=0 AREA=1
AREA=0
CHENLI
6
应用SPSS建立回归方程
回归结果:
CHENLI
7
SPSS输出结果
M od e l Summary
Model 1
df Mean Square F
6
3.098 32.759
Sig. .000a
Residual .851
9
.095
Total 19.438
15
a.Predictors: (Constant) , AREA, ED 3, 年 龄 , ED2, ED 4,
b.Dependent Var iable: 生 子 女 数
-1 .1 27
.2 95
-. 39 9
ED3
-1 .3 09
.3 52
-. 51 4
ED4 ED5
-1 .5 76 -1 .5 69
.3 82 .3 70
-. 55 8 -. 61 6
AREA
-. 48 6
.1 62
-. 22 0
a.Depe nde nt Variab le: 生 子 女 数
CHENLI