第五章_包含虚拟变量的回归模型(课堂PPT)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1, 大学毕业 d1i 0,其他
1, 非大学毕业 d2i 0,其他
1
《
11
• 经验1.1:一个2分类的定性属性最多用1个 虚拟变量刻画,否则会出现完全共线性( 即虚拟变量陷阱)问题
• 经验1.2:一个n分类的定性属性最多用n-1 个虚拟变量刻画,否则会出现完全共线性 (即虚拟变量陷阱)问题
1
《
19.5
1
24.0
2
21.0
2
25.0
3
22.0
3
26.5
4
23.1
4
性别 初职年薪 教龄
1
25.0
5
0
28.0
5
1
29.5
6
0
26.0
6
1
27.5
7
0
31.5
7
1
29.0
8
0
性别 0 1 1 0 0 1 0
1
《
14
1
《
15
salary 男性 : s·alaryi 21.302861 1.370714 yearsi 3.333571
个虚拟变量刻画,无法反映定性属性之间
的交互作用。可以用(组合个数-1)个虚拟
变量刻画,可以测算定性属性之间的交互
作用,但是这样做可能会损失较多的自由
1 度。
《
35
小结(续)
• 经验3:一个n分类的定性属性可以用一个 虚拟变量刻画,但会隐含约束,可以采用 多个虚拟变量刻画。
• 经验4: m个n分类的定性属性还可以用虚 拟变量的交叉项来度量,交叉项前的系数 可以直接测算交互作用的增量影响,比经 验2中的方法更直观,而且还可能测算定性 属性和定量变量之间的交互作用。
– 定量变量 – 定性变量:取值不连续的变量,用于描述经济
对象的分类属性(定性因素),可以采用虚拟 变量来度量
• 定性自变量 • 定性因变量
1
《
4
包含虚拟自变量的线性回归模型
• 自变量中仅有一个虚拟变量 • 自变量中既包括定量变量又包括虚拟变量
1
《
5
自变量中仅有一个虚拟变量
yi 0 1 di ui
1
《
24
1
《
25
1
《
26
多个虚拟变量之间的交互作用
• 例子:教育水平与衣着开支
yi 1 2 Genderi 3 Edui Incomei ui
yi 1 2 Genderi 3 Edui
4 Genderi Edui Incomei ui
1
《
27
• 经验4: m个n分类的定性属性还可以用虚 拟变量的交叉项来度量,交叉项前的系数 可以直接测算交互作用的增量影响,比经 验2.2中的方法更直观,而且还可能测算定 性属性和定量变量之间的交互作用。
女性 : s·alaryi 17.96929 1.370714 yearsi
years
1
《
16
2定性变量+1定量变量
yi 0 1 d1i 2 d2i 3 xi ui
1, 男教师 d1i 0,女教师
1, 白种人 d2i 0, 非白种人
xi 教龄
1
《
17
思考题:以下定义方法的差别?
yi 旅游支出 xi 年收入
1
《
22
思考题:以下定义方法的差别
yi 0 1 di 2 xi ui
2, 大学及以上教育 di 1, 中学教育
0,其他 yi 旅游支出 xi 年收入
1
《
23
• 经验3:一个n分类的定性属性可以用一个 虚拟变量刻画,但会隐含约束,可以采用 多个,即(分类个数-1)个虚拟变量刻画 。
12
1个定性变量+1个定量变量
Βιβλιοθήκη Baidu
yi 0 1 di 2 xi ui
1, 男教师 di 0,女教师
xi 教龄
女教师的平均年薪 E yi | xi , di 0 0 2xi
男教师的平均年薪 E yi | xi , di 1 0 1 2xi
1
《
13
初职年薪 教龄
23.0
1
1
《
28
例7.10(第236页)
1
《
29
1
《
30
1
《
31
虚拟变量与定量变量之间的交互作用
• 例子:检验不同组之间回归函数上的差别
1
《
32
1
《
33
女性运动员 c·umgpai 0.100346 0.001728 sati
0.005916 hsperci 0.015869 tothrsi
男性运动员 c·umgpai 1.213984 0.000611 sati
0.005967 hsperci 0.010300 tothrsi
1
《
34
小结
• 经验1:一个n分类的定性属性最多用n-1个 虚拟变量刻画,否则会出现完全共线性( 即虚拟变量陷阱)问题。
• 经验2: m个n分类的定性属性如果只用m
yi 0 1 nwmi 2 wfei 3 wmi
4 xi ui
1, 非白种人男教师 nwmi 0,其他
1, 白种人女教师 wfei 0,其他
1, 白种男教师 wmi 0, 其他
xi 教龄
1
《
18
1
《
19
1
《
20
• 经验2.1:2个两分类的定性属性如果只用2 个虚拟变量刻画,无法反映定性属性之间 的交互作用,用(组合个数-1)个虚拟变 量刻画更具灵活性。
• 经验2.2: m个n分类的定性属性如果只用m 个虚拟变量刻画,无法反映定性属性之间 的交互作用,用(组合个数-1)个虚拟变 量刻画更具灵活性。
1
《
21
一个多分类的虚拟变量
yi 0 1 d1i 2 d2i 3 xi ui
1, 中学教育 d1i 0,其他
1, 大学及以上教育 d2i 0,其他
第五章 包含虚拟变量的回归模型
1
《
1
主要内容
• 虚拟变量的性质 • 包含虚拟自变量的线性回归模型 • 多分类虚拟变量 • 多个变量之间的交互作用
– 虚拟变量之间的交互作用 – 虚拟变量与定量变量之间的交互作用
• 包含虚拟因变量的回归模型
1
《
2
第五章
包含虚拟变量 的回归模型
1
《
3
虚拟变量的性质
• 定量变量 vs. 定性变量
18.5 21.7 18.0 19.0 22.0
教育
0 1 0 0 1
1
《
7
1
《
8
y
1
1 3.28
d 0
《
d 1
x
9
• 虚拟变量系数(差别截距项系数)的经济 含义
• 赋值为0的一类常称为基准类(对比类)
1
《
10
思考题:如下定义存在什么问题?
yi 0 1 d1i 2 d2i ui
1, 大学毕业 di 0,其他 非大学毕业生初职年薪的期望值
E yi | di 0 0
大学毕业生初职年薪的期望值
E yi | di 1 0 1
1
《
6
不同教育水平下的初职年薪
初职年薪 (千美元)
21.2 17.5 17.0 20.5 21.0
教育
1 0 0 1 1
初职年薪 (千美元)
1, 非大学毕业 d2i 0,其他
1
《
11
• 经验1.1:一个2分类的定性属性最多用1个 虚拟变量刻画,否则会出现完全共线性( 即虚拟变量陷阱)问题
• 经验1.2:一个n分类的定性属性最多用n-1 个虚拟变量刻画,否则会出现完全共线性 (即虚拟变量陷阱)问题
1
《
19.5
1
24.0
2
21.0
2
25.0
3
22.0
3
26.5
4
23.1
4
性别 初职年薪 教龄
1
25.0
5
0
28.0
5
1
29.5
6
0
26.0
6
1
27.5
7
0
31.5
7
1
29.0
8
0
性别 0 1 1 0 0 1 0
1
《
14
1
《
15
salary 男性 : s·alaryi 21.302861 1.370714 yearsi 3.333571
个虚拟变量刻画,无法反映定性属性之间
的交互作用。可以用(组合个数-1)个虚拟
变量刻画,可以测算定性属性之间的交互
作用,但是这样做可能会损失较多的自由
1 度。
《
35
小结(续)
• 经验3:一个n分类的定性属性可以用一个 虚拟变量刻画,但会隐含约束,可以采用 多个虚拟变量刻画。
• 经验4: m个n分类的定性属性还可以用虚 拟变量的交叉项来度量,交叉项前的系数 可以直接测算交互作用的增量影响,比经 验2中的方法更直观,而且还可能测算定性 属性和定量变量之间的交互作用。
– 定量变量 – 定性变量:取值不连续的变量,用于描述经济
对象的分类属性(定性因素),可以采用虚拟 变量来度量
• 定性自变量 • 定性因变量
1
《
4
包含虚拟自变量的线性回归模型
• 自变量中仅有一个虚拟变量 • 自变量中既包括定量变量又包括虚拟变量
1
《
5
自变量中仅有一个虚拟变量
yi 0 1 di ui
1
《
24
1
《
25
1
《
26
多个虚拟变量之间的交互作用
• 例子:教育水平与衣着开支
yi 1 2 Genderi 3 Edui Incomei ui
yi 1 2 Genderi 3 Edui
4 Genderi Edui Incomei ui
1
《
27
• 经验4: m个n分类的定性属性还可以用虚 拟变量的交叉项来度量,交叉项前的系数 可以直接测算交互作用的增量影响,比经 验2.2中的方法更直观,而且还可能测算定 性属性和定量变量之间的交互作用。
女性 : s·alaryi 17.96929 1.370714 yearsi
years
1
《
16
2定性变量+1定量变量
yi 0 1 d1i 2 d2i 3 xi ui
1, 男教师 d1i 0,女教师
1, 白种人 d2i 0, 非白种人
xi 教龄
1
《
17
思考题:以下定义方法的差别?
yi 旅游支出 xi 年收入
1
《
22
思考题:以下定义方法的差别
yi 0 1 di 2 xi ui
2, 大学及以上教育 di 1, 中学教育
0,其他 yi 旅游支出 xi 年收入
1
《
23
• 经验3:一个n分类的定性属性可以用一个 虚拟变量刻画,但会隐含约束,可以采用 多个,即(分类个数-1)个虚拟变量刻画 。
12
1个定性变量+1个定量变量
Βιβλιοθήκη Baidu
yi 0 1 di 2 xi ui
1, 男教师 di 0,女教师
xi 教龄
女教师的平均年薪 E yi | xi , di 0 0 2xi
男教师的平均年薪 E yi | xi , di 1 0 1 2xi
1
《
13
初职年薪 教龄
23.0
1
1
《
28
例7.10(第236页)
1
《
29
1
《
30
1
《
31
虚拟变量与定量变量之间的交互作用
• 例子:检验不同组之间回归函数上的差别
1
《
32
1
《
33
女性运动员 c·umgpai 0.100346 0.001728 sati
0.005916 hsperci 0.015869 tothrsi
男性运动员 c·umgpai 1.213984 0.000611 sati
0.005967 hsperci 0.010300 tothrsi
1
《
34
小结
• 经验1:一个n分类的定性属性最多用n-1个 虚拟变量刻画,否则会出现完全共线性( 即虚拟变量陷阱)问题。
• 经验2: m个n分类的定性属性如果只用m
yi 0 1 nwmi 2 wfei 3 wmi
4 xi ui
1, 非白种人男教师 nwmi 0,其他
1, 白种人女教师 wfei 0,其他
1, 白种男教师 wmi 0, 其他
xi 教龄
1
《
18
1
《
19
1
《
20
• 经验2.1:2个两分类的定性属性如果只用2 个虚拟变量刻画,无法反映定性属性之间 的交互作用,用(组合个数-1)个虚拟变 量刻画更具灵活性。
• 经验2.2: m个n分类的定性属性如果只用m 个虚拟变量刻画,无法反映定性属性之间 的交互作用,用(组合个数-1)个虚拟变 量刻画更具灵活性。
1
《
21
一个多分类的虚拟变量
yi 0 1 d1i 2 d2i 3 xi ui
1, 中学教育 d1i 0,其他
1, 大学及以上教育 d2i 0,其他
第五章 包含虚拟变量的回归模型
1
《
1
主要内容
• 虚拟变量的性质 • 包含虚拟自变量的线性回归模型 • 多分类虚拟变量 • 多个变量之间的交互作用
– 虚拟变量之间的交互作用 – 虚拟变量与定量变量之间的交互作用
• 包含虚拟因变量的回归模型
1
《
2
第五章
包含虚拟变量 的回归模型
1
《
3
虚拟变量的性质
• 定量变量 vs. 定性变量
18.5 21.7 18.0 19.0 22.0
教育
0 1 0 0 1
1
《
7
1
《
8
y
1
1 3.28
d 0
《
d 1
x
9
• 虚拟变量系数(差别截距项系数)的经济 含义
• 赋值为0的一类常称为基准类(对比类)
1
《
10
思考题:如下定义存在什么问题?
yi 0 1 d1i 2 d2i ui
1, 大学毕业 di 0,其他 非大学毕业生初职年薪的期望值
E yi | di 0 0
大学毕业生初职年薪的期望值
E yi | di 1 0 1
1
《
6
不同教育水平下的初职年薪
初职年薪 (千美元)
21.2 17.5 17.0 20.5 21.0
教育
1 0 0 1 1
初职年薪 (千美元)