第六章虚拟变量回归模型(最新)资料.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E(Yi | X i , Di 0) 0 1 X i
企业男职工的平均薪金为:
E(Yi | X i , Di 1) ( 0 2 ) 1 X i
7
几何意义:
• 假定2>0,则两个函数有相同的斜率,但有不同 的截距。意即,男女职工平均薪金对工龄的变化 率是一样的,但两者的平均薪金水平相差2。
异,称为差别截距系数. • B1+B2:企业女性职工的平均薪金
二、虚拟变量的引入方式
• 虚拟变量做为解释变量引入模型有两种基本方式: 加法方式和乘法方式。
1、加法方式
上述企业职工薪金模型中“性别”虚拟变量的引 入采取了加法方式。
Yi 0 1 X i 2 Di i
企业女职工的平均薪金函数为:
Dependent Variable: Y
性别赋值:男性=0,女性=1;
Variable Coefficient
Std. Error
t-Statistic
Prob.
C
3176.833
233.0446
13.63187
0.0000
SEX -503.1667
329.5749
-1.526714
0.1578
R-squared
第五章 简要总结:各模型的斜率值 B2含义
• 线性回归模型:解释变量每变动一个单位,被解 释变量变动的绝对量
• 双对数模型:解释变量每变动一个百分点,被解 释变量变动的百分数
• 对数-线性模型:解释变量每变动一个单位,被解 释变量均值的(瞬时)增长率
• 线性-对数模型:解释变量相对变动一个百分点, 被解释变量变动的绝对量
1, 本科学历 D=
0, 非本科学历
一般地,在虚拟变量的设置中:
• 基础类型、肯定类型取值为1;
• 比较类型,否定类型取值为0。
4
概念:
解释变量只含有虚拟变量的模型,称为方差分析 (analysis-of variance: ANOVA)模型。
Y=B1+B2*D+μ Y为职工薪金, Di=1,女性;Di=0,男性 而同时含有一般解释变量与虚拟变量的模型,称为协 变量模型(analysis-of covariance: ANCOVA)模型。 一个以"工龄"和"性别"虚拟变量为解释变量,考察企 业职工薪金的模型:
0.189026
Dependent Variable: Y
性别赋值:男性=1,女性=0;
Variable Coefficient
Std. Error
t-Statistic
Prob.
C
2673.667
233.0446
11.47277
0.0000
SEX2 503.1667
329.5749
1.526714
这时需要引入两个虚拟变量:
1 D1 0
高中 其他
1 D2 0
大学及其以上 其他
模型可设定如下:把“高中以下”作为基准水
平
Yi 0 1 X i 2 D1 3 D2 i
13
在E(i)=0 的初始假定下,高中以下、高中、大学 及其以上教育水平下个人保健支出的函数:
• 高中以下:
E(Yi | X i , D1 0, D2 0) 0 1 X i
Yi 0 1 X i 2 Di i
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,女性;Di=0,男性;
方差分析模型中参数的含义
• E(Y|D=0)=B1+B2(0)=B1
• E(Y|D=1)=B1+B2(1)=B1+B2
• B1:企业男性职工的平均薪金, • B2:企业女性职工的平均薪金与男性职工的差
0.1578
R-squared
0.189026
11
(6-9)被解释变量:食品支出;
P138
解释变量:税后收入、性别
Dependent Variable: Y
Variable Coefficient
Std. Error
C
1506.244
INCOME0.058982
SEX -228.9868
188.0096 0.006117 107.0582
• 倒数模型:解释变量的倒数每变动一个单位,被 解释变量变动的绝对量
第六章 虚拟变量回归模型
一、虚拟变量的基本含义 二、虚拟变量的引入方式 三、虚拟变量的设置原则 四、虚拟变量在季节分析中的应用 五、因变量是虚拟变量的模型:LPM 总结 一个实际案例:虚拟变量的引入
2
一、虚拟变量Βιβλιοθήκη Baidu基本含义
• 许多经济变量是可以用数值加以定量度量的,如: 商品需求量、价格、收入、产量等,这类变量一般 称为定量变量
(协变量模型:6-9)被解释变量:食品支出; 解释变量:税后收入:X、性别:D
P138
(6-23) 被解释变量:食品支出; 解释变量:税后收入、性别、税后收入*性别
9
1、分别写出(6-4)、(6-9)的估计方程。 2、进一步写出男性、女性的估计方程。 3、根据估计结果,解释偏回归系数含义。
10
(6-4)被解释变量:食品支出;解释变量:性别
• 可以通过传统的回归检验,对2的统计显著性进 行检验,以判断企业男女职工的平均薪金水平是 否有显著差异。
年薪 Y
男职工
女职工
2
0
工龄 X
8
例题6-1:男女食品支出和税后收入的关系。 P134
(方差分析模型:6-4)被解释变量:食品支出 解释变量:性别:女性=1,男性=0
结论:因为B2回归结果不显著,表明男、女平均食品支出 差异不显著
R-squared
0.928418
t-Statistic
8.011529 9.641745 -2.138899
Prob.
0.0000 0.0000 0.0611
12
例2:在横截面数据基础上,考虑个人保健支出对 个人收入和教育水平的回归。 教育水平考虑三个层次(或分类):高中以下,
高中,
大学及其以上
• 但也有一些影响经济变量的因素无法定量度量, 如:“职业”、“性别”对收入的影响,“战 争”、“自然灾害”对GDP的影响,“季节”对 某些产品(如冷饮)销售的影响等等。
• 为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”,
3
这种“量化”通常是通过引入“虚拟变量”来 完成的。根据这些因素的属性类型,构造只取“0” 或“1”的人工变量,通常将定性变量,称为虚拟变量 (dummy variables),或二元变量\二分变量\分类 变量\指标变量.记为D。(不要用X作为虚拟变量符号) • 例如,反映"文化程度"的虚拟变量可取为:
企业男职工的平均薪金为:
E(Yi | X i , Di 1) ( 0 2 ) 1 X i
7
几何意义:
• 假定2>0,则两个函数有相同的斜率,但有不同 的截距。意即,男女职工平均薪金对工龄的变化 率是一样的,但两者的平均薪金水平相差2。
异,称为差别截距系数. • B1+B2:企业女性职工的平均薪金
二、虚拟变量的引入方式
• 虚拟变量做为解释变量引入模型有两种基本方式: 加法方式和乘法方式。
1、加法方式
上述企业职工薪金模型中“性别”虚拟变量的引 入采取了加法方式。
Yi 0 1 X i 2 Di i
企业女职工的平均薪金函数为:
Dependent Variable: Y
性别赋值:男性=0,女性=1;
Variable Coefficient
Std. Error
t-Statistic
Prob.
C
3176.833
233.0446
13.63187
0.0000
SEX -503.1667
329.5749
-1.526714
0.1578
R-squared
第五章 简要总结:各模型的斜率值 B2含义
• 线性回归模型:解释变量每变动一个单位,被解 释变量变动的绝对量
• 双对数模型:解释变量每变动一个百分点,被解 释变量变动的百分数
• 对数-线性模型:解释变量每变动一个单位,被解 释变量均值的(瞬时)增长率
• 线性-对数模型:解释变量相对变动一个百分点, 被解释变量变动的绝对量
1, 本科学历 D=
0, 非本科学历
一般地,在虚拟变量的设置中:
• 基础类型、肯定类型取值为1;
• 比较类型,否定类型取值为0。
4
概念:
解释变量只含有虚拟变量的模型,称为方差分析 (analysis-of variance: ANOVA)模型。
Y=B1+B2*D+μ Y为职工薪金, Di=1,女性;Di=0,男性 而同时含有一般解释变量与虚拟变量的模型,称为协 变量模型(analysis-of covariance: ANCOVA)模型。 一个以"工龄"和"性别"虚拟变量为解释变量,考察企 业职工薪金的模型:
0.189026
Dependent Variable: Y
性别赋值:男性=1,女性=0;
Variable Coefficient
Std. Error
t-Statistic
Prob.
C
2673.667
233.0446
11.47277
0.0000
SEX2 503.1667
329.5749
1.526714
这时需要引入两个虚拟变量:
1 D1 0
高中 其他
1 D2 0
大学及其以上 其他
模型可设定如下:把“高中以下”作为基准水
平
Yi 0 1 X i 2 D1 3 D2 i
13
在E(i)=0 的初始假定下,高中以下、高中、大学 及其以上教育水平下个人保健支出的函数:
• 高中以下:
E(Yi | X i , D1 0, D2 0) 0 1 X i
Yi 0 1 X i 2 Di i
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,女性;Di=0,男性;
方差分析模型中参数的含义
• E(Y|D=0)=B1+B2(0)=B1
• E(Y|D=1)=B1+B2(1)=B1+B2
• B1:企业男性职工的平均薪金, • B2:企业女性职工的平均薪金与男性职工的差
0.1578
R-squared
0.189026
11
(6-9)被解释变量:食品支出;
P138
解释变量:税后收入、性别
Dependent Variable: Y
Variable Coefficient
Std. Error
C
1506.244
INCOME0.058982
SEX -228.9868
188.0096 0.006117 107.0582
• 倒数模型:解释变量的倒数每变动一个单位,被 解释变量变动的绝对量
第六章 虚拟变量回归模型
一、虚拟变量的基本含义 二、虚拟变量的引入方式 三、虚拟变量的设置原则 四、虚拟变量在季节分析中的应用 五、因变量是虚拟变量的模型:LPM 总结 一个实际案例:虚拟变量的引入
2
一、虚拟变量Βιβλιοθήκη Baidu基本含义
• 许多经济变量是可以用数值加以定量度量的,如: 商品需求量、价格、收入、产量等,这类变量一般 称为定量变量
(协变量模型:6-9)被解释变量:食品支出; 解释变量:税后收入:X、性别:D
P138
(6-23) 被解释变量:食品支出; 解释变量:税后收入、性别、税后收入*性别
9
1、分别写出(6-4)、(6-9)的估计方程。 2、进一步写出男性、女性的估计方程。 3、根据估计结果,解释偏回归系数含义。
10
(6-4)被解释变量:食品支出;解释变量:性别
• 可以通过传统的回归检验,对2的统计显著性进 行检验,以判断企业男女职工的平均薪金水平是 否有显著差异。
年薪 Y
男职工
女职工
2
0
工龄 X
8
例题6-1:男女食品支出和税后收入的关系。 P134
(方差分析模型:6-4)被解释变量:食品支出 解释变量:性别:女性=1,男性=0
结论:因为B2回归结果不显著,表明男、女平均食品支出 差异不显著
R-squared
0.928418
t-Statistic
8.011529 9.641745 -2.138899
Prob.
0.0000 0.0000 0.0611
12
例2:在横截面数据基础上,考虑个人保健支出对 个人收入和教育水平的回归。 教育水平考虑三个层次(或分类):高中以下,
高中,
大学及其以上
• 但也有一些影响经济变量的因素无法定量度量, 如:“职业”、“性别”对收入的影响,“战 争”、“自然灾害”对GDP的影响,“季节”对 某些产品(如冷饮)销售的影响等等。
• 为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”,
3
这种“量化”通常是通过引入“虚拟变量”来 完成的。根据这些因素的属性类型,构造只取“0” 或“1”的人工变量,通常将定性变量,称为虚拟变量 (dummy variables),或二元变量\二分变量\分类 变量\指标变量.记为D。(不要用X作为虚拟变量符号) • 例如,反映"文化程度"的虚拟变量可取为: