关于虚拟解释变量的回归模型 - 汇总

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Econometrics
2012.10
14 / 38
男女教师年薪与教龄建模
. 上述表明男、女教师的平均年薪对教龄的函数具有相同的斜 率 (B2 ),但截距不同。 . 换句话说,男教师的平均年薪水平与女教师的平均年薪水平 2 不同 (多了 B3 ),但男、女教师平均年薪对教龄的变化率相 同。 . 如果斜率相同的假定是有效的,那么,很容易检验零假设: 3 B3 = 0(也即没有性别歧视) 。 . 并根据 t 检验结果判定 B3 的统计显著性。如果 t 检验表明 4 B3 是统计显著的,我们就可以拒绝零假设:男、女教师的平 均年薪水平相同。
Econometrics
2012.10
18 / 38
旅游支出与收入和教育的关系
. 个人假期旅游的年支出对其收入与受教育水平的回归。 . 教育水平是一个定性的变量。 2 . 假定教育水平有如下几等:未达到中学水平,中学水平,大 3 学水平(需要多少虚拟变量? ) 。 . 答案是 2。 4
1
.
如果回归模型包含了一个常数项,则当一个定性的变量有 m 类 时,应该引进且只引进 (m − 1) 个虚拟变量。 .
1
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
11 / 38
(非)大学毕业生的年薪建模
1
. 散点图与残差:
22 21 20 19 18 17
income
0
0.1
0.2
0.3
0.4
0.5 diploma
0.6
0.7
0.8
0.9
1
1
0.5
虚拟变量的个数 .
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
19 / 38
旅游支出与收入和教育的关系
1
. 计量经济模型:考虑协方差分析模型 Y = B1 + B2 X + B3 D1 + B4 D2 + U where Y -用于假期旅游的年支出,X -年收入。 { { 1, 中学教育 1, 大学教育 D1 = D2 = 0, 其他 0, 其他 (5)
. . . . . .
© Z.J. Yang (Hunan University)
Econometrics
2012.10
10 / 38
(非)大学毕业生的年薪建模
. 毕业生初职年薪 —回归分析结果:
回归系数估计 t 统计值 p-值 标准差 +1.800e+001 (+57.74) 0.0000 +0.3118 +3.280e+000 (+7.439) 0.0001 +0.4409 模型误差方差估计 =0.48600 决定系数 =0.8737, 修正的决定系数 =0.8579. 修正的复相关系数 =0.9262 回归方程 F 检验值 =55.3416,相应 p 值 =0.00007
. . . . . .
. 3 . 4 . 5 . 6
© Z.J. Yang (Hunan University)
Econometrics
2012.10
6 / 38
(非)大学毕业生的年薪建模
Figure: 10 个不同教育水平的职员初职年薪数据
. 问题 . 大学生与否初职年薪是否有显著差异,差异多少? .
2012.10
9 / 38
(非)大学毕业生的年薪建模
1
. 以下是利用 Matlab 程序的计算结果:
以下输出原始数据、拟合值及残差 因变量 拟合值 残差 虚拟变量 21.2 21.28 -0.0800 1.0 17.5 18.00 -0.5000 0.0 17.0 18.00 -1.0000 0.0 20.5 21.28 -0.7800 1.0 21.0 21.28 -0.2800 1.0 18.5 18.00 +0.5000 0.0 21.7 21.28 +0.4200 1.0 18.0 18.00 +0.0000 0.0 19.0 18.00 +1.0000 0.0 22.0 21.28 +0.7200 1.0
20 / 38
关于虚拟解释变量的回归模型
. 1 . 2
基本概念 方法举例 方差分析模型 协方差分析模型 虚拟变量设定应注意的问题 虚拟变量有多种分类的情况 两个定性变量的回归模型 回归模型中的结构稳定性 -虚拟变量法 虚拟变量在季节分析中的应用
. . . . . .
. 3 . 4 . 5 . 6
© Z.J. Yang (Hunan University)
8 / 38
(非)大学毕业生的年薪建模
. 零假设 H0 :大学教育没有任何益处 (即 B2 = 0)。 . 对此,只要用前面介绍的普通最小二乘法计算 t 检验值,即 2 可判定 B2 是否是统计显著的。
1
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
1
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
16 / 38
关于虚拟解释变量的回归模型
. 1 . 2
基本概念 方法举例 方差分析模型 协方差分析模型 虚拟变量设定应注意的问题 虚拟变量有多种分类的情况 两个定性变量的回归模型 回归模型中的结构稳定性 -虚拟变量法 虚拟变量在季节分析中的应用
2012.10
1 / 38
关于虚拟解释变量的回归模型
. 1 . 2
基本概念 方法举例 方差分析模型 协方差分析模型 虚拟变量设定应注意的问题 虚拟变量有多种分类的情况 两个定性变量的回归模型 回归模型中的结构稳定性 -虚拟变量法 虚拟变量在季节分析中的应用
. . . . . .
. 3 . 4 . 5 . 6
income
0
−0.5
−1
1
2
3
4
5 diploma
6
7
8
9
10
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
12 / 38
男女教师年薪与教龄建模
1
. 数据:
Figure: 大学教师的年薪、教龄及性别
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
13 / 38
男女教师年薪与教龄建模
1
. 计量经济模型:
考虑协方差分析模型
Y = B1 + B2 X + B3 D + U where Y -大学教师年薪,X -教龄 { 1, 男教师 D= 0, 女教师
(3)
(4)
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
1
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
4 / 38
虚拟变量 —(协)方差分析模型
. 一个回归模型的解释变量可以仅仅是虚拟变量 -方差分析模 型(analysis-of-variance models) (ANOVA)。 . 2 也可以是普通解释变量和虚拟变量的混合模型 -协方差分析 模型analysis-of-covariance models (ANCOVA).
1
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
5 / 38
关于虚拟解释变量的回归模型
. 1 . 2
基本概念 方法举例 方差分析模型 协方差分析模型 虚拟变量设定应注意的问题 虚拟变量有多种分类的情况 两个定性变量的回归模型 回归模型中的结构稳定性 -虚拟变量法 虚拟变量在季节分析中的应用
2012.10
22 / 38
.
节省参数 .
若模型包含多个定性变量,而且每个定性变量有多种分类,则引 入模型的虚拟变量将消耗大量的自由度。因此,应当权衡进入模 型的虚拟变量的个数。特别地,未知参数的个数不能超过样本观 察值的个数。 .
. . . . . .
. 3 . 4 . 5 . 6
© Z.J. Yang (Hunan University)
Econometrics
2012.10
17 / 38
旅游支出与收入和教育的关系
1
. 数据:
Figure: 大旅游支出 (Y)、收入 (X)、受教育水平
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
21 / 38
两个定性变量的例子
. 虚拟变量的技术可以推广到解释变量中有不止一个定性变量 的情形。 . 让我们回到大学教师年薪的例中。现在假定除了教龄、性别 2 以外,肤色也是一个重要的决定因素。假定肤色有两种,白 种和非白种。 . 包含两个定性变量的回归模型 3
(6)
2
. 在对上面虚拟变量的赋值中,我们将“未达到中学水平”视 为基准类。因此,截距 B1 代表了这一类的截距。差别截距 B3 ,B4 表明了其他两类的截距与基准类的截距的差距有多 大。
. . . . . .
© Z.J. Yang (Hunan University)
Econometrics
2012.10
. . . . . .
. 3 . 4 . 5 . 6
© Z.J. Yang (Hunan University)
Econometrics
2012.10
3 / 38
虚拟变量 —(协)方差分析模型
. 有些时候,解释变量却是定性的变量,我们把这类定性变量 称为虚拟变量 (Dummy Variable)。 . 这些变量还有其他的一些名称,比如,指标变量、二元变量、 2 分类变量、二分变量。 . 虚拟变量与定量变量一样可用于回归分析。 3
. 从这些回归中可以看出,截距 B1 表示非大学毕业生的平均 初职年薪, “斜率”系数 B2 表明大学毕业生的平均初职年薪 与非大学生的差距是多少;B1 + B2 表示大学毕业生的平均 初职年薪。
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
© Z.J. Yang (Hunan University)
Econometrics
2012.10
2 / 38
关于虚拟解释变量的回归模型
. 1 . 2
基本概念 方法举例 方差分析模型 协方差分析模型 虚拟变量设定应注意的问题 虚拟变量有多种分类的情况 两个定性变量的回归模型 回归模型中的结构稳定性 -虚拟变量法 虚拟变量在季节分析中的应用
. . . . . .
© Z.J. Yang (Hunan University)
Econometrics
2012.10
7 / 38
(非)大学毕业生的年薪建模
. 考虑方差分析模型 Y = B1 + B2 D + U where D=
2
1
(1)
{
1, 大学毕业 0, 其他 (比如,非大学毕业)
(2)
1
.
.
.
.
.
.
© Z.J. Yang (Hunan University)
Econometrics
2012.10
15 / 38
应注意的问题
. In regression analysis, a dummy variable (also known as indicator or bound variable) is one that takes the values 0 or 1 to indicate the absence or presence of some categorical effect that may be expected to shift the outcome. . 虚拟变量一般取 0,1。 2 . 赋值为 0 的一类常称为基准类 (base or bench mark)。 3 . 虚拟变量 D 的系数称为差别截距系数 ( differential intercept 4 coefficient )。 . 5 防止出现多重共线性。
.
计量经济学(第 6 讲)
关于虚拟解释变量的回归模型
. Regression with Dummy Variables
杨招军
zjyang@hnu.edu.cn
湖南大学 金融与统计学院
2012 年 10 月
. . . . . .
© Z.J. Yang (Hunan University)
Econometrics
1
Y = B1 + B2 X + B3 D1 + B4 D2 + U where Y -大学教师年薪,X -教龄 { { 1, 男教师 1, 白种 D1 = D2 = 0, 女教师 0, 非白种
. . . . .
(7)
(8)
.Baidu Nhomakorabea
© Z.J. Yang (Hunan University)
Econometrics
相关文档
最新文档