工资收入差异分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
工资收入差异分析
摘要
为了考察工资收入是否与性别,年龄,学历,企业规模有关,我们建立计量经济学模型对其进行分析判断和预测,因国内数据不好查找,我们在这个模型中就引用日本的数据建立模型。
关键词: 工资收入差距线性回归
一.数据收集和模型结构
下表列出的15个工人月收入以及相应的性别,年龄层(30多岁与40多岁),学历(大学毕业,高中毕业,初中毕业),企业规模(大型企业,中型企业,小型企业)之间的关系。根据这些定性数据,通过这些定性数据,通过小面问题分析收入差距的原因。
1为了将定性数据作为解释变量纳入模型,引入下面六个虚拟变量。根据下表制作虚拟变量的数据表。
性别S S=1 男性S=0 女性
年龄A A=1 40多岁A=0 30多岁
学历(1) E1`=1 大学毕业E1=0 其他
学历(2)E2=1 高中毕业E2=0 其他
企业规模(1)F1=1 大型企业F1=0 其他
企业规模(2)F2=1 中小型企业F2=0 其他
2设定模型
Y=α+β1S+β2A+β3 E1 +β4 E2 +β5 F1 +β6 F2 +u
α>0 , β1>0 , β2>0 , β3>0 , β4>0 , β5>0 , β6>0
3估计模型的参数,检验参数和整体模型并对模型进行修正
4计算下列属性所对应的月收入
a)大型企业中40多岁男性大学毕业工人的月收入Y a
b)中型企业中30多岁女性大学毕业工人的月收入Y b
c)小型企业中30多岁男性初中毕业工人的月收入Yc
表1 月收入与性别、年龄层、学历、企业规模之间的关系
二.模型的参数估计
表3 最小二乘估计
Dependent Variable: Y
Method: Least Squares
Date: 12/15/03 Time: 20:14
Sample: 1986 2000
Included observations: 15
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 11.96613 1.694604 7.061317 0.0001
S 14.38476 1.238761 11.61222 0.0000
A 12.64252 1.519607 8.319597 0.0000
E1 15.87300 1.466859 10.82108 0.0000
E2 5.082785 1.119298 4.541047 0.0019
F1 12.15240 1.326189 9.163398 0.0000
F2 5.543744 1.196137 4.634706 0.0017 R-squared 0.983316 Mean dependent
var
38.06667
Adjusted R-squared 0.970802 S.D. dependent
var
10.06029
S.E. of regression 1.719035 Akaike info
4.226127
criterion
23.64064 Schwarz criterion 4.556551
Sum squared
resid
F-statistic 78.58178
Log likelihood -24.6959
6
2.283073 Prob(F-statistic) 0.000001
Durbin-Watson
stat
Y = 11.966 + 14.385S + 12.643A + 15.873E1 + 5.083E2 + 12.152F1 + 5.544F2
(7.061) (11.612) (8.320) (10.821) (4.541) (9.163) (4.635)
_
R2 = 0.9708
三.模型的统计检验
(1)经济意义检验
所有的参数都为正数,即性别、年龄、学历和所在企业的大小对月收入有正面的影响,符合经济意义。
(2)统计推断检验
(a)拟和优度检验
可决系数R2 = 0.983316 说明模型在整体上拟和很好,Y 的总差由模型作出了绝大部分解释。
_
R2 = 0.9708也说明模型中各个解释变量对应变量的联合影响程度很大
(b)回归参数的显著性检验——T检验
在显著性水平a=0.01条件下t a/2 (n-k)= t a/2 (15-6) =3.250 模型估计的各参数的T值都大于3.250。说明各个解释变量对应变量的影响都是显著的。即性别,年龄,学历,企业大小对月收入有显著影响。
(c)回归方程的显著性检验——F检验
在显著性水平a=0.01条件下,F0。01(k-1,n-k)= F0。01 (6-1,15-6)=6.06 模型中的F-statistic=78.5819 大于6.06,说明回归方程显著,即各个解释变量同应变量之间存在显著的线性关系。
(3)计量经济学检验
(a)多重共线性检验
由表4可以看出,解释变量之间不存在严重的多重共线性,各解释变量之间的
干扰程度不大,不需要进行修正。
(b)异方差检验
a White 检验
表5 White 检验
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/15/03 Time: 21:54
Sample: 1986 2000
Included observations: 15
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 14.63007 15.55903 0.940295 0.3746
S 2.538157 11.37371 0.223160 0.8290
A -6.24856
8
13.95230 -0.447852 0.6661
E1 -0.10557
3
13.46799 -0.007839 0.9939
E2 -5.14713
5
10.27685 -0.500847 0.6300
F1 2.974629 12.17643 0.244294 0.8132
F2 -2.86070
8
10.98235 -0.260482 0.8011
R-squared 0.125144 Mean dependent
var 11.3991
6
Adjusted R-squared -0.53099
8
S.D. dependent
var
12.7559
2
S.E. of regression 15.78335 Akaike info
criterion 8.66051
2
Sum squared resid 1992.912 Schwarz criterion 8.99093
6
Log likelihood -57.9538
4 F-statistic 0.19072
7
Durbin-Watson stat 2.370596 Prob(F-statistic) 0.97077
3
计算n R2 = 15×0.125144 = 1.87716 在显著性水平a=0.01条件下,X2 0.01 (P>5) 都大于
1.87716 ,即可接受原假设,随机误差u 不存在异方差性。
(c)自相关检验
DW检验由表1中估计的结果,DW=2.283073 ,在给定显著性水平