某些地区各行业工资水平的分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

年某些地区各行业工资水平的分析

————————————————————————————————作者:————————————————————————————————日期:

2

2009年某些地区各行业工资水平的分析

1、研究背景及意义

1.1研究背景

工资水平是指一定区域和一定时间内劳动者平均收入的高低程度。生产决定分配,只有经济发展才能提供更多的可分配的社会产品,因此一个地区的工资水平在一定程度上反映了其经济发展的水平。工资水平的影响因素包括地域的影响。企业所在的地区对企业的工资水平有相当大的影响,顺应这种大环境的要求才不会引起员工的异议。一般企业在确定其工资水平时,都应该对本地区的工资水平进行调查,以便对相关的工资环境有一个大概的了解。

1.2研究意义

1、通过多元统计分析方法,研究一个地区的工资水平与其经济发展水平的内在联系。

2、将平均工资划分为3类,分析哪些地区、哪些行业的工资水平较高,可为员工和企业提供宏观上的指引。

2、数据描述

本数据集象征性地抽取全国15个省市(北京、天津、河北、山西、辽宁、吉林、上海、江苏、浙江、安徽、福建、江西、湖南、广东、海南)的工资状况,各省市分别记录了其9个主要行业(企业、机关、农林牧渔业、采矿业、制造业、建筑业、计算机软件业、批发零售业、住宿餐饮业)的平均工资水平,具体参见下图:

3、分析方法

3.1通过描述统计分析方法,判断哪些行业平均工资水平较高

通过比较不同行业(如企业、机关、建筑业、制造业······)的均值、标准差、极大值、极小值,可以从总体上判断哪些行业的工资水平比较高,哪些行业

的较低。

3.2通过系统聚类分析方法,判断哪些地区平均工资水平较高

通过对不同地区进行聚类,使具有相似特征(亲疏程度高)的地区聚集在一起,使差异性大的地区分离开来,有助于合理地分析地域工资水平的情况。

4、输出结果分析

4.1描述统计结果分析

1、由表1分析统计量的输出结果可知:平均工资水平较高的三个行业分别是:

计算机软件业(55777.2元)、机关(43972.53元)、采矿业(39323.93元);平均工资水平较低的三个行业分别是:农林牧渔业(20035.47元)、住宿餐饮

业(20619.67元)、制造业(27943.33元)。在9个行业中,极大值最大的是

计算机软件业(105413元),极小值最小的是农林牧渔业(8841元)。

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation

企业15 22000 62046 3.33E4 11642.301

机关15 26668 74734 4.40E4 17047.500

农林牧渔业15 8841 45925 2.00E4 10432.601

采矿业15 22846 66138 3.93E4 12600.091

制造业15 21242 48207 2.79E4 7662.814

建筑业15 19519 69131 2.96E4 13359.351

计算机软件业15 27753 105413 5.58E4 23372.698

批发零售业15 16263 60260 2.99E4 12801.976

住宿餐饮业15 13577 38040 2.06E4 6566.173

Valid N (listwise) 15

4.2系统聚类结果分析

1、表2数据中给出了样本处理的基本信息,包括样本总数、含有缺失值的样本数

以及百分比等。

Case Processing Summary a

Cases

Valid Missing Total N Percent N Percent N Percent

15 83.3% 3 16.7% 18 100.0%

a. Squared Euclidean Distance used

2、表3显示的是用欧式距离平方计算的近似矩阵表,其中的数值表示各个样本

之间的相似系数,数值越大表示两样本距离越大。

Proximity Matrix

Case

Squared Euclidean Dista 1:北京2:天津3:河北4:山西5:辽宁6:吉林7:上海8:江苏

1:北京.000 .756 3.452 3.773 2.598 3.896 .873 1.666 2:天津.756 .000 1.766 1.842 1.340 1.994 1.985 .540 3:河北 3.452 1.766 .000 .077 .162 .124 6.936 .657 4:山西 3.773 1.842 .077 .000 .349 .123 7.184 .831 5:辽宁 2.598 1.340 .162 .349 .000 .212 5.817 .369 6:吉林 3.896 1.994 .124 .123 .212 .000 7.476 .785 7:上海.873 1.985 6.936 7.184 5.817 7.476 .000 4.185 8:江苏 1.666 .540 .657 .831 .369 .785 4.185 .000 9:浙江 1.634 .720 1.579 1.679 1.101 1.600 3.719 .402 10:安徽 2.959 1.353 .093 .119 .213 .202 6.105 .518 11:福建 2.832 1.313 .371 .428 .203 .296 5.900 .340 12:江西 4.363 2.289 .275 .224 .362 .063 8.021 .942 13:湖南 3.683 1.912 .299 .306 .226 .084 7.128 .718 14:广东 1.577 .685 .518 .726 .220 .677 4.262 .064 15:海南 3.534 1.863 .153 .282 .142 .180 7.046 .583 This is a dissimilarity matrix

3、表4显示的是聚类表,该表反映的是每一个阶段聚类的结果,实际上就是聚类

过程,系数(Coefficients)表示的是“聚合系数”,第2列和第3列表示的是聚

合的类。聚类进程中系数逐渐变大,结果时类与类差异较大。

Agglomeration Schedule

Stage

Cluster Combined

Coefficients

Stage Cluster First Appears

Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2

1 1

2 1

3 .051 0 0 3

2 8 14 .064 0 0 10

3 6 12 .07

4 0 1 8

4 3 4 .077 0 0 5

5 3 10 .10

6 4 0 9

6 11 15 .139 0 0 7

7 5 11 .173 0 6 8

8 5 6 .229 7 3 9

相关文档
最新文档