数据分析报告的范文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于某地区361个人旅游情况统计分析报告

-----数据分析报告的范文精品篇

一、数据介绍:

本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。

二、数据分析

1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人

旅游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。

统计量

积极性性别

N 有效359 359

缺失0 0

首先,对该地区的男女性别分布进行频数分析,结果如下

性别

频率百分比有效百分比累积百分比

有效女198 55.2 55.2 55.2

男161 44.8 44.8 100.0

合计359 100.0 100.0

表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分

别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。其次对原有数据中的旅游的积极性进行频数分析,结果如下表:

积极性

频率百分比有效百分比累积百分比有效差171 47.6 47.6 47.6

一般79 22.0 22.0 69.6

比较好79 22.0 22.0 91.6

好24 6.7 6.7 98.3

非常好 6 1.7 1.7 100.0

合计359 100.0 100.0

其次对原有数据中的积极性进行频数分析,结果如下表:

其次对原有数据中的是否进通道进行频数分析,结果如下表:

Statistics

通道

N Valid 359

Missing 0

这说明,在该地区被调查的359个人中,有没走通道的占81.6%,占绝大多数。上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171 人数的47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积性为好的和非常好的比例比较低,分别为24人和6人,占总体的比例为6.7%和1.7%。

2、描述统计分析。

再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。

如表所示,以起始工资为例读取分析结果,359个人中收入最小值为7.426¥,最大值为6250.00000¥,平均1032.9302¥,标准差为762.5239¥偏度系数和峰度系数分别为1.790和6.869。

其他数据依此读取,则该表表明该地区旅游花费的详细分布状况。

3、探索性数据分析

(1)交叉分析。

通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。现以现工资与职务等级的列联表分析为例,读取数据(下面数据分析表为截取的一部分):

Count

上联表及Bar Chart涉及两个变量,即性别与积极性的二维交叉,反映了在不同的性别对于旅游积极性分布情况。上表中,性别成为行向量,积极性列向量。

(2)性别与收入的探索性分析

Descriptives

性别Statistic Std. Error 收入女Mean 1005.28562 49.514796

95% Confidence Interval for Mean Lower Bound 907.63853 Upper Bound 1102.93272

5% Trimmed Mean 957.92011

Median 937.50000

Variance 485439.577

Std. Deviation 696.734940

Minimum 7.426

Maximum 3125.000

Range 3117.574

Interquartile Range 937.563

Skewness .896 .173 Kurtosis .310 .344 男Mean 1066.92791 65.993219

95% Confidence Interval for Mean Lower Bound 936.59779 Upper Bound 1197.25802

5% Trimmed Mean 986.95497

Median 937.50000

Variance 701171.907

Std. Deviation 837.360082

Minimum 58.630

Maximum 6250.000

Range 6191.370

Interquartile Range 718.750

Skewness 2.370 .191

Kurtosis 10.166 .380

收入

Stem-and-Leaf Plots

收入 Stem-and-Leaf Plot for

性别= 女

Frequency Stem & Leaf

18.00 0 . 001111111111111111

26.00 0 . 22222222222223333333333333

17.00 0 . 44444444444555555

33.00 0 . 666666666666666666666777777777777

相关文档
最新文档