《描述性统计分析》
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
10
【界面介绍】 ⑴ 选择菜单【Analyze】→【Descriptive Statistics】→ 【Frequencies】,进入频数分析的分析界面,出现如图所 示的窗口。
⑵ 将若干频数分析变量选择到Variables(s)框中;选择Display frequency tables复项表示在结果中输出频数表。
.
18
(3)单击【Plots】按钮,弹出Plots子对话框。该项用于选择 所需要的统计图。
.
19
(4 )单击【Options】按钮,在弹出的子对话框中选择对 缺失值的处理方式,可以是不分析有任一缺失值的记录 (Exclude cases listwise)、不分析计算某统计量时有缺 失值的记录(Exclude cases pairwise),或报告缺失值 (Report values)。
描述性统计分析
【学习提要】
对数据进行统计描述是统计分析中最基本的工作。对于 整理好的数据,通过描述性统计分析,可以挖掘出很多统计 量的特征。SPSS软件中,描述性统计分析功能主要集中在 “Descriptive Statistics”菜单。具体包括5个过程: Frequencies过程、Descriptives过程、Explore过程、Crosstabs 过程和Ratio过程。
.
22
列联表分析的主要任务有两个:
• 第一,根据收集到的样本数据,产生二维或多维交叉 列联表。交叉列联表是两个或多个以上变量交叉分组 后形成的频数分布表。
• 第二,在交叉列联表的基础上,分析两两变量之间是 否具有独立性或一定的相关性。对交叉列联表中的行 变量和列变量之间关系进行分析是列联表分析的第二 个任务。在列联表基础上做进一步分析,可以得到行 变量和列变量之间是否有联系、联系的紧密程度如何 等更深层次的信息。
.
15
4.3 探索性分析
Explore过程可对变量进行更为深入详尽的描述性统 计分析,主要用于对资料的性质、分布特点等完全不清楚 时,故又称之为探索性分析。
它在一般描述性统计指标的基础上,增加有关数据其他 特征的文字与图形描述,如茎叶图、箱图等,显得更加详 细、全面,有助于用户制定继续分析的方案。
标准差Std.deviation:描述变量关于均值的偏离程度 方差Variance:标准差的平方 极大值Maximum:某变量所有取值的最大值 极小值Minimum:某变量所有取值的最小值 全距Range:某变量极大值与极小值之差 均值的标准误差S.E.mean:均值的标准误差
.
5
在描述性统计分析中,Descriptives过程是连 续资料统计描述应用最多的一个过程,他可对变 量进行描述性统计分析,计算并列出一系列相应 的统计指标。
.
6
【界面介绍】
⑴ 选 择 菜 单 【Analyze】→【Descriptive Statistics】→ 【Descriptives】,进入基本描述性统计量的分析界面, 出现如图所示的窗口。
.
7
⑵ 在Variables(s)框定义要分析的数值型变量,可同时选择多 个变量。 ⑶ 若需将原始数据的标准正态评分存为新变量,则选择Save standardized values as variables选项。 ⑷ 单击【Options】按钮指定计算哪些基本描述性统计量,出 现如图所示的窗口。
.
3
描述变量分布情况的统计量
偏度Skewness:描述变量分布的对称程度和方 向。偏度为0表示对称,大于0表示右偏,小于0表 示左偏
峰度Kurtosis:描述变量分布的陡峭程度。峰度为 0表示陡峭程度和正态分布相同,大于0表示比正 态分布陡峭,小于0表示比正态分布平缓
.
4
描述变量离散程度的统计量
.
1
4.1 描述统计量
常见的描述性统计量主要包括以下3类: 描述变量集中趋势的统计量、描述变量分布 情况的统计量、描述变量离散程度的统计 量。
通常,综合这三类统计量就能够极为准 确和清晰的把握数据的分布特点。
.
2
描述变量集中趋势的统计量:
均值Mean:表示变量值的平均水平 中位数Median:一组数据中处于最中间位置的数 众数Mode:一组数据中出现次数最多的数 和Sum:某变量的所有变量值之和
.
11
⑶ 单击【Statistics】按钮后弹出Statistics子对话框。
.
12
⑷ 单击【Charts】按钮后弹出Charts子对话框。
.
13
⑸ 单击【Format】按钮,弹出Format子对话框。该对话框 用于定义输出频数表的格式,在实际中,我们一般采用 默认格式。
.
14
• 例4-2 已知有某地110名10岁女生身高数据,数据见文 件4-2-1.sav ,请编制频数表。
20
例4-3 已知有某地城市和农村各55名10岁女生身高数 据,数据见文件4-2-1.sav,请利用Explore过程分组分 析。
.
21
4.4 列联表分析
通过频数分析能够掌握单个变量的数据分布情况。 在实际分析过程中,不仅要了解单变量的分布特征,还 要分析多个变量不同取值下的分布,掌握多变量的联合 分布特征,进而分析变量之间的相互影响和关系。当问 题涉及多个变量时,采用单纯的频数分析方法显然不 够,这时,我们需要借助交叉分组下的频数分析,又称 为列联表分析。
.
16
【界面介绍】
⑴ 选 择 菜 单 【Analyze】→【Descriptive Statistics】→ 【Explore】,进入探索性分析界面,出现如图所示的 窗口。
.
17
(2)单击【Statistics】按钮,弹出Statistics子对话框,如图 所示。该项用于选择所需要的描述统计量。
.
8
【实验案例】 例4-1 测量20台液晶显示器的重量,数据见4-1-1.sav,对其进行 描述性统计分析。
.
9
4.2 频数分布表分析
频数分析统计的是每一组中观测点的个数,而不是 考虑其实际取值。
通过频数分析能够了解变量取值的情况,对于把握 数据的分布特征非常有用。当某变量的自然取值是局限 在有限的几个数值中,则频数分析就是统计该变量在各 个取值点的个数分布情况;如果某变量的取值是在某范 围内的离散值,则需要将其取值区域划分为几个取值区 间,频数分析就是统计该变量在各个取值区间观测点个 数的分布情况。