SPSS基本统计分析(new)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章SPSS基本统计分析
SPSS的主要分析工具——Analyze菜单
报告--Rports
描述性统计分析--Descriptive Statistics菜单
表格--Tables
均数间的比较--Compare Means菜单
一般线性模型――General Linear Model菜单
相关分析――Correlate菜单
多元线性回归与曲线拟合―― Regression菜单
对数线性模型——Loglinear菜单
聚类分析与判别分析——Classify菜单
因子分析与对应分析——Data Reduction菜单
信度分析与多维尺度分析——Scale菜单
非参数检验――Nonparametric Tests菜单
时间序列分析--Time series
描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,包括:
Frequencies:频数分析过程,特色是产生频数表(主要针对分类变量)
Descriptives:数据描述过程,进行一般性的统计描述(主要针对数值型变量)
Explore:数据探察过程,用于对数据概况不清时的探索性分析
Crosstabs:多维频数分布交叉表分析(列联表分析)
Ratio statistics:比率分析
对数据分析通常是从基本统计分析入手的。通过基本统计分析,能够使用权分析者掌握的基本统计特征,把握数据的总体分布形态。基本统计分析的结论对今后进一步的数据建模,将起到重要的指导和参考作用。
对数据的基本统计分析通常包括以下几个方面:
(1)编制单个变量的频数分布表。
(2)计算单个变量的描述统计量以及不同分组下的描述统计量。
(3)编制多变量的交叉频数分布表,并以此分析变量间的关系
(4)其它探索性分析
(5)数据的多选项分析
为实现上述分析,往往采用两种方式实现:第一,数值计算,即计算常见的基本统计量的值,通过数值来准确反映数据的基本统计特征,反映变量统计特征上的差异;第二,图形绘制,即绘制常见的基本统计图形,通过图形来直观展现数据的分布特点,比较数据分布的异同。通常,数值计算和图形绘制是结合使用的,它们将起到相辅相成的作用。
4.1 频数分析
4.1.1频数分析的目的和基本任务
基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。
例如,在意味着数据分析中,通常应首先对本次调查的被调查者的状况,如被访者的总人数、年龄特点、职业特点、性别特征等进行分析和总结。通过这些分析,能够在一定程
度上反映出样本是否具有总体代表性,抽样是否存在系统偏差等,并以此证明以后相关问题分析的代表性和可信性。这睦分析可以通过频数分析来实现。
频数分析的第一个基本任务是编制频数分布表。SPSS中的频数分布表包括的内容有:1.频数(frequency)
即变量值落在某个区间(或某个类别)中的次数。
2.百分比(percent)
即各频数占总样本数的百分比
3.有效百分比(valid percent)
即各频数占有效样本数的百分比。其中;有效样本数=总样本数-缺失样本数。有效百分比计算的是:在不包含缺失值个案的所有个案中各变量取值频数的比例。
4.累计百分比(cumulative percent)。
即各百分比逐级累加起来的结果。最终取值为百分之百。
频数分析的第二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画方式。能够非常清晰地展示变量的取值状况。频数分析中常用的统计图包括:
1.柱形图或条形图(bar chart)
即用宽度相同的条形的高度或长短来表示频数分布变化的图形,适用的定序和定类变量的分析。柱形图的纵坐标或条形图的横坐标可以表示频数,也可以表示百分比。它们又分为单式图和复式图等形式。
2.饼图(pie chart)
3.直方图(histograms)
即用矩形的面积来表示频数分布变化的图形。适用于定距型变量的分析。可以在直方图上附加正态分布曲线,便于与正态分布的比较。
4.1.2 频数分析的应用举例
案例4-1
利用第2章案例2-1的住房问卷调查数据,分析被调查家庭中户主的从业状况、日前所住房屋的产权情况。
SPSS频数分析的基本操作步骤如下:
(1)选择菜单:analyze->descriptive statistics->frequencies
(2)选择若干频数分析变量到[variable(s)]框中。这里选择从业状况和房屋产权。
(3)按[chart]选择绘制统计图。在[ chart values]框中选择柱形图纵坐标或条形图横坐标(或饼图中扇形面积)的含义,[frequencies]表示频数;[percentages]表示百分比。这里选择柱形图。
(4)频数分布表格式(Format)的定义
1.调整频数分布表中数据的输出顺序(Order by):频数分布表中的内容的输出顺序可以按变量值的升序输出(Ascending values),按变量值的降序输出(Descending values),按频数的升序输出( Ascending counts),按频数的降序输出( Descending counts)。
2.multiple variables单选框组:
如果选择了两个以上变量作频数表,则compare variables可以将所有变量的结果在同一个频数表过程输出结果中显示,便于互相比较;organize output by variables则将结果在不同的频数表过程输出结果中显示,每一个变量一张表。
3.压缩频数分布表(Suppress tables with more than n categories)
如果变量取值的个数或取值区间的个数太多,频数分布表将很庞大,此时可以压缩它。SPSS默认,如果变量取值的个数或取值区间的个数大于10,则不输出相应的频数分布表。应用中可以修改该值。