spss学习总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Spss学习心得
Spss软件是一款用来分析数据的软件。在我们的日常生活中存在着好多数据。如果要把这些数据统计起来,并作分析,这一定是一个很大的任务。Spss利用的是计算机的计算优势将复杂的数学计算问题很方便的解决了。几乎可以这么说Spss软件里的每一个按钮或选项都蕴含了一个数据计算或一个数学原理。Spss通过简单的鼠标操作将复杂的数学问题得以解决,他可以让不了解数据分析原理的人也能迅速的学会对数据的分析和处理。
Spss的功能很强大,主要分析功能(如图1所示)有报告分析、描述统计、表、比较均值、一般线性模型、广义线性模型、混合模型、相关分析、回归分析、对数线性模型、神经网络、分类、降维、度量、非参数检验、预测、生存函数、多重响应、缺失值分析、多重归因、复杂抽样、质量控制、ROC曲线图等。Spss还可以通过数据绘制不同的图形如直方图、茎叶图、聚类分析图。下面对几个常用的分析方法做个总结。
图1
一、Spss之描述性统计
统计常分为描述性统计和推断性统计(概率统计)。前者往往多用于社会科学,后者多用于自然科学,两者相互渗透。其中,描述性统计是统计学中最基本、最常用的统计方法。基本数学模型:集中趋势、离散趋势、偏度和峰度。
描述集中趋势的统计量有
(1)算术平均值(Mean),但易受极端值影响
(2)中位数(Median,Me)将样本数据进行升序或降序排列后,处在中间位置上的数称为中位数。比较稳定,不受极端值影响。
(3)众数(Mode,Mo)样本数据中出现次数最多的数。可能有多个众数,也可能没有。不受极端值影响。
(4)调整的平均数(Trimmed Mean)将样本数据进行排序后,按照一定比例去掉两端的极大、极小值,对剩下的数据求平均。在“Explore”菜单中5%的调整平均数指分别去掉前后2.5%的数据。较少受极端值得影响。
(5)几何平均数(Geometric Mean)主要用于计算平均发展(增长)速度。
(6)调和平均数(Harmonic Mean)分母包含倒数的平均数,主要用于计算平均价格等指标。
(7)四分位数,最低数与中位数之间的中位数是25分位数,原中位数与最高数之间的中位数是75分位数。
●描述离中趋势的统计量
(1)极差(Range)样本数据中最大值与最小值的差值。
(2)平均差(Average Difference)指各样本数据与均值间差异绝对值的均值,也称为平均绝对差。
(3)方差(Variance)
(4)标准差(Standard Deviation,Std Dev) 是方差的算术平方根。
(5)标准误(Standard Error of Mean ,S.E.Mean)是样本平均数的标准差。
●偏度和峰度
偏度(Skewness)是反映数据分布不对称性的一个数字特征。
偏度为0表示该变量的数据分布形态为对称分布;
偏度 > 0表示其分布形态为右偏分布,有一条长尾托在右边;
偏度 < 0表示其分布形态为左偏分布,有一条长尾托在左边;
偏度的绝对值越大,表示数据的分布形态的偏斜程度就越大
峰度(Kurtosis)是描述分布形状为陡峭还是平坦的数字特征。
峰度为0表示其数据分布与正态分布的陡缓程度相同;
峰度 <0表示比正态分布的高峰要平坦,为平顶峰;
峰度>0表示比正态分布的高峰要陡峭,为尖顶峰。
Spss的操作过程:
[Analyze]=>[Descriptive Statistics] =>[Frequencies...],弹出[Frequencies]主对话框。在对话框的变量列表中选择变量,单击按钮进入[Variable(s)]列表框,并选择[Display Frequency Tables]显示频数分布表。单击[Statistics...],弹出[Frequencies:Statistics]子对话框,选择均值(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.Deviation)、方差(Variance)、极差(Range)、最小值(Minimum)、最大值(Maximum)、偏度(Skewness)和峰度(Kurtosis),单击[Continue]返回[Frequencies] ,再单击[OK]按钮即可得到各种统计量的计算结果。
结果:
结果:
数据探察过程(Explore)
探察性数据分析是指对数据的初步考察,由描述统计指标和直观的图形组成。包括检查数据错误、描述整体或分组数据的数量特征和分布特征,假设检验,奇异值辨认等。
Analyze →Descriptive Statistics→ Explore出现对话框
结果:
二、Spss之均值比较
Means过程
定义:Means过程是SPSS计算各种基本描述统计量的过程。与计算某一样本总体均值相比,Means过程其实就是按照用户指定条件,对样本进行分组计算均数和标准差,如按性别计算各组的均数和标准差。
用户可以指定一个或多个变量作为分组变量。如果分组变量为多个,还应指定这些分组变量之间的层次关系。层次关系可以是同层次的或多层次的。同层次意味着将按照各分组变量的不同取值分别对个案进行分组;多层次表示将首先按第一分组变量分组,然后对各个分组下的个案按照第二组分组变量进行分组。
单一样本T检验
定义:SPSS单样本T检验是检验某个变量的总体均值和某指定值之间是否存在显著差异。统计的前提样本总体服从正态分布。也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。
计算公式如下。
单样本T检验的零假设为H0总体均值和指定检验值之间不存在显著差异。
采用T检验方法,按照下面公式计算T统计量: