spss教程-常用的数据描述统计:频数分布表等--统计学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节常用的数据描述统计
本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。
1.数据
这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。
图2-2:数据输入格式示例
1.Frequencies语句
(1)操作
打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。
图2-3: Frequencies定义窗口
把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求显示频数分布表)。如果您只要求得到一个频数分布表,那么就可以点OK按钮了。如果您想同时获得一
些统计量,及统计图表,还需要进一步设置。
①Statistics选项
单击Statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下:
(ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有:
●Quartiles四分位数,即显示25%、50%、75%的百分位数。
●把数据平均分为几份。如本例中要求平均分为3份。
●Percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有:
●Mean 算术平均数
●Median 中数
●Mode 众数
●Sum 算术和
(ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有:●Std. Deviation 标准差
●Variance 方差
●Range 全距
●Minimum 最小值
●Maximum 最大值
●S.E. mean 平均数的标准误
(ⅳ)描述数据分布(Distribution)的统计量
●Skewness 偏度,非对称分布指数。
●Kurtosis 峰度,CASE围绕中心点的扩展程度。
另外,频数过程(Frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(Values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。
图2-4:次数分布统计量定义窗口图2-5:次数分布图形定义窗口
在本例中,我们选择输出:四分位点的值,平均分为3等分的分位点的值和15%,50%,85%的分位点的值;对于集中趋势的度量,选择输出算术平均数、中数、众数和总和,对于离散程度的度量选择输出标准差和方差。
②Charts选项
为了获得统计图表,单击主对话框中的Charts铵钮,打开它的对话框,如图2-5所示。
用户可以在图形类型(Chart Type)选择框中定义输出的图形类型,频数(Frequence)过程可以提供的输出选项有:
●None 不显示图表
●Bar charts 条形图
●Pie charts 圆形图
●Histograms 直方图
另外,对于图形中纵坐标值的表示,可以有两种方式:
●Frequencies 纵座标为变量值的频数
●Percentages 纵座标为变量值的百分比
在本例中,由于学生成绩可以看成是连续性的数据,所以这里选择输出直方图,并拟合正态曲线。点击Continue返回主对话框。
③Format选项
单击Format…,打开Format对话框,如图2-6所示。在该对话框,可以选择数据输出显示的顺序(Order by),Frequencies提供的选项有:
●Ascending values 在输出频数分布表时按变量值升序排列
●Descending values 在输出频数分布表时按变量值降序排列
●Ascending counts 输出频数分布表时按变量值频数的升序排列
●Descending counts 输出频数表时按变量值频数的降序排列
图2-6:定义输出显示格式对话框
在Format 中我们一律使用默认选项。点击Continue 返回主对话框,在主对话框中点击OK,可以得到次数分布的输出结果。 (2)结果及解释
①学生成绩变量的Frequences 输出描述统计结果:
Statistics
SCORE 100079.68079.75080.07.02649.3717968.072.07575.00076.50079.75082.50084.00087.000
Valid Missing
N
Mean Median Mode
Std. Deviation Variance Sum
1525
33.3333333350
66.666666677585
Percentiles
输出说明:
● N 后面的Valid 和Missing 分别用来描述有效值样本容量和缺失值的样本个数,在本例所用数据中,
有100个有效数字,缺失值的个数为0。
● Mean 、Median 、Mode 和Sum 分别用来描述算术平均数、中数、众数和数据的总和,本例所用数据的
算术平均数为79.680,中数为79.75,众数为80,数据总和为7968.0。
● Std. Deviation 和Variance 分别用来描述数据的标准差和方差,这里数据的标准差为7.026,方差
为49.371。
● Percentiles 后给出不同的百分位数对应的值,如15后面的数字72.075表示,15%的分位点的值为
72.075,即小于72.075分的人数占总人数的15%。(表中有两个无穷循环小数,是我们自定义的三等分的百分位数)