描述性统计分析方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主要内容 (1)整理。主要是做统计分组及频数统计。 (2)计算分布特征指标。如平均数、众数、
中位数、标准差,等。
(3)做图表。如条形图、饼图、直方图等。
第二节 统计整理
一、统计整理的内容
主要是对原始数据进行统计分组并做频 数统计。
二、统计分组的类型
根据原始数据的类型,统计分组有: (1)单项式分组。一般适用于数值型和字符
串型数据。 (2)组距式分组。一般适用于数值型。
三、spss相关操作
序号 性别
1
男
将8个同学的考试 2
男
成绩建立为SPSS 3
女
文件,并对学生 4
男
的性别及考试成 5
女
绩进行频数统计。 6
女
7
男
8
男
考试成绩 78 68 45 72 93 56 85 84
步骤1:建立数据文件
定义变量视图。(重点在于数据类型、值 标签)
应答人数百分比(percent of cases) 即,选择该项的人占总人数的比重。应答
人数百分比加总不等于100%。 应答次数百分比(percent of responses)
即,在做出的所有选择中,选择该项的次 数占总次数的比例。应答次数百分比加总等 于100%。
(三)SPSS相关操作
定义多选题变量集 (分析——多重响应——定义变量集) 频数表 (分析——多重响应——频率) 注意:缺失值的处理问题。 交叉分析
第三节 统计指标计算
一、指标类型 集中趋势指标
反映分布的平均水平。如平均数、众数、 中位数等。 离中趋势指标
反映分布的离散程度。如标准差、极值、 等。
百分位数指标 四分位数、各个百分位数等。
数据视图中输入数据。
步骤2:对性别进行统计分组 (单项式分组)
分析——描述统计——频率 注意输出结果的解释。
(此频率非彼频率)
步骤3:对考试成绩进行统计分组 (组距式分组)
对考试成绩进行可视离散化(即将原始数 据转化为统计组别的离散数据,如1、2、3、 4、5)
对分组后的离散数据进行频数分析。
步骤4:作出性别与考试成绩的交叉表
分析——描述统计——交叉表
三、多选题的统计整理问题
多选题又称多重应答,是在社会调查中常 见的一种数据记录类型。它本质上属于分类 数据,但由于其数据格式较为特殊,所以 SPSS中专门的模块来分析。
(一)多选题的记录格式
例1:确诊高血压后,您按医生的建议采取了
描述性统计分析方法
第一节 基本问题
意义 一般的数据资料都来源于样本的调查。只
有通过对样本的研究,才能做好对实际问题 的可能的推断。因此,描述性分析是统计数 据分析的第一步。
定义 通过对现象进行调查研究,将大量数据加
以整理,简化,制成图标,并就这些数据的 分布特征进行计算,如集中趋势、离中趋势 等。
一般的图形:箱式图、茎叶图 考察数据是否为正态分布 (1)正态QQ概率图、去势QQ正态概率图。 (2)正态性检验 分组情况下对不同组别方差齐性进行检验
第四节 统计图制作
略
Baidu Nhomakorabea
分布指标 偏度系数、峰度系数。
其它 M统计量、极端值等。
二、数据类型及SPSS一般实现操作
基于未分组的原始数据资料 基于某种标志的分组数据资料
三、EXPLORE模块
Explore过程(探索性分析)主要用于对 资料的性质、分布特点等完全不清楚的情况 下。在常用描述性统计指标的基础上,又增 加了有关数据详细分布特征的文字及图形 等。
每个变量代表对一个选项的选择结果,是 或不是,均为二分类变量。
SPSS中演示数据建立情况
2.多重分类法记录格式
同样,每个多选题根据5个选项设计5个变 量。每个变量均为多分类变量。 注意:多重分类法记录格式中常见数据缺 失的现象。 SPSS中演示数据建立过程
(二)多选题常用分析指标
哪些非药物方法控制高血压?
A.调理饮食
B.做适宜运动
C.保持情绪稳定 D.其它措施
例2:请在下面列出的20个品牌中选择您认为 最信得过几个(最多列五个),并将代码按 照顺序排列。 候选品牌列表:1.长虹 2.海尔 3……….
1.多重二分法记录格式
一个多选题要根据它的选项设定对应的变 量。如例1有四个选项,对应这个多选题就 应该有4个变量。