多元统计分析之聚类分析PPT课件

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章 SPSS基本统计分析
基本内容:
●频数分析 ●计算基本描述统计量 ●多选项分析
1
第1节 频数分析
基本内容: 频数分配表
统计图
一、频数分析的目的和基本思路
基本统计分析往往从频数分析开始。通过频数 分析能够了解变量取值的状况、对数据的分布 特征是非常有用的。
(年龄特征、职业特点、性别特征等)
13
问题2:您择业中考虑的主要因素有(限选三项)
1经济收入 3发展前途 5个人爱好 7劳动强度 9社会地位
2 专业对口 4地理区位 6风险大小 8社会福利 10其他
14
显然,答案不只一个。
高考填报志愿、居民储蓄
多选项问题
回答方式: 第一类,选择的答案有一定的先后顺序。
第二类,选择的答案没有先后顺序。
两个任务:
编制频数分配表 绘制统计图
3
二、频数分配表
基本内容: ●频数(Frequency):变量值落在某个区间(或某个类别)中
的次数。
●百分比(Percent):各频数占总样本量的百分比。 ●有效百分比(Valid Percent):
各频数占总有效样本量的百分比。 这里:有效样本量=总样本-缺失样本量 如果所分析的数据在频数分析变量上有缺失值,那么有效百分比更 能准确的反映变量的取值分布情况。
析。反映两变量之间的大致关系,如果绘出的 点大致分布在一条直线周围,称两者之间存在 线性关系;如果绘出的点大致分布在一条曲线 周围,则称为存在非线性关系。
7
四 基本操作
(1)选择菜单【分析】-【描述统计】-【频 率】
8
(2)选择若干变量到【变量】框中。比如, 选择“从业状况”。
(3)点击【图表】选择绘制统计图形。在 【图表类型】框中选择条形图、直方图或者扇 形图。
9
五、频数分配表应用举例
例1利用住房状况问卷调查数据,分析被调查者家庭中户 主的从业状况和目前所住房屋的产权情况。
例2. 利用住房状况问卷调查数据,对人均住房面积进行频 数分析。
10
作业: 利用2013年中国各地区生产总值数据, 分别对所属地区和地区生产总值进行频 数分析。
11
第三节 多选项分析
方法选择的原则:
对于所选答案具有一定顺序的多选项问题,一般采用 分类法分解,对于所选答案没有顺序的问题,一般采 用二分法分解。
21
2、多选项问题作普通频数分析的困难
普通频数分析得到的结果:
表1 V1频数分析结果

表2 V2频数分析结果
22
表3 V3频数分析结果 想要获得的理想结果:
23
(4)是亲戚朋友推荐吗?
(5)是单位统一组织购买吗?
(6)是保险公司的宣传吗?
(7)是其他吗?
Baidu Nhomakorabea
18
19
多选项分类法
首先估计多选项问题最多可能出现的答案个数,然后, 为每个答案设置一个SPSS变量,变量取值为多选项问 题中的可选答案。
20
实际应用中需要考虑两个方面:
是否便于分析; 是否丢失信息。
二、多选项分析的基本操作
多选项分析:【多重响应】功能 两步: 第一步,定义多选项变量集:即将多选项问题
分解并设置多个变量后,应指定这些变量为一 个集合。
【分析】 【多重响应】 【定义变量集】
第二步,多选项频数分析
【分析】 【多重响应】 【频数】
24
25
26
三、应用举例:
案例1:为研究影响老年人购买养老保险 的因素,进行问卷调查。现要求根据所 获得的调查数据,分析老年人购买养老 保险的原因。
本节基本内容:
●多选项分析的目的和思路 ●多选项分析的应用举例
12
一、多选项分析的目的和思路
问题1:在对保险市场的一项调查中,设计了这样一道问题: 按照您自己的实际情况,依次选择您购买商业养老保险
的原因,最多不超过3项: (1)使晚年生活有保障; (2)一种安全的投资保值方式; (3)抱着试试看的态度购买; (4)亲戚朋友推荐; (5)单位统一组织购买; (6)保险公司的宣传; (7)其他。
一个多选项问题 关键环节
多个SPSS变量的分析
17
分解的方法有两种:二分法和分类法
多选项二分法
将多选项问题中的每个答案设为一个SPSS变量,每个 变量只有0或1两个取值,分别表示不选择或选择该答 案。
将多选项问题分解成七个问题:
(1)是使晚年生活有保障吗?
(2)是一种安全的投资保值方式吗?
(3)是抱着试试看的态度购买吗?
29
多选项交叉分组下的频数分析的基本操作:
1.【分析】——【多重响应】——【交叉表】; 2.选择列联表的行变量并定义取值范围,或选择
多选项变量集为行变量; 3.选择列联表的列变量并定义取值范围,或选择
多选项变量集为列变量; 4.选择列联表的控制变量并定义取值范围,或选
27
多选项频数分析结果:
28
案例2:为研究影响老年人购买养老保险的因 素,进行问卷调查。现要求根据所获得的调查 数据,分析不同工作单位性质人员购买养老保 险的原因。
分析:本例由于涉及工作单位性质和购买养老 保险原因两个方面,因此应采用多选项交叉分 组下的频数分析方法进行研究,即生成列联表。 其中设列联表的列变量为购买原因,行变量为 工作单位性质。
区别:
直方图适用于定量数据,而条形图适用于定性数据; 条形图中,条形的宽度相同,仅以条形高低反映频数的 差别;直方图中,矩形的高度和宽度有所不同。
5
6
饼图(扇形图):piechart 适用于研究事物内在结构组成 散点图:scatter plot 用于对两个定量变量之间的关系进行探索性分
●累计百分比(Cumulative Percent):
各百分比逐级累加起来的结果。最终取值为百分之百。
4
三、统计图
包括: 条形图(柱形图):bar
适用于定性数据,用宽度相同的条形高度来表示数据 的多少。
直方图:histograms
适用于分组定量数据的描述,用矩形的宽度和高度表 示频数分布。可以附加正态分布曲线。
注意:问题本身的特点,采取不同的策略。
15
一般步骤: 多选项问题分解 多选项频数分析
16
1、多选项问题的分解
为什么要对多选项问题进行分解呢? 不同于单选项问题的一般处理方法,必须设置多个 SPSS变量。
基本思路:
将问卷中的一道多选项问题分解成若干个问题,对应 设置若干个SPSS变量,分别存放描述这些问题的几个 可能被选择的答案。
相关文档
最新文档