第三章统计数据的整理及显示
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
26
二、顺序型数据的整理
1累积频数(cumulative frequencies): 各类别频数的逐级累加
2累积频率(cumulative percentages): 各类别频率(百分比)的逐级累加
方向: 向上累积:自类别顺序的开始一方向
最后一方累加 向下累积:自类别顺序的最后一方向
开始一方累加
4
二、数据的筛选
1)当数据中的错误不能予以纠正, 或者有些数据不符合调查的要求而又无 法弥补时,需要对数据进行筛选
2)根据某种需要进行筛选
5
数据筛选(data filter)
▪ 用Excel进行数据筛选
▪ 8名学生的考试成绩数据
6
数据筛选(data filter)
7
自动筛选
8
高级筛选
9
高级筛选
用Excel制作频数分布表
21
顾客性别 饮料类型 顾客性别
女
旭日升冰茶
女
男
露露
男
男
旭日升冰茶
男
女
可口可乐
女
男
百事可乐
男
男
可口可乐
女
女
汇源果汁
男
女
可口可乐
女
男
露露
女
男
可口可乐
女
女
可口可乐
男
女
旭日升冰茶
男
男
可口可乐
女
男
百事可乐
男
男
露露
女
女
旭日升冰茶
女
男
旭日升冰茶
女
饮料类型
旭日升冰茶 可口可乐 可口可乐 旭日升冰茶 露露 旭日升冰茶 可口可乐 露露 百事可乐 百事可乐 汇源果汁 露露 百事可乐 可口可乐 百事可乐 汇源果汁
之分,但习惯上用升序
▪ 汉字型数据,可按汉字的首位
拼音字母排列,也可按笔画排 序,其中也有笔画多少的升序 降序之分
12
数据排序(方法)
2.数值型数据的排序 ❖递增排序:设一组数据为 x1,x2,…,xn, 递增排序后可表示为: x(1)<x(2)<…<x(n) ❖递减排序:可表示为 x(1)>x(2)>…>x(n)
13
数据排序(方法)
在Excel中进行排序(以8名学生的考试成 绩为例)
14
数据排序(方法)
按统计学成绩排序后的学生成绩排名
15
四、建立数据透视表
➢ 从复杂的数据中提取有用的信息 ➢ 可以对数据表的重要信息按使用者的习惯或
分析要求进行汇总和作图,形成交叉表
➢ 数据源表中的首行必须有列标题
16
数据透视表
17
在Excel中建立数据透视表
18
形成的数据透视表
19
第二节 统计数据的整理 一、分类型数据的整理 二、顺序型数据的整理 三、数值型数据的整理
20
一、分类数据整理—频数分布表
【例1】一家市场调查公司为研究不同品牌饮 料的市场占有率,对随机抽取的一家超市进 行了调查。调查员在某天对50名顾客购买饮 料的品牌和顾客性别进行了记录。下页表格 就是记录的原始数据
第三章 统计数据的整理与显示
目录
第一节 数据的预处理 第二节 统计数据的整理 第三节 统计数据的显示
2
第一节 数据的预处理
一、数据的审核 二、数据的筛选 三、数据的排序 四、建立数据透视表
3
一、数据的审核
数据的审核即对调查资料进行审核 ➢ 审核资料的完整性和及时性 ➢ 审核资料的正确性 ➢ 历史资料的审核
30
分组方法
分组方法
单变量值分组
组距分组 等距分组 异距分组
31
单变量值分组 (要点) 单变量值分组
——将一个变量值作为一组 1.适合于离散变量 2.适合于变量值较少的情况
32
零件数 (个) 107 108 110 112 113 114 115 117 118
单变量值分组表
某车间50名工人日加工零件数分组表
10
三、数据的排序
1. 按一定顺序将数据排列,以发现一些明显
的特征或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新
归类或分组等提供依据
3. 在某些场合,排序本身就是分析的目的之
一
4. 排序可借助于计算机完成
11
数据排序(方法) 1. 分类数据的排序
▪ 字母型数据,排序有升序降序
1. 频 数:落在各类别中的数据个数 2. 比 例:某一类别数据占全部数据的比值 3. 百分比:将对比的基数作为100而计算的比值 4. 比 率:不同类别数值的比值
23
分类数据的整理与显示
2.频数分布表(通过数据透视表在Excel中得到)
24
利用SPSS的频数分析得到
25
通过SPSS 的交叉列联表获得
乙城市
回答类别
非常不满意
不满意 一般 满意 非常满意
合计
户数 (户)
21 99 78 64 38 300
百分比 (%)
7.0 33.0 26.0 21.3 12.7 100.0
向下累积
户数
百分比
(户)
(%)
300
100.0
279
93.0
180
60.0
102
34.0
38
12.7
—
—
29
三、数值型数据的整理 【例】某生产车间50名工人日加工零件数 如下(单位:个)。试对数据进行分组。
汇源果汁
顾客性别
女 女 男 女 女 女 女 男 女 女 男 男 男 女 女 女
饮料类型
露露 可口可乐 旭日升冰茶 百事可乐 露露 汇源果汁 可口可乐 百事可乐 露露 旭日升冰茶 可口可乐 旭日升冰茶 可口可乐 汇源果汁 百事可乐 可口可乐
22
分类数据的整理
1.基本过程
▪ 列出各类别 ▪ 计算各类别的频数 ▪ 制作频数分布表
27
顺序数据的频数分布表 (例题分析)
【例2】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意?
1.非常不满意; 2.不满意;3. 一般;4.满意; 5.非常满意。
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 (户)
百分 比
(%)
向上累积 户数 百分比 (户) (%)
非常不满意 24 8
24
8.0
不满意
108 36
一般
93 31
满意
45 15
非常满意 30 10
132
44.0
225
75.0
来自百度文库
270
90.0
300
100.0
合计
300 100.0 —
—
28
顺序数据的频数分布表 (例题分析)
乙城市家庭对住房状况评价的频数分布
频数 (人)
零件数 (个)
频数 (人)
零件数 (个)
频数 (人)
1
119
1
128
2
2
120
2
129
1
1
121
1
130
1
2
122
4
131
1
1
123
4
133
2
1
124
3
134
2
1
125
2
135
1
3
126
2
137
1
3
127
3
139
2
33
组距分组 (要点) 组距分组
——将变量值的一个区间作为一组
1. 适合于连续变量 2. 适合于变量值较多的离散型变量情况 3. 需要遵循“不重不漏”的原则 4. 可采用等距分组,也可采用不等距分组
二、顺序型数据的整理
1累积频数(cumulative frequencies): 各类别频数的逐级累加
2累积频率(cumulative percentages): 各类别频率(百分比)的逐级累加
方向: 向上累积:自类别顺序的开始一方向
最后一方累加 向下累积:自类别顺序的最后一方向
开始一方累加
4
二、数据的筛选
1)当数据中的错误不能予以纠正, 或者有些数据不符合调查的要求而又无 法弥补时,需要对数据进行筛选
2)根据某种需要进行筛选
5
数据筛选(data filter)
▪ 用Excel进行数据筛选
▪ 8名学生的考试成绩数据
6
数据筛选(data filter)
7
自动筛选
8
高级筛选
9
高级筛选
用Excel制作频数分布表
21
顾客性别 饮料类型 顾客性别
女
旭日升冰茶
女
男
露露
男
男
旭日升冰茶
男
女
可口可乐
女
男
百事可乐
男
男
可口可乐
女
女
汇源果汁
男
女
可口可乐
女
男
露露
女
男
可口可乐
女
女
可口可乐
男
女
旭日升冰茶
男
男
可口可乐
女
男
百事可乐
男
男
露露
女
女
旭日升冰茶
女
男
旭日升冰茶
女
饮料类型
旭日升冰茶 可口可乐 可口可乐 旭日升冰茶 露露 旭日升冰茶 可口可乐 露露 百事可乐 百事可乐 汇源果汁 露露 百事可乐 可口可乐 百事可乐 汇源果汁
之分,但习惯上用升序
▪ 汉字型数据,可按汉字的首位
拼音字母排列,也可按笔画排 序,其中也有笔画多少的升序 降序之分
12
数据排序(方法)
2.数值型数据的排序 ❖递增排序:设一组数据为 x1,x2,…,xn, 递增排序后可表示为: x(1)<x(2)<…<x(n) ❖递减排序:可表示为 x(1)>x(2)>…>x(n)
13
数据排序(方法)
在Excel中进行排序(以8名学生的考试成 绩为例)
14
数据排序(方法)
按统计学成绩排序后的学生成绩排名
15
四、建立数据透视表
➢ 从复杂的数据中提取有用的信息 ➢ 可以对数据表的重要信息按使用者的习惯或
分析要求进行汇总和作图,形成交叉表
➢ 数据源表中的首行必须有列标题
16
数据透视表
17
在Excel中建立数据透视表
18
形成的数据透视表
19
第二节 统计数据的整理 一、分类型数据的整理 二、顺序型数据的整理 三、数值型数据的整理
20
一、分类数据整理—频数分布表
【例1】一家市场调查公司为研究不同品牌饮 料的市场占有率,对随机抽取的一家超市进 行了调查。调查员在某天对50名顾客购买饮 料的品牌和顾客性别进行了记录。下页表格 就是记录的原始数据
第三章 统计数据的整理与显示
目录
第一节 数据的预处理 第二节 统计数据的整理 第三节 统计数据的显示
2
第一节 数据的预处理
一、数据的审核 二、数据的筛选 三、数据的排序 四、建立数据透视表
3
一、数据的审核
数据的审核即对调查资料进行审核 ➢ 审核资料的完整性和及时性 ➢ 审核资料的正确性 ➢ 历史资料的审核
30
分组方法
分组方法
单变量值分组
组距分组 等距分组 异距分组
31
单变量值分组 (要点) 单变量值分组
——将一个变量值作为一组 1.适合于离散变量 2.适合于变量值较少的情况
32
零件数 (个) 107 108 110 112 113 114 115 117 118
单变量值分组表
某车间50名工人日加工零件数分组表
10
三、数据的排序
1. 按一定顺序将数据排列,以发现一些明显
的特征或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新
归类或分组等提供依据
3. 在某些场合,排序本身就是分析的目的之
一
4. 排序可借助于计算机完成
11
数据排序(方法) 1. 分类数据的排序
▪ 字母型数据,排序有升序降序
1. 频 数:落在各类别中的数据个数 2. 比 例:某一类别数据占全部数据的比值 3. 百分比:将对比的基数作为100而计算的比值 4. 比 率:不同类别数值的比值
23
分类数据的整理与显示
2.频数分布表(通过数据透视表在Excel中得到)
24
利用SPSS的频数分析得到
25
通过SPSS 的交叉列联表获得
乙城市
回答类别
非常不满意
不满意 一般 满意 非常满意
合计
户数 (户)
21 99 78 64 38 300
百分比 (%)
7.0 33.0 26.0 21.3 12.7 100.0
向下累积
户数
百分比
(户)
(%)
300
100.0
279
93.0
180
60.0
102
34.0
38
12.7
—
—
29
三、数值型数据的整理 【例】某生产车间50名工人日加工零件数 如下(单位:个)。试对数据进行分组。
汇源果汁
顾客性别
女 女 男 女 女 女 女 男 女 女 男 男 男 女 女 女
饮料类型
露露 可口可乐 旭日升冰茶 百事可乐 露露 汇源果汁 可口可乐 百事可乐 露露 旭日升冰茶 可口可乐 旭日升冰茶 可口可乐 汇源果汁 百事可乐 可口可乐
22
分类数据的整理
1.基本过程
▪ 列出各类别 ▪ 计算各类别的频数 ▪ 制作频数分布表
27
顺序数据的频数分布表 (例题分析)
【例2】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意?
1.非常不满意; 2.不满意;3. 一般;4.满意; 5.非常满意。
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 (户)
百分 比
(%)
向上累积 户数 百分比 (户) (%)
非常不满意 24 8
24
8.0
不满意
108 36
一般
93 31
满意
45 15
非常满意 30 10
132
44.0
225
75.0
来自百度文库
270
90.0
300
100.0
合计
300 100.0 —
—
28
顺序数据的频数分布表 (例题分析)
乙城市家庭对住房状况评价的频数分布
频数 (人)
零件数 (个)
频数 (人)
零件数 (个)
频数 (人)
1
119
1
128
2
2
120
2
129
1
1
121
1
130
1
2
122
4
131
1
1
123
4
133
2
1
124
3
134
2
1
125
2
135
1
3
126
2
137
1
3
127
3
139
2
33
组距分组 (要点) 组距分组
——将变量值的一个区间作为一组
1. 适合于连续变量 2. 适合于变量值较多的离散型变量情况 3. 需要遵循“不重不漏”的原则 4. 可采用等距分组,也可采用不等距分组