统计学 数据的整理及图表展示PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)统计学成绩等于80分的学生 (2)数学成绩最高的前三名学生,英语成绩
最低的三名学生 (3)统计学成绩在80-90之间的学生 (4)四门课程成绩都大于70分的学生
.
3
数据排序
1. 分类数据的排序
▪ 字母型数据,排序有升序降序之分,但习
惯上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排
列,也可按笔画排序,其中也有笔画多少 的升序降序之分
.
7
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与图示
1. 列出各类别 2. 计算各类别的频数 3. 制作频数分布表 4. 用图形展示
.
8
分类数据中需要计算的指标
1.频 数:落在各类别中的数据个数 频数分布:把各个类别及落在其中的相应频 数全部列出,并用表格形式表现出来。
2.比 例:某一类别数据占全部数据的比值 3.百分比:将对比的基数作为100而计算的比值
.
19
三维饼图
8%
5%
9%
9% 22%
商品广告
47%
服务广告
金融广告
房地产广告
招生招聘广告
其他广告
.
20
环形图
1. 环形图中间有一个“空洞”,总体中的 每一部分数据用环中的一段表示
2. 环形图与饼图类似,但又有区别
– 饼图只能显示一个总体各部分所占的比例 – 环形图则可以同时绘制多个总体的数据系
.
10
方法一:数据透视表方法
• 利用数据透视表功能,进行频数分析。 在数据透视表【布局】对话框中,依次
将“饮料类型”拖到“行”区域以及“数据 ”区域,将“顾客性别”拖到“列”区域。
.
11
方法二:EXCEL中的函数功能
插入 —— 函数 —— COUNTIF
数一数 COUNT IF要计算某一类别的频数
一般
93 31 225 75.0 168 56
满意
45 15 270 90.0 75
25
非常满意 30
10
300 100.0 30
10
合计
300 100.0 —
—
——
.
25
回答类别
乙城市家庭对住房状况评价的频数分布
乙城市
户数 百分比 (户) (%)
向上累积
户数 百分比 (户) (%)
向下累积
户数 百分比 (户) (%)
2. 数值型数据的排序
.
4
分类汇总
根据不同的研究目的,按照某个类别进 行汇总分析。
分类汇总之前要先按分类项排序。
简单分类汇总 多级分类汇总
.
5
数据透视表ቤተ መጻሕፍቲ ባይዱ
利用数据透视表可以按照研究目的不同, 进行交叉汇总分析,使研究者可以从各种 角度、维度去查看分析数据,从繁杂的数 据中挖掘和整合数据。
.
6
[例3.2] 在某大学随机抽取30名学生,调查 他们的性别、家庭所在地、平均月生活费 支出、平均每月购买衣物支出和购买衣物 时所考虑的首选因素等,得到的数据如表32,试建立一个数据透视表,在表的行变量 中给出性别和买衣物的首选因素,在列变 量中给出学生的家庭所在地区,对平均月 生活费和月平均衣物支出进行交叉汇总。
第3章 数据的整理与 图表展示
3.1 数据的预处理 3.2 品质数据的整理与展示 3.3 数值型数据的整理与展示
.
1
3.1 数据的预处理
1. 数据审核
■ 发现数据中的错误
2. 数据筛选
■ 找出符合条件的数据
3. 数据排序
▪ 发现数据的基本特征 ▪ 升序和降序
.
2
数据筛选
例3.1 表3-1是8名学生4门课程的考试成绩 数据(单位:分)。试找出
向上累积:从类别顺序的开始一方,向类别 顺序的最后一方累加频数;
向下累积:从类别顺序的最后一方,向类别 顺序的开始一方累加频数。
2. 累积频率:将各类别的百分比逐级累加
.
23
【例3.5】在一项城市住房问题的研 究中,研究人员在甲乙两个城市 各抽样调查300户,其中的一个问 题是:“您对您家庭目前的住房 状况是否满意?
列,每一个总体的数据系列为一个环
3. 环形图可用于进行比较研究 4. 环形图可用于展示分类数据和顺序数据
.
21
13%
7%
10% 8%
15% 21%
33% 36%
31% 26%
非常不满意 不满意 一般 满意 非常满意
图3-4 甲乙两城市家庭对住房状况的评价
.
22
3.2.2 顺序数据的整理与图示
1. 累积频数:将各有序类别的频数逐级累加 起来得到的频数。
.
12
分类数据的图示 条形图
条形图是用宽度相同的条形的高度 或长短来表示数据多少的图形
★ 各类别可以放在纵轴,称为条形图,也可 以放在横轴,称为柱形图
★ 对比条形图(复式条形图): 显示分类 变量在不同时间或不同空间上的差异或 变化
.
13
其他广告 招生招聘广告
房地产广告 金融广告 服务广告 商品广告
1.非常不满意;
2.不满意;
3.一般;
4.满意;
5.非常满意。
.
24
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 百分比 (户) (%)
向上累积 户数 百分比 (户) (%)
向下累积 户数 百分比 (户) (%)
非常不满意 24
8
24 8.0 300 100.0
不满意
108 36 132 44.0 276 92
4.比 率:不同类别数值之间的比值
.
9
【例3.3】一家市场调查公司为研究不同品牌
饮料的市场占有率,对随机抽取的一家超市 进行调查。调查员随机观察了50名顾客购
买饮料类型及购买者性别,并进行了记录, 如果一个顾客购买某一品牌的饮料,就将这 一饮料的品牌名字记录一次。数据见Excel
表。要求:对饮料类型和顾客性别的分布状 况进行描述分析,求不同品牌饮料的频数分 布、比例和百分比。
2. 主要用于 展示分类 数据的分 布
频数
16
15
12
11
9
9
8
6
4
0 可口可乐 旭日升冰茶 百事可乐
露露
不同品牌饮料的帕累托图
汇源果汁
品牌
.
18
饼图
1. 饼图:用圆形及圆内扇形的面积来表示 数值大小的图形。
2. 主要用于表示总体中各组成部分所占的 比例,对于研究结构性问题十分有用
3. 在绘制圆形图时,总体中各部分所占的 百分比用圆内的各个扇形面积表示,这 些扇形的中心角度,是按各部分百分比 占3600的相应比例确定的
0
5 8 9 9
10
条形图
22
20
30
.
频数
47
40
50
14
柱形图
50 47
40
30 20 10
22
频数
9
9
8
5
0
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
.
15
复式条形图
.
16
对比条形图
.
17
分类数据的图示—帕累托图
1. 按各类别 数据出现 的频数多 少排序后 绘制的柱 形图
最低的三名学生 (3)统计学成绩在80-90之间的学生 (4)四门课程成绩都大于70分的学生
.
3
数据排序
1. 分类数据的排序
▪ 字母型数据,排序有升序降序之分,但习
惯上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排
列,也可按笔画排序,其中也有笔画多少 的升序降序之分
.
7
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与图示
1. 列出各类别 2. 计算各类别的频数 3. 制作频数分布表 4. 用图形展示
.
8
分类数据中需要计算的指标
1.频 数:落在各类别中的数据个数 频数分布:把各个类别及落在其中的相应频 数全部列出,并用表格形式表现出来。
2.比 例:某一类别数据占全部数据的比值 3.百分比:将对比的基数作为100而计算的比值
.
19
三维饼图
8%
5%
9%
9% 22%
商品广告
47%
服务广告
金融广告
房地产广告
招生招聘广告
其他广告
.
20
环形图
1. 环形图中间有一个“空洞”,总体中的 每一部分数据用环中的一段表示
2. 环形图与饼图类似,但又有区别
– 饼图只能显示一个总体各部分所占的比例 – 环形图则可以同时绘制多个总体的数据系
.
10
方法一:数据透视表方法
• 利用数据透视表功能,进行频数分析。 在数据透视表【布局】对话框中,依次
将“饮料类型”拖到“行”区域以及“数据 ”区域,将“顾客性别”拖到“列”区域。
.
11
方法二:EXCEL中的函数功能
插入 —— 函数 —— COUNTIF
数一数 COUNT IF要计算某一类别的频数
一般
93 31 225 75.0 168 56
满意
45 15 270 90.0 75
25
非常满意 30
10
300 100.0 30
10
合计
300 100.0 —
—
——
.
25
回答类别
乙城市家庭对住房状况评价的频数分布
乙城市
户数 百分比 (户) (%)
向上累积
户数 百分比 (户) (%)
向下累积
户数 百分比 (户) (%)
2. 数值型数据的排序
.
4
分类汇总
根据不同的研究目的,按照某个类别进 行汇总分析。
分类汇总之前要先按分类项排序。
简单分类汇总 多级分类汇总
.
5
数据透视表ቤተ መጻሕፍቲ ባይዱ
利用数据透视表可以按照研究目的不同, 进行交叉汇总分析,使研究者可以从各种 角度、维度去查看分析数据,从繁杂的数 据中挖掘和整合数据。
.
6
[例3.2] 在某大学随机抽取30名学生,调查 他们的性别、家庭所在地、平均月生活费 支出、平均每月购买衣物支出和购买衣物 时所考虑的首选因素等,得到的数据如表32,试建立一个数据透视表,在表的行变量 中给出性别和买衣物的首选因素,在列变 量中给出学生的家庭所在地区,对平均月 生活费和月平均衣物支出进行交叉汇总。
第3章 数据的整理与 图表展示
3.1 数据的预处理 3.2 品质数据的整理与展示 3.3 数值型数据的整理与展示
.
1
3.1 数据的预处理
1. 数据审核
■ 发现数据中的错误
2. 数据筛选
■ 找出符合条件的数据
3. 数据排序
▪ 发现数据的基本特征 ▪ 升序和降序
.
2
数据筛选
例3.1 表3-1是8名学生4门课程的考试成绩 数据(单位:分)。试找出
向上累积:从类别顺序的开始一方,向类别 顺序的最后一方累加频数;
向下累积:从类别顺序的最后一方,向类别 顺序的开始一方累加频数。
2. 累积频率:将各类别的百分比逐级累加
.
23
【例3.5】在一项城市住房问题的研 究中,研究人员在甲乙两个城市 各抽样调查300户,其中的一个问 题是:“您对您家庭目前的住房 状况是否满意?
列,每一个总体的数据系列为一个环
3. 环形图可用于进行比较研究 4. 环形图可用于展示分类数据和顺序数据
.
21
13%
7%
10% 8%
15% 21%
33% 36%
31% 26%
非常不满意 不满意 一般 满意 非常满意
图3-4 甲乙两城市家庭对住房状况的评价
.
22
3.2.2 顺序数据的整理与图示
1. 累积频数:将各有序类别的频数逐级累加 起来得到的频数。
.
12
分类数据的图示 条形图
条形图是用宽度相同的条形的高度 或长短来表示数据多少的图形
★ 各类别可以放在纵轴,称为条形图,也可 以放在横轴,称为柱形图
★ 对比条形图(复式条形图): 显示分类 变量在不同时间或不同空间上的差异或 变化
.
13
其他广告 招生招聘广告
房地产广告 金融广告 服务广告 商品广告
1.非常不满意;
2.不满意;
3.一般;
4.满意;
5.非常满意。
.
24
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 百分比 (户) (%)
向上累积 户数 百分比 (户) (%)
向下累积 户数 百分比 (户) (%)
非常不满意 24
8
24 8.0 300 100.0
不满意
108 36 132 44.0 276 92
4.比 率:不同类别数值之间的比值
.
9
【例3.3】一家市场调查公司为研究不同品牌
饮料的市场占有率,对随机抽取的一家超市 进行调查。调查员随机观察了50名顾客购
买饮料类型及购买者性别,并进行了记录, 如果一个顾客购买某一品牌的饮料,就将这 一饮料的品牌名字记录一次。数据见Excel
表。要求:对饮料类型和顾客性别的分布状 况进行描述分析,求不同品牌饮料的频数分 布、比例和百分比。
2. 主要用于 展示分类 数据的分 布
频数
16
15
12
11
9
9
8
6
4
0 可口可乐 旭日升冰茶 百事可乐
露露
不同品牌饮料的帕累托图
汇源果汁
品牌
.
18
饼图
1. 饼图:用圆形及圆内扇形的面积来表示 数值大小的图形。
2. 主要用于表示总体中各组成部分所占的 比例,对于研究结构性问题十分有用
3. 在绘制圆形图时,总体中各部分所占的 百分比用圆内的各个扇形面积表示,这 些扇形的中心角度,是按各部分百分比 占3600的相应比例确定的
0
5 8 9 9
10
条形图
22
20
30
.
频数
47
40
50
14
柱形图
50 47
40
30 20 10
22
频数
9
9
8
5
0
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
.
15
复式条形图
.
16
对比条形图
.
17
分类数据的图示—帕累托图
1. 按各类别 数据出现 的频数多 少排序后 绘制的柱 形图