统计学思想方法与应用第章分类数据的描述分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10 02:51
3.2 频数分布表(定性数据)
定义:选择一个 变量对 总体分组,并计算落在 各组中的频数所形成的 分布。
1. 列出各类别
3. 计算各类别的频数 3. 生成频数分布表
不重不漏
02:51
搜索引擎 访问量 访问比例
Google Direct Yahoo MSN
50629 22173 7272 3166
用于研究 结构 问题
02:51
简单饼图
10% 1% 3% 8%
24%
复合饼图(示例)
Google
Direct
Yahoo
54%
MSN
SnapLink
其他
20
环形图
1. 环形图中间有一个“空洞”,样本或总 体中的每一部分数据用环中的一段表示
2. 与饼图类似,但又有 区别
? 饼图只能显示一个总体各部分所占的比 例
? 环形图则可以同时绘制 多个样本或总体
的数据系列,每一个样本或总体的数据 系列为一个环
02:51 各县某种产品的生产情况。如右图所示:
15
条形图
1. 2.
02:51
用宽度相同的条形 的高度或长短来表 示各类别数据
有些赞成 有些不赞成
完全赞成 完全不赞成 既不反对也不赞成
不知道
0
50
各 类 别 可 放 在 纵 轴 , 60.00%
称为条形图,可以
50.00%
放在横轴,称为柱 形 图 ( column
量 40.00% 问 访 30.00%
20.00%
chart )
10.00%
0.00%
Google
Direct
100
150
200
250
Yahoo
ห้องสมุดไป่ตู้MSN
搜索引擎
SnapLink
其他
16
帕累托图--关键的少数和次要的多数
1. 按各类别数 据出现的频
数多少 排序 后绘制的柱 形图
关键的少数
2. 用于展示 分 类数据 的分 布
统计图是用几何图形或具体事物的形象来表现 统计数据的一种形式。
统计图既可以节省大量文字叙述,又可便于数 据的对比分析与积累。利用统计图表现统计数据, 能更为鲜明醒目、一目了然、形象具体地显示现象 之间的相互关系。
按照图形的形式,统计图大体上可以分为 几何图、 象形图和统计地图三种。
02:51
14
3.3 统计图
? (1)几何图。几何图是利用几何的形和线来表明统计数据的 图形,包括条形图、饼图等。
? (2)象形图。象形图是以表示现象本身形象的长度、大小、 多少来表示数值大小的一种图形。
? (3)统计地图。统计地图是用不同的颜色或纹理表示变量或
某种指标在地域上的分布特征及规律, 用以显示不同地域事
物数量的分布情况。例如可以利用颜色的深浅来表示某地区
3 02:51
用哪些图形展示奖牌?
在2012年伦敦奥运会上,中国队以 38金27银22铜位列奥运金牌榜和奖牌 榜第二位,这也是中国境外参赛以来 取得的 最好成绩,美国队以 46金29银 29铜104奖牌高居榜首。 东道主英国 位居第三
4 02:51
用哪些图形展示奖牌?
排名 国家及地区
1
美国
2
中国
3. 百分比(percentage ) :将对比的基数作为 100而计算的比值
12 02:51
用Excel生成频数分布表
态度
频数
不知道
9
既不反对也不赞成
173
完全不赞成 完全赞成 有些不赞成
50 使用(数实2据3例5透)视表
82
有些赞成
223
总计
772
13 02:51
3.3 统计图
如果想获得更生动的展示,我们可以使用 统计图。
54.34% 23.80% 7.80% 3.40%
SnapLink 946 1.02%
其他 总计
分组
8987 93173
频数
9.65% 100%
11
频数分布表
1. 频数(frequency ) :落在各类别中的 数据 个数
2. 比例(proportion ) :某一类别数据个数占 全部数据个数的比值
? 准确性审核:内容是否符合实际;计算是否正确。
? 如:文化程度:小学
职业:大学教师
? 对第二手资料 (获取他人的资料):审核其 完整 性、准确性、适用性、时效性
7 02:51
b、筛选: 剔除不符合要求的数据或有明显错误的数据; 将符合特定条件的数据筛选出来。
8 02:51
(2)数据的排序
?数据排序 是按一定顺序将数据排列 。 排序目的:
一张好图胜过千言万语
02:51
1
第 3 章 分类数据的描述分析
3.1 数据的预处理 3.2 频数表 3.3 统计图 3.4 列联表
02:51
2
学习目标
?用频数表描述数据的分布; ?用条形图、饼图、百分条图等图形来展
示数据; ?用列联表分析两个分类指标之间的关系; ?相关理论在统计软件中的应用; ?相应统计分析结果的解读。
?为数据画一个图 ?制作一个表 ?计算一些我们感兴趣的东西
6 02:51
3.1数据的预处理
? 主要包括:数据的 审核、筛选、排队
?(1)数据的审核与筛选
? a、审核:
? 对 第一手资料 (直接调查或试验取得):审核其 完整性 与 准确性
? 完整性审核:应调查的单位或个体是否有遗漏; 所调查的项目是否填齐全。
次要的多数
图3.8 不同类型搜索引擎的频数分布表绘制的帕累托图
该帕累托图表明:对网站的访问主要途径依靠 Google 和Direct ,KEEN公司需要在这两个途径上进行加强和改进。19
02:51
用圆形及 圆内扇形的 角度来表示 数值大小的 图形,主要 用于表示一 个样本(或 总体)中 各 组成部分的 数据占全部 数据的比例
a、通过浏览数据发现一些明显的特征 趋势或 解决问题的线索;
b、有助于数据的检查 纠错; c、为分组提供依据。
排序 方式 : 数字型数据 /字母型数据 ?? 升序或降序 汉字型数据 ?? 多种
9 02:51
3.2 频数分布表
预处理数据
分组
计算频数
描述统计
? 统计分组是将预处理过的数据按照 某种特征或标 准分成不同的组别。 ? 统计分组变量 :分组时所依据的特征或标准,有 定性变量 和定量变量。 ? 频数分布表 :对分组后的数据,计算各组中数据 出现的次数或频数所形成的汇总表。
3
英国
男子 金银铜 17 15 13 17 8 11 17 9 13
女子
混合
金银铜金银铜
29 14 15 0 0 1
20 18 12 1 1 0
965321
根据上面的数据,你认为可以选择哪些 图 形来展示三个国家所获得的奖牌情况?学完本 章的图表展示技术,这样的问题就会迎刃而解
5 02:51
数据分析包括三种形式
3.2 频数分布表(定性数据)
定义:选择一个 变量对 总体分组,并计算落在 各组中的频数所形成的 分布。
1. 列出各类别
3. 计算各类别的频数 3. 生成频数分布表
不重不漏
02:51
搜索引擎 访问量 访问比例
Google Direct Yahoo MSN
50629 22173 7272 3166
用于研究 结构 问题
02:51
简单饼图
10% 1% 3% 8%
24%
复合饼图(示例)
Direct
Yahoo
54%
MSN
SnapLink
其他
20
环形图
1. 环形图中间有一个“空洞”,样本或总 体中的每一部分数据用环中的一段表示
2. 与饼图类似,但又有 区别
? 饼图只能显示一个总体各部分所占的比 例
? 环形图则可以同时绘制 多个样本或总体
的数据系列,每一个样本或总体的数据 系列为一个环
02:51 各县某种产品的生产情况。如右图所示:
15
条形图
1. 2.
02:51
用宽度相同的条形 的高度或长短来表 示各类别数据
有些赞成 有些不赞成
完全赞成 完全不赞成 既不反对也不赞成
不知道
0
50
各 类 别 可 放 在 纵 轴 , 60.00%
称为条形图,可以
50.00%
放在横轴,称为柱 形 图 ( column
量 40.00% 问 访 30.00%
20.00%
chart )
10.00%
0.00%
Direct
100
150
200
250
Yahoo
ห้องสมุดไป่ตู้MSN
搜索引擎
SnapLink
其他
16
帕累托图--关键的少数和次要的多数
1. 按各类别数 据出现的频
数多少 排序 后绘制的柱 形图
关键的少数
2. 用于展示 分 类数据 的分 布
统计图是用几何图形或具体事物的形象来表现 统计数据的一种形式。
统计图既可以节省大量文字叙述,又可便于数 据的对比分析与积累。利用统计图表现统计数据, 能更为鲜明醒目、一目了然、形象具体地显示现象 之间的相互关系。
按照图形的形式,统计图大体上可以分为 几何图、 象形图和统计地图三种。
02:51
14
3.3 统计图
? (1)几何图。几何图是利用几何的形和线来表明统计数据的 图形,包括条形图、饼图等。
? (2)象形图。象形图是以表示现象本身形象的长度、大小、 多少来表示数值大小的一种图形。
? (3)统计地图。统计地图是用不同的颜色或纹理表示变量或
某种指标在地域上的分布特征及规律, 用以显示不同地域事
物数量的分布情况。例如可以利用颜色的深浅来表示某地区
3 02:51
用哪些图形展示奖牌?
在2012年伦敦奥运会上,中国队以 38金27银22铜位列奥运金牌榜和奖牌 榜第二位,这也是中国境外参赛以来 取得的 最好成绩,美国队以 46金29银 29铜104奖牌高居榜首。 东道主英国 位居第三
4 02:51
用哪些图形展示奖牌?
排名 国家及地区
1
美国
2
中国
3. 百分比(percentage ) :将对比的基数作为 100而计算的比值
12 02:51
用Excel生成频数分布表
态度
频数
不知道
9
既不反对也不赞成
173
完全不赞成 完全赞成 有些不赞成
50 使用(数实2据3例5透)视表
82
有些赞成
223
总计
772
13 02:51
3.3 统计图
如果想获得更生动的展示,我们可以使用 统计图。
54.34% 23.80% 7.80% 3.40%
SnapLink 946 1.02%
其他 总计
分组
8987 93173
频数
9.65% 100%
11
频数分布表
1. 频数(frequency ) :落在各类别中的 数据 个数
2. 比例(proportion ) :某一类别数据个数占 全部数据个数的比值
? 准确性审核:内容是否符合实际;计算是否正确。
? 如:文化程度:小学
职业:大学教师
? 对第二手资料 (获取他人的资料):审核其 完整 性、准确性、适用性、时效性
7 02:51
b、筛选: 剔除不符合要求的数据或有明显错误的数据; 将符合特定条件的数据筛选出来。
8 02:51
(2)数据的排序
?数据排序 是按一定顺序将数据排列 。 排序目的:
一张好图胜过千言万语
02:51
1
第 3 章 分类数据的描述分析
3.1 数据的预处理 3.2 频数表 3.3 统计图 3.4 列联表
02:51
2
学习目标
?用频数表描述数据的分布; ?用条形图、饼图、百分条图等图形来展
示数据; ?用列联表分析两个分类指标之间的关系; ?相关理论在统计软件中的应用; ?相应统计分析结果的解读。
?为数据画一个图 ?制作一个表 ?计算一些我们感兴趣的东西
6 02:51
3.1数据的预处理
? 主要包括:数据的 审核、筛选、排队
?(1)数据的审核与筛选
? a、审核:
? 对 第一手资料 (直接调查或试验取得):审核其 完整性 与 准确性
? 完整性审核:应调查的单位或个体是否有遗漏; 所调查的项目是否填齐全。
次要的多数
图3.8 不同类型搜索引擎的频数分布表绘制的帕累托图
该帕累托图表明:对网站的访问主要途径依靠 Google 和Direct ,KEEN公司需要在这两个途径上进行加强和改进。19
02:51
用圆形及 圆内扇形的 角度来表示 数值大小的 图形,主要 用于表示一 个样本(或 总体)中 各 组成部分的 数据占全部 数据的比例
a、通过浏览数据发现一些明显的特征 趋势或 解决问题的线索;
b、有助于数据的检查 纠错; c、为分组提供依据。
排序 方式 : 数字型数据 /字母型数据 ?? 升序或降序 汉字型数据 ?? 多种
9 02:51
3.2 频数分布表
预处理数据
分组
计算频数
描述统计
? 统计分组是将预处理过的数据按照 某种特征或标 准分成不同的组别。 ? 统计分组变量 :分组时所依据的特征或标准,有 定性变量 和定量变量。 ? 频数分布表 :对分组后的数据,计算各组中数据 出现的次数或频数所形成的汇总表。
3
英国
男子 金银铜 17 15 13 17 8 11 17 9 13
女子
混合
金银铜金银铜
29 14 15 0 0 1
20 18 12 1 1 0
965321
根据上面的数据,你认为可以选择哪些 图 形来展示三个国家所获得的奖牌情况?学完本 章的图表展示技术,这样的问题就会迎刃而解
5 02:51
数据分析包括三种形式