优选第三章应用统计学图表法
合集下载
应用统计学 第三章 图表描述
33
第二节 数值型数据的图表描述
第 三 章
四、茎叶图
图
表 描
叶图又称枝叶图,其基本思路是将数
述 组中的数按位数进行比较,将数的大小基
本不变或变化不大的位作为一个主干
(茎),将变化大的位作为分枝(叶),
列在主干的后面,这样就可以清楚地看到
每个主干后面有几个数,每个数具体是多
少。图3-10是根据表3-5中的数据所绘制
18
第二节 数值型数据的图表描述
第 三 章
图
例如,为科学考核教学效果,任课教师每学期期末都要对自己所担任课程
表
描
的学生考试成绩进行统计分析。表3-5所示为某班级60名学生统计学课程的期
述
末考试成绩数据。
19
第二节 数值型数据的图表描述
第 三 章
图
表3-5中共有60个观测值,其变量值个数多达31个。若以单个变量值来确
29
第二节 数值型数据的图表描述
第 三 章
为强调频数分布的整体特征,还可以在直方图的基础上进一步加工制作出频数分
图
布折线图或曲线图。折线图是将直方图中各个条形上端的中点用直线连接起来所形成
表 描
的图形,它可以通过折线与横轴所围成的面积来显示数据。图3-7所示是根据图3-6
述
的直方图所绘制的折线图。
以上是围绕定类数据所介绍的图表描述方法,这些方法同样适用于定序数据。例如,为
图
表 评价某城市的空气质量状况,研究人员在该城市中测定了300个采样点,并获得表3-3所示
描
述 的测定结果。
12
第一节 品质型数据的图表描述
第 三 章
表3-3中的数据是定序变量数据,根据此数据所绘制的频数分布条形图及饼形图如图3-4
第二节 数值型数据的图表描述
第 三 章
四、茎叶图
图
表 描
叶图又称枝叶图,其基本思路是将数
述 组中的数按位数进行比较,将数的大小基
本不变或变化不大的位作为一个主干
(茎),将变化大的位作为分枝(叶),
列在主干的后面,这样就可以清楚地看到
每个主干后面有几个数,每个数具体是多
少。图3-10是根据表3-5中的数据所绘制
18
第二节 数值型数据的图表描述
第 三 章
图
例如,为科学考核教学效果,任课教师每学期期末都要对自己所担任课程
表
描
的学生考试成绩进行统计分析。表3-5所示为某班级60名学生统计学课程的期
述
末考试成绩数据。
19
第二节 数值型数据的图表描述
第 三 章
图
表3-5中共有60个观测值,其变量值个数多达31个。若以单个变量值来确
29
第二节 数值型数据的图表描述
第 三 章
为强调频数分布的整体特征,还可以在直方图的基础上进一步加工制作出频数分
图
布折线图或曲线图。折线图是将直方图中各个条形上端的中点用直线连接起来所形成
表 描
的图形,它可以通过折线与横轴所围成的面积来显示数据。图3-7所示是根据图3-6
述
的直方图所绘制的折线图。
以上是围绕定类数据所介绍的图表描述方法,这些方法同样适用于定序数据。例如,为
图
表 评价某城市的空气质量状况,研究人员在该城市中测定了300个采样点,并获得表3-3所示
描
述 的测定结果。
12
第一节 品质型数据的图表描述
第 三 章
表3-3中的数据是定序变量数据,根据此数据所绘制的频数分布条形图及饼形图如图3-4
应用统计学(第二版)第3章数据整理PPT课件
第3章 数据整理
1
描述统计
统计数据 的收集
统计数据 的整理
数据分布特征 的测度
2
主要内容和学习目标
3.1 数据的整理(掌握) 3.2 数据整理结果的描述:
统计指标(掌握) 3.3 数据整理结果的描述:
统计表和统计图(掌握)
3
3.1 数据的整理
3.1.1 数据整理的步骤 3.1.2 数据分组 3.1.3 数据汇总
与处理
数据 录入
归集资料 并汇总
汇总后的 审核
16
2、次数分配
次数分配的概念与种类:
次数分配总体中的所有单位按一定标志分组整理,并 将各组按一定顺序排列,形成总体中各个单位在各组 间的分布.
由总体分组和各组相对应的分配次数两个要素构成。
按照分组标志的不同 次数分配:品质型分配数列
数量型分配数列
17
24
数值型数据的分组整理
312341212321 122242122132 124223332121 213211231224 142124122122
23
表3-3 饭店食物质量状况的频数分布
饭店食物质量 极好
非常好 良好 一般 较差 合计
频 数(人) 18 27 9 6 0 60
频率(%) 30 45 15 10 0 100
编制次数分配的步骤
第一步:对数据进行分组
第二步:计算各组的频数、频率、
c
累积频数和累积频率
第三步:编制频数分布表
18
统计分组的原则: 穷尽原则:使总体中的每一个单位都有组可归 互斥原则:使总体中的每一个单位只有一组可归
19
频数(Frequency,亦称为次数) 是指落入各组中的数据的个数或次数
1
描述统计
统计数据 的收集
统计数据 的整理
数据分布特征 的测度
2
主要内容和学习目标
3.1 数据的整理(掌握) 3.2 数据整理结果的描述:
统计指标(掌握) 3.3 数据整理结果的描述:
统计表和统计图(掌握)
3
3.1 数据的整理
3.1.1 数据整理的步骤 3.1.2 数据分组 3.1.3 数据汇总
与处理
数据 录入
归集资料 并汇总
汇总后的 审核
16
2、次数分配
次数分配的概念与种类:
次数分配总体中的所有单位按一定标志分组整理,并 将各组按一定顺序排列,形成总体中各个单位在各组 间的分布.
由总体分组和各组相对应的分配次数两个要素构成。
按照分组标志的不同 次数分配:品质型分配数列
数量型分配数列
17
24
数值型数据的分组整理
312341212321 122242122132 124223332121 213211231224 142124122122
23
表3-3 饭店食物质量状况的频数分布
饭店食物质量 极好
非常好 良好 一般 较差 合计
频 数(人) 18 27 9 6 0 60
频率(%) 30 45 15 10 0 100
编制次数分配的步骤
第一步:对数据进行分组
第二步:计算各组的频数、频率、
c
累积频数和累积频率
第三步:编制频数分布表
18
统计分组的原则: 穷尽原则:使总体中的每一个单位都有组可归 互斥原则:使总体中的每一个单位只有一组可归
19
频数(Frequency,亦称为次数) 是指落入各组中的数据的个数或次数
实用统计学第3章 PPT课件
2007年全国出生人口性别比(男性比女性)为120.2 %,这个数 字在1982年为108.5%,1987年 为110.9 %,1990 年为111.3 %, 1995年 115.6%,2000年为116.9%。
我国2007年三次产业产值结构为:11.7:49.Байду номын сангаас:39.1。
(不同总体)
4.比较相对数
3.比例相对数
在同一总体内不同部分之比。用于对比总体内部不同部分 之间的比例关系。
比例相对指 总 总 标体 体中 中另 某一 一部 部分 分的 的 10数 数 0%值 值
举例:
2007我国全年货物进出口总额21738亿美元,其中,货物出口 12180亿美元,货物进口9558亿美元,比例为127.41%。
按采用的计量单位不同
实物量指标:根据事物、现象的属性、特点和用途, 采用自然单位、度量衡单位、标准实物量单位和复合 单位计量的总量指标。如,我国2007年全年能源消费总量
26.5亿吨标准煤,比上年增长7.8%。煤炭消费量25.8亿吨,增长 7.9%;原油消费量3.4亿吨,增长6.3%;天然气消费量673亿立 方米,增长19.9%;
将同类(同一)指标在不同地区、单位之间作静态对比的比率。 它可以说明同一时期内某种同类现象在不同单位之间的差异程 度,一般用系数或百分数来表示。其计算公式为:
比较相对指乙 甲 标地 地区 区同 某一 现现 象象 的 1的 数 0% 0数 值值
注意分子、分母必须是同一性质的总量指标、相对指标或平均指标
举例:
07年天津住宅开发总面积中,普通住宅、公寓、别墅 各占80%、13%和7%。
07全年国内生产总值246619亿元,第一产业增加值 28910亿元,第二产业增加值121381亿元,第三产业 增 加 值 96328 亿 元 , 分 别为: 11.72% 、 49.22% 、 39.06%
我国2007年三次产业产值结构为:11.7:49.Байду номын сангаас:39.1。
(不同总体)
4.比较相对数
3.比例相对数
在同一总体内不同部分之比。用于对比总体内部不同部分 之间的比例关系。
比例相对指 总 总 标体 体中 中另 某一 一部 部分 分的 的 10数 数 0%值 值
举例:
2007我国全年货物进出口总额21738亿美元,其中,货物出口 12180亿美元,货物进口9558亿美元,比例为127.41%。
按采用的计量单位不同
实物量指标:根据事物、现象的属性、特点和用途, 采用自然单位、度量衡单位、标准实物量单位和复合 单位计量的总量指标。如,我国2007年全年能源消费总量
26.5亿吨标准煤,比上年增长7.8%。煤炭消费量25.8亿吨,增长 7.9%;原油消费量3.4亿吨,增长6.3%;天然气消费量673亿立 方米,增长19.9%;
将同类(同一)指标在不同地区、单位之间作静态对比的比率。 它可以说明同一时期内某种同类现象在不同单位之间的差异程 度,一般用系数或百分数来表示。其计算公式为:
比较相对指乙 甲 标地 地区 区同 某一 现现 象象 的 1的 数 0% 0数 值值
注意分子、分母必须是同一性质的总量指标、相对指标或平均指标
举例:
07年天津住宅开发总面积中,普通住宅、公寓、别墅 各占80%、13%和7%。
07全年国内生产总值246619亿元,第一产业增加值 28910亿元,第二产业增加值121381亿元,第三产业 增 加 值 96328 亿 元 , 分 别为: 11.72% 、 49.22% 、 39.06%
统计基础与应用课件 第三章
第三节 分布数列
一、分布数列的概念
向上累计和向下累计
向上累计:该组及该组以上次数或频率加和; 向下累计:该组及该组以下次数或频率加和。
表3-9中的第三组,向上累计次数为26,是由该组次数12 及该组以上次数9、5加和得出的,表明该地区零售商店 销售额在150万元以下的有26家;第三组向下累计次数为 26,是由该组次数12及该组以下次数7、4、3加和得出的, 表明该地区零售商店销售额在100万元以上的有26家。
第三节 分布数列
一、分布数列的概念
分布数列是指在统计分组的基础上,将 总体所有的单位按某一标志进行归组并排列, 形成总体中各个单位在各组间的分布。其中, 分布在各组的总体单位数称为频数(或次 数),用绝对数表示;各组频数与总频数之 比称为频率(或比重),用相对数表示。
例如
分布数列由各组名称(或各组变量值)和各组 单位数(次数)构成。
第四节 统计表与统计图
二、统计表的结构
第四节 统计表与统计图
二、统计表的结构
统计表的设计
统计表的设计规则
统计表绘制。 表的上下两端用 粗线,中间用均 匀细线,左右两 端开口。
计量单位。必须注明数 字资料的计量单位。当 全表只有一种计量单位 时,可将它写在总标题 的右下方。如果表中各 行的指标数值计量单位 不同,可在行标题后添 一列计量单位。
作
三个阶段,起着承前启后的
作用。统计整理是统计调查
用 的继续,又是统计分析的基
础。
统计整理 步骤
制定整理方案 统计资料审核 统计数据的分组 编制统计表或绘制统计图
第二节 统计分组
一、统计分组的概念、作用
1.统计分组的 概念
所谓统计分组,是指根据统计研究的需要,按照某种标志 将统计总体划分为若干组成部分的一种统计方法。 统计分组的含义有两点:对于总体而言,是“分”;而对 于每个总体单位而言,是“合”。
统计分析图表的使用
占0%~80%为A类因素,也就是主要因素; 80%~90%为B类因素,是次要因素; 90%~100%为C类因素,即一般因素。 由于A类因素占存在问题的80%,此类因素解决了,质量问题大部分 就20得20/到3/4了解决。
பைடு நூலகம்
三、柏拉图
二、柏拉图应用要点: 1、比较改善前后的柏拉图,可以评估出改善效果。 2、分析柏拉图只要抓住前面的2-3项就可以。 3、柏拉图的分类项目不要太少,5-9项较合适。 4、作成的柏拉图如果发现各项目分配的比例差不多
2020/3/4
五、直方图
直方图又称质量分布图,柱状图,它是表示资料变化情 况的一种主要工具。用直方图可以解析出资料的规则性,比 较直观地看出产品质量特性的分布状态,对于资料分布状况 一目了然,便于判断其总体质量分布情况。
直方图是将所收集的数据、特性或结果值,在横轴上用 一定的范围区分成几个相等的区间,将各区间内的测定值所 出现的次数累积起来的面积。
2020/3/4
一、查检表
四、注意事项: 1).收集的数据必须真实,不可作假或修正. 2).收集的数据应能获得层别的情报. 3).查检项目基准需一致. 4).样本数需有代表性. 5).明确测定、检查的方法. 6).明确查验样本的收集方法、记录方式、符号代表意义. 7).慎用他人提供的数据.
2020/3/4
2020/3/4
一、查检表
三、查检表的分类: (1)点检用的查检表。其作用是确认操作实施、设备准备
的情况,或为预防发生不良事故,确保安全时使用。如定 期查检急救车的物品所用的查检表。 (2)记录用的查检表。将数据分为数个项目,以符号、数 字记录,作为分析问题、掌握事实及改善用的根据。根据 所收集到的数据,来调查不良项目、不良原因、缺点位置 等情况。如某内科病人候诊时间调查表
பைடு நூலகம்
三、柏拉图
二、柏拉图应用要点: 1、比较改善前后的柏拉图,可以评估出改善效果。 2、分析柏拉图只要抓住前面的2-3项就可以。 3、柏拉图的分类项目不要太少,5-9项较合适。 4、作成的柏拉图如果发现各项目分配的比例差不多
2020/3/4
五、直方图
直方图又称质量分布图,柱状图,它是表示资料变化情 况的一种主要工具。用直方图可以解析出资料的规则性,比 较直观地看出产品质量特性的分布状态,对于资料分布状况 一目了然,便于判断其总体质量分布情况。
直方图是将所收集的数据、特性或结果值,在横轴上用 一定的范围区分成几个相等的区间,将各区间内的测定值所 出现的次数累积起来的面积。
2020/3/4
一、查检表
四、注意事项: 1).收集的数据必须真实,不可作假或修正. 2).收集的数据应能获得层别的情报. 3).查检项目基准需一致. 4).样本数需有代表性. 5).明确测定、检查的方法. 6).明确查验样本的收集方法、记录方式、符号代表意义. 7).慎用他人提供的数据.
2020/3/4
2020/3/4
一、查检表
三、查检表的分类: (1)点检用的查检表。其作用是确认操作实施、设备准备
的情况,或为预防发生不良事故,确保安全时使用。如定 期查检急救车的物品所用的查检表。 (2)记录用的查检表。将数据分为数个项目,以符号、数 字记录,作为分析问题、掌握事实及改善用的根据。根据 所收集到的数据,来调查不良项目、不良原因、缺点位置 等情况。如某内科病人候诊时间调查表
应用统计学
指标的取值
精品课件
4、分类 (1)指标按其反映的总体内容不同分为: 数量指标和质量指标
数量指标反映总规模、总水平, 其值的取得不需要通过对比运算。
质量指标反映相对水平和工作质量, 其值的取得要通过对比运算。
(2)按其作用和表现形式不同分为:总 量指标;相对指标;平均指标。
❖ 变量:考试成绩(一个) ❖变量值: 56、67、83、88、92。(五个)
精品课件
2、分类
(1)变量按其取值是否连续有离散变量 和连续变量之分
离散变量:只能用整数表示、通 过计数取得其值、可有限分割其值。如 学生人数、机器台数。
连续变量:可用小数表示、通过 测量或 计算取得其值、可无限分割其 值。如销售额、身高。
精品课件
2、标志分类
品质标志:用文字表示属性
标志
数量标志:用数字表示特征
不变标志:各单位具体表现 相同
可变标志:各单位具体表现 不同
精品课件
三、变量 1、概念: 变量:可变的数量标志称为变量
变量值:即变量的具体表现。
精品课件
举例:
❖ 一个班级有5个学生,某门课程的考 试成绩是56分、67分、83分、88分、 92分。
农村居民家庭 恩格尔系数
%
45.6 47.2 45.5
精品课件
43
43.1
精品课件
2000—2004年城乡居民住房情况
年份
2000 2001 2002 2003 2004
城市人均住宅建 农村人均住宅建 筑面积(平方米)筑面积(平方米)
20.3
24.8
20.8
25.7
22.8
26.5
23.7
27.2
精品课件
应用统计学PPT课件
B(n,p) = n! / [k!(n-k)!] * p^k * (1-p)^(n-k),其中k为成功次数。
二项分布的应用
在统计学中广泛应用于计数数据,如成功率、故障率等。
二项分布
描述n次独立、相同、成功概率为p的伯努利试验的总成功次数的概率分布。
二项分布
正态分布曲线
呈钟形,对称分布于均值μ处,曲线下的面积为1。
数据质量评估
01
02
03
数据收集
数据清洗
对数据进行清洗,处理缺失值、异常值、错误值等问题,确保数据质量。
数据转换
对数据进行必要的转换,以满足统计分析的要求,如变量编码、类别转换等。
数据可视化
将数据以图表、图像等形式进行展示,帮助人们更好地理解数据和发现数据中的规律。
数据整理与展示
03
预测性分析
利用历史数据和算法模型对未来趋势进行预测,如时间序列分析、机器学习模型等。
实验设计
04
CHAPTER
统计学的基本概念
统计学中研究的全部数据,代表某一特定群体的所有个体。
总体
从总体中选取的一部分数据,用于推断总体的特征和规律。
样本
总体与样本
描述总体特性的数值,通常由总体数据计算得出。
描述样本特性的数值,通常由样本数据计算得出。
参数与统计量
统计量
参数
定量数据
可以量化的数据,如年龄、身高、体重等。
金融统计分析
对不同产业的经营数据进行分析,以评估产业发展和竞争态势,为企业决策提供依据。
产业统计分析
经济学
社会调查统计
通过问卷调查、访谈等方式收集数据,并运用统计分析方法研究社会现象和问题。
人口统计学
二项分布的应用
在统计学中广泛应用于计数数据,如成功率、故障率等。
二项分布
描述n次独立、相同、成功概率为p的伯努利试验的总成功次数的概率分布。
二项分布
正态分布曲线
呈钟形,对称分布于均值μ处,曲线下的面积为1。
数据质量评估
01
02
03
数据收集
数据清洗
对数据进行清洗,处理缺失值、异常值、错误值等问题,确保数据质量。
数据转换
对数据进行必要的转换,以满足统计分析的要求,如变量编码、类别转换等。
数据可视化
将数据以图表、图像等形式进行展示,帮助人们更好地理解数据和发现数据中的规律。
数据整理与展示
03
预测性分析
利用历史数据和算法模型对未来趋势进行预测,如时间序列分析、机器学习模型等。
实验设计
04
CHAPTER
统计学的基本概念
统计学中研究的全部数据,代表某一特定群体的所有个体。
总体
从总体中选取的一部分数据,用于推断总体的特征和规律。
样本
总体与样本
描述总体特性的数值,通常由总体数据计算得出。
描述样本特性的数值,通常由样本数据计算得出。
参数与统计量
统计量
参数
定量数据
可以量化的数据,如年龄、身高、体重等。
金融统计分析
对不同产业的经营数据进行分析,以评估产业发展和竞争态势,为企业决策提供依据。
产业统计分析
经济学
社会调查统计
通过问卷调查、访谈等方式收集数据,并运用统计分析方法研究社会现象和问题。
人口统计学
应用统计学课件-ch0304
四、数据资料的关联分析和审核评估能力
关联分析是指关联行业、关联产业、关联指标 是否匹配的分析。 审核评估是指对数据来源是否可靠、数据是否 准确、系统的分析。不仅要关注指标之间、统 计报表内的逻辑关系平衡,还要搞清楚数据的 来龙去脉、搞清楚数据增减变动的原因、搞清 楚数据的涵义、口径等制度规定。
五、统计数据表示能力
三、分组标志(分组标准)
1、概念:即分组的依据 2、选择: (1)根据统计研究的目的选择 (2)选择具有本质性的重要标志 (3)结合现象所处的具体条件
四、统计分组的种类
(一)按分组标志的性质不同分
1、按品质标志分组:形成品质分布数列
如:学生按性别分组,企业按所有制性质分组等
2、按数量标志分组:形成变量数列
商品广告
某城市居民关注不同类型广告的人数构成56.0%
第五节 统计表
某城市居民关注广告类型的频数分布表
广告类型
人数(人) 比例
频率(%)
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
合计
112
0.560
51
0.255
9
0.045
16
0.080
10
0.050
2
0.010
200
1.000
例:
全民所有制企业 企业 集体所有制企业
其他经济类型
大型
中型 小型 大型 中型 小型 大型 中型 小型
在复合分组方法下形成复合分组体系
五、统计分组的方法
(一)按品质标志分组
1、选择品质标志作为分组标志 2、确定组数并表示出各组(根据品质标志的具体表现) 3、把各单位归入相应的组汇总出各组的单位数(次数)
第三章 统计学 数据的图表展示PPT课件
3. 绘制圆形图时,样本或总体中各部分所占 的百分比用圆内的各个扇形角度表示,这 些扇形的中心角度,按各部分数据百分比 乘以3600确定
可编辑课件PPT
30
分类数据的图示—饼图 (例题分析)
汇源果汁 12%
露露 18%
可口可乐 30%
百事可乐 18%
旭日升冰茶 22%
不同品牌饮料的构成
可编辑课件PPT
2. 排序有助于对数据检查纠错,以及为重 新归类或分组等提供依据
3. 在某些场合,排序本身就是分析的目的 之一
4. 排序可借助于计算机完成
可编辑课件PPT
12
数据排序 (方法)
1. 分类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯
上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排列,
也可按笔画排序,其中也有笔画多少的升序 降序之分
32
环形图(doughnut chart)
【例】2006年北京、上海和天津地区按收入法计算 的地区生产总值(按当年价格计算)数据。绘制环形 图比较三个地区的生产总值构成
可编辑课件PPT
33
环形图 (doughnut chart )
北京、上海和天津地区按收入法计算的地区生产总值
31% 25%
36%
销售量
800
688
700
600
563
500
468
400
300 256
397 285
328 247
200
一季度 二季度
100
0
联想
IBM
康柏
戴尔 电脑品牌
电脑销售量的对比条形图
可编辑课件PPT
28
分类数据的图示—帕累托图(pareto chart)
可编辑课件PPT
30
分类数据的图示—饼图 (例题分析)
汇源果汁 12%
露露 18%
可口可乐 30%
百事可乐 18%
旭日升冰茶 22%
不同品牌饮料的构成
可编辑课件PPT
2. 排序有助于对数据检查纠错,以及为重 新归类或分组等提供依据
3. 在某些场合,排序本身就是分析的目的 之一
4. 排序可借助于计算机完成
可编辑课件PPT
12
数据排序 (方法)
1. 分类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯
上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排列,
也可按笔画排序,其中也有笔画多少的升序 降序之分
32
环形图(doughnut chart)
【例】2006年北京、上海和天津地区按收入法计算 的地区生产总值(按当年价格计算)数据。绘制环形 图比较三个地区的生产总值构成
可编辑课件PPT
33
环形图 (doughnut chart )
北京、上海和天津地区按收入法计算的地区生产总值
31% 25%
36%
销售量
800
688
700
600
563
500
468
400
300 256
397 285
328 247
200
一季度 二季度
100
0
联想
IBM
康柏
戴尔 电脑品牌
电脑销售量的对比条形图
可编辑课件PPT
28
分类数据的图示—帕累托图(pareto chart)
应用统计学之用图表和统计量看数据培训课件
2 - 17 *
应用统计学
Applied Statistics
定性数据的图示—环形图
(例题分析)
13% 10% 15% 7% 8%
非常不满意 36%
33% 不满意 一般
21%Leabharlann 31%满意非常满意
26% 甲乙两城市家庭对住房状况的评价
2 - 18 *
2.1 用图表描述数据
2.1.2 用图表展示定量数据
应用统计学
Applied Statistics
生成频数分布表
(分组)
1. 确定组数:组数的确定应以能够显示数 据的分布特征和规律为目的。在实际分 组时,组数一般为5K 15 2. 确定组距:组距(Class Width)是一个组 的上限与下限之差,可根据全部数据的 最大值和最小值及所分的组数来确定, 即组距=( 最大值 - 最小值)÷ 组数 3. 统计出各组的频数
绿色
健康饮品
用Excel制作频数分布表
*
2-9
应用统计学
Applied Statistics
使用Excel数据透视表数计数
(pivot table)
第1步:选择【数据】菜单中的【数据透视表和数据透视图】 第2步:确定数据源区域 第3步:在【向导—3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】 第4步:在【向导—布局】对话框中,依次将“分类变量“(这 是饮料品牌)连续拖放两次:一次拖至左边的“行”区域 ,一次拖至 “数据”区域 第5步:然后单击【确定】,自动返回【向导—3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表
~
~
~ ~ ~
*
2 - 20
应用统计学
Applied Statistics
应用统计学
Applied Statistics
定性数据的图示—环形图
(例题分析)
13% 10% 15% 7% 8%
非常不满意 36%
33% 不满意 一般
21%Leabharlann 31%满意非常满意
26% 甲乙两城市家庭对住房状况的评价
2 - 18 *
2.1 用图表描述数据
2.1.2 用图表展示定量数据
应用统计学
Applied Statistics
生成频数分布表
(分组)
1. 确定组数:组数的确定应以能够显示数 据的分布特征和规律为目的。在实际分 组时,组数一般为5K 15 2. 确定组距:组距(Class Width)是一个组 的上限与下限之差,可根据全部数据的 最大值和最小值及所分的组数来确定, 即组距=( 最大值 - 最小值)÷ 组数 3. 统计出各组的频数
绿色
健康饮品
用Excel制作频数分布表
*
2-9
应用统计学
Applied Statistics
使用Excel数据透视表数计数
(pivot table)
第1步:选择【数据】菜单中的【数据透视表和数据透视图】 第2步:确定数据源区域 第3步:在【向导—3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】 第4步:在【向导—布局】对话框中,依次将“分类变量“(这 是饮料品牌)连续拖放两次:一次拖至左边的“行”区域 ,一次拖至 “数据”区域 第5步:然后单击【确定】,自动返回【向导—3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表
~
~
~ ~ ~
*
2 - 20
应用统计学
Applied Statistics
统计分析和图表应用
•样本中位数 ~x
(2)表示样本数据分布分散程度的 •样本方差
•样本标准差 •样本极差
2
5、两类错误和风险
3
二、常用方法(工具)的分类
1、老七种工具
调查表 分层法 排列图
因果图 直方图
控制图
散布图
2、新七种工具
亲和图 树图 关联图 矩阵图
箭条图 PDPC法(过程决策程序图法)
矩阵数据分析法
3、ISO9004·4《质量改进指南》推荐方法
1、树图的基本形式:
宝塔型
主 题 主要类别 组成要素 子 要 素
主题 主要类别 组成要素 子要素
侧向型
21
2、应用树图进行原因分析时,思路与因果图基本相同,应注 意的问题也相似:
⑴ 针对一个问题作一张树图,分析其原因; ⑵ 让小组成员充分发表意见,找出可能存在的全部原因; ⑶ 将全部原因,按因果关系分层次排列,用直线连接,直至可直接采取
N=4870 累计%
69.14 79.84 87.69 91.82 95.02 97.48 100.00
7
缺陷位置调查表
汽车车身喷漆质量的缺陷位置调查表
车型 工序 调查目的
喷漆缺陷
检查处 检查者 调查数
车身 2139辆
色斑
流漆 颗尘粒
年 月日
8
质量分布调查表
零件实测值分布调查表
4、举例:
打打胶胶过过程程温温度度测测量量不不准准确确
辅辅料料33粘粘结结于于
打打胶胶机机 温温度度高高
打打胶胶过过程程 温温控控不不好好
打打胶胶机机夹夹层层 水水循循环环不不好好
打打胶胶机机叶叶片片角角度度不不当当
冷冷却却水水水水压压低低 水水管管有有堵堵塞塞物物 出出水水口口温温度度高高
(2)表示样本数据分布分散程度的 •样本方差
•样本标准差 •样本极差
2
5、两类错误和风险
3
二、常用方法(工具)的分类
1、老七种工具
调查表 分层法 排列图
因果图 直方图
控制图
散布图
2、新七种工具
亲和图 树图 关联图 矩阵图
箭条图 PDPC法(过程决策程序图法)
矩阵数据分析法
3、ISO9004·4《质量改进指南》推荐方法
1、树图的基本形式:
宝塔型
主 题 主要类别 组成要素 子 要 素
主题 主要类别 组成要素 子要素
侧向型
21
2、应用树图进行原因分析时,思路与因果图基本相同,应注 意的问题也相似:
⑴ 针对一个问题作一张树图,分析其原因; ⑵ 让小组成员充分发表意见,找出可能存在的全部原因; ⑶ 将全部原因,按因果关系分层次排列,用直线连接,直至可直接采取
N=4870 累计%
69.14 79.84 87.69 91.82 95.02 97.48 100.00
7
缺陷位置调查表
汽车车身喷漆质量的缺陷位置调查表
车型 工序 调查目的
喷漆缺陷
检查处 检查者 调查数
车身 2139辆
色斑
流漆 颗尘粒
年 月日
8
质量分布调查表
零件实测值分布调查表
4、举例:
打打胶胶过过程程温温度度测测量量不不准准确确
辅辅料料33粘粘结结于于
打打胶胶机机 温温度度高高
打打胶胶过过程程 温温控控不不好好
打打胶胶机机夹夹层层 水水循循环环不不好好
打打胶胶机机叶叶片片角角度度不不当当
冷冷却却水水水水压压低低 水水管管有有堵堵塞塞物物 出出水水口口温温度度高高
应用统计学第3章-数据整理.ppt
7 80 x 90 3
相对次数 4/61=0.07 7/61=0.11 12/61=0.20 18/61=0.29 11/61=0.18 6/61=0.10 3/61=0.05
1.00
百分比% 7 11 20 29 18 10 5 100
50
累计次数分布
(1)向上累计。
又称为以下累计。从变量值低的组开始,将各组 频数(频率)逐次向变量值高的组累计,说明某一 组上限以下各组的累计频数(频率)。
60
经济学学期成绩
假設X大經濟學上學期的學期成績如下: 56 57 58 64 65 66 67 69 71 72 73 74 74 75 75 77 78 78 79 84 85 85 86 86 87 88 89 90 92 94 95
61
经济学学期成绩的茎叶图
茎
叶
5
678
6
45679
7
12344557889
(宾词栏)
20
饭店食物质量状况调查
表3-3 饭店食物质量状况的频数分布
饭店食物质量 极好
非常好 良好 一般 较差 合计
频 数(人) 18 27 9 6 0 60
21
相对次数分配
频率是用各组次数与总体单位总个数相比,其 计算公式为:
某一组次数
频率
100 %
总体单位总个数
22
饭店食物质量状况调查
0.95
0.15
7 80 x 90 0.05
1.00
0.05
合計
1.00
53
统计图
直方图 线图 次数多边图
54
海之滨每日营业收入的次数分配直 方图
次20 数18
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、数据的筛选——处理数据中的错误
数据错误
能能 能否纠正 不能
纠正错误 筛选数据
• 剔除不符合要求或有明显错误的数据 • 将符合某种特定条件的数据筛选出来,而不符合特定条 件的数据予以剔出
三、数据的排序——发现数据的基本特征
1. 按一定顺序将数据排列,以 发现一些明显的特征或趋势, 找到解决问题的线索
第二手数据
适用性审核 时效性审核
➢ 应弄清楚数据的来源、数据的口径以及 有关的背景材料 ➢ 确定这些数据是否符合自己分析研究的 需要
➢ 应尽可能使用最新的统计数据
确认是否有必要做进一步的加工整理
审核数据准确性的方法
计算检查——主要用于对数量数据的审核
A省 B省 … 国内漫游出访通话量 8 12 … 国内漫游来访通话量 10 7 …
某城市330名用户每月手机话费支出的频数分布
用 户 数
频
向上累积
率 用户数 频率
(个) (%) (个)
(%)
向下累积
用户数 频率 (个) (%)
100元以内 161 48.8
161 48.8
330 100.0
101-200元 114 34.6
275 83.3
169
51.2
201-300元 29 8.8 304 92.1
【 例 3.2】 在 一 项 关 于用户移动业务支出
情况的调查中,研究
人员在某城市抽样调 查 了 330 名 移 动 用 户 ,对其中的一个问题
:“手机话费一个月
多少钱?”设了七个 选项:
1、100元以内 2、 101-200元 3、201-300元 4、301-500元 5、501-600元 6、601-1200元 7、1501元以上
55
16.6
301-500元 14 4.3 318 96.4
26
7.8
501-600元
6 1.8 324 98.2
12
3.6
601-1200元 4 1.2 328 99.4
6
1.8
1501元以上 2 0.6 330 100.0
2
0.6
合计
330 100 —
—
—
—
19% 32%
二、数据的展示
10% 15%
第一节 数据的预处理
一、数据的审核 二、数据的筛选 三、数据的排序
一、数据的审核
原始数据
完整性审核
➢ 检查应调查的单位或个体是否有遗漏 ➢ 所有的调查项目或指标是否填写齐全
准确性审核
➢ 检查数据是否真实地反映了客观实际
情况,内容是否符合实际 ➢ 检查数据是否有错误,计算是否正确等
一、数据的审核
合计 324 289
Something Wrong !!!
检查调查表中的各项数据在计算结果和计算方 法上有无错误
审核数据准确性的方法
逻辑检查——主要用于对品质数据的审核
姓名 余小姐 罗先生 吴女士
性别 女 男 女
地址 香洲区 香洲 香州
不,他们住在 三个区!
他们住在同一 区
STATISTICA
从定性角度,审核数据是否符合逻辑,内容是 否合理,各项目或数字之间有无相互矛盾的现象
定类数据
频数 频率
定序数据
累计频数 累计频率
指标含义
将将将落各对各在类比类各别的别类的基的别频数频中率作数数(为百 1分00比逐而据)级计的逐累算个级加的数累比加值
实例1:定类数据的频数分布表
【例3.1】某市移动公司为 研究移动数据业务集团客 户的行业分布状况,搜集 了该城市90个集团客户的 客户资料。将其所属行业 分为下列类别: 1.金融(银行证券保险) 2.政府,工商、税务 3.制造业 4.教育科研 5.交通运输 6.批发零售 7.公用事业 8.旅游酒店
24%
15% 12%
44% 18%
40%
29% 30%
12%
1999
2002
3 to 5 years
数据类型与图示
数据类型与图示
品质数据
数量数据
分组数据 分组数据 原始数据 时序数据 多元数据
条柱圆 直 折 茎 箱
线
雷
形形形 方 线 叶 线
达
图图图 图 图 图 图
图
图
品质数据的图示─条形图(Bar Graph)
2、图表描述的结果能反映样本分布特征 3、图表描述的结果可用于研究变量之间的关系
用图表法描述数据的一般过程
数据的预处理 数据的描述
数据审核 数据筛选 数据排序
数据整理 数据展示
发现数据中的错误 处理数据中的错误 发现数据基本特征
品质数据:分类 数量数据:分组 用图表展示数据
本章内容
第一节 数据的预处理 第二节 用图表法描述品质数据 第三节 用图表法描述数量数据
经济类管理类
基础课程
优选第三章应用统计学图表法
1 -1
学习目标
1. 了解数据预处理的内容和目的 2. 掌握品质数据整理和描述的方法 3. 掌握数量数据整理和描述的方法 4. 用Excel作频数分布表和分布图 5. 合理使用统计表
统计数据为什么要用图表描述?
1、原始数据反映个体特征,庞大而杂乱,单从原始数 据中无法得到总体特征和数量规律
法也适合于高层次的数据;但适合 于高层次数据的整理和显示方法并 不适合于低层次的数据
第二节 用图表法描述品质数据
一、品质数据的整理 二、品质数据的展示
品质数据的整理
整理过程
确定分类标志
将数据归类
☺
☺ ☺
☺☺
计算各类别中的数 据个数(频数) 制作频数分布表
用图形展示数据
数据整理中计算的指标
数据类型和指标
1. 在表示品质数据的分布时,条形信图息查询
是用条形图的高度或长短来表示收发各E-Mail
阅读网络新闻
类别数据的频数或频率
在线学习
12.3% 6.7%
采购与订货 5.5%
2. 绘制时,各类别可以放在纵轴,称 其他 4.5%
为条形图,也可以放在横轴,称为
柱形图
3. 条形图和柱形图有单式、复式等形
2. 排序有助于对数据检查纠错, 以及为重新归类或分组等提 供依据
3. 在某些场合,排序本身就是 分析的目的之一
4. 排序可借助于计算机完成
一、数据的整理
1. 要弄清所面对的数据类型,因为不 同类型的数据,所采取的处理方式 和方法是不同的
2. 对品质数据主要是做分类整理 3. 对数量数据主要是做分组整理 4. 适合于低层次数据的整理和显示方
移动数据业务集团客户行业类型的频数分布
行业类型
客户数(户) 频率(%)
金融(银行证券保险) 政府,工商、税务 制造业 教育科研 交通运输 批发零售 公用事业 旅游酒店
12 13.3
5
5.6
32 35.6
10.0
2
2.2
10 11.1
合计
90 100
实例2:定序数据的频数分布表