统计学课件 第三张章 数据的整理与显示
统计学 数据的整理及图表展示PPT课件
.
9
【例3.3】一家市场调查公司为研究不同品牌
饮料的市场占有率,对随机抽取的一家超市 进行调查。调查员随机观察了50名顾客购
买饮料类型及购买者性别,并进行了记录, 如果一个顾客购买某一品牌的饮料,就将这 一饮料的品牌名字记录一次。数据见Excel
表。要求:对饮料类型和顾客性别的分布状 况进行描述分析,求不同品牌饮料的频数分 布、比例和百分比。
向上累积:从类别顺序的开始一方,向类别 顺序的最后一方累加频数;
向下累积:从类别顺序的最后一方,向类别 顺序的开始一方累加频数。
2. 累积频率:将各类别的百分比逐级累加
.
23
【例3.5】在一项城市住房问题的研 究中,研究人员在甲乙两个城市 各抽样调查300户,其中的一个问 题是:“您对您家庭目前的住房 状况是否满意?
1.非常不满意;
2.不满意;
3.一般;
4.满意;
5.非常满意。
.
24
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 百分比 (户) (%)
向上累积 户数 百分比 (户) (%)
向下累积 户数 百分比 (户) (%)
非常不满意 24
8
24 8.0 300 100.0
不满意
108 36 132 44.0 276 92
.
7
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与图示
1. 列出各类别 2. 计算各类别的频数 3. 制作频数分布表 4. 用图形展示
.
8
分类数据中需要计算的指标
1.频 数:落在各类别中的数据个数 频数分布:把各个类别及落在其中的相应频 数全部列出,并用表格形式表现出来。
第3章数据整理与显示ppt课件
三、平均每户就业人口数
行 四、平均每人全部收入
标 五、平均每人实际支出
题
#消费性支出
非消费性支出
六、平均每人居住面积
户 人 人 元 元 元 元 平方米
37890 3.19 1.83
5188.54 4945.87 4185.64
755.94 11.90
复合分组
分组体系
3 - 30
经济、管理类 基础课程
统计学
简单分组
(举例)
表3-5 某城市居民关注广告类型的频数分布
广告类型 人数(人) 比例 频率(%)
商品广告
112 0.560 56.0
服务广告
51
0.255 25.5
金融广告
9
0.045 4.5
房地产广告
16
0.080
8.0
招生招聘广告 10
0.050
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
主要用于对定类数据和定序数据的审核
2. 计算检查
检查调查表中的各项数据在计算结果和计算 方法上有无错误
主要用于对定距和定比数据的审核
3 - 12
经济、管理类 基础课程
统计学
资料的审核
(汇总后的资料)
审核的方法
1. 复计审核
对每个指标数值进行复核计算
统计学基础(第三章统计数据整理与展示)PPT课件
– 两种整理形式优缺点互补,实际中常常结合运用, 称为综合整理,即对一些最基本的统计指标实行 逐级整理,另一方面又将全部原始资料实行集中 整理。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
三、统计整理的步骤
• 1.设计和编制统计资料的整理方案。 • 2.审核统计资料。
第一节 统计整理的
统计分组 分配数列 统计表和统计图
• 案例分析
• 思考与练习
E-mail::
第三章 统计数据整理与展示
第三章>>第E-一ma节il::
第三章 统计数据整理与展示
一、统计整理的意义
• 概念
– 统计整理,是指根据统计研究的目的,将 统计调查所搜集到的原始资料进行科学的 分类和汇总,或对已初步加工的资料进行 再加工,使之系统化、条理化,成为能够 反映现象总体特征的综合资料的工作过程。
1980年
GDP 100 第一产业 3.2 第二产业 75.7 第三产业 21.1
1990年 100 4.3 63.8 31.9
1996年 1997年 100 100
2.5 2.3 54.5 52.2 43.0 45.5
3·研究总体现象之间的依存关系
例:中国农民家庭按收入分组的恩格尔系数(1984年)
• 5.编制统计图表。
– 以统计表、统计图的形式简明扼要地表现统计整 理的结果。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
第三章E>-m>a第il::二节
第三章 统计数据整理与展示
什么是统计分组?
根据现象的特点和统计研究的目的要求, 按照某个(或几个)标志把总体划分为若干 不同性质的组,称为统计分组。
第3章 统计数据的整理与显示.ppt
统计整理
将统计调查得到的原始资料进行 科学的分类和汇总,使之成为系 统化、条理化的综合资料,以反 映研究总体特征的过程。
地位
是统计调查的继续,统计分析的前 提和基础,起着承前启后的作用。
统计数据整理的一般程序 数据的预处理 数据的分组 数据的汇总
分布数列(频数分布)
(一)数据的预处理
1. 数据的审核
0~15 15~65 65以上
合计
1953年
36.3 59.3 4.4
100
1964年
40.7 55.7 3.6
100
1982年
33.6 61.5 4.9
100
1990年
27.5 66.7 5.8
100
2000年
22.9 70.1 7.0
100
(3)分析现象之间的依存关系
中国农民家庭按收入分组的恩格尔系数
▪ 检查数据中的错误
2. 数据的排序
▪ 升序和降序 ▪ 寻找数据的基本特征
3. 数据的筛选
▪ 找出符合条件的数据
数据的审核
1. 完整性与及时性审核
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全 – 检查填报单位是否按时报送了有关数据
2. 准确性审核
– 检查数据是否真实反映客观实际情况,内 容是否符合实际
– 检查数据是否有错误,计算是否正确等
• 审核数据准确性的常用方法
1. 逻辑检查
– 从定性角度,审核数据是否符合逻辑,内容是否 合理,各项目或数字之间有无相互矛盾的现象
– 主要用于对分类和顺序数据的审核
2. 计算检查
– 检查调查表中的各项数据在计算结果和计算方法 上有无错误
第三章统计数据的整理与显示
统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
【统计学 精品课件】第3章 统计数据的整理与显示
• 1.单项式分组与组距式分组
• 单项式分组就是用一个变量值作为一组,形成单项式变量 数列。
• 单项式分组一般适用于离散型变量且变量变动范围不大的 场合。
• 3.统计表的分类 • (1)按主词的结构分类,根据主词是否分组和 分组的程度,分为简单表、分组表和复合表
• (2)按宾词的设计分类,可分为宾词简单排列、 分组平行排列和分组层叠排列三种
• 3.统计表的设计 • (1)标题设计 • (2)线条的绘制 • (3)合计栏的设置 • (4)指标数值 • (5)计量单位 • (6)注解或资料来源
•
(3k-2)1 3.22lg N
•
d R xmax xmin
• (3-3)
k 1 3.22 lg N
• 式中:k为组数;N为总体单位数;d为组距;R为全距, 即最大变量值xmax与最小变量值xmin之差。
• 上下限之间的中点数值称为组中值,组中值的计算公式
为: •
组中值 上限+下限 2
• 当研究目的在于探讨总体在某一标志上的构成,而将总体 划分为若干组成部分以显示所研究标志的结构时,这种分 组称为结构分组。
• (3)可以揭示现象之间的依存关系
• 当研究目的在于探讨同一总体范围内两个可变标志的依存 关系时,可以将其中一个可变标志(自变量)作为分组标 志,以观察另一标志(因变量)相应的变动情况。这种分 组称为分析分组,它可以揭示现象之间的依存关系。
• 按品质标志分组编制的分布数列叫做品质分布数列或属 性分布数列,简称为品质数列。
统计数据的整理及其显示(ppt-107页)(共106张PPT)全篇
穷尽原则
互斥原则
注意:统计分组是对总体认识深化的手段,它是一切统计研究的基 础,应用于统计工作的全过程,是统计研究的基本方法。
⑴ 类型分组
揭露社会经济现象的类型,反映各类型的特点。
例
单位:亿元
类 型 1999年 2000年 2001年 2002年
农业 14 106.2 13 873.6 14 462.8 14 931.5
审核
对第二手数据: 完整性: 准确性: 适用性:数据的来源、口径以及
有关背景资料; 时效性:尽可能使用最新的数据。
(2)数据筛选
当数据中的错误不能予以纠正,或者有些数据不符合 调查的要求而又无法弥补时,需要对数据进行筛选。
数据筛选的内容:
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除;
例如:企业按人数分组
499及以下
500 ~ 999
1000 ~ 2999 3000及以上
工人按工资分组
600 ~ 700 700 ~ 800 800 ~ 1200
1200 ~ 1500
适用条件: 它适用于变量值变化范围较大、不同变量值个数
较多的离散型变量及连续型变量的场合。
注意:连续型变量的数值不能一一列举,故
例如:按以五分制计分的成绩对全班100名学生进行分组,宜单 变量数列;按以百分制计分的成绩对全班100名学生进行分组 ,宜组距式数列;
1. 定类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯
上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排列
,也可按笔画排序,其中也有笔画多少的升 序降序之分
2. 定距和定比数据的排序
递递增增排排序序:后设可一表组示数为据:为X(1X)1<,X(X2)2<,……<X,(NX) N, 递减排序可表示为:X(1)>X(2)>…>X(N)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 2.掌握3.掌握 4.
用Excel
5.
§3.1数据的预处理
3.1.1 数据审核
3.1.2 数据筛选
3.1.3 数据排序
1.
错误2.
符合条件
3.
升序和降序
4.
按需要汇总
(raw data)
完整性准确性
检查数据是否有错误,计算是否正确等
数值型数据,计算检查)
(second hand data)
1.适用性
2.时效性
3.确认
(data filter)
1. 2.
不符合明显错误
剔除符合筛选出来,而不
用Excel 进行数据筛选
8名学生的考试成绩数据(data filter)
(data rank)
1.一定顺序
2.
有助于
3.
排序本身就是分析的目的
4.借助于计算机
(方法)
1.分类数据 字母型习惯上
用升序
汉字型首位拼音字母笔画多少
2.数值型–递增递增
–递减x (2)>…>x (n)
数据透视表
(pivot table )
1.
复杂提取有用 2.重要信息汇总和作图
3. 4.首行
列标题
拖至
区域,将需要汇总的“变
【向导—3步骤之3】对
,即可输出数据透视表
§3.2 分类和顺序数据的整理与显示
3.2.1 分类数据的整理与显示
3.2.2 顺序数据的整理与显示
(基本问题)
1.弄清数据类型
2.分类数据和顺序数据分类整理
3.数值型数据分组整理
4.适合于低层次数据的整理和显示方法也适合
于高层次的数据;但适合于高层次数据的整
(基本过程) B
A
E
D
C
比率
百分比
比例
频数
分类
(可计算的统计量)
1.个数
2.一类别全部数
据
3.
4.不同类别
制作频数分布表
(bar Chart )
1.宽度相同高度或长短
2.单式复式
3.分类数据频数分布
4.
条形图可以横置或纵置
汇源果汁
露露
品牌
(side - 1.不
同时间或不同空间2.差异或变化趋势
688
563
328247
戴尔
电脑品牌
1.
频数多少排序2.分类数据不同品牌饮料的帕累托图
百事可乐
露露
汇源果汁
品牌
(pie Chart)
1.圆形及圆内扇形的角度
2.各组成部分所
占的比例结构性问题
3.绘制圆形图时,总体中各部分所占的百分
比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占
不同品牌饮料的构成
旭日升冰茶
22%
分类数据显示图例
(可计算的指标)
频数逐级累加
频率(百分比)的逐级累加
☺
☺☺☺☺☺
—
—
—
100.092562510276168753044.075.090.0100.0132225270300
乙城市
回答类别
100.093.060.034.012.7300279180102387.040.066.087.3100.0211201982623007.033.026.021.312.72199786438非常不满意不满意一般满意
非常满意百分比(%)户数(户)百分比(%)户数(户)向下累积向上累积
百分比(%)户数(户)乙城市家庭对住房状况评价的频数分布
(24
300
132
225
2700
100
200300400
非常不满意
不满意一般满意
非常
满意
累积户数(户)(a)向上累积
非常不满意
不满意一般满意非常满意
(b)向下累积甲城市家庭对住房状况评价的累积频数分布
甲城市家庭对住房状况评价的累积频数分布
(annular chart)
1. 2.
同时绘制多个总体
3. 4.环形图主要用于展示分类和顺序数据
满意非常满意
§3.3 数值型数据的整理与显示
3.3.1 数据分组
3.3.2 数值型数据的图示
等距分组等距分组异距分组
异距分组
(要点)
一个变量值离散变量值较少的情况
☺☺☺☺
(要点)
1.一个区间
2.连续变量
3.
变量值较多4.
“不重不漏”5.等距不等距☺~ ☺☺~ ☺☺~ ☺☺~ ☺☺~ ☺
(步骤)
1.确定组数
2.确定组距
上限与下限之差,可根据全部数据的最大
统计频数并整理成频数分布表
(几个概念)
(例题分析)【例】某电脑
公司2005年前
四个月各天的
销售量数据(
单位:台)。
试对数据进行
分组。
(步骤)
1.
用Excel 制作频数分布表
(上下组限重叠)
(上下组限间断)
(使用开口组)
(在表现频数分布上的差异)
1.等距
不受
绝对频数
2.不等距
受
各组绝对频数的多少不能反映频数分布的实际
频数密度组距)反映
Excel
分组数据—。