第3章统计数据的整理与显示

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3章统计数据的整理与显⽰
第三章数据的整理与显⽰
§1 数据的预处理
⼀、数据的审核与筛选
完整性审核:主要是检查应调查的单位或个体是否有遗漏,所有的调查项⽬或指标是否填写齐全等。

准确性审核:1. 检查数据资料是否真实地反映了客观实际情况,内容是否
符合实际;
2. 检查数据是否有错误,计算是否正确等。

数据筛选:
1. 将某些不符合要求的数据或有明显错误的数据予以剔除;
2. 将符合某种特定条件的数据筛选出来,⽽不符合条件的数据予以剔除。

⼆、数据的排序
数据排序是按⼀定顺序将数据排列,以便于研究者通过浏览数据发现⼀些明显的特征或趋势,找到解决问题的线索。

原始数据 n x x x x ,,,,321
顺序统计量 '''21n x x x 或'''21n x x x
§2 属性数据的整理与显⽰
⼀、分类数据的整理与显⽰(⼀)频数与频数分布
1. 频数(frequency 次数):是落在各类别中的数据个数。

频数分布(frequency distribution 次数分布):各个类别及其相应的频数全部列出来。

2. ⽐例(proportion ):是⼀个总体(或样本)中各个部分的数值占全部数值的⽐重,通常⽤于反映总体的构成或结构。

3. 百分⽐(percentage ):将⽐例乘以100就是百分⽐或百分数,它是将对⽐的基数抽象化为100⽽计算出来的,⽤%表⽰。

4. ⽐率(ratio ):是各不同类别数值之间的对⽐关系,因⽽⽐值可能⼤于1。

(⼆)分类数据的图⽰ 1. 条形图(bar chart )2. 饼图(pie chart )⼆、顺序数据的整理与显⽰(⼀)累积频数和累积频率
1.累积频数(cumulative frequencies )就是将各类别的频数逐级累加起来。

向上累积向下累积
(⼆)顺序数据的图式
1.累积频数分布图 2.环形图
§3 定量数据的整理与显⽰
⼀、数据的分组
分组就是根据统计研究的需要,将数据按照某种标准划分成不同的组别,分组后再计算出各组中出现的次数或频数,形成频数分布表。

相关概念: [1] 组数
[2] 组限(limit ):各组的数量界限。

上限不包括在本组范围内开⼝组:没有上限或没有下限的组
开⼝组(第⼀组)的下限=本组上限-邻组组距开⼝组(最末组)的上限=本组下限+邻组组距 [3] 组距(class width ):⼀组的上限与下限之差等距数列异距数列
[4] 全距:数列中最⼤值和最⼩值的差全距=最⼤值-最⼩值
=最⼤⼀组的上限-最⼩⼀组的下限 =组距*组数
[5] 组中值(class midpoint ):前提是组内变量变化均匀组中值=(上限+下限)/2 分组的步骤: 1.确定的组数
斯特奇斯(Sturges )经验公式 K=1+lgn/lg2 2.确定各组组距
组距K
X X d min
max
取⽐该值稍⼤的相对整数
3.根据分组整理成频数分布表⼆、数值型数据的图⽰
(⼀)分组数据:直⽅图(histogram )和折线图(frequency polygon )
(⼆)未分组数据:茎叶图(stem-and-leaf display )和箱线图(box plot )
(三)时间序列数据:线型图(line plot )
(四)两个变量间关系的图⽰:散点图
(五)多变量数据:雷达图(radar chart )
三、频数分布的类型
正态分布、正偏(右偏)分布、负偏(左偏)分布、正J型分布、反J型分布、U分布
§4 统计表
⼀、统计表的概念
统计表是统计资料的⼀种重要的表现形式。

把整理汇总得出的统计数据资料,按照⼀定的结构和顺序,有系统地排列在⼀定的表格之内。

⼆、统计表的结构
[1]
[2] 按其反映的统计数列内容的不同分:
空间数列表——即同⼀时间条件下,不同空间的数列
时间数列表——是同⼀空间的不同时间的数列
[3] 按其总体分组的不同分:
简单表
简单分组表
复合分组表
四、统计表的设计
[1] 统计表内容的设计
a、主语与谓语的安排通盘考虑,内容不要过分庞杂,最好⼀个表集中
说明⼀个问题。

b、总标题,栏、⾏标题应简明扼要,栏、⾏的排列要表达统计资料的
逻辑关系。

c 、表中的数值要注明计算单位。

d 、表中的数字必须填列清楚,没有内容时应标出“—”号。

[2] 统计表形式的设计
统计表的纵栏为了便于引⽤表内数值可以编号;
横⾏为了便于阅读,在填列数距时可以每隔五⾏空⼀⾏;
资料来源、注释⼀般都写在表下,必要时可以附简要的说明。

§5 数据的汇总与⽐较
⼀、数据的汇总——总量指标
(⼀)概念及分类
总量指标是指反映总体的规模或⽔平的数量范畴,⼜称绝对数。

基本特征:
1.具有⼀重性的计量单位 2.与总体的概念相关联 3.只说明总体的规模或⽔平分类:
1.总体单位总量与标志总量 2.时期指标与时点指标
(⼆)作⽤
1.是认识事物的起点; 2.是决策和管理的依据; 3.是其他指标的计算基础。

(三)计算⽅法1.直接汇总——混合量
2.折算汇总——标准实物产量⼆、数据的⽐较——相对指标
(⼀)概念与表现形式 1.概念
两个数量进⾏对⽐形成的统计指标称为相对指标,⼜称相对数。

2.数值表现形式
⽆名数:⽐较双⽅单位相同导致⽆名数有名数:⽐较双⽅单位不同导致有名数(⼆)作⽤
第⼀,反映总体深层次的数量特征;第⼆,具有⼴泛的可⽐性。

区分的意义
数据的收集⽅法不同
数据的加⼯与使⽤不同
品的⽀出/全部消费⽀出);基尼系数=A/(A+B)
2.⽐例相对数
⼈⼝性别⽐例;积累与消费⽐例;农轻重⽐例
3.动态相对数
经济发展速度;商品价格指数;成本指数
4.⽐较相对数
中国⼈⼝预期寿命与世界⼈⼝平均预期寿命的⽐较;中国第三产业产值⽐重与美国第三产业⽐重的⽐较5.计划完成程度相对数
产量计划完成百分⽐;成本降低计划完成率
6.强度相对数
⼈⼝出⽣、死亡、⾃然增长率;资⾦利税率
六种相对指标的⽐较
(四)应⽤原则
应⽤相对指标要遵循以下原则:1.正确选择对⽐基础;
2.注意指标间的可⽐性;3.使⽤合适的表述形式;4.多种指标结合运⽤。

相关文档
最新文档