第三章 统计数据的整理与显示

合集下载

统计学第3章统计数据整理与显示

统计学第3章统计数据整理与显示
第三章
2013-11-21
本 章 内 容
第一节 统计数据整理概述 第二节 统计分组与频数分布数列
第三节 统计数据的显示
第四节
2013-11-21
EXCEL在数据整理应用示例
第一节 统计数据整理概述
一、统计数据整理的含义与要求
二、统计数据整理的步骤
三、统计数据的预处理
2013-11-21
一、统计数据整理的含义与要求
个体企业 其它企业
70~80分 (中等) 80~90分 (良好) 90~100分(优秀)
2013-11-21
统计分组是在总体内部进行的一种定性分类,把 总体划分为一个个性质不同,范围更小的总体。
统计分组有两个方面的含义,即:
是“分” 即将总体区分为性质 不同的若干组成部分
统计 分组
是“合” 即将性质相同的总 体单位合为一组
每一组中的最大变量值称为上限,每组最小变量值
称为下限。
重叠组限 在统计时 遵循“上 限不在内” 的原则。
工人按工资分组:
600 700 800 1200 ~ 700 ~ 800 ~ 1200 ~ 1500
企业按人数分组:
1 ~ 499 500 ~ 999 1000 ~ 2999 3000 ~ 3499
(4)按数量标志分组
数量标志分组,即变量分组。 例如, 按考分分组(分) 60以下 用数量来 60 ~ 70 表示各组 70 ~ 80 性质上的 80 ~ 90 差别 90 ~ 100 注意:第一,明确分组的目的,. 即通过数量的变化来区 分各组质的差别,而不是单纯的数量差别。 第二,采用适当的分组形式, 即要以什么样的数量作 为划分标准。是单项式或是组距式?如果是组距式分
2013-11-21

统计学课件 第三张章 数据的整理与显示

统计学课件 第三张章 数据的整理与显示

1. 2.掌握3.掌握 4.用Excel5.§3.1数据的预处理3.1.1 数据审核3.1.2 数据筛选3.1.3 数据排序1.错误2.符合条件3.升序和降序4.按需要汇总(raw data)完整性准确性检查数据是否有错误,计算是否正确等数值型数据,计算检查)(second hand data)1.适用性2.时效性3.确认(data filter)1. 2.不符合明显错误剔除符合筛选出来,而不用Excel 进行数据筛选8名学生的考试成绩数据(data filter)(data rank)1.一定顺序2.有助于3.排序本身就是分析的目的4.借助于计算机(方法)1.分类数据 字母型习惯上用升序汉字型首位拼音字母笔画多少2.数值型–递增递增–递减x (2)>…>x (n)数据透视表(pivot table )1.复杂提取有用 2.重要信息汇总和作图3. 4.首行列标题拖至区域,将需要汇总的“变【向导—3步骤之3】对,即可输出数据透视表§3.2 分类和顺序数据的整理与显示3.2.1 分类数据的整理与显示3.2.2 顺序数据的整理与显示(基本问题)1.弄清数据类型2.分类数据和顺序数据分类整理3.数值型数据分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整(基本过程) BAEDC比率百分比比例频数分类(可计算的统计量)1.个数2.一类别全部数据3.4.不同类别制作频数分布表(bar Chart )1.宽度相同高度或长短2.单式复式3.分类数据频数分布4.条形图可以横置或纵置汇源果汁露露品牌(side - 1.不同时间或不同空间2.差异或变化趋势688563328247戴尔电脑品牌1.频数多少排序2.分类数据不同品牌饮料的帕累托图百事可乐露露汇源果汁品牌(pie Chart)1.圆形及圆内扇形的角度2.各组成部分所占的比例结构性问题3.绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占不同品牌饮料的构成旭日升冰茶22%分类数据显示图例(可计算的指标)频数逐级累加频率(百分比)的逐级累加☺☺☺☺☺☺———100.092562510276168753044.075.090.0100.0132225270300乙城市回答类别100.093.060.034.012.7300279180102387.040.066.087.3100.0211201982623007.033.026.021.312.72199786438非常不满意不满意一般满意非常满意百分比(%)户数(户)百分比(%)户数(户)向下累积向上累积百分比(%)户数(户)乙城市家庭对住房状况评价的频数分布(243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向上累积非常不满意不满意一般满意非常满意(b)向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布(annular chart)1. 2.同时绘制多个总体3. 4.环形图主要用于展示分类和顺序数据满意非常满意§3.3 数值型数据的整理与显示3.3.1 数据分组3.3.2 数值型数据的图示等距分组等距分组异距分组异距分组(要点)一个变量值离散变量值较少的情况☺☺☺☺(要点)1.一个区间2.连续变量3.变量值较多4.“不重不漏”5.等距不等距☺~ ☺☺~ ☺☺~ ☺☺~ ☺☺~ ☺(步骤)1.确定组数2.确定组距上限与下限之差,可根据全部数据的最大统计频数并整理成频数分布表(几个概念)(例题分析)【例】某电脑公司2005年前四个月各天的销售量数据(单位:台)。

第三章_数据的整理与显示讲解

第三章_数据的整理与显示讲解
2. 数据筛选的内容包括:2个
将某些不符合要求的数据或有明显错误的数据
予以剔除
将符合某种特定条件的数据筛选出来,而不符
合特定条件的数据予以剔除
数据筛选
(data filter)
用EXCEL进行数据筛选
8名学生的考试成绩数据
数据排序
1. 按一定顺序将数据排列,以发现一些明显的 特征或趋势,找到解决问题的线索
一、数据的分组
分组的方法: 单变量值分组和组距分组
例题:数据的分组是( )
A 统计调查阶段的基本方法 B 统计整理阶段的基本方法 C 统计分析阶段的基本方法 D 贯穿于统计工作全过程的基本方法
答案 B
例题:离散型变量分组的方法( ) A 只能是单变量值分组 B 既可以是单变量值分组,也可以使组距分组 C 只能是组距分组 D 不能进行分组
如表3-8:140~149,150~159,160~169…… 对于连续变量,可以采取相邻两组限重叠 的方法,根据“上限不在内”的规定解决不重 的问题,也可以对一个组的上限采用小数点的 形式(小数点的位数根据所要求的精度具体确 定)。 如:10~11.99,12~13.99,14~15.99
例题:划分连续型变量的组限时,相邻组的组 限通常( )。
第 3 章 数据的整理与显示
3.1 数据的预处理 3.2 分类和顺序数据的整理与显示 3.3 数值型数据的整理与显示 3.4 统计表
3.1 数据的预处理
数据的预处理是数据整理的先前步骤,包括:
1.数据的审核
检查数据中的错误
2.数据的筛选
找出符合条件的数据
3.数据排序
升序和降序 寻找数据的基本特征
资料审核、分组、 汇总、制表、制图等。

统计学第三章(统计资料的整理与展示)

统计学第三章(统计资料的整理与展示)

第三章统计数据的整理与显示一、单项选择题:1.将统计总体按某一标志进行分组后,其结果是()。

A.组内同质性,组间同质性B.组内差异性,组间差异性C.组内同质性,组间差异性D.组内差异性,组间同质性2.在组距数列中,当全距确定时,组距与组数的关系是()。

A.组距越大,组数越小B.组距越大,组数越大C.组距越小,组数越小D.组距与组数的关系不确定3.连续型量在确定组限时,相邻组的组限必须()。

A.间断B.重叠C.相等D.不等4.变量数列中,各组频率的合计数应该为()。

A.大于1B.等于1C.小于1D.不等于15.在异距数列中,要准确反映其分布状况,必须采用()。

A.向上累计B.向下累计C.频数D.频率密度6.计算向上累计次数或频数时,其计数表达的意义是()。

A.上限以下的累计次数或频数B.上限以上的累计次数或频数C.下限以下的累计次数或频数D.上限以上的累计次数或频数7.在统计表中,说明统计表名称的词语是()。

A.主词B.宾词C.总标题D.横行标题8.次数分布的特征是:两头小,中间大。

即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。

这种次数分布是()。

A.正态分布B.U形分布C.正J形分布D.反J形分布9.类似于直方图,与直方图比较,其构造更容易,且能显示变量的实际值,从而不会因数据分组将具体的数值信息丢失,这种图是()。

A.折线图B.曲线图C.茎叶图D.帕拉图10.填写统计表时,当某一位置不应该有数字,应用的符号是()。

A.0B.×C.…D.–二、多项选择题:1.在统计数据整理之前,要对统计数据进行审核。

审核的主要内容是()。

A.数据的准确性B.数据的及时性C.数据的系统性D.数据的完整性E.数据的客观性2.统计分组的作用是()。

A.划分社会经济现象的类型B.刻画总体具有的特征C.揭示社会经济现象的内部构成D.反映总体单位的分布情况E.分析社会经济现象之间的依存关系3.在组距数列中,组中值是()。

第三章统计数据的整理与显示

第三章统计数据的整理与显示

统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8

统计数据的整理和显(1)

统计数据的整理和显(1)
• 正确选择分组标志 ——根据统计研究的目的选择 ——在多个标志中选择最能反映事物本质特征的标志 ——注意不同时代标志的意义变化
分组的原则:穷尽和互斥
1.按品质标志分组或按数量标志分组,或用两 种标志结合分组 2.按主要标志与辅助标志分组
(四)统计分组体系
1.简单分组与平行分组
标 按性别分组
志 男性 女性
(二)统计分组的作用
1.划分性质不同的各种类型,研究其特征和规律性
表1 我国近几年农业总产值情况 单位:亿元
类型 1995年 1996年 1997年 1998年
农业 11884.6 13539.8 13866.9 14099.3
林业
709.9
778 817.8 848.7
牧业
6044.9 7083 7620.3 7729.8
如:某校按学生人数分组,其组限为: 100人以下 101—200 201—300 301人以上
组距分组中,上述分组都是等距分组,即各组组 距相等,其特点是:
由于各组组距相等,各组次数的分布不受组距大 小的影响,它消除了组距对其分布的影响,与次数 密度的分布是一致的,一般呈正态分布。
同时也存在不等距分组即只要有一组组距不相等的 分组,也称异距分组。例如学生年龄18岁以下,1920,21-24,25岁以上等。其特点是:
60—70
—60
70以上等
61人以上等
我们把这种分组形式称为开口组。“以下”称之 为下开口,“以上”称之为上开口。
下开口的组中值=本组上限-(1/2)*相邻组 的组距
上开口的组中值=本组下限+(1/2)*相邻组 的组距
例如结合上面学生成绩的分布计算其组中值 下开口组中值=60-(1/2)×(70-60)=55 上开口组中值=70+(1/2)×(70-60)=75

《管理统计学》焦建玲 第03章 描述性统计分析

《管理统计学》焦建玲 第03章 描述性统计分析

第三章 描述性统计分析
3.1 统计数据整理与显示
频数分布
【例3-1】以下是一个班级60名学生数学期末考试成绩,请编制 组距式变量数列。 90 78 81 64 83 75 78 79 81 82 91 93 95 94 84 64 61 87 70 60 20 65 77 73 78 92 88 73 86 73 64 76 71 67 63 69 70 89 90 83 74 79 76 99 75 38 55 82 93 98 85 78 89 66 71 84 70 68 72 80
第三章 描述性统计分析
3.1 统计数据整理与显示
统计分组
统计分组是根据统计研究的任务的要求和现象总体的内 在特点,按照一定的标志,将统计总体区分为不同类型或 不同性质的若干组成部分。这些组成部分中的每一个部分 就叫做一个分组,通过分组把总体内部不同性质的单位分 开,把性质相同的单位归并在一个组内,说明总体内部各 组之间的相互关系及其特征。
下限公式: 上限公式:
Me L
fi 2 Sm1 h fm
Me U
fi 2 Sm1 h fm
第三章 描述性统计分析
3.1 统计数据整理与显示
【例3-2】某高校随机抽取300名学生的身高样本资料,
并根据研究需求对样本进行分组,数据如表3-4所示,试
计算该校学生身高的中位数。
表3-4 某高校学生身高样本数据
第三章 描述性统计分析
3.1 统计数据整理与显示
频数分布
组限的具体形式有间断组限和重合组限,开口组限和闭口组限。 例如:企业职工按年龄分组,其 组限可表示为:30岁以下,30~39 岁,40~49岁,50~59岁,60岁以 上。
间断组限是每一组的组限与邻组的组限都是间断设置的。

统计学(第3章)

统计学(第3章)
第三章 统计数据的整理 6
4、定比尺度(比率尺度 ratio scale)
是对事物之间比值的一种测度,可用
于参数与非参数统计推断。 特征:

除区分事物的类别、进行排序、比较大 小,而且还可以进行加减乘除运算。 具有绝对零点,即“0”表示“没有” 或“不存在”。 所有统计量都可以对其进行分析。与定 距尺度的唯一区别是有绝对固定的零点。
第三章 统计数据的整理 10
3、观察数据和实验数据


观察数据:通过调查或观测而得 到的数据。 实验数据:通过控制实验对象而 收集的数据。
第三章 统计数据的整理
11
4、直接数据和间接数据
直接数据:即原始数据。
间接数据:已加工整理过的数据。
第三章 统计数据的整理
12
第二节 统计整理的含义和步骤



当异距分组时,各组的次数还受 到组距不同的影响。为消除异距 分组的这种影响,须计算频率密 度(或次数密度),计算公式: 频数密度 = 频数/组距 频率密度 = 频率/组距
第三章 统计数据的整理
36
二、分布数列的编制
将原始资料按其数值大小重新排列 2. 确定全距 3. 确定组距和组数 4. 确定组限 5. 编制变量数列 示例3-5
第三章 统计数据的整理
某地人口
21
(三)按分组标志的不同性质分
品质分组(属性分组):是将总体按
品质(或属性)标志进行分组。如企 业按经济成份、企业规模,职工按性 别、文化程度分组等。 数量分组(变量分组):是将总体按 数量标志进行分组,如企业按职工人 数、劳动生产率分组,职工按工龄、 工资分组等。
第三章 统计数据的整理 31
4、开口组的组距与组中值

统计学基础(第三章)

统计学基础(第三章)

7.0 40.0 66.0 87.3 100.0 —
300 279 180 102 38 —
100.0 93.0 60.0 34.0 12.7 —
statistics
统计学——第三章数据整理与显示 数值数据(定距数据)的分组
单项分组:每一个组中只有一个变量值,适用于离散型变量 的数据、并且数据的范围不太大情况下的分组。 组距分组:每个分组是一个数值区间。它适用于连续型变量 或变动范围较大的离散型变量的数据分组。
statistics
统计学——第三章数据整理与显示
具体步骤:
(1)打开Excel工作表中“工具”下拉菜单中的“数据分析”选项。
(2)在“数据分析”对话框中选择“直方图”命令,并点击“确定”按钮。 (3)在该对话框中“输入区域”一栏填入数据区域B2:B41;在“接收区域” 一栏填入代码区域C2:C5;在“输出区域”一栏填入结果输出的区域;其他 选项根据需要选择。点击“确定”按钮,得结果。 (4)对输出结果进行还原并适当改造,即可得频数分布。
统计学——第三章数据整理与显示
第四节 统 计 图

statistics
统计学——第三章数据整理与显示
统计图的结构
标题 一般包括图表标题、数值轴(X,Y)标题 坐标轴和网格线 坐标轴和网格线构造了绘图区的骨架, 借助坐标轴和网格线,可以更容易读懂统计图。 图表区和绘图区 统计表的所有内容都在图表区内,包括 绘图区。统计图绘制在绘图区内。 图例 用来标明图表中的数据系列。
答:调查整理的结果为
甲城市 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 户数/户 24 108 93 45 30 300 百分比/% 8 36 31 15 10 100 向上累积 24 132 225 270 300 — 8.0 44.0 75.0 90.0 100.0 — 向下累积 百分比/% 100 92 56 25 10 — 300 276 168 75 30 — 户数/户 百分比/% 户数/户

第三章 统计数据的整理

第三章 统计数据的整理

土 地 面 积
人口密度
日本
美国
欧共体
统计地图
合成纤维人造纤维的地域分布
(四)统计图的构成
图题
某国各地降水量
90 80 70 60 50 40
1 图题 2 图号 3 图目
4 图尺 5 图形 6 图注
图 目
降 水 量 ( 毫 米 )
图形
图注
东部 西部 北部
图尺 30
20 10 0 第一季度 第二季度 第三季度 第四季度
分配数列的种类
1.按分组标志的性质不同
品质变量数列:按品质变量分组形成
数值变量数列:按数值变量分组形成
2.数值变量数列还可分为 单项数列:每组只有一个变量值的变量数列 组距数列:每组变量值是一段区间的变量数列
连续变量数列:按连续变量分组形成的数列
离散变量数列:按离散变量分组形成的数列
品质变量分配数列实例
本章重难点提示
本章重点:统计分组、变量数列的编制、统计数据的显示方 法——统计表和统计图。 本章难点:统计分组、变量数列的编制、次数分布图的绘制。
第一节 数据整理的一般问题
一 数据整理的概念和作用
(一)概念 对统计调查所搜集到的数据进行分类和汇总,使 其系统化、条理化、科学化,以得出反映事物总体综 合特征的资料的工作过程。
100-500 500以上
180
85 35
7.83
3.70 1.52
合计
2300
100.00
单项式变量数列实例
表3-4 家庭人口数(人) 1 某市居民家庭按家庭人口数分组 家庭数(千户) 9.8 比重(%) 5.76
2
3
27.5
94.6

第三章 统计数据的整理和显示

第三章  统计数据的整理和显示
调查得到 的原始 统计资料 加工整理, 归并汇总, 重新排列
发现数据 的规律性, 作进一步的 统计分析
二、统计整理的步骤

1.统计资料的审核
包括对资料的完整性和准确性审核。
2.统计资料的分组和汇总
分组和汇总是统计整理的中心工作
3.编制统计图表
统计图表是统计整理成果最常用的表现形式,
举例

政治面貌
中共党员 团员 中共党员 团员
按别

政治面貌

3.
按分组的作用分
类型分组 结构分组 分析分组
四、分组体系
1.概念:统计分组体系是指在统计整理中,为研究现 象总体的情况而运用多个分组标志对总体进行分组,从而 形成一系列相互联系、相互补充的分组体系。 2.分类:平行分组体系和复合分组体系。 平行分组体系就是对同一总体进行若干次简单分组。 复合分组体系就是对某一总体进行某种复合分组。 汉族12人,占60% 1.按民族分组 回族5人,占25% 平 满族3人,占15% 行 20岁5人,占25% 分 21岁5人,占25% 组 2.按年龄分组 22岁2人,占10% 体 23岁8人,占40% 系 中共党员8人,占40% 3.按政治面貌分组 团员12人,占60%

一、统计整理的意义

统计整理:根据统计研究的目的,对统计 调查所搜集到的原始资料进行分组、汇总, 使其条理化、系统化的工作过程。
对于已整理过的初级资料进行再整理,也属于
统计整理。

意义:整个统计工作和研究过程的中间
环节,起着承前启后的作用。统计整 理是统计调查的继续,又是统计分析 的基础。
适用于连续型变量 变动范围比较大的离散型变量
某班考试成绩统计表

统计学 第3章 数据的整理与显示

统计学 第3章  数据的整理与显示

主讲:王光玲,济南大学商学院 45
2.统计分组的方法
2)数量标志分组 ——按表现总体单位数量特征的标 志进行的分组 。
例如,按职工人数分组、按人口年龄分组、按工资收 入水平分组、按销售额分组等
(1)单项式分组:每组变量值是一个值 (2)组距式分组:每组变量值是一个区间。
2020/5/14
46
小作业:课后将课本P50的例3-1和3-2的例子演示
一遍!
2020/5/14
39
3.2 统计分组与频数分布
3.2.1 统计分组 3.2.2 频数分布及统计图
主讲:王光玲,济南大学经济学院
3.2.1 统计分组
主讲:王光玲,济南大学经济学院
1、统计分组(见P52)
概念:根据统计研究的目的和客观现象的内在特点,按 照一定的标志把被研究总体划分为若干个性质不同但又 有联系的组,称为统计分组。
某单位共有1000名职工,每名职工的文化程度、月收入、 婚姻状况等个体特征都有所不同(变异)。若该单位领导 想从总体上了解职工队伍的文化程度、月收入、婚姻状况 等情况,则可先要通过登记方法获得每个职工的资料,对 这些描述每名职工个体特征的资料进行分类汇总和分析计 算,就可以了解该单位全部职工中有多少人未婚、多少人 已婚、多少人离婚、多少人丧偶,各自所占的百分比是多 少;也可以了解研究生、大学、中专(高中)等不同文化 程度职工的人数及比重;还可以了解职工月平均工资、各 类职工的工资水平、职工工资分布的均衡性等等,以上内 容均为统计整理的有效信息,这些统计信息对于制定企业 的人力资源计划是十分必要的。
2020/5/14
43
2.统计分组的方法
1)品质标志分组 ——按研究对象的某种属性特征分组。
(2)复合分组:对总体按两个或两个以上的标志进 行的重叠式分组。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据整理的原则:
1.目的性原则 2.联系性原则 3.简明性原则
数据整理的内容
编制 统计图表
审核
汇总
分组
数据整理的具体步骤
(1)对搜集到的资料进行全面审核,以确 保统计资料符合统计研究目的的要求, 资料准确无误。 (2)根据研究目和统计分析的需要,选择 整理的标志,并进行划类分组。
(3)在分组的基础上,将各项资料进 行汇总,得出反映各组和总体数量 特征的各种指标。 (4)统计资料的显示。即通过编制统 计表和绘制统计图,将整理出的资 料简捷明了、系统有序地显示出来。 (5)对统计数据分门别类地系统积 累。
18.18
1100
100.00
(二)变量分组的方法
按数量标志分组,应注意如下两个问题: 首先,分组时各组数量界限的确定必须 能反映事物质的差别。 其次,应根据被研究的现象总体的数量 特征,采用适当的分组形式,确定相宜 的组距、组限。
例3-2:各国家庭收入分组 出于对市场研究的目的,我们将各国家庭划分 为各个收入组。 其中:年收入在10000美元以下的称为“贫 困”, 收入在10000至30000美元的称为“中 下”, 收入在30000至50000美元的称为“中 等”, 收入在50000至100000美元的称为“中 上”, 收入在100000美元以上的称为“富 裕”。
统计整理的意义: 1、统计整理是整个统计工作和研究过 程的中间环节,起着承前启后的作用。 统计整理是统计调查的继续,又是统计 分析的基础。 2、统计整理还是积累历史资料的必要手 段。
统计整理的类型: 1.定期统计报表数据的整理 2.专题性统计数据的整理 3.历史统计数据的整理
二、统计整理的原则和内容
变量数列
单项数列 组距数列
等距数列
异距数列
七、组距、组数与组中值
(一)组距 组距是各组上下限之间的距离,即 各组最大标志值与最小标志值之差。
(二)组数
全距是总体中最大的标志值与最小的标志值 之差。 组数的多少直接取决于两个因素,一个是总 体的全距,另一个是组距。在等距分组的 条件下,组数等于全距除以组距。在组距 既定的条件下,全距大则组数多,全距小 则组数少;在全距既定的条件下,组距大 则组数少,组距小则组数多。
四、频数分布的类型
(一)钟型分布
钟型分布的特征是“两头小,中间大”, 即靠近中间的变量值分布的次数多,靠近 两边的变量值分布的次数少,其曲线图宛 如一口钟,如下图所示。
正偏(右偏)
负偏(左偏)
(
a)正态分布
(b)偏态分布
如图(a)所示,其分布特征是以标志变量 中心为对称轴,左右两侧对称,两侧变量值 分布的次数随着与中间变量值距离的增大而 渐次减少。在统计学中,称这种分布为对称 分布。 而图(b)为非对称分布,它们各有不同方 向的偏态,即左偏态分布和右偏态分布。客 观实际中,许多社会现象统计总体的分布都 趋于对称分布中的正态分布。正态分布是描 述统计中的一种主要分布,它在社会经济统 计分析中具有重要的意义。
三、数据的预处理
(一)数据的审核
1.审核资料的完整性和及时性 审核资料的完整性,就是看调查单位或填报 单位是否齐全;规定的项目是否都有答案, 应报资料的份数是否符合规定。 审核资料的及时性,是看填报单位是否按时 报送了有关资料。对不报、漏报或迟报的 现象都要及时查清。
2.审核资料的正确性: 审核资料的正确性,是检查所填报的资 料是否准确可靠。常用的审核方法有两 种: (1)逻辑检查 首先,从理论上或常识上检查资料是否 有悖常理、有无不切实际或不符合逻辑 的地方。 其次,是检查各项目之间有无相互矛盾 的地方。
例3-3:例:某高中学生年龄分布表
年龄(岁) 16 17 18 19 学生数 100 200 240 210 比率(%) 10.31 20.62 24.74 21.65
20
合计
220
970
22.68
100.00
(2)组距式分组:就是将变量依次划分 为几段区间,一段区间表现为“从…… 到……”距离,把一段区间内的所有变 量值归为一组,形成组距式变量数列。 区间的距离就是组距。对于连续型变量 或者变动范围较大的离散型变量,适宜 采用组距式分组。
教学目的和要求:
1.了解统计数据整理的概念和重要意义; 2.熟悉整理的原则和内容,并能进行预处理; 3.掌握分组的概念、特点和原则,能熟练进行分组,熟 悉分组的作用,了解分组的种类; 4.掌握频数分布的概念及其构成,熟悉频数分布的编制 方法; 5.掌握组限的表现形式及原则、组距和组中值的计算; 6.掌握统计表的含义及其构成,熟悉统计表的编制,了 解频数分布的种类及常用的统计图的绘制;
二、变量数列的编制
三、累计频数与累计频率
向上累计频数(或频率) ,即先列出各 组的上限,然后由标志值低的组向标志 值高的组依次累计频数(或频率)。某 组向上累计频数表明该组上限以下的各 组单位数之和是多少,某组向上累计频 率表明该组上限以下的各组单位数之和 占总体单位数的比重。
向下累计频数(或频率),即先列出各 组的下限,然后由标志值高的组向标志 值低的组依次累计频数(或频率)。某 组向下累计频数表明该组下限以上的各 组单位数之和是多少,某组向下累计频 率表明该组下限以上的各组单位数之和 占总体单位数的比重。
(二)资料审核后的订正
通过上述审核,如发现有缺报、缺份和缺项等 情况,应及时催报、补报;如有不正确之处, 则应分别不同情况作如下处理: (1)对于可以肯定的一般错误,应及时代为更正, 并通知原报单位。 (2)对于可疑之数或无法代为更正的错误,应要 求原单位复查更正。
(3)如果所发现的差错在其他单位也可能 发生时,应将错误情况通报所有单位, 以免发生类似错误。 (4)对于严重的错误,应发还重新填报, 并查明发生错误的原因,若属于违法行 为,则应依法严肃处理。
各国家庭收入分组表
收入类别 贫困 中下 中等 中上 家庭数(千家) 15743 34717 23036 16421 比重(%) 17.0 37.4 24.8 17.7
富裕
合 计
2911
92828
3.1
100.0
1.单项式分组与组距式分组
(1)单项式分组:就是用一个变量值(标志 值)作为一组,形成单项式变量数列。单项 式分组一般适用于离散型变量且变量变动范 围不大的场合。
f 0 1 f
(2)各组频率之和等于1 。即

f 1 f
(三)频数分布的种类
频数分布
品质频数分布
变量频数分布
单项数列
组距数列
1.品质频数分布:简称为品质数列,它是经 过属性分组后形成的频数分布,其组别表 现为一系列的概念或范畴。 2.变量频数分布:简称为变量数列,它是经 过变量分组后形成的分布数列,其组别表 现为不同的数值或数域。 ⑴单项数列:是以一个变量值为一组编制的 变量频数分布。 ⑵组距数列:是以表示一定变动范围的两个 变量值构成的组所编制的变量频数分布。
第二节 统计分组
本节重点: 统计分组的概念、作用和原则 统计分组的方法 本节难点: 统计分组的方法
一、统计分组的概念
根据社会经济现象的特点和统计研 究的目的要求,按照某个重要标志 (或几个标志)把总体划分为若干 不同性质的组,称为统计分组。
二、统计分组的原则
穷尽原则和互斥原则。
三、统计分组的作用
划分社会现象的不同类型 揭示社会现象的内部结构 分析社会现象之间的依存关系
四、分组的类型
按分组作用或目的不同
类型分组 结构分组
分析分组
四、分组的类型
按分组标志的多少
简单分组 复合分组
并列分组
四、分组的类型
按分组标志性质
属性分组
变量分组
、分组标志的选择
要符合统计研究的目的和要求 要选择最能说明事物本质特征的 标志 要考虑到现象所处的具体历史条 件
例3-4:某车间50名工人日加工零件数
117 110 108 112 137 122 118 131 134 114 124 123 125 127 120 129 126 117 123 128 139 133 122 119 124 107 134 133 113 115 117 127 126 120 139 130 123 122 123 128 122 118 118 118 124 125 112 108 112 121
?
本章教学时数

6学时
本章教学方法

讲授法、案例法、演示法
第一节 统计数据整理概述
本节重点: 数据整理的概念 数据预处理的方法

本节难点: 数据的预处理

一、统计整理及其类型
统计整理:就是对搜集得到的初始数据 进行审核、分组、汇总,使之条理化、 系统化,变成能反映总体特征的综合数 据的工作过程。对已整理过的资料(包 括历史资料)进行再加工也属于统计整 理。
2.间断组距式分组和连续组距式分组 (1)间断组距式分组 :是指组限不相连的 分组。 (2)连续组距式分组 :凡是组限相连(或重 叠)的分组,即以同一数值作为相邻两组的 共同界限的分组。统计上规定: “上限不在内” (例3-2即为此)
3.等距分组与异距分组 等距分组:就是标志值在各组保持相等 的组距,即各组的标志值变动都限于相 同的范围。凡是在标志值变动比较均匀 的情况下,都可采用等距分组。
六、统计分组的方法
(一)属性分组的方法
1.对事物进行属性分组,其组数的多少首先 取决于事物本身的特点。 2.对于有些事物构成比较复杂,组数可多可 少的情况,就需要考虑统计研究任务的具体 要求
例3-1:某校新生按民族分组表
按民族分组 汉族 少数民族 合计 学生人数 比率(%)
900
81.82
200
工人日加工零件频数分布表
按零件数分组 105-110 110-115 115-120 120-125 125-130 130-135 工人数 3 5 8 14 10 6 频率(%) 6 10 16 28 20 12
相关文档
最新文档