第3章统计整理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某区居民按家庭拥有汽车数分组 居民家庭拥有汽车数(辆) 0 居民户数 68
1
2 3或以上 合计
24
6 2 100
单项式分组适用于离散变量并且变量值的 变动范围不大的情况
2013-12-10 10
(2)组距式分组
将现象的总体变动范围划分为若干个区间, 以每个区间作为变量值
2005年全国人口年龄构成表
157.50
162.50
167.50
172.50
177.50
182.50
í ß É ¸
íß É¸
íß É¸
2013-12-10
28
绘制异距变量数列次数分布图的具体步骤与等距数列 类似,相区别的地方在于:以纵轴代表各组标准组距 次数并在上面标出各组标准组距次数所在位置;然后 以组距为宽,以标准组距次数为高,绘制相对应的矩 形,各组矩形组合构成直方图。
按年龄分组 0-14岁 15-64岁 65岁及以上 年末数 26504 94197 10055 比重% 20.3 72.0 7.7
组距式分组适用于连续变量和变 动范围较大的离散变量的情况
2013-12-10 11
3.3
分配数列
distributive series
3.3.1分配数列的意义和种类
在统计分组的基础上,将总体的所有单位按组进 行归类整理并按一定顺序排列,计算出各组的单 位数,形成了一个反映总体中各单位在各组中的 分布情况的数列,这个数列称为分配数列或次数 分布(frequency distribution) 分配数列由两要素组成,一是总体中按某标志分 的组,二是各组相应的分配次数或频率或标志值
第3章
统计整理
统计整理的意义和内容
统计分组 分配数列 统计图表
2013-12-10 1
3.1
统计整理的意义和内容
3.1.1统计整理(statistical Treatment)的意义
指根据统计研究的任务和要求,对统计调查所取得 的原始资料进行科学的分类、汇总或对已整理过的 资料进行再加工,使之系统化、条理化,以得到反 映现象总体特征的综合资料的工作过程
拟订统计整理纲要 审核原始资料
进行分组汇总
编制统计图表
完整性,主要检查调查单位资 料是否齐全,是否上报了规定 统计资料的保管与积累 的份数、调查项目是否完整等
2013-12-10 3
3.2
统计分组
statistical grouping
3.2.1统计分组的概念和作用
concept and function of statistical grouping
2013-12-10
13
1.品质分配数列
它由各组名称和次数构成,各组次数用绝对数表示, 即为频数;用相对数表示,即为频率。
我国2005年人口性别构成表 按性别分组 人数(万人) 比重(%) 男 女 合计 67375 63381 130756 51.50 48.50 100.00
(各组名称)
(次数或频数)
3.按分组标志的性质,可分为
品质标志分组和数量标志分组
2013-12-10
6
3.2.3 分组标志选择及界限的确定
1.应根据研究的目的与任务选择分组标志 2.选择最能体现现象本质特征的标志作为分组标志
3.结合现象发展的具体历史条件和经济条件
选择分组标志 划分各组界限就是在分组标志的变异范围内, 划定各相邻组间的性质界限和数量界限。 划分各组界限一定要本着保证各组组内单位的 同质性和组与组之间单位的差异性的原则进行
“十五”时期国内生产总值与增长速度
2013-12-10
23
“十五”时期各年年末电话用户数
2013-12-10
24
折线图 Polygon
40
30
20
10
ÈÊ Sum Ë ý
157.50 162.50 167.50 172.50 177.50 182.50
0 152.50
í ß É ¸
2013-12-10 25
(2)组距式变量数列
每个组由若干个变量值形成的区间表示。组距式变量数列 应用于连续变量分组或变动幅度较大、不重复值较多的离 散变量分组的情况
2013-12-10
15
3.3.2
变量数列的编制
arrange variable series
1.变量数列次数分布表的编制
(1)将各个变量值按大小顺序排列,以明确 变量的变化范围,并求全距。 全距=最大变量值- 最小变量值 Range =largest value -smallest value
2013-12-10
30
累计次数的特点是:同一数值的向上累计和向 下累计次数之和等于总体总次数,累计比率之 和等于100%或1。 累计次数分布还是计算位置平均数的依据。
2013-12-10
31
4.次数分布的主要类型 常见的次数(频率)分布图有三种:
钟型分布,包括对称钟型分布即正态分布,左偏 分布和右偏分布;
某组标准组距次数 该组次数密度 标准组距
各组次数 次数密度 各组组距
标准组距为异距变量数列各组距中最小的组距
2013-12-10 29
3.累计次数和累计频率
cumulative number and ~ frequency
(1)向上累计(又称由小向大累计)。是将各组次数 和频率由变量值低的组向变量值高的组逐组累计, 它表明该组上限以下的单位数是多少,占总体比重 是多少。 (2)向下累计(又称由大向小累计)。是将各组次数 和频率由变量值高的组向变量值低的组逐组累计, 它表明该组下限以上的单位数是多少,占总体比 重是多少。
2013-12-10
19
(4)
编制次数分布表或分配数列
根据上面确定的组数、组距和组限,可以把各个 变量值按组归类,编制成组距数列,并编制成表 格形式,由此得次数分布表或分配数列 2.变量数列次数分布图的绘制 我们不仅用次数分布表表示总体单位的分布状况, 还可以通过绘制变量数列次数分布图直观形象地 揭示总体单位的分布状况和规律性
是根据统计研究的需要和总体的内在特征,将总 体按照一定的标志划分为若干个组成部分的一种 统计方法。 简而言之,统计分组就是把性质相同的总体单位 归为一组,而把性质不同的总体单位区别开来形 成不同的组
2013-12-10 4
统计分组是进行科学的资料整理和统计分 析的基础,分组的好坏直接关系到整个统 计工作的成败 统计分组的作用有以下三个方面:
“十五”时期粮食产量与增长速度
2013-12-10
26
曲线图 Ogive
40
30
20
10
ÈÊ Sum Ë ý
157.50 162.50 167.50 172.50 177.50 182.50
0 152.50
2013-12-10
í ß É ¸
27
Histogram
40
Polygon
40 40
Ogive
2013-12-10
16
(2)确定组数和组距 如果变量值变动较均匀,可采用等距分 组形成等距数列。 组距=全距÷组数 class width =Range ÷class number 斯特吉斯经验公式:组数=1+3.3LogN 分布不均匀时采用异距分组,并且在分组时还要 考虑研究的目的与要求,尽可能使各组有意义。
2013-12-10 7
3.2.4
统计分组的方法
method of statistical grouping
1.品质标志分组的方法
按品质标志分组,就是选择反映事物本质属 性特征的品质标志作为分组标志 在实际工作中对组与组之间的边缘部分不易划 分。统计工作中,对于这些比较复杂的分组要 规定统一的划分标准或分类目录,如《关于城 乡划分标准的规定》、《工业部门分类目录》、 《工业产品目录》等,具体确定分类名称、分 类标准、计量单位和编码方法,作为分组的统 一依据,供长期稳定使用。
2013-12-10 18
计算组中值
组中值是各组下限和上限的中点数值,计算公式 为:组中值median=(上限+下限)÷2 对于开口组,一般是用相邻的组距作为开口组的 组距,其组中值的近似公式为: 对上开口组: 组中值=本组下限+邻组组距÷2 对下开口组: 组中值=本组上限-邻组组距÷2 组中值是以各组内的变量值均匀分布为假设前提 的,因此以组中值为各组的代表值计算的一些综 合指标只能是近似的。
1.划分社会经济现象的类型 2.研究总体的内部结构 3.分析现象之间的依存关系
2013-12-10
5
3.2.2 统计分组的种类
categories of statistical grouping
1.按分组的作用或目的不同,分为
类型分组、结构分组和分析分组
2.按分组标志的多少及其排列形式,可分为
简单分组、复合分组和分组体系
2013-12-10
17
(3) 确定组限并计算组中值 组距数列中每个组的两个端点数值叫组限,其中每 组的小值称为下限,大值称为上限。组限的确定应 该注意以下几点
1.最小组的下限要略低于或等于最小变量值,最 大组的上限要略高于或等于最大变量值,以免在 分组中产生遗漏。 2.组限的确定应体现事物性质的数量界限,并能 真实反映总体内各单位的分布情况。 3.连续型变量在分组时相邻组的上下限应该重合, 每个组的上限同时也是下一组的下限,但要遵循 “上限不在组内”的原则。
(比率频率)
2013-12-10
14
2.变量分配数列 变量分配数列简称变量数列,是按数量标志分组 形成的分配数列。变量数列按其分组方法的不同, 可以分为单项式变量数列和组距式变量数列 (1)单项式变量数列
每个变量值是一个组,顺序排列。在单项式变量数列中,有 多少不重复的变量值就有多少组。单项式变量数列仅适用于 变动幅度比较小、不重复变量值较小的离散变量分组的情况
2013-12-10
21
直方图 Histogram
40
30 27 25 20 20
32
19
10 Std. Dev = 7.72 5 0 152.5 157.5 162.5 167.5 172.5 177.5 182.5 187.5 5 Mean = 166.5 N = 133.00
í ß É ¸
2013-12-10 22
30 27 25 20 20
32
ห้องสมุดไป่ตู้
30
30
20
19
20
10
10
ÈÊ Sum Ë ý
10
ÈÊ Sum Ë ý
5 0 152.5 157.5 162.5 167.5 172.5 177.5
5 182.5 187.5
0 152.50
157.50
162.50
167.50
172.50
177.50
182.50
0 152.50
U型分布; 正J型分布和反J型分布。
2013-12-10
32
常见的次数(频率)分布图
对称钟型分布 对称钟型分布
右偏分布 右偏分布
左偏分布 左偏分布
U型分布
2013-12-10
U型分布
正J型分布
正J型分布
反J型分布
反J型分布
33
3.4 统计图表 3.4.1 统计表
1.统计表Statistical table的定义和作用 统计表是用纵横交叉的线条所绘制的表格来表现 统计资料的一种形式。统计表主要是指统计整理 表和统计分析表,但广义的统计表也包括调查表。 采用统计表反映统计资料,主要有以下优点 (1)能使统计资料条理化、系统化,清晰地表达 统计数据之间的相互联系 (2)能简洁、明了、紧凑地显示统计数据资料, 具有叙述方式显示统计数据所无法比拟的优势 (3)便于计算和检查统计数据中数字的完整性和 正确性
2013-12-10
20
单项式变量数列次数分布图的绘制比较简单,具体 绘制方法是:直接以变量值为横轴,以次数为纵轴, 在坐标轴上描绘出各组变量值与相对应的次数对应 的坐标点,连接各坐标点即可得分布图。
组距式变量数列次数分布图一般有直方图 (histogram)和次数分配曲线图。次数曲线图也 是在直方图的基础上绘制的。
它既是统计调查的继续,也是统计分析的前提
具有承前启后的作用
2013-12-10
2
3.1.2
统计整理的内容
对资料的审核主要包括资料的 准确性、及时性和完整性审核 准确性,就是检查所填报的 资料是否准确可靠。主要从 两个方面进行:其一,逻辑 检查;其二,计算检查 及时性,主要检查资料是否符 合调查规定的时间,是否在规 定的调查期限报出
2013-12-10 8
2.数量标志分组的方法
数量标志分组是指选择反映事物数量差异的数量 标志作为分组标志后,根据其变异范围划定各组 界限,将总体划分为若干个性质不同的组成部分 按数量标志分组的方法有两种:
单项式分组和组距式分组
2013-12-10
9
(1)单项式分组 单项式分组就是按每个变量值对现象总体 进行的分组
2013-12-10
12
在分配数列中,分布在各组的总体单位数称为次 数,又称为频数absolute class frequency ; 各组次数占总体次数的比重,称为比率,又称为 频率(frequency) 。次数和频率从不同角度反 映了各组标志值出现的频繁程度,说明了总体单 位在各组中的分布,是分配数列的两种表现形式 分配数列按分组标志特征的不同,分为 品质分配数列和变量分配数列
相关文档
最新文档