第三章 统计整理(图片版)
合集下载
统计学原理 第三章 统计整理PPT课件
• 7、统计分组的关键在于确定( D )。
• A.组中值
B.组距
• C.组数
D.分组标志和分组界限
• 7.对某校学生分别按年级和年龄分组,由此形成的分组
体系是( A )。
• A.平行分组体系
B.复合分组体系
• C. 二者兼而有之
D.二者都不是
• 二、多选题
• 1、统计分组有按品质标志分组和按数量标志分组两种,
下述人口总体分组属数量标志分组的是( BD )。
• A.按性别分组
B.按年龄分组
• C.按文化程度分组
D.按收入水平分组
• E.按居住地区分组
• 2、统计分组是将统计总体按一定标志区分为若干部分的
统计方法。它( ABDE)。
• A.是统计研究中的基本方法 B.是在统计总体内部进行
• C.是在统计总体之间进行 D.对总体而言是分
轻
重
工
工
企
企
业
业
简单分组
按经济类型分
国集 其 有体 他 工工 工 业业 业 企企 企 业业 业
平行分组体系
工业企业
按轻重 工业分
按企业 规模分
轻工企业
大型轻 小型轻 工企业 工企业
重工企业
大型重 小型重 工企业 工企业
按经 济类 型分
国有 大型 轻工 企业
集体 大型 轻工 企业
其他 大型 轻工 企业
2.对原始资料进行审核与检查
3.对原始资料进行 统计分组和统计汇总
基础
中心
4.编制统计表或绘制统计图
(1)完整性 (2)准确性 (3)适用性 (4)时效性
结果
第二节 统计分组
一、统计分组的定义 是指根据客观现象的特点和统计研究的目的要求,按照一 定的标志把总体划分为若干不同性质的组或类型。
统计学基础(第三章统计数据整理与展示)PPT课件
• (三)两种方式的比较
– 两种整理形式优缺点互补,实际中常常结合运用, 称为综合整理,即对一些最基本的统计指标实行 逐级整理,另一方面又将全部原始资料实行集中 整理。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
三、统计整理的步骤
• 1.设计和编制统计资料的整理方案。 • 2.审核统计资料。
第一节 统计整理的
统计分组 分配数列 统计表和统计图
• 案例分析
• 思考与练习
E-mail::
第三章 统计数据整理与展示
第三章>>第E-一ma节il::
第三章 统计数据整理与展示
一、统计整理的意义
• 概念
– 统计整理,是指根据统计研究的目的,将 统计调查所搜集到的原始资料进行科学的 分类和汇总,或对已初步加工的资料进行 再加工,使之系统化、条理化,成为能够 反映现象总体特征的综合资料的工作过程。
1980年
GDP 100 第一产业 3.2 第二产业 75.7 第三产业 21.1
1990年 100 4.3 63.8 31.9
1996年 1997年 100 100
2.5 2.3 54.5 52.2 43.0 45.5
3·研究总体现象之间的依存关系
例:中国农民家庭按收入分组的恩格尔系数(1984年)
• 5.编制统计图表。
– 以统计表、统计图的形式简明扼要地表现统计整 理的结果。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
第三章E>-m>a第il::二节
第三章 统计数据整理与展示
什么是统计分组?
根据现象的特点和统计研究的目的要求, 按照某个(或几个)标志把总体划分为若干 不同性质的组,称为统计分组。
– 两种整理形式优缺点互补,实际中常常结合运用, 称为综合整理,即对一些最基本的统计指标实行 逐级整理,另一方面又将全部原始资料实行集中 整理。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
三、统计整理的步骤
• 1.设计和编制统计资料的整理方案。 • 2.审核统计资料。
第一节 统计整理的
统计分组 分配数列 统计表和统计图
• 案例分析
• 思考与练习
E-mail::
第三章 统计数据整理与展示
第三章>>第E-一ma节il::
第三章 统计数据整理与展示
一、统计整理的意义
• 概念
– 统计整理,是指根据统计研究的目的,将 统计调查所搜集到的原始资料进行科学的 分类和汇总,或对已初步加工的资料进行 再加工,使之系统化、条理化,成为能够 反映现象总体特征的综合资料的工作过程。
1980年
GDP 100 第一产业 3.2 第二产业 75.7 第三产业 21.1
1990年 100 4.3 63.8 31.9
1996年 1997年 100 100
2.5 2.3 54.5 52.2 43.0 45.5
3·研究总体现象之间的依存关系
例:中国农民家庭按收入分组的恩格尔系数(1984年)
• 5.编制统计图表。
– 以统计表、统计图的形式简明扼要地表现统计整 理的结果。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
第三章E>-m>a第il::二节
第三章 统计数据整理与展示
什么是统计分组?
根据现象的特点和统计研究的目的要求, 按照某个(或几个)标志把总体划分为若干 不同性质的组,称为统计分组。
统计整理-PPT课件
2019/2/21
统计表
统计表的构成
统计表的内容
22
统计表的种类
第四节 统计表和 统计图
二、统计图
条形图
曲线图 饼图
3500 3000 2500 2000 1500 1000 第一季度 第一季度
23
500 0 别克 本田 威驰 宝来
2019/2/21
19
2019/2/21
第三节 分配数列
某班学生统计成绩次数分布情况
按成绩 分组 (分) 60以下 60~70 70~80 80~90 90以上 合计
频数
(人)
频率
(%)
向上累计 频数
(人)
向下累计
频率(%) 频数(人) 频率(%) 6 20 48 88 100 — 50 47 40 26 6 — 100 94 80 52 12 —
87 72 61
2
2019/2/21
整理资料
按成绩等级分组 人数(人)
60以下 4
各组人数占 总人数比重(%) 10.0 15.0
30.0
60~70分
70~80分
6
12
80~90分
90~100分 合 计
3
15
3 40
37.5
7.5 100.0
2019/2/21
第一节 统计整理的 意义和步骤
统计整理的意义、步骤
500以下
500-1000 1000—2000 2000-3000 3000以上 合计
50
125 225 75 25 500
3000+1000/2=3500 -
15
相邻两组组限用相同数字表示, 叫重叠式组限。重叠式组限适 用于连续型变量分组。
统计表
统计表的构成
统计表的内容
22
统计表的种类
第四节 统计表和 统计图
二、统计图
条形图
曲线图 饼图
3500 3000 2500 2000 1500 1000 第一季度 第一季度
23
500 0 别克 本田 威驰 宝来
2019/2/21
19
2019/2/21
第三节 分配数列
某班学生统计成绩次数分布情况
按成绩 分组 (分) 60以下 60~70 70~80 80~90 90以上 合计
频数
(人)
频率
(%)
向上累计 频数
(人)
向下累计
频率(%) 频数(人) 频率(%) 6 20 48 88 100 — 50 47 40 26 6 — 100 94 80 52 12 —
87 72 61
2
2019/2/21
整理资料
按成绩等级分组 人数(人)
60以下 4
各组人数占 总人数比重(%) 10.0 15.0
30.0
60~70分
70~80分
6
12
80~90分
90~100分 合 计
3
15
3 40
37.5
7.5 100.0
2019/2/21
第一节 统计整理的 意义和步骤
统计整理的意义、步骤
500以下
500-1000 1000—2000 2000-3000 3000以上 合计
50
125 225 75 25 500
3000+1000/2=3500 -
15
相邻两组组限用相同数字表示, 叫重叠式组限。重叠式组限适 用于连续型变量分组。
第三章统计整理PPT课件
3、分 品质数列 类 变量数列
单值数列
比重。
等距数列
组距数列 异距数列
二、变量数列的编制
编制变量数 列的步骤
确
确
计
编
定
定
算
制
组
组
频
表
数
距
数
格
(一)品质数列:
将总体按品质标志分组形成的分布数列
例
某班学生的性别构成情况
按性别分组 绝对数人数 比重(%)
男
30
75
女
10
25
合计
40
100
组别
次数
频率
(二)变量数列
1、单值数列
指每个组值只用一个具体的 变量值表现的数列
编制条件:
变量是离散变量
同时
变量的不同取值个数较少 具备
【例】己知某车间有24名工人,他们的日产量(件) 分别是:20,23,20,24,23,21,22,25,26,20, 21,21,22,22,23,22,22,24,25,21,22,21, 24,23.要求根据以上资料编制变量数列。
2.性质
分与合 、穷尽与互斥、反映本质差异、可能掩 盖差异、关键是分组标志的选择和分组界限的 确定
3、统计分组的原则 穷尽原则,使总体中的每一个单位都
应有组可归,或者说各分组的空间足以 容纳总体所有的单位。
互斥原则,在特定的分组标志下,总
体中的任何一个单位的只能归属于某一 组,而不能同时或可能归属于几个组。
二、统计分组的作用:
划分社会经济现象的类型 反映社会经济现象的内部结构和比例关系 揭示社会经济现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异 而抽象掉组内各单位之间的差异,使数据变 得条理化,便于进一步分析研究。
第三章--统计整理-幻灯片(1)
如某班学生按年龄分组:17岁,18岁,19岁, 20岁, 21岁,22岁。
组距式分组
将作为分组依据的数量标志的整个取 值范围依次划分为若干个满足互斥性
和包容性的区间,用这些数值区间作
为组的名称。
某班学生统计 学原理成绩分 组
60分以下 60—70分 70—80分 80—90分 90分以上
组距式分组中的一些概念 《统计学原理》第三章 统计整理
对教师 的分类
按性别分类
男性 女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
复合分组体系
对教师 的分类
按性别 分类
按职称 分类
按年龄 分类
《统计学原理》第三章 统计整理
共计12组 男 2×3×2
女 高级
中级
初级 青年 中年
《统计学原理》第三章 统计整理
统计资料的再分组
• 统计资料的再分组就是把统计分 组资料按某种要求,重新划定各 组界限,再将资料中的单位数或 比重分布重新做出调整。
对总体单位而言,是“合”,即将性质相同的 个体组合起来,在同一组内则保持着相同的性 质。
分组
《统计学原理》第三章 统计整理
25%
33%
分组前
分组后
42%
作用:1·区分事物的性质
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
将统计调查得到的原始资料进行科
统计整理 学的分类和汇总,使之成为系统化、
条理化的综合资料,以反映研究总 体的特征。
地位 是统计调查的继续,统计分析的前提 和基础,起着承前启后的作用。
《统计数据的整理》PPT课件
3
900-1000
7
1000-1100 13
1100-1200
5
1200-1300
2
合计
30
比重 (%)
10.0 23.3 43.3 16.7 6.7
100.0
累计频数
向上
向下
3
30
10
27
23
20
28
7
30
2
- 精选ppt
-
累计频率(%)
向上
向下
10.0 33.3 76.6 93.3 100.0
100.0 90.0 66.7 23.4 6.7
身高(米) 1.50-1.60 1.60-1.70 1.70-1.80 合计
精选ppt
学生人数 10 11 9 30
9
统计分组的方法(总结)
定性数据的分组方法 —— 单项式分组 定量数据的分组方法
1、按离散变量分组
(1)变量值取值不多 —— 单项式分组 (2)变量值取值较多 —— 组距式分组
2、按连续变量分组 —— 组距式分组
– 一般在现象性质差异的变动比较均衡条件下使用。 –优点:易于掌握次数分布的特征;各组次数可以直接比较。
按身高分组(米)
1.50-1.60 1.60-1.70 1.70-1.80 合计
学生人数
10 11 9
30
精选ppt
13
异距分组:在组距式分组中,各组组距不尽相等。
– 一般在现象性质差异的变动非均衡的条件下使用。 – 优点:能够准确地描述偏态分布;能将性质相同的总体单位
精选ppt
3
一、统计分组的一般问题
概念:
– 统计分组是根据统计研究的目的和客观现象的内在特点,按某个标 志(或几个标志)把被研究的总体划分为若干个不同性质的组的统 计方法 。
第三章 统计整理PPT教学课件
第三章 统计整理
第一节统计整理的意义和内容 一、统计整理的意义 统计整理:根据统计研究的任务与要求,
对通过统计调查取得的资料进行分组、 汇总,使其条理化、系统化的工作过 程。
2020/12/101二、统计整理的步骤和内容 1、设计和编制统计资料整理方案 2、对调查来的资料进行审核 3、对资料进行分组、汇总和计算 4、对整理后的资料再一次进行审核 5、将汇总整理的结果编制成统计表
2020/12/10
24
(二)国民经济中常用的几种分组(类)标 准
1、经济类型分组(9类) (1)国有经济(2)集体经济 (3)私营经济(4)个体经济 (5)联营经济(6)股份制经济 (7)外商投资经济(8)港澳台投资经济 (9)其他经济
2020/12/10
25
三次产业分类
第一产业:农业(农业、林业、牧业、渔业)
2020/12/10
14
为了解工业企业职工总体的基本情况,选择 年龄、文化程度、工龄和操作形式等标志 进行分组:
2020/12/10
15
按年龄分组 20岁及20岁以下 21岁—35岁 36岁—50岁 51岁—55岁 56岁—60岁 60岁以上
按文化程度分组 大专以上 中专 技工 高中 初中 小学
2.选择能够反映事物本质特征的标志作 为分组标志
2020/12/10
8
(二)分组方法
1.按品质标志分组
按品质标志分组是指选择反映事物属性 差异的品质标志作为分组标志进行分 组,并在品质标志的变异范围内划定 各组界限,将总体划分为若干个性质 不同的组成部分。
2020/12/10
9
为了使复杂的分类在全国统一执行, 国家统计局及中央有关部门,统一制 订有各种分类目录与规定标准,如: 《工业部门分类目录》《工业产品目 录》《大中小型工业企业划分标准》 《经济类型划分规定》
第一节统计整理的意义和内容 一、统计整理的意义 统计整理:根据统计研究的任务与要求,
对通过统计调查取得的资料进行分组、 汇总,使其条理化、系统化的工作过 程。
2020/12/101二、统计整理的步骤和内容 1、设计和编制统计资料整理方案 2、对调查来的资料进行审核 3、对资料进行分组、汇总和计算 4、对整理后的资料再一次进行审核 5、将汇总整理的结果编制成统计表
2020/12/10
24
(二)国民经济中常用的几种分组(类)标 准
1、经济类型分组(9类) (1)国有经济(2)集体经济 (3)私营经济(4)个体经济 (5)联营经济(6)股份制经济 (7)外商投资经济(8)港澳台投资经济 (9)其他经济
2020/12/10
25
三次产业分类
第一产业:农业(农业、林业、牧业、渔业)
2020/12/10
14
为了解工业企业职工总体的基本情况,选择 年龄、文化程度、工龄和操作形式等标志 进行分组:
2020/12/10
15
按年龄分组 20岁及20岁以下 21岁—35岁 36岁—50岁 51岁—55岁 56岁—60岁 60岁以上
按文化程度分组 大专以上 中专 技工 高中 初中 小学
2.选择能够反映事物本质特征的标志作 为分组标志
2020/12/10
8
(二)分组方法
1.按品质标志分组
按品质标志分组是指选择反映事物属性 差异的品质标志作为分组标志进行分 组,并在品质标志的变异范围内划定 各组界限,将总体划分为若干个性质 不同的组成部分。
2020/12/10
9
为了使复杂的分类在全国统一执行, 国家统计局及中央有关部门,统一制 订有各种分类目录与规定标准,如: 《工业部门分类目录》《工业产品目 录》《大中小型工业企业划分标准》 《经济类型划分规定》
统计学课件--第三章统计整理
2019/8/21
课件
3
第三章 统计整理
第一节 统计整理的基本理论
(二) 意义 统计整理是统计工作过程的第三阶段,是统计调查的继续, 是统计分析的前提,它是从对现象的感性认识过渡到对现象理性 认识的开始,是这个过程的连续点,并为这个过程提供坚实的基 础,它在统计工作中起着承前启后的作用 。
2019/8/21
分布在各组中的个体单位数叫做次数或频数。 各组次数与总次数之比叫做比率或频率。 将各组别与次数按一定的次序排列所形成的数列称作次数分布 数列,简称分布数列,又称分配数列或频数分配。
2019/8/21
课件
11
第三章 统计整理
1987年底我国职工构成表
按经济类型 职工人数 比重(%)
分组
(万人)
全民所有 制
三、几种常见的统计图
集体所有 制
其它
9654 3488 72
73.09 26.40 0.54
合计
13214
100.00
组的名称 次数(频数 ) 比率(频率)
2019/8/21
课件
12
第三章 统计整理
第三节 次数分布
二、变量数列的类型
(一)单项式数列
按每个变量值分别列组,依次分组编制的变量数列叫 做单项式变量数列。
(6) 统计表的表式一般是开口式的,即表的左右两端不 画纵线,上下基线应用粗线。
(7) 对于某些需要特殊注明的统计资料,应在统计表的 下方加注说明。
2019/8/21
课件
29
第三章 统计整理
第六节 统计图
一、统计图的意义和绘制原则 二、统计图的绘制步骤
1. 确定绘制统计图的目的 2. 搜集统计资料 3. 决定绘制的图式 4. 绘制图形
《统计整理》PPT课件
0
年份
h
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
CO2排放量
表3-2 2000-2005年我国国内生产总值构成情况
表3-3 某市1998年100个百货商场的年销售与流通费情况
组距
每组变量值变动区间的长度,为上 下限之差
组中值 每组变量取值范围的中点数值
组中值= 上限 下限
2
某地区100个百货商店 月销售额与流通费用情况
销售额(万 元)
上组限U
商(店个数)=10如每额0百中-:费5元支0(组商付=元距5品 的)0销 流d(=售 通万U-元L )
50以下
10
14.2
50~100 20
简单分组:按照单一标志分组
平行分组体系 各分组标志并列使用 交叉分组体系 (复合分组) 各分组标志交叉结合使用
平行分组体系
对教师 的分类
男性 按性别分类
女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
交叉分组体系
按性别 分类 对教师 按职称 的分类 分类 按年龄 分类
共计12组 男 2×3×2
700以上
合计
工人数(人)
10 42 17 15 12 4
100
表3-8某工厂工人完成生产定额情况累计变量数列
按完成件数分 组(件)
500以下 500~550 550~600 600~650 650~700
700以上
工人数 (人)
10 42 17 15 12 4
年份
h
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
CO2排放量
表3-2 2000-2005年我国国内生产总值构成情况
表3-3 某市1998年100个百货商场的年销售与流通费情况
组距
每组变量值变动区间的长度,为上 下限之差
组中值 每组变量取值范围的中点数值
组中值= 上限 下限
2
某地区100个百货商店 月销售额与流通费用情况
销售额(万 元)
上组限U
商(店个数)=10如每额0百中-:费5元支0(组商付=元距5品 的)0销 流d(=售 通万U-元L )
50以下
10
14.2
50~100 20
简单分组:按照单一标志分组
平行分组体系 各分组标志并列使用 交叉分组体系 (复合分组) 各分组标志交叉结合使用
平行分组体系
对教师 的分类
男性 按性别分类
女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
交叉分组体系
按性别 分类 对教师 按职称 的分类 分类 按年龄 分类
共计12组 男 2×3×2
700以上
合计
工人数(人)
10 42 17 15 12 4
100
表3-8某工厂工人完成生产定额情况累计变量数列
按完成件数分 组(件)
500以下 500~550 550~600 600~650 650~700
700以上
工人数 (人)
10 42 17 15 12 4
统计原理课件 第三章统计整理
作用:可以科学合理地显示统计资料,使统计资料更能便于 人们阅读,为分析研究客观现象之间的关系,如现象的规模、 结构、比例、发展速度等提供便利条件。在实际应用中,统 计表是统计资料最广泛的表现形式。
3.4.1 统计表
结构: 1)从统计表的表式结构看,统计表包括
总标题、横行标题、纵栏标题和指标数值四部 分。
取决于所研究变量的类型和变量的变动幅度。 对于连续变量,只能编制组距数列;对于离散 变量,则根据其变量值的多少和变动幅度的大 小来确定。
3.3.2 变量数列的编制
3.确定组数和组距 组距是每组中最大变量值与最小变量值之间的距
离或差数。其中最大的变量值称为上组限,简称上限, 最小的变量值称为下组限,简称下限。组距的计算公 式为: 组距=上限-下限
3.4.1 统计表
• 表3-4 某班50名学生期中测验成绩分组表
按成绩分组 60分以下
60-70 70-80 80-90 90以上
合计
学生数(人) 3 9 12 20 6
50
比重(%) 6 18 24 40 12
100
3.4.1 统计表
• 表3-5 某地区固定资产投资额
项目
一、国有企业 基本建设 更新改造
条形图
100 90 80 70 60 50 40 30 20 10 0
第一季度 第二季度 第三季度 第四季度
东部 西部 北部
折线图
08年北京城镇居民消费结构
6% 8%
14%
41%
5% 5%
11%
10%
食品 衣着 家庭设备 医疗保健 交通和通讯 文化教育 居住 杂项商品
饼图
商品销售额 (万元)
第三章 统计整理
学习目标
3.4.1 统计表
结构: 1)从统计表的表式结构看,统计表包括
总标题、横行标题、纵栏标题和指标数值四部 分。
取决于所研究变量的类型和变量的变动幅度。 对于连续变量,只能编制组距数列;对于离散 变量,则根据其变量值的多少和变动幅度的大 小来确定。
3.3.2 变量数列的编制
3.确定组数和组距 组距是每组中最大变量值与最小变量值之间的距
离或差数。其中最大的变量值称为上组限,简称上限, 最小的变量值称为下组限,简称下限。组距的计算公 式为: 组距=上限-下限
3.4.1 统计表
• 表3-4 某班50名学生期中测验成绩分组表
按成绩分组 60分以下
60-70 70-80 80-90 90以上
合计
学生数(人) 3 9 12 20 6
50
比重(%) 6 18 24 40 12
100
3.4.1 统计表
• 表3-5 某地区固定资产投资额
项目
一、国有企业 基本建设 更新改造
条形图
100 90 80 70 60 50 40 30 20 10 0
第一季度 第二季度 第三季度 第四季度
东部 西部 北部
折线图
08年北京城镇居民消费结构
6% 8%
14%
41%
5% 5%
11%
10%
食品 衣着 家庭设备 医疗保健 交通和通讯 文化教育 居住 杂项商品
饼图
商品销售额 (万元)
第三章 统计整理
学习目标
第三章统计整理
实践环节:用EXCEL绘制统计图和统计表。 包括:表格的绘制、填写、编辑
直方图、折线图、条形图、圆形图等的绘制和编辑。
本章习题
1、某工厂同工种的50名工人完成生产定额百分数(%) 资料如下:
83 88 123 110 118 158 121 146 137 120 163 125 136 127 142 118 123 126 138 151 101 86 82 113 142 108 101 105 125 116 132 138 117 103 114 131 108 87 119 127 105 115 126 125 110 107 141 135 117 93 要求:(1)根据上述资料编制变量数列
4.房地产广告 5.招生招聘广告 6.其他广告
某城市居民关注广告类型的频数分布表
广告类型
人数(人)
比例
频率(%)
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
合计
112
0.560
56.0
51
0.255
25.5
9
0.045
4.5
16
0.080
8.0
10
0.050
5.0
2
0.010
1.0
品质分布数列: 数量分布数列:简称为变量数列
二、变量数列的种类
按组的表示方式不同可分为:
1、单项变量数列:每组用一个数表示。 适合于离散型变量,而且 变量值较少的情况。
如:
工人按日产量(件)分组 工人数(人)
2
5
3
10
4
3
2、组距数列:
适合于连续型变量,而且变量值较多的情况。 可采用等距分组,也可采用不等距分组
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
公式:
次数密度=各组次数 / 各组组距
(9)
开口组:缺上限或缺下限的组 闭口组:上下限齐全的组
(10)组中值及计算* ①闭口组
组中值=(上限+下限)/ 2
②开口组
缺上限时: 组中值=下限+邻组组距/ 2 缺下限时: 组中值=上限 -邻组组距/ 2
2.注意事项 (1)组距最好为5或10的倍数。 (2)最小组的下限略低于最小变量值,最大组 的上限略高于最大变量值。 (3)离散型变量分组,相邻组的组限可以间 断,也可以重叠;连续型变量分组,相邻组的组 限必须重叠。
简单分组 简单分组是对研究对象按照一个标志进行的分组。
复合分组
复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分 组。即先按一个标志进行分组,然后再按另一个标志在已分好的各个组 内划分成若干个小组。
平行分组 平行分组是选择两个或两个以上的标志对总体进行一次次简 单分组后所形成的体系;
(一)钟形分布/丘形分布 1.含义: 特点是“两头小,中间大”,即越靠近中间的变量值分 布次数愈多;愈远离变量值中点分布的次数愈少,形态如钟或山 丘。 正态分布:左右两侧对称分布 2.种类 左偏分布:存在极小变量值时曲线向左偏的 偏态分布 非对称分布 右偏分布:存在极大变量值时曲线向右偏的 非对称分布
第三章、统计数据的整理
学习目的及要求
理解统计分组的概念,了解统计分组的作用,掌 握统计分组的方法,理解频数分布的概念,掌握变 量数列的ห้องสมุดไป่ตู้类,了解变量数据的编制,了解频数分 布的主要类型,学会编制和运用统计表,并能灵活 利用Excel编制统计表和绘制统计图。
第一节、统计整理一般问题
第二节、统计分组
(4)组数:数列中的分组个数。
组数和组距的关系
定性关系:全距一定的情况下,组数和组距呈 反方向变动。 定量关系: 组数=全距/组距=R/d 组距=R/(1+3.322lgN) 式二为确定组距的经验公式,其中N代表组数。
(5)频数(次数)与频率(比重) (6)品质数列与变量数列 (7)等距数列与异距数列 (8)次数密度:单位组距内分布的总体单位数。
单项式变量数列实例
某村居民家庭按家庭人口数分组
家庭人口数(人) 家庭数(户)比重(%) 1 5 5 2 10 10 3 35 35 4 25 25 5 15 15 6 10 10 合计 100 100
组距式变量数列实例
某车间工人按月工资分组
月工资(元)
1500以下 1500-1700 1700-2000 2000-2300 2300-2600 2600-4000 4000以上 合计
洛伦茨曲线:专门用以检定社会收入分配的平等程度。
洛伦兹曲线(Lorenz curve),也译为“劳伦兹曲线”。就 是,在一个总体(国家、地区)内,以“最贫穷的人口计算 起一直到最富有人口”的人口百分比对应各个人口百分比的 收入百分比的点组成的曲线。
二八定律
收 入
人口(%) 洛伦茨曲线示意图
绝对不 平等线
(三)J形分布:J形分布的特征是“一边大,一边小”。即次数 随着变量值的变化大多数集中在某一端的分布。其曲线形 如英文字母的“J”字,具体有正J形分布和反J形分布两种类 型。
(育龄妇女文化程度与平均生育子女数)
正J形分布
反J形分布
**思考题:以下现象的次数分布符合哪种分布的特征? A 人群中身高、体重的分布 B 学生考试成绩的分布 C 按人口年龄分布的死亡率 D 餐饮企业销售额的分布
编制步骤之六——绘制表格
表 某车间工人日产零件分组表
日产零件数(件) 50-60 60-70 70-80 80-90 90-100 合计
工人数(人) 比重(%) 4 10 8 20 13 32.5 10 25 5 12.5 40 100
4.累计次数分布表的编制
(1)累计次数和累计频率 反映总体单位分布特征的指标,用以说明总体 中在某一变量值水平上下总共包含的总体单位次数 和频率。 (2)累计次数和频率的计算方法
洛伦茨曲线示意图
最低 较低 中等 较高 最高
人口(%)累计(%)收入(%)累计(%) 20 20 5 5 20 40 10 15 20 60 16 31 20 80 24 55 20 100 45 100
重之和等于100%(或1)。
(三)分配数列的种类
分配数列是在分组的基础上形成的,根据分组时采用的分 组标志不同,分配数列可分为: (这种数列一般比较稳定,只要分组 品质分配数列 标准定的比较恰当,通常能准确地反 映总体的分布特征。) 分配数列 变量分配数列 组距分配数列 不等距数列 单项式分配数列 等距数列
(2)反映总体的内部结构。
我国三次产业结构状况
年份 第一产业 第二产业 第三产业 1980 30.2 48.2 21.6 1990 2000 27.1 15.1 41.3 45.9 31.6 39 2010 2017 10.2 7.9 46.8 40.5 43 51.6
(3)揭示现象之间的依存关系。
年 份
2010 2011 2012 2013 2014 2015 2016
三、统计分组的关键
选择分组标志和分组划分各组界限(针对数值型变量)。
四、选择分组标志的原则
1.根据研究任务和目的选择分组标志。 2.选择能反映事物本质特征或重要特征的标志。 3.结合现象所处的历史条件和社会经济条件选择分组 标志。
二、数据整理的程序
第二节、统计分组
□◎□※※ ※□※□□ □□◎□◎ ◎※※□※
□□□□□□□ □□ ※※※※※※※ ◎◎◎◎
通过统计整理: (合并、分类) 直观、有规律
第一手资料: 简单、凌乱
一、统计分组的概念
根据统计研究目的和客观现象的内在特点,按照选定 的某个或几个标志,将被研究的总体数据分成若干部分的 科学分类。
向上累计 : 是将各组的次数和频率,由变量值低 的组向高的组累计。说明各组上限以下包含的总体 单位数和比率。 向下累计 : 是将各组的次数和频率,由变量值高 的组向低的组累计。说明各组下限以上包含的总体 单位数和比率。
根据上例编制的累计次数分布表如下:
二、次数分布的类型
社会经济现象的分布主要有以下三种类型:
五、统计分组的原则
1.穷尽性原则 2.互斥性原则 3.组内同质,组间差异性原则
六、统计分组的种类
(一)根据 分 组 变 量 ( 标志 ) 的性 质不同
按品质标志 分组 按数量(变 量)标志分 组
(二)根据采用的分组标志的个数多少 只按一个标志分组:简单分组 复合分组
按两个或以上的标志分组
平行分组
收 入
A B
人口(%) 绝对不平等线
根据实际收入分配线 与绝对平等线或绝对 不平等线进行对比, 可衡量其不平等程度。 离绝对平等线越远分 配越不平等;反之, 越靠近绝对平等线分 配越平等。 基尼系数——基尼根 据洛伦茨曲线提出的 判断分配平等程度的 指标。 基尼系数=A/A+B 基尼系数的实际数值 只能介于0~1之间。
正态分布
左偏分布
右偏分布
(二)U形分布:是指较大和较小的变量值出现的次数多, 而中间变量值出现的次数少,特点是“两头大,中间 小” 。
例子:发展中国家人口死亡率 的年龄分布。 英国与美国一项联合研究 显示,人一生的幸福感呈现U形 曲线,年轻与年老时最快乐,中年 时会坠入幸福感的“谷底”,发 生在44岁左右,而且要持续几年 甚至更长的时间。
第三节、分配数列和次数分布的类型 第四节、统计图表
第一节 数据整理的一般问题
一、统计整理的概念和作用
(一)概念 对统计调查所搜集到的数据进行分类和汇总, 使其系统化、条理化、科学化,以得出反映事物 总体综合特征的资料的工作过程。 (二)作用 统计数据整理,是统计调查的继续,也是统 计分析的前提,承前启后,在整个统计工作中具 有重要的作用。
编制步骤之二——确定变量数列的形式
因变量值较多、变动幅度较大,适宜采用组 距式数列。
编制步骤之三——确定组数和组距
[分析] 全距为47,分为5组,组距为10。
编制步骤之四——确定组限
[分析] 离散型变量分组,相邻组的组限可以重叠, 也可间断,本例选择重叠。
编制步骤之五——计算各组的频数和频率
[分析] 根据排序后的变量序列清点各数据区间的 频数并计算比重,也可利用Excel统计软件进行。
二、统计分组的作用
(1)区分现象的类型。
例:按所有制性质划分,我国现有8种经济类型: 国有经济;集体经济;私营经济;个体经济;联营经 济;股份制经济;外商投资经济;港澳台投资经济
国民经济按行业分组,可以划分为20个行业门类: (1)农、林、牧、渔业;(2)采矿业;(3)制造业; (4)电力、燃气及水的生产和供应业;(5)建筑业;(6) 交通、运输、仓储及邮政业;(7)信息传输、计算机服务 和软件业;(8)批发和零售业;(9)住宿和餐饮业; (10)金融业;(11)房地产业;(12)租赁和商务服务 业;(13)科学研究、技术服务和地质勘探业;(14)水 利、环境和公共设施管理;(15)居民服务和其他服务业; (16)教育;(17)卫生、社会保障和社会福利业;(18) 文化、体育和娱乐业;(19)公共管理和社会组织;(20) 国际组织。通过分类,可以反映我国各行业的发展,为进 一步研究其水平与结构提供了便利条件。 产业可以划分为第一产业、第二产业、第三产业;
第 三 节 分配数列和次数分布类型
一、分配数列
(一)概念
将总体按分组标志分组后形成的总体单位 在各组的分布,又称次数分布数列或频数分 布数列。
(二)分配数列的要素
组别:总体分成若干个组 次数(频数):分布在各组的总体单位数。各组的
次数(频数)之和等于总体单位总数。
频率(比重):各组次数占总次数的比重。各组比
次数密度=各组次数 / 各组组距
(9)
开口组:缺上限或缺下限的组 闭口组:上下限齐全的组
(10)组中值及计算* ①闭口组
组中值=(上限+下限)/ 2
②开口组
缺上限时: 组中值=下限+邻组组距/ 2 缺下限时: 组中值=上限 -邻组组距/ 2
2.注意事项 (1)组距最好为5或10的倍数。 (2)最小组的下限略低于最小变量值,最大组 的上限略高于最大变量值。 (3)离散型变量分组,相邻组的组限可以间 断,也可以重叠;连续型变量分组,相邻组的组 限必须重叠。
简单分组 简单分组是对研究对象按照一个标志进行的分组。
复合分组
复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分 组。即先按一个标志进行分组,然后再按另一个标志在已分好的各个组 内划分成若干个小组。
平行分组 平行分组是选择两个或两个以上的标志对总体进行一次次简 单分组后所形成的体系;
(一)钟形分布/丘形分布 1.含义: 特点是“两头小,中间大”,即越靠近中间的变量值分 布次数愈多;愈远离变量值中点分布的次数愈少,形态如钟或山 丘。 正态分布:左右两侧对称分布 2.种类 左偏分布:存在极小变量值时曲线向左偏的 偏态分布 非对称分布 右偏分布:存在极大变量值时曲线向右偏的 非对称分布
第三章、统计数据的整理
学习目的及要求
理解统计分组的概念,了解统计分组的作用,掌 握统计分组的方法,理解频数分布的概念,掌握变 量数列的ห้องสมุดไป่ตู้类,了解变量数据的编制,了解频数分 布的主要类型,学会编制和运用统计表,并能灵活 利用Excel编制统计表和绘制统计图。
第一节、统计整理一般问题
第二节、统计分组
(4)组数:数列中的分组个数。
组数和组距的关系
定性关系:全距一定的情况下,组数和组距呈 反方向变动。 定量关系: 组数=全距/组距=R/d 组距=R/(1+3.322lgN) 式二为确定组距的经验公式,其中N代表组数。
(5)频数(次数)与频率(比重) (6)品质数列与变量数列 (7)等距数列与异距数列 (8)次数密度:单位组距内分布的总体单位数。
单项式变量数列实例
某村居民家庭按家庭人口数分组
家庭人口数(人) 家庭数(户)比重(%) 1 5 5 2 10 10 3 35 35 4 25 25 5 15 15 6 10 10 合计 100 100
组距式变量数列实例
某车间工人按月工资分组
月工资(元)
1500以下 1500-1700 1700-2000 2000-2300 2300-2600 2600-4000 4000以上 合计
洛伦茨曲线:专门用以检定社会收入分配的平等程度。
洛伦兹曲线(Lorenz curve),也译为“劳伦兹曲线”。就 是,在一个总体(国家、地区)内,以“最贫穷的人口计算 起一直到最富有人口”的人口百分比对应各个人口百分比的 收入百分比的点组成的曲线。
二八定律
收 入
人口(%) 洛伦茨曲线示意图
绝对不 平等线
(三)J形分布:J形分布的特征是“一边大,一边小”。即次数 随着变量值的变化大多数集中在某一端的分布。其曲线形 如英文字母的“J”字,具体有正J形分布和反J形分布两种类 型。
(育龄妇女文化程度与平均生育子女数)
正J形分布
反J形分布
**思考题:以下现象的次数分布符合哪种分布的特征? A 人群中身高、体重的分布 B 学生考试成绩的分布 C 按人口年龄分布的死亡率 D 餐饮企业销售额的分布
编制步骤之六——绘制表格
表 某车间工人日产零件分组表
日产零件数(件) 50-60 60-70 70-80 80-90 90-100 合计
工人数(人) 比重(%) 4 10 8 20 13 32.5 10 25 5 12.5 40 100
4.累计次数分布表的编制
(1)累计次数和累计频率 反映总体单位分布特征的指标,用以说明总体 中在某一变量值水平上下总共包含的总体单位次数 和频率。 (2)累计次数和频率的计算方法
洛伦茨曲线示意图
最低 较低 中等 较高 最高
人口(%)累计(%)收入(%)累计(%) 20 20 5 5 20 40 10 15 20 60 16 31 20 80 24 55 20 100 45 100
重之和等于100%(或1)。
(三)分配数列的种类
分配数列是在分组的基础上形成的,根据分组时采用的分 组标志不同,分配数列可分为: (这种数列一般比较稳定,只要分组 品质分配数列 标准定的比较恰当,通常能准确地反 映总体的分布特征。) 分配数列 变量分配数列 组距分配数列 不等距数列 单项式分配数列 等距数列
(2)反映总体的内部结构。
我国三次产业结构状况
年份 第一产业 第二产业 第三产业 1980 30.2 48.2 21.6 1990 2000 27.1 15.1 41.3 45.9 31.6 39 2010 2017 10.2 7.9 46.8 40.5 43 51.6
(3)揭示现象之间的依存关系。
年 份
2010 2011 2012 2013 2014 2015 2016
三、统计分组的关键
选择分组标志和分组划分各组界限(针对数值型变量)。
四、选择分组标志的原则
1.根据研究任务和目的选择分组标志。 2.选择能反映事物本质特征或重要特征的标志。 3.结合现象所处的历史条件和社会经济条件选择分组 标志。
二、数据整理的程序
第二节、统计分组
□◎□※※ ※□※□□ □□◎□◎ ◎※※□※
□□□□□□□ □□ ※※※※※※※ ◎◎◎◎
通过统计整理: (合并、分类) 直观、有规律
第一手资料: 简单、凌乱
一、统计分组的概念
根据统计研究目的和客观现象的内在特点,按照选定 的某个或几个标志,将被研究的总体数据分成若干部分的 科学分类。
向上累计 : 是将各组的次数和频率,由变量值低 的组向高的组累计。说明各组上限以下包含的总体 单位数和比率。 向下累计 : 是将各组的次数和频率,由变量值高 的组向低的组累计。说明各组下限以上包含的总体 单位数和比率。
根据上例编制的累计次数分布表如下:
二、次数分布的类型
社会经济现象的分布主要有以下三种类型:
五、统计分组的原则
1.穷尽性原则 2.互斥性原则 3.组内同质,组间差异性原则
六、统计分组的种类
(一)根据 分 组 变 量 ( 标志 ) 的性 质不同
按品质标志 分组 按数量(变 量)标志分 组
(二)根据采用的分组标志的个数多少 只按一个标志分组:简单分组 复合分组
按两个或以上的标志分组
平行分组
收 入
A B
人口(%) 绝对不平等线
根据实际收入分配线 与绝对平等线或绝对 不平等线进行对比, 可衡量其不平等程度。 离绝对平等线越远分 配越不平等;反之, 越靠近绝对平等线分 配越平等。 基尼系数——基尼根 据洛伦茨曲线提出的 判断分配平等程度的 指标。 基尼系数=A/A+B 基尼系数的实际数值 只能介于0~1之间。
正态分布
左偏分布
右偏分布
(二)U形分布:是指较大和较小的变量值出现的次数多, 而中间变量值出现的次数少,特点是“两头大,中间 小” 。
例子:发展中国家人口死亡率 的年龄分布。 英国与美国一项联合研究 显示,人一生的幸福感呈现U形 曲线,年轻与年老时最快乐,中年 时会坠入幸福感的“谷底”,发 生在44岁左右,而且要持续几年 甚至更长的时间。
第三节、分配数列和次数分布的类型 第四节、统计图表
第一节 数据整理的一般问题
一、统计整理的概念和作用
(一)概念 对统计调查所搜集到的数据进行分类和汇总, 使其系统化、条理化、科学化,以得出反映事物 总体综合特征的资料的工作过程。 (二)作用 统计数据整理,是统计调查的继续,也是统 计分析的前提,承前启后,在整个统计工作中具 有重要的作用。
编制步骤之二——确定变量数列的形式
因变量值较多、变动幅度较大,适宜采用组 距式数列。
编制步骤之三——确定组数和组距
[分析] 全距为47,分为5组,组距为10。
编制步骤之四——确定组限
[分析] 离散型变量分组,相邻组的组限可以重叠, 也可间断,本例选择重叠。
编制步骤之五——计算各组的频数和频率
[分析] 根据排序后的变量序列清点各数据区间的 频数并计算比重,也可利用Excel统计软件进行。
二、统计分组的作用
(1)区分现象的类型。
例:按所有制性质划分,我国现有8种经济类型: 国有经济;集体经济;私营经济;个体经济;联营经 济;股份制经济;外商投资经济;港澳台投资经济
国民经济按行业分组,可以划分为20个行业门类: (1)农、林、牧、渔业;(2)采矿业;(3)制造业; (4)电力、燃气及水的生产和供应业;(5)建筑业;(6) 交通、运输、仓储及邮政业;(7)信息传输、计算机服务 和软件业;(8)批发和零售业;(9)住宿和餐饮业; (10)金融业;(11)房地产业;(12)租赁和商务服务 业;(13)科学研究、技术服务和地质勘探业;(14)水 利、环境和公共设施管理;(15)居民服务和其他服务业; (16)教育;(17)卫生、社会保障和社会福利业;(18) 文化、体育和娱乐业;(19)公共管理和社会组织;(20) 国际组织。通过分类,可以反映我国各行业的发展,为进 一步研究其水平与结构提供了便利条件。 产业可以划分为第一产业、第二产业、第三产业;
第 三 节 分配数列和次数分布类型
一、分配数列
(一)概念
将总体按分组标志分组后形成的总体单位 在各组的分布,又称次数分布数列或频数分 布数列。
(二)分配数列的要素
组别:总体分成若干个组 次数(频数):分布在各组的总体单位数。各组的
次数(频数)之和等于总体单位总数。
频率(比重):各组次数占总次数的比重。各组比