南京大学统计学---ch2统计整理PPT课件
合集下载
统计学原理 第三章 统计整理PPT课件
• 7、统计分组的关键在于确定( D )。
• A.组中值
B.组距
• C.组数
D.分组标志和分组界限
• 7.对某校学生分别按年级和年龄分组,由此形成的分组
体系是( A )。
• A.平行分组体系
B.复合分组体系
• C. 二者兼而有之
D.二者都不是
• 二、多选题
• 1、统计分组有按品质标志分组和按数量标志分组两种,
下述人口总体分组属数量标志分组的是( BD )。
• A.按性别分组
B.按年龄分组
• C.按文化程度分组
D.按收入水平分组
• E.按居住地区分组
• 2、统计分组是将统计总体按一定标志区分为若干部分的
统计方法。它( ABDE)。
• A.是统计研究中的基本方法 B.是在统计总体内部进行
• C.是在统计总体之间进行 D.对总体而言是分
轻
重
工
工
企
企
业
业
简单分组
按经济类型分
国集 其 有体 他 工工 工 业业 业 企企 企 业业 业
平行分组体系
工业企业
按轻重 工业分
按企业 规模分
轻工企业
大型轻 小型轻 工企业 工企业
重工企业
大型重 小型重 工企业 工企业
按经 济类 型分
国有 大型 轻工 企业
集体 大型 轻工 企业
其他 大型 轻工 企业
2.对原始资料进行审核与检查
3.对原始资料进行 统计分组和统计汇总
基础
中心
4.编制统计表或绘制统计图
(1)完整性 (2)准确性 (3)适用性 (4)时效性
结果
第二节 统计分组
一、统计分组的定义 是指根据客观现象的特点和统计研究的目的要求,按照一 定的标志把总体划分为若干不同性质的组或类型。
统计学课件-第二章统计整理
统计学课件-第二章统计整理
目
CONTENCT
录
• 统计整理概述 • 数据收集与整理 • 统计分组 • 频数与频率分布 • 统计表
01
统计整理概述
统计整理的定义
统计整理是根据统计研究的目的,将统计调查所得到的大量原始 资料进行审核、汇总和加工,使之系统化、条理化,从而得出能 够反映现象总体特征的综合数字资料的工作过程。
统计表的编制原则与步骤
原则
统计表的编制应遵循科学性、简明性和实用性的原则。科学性要求表格设计合理 、逻辑严谨;简明性要求表格内容简洁明了、易于理解;实用性要求表格能够满 足实际需要,提供有价值的信息。
步骤
编制统计表的一般步骤包括收集数据、设计表格结构、录入数据、核对数据、调 整表格格式和发布表格等。在编制过程中,需要注意数据的准确性和完整性,同 时要合理设计表格的结构和布局,使得表格内容丰富、条理清晰。
分组是统计整理的关键环节, 是统计分析的基础。
统计分组的方法
按照数量标志分组
根据数量标志将总体分为若干个部分,然后对各部 分进行统计描述和统计分析。
按照品质标志分组
根据品质标志将总体分为若干个类别,然后对各类 别进行统计描述和统计分析。
复合分组
同时使用数量标志和品质标志进行分组,以便更全 面地揭示总体的内部结构。
它是在统计调查取得大量原始资料之后,对所有资料进行的“去 粗取精、去伪存真、由此及彼、由表及里”的再加工过程。
统计整理的目的
将大量杂乱无章的个体资料、群体资料进行审核、 汇总,使其成为系统化、条理化的可资运用的统计 资料。
揭示总体单位的数量特征和相互关系,形成能够说 明总体特征的综合资料。
保证统计资料的准确性和及时性,为统计分析提供 可靠的依据。
目
CONTENCT
录
• 统计整理概述 • 数据收集与整理 • 统计分组 • 频数与频率分布 • 统计表
01
统计整理概述
统计整理的定义
统计整理是根据统计研究的目的,将统计调查所得到的大量原始 资料进行审核、汇总和加工,使之系统化、条理化,从而得出能 够反映现象总体特征的综合数字资料的工作过程。
统计表的编制原则与步骤
原则
统计表的编制应遵循科学性、简明性和实用性的原则。科学性要求表格设计合理 、逻辑严谨;简明性要求表格内容简洁明了、易于理解;实用性要求表格能够满 足实际需要,提供有价值的信息。
步骤
编制统计表的一般步骤包括收集数据、设计表格结构、录入数据、核对数据、调 整表格格式和发布表格等。在编制过程中,需要注意数据的准确性和完整性,同 时要合理设计表格的结构和布局,使得表格内容丰富、条理清晰。
分组是统计整理的关键环节, 是统计分析的基础。
统计分组的方法
按照数量标志分组
根据数量标志将总体分为若干个部分,然后对各部 分进行统计描述和统计分析。
按照品质标志分组
根据品质标志将总体分为若干个类别,然后对各类 别进行统计描述和统计分析。
复合分组
同时使用数量标志和品质标志进行分组,以便更全 面地揭示总体的内部结构。
它是在统计调查取得大量原始资料之后,对所有资料进行的“去 粗取精、去伪存真、由此及彼、由表及里”的再加工过程。
统计整理的目的
将大量杂乱无章的个体资料、群体资料进行审核、 汇总,使其成为系统化、条理化的可资运用的统计 资料。
揭示总体单位的数量特征和相互关系,形成能够说 明总体特征的综合资料。
保证统计资料的准确性和及时性,为统计分析提供 可靠的依据。
统计资料整理ppt文档
20
130~135
6
12
135~140
4
8
合计
50
100
等距分组表
(上下组限间断)
表3-3 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~109
3
6
110~114
5
10
115~119
8
16
120~124
14
28
125~129
10
20
130~134
6
12
135~139
4
8
2. 计算检查
检查调查表中的各项数据在计算结果和计算 方法上有无错误
主要用于对定距和定比数据的审核
资料的审核
(汇总后的资料)
审核的方法
1. 复计审核
对每个指标数值进行复核计算
2. 表表审核
检查不同统计表出现的同一指标数值是否一致
3. 对照审核 4. 表实审核
统计汇总
基本组织形式
1. 逐级汇总
相对于总体的“分”,个体的“合”
统计分组的作用
1. 区分社会经济现象的类型
银行、保险公司、信托投资公司、证券投资公司等等
2. 反映社会经济现象总体的内部结构
性别结构、学历结构、年龄结构、地区结构
3. 反映社会经济现象之间的依存关系
收入与长相之间的关系、股票价格与公司业绩的关系
分组标志的选择
统计资料整理
第一节 统计资料整理的一般 问题
一. 统计整理 二.统计整理的内容 三.统计资料的审核和汇总
统计整理
统计整理的概念:
根据统计研究的目的要求, 对统计调查所得的原始资料进 行科学的分类、汇总,或对已 初步加工的资料进行再加工, 使之成为系统化、条理化的综 合资料,已反映现象总体特征 的工作过程
统计整理-PPT课件
2019/2/21
统计表
统计表的构成
统计表的内容
22
统计表的种类
第四节 统计表和 统计图
二、统计图
条形图
曲线图 饼图
3500 3000 2500 2000 1500 1000 第一季度 第一季度
23
500 0 别克 本田 威驰 宝来
2019/2/21
19
2019/2/21
第三节 分配数列
某班学生统计成绩次数分布情况
按成绩 分组 (分) 60以下 60~70 70~80 80~90 90以上 合计
频数
(人)
频率
(%)
向上累计 频数
(人)
向下累计
频率(%) 频数(人) 频率(%) 6 20 48 88 100 — 50 47 40 26 6 — 100 94 80 52 12 —
87 72 61
2
2019/2/21
整理资料
按成绩等级分组 人数(人)
60以下 4
各组人数占 总人数比重(%) 10.0 15.0
30.0
60~70分
70~80分
6
12
80~90分
90~100分 合 计
3
15
3 40
37.5
7.5 100.0
2019/2/21
第一节 统计整理的 意义和步骤
统计整理的意义、步骤
500以下
500-1000 1000—2000 2000-3000 3000以上 合计
50
125 225 75 25 500
3000+1000/2=3500 -
15
相邻两组组限用相同数字表示, 叫重叠式组限。重叠式组限适 用于连续型变量分组。
统计表
统计表的构成
统计表的内容
22
统计表的种类
第四节 统计表和 统计图
二、统计图
条形图
曲线图 饼图
3500 3000 2500 2000 1500 1000 第一季度 第一季度
23
500 0 别克 本田 威驰 宝来
2019/2/21
19
2019/2/21
第三节 分配数列
某班学生统计成绩次数分布情况
按成绩 分组 (分) 60以下 60~70 70~80 80~90 90以上 合计
频数
(人)
频率
(%)
向上累计 频数
(人)
向下累计
频率(%) 频数(人) 频率(%) 6 20 48 88 100 — 50 47 40 26 6 — 100 94 80 52 12 —
87 72 61
2
2019/2/21
整理资料
按成绩等级分组 人数(人)
60以下 4
各组人数占 总人数比重(%) 10.0 15.0
30.0
60~70分
70~80分
6
12
80~90分
90~100分 合 计
3
15
3 40
37.5
7.5 100.0
2019/2/21
第一节 统计整理的 意义和步骤
统计整理的意义、步骤
500以下
500-1000 1000—2000 2000-3000 3000以上 合计
50
125 225 75 25 500
3000+1000/2=3500 -
15
相邻两组组限用相同数字表示, 叫重叠式组限。重叠式组限适 用于连续型变量分组。
统计整理ppt课件
显著性水平与临界值
显著性水平是用来判断假设是否成立的概率标准,临界值 则是用来判断数据是否拒通过比较不同组数据 的均值是否存在显著差异来判断 因素对数据的影响,常用的方法 有单因素方差分析、多因素方差
分析和协方差分析。
前提条件
方差分析的前提条件包括各组数 据的独立性、正态性和方差齐性。
适用范围 适用于科研、企事业单位的数据 分析。
R在统计整理中的应用
总结词
R是一款开源的统计分析软件,具有强大的统计计算和图形展示功能。
详细描述
R拥有丰富的统计分析包和函数库,支持各种统计分析方法,如回归 分析、聚类分析、主成分分析等,能够绘制各种统计图形。
适用范围
适用于需要进行复杂统计分析的场景。
操作难度
相对较高,需要一定的编程基础和统计学知识。
THANKS FOR WATCHING
感谢您的观看
标准差
方差的平方根,也是表示 数据离散程度的量。
变异系数
标准差与均值的比值,用 于消除数据规模的影响, 更好地比较不同数据的离 散程度。
偏度、峰度、四分位数
偏度
四分位数
描述数据分布对称性的量,正偏表示 数据向右偏移,负偏表示数据向左偏 移。
将数据分为四个等份,分别对应于下 四分位数、中位数、上四分位数和上 上四分位数。
保证统计资料的科学性。
及时性原则
及时对调查资料进行整理,保 证统计资料的时效性。
完整性原则
对调查资料进行全面、完整的 整理,避免遗漏和缺失。
02 数据收集与整理
数据来源与收集方法
调查问卷
通过设计问卷,向目标人群发放 并收集数据。
数据库
利用现有数据库,从中提取相关 数据。
显著性水平是用来判断假设是否成立的概率标准,临界值 则是用来判断数据是否拒通过比较不同组数据 的均值是否存在显著差异来判断 因素对数据的影响,常用的方法 有单因素方差分析、多因素方差
分析和协方差分析。
前提条件
方差分析的前提条件包括各组数 据的独立性、正态性和方差齐性。
适用范围 适用于科研、企事业单位的数据 分析。
R在统计整理中的应用
总结词
R是一款开源的统计分析软件,具有强大的统计计算和图形展示功能。
详细描述
R拥有丰富的统计分析包和函数库,支持各种统计分析方法,如回归 分析、聚类分析、主成分分析等,能够绘制各种统计图形。
适用范围
适用于需要进行复杂统计分析的场景。
操作难度
相对较高,需要一定的编程基础和统计学知识。
THANKS FOR WATCHING
感谢您的观看
标准差
方差的平方根,也是表示 数据离散程度的量。
变异系数
标准差与均值的比值,用 于消除数据规模的影响, 更好地比较不同数据的离 散程度。
偏度、峰度、四分位数
偏度
四分位数
描述数据分布对称性的量,正偏表示 数据向右偏移,负偏表示数据向左偏 移。
将数据分为四个等份,分别对应于下 四分位数、中位数、上四分位数和上 上四分位数。
保证统计资料的科学性。
及时性原则
及时对调查资料进行整理,保 证统计资料的时效性。
完整性原则
对调查资料进行全面、完整的 整理,避免遗漏和缺失。
02 数据收集与整理
数据来源与收集方法
调查问卷
通过设计问卷,向目标人群发放 并收集数据。
数据库
利用现有数据库,从中提取相关 数据。
统计学课件---第二章统计整理-35页PPT资料
要求编制组距数列。
编制等距数列
编制步骤:
⒈求全距
全距=最大值-最小值
⒉确定组距及组数 组距=全距÷组数 组距和组数成反比的关系,组数的确定一般原 则 (1)正确的反映总体各部分质的差异
(2)能够准确清晰的反映总体单位的分布特征
编制等距数列
⒊确定组限
组限的表示方法
对于离散变量,相邻组组限可以间断,也 可重叠;
4、基本单位分类 机构单位(住户 法人单位) 产业活动单位(基 层单位是指位于一个地点、主要从事一种经济活 动的单位。它与机构单位具有隶属关系,一个机 构单位可能包含一个或多个基层单位,而一个基 层单位仅属于一个机构单位 )
第一节 统计整理概述
一、统计整理的概念 二、统计整理的内容
统计整理概念
将统计调查得到的数据进行加 工整理,使其系统化、条理化, 符合分析的需要。
必要性 是统计调查的继续,统计分析的前 提和基础
统计整理的内容
(一)对原始数据资料进行审核检查和整 理
1、完整性审核 2、准确性审核
(二)对次级资料的检查与整理
的情况。
等距数列 变量值变动区间的长度相等 异距数列 变量值变动区间的长度不完全相等
等距数列
某工厂工人完成生产定额情况表
工人完成生产定额(%) 工人数(个)
90以下
30Байду номын сангаас
90—100
40
100—110
60
110—120
30
120以上
20
百分比(%)
16.7 22.2 33.3 16.7 11.1
合计
❖关键问题—选择分组标志和划分各组得界 限
(一)分组标志确定的原则 1、根据研究的目的与任务选择分组标志 2、要选择能够反映事物本质或主要特征的标
编制等距数列
编制步骤:
⒈求全距
全距=最大值-最小值
⒉确定组距及组数 组距=全距÷组数 组距和组数成反比的关系,组数的确定一般原 则 (1)正确的反映总体各部分质的差异
(2)能够准确清晰的反映总体单位的分布特征
编制等距数列
⒊确定组限
组限的表示方法
对于离散变量,相邻组组限可以间断,也 可重叠;
4、基本单位分类 机构单位(住户 法人单位) 产业活动单位(基 层单位是指位于一个地点、主要从事一种经济活 动的单位。它与机构单位具有隶属关系,一个机 构单位可能包含一个或多个基层单位,而一个基 层单位仅属于一个机构单位 )
第一节 统计整理概述
一、统计整理的概念 二、统计整理的内容
统计整理概念
将统计调查得到的数据进行加 工整理,使其系统化、条理化, 符合分析的需要。
必要性 是统计调查的继续,统计分析的前 提和基础
统计整理的内容
(一)对原始数据资料进行审核检查和整 理
1、完整性审核 2、准确性审核
(二)对次级资料的检查与整理
的情况。
等距数列 变量值变动区间的长度相等 异距数列 变量值变动区间的长度不完全相等
等距数列
某工厂工人完成生产定额情况表
工人完成生产定额(%) 工人数(个)
90以下
30Байду номын сангаас
90—100
40
100—110
60
110—120
30
120以上
20
百分比(%)
16.7 22.2 33.3 16.7 11.1
合计
❖关键问题—选择分组标志和划分各组得界 限
(一)分组标志确定的原则 1、根据研究的目的与任务选择分组标志 2、要选择能够反映事物本质或主要特征的标
南京大学统计学课件 ch2统计整理
组数=全距 组距 组数 全距/组距 全距 斯特杰斯经验公式: 斯特杰斯经验公式: 组数=1+3.322 Lg N 组数 由此推出
组距=(最大变量值 最小变量值 ( 最小变量值) 组距 (最大变量值-最小变量值)/(1+3.322Lg N )
1-11
例如:通过调查取得 个商业企业某月销售额资料: 例如:通过调查取得100个商业企业某月销售额资料: 个商业企业某月销售额资料 单位:万元) , , , , (单位:万元)20,60,45,90,105,56,250,89, , , , , 130,30,98,…300。 , , , 。 将这些数据资料按“销售额”的多少进行整理, 将这些数据资料按“销售额”的多少进行整理,得到下 列整理结果: 列整理结果: 销售额(万元) 企业数(个) 0 — 50 50 — 100 100— 150 150— 200 250— 300 合 计 12 25 30 23 10 100
统计整理的内容:分组、 统计整理的内容:分组、汇总和制表
1-12
第三节 变量数列
一、次数分布与变量数列 1、次数分布与变量数列的概念 、 在统计分组的基础上, 在统计分组的基础上,将总体所有的单位按 某一标志进行归类排列,称为次数分布, 某一标志进行归类排列,称为次数分布,或 频数分布。根据分组标志特征的不同, 频数分布。根据分组标志特征的不同,次数 分布数列可分为品质数列和变量数列。 分布数列可分为品质数列和变量数列。 2、变量数列的两个要素 、
第二章 统计整理
第一节 统计整理的概念和内容 第二节 统计分组 第三节 变量数列
1-1
第一节 统计整理的概念和内容
一、统计整理的概念和作用 1、根据统计研究的目的和任务,将调查取得的大量 、根据统计研究的目的和任务, 原始资料进行科学的分类和汇总, 原始资料进行科学的分类和汇总,为统计分析提供 系统化和条理化的综合统计资料的工作过程。 系统化和条理化的综合统计资料的工作过程。 2、通过统计整理使说明个体和局部的资料过渡到说 、 明总体和全局的资料。 明总体和全局的资料。 二、统计整理的内容
组距=(最大变量值 最小变量值 ( 最小变量值) 组距 (最大变量值-最小变量值)/(1+3.322Lg N )
1-11
例如:通过调查取得 个商业企业某月销售额资料: 例如:通过调查取得100个商业企业某月销售额资料: 个商业企业某月销售额资料 单位:万元) , , , , (单位:万元)20,60,45,90,105,56,250,89, , , , , 130,30,98,…300。 , , , 。 将这些数据资料按“销售额”的多少进行整理, 将这些数据资料按“销售额”的多少进行整理,得到下 列整理结果: 列整理结果: 销售额(万元) 企业数(个) 0 — 50 50 — 100 100— 150 150— 200 250— 300 合 计 12 25 30 23 10 100
统计整理的内容:分组、 统计整理的内容:分组、汇总和制表
1-12
第三节 变量数列
一、次数分布与变量数列 1、次数分布与变量数列的概念 、 在统计分组的基础上, 在统计分组的基础上,将总体所有的单位按 某一标志进行归类排列,称为次数分布, 某一标志进行归类排列,称为次数分布,或 频数分布。根据分组标志特征的不同, 频数分布。根据分组标志特征的不同,次数 分布数列可分为品质数列和变量数列。 分布数列可分为品质数列和变量数列。 2、变量数列的两个要素 、
第二章 统计整理
第一节 统计整理的概念和内容 第二节 统计分组 第三节 变量数列
1-1
第一节 统计整理的概念和内容
一、统计整理的概念和作用 1、根据统计研究的目的和任务,将调查取得的大量 、根据统计研究的目的和任务, 原始资料进行科学的分类和汇总, 原始资料进行科学的分类和汇总,为统计分析提供 系统化和条理化的综合统计资料的工作过程。 系统化和条理化的综合统计资料的工作过程。 2、通过统计整理使说明个体和局部的资料过渡到说 、 明总体和全局的资料。 明总体和全局的资料。 二、统计整理的内容
第四章--统计整理PPT教学课件
总,再加工、再汇总,使其条理化、系统化的工作过程。
例如:过调查取得100个商业企业 某月销售通额资料(单位:万元)20,60, 45,90,105,56,250,89,130,30,98, … 300.将这些数据资料按“销售额”的 多少进行整理,得到下列整理结果
借助统计方法,可进行统计分析,以 掌握202这0/121/1200个商业企业的经营状况.
变量 分组 方法
单项式 以一个变量值为一组或以变量的一个值为 分 组 一组.适用于离散性变量,且变量值的个数少
以变量变动的一个区间或以变量的一定变 组距式 动范围为一组,区间或范围的 距离称为组距. 分 组 适用于连续型变量和离散型变量的变量值较
多的情况
无论是品质分组,还是变量分组,都会遇到相同的问
值分布的次数少,其形状宛如一口古钟。
特征是靠近中间的变量值分布的次数少 U型分布 靠近两端的变量值分布的次数多,其形状
宛如英文字母U
J型分布
特征是次数随着变量值的增大而增多或 随变量值的增大而减少,其形状宛如英文 大写字母J
洛20伦20/茨12/1分2 布 专门用以测定社会收入分配的平等程度11
变量分配数列
组距分配数列
2020/12/12
等距数列
不等距数列
9
第四章 统计整理 累计频数或频率分配数列的编制方法
序 计划完成 工人数 比重 向上累计 向下累计 号 程度(%(人) (%) 人数 比重 人数 比重 1 60 — 70 2 1.0 2 1.0 200 100 2 70 — 80 5 2.5 7 3.5 198 99.0 3 80 — 90 14 7.0 21 10.5 193 96.5 4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0 6 110—120 52 26.0 169 84.5 83 41.5 7 120—130 23 11.5 192 96.0 31 15.5 8 130—140 8 4.0 200 100.0 8 4.0
统计整理 PPT课件
数据的排序
(要点)
1.
按一定顺序将数据排列,以发现一些明显 的特征或趋势,找到解决问题的线索
排序有助于对数据检查纠错,以及为重新 归类或分组等提供依据 在某些场合,排序本身就是分析的目的之 一 排序可借助于计算机完成
2.
3.
4.
数据的排序
(方法)
1.
定类数据的排序 字母型数据,排序有升序降序之分,但习惯上
2.
准确性审核
检查数据是否真实反映客观实际情况,内 容是否符合实际 检查数据是否有错误,计算是否正确等 如:文化程度:小学 职业:大学教师
数据的审核
(原始数据)
审核数据准确性的方法
1.
逻辑检查
从定性角度,审核数据是否符合逻辑,内容是否 合理,各项目或数字之间有无相互矛盾的现象 主要用于对定类数据和定序数据的审核
19
四、分组标志的选择
(一)分组标志选择的原则
1.目的性原则:根据研究问题的目的选择
需要具有对所研究问题的系统专业知识 2.本质性原则:选择反映现象本质特征的 标志作为分组标志。 反映职工生活水平:总收入 ? 平均收入?
20
3.具体条件原则:结合现象所处的 具体历史条件或经济条件 如:历史上富足生活的“三大件”。
21
(二)统计分组的种类
按分组标志个数不同分为:简单分组与复合分组
标 按性别分组 志 男性 人数(人) 比重(%)
简单分组
女性
国有企业
按企业性质分组 独资企业 其他企业 大型企业 按规模分组
简单分组又称单一分 平行分组 体系 组,就是对研究对象 总体只按一个标志的 分组进行分组。
对总体选择两个或 两个以上的标志进行简 单分组形成的分组体系
《统计整理》PPT课件
0
年份
h
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
CO2排放量
表3-2 2000-2005年我国国内生产总值构成情况
表3-3 某市1998年100个百货商场的年销售与流通费情况
组距
每组变量值变动区间的长度,为上 下限之差
组中值 每组变量取值范围的中点数值
组中值= 上限 下限
2
某地区100个百货商店 月销售额与流通费用情况
销售额(万 元)
上组限U
商(店个数)=10如每额0百中-:费5元支0(组商付=元距5品 的)0销 流d(=售 通万U-元L )
50以下
10
14.2
50~100 20
简单分组:按照单一标志分组
平行分组体系 各分组标志并列使用 交叉分组体系 (复合分组) 各分组标志交叉结合使用
平行分组体系
对教师 的分类
男性 按性别分类
女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
交叉分组体系
按性别 分类 对教师 按职称 的分类 分类 按年龄 分类
共计12组 男 2×3×2
700以上
合计
工人数(人)
10 42 17 15 12 4
100
表3-8某工厂工人完成生产定额情况累计变量数列
按完成件数分 组(件)
500以下 500~550 550~600 600~650 650~700
700以上
工人数 (人)
10 42 17 15 12 4
年份
h
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
CO2排放量
表3-2 2000-2005年我国国内生产总值构成情况
表3-3 某市1998年100个百货商场的年销售与流通费情况
组距
每组变量值变动区间的长度,为上 下限之差
组中值 每组变量取值范围的中点数值
组中值= 上限 下限
2
某地区100个百货商店 月销售额与流通费用情况
销售额(万 元)
上组限U
商(店个数)=10如每额0百中-:费5元支0(组商付=元距5品 的)0销 流d(=售 通万U-元L )
50以下
10
14.2
50~100 20
简单分组:按照单一标志分组
平行分组体系 各分组标志并列使用 交叉分组体系 (复合分组) 各分组标志交叉结合使用
平行分组体系
对教师 的分类
男性 按性别分类
女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
交叉分组体系
按性别 分类 对教师 按职称 的分类 分类 按年龄 分类
共计12组 男 2×3×2
700以上
合计
工人数(人)
10 42 17 15 12 4
100
表3-8某工厂工人完成生产定额情况累计变量数列
按完成件数分 组(件)
500以下 500~550 550~600 600~650 650~700
700以上
工人数 (人)
10 42 17 15 12 4
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
企业数(个)
0 — 50
12
50 — 100
25
100— 150
30
150— 200
23
250— 300
10
合计
100
统计整理的内容:分组、汇总和制表
.
1-12
第三节 变量数列
一、次数分布与变量数列 1、次数分布与变量数列的概念 在统计分组的基础上,将总体所有的单位按
某一标志进行归类排列,称为次数分布,或 频数分布。根据分组标志特征的不同,次数 分布数列可分为品质数列和变量数列。 2、变量数列的两个要素
以同一数值作为相邻两组的共同界限的组距式分组。 离散型变量,可间断组距式分组,也可连续组距式
分组。连续型变量,只能采用连续组距式分组。 “上限在不内”原则:在连续组距式分组中,以同
一个数值作为相邻两组共同的界限,统计上规定, 凡是总体某一个单位的变量值是相邻两组的界限值, 这一个单位归入作为下限值的那一组内。
1)统计资料的审核。 2)资料的分组和汇总。分组,即对资料按其性质和特点,
划分为若干类;汇总,加总计算形成各项统计指标。统计 分组和统计指标是整理的中心工作。 3)编制统计表或绘制统计图。 4)统计资料的积累、保管和公布。
.
1-2
第二节 统计分组一、统计分来自的概念与种类 1、统计分组根据统计研究的目的和客观现象的内在特点,按 某个标志(或几个标志)把被研究的总体划分为 若干个不同性质的组,称为统计分组。
计算公式: 次数密度=次数/组距
.
1-14
三、累计频数与累计频率
1、较小制累计次数(或频率):以变量值最 小一组的次数或频率为起点,向变量值高的 组依次累计次数或频率。每组的较小制累计 次数(或频率)表明小于该组变量值上限的 次数或频率合计有多少。
.
1-6
1)单项式分组与组距式分组
A)单项式分组:用一个变量值作为一组,形成单项 式变量数列。
变量值又称标志值。按数量标志分组,数量标志的 表现,就是变量的取值
单项式分组一般适用于离散型变量且变量变动范围 不大的场合。
B)组距式分组:将变量依次划分为几段区间,一段 区间表现为“从……到……”距离,把一段区间内的 所有变量值归为一组,形成组距式变量数列。区间 的距离就是组距。
2)按分组的标志的性质不同,分为品质分组(或称 属性分组)和数量分组(或称变量分组)。
品质分组:按品质(或属性)标志进行分组。品质分组所 形成的数列称为品质数列。
数量分组:按数量标志分组,数量标志的变异性体现在它 不断变动自身的数量上,故也称为变量分组。变量分组所 形成的数列称为变量数列。
.
1-4
.
1-5
二、统计分组的方法
1、品质分组的方法。 按品质标志分组,有些分组比较简单,分组
标志一经确定,组的名称和组数也随之确定。 2、数量分组的方法。 按数量标志分组,应注意如下两个问题:首
先,分组时各组数量界限的确定必须能反映 事物质的差别。其次,应根据被研究的现象 总体的数量特征,采用适当的分组形式,确 定相宜的组距、组限。
连续型变量或者变动范围较大的离散型变量,适宜 采用组距式分组。
.
1-7
2)间断组距式分组和连续组距式分组
下限,上限:组距式分组的每一组变量值中,其最 小值为下限,最大值为上限。
组距:上下限之间的距离。 组限:相邻两组的界限。 间断组距式分组:组限不相连的组距式分组。 连续组距式分组:组限相连(或称相重叠的),即
2、统计分组的原则
组内的同质性 组间的差异性
.
1-3
3、统计分组的种类
1)按分组标志的多少,可分为简单分组和复合分组。
简单分组:就是对研究现象按一个标志进行分组。 复合分组:用两个或两个以上标志分组,即先按一个标志
分组,在此基础上再按第二个标志分小组,又再层叠地按 第三个标志分成更小的组,这称为复合分组。
组距=(最大变量值-最小变量值)/(1+3.322Lg N )
.
1-11
例如:通过调查取得100个商业企业某月销售额资料: (单位:万元)20,60,45,90,105,56,250,89,
130,30,98,…300。 将这些数据资料按“销售额”的多少进行整理,得到下 列整理结果:
销售额(万元)
开口组的组距:以相邻组的组距为本组的组距。
2.组中值:上下限之间的中点数值称为组中值,
组中值的计算公式:
组中值 上限下限
2
.
1-10
计算平均指标或进行其它统计分析时,常以 组中值来代表各组标志值的平均水平。
3.组数
组数=全距/组距 斯特杰斯经验公式:
组数=1+3.322 Lg N 由此推出
1)变量值,一般用x表示; 2)各组所出现的单位数,即次数,亦称频数,一
般用f表示。
.
1-13
二、变量数列的编制
1、编制方法 2、频率的性质
1)任何频率都是界于0和1之间的一个分数 2)各组频率之和等于1
3、次数密度:采用异距分组,各组次数的多 少受到组距不同的影响,为消除异距分组所 造成的影响须计算次数密度(或称频数密 度)。
3)按分组的作用和任务不同,分为类型 分组、结构分组和分析分组。
类型分组:把复杂的现象总体,划分为若干个不 同性质的部分,就是类型分组。
结构分组:在对总体分组的基础上计算出各组对 总体的比重,借此研究总体各部分的结构,即结 构分组。
分析分组:为研究现象之间依存关系而进行的统 计分组即分析分组。
.
1-8
3)等距分组与异距分组
等距分组:标志值在各组保持相等的组距, 即各组的标志值变动都限于相同的范围。一 般用于标志值变动比较均匀的场合。
异距分组:各组的组距不相等。
.
1-9
相关指标的计算
1.组距
连续式分组的组距计算公式:
组距=本组上限–本组下限
间断式分组的组距计算公式:
组距=本组上限–本组下限+1
第二章 统计整理
第一节 统计整理的概念和内容 第二节 统计分组 第三节 变量数列
.
1-1
第一节 统计整理的概念和内容
一、统计整理的概念和作用 1、根据统计研究的目的和任务,将调查取得的大量
原始资料进行科学的分类和汇总,为统计分析提供 系统化和条理化的综合统计资料的工作过程。 2、通过统计整理使说明个体和局部的资料过渡到说 明总体和全局的资料。 二、统计整理的内容