统计整理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标志值相等的量具有不同意义的场合 标志值按一定比例发展变化的场合
商场营业额
例:计算组中值
按学生成绩分组(分)人数(人) 所占比重(%) 60以下 60—70 70—80 80—90 90以上 合计
单选题
1、统计分组的关键在于 A.确定分组标志 B.确定组数 C.确定组距 D.确定分组界限
分组方法
分组方法
单项式分组
组距分组 等距分组 异距分组
单项式分组表(实例)
表3-4 某车间50名工人日加工零件数分组表
零件数 频数 零件数 频数 零件数 频数
(个)
(人)
(个)
(人)
(个)
(人)
107
1
119
1
128
2
108
2
120
2
129
1
110
1
121
1
130
1
112
2
122
4
131
1
113
m 4-7 6-10 7-12 10-20
本例中可取组数 m = 6
一般 m 10
第三步:确定组距
组数和组距的关系: h R
m
确定组距 –根据 h R 来确定
m
–组距 h= 32/6 = 5.33(可取为5)
第四步:确定组限
组限的确定要能反映总体分布特征
满足条件:
– 最小组的下限<= – 最大组的上限>=
适用于离散型变量且变量的取值4人不多。
如,职工家庭人口数,其取值不5人可能很多, 且每一个取值都可视为一种类型6人:
2)组距分组
凡是用一定范围内的两 个变量值表示一个组的
分组。适用于连续型变
量或虽为离散型变量但 取值很多,不便一一列 举的情况。
(1)连续型变量的组距 式分组
如对商店按销售额进行分 组:
时效
统计分组
概念
根据统计研究任务的要求和现象总体的内 在特点,把统计总体按照某一(一定)标 志划分为若干性质不同又有联系的几个部 分 (定性分类)
于总体而言“分”,于个体而言“合” 组内同质,组间差异
统计分组的作用
➢ 划分社会经济类型;
➢ 研究同类总体的结构;
从数量上反映总体内部的结构
➢ 分析被研究现象总体诸标志之间的联系和 依存关系。
编制过程
首先,对上面的数据进行排序 107 108 108 110 112 112 113 114
115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
105~110
3
6
110~115
5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135~140
4
8
等距分组表(上下组限间断)
表3-6 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~109
3
6
110~114
5
10
115~119
8
16
X min
X max
其确定的方式有很多
第五步:次数汇总(1)
计算各组次数:落在各组的单位数 计算各组频率:各组单位数占总体单位
数的比重 –任何组的频率都在0-1之间 –各组的频率之和等于1
等距分组表(上下组限重叠)
表3-5 某车间50名工人日加工零件数分组表
按零件数分组 频数(人)
频率(%)
数
110以下 3 6 3 6
50 100
110— 120 120— 130 130—
13 26 16 32 24 48 40 80 10 20 50 100
42 84 20 40
48
(五)次数分布的表示
1、列表法 2、图示法
–直方图和条形图 –折线图 –圆形图 –茎叶图 –线图 –雷达图
2、将统计总体按某一标志分组的结果 表现为
A.组内同质性,组间差异性 B.组内差异性,组间差异性 C.组内差异性,组间同质性 D.组内同质性,组间同质性
3、工业企业按经济类型分组和工业企业 按职工人数分组,两个统计分组是
A.按数量标志分组
B.按品质标志分组
C.前者按数量标志分组,后者按品质标 志分
1、按分组任务和作用不同
类型分组 结构分组
通常认为,总体按品质标志分组属类型分组; 按数量标志分组属结构分组 分析分组 分组标志称为原因标志,与原因对应的标志 称为结果标志,且要求计算为平均数或相对 数。
2、按分组标志个数不同
简单分组
把总体只按一个标志分组。
复合分组
对同一总体选择两个或两个以上标志层叠 起来进行分组。例如,可以 同时选择学 科、学制、 性别三个标志对某学院全体 在校学生这个总体 进行分组。
最大值139 最小值107 计算全距:全距 = 最大值 – 最
小值 R X max X min =32
第二步:确定组数m
组数的确定以能显示数据分布特征和规律 为目的
–1、公式: m 1 3.3lg N
- 2、经验:
资料数目N 50以下 50-100
100-200 200以上
12
135以上
4
8
合计
50
100
等距分组与不等距分组
(在表现频数分布上的差异)
1. 等距分组 – 各组频数的分布不受组距大小的影响 – 可直接根据绝对频数来观察频数分布的 特征和规律
2. 不等距分组 – 各组频数的分布受组距大小不同的影响 – 各组绝对频数的多少不能反映频数分布 的实际状况
– 需要用频数密度(频数密度=频数/组
各组单位数之和占总体单位数的比重
向下累计频数(频率)
先列出各组的下限,按变量值高的组向变 量值低的组依次累计频数(频率)
某组向下累计频数表明该组下限以上的各 组单位数之和是多少
某组向上累计频率表明该组下限以上的各 组单位数之和占总体单位数的比重
50名工人日产零件数次数分布表
按零件数 次数 频率
(一)统计整理的概念
根据统计研究任务的要求,对调查所搜集 到的原始资料进行分组、汇总,使其条理 化、系统化的工作过程,就是统计整理。
对于已整理过的次级资料进行再整理,也 属于统计整理。
(二)统计资料整理的作用
通过综合指标对总体作出概括性说明 整个统计工作和研究过程的中间环节 积累历史资料的必要手段
3 6 100
向下累计 次数 频率(%)
50 100
110—120 13 26
110 47 98
120—130 24 48
120 34 68
130—140 10 20
130 10
20
合 计 50 100
—
—
50名工人日产零件数次数分布表
按零件 次 频率 向上累计
向下累计
数分组 数 (%)次数 频率%) 次 频率(%)
变量值只是在整数间变动,可采用间断组 距式分组,也可采用连续组距式分组
变量值在一定范围内的表现可以是整数也 可以是小数,只能采用连续组距式分组
连续组距式分组,遵循“上限不在内”原 则
注意 –必须采用异距分组的情况
标志值分布很不均匀的场合
分布较密集的区间采用短组距,稀疏区间 用长组距
•按销售额分组(万元) •50以下 •50—200
•200—400 •400—600 •600—800 •800以上
(2)离散型变量的组距式分组
如对某企业的生产小组按人数分组:
不重叠组限式分组
生产小组 按人数分组(人)
5—10 11—16 17—22
重叠组限式分组 (上限不在本组内)
生产小组 按人数分组(人)
120~124
14
28
125~129
10
20
130~134
6
12
135~139
4
8
等距分组表(使用开口组)
表3-7 某车间50名工人日加工零件数分组表
按零件数分组 频数(人)
频率(%)
110以下
3
6
110~114
5
10
115~119
8
16
120~124
14
28
125~129
10
20
130~134
6
属性分配数列分为品质数列和变量数列 变量数列分为单项式数列和组距式数列 组距式数列分为等距数列和不等距数列
次数密度=次数/组距,主要用于消除各组
组距不相等而造成的现象分布的影响。
(四)变量分配数列的编制
编制步骤
(1)将杂乱无章的数据从小到大排列, 找出最大值和最小值;
(2)确定组数和组距; (3)确定组限及组限的表示形式 (4)统计各组次数,计算合计栏,计算
D.前者按品质标志分组,后者按数量标 志分
三 次数分布
(一)概念 在统计分组的基础上将总体的所有单位按
组归类,并把所有的组及其单位数按一定顺 序排列起来,用以反映总体单位在各组的分 布状况。又称:分配数列 (二)组成要素 总体按某标志所分的组 x; 各组所占有的单位数—次数f。
(三)分类
向上累计
分组
(%) 各组上限 次数 频率(%)
110以下
36
110
110—120 13 26
120
120—130 24 48
130
130—140 10 20
140
合计
50 100
36
16 32
40 80
50 100
—
—
50名工人日产零件数次数分布表
按零件数 分组
110以下
次数 频率 (%) 各组下 限
(三)统计资料整理的主要步骤
设计和编制统计资料的汇总方案 资料审核 统计分组。是统计整理的关键 汇总——统计整理的中心内容。主要有手
工汇总和电子计算机汇总。 再次审核 编制统计表,绘制统计图
统计资料的审核
资料的审核
原始资料 二手资料
完整性 及时性 准确性
适用
逻辑检查 计算检查
统计数据的整理 与显示
教学目的和要求
学习目的和要求:了解统计整理的
概念、和步骤;掌握统计分组的方法 及其有关次数分布的知识;掌握统计 表的概念、构成与设计方法。
重点和难点:统计分组和次数分布
统计资料整理
一 统计整理的内容 二 统计分组 三 次数分布 四 统计表
一 统计整理的内容
举例:
理科学生组 – 本科学生组
男学生组 女学生组
– 专科学生组 男学生组 女学生组
文科学生组 本科学生组 男学生组 女学生组 专科学生组 男学生组 女学生组
3、按分组标志性质不同
按品质标志分组 –实际上最复杂:如农村和城镇
1)按组单数。项量式标分志组分:组一-变个量变分量组按值家表庭示人123一人 人 人口个数组分的组分
二 统计分组
(一)统计分组标志的选择原则
要选择能够反映事物本质或主要特征 的标志
应根据研究的目的与任务选择 根据现象所处的历史条件的变化选择
(二)统计分组的分类
1、按分组任务和作用不同 类型分组 结构分组 分析分组
2、按分组标志个数不同 简单分组 复合分组
3、按分组标志性质不同 按品质标志分组 按数量标志分组
1
123
4
133
2
114
1
124
3
134
2
115
1
125
2
135
1
117
3
126
2
137
1
wk.baidu.com
118
3
127
3
139
2
组距分组(要点)
1. 将变量值的一个区间作为一组
2. 适合于连续变量
3. 适合于变量值较多的情况
4. 遵循“不重不漏”的原则
5. 可采用等距分组,也可采用不等 距分组
第一步:排序,计算全距
5—11 11—17 17—23
(3)组距式分组中的有关问题
组限:包括上限、下限(开口组和闭口组) 组距:=上限—下限(等距分组和异距分组)
组中值
组中值 下限 上限 2
组中值 下限 邻组组距 2
组中值 上限 邻组组距 2
闭口组 缺上限的开口组 缺下限的开口组
注意 -1
距)反映频数分布的实际状况
第五步:次数汇总(2)
计算各组的累计次数、累计频率 –向上累计:按变量值由小到大累计 –向下累计 (见例)
向上累计频数(频率)
先列出各组的上限,按变量值低的组向
变量值高的组依次累计频数(频率) 某组向上累计频数表明该组上限以下的
各组单位数之和是多少 某组向上累计频率表明该组上限以下的
各组的相应频率。
编制频数分布表的 步骤
编制频数分 布表的步骤
确
确
确
计
编
定
定
定
算
制
组
组
组
频
表
数
距
限
数
格
变量分布数列的编制
某生产车间 50 名 工 人 日 加工零件数 如下(单位 :个)。试 采用单变量 值对数据进 行分组。
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
商场营业额
例:计算组中值
按学生成绩分组(分)人数(人) 所占比重(%) 60以下 60—70 70—80 80—90 90以上 合计
单选题
1、统计分组的关键在于 A.确定分组标志 B.确定组数 C.确定组距 D.确定分组界限
分组方法
分组方法
单项式分组
组距分组 等距分组 异距分组
单项式分组表(实例)
表3-4 某车间50名工人日加工零件数分组表
零件数 频数 零件数 频数 零件数 频数
(个)
(人)
(个)
(人)
(个)
(人)
107
1
119
1
128
2
108
2
120
2
129
1
110
1
121
1
130
1
112
2
122
4
131
1
113
m 4-7 6-10 7-12 10-20
本例中可取组数 m = 6
一般 m 10
第三步:确定组距
组数和组距的关系: h R
m
确定组距 –根据 h R 来确定
m
–组距 h= 32/6 = 5.33(可取为5)
第四步:确定组限
组限的确定要能反映总体分布特征
满足条件:
– 最小组的下限<= – 最大组的上限>=
适用于离散型变量且变量的取值4人不多。
如,职工家庭人口数,其取值不5人可能很多, 且每一个取值都可视为一种类型6人:
2)组距分组
凡是用一定范围内的两 个变量值表示一个组的
分组。适用于连续型变
量或虽为离散型变量但 取值很多,不便一一列 举的情况。
(1)连续型变量的组距 式分组
如对商店按销售额进行分 组:
时效
统计分组
概念
根据统计研究任务的要求和现象总体的内 在特点,把统计总体按照某一(一定)标 志划分为若干性质不同又有联系的几个部 分 (定性分类)
于总体而言“分”,于个体而言“合” 组内同质,组间差异
统计分组的作用
➢ 划分社会经济类型;
➢ 研究同类总体的结构;
从数量上反映总体内部的结构
➢ 分析被研究现象总体诸标志之间的联系和 依存关系。
编制过程
首先,对上面的数据进行排序 107 108 108 110 112 112 113 114
115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
105~110
3
6
110~115
5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135~140
4
8
等距分组表(上下组限间断)
表3-6 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~109
3
6
110~114
5
10
115~119
8
16
X min
X max
其确定的方式有很多
第五步:次数汇总(1)
计算各组次数:落在各组的单位数 计算各组频率:各组单位数占总体单位
数的比重 –任何组的频率都在0-1之间 –各组的频率之和等于1
等距分组表(上下组限重叠)
表3-5 某车间50名工人日加工零件数分组表
按零件数分组 频数(人)
频率(%)
数
110以下 3 6 3 6
50 100
110— 120 120— 130 130—
13 26 16 32 24 48 40 80 10 20 50 100
42 84 20 40
48
(五)次数分布的表示
1、列表法 2、图示法
–直方图和条形图 –折线图 –圆形图 –茎叶图 –线图 –雷达图
2、将统计总体按某一标志分组的结果 表现为
A.组内同质性,组间差异性 B.组内差异性,组间差异性 C.组内差异性,组间同质性 D.组内同质性,组间同质性
3、工业企业按经济类型分组和工业企业 按职工人数分组,两个统计分组是
A.按数量标志分组
B.按品质标志分组
C.前者按数量标志分组,后者按品质标 志分
1、按分组任务和作用不同
类型分组 结构分组
通常认为,总体按品质标志分组属类型分组; 按数量标志分组属结构分组 分析分组 分组标志称为原因标志,与原因对应的标志 称为结果标志,且要求计算为平均数或相对 数。
2、按分组标志个数不同
简单分组
把总体只按一个标志分组。
复合分组
对同一总体选择两个或两个以上标志层叠 起来进行分组。例如,可以 同时选择学 科、学制、 性别三个标志对某学院全体 在校学生这个总体 进行分组。
最大值139 最小值107 计算全距:全距 = 最大值 – 最
小值 R X max X min =32
第二步:确定组数m
组数的确定以能显示数据分布特征和规律 为目的
–1、公式: m 1 3.3lg N
- 2、经验:
资料数目N 50以下 50-100
100-200 200以上
12
135以上
4
8
合计
50
100
等距分组与不等距分组
(在表现频数分布上的差异)
1. 等距分组 – 各组频数的分布不受组距大小的影响 – 可直接根据绝对频数来观察频数分布的 特征和规律
2. 不等距分组 – 各组频数的分布受组距大小不同的影响 – 各组绝对频数的多少不能反映频数分布 的实际状况
– 需要用频数密度(频数密度=频数/组
各组单位数之和占总体单位数的比重
向下累计频数(频率)
先列出各组的下限,按变量值高的组向变 量值低的组依次累计频数(频率)
某组向下累计频数表明该组下限以上的各 组单位数之和是多少
某组向上累计频率表明该组下限以上的各 组单位数之和占总体单位数的比重
50名工人日产零件数次数分布表
按零件数 次数 频率
(一)统计整理的概念
根据统计研究任务的要求,对调查所搜集 到的原始资料进行分组、汇总,使其条理 化、系统化的工作过程,就是统计整理。
对于已整理过的次级资料进行再整理,也 属于统计整理。
(二)统计资料整理的作用
通过综合指标对总体作出概括性说明 整个统计工作和研究过程的中间环节 积累历史资料的必要手段
3 6 100
向下累计 次数 频率(%)
50 100
110—120 13 26
110 47 98
120—130 24 48
120 34 68
130—140 10 20
130 10
20
合 计 50 100
—
—
50名工人日产零件数次数分布表
按零件 次 频率 向上累计
向下累计
数分组 数 (%)次数 频率%) 次 频率(%)
变量值只是在整数间变动,可采用间断组 距式分组,也可采用连续组距式分组
变量值在一定范围内的表现可以是整数也 可以是小数,只能采用连续组距式分组
连续组距式分组,遵循“上限不在内”原 则
注意 –必须采用异距分组的情况
标志值分布很不均匀的场合
分布较密集的区间采用短组距,稀疏区间 用长组距
•按销售额分组(万元) •50以下 •50—200
•200—400 •400—600 •600—800 •800以上
(2)离散型变量的组距式分组
如对某企业的生产小组按人数分组:
不重叠组限式分组
生产小组 按人数分组(人)
5—10 11—16 17—22
重叠组限式分组 (上限不在本组内)
生产小组 按人数分组(人)
120~124
14
28
125~129
10
20
130~134
6
12
135~139
4
8
等距分组表(使用开口组)
表3-7 某车间50名工人日加工零件数分组表
按零件数分组 频数(人)
频率(%)
110以下
3
6
110~114
5
10
115~119
8
16
120~124
14
28
125~129
10
20
130~134
6
属性分配数列分为品质数列和变量数列 变量数列分为单项式数列和组距式数列 组距式数列分为等距数列和不等距数列
次数密度=次数/组距,主要用于消除各组
组距不相等而造成的现象分布的影响。
(四)变量分配数列的编制
编制步骤
(1)将杂乱无章的数据从小到大排列, 找出最大值和最小值;
(2)确定组数和组距; (3)确定组限及组限的表示形式 (4)统计各组次数,计算合计栏,计算
D.前者按品质标志分组,后者按数量标 志分
三 次数分布
(一)概念 在统计分组的基础上将总体的所有单位按
组归类,并把所有的组及其单位数按一定顺 序排列起来,用以反映总体单位在各组的分 布状况。又称:分配数列 (二)组成要素 总体按某标志所分的组 x; 各组所占有的单位数—次数f。
(三)分类
向上累计
分组
(%) 各组上限 次数 频率(%)
110以下
36
110
110—120 13 26
120
120—130 24 48
130
130—140 10 20
140
合计
50 100
36
16 32
40 80
50 100
—
—
50名工人日产零件数次数分布表
按零件数 分组
110以下
次数 频率 (%) 各组下 限
(三)统计资料整理的主要步骤
设计和编制统计资料的汇总方案 资料审核 统计分组。是统计整理的关键 汇总——统计整理的中心内容。主要有手
工汇总和电子计算机汇总。 再次审核 编制统计表,绘制统计图
统计资料的审核
资料的审核
原始资料 二手资料
完整性 及时性 准确性
适用
逻辑检查 计算检查
统计数据的整理 与显示
教学目的和要求
学习目的和要求:了解统计整理的
概念、和步骤;掌握统计分组的方法 及其有关次数分布的知识;掌握统计 表的概念、构成与设计方法。
重点和难点:统计分组和次数分布
统计资料整理
一 统计整理的内容 二 统计分组 三 次数分布 四 统计表
一 统计整理的内容
举例:
理科学生组 – 本科学生组
男学生组 女学生组
– 专科学生组 男学生组 女学生组
文科学生组 本科学生组 男学生组 女学生组 专科学生组 男学生组 女学生组
3、按分组标志性质不同
按品质标志分组 –实际上最复杂:如农村和城镇
1)按组单数。项量式标分志组分:组一-变个量变分量组按值家表庭示人123一人 人 人口个数组分的组分
二 统计分组
(一)统计分组标志的选择原则
要选择能够反映事物本质或主要特征 的标志
应根据研究的目的与任务选择 根据现象所处的历史条件的变化选择
(二)统计分组的分类
1、按分组任务和作用不同 类型分组 结构分组 分析分组
2、按分组标志个数不同 简单分组 复合分组
3、按分组标志性质不同 按品质标志分组 按数量标志分组
1
123
4
133
2
114
1
124
3
134
2
115
1
125
2
135
1
117
3
126
2
137
1
wk.baidu.com
118
3
127
3
139
2
组距分组(要点)
1. 将变量值的一个区间作为一组
2. 适合于连续变量
3. 适合于变量值较多的情况
4. 遵循“不重不漏”的原则
5. 可采用等距分组,也可采用不等 距分组
第一步:排序,计算全距
5—11 11—17 17—23
(3)组距式分组中的有关问题
组限:包括上限、下限(开口组和闭口组) 组距:=上限—下限(等距分组和异距分组)
组中值
组中值 下限 上限 2
组中值 下限 邻组组距 2
组中值 上限 邻组组距 2
闭口组 缺上限的开口组 缺下限的开口组
注意 -1
距)反映频数分布的实际状况
第五步:次数汇总(2)
计算各组的累计次数、累计频率 –向上累计:按变量值由小到大累计 –向下累计 (见例)
向上累计频数(频率)
先列出各组的上限,按变量值低的组向
变量值高的组依次累计频数(频率) 某组向上累计频数表明该组上限以下的
各组单位数之和是多少 某组向上累计频率表明该组上限以下的
各组的相应频率。
编制频数分布表的 步骤
编制频数分 布表的步骤
确
确
确
计
编
定
定
定
算
制
组
组
组
频
表
数
距
限
数
格
变量分布数列的编制
某生产车间 50 名 工 人 日 加工零件数 如下(单位 :个)。试 采用单变量 值对数据进 行分组。
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121