分组计算组数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
99
21
85
2
84
12
94
22 106
3
111
13
119
23
101
4
91
14
87
24 105
5
109
15
118
25
96
6
91
16
97
26
105
7
111
17
103
27 107
8
107
18
103
28 128
9
121
19
95
29 111
返回 10
105
20
106
30
101
一、品质次数分配的编制
按品质标志进行分组,由总体各组的名称及各组的单 位数(次数)组成。
某高校学生的性别分布
按性别分组 人数 比例(%)
女生
5448
41.2
男生 合计
7804 13262
58.8 100.0
Excel 演示
二、变量次数分配的编制
1、将原始资料按顺序排序 2、确定组数与组距
(1)当n较大时,k取10~20;当n<50时, k取5~6 ;
▪ 连续型变量,相邻组的上、下限采用重叠的方法分 组界定。
如按职工工资分组,0-500,500-1000,10001500,1500-2000,…,等; 4、将各个数据按其数值大小归入相应的组内。
某企业非熟练工人的周工资额(元)单位:元
人员编号 周收入 人员编号 周收入 人员编号 周收入
1
106
11
相邻两组上下限时,一般把此值归并到作为下限的那 一组。
注意EXCEL!
(2)全距:变量值中最大值与最小值的差数 组数=全距/组距 组距=上限—下限
(3)组中值=(上限+下限)/2
缺下限的开口组:组距数列的首组出现 “***以下”
组中值 = 上限 - 邻组组距 2
缺上限的开口组:组距数列的末组出 现“***以上”
▪ 品质分组:按品质标志进行的分组 如人口总体按性别分组、高校教师按职
称分组。
▪ 变量分组:按数量标志进行的分组 如企业按职工人数分------1000人以下、
1000-5000人、5000人以上
三、分组标志与分组体系的选择
1、根据统计研究的目的,在对现象进行分析的基础 上,抓住具有本质性的区别及反映现象内在联系的 标志来作为分组标志。
25%
33%
分组前
分组后
42%
分组时注意:
•将具有共性的个体归入同一组
•将总体内部个体间的差异通过组别区分开 来
分组的原则:保证总体中的任何一个个体或原 始数据都能归于某一个组且仅能归于某一个组,即 保证不重、不漏。
统计分组的关键是分组标志的选择
二、统计分组的种类
1、按分组标志的多少不同分: ▪ 简单分组:分组仅按一个标志来进行 ▪ 复合分组:分组按两个或两个以上的标志进行,并
•600—800;800以上
2)离散型变量的组距式分组 如对某企业的生产小组按人数分组:
生产小组按人数分组(人) 组数 5—10 11—16 17—22
组距式分组中的有关问题:
(1)组距和组中值
▪ 组距两端的数值称为组限,其中:每组的起点 数值称下限、每组的终点数值称上限。
▪ 离散型变量分组:各组的上下限都可以用确定的数 值(整数)表示。
组中值 = 下限 + 邻组组距 2
合理确定组中值
例如: 第一组:50人以下 第二组:50—200人
按公式 组中值 50 200 50 2(5 不合理)
2
应定下限为0 组中值 (0 50)/ 2 25
3.2 次数分配
▪ 数据观察值在各组中的个数称为次数,各组间的次数 称为次数分配。次数分配描述了总体的结构和特征。
变量分组的目的并不是单纯确定各组在数量 上的差别,而是要通过数量上变化来区分各组的 不同类型和性质。
▪ 单项式分组:是依次将每一个变量值作为一组。 (适用于离散型变量且变量取值不多的情况)
▪ 例如,居民家庭人口数,其取值不可能很多,且每一个 取值都可视为一种类型。
按家庭人口数分组 1人 2人 3人 4人 5人 6人
▪ 连续型变量分组:相邻组的上限和下限无法用两 个确定的数值分别表示,因此上一组的上限同时也 是下一组的下限。
例如:企业按工人工资对工人进行分组如下: 500—600元 600---700元 700---800元
如果某工人工资为700元,应将他归并到哪一组? “上组限不计入”原则:遇到某单位的标志值刚好等于
且层叠在一起。
例如:对全国的工业企业进行
简单分组:
按经济类型分:全民所有制企业、集体所有制企 业、城乡个体企业
按轻重工业分:重工业、轻工业
按企业规模大小分:大型企业、中型企业、小型 企业
复合分组:
大型企业
重工业 中型企业
全民所有制
小型企业
轻工业
集体所Βιβλιοθήκη Baidu制 重工业 轻工业
2、按分组标志的性质不同分:
(2)如果数据分布比较均匀、对称,即中间数值次数 多,大小极端值次数少,考虑用以下公式来确定组数:
组数=1+3.322 log n 式中, n 表示总次数, log 表示以10为底的对数。
组距=
(观察值中的最大数值-观察值中的最小数值)/组数
3、确定组限 每组区间的界限称为组限。
▪ 离散型变量,分组时相邻组的组限必须间断。 如某省企业按职工人数分组,可分为:0-99,100199,200-299,300-399,…,900-1000等;
▪ 组距式分组:把整个变量值依次划分为几个区间, 各个变量值按其大小确定所归并的区间,区间的距离 称组距。 包括等距分组和不等距分组 适用于连续型变量或虽为离散型变量但取值很多, 不便一一列举的情况。
1)连续型变量的组距式分组 如对商店按销售额进行分组 :
•按销售额分组(万元)
•50以下;50—200;200—400;400—600
2、在统计整理中,为了全面认识被研究现象总体, 常常需要运用多个分组标志对总体进行分组,形成 一系列相互联系、相互补充的分组体系。
四、统计分组方法
1、品质分组的方法 ▪ 分组标志一经确定,组名称和组数也就确定,不
存在组与组之间界限区分的困难。 ▪ 复杂的情况下,各组界限不易划分,从这一组到
另一组存在各种过度状态,边缘不清。 2、变量分组的方法:
第三章 数据整理
按照研究的目的,将搜集到的原始数据进 行整理加工,从中提取有用的信息,并搜索其 中的数量规律性。
3.1 数据分组 3.2 次数分配 3.3 统计指标 3.4 统计表和统计图
3.1 数据分组
▪ 一、统计数据分组的目的及原则
分组是将总体所有单位按一定的标准区分为若干部分
分组的目的:概括数据,清晰条理