应用经济统计学数据分组

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

茎叶图
茎叶
次数
0 13 8
3
1 09
2
2 137 9
4
3 158
3
4 569
3
5 267
3
6 0222668 88 9
7 26
2
8
0
9 1 355
4
累计次数分配图
小于上组限的累积次数分配
每周工资 上组限 组次数 小于上组限的
(元)
累计次数
(人)
80~90
90
3
3
小于上组限的累 积百分比(%)
10
变量次数分配的编制
1、将原始资料顺序排序 2、将各个数据按其数值大小归入相应的组内 3、确定组数与组距
如果数据分布比较均匀、对称,即中间数值次数多, 大小极端值次数少,考虑用以下公式来确定组数: 组数=1+3.322 log n
组距= (观察值中的最大数值-观察值中的最小数值)/组数
4、确定组限
分组计算
50
频率(%)
6 10 16 28 20 12 8
100
变量次数分配的图示
➢直方图:频数分配直方图、频率分配直 方图
➢次数多边形图 ➢茎叶图 ➢累积次数分配图:小于上组限的累积次
数分配图、大于下组限的累积次数分配 图。[特例] 洛伦茨曲线
直方图
以变量值为横坐标、次数为纵坐标,以矩形高度表示各组 次数(频数)分配多少。如下图:
90~100
100
7
10
33
100~110 110
13
23
77
110~120 120
5
28
93
120~130 130
2
30
100
累计次数分配图
以变量值为横坐标、以累积计次数为纵坐标描点连接而 成的图,如下图:
累计次数分配图
大于下组限的累积次数分配
每周工资 上组限 组次数 小于上组限的
(元)
累计次数
基尼系数 r=A/(A+B) r=0 绝对平等 r=1 绝对不平等 r越大越不平等,反之则越平等。
龄分组
人)
1岁以下
2
2
1~7岁
12.2
2.03
7~18岁
24
2.18
18~25岁
14.8
2.11
25~55岁
34.2
1.14
55岁以上
16.3
0.54
合计
103.5
--
组限分类
➢ 重叠组限:“100~200”,“200~300” ➢ 间断组限:“100~199”,“200~299” ➢ 开口组:“100以下”,“500以上” 应用范围: 离散变量可采用间断组限,亦可采用重叠组限; 连续变量应采用重叠组限; 数据资料中若有极端值应采用开口组.
2.确定组数及组距
组数=1+3.322lg50=6.64≈7 组距=(139-107)/7=4.6 ≈5
3.确定组限
最小值为107,以105为第一组下限。采用 重叠组限.
某车间50名工作日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105-110
3
6
110-115
5
10
115-120
8
16
120-125
(人)
80~90
80
3
30
小于上组限的累 积百分比(%)
100
90~100
90
7
27
90
100~110 100
13
20
66
110~120 110
5
7
23
120~130 120
2
2
7
累计次数分配图
洛伦茨曲线
以人口百分比为横坐标、以累积收入百分比为纵坐标 描点连接而成的图形,如图:
基尼系数
反映一国收入的平等程度。 如上图
反映不出观察值 分布特征
分组太细会出现什么问题?
140
120
100
工资
80 60
40
20
0
工资表
1 人员编号
不等距分组
在不等距分组情况下,要比较各组次数或 分析总体结构,要消除由组距不等造成的 影响。为此需计算单位组距的次数,即频 数密度。
每组单位组距次数=某组次数/该组组距
不等距分组
人口按年 人口数(万 频数密度(万人)
统计数据的分组
分组是将总体所有单位按一定的标 准区分为若干部分
分组的目的:概括数据,清晰条理
如何分组?
将具有共性的个 体归入同一组
将总体内部个 体间的差异通 过组别区分开 来
统计数据的分组
• 品质数列是按现象的性质、类别标志进 行的分组。例如人口按性别和民族分组;
• 时间数列按时间发生的先后顺序分组。 例如我国解放后各年的人口数字;GDP
• 变量数列是按某一数量标志大小顺序进 行的分组。例如某企业按工资收入的多 少分组;
• 空间数列是按不同地区标志进行的分组。 例如人口按省、市、自治区分组;
次数分配
• 数据观察值在各组中的个数称为次数, 各组间的次数称为次数分配。次数分配 描述了总体的结构和特征。
• 例如:某企业非熟练工人的周工资额(元) • 如何分组?
人次
14 12 10 8 6 4 2 0
80-90
90-100
分配直方图
收入
100-110 110-120
120-130
频数分布直方图
直方图
频率分布直方图
次数多边形图
人次
14 12 10
8 6 4 2 0
80-90
90-100
分配直方图
收入
100-110 110-120
120-130
次数多边形图
[注]重叠组限计数时应遵循“上组限不包括在内 原则。
组中值的计算
组中值=(下限+上限)/2
若遇开口组的资料,其开口组的组限一 般按其相邻组的组距计,

某生产车间50名工人日加工零件数 如下(单位:个)。试对数据进行组距分组。
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
14
28
125-130
10
20
130-135
6
12
135-140
4
8
合计
50
100
亦可采用间断组限
某车间50名工人日加工零件数分组表
按零件数分组
105-109 110-114 115-119 120-124 125-129 130-134 135-139
合计
频数(人)
3 5 8 14 10 6 4
分6组,组距8
每周工资 (元)
84~92 92~100 100~108 108~116 116~124 124~132 合计
人 数(个) 各组人数占总人数百 分比(%)
5
17
5
17
12
40
4
13
3
10
1
3
30
100
结合实际数据
一、比较计算组距值(7.3),组距为 10比较好计算且方便,
二、分组的组数相应从6减少为5。最 小值为84,下限从80开 始,
1.将数据排序
107, 108, 108, 110, 112, 112, 113, 114, 115, 117, 117, 117, 118, 118, 118, 119, 120, 120, 121, 122, 122, 122, 122, 123, 123, 123, 123, 124, 124, 124, 125, 125, 126, 126, 127, 127, 127, 128, 128, 129, 130, 131, 133, 133, 134, 134, 135, 137, 139, 139
• 组数=1+3.322 log n =5.9(n=30) 分6组
• 组距:每组区间的宽度 =(观察值中的最大数值- 观察值中的最小数值)/组数 =(128-84)/6=7.3
分6组,组距8
排序: 84,85,87,91,91,94,95,96,97, 99,101,101,103,103,105,105, 105,106,106,106,106,107,107, 109,110,111,111,118,119,121,128
分5组,组距10
每周工 人数(个)各组人数占总人

数百分比(%)
(元)
80~90
3
10
90~100
7
23
100~
13
43
110
110~
5
17
120
120~
2
7
130
分两组
次数
工资收入次数分配表
工资收入分组
次数
20
80-105
13
15
105-130
17合计30Fra bibliotek10次数
5 0
80-105 105-130
还可将几种不同数据绘在同一多边形图上 用于比较.如图:
茎叶图
数据源: 21 ,29, 60, 1, 27, 35, 66, 23, 8, 38, 31, 45, 57, 66, 68, 62, 62, 93, 68, 19, 68, 72, 76, 91, 46, 62, 3, 10, 49, 56, 52, 95 按大小排序后如下: 1, 3, 8, 10, 19, 21, 23, 27, 29, 31, 35, 38, 45, 46, 49, 52, 56, 57, 60, 62, 62, 62, 66, 66, 68, 68, 68, 72, 76, 91, 93, 95
相关文档
最新文档