《应用经济统计学数据分组》

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分6组,组距8
每周工资 (元) 84~92 人 数(个) 各组人数占总人数百 分比(%) 5 17
92~100
100~108 108~116 116~124 124~132 合计
5
12 4 3 1 30
17
40 13 10 3 100
结合实际数据
一、比较计算组距值(7.3),组距为 10比较好计算且方便, 二、分组的组数相应从6减少为5。最 小值为84,下限从80开 始,
次数分配
• 数据观察值在各组中的个数称为次数, 各组间的次数称为次数分配。次数分配 描述了总体的结构和特征。 • 例如:某企业非熟练工人的周工资额(元) • 如何分组?
变量次数分配的编制
1、将原始资料顺序排序 2、将各个数据按其数值大小归入相应的组内 3、确定组数与组距
如果数据分布比较均匀、对称,即中间数值次数多, 大小极端值次数少,考虑用以下公式来确定组数: 组数=1+3.322 log n 组距= (观察值中的最大数值-观察值中的最小数值)/组数
120~130
120
2
2
7
累计次数分配图
洛伦茨曲线
以人口百分比为横坐标、以累积收入百分比为纵坐标 描点连接而成的图形,如图:
基尼系数
反映一国收入的平等程度。 如上图 基尼系数 r=A/(A+B) r=0 绝对平等 r=1 绝对不平等 r越大越不平等,反之则越平等。
50
6 10 16 28 20 12 8
100
变量次数分配的图示
直方图:频数分配直方图、频率分配直 方图 次数多边形图 茎叶图 累积次数分配图:小于上组限的累积次 数分配图、大于下组限的累积次数分配 图。[特例] 洛伦茨曲线
直方图
以变量值为横坐标、次数为纵坐标,以矩形高度表示各组 次数(频数)分配多少。如下图:
反映不出观察值 分布特征
分组太细会出现什么问题?
工资表 140 120 100 80 工资 60 40 20 0
1 人员编号
不等距分组
在不等距分组情况下,要比较各组次数或 分析总体结构,要消除由组距不等造成的 影响。为此需计算单位组距的次数,即频 数密度。 每组单位组距次数=某组次数/该组组距
不等距分组
2.确定组数及组距
组数=1+3.322lg50=6.64≈7 组距=(139-107)/7=4.6 ≈5
3.确定组限
最小值为107,以105为第一组下限。采用 重叠组限.
某车间50名工作日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105-110 110-115 115-120 120-125 125-130 130-135 135-140
人次
次数多边形图
还可将几种不同数据绘在同一多边形图上 用于比较.如图:
茎叶图
数据源: 21 ,29, 60, 1, 27, 35, 66, 23, 8, 38, 31, 45, 57, 66, 68, 62, 62, 93, 68, 19, 68, 72, 76, 91, 46, 62, 3, 10, 49, 56, 52, 95 按大小排序后如下: 1, 3, 8, 10, 19, 21, 23, 27, 29, 31, 35, 38, 45, 46, 49, 52, 56, 57, 60, 62, 62, 62, 66, 66, 68, 68, 68, 72, 76, 91, 93, 95
人口按年 人口数(万 龄分组 人) 1岁以下 1~7岁 7~18岁 2 12.2 24 频数密度(万人) 2 2.03 2.18
18~25岁
25~55岁 55岁以上
14.8
34.2 16.3
2.11
1.14 0.54
合计
103.5
--
组限分类
重叠组限:“100~200”,“200~300” 间断组限:“100~199”,“200~299” 开口组:“100以下”,“500以上” 应用范围: 离散变量可采用间断组限,亦可采用重叠组限; 连续变量应采用重叠组限; 数据资料中若有极端值应采用开口组. [注]重叠组限计数时应遵循“上组限不包括在内 原则。
4、确定组限
分组计算
• 组数=1+3.322 log n =5.9(n=30) 分6组 • 组距:每组区间的宽度 =(观察值中的最大数值- 观察值中的最小数值)/组数 =(128-84)/6=7.3
分6组,组距8
排序: 84,85,87,91,91,94,95,96,97, 99,101,101,103,103,105,105, 105,106,106,106,106,107,107, 109,110,111,111,118,119,121,128
组中值的计算
组中值=(下限+上限)/2
若遇开口组的资料,其开口组的组限一 般按其相邻组的组距计,

某生产车间50名工人日加工零件数 如下(单位:个)。试对数据进行组距分组。
117 108 110 112 137
122 131 118 134 114
124 125 123 127 120
129 117 126 123 128
120~130
130
2
30
100
累计次数分配图
以变量值为横坐标、以累积计次数为纵坐标描点连接而 成的图,如下图:
累计次数分配图
大于下组限的累积次数分配
每周工资 上组限 组次数 小于上组限的 (元) 累计次数 (人) 80~90 90~100 100~110 110~120 80 90 100 110 3 7 13 5 30 27 20 7 小于上组限的累 积百分比(%) 100 90 66 23
第三章 数据整理
---数据分组
统计数据的分组
分组是将总体所有单位按一定的标 准区分为若干部分
分组的目的:概括数据,清晰条理
如何分组?
将具有共性的个 体归入同一组 将总体内部个 体间的差异通 过组别区分开 来
统计数据的分组
• 品质数列是按现象的性质、类别标志进 行的分组。例如人口按性别和民族分组; • 时间数列按时间发生的先后顺序分组。 例如我国解放后各年的人口数字;GDP • 变量数列是按某一数量标志大小顺序进 行的分组。例如某企业按工资收入的多 少分组; • 空间数列是按不同地区标志进行的分组。 例如人口按省、市、自治区分组;
合计
3 5 8 14 10 6 4
50
6 10 16 28 20 12 8
100
亦可采用间断组限
某车间50名工人日加工零件数分组表 按零件数分组 频数(人) 频率(%)
105-109 110-114 115百度文库119 120-124 125-129 130-134 135-139
合计
3 5 8 14 10 6 4
14 12 10 8 6 4 2 0 收入
80-90 90-100 100-110 110-120 120-130
分配直方图
人次
频数分布直方图
直方图
频率分布直方图
次数多边形图
14 12 10 8 6 4 2 0 收入
80-90 90-100 100-110 110-120 120-130
分配直方图
分5组,组距10
每周工 人数(个) 各组人数占总人 数百分比(%) 资 (元) 3 10 80~90 90~100 7 23
100~ 110 110~ 120 120~ 130
13
5 2
43
17 7
分两组
次数 20 15 10 5 0 80-105 105-130 次数
工资收入次数分配表
工资收入分组 80-105 105-130 合计 次数 13 17 30
139 122 133 119 124
107 133 134 113 115
117 126 127 120 139
130 122 123 123 128
122 118 118 127 124
125 108 112 135 121
1.将数据排序
107, 108, 108, 110, 112, 112, 113, 114, 115, 117, 117, 117, 118, 118, 118, 119, 120, 120, 121, 122, 122, 122, 122, 123, 123, 123, 123, 124, 124, 124, 125, 125, 126, 126, 127, 127, 127, 128, 128, 129, 130, 131, 133, 133, 134, 134, 135, 137, 139, 139
茎叶图
茎 0 1 2 3 4 5 6 7 8 9 叶 次数 1 3 8 3 0 9 2 1 3 7 9 4 1 5 8 3 5 6 9 3 2 6 7 3 0 2 2 2 6 6 8 8 8 9 2 6 2 0 1 3 5 5 4
累计次数分配图
小于上组限的累积次数分配
每周工资 上组限 组次数 小于上组限的 (元) 累计次数 (人) 80~90 90~100 100~110 110~120 90 100 110 120 3 7 13 5 3 10 23 28 小于上组限的累 积百分比(%) 10 33 77 93
相关文档
最新文档