统计学 第2章 统计数据的收集整理与显示(第二部分)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

27
15
据此可以计算基尼系数
100
80
基尼系数=A/(A+B)
绝对平等线
60
A
40
B
绝对不平等线
实际分配曲线 (洛伦茨曲线)
20
0 0 20 40 60 80 100
16
六、频(次)数分布图类型
各种不同性质的社会经济现象,其次数分布类型大
致有三种:钟型分布、U 型分布和 J 型分布。
17
1.钟型分布
7
3.统计表设计(要求简练、明确、实用、美观,利于比较)
(1)横线外粗内细,左右两侧开口 (2)标题(简要准确) (3)合计栏 (4)数值格式(小数位、缺失值) (5)计量单位 (6)注释或资料来源。
8
二、统计图
常用:直方图、折线图、曲线图、饼图、散点图、雷达图等。
1.直方图
直方图是用直方形宽度和高度表示次数分布的图形。 绘制直方图时,横轴表示各组组限,纵轴表示次数或频率。
8
11 11 7 4 2 1
44
36 25 14 7 3 1
16
22 22 14 8 4 2
88
72 50 28 14 6 2
合计
50

100

合计
50

100

2
第三节 统计数据显示
一 统计表
二 统计图
统计表和统计图是显示统计数据的两种方式。 利用统计表和统计图显示数据,比单纯的枯燥 数据更直观、生动。 正确使用统计表和统计图,是做好统计分析的 基本技能。
乡 镇 数
12
10
频 率 2 (%) 0
25 15
8
6 10 4 5
2
0
800-900 900-1000 1000-1100 1100-1200 1200-1300 1300-1400 1400-1500 1500以上
0
根据表2-3绘制
财政收入
9
2.折线图
在直方图基础上,用折线将各组次数高度坐标连接而成;也
横 行 标 题

133.5
109.9 129.5 99.9 117.8
农 业 各 税 国有企业所得税 集体企业所得税 合 计
wenku.baidu.com指 标 数 值
资料来源: 《中国统计年鉴 2001 年》 。
主词栏
宾词栏
6
2.统计表分类(例子见教材表2-4至表2-8)
(1)按主词结构分类,根据是否分组和分组程度,分为: 简单表(主词未分组) (一览表) 简单分组表(主词仅按一个标志分组) 复合分组表(单向、交叉) (2)按宾词设计分类,可分为: 宾词简单排列(宾词不做分组,按一定顺序排列) 分组平行排列(宾词栏中各组彼此分开,平行排列) 分组层叠排列(指标同时有层次地按两个或两个以上 标志分组,各分组层叠在一起) (3)主词分组与宾词分组的区别: 主词分组划分总体,具有独立意义; 宾词分组不划分总体,从属于主词要求,详细描述主词 数量特征。
税收按税种分组 工 商 税 税 1999 年总额 8 885.44 562.23 423.50 639.00 172.41 10 682.58 速度(%) 2000 年总额 ( 以 上 年 为 100) 10 366.09 750.48 465.31 827.41 172.22 12 581.51 116.7 纵栏 标题
0
向下累计频数(或频率)分布。
方法是:先列出各组下限,然后由标志 值高的组向标志值低的组依次累计。 向下累计频数表明某组下限以上的各组 单位数之和;向下累计频率表明某组下限以上 的各组单位数之和占总体单位数比重。 累计频数和累计频率既可用表格表示;也可用 图形表示。 累计频数(频率)分布图分为向上累计分布图和 向下累计分布图。二者均以分组变量为横轴, 以累计频数(频率)为纵轴。
五、累计频数与累计频率◇
累计频数(或频率):可以采用向上累计频数
(或频率),也采用向下累计频数(或频率)。 向上累计频数(或频率)分布。 方法是:先列出各组上限,然后由标 志值低的组向标志值高的组依次累计。 向上累计频数表明某组上限以下的各 组单位数之和; 向上累计频率表明某组上限以下的各 组单位数之和占总体单位数比重。
22
课堂习题
某地区20个企业,某年产品销售利率指标按大小顺
序排列如下(%):
6.5 16.2 19.5 22.5
9.6 18.2 19.7 24.3
11.3 18.6 20.6 24.9
13.8 15.4 18.6 19.2 20.9 21.9 28.6 29.5
23
如果拟定组距为10,组数为3。 现在对组限做不同的设计。
可用组中值与次数交点连接而成。两个终点要与横轴相交。 折线图下围成的面积与直方图相等,表示的频数分布一致。
乡 镇 数
12 10 8 15 6 10 4 2 0 700 800 900 5 25
20
频 率 (%)
0 1000 1100 1200 1300 1400 1500 1600 1700
财政收入
3
一、统计表
1.定义和结构
定义: 整理统计数据,并按一定方式排列得到的表格。 结构: 从表式看,包括: 总标题:统计表名,扼要说明表的内容,指出时间 和范围。臵于表格正上方。 横行标题:横行名,位于表格左方。 纵栏标题:纵栏名,臵于表格上方。 横行标题和纵栏标题共同说明表格中统计数据内容 指标数值:位于横行和纵栏交叉处,说明总体及其 组成部分的数量特征,为统计表格核心内容。
1000-1100
1100-1200 1200-1300 1300-1400 1400-1500 1500-1600 1600-1700
8
11 11 7 4 2 1
14
25 36 43 47 49 50
16
22 22 14 8 4 2
28
50 72 86 94 98 100
1000-1100
1100-1200 1200-1300 1300-1400 1400-1500 1500-1600 1600-1700
10
20
30
40
50
60
70 80
19
3.J型分布
J型分布有两种类型: 一种呈正J型分布,次数随变量增大而增多; 另一种呈反J型分布,次数随变量增大而减少。
正J型图
反J型图
20
注意:
对数据做组距式整理的步骤: (1)将数据按大小做排序整理; (2)指定初始分组数和组距。 初始分组数的选多少(组距选多大)没有一个可供
直角坐标系下,将各组组距的上限与相应的累 计频数(频率)构成坐标点,依次用折线(光滑曲线) 相连 向下累计频数(频率)分布图 直角坐标系下,将各组组距的下限与相应的累 计频数(频率)构成坐标点,依次用折线(光滑曲线) 相连 以分组变量为横轴,累计频数(频率)为纵轴。 组的次数(频率)越少,曲线越平缓,相反,越陡 峭。
遵循的固定法则。一般而言,数据量大时,分组数 可多些(组距可以小些),数据较少时,分组数应 少些(组距大些)。 经验公式:组数=1+3.3logN 组距=全距/组数
21
注意:所算得的组距可能是一个分数,不方便应用,
此时,须采用它最接近的那个整数。 通常,为了分布列一目了然,人们还要人为的把这 些数字改得更为“整齐”一些。 常见用作组距的形如1,5,10,15,20,25,30等一些“整 5”“整10”的数字。
10
3.曲线图
当变量数列的组数无限增多时,折线便近似地表现为一条平
滑曲线。
乡 镇 数
12 10 8 15 6 10 4 2 0 700 800 900 5 25
20
频 率 (%)
0 1000 1100 1200 1300 1400 1500 1600 1700
财政收入
11
累计分布(曲线)图
向上累计频数(频率)分布图
24
第一次统计学作业
1、某地区人口数据如下表,请在空白处填写组距、 组中值、频率、上限以下累计频数。
25
2、现有某地区50户居民的月人均可支配收入数据资料 如下(单位:元):
26
要求: (1)试根据上述资料作等距式分组,编制次(频)
数分布和频率分布数列; (2)编制向上和向下累计频数、频率数列; (3)用频率分布列绘制直方图、折线图和向上、向 下累计图; (4)根据图形说明居民月人均可支配收入分布的特 征。
这种累计分布曲线图最早由美国的洛伦茨
(M.O.lorenz)提出,故称洛伦茨曲线图。
14
其绘制方法为:
1.将分配对象和接受分配者的数量均变为结构相对数,并 进行向上累计。 2.纵轴和横轴均为百分比尺度。 纵轴自下而上,用以测定分配对象(如财富、土地或 收入等); 横轴由左向右,用以测定接受分配者(如人口)。 3.根据计算得出的分配对象和接受对象的累计百分数,标 出相应的绘示点,连接各点并使之平滑化,所得曲线即洛 伦茨曲线(向上累计图)。
钟型分布特征:“两头小,中间大”。即靠近中间 变量值分布次数多,靠近两边的变量值分布的次数 少,其曲线图宛如一口钟 。很多现象服从或近似服 从该分布。
(Ⅰ)对称
(Ⅱ)正偏 (右偏)
(Ⅲ)负偏 (左偏)
18
2.U型分布
50 死 亡 30 率 (‰) 20 10 0 年龄 40
U 型分布的形状与钟型分布相反: 靠近中间的变量值分布次数少, 靠近两端的变量值分布次数多, 形成“两头大,中间小”的 特征。 如人口死亡率与年龄关系。
12
累计分布(曲线)图
向上累计分布曲线呈上升状,向下累计分布曲线呈下降状。
% 100
80
向上累计图: 70分以下有 22.5%
60 40 20 0 50 60 70 80 90
向下累计图: 90分以上有 20%
成绩 100
13
累计分布曲线应用
累计频数(或频率)分布曲线,可用于研究社
会财富、土地和工资收入的分配是否均等 (平等、公平?)。
4
从内容看,包括: 主词栏:要说明的总体及其组成部分。主词位于表 的左方。 宾词栏:说明总体数量特征的各个统计指标。宾词 位于表的右方。 实际使用中,若必要,主宾词可变化位臵或者合并排列。 此外,统计表还有:
补充资料、注解、资料来源、填表单位、填表 人等。
5
我国各项税收收入情况表 单位:亿元
1
变量数列及其累计分布
向上累计(上限以下)
组距分组 频 数 5 1 累计 频数 5 6 频率 % 10 2 累计频 率% 10 12
向下累计(下限以上)
组距分组 频 数 5 1 累计 频数 50 45 频率 % 10 2 累计频 率% 100 90
800-900 900-1000
800-900 900-1000
相关文档
最新文档