数据表现形式统计数据的收集与整理ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例题:居委会想调 查某小区常住人口 的年龄分布情况, 得到下表的数据:
小区常住人口年龄 分布数列
年龄 0-20 20-30 30-40 40-45
人数 频数密度
15 0.75
30
3
45
4.5
5
1
计算单位组距频数,即频数密度=频数/组距 黑板作图
15
饼分图(Pie chart) 圆形图又称饼图,是用圆形及圆内扇形的 面积来表示数值大小的图形
主要用于表示总体中各组成部分所占的比 例,对于研究结构性问题十分有用
在绘制圆形图时,总体中各部分所占的百 分比用圆内的各个扇形面积表示,这些扇 形的中心角度,是按各部分百分比占3600 的相应比例确定的。
16
例2.3.3 某课题组为了科学评价某高校学科建设项目的绩 效,对构建的学科建设绩效评估指标权重进行了问卷调查,累 计发放问卷调查表243份,回收有效问卷223份,其中,教授占 65%,研究员占1%,副教授占12%,副研究员占1%,讲师占 20%,助教占1%,则样本职称分布如图2.4.4所示。
直方图一般表示数值型数据,用面积表示频 数的大小。等距数列一般以组距为底,频数为高; 异距数列应将频数换算成统一的单位组距频数。
12
例2.3.2 某连锁企业2010年度各分公司完成销售计划如表2.3.6所示,试 绘制直方图。
表 2.4.3 销售计划完成程度的变量分配数列
分组名 按销售计划完成程度分组(%) 企业数
的统计表。 复合分组表:是指统计总体按两个以上标志进行重
叠分组的统计表。 表例见课本
8
二、统计图
条形图(Bar chart)
条形图常用于描述离散型数据的情况,是我们经常见到的一 种图形,它是用宽度相等而高度为频数(率)来表示各类数据的大 小。
绘制时,各类别可以放在纵轴,称为条形图,也 可以放在横轴,称为柱形图
0
60~80
3
1
80~100
5
2
100~120
6
3
120~140
11
4
140~160
5
13
直方图(Histogram)
解:应用Spss软件中的“Gragh”功能绘制的直方图, 如图2.3.3所示。
a) 显示正态曲线的直方图
b)不显示正态曲线的直方图
图 2.4.3 销售计划完成程度直方图
14
异距分组绘制直方图
图 2.4.7 不同分布的箱线图
21
箱形图 (Boxplot)
例2.3.4 2010年10月—12月某高校经济管理学科共有10 篇博士学位论文需要评审,分别请该领域8位专家进行审稿, 论文得分数据如表2.3.7所示。
表 2.4.4 博士学位论文得分数据
论文编号
审稿专家
1
2
3
4
5
6
7
8
D1
93 95 94 93
主词:即组的名称 宾词:说明总体特征的各项指标
6
我国2000年国内生产总值
组别 第一产业
第二产业
第三产业 合计
增加值(亿元) 14628
44935
29879 89442
比重(%) 16.3
50.3
33.4 100.0
主词
宾词
7
(二)统计表的种类
统计表按分组情况不同,可分为:
简单表:是统计总体未经任何分组的统计表。 简单分组表:是指统计总体仅按一个标志进行分组
横行标题:说明横行各组的名称。 纵栏标题:说明纵栏内容的名称。 指标数值:即统计表中的数字资料。
4
我国2000年国内生产总值
组别 第一产业
增加值(亿元)
14628
比重(%)
16.3
第二产业 第三产业
合计
44935 29879 89442
50.3
指标
数值
33.4
100.0
5
统计表从内容上来看,由以下两个部分构 成。
研ቤተ መጻሕፍቲ ባይዱ员 助教 1% 1%
副教授 12%
副研究员 1%
讲师 20%
教授 65%
图 2.4.4 学科建设项目绩效评估指标权重问卷调查样本分布图
17
洛伦茨曲线
洛伦茨曲线是20世纪初美国经济学家、统计学家洛伦兹 (M.E.Lorentz)绘制成的描述收入和财富分配性质的曲线, 洛伦兹曲线如图2.3.5所示。
19
箱形图 (Boxplot)
箱形图也称箱线图,是由一组数据的最 大值、最小值、中位数和两个四分位数5个 特征值绘制的一个箱子和两条线段的图形。 如图2.3.6所示。
20
箱形图 (Boxplot)
不同箱形形状可反映出不同的分布特征,如图2.3.7所示。
(a)正态分布
(a)左偏分布
(a)右偏分布
(a)U 形分布
统计学
Statistics
1
第二章 统计数据的收 集与整理
第三节 统计数据表现形式
2
1.统计表
统计表的概念
广义:统计工作各阶段所用的一切表格。 狭义:表现经过整理的统计数据的表格。 统计数据最规范的表现形式。
3
(一)统计表的结构 统计表从形式上看由以下四个部分构成。
总标题:即表的名称,用以概括说明统 计表中的全部内容。
收入累计百分比(%)
100
T
50
洛伦茨曲线 L
SA
SB

50
100 人口累计百分比(%)
图 2.4.5 洛伦茨曲线
18
洛伦茨曲线
为了更准确地反映收入分配的变化程度,20世纪初意大利 经济学家基尼(Gini)根据洛伦茨曲线,提出了计算收入分配 公平程度的统计指标,称为基尼系数。其公式为:
联合国有关组织规定:G小于0.2表示收入绝对平均,在 0.2~0.3之间表示比较平均,在0.3~0.4之间表示相对合理,在 0.4~0.5之间表示收入差距较大,大于0.6表示收入差距悬殊。基 尼系数0.4为国际警戒线,超过了0.4则应采取措施缩小收入差距。
9
例2.3.1 某高校2005年各院教师在国内核心杂志上发表论文情况,如表2.3.5所示
表 2.4.2
院编号 一院 二院 三院 四院 五院 六院
某高校 2005 年各学院教师发表核心期刊论文情况
院名
论文数
自动化学院
280
经济管理学院
240
人文学院
200
信息科学与技术学院
160
理学院
80
机电学院
120
94
96 95 94
D2
91 94 90 93
90
92 92 91
10
条形图(Bar chart)
解:由表2.3.5中的数据应用Excel软件中的“插入”功能中的“图表”功 能绘成的条形图如图2.3.2所示。
论文数 300
250
200
150 100
50
0 一院
二院
三院
四院
五院
六院 院编号
11
直方图(Histogram)
直方图表征数据的频数分布特征,它与条形 图在形式上有类似之处,都是用条形来表示数据 特征,但直方图中的条形之间是没有间隔的。
相关文档
最新文档