统计学 课件 第3章 数据的描述

合集下载

第三章统计数据的描述概要PPT课件

第三章统计数据的描述概要PPT课件

对象的不同而变化的。
如:某地区工业企业职工总数
以该地区每个工业企业职工为总体单位时——总体总量
以该地区每个工业企业为总体单位时——标志总量
7
-
(2)按反映的时间状况——时期指标和时点指标
时期指标——流量 反映总体在一段时期内活动过程的总量, 指标数值可以累计相加, 数值大小和时间的长短有直接关系;
2、作用
最常用的对比分析方法;
使一些不能直接对比的现象有了共同对比的基础; 是经济管理和考核评价企业经济活动状态的重要指标。
9-Leabharlann 3、表现形式百分数:分母抽象成100的比值
相对数的表现形式无名数千 成分 数数
系数(倍数)
有名数——复名数
10
-
(二)相对指标在社会经济分析中的应用
根据研究的目的不同、对比的基础不同,分为: 计划完成相对数——检查计划完成程度 结构相对数——反映现象的结构和分布 比例相对数——反映现象内部比例关系 比较相对数——评价不同单位的实力、优劣 强度相对数——反映现象强度、密度和普遍程度 动态相对数——反映现象发展变化的状态
343.3 477.6 739.1 1510.2 4283.0 6280.0 6859.6 7702.8 8472.2 9421.6 10493.0 11759.5 13785.8 15780.8 17174.7
农村与城镇之 农村居民家庭恩格 城镇居民家庭恩格
比(%)
尔系数(%)
尔系数(%)
38.9
17
-
例2和例3计划完成百分数都大于100%
但是一例完成了计划,一例没有完成计 划,这就表明,在分析计划完成情况时,要注 意计划任务数的性质差异。若计划任务是正指 标,如产值、利润等,其计划完成相对数大于 100%为超额完成计划;若计划任务是逆指标, 如产品成本、原材料消耗量等,其计划完成相 对数小于100%为超额完成计划。

应用统计学(第三章 数据的描述性分析)

应用统计学(第三章 数据的描述性分析)

累积频率 Cumulative P
0.02 0.09 0.28 0.63
0.84 0.95 1.00
a.自然值进行分组,最大值17,最小值11 b.数据主要集中在14,向两侧分布逐渐减少
(3)计量数据
100例健康男子血清总胆固醇(mol/L)测定结果
4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.49 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90
15
21
0.21
0.84
16
11
0.11
0.95
17
5
0.05
1.00
表 2-2 100只梅花鸡每月产蛋数次数分布表
每月产蛋数
11 12 13 14 15 16 17

统计学课件(第三章数据描述的综合指标)

统计学课件(第三章数据描述的综合指标)
企业可以通过总量指标来 了解市场需求和竞争状况, 制定营销策略。
研究分析
学者和研究机构可以通过 总量指标来分析社会经济 问题,提出解决方案。
03
相对指标
定义与计算方法
相对指标
是用来反映社会经济现象数量特征的相对水平、相互关系和变异程度的指标。
计算方法
相对指标通常采用两个数值的比值来计算,如比例、比率、动态相对数、计划 完成程度相对数等。
04
平均指标
定义与计算方法
定义
平均指标是用来反映数据集中趋势的统计指标,它通过把所有数据加起来并除以 数据的个数来计算。
计算方法
平均指标的计算方法包括算术平均数、调和平均数、几何平均数等。其中,算术平 均数是最常用的一种,其计算公式为 $overline{x} = frac{1}{n}sum_{i=1}^{n} x_i$, 其中 $n$ 是数据的个数,$x_i$ 是每一个数据。
相对指标的分类
结构相对数
反映总体内部各组或各部分之 间数量对比关系的相对指标, 如各产业在国民生产总值中的
比重。
比例相对数
反映总体中不同部分数量对比 关系的相对指标,如男女人口 比例。
强度相对数
反映一个现象的平均水平或单 位水平的相对指标,如人均国 内生产总值。
动态相对数
反映某一现象在不同时间上数 量变化程度的相对指标,如经
平均指标的分类
数值平均数
包括算术平均数、调和平均数和几何 平均数等,它们分别以不同的方式对 数据进行加权和处理。
位置平均数
包括中位数和众数,它们用来反映数 据分布的中心位置或集中趋势。
平均指标的应用
描述数据的集中趋势
通过计算平均指标,可以了解一组数据的中心趋势,即数据向哪 个值集中或偏移。

统计学 第3章 数据分布特征描述PPT参考幻灯片

统计学 第3章  数据分布特征描述PPT参考幻灯片
#
关于加权问题 权数确定方式:
➢客观权数: 权数由实际统计资料获得或推算。
➢主观权数: 根据研究问题,由研究者主观赋值。
权数作用: ➢权衡变量的各种取值在计算平均数时的重 要性。 ➢权数作用,根本上是通过权数结构实现。
#
权数作用:
➢即使不改变被平均的数值,仅改变权数结构,即 可改变平均数水平。 例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
平均年龄为(单位:周岁)
22 22 25 25 25 25 25 30 30 50 22 ... 30
20
538 26.9 20
表 3-2
年龄 人数(人)
x
f
22
4
25
10
30
5
分组数据不能简单平 均 !因为各组变量值 的次数(权数)不等! 若采用简单平均:

xi fi
i 1 n
fi

xf f
i 1
例3-1单项式分组资料(表3-2)计算方法为:
x 22 4 2510 305 501 4 10 5 1
538 26.9 20
#
3.由组距分组资料计算
➢ 组距分组资料中,各组变量值不唯一,是一个区间;
#
➢位置平均数 根据对总体中处于特定位置的单个或部
分单位标志值直接观察或推算确定的代表值。 优点:不易受极端值影响,具有较好稳健性。 缺点:不宜用作统计推断。 主要包括众数和中位数。
#
一、集中趋势指标及作用 集中趋势指标作用 1.反映变量分布的集中趋势和一般水平。
➢如用平均工资了解职工工资分布的中心, 反映职工工资的一般水平。

统计学PPT课件

统计学PPT课件
19世纪初,法国数学家、统计学家拉普拉斯在总结前人成果 的基础上出版了《概率的分析理论》一书,从而形成完整的应用 理论体系。
二、统计学的产生和发 展
3 古典概率论
古典概率论对统计学的贡献可归纳为以下几点:
(1) 总结了古典概率论的研究成果,初步奠定了数理统计学的 理论基础。 (2) 把大数定律作为概率论与政治算术的桥梁。 (3) 提出应以自然科学的方法研究社会现象,为数理统计的产 生提供了必要的理论依据。
统计活动、统计资料和统计学相互依存、相互联系,共同构成一个完 整的整体,这就是人们所说的统计。
二、统计学的产生和发 展
进入资本主义社会以后,随着社会生产力的发展,人们对 统计数据资料的需求增多,专业的统计机构和研究组织逐渐出 现,统计初步发展为社会分工中的一个独立部门。
到了 17世纪中叶,统计学应运而生。
三、统计学的应用
(二) 统计学在经济领域的应用
统计学最初产生于对经济现象的研究。至今,经济领域仍然是统计 学最重要的研究领域。统计学在经济领域的应用形成了经济统计学。经 济学在研究经济现象及其发展变化的规律性时,除要进行规范性的理论 分析外,还离不开对现实经济活动的实证研究。经济学家只有通过对现 实经济活动的运行条件、运行过程和运行结果的数量分析,才能得出真 正符合客观实际的规律性结论。经济现象是人类参与的活动,其影响因 素异常复杂。对社会经济现象规律性的认识,只能被动地对实际的经济 关系和经济活动的运行情况进行观测。因此,无论是宏观经济学研究还 是微观经济学分析,都需要大量地运用统计方法,通过各种调查方法来 收集实际的经济统计数据,并分析其数量规律性。
《不列颠百科全书》将统计学定义为收集、分析、表 述和解释数据的科学。
一、统计的含义

第3章数据的描述ppt课件

第3章数据的描述ppt课件
(下限+上限)/2。
开口组的组中值可以按以下方法计算:
缺下限:上限-邻组组距/2
缺上限:下限+邻组组距/2
中央财经大学统计学院2010
10
但许多作者认 为无法计算开 口组的上限或 下限。
等距分组表:上下组限间断
某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~109
3
6
110~114
20-25
5
25-30
2
30-35
1
合计
20
频数
10 8 6 4 2 0
5 10 15 20 25 30 35 40 审计时间(天)
中央财经大学统计学院2010
20
直方图(不等距分组)
某会计师事务所对20家公 司进行年终审计所需时间
(天)的频数分布表
审计时 频 间(天) 数 10-15 4 15-20 8 20-25 5 25-35 3 合计 20
列联表一般根据两个定性变量进行编制,如果是 定量变量则需要先对单个变量进行分组。
列联表中的数字为交叉单元格中的频数或频率。
以列联表为基础可以对两个变量之间的关系进行 多种统计检验。
中央财经大学统计学院2010
14
列联表举例
市场营销专业的男生有10人。
市场营销专业 统计学专业
男生
女生 合计
频数
9 8 7 6 5 4 3 2 1 0
5 10 15 20 25 30 35 40
审 (Stem-and-Leaf Display)
主要用于显示未分组的原始数据的分布。由“茎” 和“叶”两部分构成,其图形是由数字组成的。

统计学课件第3章 数据的图表展示

统计学课件第3章 数据的图表展示

2
All rights reserved
南审理学院
图表的力量(续)
历史上著名的统计图表
拿破仑的大军团进军俄国
Minard绘制的地图,展现了1812年拿破仑的 大军团进军俄国的路线(上半部分)和撤退 时的气温变化(下半部分)。这一历史事件 中,法军数量的急剧减少以及恶劣的气候条 件一览无遗
法国科学家Étienne-Jules Marey称“该图所 展现出的雄辩对历史学家的笔是一种极大的 挑战”
6
All rights reserved
南审理学院
图表的力量(续)
南丁格尔的极坐标面积图:两幅图分别是1854年和1855年的 军队伤亡人数,一年12个月恰好可以将极坐标分为12等分, 每一瓣代表一个月。图中用颜色标记出了三种死亡原因。
7
All rights reserved
南审理学院
图表的力量(续)
3
All rights reserved
南审理学院
图表的力量(续)
4
All rights reserved
南审理学院
图表的力量(续)
这一史诗般的历史时刻被Charles Joseph Minard转换成了信息视觉化 的先驱作品。1861年,这位法国工程师出版了1812-1813征俄战役中法 国部队连续伤亡图解。这幅1861年出版的信息图,以拿破仑在1812征俄 战役中遭遇的灾难为主题。这幅图使用了好几种二维变量:线条的粗细 表示军队的强弱,数字指示关键转折点的军力。从左到右: ——图像顶端最粗的线条表示最初渡河的422,000人,他们一路深入到俄国 领土,在莫斯科停下来的时候还有100,000人左右。从右到左,他们朝 西走回头路,渡过Niemen河的时候,仅仅剩下10,000。随着大部队和 余部会师(比如在渡贝尔齐纳河之前),图中显示的数字降中也有升。 ——图的下半部分是从右往左看的。它用列氏度(将列氏度乘以1¼可以得到 相应的摄氏度,例如-30°R = −37.5 °C)显示了法国军队从俄国撤退 时的气温变化。从莫斯科的接近0°R(译注:原文此处未写明温度,该 数据由原图推断得出。)到这次灾难性冒险结束时的-30°R。 单纯的作图以非常形象的方式表示出了事件的规模以及在短短几个月里 法国军队每况愈下的过程。这幅地图很实在地告诉我们数据视觉化和图 象的交流的魅力:这幅地图通过各种不同的手段,仅仅用图像就描述出 征俄战役惨败的各项重要数据,以及这场灾难是如何发生的。信息设计 及稍后出现的数据视觉化的长处之一就是它能减少看懂一个特定事件的 来龙去脉所需要的时间,同时还能够更好地突出重点。

自考统计学原理第三章:统计数据的描述与显示(PPT)

自考统计学原理第三章:统计数据的描述与显示(PPT)

d为众数组的组距;
1=fm-fm-1,即众数组的次数与下一组(或前一组)次数之差;
2=fm -fm+1,即众数组的次数与上一组次数之差
众数计算
按产值分组 (万元) 50 以下
50—60 60—70 (L)70—80(U) 80—90 90 以上
合计
人数 (人)
10 20 40(fm-1) 50(fm) 40(fm+1) 30 190
当n为偶数时,Me =中间位置两侧的两个变量值的简单平均。
如,24,25,25,26,26,27,28,29
按年龄分组 人数(f)
向上累计
向下累计
(二)根据分组资料确定中位数 1、由单项式数列确定中位数
15(下方) 16 17
18(Me 组) 19
20(上方)
合计
10
10(1—10)
181(171—180)
(2)绝对值运算给数学处理带来很多不便。
三、方差和标准差
方差( ):2 各变量值与其算术平均数离差平方的算术平均数;
标准差(
):各变量值与其算术平均数离差平方的算术平均数
的平方根。
(一)方差和标准差的计算
方差的简单式 : σ2
Σ(x
x)2 ;(未分组资料)
n
方差的加权式 : σ2
Σ(x
x)2f ;(已分组资料)
G nx 1 •x 2 •.x .n . nπx
• 计算方法:
举例:计算我国2002—2007年期间的GDP年平均增长率
我国 2002—2007 年各年国内生产总值及增长率
年份
GDP(亿元)
增长率(%)
发展速度(%)
2002 2003 2004 2005 2006 2007

统计学(第3章)

统计学(第3章)
第三章 统计数据的整理 6
4、定比尺度(比率尺度 ratio scale)
是对事物之间比值的一种测度,可用
于参数与非参数统计推断。 特征:

除区分事物的类别、进行排序、比较大 小,而且还可以进行加减乘除运算。 具有绝对零点,即“0”表示“没有” 或“不存在”。 所有统计量都可以对其进行分析。与定 距尺度的唯一区别是有绝对固定的零点。
第三章 统计数据的整理 10
3、观察数据和实验数据


观察数据:通过调查或观测而得 到的数据。 实验数据:通过控制实验对象而 收集的数据。
第三章 统计数据的整理
11
4、直接数据和间接数据
直接数据:即原始数据。
间接数据:已加工整理过的数据。
第三章 统计数据的整理
12
第二节 统计整理的含义和步骤



当异距分组时,各组的次数还受 到组距不同的影响。为消除异距 分组的这种影响,须计算频率密 度(或次数密度),计算公式: 频数密度 = 频数/组距 频率密度 = 频率/组距
第三章 统计数据的整理
36
二、分布数列的编制
将原始资料按其数值大小重新排列 2. 确定全距 3. 确定组距和组数 4. 确定组限 5. 编制变量数列 示例3-5
第三章 统计数据的整理
某地人口
21
(三)按分组标志的不同性质分
品质分组(属性分组):是将总体按
品质(或属性)标志进行分组。如企 业按经济成份、企业规模,职工按性 别、文化程度分组等。 数量分组(变量分组):是将总体按 数量标志进行分组,如企业按职工人 数、劳动生产率分组,职工按工龄、 工资分组等。
第三章 统计数据的整理 31
4、开口组的组距与组中值

大学统计学 第3章 数据分布特征的描述

大学统计学 第3章 数据分布特征的描述

22
4
25
10
222530503.175
30
5
4
50
1
2021/7/13
合计
20
2.加权算术平均数
正确的计算是:
x 2 4 2 2 1 5 0 3 5 0 5 1 0 5 3 2.8 9 6
4 1 0 5 1
20
加权算术平均数的计算公式:
n
xx1f1x2 f2 ...xn fn f1f2 ...fn
一组数据的总和除以这组数据的项数所得的结果;
最常用的数值平均数。
1.简单算术平均数
把每项数据直接加总后除以它们的项数。
通常用于对未分组的数据计算算术平均数。
计算公式:
n
xx1x2... xn
xi i1
x
n
nn
2021/7/13
例 3-1
表 3-1 解:采用简单算术平均法计算,即全体
男性 女性 队员的平均年龄为(单位:周岁):
f
上限公式: Me L 2 Sm1 i 700 1500 720100 774.3
fm
1050
f
下限公式: Me U 2 Sm1 i 800 15001230100 774.3
fm
1050
2021/7/13
四分位数、十分位数和百分位数
四分位数是将数据由小到大排序后,位于全部数据 1/4位置上的数值。
x x f f
事实上比重权数更能够直接表明权数的权衡轻重作 用的实质。
当权数完全相等(f1 =f2 =…= fn)时,加权算术 平均数就成了简单算术平均数。
2021/7/13
3.由组距数列计算算术平均数
表3-3

统计学第三章数据特征的描述

统计学第三章数据特征的描述
➢ 极差(range): ➢ 平均差(mean deviation) ➢ 方差和标准差(variance and standard deviation): ➢ 离散系数(coefficient of variation): ❖ 数据标准化得分(score):
2020/7/29
宁波大学商学院 郑建华12源自2020/7/29宁波大学商学院 郑建华
1
3.1 数据集中趋势特征的描述
• 集中趋势(central tendency)是指一组数 据向某一中心值靠拢的倾向。描述集中 趋势就是寻找数据一般水平的代表值或 中心值。
• 3.1.1 算术平均数(arithmetic mean) • 3.1.2 众数(mode) • 3.1.3 中位数(median) • 3.1.4 均值、众数、中位数的比较
• 原始数据情形,组距分组数据情形。数据特征 描述案例.xls
2020/7/29
宁波大学商学院 郑建华
8
• 中位数存在如下特点:
➢中位数受极端值的影响很小;
➢中位数适合于任何类型的数据,只要数 据能够以某种方式排序;
➢在确定中位数时,并没有考虑所有的观 察值;
2020/7/29
宁波大学商学院 郑建华
9
3.1.4 均值、众数、中位数的比较
• 均值、众数、中位数的关系
➢从频率曲线图看:众数出现的频率最高, 始终对应曲线的最高峰;中位数处于数 据的中间位置,平分频率分布曲线下方 的面积;均值为所有数据的算术平均, 对应分布曲线的型心(或重心)。
➢从数值大小看,Me处于三数中间;且存 在近似关系: Mo-mean≈3(Me-mean).
2020/7/29
宁波大学商学院 郑建华
2

统计学第三章 数据分布特征的描述.ppt

统计学第三章  数据分布特征的描述.ppt
x 500以下 500 —600
600 —700 700 以上 合计
职工人数(人)
f
f/∑f
50 16.7
70 23.3
120 40.0
60 20.0
300 100.0
要求:根据资料计算全部职工的平均工资。
统计学课程建设小组
三峡大学
经济与管理学院
例3权数的选择
当分组的标志为相对数或平均数时,经常会遇到 选择哪一个条件为权数的问题。如下例:
女性为63319万人) (三)比较相对指标
甲总体某指标值 比较相对指标=—————————×100%
乙总体同类指标值
统计学课程建设小组
三峡大学
经济与管理学院
(四)强度相对指标
某一总量指标数值
强度相对指标=—————————————
另一有联系而性质不同的总量指标数值
如:2005年一季度城镇居民人均可支配收入为 2938元
___ x1 x2 ... xn x
Xn
n
(2)加权算术平均数
它适合于计算分组数列的平均数。
其计算公式为:
___
X
x1 f1 x2 f2 ... xn fn f1 f2 ... fn
xf
f
xf f
统计学课程建设小组
三峡大学
统计学第三章 数据分布特征的 描述
三峡大学
经济与管理学院
第一节 总量指标 一、总量指标的概念、作用
(一)概念 又称绝对数。它是表明一定时间、地点和
条件下某种社会经济现象总体规模或水平的统 计指标。 (二)作用
1.是反映总体基本状况,社会经济活动绝对 效果的统计指标;

最新《统计学》辅修-第三章-数据的描述资料PPT课件

最新《统计学》辅修-第三章-数据的描述资料PPT课件
2)在对话窗口选择“简单条形图(Simple)” 3)在弹出窗口的“类别轴” 框
输入定性变量名(饮料); 4)点击“确定(OK)”即可。
2/10/2021
华东师范大学
第三章 数据的描述
第8页
➢ 条形图可分为: 简单(Simple)条形图; 复杂(Clusered)条形图; 堆积(Stacked)条形图。
第12页
2/10/2021
华东师范大学
第三章 数据的描述
饮料品种和性别的交叉表
饮 料 品 种
可口可乐 苹果汁 橘子汁
百事可乐 杏仁露
合计
性别
男女
13 4
2
6
3
4
5
2
2
9
25 25
合计
17 8 7 7 11 50
第13页
2/10/2021
华东师范大学
第三章 数据的描述
第14页
交叉表的Excel命令
《统计学》辅修-第三章-数据 的描述资料
ห้องสมุดไป่ตู้
第三章 数据的描述
第2页
§3.1 数据的图表描述
用收集到的数据来列表和作图 要求:
➢ 理解图形的意义; ➢ 学会用SPSS作图。
2/10/2021
华东师范大学
第三章 数据的描述
第3页
定性数据的图表描述
1. 频数、频率分布表:
例:最喜欢喝哪一种饮料? 原始数据见下表
➢ 将项目“饮料”拖入行字段, ➢ 将项目“性别”拖入列字段, ➢ 然后将“饮料”拖入中间部分。
2/10/2021
华东师范大学
第三章 数据的描述
交叉表的SPSS命令
➢ 分析 描述性统计 交叉表
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。





1996年-2003年城乡居民人民币储蓄存款年底余额
中央财经大学统计学院2010 27
3.1.4 绘制统计图时的注意事项

1、通过选择恰当的图形类型、刻度、长宽比 例等,使图形能够准确反映数据中包含的信息。 时间一般绘在横轴,指标数据绘在纵轴。 长宽比例要适当 ,其长宽比例大致为10:7。 一般情况下,纵轴数据下端应从“0”开始。 数据与“0”之间的间距过大时,可以采取折 断的符号将纵轴折断。
中央财经大学统计学院2010 14
列联表举例
市场营销专业的男生有10人。
市场营销专业 男生 10
统计学专业 20
合计 30
女生 合计
30 40
中央财经大学统计学院2010
15 35
15
45 75
3.1.3 常用统计图
数据类型
定性数据
定量数据
条 形 图
饼 图
线 图
直 方 图
箱 线 图
茎 叶 图
中央财经大学统计学院2010
中央财经大学统计学院2010 23
审计时间的折线图
9 8 7 6 5 4 3 2 1 0 5 10 15 20 25 30 审计时间(天) 35 40
频数
中央财经大学统计学院2010
24
茎叶图 (Stem-and-Leaf Display)

主要用于显示未分组的原始数据的分布。由“茎” 和“叶”两部分构成,其图形是由数字组成的。 通常以数据的高位数值作树茎,低位数字作树叶, 树叶上只保留一位数字。 树叶的竖列要对齐,以计算各组的次数。
中央财经大学统计学院2010 13
频率(%) 6 10 16 28 20 12 8 100
3.1.2 列联表(Contingency table )



如果对数据同时根据两个变量分组,汇总得到的 结果称为列联表。列联表反映的是两个变量的联 合分布,可以用来分析两关变量之间的关系。也 称为交叉分组表(Cross tabulation)。 列联表一般根据两个定性变量进行编制,如果是 定量变量则需要先对单个变量进行分组。 列联表中的数字为交叉单元格中的频数或频率。 以列联表为基础可以对两个变量之间的关系进行 多种统计检验。
中央财经大学统计学院2010 4
频数分布举例

两个构成要素:
各组的分组界限 每组中的次数或频率 通过频数分布表可以发 现数据分布的特征。


成绩 60以下 60-70 70-80 80-90 90以上 合计
人数 频率 3 7.14% 8 19.05% 12 28.57% 15 35.71% 4 9.52% 42 100.00%

40名教师的年龄的 数据:40,41,48, 51,37,35,36, 9.00 2 . 677888999 50,33,42,28, 4.00 3 . 3344 33,36,29,28, 8.00 3 . 55566679 29,34,35,27, 1 0.00 4 . 0011222233 36,28,29,34, 3.00 4 . 588 26,35,40,27, 4.00 5 . 0112 43,45,39,42, 1.00 5 . 5 41,48,55,43, 1.00 Extremes (>=64) 42,42,51,52, 64 Stem width: 10.00
2003年我国就业人员情况(万人)
中央财经大学统计学院2010 17
圆形图 (Pie Chart)

也叫饼图,它是用圆形及圆内扇形的面积 来表示数值大小的图形。主要用于总体内 部的结构,各组成部分所占比例等。
第一产业 15% 第三产业 33%
第二产业 52%
2003年我国国内生产总值中各产业比重
中央财经大学统计学院2010 18
中央财经大学统计学院2010 8
组距分组的步骤
1、确定组数:通常为5到15 (20)组。 Sturges 提出的经验公式:分组组数K应满足
2K n,
lg( n) K 1 lg( 2)
2、确定组距和各组界限,建议为5,10…的倍数。
组距≈( 最大值 - 最小值)÷ 组数 3、根据分组整理成频数分布表
3 5 8 14 10 6 4 50
中央财经大学统计学院2010 12
频率(%)
6 10 16 28 20 12 8 100
等距分组表:(使用开口组)
某车间50名工人日加工零件数分组表 按零件数分组 110以下 110~115 115~120 120~125 125~130 130~135 135以上 合计 频数(人) 3 5 8 14 10 6 4 50
Each leaf:
中央财经大学统计学院2010 26
Stem - and - Leaf Plot Frequency Stem & Leaf
1 case(s)
线图(Line Chart)

利用线形的升降起伏来表现描述的变 量在一段时期内的变动情况,主要用 于显示时间数列的数据。
80000.0 70000.0 60000.0 50000.0 40000.0 30000.0 20000.0 10000.0 0.0 1996 1997 1998 1999 2000 2001 2002 2003
16
条形图(Bar Chart)

用宽度相同的条形高度或长短来表示数据 变动的图形,条形的排列可以横排,也可 以纵排。条形图有单式、复式等形式。
40000 35000 30000 25000 20000 15000 10000 5000 0 36546
21809 16077
第一产业
第二产业
第三产业
原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 从小到大排序后的数据: 21, 24, 24, 26, 27, 27, 30 32, 38, 41 30, 茎叶图:
中央财经大学统计学院2010 25
2 144677 3 028
4 1
SPSS Statistics生成的一个茎叶图
为无法计算开 口组的上限或 下限。
缺上限:下限+邻组组距/2
中央财经大学统计学院2010 10
等距分组表:上下组限间断
某车间50名工人日加工零件数分组表 按零件数分组 105~109 110~114 115~119 120~124 125~129 130~134 135~139 合计 频数(人) 3 5 8 14 10 6 4 50
第3章 数据的描述
统计图与统计表 数据集中趋势的数值描述 数据离散程度的数值描述 数据分布的形态
中央财经大学统计学院
本章要回答的问题


常用的统计图表有哪些?如何绘制和解释 其含义? 通常使用哪些数值指标描述数据的特征? 如何计算?
中央财经大学统计学院2010
2
§ 3.1 统计图与统计表

绘制统计图一般都需要先对数据进行统计 分组,在得到的频数分布表的基础上制图。

频数(frequency) :每个组中的数据个数,也
称次数。
频率(relative frequency) :频数/总数据个数。
中央财经大学统计学院2010 5
分组方法
分组方法
按品质变量分组 按数量变量分组
单变量值分组 等距分组
组距分组 不等距分组
中央财经大学统计学院2010
6
单变量值分组

定 期 活 期
70000.0
60000.0
上图增长速度缓慢。
80000.0
定 活 期 期
50000.0
70000.0 60000.0 50000.0 40000.0
40000.0
定 期
活 期
30000.0
20000.0
30000.0 20000.0
将一个变量值作为一 组,适合于离散变量, 适合于变量值较少的 情况。 例如某学院2008年 毕业研究生毕业时 发表论文篇数的频 数分布表(右表)。
发表论 文篇数 2 3 4 5 6 合计
7
人数 6 8 5 3 2 24
中央财经大学统计学院2010
组距分组




将变量值的一个区间作为一组,适合于 连续变量,适合于变量值较多的情况。 分组必须遵循“不重不漏”的原则。 分为等距与不等距分组。 各组组距都相等时为等距分组。 为了避免有些组中的频数很少甚至 是空白的情况,有时也可以采用不 等距(异距)分组。 应用中可能需要把第一组和/或最后一组 设为开口组。
中央财经大学统计学院2010 22
折线图 (Frequency polygon)



折线图也称频数多边形图是在直方图的基 础上,把直方图顶部的中点(组中值)用直线 连接起来,再把原来的直方图抹掉。 折线图的两个终点要与横轴相交,具体的做法 是第一个矩形的顶部中点通过竖边中点(即该 组频数一半的位置)连接到横轴,最后一个矩 形顶部中点与其竖边中点连接到横轴。 组数越多,组据就越小,折线图就越光滑,逐 渐形成一条平滑的曲线,这就是频数分布曲线。
中央财经大学统计学院2010 9
组距分组中的基本概念

1、 下 限:一个组的最小可能值 2、 上 限:一个组的最大可能值 3、 组 距:上限与下限之差 4、 组中值:下限与上限之间的中点值, (下限+上限)/2。
开口组的组中值可以按以下方法计算: 但许多作者认 缺下限:上限-邻组组距/2
直方图(Histogram)



用来反映数量变量的分布状况。在统计分组的 基础上,用横轴表示数据分组,纵轴表示频数 或频率,各组与相应的频数就形成了一个矩形, 即直方图。 注意对不等距分组:纵轴必须表示为频数密度 频数密度=频数/组距 (面积之和=总频数) 手工绘制直方图时需要先对数据进行分组;用 统计软件作直方图时统计软件可以自动进行分 组。
相关文档
最新文档