《统计学》第3讲:图表描述
应用统计学 第三章 图表描述
第二节 数值型数据的图表描述
第 三 章
四、茎叶图
图
表 描
叶图又称枝叶图,其基本思路是将数
述 组中的数按位数进行比较,将数的大小基
本不变或变化不大的位作为一个主干
(茎),将变化大的位作为分枝(叶),
列在主干的后面,这样就可以清楚地看到
每个主干后面有几个数,每个数具体是多
少。图3-10是根据表3-5中的数据所绘制
18
第二节 数值型数据的图表描述
第 三 章
图
例如,为科学考核教学效果,任课教师每学期期末都要对自己所担任课程
表
描
的学生考试成绩进行统计分析。表3-5所示为某班级60名学生统计学课程的期
述
末考试成绩数据。
19
第二节 数值型数据的图表描述
第 三 章
图
表3-5中共有60个观测值,其变量值个数多达31个。若以单个变量值来确
29
第二节 数值型数据的图表描述
第 三 章
为强调频数分布的整体特征,还可以在直方图的基础上进一步加工制作出频数分
图
布折线图或曲线图。折线图是将直方图中各个条形上端的中点用直线连接起来所形成
表 描
的图形,它可以通过折线与横轴所围成的面积来显示数据。图3-7所示是根据图3-6
述
的直方图所绘制的折线图。
以上是围绕定类数据所介绍的图表描述方法,这些方法同样适用于定序数据。例如,为
图
表 评价某城市的空气质量状况,研究人员在该城市中测定了300个采样点,并获得表3-3所示
描
述 的测定结果。
12
第一节 品质型数据的图表描述
第 三 章
表3-3中的数据是定序变量数据,根据此数据所绘制的频数分布条形图及饼形图如图3-4
《统计学原理》项目三 用图表展示数据
图并没有说谎,是说谎者在画图。 ——本杰明·迪斯雷利
统计学原理
数据的预处理
数值型数据的 整理与展示
品质数据的 整理与展示
合理使用图表
统计学原理
知识目标:
1. 能理解统计数据的图表展示意义。 2. 能描述数据的类型和质量要求,理解不同数据的分类方法。 3. 能描述数据来源、数据收集方法和统计调查方式。
70.00
158
79.00
182
91.00
34
17.00
192
96.00
42
21.00
8
4.00
200
100.00
8
4.00
200
100.00
-
-
-
-
统计学原理
统计学原理
统计学原理
任务 3 数值型数据的整理与展示
3.3.1 数据分组
数据分组是根据统计研究的需要,将原始数据按照某种标准化分 成不同的组别,分组后的数据称为分组数据(grouped data)。 数据分 组的主要目的是观察数据的分布特征。数据经分组后再计算出各组中 数据出现的频数,就形成了一张频数分布表。数据分组的方法有单变 量值分组和组距分组两种。
——
统计学原理
• 组距式分组 • 组距式分组变量数列,简称组距数列,它是指每个组是用两个变量值所确定
的一个区间范围来表示,在连续变量或变量值较多的离散变量情况下,通常 采用组距分组。它是将全部变量值依次划分为若干个区间,并将这一区间的 变量值作为一组。如果各组的组距相等,就叫等距数列。若不等就叫做非等 距数列。
统计学原理
任务2 品质数据的整理与展示
数据经过预处理后,可根据需要进一步做分类或分组。在 对数据进行整理时,首先要弄清楚所面对的是什么类型的数据, 因为不同类型的数据,所采取的处理方式和所适用的处理方法 是不同的。对品质数据主要是做分类整理,对数值型数据则主 要是做分组整理。品质数据包括分类数据和顺序数据,它们整 理和图形展示的方法上大多上是相同的,但也有些微小差异。
统计学02-第三讲 中心极限定理课件
第3讲 中心极限定理
1
中心极限定理
设从均值为,方差为 2的一个任意总体中抽取
容量为n的样本,当n充分大时,样本均值的抽样 分布近似服从均值为μ、方差为σ2/n的正态分布。
一个任意分 布的总体
x
n
x
X
当样本容量足够大时(n 30) ,样本均 值的抽样分布逐渐趋于正态分布
X 的分布趋于正态分布的过程
因此知,样本均值的抽样分布服从:
X~N
, 2
n
N
10,
0.62 36
N
10, 0.01
P
9.9<X<10.1=
P
9.9 10 0.1
<
X 10 0.1
<10.1 10 0.1
P
Z<10.1 10 0.1
P
Z<
9.9 10 0.1
P Z<1 P Z<-1 2P Z<1 1
(2)
2 1 1 0.6826
抽样分布与总体分布的关系
总体分布
正态分本
正态分布 非正态分布
抽样分布
例题
设从一个均值为μ=10,方差 σ2=0.36的总 体中随机抽取样本容量为n=36的样本,假 定该总体不是很有偏。
要求:计算样本均值在总体均值0.1范围内 的近似概率。
解:根据中心极限定理,样本容量>30,样本均 值的抽样分布近似服从正态分布。
统计学 第3章 数据分布特征描述PPT参考幻灯片
关于加权问题 权数确定方式:
➢客观权数: 权数由实际统计资料获得或推算。
➢主观权数: 根据研究问题,由研究者主观赋值。
权数作用: ➢权衡变量的各种取值在计算平均数时的重 要性。 ➢权数作用,根本上是通过权数结构实现。
#
权数作用:
➢即使不改变被平均的数值,仅改变权数结构,即 可改变平均数水平。 例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
平均年龄为(单位:周岁)
22 22 25 25 25 25 25 30 30 50 22 ... 30
20
538 26.9 20
表 3-2
年龄 人数(人)
x
f
22
4
25
10
30
5
分组数据不能简单平 均 !因为各组变量值 的次数(权数)不等! 若采用简单平均:
xi fi
i 1 n
fi
xf f
i 1
例3-1单项式分组资料(表3-2)计算方法为:
x 22 4 2510 305 501 4 10 5 1
538 26.9 20
#
3.由组距分组资料计算
➢ 组距分组资料中,各组变量值不唯一,是一个区间;
#
➢位置平均数 根据对总体中处于特定位置的单个或部
分单位标志值直接观察或推算确定的代表值。 优点:不易受极端值影响,具有较好稳健性。 缺点:不宜用作统计推断。 主要包括众数和中位数。
#
一、集中趋势指标及作用 集中趋势指标作用 1.反映变量分布的集中趋势和一般水平。
➢如用平均工资了解职工工资分布的中心, 反映职工工资的一般水平。
《描述统计-图表》课件
用途
用于展示地理位置上的数据分布, 支持地理空间分析。
各种图表选型原则
1 目标清晰
根据需求和目标选择最适合的图表类型,确 保图表能够清晰地传达信息。
2 数据完整
选择能够展示数据全貌的图表类型,避免信 息的缺失和误解。
3 醒目突出
通过合适的配色和排版,使图表能够吸引眼 球并强调重点。
4 简洁易懂
图表应该尽可能简洁明了,去除冗余的信息, 以便观众快速理解。
3 提高效率
可视化数据可以减少阅读 和解释数据的时间,使决 策过程更高效。
常见的描述统计图表类型
条形图
用于比较分类变量之间的数量差异。
散点图
用于显示两个变量之间的关系或相关性。
折线图
用于显示数据随时间或任意有序变量变化的趋 势。
饼图
用于展示分类变量的百分比或部分与整体的比 例。
柱状图
定义
用垂直或水平的长方形条表示数 据,条的高度表示数据的数量。
图表设计与排版技巧
1 选择合适的样式
根据主题和需求选择合适的图表样式,如风 格、颜色、字体等。
2 布局合理分组
图表之间的排列和分组应该有一定的逻辑关 系,便于观众的理解和比较。
3 明确标签和标题
为每个图表添加标签和标题,使观众制图表尺寸
根据展示的需求和场景,控制图表的尺寸, 以适应不同的显示设备。
直方图
定义
用连续的长方形条来表示数据的 分布情况,条的宽度表示数据的 范围大小。
示例
分析学生的考试成绩分布,以便 了解整体的学习情况。
用途
用于展示数据的分布情况,帮助 我们了解数据的整体特征。
热力图
定义
用颜色或阴影表示数据的密度和 分布情况。
人大《统计学》第三章 数据的描述1
§1.4.1 定性变量的统计表描述
例如:假设某项调查中3000名被访问者按照受教育水平高低可分为四大 类时,除了可以得到每一类所对应的频数、比例分布表,还可计算累积 频数或频率分布表:
§1.4.2 定量变量的统计表描述
对于定量变量,通常采用统计分组,得到每一组所对应的频 数、频率或比例表,用来对数据特征进行描述。
用来描述定性变量取值的图示法都能够用来描述定性变量的数值。 此外,还可以采用直方图、折线图、茎叶图、盒形图来进行描述。
§2.3 定量变量的图示
1.直方图
直方图(Histogram)是根据定量变量的取值范围来显示观测频数的 图。 常用于显示连续型变量在取值区间内的频数分布。 用矩形的宽度和高度(即面积)来表示频数的分布。
§1 用统计表描述数据 §2 用统计图描述数据 §3 用计算机实现制统计图
§1 用统计表描述数据
§1.1 统计表的构成 §1.2 统计表的类型 §1.3 统计表的编制规则 §1.4 数据的统计表描述
§1.1 统计表的构成
统计表一般是由四个主要部分构成:表头,行标题,列标题,数据资料
,必要时需要在统计表的下方加上表外附加。
§1.2 统计表的类型指标按照两个或两个以上的标志层叠分类 所形成的统计表。
§1.2 统计表的类型
4.交叉表
行标题和列标题中的变量指标同时采用分类的形式来表示,使得数 据依据行或列变量分类结果在交叉的单元格中显示。
§1.3 统计表的编制规则
编制统计表的基本指导原则: 简练 美观、科学、实用” 简练、 编制统计表的基本指导原则:“简练、美观、科学、实用
§2.3 定量变量的图示
频 20 数 人
) (
15
10
统计图表的表示与分析
统计图表的表示与分析在我们的日常生活和工作中,统计图表无处不在。
无论是在经济领域、科学研究、教育行业,还是在社会调查中,统计图表都以其直观、清晰的特点,帮助我们理解和分析大量的数据。
那么,什么是统计图表?它又是如何表示和分析数据的呢?统计图表,简单来说,就是将数据以图形或表格的形式呈现出来,以便于我们更直观地观察数据的分布、趋势、关系等。
常见的统计图表类型有很多,比如柱状图、折线图、饼图、直方图、箱线图等等。
柱状图是一种非常直观的图表类型,它通过一根根柱子的高度来表示不同类别数据的数量或大小。
例如,我们想要比较不同品牌手机在一个月内的销量,就可以用柱状图来展示,柱子的高度对应着销量的多少,这样一眼就能看出哪个品牌的销量最高,哪个品牌的销量较低。
折线图则更适合展示数据随时间或其他顺序变量的变化趋势。
比如,我们观察某地区一年中每个月的平均气温变化,就可以用折线图来呈现,清晰地看到气温是如何上升或下降的。
饼图主要用于展示各部分数据在总体中所占的比例关系。
假设要了解一个班级中不同学科成绩在总成绩中所占的比重,用饼图就可以很直观地看出哪个学科占比最大,哪个学科相对较小。
直方图用于展示数据的分布情况,它能够让我们了解数据在各个区间的频率。
比如,统计某个班级学生的考试成绩分布,通过直方图可以清楚地看到成绩集中在哪个分数段。
箱线图则能反映出一组数据的分布特征,包括四分位数、异常值等。
对于比较多组数据的分布情况,箱线图非常有用。
在实际应用中,选择合适的统计图表类型至关重要。
这需要我们根据数据的特点和要展示的信息来决定。
如果数据是分类数据,并且我们想要比较不同类别的数量大小,柱状图可能是最佳选择;如果要展示数据的变化趋势,折线图更合适;如果关注比例关系,饼图是不错的;而对于了解数据的分布,直方图和箱线图则能发挥更好的作用。
除了选择合适的图表类型,正确地解读和分析统计图表也同样重要。
当我们面对一个统计图表时,首先要明确图表的标题和坐标轴的含义,这能帮助我们理解数据所代表的内容。
统计图表课件
散点图的基本概念
散点图定义
散点图是一种展示两个变量之间关系 的图表,通过在二维平面上标定点的 位置来展示变量之间的关系。
散点图的构成
散点图由横轴和纵轴组成,横轴表示 一个变量,纵轴表示另一个变量,每 个点代表一个数据点。
散点图的创建
数据准备
准备需要展示的两个变量的数据,并确定数据点的数量和位置。
预测未来趋势
通过分析历史数据的变化趋势,可以预测未来的发展趋势,如根据 历史销售数据预测未来销售趋势。
04
饼图
饼图的基本概念
定义
01
饼图是一种以圆形为基础的图表,用于展示不同数据项之间的
比例关系。
构成
02
饼图由一个完整的圆形和若干扇形组成,每个扇形代表一个数
据项,扇形的大小表示该数据项在总体中的比例。
风险管理
通过箱线图、直方图等 展示风险分布和变化趋 势,帮助企业识别和管 理风险。
投资组合优化
利用矩阵图、气泡图等 展示投资组合的收益和 风险,为投资者提供资 产配置建议。
THANKS
感谢观看
通过观察散点图中数据点的分布情况 ,可以判断两个变量之间是否存在相 关性。
发现异常值
在散点图中,如果某个数据点的位置 明显偏离其他数据点,则可以认为该 数据点是异常值。
比较不同组的数据
当需要比较不同组的数据时,可以使 用散点图来展示每组数据在二维平面 上的分布情况。
06
统计图表在数据分析中 的应用
于理解。
饼图的应用场景
市场份额分析
通过饼图展示不同品牌或产品在市场中的份额, 便于企业了解市场状况和竞争情况。
用户分布分析
通过饼图展示不同地区或不同用户群体的比例关 系,便于企业了解用户分布和需求特点。
统计学第3讲第3章频次分布与图示法
每10万白人因病死亡数
每10万黑人因病 死亡人数
15~24
24
39
25 ~34
49
131
35 ~44
150
413
45 ~54
514
1177
55 ~64
1567
2577
65 ~74
3714
4509
表3-9 不同年龄组白人和黑人囚犯因病死亡率(每10万人的死亡人数)
小结
78.3
57
1
4
3.3
86
0
119
99.2
71
6
91
75.8
56
0
3
2.5
85
0
119
99.2
70
8
85
70.8
55
0
3
2.5
84
0
119
99.2
69
1
77
64.2
54
0
3
2.5
83
0
119
99.2
68
9
76
63.3
53
1
3
2.5
82
0
119
99.2
67
8
67
55.8
52
1
2
1.7
81
2
119
99.2
0.633 ×30=19.0
X
f
累积f
15
4
24
14
2
20
13
2
18
从表中可以看出累积次数为19的分数高于13.5而低于14.5,因此可 确定张三为14分
统计学数据的图表展示ppt课件
条圆环 直 折 茎 箱
线
形形形 方 线 叶 线
图图图 图 图 图 图
图
雷 达 图
39
3.4 合理使用图表
3.4.1 鉴别图形优劣的准则
有对图形的统 计描述和文字 说明
服务于一个明确 的目的
强调数据间的比较
好图
显示数据 让读者的注意力集 中在图形内容上
避免歪曲
40
3.4.2 统计表的设计
1997~1998年城镇居民家庭抽样调查资料
41
30
(2)箱线图
将一组数据从大到小排列,分别计算出他的上边
缘,上四分位数,中位数,下四分位数,下边缘
,还有一个异常值。
X最小值 QL 中位数 QU
X最大值
4 6 8 10 12
图3-9 简单箱线图
31
分布的形状与箱线图
QL 中位数 QU
QL 中位数 QU
QL 中位数 QU
左偏分布
对称分布
不同分布的箱线图
某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~114
5
10
115~119
8
16
120~124
14
28
125~129
10
20
130~134
6
12
135以上
4
8
合计
50
100
28
3.3.2 数值型数据的图示
1.分组数据:直方图
用矩形的宽度和高度来表示频数分布的图形,实际 上是用矩形的面积来表示各组的频数分布
35
4.多变量数据的图示 (1)散点图
第3讲--计数资料统计描述PPT课件
一、 统计表
(一)统计表的意义与制作原则
1.意义:统计表用简明的表格形式,有条理 地罗列数据和统计量,方便阅读、比较和计算。
2. 基本格式:三条线(顶线、标目线、底 线),三部分(标题、标目、数字) 3. 基本结构:包括:表号、标题、标目、线条、 数字、备注 4. 种类:简单表和组合表 5.制表原则:重点突出、层次清楚
• 基本概念:标准组、标化组
13
•
直接法的计算
• 1) 选择年龄别人口数作标准时,直接法标准化率的 计算公式为:
p Ni pi
Ni为标准年龄别人口数N,为实际年龄别死亡率
N为标准人口总数。
是预期死亡数,它除以
标准人口总数N即得直Ni接pi 法的标准化死亡率。
14
• 2)选择年龄别人口构成比作标准时,直接 法标准化率的计算公式为:
17
标准化组的选择
• 标准化组的选择: 标准化法计算的关键是选择 统一的标准构成。选择标准构成的方法通常有 三种:
– 1.两组资料中任选一组资料的人口数(或人口构成) 作为两者的“共同标准”。
– 2.两组资料各部分人口之和组成的人口数(或人口 构成)作为两者的“共同标准”。
– 3.另外选用一个通用的或便于比较的标准作为两者 的“共同标准”,如采用全国、全省或全地区的数据作 为标准。
• 因此需要在绝对数的基础上计算相对数。
2
第一节:常用相对数
• 常用的相对数:
– 一、率 – 二、构成比 – 三、相对比
3
一、率
率:说明某现象发生的频率或强度。 常以百分率(%)、千分率(‰)、
万分率(1/万)、十万分率(1/10万)等表 示,计算公式为:
率同某期时可期能内发发生生某某现现象象的的观观察察单单位位总数数比例基数
自考统计学原理第三章:统计数据的描述与显示(PPT)
d为众数组的组距;
1=fm-fm-1,即众数组的次数与下一组(或前一组)次数之差;
2=fm -fm+1,即众数组的次数与上一组次数之差
众数计算
按产值分组 (万元) 50 以下
50—60 60—70 (L)70—80(U) 80—90 90 以上
合计
人数 (人)
10 20 40(fm-1) 50(fm) 40(fm+1) 30 190
当n为偶数时,Me =中间位置两侧的两个变量值的简单平均。
如,24,25,25,26,26,27,28,29
按年龄分组 人数(f)
向上累计
向下累计
(二)根据分组资料确定中位数 1、由单项式数列确定中位数
15(下方) 16 17
18(Me 组) 19
20(上方)
合计
10
10(1—10)
181(171—180)
(2)绝对值运算给数学处理带来很多不便。
三、方差和标准差
方差( ):2 各变量值与其算术平均数离差平方的算术平均数;
标准差(
):各变量值与其算术平均数离差平方的算术平均数
的平方根。
(一)方差和标准差的计算
方差的简单式 : σ2
Σ(x
x)2 ;(未分组资料)
n
方差的加权式 : σ2
Σ(x
x)2f ;(已分组资料)
G nx 1 •x 2 •.x .n . nπx
• 计算方法:
举例:计算我国2002—2007年期间的GDP年平均增长率
我国 2002—2007 年各年国内生产总值及增长率
年份
GDP(亿元)
增长率(%)
发展速度(%)
2002 2003 2004 2005 2006 2007
医学统计学第3讲正态分布
86
146
百分
35.98326
61.08787
194 位数法 81.17155 212 实例 88.70293 228 234 95.39749 97.90795 98.32636
17~
19~21
111 2 239 0 95% 212 1 12.88 μ 235 P95 mol/kg 16 1 0 1 236 2 120 1 119 3 239 239 -
制定参考值范围
参考值范围又称正常值范围,医学上是指 绝大多数正常人的某指标值所在的范围。 参考值范围的意义
划分正异常
制定步骤
1. 2. 3. 4. 5. 6. 从“正常人”总体中抽样:明确研究总体 控制检测误差 判断是否需要分组(如性别、年龄)确定 根据专业知识决定单侧还是双侧 选择百分界值 确定可疑范围
单侧上限---过高异常 双侧---过高、过低均异常
单侧下限---过低异常
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性 病人 假阳性
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性率 病人 假阳性率
正常人与病人的数据分布重叠示意图(双侧)
N(, 2)
N(0,1)
0.6 0.5
f (X )
N (1,0.8 )
2
0.4 0.3 0.2 0.1 0
N (0,1 )
N (1,1.2 )
2
2
-4
-3
-2
-1
0
1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频 率
二百只灯泡的可使用小时数次数分布直方图
数值型数据的图表描述
60
50
40
将数据分为 9 组时的直方图
30
20
10
0 46.7 55.0 63.3 71.7 80.0 88.3 96.7 105.0 113.3
二百只灯泡的可使用小时数次数分布直方图
数值型数据的图表描述
二百只灯泡的可使用小时数频数分布盒形图
数值型数据的图表描述
由直方图看次数分布特征
反J形分布
数值型数据的图表描述
由直方图看次数分布特征
U形分布
数值型数据的图表描述
几种图示方法优劣比较
优
茎叶图 盒形图 直方图
点
缺
陷
变量取值较多,不影响其 显示效果
变量值较多,观测较多不 影响显示效果。概括性好 变量值较多,观测较多不 影响显示效果。概括性较 好。反映次数分布直观
数值型数据的图表描述
制 作 11 名 学 生 各 科 成 绩 盒 形 图
编号 1 2 3
11名学生各科成绩 英语 数学 经济学 76 65 93 90 97 95 51 81 76
营销学 74 87 85
统计 55 91 68
4 5 6 7 8 9 10 11
71 70 93 86 83 78 85 81
数值型数据的图表描述
由直方图看次数分布特征
观测无限增多,组数 无限增多,组距无限 缩小,分布特征不变, 则图形趋近平滑曲线
钟形的对称分布
数值型数据的图表描述
由直方图看次数分布特征
钟形的右偏分布
数值型数据的图表描述
由直方图看次数分布特征
钟形的左偏分布
数值型数据的图表描述
由直方图看次数分布特征
正J形分布
75
65 81 83 78 90 96 66 68
90
81 62 70 66 78 75 86 72
62
75 79 70 66 71 64 96 77
89
62 83 81 94 101 76 89 60
71
94 93 77 77 78 72 81 87
71
71 61 72 63 43 77 71 84
数值型数据的图表描述
20
10
适用于大量观测 的情况,能很好 地显示次数分布 状况。但也丢失 了不少数据细节
0
20
25
30
35
40
45
50
55
60
直方图 通常是 等距的
某地一星期申请结婚女性年龄频数分布直方图
数值型数据的图表描述
107
73
65 62 116 86 78
68
71 79 65 73 88
6 5+ 5 4+ 4 3+ 3 2+ 2 1+
0 6
6 0 7 0 5 2 9
能在变量取值较多的情况 下,很好地显示分布状况, 同时又没有丢失信息
4
但不适合观测较多的数据
0 0 1 1 3 3 4 5 5 5 6 6 7 7 7 9 9 9 9 2 3 3 3 3 4 4 4
数值型数据的图表描述
某地一星期申请结婚女性年龄排序
19
23
22
24
22
24
23
24
23
25
23
25
25
29 30 36 60
25
29 31 37
26
29 31 40
27
29 33 44
27
30 33 46
27
30 34 56
数值型数据的图表描述
某地一星期申请结婚女性年龄频数分布表 年龄 19 22 23 24 25 26 27 29 30 频数 1 2 4 3 4 2 3 4 3 年龄 31 33 34 37 40 44 46 56 60 频数 2 2 1 1 1 1 1 1 1
如果观测数较大,显示 效果不好
有信息损失 有信息损失。组数的确 定带有一定的主观性
多变量数据的图形描述
三十名学生的身高与体重数据
序号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
身高x
156.0 155.0 144.6 161.5 161.3 158.0 161.0 162.0 164.3 144.0 157.9 176.1 168.0 164.5 153.0
97
80 86 88 80 77
76
84 68 64 68 103
79
88 74 79 78 88
94
62 61 78 89 63
49
61 82 79 72 68
98
79 65 77 58 88
57
98 98 86 69 81
二 百 只 灯 泡 样 本 的 可 使 用 小 时 数
54 66 62 74 92
93
89 68 59
69
82 61 62
76
96 73 71
89
77 72 81
75
102 76 65
73
63
63
89
82
64
85
92
64
73
数值型数据的图表描述
小时数
43-48
灯泡数
2 1 2 21 28 28 上 限 33 26 21 19
上限 下限 组中值 2
48-53 53-58 58-63 63-68 68-73 下限 73-78 78-83 83-88 88-93
某地一星期申请结婚女性年龄频数盒形图(box plot)
下四分 位 数
上四分 位 数
1.5S
盒形图与点线 图的刻度相同
最 小 数 值
中 位 数
适用变量取值较多和频数较多 的情况,但有一定的信息损失
最 大 数 值
方盒越宽,说明频数分布的离散程度越高;方盒越窄, 说明离散程度越低;中位数在方盒中的相对位置趋近 于中间,表面频数分布具有较强的对称性。 方盒右侧延伸出来的线段成端一般取1.5倍分位差范 围内的最大观测值;左侧延伸出来的线段长短取1.5 倍分为差范围内的最小观测值。
总 计
50
100
定类数据的图表描述
饼形图(pie chart )
10% 10% 38% 16%
频 数
20
条形图(bar chart)
频 率
%
40
10
20
26% 0 0
用饼形图表 示频率分布
可口 雪 可乐 碧
杏 仁 露
新 骑 士
醒 目
定类数据频数分布的图示可采用饼形图或条形图
定类数据的图表描述
10% 10% 38% 16%
74 78 63 91 82 75 71 55
88 66 79 83 92 78 86 78
69 90 80 77 84 91 74 70
73 84 81 70 69 94 62 71
数值型数据的图表描述
11名学生各科成绩频数分布盒形图
英 语
经 济 学 数 学
营 销 学
统 计
盒形图便于变量间 频数分特征的比较
5种软饮料购买频数排序
可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 可口可乐 雪 碧 雪 雪 雪 雪 雪 雪 雪 雪 雪 雪 碧 碧 碧 碧 碧 碧 碧 碧 碧 碧 雪 雪 杏 杏 杏 杏 杏 杏 杏 杏 碧 碧 露 露 露 露 露 露 露 露 新 新 新 新 新 醒 醒 醒 醒 醒 骑 骑 骑 骑 骑 士 士 士 士 士 目 目 目 目 目
定序数据的图表描述
累计频数的一切特点源于频数分布
甲城市家庭对住房状况评价累积频数图
向上 累计
300
200
100
向下 累计
0
非常不 满意
不 满 意
一 般
满 意
非常满 意
数值型数据的图表描述
某地一星期申请结婚女性年龄原始数据 30 31 29 34 30 37 27 27 24 22 19 25 24 56 23 33 23 23 22 40 25 29 23 60 31 30 29 46 44 25 24 36 33 25 29 27 26
满 意
非常 满意
非 常 满 意
定序数据的图表描述
甲城市
非常 满意
非常 不满 意
乙城市
非常 满意
非常 不满 意
满意
不满意 一般 满意 一般 不满意
甲乙两城市家庭对住房状况评价频数分布饼形图
定序数据的图表描述
甲城市
乙城市
甲乙两城市家庭对住房状况评价分布频数环形图(loop chart)
定序数据的图表描述
第二步 确定组距
最大变量值 最小变量值 组距
43 9
※本例SPSS默认组数为 15 组。可见该方法并非 绝对
116
8.1
组数
※组距宜取整数。最好 是5或5的倍数
第三步 汇总频数 上 限 不 在 本 组 内
如78应汇入78-83 组
数值型数据的图表描述
频 数
由频率所得的直 方图与由频数所 得的直方图的特 征相同
例如 第7组组中值
上限 下限 2 73 78 2 75.5
93-98
98-103 103-108 108-113 113-118
10
6 2 0 1
二 百 只 灯 泡 使 用 小 时 数 组 距 频 数 分 布 表