统计学-第3章 数据的图表展示 学习指导
统计学(第六版)期末考试考点梳理
统计学(第六版)期末考试考点梳理统计学(第六版)期末考试考点梳理第⼀章导论1.1.1 什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
数据分析所⽤的⽅法分为描述统计⽅法和推断统计⽅法。
1.2 统计数据的类型1.2.1 分类数据、顺序数据、数值型数据按照所采⽤的计算尺度不同,可以将统计数据分为分类数据、顺序数据、数值型数据。
分类数据:只能归于某⼀类别的⾮数字型数据,它是对事物进⾏分类的结果,数据表现为类别,是⽤⽂字来表⽰。
例如:⽀付⽅式、性别、企业类型等。
顺序数据:只能归于某⼀有序类别的⾮数字型数据。
例如:员⼯对改⾰措施的态度、产品等级、受教育程度等。
数值型数据:按数字尺度测量的观测值,其结果表现为具体的数值。
例如:年龄、⼯资、产量等。
统计数据⼤体上可分为品质数据(定性数据)和数量数据(定量数据、数值型数据)。
1.2.2 观测数据和实验数据按照统计数据的收集⽅法,可以分为观测数据和实验数据。
观测数据:通过调查或观测⽽收集的数据。
例如:降⾬量、GDP、家庭收⼊等。
实验数据:在实验中控制实验对象⽽收集到的数据。
例如:医药实验数据、化学实验数据等。
1.2.3 截⾯数据和时间序列数据按照被描述的现象与时间的关系,可分类截⾯数据和时间序列数据。
截⾯数据:在相同或近似相同的时间点上收集的数据。
例如:2012年我国各省市的GDP。
时间序列数据:同⼀现象在不同的时间收集的数据。
例如:2000-2012年湖北省的GDP。
1.3.1 总体和样本总体:包含所研究的全部个体(数据)的集合。
样本:从总体中抽取的⼀部分元素的集合。
1.3.2 参数和统计量参数:⽤来描述总体特征的概括性数字度量。
统计量:⽤类描述样本特征的概括性数字度量。
例如:某研究机构准备从某乡镇5万个家庭中抽取1000个家庭⽤于推断该乡镇所有农村居民家庭的年⼈均纯收⼊。
这项研究的总体是5万个家庭;样本是1000个家庭;参数是5万个家庭的⼈均纯收⼊;统计量是1000个家庭的⼈均纯收⼊。
统计学 数据的整理及图表展示
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~110
3
6
110~115
5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135~140
4
8
合计
50
100
等距分组表
(使用开口组)
表3-7 某车间50名工人日加工零件数分组表
1.非常不满意;
2.不满意;
3.一般;
4.满意;
5.非常满意。
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 百分比 (户) (%)
向上累积 户数 百分比 (户) (%)
向下累积 户数 百分比 (户) (%)
非常不满意 24
8
24 8.0 300 100.0
不满意
108 36 132 44.0 276 92
条形图
条形图是用宽度相同的条形的高度 或长短来表示数据多少的图形
★ 各类别可以放在纵轴,称为条形图,也 可以放在横轴,称为柱形图
★ 对比条形图(复式条形图): 显示分类 变量在不同时间或不同空间上的差异或 变化
其他广告 招生招聘广告
房地产广告 金融广告 服务广告 商品广告
0
5 8 9 9
10
条形图
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~115
5
10
115~120
8
16
统计学第3章统计数据整理与显示
2013-11-21
本 章 内 容
第一节 统计数据整理概述 第二节 统计分组与频数分布数列
第三节 统计数据的显示
第四节
2013-11-21
EXCEL在数据整理应用示例
第一节 统计数据整理概述
一、统计数据整理的含义与要求
二、统计数据整理的步骤
三、统计数据的预处理
2013-11-21
一、统计数据整理的含义与要求
个体企业 其它企业
70~80分 (中等) 80~90分 (良好) 90~100分(优秀)
2013-11-21
统计分组是在总体内部进行的一种定性分类,把 总体划分为一个个性质不同,范围更小的总体。
统计分组有两个方面的含义,即:
是“分” 即将总体区分为性质 不同的若干组成部分
统计 分组
是“合” 即将性质相同的总 体单位合为一组
每一组中的最大变量值称为上限,每组最小变量值
称为下限。
重叠组限 在统计时 遵循“上 限不在内” 的原则。
工人按工资分组:
600 700 800 1200 ~ 700 ~ 800 ~ 1200 ~ 1500
企业按人数分组:
1 ~ 499 500 ~ 999 1000 ~ 2999 3000 ~ 3499
(4)按数量标志分组
数量标志分组,即变量分组。 例如, 按考分分组(分) 60以下 用数量来 60 ~ 70 表示各组 70 ~ 80 性质上的 80 ~ 90 差别 90 ~ 100 注意:第一,明确分组的目的,. 即通过数量的变化来区 分各组质的差别,而不是单纯的数量差别。 第二,采用适当的分组形式, 即要以什么样的数量作 为划分标准。是单项式或是组距式?如果是组距式分
2013-11-21
贾俊平《统计学》(第7版)考研真题与典型题详解-第3章 数据的图表展示【圣才出品】
第3章数据的图表展示一、单项选择题1.对于大批量的数据,最适合描述其分布的图形是()。
[中国海洋大学2018研] A.条形图B.茎叶图C.直方图D.饼图【答案】C【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。
2.下面哪个图形保留了原始数据的信息?()[对外经济贸易大学2015研]A.直方图B.茎叶图C.条形图D.箱线图【答案】B【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。
ACD三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
3.用于显示时间序列数值型数据,以反映事物发展变化的规律和趋势的图是()。
[重庆大学2013研]A.直方图B.箱线图C.茎叶图D.线图【答案】D【解析】如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图。
线图主要用于反映现象随时间变化的特征。
4.雷达图的主要用途是()。
[浙江工商大学2011研、安徽财经大学2012样题] A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性【答案】D【解析】雷达图在显示或对比各变量的数值总和时十分有用。
假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。
此外,利用雷达图也可以研究多个样本之间的相似程度。
5.美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下展示数据的图表中,哪一种不适合用来处理这一样本数据?()[中山大学2011研]A.散点图B.饼图C.条形图D.频数图【答案】A【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。
《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
统计学第五版课后题答案
统计学第五版贾俊平版课后题答案(部分)第三章数据的图表展示3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:接收频率E16D17C32B21A14(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A14141005101520253035CDBAE204060801001203.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业3.3 某百货公司连续40天的商品销售额如下:单位:万元41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42363737493942323635要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
统计学统计数据的整理和显示
组数
组中值:各组中点位置所对应的变量值。其计算公式为:
01
或= (适用上开口组)
03
组中值= (适用所有闭口组)
02
或= (适用下开口组)
表3—2 三次产业增加值结构变化 资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。
从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。
举例说明:
1
某工厂生产车间30人工人日产量原始数据如下:
第三章 统计数据的整理和显示
本章主要内容
肆
叁
贰
壹
统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。
第一节 统计数据整理概述
3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。
统计学-第3章 数据的图表展示 学习指导
第3章(数据的图表展示)学习指导(一)数据的预处理数据预处理包括审核、筛选和排序。
1.对不同渠道取得的数据在审核内容和方法上有所不同。
直接调查取得的原始数据从完整性和准确性上去审核。
二手数据除审核其完整性和准确性外,还要审核其适用性和时效性。
2.数据的筛选包括两个方面:一是剔除错误数据;二是剔除不符合特定条件的数据。
3.数据排序是按一定的顺序将数据进行排列,以便发现数据的特征和趋势。
(二)品质数据的整理与显示品质数据的整理是对数据进行分类,计算出每一类别的频数、频率或比例、比率,并用图形进行显示。
(三)数值型数据的整理与显示品质数据的整理与显示方法都适用于数据型数据的整理与显示,但数据型数据还有一些特定的方法,而且这些方法不适用于品质数据。
(四)统计表统计表是用于显示统计数据的基本工具,由表头、行标题、列标题、数字资料以及表外附注组成。
概念练习一)单项选择题1、统计整理阶段最关键的问题是( )。
A、对调查资料的审核;B、统计分组;C、统计汇总;D、编制统计表。
2、统计分组的关键在于( )。
A、分组标志的正确选择;B、按品质标志分组;C、运用多个标志进行分组,形成一个分组体系;D、分组形式的选择。
3、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的( )。
A、80-89%B、80%以下90-99%80.1-90%100-109%90.1-100%110%以上100.1-110%C、90%以下D、85%以下90-100%85-95%100-110%95-105%110%以上105-115%4、在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是( )。
A、将此值归人上限所在组;B、将此值归人下限所在组;C、将此值归人上限所在组或下限所在组均D、另行分组。
5、划分离散变量的组限时,相邻两组的组限( )。
A、必须是间断的;B、必须是重叠的;C、即可以是间断的,也可以是重叠的;D、应当是相近的。
《统计学》课后答案(第二版_贾俊平版)
第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。
本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。
本章各节的主要内容和学习要点如下表所示。
二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称。
22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能。
本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。
本章各节的主要内容和学习二、主要术语24. 频数:落在某一特定类别(或组)中的数据个数。
统计学课件第3章 数据的图表展示
2
All rights reserved
南审理学院
图表的力量(续)
历史上著名的统计图表
拿破仑的大军团进军俄国
Minard绘制的地图,展现了1812年拿破仑的 大军团进军俄国的路线(上半部分)和撤退 时的气温变化(下半部分)。这一历史事件 中,法军数量的急剧减少以及恶劣的气候条 件一览无遗
法国科学家Étienne-Jules Marey称“该图所 展现出的雄辩对历史学家的笔是一种极大的 挑战”
6
All rights reserved
南审理学院
图表的力量(续)
南丁格尔的极坐标面积图:两幅图分别是1854年和1855年的 军队伤亡人数,一年12个月恰好可以将极坐标分为12等分, 每一瓣代表一个月。图中用颜色标记出了三种死亡原因。
7
All rights reserved
南审理学院
图表的力量(续)
3
All rights reserved
南审理学院
图表的力量(续)
4
All rights reserved
南审理学院
图表的力量(续)
这一史诗般的历史时刻被Charles Joseph Minard转换成了信息视觉化 的先驱作品。1861年,这位法国工程师出版了1812-1813征俄战役中法 国部队连续伤亡图解。这幅1861年出版的信息图,以拿破仑在1812征俄 战役中遭遇的灾难为主题。这幅图使用了好几种二维变量:线条的粗细 表示军队的强弱,数字指示关键转折点的军力。从左到右: ——图像顶端最粗的线条表示最初渡河的422,000人,他们一路深入到俄国 领土,在莫斯科停下来的时候还有100,000人左右。从右到左,他们朝 西走回头路,渡过Niemen河的时候,仅仅剩下10,000。随着大部队和 余部会师(比如在渡贝尔齐纳河之前),图中显示的数字降中也有升。 ——图的下半部分是从右往左看的。它用列氏度(将列氏度乘以1¼可以得到 相应的摄氏度,例如-30°R = −37.5 °C)显示了法国军队从俄国撤退 时的气温变化。从莫斯科的接近0°R(译注:原文此处未写明温度,该 数据由原图推断得出。)到这次灾难性冒险结束时的-30°R。 单纯的作图以非常形象的方式表示出了事件的规模以及在短短几个月里 法国军队每况愈下的过程。这幅地图很实在地告诉我们数据视觉化和图 象的交流的魅力:这幅地图通过各种不同的手段,仅仅用图像就描述出 征俄战役惨败的各项重要数据,以及这场灾难是如何发生的。信息设计 及稍后出现的数据视觉化的长处之一就是它能减少看懂一个特定事件的 来龙去脉所需要的时间,同时还能够更好地突出重点。
贾俊平统计学第3章数据的图表展示
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与图示 3.2.2 顺序数据的整理与图示
3 - 17
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第六版)
数据的整理与显示
(基本问题)
1. 要弄清所面对的数据类型
不同类型的数据,采取不同的处理方式和方法
2. 对分类数据和顺序数据主要是作分类整理
2. 时效性审核
尽可能使用最新的数据
3. 确认是否有必要做进一步的加工整理
3 -8
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第六版)
数据筛选与排序
3 -9
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第六版)
数据筛选
(data filter)
1. 当数据中的错误不能予以纠正,或者有些 数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选
2. 数据筛选的内容
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除
▪ 将符合某种特定条件的数据筛选出来,而不
符合特定条件的数据予以剔除
3 - 10
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第六版)
数据筛选
(data filter)
用Excel进行数据筛选
8名学生的考试成绩数据
2. 准确性审核
数据是否真实反映实际情况,内容是否符合 实际
数据是否有错误,计算是否正确等
3 -7
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第六版)
数据的审核—二手数据
第3章 数据的图表展示
2 - 13
统计学
STATISTICS
等组距分组
(步骤)
1. 确定组数:组数的确定应以能够显示数
据的分布特征和规律为目的
2. 确定组距:组距(class width)是一个组的
上限与下限之差,可根据全部数据的最大 值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 3. 统计出各组的频数并整理成频数分布表
2 - 28
统计学
STATISTICS
统计表的设计
1.统计表的常用结构 2.设计统计表的一般规则
2 - 29
统计学
STATISTICS
本章小结
1.数据的预处理 2.品质数据的整理与展示 3.数值型数据的整理与展示 4.合理使用图表
2 - 30
统计学
STATISTICS
作业
1、P78-3.1 2、P79-3.3 3、P79-3.4 4、P82-3.12
2-4
统计学
STATISTICS
3.2 品质数据的整理与展示
统计学
STATISTICS
分类数据的整理与展示
一、图示用数据计算 1.频数:落在某一特定类别或组中的数据个数 2.频数分布:各个类别或组的频数汇总表 3.比例和百分比 4.比率:不同类别数值之间的比值
2-6
统计学
STATISTICS
分类数据的整理与展示
我一眼就看出 来了,周加工 零 件 在 100 ~ 110 之 间 的 人 数最多!
直方图的绘制
12
8
4
0 80 90 100 110 120 130
某车间工人周加工零件直方图 2 - 19
统计学
STATISTICS
统计学基础(第三章)
7.0 40.0 66.0 87.3 100.0 —
300 279 180 102 38 —
100.0 93.0 60.0 34.0 12.7 —
statistics
统计学——第三章数据整理与显示 数值数据(定距数据)的分组
单项分组:每一个组中只有一个变量值,适用于离散型变量 的数据、并且数据的范围不太大情况下的分组。 组距分组:每个分组是一个数值区间。它适用于连续型变量 或变动范围较大的离散型变量的数据分组。
statistics
统计学——第三章数据整理与显示
具体步骤:
(1)打开Excel工作表中“工具”下拉菜单中的“数据分析”选项。
(2)在“数据分析”对话框中选择“直方图”命令,并点击“确定”按钮。 (3)在该对话框中“输入区域”一栏填入数据区域B2:B41;在“接收区域” 一栏填入代码区域C2:C5;在“输出区域”一栏填入结果输出的区域;其他 选项根据需要选择。点击“确定”按钮,得结果。 (4)对输出结果进行还原并适当改造,即可得频数分布。
统计学——第三章数据整理与显示
第四节 统 计 图
statistics
统计学——第三章数据整理与显示
统计图的结构
标题 一般包括图表标题、数值轴(X,Y)标题 坐标轴和网格线 坐标轴和网格线构造了绘图区的骨架, 借助坐标轴和网格线,可以更容易读懂统计图。 图表区和绘图区 统计表的所有内容都在图表区内,包括 绘图区。统计图绘制在绘图区内。 图例 用来标明图表中的数据系列。
答:调查整理的结果为
甲城市 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 户数/户 24 108 93 45 30 300 百分比/% 8 36 31 15 10 100 向上累积 24 132 225 270 300 — 8.0 44.0 75.0 90.0 100.0 — 向下累积 百分比/% 100 92 56 25 10 — 300 276 168 75 30 — 户数/户 百分比/% 户数/户
贾俊平《统计学》(第7版)考研真题与典型题详解 第3章~第4章【圣才出品】
第3章数据的图表展示一、单项选择题1.对于大批量的数据,最适合描述其分布的图形是()。
[中国海洋大学2018研] A.条形图B.茎叶图C.直方图D.饼图【答案】C【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。
2.下面哪个图形保留了原始数据的信息?()[对外经济贸易大学2015研]A.直方图B.茎叶图C.条形图D.箱线图【答案】B【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。
ACD三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
3.用于显示时间序列数值型数据,以反映事物发展变化的规律和趋势的图是()。
[重庆大学2013研]A.直方图B.箱线图C.茎叶图D.线图【答案】D【解析】如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图。
线图主要用于反映现象随时间变化的特征。
4.雷达图的主要用途是()。
[浙江工商大学2011研、安徽财经大学2012样题] A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性【答案】D【解析】雷达图在显示或对比各变量的数值总和时十分有用。
假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。
此外,利用雷达图也可以研究多个样本之间的相似程度。
5.美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下展示数据的图表中,哪一种不适合用来处理这一样本数据?()[中山大学2011研]A.散点图B.饼图C.条形图D.频数图【答案】A【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。
统计学 数据的整理及图表展示
– 饼图只能显示一个总体各部分所占的比例 – 环形图则可以同时绘制多个总体的数据系
列,每一个总体的数据系列为一个环
3. 环形图可用于进行比较研究 4. 环形图可用于展示分类数据和顺序数据
13%
7%
10% 8%
15% 21%
33% 36%
31% 26%
非常不满意 不满意 一般 满意 非常满意
组中值= 下限值+上限值 2
组距分组
第1步:排序,确定组数(K)
5≤K≤15
K 1 lg n
能够显示数据的分布特征和规律
lg 2
第2步:确定组距 组距=(最大值-最小值)÷组数
★ 组距宜取5或10的倍数
◆第一组的下限应低于最小值, ◆最后一组的上限应高于最大值。 遵循“不重不漏”的原则
上组限不在内
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~115
5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135以上
4
8
合计
50
100
用Excel制作数值型数据的频数分布表
【工具】 ——【数据分析】 ——【直方图】 【输入区域】:输入原始数据区域 【接收区域】:输入各组的上限值 【输出区域】:选择一个空白单元格(想要
(上下组限重叠)
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~110
3
6
《统计学基础》课件项目3 用图表展示数据
统计学原理
拓展阅读3-1: 《财富》世界500强排行榜一直是衡量全球大型公司的最著名、最权威的榜单,被誉为 “终极榜单”,由《财富》杂志每年发布一次。
统计学原理
统计学原理
3.1.4数据透视表
为了从复杂的数据中提取有用的信息,可以利用Excel提供的【数据透视 表】(pivot table)工具。利用数据透视表,可以对数据表的重要信息按使 用者的习惯或分析要求进行汇总和作图,形成一个符合要求的交叉表(列联 表)。在利用数据透视表时,数据源表中的首行必须有列标题。
统计学原理
统计学原理
第2步:在下拉箭头框内选择要筛选出的数据。
统计学原理
3.1.3数据排序 数据排序是按一定顺序将数据排列,以便研究者通过浏览数据发现
一些明显的特征或趋势,找到解决问题的线索,除此之外,排序还有助 于对数据检查纠错以及为重新归类或分组提供方便。美国的《财富》杂 志每年都要在全世界范围内排出五百强企业,通过这一信息不仅可以了 解自己企业所处的地位,还可以从一个侧面了解到竞争对手的状况,有 效制定企业的发展规划和战略目标。
统计学原理
使用数据透视表进行技术和汇总。具体做法是:在【数据透视】 对话框中,依次将“合拍对象”加入“行”(或列)区域,将“性别 ”加入到“列”(或行)区域,将“合拍对象”加入“数据”区域。
统计学原理
使用【数据分析】工具中(Excel【数据分析】工具安装。Excel 【数据分析】工具提供了一些常用统计方法的程序。如果你的及其还 没有安装此项功能,需要安装后才能使用。步骤如下:
统计学原理
例:在某大学随机抽取20名学生,调查他们的性别、民族、家庭所在地、平均月生活费、月愿意 支付摄影费用、影响摄影的因素等,得到的数据如表3—2所示。试建立一个数据透视表,在表的 行变量中给出性别平均月生活费和月愿意支付摄影费用,在列变量中给出学生的家庭所在地区,
统计学 第3章 数据的整理与显示
主讲:王光玲,济南大学商学院 45
2.统计分组的方法
2)数量标志分组 ——按表现总体单位数量特征的标 志进行的分组 。
例如,按职工人数分组、按人口年龄分组、按工资收 入水平分组、按销售额分组等
(1)单项式分组:每组变量值是一个值 (2)组距式分组:每组变量值是一个区间。
2020/5/14
46
小作业:课后将课本P50的例3-1和3-2的例子演示
一遍!
2020/5/14
39
3.2 统计分组与频数分布
3.2.1 统计分组 3.2.2 频数分布及统计图
主讲:王光玲,济南大学经济学院
3.2.1 统计分组
主讲:王光玲,济南大学经济学院
1、统计分组(见P52)
概念:根据统计研究的目的和客观现象的内在特点,按 照一定的标志把被研究总体划分为若干个性质不同但又 有联系的组,称为统计分组。
某单位共有1000名职工,每名职工的文化程度、月收入、 婚姻状况等个体特征都有所不同(变异)。若该单位领导 想从总体上了解职工队伍的文化程度、月收入、婚姻状况 等情况,则可先要通过登记方法获得每个职工的资料,对 这些描述每名职工个体特征的资料进行分类汇总和分析计 算,就可以了解该单位全部职工中有多少人未婚、多少人 已婚、多少人离婚、多少人丧偶,各自所占的百分比是多 少;也可以了解研究生、大学、中专(高中)等不同文化 程度职工的人数及比重;还可以了解职工月平均工资、各 类职工的工资水平、职工工资分布的均衡性等等,以上内 容均为统计整理的有效信息,这些统计信息对于制定企业 的人力资源计划是十分必要的。
2020/5/14
43
2.统计分组的方法
1)品质标志分组 ——按研究对象的某种属性特征分组。
(2)复合分组:对总体按两个或两个以上的标志进 行的重叠式分组。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3章(数据的图表展示)学习指导(一)数据的预处理数据预处理包括审核、筛选和排序。
1.对不同渠道取得的数据在审核内容和方法上有所不同。
直接调查取得的原始数据从完整性和准确性上去审核。
二手数据除审核其完整性和准确性外,还要审核其适用性和时效性。
2.数据的筛选包括两个方面:一是剔除错误数据;二是剔除不符合特定条件的数据。
3.数据排序是按一定的顺序将数据进行排列,以便发现数据的特征和趋势。
(二)品质数据的整理与显示品质数据的整理是对数据进行分类,计算出每一类别的频数、频率或比例、比率,并用图形进行显示。
(三)数值型数据的整理与显示品质数据的整理与显示方法都适用于数据型数据的整理与显示,但数据型数据还有一些特定的方法,而且这些方法不适用于品质数据。
(四)统计表统计表是用于显示统计数据的基本工具,由表头、行标题、列标题、数字资料以及表外附注组成。
主要内容学习要点2.1数据的预处理数据审核▶数据审核的目的。
▶原始数据和二手数据的审核。
数据筛选▶数据筛选的目的。
▶用Excel进行数据筛选。
数据排序▶数据排序的目的。
▶分类数据和数值型数据的排序方法。
▶用Excel进行数据排序。
数据透视表▶数据透视表的用途。
▶用Excel进行数据透视。
2.2品质数据的整理与展示分类(列名)数据的整理与图示▶概念:次数,次数分配,比率。
▶用Excel制作分类数据的次数分布表。
▶分类数据的图示:条形图,帕累托图,饼图,环形图。
▶用Excel作图。
顺序数据的整理与图示▶概念:累积次数,累积频率。
▶累积次数分布图。
2.3 数值型数据的整理与展示数据分组▶概念:数据分组,组距分组,等距分组,不等距分组,组距,组中值。
▶频数分布表的制作步骤。
▶用Excel制作频数分布表。
数值型数据的图示▶直方图的绘制。
▶茎叶图的绘制。
▶箱线图的绘制。
▶直方图与条形图的区别。
▶用Excel作图。
2.4 合理使用图表鉴别图形优劣的准则▶好的图形应具备的特征。
▶鉴别图形优劣的准则。
统计表的设计▶统计表的设计要求。
概念练习一)单项选择题1、统计整理阶段最关键的问题是( )。
A、对调查资料的审核;B、统计分组;C、统计汇总;D、编制统计表。
2、统计分组的关键在于( )。
A、分组标志的正确选择;B、按品质标志分组;C、运用多个标志进行分组,形成一个分组体系;D、分组形式的选择。
3、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的( )。
A、80-89%B、80%以下90-99%80.1-90%100-109%90.1-100%110%以上100.1-110%C、90%以下D、85%以下90-100%85-95%100-110%95-105%110%以上105-115%4、在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是( )。
A、将此值归人上限所在组;B、将此值归人下限所在组;C、将此值归人上限所在组或下限所在组均D、另行分组。
5、划分离散变量的组限时,相邻两组的组限( )。
A、必须是间断的;B、必须是重叠的;C、即可以是间断的,也可以是重叠的;D、应当是相近的。
11。
落在某一特定类别或组中的数据个数称为( )。
A频数B频率C.频数分布表D.累积频数12.下面的哪一个图形最适合于描述结构性问题( )。
A条形图D.饼图C.雷达图D.直方图13.下面的哪一个图形适合于比较研究两个或多个样本或总体的结构性问题( )。
A环形图B饼图C直方图D.茎叶图14.将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为( )。
A.单变量值分组B.组距分组C.等距分组D.连续分组15.组中值是( )。
A.一个组的上限与下限之差B.一个组的上限与下限之间的中点值C.一个组的最小值D.一个组的最大值16.下面的图形中最适合于描述一组数据分布的图形是( )。
A.。
条形图B.箱线图C直方图D.饼图17.对于大批量的数据,最适合于描述其分布的图形是( )。
A.条形图B.茎叶图 C.直方图 D.饼图18.对于小批量的数据,最适合于描述其分布的图形是( )。
A.条形图B.茎叶图C.直方图D.饼图19.为了研究多个不同变量在不同样本间的相似性,适合采用的图形是( )。
A.环形图B.茎叶图C.雷达图 D.箱线图20.10家公司的月销售额数据(万元)分别为:72,63,54,54,29,26,25,23,23,20。
下列哪个图形最适宜用于描述整理这些数据( )。
A. 条形图B.散点图C.直方图D.饼图21.下面的哪个图形适合描述顺序数据( )。
A.直方图B.茎叶图C.累积频数分布图D.箱线图22.将某企业职工的月收人依次分为2 000元以下、2 000元~3 000元、3 000元~4 000元、4 000元~5 000元、5 000元以上几个组。
第一组的组中值近似为( )。
A.2 000 B。
1 000 C.1 500 D.2 50023.将某企业职工的月收人依次分为2 000元以下、2 000元~3 000元、3 000元~4 000元、4 000元一5 000元、5 000元以上几个组。
最后一组的组中值近似为( )。
A.5 000 B.7 500 C.5 500 D.6 50024.直方图与条形图的区别之一是( )。
A.直方图的各矩形通常是连续排列的,而条形图则是分开排列的B.条形图的各矩形通常是连续排列的,而直方图则是分开排列的C.直方图主要用于描述分类数据,条形图则主要用于描述数值型数据D,直方图主要用于描述各类别数据的多少,条形图则主要用于描述数据的分布25..一个样本或总体中各个部分的数据与全部数据之比称为( )。
A. 频数B.频率C比例D.比率26。
样本或总体中各不同类别数值之间的比值称为( )。
A. 频数D.频率C.比例D.比率27.将比例乘lP2100得到的数值称为( )。
A. 频率B.百分数C.比例D.比率选择题答案单项选择题1、A2、A3、C4、B5、C 11、A 12、B 13、A 14、B 15、B 16、C 17、C 18、B 19、C 20、B21、C 22、C 23、C 24、A 25.C 26.D 27.B标准试题(一)填空题1.数据的预处理包括数据的审核、筛选、___________等。
2.数值型数据的分组方法有单变量值分组和____________两种。
3.统计表是用于____________的基本工具。
4.统计表一般由表头、行标题、列标题、_____________和表外附注组成。
5.人口死亡率按年龄分布呈___________形分布。
(二)单项选择题1.统计整理的资料( )A.只包括直接资料B.只包括二手数据C.包括直接资料和二手数据D.是统计分析的结果2.下面哪一个是数量标志( )A.学号B.性别C.民族D.钢产量3.下列哪一个是品质标志( )A.所有制B.收入水平C.考试分数D.年龄4.某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( )A.230B.200C.210D.1805.变量数列的组中值是( )A.组间变量值B.组内任意一变量值C.总体单位变量值D.上限与下限的平均数(三)多项选择题1.采用等距或异距分组主要取决于( )A.现象性质差异的变动程度B.组距的大小C.组数的多少D.统计研究的目的E.变量的类型2.统计分组的关键在于( )A.按品质标志分组B.按数量标志分组C.选择分组标志D.划分各组界限E.按主要分组标志分组3.分组标志的选择( )A.根据总体划分的满意标准B.根据统计研究目的进行C.适应被研究对象的特征D.必须是数量标志E.必须考虑历史资料的可比性4.统计表的构成有( )A.表头B.行标题C.列标题D.数字资料E.表外附加5.对原始资料的审核的内容是( )A.完整性B.准确性C.时效性D.适用性E.经济性(四)判断题1.单变量值分组通常只适用于离散变量且变量值较少的情况。
( )2.在连续变量或变量值较多的情况下,可采用组距分组。
( )3.统计分组通常规定“上组线不在内”。
( )4.数据预处理是在统计数据分组或分类之后所做的必要处理。
( )5.对品质数据主要是分组整理,对数值型数据主要是分类整理。
( )(五)简答题1.影响次数分布的主要因素有哪些?2.如何选择分组标志?标准试题参考答案(一)填空题1.排序2.组距3.显示统计数据4.数字资料5.U(二)单选题1.(C)2.(D)3.(A)4.(A)5.(D)(三) 多选题1.(A)(D)2.(C)(D)(E)3.(B)(C)(E)4.(A)(B)(C)(D)(E)5.(A)(B)(四)判断题1. (√)2. (√)3. (√)4. (×)5. (×)(五)简答题1.①组距与组数;②组限与组中值;③总体单位实际分布的特征或类型。
2.①根据统计研究目的进行;②适应被研究对象的特征;③必须考虑历史资料的可比性。