统计学贾俊平第3章数据的图表展示
贾俊平统计学 第七版 课后思考题

第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
统计学贾俊平第三章课后答案

一、思考题3.1数据的预处理包括数据审核,数据筛选,数据排序,数据透视表。
3.2分类数据整理:频数分布表(频数,比例,百分比,比率)图示方法:条形图,对比条形图,帕累托图,饼图。
顺序数据的整理:频数分布表(累计频数,累计频率)图示方法:环形图。
3.3数值型数据的分组方法是组距分组,步骤:1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,组数一般为5≤K ≤152.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=( 最大值 - 最小值)÷ 组数3.统计出各组的频数并整理成频数分布表3.4直方图和条形图区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据3.5绘制线图应该注意的问题:一般情况下,纵轴数据下端应从“0”开始,以便于比较。
数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断3.6饼图和环形图的不同:饼图只能显示一个总体各部分所占的比例,环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。
3.7茎叶图与直方图相比的优点与各自的应用场合:直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。
直方图适用于大批量数据,茎叶图适用于小批量数据3.8鉴别图表优劣的准则有:3.9制作统计表时应注意的问题:二、练习题3.1为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别为:A.好;B.较好;C.一般;D.较差;E.差。
贾俊平《统计学》(第7版)考研真题与典型题详解-第3章 数据的图表展示【圣才出品】

第3章数据的图表展示一、单项选择题1.对于大批量的数据,最适合描述其分布的图形是()。
[中国海洋大学2018研] A.条形图B.茎叶图C.直方图D.饼图【答案】C【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。
2.下面哪个图形保留了原始数据的信息?()[对外经济贸易大学2015研]A.直方图B.茎叶图C.条形图D.箱线图【答案】B【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。
ACD三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
3.用于显示时间序列数值型数据,以反映事物发展变化的规律和趋势的图是()。
[重庆大学2013研]A.直方图B.箱线图C.茎叶图D.线图【答案】D【解析】如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图。
线图主要用于反映现象随时间变化的特征。
4.雷达图的主要用途是()。
[浙江工商大学2011研、安徽财经大学2012样题] A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性【答案】D【解析】雷达图在显示或对比各变量的数值总和时十分有用。
假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。
此外,利用雷达图也可以研究多个样本之间的相似程度。
5.美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下展示数据的图表中,哪一种不适合用来处理这一样本数据?()[中山大学2011研]A.散点图B.饼图C.条形图D.频数图【答案】A【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。
贾俊平《统计学》复习笔记课后习题详解及典型题详解(数据的图表展示)【圣才出品】

②列联表和交叉表
由两个或两个以上变量交叉分类的频数分布表也称为列联表。
二维的列联表(两个变量交叉分类)也称为交叉表。
③比例(构成比)、百分比和比率
比例是一个样本(或总体)中各个部分的数据与全部数据之比,通常用于反映样本(或
二、品质数据的整理与展示 1.分类数据的整理与图示 分类数据本身就是对事物的一种分类,为对数据及其特征有一个初步的了解,在整理时 首先列出所分的类别,然后计算出每一类别的频数、频率或比例、比率等,形成一张频数分 布表,最后根据需要选择适当的图形进行展示。 (1)频数与频数分布 ①频数与频数分布 频数又称为次数,是各组占有的单位个数,将总体所有单位按一定标志进行归类排列, 称为频数分布。频数(频率)愈大的组所对应的标志值,它对于总体标志平均水平所起的作 用也愈大;反之,频数(频率)愈小的组所对应的标志值对于总体标志平均水平所起的作用
总体)的构成或结构。将比例乘以 100 得到的结果称为百分比,用%表示。比率是样本(或
总体)中各不同类别数据之间的比值,其比值可能大于 1。
(2)分类数据的图示
统计图是统计数据直观的表现形式,可以将复杂的数据用生动的图形表现出来,因而绘
制并使用好统计图就成为统计分析的基本功。常见的分类数据展示图形有条形图、帕累托图、
三、数值型数据的整理与展示 1.数据分组
4 / 52
圣才电子书 十万种考研考证电子书、题库视频学习平台
(1)数据分组的概念和目的 数据分组是根据统计研究的需要,为了观察数据的分布特征,将原始数据按照某种标准 划分成不同的组别,分组后的数据称为分组数据。经分组后再计算出各组中数据出现的频数, 就形成了一张频数分布表。在分组时,如果按照性别、质量等级等定性指标分组,称为按品 质标志分组;如果按照数量或数值等定量指标分组,称为按数量标志分组。 (2)数据分组的方法 ①单变量值分组:把每一个变量值作为一组,这种分组通常只适合离散变量,且在变量 值较少的情况下使用; ②组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。适用于连续变量或变 量值较多的情况。 (3)分组和编制频数分布表的具体步骤 ①确定组数 一般情况下,一组数据所分的组数不应少于 5 组且不多于 15 组,即 5≤K≤15。实际应 用时,可根据数据的多少和特点及分析的要求来确定组数。 ②确定各组的组距 组距是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数 来确定,即组距=(最大值-最小值)÷组数。 注意:为便于计算,组距宜取 5 或 10 的倍数,而且第一组的下限应低于最小变量值, 最后一组的上限应高于最大变量值。 ③根据分组整理成频数分布表 (4)组距分组的注意事项
贾俊平《统计学》章节题库(含考研真题)(数据的图表展示)【圣才出品】

1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是 由数字组成的。ACD 三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
8.对于 100 名学生某一门课程的成绩,若想得到四分之一分位数、中位数与四分之三 分位数,以下哪种描述统计的办法更有效?( )[中山大学 2012 研]
A.直方图 B.茎叶图 C.饼图 D.点图
4 / 33
圣才电子书
【答案】B
十万种考研考证电子书、题库视频学习平台
12.饼图的主要用途是( )。 A.反映一个样本或总体的结构 B.比较多个总体的构成 C.反映一组数据的分布 D.比较多个样本的相似性 【答案】A 【解析】饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个 样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
【解析】直方图、饼图描述的数值型数据是分组数据,而茎叶图描述的是未分组的数值
型数据,点图描述的是两个变量之间的关系。茎叶图保留了原始数据的信息,可以计算其分
位数。
9.某外商投资企业按工资水平分为四组:1000 元以下,1000~1500 元;1500~2000 元;2000 元以上。第一组和第四组的组中值分别为( )。[首经贸 2009 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 3 章 数据的图表展示
一、单项选择题 1.对于大批量的数据,最适合描述其分布的图形是( )。[中国海洋大学 2018 研] A.条形图 B.茎叶图 C.直方图 D.饼图 【答案】C 【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。 条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形 的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占 全部数据的比例。
统计学第五版课后题答案

统计学第五版贾俊平版课后题答案(部分)第三章数据的图表展示3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:接收频率E16D17C32B21A14(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A14141005101520253035CDBAE204060801001203.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业3.3 某百货公司连续40天的商品销售额如下:单位:万元41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42363737493942323635要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
(完整版)统计学贾俊平考研知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。
(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
(1)分类数据是只能归于某一类别的非数字型数据。
它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。
(2)顺序数量是只能归于某一有序类别的非数字型数据。
也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。
(3)数值型数据是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。
总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。
三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。
通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
《统计学》课后答案(第二版_贾俊平版)

第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。
本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。
本章各节的主要内容和学习要点如下表所示。
二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称。
22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能。
本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。
本章各节的主要内容和学习二、主要术语24. 频数:落在某一特定类别(或组)中的数据个数。
统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下(4)帕累托图(略)。
2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。
(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。
2.72.8(1)属于数值型数据。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =(万元);M e= 。
贾俊平《统计学》(第7版)考研真题与典型题详解 第3章~第4章【圣才出品】

第3章数据的图表展示一、单项选择题1.对于大批量的数据,最适合描述其分布的图形是()。
[中国海洋大学2018研] A.条形图B.茎叶图C.直方图D.饼图【答案】C【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。
2.下面哪个图形保留了原始数据的信息?()[对外经济贸易大学2015研]A.直方图B.茎叶图C.条形图D.箱线图【答案】B【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。
ACD三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
3.用于显示时间序列数值型数据,以反映事物发展变化的规律和趋势的图是()。
[重庆大学2013研]A.直方图B.箱线图C.茎叶图D.线图【答案】D【解析】如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图。
线图主要用于反映现象随时间变化的特征。
4.雷达图的主要用途是()。
[浙江工商大学2011研、安徽财经大学2012样题] A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性【答案】D【解析】雷达图在显示或对比各变量的数值总和时十分有用。
假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。
此外,利用雷达图也可以研究多个样本之间的相似程度。
5.美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下展示数据的图表中,哪一种不适合用来处理这一样本数据?()[中山大学2011研]A.散点图B.饼图C.条形图D.频数图【答案】A【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。
统计学贾俊平第3章数据的图表展示

组距(class width) :上限与下限之差
组中值(class midpoint) :下限与上限之间 的中点值
组中值 = 下限值+上限值 2
45
All rights reserved
【例】某电 脑公司连续 个月各天的 销售量数据( 单位:台)。 试对数据进 行分组
All rights reserved
29
All rights reserved 29
帕累托图
30
All rights reserved 30
例析
频数汇总
罪犯的例子
改造方式 监狱 文学课 总计
无新罪 22 32 54
新罪 18 6 24
总计 40 38 78
31
All rights reserved
Graphs are the most effective way to communicate using data
一图胜千言
John Tukey:“图形的最大价值就是使我 们注意到我们从来没有料到过的信息”
6
All rights reserved
图表的力量
历史上著名的统计图表
拿破仑的大军团进军俄国
向上累积
户数 百分比
(户)
(%)
向下累积
户数 百分比 (户) (%)
非常不满意 21
7.0
21
7.0 300 100.0
不满意
99 33.0 120
40.0 279
93.0
一般
78 26.0 198
66.0 180 60.0
满意
64 21.3 262
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
All rights reserved
图表的力量
法国科学家 Marey称:该图所展现出的雄辩对历史 学家的笔是一种极大的挑战
8
All rights reserved
图表的力量
进出口时间序列
Playfair (1786)绘制的线图。这幅图主要展示了1700年至 1780年间英格兰的进出口时序数据
11
All rights reserved
图表的力量(续)
统计地图
1854年英国Broad大街大规模爆发霍乱,当时 了解微生物理论的人很少,人们不清楚霍乱 传播途径,而“瘴气传播理论”是当时的主 导理论; John Snow对这种理论表示了怀疑,于1849年 发表了关于霍乱传播理论的论文,本图即其 主要依据
42
All rights reserved 42
数据分组
将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 需要遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组
43
All rights reserved
组距分组
确定组数:组数的确定应以能够显示数据的 分布特征和规律为目的。在实际分组时,组 数一般为5K 15
一般
93 31 225 75.0 168 56
满意
45 15 270 90.0 75 25
非常满意 30 10 300 100.0 30 10
合计
300 100.0 —
—
—
—
37
All rights reserved
顺序数据的频数分布表
回答类别
乙城市家庭对住房状况评价的频数分布
乙城市
户数 百分比 (户) (%)
38
12.7
合计
300 100.0 —
—
—
—
38
All rights reserved
顺序数据的图示—累计频数分布图
400 累 积 300 户 数 200
(户1)00
400 累
225 270 300
积 300 户 300
276
数 200
168
132
(户) 100
75
0 24
0
30
非常 不满意 一般 满意 非常
3.2 品质数据的整理与展示
23
All rights reserved 23
数据的整理与显示
明确面对的数据类型。不同类型的数据,采 取不同的处理方式和方法
对分类数据和顺序数据主要是作分类整理 对数值型数据则主要是作分组整理 适合于低层次数据的整理和显示方法也适合
于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据
21
All rights reserved
数据透视表
数据透视表(pivot table )
▪ 以从复杂的数据中提取有用的信息 ▪ 可以对数据表的重要信息按使用者的习
惯或分析要求进行汇总和作图
▪ 形成一个符合需要的交叉表(列联表) ▪ 在利用数据透视表时,数据源表中的首
行必须有列标题 表3.2
22
All rights reserved
8名学生的考试成绩数据
19
All rights reserved
数据排序
数据排序(Sort)
▪ 按一定顺序将数据排列,以发现一些明显
的特征或趋势,找到解决问题的线索
▪ 排序有助于对数据检查纠错,以及为重新
归类或分组等提供依据
▪ 在某些场合,排序本身就是分析的目的之
一排序可借助于计算机完成
20
All rights reserved
All rights reserved
29
All rights reserved 29
帕累托图
30
All rights reserved 30
例析
频数汇总
罪犯的例子
改造方式 监狱 文学课 总计
无新罪 22 32 54
新罪 18 6 24
总计 40 38 78
31
All rights reserved
用于结构比较研究
用于展示分类和顺序数据
40
All rights reserved
环形图
13%
7%
10% 8%
15% 21%
33% 36%
31% 26%
甲乙两城市家庭对住房状况的评价
41
非常不满意 不满意 一般 满意 非常满意
All rights reserved
3.3 数值型数据的整理与展示
24
All rights reserved
分类数据的整理
列出各类别 计算各列的频数 制作频数分布表 用图形显示数据
25
All rights reserved
分类数据的整理
频数(frequency) :落在各类别中的数据个数 比率(proportion) :某一类别数据个数占全
部数据个数的比值 百分比(percentage) :将对比的基数作为100
主要用于表示样本或总体中各组成部分所占 的比例,用于研究结构性问题
绘制圆形图时,样本或总体中各部分所占的 百分比用圆内的各个扇形角度表示,这些扇 形的中心角度,按各部分数据百分比乘以 3600确定
34
All rights reserved
顺序数据的整理与图示
35
All rights reserved
确定组距:组距(Class Width)是一个组的上限 与下限之差,可根据全部数据的最大值和最 小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数
统计出各组的频数并整理成频数分布表
44
All rights reserved
组距分组
确定组距:组距(下限(lower limit) :一个组 的最小值
不满意
满意
(a)向上累积
非常 不满意 一般 满意 非常
不满意 (b)向下累积
满意
甲城市家庭对住房状况评价的累积频数分布
39
All rights reserved
环形图
环形图中间有一个“空洞”,样本或总 体中的每一部分数据用环中的一段表示
与饼图类似,但又有区别
饼图只能显示一个总体各部分所占的比例, 环形图则可以同时绘制多个样本或总体的数据系 列,每一个样本或总体的数据系列为一个环
数据是否有错误,计算是否正确等
16
All rights reserved
数据的审核—二手数据
适用性审核
弄清楚数据的来源、数据的口径以及有关 的背景材料
确定数据是否符合自己分析研究的需要
时效性审核
尽可能使用最新的数据 确认是否有必要做进一步的加工整理!
17
All rights reserved
数据筛选
当数据中的错误不能予以纠正,或者有些数 据不符合调查的要求而又无法弥补时,需要对 数据进行筛选
数据筛选的内容
▪ 将某些不符合要求的数据或有明显错误
的数据予以剔除
▪ 将符合某种特定条件的数据筛选出来,
而不符合特定条件的数据予以剔除
18
All rights reserved
数据筛选
用Excel例3.1进行数据筛选
1.非常不 满意;2.不满意 ;3.一般;4. 满意;5.非常满 意。
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 百分比 (户) (%)
向上累积
户数 百分比 (户) (%)
向下累积
户数 百分比 (户) (%)
非常不满意 24
8
24
8.0 300 100.0
不满意
108 36 132 44.0 276 92
第3章 数据的图表展示
➢ 3.1 数据的预处理 ➢ 3.2 品质数据的整理与展示 ➢ 3.3 数值型数据的整理与展示 ➢ 3.4 合理使用图表
1
All rights reserved 1
参考书
2
All rights reserved 2
参考书
3
All rights reserved 3
参考书
4
顺序数据的整理
(可计算的统计量)
对分类数据和顺序数据主累积频数 (cumulative frequencies):各类别频数的 逐级累加
累积频率(cumulative percentages):各类 别频率(百分比)的逐级累加
36
All rights reserved
顺序数据的频数分布表
【例】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意? ”
上限(upper limit) :一个组的最大值
组距(class width) :上限与下限之差
组中值(class midpoint) :下限与上限之间 的中点值
组中值 = 下限值+上限值 2
45
All rights reserved
【例】某电 脑公司连续 个月各天的 销售量数据( 单位:台)。 试对数据进 行分组
12
All rights reserved
图表的力量
这幅图形揭示了 一个重要现象, 就是死亡发生地 都在街道中部一 处水源(水井) 周围,市内其它 水源周围极少发 现死者。进一步 调查他发现这些 死者都饮用过这 里的井水
13
All rights reserved
3.1 数据预处理
14
All rights reserved 14
例析
Bar图
计数
60
50
40