第三章 统计数据的图表展示
统计学-第三章-数据的图表展示
分类数据的图示—饼图 (例题分析)
组距分组(步骤)
1.确定组数:组数的确定应以能够显示数据的 分布特征和规律为目的。在实际分组时,组数 一般为5K 15 2.确定组距:组距(Class Width)是一个组的上 限与下限之差,可根据全部数据的最大值和最 小值及所分的组数来确定,即 3.组距=( 最大值 - 最小值)÷ 组数 4.统计出各组的频数并整理成频数分布表
汇源果汁 12%
露露 18%
可口可乐 30%
百事可乐 18%
不同品牌饮料的构成
旭日升冰茶 22%
1
分类数据的 整理与图示
2
顺序数据的 整理与图示
顺序数据的整理(可计算的统计量)
1.1. 累积频数(cumulative frequencies):各类别频数的逐级累加 2.2. 累积频率(cumulative percentages):各类别频率(百分比)的逐级 累加
4.绘制时,各类别可以放在纵轴,称
可乐 冰茶 可乐 果汁 不同品牌饮料的频数分布
品牌
为条形图,也可以放在横轴,称为柱
形图(column chart)
分类数据的图示—对比条形图(side-by-side bar chart )
电脑品牌 联想 IBM 康柏 戴尔
一季度 256 285 247 563
二季度 468 397 328 688
分类数据整理—频数分布表(例题分析)
贾俊平统计学 第七版 课后思考题
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
贾俊平《统计学》(第7版)考研真题与典型题详解-第3章 数据的图表展示【圣才出品】
第3章数据的图表展示一、单项选择题1.对于大批量的数据,最适合描述其分布的图形是()。
[中国海洋大学2018研] A.条形图B.茎叶图C.直方图D.饼图【答案】C【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。
2.下面哪个图形保留了原始数据的信息?()[对外经济贸易大学2015研]A.直方图B.茎叶图C.条形图D.箱线图【答案】B【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。
ACD三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
3.用于显示时间序列数值型数据,以反映事物发展变化的规律和趋势的图是()。
[重庆大学2013研]A.直方图B.箱线图C.茎叶图D.线图【答案】D【解析】如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图。
线图主要用于反映现象随时间变化的特征。
4.雷达图的主要用途是()。
[浙江工商大学2011研、安徽财经大学2012样题] A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性【答案】D【解析】雷达图在显示或对比各变量的数值总和时十分有用。
假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。
此外,利用雷达图也可以研究多个样本之间的相似程度。
5.美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下展示数据的图表中,哪一种不适合用来处理这一样本数据?()[中山大学2011研]A.散点图B.饼图C.条形图D.频数图【答案】A【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。
统计学-数据的图表展示分析
2021/3/25
表3-4 不同类型的饮料和顾客性别的频数分布表
也称为列联表或交叉表
2021/3/25
SPSS生成频数分布表
第一步:选择【Analyze】 【Descriptive Statistics-Frequencies】 进入主题对话框
第二步:将“饮料类型”或“顾客性别” 选入【Variable】;选中【Display Frequencies tables】。
2021/3/25
数据的整理与显示
(基本问题)
1. 要弄清所面对的数据类型,因为不同类型的 数据,所采取的处理方式和方法是不同的
2. 对定类数据和定序数据主要是做分类整理 3. 对定距数据和定比数据则主要是做分组整理 4. 适合于低层次数据的整理和显示方法也适合
于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据
第三章 数据的图表展示
3.1 数据的预处理 3.2 用图表展示定型数据 3.3 用图表展示定量数据 3.4 合理使用图表
2021/3/25
不同原因引起的寿命损失
原因
寿命减少天 数
未结婚(男性) 3 500
惯用左手
3 285
吸香烟(男性) 2 250
未结婚(女性) 1 600
30%超重
1 300
20%超重
第二步:选中数据清单中的任意单元格,并选择【数据】 菜单中的【数据透视表和数据透视图】,弹出对话框如图3-7 所示。然后根据需要选择“数据源类型”和“报表类型”。这里我 们选用【Microsoft Office Excel数据列表或数据库】和【数据 透视表】 ,单击下一步,探出对框如图3-8所示 图 3-7
700
600
贾俊平《统计学》章节题库(数据的图表展示)详解【圣才出品】
表各变量值出现癿频数。条形图是用来反映分类数据癿,反映数值型数据一般用直方图;散 点图反映两个变量间癿关系;线图主要用来反映现象随时间变化癿特征。
7.一名研究人员希望通过图形来说明 4 月份以来北京地区二手房租金每天癿变化,如 下哪个图形最合适?( )[中央财经大学 2011 研]
10.统计分组癿核心问题是( )。[西安交大 2006 研] A.选择分组方法 B.确定组数 C.选择分组标志 D.确定组中值 【答案】C
5 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
【解析】分组标志作为现象总体被划分为各个丌同性质癿组癿标准或根据,选择癿正确 不否,关系到能否正确地反映总体癿性质特征、实现统计研究癿目癿。
1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
一类别,但这些类别是无序癿,故属亍分类数据。
3.用亍显示时间序列数值型数据,以反映事物发展变化癿规律和趋势癿图是( )。 [重庆大学 2013 研]
A.直方图 B.箱线图 C.茎叴图 D.线图 【答案】D 【解析】如果数值型数据是在丌同时间上取得癿,即时间序列数据,则可以绘制线图。 线图主要用亍反映现象随时间变化癿特征。
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 3 章 数据的图表展示
一、单项选择题
1.下面哪个图形保留了原始数据癿信息?( )[对外经济贸易大学 2015 研] A.直方图 B.茎叴图 C.条形图 D.箱线图 【答案】B 【解析】茎叴图是保留幵反映原始数据分布癿图形,它由茎和叴两部分构成,其图形是 由数字组成癿。ACD 三项都需要对原始数据迚行处理,求得一些测度值乊后再作出图形。
【解析】直方图、饼图描述癿数值型数据是分组数据,而茎叴图描述癿是未分组癿数值 型数据,点图描述癿是两个变量乊间癿关系。茎叴图保留了原始数据癿信息,可以计算其分 位数。
统计学第五版课后题答案
统计学第五版贾俊平版课后题答案(部分)第三章数据的图表展示3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:接收频率E16D17C32B21A14(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A14141005101520253035CDBAE204060801001203.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业3.3 某百货公司连续40天的商品销售额如下:单位:万元41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42363737493942323635要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
统计学知识点梳理
统计学第一章导论1.1.1 什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
数据分析所用的方法分为描述统计方法和推断统计方法。
1.2 统计数据的类型1.2.1 分类数据、顺序数据、数值型数据按照所采用的计算尺度不同,可以将统计数据分为分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表示。
例如:支付方式、性别、企业类型等。
顺序数据:只能归于某一有序类别的非数字型数据。
例如:员工对改革措施的态度、产品等级、受教育程度等。
数值型数据:按数字尺度测量的观测值,其结果表现为具体的数值。
例如:年龄、工资、产量等。
统计数据大体上可分为品质数据(定性数据)和数量数据(定量数据、数值型数据)。
1.2.2 观测数据和实验数据按照统计数据的收集方法,可以分为观测数据和实验数据。
观测数据:通过调查或观测而收集的数据。
例如:降雨量、GDP、家庭收入等。
实验数据:在实验中控制实验对象而收集到的数据。
例如:医药实验数据、化学实验数据等。
1.2.3 截面数据和时间序列数据按照被描述的现象与时间的关系,可分类截面数据和时间序列数据。
截面数据:在相同或近似相同的时间点上收集的数据。
例如:2012年我国各省市的GDP。
时间序列数据:同一现象在不同的时间收集的数据。
例如:2000-2012年湖北省的GDP。
1.3.1 总体和样本总体:包含所研究的全部个体(数据)的集合。
样本:从总体中抽取的一部分元素的集合。
1.3.2 参数和统计量参数:用来描述总体特征的概括性数字度量。
统计量:用类描述样本特征的概括性数字度量。
例如:某研究机构准备从某乡镇5万个家庭中抽取1000个家庭用于推断该乡镇所有农村居民家庭的年人均纯收入。
这项研究的总体是5万个家庭;样本是1000个家庭;参数是5万个家庭的人均纯收入;统计量是1000个家庭的人均纯收入。
第二章数据的搜集2.1 数据的来源2.1.1 数据的间接来源间接来源的数据:如果与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据。
统计学-第3章 数据的图表展示 学习指导
第3章(数据的图表展示)学习指导(一)数据的预处理数据预处理包括审核、筛选和排序。
1.对不同渠道取得的数据在审核内容和方法上有所不同。
直接调查取得的原始数据从完整性和准确性上去审核。
二手数据除审核其完整性和准确性外,还要审核其适用性和时效性。
2.数据的筛选包括两个方面:一是剔除错误数据;二是剔除不符合特定条件的数据。
3.数据排序是按一定的顺序将数据进行排列,以便发现数据的特征和趋势。
(二)品质数据的整理与显示品质数据的整理是对数据进行分类,计算出每一类别的频数、频率或比例、比率,并用图形进行显示。
(三)数值型数据的整理与显示品质数据的整理与显示方法都适用于数据型数据的整理与显示,但数据型数据还有一些特定的方法,而且这些方法不适用于品质数据。
(四)统计表统计表是用于显示统计数据的基本工具,由表头、行标题、列标题、数字资料以及表外附注组成。
概念练习一)单项选择题1、统计整理阶段最关键的问题是( )。
A、对调查资料的审核;B、统计分组;C、统计汇总;D、编制统计表。
2、统计分组的关键在于( )。
A、分组标志的正确选择;B、按品质标志分组;C、运用多个标志进行分组,形成一个分组体系;D、分组形式的选择。
3、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的( )。
A、80-89%B、80%以下90-99%80.1-90%100-109%90.1-100%110%以上100.1-110%C、90%以下D、85%以下90-100%85-95%100-110%95-105%110%以上105-115%4、在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是( )。
A、将此值归人上限所在组;B、将此值归人下限所在组;C、将此值归人上限所在组或下限所在组均D、另行分组。
5、划分离散变量的组限时,相邻两组的组限( )。
A、必须是间断的;B、必须是重叠的;C、即可以是间断的,也可以是重叠的;D、应当是相近的。
统计学原理随堂练习-华工
第一章绪论1.(判断题) 统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。
答案:√2.(判断题) 描述统计学是研究如何根据样本数据去推断通体数量特征的方法。
答案:×3.(判断题) 描述统计学是整个统计学的根底,推断统计学是现代统计学的主要内容。
答案:√4.(判断题) 推断统计学在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。
答案:√5.(判断题) 统计数据的计量尺度分为定类尺度、定序尺度、定距尺度和定比尺度。
答案:√6.(判断题) 定量数据说明的是现象的数量特征,是能够用数值来表现。
答案:√7.(判断题) 定性数据说明的是现象的品质特征,是不能用数值来表现。
答案:√8.(判断题) 统计指标表现为绝对数、相对数和平均数三种形式。
答案:√9.(判断题) 产品产量是时期数。
答案:√10.(判断题) 股票价格是时点数。
答案:√11.(判断题) 考试成绩分为优、良、中、及格、不及格,这是按定类尺度划分的。
答案:×12.(判断题) 考试成绩用"百分制〞度量,这是按定比尺度划分的。
答案:×13.(判断题) 将全部人口分为男女两局部,男性所占比重就是比率相对数。
答案:×14.(判断题) 动态数列就是将*同时期的各指标数值按照组别进展排序得到的数列。
答案:×15.(判断题) "企业数〞、"年龄〞都是离散变量。
答案:×16.(判断题) "性别〞、"产品等级〞属于数量变量。
答案:×17.(判断题) 数据的加工处理方法、数据分布特征的概括与分析方法等属于描述统计学的内容。
答案:√18.(判断题) 人的身高、体重、机器设备台数等都是连续变量。
答案:×19.(判断题) 离散变量的变量值只能按整数计算,不可能有小数。
答案:×20.(判断题) 价值单位是以货币形式对现象进展度量,如国民生产总值、商品销售额等。
应用统计学(第三版)马立平等
第四,统计的基本方法是归纳推断。
第三节
统计数据与统计规律
一、数据的计量尺度
(一)定类尺度
定类尺度是最粗略、计量层次最低的计 量尺度。它的主要特征是采 用文字、数 字代码和其他符号对事物进行简单的分 类或分组。建立在对 事物进行分类分组 的基础上的计量尺度称为定类尺度。 只能区分事物是同类或非同类,必须符 合穷尽和互斥的要求。
1.普查 2.抽样调查 (1)主观抽样调查 (2)概率抽样调查
(二)实验设计方式
实验设计一般包括五个相互关联的环节:
一、根据实验的目的,设计实验方案,以保证每一个非被实验因素对被实验 因素的作用相同,以突出被实验因素的效应,合理优化实验的次数; 二、方案的实施; 三、对实验结果进行测量,取得实验数据资料; 四、运用统计方法,对实验数据进行分析,形成相应的结论; 五、根据数据分析的结果,得出实验的结论。
观察法不同于日常生活中的观察,它具有目的性、计划性和系统性,而且要求观察者对所观察到的事实作 出实质性的结论。
选择具体的方法时,需要综合比较各种方法的调查范围、调查对象的可控性、影响回答的因素、回收率、回答速 度、回答质量和费用等,从而选择最适合的方法。
第三节
问卷的设计
一、问卷的概念和作用
问卷是现代调查中使用最为普遍的用于收集数据的一种表述调查项目的形式。
北京高等教育精品教材
应用统计学
(第三版)
首都经济贸易大学出版社
目录
CONTENTS
第一章 统计学与统计数据 第二章 统计数据收集的方法与数据质量 第三章 数据的图表展示 第四章 数据的统计量描述 第五章 概率抽样与抽样分布 第六章 参数统计 第七章 参数的假设检验
统计学课件第3章 数据的图表展示
2
All rights reserved
南审理学院
图表的力量(续)
历史上著名的统计图表
拿破仑的大军团进军俄国
Minard绘制的地图,展现了1812年拿破仑的 大军团进军俄国的路线(上半部分)和撤退 时的气温变化(下半部分)。这一历史事件 中,法军数量的急剧减少以及恶劣的气候条 件一览无遗
法国科学家Étienne-Jules Marey称“该图所 展现出的雄辩对历史学家的笔是一种极大的 挑战”
6
All rights reserved
南审理学院
图表的力量(续)
南丁格尔的极坐标面积图:两幅图分别是1854年和1855年的 军队伤亡人数,一年12个月恰好可以将极坐标分为12等分, 每一瓣代表一个月。图中用颜色标记出了三种死亡原因。
7
All rights reserved
南审理学院
图表的力量(续)
3
All rights reserved
南审理学院
图表的力量(续)
4
All rights reserved
南审理学院
图表的力量(续)
这一史诗般的历史时刻被Charles Joseph Minard转换成了信息视觉化 的先驱作品。1861年,这位法国工程师出版了1812-1813征俄战役中法 国部队连续伤亡图解。这幅1861年出版的信息图,以拿破仑在1812征俄 战役中遭遇的灾难为主题。这幅图使用了好几种二维变量:线条的粗细 表示军队的强弱,数字指示关键转折点的军力。从左到右: ——图像顶端最粗的线条表示最初渡河的422,000人,他们一路深入到俄国 领土,在莫斯科停下来的时候还有100,000人左右。从右到左,他们朝 西走回头路,渡过Niemen河的时候,仅仅剩下10,000。随着大部队和 余部会师(比如在渡贝尔齐纳河之前),图中显示的数字降中也有升。 ——图的下半部分是从右往左看的。它用列氏度(将列氏度乘以1¼可以得到 相应的摄氏度,例如-30°R = −37.5 °C)显示了法国军队从俄国撤退 时的气温变化。从莫斯科的接近0°R(译注:原文此处未写明温度,该 数据由原图推断得出。)到这次灾难性冒险结束时的-30°R。 单纯的作图以非常形象的方式表示出了事件的规模以及在短短几个月里 法国军队每况愈下的过程。这幅地图很实在地告诉我们数据视觉化和图 象的交流的魅力:这幅地图通过各种不同的手段,仅仅用图像就描述出 征俄战役惨败的各项重要数据,以及这场灾难是如何发生的。信息设计 及稍后出现的数据视觉化的长处之一就是它能减少看懂一个特定事件的 来龙去脉所需要的时间,同时还能够更好地突出重点。
第三章 统计数据的整理
土 地 面 积
人口密度
日本
美国
欧共体
统计地图
合成纤维人造纤维的地域分布
(四)统计图的构成
图题
某国各地降水量
90 80 70 60 50 40
1 图题 2 图号 3 图目
4 图尺 5 图形 6 图注
图 目
降 水 量 ( 毫 米 )
图形
图注
东部 西部 北部
图尺 30
20 10 0 第一季度 第二季度 第三季度 第四季度
分配数列的种类
1.按分组标志的性质不同
品质变量数列:按品质变量分组形成
数值变量数列:按数值变量分组形成
2.数值变量数列还可分为 单项数列:每组只有一个变量值的变量数列 组距数列:每组变量值是一段区间的变量数列
连续变量数列:按连续变量分组形成的数列
离散变量数列:按离散变量分组形成的数列
品质变量分配数列实例
本章重难点提示
本章重点:统计分组、变量数列的编制、统计数据的显示方 法——统计表和统计图。 本章难点:统计分组、变量数列的编制、次数分布图的绘制。
第一节 数据整理的一般问题
一 数据整理的概念和作用
(一)概念 对统计调查所搜集到的数据进行分类和汇总,使 其系统化、条理化、科学化,以得出反映事物总体综 合特征的资料的工作过程。
100-500 500以上
180
85 35
7.83
3.70 1.52
合计
2300
100.00
单项式变量数列实例
表3-4 家庭人口数(人) 1 某市居民家庭按家庭人口数分组 家庭数(千户) 9.8 比重(%) 5.76
2
3
27.5
94.6
统计学 数据的整理及图表展示
– 饼图只能显示一个总体各部分所占的比例 – 环形图则可以同时绘制多个总体的数据系
列,每一个总体的数据系列为一个环
3. 环形图可用于进行比较研究 4. 环形图可用于展示分类数据和顺序数据
13%
7%
10% 8%
15% 21%
33% 36%
31% 26%
非常不满意 不满意 一般 满意 非常满意
组中值= 下限值+上限值 2
组距分组
第1步:排序,确定组数(K)
5≤K≤15
K 1 lg n
能够显示数据的分布特征和规律
lg 2
第2步:确定组距 组距=(最大值-最小值)÷组数
★ 组距宜取5或10的倍数
◆第一组的下限应低于最小值, ◆最后一组的上限应高于最大值。 遵循“不重不漏”的原则
上组限不在内
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~115
5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135以上
4
8
合计
50
100
用Excel制作数值型数据的频数分布表
【工具】 ——【数据分析】 ——【直方图】 【输入区域】:输入原始数据区域 【接收区域】:输入各组的上限值 【输出区域】:选择一个空白单元格(想要
(上下组限重叠)
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~110
3
6
统计学贾俊平第3章数据的图表展示
组距(class width) :上限与下限之差
组中值(class midpoint) :下限与上限之间 的中点值
组中值 = 下限值+上限值 2
45
All rights reserved
【例】某电 脑公司连续 个月各天的 销售量数据( 单位:台)。 试对数据进 行分组
All rights reserved
29
All rights reserved 29
帕累托图
30
All rights reserved 30
例析
频数汇总
罪犯的例子
改造方式 监狱 文学课 总计
无新罪 22 32 54
新罪 18 6 24
总计 40 38 78
31
All rights reserved
Graphs are the most effective way to communicate using data
一图胜千言
John Tukey:“图形的最大价值就是使我 们注意到我们从来没有料到过的信息”
6
All rights reserved
图表的力量
历史上著名的统计图表
拿破仑的大军团进军俄国
向上累积
户数 百分比
(户)
(%)
向下累积
户数 百分比 (户) (%)
非常不满意 21
7.0
21
7.0 300 100.0
不满意
99 33.0 120
40.0 279
93.0
一般
78 26.0 198
66.0 180 60.0
满意
64 21.3 262
统计(03)第3章__数据的图表展示
2. 数据筛选
3. 数据排序
4. 数据透视
统计学
STATISTICS (第四版)
数据审核
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第四版)
1.
–
–
数据审核—原始数据
(raw data)
完整性审核
应调查的单位或个体是否有遗漏 所有的调查项目或变量是否填写齐全
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第四版)
3.2 品质数据的整理与展示
3.2.1 分类数据的整理不图示 3.2.2 顺序数据的整理不图示
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第四版)
数据的整理不显示
(基本问题)
丌同类型的数据,采取丌同的处理方式和方法
统计学
STATISTICS (第四版)
数据排序
(方法)
1. 分类数据的排序 字母型数据,排序有升序降序之分,但习惯上
用升序 汉字型数据,可按汉字的首位拼音字母排列, 也可按笔画排序,其中也有笔画多少的升序降 序之分
2. 数值型数据的排序
–
–
逑增排序:设一组数据为x1,x2,…,xn,逑增 排序后可表示为:x(1)<x(2)<…<x(n) 逑减排序:可表示为:x(1)>x(2)>…>x(n)
甲城市家庭对住房状况评价的频数分布 甲城市 回答类别 户数 (户) 24 108 93 45 30 300 百分比 (%) 8 36 31 15 10 100.0 向上累积 户数 (户) 24 132 225 270 300 — 百分比 (%) 8.0 44.0 75.0 90.0 100.0 — 向下累积 户数 (户) 300 276 168 75 30 — 百分比 (%) 100.0 92 56 25 10 —
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
物业服务的评价,制
订了一份调查问卷,
其中一项是业主对物
业服务的总体评价,
包括五个选项:1.非
常 满 意 、 2. 满 意 、 3.
基本满意、4.不满意、
5.非常应不用统满计学意
数值型数据的整理与展示
第三章 数据的图表展示
数据的预处理 品质数据的整理与展示 数值型数据的整理与展示
合理使用图表
数值型数据的整理与展示
环形图
合理使用图表
第三章 数据的图表展示
数据的预处理 品质数据的整理与展示 数值型数据的整理与展示
合理使用图表
合理使用图表
第三章 数据的图表展示
1.鉴别图形优劣的准则 2. 统计表的设计
鉴别图表优劣的准则
精心设计、有助于洞察问题的实质
使复杂的观点得到简明、确切、高效的阐述 能在最短的时间内以最少的笔墨给读者
数值型数据的整理与展示
第三章 数据的图表展示
1.数据分组 2.数值型数据的图示
确定组数 确定组距
制作频数 分布表
用图 形 显示数 据
上限(upper limit) :一个组的最大值 下限(low limit) :一个组的最小值
组距(class width) :上限与下限之差
组中值(class midpoint) :下限与上限 之间的中点值
提供最大量的信息 如实反映数据
合理使用图表
第三章 数据的图表展示
2002~2003年城镇居民家庭抽样调查资料
项目
单位
2002年 2003年
调查户数
平均每户家庭人口
行
平均每户就业人口 平均每户就业面
标 平均一名就业者负担人数
题 平均每人全部年收入
#可支配收入
平均每人消费性支出
户
45317
48028
数值型数据的整理与展示
第三章 数据的图表展示
1.数据分组
2.数值型数据的图示
【例】请利用 2020 年 某 班 级 50 名同学的《统计 学》课程期末考 试成绩绘制直方 图和折线图,包 括不可变直方图 和可变直方图两 种形式。
确定组数
确定组距
制作频数分 布 表
用图形显示 数 据
数值型数据的整理与展示
第三章 数据的图表展示
品质数据的整理与展示
第三章 数据的图表展示
1. 分类数据的整理
累积频数(cumulative frequencies):各类
2. 顺序数据的整理
别频数的逐级累加 累积频率(cumulative percentages):各类
【例】某居民小区物
别频率(百分比)的逐级累加
业公司欲了解业主对
分类 数据
• 分类整理
顺序 数据
• 分类整理
数值 型
• 分组整理
品质数据的整理与展示
1. 分类数据的整理 2. 顺序数据的整理
第三章 数据的图表展示
列出各 计算各类 制作频数 用图形显 类 别 别的频数 分 布 表 示 数 据
品质数据的整理与展示
1. 分类数据的整理
2. 顺序数据的整理
【例】一家市场调 查公司为研究不同 品牌手机的市场占 有率,采用网络辅 助调查的方式对随 机某知名手机论坛 的 100 名 会 员 进 行 调查,调查结果见 右表。
K 1 ln n ln 2
数值型数据的整理与展示
第三章 数据的图表展示
1.数据分组 2.数值型数据的图示
确定组数
确定组距
制作频数分 布 表
用图形显示 数 据
确定组距:组距(class width)是一个组的上 限与下限之差,可根据全部数据的最大值 和最小值及所分的组数来确定,即:
组距=( 最大值 - 最小值)÷ 组数
树叶上只保留最后一位数字
数值型数据的整理与展示
1. 数据分组 2.数值型数据的图示
茎叶图
第三章 数据的图表展示
数值型数据的整理与展示
第三章 数据的图表展示
1. 数据分组 2.数值型数据的图示
箱线图
由一组数据的5个特征值绘制而成,它 由一个箱子和两条线段组成
绘制方法:
首先找出一组数据的5个特征值,即最 大值、最小值、中位数和两个四分位数
人
3.04
3.01
人
1.58
1.58
%
51.97 52.49
元
1.92
1.91
元
8177.40 9061.22
元
7702.80 8472.20
元
6029.88 6510.94
资料来源:《中国统计年鉴2004》,中国统计出版社,2004,第359页。 注:本表为城市和县城的城镇居民家庭抽样调查资料。
表头 列 标 题
否符合实际
所有的调查项目或 变量是否填写齐全
数据是否有错误, 计算是否正确等
数据的预处理
第三章 数据的图表展示
1.数据审核 2.数据筛选 3.数据排序
检查数据中的错误
适用性审核
弄清楚数据的来源、 数据的口径以及有关
的背景材料
时效性审核
尽可能使用最新 的数据
确定数据是否符合自己 分析研究的需要
数据的预处理
数据第的预三处理章 数据第三的章 图数表据的展图标示展示
数据的预处理 品质数据的整理与展示 数值型数据的整理与展示
合理使用图表
数据的预处理
第三章 数据的图表展示
1.数据审核 2.数据筛选 3.数据排序
检查数据中的错误
完整性审核
应调查的单位或个 体是否有遗漏
准确性审核
数据是否真实反映 实际情况,内容是
数值型数据的整理与展示
第三章 数据的图表展示
1.数据分组 2.数值型数据的图示
确定组数
确定组距
制作频数分 布 表
用图形显示 数 据
确定组数:组数的确定应以能够显示数据 的分布特征和规律为目的。在实际分组时, 组数一般为5 K 15,可以按 Sturges (斯特 奇斯) 提出的经验公式确定组数K:
第三章 数据的图表展示
1. 数据分组 2.数值型数据的图示
分组数据:直方图和折线图
数值型数据的整理与展示
第三章 数据的图表展示
1. 数据分组 2.数值型数据的图示
未茎分叶组图数据:茎叶图和箱线图
用于显示未分组的原始数据的分布
由“茎”和“叶”两部分构成,其图形 是由数字组成的
以该组数据的高位数值作树茎,低位数 字作树叶
1.数据审核 2.数据筛选 3.数据排序
第三章 数据的图表展示
数据的预处理
1.数据审核 2.数据筛选 3.数据排序
第三章 数据的图表展示
品质数据的整理与展示
第三章 数据的图表展示
数据的预处理 品质数据的整理与展示 数值型数据的整理与展示
合理使用图表
品质数据的整理与展示
第三章 数据的图表展示
1. 分类数据的整理 2. 顺序数据的整理
第三章 数据的图表展示
1.数据分组 2.数值型数据的图示
分组方法 单变量值分组
组距分组
将一个变量值作为一组 适合于变量值较少的离散型数据
数值型数据的整理与展示
第三章 数据的图表展示
1.数据分组 2.数值型数据的图示
分组方法 单变量值分组
组距分组
将变量值的一个区间作为一组 适合于变量值较多的连续型变量 分为等距分组和异距分组
连接两个四分位数画出箱子,再将两 个极值点与箱子相连
数值型数据的整理与展示
第三章 数据的图表展示
1. 数据分组 2.数值型数据的图示
箱线图
最小值
下四分位 中位 上四分位
数
数
数
最大值
数值型数据的整理与展示
第三章 数据的图表展示
1. 数据分组 2.数值型数据的图示
时间序列数据(Time series data):线图
数值型数据的整理与展示
第三章 数据的图表展示
1. 数据分组 2.数值型数据的图示
双变量数据(Time series data):散点图
数值型数据的整理与展示
第三章 数据的图表展示
数据类型
品质数据
数值型数据
汇总表
原始数据 分组数据 时序数据 多元数据
条形图 茎叶图 直方图 线图 散点图
饼图 箱线图 折线图
数 字 资 料
附 加