(03)第3章 数据的图表展示
ACCESS2003所有ppt第3章 1,2,3(9)
【上限值】:对显示结果进行限定。 【唯一值】:指名记录值是否唯一。 【唯一的记录】:是否每条记录都不相同。 【运行权限】:指定该查询的执行者。 【源数据库】:输入表和查询的源数据库名 称,默认为当前数据库。
Access 2003 入门与提高
清华大学出版社
【源连接字符串】:输入连接源字段串的源 数据库名称。 【记录锁定】:指如何锁定基本表或查询中 的记录,其选项有【不锁定】、 【所有记录】 和【编辑的记录】。 【记录集类型】:决定哪些表中的数据可以 进行编辑。 【ODBC超时】:指定在多长的时间内没有 收到服务器的响应就取消ODBC查询,否则 为无时间限制。
清华大学出版社
SQL专用查询包括:
联合查询:把一个或多个表的字段组合成结果集 中的一个字段。 传递查询:使用服务器专用命令把指令直接发送 到ODBC数据库。 数据定义查询:创建或更改Access 2003、SQL 服务器或其他服务器数据库中的数据库对象。 子查询:在其他查询中形成一个Select查询的 SQL Select 查询或其他服务器语句。
Access 2003 入门与提高
清华大学出版社
特殊用途查询可分为:
参数查询:运行时显示一个对话框,用户可以把 检索数据的准则或要插入字段的值输入到这个对 话框中。 自动查找查询:自动把新记录中的某些字段值填 充到一个或多个表中。 交叉表查找:计算电子表格式中数据的总合或对 查询结果进行统计和分组,把具有两种信息的数 据联系起来。
Access 2003 入门与提高
清华大学出版社
查询及字段的属性设置
在查询设计器中单击工具栏的【属性】按钮,或者 右键的【属性】命令,弹出【查询属性】对话框:
Access 2003 入门与提高
贾俊平《统计学》(第7版)考研真题与典型题详解-第3章 数据的图表展示【圣才出品】
第3章数据的图表展示一、单项选择题1.对于大批量的数据,最适合描述其分布的图形是()。
[中国海洋大学2018研] A.条形图B.茎叶图C.直方图D.饼图【答案】C【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。
2.下面哪个图形保留了原始数据的信息?()[对外经济贸易大学2015研]A.直方图B.茎叶图C.条形图D.箱线图【答案】B【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。
ACD三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
3.用于显示时间序列数值型数据,以反映事物发展变化的规律和趋势的图是()。
[重庆大学2013研]A.直方图B.箱线图C.茎叶图D.线图【答案】D【解析】如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图。
线图主要用于反映现象随时间变化的特征。
4.雷达图的主要用途是()。
[浙江工商大学2011研、安徽财经大学2012样题] A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性【答案】D【解析】雷达图在显示或对比各变量的数值总和时十分有用。
假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。
此外,利用雷达图也可以研究多个样本之间的相似程度。
5.美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下展示数据的图表中,哪一种不适合用来处理这一样本数据?()[中山大学2011研]A.散点图B.饼图C.条形图D.频数图【答案】A【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。
《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
统计学数据的整理
顺序的开始一方累加频数。
2. 累积频率:将各类别的百分比逐级累加
【例3.5】在一项城市住房问题的研 究中,研究人员在甲乙两个城市 各抽样调查300户,其中的一个问 题是:“您对您家庭目前的住房 状况是否满意?
107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
某车间50名工人日加工零件数分组表
零件数 频数 零件数 频数 零件数 频数
(个)
(人)
(个)
(人)
(个)
(人)
107
1
119
1
128
2
108
2
120
2
129
1
110
1
121
1
130
1
112
2
122
4
131
1
113
1
123
4
133
2
114
1
124
3
134
2
115
1
125
2
135
1
117
3
126
2
137
分组方法
单变量值分组
组距分组 等距分组 异距分组
单变量值分组 (要点)
《数据的图表》课件
仪表盘的使用场景和优点
仪表盘适用于实时监控和评估关键指标。其优点包括能够直观地呈现数据的 状态、提供实时反馈和帮助管理决策。
实时图表
实时数据图表显示最新的数 据变化,常用于监控和实时 决策。
常见的数据图表有哪些?
柱状图
用于比较不同类别之间的数据大小和趋势。
折线图
用于显示数据随时间变化的趋势和关联。
散点图
用于展示变量之间的相关性和分布情况。
饼图
用于显示类别数据的相对比例。
柱状图的使用场景和优点
柱状图适用于比较不同类别之间的数据差异和趋势,能清晰地显示数据大小 和关系。其优点包括易于理解、简洁明了,适用于大量数据的展示。
《数据的图表》PPT课件
欢迎来到《数据的图表》PPT课件!在本课程中,我们将探索数据图表的定 义、分类以及常见的应用场景。让我们一起开始本届的数据之旅!
什么是数据图表?
数据图表是一种以图形方式展示数据的工具和技术。它们帮助我们更好地理 解和解释数据,揭示数据背后的模式、趋势和关系。
数据图表的作用是什么?
折线图的使用场景和优点
折线图适用于显示数据随时间的变化趋势和关联性。其优点包括能够清楚地展示趋势、突出变化和周期性,并 支持多组数据对比。
散点图的使用场景和优点
散点图适用于展示多个变量之间的关联性和分布情况。其优点包括能够发现异常值、评估相关性和观察趋势。
饼图的使用场景和优点
饼图适用于显示类别数据的相对比例和占比情况。其优点包括能够直观地展 示各组别之间的比例关系和简明扼要地传达信息。
数据图表的作用是将复杂的数据变得更易于理解和传达。它们可以帮助我们发现数据中的洞察力并支持决策和 沟通过程。
数据图表的分类有哪些?
贾俊平《统计学》章节题库(数据的图表展示)详解【圣才出品】
表各变量值出现癿频数。条形图是用来反映分类数据癿,反映数值型数据一般用直方图;散 点图反映两个变量间癿关系;线图主要用来反映现象随时间变化癿特征。
7.一名研究人员希望通过图形来说明 4 月份以来北京地区二手房租金每天癿变化,如 下哪个图形最合适?( )[中央财经大学 2011 研]
10.统计分组癿核心问题是( )。[西安交大 2006 研] A.选择分组方法 B.确定组数 C.选择分组标志 D.确定组中值 【答案】C
5 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
【解析】分组标志作为现象总体被划分为各个丌同性质癿组癿标准或根据,选择癿正确 不否,关系到能否正确地反映总体癿性质特征、实现统计研究癿目癿。
1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
一类别,但这些类别是无序癿,故属亍分类数据。
3.用亍显示时间序列数值型数据,以反映事物发展变化癿规律和趋势癿图是( )。 [重庆大学 2013 研]
A.直方图 B.箱线图 C.茎叴图 D.线图 【答案】D 【解析】如果数值型数据是在丌同时间上取得癿,即时间序列数据,则可以绘制线图。 线图主要用亍反映现象随时间变化癿特征。
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 3 章 数据的图表展示
一、单项选择题
1.下面哪个图形保留了原始数据癿信息?( )[对外经济贸易大学 2015 研] A.直方图 B.茎叴图 C.条形图 D.箱线图 【答案】B 【解析】茎叴图是保留幵反映原始数据分布癿图形,它由茎和叴两部分构成,其图形是 由数字组成癿。ACD 三项都需要对原始数据迚行处理,求得一些测度值乊后再作出图形。
【解析】直方图、饼图描述癿数值型数据是分组数据,而茎叴图描述癿是未分组癿数值 型数据,点图描述癿是两个变量乊间癿关系。茎叴图保留了原始数据癿信息,可以计算其分 位数。
第三章统计图表
第3章统计图表数据精确、简洁图形直观、形象一、统计表1. 统计表的结构①标题、②标目(纵、横)、③线条(“三线表”)、④数字、⑤备注表1 2001年某工厂四项检测指标异常检出率检测指标受检人数异常人数检出率(%)血压心率TTT∆GPT#5195195195195544362010.160.486.943.85∆:TTT(麝香草酚浊度试验),#:GPT(谷丙转氨酶)。
统计表的结构××. ××┋┋×. ××××. ××纵标目总标目(单位)××. ××××××××合计┋┋┋┋┋┋┋┋×. ××××××┋××. ××××××××横标目纵标目纵标目纵标目总标目横标目的总标目备注:2. 统计表的种类简单表复合表3. 不良统计表的修改举例年份(1) 病例数(2)存活数(3)住院期死亡总例数(4)=(2)+(3)急性期死亡数(5)住院期总病死率(%)(6)=(4)/(2)急性期病死率(%)(7)=(5)/(2)1964 17 9 8 7 47.1 41.21965 13 8 5 4 38.5 30.81966 15 8 7 6 46.7 40.01967 15 9 6 6 40.0 40.01968 12 8 4 4 33.3 33.3合计72 42 30 27 41.7 37.51967 15 6 6 40.0 40.0 1968 12 4 4 33.3 33.3 合计72 30 27 41.7 37.5二、统计图统计图2.统计图的种类与绘制注意事项1. 统计图的制图通则2. 统计图的种类与绘制注意事项(1)条图(bar chart)条图直条相互独立的④误差条图(error-bar)分段条图:具有两个统计指标,一个分组因素,且两个统误差条图:0102030405060ºÉÐÊÁÂÅΪ«ÐºËôÊμģ¨£¤£¦Á¹ËôÊμģ¤ÀäÅü£¤20406080100A BC DͧË÷ÅÑÆåÐÑ(g )图3 四种营养素喂养小白鼠三周后所增体重(克)图2 老、中、青三代的结核菌素阳性率与强阳性率(%)绘制条图注意事项必须从“0”开始由大到小排列自然顺序排列相等一半01234567甲乙(2)圆图(pie chart)圆图3.6°1%12点钟顺时针2002年某医院1402例孕妇分娩结果(3)线图与半对数线图线图连续性资料算术尺度半对数线图发展速度对数尺度绝对差与相对比的比较A →B 绝对差 相对比(A/B ) 对数差(lgA-lgB ) 1000→100 1000-100=900 1000/100=10 lg1000-lg100=3-2=1100→10 100-10=90 100/10=10 lg100-lg10=2-1=1 10→110-1=910/1=10lg10-lg1=1-0=1图2-19 绝对差示意图(算术格纸)数值时间1101001000A B图2-20 相对比示意图(半对数格纸)数值时间表2-13 某市1949~1957年15岁以下儿童结核病和白喉死亡率(1/10万)年份结核病死亡率百喉死亡率年份195719561955195419531952195119501949死40200白喉年份1957195619551954195319521951195019490.5(4)直方图(histogram)直方图25(5)散点图(scatter diagram)散点图0.2X(6)统计地图(statistical map)数量在地域(7)箱图(box plot)治疗组(8)雷达图(radar graph)雷达图ÿĮ³¦Í¥Í¿»¶¼Ä£¤Ì·»ÀÐÀ±ÂЯʼģ¤(9)气泡图气泡图8.â°ãǶ»·²öªä»¹Í½°ã°¾½Ü¶¬®Æ±Â´ÇÁ¶ÄÀ«¯Í®»·ªä»¹³ÑÉ°9.Ç®¶À°ÑǶ°ÑÍ´ÊάĻɰ㰾į½Ü¡¢ËÏè°¾ÃéÁ®°ÂÅ°½¶¶¡°ÑÍ´«Ð¶µ¾ÜÍʹϪ²¬¢ªŅ̃ĪǶºù«¿ÎÓǶÍÌÃÉ·Áµ´ª±Æâ°¾ÃÉ«·。
统计学课件第3章 数据的图表展示
2
All rights reserved
南审理学院
图表的力量(续)
历史上著名的统计图表
拿破仑的大军团进军俄国
Minard绘制的地图,展现了1812年拿破仑的 大军团进军俄国的路线(上半部分)和撤退 时的气温变化(下半部分)。这一历史事件 中,法军数量的急剧减少以及恶劣的气候条 件一览无遗
法国科学家Étienne-Jules Marey称“该图所 展现出的雄辩对历史学家的笔是一种极大的 挑战”
6
All rights reserved
南审理学院
图表的力量(续)
南丁格尔的极坐标面积图:两幅图分别是1854年和1855年的 军队伤亡人数,一年12个月恰好可以将极坐标分为12等分, 每一瓣代表一个月。图中用颜色标记出了三种死亡原因。
7
All rights reserved
南审理学院
图表的力量(续)
3
All rights reserved
南审理学院
图表的力量(续)
4
All rights reserved
南审理学院
图表的力量(续)
这一史诗般的历史时刻被Charles Joseph Minard转换成了信息视觉化 的先驱作品。1861年,这位法国工程师出版了1812-1813征俄战役中法 国部队连续伤亡图解。这幅1861年出版的信息图,以拿破仑在1812征俄 战役中遭遇的灾难为主题。这幅图使用了好几种二维变量:线条的粗细 表示军队的强弱,数字指示关键转折点的军力。从左到右: ——图像顶端最粗的线条表示最初渡河的422,000人,他们一路深入到俄国 领土,在莫斯科停下来的时候还有100,000人左右。从右到左,他们朝 西走回头路,渡过Niemen河的时候,仅仅剩下10,000。随着大部队和 余部会师(比如在渡贝尔齐纳河之前),图中显示的数字降中也有升。 ——图的下半部分是从右往左看的。它用列氏度(将列氏度乘以1¼可以得到 相应的摄氏度,例如-30°R = −37.5 °C)显示了法国军队从俄国撤退 时的气温变化。从莫斯科的接近0°R(译注:原文此处未写明温度,该 数据由原图推断得出。)到这次灾难性冒险结束时的-30°R。 单纯的作图以非常形象的方式表示出了事件的规模以及在短短几个月里 法国军队每况愈下的过程。这幅地图很实在地告诉我们数据视觉化和图 象的交流的魅力:这幅地图通过各种不同的手段,仅仅用图像就描述出 征俄战役惨败的各项重要数据,以及这场灾难是如何发生的。信息设计 及稍后出现的数据视觉化的长处之一就是它能减少看懂一个特定事件的 来龙去脉所需要的时间,同时还能够更好地突出重点。
第三章 数据的图表展示
首行必须有列标题
数据的整理与显示 (基本问题)
1. 要弄清所面对的数据类型
不同类型的数据,采取不同的处理方式和方 法
2. 对分类数据和顺序数据主要是作分类整 理
3. 对数值型数据则主要是作分组整理
条形图(bar chart),也可以放在横 轴,称为柱形图(column chart)
图示2:复式条形图
1. 分类变量在不同时间或不同空间上有 多个取值
2. 对比分类变量的取值在不同时间或不 同空间上的差异或变化趋势
电脑品牌 一季度 二季度
联想 IBM 康柏 戴尔
256 468 285 397 247 328 563 688
第三章 数据的图表展示
主讲人:龚洁松
3.1 数据的预处理 3.2 品质数据的整理与显示 3.3 数值型数据的整理与显示 3.4 合理使用图表
学习目标
1. 了解数据预处理的内容和目的 2. 掌握分类和顺序数据的整理与显示方法 3. 掌握数值型数据的整理与显示方法 4. 用Excel、SPSS作频数分布表和图形 5. 合理使用图表
3. 百分比(percentage) :将对比的基数作为100而
计算的比值,即(Ni/N)×100 %
4. 比率(ratio) :不同类别数值个数的比值,即
Ni︰Nj
图示1:条形图
1. 用宽度相同的条形的高度或长短来表 示各类别数据的图形
2. 有单式条形图、复式条形图等形式 3. 主要用于反映分类数据的频数分布 4. 绘制时,各类别可以放在纵轴,称为
图示5:环形图
1. 环形图中间有一个“空洞”,样本或总 体中的每一部分数据用环中的一段表示
统计(03)第3章__数据的图表展示
2. 数据筛选
3. 数据排序
4. 数据透视
统计学
STATISTICS (第四版)
数据审核
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第四版)
1.
–
–
数据审核—原始数据
(raw data)
完整性审核
应调查的单位或个体是否有遗漏 所有的调查项目或变量是否填写齐全
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第四版)
3.2 品质数据的整理与展示
3.2.1 分类数据的整理不图示 3.2.2 顺序数据的整理不图示
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第四版)
数据的整理不显示
(基本问题)
丌同类型的数据,采取丌同的处理方式和方法
统计学
STATISTICS (第四版)
数据排序
(方法)
1. 分类数据的排序 字母型数据,排序有升序降序之分,但习惯上
用升序 汉字型数据,可按汉字的首位拼音字母排列, 也可按笔画排序,其中也有笔画多少的升序降 序之分
2. 数值型数据的排序
–
–
逑增排序:设一组数据为x1,x2,…,xn,逑增 排序后可表示为:x(1)<x(2)<…<x(n) 逑减排序:可表示为:x(1)>x(2)>…>x(n)
甲城市家庭对住房状况评价的频数分布 甲城市 回答类别 户数 (户) 24 108 93 45 30 300 百分比 (%) 8 36 31 15 10 100.0 向上累积 户数 (户) 24 132 225 270 300 — 百分比 (%) 8.0 44.0 75.0 90.0 100.0 — 向下累积 户数 (户) 300 276 168 75 30 — 百分比 (%) 100.0 92 56 25 10 —
贾俊平统计学第5版视频精讲
贾俊平统计学第5版视频精讲!贾俊平《统计学》(第5版)精讲班【教材精讲+考研真题串讲】讲师:孙玉奎/谷小冉目录说明:本课程共包括27个高清视频(共42课时)。
序号名称1 第1章导论2 第2章数据的搜集(1)3 第2章数据的搜集(2)4 第3章数据的图表展示(1)5 第3章数据的图表展示(2)6 第4章数据的概括性度量(1)7 第4章数据的概括性度量(2)8 第5章概率与概率分布(1)9 第5章概率与概率分布(2)10 第6章统计量及其抽样分布11 第7章参数估计(1)12 第7章参数估计(2)13 第8章假设检验(1)14 第8章假设检验(2)15 第8章假设检验(3)16 第9章分类数据分析17 第10章方差分析(1)18 第10章方差分析(2)19 第11章一元线性回归(1)20 第11章一元线性回归(2)21 第12章多元线性回归(1)22 第12章多元线性回归(2)23 第13章时间序列分析和预测(1)24 第13章时间序列分析和预测(2)25 第13章时间序列分析和预测(3)26 第14章指数(1)27 第14章指数(2)内容简介本课程是贾俊平《统计学》(第5版)网授精讲班,为了帮助参加研究生招生考试指定考研参考书目为贾俊平《统计学》(第5版)的考生复习专业课,我们根据教材和名校考研真题的命题规律精心讲解教材章节内容。
【辅导内容】(1)精讲教材核心考点。
按照教材篇章结构,讲解教材的重难知识点。
(2)串讲名校考研真题。
通过分析历年考研真题,梳理命题规律和特点,分析名校考研真题出题思路。
考虑到课时的需要以及相关知识点的难易程度,对于一些简单的、考试不易涉及的知识点,本课程不予以讲述或一带而过,故建议在学习本课程之前提前复习一遍教材。
注:本课程的学员可以下载电子版讲义打印学习。
【讲师简介】孙玉奎,中央财经大学统计学博士,圣才教育独家签约讲师,主要讲授《统计学》、《商务经济统计学》等,常年从事统计类考研、统计师考试的辅导工作,并参与编写统计学类考研等辅导书,具有扎实的理论基础和实践经验,能将统计学知识寓于生活学习中的生动事例,通俗易懂。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我一眼就看出 来了,销售量 在 170 ~ 180 之间的天数最 多!
频 数
30 25
(天) 20 15
10
5
140 150 160 170 180 190 200 210 220 230 240
某电脑公司销售量分布的直方图 3 - 42
分组数据—直方图
(直方图与条形图的区别)
1. 条形图是用条形的长度(横置时)表示各类别频数 的多少,其宽度(表示类别)则是固定的 2. 直方图是用面积表示各组频数的多少,矩形的高 度表示每一组的频数或百分比,宽度则表示各组 的组距,其高度与宽度均有意义 3. 直方图的各矩形通常是连续排列,条形图则是分 开排列 4. 条形图主要用于展示分类数据,直方图则主要用 于展示数值型数据
顺序数据的整理与图示
3 - 19
顺序数据的整理
(可计算的统计量)
1. 累积频数(cumulative frequencies):各类别 频数的逐级累加 2. 累积频率(cumulative percentages):各类别 频率(百分比)的逐级累加
3 - 20
顺序数据的频数分布表
3 - 17
分类数据的图示—饼图
(例题分析)
¶ ¶ Â Â 18% ã ´ ¹ » Ô û Ö 12% É Ú É Ö ¿ ¿ ¿ À 30%
Ù Â É Ö °Ê ¿ À 18%
ñ Õ ý ù è Ð È É ±² 22%
» ¬ Æ Æ û Ï Ä ² Í ²Å Ò Á µ ¹ ³ É
3 - 18
300
户 数 200
300
276 168
(户) 100 0 非常 不满意 (b)向下累积 不满意 一般
75
30 满意 非常 满意
非常 不满意 一般 不满意 3 - 34
(a)向上累积
表3-3
乙城市家庭对住房状况评价的频数分布
乙城市
回答类别
向上累积 户数 (户) 百分比 (%) 户数
(户)
向下累积 户数 (户)
绿色
健康饮品
用Excel制作频数分布表
3 - 11
分类数据的图示—条形图
(bar Chart)
1. 用宽度相同的条形的高度或长短来表示 各类别数据的图形 2. 有单式条形图、复式条形图等形式 3. 主要用于反映分类数据的频数分布 4. 绘制时,各类别可以放在纵轴,称为条 形图,也可以放在横轴,称为柱形图 (column chart)
3-7
数据筛选
(data filter)
用Excel进行数据筛选
8名学生的考试成绩数据
3-8
数据排序
(data rank)
1. 按一定顺序将数据排列,以发现一些明 显的特征或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重 新归类或分组等提供依据 3. 在某些场合,排序本身就是分析的目的 之一 4. 排序可借助于计算机完成
300 279 180 102 38
累计频数
百分比
(%)
百分 (%
非常不满意 不满意 一般 满意 非常满意
3 - 35
21 99 78 64 38
7.0 33.0 26.0 21.3 12.7
21 120 198 262 300
7.0 40.0 66.0 87.3 100.0
100 93 60 34 12
不同品牌饮料的帕累托图
品牌
分类数据的图示—饼图
(pie Chart)
1. 也称圆形图,是用圆形及圆内扇形的角度 来表示数值大小的图形 2. 主要用于表示样本或总体中各组成部分所 占的比例,用于研究结构性问题 3. 绘制圆形图时,样本或总体中各部分所占 的百分比用圆内的各个扇形角度表示,这 些扇形的中心角度,按各部分数据百分比 乘以3600确定
IBM
康柏
戴尔
电脑品牌
电脑销售量的对比条形图
3 - 15
分类数据的图示—帕累托图
(pareto chart)
1. 按各类别 数据出现 的频数多 少排序后 绘制的柱 形图 2. 主要用于 展示分类 数据的分 布
3 - 16
16
15
12
11 9 9 6
频数
8
4
0 可口可乐 旭日升冰茶 百事可乐 露露 汇源果汁
3-5
数据筛选与排序
3-6
数据筛选
(data filter)
1. 当数据中的错误不能予以纠正,或者有些 数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选 2. 数据筛选的内容 将某些不符合要求的数据或有明显错误的数
据予以剔除
将符合某种特定条件的数据筛选出来,而不
符合特定条件的数据予以剔除
3-9
数据排序
(方法)
1. 分类数据的排序 字母型数据,排序有升序降序之分,但习惯上
用升序 汉字型数据,可按汉字的首位拼音字母排列, 也可按笔画排序,其中也有笔画多少的升序降 序之分
2. 数值型数据的排序
递增排序:设一组数据为x1,x2,…,xn,递增 排序后可表示为:x(1)<x(2)<…<x(n) 递减排序:可表示为:x(1)>x(2)>…>x(n)
(例题分析)
【例】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意? ”
1.非常不 满意;2.不满意 ;3.一般;4. 满意;5.非常满 3 意。- 21
甲城市家庭对住房状况评价的频数分布 甲城市 回答类别 户数 (户) 24 108 93 45 30 300 百分比 (%) 8 36 31 15 10 100.0 向上累积 户数 (户) 24 132 225 270 300 — 百分比 (%) 8.0 44.0 75.0 90.0 100.0 — 向下累积 户数 (户) 300 276 168 75 30 — 百分比 (%) 100.0 92 56 25 10 —
非常不满意 不满意 一般 满意 非常满意 合计
3 - 22
顺序数据的图示—累计频数分布图
(例题分析)
累 积 300 户 数 200
(户) 100 0 132 400 累 积 300 300 户 数 200 (户) 100 0 满意 非常 满意 非常 不满意 一般 满意 不满意 (b)向下累积 400
三、频数分布
(一)概念:在统计分组的基础上,将总体按 某一标志进行归类排列,并计算各组的单 位数称为频数分布。 (二)构成 1、总体按某标志所分的组 2、各组出现的单位数(频数或次数)
3 - 31
(三)、频数分布编制的步骤 频数分布编制的步骤
确 定 组 数
3 - 32
确 定 组 距
计 算 频 数
编 制 表 格
绘 制 直 方 图
1、确定组数 组数 =1+3.322㏒N 美国斯特杰斯经验公式 2、组距 组距 =全距/组数=(最大值-最小值)/组数 3、计算频数(累计频数或频率) 向上累积:是将各组频数(频率)由变量值低 的向变量值高的组累计。 向下累计:是将各组频数(频率)由变量值高 的向变量值低的组累计。
3 - 10
分类数据整理—频数分布表 (例题分析)
【例】一家市场调查公司 为研究不同品牌饮料的市 场占有率,对随机抽取的 一家超市进行了调查。调 查 员 在 某 天 对 50 名 顾 客 购买饮料的品牌进行了记 录,如果一个顾客购买某 一品牌的饮料,就将这一 饮料的品牌名字记录一次 。右边就是记录的原始数 据
3 - 14
电脑品牌 联想
一季度 256
二季度 468
IBM
康柏 戴尔
285
247 563
397
328 688
分类数据的图示—对比条形图
(例题分析)
800 700 600
销售量
563 468 397 328 256 285 247 688
500 400 300 200 100 0
一季度 二季度
联想
3-3
数据的预处理
1. 数据审核
检查数据中的错误 找出符合条件的数据 升序和降序 寻找数据的基本特征 按需要汇总
2. 数据筛选
3. 数据排序
4. 数据透视
3-4
统计整理的方法
统计整理
根据统计研究的目的,将调查所得的资料进行科 学地分组、汇总和加工计算,从而对总体的数量特征 加以显示,为统计分析准备系统的、条理化的综合资 料的工作过程。
3 - 29
组距分组
(几个概念)
1. 2. 3. 4. 下限(lower limit) :一个组的最小值 上限(upper limit) :一个组的最大值 组距(class width) :上限与下限之差 组中值(class midpoint) :下限与上限之 间的中点值 组中值 =
3 - 30
下限值+上限值 2
数据整理与图表展示
3-1
第 3 章 数据的图表展示
3.1 3.2 3.3 示 3.4 数据的预处理 品质数据(定性数据)的整理与显示 数值型数据(定量数据)的整理与显
合理使用图表
3-2
学习目标
1. 2. 3. 4. 5. 了解数据预处理的内容和目的 掌握分类和顺序数据的整理与显示方法 掌握数值型数据的整理与显示方法 制作作频数分布表和图形 合理使用图表
3 - 33
累计次数分布图。 统计学家洛伦茨利用累计百分数曲线作为验定社会收 入分配平均程度的方法。这种曲线就称为洛伦茨曲 线,在现代西方经济学著作中,经常使用这种曲线 来描述一国的收入分配平均程度。