定性数据的图表描述分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定性数据的图表描述分析
定性数据的图表描述分析
内容摘要:数据的整理是为下一步对数据描述和分析打好基础。
实际上在企业管理中有很多问题和现象无法通过数值直接表示出来,因此人们经常使用定性数据来反映对应的定类或定序变量的值。
下面我们介绍如何用图表对定类和定序变量的定性数据值进行整理和描述。
本文通过对单变量和多变量定型数据的图形描述来实现对定性数据图表的全面分析。
首先,我们简单介绍一下定性数据的整理;其次我们从单变量定性数据的图标描述着眼,具体可分为条形图、饼图、累积频数分布表和帕累托图。
最后我们从多变量定性数据的图形描述着眼,具体可分为环形图、交叉表和多重条形图。
这就是本文的全部内容介绍。
关键词:定性数据;单变量;多变量;图表描述
Content abstract: the data of the data for the next step is described and analyzed. Actually has a lot of problems and phenomena in the enterprise management can't directly by numerical representation, so people often use qualitative data to reflect the corresponding nominal or ordinal variable's value. We introduce how to use the chart below for nominal and ordinal variables in order and description about the qualitative data values. Based on univariate and multivariate finalize the design of the data graph description to achieve comprehensive analysis of the qualitative data chart. First, we make a brief introduction of qualitative data sorting; Secondly we from single variable on the basis of the icon description of qualitative data, the concrete can be divided into bar chart, pie chart, cumulative frequency distribution table and pareto chart. We finally on the basis of the graph description of qualitative data from multiple variables, concrete can be divided into circular diagram, cross table and
multiple bar chart. This is the entire contents of the introduced in this paper.
Keywords: qualitative data; Single variable; Many variables; The chart description
目录
一、定性数据的图表描述 ..................................... - 1 -
二、单变量定型数据的图形描述 ............................... - 1 -
(一)条形图 ............................................ - 1 -
1.组数 ............................................... - 1 -
2.组宽度 ............................................. - 2 -
3.组限 ............................................... - 2 -
(二)饼图 .............................................. - 2 - (三)累积频数分布图 .................................... - 2 -
1.排列图法 ........................................... - 2 -
2.因果分析图法 ....................................... - 3 -
3.事故树分析法 ....................................... - 3 -
4.事件树分析法 ....................................... - 3 -
5.统计图表分析法 ..................................... - 3 -
(四)帕累托图 .......................................... - 3 - 三、多变量定型数据的图形描述 ............................... - 4 -
(一)环形图............................................ - 4 - (二)交叉表............................................ - 4 - (三)多重条形图 ........................................ - 5 - 参考文献................................................... -
5 -
一、定性数据的图表描述
数据的整理是为下一步对数据描述和分析打好基础。
对于定性数据而言,它是用来描述事物的分类。
实际上在企业管理中有很多问题和现象无法通过数值直接表示出来,因此人们经常使用定性数据来反映对应的定类或定序变量的值。
定性数据的图表描述具体可分为单变量定型数据的图形描述和多变量定型数据的图形描述。
下面我们就对
这两者进行简单介绍。
二、单变量定型数据的图形描述
单变量定型数据的图形描述具体可分为条形图、饼图、累积频数分布表和帕累托图。
条形图和饼图通过反映频数分布表的内容,来描述定性数据,是使用最为广泛的两种图形方法,说明了落入每一个定性类别中的观测值是多少。
累积频数分布图通过反映累积频数分布表的内容来描述定序数据。
帕累托图的形式和累积频数分布图类似,但不像后者只在针对定序数据进行描述时才有意义,帕累托图能对所有定性数据进行描述,以反映那些类别对问题的研究更有价值。
①(一)条形图
当我们所寻求的关于定性变量的信息是落入每一类中的观察数值,或是落入每一类中的观察数值在观察总数中所占的比率时,可以用条形图来描述。
条形图是用宽度相同的条形表示数据变动的图形,它可以横排或竖排,竖排时也可以称为柱形图。
在表示各类定性数据的分布时,用条形图的高度或长度表示各类数据的频数或频率。
描绘条形图的要素有3个:组数、组宽度、组限。
1.组数
把数据分成几组,指导性的经验是将数据分成5~10组。
2.组宽度
通常来说,每组的宽度是一致的。
组数和组宽度的选择就不是独立决定的,一个经验标准是:近似组宽度=(最大值-最小值)/组数,然后根据四舍五入确定初步的近似组宽度,之后根据数据的状况进行调整。
3.组限
分为组下限(进入该组的最小可能数据)和组上限(进入该组的最大可能数据),并且一个数据只能在一个组限内。
绘画条形图时,不同组之间是有空隙的;而绘画直方图时,不同组之间是没有空隙的。
(二)饼图
饼图也可以称为圆形图,是以圆形以及园内扇形的面积来描述数值大小的图形。
饼图通常用来描述落在各个类中的测量数值分别在总
数中所占的比率,对于研究结构性问题相当有用。
在绘制饼图时,总体中各部分所占的比率用圆内各个扇形面积描述,其中心角度按各个扇形百分比占360°的相应比例来确定。
使用要求仅有一个要绘制的数据系列、要绘制的数值没有负值、要绘制的数值几乎没有零值、类别数目无限制、各类别分别代表整个饼图的一部分、各个部分需要标注百分比。
②
(三)累积频数分布图
累计频数可以是向上累计频数,也可以是向下累计频数。
向上累计频数分布是先列出各组的上限,然后由标志值低的组向标志值高的组依次累计频数。
向下累计频数分布是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计频数。
根据累积频数或累积频率,可以绘制出累积频数或累积频率分布图。
累积频数分布图的方法包括:1.排列图法
排列图全称为主次因素排列图,可用于确定系统安全的关键因素,以便明确主攻方向和工作重点所在。
排列图有两个纵坐标,一个横坐标,几个直方图和一条曲线组成。
左边纵坐标表示频数,右边纵坐标表示累积频率(0~100%)。
横坐标表示事故原因或事故
分类,一般按影响因素的主次从左向右排列。
直方图的高低表示某个因素影响的大小,曲线表示各因素影响大小的累计百分数。
2.因果分析图法
交通事故的发生,常常是由于多种复杂因素影响所致,可通过因果分析图将引发事故的重要因素分层(枝)加以分析。
在图上将原因和结果的关系用箭头表示,分层(枝)的多少,取决于系统安全分析的深度和广度要求。
因果分析的结果可供编制安全检查表和事故树用。
3.事故树分析法
事故树分析亦称事故预测技术,是将导致事故发生的所有基本原因事件(基本事件)找出,把它们通过逻辑推理方式用逻辑门连接起来,运用定性分析或定量分析的方法得到导致事故发生的基本事件的最小组合及预防事故发生的各种有效方案,这对事故的预防工作提供了较为全面、可靠的依据。
4.事件树分析法
事件树分析是根据实际工作需要,选出希望或不希望的事件作为开始事件,按照逻辑推理方式,推论其发展结果。
每一事件的发展趋势只有两种可能性,即失败或成功。
把每一个结果都看作新的起始事件,不断推论下去,直到找出事件发展的所有可能结果。
5.统计图表分析法
运用科学的统计分析方法,对大量与交通事故相关的资料和数据进行加工、整理、综合、分析,进而结合交通安全的规律,为防止交通事故的发生指明正确的方向。
常用方法包括:比重图、趋势图、控制图、主次图和直方图、线性回归分析法。
(四)帕累托图
帕累托图又叫排列图、主次图,是按照发生频率大小顺序绘制的直方图,表示有多少结果是由已确认类型或范畴的原因所造成。
它是将出现的质量问题和质量改进项目按照重要程度依次排列而采用的一种图表。
可以用来分析质量问题,确定产生质量问题的主要因素。
按等级排序的目的是指导如何采取纠正措施:项目班子应首先采取措施纠正造成最
多数量缺陷的问题。
从概念上说,帕累托图与帕累托法则一脉相承,该法则认为相对来说数量较少的原因往往造成绝大多数的问题或缺陷。
传统的帕累托图通过简单易懂的条形图格式来进行缺陷代码的显示和原因分析。
鉴于它的简便性,帕累托图一直都没有被作为一个高效的SPC控制图分析工具来使用。
但随着SPC软件技术的不断扩展,现在也出现了多级帕累托图。
可以想象一下,用一张帕累托图来显示缺陷代码,我们同时还可以把这些代码按照班次、客户代码、员工、产品批次,零件或者任何与数据关联的描述符来进行分类表示,该是一件多么便捷的事情。
当定类或定序变量的分类数目较多时,用帕累托图要比条形图和饼图更能直观地显示信息。
帕累托图根据意大利经济学家威尔佛多·帕累托命名,他认为20%的潜在因素是引起80%的问题所在。
③通过帕
累托图,可以从众多的分类中,找到那些比较重要的分类。
该图被广泛应用于过程分析和质量分析,它可以提供直接证据,表明首先应该改进哪些地方。
三、多变量定型数据的图形描述
在管理实践中,不同现象之间总有联系,不可能是独立的。
因此,要研究多个定性变量之间定性数据的图形表示,对进行深入的统计分析有重要的基础意义。
描述多个定性变量之间关系的方法有很多,本文主要从环形图、交叉表和多重条形图入手。
(一)环形图
环形图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形。
环形图能显示具有相同功能相同分类且问题可比的多个样本或总体中各类别所占的比例,从而利于比较研究。
但只能在类别值为定序数据时这种比较才有意义,因此环形图适用于对多个样本或总体中定序数据的描述和比较。
(二)交叉表
使用交叉表查询,显示源于表中某个字段的汇总值,并将它们分组,其中一组列在数据表的左侧,另一组列在数据表的上部。
行和列的交叉处可以对数据进行多种汇总计算,如:求和、平均值、记数、最大值、最小值等。
交叉表是用来描述同时产生的两个
定性变量的数据的图形方法。
交叉表的使用价值在于它可以使我们看到两个变量之间的关系,因此它可以广泛应用于对两个变量之间关系的检测,实践中许多统计报告都包含了大量的交叉表。
在绘制交叉表时,将哪个变量置于表的左边或右边,主要视研究方便而定。
(三)多重条形图
多重条形图也是描述两个定类或定序变量间关系的主要图形方式。
但现实中对此应用的比较少。
结束语:本文介绍了如何用图表方法整理统计中的数据,在定性数据中可以利用类似定量数据频数分布表的形式对其进行整理,并利用条形图和饼图等对定性数据的频数分布进行图示描述。
当变量的分类数目较多时,可以利用帕累托图进行描述,它比条形图和饼图更能
直观地显示信息。
若需要处理两个或多个定类或定序变量之间的关系,则可以用环形图、交叉表、多重条形图等形式。
其中交叉表和多重条形图同样适用于描述两个变量都是数字变量或者一个是定类或定序变量,另一个是数字变量之间的关系。
参考文献
[1]李金林、赵中秋.管理统计学[M].北京:清华大学出版社,2006(10).
[2]马庆国.管理统计[M].北京:科学出版社,2002.
[3]马军海.管理统计基础[M].天津:天津大学出版社,2005(2).
[4]贾俊平.统计学[M].北京:清华大学出版社,2004.。