数据分析处理技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析处理技术
主讲教师简介:郑军,女,辽宁税专第一教学部教师,副教授。
导论
一、什么是统计学
1、统计是处理数据的一门科学。
2、统计学是关于数据的科学,它所提供的是一套有关数据收
集、处理、分析、解释并从数据中得出结论的方法。
3、数据分析所用的方法可分为描述统计方法和推断统计方
法。
二、理解统计对每个人都是必要的。
第一部分数据的整理与图示
一、数据的类型
按照采用的计量尺度不同,可以将数据分为分类数据、顺序数据和数值型数据。
1、分类数据:是只能归于某一类别的非数字型数据,它是对
事物进行分类的结果,数据表现为类别,用文字来表述。如:企业按行业分类等。为便于统计处理,对于分类数据可以用数字代码表示各类别,如用1表示制造业,2表示建筑业等。
2、顺序数据:是只能归于某一有序类别的非数字型数据。顺序数据虽然也有类别,但这些类别是有序的。如将产品分为一等品、二等品、三等品、次品等。同样,对顺序数据也可以用数字代码来表示。
3、数值型数据:是按照数字尺度测量的观测值,其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。
品质数据(分类数据和顺序数据、定性数据)
数量数据(数值型数据、定量数据)
4、区分数据的类型十分重要。因为对不同类型的数据,需要采用不同的方法来处理和分析。
二、数据的搜集
1、数据的来源(数据的间接来源、直接来源)。
2、调查数据(概率抽样、非概率抽样)。
概率抽样(即随机抽样):常用的方式有简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样。
非概率抽样:常用的方式有方便抽样、判断抽样(重点抽样、典型抽样)、自愿样本、滚雪球抽样
3、搜集数据的基本方法(自填式、面访式、电话式、)。
4、数据的误差(抽样误差、非抽样误差)。
抽样误差(由于抽样的随机性引起的样本结果与总体真值间的误差)
非抽样误差(回答误差、调查员误差等)
★三、数据的图表展示
(一)、数据的预处理(审核、筛选、排序等)。
(二)、分类汇总与数据透视表(数据的全新整理分析方法)(三)、品质数据的整理与展示。
1、分类数据的整理与图示(频数与频数分布)
2、顺序数据的整理与图示(累计频数和累计频率、环形图)(四)、数值型数据的整理与图示(数据分组、直方图)。(五)合理使用图表
(一)、数据的预处理:是在对数据分类或分组前所做的必要处理。内容包括数据的审核、筛选、排序等。
1、数据审核:对原始数据审核其完整性和准确性;
对二手数据审核其适用性和时效性。
2、数据筛选:根据需要找出符合特定条件的某类数据。
3、数据排序:按一定顺序将数据排列,以便通过浏览数据
发现明显的特征或趋势等。
(二)、数据透视表(数据的全新整理分析方法)
为了从复杂的数据中提取有用的信息,可以利用Excel 提供的【数据透视表】工具。利用数据透视表,可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合要求的交叉表(列联表)。在利用数据透视表时,数据源表中的首行必须有列标题。
(三)、品质数据的整理与展示
数据经过预处理后,可根据需要进一步做分类或分组。对品质数据主要做分类整理,对数值型数据主要是做分组整理。
1、分类数据的整理与图示(频数与频数分布)
分类数据本身即是对事物的一种分类。在整理时首先列出所分的类别,然后计算出每一类别的频数、比例等,即可形成一张频数分布表,最后根据需要选择适当图形进行展示,以便对数据及其特征有一个初步了解。
分类数据的图示(条形图、帕累托图、饼图等)
2、顺序数据的整理与图示(累计频数和累计频率、环形图)
(四)、数值型数据的整理与图示(数据分组、直方图)
第二部分数据的概括性度量
(集中趋势、离散程度、偏态与峰态的度量)
一、总量指标分析
二、相对指标分析
★三、集中趋势度量
★四、离散程度度量
★五、偏态与峰态度量
一、税收总量指标分析
(一)、税收总量指标的分析要求
对总量指标的分析和描述应简洁、明了、突出其主要数量特征,给人以深刻印象。
例:“十五”期间,我市税收从2000年的561,484万元增加到2005年的1,203,402万元,年均增长16.47%,为我市经济和社会的发展提供了有力的财力保障。
(二)、税收总量指标的图表描述
总量指标在Excel 中的图表具体可描述为折线图、条形图(横 置或纵置)等。(条形图纵置时也称为柱形图)
二、税收相对指标分析
在税收数据分析中,方法最简便、应用最广泛的就是相对指标的计算与分析,因其概念比较清晰,这里只对其计算方法作一介绍。
相对指标是两个有联系的指标对比的比值,反映事物的数量特征和数量关系。
随着税收分析目的的不同,两个相互联系的指标数值对比,可以采取不同的比较标准(即对比的基础),而对比所起的作用也有所不同,从而形成不同的相对指标。归纳起来有两类:一是同一总体内部之比,二是两个总体之间对比。
(一)、属于同一总体内部之比的相对指标
属于同一总体内部之比的相对指标有:计划完成程度相对指标、结构相对指标、比例相对指标、动态相对指标四种。
1、计划完成程度相对指标(分析计划完成情况及计划进度执行情况等)。 计划完成程度相对指标=计划数实际完成数
〓100%
2、结构相对指标。例:分税种结构分析。 结构相对指标=总体总量总体部分数值
〓100%