数据分析过程中各个步骤中使用的工具

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据分析过程中各个步骤使用的工具

数据分析也好,也好,也好、商业智能也好,都需要在学习的时候掌握各种分析手段和技能,特别是要掌握分析软件工具!学习数据分析,一般是先学软件开始,再去应用,再学会理论和原理!没有软件的方法就不去学了,因为学了也不能做,除非你自己会编程序。

下图是一个顶级的分析工具场,

依次从X和Y轴看:

第一维度:数据存储层——>数据报表层——>数据分析层——>数据展现层

第二维度:用户级——>部门级——>企业级——>BI级

我结合上图和其他资料统计了我们可能用到的软件信息。具体的软件效果还需要进一步研究分析和实践。

1第一步:设计方案

可以考虑的软件工具:mind manager。

Mind manager(又叫),是表达发射性思维的有效的图形思维工具,它简单却又极其有效,是一种革命性的思维工具。思维导图运用图文并重的技巧,把各级主题的关系用相互隶属与相关的层级图表现出来,把主题关键词与图像、颜色等建立记忆链接。思维导图充分运用左右脑的机能,利用记忆、阅读、思维的规律,协助人们在与、与想象之间平衡发展,从而开启人类的无限潜能。思维导图因此具有人类思维的强大功能。

是一种将思考具体化的方法。我们知道思考是人类大脑的自然思考方式,每一种进入大脑的资料,不论是感觉、或是想法——包括、、符码、香气、食物、线条、颜色、意象、、音符等,都可以成为一个中心,并由此中心向外发散出成千上万的关节点,每一个关节点代表与中心的一个连结,而每一个连结又可以成为另一个中心主题,再向外发散出成千上万的关节点,呈现出放射性立体结构,而这些关节的连结可以视为您的,也就是您的个人。

2第二步:数据采集

可以考虑的工具软件:word、excel、access、oracle、mysql。2.1Word、Excel和Access等

有关office软件的内容,我们就不介绍了。

2.2Oracle Database

又名Oracle RDBMS,或简称Oracle。是的一款。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类

大、中、小、微机环境。它是一种高效率、可靠性好的适应高吞吐量的数据库解决方案。

介绍:

2.3MySQL

(发音为"my ess cue el",不是"my sequel")是一种的关系型系统(RDBMS),MySQL使用最常用的数据库管理语言--(SQL)进行数据库管理。这个也不做过多介绍。

3第三步:数据处理

可以考虑的工具软件:Epidata、excel、SPSS、ETL。

3.1EpiData工具

是一个既可以用于创建数据结构文档,也可以用于数据定量分析一组应用工具的集合。EpiData协会于1999年在丹麦成立。EpiData采用Pascal开发。在允许的情况下,尽可能地使用开放标准(如HTML)。

介绍:

下载地址:

3.2工具

有关Office软件的信息不做介绍

3.3SPSS工具

(Statistical Product and Service Solutions),“统计产品与服务解决方案”。最初软件全称为“”(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。

百度百科介绍:下载地址:

备注:安装需要注册码

3.4ETL模式

是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在,但其对象并不限于。

ETL是构建的重要一环,用户从抽取出所需的数据,经过,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。

目前,ETL工具的典型代表有:Informatica、Datastage、OWB、微软DTS、Beeload、Kettle……

开源的工具有eclipse的etl插件。cloveretl.

数据集成:快速实现ETL

百度百科介绍:

相关软件下载:FineBI工具

4第四步:数据分析

可以考虑的工具软件:SPSS、SAS、Matlab、Eviews、Stata、Excel、Weka、RapidMiner。

4.1SPSS

是一个综合类数据分析处理软件,前面介绍了,我们在这一部分就不再介绍。

(全称STATISTICAL ANALYSIS SYSTEM,简称SAS)是全球最大的之一,是由美国NORTH CAROLINA州立大学1966年开发的统计分析软件。

百度百科介绍:

下载地址:

备注:安装需要虚拟光盘、sid等信息。也可以购买sid。

4.3Matlab

每个人都很了解,我就不做太多介绍了。

4.4Eviews

是Econometrics Views的缩写,直译为计量经济学观察,通常称为计量经济学。它的本意是对与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。另外Eviews也是QMS公司研制的在Windows下专门从事数据分析、回归分析和预测的工具。使用Eviews可以迅速地从数据中寻找出统计关系,并用得到的关系去预测数据的未来值。

Eviews的应用范围包括:科学实验数据分析与评估、金融分析、宏观经济预测、仿真、销售预测和成本分析等。

介绍:

下载地址:

相关文档
最新文档