商业智能(BI)选型手册(简版)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
商业智能(BI)选型手册(简版)
1、前言
互联网时代企业数据呈现爆发式增长,全面考验着企业的数据处理和分析能力。面对大容量、多样性、高增长的数据很多企业往往无所适从,除了耗费大量管理和存储成本外并没有给企业带来真正的价值,大量的数据堆积给企业带来了巨大的挑战。然而数据已经渗透到了企业内外各个层面,因此想要从庞大的企业数据中“掘金”就必须有信息化应用强有力的支撑。
近年来大数据、云计算、移动应用、社交等新兴技术风靡全球,技术的创新以及环境的成熟给予了企业在信息化应用上更多元化的选择。随着中国制造企业信息化应用的不断深入,在寻求业务管理精益的同时,信息化对于决策的支撑、对于市场前沿的洞察力成为了越来越多企业深化应用的方向。根据Gartner数据,2013年全球商务智能(Business Intelligence, BI)与分析软件(包括BI平台,企业绩效管理CPM套件,分析应用和先进的分析方法)营收总计达到144亿美元,与2012年的133亿美元相比,增长8%。2013年中国区商务智能与分析软件总营收达到11亿7千580万元,较2012年增长13.5%。2014年以来,商务智能进入了一个基础性变革阶段,根据Gartner 2015年BI魔力象限研究报告显示,商业智能分析市场正处于全面过渡时期。大多数公司都在选择新一代数据挖掘工具或者交互式分析平台。尽管市场增幅放缓,但是多年来企业需求一直维持稳定。
目前中国BI市场仍然存在很多不明朗的因素,技术层面也有很多混沌之处,细分市场的发展趋势也存在很大的差异,随着大数据、移动等应用的普及,以及海量的数据都加速了BI的变革。因此,企业在选择BI产品的时候亟需梳理出清晰的思路,找到满足需求的合适产品。为此,e-works本着客观、中立、公正的原则,发布商业智能(BI)选型手册,分析BI软件选型的要点及步骤,介绍主流BI软件的核心功能和产品特点,为广大企业进行BI软件选型提供指南。
2、商业智能(BI)概述
2.1 BI的内涵
来自维基百科的解释是:“商业智能,又称商业智慧或商务智能,指用现代数据仓库技术、在线分析技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。” BI并不是近年才有的新兴名词,早在1996年Gartner Group的霍华德·雷斯内尔(Howard Dresner)就已经提出,并定义其为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及应用。
在了解概念的同时必须正确理解商业智能的内涵,e-works认为,BI的内涵在于回顾过去、总结现在和展望未来。即首先要告诉企业管理者已经发生了什么事情?结果如何?其次会告诉管理者产生这些结果的具体原因是什么,该采用何种策略解决?再则是告诉管理者企业在可预见的将来会发生什么?于此同时还能实时的告诉管理者企业正在发生什么事情,完成的进度情况如何,是否实现了既定目标,是否需要及时调整策略?只有明确了这些问题才能从根本上理解BI。
2.2 BI的价值
经过多年信息化的推进,企业内部积累了各种来自不同业务部门的数据。这些庞杂的数据给企业带来了很大的困扰:
企业数据爆发式井喷,数据存储的硬件成本造成IT负累;
数据存储在不同的应用系统中,孤岛问题严重;
异构系统加大了数据获取、管理、分析的难度;
企业数据类型复杂多样,多为非结构化数据,管理和挖掘的难度大;
传统老旧的数据展现形式无法适应现代化企业管理要求;
企业战略性调整缺乏有力的数据支持。
尽管不断增加的数据给企业的管理造成了不小的困扰,然而最核心的问题则是在于这些错综复杂的数据还不都能称之为信息,不能为企业所用。身处激烈竞争环境的企业面对海量的数据以及日益增加的数据管理成本,更希望能够发现数据的商业价值。BI软件的价值在于其通过技术手段从企业各个应用系统的庞杂数据中提取出有用的数据并进行科学的整理,以保证数据的正确性和一致性,并同过透过抽取(Extraction)、转换(Transformation)和装载(Load),的过程,合并到一个部门数据集市或企业的数据仓库中,在此基础上利用合适的BI工具, 针对不同需求进行多维数据分析和挖掘,并通过可视化手段将结果定期或实施展示给相关人员,最终为企业决策提供支持,达到协助企业创收增利、规避风险、提升效能和竞争力的目的。
2.3 BI的关键技术及功能
BI关键技术
商业智能的关键技术主要包括:数据仓库(数据集市)、数据挖掘、ETL(数据的提取、转换与加载)、联机分析处理 (OLAP)、数据可视化技术等。
数据仓库(数据集市)
数据仓库(Data Warehouse)之父比尔·恩门(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立数据仓库》)一书中所提出的定义:“数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。”数据仓库技术是为了有效的将数据集成到统一的环境中以提供决策型数据访问,因此在BI的实施过程中,大量来自企业各种管理系统的数据需要搜集和整理,需要数据仓库技术的支持。
面向主题。数据仓库中的数据是按照一定的主题或者说决策支持的需求点进行组织的,一个主题通常与多个操作型信息系统相关;
数据集成。数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出来,进行加工与集成,统一与综合之后进入数据仓库;
相对稳定。数据仓库是不可更新的且随时间而变化的,稳定的数据以只读格式保存,且不随时间改变。
数据挖掘
数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的过程。作为一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
ETL
透过抽取(Extraction)、转换(Transformation)和装载(Load)即ETL。作为BI/DW(Business Intelligence)的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。在企业实施BI的过程中,ETL面临的最大挑战是接收数据时其源数据的异构性和低质量。
联机分析处理 (OLAP)
联机分析处理(OLAP)系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。
数据可视化技术