BI商业智能系统
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
BI商业智能系统
随着企业各种信息系统的建设和完善,企业所拥有的数据越来越多。决策者面对的问题已经不再是缺少信息,而是如何得到正确的信息以帮助制定决策。典型的公司拥有数十乃至上百个应用,但是却难于从中提取、综合、使用这些系统的数据,继而从数据中提取有用的信息,发掘并提升数据的价值。
商业智能(Business Intelligence,简称BI)提供了提取数据、处理加工、信息访问的技术手段。经过多年发展,其运用范围逐渐由支撑特定业务过程的战术性决策发展到在企业范围内系统化地创造价值。因此,越来越多的企业已将其视为战略性的企业应用。
商业智能通过将分散在企业各系统中的数据进行整合,使得繁琐的信息获取过程变得简便易行。任何用户都能够容易的运
用这些技术进行决策,业务执行、业务管理、企业管理各个层次上的用户都能够使用不同的工具和技术做出明智的决策,全方位的提高企业的竞争力。
信息技术在企业中的地位正在由业务支撑工具逐步走向中心性地位,在很大程度上影响着企业如何开展业务和创造新的价值。企业要求IT系统不仅要能够支撑特定业务的执行,而且还要能够创造出新的价值。
由于IT在业务中逐步走向中心地位,对这些信息的访问也需要扩展到原来创建系统所服务的对象之外。系统之间越来越需要广泛的互相连接,以及扩展连接到客户和合作伙伴的系统。
与此同时,由于系统是业务的载体,所以必须要能够跟随业务变化而变化,成为快速革新的助推器而不是障碍。作为企业的关键资产,IT不仅被期望是一个运行良好的成本中心,而且是企业成长和扩张的贡献力量。
业务对IT要求的多种重要能力:
广泛互联的能力:连接客户、合作伙伴,赋予员工新的能力。通过将内部员工、合作伙伴和客户的数据进行整合,并进行加工和提炼后再提供出来供内部员工、合作伙伴和客户使用,商业智能系统提升了三者业务上互相联接的能力
适应变化的能力:随着业务的发展而变化,促进而非阻碍业务发展。
创造价值的能力:在业务的各个不同层面上创造价值。商业
智能系统为企业各个不同层面的人提供合适的工具和信息,使得获取准确信息和做出明智决策的能力不仅仅局限于决策层,而是所有人员都能够在各自的层面上借助BI系统提供能力,从而全方位的增强企业决策能力,全面创造价值。
这些能力的重要价值在于增强了企业敏捷性,能够更主动地适应企业内部和外部的变化。
商业智能的核心议题始终围绕在为员工提供正确信息的周围,使他们能够在合适的时间完成一个特殊的目标。使这些承诺成为真实的需求,成为全面的、安全的、与操作系统集成的、全天候的商业智能解决方案。
下图为商业智能发展缩影图:
一、商业智能的技术架构
商业智能是由数据仓库、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的的技术及其应用。商业智能是数据库技术、OLAP技术、数据采集和迁移技术、网络技术、GUI技术、查询报表技术、统计学、人工智能、知识发现技术等理论和技术的综合运用,其核心内容是从许多来自企业不同的业务处理系统的数据中,提取出有用的数据,进行清理以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程,整合到一个企业级的数据仓库里,从而得到企业信息的一个全局视图,利用合适的查询和分析工具、数据挖掘工具等对数据仓库里的数据进行分析和处理,形成信息,把信息提炼出辅助决策的知识,最后把知识呈现给管理者,为管理者的决策过程提供支持。
二、商业智能的体系结构
商业智能的整个系统被划分为4个层面,根据数据的处理和应用过程分成7个环节。从数据源经过抽取(Extraction)、转换(Transformation)和装载(Load)过程加载到中央数据仓库,再从数据仓库经过分类加工放到数据集市(Data Market,DM),或者将数据集市中的数据进一步存放到多维数据库
(Multi-dimension Database,MDD),这都属于数据组织的问题,从中间层到终端用户或从多维数据库到终端用户可将其划归为前端应用实现的问题。而贯穿整个体系数据处理环节的,是系统的流程调度控制和元数据管理,其结构如图1所示。
图1 商业智能体系结构
下面对商业智能的完整的体系结构作如下解释:
(1)数据源:数据源可以是企业日常运作积累下来的各类的业务数据,也可以是外部的数据。数据仓库的体系结构必须能处理这种多样性带来的种种问题,并解决由于数据远程迁移所带
来的完整性和安全性的问题。
(2)数据抽取、转换和装载(ETL):从源数据抽取数据、进行一定的变换、装载到数据仓库。需要进行数据处理,包括:简单变换——一次只针对一个字段,而不是考虑相关字段的值;清洁和刷洗——为了保证前后一致地格式化和使用某一字段或相关的字段群,检查字段和字段组中的实际内容而不仅是存储格式;集成——要把从全然不同来源的数据结合在一起,真正的困难在于将其集成为一个紧密结合的数据模型;聚集和概括——按照一个和几个业务维将相近的数值加在一起,聚集是将不同业务元素加在一起成为一个公共总数,在数据仓库中它们是以相同的方式进行的。
(3)数据仓库:数据仓库的一个目的就是把企业的信息访问基础从一种非结构化的或发展中的环境改变成一种结构化或规划良好的环境。
(4)数据集市:数据集市是为部门范围级别的决策支持应用而设计的,其数据模型设计和数据组织上更多地服务于一个部门的信息需求。
(5)操作型数据存储区:操作型数据存储区(Operational Data Store,ODS)是业务系统和DW之间更偏向业务系统的数据存储区域。
(6)元数据:元数据(Meta-data)通常定义为“关于数据的数据”,是描述和管理数据仓库自身内容对象、用来表示数
据项的意义及其在系统各组成部件之间的关系的数据。数据仓库所提供的“统一的企业级的信息视图”能力,主要就是靠元数据来体现。实现元数据管理的主要目标就是使企业内部元数据的定义标准化。数据仓库的维护工具可以根据元数据完成数据的抽取、清洗和转换,并做适度的汇总,数据仓库的元数据包括:
①数据资源:包括数据源模型,描述源数据属性及业务含义,源数据到数据仓库的映射关系;
②数据组织:数据仓库、数据集市表的结构、属性及业务含义,多维结构等;
③数据应用:查询与报表输出格式描述、OLAP、数据挖掘等的数据模型的信息展现、商业术语;
④数据管理:数据仓库操作过程以及数据仓库操作结果的模型,包括描述数据抽取和清洗规则,数据加载控制,临时表结构、用途和使用情况,数据汇总控制。
(7)前端应用:数据仓库的前端应用是建立数据仓库的目的,即根据用户的特点提供不同的界面。最终用户对数据仓库的访问方式包括:即席查询、报表、联机分析处理(OLAP)、数据挖掘以及领导信息系统(EIS)等。
(8)数据挖掘(Data Mining,DM):数据挖掘是采用数学的、统计的、人工智能和神经网络等领域的科学方法,从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势并用这些知识和规则建立用于决策支持的模型,为商业