商务智能技术基础(ppt 78页)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
进行OLAP分析的前提是已有建好的数据仓库,之后即可利用OLAP 复杂的查询 能力、数据对比、数据抽取和报表来进行探测式数据分析了。称其为探测式数据分 析,是因为用户在选择相关数据后,通过切片(按二维选择数据)、切块(按三维选 择数据)、上钻(选择更高一级的数据详细信息以及数据视图)、下钻(展开同一级数 据的详细信息)、旋转(获得不同视图的数据) 等操作,可以在不同的粒度上对数据 进行分析尝试,得到不同形式的知识和结果。联机分析处理研究主要集中在ROLAP( 基于关系数据库的OLAP) 的查询优化技术和MOLAP(基于多维数据组织的OLAP) 中减 少存储空间和提高系统性能的方法等。
OLAP 与数据挖掘的区别和联系是:OLAP 侧重于与用户的交互、快速的响应速度 及提供数据的多维视图,而数据挖掘则注重自动发现隐藏在数据中的模式和有用信 息,尽管允许用户指导这一过程。OLAP 的分析结果可以给数据挖掘提供分析信息 作为挖掘的依据,数据挖掘可以拓展OLAP 分析的深度,可以发现OLAP 所不能发现 的更为复杂、细致的信息。数据挖掘的研究重点则偏向数据挖掘算法以及数据挖掘 技术在新的数据类型、应用环境中使用时所出现新问题的解决上, 如对各种非结构 化数据的挖掘、数据挖掘语言的标准化以及可视化数据挖掘等。
OLAP操作语言:通过扩展数据库的操作语言SQL,得到MSQL(Multiple SQL)。
二、商务智能技术简介
• 3. DM(数据挖掘)
数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则) 的过程。
与OLAP 的探测式数据分析不同,数据挖掘是按照预定的规则对数据库和 数据仓库中已有的数据进行信息开采、挖掘和分析,从中识别和抽取隐含的模式 和有趣知识,为决策者提供决策依据。数据挖掘的任务是从数据中发现模式。模 式有很多种,按功能可分为两大类:预测型( Predictive)模式和描述型 (Descriptive)模式。
二、商务智能技术简介
• 2. OLAP(联机分析处理) 联机分析处理(OLAP) 又称多维分析,它对数据仓库中的数据进行多维分析和展
现,是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来 的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交 互地存取,从而获得对数据更深入了解的一类软件技术。它的技术核心是“维”这 个概念,因此OLAP也可以说是多维数据分析工具的集合。
第二章 商务智能技术基础
内容提要
• 2.1 商务智能系统组成及技术基础 • 2.2 数据仓库技术 • 2.3 联机分析技术 • 2.4 数据挖掘技术 • 2.5 数据展现技术
2.1 商务智能系统架构
商务智能系统架构
外部 数据 源
业务系 统数据 源
抽取 பைடு நூலகம்换 装载
数据源 数据预处理
元元 数数 据据
• 数据展现则主要保障系统分析结果的可视化。
元数据
外部数 据源
业务处 理系统 数据源
数据仓库
数据分析平台 (数据挖掘、报表展现和 OLAP工具)
商务智能应用
商务智能框架图
二、商务智能技术简介
• 1. DW(数据仓库)
必要性: 实施BI首先要从企业内部和企业外部不同的数
据源,如客户关系管理(CRM)、供应链管理(SCM)、企业资源 规划(ERP)系统以及其他应用系统等搜集有用的数据,进行转 换和合并,因此需要数据仓库和数据集市技术的支持。
• 在事务型处理环境中,数据库要求能支持日常事务 中的大量事务,用户对数据的存取操作频率高而每 次操作处理的时间短。
2.2 数据仓库 (Data Warehouse)
2.2.1 从数据库到数据仓库 2.2.2 数据仓库的定义和特点 2.2.3 数据仓库体系结构 2.2.4 数据仓库的设计与实施建立 2.2.5 数据仓库系统的评价标准
2.2.1 从数据库到数据仓库
事务型处理
• 事务型处理:即操作型处理,是指对数据库的联机 操作处理OLTP。事务型处理是用来协助企业对响 应事件或事务的日常商务活动进行处理。它是事件 驱动、面向应用的,通常是对一个或一组记录的增、 删、改以及简单查询等(大量、简单、重复和例行 性)。
• 数据预处理是整合企业原始数据的第一步,包括 数据抽取、转换和装载三个过程;
• 数据仓库则是处理海量数据的基础;
• 数据分析是体现系统智能的关键,一般采用OLAP 和DM两大技术。OLAP不仅进行数据汇总/聚集, 同时还提供切片、切块、下钻、上卷和旋转等数 据分析功能,用户可以方便地对海量数据进行多 维分析。数据挖掘则是挖掘数据背后隐藏的知识 ,通过关联分析、聚类和分类等方法建立分析模 型,预测企业未来发展趋势和将要面临的问题。
概念:数据仓库(Data Warehouse)是一种语义上一致的
数据存储,是指从多个数据源收集的信息,以一种一致的存储 方式保存所得到的数据集合。面向不同的需求,对数据进行清 洗以保证数据的正确性,然后对数据进行抽取,转换成数据仓 库所需形式,并实现加载到数据仓库。
数据仓库技术是基于信息系统业务发展的需要,基于数 据库系统技术发展而来,并逐步独立的一系列新的应用技术。 数据仓库技术就是基于数学及统计学严谨逻辑思维的并达成“ 科学的判断、有效的行为”的一个工具。数据仓库技术也是一 种达成“数据整合、知识管理”的有效手段。
数据仓 库
OLAP 服 务器
用户
。。 。。 。。
数据仓库
数据挖掘 服务器 报表设计
分析人 员
数据分工析具数据展现
图1.3 商务智能系统的组成
商务智能系统架构 • 商务智能系统的最大好处是可以得到准
确、及时的信息,帮助企业赢得竞争优 势,这些功能的完成主要依靠DW、 DM 和OLAP三大技术和数据预处理、建立 数据仓库、数据分析及数据展现四个阶 段。
预测型模式是可以根据数据项的值精确确定某种结果的模式。挖掘预测型模 式所使用的数据也都是可以明确知道结果的。描述型模式是对数据中存在的规则 做一种描述,或者根据数据的相似性把数据分组。
二、商务智能技术简介
• 4. 三大核心技术之间关系
DW是前提和基础。负责统一数据规则的处理和存储。 OLAP是操作,侧重显性知识处理和分析。 DM是发现,侧重于隐性知识发掘和利用 。
OLAP 与数据挖掘的区别和联系是:OLAP 侧重于与用户的交互、快速的响应速度 及提供数据的多维视图,而数据挖掘则注重自动发现隐藏在数据中的模式和有用信 息,尽管允许用户指导这一过程。OLAP 的分析结果可以给数据挖掘提供分析信息 作为挖掘的依据,数据挖掘可以拓展OLAP 分析的深度,可以发现OLAP 所不能发现 的更为复杂、细致的信息。数据挖掘的研究重点则偏向数据挖掘算法以及数据挖掘 技术在新的数据类型、应用环境中使用时所出现新问题的解决上, 如对各种非结构 化数据的挖掘、数据挖掘语言的标准化以及可视化数据挖掘等。
OLAP操作语言:通过扩展数据库的操作语言SQL,得到MSQL(Multiple SQL)。
二、商务智能技术简介
• 3. DM(数据挖掘)
数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则) 的过程。
与OLAP 的探测式数据分析不同,数据挖掘是按照预定的规则对数据库和 数据仓库中已有的数据进行信息开采、挖掘和分析,从中识别和抽取隐含的模式 和有趣知识,为决策者提供决策依据。数据挖掘的任务是从数据中发现模式。模 式有很多种,按功能可分为两大类:预测型( Predictive)模式和描述型 (Descriptive)模式。
二、商务智能技术简介
• 2. OLAP(联机分析处理) 联机分析处理(OLAP) 又称多维分析,它对数据仓库中的数据进行多维分析和展
现,是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来 的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交 互地存取,从而获得对数据更深入了解的一类软件技术。它的技术核心是“维”这 个概念,因此OLAP也可以说是多维数据分析工具的集合。
第二章 商务智能技术基础
内容提要
• 2.1 商务智能系统组成及技术基础 • 2.2 数据仓库技术 • 2.3 联机分析技术 • 2.4 数据挖掘技术 • 2.5 数据展现技术
2.1 商务智能系统架构
商务智能系统架构
外部 数据 源
业务系 统数据 源
抽取 பைடு நூலகம்换 装载
数据源 数据预处理
元元 数数 据据
• 数据展现则主要保障系统分析结果的可视化。
元数据
外部数 据源
业务处 理系统 数据源
数据仓库
数据分析平台 (数据挖掘、报表展现和 OLAP工具)
商务智能应用
商务智能框架图
二、商务智能技术简介
• 1. DW(数据仓库)
必要性: 实施BI首先要从企业内部和企业外部不同的数
据源,如客户关系管理(CRM)、供应链管理(SCM)、企业资源 规划(ERP)系统以及其他应用系统等搜集有用的数据,进行转 换和合并,因此需要数据仓库和数据集市技术的支持。
• 在事务型处理环境中,数据库要求能支持日常事务 中的大量事务,用户对数据的存取操作频率高而每 次操作处理的时间短。
2.2 数据仓库 (Data Warehouse)
2.2.1 从数据库到数据仓库 2.2.2 数据仓库的定义和特点 2.2.3 数据仓库体系结构 2.2.4 数据仓库的设计与实施建立 2.2.5 数据仓库系统的评价标准
2.2.1 从数据库到数据仓库
事务型处理
• 事务型处理:即操作型处理,是指对数据库的联机 操作处理OLTP。事务型处理是用来协助企业对响 应事件或事务的日常商务活动进行处理。它是事件 驱动、面向应用的,通常是对一个或一组记录的增、 删、改以及简单查询等(大量、简单、重复和例行 性)。
• 数据预处理是整合企业原始数据的第一步,包括 数据抽取、转换和装载三个过程;
• 数据仓库则是处理海量数据的基础;
• 数据分析是体现系统智能的关键,一般采用OLAP 和DM两大技术。OLAP不仅进行数据汇总/聚集, 同时还提供切片、切块、下钻、上卷和旋转等数 据分析功能,用户可以方便地对海量数据进行多 维分析。数据挖掘则是挖掘数据背后隐藏的知识 ,通过关联分析、聚类和分类等方法建立分析模 型,预测企业未来发展趋势和将要面临的问题。
概念:数据仓库(Data Warehouse)是一种语义上一致的
数据存储,是指从多个数据源收集的信息,以一种一致的存储 方式保存所得到的数据集合。面向不同的需求,对数据进行清 洗以保证数据的正确性,然后对数据进行抽取,转换成数据仓 库所需形式,并实现加载到数据仓库。
数据仓库技术是基于信息系统业务发展的需要,基于数 据库系统技术发展而来,并逐步独立的一系列新的应用技术。 数据仓库技术就是基于数学及统计学严谨逻辑思维的并达成“ 科学的判断、有效的行为”的一个工具。数据仓库技术也是一 种达成“数据整合、知识管理”的有效手段。
数据仓 库
OLAP 服 务器
用户
。。 。。 。。
数据仓库
数据挖掘 服务器 报表设计
分析人 员
数据分工析具数据展现
图1.3 商务智能系统的组成
商务智能系统架构 • 商务智能系统的最大好处是可以得到准
确、及时的信息,帮助企业赢得竞争优 势,这些功能的完成主要依靠DW、 DM 和OLAP三大技术和数据预处理、建立 数据仓库、数据分析及数据展现四个阶 段。
预测型模式是可以根据数据项的值精确确定某种结果的模式。挖掘预测型模 式所使用的数据也都是可以明确知道结果的。描述型模式是对数据中存在的规则 做一种描述,或者根据数据的相似性把数据分组。
二、商务智能技术简介
• 4. 三大核心技术之间关系
DW是前提和基础。负责统一数据规则的处理和存储。 OLAP是操作,侧重显性知识处理和分析。 DM是发现,侧重于隐性知识发掘和利用 。