复旦大学精品课程《商务智能》课件,数据仓库课件复习精品资料

合集下载

复旦大学精品课程《商务智能》课件,数据挖掘应用课件复习精品资料

复旦大学精品课程《商务智能》课件,数据挖掘应用课件复习精品资料

Typical personalization process


understanding customers through profile building delivering personalized offering based on the knowledge about the product and the customer measuring personalization impact
客户流失分析
Customer development



Elements of customer development include customer lifetime value analysis, up/cross selling and market basket analysis. Customer lifetime value analysis is defined as the prediction of the total net income a company can expect from a customer. Up/Cross selling refers to promotion activities which aim at augmenting the number of associated or closely related services that a customer uses within a firm. Market basket analysis aims at maximizing the customer transaction intensity and value by revealing regularities in the purchase behaviour of customers.

商务智能(1).ppt

商务智能(1).ppt
13
7.4 数据仓库系统的开发过程
流程:
– 启动工程 – 建立技术环境 – 设计主题进行数据建模 – 设计数据仓库中的数据库 – 数据转换程序 – 管理元数据 – 开发用户决策的数据分析工具 – 管理数据仓库环境
14
7.5 数据仓库的前端访问和分析工具
数据仓库的前端访问和分析工具是供业 务分析和决策人员访问目标数据库中的 数据,并作进一步的深入分析之用。 OLAP数据挖掘工具是常用的数据仓库的 前端访问和分析工具。
– 切片和切块 – 钻取 – 旋转
17
7.5.2 数据挖掘
1、数据挖掘的概念
– 数据挖掘是从大型数据库中提取人们感兴趣 的知识
2、数据挖掘的分析方法:
– 关联分析 – 序列模式分析 – 分类分析 – 聚类分析
18
第七章结束,谢谢!!
19
第7章 商务智能
主要内容
7.1 商务智能概述 7.2 数据仓库概述 7.3 数据仓库建模 7.4 数据仓库系统的开发过程 7.5 数据仓库的前端访问和分析工具
1
7.1 商务智能概述
商务智能的基本任务:收集、管理和分析数据, 通过先进的工具把数据转换为有用的信息,然 后将这些信息发布到整个企业,促进企业科学 决策的制定,有效获得更具有战略意义的决策。 商务智能是数据处理技术与多种技术,如人工 智能技术、统计技术、数据仓库技术的有机集 合。
– 指数据仓库的数据单位中保存数据的细化或 综合程度的级别。
(2)分割
– 指把逻辑上是统一的整体的数据分割成较少 的、可以独立管理的物理单元进行存储。
– 通常采用按时间分割。
9
例 商品销售数据的分割
2000年 家电类 日用化工类 针织服装类 副食类

数据仓库与商务智能讲义

数据仓库与商务智能讲义
• COM客户:通过接口向服务器申请需要的服务。客户知道需 要从服务器获得什么,但数是据仓客库与户商务不智能知道服务器内部的细节。
COM的特性
• 面向对象的特性和客户/服务器的特性。
• 语言无关性:COM不依赖于特定的语言,只要能够生成符合COM规范的 可执行代码即可,该特性性为跨语言合作开发提供了统一标准。
• 分布式对象是具有特定功能的,能够跨越进程的边界、实现网络、语言、 应用程序、开发工具和操作系统的”即插即用”的独立对象。
• 分布式对象是指任何可被分离出来,具有标准化的,可重用的公开接口的 软件。
• 分布式对象通过接口对外提供服务。对象与对象之间,对象与客户之间同 时通过接口进行交互。因此分布式对象一旦发布,它只能通过预定义的接 口来提供合理的、一致的服务。这种接口定义的稳定性使客户应用开发人 员能够构造出稳定的应用。一个分布式对象可以实现多个接口,同时一个 特定的接口也可以被多个分布式对象来实现。除此之外,分布式对象还提 供了对象位置的透明性,也就是说一台机器上的应用可以透明地访问其他 机器上的分布式对象。
• 前端开发工具:提供用户编程接口,便于在现有系统的基础上进行 二次开发,增强系统的伸缩性。
• 数据仓库:在数据仓库系统中,数据仓库是一个数据存储集 合,它的存储形式通常有多维数据库,关系型数据库及其 他存储方式。
数据仓库与商务智能
分布式对象技术
• 随着Internet的广泛应用,将应用扩展到局域网、 广域网甚至Internet上已成为用户的普遍需求, 分布式计算成了新的热点。
数据仓库与商务智能
分布式组件对象的特性
• 伸缩性:随着用户数目的增加、数据量的不断增多,分布式 应用系统的适应能力反映了系统的优劣。使用 COM/DCOM/COM+建立起来的应用系统能很好地适应这 种规模的变化,当用户数比较少、数据量不大时,系统显得 小巧而快速;当应用规模增大时,系统也能够正常运行并且 在保证性能的情况下不影响可靠性。DCOM的位置透明性保 证了这种变化可以不必修改组件源程序。

商务智能PPT

商务智能PPT
• • • • •
一、商务智能概述 二、数据仓库 三、数据挖掘 四、联机分析处理 五、总结
商务智能 商务智能即Business Intelligence,简称 智能 BI,是企业利用现代信息技术收集、管理和 是 分析商务数据和信息,创造和累计商务知 识和见解,改善商务决策水平的一套完整 一套完整 的解决方案。 的解决方案。
BI的作用和目的
• 理解业务 认识是哪些趋势、哪些非正常情况和哪些行为正对业务 产生影响 • 衡量绩效 • 改善关系 • 创造获利机会
BI的应用现状
• 欧美企业在2003年底大约有70%部署商务智能,虽然并不 一定把它当做全公司范围的、战略性的计划。美国和欧洲 的企业对商务智能工具的使用略有不同,美国企业用商务 智能做在线处理比欧洲企业多,而欧洲企业用商务智能进 行高级分析比美国企业多。 • 虽然许多企业都计划实施商务智能,但商务智能仍未能被 广泛地提升到战略性层面。 • 商务智能在中国的发展还处于起步阶段,大部分企业对商 务智能还缺乏必要的了解。 • 中国宝钢、海关以及大的银行和电信公司进行了数据仓库 和数据挖掘项目。
商务智能的发展趋势
商业智能软件市场在最近几年得到了迅速增长。从全球范围来看,据IDC预测,到 2005年,这个市场将以27%的年平均增长率发展,届时将会达到118亿美元。越来越多的 组织开始扩展商务智能的应用。而随着现今企业商业流程日趋复杂、企业战略考虑越 来越要求精确性,以及市场从供应商为导向变为客户为导向,现在的商务智能技术也 在不断地发展中,体现了许多方面的趋势: 1. 绩效管理 2. 产品模块的集成 3. 结构化和非结构化数据 4. 数据质量 5. 预测分析 6. 客户定制化 企业中的大部分商务智能用户是偶尔的信息消费者,他们仅需要基本的报表和电子 表格功能。然而大多数商务智能软件的功能和特性远远超出了那些用户的接受和学习 能力。同样的,对信息消费者分类,根据功能和特点定义级别是必要的。加强商务智 能软件的客户可定制化功能,将会进一步扩大软件的用户群。

商业智能介绍PPT课件

商业智能介绍PPT课件
操作(业务)系统特性
事务驱动 事务数量大,历时短 支持日常的业务 数据是当前的并在不断变化 存储详细数据, 面向应用 无冗余的数据结构与设计方法 针对快速预定义的事务优化设计 可预见的使用模式 支持办事人员或行政人员
信息(分析)系统特性
分析驱动 事务数量小,历时长 支持业务战略决策 数据是历史的, 静态的, 数据是汇总的 , 面向主题 多维的数据结构 优化是针对查询而不是更新 不可预见的使用模式 支持管理人员和执行主管人员
服务质量分析 营销管理分析 渠道分析 专题分析
客户流失专题分析 ...
即席查询、预定义报表、自定义报表、OLAP、数据挖掘、专题分析模型
元 数
客户分析数据集市
据 管 理
财务分析数据集市

大客户分析数据集市
企业数据仓库 ETL(抽取、转换、加载)
业务数据库 业务数据库 业务数据库 业务数据库
模型库 业务数据库
第25页/共30页
数据仓库的实施风险
构建一个数据仓库是一项有风险的工作
经验告诉我们 … 超过 60%的数据仓库项目最终以失败而告终:
• 项目超预算 • 项目推迟交付 - 或根本交付不了 • 结果未能达到用户的期望 • 项目在技术上是成功的, …
但在业务上却是失败的 第26页/共30页
商业智能实施的风险
第15页/共30页
商业智能实施的内容
第16页/共30页
商务智能系统的构建过程
钻取/切片/旋转
汇总
OLAP服务器
抽取/转换/加载 数据仓库/集市
业务数据源
第17页/共30页
商业智能实施内容-需求驱动
数据获取 企业信息模型
指标定义
指标体系
前端展现

商务智能复习

商务智能复习

商务智能第1章商务智能概述1.1 商业决策需要商务智能一、数据、信息和知识1、数据:符号、事实和数字信息:有用的数据关系:信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。

数据是信息的载体, 信息是对数据的解释。

知识:对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。

2、决策离不开信息、知识①决策需要信息,更离不开知识;知识更多地表现为经验--学习的结晶;学习的过程是不断地对信息加工处理;信息的收集、加工、传输与利用贯穿着决策各阶段的工作过程。

②信息已成为企业经营中重要性仅次于人才的第二大要素。

③决策=信息+经验+冒险④商务智能是对企业信息的科学管理。

3、商务智能支持商业决策商务智能如何创造知识和价值1.2 商务智能简介商务智能这一术语1996年由Gartner 公司的分析师Howard Dresner首次提出,他提出商务智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。

一、商务智能概念商务智能是整合了先进信息技术与创新管理理念的结合体,集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力,涉及企业战略、管理思想、业务整合和技术体系等层面,促进信息到知识再到利润的转变,从而实现更好的绩效。

①先进信息技术:商务智能是多项技术的综合应用;②集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息:商务智能的层次;③企业战略:商务智能服务于企业战略;④管理层、业务层:商务智能用户多样性;⑤更好的绩效:商务智能提升企业绩效。

二、商务智能的价值1、在商务智能背后有一些商业驱动力,如:①增加收入,减少费用和更有效地竞争的需求。

②管理和模拟当前商业环境复杂性的需求。

③减少IT费用和事物运动数据信息记录解释利用已有公司业务信息的需求。

2、商务智能的价值①制定合适的市场营销策略;②改善顾客智能;③经营成本与收入分析;④提高风险管理能力;⑤改善业务洞察力;⑥提高市场响应能力。

商务智能

商务智能
• 2011年,蒋彬博士出版了 • 《Constructing Data Warehouse with
Metadata-driven Generic Operators and more》一书,提出利用元数据驱动的 通用操作符来构建仓库的方法,受到
。 了Inmon的高度评价
路漫漫其悠远
• BI市场经历了多轮并购,目前BI厂商分为两 类,一类是综合性BI提供商(IBM,ORACLE ,SAP,微软),另一类是专业化BI提供商 ,如TERADATA和SAS。
路漫漫其悠远
企业BI感言:商业智能在零售业中的应用
• 客户分析:
– 顾客分析主要是指对顾客群体的购买行为的分析。例如,我们将顾客 分成“富人”和“穷人”;那么什么人是“富人”,什么人是“穷人”呢?如果我 们有会员卡,可以通过会员登记的月收入来区分,但如果没有会员卡 呢?这时可以通过小票每单金额来假设。比如每单金额大于100元的顾 客,我们认为是“富人”;每单金额小于100元的顾客,我们认为是“穷人 ”。据此,又可派生出很多其他分析思路。如“富人”喜欢什么样的商 品,“穷人”喜欢什么样的商品;“富人”的购物时间和“穷人”的购物时间; 本企业商圈里是“富人”多还是“穷人”多;“富人”给商场作出的贡献大还 是“穷人”作出的贡献大;“富人”喜欢用什么方式来支付,“穷人”喜欢用 什么方式来支付等等。此外,还有商圈的客单量分析、商圈里的购物 高峰分析、假日经济对企业的影响分析等等分析思路。
ETL工程师 数据仓库工程师
前端开发人员
BI终端用户
各类BI开发人员能力的需求
• ETL工程师:算法、程序设计、数据库 • 数据仓库工程师:数据库设计、管理、优化
;理解管理和决策; • 前端开发人员:管理和决策需求、开发工具

商务智能(第5版)课件第2章 商务智能系统架构

商务智能(第5版)课件第2章 商务智能系统架构

Increasing # of users
即席查询/报告
➢ 即席查询是指用户根据自己的需求,灵活的选择查询条件, 系统能够根据用户的选择生成相应的统计报表。
➢ 为何发生? • 业务部门可以从固定的报表、报告和一些关键的KPI中可以得
到很多相关的信息,但当他们发现问题时,需要了解为何发 生了问题。这时,就需要即席查询和OLAP(例外)分析。 • 业务分析员经常需要自己根据问题的需要完成自己的分析和 报告。 ➢ 即席查询在一些业务智能单元得到较多应用,例如通过对产 品销售数据和顾客偏好的分析,指导设计新产品。
日常 数据增加
周 数据加载
日 周期
EII
解决方案
企数业 信数息 集 成据(E据 II)
质重 量新 控组 制织
实时 增量
数据仓库
企业数 据模型 RDDWMDDB
数虚 据 OD拟 仓 S 库
解决的业务问题
报表 随即查询 例外分析 数据挖掘
Intranet/ Internet 即席查询
产品报告
OLAP 分析 数据挖掘
主数据管理与数据仓库的关系
➢ 联系 • 它们都是减少数据冗余和不一致性的跨部门集中式系统,都 依赖ETL、元数据管理等技术保证数据质量。 • 数据仓库系统的分析结果可以输入到主数据管理系统中。
➢ 区别 • 主数据管理是为呼叫中心、电子商务和CRM等业务系统提供 联机交易服务的,而数据仓库是面向分析型的应用。 • 主数据管理涉及的数据量相对较小,在运行中主数据的集成 实时性要求比数据仓库高。
系统中,可以被各个业务部门重复使用。 ➢ 不同行业的主数据类型一般不同。 ➢ 主数据管理是通过ETL、企业信息集成(EII)等技术,从企业的多个业务系统中整合需要共享的

商业智能PPT课件教材讲义

商业智能PPT课件教材讲义

Operational & e-business systems
Analyze & model business
operations
Decision processing
systems
Two Information Technologies Have Profound Impact on Business Today
Customers
Target right online customers
Personalized oneto-one marketing
Sales
Convert site visitors to customers
Up selling
Cross selling
BI for CRM Solutions
“数据仓库之父”Bill Inmon给的定义:
数据仓库就是一个用以更好地支持企业或组 织的决策分析处理的,面向主题的,集成的, 不可更新的,随时间不断变化的数据集合
数据仓库的特征
面向主题的:主题是一个在较高层次将数据归 类的标准,每个主题基本对应一个宏观的分析 领域
集成的:允许数据来自于跨组织和部门等不同 数据源;集成的数据必须是一致的、用户看来 是统一的数据视图
Core Technologies in Business Intelligence
Data warehousing
Integrated corporate data source for decision support
OLAP and DSS
Information query, analysis and reporting
Ability to rationalize and automate the process of building the enterprise-wide decision support system

商务智能复习资料

商务智能复习资料

商务智能复习资料第一章商务智能概述1、4C(1)信息技术是指获取、传递、处理和存储、以及利用信息的技术。

(2)4C内容:感测技术(是信息的采集技术,对应于人的感觉器官);通讯技术(是信息的传递技术,对应于人的神经系统);计算机技术(是信息的处理和存储技术,对应于人的思维器官);控制技术(是信息的使用技术,对应于人的执行器官)。

(3)信息技术工具:信息处理技术和通信技术是最重要的两种。

2、定义商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累积商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升个方面商务绩效,增强综合竞争力的智慧和能力。

3、商务智能的基本功能:个性化的信息分析;预测;辅助决策。

5、商务智能的作用:理解业务;衡量绩效;改善关系;创造获利机会。

6、商务智能的体系结构:是指通过识别和理解数据在系统中的流动过程和数据在企业中的应用过程来提供商务智能系统的主框架。

7、BI与交易系统的关系:系统设计的区别数据类型的区别8、数据、信息、知识、智能之间的关系(1)数据:孤立的客观事实、文字、符号,适合保存、传递和处理。

TO知识:是知识的表现形式,是知识的来源。

TO信息:数据的价值通过其携带的信息表现。

(2)信息:人们对数据进行系统的采集、组织、整理、分析的结果,目的是使数据结构化、有序化。

TO数据:信息是数据的含义,是对数据的解释。

TO知识:信息是知识的表现形式。

(3)知识:是人们对自认识而总结出来的规律、经验。

第二章数据仓库导论1、什么是数据仓库数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持经营管理中决策制定过程。

2、数据仓库的特点:面向主题;集成;稳定;随时间而变化;数据量大;软硬件要求高。

3、数据仓库与传统数据库的区别4、OLTP与OLAP的区别5、数据仓库的用户包括(1)信息使用者的数据仓库应用:以一种可以预测的、重复的方式使用。

商务智能ppt第一章商务智能

商务智能ppt第一章商务智能

DATA: S、事实和数字
How are You?
π
Happy New Year!
Word
record
Data
Explain Information
•Discrete, objective facts about the world •Easily structured and captured •Easily transferred
3.数据挖掘技术
• 与联机分析处理技术的探测式数据分析不同,数据挖掘侧重从海量数据中揭示隐含 的、先前未知的并有潜在价值的信息的非平凡过程,它按照预定的规则对数据库和 数据仓库中已有的数据进行信息开采、挖掘和分析,从中识别和抽取隐含的模式与 有趣的知识,为决策者提供决策依据。
数据(Data)
信息(Information)
知识(Knowledge)
下雨
夏天午后常下雨
夏天出门要随身带雨伞
智慧(Wisdom)
全年中如果出现这种天气情 况都要带伞
1.3 商务智能的组成要素
• 1.大数据 • 按照数据源来说,数据分为企业内部数据和企业外部数据两类。企业内部数据包括企业
业务系统产生的数据,如订单、客户信息、交易记录、物流记录等;企业外部数据是指 来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。 按照数据生成时间来说, 数据分为即时数据和历史数据。 即时数据即企业在运营过程 中产生的即时数据,这类数据基本上是几秒或者是几分钟之前产生的经营数据。而历史 数据指的是前一天、前一周,甚至是前一个月的经营数据。从数据结构化程度来说,数 据分为结构化数据和非结构化数据。结构化数据是指存储在各个交易系统背后的关系数 据库中的数据,通常以表格的形式存在和展现,非结构化数据通常以零散的文件形式存 在和展现,泛指不能简单以表格形式展现的数据。

商务智能与数据科学ppt课件

商务智能与数据科学ppt课件

精选ppt课件
25
The Data Information Knowledge and Wisdom
Hierarchy (DIKW)
知识是从数据到智慧划分为不同层次的。
精选ppt课件
26
示例
数据:上季度产品A在华东地区销售额为120万。 信息:上季度产品A华东地区销售额比去年同期减
少了25 %。 知识:如分析原因是华东地区销售单位不行,或产
精选ppt课件
7
企业
企业——这里用“组织机构”或“实体” 会显得更完整,因为所有的组织机构和 实体(不只是企业)都可以而且应该利 用商务智能;之所以仍用“企业”是为 保持与“商务”的一致性。各行各业, 包括非企业性机构,比如政府部门、教 育机构、医疗机构和公用事业等,都应 该而且能够利用商务智能。
大数据时代的 数据挖掘与商务智能
精选ppt课件
1
大纲
大数据的时代背景
商务智能与数据科学
基于统计的传统数据分析技术
数据管理系统与联机分析处理
数据挖掘与知识发现技术
典型应用及案例分析
精选ppt课件
2
第二部分
商务智能与数据科学
精选ppt课件
3
商务智能概论
什么是商务智能? 数据、信息、知识 管理、信息与决策 决策支持系统
精选ppt课件
5
商业智能——Gartner
商业智能的概念于1996年最早由加特纳 集团(Gartner Group)提出,加特纳集 团将商业智能定义为:商业智能描述了 一系列的概念和方法,通过应用基于事 实的支持系统来辅助商业决策的制定。 商业智能技术提供使企业迅速分析数据 的技术和方法,包括收集、管理和分析 数据,将这些数据转化为有用的信息, 然后分发到企业各处。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

11
集成性

数据仓库中的数据是从原 有分散的源数据库中提取 出来的,其每一个主题所 对应的源数据在原有的数 据库中有许多冗余和不一 致,且与不同的应用逻辑 相关。为了创建一个有效 的主题域,必须将这些来 自不同数据源的数据集成 起来,使之遵循统一的编 码规则。
7
实施数据仓库的条件

数据积累已达到一定规模 面临激烈的市场竞争 在IT方面的资金能得到保障
8
数据仓库的发展
自从NCR公司为Wal Mart建立了第一个数据仓库。 1996年,加拿大的IDC公司调查了62家实现了数据仓库的欧美 企业,结果表明:数据仓库为企业提供了巨大的收益。 早期的数据仓库大都采用当时流行的客户/服务器结构。近年来 分布式对象技术飞速发展,整个数据仓库体系结构从功能上划分 为若干个分布式对象,这些分布式对象不仅可以直接用于建立数 据仓库,还可以在应用程序中向用户提供调用的接口。 IBM的实验室在数据仓库方面已经进行了10多年的研究,并将 研究成果发展成为商用产品。 其他数据库厂商在数据仓库领域也纷纷提出了各自的解决方案。
SSL
Internet
Browsers Web servers
Excel spreadsheet Oracle SQL Server
layer
DB2
5
数据库系统的局限性(续)
当事务型处理环境和分析型处理环境在同一个数据库系统中, 事务型处理对数据的存取操作频率高,操作处理的时间短, 而分析型处理可能需要连续运行几个小时,从而消耗大量的 系统资源。 决策型分析数据的数据量大,这些数据有来自企业内部的, 也有来自企业外部的。来自企业外部的数据又可能来自不同 的数据库系统,在分析时如果直接对这些数据操作会造成分 析的混乱。对于外部数据中的一些非结构化数据,数据库系 统常常是无能为力。
数据仓库
Data Warehouse
赵卫东 博士 复旦大学软件学院
wdzhao@
1
事务型处理


事务型处理:即操作型处理,是指对数据库的联机操作 处理OLTP。事务型处理是用来协助企业对响应事件或 事务的日常商务活动进行处理。它是事件驱动、面向应 用的,通常是对一个或一组记录的增、删、改以及简单 查询等(大量、简单、重复和例行性)。 在事务型处理环境中,数据库要求能支持日常事务中的 大量事务,用户对数据的存取操作频率高而每次操作处 理的时间短。



9
数据仓库(Data Warehouse)数据仓库用来保存从多个数据库或其它信息源选取的数据, 并为 上层应用提供统一 用户接口,完成数据查询和分析。支持整个 企业范围的主要业务来建立的,主要特点是,包含大量面向整 个企业的综合信息及导出信息。 数据仓库是作为DSS服务基础的分析型DB,用来存放大容量的 只读数据,为制定决策提供所需要的信息。 数据仓库是与操作型系统相分离的、基于标准企业模型集成的、 带有时间属性的、面向主题及不可更新的数据集合。 以1992年W H Inmon出版《Building the Data Warehouse》 为标志,数据仓库发展速度很快。 W H Inmon被誉为数据仓库 之父。 W H Inmon对数据仓库所下的定义:数据仓库是面向主题的、 集成的、稳定的、随时间变化的数据集合,用以支持管理决策 的过程。
信息处理 分析 知识工人(如经理、主管、分析员) 长期信息需求,决策支持 星形/雪花,面向主题 历史的;跨时间维护 汇总的,统一的 汇总的,多维的 复杂查询 大多为读 信息输出 大量扫描 数百万 数百 100GB到TB 高灵活性,端点用户自治 查询吞吐量,响应时间 4
数据库系统的局限性


client 数据库适于存储高度结构化的日 applications 常事务细节数据,而决策型数据 Application 多为历史性、汇总性或计算性数 layer 据,多表现为静态数据,不需直 接更新,但可周期性刷新。 决策分析型数据是多维性,分析 内容复杂。 在事务处理环境中,决策者可能 并不关心具体的细节信息,在决 策分析环境中,如果这些细节数 XML 据量太大一方面会严重影响分析 document 效率,另一方面这些细节数据会 分散决策者的注意力。 Data management
3
事务型处理数据和分析型处理数据的区别
特性 OLTP OLAP
特征 面向 用户 功能 DB 设计 数据 汇总 视图 工作单位 存取 关注 操作 访问记录数 用户数 DB规模 优先 度量
操作处理 事务 办事员、DBA、数据库专业人员 日常操作 基于E-R,面向应用 当前的;确保最新 原始的,高度详细 详细,一般关系 短的、简单事务 读/写 数据进入 主关键字上索引/散列 数十个 数千 100MB到GB 高性能,高可用性 事务吞吐量
10
面向主题


数据仓库中的数据是按照各种主题来组织的。主题在数据仓 库中的物理实现是一系列的相关表,这不同于面向应用环境。 如保险公司按照应用组织可能是汽车保险、生命保险、伤亡 保险,而数据仓库是按照客户、政策、保险金和索赔来组织 数据。 面向主题的数据组织方式可在较高层次上对分析对象的数据 给出完整、一致的描述,能完整、统一的刻画各个分析对象 所涉及的企业的各项数据以及数据之间的联系,从而适应企 业各个部门的业务活动特点和企业数据的动态特征,从根本 上实现数据与应用的分离。
2
分析型处理



分析型处理:用于管理 人员的决策分析,例如 DSS、 EIS和多维分析等。 它帮助决策者分析数据 以察看趋向、判断问题。 分析型处理经常要访问 大量的历史数据,支持 复杂的查询。 分析型处理过程中经常 用到外部数据,这部分 数据不是由事务型处理 系统产生的,而是来自 于其他外部数据源。


6
多库系统的限制




可用性:源站点或通信网络故障将导致系统瘫痪, 源站点不能 通过网络在线联入多库系统。 响应速度:全局查询多级转换和通信传输, 延迟和低层效率影 响响应速度。 系统性能:总体性能取决于源站点中性能最低的系统, 影响系 统性能的发挥; 系统开销:每次查询要启动多个局部系统, 通信和运行开销大。
相关文档
最新文档