数据仓库基础培训

合集下载

数据仓库培训课件

数据仓库培训课件
聚类分析
将相似的数据聚集成不同的群体, 如客户分群、市场细分等。
数据展现技术
报表
通过报表展示数据的汇总和分析 结果,如销售报表、财务报告等

图表
通过图表展示数据的趋势和关系 ,如折线图、柱状图、饼图等。
可视化大屏
通过可视化大屏展示数据的实时 动态和全局信息,如监控大屏、
指挥中心等。
03
CATALOGUE
案例二:亚马逊的数据仓库实践
背景介绍:亚马逊作为全球最大的在线零售商之一,需要处理海量的销售数据和客户评价数据,为了更好地进行数据分析和 决策,亚马逊建立了自己的数据仓库。
亚马逊的数据仓库实践采用了分布式计算平台,基于Hadoop平台进行构建,处理海量的销售数据和客户评价数据,同时采 用了ETL工具进行数据清洗和整合,建立了自己的数据仓库模型,并进行了数据分析和挖掘,为公司的决策提供了有力的支持 。此外,亚马逊还利用数据仓库进行了客户行为分析,为个性化推荐和精准营销提供了支持。
采用星型模型设计数据仓库,将数据分为事实表和维度表,适用 于快速查询和报表生成。
雪花模型设计
采用雪花模型设计数据仓库,将数据按照层级进行划分,适用于需 要高度扩展和稳定性的系统。
ETL工具的使用
采用ETL工具进行数据抽取、转换和加载,提高数据处理效率和准 确性。
04
CATALOGUE
数据仓库实施
实施步骤
案例四:银行的数据仓库设计
背景介绍:银行作为金融行业的重要机构之 一,需要处理大量的金融交易数据和客户信 息数据,为了更好地进行风险管理和业务决 策,银行进行了数据仓库设计。
银行的数据仓库设计采用了分布式计算平台 ,基于Hadoop平台进行构建,处理大量的 金融交易数据和客户信息数据,同时采用了 ETL工具进行数据清洗和整合,建立了自己 的数据仓库模型,并进行了数据分析和挖掘 ,为风险管理和业务决策提供了有力的支持 。此外,银行还利用数据仓库进行了客户行 为分析,为个性化服务和精准营销提供了支

数据仓库开发培训(1)-DB2基础

数据仓库开发培训(1)-DB2基础

-2-
数据仓库开发系列培训
DB2 基础
阅读说明 本文主要面向数据库设计和开发人员、部署人员和性能调优人员。 杭州滨江 2013 年 7 月 3 日
-3-
数据仓库开发系列培训
DB2 基础
目录
培训介绍...................................................................................................................................... - 2 本文内容...................................................................................................................................... - 2 阅读说明...................................................................................................................................... - 3 第一篇 基础理论........................................................................................................................ - 6 1 DB2 数据库基本概念 ........................................................................................................

数据仓库培训文档(2)

数据仓库培训文档(2)

to_location dollars_cost units_shipped shipper
shipper_key shipper_name 22 location_key shipper_type
Measures
数据仓库概念与体系结构
度量
• 数据的实际意义,即描述数据是“什么”。 一般情况下,变量总是一个数值度量指标, 如:话务量、掉话次数、拥塞率等
• 焦点是为决策者进行数据建摸和分析,而不是为
了日常的事务处理
• 通过把对决策支持没有用的数据隔离,对特殊的
主题提供了一个简单明了的视图
8
数据仓库概念与体系结构
与传统数据库的区别:集成的
• 需要集成多个、异构的数据源
–原始数据文件 –网管数据库 –客服数据库
• 数据清洗和数据集成
9
数据仓库概念与体系结构
location
location_key street city_key
location_key units_sold dollars_sold avg_sales Measures
city
city_key city province_or_state country
21
星系模型
item
time
time_key day day_of_the_week month quarter year
与传统数据库的区别:集成的
操作型环境 应用A 应用B 应用C 应用D M,F 1,0 X,Y 男,女 数据仓库 M,F
操作型环境 应用A 应用B 应用C 应用D 管道-Cm 管道-Inches 管道-m 管道-yds
数据仓库
Cm
10
数据仓库概念与体系结构

《数据仓库基础培训》课件

《数据仓库基础培训》课件

数据仓库的安全性和保密性
1 权限管理
数据仓库中的数据应根据用户角色和权限进行精确的管理,保证敏感数据的安全性。
2 数据加密
对敏感数据进行加密处理,防止未授权的访问和数据泄露。
3 备份与恢复
定期备份数据仓库,以确保数据的可靠性和可恢复性。
数据仓库的性能优化
索引优化
通过合理的索引设计和优化, 提高数据仓库的查询性能。
易用性
数据仓库的设计应简化用户的操作和查询过程, 使其能够轻松获取所需的信息。
数据仓库的建设流程与方法
1
需求分析
根据业务需求和数据源确定数据仓库的
数据建模
2
规模、范围和功能。
设计数据仓库的逻辑模型,包括维度模
型和事实表的建立。
3
ETL开发
进行数据抽取、转换和加载的开和完整。
数据仓库建设的经验与案例分享
成功案例
分享一些数据仓库建设的成功案例,探讨其经验和 最佳实践。
挑战与解决方案
讨论数据仓库建设过程中可能遇到的挑战,以及如 何解决和应对。
数据仓库的未来发展与挑战
1 大数据时代
随着大数据技术的不断发展,数据仓库将面临更大的数据规模和复杂性。
2 实时数据分析
实时数据分析需求的增加,将对数据仓库的实时性和性能提出更高要求。
分区与分片
将数据仓库的数据进行分区和 分片,以提高查询和加载的效 率。
缓存管理
使用缓存技术,预先加载常用 的数据,减少查询时间。
数据仓库的容错机制
数据复制
通过数据复制技术,将数据仓库的副本存储在不同 的地点,提高系统的容错能力。
灾难恢复
制定灾难恢复计划,确保在系统故障或灾难情况下 能够及时恢复数据仓库。

数据仓库技术PPT培训资料

数据仓库技术PPT培训资料
数据仓库技术
—信管0701 HT
1
数据仓库技术
✓什么是数据仓库 ✓数据仓库的产生 ✓新一代数据仓库的发展趋势 ✓总结
2
什么是数据仓库
概念
数据仓库概念创始人W.H.Inmon在《建立数据 仓库》一书中对数据仓库的定义是:数据仓库就是 面向主题的、集成的、不可更新的(稳定性)、随时 间不断变化(不同时间)的数据集合,用以支持经 营管理中的决策制定过程、数据仓库中的数据面向 主题,与传统数据库面向应用相对应。
6
• 近几十年来,大量新技术、新思路的涌现出来并 被用于关系型数据库系统的开发和实现:客户/服 务器系统结构、存储过程、多线索并发内核、异 步I/O、代价优化,等等,这一切足以使得关系数 据库系统的处理能力毫不逊色于传统封闭的数据 库系统。而关系数据库在访问逻辑和应用上所带 来的好处则远远不止这些,SQL的使用已成为一 个不可阻挡的潮流,加上近些年来计算机硬件的 处理能力呈数量级的递增,关系数据库最终成为 联机事务处理系统的主宰。
9
新一代数据仓库的发展趋势
• 严格的投资回报率评估 • 整合数据集市 • 增加更多的分析 • CRM与数据仓库后期Internet 的兴起与飞速发展,我 们进入了一个新的时代,大量的信息和数据,迎 面而来,用科学的方法去整理数据,从而从不同 视角对企业经营各方面信息的精确分析、准确判 断,比以往更为迫切,实施商业行为的有效性也比 以往更受关注。
企业数据仓库为通用数据仓库,它既含有大量详细的数据, 也含有大量累赘的或聚集的数据,这些数据具有不易改变 性和面向历史性。
二、操作型数据库(ODS)
操作型数据库既可以被用来针对工作数据做决策支持,又 可用做将数据加载到数据仓库时的过渡区域。
三、数据市集(DataMart)

数据仓库应用实例培训课件(ppt 50张)

数据仓库应用实例培训课件(ppt 50张)


• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
46.凡事不要说"我不会"或"不可能",因为你根本还没有去做! 47.成功不是靠梦想和希望,而是靠努力和实践. 48.只有在天空最暗的时候,才可以看到天上的星星. 49.上帝说:你要什么便取什么,但是要付出相当的代价. 50.现在站在什么地方不重要,重要的是你往什么方向移动。 51.宁可辛苦一阵子,不要苦一辈子. 52.为成功找方法,不为失败找借口. 53.不断反思自己的弱点,是让自己获得更好成功的优良习惯。 54.垃圾桶哲学:别人不要做的事,我拣来做! 55.不一定要做最大的,但要做最好的. 56.死的方式由上帝决定,活的方式由自己决定! 57.成功是动词,不是名词! 28、年轻是我们拼搏的筹码,不是供我们挥霍的资本。 59、世界上最不能等待的事情就是孝敬父母。 60、身体发肤,受之父母,不敢毁伤,孝之始也; 立身行道,扬名於后世,以显父母,孝之终也。——《孝经》 61、不积跬步,无以致千里;不积小流,无以成江海。——荀子《劝学篇》 62、孩子:请高看自己一眼,你是最棒的! 63、路虽远行则将至,事虽难做则必成! 64、活鱼会逆水而上,死鱼才会随波逐流。 65、怕苦的人苦一辈子,不怕苦的人苦一阵子。 66、有价值的人不是看你能摆平多少人,而是看你能帮助多少人。 67、不可能的事是想出来的,可能的事是做出来的。 68、找不到路不是没有路,路在脚下。 69、幸福源自积德,福报来自行善。 70、盲目的恋爱以微笑开始,以泪滴告终。 71、真正值钱的是分文不用的甜甜的微笑。 72、前面是堵墙,用微笑面对,就变成一座桥。 73、自尊,伟大的人格力量;自爱,维护名誉的金盾。 74、今天学习不努力,明天努力找工作。 75、懂得回报爱,是迈向成熟的第一步。 76、读懂责任,读懂使命,读懂感恩方为懂事。 77、不要只会吃奶,要学会吃干粮,尤其是粗茶淡饭。 78、技艺创造价值,本领改变命运。 79、凭本领潇洒就业,靠技艺稳拿高薪。 80、为寻找出路走进校门,为创造生活奔向社会。 81、我不是来龙飞享福的,但,我是为幸福而来龙飞的! 82、校兴我荣,校衰我耻。 83、今天我以学校为荣,明天学校以我为荣。 84、不想当老板的学生不是好学生。 85、志存高远虽励志,脚踏实地才是金。 86、时刻牢记父母的血汗钱来自不易,永远不忘父母的养育之恩需要报答。 87、讲孝道读经典培养好人,传知识授技艺打造能人。 88、知技并重,德行为先。 89、生活的理想,就是为了理想的生活。 —— 张闻天 90、贫不足羞,可羞是贫而无志。 —— 吕坤

数据仓库培训

数据仓库培训

OLAP基本操作
上卷操作:通过维层次,在数据立方体上进 行聚集。 下钻操作:是上卷操作的逆操作,由不太详 细的数据到更详细的数据。 切片和切块:切片在给定的数据立方体的一 个维上进行选择,切块则是在两个或两个以 上的维进行选择。 旋转操作:是改变维度的位置关系,使最终 用户可以从其他视角来观察多维数据。
日期
一季度 二季度 三季度 四季度
ALL
南京 苏州 常州
TV PC
VCD ALL
产 品
地 区
ALL
数据仓库的主要应用
信息处理
支持查询和基本的统计分析,并使用表或图进行报告.
分析处理
支持基本的OLAP操作,在汇总的和细节的历史数据上操作.
数据挖掘
支持知识发现,包括找出隐藏的模式和关联,构造分析模型, 进行分类和预测,并用可视化工具提供挖掘结果.
一次处理的数据量小
面向应用,事务驱动
一次处理的数据量大
面向分析,分析驱动
面向操作人员,支持日常操作 面向决策人员,支持管理需要
OLTP和OLAP的区别
用户和系统的面向性:
OLTP是面向顾客的,用于事务和查询处理; OLAP是面向市场的,用于数据分析。
数据内容:
OLTP系统管理当前数据; OLAP系统管理大量历史数据,提供汇总和聚集机制。
Data Mart(数据集市)
小型的,面向部门或工作组级数据仓库.
数据仓库中的几个重要概念 (续)
Operation Data Store
操作数据存储 — ODS是能支持企业日常的全局应 用的数据集合,是不同于DB的一种新的数据环境, 是DW 扩展后得到的一个混合形式。 四个基本特点:面向主题的(Subject -Oriented)、集 成的、可变的、 当前或接近当前的。

BW基础知识(介绍)专题培训课件

BW基础知识(介绍)专题培训课件
SAP 数据仓库(BW) 与其它 SAP系统紧密集成 开放的架构
主数据管理(MDM) 跨系统的主数据同步
SAP 集成平台(XI) 与其它 SAP系统紧密集成 信息映射 多种接口实现方式
SAP Web Application Server 稳定的系统运行平台
ETL工具
BW是SAP系统整体报表工具一部分
结论性分析
BW
BW
LIS – FIS - HIS
标准报表 Report Writer Report Painter
R/3 ABAP Query
ABAP SAP R/3 数据字典 & 表格
交易性分析
BW将提供更深层次的分析报表,但是不会取代所有 通过R3产生的报表。
数据仓库系统实施背景
背景介绍
ERP系统上线后,随着日常业务的开展,将产生大量的业务 交易数据,如何充分利用这些数据,为各层经营管理人员提供有效 的帮助,是一个即将面临的问题。
数据仓库系统实施背景 成功实施R/3之后…
业务终于通过R/3规范了
库存准了
订单管起来了
财务结帐快了
业务和财务数据一致了
业务情景二 执行层
?没有一个好的信息决策能预警销售数据就好了 ?我们有5年的销售数据,应该好好利用利用才
对,可是怎么整理这些数据好呢 ?怎么比较我的销售和竞争对手的销售
数据仓库系统实施背景 业务情景三 操作层
业务人员 技术人员
?为什么现在系统速度变慢了 ?为什么有些报表运行要这么长时间
BW系统的整体定位
是面向企业中、高级管理进行业务分析和绩效考核的数据 整合、分析和展现的工具;
是主要用于历史性、综合性和深层次数据分析; 数据来源是ERP(SAP R/3)系统或其他业务系统; 能够提供灵活、直观、简洁和易于操作的多维查询分析; 不是日常交易操作系统,不能直接产生交易数据;

数据仓库技术知识培训

数据仓库技术知识培训

- 我的帐户现在有多少钱?
- 历史数据的缺乏是另一个 应用问题
- 你有 2,704.87元
- 在过去的三年中,我的帐户每月平均余额 是多少?
- 我怎样才能知道这些数字?
汇总问题
computer
另一个问题是汇总 ….
- 发往A公司的货物在哪里? - 在出厂中心,将于下周一运到
-我们上个月、去年有多少货物发往A公司? - 有多少货物准时到达? 晚到? 发生货损?
数据爆炸问题
– 自动的数据收集工具和成熟的数据库技术导致巨 大的数据存储在文件系统、数据库和其它的信息 库中 。
– 我们会淹死在数据中, 但却为信息、知识所饿! 勇于开始,才能找到成功的路
面临的挑战
如何在堆积如山的企业交易数据中 发现具有商业价值的闪光点? 如何使您的企业或组织在激烈的市 勇于开始,才能找到成功的路 场竞争中保持对客户的吸引力? 如何预先发现和避免企业运作过程 中不易察觉的商业风险?
3、数据仓库的过期;
4、用户需求的改变。
数据质量管理
如果数据质量不能被信任,则数据仓库将失去价值
,数据管理是一个循环往复的过程,包括四个基本
功能:
定义
定义
量度标准 报告
量度标准
改善
连续的改善
循环
改善
报告
操作数据存储(ODS)
探索数据仓库
ODS “遗产”系统
DSS
商业系统
客户开发系统
SAP
home grown
- 我要写个汇总报告.
获取信息的重要因素
computer
- 贯穿公司的数据集成? - 公司的历史数据? - 详细数据及汇总数据?
决策的需要
应用在不断地进步,当 联机事务处理系统应用到一定 阶段的时候,企业家们便发现 单靠拥有联机事务处理系统已 经不足以获得市场竞争的优势 ;他们需要对其自身业务的运 作以及整个市场相关行业的态 势进行分析,从而做出有利的 决策。

数据仓库基础知识培训教材(PPT38页)

数据仓库基础知识培训教材(PPT38页)

数据仓库基础知识培训教材(PPT38页 )培训 课件培 训讲义 培训ppt教程管 理课件 教程ppt
面向主题性
• 面向主题性表示了数据仓库中数据组织的基本 原则,数据仓库中的所有数据都是围绕着某一 主题组织的。
• 确定主题以后,需要确定主题应该包含的数据。
• 不同的主题之间可能会出现相互重叠的信息。
1.1从传统数据库到数据仓库(续)
• 传统的事务处理环境不适宜于决策支持应 用
• 事务处理和分析处理的性能特性不同 • 数据集成问题 • 数据动态集成问题 • 历史数据问题 • 数据的综合问题
• 操作型环境和分析型环境的分离:数据抽取
现实生活中面临的问题
人们在日常生活中经常会遇到这样的情况: • 超市的经营者希望将经常被同时购买的商
• 随着市场竞争的加剧,信息系统的用户已经不 满足于仅仅用计算机去处理每天所发生的事务 数据,而是需要信息——能够支持决策的信息, 去帮助管理决策。这就需要一种能够将日常业 务处理中所收集到的各种数据转变为具有商业 价值信息的技术,传统数据库系统无法承担这 一责任。因为传统数据库的处理方式和决策分 析中的数据需求不相称。这些不相称性主要表 现在决策处理中的系统响应问题、决策数据需 求的问题和决策数据操作的问题。
品放在一起,以增加销售; • 保险公司想知道购买保险的客户一般具有
哪些特征; • 医学研究人员希望从已有的成千上万份病
历中找出患某种疾病的病人的共同特征, 从而为治愈这种疾病提供一些帮助; • ……
企业面临的问题
• 经过多年的计算机应用和市场积累,许多 企业保存了大量原始数据和各种业务数据, 它是企业生产经营活动的真实记录
数据集成性
• 根据决策分析的要求,将分散于各处的源数据进行 抽取、筛选、清理、综合等工作,最终集成到数据 仓库中。

数据仓库基础培训

数据仓库基础培训

数据仓库的技术要求-ETL
• • 数据仓库的技术要求包含如下几个方面: ETL(Extract/Transformation/Load):用户从数据源抽取出所需的数据, 经过数据清洗、转换,最终按照预先定义好的数据仓库模型,将数据加载 到数据仓库中去;ETL是数据仓库系统中最重要的概念之一,ETL在一个 数据仓库系统项目中要花一半以上的时间。
2s
数据仓库概述
数据仓库的历史 数据仓库的基本概念 数据仓库的技术要求 数据仓库体系结构与设计 数据仓库的相关概念 数据仓库的项目过程
构造数据仓库的方法
• 构造数据仓库有两种方式:一是自上而下,一是自下而上。 • Bill Inmon先生推崇“自上而下”的方式,即一个企业建立唯一的数据 中心,就像一个数据的仓库,其中数据是经过整合、经过清洗、去掉脏 数据的、标准的,能够提供统一的视图。要建立这样的数据仓库,并不 从它需要支持那些应用入手,而是要从整个企业的环境入手,分析其中 的概念,应该有什么样的数据,达成概念完整性; • Ralph Kimbal先生推崇“自下而上”的方式,他认为建设数据仓库应 该按照实际的应用需求,加载需要的数据,不需要的数据不必要加载到 数据仓库当中。这种方式建设周期较短,客户能够很快看到结果。 • 二者都要达到同一个目标: 企业级数据仓库 • 实际上在建设数据仓库的时候,一般都参照这两种方式结合使用,没有 硬性规定。
• •
DB
OLTP系统
OLTP的特点: ·对响应时间要求非常高; ·用户数量非常庞大,主要是操作人员; ·数据库的各种操作基于索引进行。
数据仓库的历史-联机分析处理系统
• 联机分析处理系统(On-line Analytical Processing)OLAP系统:是基 于数据仓库的信息分析处理过程,是数据仓库的用户接口部分,它是数据 驱动、面向分析的。OLAP系统是跨部门、面向主题的 。

数据仓库培训课件

数据仓库培训课件

过程可能持续几个小时,从而消耗大量的系统资ຫໍສະໝຸດ 源。数据仓库培训课件
1、从数据库到数据仓库
人们逐渐认识到直接用事务处理环境来支持 DSS是行不通的。要提高分析和决策的有效性, 分析型处理及其数据必须与操作型处理及其数 据分离。必须把分析型数据从事务处理环境中 提取出来,按照DSS处理的需要进行重新组织, 建立单独的分析处理环境。
数据仓库培训课件
商品主题域:
商品固有信息:商品号,类别,单价,颜色,… 商品采购信息:商品号,类别,供应商号,供应日期,单价,数量, … 商品销售信息:商品号,客户号,数量,单价,销售日期, … 商品库存信息:商品号, 库房号,库存数量,日期, … )
采购子系统
销售子系统
库存子系统
数据仓库培训课件
数据仓库培训课件
第三类的分析工具可用于在大量的数据集合中, 找到有意义的数据趋势或者模式,而不是上面提 到的复杂数据查询。在数据分析过程中,尽管分 析者能够判定得到的数据模式是否有意义,但是 生成查询来得到有意义的模式还是很困难的。例 如,分析者查看信用卡使用记录,希望从中找出 不正常的信用卡使用行为,以表明是被滥用的丢 失的信用卡;商人希望通过查看客户记录找出潜 在的客户来提高收益。许多应用涉及的数据量很 大,很难用人工分析或者传统的统计分析方法进 行分析,数据挖掘的目的就是对这种大量数据的 分析提供支持。
✓ 数据仓库建模 ✓ 分析主题域 ✓ 确定粒度层次 ✓ 确定数据分割策略 ✓ 构建数据仓库 ✓ 数据的存储结构与存储策略 ✓ DSS应用编程
数据仓库培训课件
数据仓库与决策支持系统(DSS)
用户在进行决策制定时需要得到企业各方面的信息, 因此用户一般首先根据各个业务部门数据库中的数据, 创建数据仓库,存储各种历史信息和汇总信息。

数据仓库基础知识培训

数据仓库基础知识培训

站点B
局部数 据仓库
局部数 据仓库
局部数 据仓库
站点C
站点D

数据仓库的基本功能包含:数据抽取,数据筛选、清理,清理后的 数据加载,设立数据集市,完成数据仓库的查询、决策分析和知识 的挖掘等操作。 数据仓库的管理层分成数据管理与元数据管理两部分,主要负责对 数据仓库中的数据抽取、清理、加载、更新与刷新等操作进行管理。 数据仓库环境支持层包含数据传输和数据仓库基础两部分。 数据仓库基本功能层 数据仓库管理层 数据仓库环境支持层
数据访问量
对响应时间的 要求
每个事务只访问少量记 录
以秒为单位计量
有的事务可能要访问大量记录
以秒、分钟、甚至小时为计量 单位
定义: “一个面向主题的、集成的、随时间变化的、非易失性数 据的集合,用于支持管理层的决策过程”。 特性: 面向主题性 数据集成性 数据的时变性 数据的非易失性 数据的集合性 支持决策作用。

数据仓库 我们公司数据中心架构 指标、维度与报表和OLAP分析主题关系 名词解释及缩略语



随着信息技术的不断推广和应用,许多企业都已经在使用管理信 息系统处理管理事务和日常业务。这些管理信息系统为企业积累 了大量的信息。企业管理者开始考虑如何利用这些信息海洋对企 业的管理决策提供支持。因此,产生了与传统数据库有很大差异 的数据环境要求和从这些海洋数据中获取特殊知识的工具需要。 本章目标: (1)了解数据仓库的发展与展望 。 (2) 理解数据仓库的体系结构和参照结构。
数据仓库的数据归档、恢复及净化系统主要负责定期对数据仓库中 的数据进行归档、备份。净化系统则负责对从数据源所抽取的数据 进行数据的筛选、数据标准的统一、数据内容的统一等各种求精、 重整净化工作的管理。

数据仓库体系培训课件.pptx

数据仓库体系培训课件.pptx
数据存储·数据质量·元数据·安全
7
文思信息 版权所有,内部保密材料
BI环境内的数据架构
IT人员
高级分析人员 业务分析人员 决策用户
集市层
应用集市层 •面向应用的个性化定制。
指标库:规模指标、客户指标、盈利指标、风险指标等
汇总层
机构汇总 账户汇总
预连接/预处理 产品汇总
交易统计汇总
渠道汇总 客户汇总
管控平台
前端软件
前端软件
前端软件
前端软件
DM
信用卡 集市
DM
信贷集 市
DM
风险管 理集市
DM 。。。
ETL软件
ETL软件
ETL软件
ETL软件
SASB
YHT
CMS
PMS
。。。
4
文思信息 版权所有,内部保密材料
数据仓库典型体系架构(集中型-EDW)
前端软件(BIEE、Congnus、BO、Microstrategy)
4
应用用户、决策用户会访问特定应 用
……
业务人员通过设定业务检查规则来 3 明确模型可用性
业务部门人员多数需要常规报表供 日常呈报
…… 业务人员参考整合规则来验证业务 2 正确性
POWER USER通常需要访问第二层对 数据进行深入分析
……
1 审计/风险管理等需要未经加工的 业务原始数据
源数据质量检查规则、常规报告
EDW: •全部源系统的原始细节数据,不接 入派生和汇总数据。
ODS: •状态类数据保存当前最新数据 •日志类数据保存3个月 • 针对及其特殊的需要可以考虑 对数据保留一定时间段的历史
EDW: •一般最长在线保存7年。 •事件类数据在线保留时间会短 一些,13个月左右。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

BI概要介绍 山西移动业务介绍 山西移动经营分析系统
山西移动经分关键主题域
山西移动策略
市场为导向
山西移动策略
客户为中心
效益为目标
经分系统辅助完善业务策略制定以及业务策略执行
中国移动运营发展
移动经分建设背景
需要确定业务原因
企业运营需要
•周期冗长
新 的 报 表 要 求
失 去 •报表繁多 时 •信息不完整 间 意 •无法核对 义 数据上报
数据仓库基础培训
山西项目组 2010.6
Agenda
1 2 3 4
BI概要介绍 山西移动业务介绍 山西移动经营分析系统
山西移动经分关键主题域
BI是什么?
BI(Business Intelligence)即商业智能,是一种以计算机为工具,应 用决策科学及有关学科的理论与方法,以人机交互方式辅助决策者解决 半结构化和非结构化决策问题的信息系统。 最早在1996年提出,初期BI定义为一类由数据仓库(或数据集市)、 查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮 助企业决策为目的技术及其应用。目前,BI通常被理解为将企业中现有 的数据转化为知识,帮助企业做出明智的业务经营决策的工具。 商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术 层和战略层的决策 BI是数据仓库(DW)、联机分析处理(OLAP)和数据挖掘(DM)等技术的 综合运用,可看做一种解决方案。 在中国移动系统建设中,BI系统称之为经营分析系统。
OLAP(联机分析处理) 是使分析人员、管理人员或执行人员能够从多种 角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反 映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的 更深入了解的一类软件技术。
切片和切块(Slice and Dice) 钻取(Drill) 旋转(Rotate) ROLAP/MOLAP/HOLAP
① 上市业务公告 ② 企业管理决策 ③ 市场战略调整 ④ 绩效考核
⑤ 市场反应和主动营销
帐务
其它
数据
运营
移动经分建设背景
业务发展快,系统林立,数据分散缺
呼叫中心
乏统一标准,数据存在大量的不一致
大客户
由于信息不准确,不完整,无法实现
精确营销理念; 缺乏企业内部的信息共享架构,从整
BOSS
VGOP
BI厂商列表
下表列出了截止到2009年中国大陆地区的主要BI厂商
厂商
IBM Oracle Microsoft Informatica
产品及简介
DB2以及Cognos、SPSS、DataStage,覆盖BI全部领域 Oracle、Hyperion,覆盖BI全部领域,数据挖掘领域有待加强 SQLServer,覆盖BI全部领域,适合中小型企业,性价比高 Informatica,主要是数据集成领域
BI涉及技术-DW
数据仓库(DataWarhouse)是一个面向主题、集成、时变、非易失的数据集合,是支持管
理部门的决策过程。
面向主题(Subject Oriented)
1
集成(Integrated)
数据仓库通常是结合多个异种数据源构成的,异种数据源可能
数据仓库通常围绕一些主题,如“产品”、 “销售商”、“消费者”等来进行 组织。
国内BI厂商关注度
BI发展趋势
企业并购和重组仍将继续
操作型BI应用得到发展
MDM将在大型企业中逐步应用
数据分析从简单走向深入
BI企业将在垄断中不断新生
BI发展 趋势
数据集成应用得到重视
SAAS BI将得到快速发展
中小企业BI应用逐渐扩大市场份额
职业技能要求
技术人员
业务人员
1、Teradata数据库使用 2、熟练编写SQL及SQL优 化 3、ETL 4、OLAP 5、JAVA
1...* 0...* 设备信息 客户 1...* 1...* 0...* 用户
0...* 普通客户 大客户 集团客户
帐户
帐户域模型
用户
1
1...*
帐务关系
1...*
1
帐目
1...* 1 客户 帐户 1 1...* 账本
1...*
0...*
数据业务分类
按用户划分
个人数据业务
短信,彩信,彩铃,飞信,GPRS,手机报,来电显示,来电提醒,语言信箱,手机邮箱,pushmail,语音杂志 ,号簿管家,随E行,WLAN业务等。
1、熟练掌握移动业务 2、业务分析方法 3、沟通表达能力 4、文档能力
Agenda
1 2 3 4
BI概要介绍 移动业务介绍 山西移动经营分析系统
山西移动经分关键主题域
营业总体数据流图
实时帐务 信用管理 欠费提醒 业务受理 用户 业务变更 缴费 积分管理 销帐 帐单 三户资料 订单管理 黑名单管理 统一开通
BI涉及技术-DM
数据挖掘(Data Mining)是从数据中自动地抽取模式、关联、变化、异 常和有意义的结构。 数据挖掘大部分的价值在于利用数据挖掘技术改善预言模型。
关联 分类 聚类 决策树 神经网络
BI发展方向
第一阶段: 第二阶段: 第三阶段 第四阶段:
第五阶段:
集团数据业务
集团彩信、无线PBX、集团VPMN、企业信息机、BLACK Berry、IDC、企业随E行、农信通、银信通、航信通 、校信通等。
按通讯信道划分
语音增值业务
彩铃、来电显示、来电提醒、主叫隐藏、电话会议、语音信箱、语言秘书、语言杂志(IVR)
SMS信道
短信,梦网短信,银信通/航信通/校信通等
CSD信道 CSD手机上网
无线数据业务信道 GPRS/EDGE/3G
WLAN/WiMAX
Wlan、随e行、企业随e行、wlan无线互联网等。
GPRS无线互联网、WAP手机上网、彩信(MMS)、手机报、飞信、pushmail、手机邮箱等,无线DDN等。
数据业务分类(续)
按合作运营方式
包括关系数据库、面向对象数据库、文本数据库、Web数据库、
2
数据仓库关注的是决策者的数据建模与分析, 一般文件等 而不针对日常操作和事务的处理。因此,数
据仓库提供了特定主题的简明视图,排除了 对于决策无用的数据
4
DW特点
时变(Time Variant)
非易失(Nonvolatile)的数据集合
数据存储从历史的角度提供信息,数据仓库中 包含时间元素,它所提供的信息总是与时间相 关联的。数掘仓库中存储的是一个时间段的数
HLR
集团规范定义的三户模型
客户与客户关系
1..* 1..* 客户与用户关系 客户 1 1..* 1 0..* 帐户
用户与用户关系 1..* 1..* 用户 1 1..* 1 1..* 1..* 0..* 1..* 帐务关系
品牌
0..1
1..* 订购信息 0..*
0..*
1 产品与品牌关系 1..* 产品 1 帐目
BI行业应用
制造、零售行业 保险、能源、烟草、政务行业 金融、电信
40%
30%
30%
国内BI行业前景
金融:在BI领域投资稳步增长,每年均有大量的BI需求,操作型BI应用越来越广泛,尤其 是信贷评审领域。中小型银行BI需求也不断涌现,未来将是金融行业BI市场的主要增长 点。在未来5年时间里,BI应用在金融行业仍将高速发展。 电信:电信行业信息化程度很高,对信息化依赖很强,积累了大量的数据,具有实施商业 智能项目的基础条件和资金实力。电信行业对于BI深入应用是最渴望的,在话费套餐设 置、客户潜力分析等都需要数据挖掘技术来提供决策依据。在这些行业,实力雄厚的BI厂 商已占据有利的地位。 保险:大型保险公司中基本已经建立商业智能相关系统,并发挥了一定的作用。但是随着 新业务的推出,系统地后期开发和维护仍然需要大量的投资。据ChinaBI了解,中小型保 险公司也还有待加强商业智能系统的建设。 能源:石油和电力等能源行业的企业,均是国有大型企业,基本上已经实施了商业智能系 统,但是还有待深入挖掘商业智能的价值。这些企业的省市分公司,将会不断有新的需求 涌现,发展潜力较大。
希望发生什么?
发生了什么? 为什么会发生? 将会发生什么?
正在发生什么?
战略与战术的结合
主要是批处理 统计查询
动态查询 分析功能 逐渐增加
分析预测 挖掘模型
持续数据更新及 快速响应查询
事件驱动
BI的建设是一个过程,而不是一个项目
统计 分析查询 分析预测 持续数据更新和 快速查询 事件驱动
国内BI行业应用
国内BI行业前景
烟草:各地烟草企业已经建立很多商业智能系统,但是还有更大的空白市场。烟草公司项 目建设难度低、利润大,应用前景不错。 政务:商业智能在电子政务中的应用,更多的涉及到报表填制、数据统计,需要报表系统 能很好的满足中国特色报表的要求。一般采用自上而下的市场推广手段会前景广阔。 航空:国内的航空公司,也在逐步深入BI系统的建设。 制造:制造业的企业信息化水平参差不齐,有些大中型企业已经成功使用商业智能技术, 但是大部分企业基础信息化水平仍未达到,随着这些企业的信息化水平逐步提高,建设商 业智能系统的需求也会随之而来。随着金融危机的度过和国内经济的恢复,制造业将是未 来商业智能新的增长点。 零售:一些大型的超市、百货、电器、手机等销售企业,绝大部分已经实现了连锁,基础 信息化建设程度高,商业智能技术已经应用较广泛,未来还有进一步的应用空间 据ChinaBI预测,未来商业智能在各行业均稳定发展,新的利润增长点主要 集中于金融和制造业。
个企业范围来看,存在信息孤岛的隐患
数据->信息->知识的有效转化较少, 并且分析结果不能有效地反馈回操作环
相关文档
最新文档