数据仓库开发实例-PPT

合集下载

《数据仓库》PPT课件 (2)

《数据仓库》PPT课件 (2)
数据仓库体系结构
数据库系统模式(操作型数据)
采购子系统: 订单(订单号,供应商号,商品号,类别,单价。数量,总金额,日
期, … ) 供应商(供应商号,供应商名,地址,电话,…)
销售子系统: 客户(客户号,姓名,地址,电话, … ) 销售(客户号,商品号,数量,单价,日期, … )
库存子系统: 进库单(编号,商品号,数量,单价,日期, … ) 出库单(编号,商品号,数量,单价,日期, … ) 库存(商品号, 库房号,类别,单价,库存数量,
21
第2章 数据仓库
数据仓库体系结构
数据源
数据仓库
RDBMS 数据文件
其他
综合数据 当前数据 历史数据 元数据
分析工具 查询工具 OLAP工具 DM工具
抽取、转换、装载
精选ppt
22
第2章 数据仓库
数据仓库体系结构
数据仓库体系结构实例-税务数据仓库
数据源
ETL
数据存储
数据访问 数据展示
生产 数据库
数据集市
EXCEL
数据仓库
5-10 年
当前 详细数据
过去 详细数据
精选ppt
25
第2章 数据仓库
数据仓库体系结构
数据仓库数据的组织
• 数据由操作型环境(综合)导入数据仓库 • 数据具有不同的细节
早期细节级(过期数据) 当前细节级 轻度综合数据级(数据集市) 高度综合数据级
精选ppt
26
第2章 数据仓库
多渠道
社保库
遗留系统 数据库
E
外部 数据源
数据复制 平台
转换 T 中转区
L 加载 中转区
文档 数据
地市库
个税库

数据仓库开发模型ppt课件

数据仓库开发模型ppt课件
amou_mone
agelevel_id time_id year_id month_id
geo_id prov_id city_id county_id produ_id amou_mone
全连接结果
time_id year_id month_id
produ_id
agelevel_id time_id geo_id produ_id
d 概括与聚集:向需要概括总数的数据中增加新的数值。 d 预算与推导:创建附加的数据字段。 d 转换与再映像:把数据源信息转化为适合于数据仓库事
实表行的过程以及将许多表组成事实表行的过程。
42
2.5.3 元数据的收集
v 元数据遍及数据仓库中的任何地方和环境中,因此元数据的收 集过程应尽量采用自动收集方式进行。
48
2.6.4 聚集模型的处理
v 聚集事实表已经独立存在并且可以与基本事实表一同保存。 v 通过将当前加载数据添加到系统中的累积“桶”中 ,可以创建
某时间短的聚集。 v 将数据的聚集与数据仓库的加载过程组合为同一处理过程 。 v 在将数据仓库数据加载以后,再进行聚集处理 。 v 每次在加载数据仓库数据时,都需要对各种聚集进行计算和
34
2.5 数据仓库的元数据模型
35
2.5.1 元数据的类型与组成
v 元数据是数据的数据,是对数据仓库中的各种数据的详细 的描述与说明。
v 根据元数据在数据仓库中所承担的任务,可以将元数据分 成静态元数据和动态元数据两类。
v 静态元数据主要与数据结构有关;动态元数据主要与数据 的状态和使用方法有关。
增加,及时保持聚集与基本数据的同步性 。
49
2.6.5 聚集模型的管理
v 要根据使用情况删除不经常使用的聚集 。 v 需要减少层次过于接近的聚集生成 。 v 注意将聚集独立存储在自己的事实表中,便于用户直接进

《数据仓库》课件 (2)

《数据仓库》课件 (2)
数据仓库PPT课件 (2)
本课程将介绍数据仓库的定义、架构和应用,以及未来发展趋势和实现要点。
什么是数据仓库
定义
数据仓库是为了支持企业决策而设计的一种面向主题的、集成的、随时间变化而存储的数据 集合。
特点
数据仓库通过ETL过程,将分散的、异构的数据整合在一起,便于数据分析和决策支持。
区别
相比传统的OLTP系统,数据仓库更侧重于历史数据的存储和分析,而不是实时的事务处理。
数据仓库的架构
三层架构
数据仓库通常采用三层架构:数据 源层、数据存储层和数据展示层。
星型模式
维度建模是一种常见的数据仓库设 计方法,其中以某个业务过程为中 心的表称为事实表,以事实表中记 录所描述的业务过程为主题的表称 为维度表。
存储技术
数据仓库的存储技术包括关系型数 据库、列式存储和NoSQL数据库等 多种形式。
数据仓库的案例
银行信用卡分析数据仓库
银行为了管理信用卡业务和客 户信息,建立了基于数据仓库 的信用卡分析系统。
零售企业销售数据仓库
零售企业通过数据仓库实现对 商品销售、客户关系和供应链 的管理和分析。
航空公司航班数据仓库
航空公司通过数据仓库对航班、 机票销售、客户关系等数据进 行分析,提高运营效率和服务 水平。
数据仓库的应用
数据分析与决策支持
数据仓库为企业提供决策支持所需 的数据平台,包括数据分析、数据 挖掘、业务智能等多个方面。
大数据、云计算与数据仓库
数据仓库在大数据和云计算时代呈 现全新发展趋势,例如基于云计算 的数据仓库服务、数据湖等。
数据仓库的发展趋势
数据仓库的发展趋势包括数据仓库 自动化、流数据仓库、企业级数据 智能等多个方面。

数据仓库应用实例培训课件(ppt 50张)

数据仓库应用实例培训课件(ppt 50张)


• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
46.凡事不要说"我不会"或"不可能",因为你根本还没有去做! 47.成功不是靠梦想和希望,而是靠努力和实践. 48.只有在天空最暗的时候,才可以看到天上的星星. 49.上帝说:你要什么便取什么,但是要付出相当的代价. 50.现在站在什么地方不重要,重要的是你往什么方向移动。 51.宁可辛苦一阵子,不要苦一辈子. 52.为成功找方法,不为失败找借口. 53.不断反思自己的弱点,是让自己获得更好成功的优良习惯。 54.垃圾桶哲学:别人不要做的事,我拣来做! 55.不一定要做最大的,但要做最好的. 56.死的方式由上帝决定,活的方式由自己决定! 57.成功是动词,不是名词! 28、年轻是我们拼搏的筹码,不是供我们挥霍的资本。 59、世界上最不能等待的事情就是孝敬父母。 60、身体发肤,受之父母,不敢毁伤,孝之始也; 立身行道,扬名於后世,以显父母,孝之终也。——《孝经》 61、不积跬步,无以致千里;不积小流,无以成江海。——荀子《劝学篇》 62、孩子:请高看自己一眼,你是最棒的! 63、路虽远行则将至,事虽难做则必成! 64、活鱼会逆水而上,死鱼才会随波逐流。 65、怕苦的人苦一辈子,不怕苦的人苦一阵子。 66、有价值的人不是看你能摆平多少人,而是看你能帮助多少人。 67、不可能的事是想出来的,可能的事是做出来的。 68、找不到路不是没有路,路在脚下。 69、幸福源自积德,福报来自行善。 70、盲目的恋爱以微笑开始,以泪滴告终。 71、真正值钱的是分文不用的甜甜的微笑。 72、前面是堵墙,用微笑面对,就变成一座桥。 73、自尊,伟大的人格力量;自爱,维护名誉的金盾。 74、今天学习不努力,明天努力找工作。 75、懂得回报爱,是迈向成熟的第一步。 76、读懂责任,读懂使命,读懂感恩方为懂事。 77、不要只会吃奶,要学会吃干粮,尤其是粗茶淡饭。 78、技艺创造价值,本领改变命运。 79、凭本领潇洒就业,靠技艺稳拿高薪。 80、为寻找出路走进校门,为创造生活奔向社会。 81、我不是来龙飞享福的,但,我是为幸福而来龙飞的! 82、校兴我荣,校衰我耻。 83、今天我以学校为荣,明天学校以我为荣。 84、不想当老板的学生不是好学生。 85、志存高远虽励志,脚踏实地才是金。 86、时刻牢记父母的血汗钱来自不易,永远不忘父母的养育之恩需要报答。 87、讲孝道读经典培养好人,传知识授技艺打造能人。 88、知技并重,德行为先。 89、生活的理想,就是为了理想的生活。 —— 张闻天 90、贫不足羞,可羞是贫而无志。 —— 吕坤

《数据仓库开发实例》课件

《数据仓库开发实例》课件
数据仓库是随时间变化的
数据仓库中的数据会随着时间的推移 不断更新和变化,反映企业的业务发 展和变化。
数据仓库的体系结构
数据源
数据仓库的数据来源程,将数据从源系 统加载到数据仓库中。
数据仓库
存储和管理企业数据的核心部分,包括事实 表和维度表。
根据逻辑设计和物理设计,开发ETL过程,实现数据的抽取、转换和加载。
开发查询和管理工具
开发数据仓库的查询和管理工具,方便用户对数据进行查询和管理。
测试和验证
对数据仓库进行测试和验证,确保数据的准确性和完整性。
PART 03
数据仓库开发实例
REPORTING
实例一:零售业数据仓库
总结词:销售分析
详细描述:该实例展示了如何构建一个零售业数据仓库,用于分析销售数据,包 括商品类别、销售量、销售额等指标,以及如何利用数据仓库进行市场趋势预测 和销售策略优化。
总结与展望
REPORTING
数据仓库开发的总结
01
技术应用
随着大数据时代的来临,数据仓库技术得到了广泛应用。 在本次开发实例中,我们采用了先进的数据处理和分析技 术,实现了高效的数据存储、查询和分析。
02 03
业务价值
数据仓库在业务领域中具有重要价值,它能够帮助企业更 好地理解客户需求、优化业务流程、提高决策效率。通过 本次开发,我们成功地将数据转化为有价值的业务信息, 为企业提供了决策支持。
OLAP
联机分析处理,通过多维数据分析工具对数 据仓库中的数据进行查询和分析。
PART 02
数据仓库开发流程
REPORTING
需求分析
1 2
明确目标
理解业务需求,确定数据仓库的构建目标。
调研现状

数据仓库的开发流程PPT课件

数据仓库的开发流程PPT课件
第7页/共53页
原型法
第8页/共53页
数据仓库的开发流程
规划 与确定 需求
开发 概念 模型
开发 逻辑 模型
规划分析阶段
设计 体系 结构
数据库 与元数
据设计
数据 仓库 评价
数据仓库 使用维 开发过程 护阶段
设计实施
阶段
确定 数据源
抽取
数据
仓库 维护
数据 仓库
填充与 测试数
开发 中间件
应用
据仓库
第9页/共53页
第52页/共53页
数据仓库的开发流程
数据仓库系统的开发是一个经过不断循环、 反馈而使系统不断增长与完善的过程,这 也是原型法区别于系统生命周期法的主要 特点。
第10页/共53页
数据仓库的设计步骤
概念模型设计 技术准备工作 逻辑模型设计 物理模型设计 数据仓库生成 数据仓库使用与维护
第11页/共53页
数据仓库的设计步骤
第43页/共53页
举例
零售个性化系统。 在系统中,客户阅读到由零售商编制的目录或 宣传广告后促使他有了购买的念头,或者至少 想查询一下目录,结果是给零售商打电话。
第44页/共53页
举例
第45页/共53页
举例
当客户定货或咨询情况时,零售商代表查出一 些与此有关的其他信息,如: 客户上次购物的时间; 上次购物的类型; 客户所属的市场地段。
帮助得到目标系统明确而严格的需求,促进客 户和各阶段系统人员之间的相互有效的信息交 流,并以此为基础进行需求分析和系统设计。
从本质上看,原型是未来目标系统的一个模型。
第6页/共53页
原型法
原型不是系统开发的最终产品,而是在某 个开发阶段中为达到一定的目的所生成的 系统简化模拟版本;

《数据仓库技术》课件

《数据仓库技术》课件

数据质量参差不齐
数据来源多样,数据质 量难以保证,需要进行
数据清洗和校验。
数据分析需求多变
不同部门和业务场景对 数据分析的需求各不相 同,需要灵活地调整数 据仓库架构和查询方式

应对策略
采用分布式存储和计算 技术,提高数据存储和 处理能力;建立数据质 量管理体系,确保数据 质量;提供灵活的数据 仓库架构和查询方式, 满足多变的分析需求。
大数据时代的挑战与机遇
挑战
随着大数据时代的来临,数据量呈爆 炸式增长,如何高效地存储、处理和 分析这些数据成为数据仓库面临的挑 战。
机遇
大数据时代为数据仓库技术的发展提 供了广阔的空间,通过技术创新和优 化,数据仓库能够更好地应对大数据 的挑战,为企业提供更有价值的数据 分析服务。
数据仓库技术的未来发展
云端部署
AI与数据仓库的结合
随着云计算技术的成熟,数据仓库将 逐渐向云端迁移,以提高可扩展性和 灵活性。
人工智能技术的不断发展将为数据仓 库带来更多智能化功能,如自动分类 、预测等。
实时分析
随着对数据实时性的需求增加,数据 仓库将加强实时分析功能,提高数据 处理速度。
数据仓库与其他技术的结合
数据仓库与大数据技术的结合
OLAP技术
多维数据分析
OLAP支持多维数据分析,这意味着用户 可以从多个角度和维度(如时间、地点、
产品类别等)来分析数据。
A OLAP技术概述
OLAP是一种用于分析大量数据的工 具和技术,它允许用户通过多维数 据分析来深入了解数据的不同方面 。
B
C
D
可视化工具
OLAP系统通常提供各种可视化工具,如 仪表盘、报表、图表等,以帮助用户更好 地理解数据和分析结果。

数据仓库的设计与开发ppt课件

数据仓库的设计与开发ppt课件
▪ 数据仓库是多维数据库,它扩展了关系数据库模 型,以星形架构为主要结构方式的,并在它的基 础上,扩展出理论雪花形架构和数据星座等方式, 但不管是哪一种架构,维度表、事实表和事实表 中的量度都是必不可少的组成要素。
精选编辑ppt
20
1)星形模型
▪ 星形模型是最常用的数据仓库设计结构的 实现模式。
▪ 星形模式通过使用一个包含主题的事实表 和多个维度表来支持各种决策查询。
例: 在商品销售分析DW模型中,商品的销售数量、金额、企业利润等是分析数据; 销售的时间、地点等使用户感兴趣的描述数据; 销售产品的详细情况、购买商品的客户详细情况等是细节数据。
(2) 数据的历史变迁性。DW的数据模型增加时间属性作 为码的一部分
(3) 数据的概括性。DW的数据模型中增加了一些衍生数
供应商品 信息
供应商 编号
供应商固 有信息
商品固 有信息
商品库 存信息
商品销 售信息
日期
供应商
供应
商品
商品采 购信息 商品号
日期
日期
顾客号 精选编辑ppt
购买 顾客
顾客购 物信息
顾客固 有信息 19
2. 逻辑模型设计
▪ 关系数据库一般采用二维数据表的形式来表示数 据,一个维是行,另一个维是列,行和列的交叉 处就是数据元素。关系数据的基础是关系数据库 模型,通过标准的SQL语言来加以实现。
精选编辑ppt
2
思考:
▪ 沃尔玛的数据仓库是怎样建成的?
精选编辑ppt
3
教学目标
▪ 掌握
➢ 数据仓库的设计和开发方法 ➢ 数据模型的设计 ➢ 维度设计 ➢ 粒度设计 ➢ 数据仓库的开发步骤
精选编辑ppt
4

数据仓库系统的设计及开发PPT课件

数据仓库系统的设计及开发PPT课件

3
数据仓库建模人员所需的技能和能力
• 分析能力
见树又见林 模拟 论证
• 学习能力
抽象 综合
• 交流能力
组交互 演示 调查访谈
• 原型设计能力
• 企业体系架构
2020/4/27
版权所有:天津市易普际科技发展有限公司
4
数据仓库设计建模的要点和原则
建模原则 •选择创建什么模型对如何动手解决问题和如何解决
概念模型的设计是为逻辑模型的设计做准备,它没有统一的标准,主要根据设计 者的经验。
• 逻辑模型设计(Logical Data Modeling):
分别对概念模型的各个主题域进行细化,根据业务定义、分类和规则,定义其中的实体并描 述实体之间的关系,并产生实体关系图(ERD),然后遵照规范化思想在实体关系的基础上明 确各个实体的属性。实体产生于中国移动开展的业务、服务及其涉及的对象(如客户、帐户、 员工、机构、资源),实体间的对应、约束关系则来自于各业务过程中的规则。可以说,这
• 物理建模,生成物理模型,主要解决,逻辑模型针对不同 关系型数据库的物理化以及性能等一些具体的技术问题。
2020/4/27
版权所有:天津市易普际科技发展有限公司
7
思考
•需求建模与业务建模
•需求建模与业务建模谁先谁后?
•软件开发过程是否应该是:业务调研,业务建模 (业务分析),(业务模型分析)需求调研(这时,已 经有一部分需求可从业务模型中获得), 需求建模, 需求分析……
• 心得体会: • 看到背后的商业需求,你会发现模型原来非常稳定 • 不需要急于知道所有的细节性的需求,只要了解比较重要的20%的需求
2020/4/27
版权所有:天津市易普际科技发展有限公司

数据仓库实例课件

数据仓库实例课件
数据仓库实例课件
2.需求分析
◦ AdventureWorks数据库设计的方面很多,但是我们的目标 很简单,只有以下三个:
需要分析不同类别的产品通过直销在不同地区、不同时间段 内销售的业绩。
生成分析结果的报表。 分析影响客户所有车的数量的因素。
数据仓库实例课件
◦ 通过目标可以发现分析销售业绩基于的维度有三个:产品、客户和 时间,事实数据则为反映销售业绩的订单。
设计包的方法是从工具箱中将需要使用的容器、任务、可执行体等 工具拖拽到包的SSIS设计器窗口中,再对这些对象进行设计。
由于主要执行的是数据抽取工作,因此数据流任务是我们主要设置 的任务。
数据仓库实例课件
分析服务(Analysis Services) SQL Server 分析服务(SSAS)是一个用于分析数据仓库中数据的工
具,它包括了OLAP和数据挖掘工具。在SQL Server 2005数据库系统 中,Analysis Services工具以服务器的方式为用户提供管理多维数 据立方体的服务。Analysis Services可以把数据仓库中的数据组织 起来,经过预先的聚集运算,加入到多维立方体中(即建立立方体), 然后对复杂的分析型访问做出迅速的回答。
◦ 对于事实数据,我们只会关心订单中产品的价格、折扣、数量和总 价的情况。
◦ 可以得到如下需求分析模型:
数据仓库实例课件
◦ 分析模型的事实表、维度表关系
数据仓库实例课件
3.数据转换和抽取(建立数据仓库) ◦ (1)首先使用Microsoft SQL Server Management Studio新建一个 数据库Sales_DW作为数据抽取的目标数据库,AdventureWorks作为 源数据库。 ◦ (2)新建Integration Services 项目Integration Sales,并在此 项目中新建一个SSIS包Integration Sales.dtsx,在此包中进行数 据的抽取,整合等操作。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库开发应用实例
1
主要内容:
• 数据仓库的需求分析 • 数据仓库概念模型构造 • 数据仓库逻辑模型设计 • 数据仓库元数据设计
2
实例背景
• 某大型连锁超市的业务涵盖于3个省范围内的1000多家 分店。每个分店都有较完整的日用品和食品销售部门, 包括百货、杂货、冷冻食品、奶制品、肉制品和面包 食品等,大约5万多种,其中大约45000种商品来自外 部生产厂家,并在包装上印有条形码。每个条形码代 表了唯一的商品。
5
超市销售数据仓库的需求分析
• 3超市商品采购分析
• 超市在商品采购工作中需要分析哪些商品是热销的商 品,尽可能采购销售热销商品。热销商品往往是加快 企业资金流动的动力,快速流动的资金可以使企业在 一定的时间内取得比其他企业更多的利润。而且超市 营销管理人员在了解热销商品后,可以大量采购热销 商品,重新安排热销商品的货架,向更多的客户推销 热销商品,便于更多客户的购买,以进一步加快企业 资金的流动。
• 超市客户的流失,意味着企业赢利的降低。企业管理 者希望了解哪些客户可能会流失,使企业能够提前设 法加以挽留。
7
超市销售数据仓库概念模型构造
• 数据仓库设计中就首先考虑营销主题的设计,确定超 市营销主题模型
• 采用了星型模型,没有采用雪花模型。因为雪花模型 通过对维表的分类细化描述,对于主题的分类详细查 询具有良好的响应能力。但是雪花模型的构造在本质 上是一种数据模型的规范化处理,会给数据仓库操作 带来不同表的连接困难 。但是在对维度表进行维护时, 可能需要对大量重复值进行修改。
14
• 纪元表示法采用从某纪元开始连续对日期进行计数的方法 来给出日期编号,在表中还可以给出“星期”与“月份” 的绝对编号列。这些数据支持跨年度跨月份的简单数据运 算。在生成报表时,经常要给出像“一月”这样的月份名 称。因此,为报表确定一个“年月”(YYYY-MM)列标题 也有必要。报表中很可能需要季度编号(Q1,…,Q4) 或 年季度编号列。如果企业的财政年度与日历表在周期上不 一致,还需要为财政年度给出类似列。
• 商品销售单价对于计算商品利润十分重要,但将某个商品一段 时间内的所有销售单价相加是毫无意义的。管理人员可能只对 某一时间段内某个商品的平均销售价感兴趣。平均销售价格可 以用该时间段内的商品销售额除以商品销售量获取。在事实表 中可以不用商品销售单价,代之以商品销售额,销售额也常常 是管理人员衡量营销策略好坏的重要指标。
6
超市销售数据仓库的需求分析
• 4超市客户关系分析
• 用80:20理论分析,占企业客户群20%左右的客户购 买金额往往占据了企业销售金额的80%。对客户群体 的划分有利于企业了解企业的主要客户群体状况、主 要客户群对企业销售服务的需求状况、不同客户群为 企业所带来的利润状况。
• 在对客户进行类型划分的基础上,可以针对不同客户 群体的特点采用不同的营销策略,对客户群体的消费 进行合理的引导。
• 在“节假日”列中给出“节假日”或者“非节假日”的内 容,维表属性作为数据分析的导航,简单地在“节假日” 列中给出“Y”或者“N”对数据分析没有多大用处。例如, 在生成某种商品的节假日与非节假日销售情况比较查询时, 列中给出“节假日”或者“非节假日”这样有意义的值要 比一个简单的“Y”或者“N”之类的值有用得多。
• 超市不同商品的销售利润是有差别的。希望在数据仓 库中通过对商品的赢利分析,了解不同商品的销售赢 利状态,以确定企业的销售重点,对那些可以为企业 带来较大赢利的商品加大促销力度。
4
超市销售数据仓库的需求分析
• 2超市商品库存分析
• 超市商品的库存状况对超市的利润具有巨大的影响。 超市如果能够在合适的时候销售合适的商品,在不出 现脱销的情况下尽可能减少商品库存的库存成本,是 超市商品库存分析的主要目的。在商品库存分析中, 管理人员还经常要根据商品的库存量和商品库存成本 确定商品的销售价格。从超市的商品库存情况来看, 库存分析实质上是对超市的价值链进行分析,分析商 品库存在超市的整个价值链上所发挥的作用。
• 分析超市高层管理人员通过那些角度,即需要 通过那些维度来考察、选择营销方案。一般情 况下,在确定超市营销策划时,超市管理人员 需要通过日期、商品、分店、促销和客户五个 维度对促销方案进行分析,了解促销方案的可 用性和效果
10
超市营销数据仓库事实表模型
日期维 日期关 键字
分店维 分店关 键字
超市营销主题 日期关键字 分店关键字 客户关键字 商品关键字 促销关键字 商品销售编号 商品销售量 商品销售额 商品成本 商品销售利润
12
超市营销数据仓库事实表模型
• 超市管理者还可能对商品销售的利润率感兴趣, 该数据可以用商品销售利润除以销售额获得, 该数据不是一个可加数据。将比率或百分数的 数据进行相加,所获得的数据是没有什么意义 的。管理人员在了解某一时期某些商品的利润 率时,完全可以利用该时期该商品利润和销售 额获得。
• 因此,事实表中确定度量数据为商品销售量、 商品销售额、商品成本和商品销售利润。
• 在连锁超市所使用的分店维表中有建筑面积、金 融服务、最早开业时间等描述特定分店的文字描 述。描述销售面积的列应该是数字型的,并且在 理论上是跨分店可相加的,以表示某一地区的销 售面积。它是分店的一个不变属性,通常作为报 表约束或者行标题使用。而且为了能够分析不同 种类商品对超市销售利润的贡献情况,还需要设 立不同商品的销售面积。
16
17
18
2.商品维
• 一般超市分店可能存储60000个商品编号,但大型连锁超 市保留不再销售的历史商品营销方案情况,商品维度可 能至少需要150000行乃至多达百万行。
• 商品维度数据主要来源于业务系统的商品主文件。超市 总部对所销售商品的主文件进行统一管理。
• 商品主文件的一个重要作用,就是维护每个商品存储标 志的许多描述属性。商品维是一组重要的属性。
• 超市的促销维度可以包含促销名称、减价类型、促销媒体类 型、广告类型和优惠券类型等。超市的主要促销方式是降价、 广告、柜台展销与优惠券。如果将这些因素分别建立促销维 度,就可以记录分析这些促销方法非常相似的信息,使用户 更加容易理解促销方案的作用。但是将所有的促销因素合并 在一个维表中,则能够方便用户的浏览,能够弄清各种不同 的价格降低、广告、展销与优惠券是如何在一起共同发挥促 销作用的。
• 某个商品种类包含多个商品子类,商品子类包含多个商 标,商标包含多个商品存储标志。
• 还应包含描述商品形状或存储位置的层次属性,例如商 品的包装类型、包装尺寸、包装数量、托盘中的包装数, 以及与商品存储的层次:存储类型、货架结构等维度。
19
3.分店维
• 分店维表用于描述超市的各个链锁店。分店维表 是基本的地理维度,每个分店可被看成一个位置。 这样,可以由分店形成诸如街道、邮政编码、县、 市、省这样的任意地理属性。地理体系与分店地 区体系对每个分店来说,都有良好的定义。
13
超市数据仓库维表模型设计
• 1.日期维
• 日期维模型是许多数据仓库应用中的常用维度,其设 计方式与其他多数维模型有差别。具体设计时,日期 维可以存放以日期表示的5到10年的数据行,也可以将 3至4年的数据行作为日期维内容。如果对10年的每一 天都进行存储,也只需要3650行
• 日期维的每列由行所代表的特定日期进行定义。“星 期”列含有像“星期一”这样的名称内容,该列可用 于创建比较“星期一”与“星期日”销售情况对比的 查询。日历日期编号从1开始取值,然后根据月份的情 况取到28、29、30或者31,这一列主要用于对每个月 的同一天进行比较。同样,可以给出日历周编号、和 日历月编号(1,…,12)。
15
• “星期六”与“星期日”要归入“周末”之列。当然,可 以对多个日期表属性进行共同约束,从而能够实现一些 像平日假期销售与周末假期销售进行比较的数据仓库应 用。
• “销售时节”列应设置为销售时节的名称,例如,春节、 情人节、端午节、五一节、国庆节、中秋节、重阳节、 圣诞节、或者标为“不是”。
• “重大事件”列与“销售时节”列情形类似,可以标记 为“周日大采购”或者“中秋合家欢”这样与日期有特 殊联系的促销事件。而一般性的促销活动通常不放在日 期表中处理,以促销维表的形式进行更加完整的描述。 因为促销事件并不是仅仅由日期来定义,通常还需要由 日期、商品与商店的组合来定义。
客户维 客户关键 字
商品维 商品关 键字
促销维 促销关 键字
11
超市营销数据仓库事实表模型
• 从销售系统中可直接获取商品销售量、销售单价、商品成本。 但管理人员考察超市的营销策略时,需要考虑营销策略和相应 的商品销售利润。商品销售利润可以直接通过商品销售量、销 售单价和商品成本计算获得,但商品销售利润具有良好的可加 性,管理人员又经常需要查看。将利润数据存放在事实表中可 大大减少数据仓库工作时的工作量,还可以保证所有用户在使 用商品销售利润这一重要数据时的一致性。
21
4.促销维
• 在促销维度中为促销出现的每种组合都建立一行记录是很有 意义的。在一年的销售活动中,可能出现1000个广告,5000 次临时降价和1000次柜台展销,但可能只有10000个组合促销 能影响任何特定的商品。例如,在某给定维度中,大多数分 店都会同时运作所有促销售手段,而只有少数几个分店不进 行柜台展销。在这种情况下,就需要两个单独的促销记录行, 一个用于通常的降价并外加广告与柜台展销,而另一个用于 降价并外加单纯的广告。
• 性别、婚姻状况、家庭人口、住房条件和自有汽车情 况均是超市销售管理人员对超市营销策略进行分析的 主要依据。出于超市营销策略制定的考虑,还需要了 解客户的日常活动范围,以便有针对性地进行促销广 告的发送。
23
超市数据仓库元数据设计
销售主题元数据
24
销售事实元数据
25
销售事实元数据
26
相关文档
最新文档