数据仓库-数据建模过程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

目录

一、数据仓库建模模式: (1)

1.自顶向下: (1)

2.自底向上: (1)

二、数据仓库设计重点步骤: (1)

1.概念模型设计(客观世界->主观世界) (1)

1)业务数据理解和需求分析; (1)

2)分析主题和元数据; (1)

2.逻辑模型设计(主观世界->关系模型) (3)

1)事实表及其度量和粒度确定; (3)

2)维度确定; (3)

3.物理模型设计(关系模型->存储模型) (5)

1)数据仓库的物理存储方式 (5)

三、cube展示 (5)

一、数据仓库建模模式:

1.自顶向下:

先通过ETL将数据汇集到数据仓库中,然后再通过数据复制的方式推进各个数据集

市;

2.自底向上:

先通过ETL将数据汇集到数据集市中,然后再数据复制的方式提升到数据仓库中;

二、数据仓库设计重点步骤:

1.概念模型设计(客观世界->主观世界)

1)业务数据理解和需求分析;

如:这次我主要针对营帐中的应收金额做简单的数据模型,主要分析应收金额,

从各个维度去分析和了解应收金额的情况;

2)分析主题和元数据;

a)

转换为星型图为:

b)主题和元数据

主题:分析应收金额

元数据:表格中分析出的的维度,类别层次以及度量都属于元元素

元数据:定义了数据仓库中的许多对象—--表,列,查询,规则以及数据仓库内部的数据转移;

2.逻辑模型设计(主观世界->关系模型)

1)事实表及其度量和粒度确定;

根据对应收的分析,分析出事实表(主键+外键+度量字段)和粒度

注:设计事实表时,尽量的使事实表尽可能的小,可以提高事实表的处理,备份以及查询的性能,可通过减少列的数量,降低列的大小等方式。

如果事实表的数据量过大,可以采用数据分割的方式,将数据按照一定的规

则分割,如可以按照时间按月来分割成多个部分,或者按年来分割,来降低数

据量。

度量值:应收金额

粒度:取的是精确到天。

事实表:FACT_RPT_AI

字段如下:

SEQNO 序列号

CREATETIME 创建日期

AIMONTH 归属月

AI_NO 费用表外键

OPID 操作员表外键

ORGID 组织结构表外键

CUSTID 客户表外键

ACCTID 账户表外键

SERVICEACCOUNTID 用户表外键

PRODUCTID 产品表外键

STID 用户所属街道

SERVICEID 品牌

PACKAGEID 产品包

VALUE 应收金额

SETOFFAMOUNT 销账金额

2)维度确定;

a)时间维度:日,月,年,建立相应的维度表(Dimtime),表结构如下:

PKID 主键

the_day 日

the_month 月

he_year 年

b)区域维度:街道,区域,市, 相应的维度表(DimDISTRICT) ,表结构如下:

STID 主键

STNAME 街道

T_STNAME 区域

c)组织机构维度:一级,二级,三级,四级(DimOrganization) ,表结构如下:

PKID 主键

ORGID orgid

NAME 组织名称

PARENTORGID 组织父ID

NODE0_ID 一级组织ID

NODE0_NAME 一级组织名称

NODE1_ID 二级组织ID

NODE1_NAME 二级组织名称

NODE2_ID 三级组织ID

NODE2_NAME 三级组织名称

NODE3_ID 四级组织ID

NODE3_NAME 四级组织名称

d)客户维度:客户类型,客户来源(DimCustomer) ,表结构如下:

CUSTOMERID 主键

CUSTOMERSTYLE 客户类型

CUSTOMERTYPE 客户来源

e)产品维度:产品名称(DIMPRODUCT) ,表结构如下:

DIMPRODUCT表结构:

PRODUCTID 主键

PRODUCTNAME 产品名称

STATUS 产品状态

f)费用维度:费用类型,账目类型,是否归账,是否销账,是否调账

(Dimaccountitem) ,表结构如下:

ACCTID 费用表主键

CREATETIME 费用记录创建时间

FEETYPE 费用类型

ACCTITEMTYPEID 账目类型

BILLINGCYCLEID

INVOICEDFLAG 是否归账

SETOFFFLAG 是否销账

ADJUSTMENTFLAG 是否调账

g)产品包维度:产品包名称(Dimproductpackage) ,表结构如下:

PACKAGEID 产品包ID

PACKAGENAME 产品包名称

h)用户维度:用户code,用户状态(Dimserviceaccount) , 品牌(Dimservice),,

Dimserviceaccount表结构如下:

SERVICEACCOUNTID 用户ID

SERVICECODE 用户code

STATUS 用户状态

相关文档
最新文档