数据仓库-数据建模过程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
一、数据仓库建模模式: (1)
1.自顶向下: (1)
2.自底向上: (1)
二、数据仓库设计重点步骤: (1)
1.概念模型设计(客观世界->主观世界) (1)
1)业务数据理解和需求分析; (1)
2)分析主题和元数据; (1)
2.逻辑模型设计(主观世界->关系模型) (3)
1)事实表及其度量和粒度确定; (3)
2)维度确定; (3)
3.物理模型设计(关系模型->存储模型) (5)
1)数据仓库的物理存储方式 (5)
三、cube展示 (5)
一、数据仓库建模模式:
1.自顶向下:
先通过ETL将数据汇集到数据仓库中,然后再通过数据复制的方式推进各个数据集
市;
2.自底向上:
先通过ETL将数据汇集到数据集市中,然后再数据复制的方式提升到数据仓库中;
二、数据仓库设计重点步骤:
1.概念模型设计(客观世界->主观世界)
1)业务数据理解和需求分析;
如:这次我主要针对营帐中的应收金额做简单的数据模型,主要分析应收金额,
从各个维度去分析和了解应收金额的情况;
2)分析主题和元数据;
a)
转换为星型图为:
b)主题和元数据
主题:分析应收金额
元数据:表格中分析出的的维度,类别层次以及度量都属于元元素
元数据:定义了数据仓库中的许多对象—--表,列,查询,规则以及数据仓库内部的数据转移;
2.逻辑模型设计(主观世界->关系模型)
1)事实表及其度量和粒度确定;
根据对应收的分析,分析出事实表(主键+外键+度量字段)和粒度
注:设计事实表时,尽量的使事实表尽可能的小,可以提高事实表的处理,备份以及查询的性能,可通过减少列的数量,降低列的大小等方式。
如果事实表的数据量过大,可以采用数据分割的方式,将数据按照一定的规
则分割,如可以按照时间按月来分割成多个部分,或者按年来分割,来降低数
据量。
度量值:应收金额
粒度:取的是精确到天。
事实表:FACT_RPT_AI
字段如下:
SEQNO 序列号
CREATETIME 创建日期
AIMONTH 归属月
AI_NO 费用表外键
OPID 操作员表外键
ORGID 组织结构表外键
CUSTID 客户表外键
ACCTID 账户表外键
SERVICEACCOUNTID 用户表外键
PRODUCTID 产品表外键
STID 用户所属街道
SERVICEID 品牌
PACKAGEID 产品包
VALUE 应收金额
SETOFFAMOUNT 销账金额
2)维度确定;
a)时间维度:日,月,年,建立相应的维度表(Dimtime),表结构如下:
PKID 主键
the_day 日
the_month 月
he_year 年
b)区域维度:街道,区域,市, 相应的维度表(DimDISTRICT) ,表结构如下:
STID 主键
STNAME 街道
T_STNAME 区域
c)组织机构维度:一级,二级,三级,四级(DimOrganization) ,表结构如下:
PKID 主键
ORGID orgid
NAME 组织名称
PARENTORGID 组织父ID
NODE0_ID 一级组织ID
NODE0_NAME 一级组织名称
NODE1_ID 二级组织ID
NODE1_NAME 二级组织名称
NODE2_ID 三级组织ID
NODE2_NAME 三级组织名称
NODE3_ID 四级组织ID
NODE3_NAME 四级组织名称
d)客户维度:客户类型,客户来源(DimCustomer) ,表结构如下:
CUSTOMERID 主键
CUSTOMERSTYLE 客户类型
CUSTOMERTYPE 客户来源
e)产品维度:产品名称(DIMPRODUCT) ,表结构如下:
DIMPRODUCT表结构:
PRODUCTID 主键
PRODUCTNAME 产品名称
STATUS 产品状态
f)费用维度:费用类型,账目类型,是否归账,是否销账,是否调账
(Dimaccountitem) ,表结构如下:
ACCTID 费用表主键
CREATETIME 费用记录创建时间
FEETYPE 费用类型
ACCTITEMTYPEID 账目类型
BILLINGCYCLEID
INVOICEDFLAG 是否归账
SETOFFFLAG 是否销账
ADJUSTMENTFLAG 是否调账
g)产品包维度:产品包名称(Dimproductpackage) ,表结构如下:
PACKAGEID 产品包ID
PACKAGENAME 产品包名称
h)用户维度:用户code,用户状态(Dimserviceaccount) , 品牌(Dimservice),,
Dimserviceaccount表结构如下:
SERVICEACCOUNTID 用户ID
SERVICECODE 用户code
STATUS 用户状态