事实表与维度表解释

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

销售单数据日库存数据发货进度数据
比较
特点
时间/时期粒度事实表加载事实表更新时间维事实
事务事实
时间代表一个交易事件新增不更新业务日期交易活动
周期快照事实
时期代表一个时间周期新增不更新时期末时间周期内的绩效
累积快照事实
时间跨度较短的多个时点代表一个业务周期新增和修改新事件产生时更新多个业务过程的完成日期限定多个业务阶段内的绩效
注 4、维度表若被多个事实表使用，则应作为公共维度表来设计。
意
5、维度表，区分代理键和自然键的目的是跟踪在操作性系统中无须考虑的数据变化情况
总之，事实表的设计是以能够正确记录历史信息为准则，维度表的设计是以能
够以合适的角度来聚合主题内容为准则
04表关系
事实表
1、用来存储事实的度量及指向各个维的外键值 2、不应该包含描述性的信息，也不应该包含除数字度量字段及使事实与纬度表中对应项的相关索引字段之外的任何数据 3、可以累计的度量值，最有用的度量值是可累计的度量值，其累计起来的数字是非常有意义的，用户可以通过累计度量值获得汇总信息 4、非累计的度量值可以用于事实数据表，单汇总结果一般是没有意义的，但是求平均值是有意义的。
时间维
01事实表
用来存储事实的度量和各维的码值
举例
定义
事实表
事务事实表 Transaction fact table 周期快照事实表 Periodicsnapshot fact table 累积快照事实表 Accumulatingsnapshot fact table
分类
事务事实周期快照事实累积快照事实
数据进行分析时所用的量，可有多个维度，不超15个
做为事实表的外键，整型值，节省空间，有层次结构含义
事实表
维度表
1、维度表需要冗余，主要是因为维度一般不大，而维度表的冗余可以使事实表节省很多空间。
2、事实表一般都很大，得到结果的时间较长，进行特殊预处理是必要的。
3、维度表必须有而且只有一个最明细层作为该维表的颗粒度
02维度表
维度的三种模型：星形模型雪花模型多维模型
维度的类型：缓慢变化维快速变化维大维和迷你维退化维
03表设计
指标外键主键
有数值化和可加性的度量值，如销售额、证书量
事实数据特征属性值，关联维度表
来源业务系统，考虑数据冗余，可不设主键
冗余特征主键
包含的列应该尽可能全面，记录属性变化的维
维度表
1、保存该维的元数据，即维的描述信息，包括维的层次及成员类别等 2、列字段可以将信息分为不同层次的结构级。 3、键属性必须为维度的每个成员包含一个对应的唯一值。 4、属性可以是可分组的，也可以是不可分组的
总之
1、事实表就是你要关注的内容； 2、维度表就是你观察该事务的角度，是从哪个角度去观察这个内容的 3、事实数据和维度数据的识别必须依据具体的主题问题而定 4、一个事实数据表都要和一个或多个纬度表相关联。
数据中心建设概念解释
商占超 Q:274231105
目录
01
事实表
02
维度表
03
表设计
04
表关系
数据谈起
地区维
类型维
交易次数交易量
交易额
客户维
一组销售数据
像叙事作文一样，包含：时间、地点、人物、事情，描述着销售的过程。
是否可以这样理解呢？对吗
事实表存放描述业务内特定事件的数据。维度表存放维度属性值，如客户信息、地区信息、时间清单、类型信息等