数据模型基本概念及建模方法论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
继承于逻辑数据模型 依赖于所选择的数据库 决定于业务需求和性能之间的平衡
设计内容
数据库、表和字段、索引 需要作非正则化处理
后续工作:ETL、元数据管理和前端应用输入
8
应用数据模型
Application Data Model(ADM)应用数据模型
设计目标
满足最终用户对数据的访问(内容、形式要求) 满足应用系统对数据的存取(性能、存储要求)
3
数据模型的分类
数据仓库项目中数据模型可以分为以下几种:
Conceptual Data Model (CDM) 概念数据模型 Logical Data Model (LDM) 逻辑数据模型 Physical Data Model(PDM)物理数据模型 Application Data Model(ADM)应用数据模型
15
逻辑数据模型基本术语 (四)
关系 二元关系
父实体的一个实例严格关系子实体的0,1或多个实例的这种 关系是二元关系 基数 父、子实体实例的比例,如1:1,1:M
识别(型)关系
子实体实例唯一性的识别与父实体相关联,父实体的主键属 性成为子实体的主键属性
非识别(型)关系
子实体不需要与父实体的关系就可以确定实例唯一性,父实体 的主键属性成为子实体的非键属性
从属数据集市
回答 业务问题
11
知识发现 数据挖掘 信息存取
工具
业务人员
聚集 统计 人工智能 神经网络
对象语言
多维 可视化 EIS/DSS电子表 开发
逻
辑
数
据
应 用
模 型
数
据
模
型
内容安排
什么是数据模型 数据模型相关术语 数据模型方法论 建模注意事项
12
逻辑数据模型基本术语 (一)
模型分类 概念数据模型 逻辑数据模型 物理数据模型 应用数据模型
17
逻辑数据模型基本术语 (示例)
• Logical Data Model (LDM)
•
Example
Key Attribute
Cardinality One-to-many 1:M
Entity
Business Rule : • one customer invoice at least
contains one invoice item
3NF 建设
可能会按照性能、空间要求进行非正则化
无冗余数据 无派生数据 业务人员与建模人员
含冗余数据 包含派生数据 物理数据库设计人员
逻辑数据模型在数据仓库中的定位
采集
存储 和管理
IT 用户
源数据
业务系统 业务系统
业务数据 外部数据
数据导入 析取 清洗 条件 剔除 家庭关系 加载
企业 数据仓库
关系数据库管理系统
Relationship
Nonkey Attribute
18
范式理论 Normal Form
14
逻辑数据模型基本术语 (三)
属性: (描述真实或抽象事物相关联的特征或性质) 主键 (识别实体实例唯一性的属性、属性组) 可选键 (能识别实体实例唯一性的其他属性、属性组) 外键 (通过父实体到子实体关系转移到子实体的属性) 非键属性(不是实体主键属性的其他属性 ) 基础名 (外键的原来名称 ) 角色名 (外键的新名称,表明取值是父实体属性的子集 ) 鉴别器 (取值决定父实体实例属于哪个子类的属性 )
16
逻辑数据模型基本术语 (五)
关系 确定关系
父实体的一个实例对应子实体的0、1或多个实例,并且子实体 的一个实例对应0或1个父实体的实例
非确定关系
多对多关系
子类关系
子类实体和所属父实体的关系
完全子类群
所属父实体的每个实例都能够与子类群的一个实体实例相关联
不完全子类群
所属父实体的每个实例不一定都有子类相关联
模型结构 第三范式(3NF)结构 星型结构(多星型结构) 雪花型结构
13
3NF
基础数据模型
Star Schema
汇总数据/已知应 用模型
Snowflake
星型结构的演变
逻辑数据模型基本术语 (二)
实体 独立型实体 依赖型实体
子类实体
主题域 层面
核心实体 关系实体 特征实体 分类实体
设计蓝图,指导整个数据仓库系统的建设 业务语言,业务人员与技术人员沟通的手段和方法 业务视图,独立于数据库技术实现
设计内容:实体、关系和属性 建模方法:3NF的设计方法 后续工作:物理数据模型的输入
7
物理数据模型
Physical Data Model(PDM)物理数据模型
设计目标:面向物理实施的具体细节 输入条件
数据模型的基本概念 及建模方法论
崔大强 技术经理
NCR(中国)有限公司数据仓库事业部
内容安排
什么是数据模型 数据模型相关术语 数据模型方法论 建模注意事项
2
什么是数据模型?
以数学的方式对现实事物的一种抽象表达,…
特征: 内容:描述了数据、及其之间的关系 形式:反映了数据的组织与管理形式 用途: (数据仓库)系统建设中的数据信息的蓝图 (数据仓库)系统建设的核心 业务人员与IT人员沟通的语言和工具
主要特征
面向Power User和业务人员 与具体的应用相关 多维分析时一般采用星型结构或者雪花状结构
的设计方法 是事实表和维度表的组合
9
逻辑数据模型与物理数据模型比较
包含内容 定位记录 使用名称
正则化
冗余数据 派生数据 开发人员
10
逻辑数据模型 实体、属性 主键 业务名称
物理数据模型 表、字段 主索引 物理名称(受限于DBMS)
4
概念数据模型
Conceptual Data Model(CDM)概念数据模型
从全局上、宏观上介绍模型设计思路、范围和内容。 主要组成元素
来自百度文库题 主题间关系 主题中的重要实体 实体间的相互关系
目标与用途
圈定建模的范围 划分建设主题 理清主要业务关系 构造逻辑数据模型的框架
5
逻辑数据模型
定义: 符号体系 使用逻辑建模语言 设计内容 定义数据与数据之间的逻辑关系 表现形式 以图形化的形式 反映内容 反映客户的业务规则 设计目标 达到数据组织的设计目标
6
逻辑数据模型
Logical Data Model (LDM) 逻辑数据模型
设计人员:业务人员、IT人员 设计目标
设计内容
数据库、表和字段、索引 需要作非正则化处理
后续工作:ETL、元数据管理和前端应用输入
8
应用数据模型
Application Data Model(ADM)应用数据模型
设计目标
满足最终用户对数据的访问(内容、形式要求) 满足应用系统对数据的存取(性能、存储要求)
3
数据模型的分类
数据仓库项目中数据模型可以分为以下几种:
Conceptual Data Model (CDM) 概念数据模型 Logical Data Model (LDM) 逻辑数据模型 Physical Data Model(PDM)物理数据模型 Application Data Model(ADM)应用数据模型
15
逻辑数据模型基本术语 (四)
关系 二元关系
父实体的一个实例严格关系子实体的0,1或多个实例的这种 关系是二元关系 基数 父、子实体实例的比例,如1:1,1:M
识别(型)关系
子实体实例唯一性的识别与父实体相关联,父实体的主键属 性成为子实体的主键属性
非识别(型)关系
子实体不需要与父实体的关系就可以确定实例唯一性,父实体 的主键属性成为子实体的非键属性
从属数据集市
回答 业务问题
11
知识发现 数据挖掘 信息存取
工具
业务人员
聚集 统计 人工智能 神经网络
对象语言
多维 可视化 EIS/DSS电子表 开发
逻
辑
数
据
应 用
模 型
数
据
模
型
内容安排
什么是数据模型 数据模型相关术语 数据模型方法论 建模注意事项
12
逻辑数据模型基本术语 (一)
模型分类 概念数据模型 逻辑数据模型 物理数据模型 应用数据模型
17
逻辑数据模型基本术语 (示例)
• Logical Data Model (LDM)
•
Example
Key Attribute
Cardinality One-to-many 1:M
Entity
Business Rule : • one customer invoice at least
contains one invoice item
3NF 建设
可能会按照性能、空间要求进行非正则化
无冗余数据 无派生数据 业务人员与建模人员
含冗余数据 包含派生数据 物理数据库设计人员
逻辑数据模型在数据仓库中的定位
采集
存储 和管理
IT 用户
源数据
业务系统 业务系统
业务数据 外部数据
数据导入 析取 清洗 条件 剔除 家庭关系 加载
企业 数据仓库
关系数据库管理系统
Relationship
Nonkey Attribute
18
范式理论 Normal Form
14
逻辑数据模型基本术语 (三)
属性: (描述真实或抽象事物相关联的特征或性质) 主键 (识别实体实例唯一性的属性、属性组) 可选键 (能识别实体实例唯一性的其他属性、属性组) 外键 (通过父实体到子实体关系转移到子实体的属性) 非键属性(不是实体主键属性的其他属性 ) 基础名 (外键的原来名称 ) 角色名 (外键的新名称,表明取值是父实体属性的子集 ) 鉴别器 (取值决定父实体实例属于哪个子类的属性 )
16
逻辑数据模型基本术语 (五)
关系 确定关系
父实体的一个实例对应子实体的0、1或多个实例,并且子实体 的一个实例对应0或1个父实体的实例
非确定关系
多对多关系
子类关系
子类实体和所属父实体的关系
完全子类群
所属父实体的每个实例都能够与子类群的一个实体实例相关联
不完全子类群
所属父实体的每个实例不一定都有子类相关联
模型结构 第三范式(3NF)结构 星型结构(多星型结构) 雪花型结构
13
3NF
基础数据模型
Star Schema
汇总数据/已知应 用模型
Snowflake
星型结构的演变
逻辑数据模型基本术语 (二)
实体 独立型实体 依赖型实体
子类实体
主题域 层面
核心实体 关系实体 特征实体 分类实体
设计蓝图,指导整个数据仓库系统的建设 业务语言,业务人员与技术人员沟通的手段和方法 业务视图,独立于数据库技术实现
设计内容:实体、关系和属性 建模方法:3NF的设计方法 后续工作:物理数据模型的输入
7
物理数据模型
Physical Data Model(PDM)物理数据模型
设计目标:面向物理实施的具体细节 输入条件
数据模型的基本概念 及建模方法论
崔大强 技术经理
NCR(中国)有限公司数据仓库事业部
内容安排
什么是数据模型 数据模型相关术语 数据模型方法论 建模注意事项
2
什么是数据模型?
以数学的方式对现实事物的一种抽象表达,…
特征: 内容:描述了数据、及其之间的关系 形式:反映了数据的组织与管理形式 用途: (数据仓库)系统建设中的数据信息的蓝图 (数据仓库)系统建设的核心 业务人员与IT人员沟通的语言和工具
主要特征
面向Power User和业务人员 与具体的应用相关 多维分析时一般采用星型结构或者雪花状结构
的设计方法 是事实表和维度表的组合
9
逻辑数据模型与物理数据模型比较
包含内容 定位记录 使用名称
正则化
冗余数据 派生数据 开发人员
10
逻辑数据模型 实体、属性 主键 业务名称
物理数据模型 表、字段 主索引 物理名称(受限于DBMS)
4
概念数据模型
Conceptual Data Model(CDM)概念数据模型
从全局上、宏观上介绍模型设计思路、范围和内容。 主要组成元素
来自百度文库题 主题间关系 主题中的重要实体 实体间的相互关系
目标与用途
圈定建模的范围 划分建设主题 理清主要业务关系 构造逻辑数据模型的框架
5
逻辑数据模型
定义: 符号体系 使用逻辑建模语言 设计内容 定义数据与数据之间的逻辑关系 表现形式 以图形化的形式 反映内容 反映客户的业务规则 设计目标 达到数据组织的设计目标
6
逻辑数据模型
Logical Data Model (LDM) 逻辑数据模型
设计人员:业务人员、IT人员 设计目标