数据需求分析与建模
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实体-关系图:图例
实体 可选关系 属性 关键属性 关系
强制关系
强制/可选关系
1对多
多对多
实体分析法
确定局部视图的范围:实体的个数应适量 识别实体及标识 确定实体间的联系 分配实体及联系的属性
识别实体及标识
序号 步骤 1 2 对数据对象 进行分类 识别实体与 属性 原则 同一类中的对象在概 念上应具有共性 描述信息原则 多值性原则 存在性原则 描述 这个过程,类似于面向对象中类的识别,也 可以有超类和子类的概念 实体均有描述信息,属性则没有 若描述中存在多个值描述,则即使该描述项 本身无描述信息也应划为实体 若对象类R的描述的值集中去掉某个值,如果 对应用不产生影响,就应为属性,否则应为 实体 属性不再与其描述对象之外的其他对象类发 生联系 若一个对象类的标识是由其它对象类的标识 组成的,则通常应定义为联系 对象名清晰、易于记忆,反应对象的主要特 定,遵守缩写规则
E-R图到关系模式的转换
一对多关系模式:在n端实体类型对应的关系模式 中加入1端实体类型的键和联系类型的属性
身份证号 客户名 客户 地址 帐户号 联系电话 1 存款者 M 帐户 余额
开户时间
校长(姓名,性别,职称,年龄,校名,任职时间) 学校(校名,地址,电话)
E-R图到关系模式的转换
多对多关系模式:将联系类型也转换成关系模式, 属性为两端实体类型的键加上联系类型的属性
数据需求分析与设计要素
术语表 数据结构分析,对表的内容要区分 > 主要字段和次要字段 > 稳定字段和不稳定字段 > 即时记录和历史记录 另个需要考虑 > 联机事务需要报表需求决策查询需求 > 数据量与增长速度(数据查询失效案例) > 性能与扩展 > 并发可能性与数量
数据需求分析与设计要素
数据字典应用
数据流说明 > 数据流名或标识:即在DFD中所对应的数据流名称 > 描述:说明数据流的用途与目的 > 别名:可选择的名字 > 数据源:数据流的起点 > 目的:数据流的终止点 > 记录:每个数据流都代表了一组被称为记录或数据 结构的相关实体 > 量和频率:描述单位时间内数据流发生的次数。
属性综合法 自底向上法 将收集的数据元素作为分析对象,各 层实体及联系通过低层属性综合而成
1wenku.baidu.com确定属性分类
联系,建立初步数据模型框架; •确定实体构成 •逐步求精,加上必要描述属性, •确定实体间联系联系 形成完整的模型(用户视图) 1.通过对数据元素与应用任务联系的 •将这些视图集成为一个统一的数 定性、定量统计分析技术推导出相应 据模型(用户视图集成) 的信息结构 1.用E-R图描述全局信息结构 优点 减少分析中所涉及的对象数,简 化分析过程;采用图形法使得整 个过程更直观、易理解,有利用 户介入 基于统计分析(定量/定性)推导, 对于较为简单的设计对象特别有效
数据字典应用
外部实体说明 > 实体名或标识:即在数据流图中所对应的实体名称 > 描述:说明实体的用途与目的 > 别名:可选择的名字 > 输入数据流 > 输出数据流 数据元素说明的常用表示法 > :由…构成 > :和,代表顺序连接的关系 > [ | ]:或,代表从中选择一个 > {}*:n次重复 > ():代表可选的数据项 > *…*:表示特定限制的注释
数据需求分析与建模
数据流通过程:数据流图(DFD) 数据存储方式:实体-关系图(ERD) 数据定义方式:数据字典(DD) 数据需求分析与设计要素
数据流图:基本元素
存放数据的地方,这些 数据在以后使用,通常 与实体 - 联系图中的一个 数据实体相对应 数据存储/文件 被加工的数据与流向, 箭头边应给出数据流名 字,可用名词或名词性 短语命名 当过程 / 加工执行时 , 外部实体与过程之间来 回通信
过程/加工
输入数据在此进 行变换产生输 出数据,其中要 注明加工的名称
数据输入的源点或 数据输出的 汇点,其中要注明 外部实体/源/宿 源点和汇点的名称
数据流
实时连接
数据流图:图的结构
数据流图:分层的DFD
绘制数据流图:构建顶层图
绘制数据流图:绘制DFD片断
数据建模过程
需求捕获与分析
E-R图
姓名 学号 学生 性别 课程号 年龄 M 考试 N 课程 课程名 授课老师
成绩
学生(学号,姓名,性别,年龄) 课程(课程号,课程名,授课老师) 考试(课程号,学号,成绩)
数据字典应用
数据元素说明 > 数据元素名或标识:即对用户而言有意义的名称; > 别名:可选择的名字 > 类型和长度:说明数据元素的组成部分,是数字、 字母还是其他;而长度则是指其最大的组成个数 > 默认值:即数据元素的一个初始值; > 可接受的值:即数据元素有效的合法取值范围 > 数据源:即对数据元素值的起源点的具体说明 > 安全:对于有权访问或更新每个数据元素的人或部 门的标识 > 有责任用户:负责输入/改变数据元素值的用户标识 > 描述和评论:加上一些更好的说明数据元素的注解
概念结构设计 逻辑结构设计
需求分析阶段
概念设计阶段
数据模型优化 逻辑设计阶段 物理结构设计 设计评价 性能评估 物理设计阶段 物理实现
试运行 数据库实施阶段 使用与维护 运行维护阶段
概念结构设计的方法
方法 别称 要点 步骤 实体分析法 自顶向下法 从总体概念入手,从分析一个单 位的事务活动开始
1.识别用户关心的实体及实体间
学校 包含 系 拥有 教师
断层 陷阱
E-R图到关系模式的转换
实体模型:每个实体转成一个模式 客户(客户名,身份证号,地址,联系电话)
性别
身份证号 地址
职称 校名 年龄 校长 任职
地址 电话
姓名
客户名 客户 联系电话
学校
任职时间
一对一关系模式:在两个关系模式中的任意一个模式 中,加入另一个模式的键和联系类型的属性 校长(姓名,性别,职称,年龄,校名,任职时间) 学校(校名,地址,电话)
确定实体间联系时的陷阱
类型 说明 示例
扇形 陷阱
若两个实体类间的一对多联 这样将丢失教师和系之间的联系 系,由一个实体值引出多个 表示。 同一类型的联系值,那么其 学校 系 学校 教师 值图将呈扇形结构,也称为 1 1 包含 拥有 扇形联系。而扇形陷阱是指 双扇 N N 由一个实体引出两种不同类 系 教师 型的扇形联系,形成双扇形 A)E-R模型 B)值图 结构。 是指因为型图包含了传递联 该模型无法表示直接属于学校的教 系,而掩盖了某些特定的直 师 接联系 1 N 1 N
数据共享考虑 > 数据库、文件、XML > 逐段加密问题 > 数据Filter原则 > 谁建立?谁修改?谁查询?谁应用? 数据挖掘与分析 > 查询报表—从规则入手 > BI > 数据挖掘,仓库(电信数据整合)
数据仓库
查询工具 数据仓库 抽取、清理 装载、刷新 OLAP服务器 服务 分析工具 …… 数据挖掘 工具 报表工具
多对一联系性 组合标识判别原则 3 4 对象命名 确定实体标 识(键) 命名原则
实体的标识是指能够惟一标识一个实体的属性或属性组,也就是该 实体的关键字。
实体分析法:确定实体间联系
一对一关系: > 两个实体都是强制性的 > 仅有一类实体是强制的 > 两类实体均非强制性的 一对多关系 > 多端强制性 > 多端非强制性 多对多关系
数据字典应用
数据存储(文件)说明 > 数据存储名或标识:在DFD中对应的数据存储名称 > 描述:说明数据存储的用途与目的 > 别名:可选择的名字 > 属性:输入或离开数据存储的标准数据流图名 > 量和频率:描述数据存储中记录出现的可估计的个 数和更新频度 加工说明 > 加工名或标识:即在数据流图中所对应的加工名称 > 描述:说明加工的用途与目的 > 加工数据标识:用来指明加工所在的层次 > 加工描述:说明包括的输入和输出数据流
数据字典应用实例
客户基本信息=客户编号+客户名称+身份证号码+手机+小灵通+家庭电话 客户编号={0…9}8 客户名称={字}4 身份证号码=[{0…9}15|{0…9}18] 手机=[{0…9}11|{0…9}12] 小灵通=(区号)+本地号 家庭电话=(区号)+本地号 办公电话=(区号)+本地号 区号={0…9}4 本地号=[{0…9}7|{0…9}8]
数据集市 数据源
OLAP服务器