数据的组织与管理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
m
n
A
联系
B
教师
m
教学
n
学生
E—R图建模
实体及其联系
E—R图
概念模型
E—R图绘制 1、利用分类、聚集、概括等方法抽象出实体,并一一命名。
2、描述实体之间的联系
3、实体属性和联系属性的说明
ISBN* 书名
页数 类别
图书
定稿时间
姓名
身份证号*
出生地
写作
作者
出版社 价格
构造E-R图应注意的问题:
1、注意标识实体属性中的关键字;
二、实体联系模型(E-R模型)
实体联系模型反映的是现实世界中的事物及其 相互联系。
ISBN* 书名
页数 类别
图书
定稿时间
姓名
身份证号*
出生地
写作
作者
出版社 价格
1、实体(Entity)
描述客观事物的概念
表示方法:
实体名称
2、属性 "属性"指实体具有的某种特性。 表示方法:
属性
属性1
属性2
属性n
数据控制能力
应用程序自己控制
由数据库管理系统提供数据安全性、完 整性、并发控制和恢复能力
..
客户交易
银银行行文数件据处库理处系理统系统
帐户核对 处理
客户财务 报表
Fra Baidu bibliotek
帐户核 对程序
客文户件交修 易 处 理
改核对
存款处理
核对帐 户程序
存款 程序
存款帐 目程序
存款文 件修改
数 据分库期贷管款理 系 统 处理
课程号* 课程名 学时数
学生 m 学习 n 课程
成绩
学生(学号,姓名,年龄) 课程(课程号,课程名,学时数) 学习(学号,课程号,成绩)
3.1 数据库设计概述 3.2 概念结构设计(ER图) 3.3 逻辑结构设计(关系模式) 3.4 物理结构设计
四、数据库的物理结构设计
物理结构设计是为数据模型在设备上选定合 适的存储结构和存取方法,以获得数据库的最佳 存取效率。数据库的物理结构设计就是对一个给 定的逻辑结构选取一个最适合应用环境的物理结 构的过程。
厂号* 厂名 地点
厂长 1 管理 1 工厂
厂长(厂长号,姓名,年龄) 工厂(厂号,厂名,地点) 管理(厂号,厂长号)
转换举例二
仓库号* 地点 面积
货号* 品名 价格
仓库 1 存放 n 产品
数量
仓库(仓库号,地点,面积) 产品(货号,品名,价格) 存放(仓库号,货号,数量)
转换举例三
学号* 姓名 年龄
数据模型
数据库不仅存放数据,而且还要存放数据和数据 之间的联系。
表示数据和数据之间的联系的方法称为数据模 型。 (1)表示数据 (2)数据之间的关系
层次模型
(Hierarchical Model)用树形结构表示客观事 物之间联系的模型。
A
B
C
D
E
F
仓库号 城市
面积
仓库
仓库号 器件号
数量
库存
仓库号 职工号
转换方法和原则
1 、实体
相应转换为一个关系,实体名称作为关系 名称,该关系包括对应实体的全部属性,并确 定出该关系的关键字。
2、联系
a.联系具有属性: 联系名作为关系名,发生联系的实体的主关键
字 作为联系的主关键字。 b.联系不具有属性: 不带有属性的联系可以去掉。
转换举例一
厂长号* 姓名 年龄
1 科室主任
2、一对多联系
如果对于A中的每一实体,实体B中有一个以上实体与之发生联系, 反之,B中的每一实体至多只能对应于A中的一个实体,则称A与B是一对 多联系。
1 A
n
联系
B
教研室
1
联系
n
教师
3、多对多联系
如果A中至少有一实体对应于B中一个以上实体,反之,B中也至少有 一个实体对应于A中一个以上实体,则称A与B为多对多联系。
1、确定库文件的组织形式
如选用顺序文件组织形式、索引文件组织形式等。
2、存取路径的选择
对同一个数据提供多条存取路径。物理设计要确定 应该建立哪些存取路径。
3、确定数据存放位置
为了提高系统性能,数据应该根据应用情况将易变 部分和稳定部分、经常存取部分和存取频率较低的部分 分开存放。例如将易变的、存取频繁的数据存放在高速 存储器上;稳定的、存取频度小的数据存放在低速存储 器上。
数量 675 250 340 280 200 270 500 330
仓库
器件
器件号 P1 P2 P3 P4
器件名称 显示卡 声卡 解压卡 散热风扇
三、关系数据模型(Relational Model)
美国IBM公司的E.F.Codd,从1970年起连续发表了多篇论文, 提出关系模型,奠定了关系数据库的理沦基础。
数据库
中央 数据库
两种数据管理方式的对比
对比方面
文件系统
数据的管理者
文件系统
数据面向的对象 某一应用程序
数据的共享程度
特 数据的独立性 点
数据的结构化
共享性差,冗余度大 独立性差 记录内有结构
数据库系统
数据库管理系统 整个应用系统 共享性高,冗余度小 高度的物理独立性和逻辑独立性 整体结构化,用数据模型描述
层次数据模型
2、DBTG报告
美国数据系统语言协会(Conference On Data System Language)下属的数据库任务组(Database Task Group)发 表了若干个报告,奠定了数据库的很多概念、方法和技术。
网状数据模型
3、1970年,IBM公司的研究员E.F.Codd发表了论文 “大型共享数据库的关系模型”,为关系数据库的 发展奠定了理论基础。
测试题
1、有关信息的说法,正确的是(C )
A、信息是关于主观愿望、不可通讯的知识 B、信息是人类思维活动的结果 C、信息是可以通讯的 D、信息可以分为战术信息、管理信息和数字信息
2、信息与数据的关系是( D)
A、信息是数据的载体 B、数据决定于信息 C、信息与数据的含义是相同的 D、数据是信息的表达形式
工资
职工
职工号 供应商号 订购单号 订购日期
订购单
网状模型
(Network Model)用网络结构表示客观事物之间联 系的数据模型。
关系模型
(Relational Model)用二维表表示实体与实体之间联系 的模型。
器件
仓库
仓库号
WH1 WH2 WH3
城市
北京 上海 广州
面积
370 500 200
4、主码 (Primary Key,也称主关键字)。
5、域。属性的取值范围。
6、分量。元组中的一个属性值。
7、关系模式。对关系的描述,用关系名 (属性1,属 性2,…属性n)来表示。
eg. 库存(仓库号,器件号,数量) 仓库(仓库号,城市,面积)
第三节 数据库的设计
3.1 数据库设计概述 3.2 概念结构设计(ER图) 3.3 逻辑结构设计(关系模式) 3.4 物理结构设计
信息的转换
现实世界
认识选择描述
信息世界
客观 事物类: 事物 相关性质集合
存储 二进制数据集合
结构
实体 实体集合
人
及 实体
联系 相关属性集合
E-R模型
加工、转换
DBMS 的数据 模型
加工 转换
数 文件 据 记录 库 相关数据项集合
计算机世界
DBMS
数据世界
3.1 数据库设计概述 3.2 概念结构设计(ER图) 3.3 逻辑结构设计(关系模式) 3.4 物理结构设计
学生数据库 学生文件
记录1 记录2 …... 记录n-1 记录n
若干学生
数据项1 数据项2 …... 数据项n-1 数据项n
姓名、性别等
数据–记文项数录 件多据个库字(符D组at成ab一a个se词) 或者一个完整的数字
– 不––能–与与综再某某合分个个成的特特有、殊定意相义对主关的象题的单或相文位活关件。动的集有数合关据的记所录有的数集据合项。组成 –数据库中包括了数据,它们之间的联系
关系数据模型
数据库系统的构成
数据库系统是由计算机系统、数据、数据库管理系
统和有关人员组成的具有高度组织的总体。
1、计算机系统(支持数据库系统的硬件和软件环境)
2、数据库(Database)
3、数据库管理系统 (DBMS) 4、人员
·数据库管理员 ·系统程序员 ·用户
数据库强调数据 数据库管理系统是系统软件 数据库系统强调的是系统
8.7 数据库技术与数据库设计
•数据的组织与管理 •数据库技术 •数据库设计
第一节 数据的组织与管理
在管理信息系统中,大量的数据以一定的 形式存放在各种存储介质中,数据的组织方 式以及内在联系的表示方法直接决定着数据 处理的效率。
一、数据组织的层次
数据库Database
文件1 文件2 …... 文件n-1 文件n
实体名称
3、联系 现实世界的事物总是存在着这样或那 样的联系
表示方法:
联系
实体1
联系
实体2
联系的类型
设A,B为两个包含若干个体的总体,
1、一对一联系
如果对于A中的一个实体,B中至多有一个实体与其发生联系,反之,B 中的每一实体至多对应A中一个实体,则称A与B是一对一联系。
系
1
任职
1
系主任
病区
1 任职
2、如果所处理的对象是一个比较大的系统,则应该先 画出各个部门的子E-R图,然后再合并同类实体,消除 冗余。
3、对于一个特定的应用处理对象,所构造的E-R模型 可能不是唯一的。
3.1 数据库设计概述 3.2 概念结构设计(ER图) 3.3 逻辑结构设计(关系模式) 3.4 物理结构设计
回顾
三、ER图向关系数据模型的转换
数据文件1 数据文件2 数据文件3
存在问题:
1、数据冗余与数据不一致性 2、数据联系弱 3、缺少数据字典,缺乏灵活性
数据库处理系统
用户 应用程序1
用户 用户
应用程序2 应用程序3
DBMS
特点: 1、完善的数据字典和数据模型 2、数据独立性 3、方便的接口 4、完整的数据控制功能 5、提高了系统的灵活性
器件
库存 仓库号 WH1 WH1 WH1 WH2 WH2 WH2 WH3 WH3
库存
器件号 P2 P3 P4 P1 P2 P4 P2 P1
仓库
数量 675 250 340 280 200 270 500 330
1、关系。一个关系对应于一张二维表。 2、元组。表中一行称为一个元组。 3、属性。表中一列称为一个属性。给每列起一个名即 为属性名。
一、数据库设计的主要内容
现实世界
人们头脑之外的客观世界,它包含客观事物及其相互联系
观念世界
信息世界,是现实世界在人们头脑中的反映
数据世界
现实世界中的事物及其联系,在数据世界中用数据模型描
现实世界 观念世界 数据世界
数据库设计的步骤
用户需求分析
概念结构设计
E-R图
逻辑结构设计 数据模型
物理结构设计
客户票据 分期贷 款程序
贷款分析 报告
分期贷 款程序
分期贷款 客户数据文库件修改
二、数据库系统的产生与构成
数据库是统一管理的相关数据的集合。
数据库系统的诞生(20世纪60年代末和70年代初)
1、数据库管理系统IMS(Information Management System)
1968年研制成功、1969年形成产品的。 IBM(International Business Machine)
信息世界
实体 及 联系
实体集合 实体 相关属性集合
E-R模型
加工、转换
数 文件
据 记录
DBMS的
库 相关数据项集合 数据模型
数据世界
关系模式 对关系的描述,用关系名 (属性1,属性2,…属
性n)来表示。
eg. 库存(仓库号,器件号,数量) 仓库(仓库号,城市,面积)
转换过程示意图
E-R图
关系模型
3、管理信息系统是( D)
A、计算机系统
B、数据处理系统
C、办公自动化系统 D、人机交互系统
4、决策问题的类型包括( D)
A、结构化决策和半结构化决策 B、优化决策和结构化决策 C、组织结构和非组织结构 D、结构化决策、非结构化决策和半结构化决策
5.在数据库设计中,根据用户要求,一般先建立能反映不 同实体间存在的各种联系,即E-R图。如果一个教师可指 导多名研究生,且一名研究生可由多位教师指导,那么指
二、数据管理的内容
• 企业建立和维护其信息资源的全部工作称为信息资源管理 • 数据是一种资源,对它进行管理的过程称为数据管理。 • 包括:
– 数据收集 – 存储 – 维护 – 加工处理 – 安全保证 – 组织 – 检索
第二节 数据库技术
传统文件处理系统
一、数据处理的发展
用户 用户 用户
应用程序1 应用程序2 应用程序3
示例:学生数据库的数据层次
数据的层次
数据库 文件 纪录
数据项
举例
课程文件 简历文件 财务文件
学生数据库
刘汉云 数据库系统 4 89 李卓宇 数据库系统 4 85 张昕阳 数据库系统 4 85
课程文件
刘汉云 数据库系统 4 89 包含:学生姓名、所选课程、 学分及成绩的记录
刘汉云
(名字字段)
图 1 数据的层次
库存
仓库
器件
器件号 P1 P2 P3 P4
器件名称 显示卡 声卡 解压卡 散热风扇
仓库
器件
库存
仓库号 WH1 WH2 WH3
城市 北京 上海 广州
面积 370 500 200
库存
仓库号 WH1 WH1 WH1 WH2 WH2 WH2 WH3 WH3
器件号 P2 P3 P4 P1 P2 P4 P2 P1