数据库概念解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据库系统DBS
数据库系统DBS(Database System)是由硬件、软件、数据库和用户四部分构成整体。
数据库:是数据库系统的核心和管理对象,数据库是存储在一起的相互有联系的数据集合。数据库中的数据是集成的、共享的、最小冗余的、能为多种应用服务,数据是按照数据模型所提供的形式框架存放在数据库中。
硬件:数据库系统是建立在计算机系统上,运行数据库系统的计算机需要有足够大的内存以存放系统软件、需要足够大容量的磁盘等联机直接存取设备存储数据库庞大的数据。需要足够的脱机存储介质(磁盘、光盘、磁带等)以存放数据库备份。需要较高的通道能力,以提高数据传送速率。要求系统联网,以实现数据共享。
软件:数据库软件主要指数据库管理系统DBMS(DataBase Management System)。
DBMS是为数据库存取、维护和管理而配置的软件,它是数据库系统的核心组成部分,DBMS在操作系统支持下工作。DBMS主要包括数据库定义功能、数据操纵功能、数据库运行和控制功能、数据库建立和维护功能、数据通信功能。
用户:数据库系统中存在一组管理(数据库管理员DBA)、开发(应用程序员)、使用数据库(终端用户)的用户。
数据模型三要素是数据结构、数据操作、数据的约束条件。
1)数据结构:是所研究的对象类型的集合,是对系统静态特性的描述。
(2)数据操作:对数据库中各种对象(型)的实例(值)允许执行的操作的集合,操作及操作规则。如操作有检索、插入、删除、修改,操作规则有优先级别等。数据操作对系统动态特性的描述。
(3)数据的约束条件:是一组完整性规则的集合。也就是说,对于具体的应用娄必须遵循特定的语义约束条件,以保证数据的正确、有效和相容。
实体-联系模型图(E-R模型图):在数据库的概念设计过程中,最常用的就是实体-联系模型图(E-R模型图)。在E-R模型图中,实体用矩形框表示,实体的属性用圆角框表示,它们之间的联系用菱形框表示,在实体和联系之间用一条直线连接起来,这条直线带有"1"、"N"或"M"等值,用来表示联系的性质,即表示实体之间的联系是一对一、一对多或多对多等关系。因此,E-R模型也称为E-R 图。
E-R模型向关系模型的转换规则如下:
(1)一个实体型转换为一个关系模式,实体的属性就是关系的属
性,实体的码就是关系的码。
(2)一个1 : 1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。如果转换为一个独立的模式,则与该联系相连的各实体的码及联系本身的属性均转换为关系的属性,每个实体的码均是该关系的候选键。
(3)一个1 : n联系可以转换为一个独立的关系模式,也可以与任意n端对应的关系模式合并。如果转换为一个独立的模式,则与该联系相连的各实体的码及联系本身的属性均转换为关系的属性,而关系的码为n端实体的码。
(4)一个m : n联系转换为一个独立的关系模式,与该联系相连的各实体的码及联系本身的属性均转换为关系的属性,而关系的码为各实体码的组合。
(5)3个以上实体间的一个多元联系可以转换为一个独立的关系模式,与该联系相连的各实体的码及联系本身的属性均转换为关系的属性,而关系的码为各实体码的组合。
在关系代数运算中,五种基本运算为:并、差、选择、投影、笛卡尔积
选择:从关系中找出满足给定条件的元组的操作
投影:从关系中指定若干个属性组成新的关系的操作
联接:将两个关系并成一个更宽的关系模式。
数据库规范化:
规范化是对数据库数据进行有效组织的过程。规范化过程的两个主要目的是:消除冗余数据(如把相同的数据存储在超过一个表里)和确保数据的依赖性处于有效状态(相关数据只存储在一个表里)。这两个目标的实现很有意义,因为能够减少数据库和表的空间消耗,并确保数据存储的一致性和逻辑性。
范式:
国际数据库界制定了一系列构建数据库必须遵循的特殊规则,以确保数据库的规范化。在关系数据库里,这种规则就是范式,在数据库的世界里用数字来定义不同级别的范式,从低到高共分为五种:第一范式(简称1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)和第五范式(5NF)。第一范式需要满足的要求最低,第二范式在第一范式的基础上增加了更多的要求,以此类推。在实际应用当中,最常见的是第一范式、第二范式和第三范式
第一范式(1NF)
对于关系数据库而言,第一范式就是最基本的规则设置,必须满足以下两项要求:
从同一个表中删除重复列
为各个相关数据组创建独立表格,并以唯一列或列集(主键)来识别每行。
第一条规则表示在一个表的同一行中不能出现重复数据,指的是数据库表的不可分割属性。
第二范式(2NF)进一步深化了去除重复数据的概念,主要要求包括:
满足第一范式的所有要求
去除一个表中应用于多个行的数据子集,把它们分割到独立的表中。
利用外键为这些新创建的表和原表建立联接关系。
这些规则可以简单归纳如下:第二范式通过把冗余数据抽取出来,放置在新表里,并为新表建立联接关系,从而减少冗余数据量。
第三范式(3NF)符合第三范式的数据库要满足以下两个基本要求:首先要满足第一范式和第二范式的要求
删除所有不完全依赖主键的列。
数据库设计的基本步骤:
需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库的建立和测试、数据库运行和维护。
需求分析:
首先必须确认数据库的用户和用途。由于数据库是一个单位的模拟,数据库设计者必须对一个单位的基本情况有所了解。收集和分析这些资料的过程称为需求分析。
概念设计:
用概念数据模型,例如E-R模型,表示数据及其相互间的联系,产生反映用户信息需求和处理需求的数据库概念模式。数据库概念模式是独立于任何数据库管理系统、面向现实世界的数据模型。
逻辑设计:
在逻辑设计阶段,将第二步所得到的数据库概念模式,转换成以DBMS的逻辑数据模型表示的逻辑模式。
物理设计:
根据数据库的逻辑和概念模式、DBMS及计算机系统所提供的功能和施加的限制,设计数据库文件的物理存储结构、各种存取路径。
在不同的设计阶段将形成数据库的三层模式。
1)需求分析阶段,综合用户应用需求;
2)概念设计阶段,形成独立于数据库管理系统DBMS的概念模式;
3)逻辑设计阶段,将概念模式(可用E-R图描述)转换成DBMS 支持的数据模型(如关系模型),形成数据库的逻辑模式;
4)据用户处理的要求和安全性的考虑,在基本表的基础上建立必