数据库总结(简答题)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据的定义:描述事物的符号记录
数据库的定义:数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合
DBMS的定义:数据库管理系统(Database Management System,简称DBMS):位于用户与操作系统之间的一层数据管理软件(系统软件)。
DBMS的用途:
(1)科学地组织和存储数据
(2)高效地获取和维护数据
DBMS的主要功能:
(1)数据定义功能:提供数据定义语言(DDL)定义数据库中的数据对象
(2)数据操纵功能:提供数据操纵语言(DML) ,实现对数据库的基本操作(查询、插入、删除和修改)。
(3)数据库的运行管理:在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性、并在多用户同时使用数据库时进行并发控制,且在数据库系统发生故障后对系统进行恢复。
(4)数据库的建立和维护功能(实用程序):数据库数据批量装载、数据库转储、恢复、数据库的重组织、性能监视等
(5)数据库系统(Database System,简称DBS):指在计算机系统中引入数据库后的系统在不引起混淆的情况下常常把数据库系统简称为数据库
数据库系统的构成
(1)数据库
(2)数据库管理系统(及其开发工具)
应用系统
数据库管理员(DBA)和用户
数据管理是指对数据的组织、分类、编码、存储、检索和维护。
数据管理技术的发展过程
人工管理阶段特点:
(1) 数据不保存
(2) 系统没有专用的软件对数据进行管理
(3) 数据不共享
(4) 数据不具有独立性
文件系统阶段特点:
(1)数据以文件形式长期保存
(2)数据由文件系统统一管理
(3)应用程序直接访问数据文件
(4)数据的存取基本上以记录为单位
缺点:
(1)数据冗余度大
(2) 数据独立性低
(2)数据一致性差
数据库系统阶段特点:
(1)数据共享性高、冗余少
(2)数据结构化
(3)数据独立性高
(4)由DBMS进行统一的数据控制功能
A)数据的安全性(security)控制
B) 数据的完整性(integrity)控制
C) 并发(concurrency)控制
D) 数据恢复(recovery)
数据模型分成两个不同的层次:
(1)概念模型(概念层数据模型,也称信息模型):它是按用户的观点来对数据和信息建模。
(2)数据模型(组织层数据模型):它是按计算机系统的观点对数据建模,主要用于DBMS 的实现。
抽象过程---两步抽象
(1)现实世界中的客观对象抽象为概念模型;
(2)把概念模型转换为某一DBMS支持的数据模型。
数据模型通常由数据结构、数据操作和数据的约束条件三个要素组成
(7) 联系(Relationship)
实体内部的联系:组成实体的各属性之间的联系。
实体之间的联系:不同实体集之间的联系。
(1)一对一(2)一对多(3)多对多
目前最常用的数据模型有
层次模型(Hierarchical Model)
网状模型(Network Model)
关系模型(Relational Model)
面向对象的数据模型
(5)关系模型的优缺点
优点:
1)建立在严格的数学概念的基础上
2) 数据结构简单、清晰,用户易懂易用实体和各类联系都用关系来表示。
3) 关系模型的存取路径对用户透明具有更高的数据独立性,更好的安全保密性简化了程序员的工作和数据库开发建立的工作
缺点
1) 存取路径对用户透明, 导致查询效率往往不如非关系数据模型
2)为提高性能,必须对用户的查询请求进行优化
三级模式结构:
外模式:是数据库中全体数据的逻辑结构和特征的描述
概念模式:是数据库用户使用的局部数据的逻辑结构和特征的描述
内模式:是数据物理结构和存储方式的描述
二级映象
(1)外模式/模式映象:定义外模式与模式之间的对应关系
用途: 保证数据的逻辑独立性
(2)模式/内模式映象:模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。
用途:保证数据的物理独立性
关系数据库的规范化理论主要包括三个方面的内容:
函数信赖
范式(Normal Form)
模式设计和模式分解
进行数据库的操作时,会出现以下几方面的问题:
1. 数据冗余
2. 插入异常
3. 删除异常
4. 更新异常
一个好的关系模式应该具备以下四个条件:
1. 尽可能少的数据冗余
2. 没有插入异常
3. 没有删除异常
4. 没有更新异常
1.第一范式
第一范式(First Normal Form)是最基本的规范形式,即关系中每个属性都是不可再分的简单项。
2.第二范式
定义:如果关系模式R∈1NF,并且R中的每个非主属性都完全函数依赖于主码,则R ∈2NF。
存在问题:
(1)数据冗余
(2)插入异常
(3)删除异常
(4)更新异常
之所以存在这些问题,是由于在S-L表中存在着非主属性对主码的传递依赖。
3.第三范式
定义:如果R(U,F) ∈2NF,并且所有非主属性都不传递依赖于主码,则R(U,F) ∈3NF。关系模式S-L由2NF分解为3NF后,既没有非主属性对主码的部分依赖,也没有非主属性对主码的传递依赖,解决了2NF中存在的四个问题。
(1)数据冗余降低
(2)不存在插入异常
(3)不存在删除异常
(4)不存在更新异常值
4.BC范式(BCNF)
定义:若关系模式R∈1NF,对于关系R的每个函数依赖X→Y且Y X,X必含有候选码,则R∈BCNF。
即每个决定属性集都包含候选码。
关系规范化的目的:解决关系模式中存在的插入、删除、更新操作异常,数据冗余问题. 关系规范化的方法:围绕函数依赖的主线,对一个关系模式进行分解,使关系从较低级范式变换到较高级范式。
模式分解的准则:
(1)无损连接性
(2)保持函数依赖