数据库主要名词解释

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.属性和域:在现实世界中,一个事物常常取若干特性来描述,这些特性成为属性。每个属性的取值范围对应一个值的集合,成为该属性的域。一般在关系数据模型中,限制所有的域都是原子数据。例如,整数、字符串是原子数据,而集合、记录、数组是非原子数据。关系数据模型的这种限制称为第一范式条件。

2。事务:关系数据库中,一般使用“事务”来处理用户对数据库执行的一系列操作。事物是一种机制,是一个操作序列,它包含了一组数据库操作命令,所有的命令作为一个整体,一起向系统提交或撤消操作请示,即要么都执行,要么都不执行.因此,事务是一个不可分割的逻辑单元,类似于操作系统中的原语。

3。目或度:属性个数n是关系的目或度。

4.候选码:若关系中某一属性(或属性组)的值能唯一地标识一个元组,则称该属性(属性组)为候选码。

5。超码:是一个或多个属性的集合,这些属性的集合可以在一个关系中唯一地标识一个元组

5.主码(Primary Key):若一个关系能多个候选码,则选定其中一个为主码。

6.主属性(Key attribute):包含在任何候选码中的属性称为主属性。

7。非码属性(Non—Key attribute):不包含在任何候选码中的属性称为非码属性.

8。外码(Foreign Key):如果关系模式R中的属性(属性组)不是该关系的码,但它是其他关系的码,那么该属性(属性组)对关系模式R而言是外码.例如,客户与货款之间的借贷联系c-l(c-id, loan—no),属性c—id是客户关系的码,所以c—id是外码;属性loan-no 是贷款关系中的码,所以loan-no也是外码。

数据库完整性主要作用:防止合法用户使用数据库时向数据库中添加不合语义的数据;利用基于DBMS的完整性控制机制来实现业务规则,易于定义,容易理解,而且可以降低应用程序的复杂性,提高应用程序的运行效率;在应用软件的功能测试中,完善的数据库完整性有助于尽早发现应用软件的错误

数据库设计概述:需求分析(确定存储哪些数据、数据之间的联系和约束)概念数据库设计(在需求分析的基础上,形成独立于DBMS的概念模型)逻辑数据库设计(将概念模型映射为某个特定的DBMS模式数据)物理数据库设计(为逻辑数据模型建立一个完整的能实现的数据库结构)实施(物理设计的结果把原始数据装入数据库,建立一个具体的数据库)运行与维护(进一步调整和修改数据库)。

实体:是现实世界中可区别于所有其他对象的一个“事物”或者“对象”。事物:事件、物体、概念.——学生:甲、乙、丙…课程:DB、DS、SE…

实体集:同类型实体的集合。--{二年级一班的学生},{DB,DS,SE}…

实体型:类型的特性和性质。-—学生、教师、课程、图书、货物订单

属性:来源于域,域是同类型值的集合,用来刻画实体的特征。

联系:多个实体之间的关联关系如:选课联系。联系实例:一个具体的多个实体间的相互关系.如:(甲,DS),(甲,OS),(乙,DS)… 联系集:同类型联系的集合。{(甲,DS)(甲,OS)(乙,DS)…}

实体和联系的关系:实体参与联系,扮演角色。一般地,扮演的角色是明确的,不需要显式指明。同型实体间的联系:同型实体间可以有联系。称作自环联系(recursive)。联系扮演的角色需要指明。

联系可以有属性:属性是描述性属性.属性是一个联系所具有的某种性质。例如,选课联系可以有属性:成绩

全部参与vs部分参与:如果每个实体,至少参与某联系集的一个联系中,称全部参与。否则,称作部分参与.全部参与是联系的一种约束。部分参与不是联系的约束。全部参与使用双线段表示。

属性在E—R图中的表示方法:E—R图中直接表示属性。E-R中省略属性,属性另行使用表格表示。

直接表示vs使用表格表示:E-R直接表示属性,语义清晰,但图复杂。省略属性,可以使E—R更好地突出逻辑模型的骨架,适用于全局E—R图或复杂E—R图。在简单的局部E-R图中,可以直接在E—R中表示关键属性,帮助理解数据语义。

实体间关系的表示:两实体之间的关联关系要使用联系表示。不可以将一个实体的主码作为另一个实体的属性,以表示两个实体间的关系.弱实体定义:没有足够属性标识的实体,称为弱实体。反之称为强实体.弱实体需要依赖属主实体而存在,不能独立存在 .

标志性联系:弱实体和属主实体之间的联系是存在依赖联系。弱实体和属主实体间的存在依赖联系,称作实体的标志性联系。标识性联系:多对一、全部参与,一般不命名。标识性联系在E—R图中以双边框菱形表示。

分辨符: 弱实体在特定属主实体内的标识属性,称作分辨符.在全局范围内,弱实体的标识由属主实体的主码和弱实体的分辨符共同组成。分辨符在E—R图中用虚下划线表示.

属性实体化:属性实体化后,如果有标识属性,自然成为强实体。属性实体化后,如果没有标志性属性,有两种办法处理: 1、将属性实体化为弱实体 2、通过增加标识属性,使属性实体化为强实体.

弱实体vs强实体:增加标识属性实际上是进行了实现相关的设计工作.在分析阶段进行设计工作会限制设计阶段设计方案的选择。使用弱实体能更好地刻画现实语义。引入弱实体使E—R图元素增多、复杂性增加。

聚集:可以将联系和参与联系的实体聚集为高层实体.高层实体可以和其它实体产生联系.例如:客户、项目及订购联系聚集成的高层实体,可以和银行之间建立担保联系。

命名冲突:同名异义-相同的名字表示的对象不同。财务部:工资=月工资+奖金。人力资源部:工资指不含奖金的工资。异名同义:同一意义的对象具有不同的名字。例如:工资、社保缴费基数。

命名冲突消除-在全局范围内使用统一和精确无二义的命名。

冲突消除目标:同名同义、同义同名

属性冲突:属性域的冲突。属性的类型、取值范围不同。如成绩存在五分制、百分制、等级制。属性取值单位冲突:如重量单位:吨、千克、克。属性冲突消除目标:同一属性概念、域、单位完全相同

结构冲突:同一对象在不同E—R图中的抽象结果不同.同一实体在不同E—R图中属性组成不同.同一实体在不同E-R图中抽象层次不同。同一联系在不同E—R图中呈现不同的类型。结构冲突消除:需要对E—R图进行必要的重构

表的合并:联系转化成的表,和实体转化成的表,可以机械地按照下述原则合并:

——-二元多对一联系:联系转化的表可以和“多端”实体转化成的表进行合并

———二元一对一联系:联系转化的表可以任一端实体转化成的表进行合并;二元一对一联系不能导致相关实体转化成的表合并。

--—二元m:n联系:联系转化的表和实体转化的表不能进行合并。

-—-多元联系:联系转化的表和实体转化的表不能进行合并;即便是m:n:1,其转化的表和也不能进行合并。

实体转化成的表,相互之间不能机械合并。

联系转化成的表,相互之间不能机械合并.

聚集à表:聚集的处理方案:联系及相关实体聚集成的高层实体,核心是被聚集的“联系”;聚集成的高层实体本身不转化成表;高层实体参与的联系进行正常的表转化,高层实体的主码使用聚集的“核心联系”的主码代替。

E—R图转换为表 vs 模式优化设计:一个良好的E-R图,转换为表并进行必要的合并,得到的结果已经是比较理想的数据库模式;不排除还有人工进一步优化的余地;进一步的优化必须审慎,必须综合评价优化的优缺点。

物理存储介质分类:数据访问的速度;每单位数据的成本;可靠性—在电源出现故障或系统崩溃时数据丢失;存储设备的物理故障 .按存储信息分—易失性存储:电源断电后失去内容。非易失性存储:电源断电后内容仍然;保持包括辅助存储和三级存储,以及带有备用电池的主存。

数据库的三级模式:物理模式:数据的存储结构,研究数据如何存储,也称作称存储模式、内模式。逻辑模式:全体数据的逻辑结构,又称作全局模式。外模式:具体用户看到的数据的逻辑结构,又称作子模式、用户模式.

高速缓冲存储器 - 主存储器(Main memory) - 易失的(Volatile) - 快闪存储器(Flash memory)—磁盘光学存储器—磁带存储器文件中记录的组织:堆文件 - 一个记录可以放在文件中任何地方只要有有足够的空间 ;顺序文件—记录根据“搜索码”的值顺序存储;哈希文件—在每条记录的某些属性上计算一个哈希函数,哈希函数的结果确定了记录应放到文件的哪一块中. 每个关系的记录可被存储在一个单独的文件中 - 在多表聚簇文件组织中一个文件可以存储多个不同关系的记录。

动机:将相关记录存储在同一个块上从而减少I/O

索引:索引机制用于加快访问所需数据的速度.搜索码用于在文件中查找记录的属性或属性集。

顺序索引和散列的比较:散列索引:将值平均分布到若干散列桶中;能很好地支持特定值查询;不能有效支持值范围查询。顺序索引:基于值的大小顺序组织的索引;能很好地支持特定值查询、值范围查询;典型代表:B+树索引,是目前主流的索引结构 .

稠密索引:在稠密索引中,文件中的每个搜索码值都有一个索引项。

稀疏索引:在稀疏索引中,只为搜索码的某些值建立索引项.只有索引是聚集索引时才能使用稀疏索引.在稀疏索引中为了定位一个搜索码值为 K 的记录,我们需要:1.找到搜索码值

多级索引:如果主索引不能放在内存中,访问效率将变低。解决方案:把主索引当做一个连续的文件保留在磁盘上,创建一个它之上的稀疏索引。外层索引–主索引上的稀疏索引.内索层引–主索引文件。如果外层索引还是太大而无法放在内存中,可以再次创建一个次级索引,以此类推.对文件进行插入或删除操作时,各级索引必须全部更新。

主索引:包含记录的文件按照某个搜索码指定的顺序排序,那么该搜索码对应的索引称为主索引,也被称为聚集索引。尽管不必如此,但主索引的搜索码常常是主码。可以使用稀疏索引.

辅助索引:搜索码指定的顺序与文件中记录的物理顺序不同的索引.也称为非聚集索引.一个表可以有多个辅助索引;辅助索引必须采用稠密索引;候选码上的辅助索引和稠密聚集索引(主索引)没有太大的区别.

B-TREE和BitMap区别和使用场景:B—TREE:记录对应的列重复的值较少,如主键,姓名等。在做updated时,b—tree只消耗很少的资源。where子句中 or条件较多时速度较慢。记录频繁的insert和update,查询相对较少的系统。Bitmap 索引:用在记录相同的值较多的列上,如性别只有两种值:男和女。在做updated时,bitmap的消耗是昂贵的。where子句中 or条件较多时速度非常快。(OLAP)数据仓库,查询系统等较少做数据修改的系统。

索引的建立原则:不必为小表创建索引;为表的主码建立索引;为检索数据时大量使用的列建立辅助索引(如 name);若经常基于外码访

相关文档
最新文档