数据库函数依赖

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

求(BD)+，判断BD→AC是否属于F+
解：X+=BDEGCA
结论：(BD)+=ABCDEG,BD→AC可由F导出，即BD→AC属于F+
例：已知关系模式R中
U={A，B，C，E, H, P, G},
F={AC→PE, PG→A, B→CE, A→P, GA→B,GC→A, PAB→G, AE→GB, ABCP→H},
（学生ID，所修课程ID）→学生姓名
六、平凡函数依赖和非平凡函数依赖
设X，Y均为某关系上的属性集，且X→Y
1)若Y包含于X，则称X→Y为：平凡函数依赖；
2)若Y不包含于X，则称X→Y为：非平凡函数依赖。
Y包含于X内，W于X相交，与Y无直接交集。
则：X→Y为平凡函数依赖
X→W, W→Y为非平凡函数依赖
A→ABC,AB→ABC,AC→ABC,ABC→A,BC→BC}
例：已知关系模式R中
U={A，B，C，D, E, G},
F={AB→C, C→A, BC→D, ACD→B, D→EG, BE→C, CG→BD, CE→AG},判断BD→AC是否属于F+
解：由D→EG知D→E，BD→BE…①
又知BE→C，C→A所以BE→A, BE→AC…②
解：当X=A时，X+=ABC
当X=B时，X+=BC
当X=C时，X+=C
* X代表的属性集可以决定的属性集（包括本身）
2、定理：当且仅当Y属于X+时，X→Y能根据Armstron公理由F导出。
证：设Y=A1,A2,…,An
①充分条件：当Y属于X+时,对于每个i,Xห้องสมุดไป่ตู้Ai可由公理导出。
再用合并规则可得X→Y。
②必要条件：若X→Y能够由公理导出,则根据分解规,
X→Ai(i=1,2,…,n)成立，所以Y属于X+。
3、计算X+
(1)算法依据：若F为关系模式R(U)的函数依赖集,X,Z,W是U的子集,对于任意的Z→W∈F,若X≥Z（表X包含Z）,则X→XW。
(2)算法：
a.令X+ = X;
b.在F中依次查找每个没有被标记的函数依赖，若“左边属性集”包含于X+，则令X+ = X+∪“右边属性集”,为被访问过的函数依赖设置访问标记。
例：
学生ID，学生姓名，所修课程ID，课程名称，成绩
（学生ID，所修课程ID）→成绩
成绩既不能单独依赖于学生ID，也不能单独依赖于所修课程ID，因此成绩完全函数依赖于关键字。
（学生ID，所修课程ID）→学生姓名
学生ID→学生姓名
学生姓名可以依赖于关键字的一个主属性——学生ID，因此学生姓名部分函数依赖于（学生ID，所修课程ID）。
[Y]，则称X函数决定Y，或称Y函数依赖于X，记为X→Y。
例：
(sno-学生ID，tno-教师ID，cno-课程ID，sname-学生姓名，tname-教师姓名，cname-课程名称，grade-成绩）
1、sno→sname, cno→cname,(sno,cno)→grade√
2、sname→sno, tno→cno, sno→tname×
七、传递函数依赖
X→Y，Y→Z
则Z传递函数依赖于X
函数依赖闭包
一、函数依赖的逻辑蕴涵
定义：设有关系模式R(U)及其函数依赖集F，如果对于R的任一个满足F的关系r函数依赖X→Y都成立，则称F逻辑蕴涵X→Y，或称X→Y可以由F推出。
例：关系模式R=(A,B,C),函数依赖集F={A→B,B→C}, F逻辑蕴涵A→C。
2、X和Y间联系是M:1(M)，则X→Y。
3、X和Y间联系是M:N(M,N)，则X、Y间不存在函数依赖。
五、完全函数依赖和部分函数依赖
1、函数依赖分为完全函数依赖和部分函数依赖
2、定义：
在R(U)中，如果X→Y，并且对于X的任何真子集X'都有X'Y'，则称Y完全依赖于X，记作X→Y；否则，如果X→Y，且X中存在一个真子集X'，使得X'→Y成立，则称Y部分依赖于X。
由①、②知，BD→AC，所以BD→AC被F所蕴涵，即BD→AC属于F+
例：已知关系模式R中
U={A，B，C，E, H, P, G},
F={AC→PE, PG→A, B→CE, A→P, GA→B, GC→A, PAB→G, AE→GB, ABCP→H},证明BG→HE属于F+
证：由B→CE知B→C，B→E, BG→GC…①
c.反复执行b直到X+不改变为止。
（先令X+等于本身，然后在F+中依次查找左边包含于X+的属性，把其右边的对应属性并到X中）
(3)算法实现
输入：关系模式R的子集X,R上的函数依赖集F。
输出：X关于F的闭包X+
算法伪语言描述：
Closure(X,F)
{
olds=Φ; news=X; G=F;
while (olds!=news)
{
olds=news;
for (G中的每个函数依赖W→Z)
{
if (news包含W)
{
news=news∪Z;
从G中删除函数依赖W→Z;
}
}
}
return news;
}
例：已知关系模式R中
U={A，B，C，D, E, G},
F={AB→C, C→A, BC→D, ACD→B, D→EG, BE→C, CG→BD, CE→AG},
同理(ab)+={a,b,f}也不包含g,故不是多余的.
b+={b}不多余,c+={c,i}不多余
c->i,g->h多不能去掉.
所以所求最小函数依赖集为F={abd->e,ab->g,b->f,c->j,c->i,g->h};
输出：若X→Y∈F+输出真，否则输出假
算法伪语言描述：
number(F,X→Y)
{ if (Y包含于close(X,F))
return真
else
return假
}
{Ai|i=1,2,…}称为X对于F的闭包，记为X+。
最小函数依赖
如果函数依赖集合F满足：
（1）F中的每一个函数依赖的右部都是单属性。
（2）F中的任一函数依赖X-->A，其F-{X-->A}与F是不等价的。
三、函数依赖是语义范畴
1、语义：数据所反映的现实世界事物本质联系
2、根据语义来确定函数依赖性的存在与否
3、函数依赖反映属性之间的一般规律，必须在关系模式下的任一个关系r中都满足约束条件。
四、属性间的联系决定函数依赖关系
设X、Y均是U的子集
1、X和Y间联系是1:1，则X→Y,Y→X。（相互依赖，可记作X←→Y）
（X→Y由F依赖集中所有依赖关系推断而出）
二、Armstrong公理
1、定理：若U为关系模式R的属性全集，F为U上的一组函数依赖，设X、Y、Z、W均为R的子集，对R(U,F)有：
F1(自反性)：若X≥Y(表示X包含Y），则X→Y为F所蕴涵；(F1':X→X)
F2(增广性):若X→Y为F所蕴涵，则XZ→YZ为F所蕴涵；(F2':XZ→Y)
F3(传递性):若X→Y,Y→Z为F所蕴涵，则X→Z为F所蕴涵；
F4(伪增性)：若X→Y，W≥Z(表W包含Z）为F所蕴涵，则XW→YZ为F所蕴涵；
F5(伪传性):若X→Y，YW→Z为F所蕴涵,则XW→Z为F所蕴涵；
F6(合成性):若X→Y,X→Z为F所蕴涵，则X→YZ为F所蕴涵；
F7(分解性):若X→Y,Z≤Y (表Z包含于Y）为F所蕴涵，则X→Z为F所蕴涵。
即：F+={X→Y|X→Y∈F∨“应用Armstong公理从F中导出的任何X→Y”}
△F包含于F+，如果F=F+，则F为函数依赖的一个完备集。
△规定：若X为U的子集，X→Φ属于F+。
例：R=ABC,F={A→B, B→C},求F+
解：F+ ={A→Φ,AB→Φ,AC→Φ,ABC→Φ,B→Φ,C→Φ,
又知GC→A，A→P所以BG→A, BG→ABCP…②
又ABCP→H，由①、②知BG→HE，所以BG→HE被F所蕴涵，
即BG→HE属于F+
四、属性集闭包
1、定义：若F为关系模式R(U)的函数依赖集，X是U的子集，则由Armstrong公理推导出的所有X→Ai所形成的属性集
例：设R=ABC,F={A→B, B→C}当X分别为A,B,C是求X+。
函数依赖推理规则F1∽F7都是正确的。
2、Armstrong公理：
推理规则F1、F2、F3合称Armstrong公理；
F4∽F7可由F1、F2、F3推得，是Armstrong公理的推论部分。
三、函数依赖的闭包
定义：若F为关系模式R(U)的函数依赖集，我们把F以及所有被F逻辑蕴涵的函数依赖的集合称为F的闭包，记为F+。
数据库函数依赖
一、函数依赖（Functional Dependency)的概念
数据依赖的一种，它反映属性或属性组之间相依存，互相制约的关系，即反映现实世界的约束关系。
二、定义
设R（U）是属性U上的一个关系模式，X和Y均为U={A1，A2，…，An}的子集，r为R的任一关系，如果对于r中的任意两个元组u，v，只要有u[X]=v[X]，就有u[Y]=v
证明BG→HE属于F+
证：因为,(BG)+ =ABCEHPG,
所以BG→HE可由F导出，即BG→HE属于F+
4、结论
判定函数依赖X→Y是否能由F导出的问题，可转化为求X+并判定Y是否是X+子集的问题。
即求闭包问题可转化为求属性集问题。
判定给定函数依赖X→Y是否蕴涵于函数依赖集F算法实现：
输入：函数依赖集合F,函数依赖X→Y
3.去掉F中所有冗余依赖关系.
做法为从F中去掉某关系,如去掉(X->Y),然后在F中求X+,如果Y在X+中,则表明x->y也是多余的.需要去掉.
此题如果F去掉abd->e,F将等于{ab->g,b->f,c->j,c->i,g->h},而(abd)+={a,d,b,f,g,h},其中不包含e.所以不是多余的.
A→A,AB→A,AC→A,ABC→A,B→B,C→C,
A→B,AB→B,AC→B,ABC→B,B→C,
A→C,AB→C,AC→C,ABC→C,B→BC,
A→AB,AB→AB,AC→AB,ABC→AB,BC→Φ,
A→AC,AB→AC,AC→AC,ABC→AC,BC→B,
A→BC,AB→BC,AC→BC,ABC→BC,BC→C,
作法是属性中去掉其中的一个,看看是否依然可以推导
此题:abd->e,去掉a,则(bd)+不含e,故不能去掉,同理b,d都不是冗余属性
ab->g,也没有
cj->i,因为c+={c,j,i}其中包含i所以j是冗余的.cj->i将成为c->i
F={abd->e,ab->g,b->f,c->j,c->i,g->h};
证：设u,v为r中任意两个元组：
若A→C不成立，则有u[A]=v[A],而u[C]≠v[C]
而且A→B, B→C,知
u[A]=v[A], u[B]=v[B], u[C]=v[C],
即若u[A]=v[A]则u[C]=v[C]，和假设矛盾。
故F逻辑蕴涵A→C。
满足F依赖集的所有元组都函数依赖X→Y（X→Y不属于F集），则称F逻辑蕴涵X→Y
（3）F中的任一函数依赖X-->A，Z为X的子集。（F-{X-->A}）∪{Z-->A}与F是不等价的。
则称F为最小函数依赖集合，记为Fmin。
求最小函数依赖集分三步:
1.将F中的所有依赖右边化为单一元素
例：fd={abd->e,ab->g,b->f,c->j,cj->i,g->h}
2.去掉F中的所有依赖左边的冗余属性.