数据库函数依赖
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
求(BD)+,判断BD→AC是否属于F+
解:X+=BDEGCA
结论:(BD)+=ABCDEG,BD→AC可由F导出,即BD→AC属于F+
例:已知关系模式R中
U={A,B,C,E, H, P, G},
F={AC→PE, PG→A, B→CE, A→P, GA→B,GC→A, PAB→G, AE→GB, ABCP→H},
(学生ID,所修课程ID)→学生姓名
六、平凡函数依赖和非平凡函数依赖
设X,Y均为某关系上的属性集,且X→Y
1)若Y包含于X,则称X→Y为:平凡函数依赖;
2)若Y不包含于X,则称X→Y为:非平凡函数依赖。
Y包含于X内,W于X相交,与Y无直接交集。
则:X→Y为平凡函数依赖
X→W, W→Y为非平凡函数依赖
A→ABC,AB→ABC,AC→ABC,ABC→A,BC→BC}
例:已知关系模式R中
U={A,B,C,D, E, G},
F={AB→C, C→A, BC→D, ACD→B, D→EG, BE→C, CG→BD, CE→AG},判断BD→AC是否属于F+
解:由D→EG知D→E,BD→BE…①
又知BE→C,C→A所以BE→A, BE→AC…②
解:当X=A时,X+=ABC
当X=B时,X+=BC
当X=C时,X+=C
* X代表的属性集可以决定的属性集(包括本身)
2、定理:当且仅当Y属于X+时,X→Y能根据Armstron公理由F导出。
证:设Y=A1,A2,…,An
①充分条件:当Y属于X+时,对于每个i,Xห้องสมุดไป่ตู้Ai可由公理导出。
再用合并规则可得X→Y。
②必要条件:若X→Y能够由公理导出,则根据分解规,
X→Ai(i=1,2,…,n)成立,所以Y属于X+。
3、计算X+
(1)算法依据:若F为关系模式R(U)的函数依赖集,X,Z,W是U的子集,对于任意的Z→W∈F,若X≥Z(表X包含Z),则X→XW。
(2)算法:
a.令X+ = X;
b.在F中依次查找每个没有被标记的函数依赖,若“左边属性集”包含于X+,则令X+ = X+∪“右边属性集”,为被访问过的函数依赖设置访问标记。
例:
学生ID,学生姓名,所修课程ID,课程名称,成绩
(学生ID,所修课程ID)→成绩
成绩既不能单独依赖于学生ID,也不能单独依赖于所修课程ID,因此成绩完全函数依赖于关键字。
(学生ID,所修课程ID)→学生姓名
学生ID→学生姓名
学生姓名可以依赖于关键字的一个主属性——学生ID,因此学生姓名部分函数依赖于(学生ID,所修课程ID)。
[Y],则称X函数决定Y,或称Y函数依赖于X,记为X→Y。
例:
(sno-学生ID,tno-教师ID,cno-课程ID,sname-学生姓名,tname-教师姓名,cname-课程名称,grade-成绩)
1、sno→sname, cno→cname,(sno,cno)→grade√
2、sname→sno, tno→cno, sno→tname×
七、传递函数依赖
X→Y,Y→Z
则Z传递函数依赖于X
函数依赖闭包
一、函数依赖的逻辑蕴涵
定义:设有关系模式R(U)及其函数依赖集F,如果对于R的任一个满足F的关系r函数依赖X→Y都成立,则称F逻辑蕴涵X→Y,或称X→Y可以由F推出。
例:关系模式R=(A,B,C),函数依赖集F={A→B,B→C}, F逻辑蕴涵A→C。
2、X和Y间联系是M:1(M),则X→Y。
3、X和Y间联系是M:N(M,N),则X、Y间不存在函数依赖。
五、完全函数依赖和部分函数依赖
1、函数依赖分为完全函数依赖和部分函数依赖
2、定义:
在R(U)中,如果X→Y,并且对于X的任何真子集X'都有X'Y',则称Y完全依赖于X,记作X→Y;否则,如果X→Y,且X中存在一个真子集X',使得X'→Y成立,则称Y部分依赖于X。
由①、②知,BD→AC,所以BD→AC被F所蕴涵,即BD→AC属于F+
例:已知关系模式R中
U={A,B,C,E, H, P, G},
F={AC→PE, PG→A, B→CE, A→P, GA→B, GC→A, PAB→G, AE→GB, ABCP→H},证明BG→HE属于F+
证:由B→CE知B→C,B→E, BG→GC…①
c.反复执行b直到X+不改变为止。
(先令X+等于本身,然后在F+中依次查找左边包含于X+的属性,把其右边的对应属性并到X中)
(3)算法实现
输入:关系模式R的子集X,R上的函数依赖集F。
输出:X关于F的闭包X+
算法伪语言描述:
Closure(X,F)
{
olds=Φ; news=X; G=F;
while (olds!=news)
{
olds=news;
for (G中的每个函数依赖W→Z)
{
if (news包含W)
{
news=news∪Z;
从G中删除函数依赖W→Z;
}
}
}
return news;
}
例:已知关系模式R中
U={A,B,C,D, E, G},
F={AB→C, C→A, BC→D, ACD→B, D→EG, BE→C, CG→BD, CE→AG},
同理(ab)+={a,b,f}也不包含g,故不是多余的.
b+={b}不多余,c+={c,i}不多余
c->i,g->h多不能去掉.
所以所求最小函数依赖集为F={abd->e,ab->g,b->f,c->j,c->i,g->h};
输出:若X→Y∈F+输出真,否则输出假
算法伪语言描述:
number(F,X→Y)
{ if (Y包含于close(X,F))
return真
else
return假
}
{Ai|i=1,2,…}称为X对于F的闭包,记为X+。
最小函数依赖
如果函数依赖集合F满足:
(1)F中的每一个函数依赖的右部都是单属性。
(2)F中的任一函数依赖X-->A,其F-{X-->A}与F是不等价的。
三、函数依赖是语义范畴
1、语义:数据所反映的现实世界事物本质联系
2、根据语义来确定函数依赖性的存在与否
3、函数依赖反映属性之间的一般规律,必须在关系模式下的任一个关系r中都满足约束条件。
四、属性间的联系决定函数依赖关系
设X、Y均是U的子集
1、X和Y间联系是1:1,则X→Y,Y→X。(相互依赖,可记作X←→Y)
(X→Y由F依赖集中所有依赖关系推断而出)
二、Armstrong公理
1、定理:若U为关系模式R的属性全集,F为U上的一组函数依赖,设X、Y、Z、W均为R的子集,对R(U,F)有:
F1(自反性):若X≥Y(表示X包含Y),则X→Y为F所蕴涵;(F1':X→X)
F2(增广性):若X→Y为F所蕴涵,则XZ→YZ为F所蕴涵;(F2':XZ→Y)
F3(传递性):若X→Y,Y→Z为F所蕴涵,则X→Z为F所蕴涵;
F4(伪增性):若X→Y,W≥Z(表W包含Z)为F所蕴涵,则XW→YZ为F所蕴涵;
F5(伪传性):若X→Y,YW→Z为F所蕴涵,则XW→Z为F所蕴涵;
F6(合成性):若X→Y,X→Z为F所蕴涵,则X→YZ为F所蕴涵;
F7(分解性):若X→Y,Z≤Y (表Z包含于Y)为F所蕴涵,则X→Z为F所蕴涵。
即:F+={X→Y|X→Y∈F∨“应用Armstong公理从F中导出的任何X→Y”}
△F包含于F+,如果F=F+,则F为函数依赖的一个完备集。
△规定:若X为U的子集,X→Φ属于F+。
例:R=ABC,F={A→B, B→C},求F+
解:F+ ={A→Φ,AB→Φ,AC→Φ,ABC→Φ,B→Φ,C→Φ,
又知GC→A,A→P所以BG→A, BG→ABCP…②
又ABCP→H,由①、②知BG→HE,所以BG→HE被F所蕴涵,
即BG→HE属于F+
四、属性集闭包
1、定义:若F为关系模式R(U)的函数依赖集,X是U的子集,则由Armstrong公理推导出的所有X→Ai所形成的属性集
例:设R=ABC,F={A→B, B→C}当X分别为A,B,C是求X+。
函数依赖推理规则F1∽F7都是正确的。
2、Armstrong公理:
推理规则F1、F2、F3合称Armstrong公理;
F4∽F7可由F1、F2、F3推得,是Armstrong公理的推论部分。
三、函数依赖的闭包
定义:若F为关系模式R(U)的函数依赖集,我们把F以及所有被F逻辑蕴涵的函数依赖的集合称为F的闭包,记为F+。
数据库函数依赖
一、函数依赖(Functional Dependency)的概念
数据依赖的一种,它反映属性或属性组之间相依存,互相制约的关系,即反映现实世界的约束关系。
二、定义
设R(U)是属性U上的一个关系模式,X和Y均为U={A1,A2,…,An}的子集,r为R的任一关系,如果对于r中的任意两个元组u,v,只要有u[X]=v[X],就有u[Y]=v
证明BG→HE属于F+
证:因为,(BG)+ =ABCEHPG,
所以BG→HE可由F导出,即BG→HE属于F+
4、结论
判定函数依赖X→Y是否能由F导出的问题,可转化为求X+并判定Y是否是X+子集的问题。
即求闭包问题可转化为求属性集问题。
判定给定函数依赖X→Y是否蕴涵于函数依赖集F算法实现:
输入:函数依赖集合F,函数依赖X→Y
3.去掉F中所有冗余依赖关系.
做法为从F中去掉某关系,如去掉(X->Y),然后在F中求X+,如果Y在X+中,则表明x->y也是多余的.需要去掉.
此题如果F去掉abd->e,F将等于{ab->g,b->f,c->j,c->i,g->h},而(abd)+={a,d,b,f,g,h},其中不包含e.所以不是多余的.
A→A,AB→A,AC→A,ABC→A,B→B,C→C,
A→B,AB→B,AC→B,ABC→B,B→C,
A→C,AB→C,AC→C,ABC→C,B→BC,
A→AB,AB→AB,AC→AB,ABC→AB,BC→Φ,
A→AC,AB→AC,AC→AC,ABC→AC,BC→B,
A→BC,AB→BC,AC→BC,ABC→BC,BC→C,
作法是属性中去掉其中的一个,看看是否依然可以推导
此题:abd->e,去掉a,则(bd)+不含e,故不能去掉,同理b,d都不是冗余属性
ab->g,也没有
cj->i,因为c+={c,j,i}其中包含i所以j是冗余的.cj->i将成为c->i
F={abd->e,ab->g,b->f,c->j,c->i,g->h};
证:设u,v为r中任意两个元组:
若A→C不成立,则有u[A]=v[A],而u[C]≠v[C]
而且A→B, B→C,知
u[A]=v[A], u[B]=v[B], u[C]=v[C],
即若u[A]=v[A]则u[C]=v[C],和假设矛盾。
故F逻辑蕴涵A→C。
满足F依赖集的所有元组都函数依赖X→Y(X→Y不属于F集),则称F逻辑蕴涵X→Y
(3)F中的任一函数依赖X-->A,Z为X的子集。(F-{X-->A})∪{Z-->A}与F是不等价的。
则称F为最小函数依赖集合,记为Fmin。
求最小函数依赖集分三步:
1.将F中的所有依赖右边化为单一元素
例:fd={abd->e,ab->g,b->f,c->j,cj->i,g->h}
2.去掉F中的所有依赖左边的冗余属性.
解:X+=BDEGCA
结论:(BD)+=ABCDEG,BD→AC可由F导出,即BD→AC属于F+
例:已知关系模式R中
U={A,B,C,E, H, P, G},
F={AC→PE, PG→A, B→CE, A→P, GA→B,GC→A, PAB→G, AE→GB, ABCP→H},
(学生ID,所修课程ID)→学生姓名
六、平凡函数依赖和非平凡函数依赖
设X,Y均为某关系上的属性集,且X→Y
1)若Y包含于X,则称X→Y为:平凡函数依赖;
2)若Y不包含于X,则称X→Y为:非平凡函数依赖。
Y包含于X内,W于X相交,与Y无直接交集。
则:X→Y为平凡函数依赖
X→W, W→Y为非平凡函数依赖
A→ABC,AB→ABC,AC→ABC,ABC→A,BC→BC}
例:已知关系模式R中
U={A,B,C,D, E, G},
F={AB→C, C→A, BC→D, ACD→B, D→EG, BE→C, CG→BD, CE→AG},判断BD→AC是否属于F+
解:由D→EG知D→E,BD→BE…①
又知BE→C,C→A所以BE→A, BE→AC…②
解:当X=A时,X+=ABC
当X=B时,X+=BC
当X=C时,X+=C
* X代表的属性集可以决定的属性集(包括本身)
2、定理:当且仅当Y属于X+时,X→Y能根据Armstron公理由F导出。
证:设Y=A1,A2,…,An
①充分条件:当Y属于X+时,对于每个i,Xห้องสมุดไป่ตู้Ai可由公理导出。
再用合并规则可得X→Y。
②必要条件:若X→Y能够由公理导出,则根据分解规,
X→Ai(i=1,2,…,n)成立,所以Y属于X+。
3、计算X+
(1)算法依据:若F为关系模式R(U)的函数依赖集,X,Z,W是U的子集,对于任意的Z→W∈F,若X≥Z(表X包含Z),则X→XW。
(2)算法:
a.令X+ = X;
b.在F中依次查找每个没有被标记的函数依赖,若“左边属性集”包含于X+,则令X+ = X+∪“右边属性集”,为被访问过的函数依赖设置访问标记。
例:
学生ID,学生姓名,所修课程ID,课程名称,成绩
(学生ID,所修课程ID)→成绩
成绩既不能单独依赖于学生ID,也不能单独依赖于所修课程ID,因此成绩完全函数依赖于关键字。
(学生ID,所修课程ID)→学生姓名
学生ID→学生姓名
学生姓名可以依赖于关键字的一个主属性——学生ID,因此学生姓名部分函数依赖于(学生ID,所修课程ID)。
[Y],则称X函数决定Y,或称Y函数依赖于X,记为X→Y。
例:
(sno-学生ID,tno-教师ID,cno-课程ID,sname-学生姓名,tname-教师姓名,cname-课程名称,grade-成绩)
1、sno→sname, cno→cname,(sno,cno)→grade√
2、sname→sno, tno→cno, sno→tname×
七、传递函数依赖
X→Y,Y→Z
则Z传递函数依赖于X
函数依赖闭包
一、函数依赖的逻辑蕴涵
定义:设有关系模式R(U)及其函数依赖集F,如果对于R的任一个满足F的关系r函数依赖X→Y都成立,则称F逻辑蕴涵X→Y,或称X→Y可以由F推出。
例:关系模式R=(A,B,C),函数依赖集F={A→B,B→C}, F逻辑蕴涵A→C。
2、X和Y间联系是M:1(M),则X→Y。
3、X和Y间联系是M:N(M,N),则X、Y间不存在函数依赖。
五、完全函数依赖和部分函数依赖
1、函数依赖分为完全函数依赖和部分函数依赖
2、定义:
在R(U)中,如果X→Y,并且对于X的任何真子集X'都有X'Y',则称Y完全依赖于X,记作X→Y;否则,如果X→Y,且X中存在一个真子集X',使得X'→Y成立,则称Y部分依赖于X。
由①、②知,BD→AC,所以BD→AC被F所蕴涵,即BD→AC属于F+
例:已知关系模式R中
U={A,B,C,E, H, P, G},
F={AC→PE, PG→A, B→CE, A→P, GA→B, GC→A, PAB→G, AE→GB, ABCP→H},证明BG→HE属于F+
证:由B→CE知B→C,B→E, BG→GC…①
c.反复执行b直到X+不改变为止。
(先令X+等于本身,然后在F+中依次查找左边包含于X+的属性,把其右边的对应属性并到X中)
(3)算法实现
输入:关系模式R的子集X,R上的函数依赖集F。
输出:X关于F的闭包X+
算法伪语言描述:
Closure(X,F)
{
olds=Φ; news=X; G=F;
while (olds!=news)
{
olds=news;
for (G中的每个函数依赖W→Z)
{
if (news包含W)
{
news=news∪Z;
从G中删除函数依赖W→Z;
}
}
}
return news;
}
例:已知关系模式R中
U={A,B,C,D, E, G},
F={AB→C, C→A, BC→D, ACD→B, D→EG, BE→C, CG→BD, CE→AG},
同理(ab)+={a,b,f}也不包含g,故不是多余的.
b+={b}不多余,c+={c,i}不多余
c->i,g->h多不能去掉.
所以所求最小函数依赖集为F={abd->e,ab->g,b->f,c->j,c->i,g->h};
输出:若X→Y∈F+输出真,否则输出假
算法伪语言描述:
number(F,X→Y)
{ if (Y包含于close(X,F))
return真
else
return假
}
{Ai|i=1,2,…}称为X对于F的闭包,记为X+。
最小函数依赖
如果函数依赖集合F满足:
(1)F中的每一个函数依赖的右部都是单属性。
(2)F中的任一函数依赖X-->A,其F-{X-->A}与F是不等价的。
三、函数依赖是语义范畴
1、语义:数据所反映的现实世界事物本质联系
2、根据语义来确定函数依赖性的存在与否
3、函数依赖反映属性之间的一般规律,必须在关系模式下的任一个关系r中都满足约束条件。
四、属性间的联系决定函数依赖关系
设X、Y均是U的子集
1、X和Y间联系是1:1,则X→Y,Y→X。(相互依赖,可记作X←→Y)
(X→Y由F依赖集中所有依赖关系推断而出)
二、Armstrong公理
1、定理:若U为关系模式R的属性全集,F为U上的一组函数依赖,设X、Y、Z、W均为R的子集,对R(U,F)有:
F1(自反性):若X≥Y(表示X包含Y),则X→Y为F所蕴涵;(F1':X→X)
F2(增广性):若X→Y为F所蕴涵,则XZ→YZ为F所蕴涵;(F2':XZ→Y)
F3(传递性):若X→Y,Y→Z为F所蕴涵,则X→Z为F所蕴涵;
F4(伪增性):若X→Y,W≥Z(表W包含Z)为F所蕴涵,则XW→YZ为F所蕴涵;
F5(伪传性):若X→Y,YW→Z为F所蕴涵,则XW→Z为F所蕴涵;
F6(合成性):若X→Y,X→Z为F所蕴涵,则X→YZ为F所蕴涵;
F7(分解性):若X→Y,Z≤Y (表Z包含于Y)为F所蕴涵,则X→Z为F所蕴涵。
即:F+={X→Y|X→Y∈F∨“应用Armstong公理从F中导出的任何X→Y”}
△F包含于F+,如果F=F+,则F为函数依赖的一个完备集。
△规定:若X为U的子集,X→Φ属于F+。
例:R=ABC,F={A→B, B→C},求F+
解:F+ ={A→Φ,AB→Φ,AC→Φ,ABC→Φ,B→Φ,C→Φ,
又知GC→A,A→P所以BG→A, BG→ABCP…②
又ABCP→H,由①、②知BG→HE,所以BG→HE被F所蕴涵,
即BG→HE属于F+
四、属性集闭包
1、定义:若F为关系模式R(U)的函数依赖集,X是U的子集,则由Armstrong公理推导出的所有X→Ai所形成的属性集
例:设R=ABC,F={A→B, B→C}当X分别为A,B,C是求X+。
函数依赖推理规则F1∽F7都是正确的。
2、Armstrong公理:
推理规则F1、F2、F3合称Armstrong公理;
F4∽F7可由F1、F2、F3推得,是Armstrong公理的推论部分。
三、函数依赖的闭包
定义:若F为关系模式R(U)的函数依赖集,我们把F以及所有被F逻辑蕴涵的函数依赖的集合称为F的闭包,记为F+。
数据库函数依赖
一、函数依赖(Functional Dependency)的概念
数据依赖的一种,它反映属性或属性组之间相依存,互相制约的关系,即反映现实世界的约束关系。
二、定义
设R(U)是属性U上的一个关系模式,X和Y均为U={A1,A2,…,An}的子集,r为R的任一关系,如果对于r中的任意两个元组u,v,只要有u[X]=v[X],就有u[Y]=v
证明BG→HE属于F+
证:因为,(BG)+ =ABCEHPG,
所以BG→HE可由F导出,即BG→HE属于F+
4、结论
判定函数依赖X→Y是否能由F导出的问题,可转化为求X+并判定Y是否是X+子集的问题。
即求闭包问题可转化为求属性集问题。
判定给定函数依赖X→Y是否蕴涵于函数依赖集F算法实现:
输入:函数依赖集合F,函数依赖X→Y
3.去掉F中所有冗余依赖关系.
做法为从F中去掉某关系,如去掉(X->Y),然后在F中求X+,如果Y在X+中,则表明x->y也是多余的.需要去掉.
此题如果F去掉abd->e,F将等于{ab->g,b->f,c->j,c->i,g->h},而(abd)+={a,d,b,f,g,h},其中不包含e.所以不是多余的.
A→A,AB→A,AC→A,ABC→A,B→B,C→C,
A→B,AB→B,AC→B,ABC→B,B→C,
A→C,AB→C,AC→C,ABC→C,B→BC,
A→AB,AB→AB,AC→AB,ABC→AB,BC→Φ,
A→AC,AB→AC,AC→AC,ABC→AC,BC→B,
A→BC,AB→BC,AC→BC,ABC→BC,BC→C,
作法是属性中去掉其中的一个,看看是否依然可以推导
此题:abd->e,去掉a,则(bd)+不含e,故不能去掉,同理b,d都不是冗余属性
ab->g,也没有
cj->i,因为c+={c,j,i}其中包含i所以j是冗余的.cj->i将成为c->i
F={abd->e,ab->g,b->f,c->j,c->i,g->h};
证:设u,v为r中任意两个元组:
若A→C不成立,则有u[A]=v[A],而u[C]≠v[C]
而且A→B, B→C,知
u[A]=v[A], u[B]=v[B], u[C]=v[C],
即若u[A]=v[A]则u[C]=v[C],和假设矛盾。
故F逻辑蕴涵A→C。
满足F依赖集的所有元组都函数依赖X→Y(X→Y不属于F集),则称F逻辑蕴涵X→Y
(3)F中的任一函数依赖X-->A,Z为X的子集。(F-{X-->A})∪{Z-->A}与F是不等价的。
则称F为最小函数依赖集合,记为Fmin。
求最小函数依赖集分三步:
1.将F中的所有依赖右边化为单一元素
例:fd={abd->e,ab->g,b->f,c->j,cj->i,g->h}
2.去掉F中的所有依赖左边的冗余属性.