(人工智能)人工智能原理教案章不确定性推理方法证据理论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(人工智能)人工智能原理教案章不确定性推理方法
证据理论
3.4证据理论
0.前言
●主观Bayes方法必须给出先验概率。
●Dempster和Shafer提出的证据理论,可用来处理这
种由不知道所引起的不确定性。
●证据理论采用信任函数而不是概率作为不确定性度量,
它通过对壹些事件的概率加以约束来建立信任函数而
不必说明精确的难于获得的概率。
●证据理论满足比概率论更弱的公理系统,当这种约束限
制为严格的概率时(即概率值已知时),证据理论就退
化为概率论了。
1.证据的不确定性度量
(1)基本理论
辨别框概念:设U为假设x的所有可能的穷举集合,且设U 中的各元素间是互斥的,我们称U为辨别框(Frameofdiscernment)。
设U的元素个数为N,则U的幂集合2U的元素个数为2N,每个幂集合的元素对应于壹个关于x取值情况的命题(子集)。
对任壹AU,命题A表示了某些假设的集合(这样的命题间不再有互斥性)。
针对医疗诊断问题,U就是所有可能疾病(假设)的集合,诊断结果必是U中确定的元素构成的。
A表示某壹种(单元素)或某些种疾病。
医生为了进行诊断所进行的各种检查就称作证据,有的证据所支持的常不只是壹种疾病而是多种疾病,即U的
壹子集A。
定义1:基本概率分配函数(Basicprobabilityassignment):对任壹个属于U的子集A(命题),命它对应于壹个数
m∈[0,1],而且满足
则称函数m为幂集2U上的基本概率分配函数bpa,称m(A)为A的基本概率数。
m(A)表示了证据对U的子集A成立的壹种信任的度量,取值于[0,1],而且2U中各元素信任的总和为1。
m(A)的意义为
●若A⊂U且A≠U,则m(A)表示对A的确定信任程度。
●若A=U,则m(A)表示这个数不知如何分配(即不知道的
情况)。
例如,
设U={红,黄,白},2U上的基本概率分配函数m为
m({},{红},{黄},{白},{红,黄},{红,白},{黄,白},{红,黄,白})=(0,0.3,0,0.1,0.2,0.2,0,0.2)
其中,
m({红})=0.3表示对命题{红}的确定信任度。
m({红,黄,白})=0.2表示不知道这0.2如何分配。
值得注意的是,
m({红})+m({黄})+m({白})
=0.3+0+0.1=0.4<1
因此,m不是概率,因为概率函数P要求
P(红)+P(黄)+P(白)=1
即有
P(A)=1-P(~A)
而这里m(A)1-m(~A)
其中:~A=U-A,是A的补集。
小结:bpa不同于Bayes方法,因为Bayes方法仅对U中单个元素赋予壹种信任――概率。
而对于bpa来说:
●给U的每个子集指派[0,1]中的壹个数;
●空集的指派为0;
●所有子集的指派值之和等于1。
●m(U)只是总可信度的壹部分。
于对U中的适当子集分派
可信度之后,剩余的可信度就不再分派给其它任何子集,
而只分派给U本身。
即:如果有壹证据仅支持U的壹个子
集A,m(A)=S,而不支持其它任何子集B,则指派
m(U)=1-S,m(B)=0,B≠A,BU。
定义2:信任函数(Belieffunction):
命题A的信任函数Bel:2U→[0,1]为
∀A⊆U
表示对A的总信任。
即,命题A的信任函数的值,是A的所有子集的基本概率之
和。
例如,于前面的例子中
Bel({红},{白})
=m({红})+m({白})+m({红,白})
=0.3+0.1+0.2
=0.6
根据定义能够见出
Bel()=0
Bel(U)=1
单元素集上m和Bel是相等的,例如:
Bel({红})
=m({红})
=0.3。
定义3:似然函数(Plausibilityfunction):
命题A的似然函数Pl:2U→[0,1]为
∀A⊆U
表示对于不否定A的信任度,是所有和A相交的子集的基本概率之和。
其中:~A=U-A,是A的补集。
信任函数和似然函数有以下的关系:
0≤Bel(A)≤Pl(A)≤1
Pl(A)-Bel(A)表示了既不信任A也不信任~A的壹种度量,可表示对命题A是真是假不知道的度量。
用记号
A[Bel(A),Pl(A)]
来综合描述A的不确定性。
其中,Bel(A)和Pl(A)分别表示命题A 的下限函数和上限函数。
实际上m,Bel,Pl只要知其壹,必可求得另俩个,但三个函数有不同含义。
例如,于前面的例子中:
m({红})=0.3
Bel({红})=m({红})+m({})
=0.3+0=0.3
Pl({红})=1-Bel({~红})
=1-Bel({黄,白})
=1-[m({黄})+m({白})+m({黄,白})]
=1-(0+0.1+0)
=0.9
所以,{红}[Bel({红}),Pl({红})]={红}[0.3,0.9]。
以下列举几个典型值的含义:
A[1,1]
表示A为真。
因为Bel(A)=1,Bel(~A)=1-Pl(A)=0。
A[0,0]
表示A为假。
因为Bel(A)=0,Bel(~A)=1-Pl(A)=1。
A[0,1]
表示对A壹无所知。
因为:Bel(A)=0,说明对A缺少信任;Bel(~A)=1-Pl(A)=0,
说明对~A也缺少信任。
A[0.6,1]
表示对A部分信任。
因为Bel(A)=0.6,Bel(~A)=0。
A[0,0.4]
表示对~A部分信任。
因为Bel(A)=0,Bel(~A)=0.6。
A[0.3,0.9]
表示同时对A和~A部分信任。
(2)证据描述
设某个领域的辨别框U={S1,S2,…,S n},m为2U上定义的基本概率分配函数,于下面描述的算法中,应满足如下条件:
a)m({S i})≥0,对S i∈U
b)
c)m(U)=1-
d)m(A)=0,对A U,且|A|≠1(集合A的元素个数不为1,且又不
包括全体元素)
例如,U={红,黄,白}时下面的基本概率分配函数:
m({红},{黄},{白},{红,黄,白},{})
=(0.6,0.2,0.1,0.1,0)
其中,m({红,黄})=m({红,白})=m({黄,白})=0。
定义4(证据的信任函数):
对任何命题A⊆U,其信任函数为
Bel(A)=∀A⊂U
Bel(U)=
定义5(证据的似然函数):
对任何命题A⊆U,其似然函数为
Pl(A)=1-Bel(~A)=1-A⊂U
=1-
=1-[1-m(U)-Bel(A)]
=m(U)+Bel(A)
根据之上定义,能够见出命题的信任函数和似然函数之间满足下列关系:
●Pl(A)≥Bel(A)
●Pl(A)-Bel(A)=m(U)
除了以A[Bel(A),Pl(A)]来作为证据A的不确定性度量外,仍可用类概率函数来度量。
定义6(类概率函数):
设U为有限域,对任何命题A⊆U,命题A的类概率函数为其中|A|、|U|分别表示A和U所含元素个数。
类概率函数具有如下性质:
1)
2)Bel(A)≤≤Pl(A),∀A⊆U
3)=1-,∀A⊆U
根据之上性质,能够得出以下推论:
1)
2)
3)
能够见出,类概率函数和概率函数具有非常相似的性质。
(3)证据的组合
对于同样的证据,由于来源不同,会得到不同的概率分配函数。
Dempster提出用正交和来组合这些函数。
定义7(正交和):
设m1,m2,…,m n为2U上的n个基本概率分配函数,它们的正交和m(A)=(m1m2…m n)(A)为
其中
k-1=1-
若k-1=0,则m i之间是矛盾的,没有联合基本概率分配函数。
若k-1≠0,这样的m i就确定壹个基本概率分配函数。
常数k是根据m1m2…m n需对2U的所有元素的基本概率分配之和为1来确定的。
(这种规定称作Dempster组合规则,要求m1m2…m n提供的证据满足某种独立性条件)
2.规则的不确定性度量
设某个领域的辨别框U={S1,…,S n},命题A、B、…为U的子集,推理规则为
E→H,CF
其中,E、H为命题的逻辑组合,CF为可信度因子。
命题和可信度因子可表示为
A={a1,…,a k}
CF=(c1,…,c k)
其中c i用来描述a i的可信度,i=1,2,…,k。
对任何命题A,A的可信度CF应满足:
1)c i≥0,1≤i≤k
3.推理计算
(1)当条件部分为命题的逻辑组合时,整个条件部分的确定性计算:
=min{}合取
=max{}析取
(2)结论部分的命题的确定性计算:
即,已知,A→B(c1,…,c k),如何计算。
思路:根据前面介绍的方法,首先计算基本分配函数m(B),然后计算结论部分命题B的信任函数Bel(B)、似然函数Pl(B),最后计算类概率函数和确定性。
设B={b1,b2,…,b k},且U={b1,b2,…,b k},则U上的基本概率
分配函数为
m({b1},…,{b k})=(c1,…,c k)
c i
便可得。
(3)独立证据导出同壹假设
如果有n条规则支持同壹命题时,根据Dempster组合规则,总的基本概率分配函数m为各规则结论得到的基本概率分配函数的正交和:
m=m1m2…m n
例如,已知A1→B(c1,…,c k)
A2→B()
以及
如何计算。
首先计算总的基本概率分配函数m=m1m2,然后计算命题B 的信任函数、似然函数,进而可求出类概率函数。
例U={a,b,c,d}(参见p101)
:{b,c,d}→0.7U→0.3
:{a,b}→0.6U→0.4
可列表求m=m1m2
m1
,
于是
{b}→0.42,{a,b}→0.18,{b,c,d}→0.28
U→0.12(=0.7(0.6+0.4)+0.3(0.6+0.4)=1)
有了便可计算,如
()({a,b})
=
=m()+m({a})+m({b})+m({a,b})
=0+0+0.42+0.18=0.60
随之可计算,从而可得
4.举例(p102)
(1)已知=0.8.=0.6)|U|=20→B={,}()=(0.3,0.5)来计算。
先计算=min{}=min{0.8,0.6}=0.6
进而计算=(0.6×0.3,0.6×0.5)=(0.18,0.3)
于是有Bel(B)=m()十m({})+m({})+
=0+0.18+0.3+0=0.48
(依C i定义,m({})=0.18,m({})=0.3,随之有
m(U)=1-(0.18+0.3)=0.52,而对U的其他子集的m值均赋以
Pl(B)=1-Be1(~B)=1-0=1
最后得
=0.48+(1-0.48)=0.53。
(2)已知=0.53,=0.52,|U|=20。
以及
→B={},()=(0.1,0.5,0.3)
→B={},()=(0.4,0.2,0.1)
求。
先求
=(0.53×0.1,0.53×0.5,0.53×0.3)=(0.053,0.265,OJ59) (U)=1壹(0.053+0.265+0.159)=0.524
=(0.52×0.4,0.52×0.2,0.52×0.1)
=(0.208,0.104,0.052)
(U)=1-(0.208+0.104+0.052)=0.636
以及m=
=({})()+({})(U)+
()()+()(U)
+(()+()(U)+(U)({})+(U)()
+(U)()+(U)(U)
=0.874
得
m({})=(({})({})+({})(U)+(U)({})
=0.176
m()=(()()+()(U)+(U)())
=0.299
m()=((()+()(U)+(U)())
=0.157
m(U)=1-(0.176+0.299+0.157)=0.368
于是
Bel(B)=m({})+m()+m()=0.632
Pl(B)=1
最后得
=
=0.632十(1-0.632)·3/20
=0.687
从代数观点见,MYCIN、EMYCIN、PROSPECTOR、D-S给出的不确定方法均可构成半群;MYCIN、D-S方法仍有单位元但无逆元;EMYCIN、PROSPECTOR方法既有单位元又有逆元,从而可构成群。
5.本节小结
证据理论有如下壹些特点:
1)证据理论满足比概率论更弱的公理系统。
当|A|>1,m(A)=0时,
证据理论就退化为概率论;当对所有的m(A i)≠0,有A1⊆A2⊆…⊆A n时,证据理论退化为Zadeh的可能性理论。
2)证据理论能够区分不知道和不确定。
3)证据理论能够处理证据影响壹类假设的情况,即证据不仅能影响
壹个明确的假设(和单元素子集相对应)、仍可影响壹个更壹般的不明确的假设(和非单元素子集相对应)。
因此,证据理论能够于不同细节、不同水平上聚集证据,更精确地反应了证据收集过程。
4)证据理论的缺点是:要求辨别框中的元素满足相互排斥的条件,
于实际系统中不易满足。
而且,基本概率分配函数要求给的值太多,计算比较复杂。
5)。