证据理论方法详解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章证据理论(Evidence Theory)方法
在本章§1,我们将讨论一种被称之为登普斯特-谢弗(Dempster-Shafer)或谢弗-登普斯特(Shafer-Dempster)理论(简称D-S理论或证据理论)的不精确推理方法。
这一理论最初是以登普斯特(Dempster,1967年)的工作为基础的,登普斯特试图用一个概率区间而不是单一概率数值去建模不确定性. 1976年,谢弗(Shafer,1976年)在《证据的数学理论》一书中扩展和改进了登普斯特工作. D-S理论具有好的理论基础。
确定性因子能被证明是D-S 理论的一种特殊情形。
在§2我们将描述一种简化的证据理论模型MET1 . 在§3我们将给出支持有序命题类问题的具有凸函数性质的简化证据理论模型。
围绕证据理论的一些新的研究工作,将在第六章介绍。
§1D-S理论(Dempster-Shafer Theory)
●辨别框架(Frames of Discernment)
D-S理论假定有一个用大写希腊字母Θ表示的环境(environment),该环境是一个具有互斥和可穷举元素的集合:Θ = { θ1 , θ2 , ⋯, θn }
术语环境在集合论中又被称之为论域(the universe of discourse)。
一些论域的例子可以是:
Θ = { airliner , bomber , fighter }
Θ = { red , green , blue , orange , yellow }
Θ = { barn , grass , person , cow , car }
注意,上述集合中的元素都是互斥的。
为了简化我们的讨论,假定Θ是一个有限集合。
其元素是诸如时间、距离、速度等连续变量的D-S 环境上的研究工作已经被做。
理解Θ的一种方式是先提出问题,然后进行回答。
假定
Θ = { airliner , bomber , fighter }
提问1:“这军用飞机是什么?”;
答案1:是Θ的子集{ θ2 , θ3 } = { bomber , fighter }
提问2:“这民用飞机是什么?”;
答案2:是Θ的子集{ θ1} = { airliner },{ θ1} 是单元素集合。
因为元素是互斥的,环境是可穷举的,对于一个提问只能有一个正
确的答案子集。
环境的所有子集是对应论域的所有可能的有效答案。
飞机环境的所有可能的子集由图5.1.1示出。
注意,图5.1.1是一个
格,子集节点可以有多个父亲节点,这个格(Lattice )是一个分层结构。
从 Θ到 ∅ 的任一路径都表达了连接父节点到儿子节点的子集分层关系,例如,{}{}{}C ,B ,A B ,A A ⊂⊂⊂∅ .
当一个环境的元素可以被解释成可能的答案,并且仅有一个答案是
正确的,那么该环境被称之为一个鉴别框架。
鉴别这个术语意味着,对于一个提问,从与该提问相关的所有可能
的答案中能区分出一个正确的答案。
能区分出一个正确的答案需要鉴别框架是可穷举的,其子集是不相
交的。
一个大小为N 的集合包括自身恰有2N 个子集,这些子集定义了幂
集,记为Θ2,对于飞机框架有
Θ2 = {}{}{}{}{}{}{}{}C ,B ,A ,C ,B ,F ,A ,B ,A ,F ,B ,A ,∅
Θ2 和对应于环境的所有可能提问的正确答案之间存在着一一对
应关系。
● MASS 函数和无知
在贝叶斯理论中,后验概率随着证据而改变是所需要的。
同样地,在D-S 理论中,关于证据的信任
也可以改变。
在D-S 理论中,习惯上把证据的信任度类似于物理对象
的质量去考虑,即证据的质量(Mass )支持了一个信任。
关于质量这
一术语也被称为基本概率赋值(BPA , the Basic Probability
Assignment )或简称为基本赋值(Basic Assignment )。
为了避免与概
率论相混淆,我们将不使用这些术语,而是简单的使用质量(Mass )
一词。
D-S 理论和概率论的基本区别是关于无知的处理。
即使在无知的情
况下,概率论也必须分布一个等量的概率值。
假如你没有先验知识,
那么你必须假定每一种可能性的概率值都是P
N
1P =
其中,N是可能性的总数。
事实上,这赋值为P是在无可奈何的情况下作出的。
但是,概率论也有一种冠冕堂皇的说法,即所谓的中立原理(the principle of indifference )。
当仅仅有两种可能性存在的时候,比方说“有石油”和“没有石油”,分别用H和⌝H表示,那么出现应用中立原理的极端情况。
在与此相类似的情况中,即使在没有一点知识的条件下,那么也必须是P = 50 % ,因为概率论要求P(H)+P(⌝H) = 1,就是说,要么赞成H,要么反对H,对H无知是不被允许的。
在没有关于⌝H的任何证据的情况下,即使不用中立原理,那么约束P(H)+P(⌝H) = 1也要求必须对⌝H进行概率赋值。
D-S理论不要求必须对无知假设H和反驳假设H赋以信任值,而是仅仅将Mass分配给你希望对其分配信任的环境的子集。
任一未被分配给具体子集的‘信任’被看成‘未表达意见’,并将其分配给环境Θ. 反驳一个假设的‘信任’,实际上,是对该假设的‘不信任’,但不是对该假设‘未表达意见’。
例1.1
假定一个敌友飞机识别(IFF , Identification Friend or Foe)传感器(敌友飞机识别(IFF , Identification Friend or Foe)传感器也被简称为敌友飞机识别器),从一架飞机的应答器获得了一个响应。
如果某飞机是友机,那么它的发射机应答器应通过回送它的识别代码立即进行应答。
若接收应答的飞机未收到某架飞机A的应答,那么接收应答的飞机的缺省处理结果是:飞机A是一架敌机。
一架飞机A* 可能因下列原因未能发送应答信息:
• A* 的敌友飞机识别器发生了故障
• A* 的发射机应答器发生了故障
• A*上没有敌友飞机识别器
• A* 的敌友飞机识别器受到了干扰
• A* 收到了保持其雷达沉默的命令
假定因敌友飞机识别器的故障,导致了关于目标飞机有0.7的可能性是敌机的证据,其中仅仅轰炸机和战斗机被认为是敌机。
由此,这Mass的赋值为
m1({B , F}) = 0.7
其中,m1系指由第一个敌友飞机识别器提供的证据的Mass值。
注意,
其余的信任将被留给环境 Θ ,作为未表达意见的部分:
m 1({Θ}) = 1-0.7 = 0.3
注意‘未表达意见’既不是信任,也不是不信任。
而概率论对此却给出不同的结果 P(敌机) = 0.7 P(⌝敌机) = 1-0.7 = 0.3
对同一个问题,两种理论却给出了不同的处理,这正体现了D-S
理论和概率论之间的主要差别。
环境的幂集合中的任一个集合,若其Mass 值大于0(zero ),则
称其为焦点元素(focal element )。
使用焦点元素这一术语的原因是:一个幂集合元素X 的Mass 值m(X)大于0
,意味着可用证据在X 中的被聚焦,或者说被集中。
表5.1.1说明Mass 比概率有大得多的自由度:
表5.1.1 D-S 理论和概率论的比较
每一个Mass 能被形式化表成一个函数,该函数映射幂集合中的每
一个元素成为区间 [0 , 1]的一个实数。
函数的形式化描述为
m :Θ2→ [0 , 1]
按着惯例,空集合的Mass 通常被定义为0(zero ),m(∅) = 0 . Θ
的幂集合2Θ 的所有子集的Mass 和为1
∑=Θ∈2X 1)X (m 或 1)X (m X =∑Θ
⊆
例如,在飞机环境中有
∑=+=Θ+=Θ
∈2X 1113.07.0)(m })F ,B ({m )X (m
● 组合证据
当新的证据变成可用的时候,我们希望组合所有的证据以产生一个
更好的信任评价。
为了说明如何组合证据(也称之为证据组合),我们首先看一个证据组合一般公式的一种特殊的情形。
假定另一类型的一个传感器用0.9的信任识别出目标飞机为轰炸
机。
现在,来自传感器的证据的Mass 为:
m 1({B , F}) = 0.7 m 1(Θ) = 0.3
m 2({B}) = 0.9 m 2(Θ) = 0.1
其中,m 1和m 2与第一和第二种类型的传感器相对应。
使用下述登普斯特的组合规则的特殊形式以产生组合Mass
)Y (m )X (m )Z (m m )Z (m Z
Y X 21213∑⨯=⊕==⋂
其中,求和遍布使X ⋂ Y = Z 成立的所有元素X 与Y ,操作符 ⊕ 表示正交和或直接和。
登普斯特的规则组合两个Mass 以产生一个新的Mass ,新Mass 表示初始可能是冲突的证据间的一致意见。
这新Mass 通过仅仅对交集的Mass 求和汇集了一致意见,集合
的交集表达了公共的证据元素。
十分重要的一点是:用于组合的证据必须是独立差错的
(independent errors )。
注意,独立差错的证据 ≠ 独立采集的证据。
表5.1.2给出了登普斯特的组合规则,其中每一个交集之后都跟随
一个数值(两个Mass 的乘积)。
表5.1.2 行列Mass 相乘
90.027.063.0})B ({m m })B ({m 2112=+=⊕= (轰炸机) 07.0})F ,B ({m m })F ,B ({m 2112=⊕= (轰炸机或战斗机) 03.0)(m m )(m 2112=Θ⊕=Θ (未表示意见)
这m 12({B}) 表示目标飞机是轰炸机的信任。
但是,这m 12({B , F}) 和 m 12(Θ) 却包含着另外的信息。
因为它们的集合中包含了轰炸机,所以把它们的正交和贡献给轰炸机一个信任似乎是合理的。
由此,关于 {B} 的最大信任为0.03 + 0.07 + 0.9,关于 {B} 的最
小信任为0.9,{B} 的真实的信任在区间 [0.9 , 1.0] 中的某处。
在证据推理中,证据导致一个证据区间(EI , Evidence Interval )。
EI 的下界在证据推理中被称为support (Spt) ,在D-S 理论中被称为Bel ,这上界被称为plausibility (Pls )。
这support 是基于证据的最小信任,而plausibility 是基于证据的最大信任。
我们有,0 ≤ Bel ≤ Pls ≤ 1成立。
在证据理论中,下界和上界有时被称做下概率和上概率。
表5.1.3
给出了一些通常的证据区间。
support 或belief 函数(即Bel 函数)是一个集合和它的所有子
集的总的信任。
Bel 之定义如下:
∑=⊆X
Y )Y (m )X (Bel
以飞机环境中的第一个传感器为例, Bel 1({B , F}) = m 1({B , F}) + m 1({B}) + m 1({F}) = 0.7 + 0 + 0 = 0.7
表5.1.3一些通常的证据区间
Mass 是关于一个集合的信任,而不包括它的任何一个子集的信
任,Mass 是一个较为局部的信任。
belief 函数应用于一个集合和该集合的任何一个子集, Bel 是一
个更为全局的信任。
这Mass 和belief 函数之间的关系可表示为
)Y (Bel )
1()X (m X Y Y X ∑-=⊆- 其中,|X -Y| 是集合X -Y 的基数。
Bel 1 ⊕ Bel 2 ({B , F})
= m 1 ⊕ m 2 ({B , F}) + m 1 ⊕ m 2 ({B}) + m 1 ⊕ m 2 ({F})
= 0.07 + 0.90 + 0
= 0.97
1。
一个集合S 的证据区间,EI (S),可用信任来定义:
)]S (Bel 1,)S (Bel [)S (EI -=
如果S = {B},那么 }F ,A {S =,有Bel({A , F}) = m 1 ⊕ m 2 ({A , F}) + m 1 ⊕ m 2 ({A}) + m 1 ⊕ m 2 ({F}) = 0,所以,又有EI ({B}) = [0.90 , 1 - 0] = [0.90 , 1] .
一个集合X 的似然性(plausibility )被定义为不反对X (或不反驳
X )的程度:
∑-=-=⊆X
Y )Y (m 1)X (Bel 1)X (Pls
● 信任的标准化
假定第三个传感器报告了关于目标飞机的一个冲突的证据
m 3 ({A}) = 0.95 m 3 (Θ) = 0.05
表5.1.4给出了证据组合的十字相乘的结果:
表5.1.4 组合第三个证据
因为有 {A} ⋂ {B} = ∅ ,{A} ⋂ {B , F} = ∅,所以出现了空集合。
具体计算如下:
m 1 ⊕ m 2 ⊕ m 3 ({A}) = 0.0285
m 1 ⊕ m 2 ⊕ m 3 ({B}) = 0.045
m 1 ⊕ m 2 ⊕ m 3 ({B , F}) = 0.0035
m 1 ⊕ m 2 ⊕ m 3 (∅) = 0.855 + 0.0665 = 0.9215
m 1 ⊕ m 2 ⊕ m 3 (Θ) = 0.0015
注意,我们有所有Mass 之和必须等于1,即
∑=⊕⊕Θ⊆X 3211)X (m m m ,其中求和只需遍及所有的焦点元素。
但是,由于m 1 ⊕ m 2 ⊕ m 3 (∅) > 0就产生了问题:该事实与m (∅)
= 0之定义相矛盾。
一种解决办法是使焦点元素标准化。
就是用某种原则把 m 1 ⊕ m 2
⊕ m 3 (∅) 分给焦点元素。
首先定义 ∑⨯=K ∅
=⋂Y X 21)Y (m )X (m ,然后对每一个焦点元素Z 作:
置Z ← Z / (1-Κ)
对表5.1.4 的例子,Κ= 0.855 + 0.0665 = 0.9215,1 -Κ= 0.0785,每个焦点元素标准化后的值为:
m 1 ⊕ m 2 ⊕ m 3 ({A}) = 0.363
m 1 ⊕ m 2 ⊕ m 3 ({B}) = 0.573
m 1 ⊕ m 2 ⊕ m 3 ({B , F}) = 0.045
m 1 ⊕ m 2 ⊕ m 3 (Θ) = 0.019
可见,由于第三个(与前两个证据相冲突的)关于 {A} 的证据的
存在,显著地侵蚀了对 {B} 的信任。
有,
Bel ({B}) = m 1 ⊕ m 2 ⊕ m 3 ({B}) = 0.573
363
.0})F ({m m m })A ({m m m })F ,A ({m m m })
F ,A ({Bel )}B {(Bel 321321321=⊕⊕=+⊕⊕=+
⊕⊕==
又有,{B} 的证据区间
]673.0,573.0[]363.01,573.0[)]}B {(Bel 1,})B ({Bel [})B ({EI =-=-=
注意,由于 {A} 的冲突证据使 {B} 的support 和plausibility 都明显地减小了。
登普斯特的证据组合规则的一般形式为
K -∑⨯=⊕=⋂1)
Y (m )X (m )Z (m m Z
Y X 2121 其中,∑⨯=K ∅
=⋂Y X 21)Y (m )X (m 注意,当 1=K 时,正交和无定义。
Κ的值指出了被组合证据相互
冲突的程度。
当 0=K 时,表示两个证据完全一致(完全相容);当
1=K 时,表示两个证据完全冲突;当 10<K <时,表示两个证据部分相容。
● 移动(Moving Masses and Sets )
移动 Mass 的模拟有利于理解支持(support )和似真性
(plausibility )。
主要原则如下:
• 支持(support )是赋予一个集合和它的所有子集的Mass ;
• 一个集合的Mass 能够自由地移入它的子集;
• 一个集合的Mass 不能移到它的超集(superset )中去;
• 如果从一个集合移动Mass 进入它的子集,则这些被移动的Mass
在相应的子集中仅仅能贡献给子集的似真部分,而不能贡献给支持部分;
• 环境 Θ 的Mass 能移到任一子集。
假定 M(X) = 0. 6 ,M(Y) = 0. 4, 分别是X 和Y 的支持。
X 的似
真性是0. 6,因为Y 的Mass 不能移入X . 然而,X 的Mass 能移入
Y ,所以Y 的似真性是 0. 4 + 0. 6 = 1 . X 和Y 的证据区间是 EI(X) = [0. 6 , 0. 6] , EI(Y) = [0. 4 , 1] .
● D-S 理论的困难
由于标准化使D-S 理论出现了困难,并导致了与人们期待相反的结
果。
1984年,扎德(Zadeh )引用了两个医生A , B 关于对同一个患者疾病的信任的例子。
关于一个患者疾病的信任如下:
m A (脑膜炎) = 0.99 , m A (脑 瘤) = 0.01
m B (脑震荡) = 0.99 , m B (脑 瘤) = 0.01
两个医生都认为这个患者得脑瘤的可能性只有0. 01 . 用登普斯特的证据组合规则计算如下:
m A ⊕ m B ({脑 瘤}) = 0.0001
m A ⊕ m B (∅) = 0.9801 + 0.0099 + 0.0099 = 0.9999
1 -Κ= 1 - 0.9999 = 0.0001
标准化后得到:
m A ⊕ m B ({脑 瘤}) = 1,m A ⊕ m B ({脑膜炎}) = 0,m A ⊕ m B ({脑震荡}) = 0
这样一个结果与我们的直觉完全不同。
我们认为不仅当Κ=1时,不能做正交和,而且当Κ接近于1的时候也不能做正交和。
§2 一种简化的证据理论模型MET1
考虑集合 S = {s 1,s 2,…, s n },设 μ 是集合2S ⋃ {S } 上的一个函数,说 μ 是 2S ⋃ {S }上的一个基本支持函数(这里的基本支持函数与D-S 中的Mass 函数相当),如果 μ 满足:
① ;都有1)A (0,S A ≤≤⊂∀μ
② 0)(=∅μ;
③ ∑≤⊂S
A 1)A (μ ;
④ ∑=+⊂S
A .1)S ()A (μμ
在比较普遍的一类应用问题中,{}S 2A S ⊂∀,若μ(A) > 0,则必有:
{}n i 1,s A S A i ≤≤==单个元素集合
,,或者余集 换言之,{}{}{
}0)A (n i 1s S A i =≤≤∉μ则必有,如果 .
在后面将看到,基于此,可使基本支持函数的运算大为简化。
为简便计,简记{}n 21i )s ()s (i i ,,,,对于为 =μμ. 于是基本支持函数的定义又可改述如下:
2S ⋃ {S }上的一个函数 μ 说是{}{}{}n i 1s S i ≤≤⋃上的一个基本支持函数,如果 μ 满足:
① ;n i 1,)s (0i ≤≤≤μ
② ∑≤≤≤n
i 1i ;1)s (μ
③ ∑-=≤≤n
i 1i )s (1)S (μμ .
这样,基本支持函数 μ 就完全取决于它在集合{}{}{}n i 1s S i ≤≤ 中的元素的取值。
● 组合规则(或曰综合函数)
设 μ,ν 是{}{}{}n i 1s S i ≤≤ 上的两个基本支持函数,其直乘积函数(也称之为综合函数,或组合规则、综合运算、直乘积运算等)定义如下:
其中,D ≠ 0 . 如果D = 0,则说 μ 与 ν 相互矛盾,对相互矛盾的基本支持函数 μ 与 ν 不作直乘积运算。
可以证明存在一个基本支持函数 ε 对于任意一个基本支持函数 μ,都有 ε ⊗ μ = μ 所以,我们有:{s 1,s 2,..., s n }上的所有基本支持函数和 ⊗,构成一个无穷有壹的阿贝尔半群。
● 综合函数(综合运算)的封闭性、可交换性与可结合性⊗ 若μ,ν 是S 上的两个基本支持函数,那么 ω = μ ⊗ν 也是S 上的基本支持函数。
ω = μ ⊗ν = ν ⊗ μ ,)()(γνμγνμγνμω⊗⊗=⊗⊗=⊗⊗=',证明从略。
● 关于A 的 μ 支持函数
对于 ∀ A ⊂ S ,
定义关于A 的 μ 支持函数,
∑=∈A
a )a ()A (μφ, ()A (φ 对应于D-S 理论中的Bel , Spt , Belief
函数) .
● 关于A 的 μ 不反对函数
∑∑∑-=+-=+=∈∈∈S a A a A
S a )a (1)a ()a (1)A ()S ()A (\μμμφμψ
直观上说,)A (φ是A 中元素的 μ 值总和,ψ(A ) 是1减去S - A 中元素的 μ 值总和。
这里的)A ()A (ψφ和分别与D-S 理论中support 和plausibility 对应。
ϕ()A 和ψ(A ) 之含义由图5.2.1示出。
图5.2.1 ϕ (A) 和 ψ (A)
显然,对于任意A 和 μ ,有ϕ(A) ≤ ψ(A) ;又对于S 的任意两个子集A 1和A 2我们有)S ()A ()A ()A ()A (2211μφψφψ=-=-
我们可以把 )A ()A (φψ- 看成是对A 无知的程度。
在应用中,称集合S 为一个“概念”。
设X 是2S
⋃ {S }上的一个变量,称X = A 为一个命题(简记为A ),表示 “S 是A ” 。
命题A 的不确定性值 ∈ [ϕ(A),ψ(A)],并称 [ϕ(A),ψ(A)] 为命题A 的证据区间,简记为 EI(A) 。
为了说清楚命题A 的不确定性值究竟在EI(A) 中的何处,在
MES1中定义了关于命题A 的 μ 认可函数: }S {2A ,S A )]A ()A ([)A ()A (f S ∈÷⨯-+=对于任意φψ 或者 α
βφψ⎪⎪⎭
⎫ ⎝⎛⨯⨯-+=S A )]A ()A ([)A ()A (f ,其中α≤0,1≥β是两个待定常数。
其中,S A 和 分别表示A 和S 中元素的个数。
可以证明命题A 的 μ 认可函数满足:
① S A ,1)A (f 0⊂∀≤≤对于;
② ∑=∈S
a 1)a (f , 其中f(a) 表示f({a}) .
事实上, f(A) ≥ 0自明。
证明 f(A) ≤ l 如下: 注意 f(A) = ϕ(A)+[ψ(A)-ϕ(A)]×⎢A / ⎢S
= a A ∈∑μ(a)+[1-a S
∈∑μ(a)]×⎢A / ⎢S
≤ a S ∈∑μ(a)+1-a S
∈∑μ(a) = 1
对于 ,我们有,
f(A) = ϕ(A) + [ψ(A) - ϕ(A) ]×⎢A / ⎢S
S S S a a f S a S a ⨯+
=∑∑∈∈)()()(μμ = 1)()(=+∑∈S
a a S μμ
显
然有,ϕψ()()()A f A A ≤≤
证毕
下面,让我们看一个例子。
设S = {油层,同层,水层,干层,气层},μ 是S 上的基本支持函数,且
μ(油层)=0.40,μ(同层)=0.30,μ(水层)=0.00,μ(干层)=0.10,μ(S )=0.20 于是,对于A ={油层,同层},支持函数、不反对函数和认可函数的值分别为
ϕ(A) = μ(油层)+μ(同层) =0.70
ψ(A) = μ(S )+ϕ(A) =0.20+0.7=0.90
f (A) = ϕ(A) +[ψ(A)-ϕ(A)]×⎢A / ⎢S
= 0.70+(0.90-0.70)×2÷5=0.78
上面,我们讨论了 μ 支持函数,μ 不反对函数和 μ 认可函数。
注意,我们的这些讨论都是在同一个概念S 上进行的。
在实际应用中,通常将同时来考虑多个不同的概念S ,T ,… 。
为此,我们将S 上的 μ 支持函数,μ 不反对函数,μ 认可函数及 μ 基本支持函数分别记为:
ϕψμS S S S f ,,, .
定义规则
在定义规则之前,我们先给出,MET1用于油气资源评价的一个具体例子。
[ 方法名] :用有机碳含量评价生油岩丰度
[ 方法注释 ] :作者:吴立真;时间:1985年8月;参考文献:黄弟藩,《中国陆相油气生成》
[ 对应任务 ] :生油岩丰度评价
[ 方法适应条件 ] :有机碳含量低于4%
[ 规 则 ] :(1)如果:有机碳含量大于1.0%
则:有可信度(CF 1)证明应属于高丰度,同时
有可信度(CF 2)证明应属于较高丰度;
(2)如果:有机碳含量属于区间 [0.6% ,1.0%]
则:有可信度(CF 1)证明应属于高丰度,同时
有可信度(CF 2)证明应属于较高丰度,同时
有可信度(CF 3)证明应属于较低丰度;
(3)如果:有机碳含量属于区间 [0.4% ,0.6%]
则:有可信度(CF 2)证明应属于较高丰度,同时
有可信度(CF3)证明应属于较低丰度,同时
有可信度(CF4)证明应属于非生油岩;
(4)如果:有机碳含量小于0.4%
则:有可信度(CF3)证明应属于较低丰度,同时
有可信度(CF4)证明应属于非生油岩;
下面将给出上面MET1用于油气资源评价的一个具体例子的进一步解释。
我们定义规则的形式化描述:
〈后件〉¦ ¦ =(〈属性值1〉〈可信度1〉…〈属性值k 〉〈可信度k 〉)
或
〈后件〉¦ ¦ =(〈属性值1〉〈可信度1〉)且
(〈属性值2〉〈可信度2〉)且 …
(〈属性值k 〉〈可信度k 〉)
命题 B ¦ ¦ =(〈属性值1〉〈属性值2〉…〈属性值k 〉),实际上命题B 是一组命题:T 是属性值1,T 是属性值2,… ,T 是属性值k ,这里T 是一个概念。
命题B 的可信度因子:
CF = (〈可信度1〉〈可信度2〉…〈可信度k 〉)
=(CF 1 , CF 2 , … , CF k )
并满足: ;,,2,10
k i CF i =≥ 2)∑≤≤≤k
i CFi 11 〈前件〉由若干个〈断言〉的逻辑与连接所构成:
〈前件〉¦ ¦ =〈断言〉AND 〈断言〉AND … AND 〈断言〉
〈规则〉¦ ¦ = IF 〈断言〉AND 〈断言〉AND … AND 〈断言〉
THEN (〈属性值1〉〈可信度1〉…〈属性值k 〉〈可信度k 〉)
为定义〈前件〉的可信度,首先来定义一个〈断言〉的可信度。
〈谓词〉是〈断言〉的核心,所有〈谓词〉的解释都是由系统或用户给出的。
〈谓词〉在 [ 0 , 1] 上取值。
一个〈规则〉的〈前件〉的可信度BF ,定义为反复使用如下规则得到的值:
若〈前件〉中只有一个〈断言〉 , 则〈前件〉的可信度定义为该〈断言〉的可信度;
使用一个新的〈断言〉代替用AND 连接的〈断言〉,这个新〈断言〉的可信度被定义为这些用AND 连接的〈断言〉的可信度中的最小值。
定义一个〈规则〉之〈后件〉的可信度CER 为:
CER =(BF ×CF 1 BF ×CF 2 … BF ×CF k ) ,其中BF 是〈前件〉的可信度,CF i 是〈后件〉中的可信度因子,即规则强度。
下面通过属性A (或命题A )来阐明其可信度因子CF i 的解释:
ε1=(Y -X)×d 1 ;ε2=(Z -Y)×d 3 ;ε3=ε2; 取 d 1 = d 3
假定A 取非负实数值
1
A ≥ Z +ε3
CF 1=
(A -Z +ε3)÷(2×ε3) Z -ε3 < A < Z +ε3
1 Y +ε
2 ≤ A ≤ Z -ε3
CF 2= 1-(A -Z +ε3 )÷(2×ε3 ) Z -ε3 < A < Z +ε3
(A -Y +ε2 )÷(2× ε2 ) Y -ε2 < A < Y +ε2
1 X +ε1 ≤ A ≤ Y - ε2
CF 3= (Y +ε2 -A)÷(2×ε2 ) Y - ε2 < A < Y +ε2
(A -X +ε1 )÷(2× ε1 ) X - ε1< A < X + ε1
1 A ≤ X -ε1
CF 4=
(X +ε1-A)÷(2×ε1 ) X -ε1 < A < X + ε1
如果一条〈规则〉之〈后件〉中有一个概念T 上的命题A ,{}n t t t T ,,,21 =,则当这条产生式规则被触发后,就得到一个关于命题 A = { a 1,a 2,…,a k } 的可信度(或该规则之结论的可信度)
CER =(BF ×CF 1 BF ×CF 2 … BF ×CF k )
我们利用这组值,来定义T 上的一个基本支持函数 μT :
BF ×CF i 如果 a =a i ( a i ∈ A)
μT (a) =
0 若 {}T T a ∈且a ∉ A ;
显然 μT 满足基本支持函数的定义。
所以,我们可以利用每条被触发的规则定义一个基本支持函素数。
设 μT ,…,νT 是概念T 上由若干条不同的规则所定义的基本支持函数,我们定义
ωT = μT ⊗ …⊗ νT
为所有这些规则执行后,T 上的新的基本支持函数,同一概念上的基本支持函数具有综合关系。
当用概念T 作为进一步推理的证据时,我们将使用这个新的基本支持函数 ωT 作为T 上的当前的基本支持函数。
总结起来,不确定性传播的过程为:初始时,每个概念S 其上都有基本支持函数,如 μS 。
若对此函数完全无知,则 μS (S )=1,μS (s)=0,对于任意s ∈ S 。
然后,利用被触发的规则,根据一些概念上已知的基本支持函数值,通过求〈前件〉的可信度值,得到〈前件〉的可信度。
再与规则的可信度因子结合,得到关于〈后件〉的可信度,即结论的可信度。
然后,利用这组可信度值定义相应概念上的一个基本支持函数,结合此概念上的原有的基本支持函数,产生新的基本支持函数,用作进一步推理的基本支持函数。
这就是MES1的不确定性传播的一个周期。
§3 一个新的简化证据理论模型 − 凸函数证据理论模型
不精确推理模型IRM ( I nexact R easoning M odel ),是专家系统的重要组成部分之-。
IRM 与其所隶属的专家系统的应用领域的知识和问题求解特点的符合程度,直接决定着专家系统的问题求解质量[1]。
§3.1 IRM1的困难
对应用领域中的有序命题类问题(文中下面给出定义),MES1的不确定性处理方法遇到了困难,下面用一些例子说明。
在这些例子中,用一个n 元组表示生油条件的评价结果,n 元组的第i 项(即第个 i 元素)表示第i 个命题:生油岩丰度是第i 类(的),设第i 个命题有真值α ∈ [0,1] .
例1:在由MES1支撑建造的生油条件评价专家系统中,对一个圈闭的生油岩丰度进行评价时,采用了有机碳、总烃和氯仿沥青等方法,假定用有机碳和氯仿沥青方法分别得到的评价结果是:
(0.1,0.6,0.0,0.0), (0.0,0.0,0.1,0.6) ,其中:
四元组(0.1,0.6,0.0,0.0)代表了一个基本支持函数:
μ().s 101=,μ().s 206=,μ().,s 300= μ().s 400=;
四元组(0.0,0.0,0.1,0.6)代表了另一个基本支持函数:
,1.0)(,0.0)(,0.0)(321===s s s ννν 6.0)(4=s ν 。
那么利用MESl 系统中的综合函数得到的综合结果是:(0.0325,0.353,0.0325,0.353).
在这个综合结果中,“生油岩丰度是第二类”与“生油岩丰度是第四类”的真值都比较大,由此可得出结论:“生油岩丰度既是第二类的,又是第四类的”。
在石油地质勘探领域中,第一、二、三、四类分别被认为是好类、较好类、较差类和差类,这个结论就表示:“生油岩丰度既是较好的,又是差的”,毋庸置疑,这是一个不能被地质专家接收的错误的结论。
例2:当使用有机碳方法和氯仿沥青方法得到的评价结果分别是:
(0.2,0.8,0.0,0.0), (0.0,0.0,0.8,0.2)
时,MES1认为这样的两个结果是不相容的,无法进行综合。
因此,只能将这两个结果罗列起来,而不能给出评价。
从有序命题的观点出发,石油地质勘探专家却认为:这种情况应该进行综合,并完全能够进行综合。
为此,我们基于MESl 系统中的基于简化证据理论提出了一个新模型 − 凸函数证据理论模型。
上面的例子可作形式描述: S 是一个概念,概念S 即“生油岩丰度”,S = {s 1,s 2,s 3,s 4},其中:s i 表示“第i 类”,对于1 ≤ i ≤ 4 . 第i 个命题是“生油岩丰度是第i 类”,对于1 ≤ i ≤ 4 . 我们注意到:这些命题均呈“S 是P ”的形式,并且表示被考察对象的主词,即S ,均相同,表示对象性质的谓词P 又依次是“第一类”,“第二类”,“第三类”和“第四类”,即呈 序关系 。
例3: 如果S = {用先进设备装备的,宽敞的,装修典雅的,明亮的},所考察的对象是“205教室”。
若四个命题“205教室是用先进设备装备的”,“205教室是宽敞的”,“205教室是装修典雅的” 和“205教室是明亮的” 的不确定性值分别为:0.059 , 0.353 , 0.059和0.353 ,那么,该结果是完全可以接受的,其含义是“205教室(是)既宽敞又明亮(的)”。
对上述例1和例3作一下分析可知:第3个例子中各命题的谓词分别是“用先进设备装备的”,“宽敞的”,“装修典雅的”和“明亮的”。
它们描述的是概念“205教室” 的不同特征或性质。
而第1个例子中各谓词描述的却是概念“生油岩丰度”的同一性质,并且各谓词间还存在着“序”关系。
§3.2 具有凸函授性质的简化证据理论模型
我们把例1中的命题称为一组有序命题。
有序命题的定义如下:
定义1. 说一组简单命题P 1,P 2,…,P n ,是一组有序命题,如果它们满足:
对i = 1,2,…,n ,命题P i 的主词项均为S ,谓词项为s i ;
对i = 1,2,…,n ,s i 均描述S 的同一性质或特征;
谓词项s 1,s 2,…,s n 描述S 的同一性质的程度依次增强或减弱。
下面来定义一组有序命题间的“小于等于”关系,记为“≤”。
定义2. 设一组有序命题P 1,P 2,…,P n ,对任意1 ≤ i , j ≤ n ,说P i ≤ P j ,当且仅当i ≤ j . (S , ≤ )是一个全序集,这里S 是有序命题集,简记 P i ≤ P j 和 P j ≤ P k 为 P i ≤ P j ≤ P k .
对实际应用领域中的评价类、解释类等问题,在有序命题的情况下,人们对同一事物的某一特征或性质的评价结果,一定表现出一种 趋向性和连续性,其形式化描述如下:
定义3. 对一组有序命题P 1,P 2,…,P n , | P i | 表示命题 P i 的真值,1 ≤ i ≤ n .
若| P m | = max{| P 1 | ,…,| P n |} ,则:对∀ i ∈ {1 , 2 , … , m-1}, 都有 | P i | ≤ | P i+1 | ;
对∀ i ∈ {m , m+1 , … , n-1}, 都有 | P i | ≥ | P i+1 | .
由此我们得到:
定义4. 一组有序命题P 1,P 2,…,P n 的真值 | P 1 |,| P 2 |,···,| P n | 应呈现出凸的性质,即对:任意P i ≤ P j ≤ P k 都有 | P j | ≥ min{| P i |,| P k |} 成立。
设S = {s 1,s 2,…,s n }。
S 表示一个概念,s 1,s 2,…,s n 是一组有序命题, 命题“S 是s i ”( 1 ≤ i ≤ n ) 简写为s i 。
定义5. ℜ = { μ | μ 是2S ⋃ {S }上的基本支持函数},表示2S ⋃ {S }上的基本支持函数空间。
说f :ℜ×ℜ → ℜ 是综合函数,如果 f 满足如下性质:
(i )设 μ1,μ2 ∈ ℜ,则 f (,)μμ12 也是基本支持函数(记ωμμ=f (,)12),称之为新的基本支持函数,即 f (,)μμ12 满足
0112≤≤≤f s i n i (,)(),
;μμ对于
f s i i n (,)().μμ1211
≤≤≤∑ (ii )f (,)μμ12应是凸函数,即对S 中的任意命题s i ,s j ,s k ,若s i ≤ s j ≤ s k ,则有
{}f s f s f s j i k (,)()min (,)(),(,)()μμμμμμ121212≥ .
性质(i )由综合函数定义本身得到。
综合函数实质上就是把两个基本支持函数组合成为一个新的基本支持函数。
性质(ii )由评价有序命题时所表现出来的凸性质得到。
下面,我们给出针对有序命题的新的综合函数f 的定义。
定义6. 设概念S = {s 1,s 2,…,s n }。
s 1,s 2,…,s n 为一组有序命题。
则其不确定性值的综合函数f 为 ∀μ1,μ2 ∈ ℜ
(i )当 μ1 = μ0 ,有 f f (,)(,)μμμμμ02202== ;
(ii )当 μ1 ≠ μ0 且 μ2 ≠ μ0时,有:
{}{}f s s S s S g k i g s S s S g k s S s S i k k k i k k k g k k (,)()()[()]()[()]/()()[()]()[()]/()()[()]()[(μμμμμμμμμμμμμμ121211221121122112112211111111=+++-+<+++-++
+++≤≤≤≤∑∑当{}{})]/()()[()]()[()]/()k g i g
s S s S k g i g g k n
k k i k n
-+=+++-+>⎧⎨⎪⎪⎪⎪⎩⎪⎪⎪⎪+≤≤≤≤∑∑11111121122当当μμμμ 其中
{}
g s S S s S S i i i i n =⨯+-++-⨯⎢
⎣⎢⎥⎦⎥≤≤∑0511********
1.()[()/(())]()[()/(())]μμμμμμ
μ0 ∈ ℜ 满足μ0(s i ) = 0,对i = 1,2,…,n .
(3. 2. 0)
下面,将以定理形式证明函数f 具备性质(i),(ii):
定理1如上定义的函数 ω = f(μ1 , μ2) 是基本支持函数 μ1 , μ2 ∈ ℜ
证: 当 μ1 = μ0 , 或 μ2 = μ0 时,显然。
当 μ1 ≠ μ0,μ2 ≠ μ0时,证明
ωμμ().[()()]s S S i i n =-⨯+≤≤≤∑105112221 . 令A k s S s S k k ()()[()]()[()]=+++μμμμ112211,
当时i g s f s i i A k g k A g A g A i g i k i <===+++-+--+≤≤∑,()(,)()[]()()()()ωμμ121
211212111
(3. 2. 1) 当时i g s i A k g k A k k g g k n k g
==+-+-++≤≤≤≤∑∑,()()()ω1
2112111 =+++++++-++-+1
2121112231[()()()()
()
()
A g A g A g A g A g A n n g ] (3.2.2)
当时i g s i A k k g A i i g A i i g A n n g A n n g i k n >==++++-+-++----+≤≤∑
,()[]()()()()()ω1
21121111 (3.2.3) 由(3.2.1):
ω()[]()()()()()()s i g A g g A g A g A g i g =++++---⨯--≤≤-∑121122122312
11 (3.2.4)
由(3.2.3):
ω()[]()()()()s i A g A g n g A n n g g i n =++++⨯+--++≤≤∑12122231
1 (3.2.5) 由(3.2.2) , (3.2.4), (3.2.5):
ω()[()()()()]()s A A A A n A i i i n i n =++++=≤≤≤≤∑∑121211123
=++⨯+⨯≤≤≤≤≤≤≤≤∑∑
∑∑121211221111[
()()()()()()]__μμμμμμs s S s S s i i i i i n i n i n i n
对于 ∀ μ ∈ ℜ, 都有 μμ()()S s i i n =-
≤≤∑11,所以又有:
ω()s i i n 1≤≤∑=-+-+-+-12
1211222211[()()()()()()]μμμμμμS S S S S S =--=-+12122212122221[()()][()()]μμμμS S S S (3.2.6)
故
ω()s i i n 1≤≤∑ ≤ 1 得证
又由新基本支持函数的定义有 ω(s i ) ≥ 0,i = 1,2,…,n
故 ω = f(μ1 , μ2) 是基本支持函数。
证毕
引理 对于 ∀ μ1 , μ2 ∈ ℜ,有:当s i ≤ s g 时,ω = f(μ1 , μ2) 是递增函数,又当s g ≤ s i 时,ω = f(μ1 , μ2) 是递减函数,其中g 在定义6中被定义。
证:对任意 s s s i j g ≤≤,
有 {}ωωμμμμ()()()[()]()[()]/()s s s S s S g k j i k k i k j -=+++-+≥+≤≤∑1
2112211110 故当时,仿上可证ωωωω()().()().s s s s s s s j i g i j i j ≥≤≤≥
由引理,易证:
定理2有序命题的综合 ω = f(μ1,μ2) 是凸函数。
事实上我们提出的新综合函数 ω = f(μ1,μ2) 将找出有序命题集中最有可能成立(或最有可能为真)之命题的序号g ,当一命题之序号与g 之差的绝对值越小时,该命题的不确定性值与序号为g 的命题的不确定性值就越接近。
应用这个新定义的综合函数于引言中的例1和例2,分别得到新的综合结果分别是:
(0.0325,0.585,0.1625,0.13)
(0.05, 0.6833334, 0.2333333, 0.0333333)
这两个结果是比较令人满意的。
我们面向有序命题类问题构造的新综合函数,有效解决了有序命题类问题。
实际验证还表明:对有序命题类且满足MES1的简化证据理论和一般证据理论模型的综合条件的领域问题,与MES1的简化证据理论和一般证据理论模型相比,这个新综合函数得到的综合结果不仅更合理,而且与领域专家所给出的结论之间有着更好的吻合。
§3.3 具有凸函授性质的简化证据理论模型的分析
新综合函数中的g 的公式为:
{}
g s S S s S S i i i i n =⨯+-++-⨯⎢⎣⎢⎥⎦⎥≤≤∑0511111112221.()[()/(())]()[()/(())]μμμμμμ
(3.3.1)
令 {}gd i s S S s S S i i i n =⨯+-++-≤≤∑1211122211111μμμμμμ()[()/(())]()[()/(())],故有
⎣⎦g gd = .
命题:g ∈ [1, n] ,g 表示最有可能为真之命题的序号。
证:为此只须证明
{}
w s S S s S S i i i n 11111112
1112221=+-++-=≤≤∑μμμμμμ()[()/(())]()[()/(())] 进而只须证明
{}w s S S s S S i i i n 2111121112221=+-++-=≤≤∑
μμμμμμ()[()/(())]()[()/(())]。