不确定性推理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 交换率:
AB B A
– 结合律:
AB BA
(A B) C A (B C) (AB)C A(BC)
– 分配律: (A B)C (AC) (BC)
(AB) C (A C)(B C)
– 摩根率:
n
n
~ ( Ai ) ~ Ai
i1
i1
n
n
~ ( Ai ) ~ Ai
i1
3
在专家系统中,不确定性表现在证据、规则和 推理三个方面,需要对专家系统中的事实与规 则给出不确定性描述,并在此基础上建立不确 定性的传递计算方法。
要实现对不确定性知识的表达,须解决: ➢ 表示问题 ➢ 计算问题 ➢ 语义问题
4
1 表示问题
表示问题指的是采用什么方法描述不确定性。通常有数值 表示和非数值的语义表示方法。数值表示便于计算、比较;非 数值表示,是一种定性的描述。
▪ 完备事件族与基本事件族有如下的性质: 定理:若{An, n=1, 2, …}为一完备事件族,则
▪ 有n P若(An{)A 1n,, n且=1对, 2于, …一}事为件一B基有本事P件(B族) ,n P则(An B)
P(B) P(An ) An B
15
▪ 对任意事件A,有
0 P(A) 1
补充知识:贝叶斯网络 ▪ 独立:如果X与Y相互独立,则 P(X,Y) = P(X)P(Y) P(X|Y) = P(X) ▪ 条件独立:如果在给定Z的条件下,X与Y相互独立,则 P(X|Y, Z) = P(X|Z) 实际中,条件独立比完全独立更重要
20
▪ 联合概率:P(X1, X2, …, XN)
10
▪ 两个事件A与B可能有以下几种特殊关系:
– 包含:若事件B发生则事件A也发生,称“A包含B”,或“B 含于A”,记作AB或BA。
– 等价:若AB且BA,即A与B同时发生或同时不发生,则称A 与B等价,记作A=B。
– 互斥:若A与B不能同时发生,则称A与B互斥,记作AB=φ – 对立:若A与B互斥,且必有一个发生,则称A与B对立,记
– 二值,则有2N可能的值,其中2N-1个独立。
▪ 如果相互独立: P(X1, X2, …, XN) = P(X1) P(X2) …P(XN)
▪ 条件概率: P(X1, X2, …, XN) = P(X1|X2, …, XN) P(X2, …, XN) 迭代表示:
P(X1, X2, …, XN) = P(X1) P(X2| X1) P(X3| X2X1)…P(XN|XN-1, …, X1) = P(XN) P(XN-1| XN) P(XN-2| XN-1XN)…P(X1|X2, …, XN)
解题方案不唯一
1
在客观世界中,由于事物发展的随机性和复杂性, 人类认识的不完全、不可靠、不精确和不一致性, 自然语言中存在的模糊性和歧义性,使得现实世界 中的事物以及事物之间的关系极其复杂,带来了大 量的不确定性。
大多数要求智能行为的任务都具有某种程度的不确 定。
不确定性可以理解为在缺少足够信息的情况下做出 判断。
i1
▪ 事件计算的优先顺序为:求余,交,差和并。
13
补充知识:概率定义
▪ 定义:设Ω为一个随机实验的样本空间,对Ω上的任 意事件A,规定一个实数与之对应,记为P(A),满足以 下三条基本性质,称为事件A发生的概率:
0 P(A) 1 P() 1 P() 0
–若二事件AB互斥,即,则
P(A B) P(A) P(B)
作或,又称A为B的余事件,或B为A的余事件。
▪ 任意两个事件不一定会是上述几种关系中的一种 。
11
▪ 设A,B,A1,A2,…An为一些事件,它们有下 述的运算:
– 交:记C=“A与B同时发生 ”,称为事件A与B的交, C={ω|ω∈A且ω∈B},记作或。 类似地用来表示事件“n个事件A1, A2, …An同时发生” 。
9
补充知识:随机事件
▪ 随机实验:随机实验是一个可观察结果的人工或自然的过程 ,其产生的结果可能不止一个,且不能事先确定会产生什么 结果。
▪ ▪ 样本空间:样本空间是一个随机实验的全部可能出现的结果
的集合,通常记作Ω,Ω中的点(即一个可能出现的实验结 果)成为样本点,通常记作ω。
▪ 随机事件:随机事件是一个随机实验的一些可能结果的集合 ,是样本空间的一个子集。常用大写字母A,B,C,…表示。
P(Bk | A)
P(Bk )P(A | Bk ) P(Bi )P(A | Bi )
P(Bi ) 1
i
i
▪
贝叶斯公式容易由条件概率的定义,乘法公式和
全称是概为条率先件公验概式概率得率。到,。而在P(B贝i|叶A)斯i=公1, 式2, 中…,, nP称(B为i),后i=验1,概2,率…也, n
19
6
(2)结论不确定性合成 即已知由两个独立的证据E1和E2,求得的假设H的 不确定性度量C1(H)和C2(H),求证据E1和E2的组 合导致的假设H的不确定性C(H),即定义函数f2, 使得: C(H)=f2(C1(H),C2(H))
(3)组合证据的不确定性算法 已知证据E1和E2的不确定性度量C(E1)和C(E2), 求证据E1和E2的析取和合取的不确定性,即定义 函数f3和f4使得: C(E1∧E2)=f3(C(E1),C(E2)) C(E1∨E2)=f4(C(E1),C(E2))
它是在领域专家给出的规则强度和用户给出的原 始证据的不确定性的基础上,定义一组函数,求 出结论的不确定性度量。
它主要包括如下三个方面: (1)不确定性的传递算法
已知规则的前提E的不确定性C(E)和规则强度 f(H,E),求假设H的不确定性C(H),即定义函数f1, 使得:
C(H)=f1(C(E),f(H,E))
▪ 必 然 事 件 Ω的 概率 P(Ω) =1, 不可能事 件 φ的概 率
P(φ) = 0
▪ 对任意事件A,有
P(~ A) 1 P(A)
▪ 设事件A1,A2,…An(k≤n)是两两互不相容的事件
,即有,则
k
P( Ai ) P(A1) P( A2 ) ... P( Ak )
i1
▪ 设A,B是两事件,则
– 并:记C=“A与B中至少有一个发生”,称为事件A与B 的并,C={ω|ω∈A或ω∈B},记作并。 类似地用表示事件“n个事件A1, A2, …An中至少有一个 发生”。
– 差:记C=“A发生而B不发生”,称为事件A与B的差, C={ω|ω∈A但ω∈B},记作差。
12
▪ 事件的运算有以下几种性质:
2
确定性推理是建立在经典逻辑基础上的 经典逻辑的基础之一就是集合论 这在很多实际情况中是很难做到的,如高、矮、
胖、瘦就很难精确地分开。 经典逻辑不适合用来处理不确定性。
不确定推理是建立在非经典逻辑基础上的一种 推理,它是对不确定性知识的运用与处理。
不确定性推理就是从不确定性初始证据出发, 通过运用不确定性的知识,最终推出具有一定 程度的不确定性但却是合理或者近乎合理的结 论的思维过程。
4.1 概述
第四章 不确定性推理
不精确思维并非专家的习惯或爱好所至,而是
客观现实的要求。
很多原因导致同一结果 推理所需的信息不完备 背景知识不足 信息描述模糊 信息中含有噪声 规划是模糊的 推理能力不足
在人类的知识和思维行 为中,精确性只是相对 的,不精确性才是绝对 的。知识工程需要各种 适应不同类的不精确性 特点的不精确性知识描 述方法和推理方法。
23
所以,道路施工(C)与 橙色桶(B)和交通缓慢 (T)是有关系的。同样 ,交通事故(A)与闪光 灯(L)和交通缓慢是相 关的,如右图。
通过分析,构造C和T的 联合概率分布表,如右表 。
如右表,如果道路不施工 ,那么出现交通缓慢的可 能 性 相 对 较 小 ( 0.1 ) , 反之就较大。
道路施工
P(A B) P(A) P(B) P(A B)
16
▪ 定义:设A,B为随机事件且P(A)>0,称
P(B | A) P( AB) P( A)
▪ 为事件A已发生的条件下,事件B的条件概率,P(A)在 概率推理中称为边缘概率。
▪ 简称P(B|A)为给定A时B发生的概率。P(AB)称为A与B 的联合概率。有联合概率公式:
C
交通事故
A
B
橙色桶
T
交通缓慢
L
闪光灯
24
考虑,如果交通缓慢,那么 是由道路施工引起的概率有 多少?即P(C|T)=?
道路施工
C
交通事故
A
P(C|T)=P(C=t,T=t)/(P(C=t, B T=t)+P(C=f,T=t))=0.3/(0.3 橙色桶
7
3 语义问题
语义问题指上述表示和计算的含义是什么。如C(H,E)可理 解为当前提E为真时,对结论H为真的一种影响程度,C(E) 可理解为E为真的程度。
处理不确定性问题的主要数学工具:
概率论 模糊数学
概率论与模糊数学所研究和处理的是两种不同的不确定性。
概率论研究和处理随机现象,事件本身有明确的含义, 只是由于条件不充分,使得在条件和事件之间不能出现 决定性的因果关系(随机性)。
模糊数学研究和处理模糊现象,概念本身就没有明确的 外延,一个对象是否符合这个概念是难以确定的 (属于 模糊的)。
无论采用什么数学工具和模型,都需要对规则和证据的 不确定性给出度量。
8
4.2 主观贝叶斯方法
补充知识:概率论基础 ▪ 概率论是研究随机现象中数量规律的科学。所谓随机 现象是指在相同的条件下重复进行某种实验时,所得实 验结果不一定完全相同且不可预知的现象。 ▪ 众所周知的是掷硬币的实验。人工智能所讨论的不确 定性现象,虽然不完全是随机的过程,但是实践证明, 采用概率论的思想方法考虑能够得到较好的结果。
在专家系统中的“不确定性” 分为: 知识的不确定性(E→H,f(H,E)) 它表示相应知识的不确定性程度,称为知识或规则强度。
证据的不确定性(E,C(E)) 它表示证据E为真的程度。它有两种来源:初始证据 (由用 户给出);前面推出的结论作为当前证据 (通过计算得到)。
5
2 计算问题
计算问题主要指不确定性的传播与更新,即获得 新信息的过程。
P( AB) P(B | A)P( A)
17
0 P(B | A) 1
▪ P( | A) 1 , P( | A) 0 ▪ 若 B1B2 ,则
P(B1 B2 | A) P(B1 | A) P(B2 | A)
▪ 乘法公式: P(AB) P(A)P(B | A)
P( A1 A2 ... An ) P( A1 )P( A2 | A1 )P( A3 | A1 A2 )... P( An | A1 A2 ... An1 )
▪ 以上三条基本规定是符合常识的。
14
▪ 定件…, }义为两:样两设本不{A空相n间, 交nΩ=,1的,且2一,…n个A}n完为 备一事组,件有则族限称,或事又可件若列族对无{A任穷n, 意多n=事个1,件事2,
B有BAn=An或φ, 本事件族。
n=1,
2,
…,则称{An, n=1, 2, …}为基
▪
全概率公 , Ai
i
式,:且设PA(A1i ), 0A,i 21,,2,..…., n A,n互则不对相于任交
意事件A有 P( A) P( Ai )P(A | Ai )
i
18
补充知识:贝叶斯定理
▪ 设,,则A…,对,B于1B,kn=互B12, ,不2, ……相,, 交nB,,n为P一(B些i)>事0,件i=,1,P(2A,)>…0,, Bn1,,且B2
实际应用中就是利用条件独立性的性质简化网络复杂性的。
来自百度文库21
举例: 道路交通问题 假设你在道路上驾驶,因为交通拥挤,你在慢慢减速。
你开始寻找减速的原因。莫非前方道路施工?或者出现交通 事故?不过,能确定的是你在不断的减速。
假设有三个参数:S表示交通缓慢(减速);C表示道路 施工;A表示交通事故。有关于该道路的交通统计数据:
根据统计,有交通缓慢S ,道路施工C ,交通事 故A的联合概率分布,如 右表。 可以计算当交通不拥堵 但前方有道路施工的概 率 为 0.01+0.05=0.06 等 交通数据处理问题。
22
当你还在寻找减速原因的时候,你发现在隔离墩上摆放 有橙色桶开始切断外车道的交通,此时,你能判定是因 为前方道路施工导致交通缓慢,而不是交通事故原因。 类似地,如果你已经在前方看到闪光灯,可能是警车或 救护车发出,在得到新证据后,你能判定出现交通事故 了。 不过,我们说某个假设是基本可以排除的,并不意味着 该假设就完全不可能。确切地说,在发现新证据的背景 下,此假设的可能性减少了。