L-概率推理-人工智能(AI)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Toothache
Toothache
PCatch PCatch PCatch PCatch
Cavity 0.108 0.012 0.072 0.008
Cavity 0.016 0.064 0.144 0.576
P(Cavity) = 0.108 + 0.012 + 0.072 + 0.008 = 0.2
解释:在观察到有牙疼 (Toothache)之后,患者有牙洞的概 率将不再是“平均”的概率,即Cavity 的先验概率已不再 适用
P(Cavity|Toothache)的值可通过保持上表蓝色4项之间的比 率不变,并将它们的和进行归一化得到
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
Toothache
▪ P(Cavity) = StSpc P(Cavitytpc) = StSpc P(Cavity|t,pc) P(tpc)
▪ P(c) = StSpc P(ctpc) = StSpc P(c|t,pc)P(tpc)
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
独立性
Independence
1/8 1/8
1/8
1/8
1/8
1/8
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
信度与信度状态是怎样发生联系的?
How are beliefs and belief states related?
1/16
1/16
1/4
单个信度是怎样影 响到这个信度状态 1/8 及其它的信度的?
1/8
条件概率
Conditional Probability
▪ P(AB) = P(A|B) P(B) = P(B|A) P(A)
P(A|B) 是给定B,A的后验概率
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
Toothache
Toothache
PCatch PCatch PCatch PCatch
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
概率推理 Probabilistic Inference
Toothache
Toothache
PCatch PCatch PCatch PCatch
Cavity 0.108 0.012 0.072 0.008
Cavity 0.016 0.064 0.144 0.576
P(cpc|t,E) = P(cpc|t)
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
一些问题
▪ 如果一个状态由n个命题描述,则信度状态包 含2n个状态 (可能其中一些概率为0)
▪ 建模的难点 ▪ 计算量问题
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
Toothache
Cavity 0.016 0.064 0.144 0.576
▪ 令E为证据,在证据E出现的条件下有
P(Toothache|E) = 0.8
▪ 我们想计算P(ctpc|E) = P(cpc|t,E) P(t|E)
▪ 由于E与牙洞或器械感染不直接相关, 因此可以认为
在给定t条件下, c、pc和E是独立的,则有:
▪ 给出Cavity的先验概率分布
▪ 给出Toothach和PCatch的条件概率表
P(ctpc) = P(tpc|c) P(c) = P(t|c) P(pc|c) P(c)
Cavity
概率信度状态与概率推理
Probabilistic Belief States and Probabilistic Inference
(通过探索少量直接影响的事件来推 理整个世界)
R&N: Chap. 14, Sect. 14.1–4
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
概率信度
= a (0.12, 0.08) = (0.6, 0.4)
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
条件概率
Conditional Probability
▪ P(AB) = P(A|B) P(B) = P(B|A) P(A)
▪ P(ABC) = P(A|B,C) P(BC) = P(A|B,C) P(B|C) P(C)
▪ 那么D应该如何对其信度状态进行更新呢?
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
Updating the Belief State
Toothache
Toothache
PCatch PCatch PCatch PCatch
Cavity 0.108 0.012 0.072 0.008
边缘化 Marginalization: P(c) = StSpc P(ctpc)
式中 c = Cavity 或 Cavity, St 是有关t = {Toothache,
Toothache}的和,Spc是有关{PCatch, PCatch}的和 人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
Probabilistic Belief
▪ 考虑这样的一个问题,该问题的整个世界由牙科医 生D和患者P组成
▪ D关心的只是P是否有牙洞;因此可由单个命题: Cavity,描述问题的状态
▪ 在对患者P作检查(观察)之前,D并不知道P是否 有牙洞,但由多年的行医实践,他认为一个人有牙 洞(Cavity)的概率会是P,而没有牙洞(Cavity) 的概率则是1-P
Cavity 0.108 0.012 0.072 0.008
Cavity 0.016 0.064 0.144 0.576
P(Cavity|Toothache) = P(CavityToothache)/P(Toothache)
= (0.108+0.012)/(0.108+0.012+0.016+0.064) = 0.6
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
回到牙医的例子......
▪ 现在我们使用3个命题:Cavity, Toothache, 和 PCatch,来表示整个牙医问题世界
▪ D的信度状态由23 = 8 个状态组成,每个状态 有对应的概率 : {CavityToothachePCatch, CavityToothachePCatch, CavityToothachePCatch,...}
Cavity 0.108 0.012 0.072 0.008
Cavity 0.016 0.064 0.144 0.576
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
概率推理 Probabilistic Inference
Toothache
Toothache
PCatch PCatch PCatch PCatch
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
信度状态可由所有命题的全联合概率定义
The belief state is defined by the full joint probability of the propositions
Toothache
Toothache
PCatch PCatch PCatch PCatch
Toothache
PCatch PCatch PCatch PCatch
Cavity 0.108 0.012 0.072 0.008
Cavity 0.016 0.064 0.144 0.576
▪ 给定Cavity (或 Cavity)条件下,Toothache
和 PCatch是独立的,只不过该独立关系隐
▪ 于是命题Cavity成为了一个布尔随机变量,而 (Cavity, p)则称为概率信度
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
概率信度状态
Probabilistic Belief State
▪ 整个牙医问题世界只有两种可能状态,分别由 Cavity 和 Cavity 描述
▪ 一个智能体的概率信度状态即为智能体自己认为的 问题世界所有状态的概率分布
藏在数字后! [请同学们自行验证] ▪ 贝叶斯网络 Bayesian networks 将命题之间
的独立性明确表示出来,从而减少了定义 整个信度状态所需的概率数量
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
贝叶斯网络
Bayesian Network
▪ 注意到Cavity是Toothache和PCatch的“起因”,然 后将这样的因果关系明确的表示出来
信度状态更新
Updating the Belief State
Toothache
Toothache
PCatch PCatch PCatch PCatch
Cavity 0.108 0.012 0.072 0.008
Cavity 0.016 0.064 0.144 0.576
▪ 假设D现在观察到患者牙疼(Toothache) 的概率为 0. 8(例如, “患者说有牙疼”)
▪ 在牙医问题的例子中,D的信度状态为:
Cavity Cavity
p
1-p
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
智能吸尘器
Vacuum Robot
如果机器人不知道问题世界的状态的具体情 况,它会认为所有的状态有着同样的可能性 (无差别原理),于是其信度状态将会为:
1/8 1/8
P(Cavity|Toothache)=P(CavityToothache)/P(Toothache)
= (0.016+0.064)/(0.1源自文库8+0.012+0.016+0.064) = 0.4
P(c|Toochache) = a P(c Toothache)
归一化常数
= a Spc P(c Toothache pc) = a [(0.108, 0.016) + (0.012, 0.064)]
1/16
1/16
1/4
(Clean(R1), 5/16) (Clean(R2), 0.5) (In(Robot,R1), 0.5) (In(Robot,R2), 0.5)
通常处理单个信度比处理整个信度状态更为方便, 例 如:
- 机器人仅当Clean(R2)概率很低的时候执行Suck(R2) - 机器人可直接观察是否Clean(R1)或Clean(R2)
▪ 两个随机变量A和B是独立(independent)的 如果 P(AB) = P(A) P(B) 即 P(A|B) = P(A)
▪ 两个随机变量A和B是给定C条件下独立的如 果
P(AB|C) = P(A|C) P(B|C) 即 P(A|B,C) = P(A|C)
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
▪ 令E为证据,在证据E出现的条件下有
▪ 我更的新和们的正想这态计4化算项P到(概TP0(o率.co8t得通tha到过pcch将|eE|它)E=们) =P(0c.8pc|t,E) P(t|E)
▪ 由于E与牙洞或更器新械的感这染4项不概直率接通相过关将它, 因们此可以认为 在给定t条件下的,和c、正p态c和化到E是0.独2得立到的,则有:
Toothache
PCatch PCatch PCatch PCatch
Cavity 0.108 0.012 0.072 0.008
Cavity 0.016 0.064 0.144 0.576
P(Cavity|Toothache) = P(CavityToothache)/P(Toothache)
= (0.108+0.012)/(0.108+0.012+0.016+0.064) = 0.6
Cavity 0.108 0.012 0.072 0.008
Cavity 0.016 0.064 0.144 0.576
P(Cavity Toothache) = 0.108 + 0.012 + ... = 0.28
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
概率推理 Probabilistic Inference
P(cpc|t,E) = P(cpc|t)
人工智能原理2008年春季 广西大学 计算机学院 Dr.Ou
Updating the Belief State
Toothache
Toothache
PCatch PCatch PCatch PCatch
Cavity Cavity
0.108 0.432 0.0120.048 0.0720.018 0.0080.002 0.016 0.064 0.0640.256 0.144 0.036 0.5760.144