贝叶斯网络

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2.贝叶斯网络

贝叶斯网络(Bayesian network)，又称信念网络(Belief Network)，或有向无环图模型(directed acyclic graphical model)，是一种概率图模型，于1985年由Judea Pearl 首先提出。它是一种模拟人类推理过程中因果关系的不确定性处理模型，其网络拓朴结构是一个有向无环图(DAG)。

贝叶斯网络的有向无环图中的节点{}12,,

,n X X X 表示随机变量，它们可以

是可观察到的变量，或隐变量、未知参数等。认为有因果关系（或非条件独立）的变量或命题则用箭头来连接。若两个节点间以一个单箭头连接在一起，表示其中一个节点是“因(parents)”，另一个是“果(children)”，两节点就会产生一个条件概率值。连接两个节点的箭头代表此两个随机变量是具有因果关系，或非条件独立。

例如，假设节点E 直接影响到节点H ，即E→H ，则用从E 指向H 的箭头建立结点E 到结点H 的有向弧(E,H)，权值(即连接强度)用条件概率P(H|E)来表示，如下图所示：

简言之，把某个研究系统中涉及的随机变量，根据是否条件独立绘制在一个有向图中，就形成了贝叶斯网络。其主要用来描述随机变量之间的条件依赖，用圈表示随机变量(random variables)，用箭头表示条件依赖(conditional dependencies)。

令G = (I,E)表示一个有向无环图(DAG)，其中I 代表图形中所有的节点的集合，而E 代表有向连接线段的集合，且令X = (X i )，i ∈ I 为其有向无环图中的某一节点i 所代表的随机变量，若节点X 的联合概率可以表示成：

()()()

i pa i i I

p x p x x ∈=∏

则称X 为相对于一有向无环图G 的贝叶斯网络，其中，()pa i 表示节点i 之“因”，或称()pa i 是i 的parents （父母）。此外，对于任意的随机变量，其联合概率可由各自的局部条件概率分布相乘而得出：

()()

()()111211,

,K K K p x x p x x x p x x p x -=

下图所示，便是一个简单的贝叶斯网络：

因为a 导致b ，a 和b 导致c ，所以有:

()()()(),,,p a b c p c a b p b a p a =

2.1贝叶斯网络的3种结构形式:

给定如下图所示的一个贝叶斯网络：

（1） x 1, x 2 , …,x 7的联合分布为:

()()()()()()()()

1234567123412351364745,,,,,,,,,,p x x x x x x x p x p x p x p x x x x p x x x p x x p x x x =

（2）x 1和x 2独立（对应head-to-head ）；

（3）x 6和x 7在x 4给定的条件下独立（对应tail-to-tail ）

根据上图，第（1）点可能很容易理解，但第（2）、（3）点中所述的条件独立是啥意思呢？其实第（2）、（3）点是贝叶斯网络中3种结构形式中的其中二种。为了说清楚这个问题，需要引入D-Separation （D-分离）这个概念。

D-Separation 是一种用来判断变量是否条件独立的图形化方法。换言之，对于一个DAG(有向无环图)E ，D-Separation 方法可以快速的判断出两个节点之间是否是条件独立的。 2.1.1 head-to-head

贝叶斯网络的第一种结构形式如下图所示：

所以有：()()()(),,,p a b c p a p b p c a b =成立，化简后可得：

()()()()

()()()

,,,,c

p a b c p a p b p c a b p a b p a p b =⇒=∑∑

在c 未知的条件下，a 、b 被阻断(blocked)，是独立的，称之为head-to-head 条件独立，对应本节中最开始那张图中的“x 1、x 2独立”。 2.1.2 tail-to-tail

贝叶斯网络的第二种结构形式如下图所示:

在c 未知的时候，有：()()()(),,p a b c p c p a c p b c =，此时，无法得出

()()(),p a b p a p b =，即c 未知时，a 、b 不独立。

c 已知时，有()()(),,,p a b c p a b c p c =，将()()()(),,p a b c p c p a c p b c =带入式子，得()()()()()()()()(),,,p a b c p a b c p c p c p a c p b c p c p a c p b c ===，即c 已知时，a 、b 独立。

所以，在c 给定的条件下，a ，b 被阻断(blocked)，是独立的，称之为tail-to-tail 条件独立，对应本节中最开始那张图中的“x 6和x 7在x 4给定的条件下独立”。

2.1.3 head-to-tail

贝叶斯网络的第三种结构形式如下图所示：

c 未知时，有：()()()(),,p a b c p a p c a p b c =，但无法推出()()(),p a b p a p b =，即c 未知时，a 、b 不独立。

c 已知，有()()(),,,p a b c p a b c p c =，据()()()()(),pa c pa pc a pc pa c =

，

可化简得到：

()()()

()()()()()()()()()

,,,,p a b c p a b c p c p a p c a p b c p c p a c p b c p c p a c p b c ====

所以，在c 给定的条件下，a ，b 被阻断(blocked)，是独立的，称之为head-to-tail 条件独立。

head-to-tail 其实就是一个链式网络，如下图所示：

根据之前对head-to-tail 的讲解，我们已经知道，在x i 给定的条件下，x i+1的分布和x 1,x 2…x i-1条件独立。意味着啥呢？意味着：x i+1的分布状态只和x i 有关，和其他变量条件独立。通俗点说，当前状态只跟上一状态有关，跟上一个状态之前的状态无关。这种顺次演变的随机过程，就叫做马尔科夫链（Markov chain ）。且有：

()()10121,,,

,n n n n p X x X X X X p X x X ++===

接着，将上述结点推广到结点集，则是：对于任意的结点集A ，B ，C ，考察所有通过A 中任意结点到B 中任意结点的路径，若要求A ，B 条件独立，则需要所有的路径都被阻断(blocked)，即满足下列两个前提之一：

A 和

B 的“head -to-tail 型”和“tail -to-tail 型”路径都通过

C ； A 和B 的“head -to-head 型”路径不通过C 以及C 的子孙； 2.2 因子图

引入实例：

根据上图，在一个人呼吸困难（dyspnoea ）的情况下，求其抽烟（smoking ）的概率是多少。即：()?p smoking dyspnoea yes

，根据条件概率推导可得：