概率图模型中的推断
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率图模型中的推断
王泉
中国科学院大学网络空间安全学院
2016年11月
•推断问题回顾
•精确推断:信念传播
–信念传播算法回顾
–信念传播在HMM中的应用•近似推断:吉布斯采样–吉布斯采样算法回顾
–吉布斯采样在LDA中的应用
•推断问题回顾
•精确推断:信念传播
–信念传播算法回顾
–信念传播在HMM中的应用•近似推断:吉布斯采样–吉布斯采样算法回顾
–吉布斯采样在LDA中的应用
•已知联合概率分布 P x
1,⋯,x n ,估计 –x Q 问题变量;x E 证据变量;x Q ∪x E =x 1,⋯,x n
P R =1 P R =0 0 P R =1G =1= ? P B =0.001 P E =0.002 P A B ,E =0.95 P A B ,¬E =0.94 P A ¬B ,E =0.29 P A ¬B ,¬E =0.001
P J A =0.9 P J ¬A =0.05 P M A =0.7 P M ¬A =0.01 P B =1E =0,J =1=? P x Q x E =x Q ,x E x E
•已知联合概率分布 P x 1,⋯,x n ,估计 –x Q 问题变量;x E 证据变量;x Q ∪x E =x 1,⋯,x n P x Q x E =x Q ,x E x E
观测图片 y i 原始图片 x i y �=argmax P y x 朴素贝叶斯
x
�=argmax P x y 图像去噪
•精确推断:计算P x Q x E的精确值
–变量消去 (variable elimination)
–信念传播 (belief propagation)
–计算复杂度随着极大团规模的增长呈指数增长,适用范围有限•近似推断:在较低的时间复杂度下获得原问题的近似解–前向采样 (forward sampling)
–吉布斯采样 (Gibbs sampling)
–通过采样一组服从特定分布的样本,来近似原始分布,适用范围更广,可操作性更强
•精确推断:计算P x Q x E的精确值
–变量消去 (variable elimination)
–信念传播 (belief propagation)
–计算复杂度随着极大团规模的增长呈指数增长,适用范围有限•近似推断:在较低的时间复杂度下获得原问题的近似解–前向采样 (forward sampling)
–吉布斯采样 (Gibbs sampling)
–通过采样一组服从特定分布的样本,来近似原始分布,适用范围更广,可操作性更强
目录
•推断问题回顾
•精确推断:信念传播
–信念传播算法回顾
–信念传播在HMM中的应用•近似推断:吉布斯采样–吉布斯采样算法回顾
–吉布斯采样在LDA中的应用
精确推断
•已知联合概率分布P x 1,⋯,x n,计算
P x Q x E=x Q,x E x E=x Q,x E
–x Q问题变量;x E证据变量;x Q∪x E=x1,⋯,x n
–问题的关键:如何高效地计算边际分布P x E=∑P x Q,x E
x Q
目录
•推断问题回顾
•精确推断:信念传播
–信念传播算法回顾
–信念传播在HMM中的应用•近似推断:吉布斯采样–吉布斯采样算法回顾
–吉布斯采样在LDA中的应用
•动机:将变量消去过程中产生的中间结果视为可复用的消息 (message),避免重复计算
•消息传递与边际分布
–
•消息传递与边际分布
–
–
•二次扫描算法 (two-pass algorithm)
–指定一个根节点,从所有叶节点开始向根节点传递消息,直到根节点收到所有邻接节点的消息
–从根节点开始向叶节点传递消息,直到所有叶节点均收到消息
目录
•推断问题回顾
•精确推断:信念传播
–信念传播算法回顾
–信念传播在HMM中的应用•近似推断:吉布斯采样–吉布斯采样算法回顾
–吉布斯采样在LDA中的应用
•隐马尔可夫模型 (hidden Markov model) 是关于时序的概率模型,是最简单的动态贝叶斯网络
–状态变量y1,y2,⋯,y n,y t∈Y表示第t时刻的系统状态–观测变量x1,x2,⋯x n,x t∈X表示第t时刻的观测值
–观测变量仅依赖于当前时刻的状态变量,即x t由y t确定
–当前状态仅依赖于前一时刻的状态,即y t t−1
–Y≔s1,s2,⋯,s N o1,o2,⋯,o M
•隐马尔可夫模型的三要素 –状态转移概率矩阵 A =a ij N ×N •在时刻 t 处于状态 s i 的条件下在下一时刻转移到状态 s j 的概率 –观测概率矩阵 B =b ij N ×M
•在时刻 t 处于状态 s i 的条件下观测到 o j 的概率 –初始状态概率向量 π=π1,π2,⋯,πN
•系统的初始状态为 s a ij =P y t+1=s j y t =s i ,
1≤i ,j ≤N b ij =P x t =o j y t =s i ,1≤i ≤N ,1≤j ≤M
πi =P y 1=s i ,1≤i ≤N
•有向树转化为无向树
初始状态概率:P y1
状态转移概率:P y t y t−1
观测概率:P x t y t
ψy
1=P y1,ψx1=1
ψy t=ψx t=1,t=2,⋯,n
ψy t−1,y t=P y t y t−1
ψx t,y t=P x t y t