概率图模型(HMM和CRF)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率图模型(HMM和CRF)
概率图模型是⼀类⽤途来表达相关关系的概率模型。
它以图为表⽰⼯具,最常见的是⽤⼀个结点表⽰⼀个或⼀组随机变量,节点之间的边表⽰变量间的概率相关关系,即“变量相关图”。
根据边的性质不同,概率图模型可⼤致分为两类:第⼀类是使⽤有向⽆环图表⽰变量间的依赖关系,称为有向⽆环图或者贝叶斯⽹;第⼆类是使⽤⽆向图表⽰变量间的相关关系,称为⽆向图或马尔可夫⽹。
隐马尔可夫模型(HMM)是结构最简单的动态贝叶斯⽹,,这是⼀种著名的有向图模型,主要⽤于时序数据建模,在语⾳识别、⾃然语⾔处理等领域有⼴泛应⽤。
HMM的变量可分为两组:⼀组是观测变量,⼀组是状态变量,由于观测变量是隐藏的所以称为隐马尔可夫模型。
马尔可夫链:系统下⼀时刻的状态仅由当前状态决定,不依赖于以往的任何状态。
基于这种依赖关系,所有变量的联合概率分布为:
除了结构信息,欲确定⼀个隐马尔可夫模型还需要以下三组参数:
状态转移概率:模型在各个状态间转换的概率,通常记为矩阵A
输出观测概率:模型根据当前状态获得各个观测值的概率,通常记为矩阵B
初始状态概率:模型在初始时刻各状态出现的概率,通常记为Π
通过指定上述3种参数λ = {A,B,Π},以及状态空间、观测空间就可以确定⼀个隐马尔可夫模型。
条件随机场(CRF)是⼀种判别式⽆向图模型。
⽣成式模型是直接对联合分布进⾏建模,⽽判别式模型则是对条件分布进⾏建模。
条件随机场试图对多个变量在给定观测值后的条件概率进⾏建模。
具体来说,若令X={x1,x2,...xn}为观测序列,y={y1,y2,...,yn}为标记序列,则条件随机场的⽬标式构建条件概率模型P(y|x)。
与马尔可夫随机场定义联合概率的⽅式类似,条件随机场使⽤势函数和图结构上的团来定义条件概率P(y|x)
HMM和CRF的区别
1.⼀个式⽣成式模型,⼀个是判别式模型
2.⼀个式联合概率分布,⼀个式条件概率
3.⼀个是有向图,参数有三种,⽤马尔可夫假设;另⼀个⽆向图,通过状态函数和状态转移特征函数定义条件概率。