隐马尔科夫模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
隐马尔科夫模型
一、引入
二、定义
三、隐马尔科夫模型的计算
(1)估值问题
(2)解码问题
(3)训练问题
四、隐马尔科夫各种结构
H M M的由来
☐1870年,俄国有机化学家V l a d i m i r V.M a r k o v n i k o v第一次提出马尔科夫模型
☐马尔可夫模型和马尔可夫链
☐ 隐式马尔可夫模型(H M M )
马尔可夫性
☐ 如果一个过程的“将来”仅依赖“现在”而不依赖“过去”,则此过程具有马尔可夫性,或称此过程为马尔可夫过程 ☐ X (t+1) = f(X(t))
马尔可夫链
☐ 时间和状态都离散的马尔科夫过程称为马尔科夫链。
设在时刻t 的随机变量用t S 表示,其观察值用t s 表示,则如果当11s S ,
22s S =,……,t t s S =的前提下,11++=t t s S 的概率是如下式所示,则称为n 阶Markov
过程。
)|()|(1
1
111111t
n t t
n t t t t t t t s
S
s S P s S s S P +-+-++++===== (1)
这里t
S 1
表示1S ,2S ,……,t S ,t s 1
表示1s ,2s ,……,t s ,t
t s S 11=表示11s S =,
22s S =,……,t t s S =。特别的当如下式成立时,则称其为1阶Markov 过程,
又叫单纯马尔可夫过程。
)|()|(111
111t t t t t t t t s S s S P s S s S P =====++++ (2)
即:系统在任一时刻所处的状态只与此时刻的前一时刻所处的状态有关。而且,为了处理问题方便,考虑式(2)右边的概率与时间无关的情况,即:
)|[)1,(1i t j t ij s S s S P t t P ===++ (3)
同时满足:
0)1,(≥+ij t t P (4)
∑==+N
j ij t t P 1
1)1,( (5) 这里ij t t P )1,(+是当时刻t 从状态i 到时刻t +1时的状态j 的转移概率,当这个转移概率是与时间无关的常数时,又叫S ,2S ,……是具有常数转移概率的Markov 过程。
隐式马尔可夫模型(H M M )
HMM 类似于一阶Markov 过程。不同点是HMM 是一个双内嵌式随机过程,即HMM 是由两个随机过程组成,一个是状态转移序列,它对应着一个单纯Markov 过程;另一个是每次转移时输出的符号组成的符号序列。这两个随机过程,其中状态转移随机过程是不可观测的,只能通过另一个随机过程的输出观察
序列观测。设状态转移序列为S=T s s s 21,,输出的符号序列为O=1o ,T o o 2。
由于模型本身是看不见的,即模型的状态不为外界所见,只能根据观察序列推导出来,所以称为隐马尔可夫模型。
离散HMM 中的元素
对于语音识别使用的HMM 可以用下面六个模型参数来定义,即:
观察值序列 o 1, o 2, ..., o T
图1 HMM 的组成示意图
},,,,,{F B A O S M π=
S :模型中状态的有限集合,即模型由哪几个状态组成。设有N 个状态,S ={i s
|i=1,2,……,N}。记t 时刻模型所处状态为t s ,),,(1N t
s s s ∈。
O :输出的观察值符号的集合,即每个状态对应的可能的观察值数目。记M 个观察值为1o ,……,
M o ,记t 时刻观察到的观察值为t o 其中1(,,)t M o o o ∈ 。
A :状态转移概率的集合。所有转移概率可以构成一个转移概率矩阵,即:
⎥⎥⎥⎦
⎤
⎢⎢⎢⎣⎡=NN N N a a a a A 1111
其中ij a 是从状态i s 到状态j s 的转移概率,i ≤1,N j ≤且有10≤≤ij a ,∑==N
j ij a 11。
B :输出观测值概率的集合。{()}j B b k =。其中
()[v |],1j t k t b k p o s j k M ===≤≤,其中
V k k 表示第个观察符号
根据B 可将HMM 分为连续型和离散型HMM 等。
()1j k
b k =∑ (离散型HMM )
()1j
b k dk ∞-∞
=⎰ (连续型HMM )
π:系统初始状态概率的集合,}{i ππ=,i π表示初始状态是i s 的概率,即:
1[],(1) 1i i P s i i N ππ==≤≤=∑ (6)
F :系统终了状态的集合。
Markov 模型没有终了状态的概念,只是在语音识别里用的Markov 模型要设定终了状态。
π,F},为了便于表示,常用下面的形式表示一个HMM,这样,可以记一个HMM为M={S,O,A,B,
π}。HMM可以分为两部分,一个是Markov链,由π,A描述,产生的输出为状即简写为M={A,B,
态序列。另一个随机过程,由B描述,产生的输出为观察符号序列。
HMM:示例
图2 两个状态的HMM
HMM 的三个基本问题
HMM 核心理论是解决三个基本问题: 1.已知观测序列O ={1o ,2o ……T o }和模型},,{πλB A =,如何有效计算在给定模型的条件
下产生观测序列O 的条件概率)/(λO P 最大。
2.已知观测序列O ={1o ,2o ……T o }和模型},,{πλB A =,如何选择相应的在某种意义上最
佳的(能最好解释观测序列的)状态序列S 。
3.如何调整模型参数},,{πλB A =以使条件概率(|)P O λ最大。