隐马尔可夫模型(课堂PPT)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

骰子作弊问题模型化: 作弊问题由 5 个部分构成:
(1)隐状态空间 S (状态空间):
S {正常骰子A,灌铅骰子 B} ,赌场具体使用哪个骰子,赌 徒是不知道的。 (2)观测空间 O :O {1,2,3,4,5,6}。正常骰子 A 和灌铅骰 子 B 的所有六个面可能取值。
.
14
(3)初始状态概率空间 :
❖ 马尔可夫模型的观测序列本身就是 状态序列;
❖ 隐马尔可夫模型的观测序列不是状 态序列;
.
9
引例2
设有N个篮子,每个都装了许多彩色小球, 小球颜色有M种.现在按下列步骤产生出一个输 出符号(颜色)序列:按某个初始概率分布,随机 的选定一个篮子,从中随机地取出一个球,记 录球的颜色作为第一个输出符号,并把球放回 原来的篮子.然后按照某个转移概率分布(与当 前篮子相联系)选择一个新的篮子(也可能仍停 留在当前篮子),并从中随机取出一个球,记下 颜色作为第二个输出符号.
.
10
如此重复地做下去,这样便得到一个输出序列. 我们能够观测到的是这个输出序列—颜色符号 序列,而状态(篮子)之间的转移(状态序列)被隐 藏起来了.每个状态(篮子)输出什么符号(颜色)是 由它的输出概率分布(篮子中彩球数目分布)来随 机决定的.选择哪个篮子(状态)输出颜色由状态 转移矩阵来决定.
a11
a22
1 a31
a12
a21
a13
a32
2 a23
3
a33 .
7
O(o1o2..o.T)(HHH.T.T.H ) HT
❖ 每个硬币代表一个状态; ❖每个状态有两个观测值: 正面 H 和反面 T; ❖ 每个状态产生H的概率:P(H); ❖ 每个状态产生T的概率为:1-P(H)
.
8
对比两个模型可见:
.
23
二、隐马尔可夫模型中的三个基本问题
(1)评估问题(evaluation):从骰子的数列中推断是 否使用了作弊骰子,如果知道使用了作弊骰子,那么在投 掷骰子的过程中出现这个序列的概率有多大。 (2)解码问题(decoding):如果确实使用了作弊骰 子,这些序列中哪些点是由B投掷出来的。 (3)学习问题(Learning):也称为参数训练问题,即 仅仅给出大量的数据点,如何从中推断出细节问题(如骰 子B投出各个点的概率?赌场是何时偷换的骰子的)。
{初始选择正常骰子的概 率,初始选择灌铅骰子的概 率}。
(4)隐状态转移概率矩阵 P22 :
正常骰子 A 灌铅骰子 B
正常骰子 A 0.9
0.1
灌铅骰子 B 0.8
0.2
(5)观测值生成概率矩阵 Q26 :
观测值
123456
正常骰子 A 1/6 1/6 1/6 1/6 1/6 1/6
灌铅骰子 B 0 1/8 1/8 3/16 3/16 3/8
隐马尔可夫模型
Hidden Markov Model Hidden Markov Model
.
1
思考题:
对给定的一定长度的DNA序列,识别其上CpG岛大致位的 方法。
.
2
两个问题: (1)给定一段DNA序列片段,判断它是否是
CpG岛?对应于Markov模型问题 (2)给定一段DNA序列,识别其中的CpG岛?
.
15
.
16
隐马尔可夫模型的定义: 隐马尔科夫模型由以下五部分构成:
(1)隐状态空间 S (状态空间):
S {S1, S2 , S3, , SN },其中 N 为状态的数目。
(2)观测空间 O : O {O1,O2 ,O3, ,OM },M 为状态
对应的观测值的数目。 (3)初始状态概率空间 : {1, 2 , 3, , N } , 其中
.
5
(1)HMM的基本概念
马尔可夫模型主要是把一个总随机 过程看成一系列状态的不断转移,其特 性主要使用“转移概率”来表示。
HMM则认为模型的状态是不可观测 的(这是“隐”的由来)。能观测到的 只是它表现出的一些观测值 (observations)
.
6
例:隐马尔可夫链—观测三个硬币状态
O(o1o2..o.T)(HHH.T.T.H ) HT
A 和 B 之间相互转换的概率写成矩阵如下:
正常骰子 A 灌铅骰子 B
正常骰子 A
0.9
0.1
灌铅骰子 B
0.8
0.2
A 和 B 产生各观测值概率的区别为:
观测值
123456
正常骰子 A 1/6 1/6 1/6 1/6 1/6 1/6
灌铅骰子 B 0
1/8 1/8 3/16 3/16 3/8
.
13
i P{X1 Si} (1 i N )
.
17
(4)隐状态转移概率矩阵 PNN :
p11
PNN
p21
p12 p22
pN1
pN 2
p1N
p2
N
p
NN
(5)观测值生成概率矩阵 QNM :
q11 q12
QNM
q21
q22
qN1 qN 2
q1M
q2M
qNM
记 HMM 为: (S,O, , P,Q)或简写为 ( , P,Q) 。
.
20
我们将图对应到赌场作弊问题,以便深入理解隐马尔可夫 模型:
.
21
赌场作弊隐马尔可夫模型中,状态空间—观测空间示意图:
.
22
注: 隐马尔可夫模型中, X { X 1 ,X 2 ,X 3 , ,X i, } 是马尔可夫链,是隐蔽层,是不可观测 的,也称为状态链。 v { v 1 ,v 2 ,v 3 , ,v i, } 是观测到的序列,是一个随机序列,也 称为观测链。 因此,隐马尔可夫模型是有两个随机过程组成:即由状态 链(马尔可夫链)和观测链组成
对应于隐Markov模型基本概念 隐马尔可夫模型中的三个基本问题 隐马尔可夫模型的生物信息学应用—
CpG岛识别
.
4
一、隐马尔可夫模型的基本概念
隐马尔可夫模型(hidden Markov model , 记作:HMM)是马尔可夫模 型的进一步发展。其在生物信息学分 析中得到了广泛的应用。
.
18
(2)隐马尔可夫模型的参数
①状态总数 N ; ②每个状态对应的观测事件数 M ;
③状态转移矩阵 : A {aij}
④每个状态下取所有观测事件的概率分布 : B{bj (k)}
⑤起始状态 :
i
.
19
马尔可夫模型的图解:
假定观测序列为 v {v1, v2 , v3, , vi , }(可见)。 假定隐马尔可夫链为, X {X1, X 2 , X 3, , X i , } (不可见)。 马尔可夫链示意图如下:
.
11
隐马尔可夫模型的示例—赌场欺诈问题:(本例来自戴培山等生物信息
专题课件)
某赌场在投骰子,根据点数决定胜负。在多次投 掷骰子的时候采取了如下手段进行作弊:准备了 两个骰子A和B,其中A为正常骰子,B为灌铅骰 子,由于怕被发现,所有连续投掷的时候偶尔使 用一下B,A和B之间转换的概率如下:
.
12
相关文档
最新文档