马尔科夫概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Graph Data Management Lab, School of Computer Science
什么是马尔科夫模型MM
什么是隐马尔科夫模型HMM
HMM的组成
HMM解决的三个经典
HMM
Graph Data Management Lab, School of Computer Science
Markov Model
•Chain rule
*p(x1)
•1‐Markov assumption
Graph Data Management Lab, School of Computer Science
MM的组成
•状态:晴天、阴天和下雨
•初始向量:定义系统在时间为0的时候的状态的概率
•状态转移矩阵:每种天气转换的概率
Graph Data Management Lab, School of Computer Science
MM实例
•假设今天是天晴,求明天是天晴,后天是下雨的概率?
P(x2=sunny,x3=rainy|x1=sunny) = p(x3=rainy|x2=sunny,x1=sunny) *
p(x2=sunny|x1=sunny)
= p(x3=rainy|x2=sunny) *
p(x2=sunny|x1=sunny)
= 0.05 * 0.8
= 0.04
•假设今天是多云,求后天是下雨的概率?
P(x3=rainy|x1=foggy) = p(x2=sunny,x3=rainy|x1=sunny) +
p(x2=rainy,x3=rainy|x1=sunny) +
p(x2=foggy,x3=rainy|x1=sunny)
= p(x3=rainy|x2=sunny)*p(x2=sunny|x1=sunny) +
p(x3=rainy|x2=rainy)*p(x2=rainy|x1=sunny) +
p(x3=rainy|x2=foggy)*p(x2=foggy|x1=sunny)
Graph Data Management Lab, School of Computer Science
HMM
•当马尔科夫过程不够强大的时候,我们又该怎么办呢?
–E.g. 一个隐居的人可能不能直观的观察到天气的情况•民间的传说告诉我们海藻的状态在某种概率上是和天气的情况相关的–海藻表面潮湿说明下雨
–海藻表明干燥说明天晴
–如果处于中间状态,那就无法确定了
•或者通过观察别人有没有带伞来推断天气
•我们有两个状态集合,一个可以观察到的状态集合(海藻的状态)和一个隐藏的状态(天气的状况)
–E.g. 中文分词
•我们看到的一些单词的序列,但实际上想知道的是每个单词的词性
国际金融市场风云变幻竞争异常激烈
国/B际/E 金/B融/M市/M场/E 风/B云/M变/M幻/E 竞/B争/E 异/B常/E 激/B烈/E
Graph Data Management Lab, School of Computer Science
两者的关系
•可以观察到的状态序列和隐藏的状态序列是概率相关的
P(O1|H)+P(O2|H)+P(O3|H) + P(O4|H) = 1Soggy: 湿透Damp: 潮湿Dryish: 略近干涩Dry: 干燥
Graph Data Management Lab, School of Computer Science 混淆矩阵
Graph Data Management Lab, School of Computer Science
HMM的组成
•隐藏状态
–一个系统的(真实)状态,可以由一个马尔科夫过程进行描述(例如,天气)
•观察状态
–在这个过程中‘可视’的状态(例如,海藻的湿度)
•初始向量
–包含了(隐)模型在时间t=0时一个特殊的隐藏状态的概率(初始概率)
•状态转移矩阵
–包含了一个隐藏状态到另一个隐藏状态的概率
•混淆矩阵
–包含了给定隐马尔科夫模型的某一个特殊的隐藏状态,观察到的某个观察状态的概率
Graph Data Management Lab, School of Computer Science
形式化定义
•隐马尔科夫模型可以用一个三元组(π,A,B)来定义–π 表示初始状态概率的向量
–A =(aij)(隐藏状态的)转移矩阵
•P(X i(t)|X j(t‐1))t‐1时刻是j而t时刻是i的概率
–B =(bij)混淆矩阵P(Y
|X i)
i
•在某个时刻因隐藏状态为X j而观察状态为Y i的概率
Graph Data Management Lab, School of Computer Science HMM解决的三个经典问题
•评价
–给定HMM求一个观察序列的概率
•解码
–搜索最有可能生成一个观察序列的隐藏状态序列
•学习
–给定观察序列生成一个HMM
Graph Data Management Lab, School of Computer Science
Coin toss model
•场景
–假设你在一个房间,被蒙住了眼睛(看不见东西)。
–房间里另一个人在做抛硬币实验,硬币数量为1~n个•硬币为biased coin,会偏向某一个面
–他不会告诉你他是怎么抛的,只会告诉你抛硬币的结
果
•抛一个硬币,每次抛完告诉你结果
•抛两个硬币,每次抛完选择一个告诉你结果
•抛三个硬币,每次抛丸选择一个告诉你结果