条件随机场梳理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
开始 输入测试集
输入训练集
分词、词性标注 特征抽取 CRF学习 CRF训练模型
分词、词性标注
特征抽取 CRF测试 命名实体识plate) 训练文件(train.data) 输出:模型文件(model)
LinearCRF2.py
readTemplate(tmpFile) loadModel(modelFile) 打开模板和训练文件
• 解决效果怎样
成效
• 以序列化形式进行全局参数 优化和解码 • 解决了其他判别式模型(如 最大熵马尔科夫模型)难以 避免的标记偏置问题。
不足
• 模型训练时收敛速度比较慢
• 能应用到哪些方向
序列标记 数据分割 组块分析 …... 应用领域 机器视觉 网络智能 ……
自然语言处 理 生物信息学
学习和测试流程
readData(dataFile) 读入训练集
processFeatures(tplist ,texts,seqnum,K,fd=1) 初始化特征值
loadModel( modelFile) 训练模型
model
概率计算 random_param(ufnum,bfnum);//获取特征 likelihoodthread_sa();//前向后向算法
• 为什么提出
隐马模 型
条件随 机场模 型
最大熵 模型
• 解决什么问题
在给定需要标记的观察序列的条件下,计算整个标记序 列的联合概率,而不是在给定当前状态下,定义一个状 态的分布。 标记序列为条件属性,可以让CRF很好的拟合现实数据, 而在这些数据中,标记序列的条件概率依赖于观测序列 中非独立的,相互作用的特征。 并通过赋予特征以不同权值来表示特征的重要程度。
条件随机场
2017-11-20
研究内容
• 什么是条件随机场 • 为什么提出 • 解决什么问题 • 解决效果怎样 • 能应用到哪些方向
• 什么是条件随机场
随机场
马尔科夫随机场MRF 条件随机场CRF
• 什么是条件随机场
• 条件随机场模型是Lafferty于2001年,在最大熵模型和隐马尔科夫模 型的基础上,提出的一种判别式概率无向图学习模型,是一种用于标 注和切分有序数据的条件概率模型。
saveModel() //保存模型
参数学习 train(datafile,tpltfile,modelfile,mp=1,regtyp e=2,sigma=1.0,fd=1.0) 预测 crfpredict(datafile,modelfile,resfile="“)
输入训练集
分词、词性标注 特征抽取 CRF学习 CRF训练模型
分词、词性标注
特征抽取 CRF测试 命名实体识plate) 训练文件(train.data) 输出:模型文件(model)
LinearCRF2.py
readTemplate(tmpFile) loadModel(modelFile) 打开模板和训练文件
• 解决效果怎样
成效
• 以序列化形式进行全局参数 优化和解码 • 解决了其他判别式模型(如 最大熵马尔科夫模型)难以 避免的标记偏置问题。
不足
• 模型训练时收敛速度比较慢
• 能应用到哪些方向
序列标记 数据分割 组块分析 …... 应用领域 机器视觉 网络智能 ……
自然语言处 理 生物信息学
学习和测试流程
readData(dataFile) 读入训练集
processFeatures(tplist ,texts,seqnum,K,fd=1) 初始化特征值
loadModel( modelFile) 训练模型
model
概率计算 random_param(ufnum,bfnum);//获取特征 likelihoodthread_sa();//前向后向算法
• 为什么提出
隐马模 型
条件随 机场模 型
最大熵 模型
• 解决什么问题
在给定需要标记的观察序列的条件下,计算整个标记序 列的联合概率,而不是在给定当前状态下,定义一个状 态的分布。 标记序列为条件属性,可以让CRF很好的拟合现实数据, 而在这些数据中,标记序列的条件概率依赖于观测序列 中非独立的,相互作用的特征。 并通过赋予特征以不同权值来表示特征的重要程度。
条件随机场
2017-11-20
研究内容
• 什么是条件随机场 • 为什么提出 • 解决什么问题 • 解决效果怎样 • 能应用到哪些方向
• 什么是条件随机场
随机场
马尔科夫随机场MRF 条件随机场CRF
• 什么是条件随机场
• 条件随机场模型是Lafferty于2001年,在最大熵模型和隐马尔科夫模 型的基础上,提出的一种判别式概率无向图学习模型,是一种用于标 注和切分有序数据的条件概率模型。
saveModel() //保存模型
参数学习 train(datafile,tpltfile,modelfile,mp=1,regtyp e=2,sigma=1.0,fd=1.0) 预测 crfpredict(datafile,modelfile,resfile="“)