基于多学习策略的网页信息抽取方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于多学习策略的网页信息抽取方法
朱明;李香;郑烇
【期刊名称】《计算机应用与软件》
【年(卷),期】2008(025)012
【摘要】由于网页信息具有异构和动态的特点,致使现有的大多数网页信息抽取方法都存在适用性差的问题.为此,将传统的文本分类器和隐式马尔可夫学习策略结合起来,提出了一种基于多学习策略的网页信息抽取方法.该方法在获得网页文本记录的局部最优分类抽取结果基础上,还利用了整个网页文本结构信息对抽取结果进行进一步优化.实验结果表明,该方法不需要对新的站点进行学习,就能获得较高的信息召回率和抽取精度,具有较强的适用性.
【总页数】3页(P68-69,115)
【作者】朱明;李香;郑烇
【作者单位】中国科学技术大学自动化系,安徽,合肥,230027;中国科学技术大学自动化系,安徽,合肥,230027;中国科学技术大学自动化系,安徽,合肥,230027
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于领域本体的Web信息抽取方法的设计与实现——以网易汽车资讯网页信息抽取为例 [J], 吴恒亮
2.基于文本行特征的网页正文信息抽取方法研究 [J], 刘志杰;潘洋
3.一种基于网页信息抽取的OA期刊资源采集方法研究 [J], 黄政;张学福
4.基于视觉特征的网页信息抽取方法研究 [J], 王宪发;郭岩;刘悦;俞晓明;程学旗
5.基于卷积神经网络的网页信息资源定向抽取方法研究 [J], 周沭玲
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档