基于特征选择的实体关系抽取

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

t ng i i an,e p ce r s n rp , o x e td c o s e t y o
sait h c r s d i e tca sf ai n frr d c n e fau e s a e d me s n tt i w ih we e u e n tx ls i c t o e u i g t e t r p c i n i . sc i o h o
距离特征是指要抽 取实体关系 的两个实体 间的词距 。 实体扩展特征 是指实体的 同义词和上位词 。 语义角色特征 是指用实体 的语义角色作 为特 征。
均 能在尽 量保 证抽 取性 能 的 同时有效 地 降低 向量 空间维数 , 高分类 效率 , 中 统计取 得 的效 果 最好 。 提 其 关键 词 :关 系抽取 ; 特征 选择 ; 息增 益 ; 望交 叉熵 ; 统计 信 期
中图分 类号 :T 3 9 P0 文献标 志码 :A 文章 编号 :10 — 6 5 2 1 ) 2 0 3 — 3 0 1 39 ( 0 2 0 — 5 0 0
毛小丽 , 中市 , 何 邢欣来 , 刘 莉
( 重庆 大 学 计 算机 学院 , 庆 40 4 ) 重 004
摘 要 :提 出了一种 实体 关 系抽 取方 案 , 方案针 对 实体 关 系抽 取 中特征 空 间维 数过 高 问题 , 该 引入 了文本 分类 中的特征 选择 算 法 , 信 息增 益、 如 期望 交叉 熵和 统 计 , 实现 了特征 空 间降维 。 实验 结果 表 明 , 各特 征 选择 算法
第2 9卷 第 2期 21 0 2年 2月
计 算 机 应 用 研 究
Ap l a i n Re e r h o o u e s p i to s ac f C mp t r c
V0 _ 9 No 2 l2 . F b 2 1 e.02
基 于特 征 选 择 的 实体 关 系抽 取
有效特征 的选择 。本文提 出的实 体关 系抽 取方 案 中选择 的 特征分 为五 类 : 实体 及其 上下 文词 法特 征 、 动词 特征 、 离 特 距 征、 实体扩 展特征 、 语义 角色特征 。 实体及其上 下文 特征 主要 包 含实 体 中心词 、 实体 前 两个 词、 实体后 两个 词以及这些词 的词 干和词性 。实体及其上 下文
法 , 流 的 指 导 性 学 习方 法 有 基 于 特 征 向量 的方 法 和 基 于 核 函 主
数 的方法 。其 中 , 于特征 向量的方法 ’ 基 是将 关系样 例进行 特征抽取 并将 其表示为特征 向量 , 然后通过机器学 习的方 法来 训练关 系实例 。而基 于核 函数 的方 法 直接 以结 构树 为处
Absr t: Th sp pe o o e e eniy r lto x r ci t d u ig t e fa u e s lc in ag rt t ac i a rpr p s d a n w tt ea in e ta ton meho sn h e t r e e to l o i hmss c n o ma u h asif r —
sait e c st e b s e o ma c ttsi ra he h e tp r r n e. c f sa itc ttsi
Ex rme sr s lss o t a h s e t r e e to l o ih a e p t e e ta to e f r a c pei nt e ut h w hwenku.baidu.comtt e e f au e s l cin ag rt ms c n k e h xr ci n p rom n e whi ns rn e uc h l e u g r d et e e i v co pa e d me so fe tv l e trs c i n i n e fci ey.an mp o e t e ca sfc to f ce c d i r v h ls i a in e i i in y.Th e
特征是最基本 、 简单的特征 。 最 动词特征表示 句子中的所有动词 。
取一般都 只考 虑一个句子 中两个实体 间的关 系 , 即实体关 系抽
取 问题 的输入 是一个句子和句子 中已经标 记出的两个实体 , 输
出则是这 两个 实体间的关系 。
目前解决 实体关系抽取 问题 主要采 用指导 性机器 学 习方
di1 .9 9 ji n 10 —6 5 2 1 .2 0 4 o :0 3 6 /.s .0 1 3 9 .0 2 0 .3 s
Eniy r lto x r cin b s d o e tr ee t n tt eain e ta to a e n f au e sl ci o
K e o ds: r lto x r ci yw r ea in e ta t on;f au e s lci n;if r to a n; e pe td c o se to y; e tr ee to n o mai n g i x ce r s n r p
实体关 系抽取 是信 息抽 取研 究 中 的一个 重要 环节 , 它 的作用是抽取 出两个实体之 间的语义关 系。 目前 , 实体关 系抽
MAO a 一i Xi o 1,H E Zh g s ,XI on —hi NG n—a ,LI Li Xi li U
( oeeo o p t , hn q g U i rt,C o gig40 4 C ia C lg C m ue C og i nv sy hn q 0 0 4, hn ) l f r n ei n
相关文档
最新文档