基于特征分选策略的中文共指消解方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ch n s r f r n e Re o u i n M h d i e e Co e e e c s l t e o o t Ba e n Fe t r s e tv ee t n S r t g s d 0 a u eRe p c i eS l c i t a e y o
[ b ta t hspp r tde ieetetrs ae p0 etp f o np rs hn s oeee c slt nb sdo c ielann , A src]T i ae u is f rn a e sdu nt e u hae nC iee rfrner oui ae nmahn rig s df f u b h y on i c e o e
1 概 述
共指现象广泛存在于 自然语言 的各种表达 中,表示篇章 中的一个语言 单位 与之 前出现 的语言 单位存在语义 上的关联 ( 本文不 讨论 回指和零指) ,用于指 向的语言单位称为照应语 ,
r s e t e y O t i t o a e u e s me “ o s ” a d u ii e f a u e f e t e y Ex e i e t lr s ls s o t a t o a mp o e t e e p c i l ,S s me h d c n r d c o v h n i e n t z e t r s e c i l . p rm n a e u t h w h tt me d C l i r v l v he h l h p rb a c fc r f r n er s u i n s t m , n me s r e c e 0. % . e t r n eo o e e e c e ol t yse a d F- a u er a h s 8 72 m o
LIYu q n , GAN n s e g , . i 一 , Ru .h n YANG n . o g , S h i al Yo g h n 。 HI u. i2 S c I
(. o ue co lBe igIfr t nSin e&T c n lg iest, in 0 1 1C ia 1C mp t S h o, in omai c c r j n o e eh oo yUnvri Be ig10 0 , hn; y j 2 B in R nomainT cn lg o Ld, e ig10 0 , hn ; . e igT SIfr t eh oo yC . t.B in 0 1 1 C ia j o j
a r p s s f a u e e e t n sr t g o b p l d t o e e e c e o u i n,t e a p o c e e t r n u n h r n u h a e e t r s nd p o o e e t r s s l c i tae y t e a p i o c r f r n e r s l t o e o h p r a h s l c s p o o ns a d ot e o n p r s s f a u e
第3 7卷 第 1 期 8
、0 .7 ,13
・
计
算
机
工
程
2 1 年 9月 0 1
S p e b r 01 e t m e 2 1
N O. 8 1
Com p t rEn 智 能及 识别 技 术 ・
文章编号: 0 32( 11— 10 1o_ 48 0 ) 8— 3 218
3 S h l flt m ai nS in ea dTe h o o y S nYa— nUnv ri , a g h u51 2 5, ia . c oo br to ce c n c n l g , u tSe ie st Gu n z o 0 7 Chn ) o n y
特征 向量 时对人称代词和普通名词短语分别 处理 ,充分利用不 同名词短语 的已有特征进行共指消解 , 并减 少部分 无效特征在共指消解过程 中产 生的 “ 噪声 ” 。实验结果表 明,该 中文共指消解 方法能提高共指消解的性能 , F值达到 8 . %。 02 7
关健诃 :共指消解 ;特征选择 ; 自 然语言 处理 ;支撑向量机 ;数据词 典
文献标 识码;A
中 圈分类号; P9 T31
基 于特征 分 选 策略 的 中文共指 消解 方法
李j勤 ‘,甘润 生 杨永 红 3 施水才 | , r 一 , ’ 2
(. 1 北京信息科技大学计算机学院 ,北京 10 0 ;2 北京拓尔 思信息技术股份有 限公 司,北京 10 0 ; 0 11 . 0 11 3 中山大学信息科 学与技 术学院计算机 科学系 ,广州 50 7 ) . 125 摘 要 :针对基于机器学 习的 中文共指消解 中不 同类别名词短语特征 向量 的使 用差异 ,提出一种基于特征分选策略的方法。该 方法在选择
[ yw r s oeee c slt n faueslcin n tr n u g rcsig S p ot etr ahn (V )dt it n r Ke o d ]c rf ner oui ;etr e t ; aue ag a e oes ; u p rV co c ieS M ; aa ci ay r e o e o l p n M d o DOI 1 . 6/i n10 -4 82 1.80 9 : 03 9js . 03 2 . 11.5 9 .s 0 0