一种消除中文分词中交集型歧义的方法

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2 1卷 第 5期 2 1 年 5月 01
计 算 机 技 术 与 发 展
COMP UI R ECHNOI T OGY D AN DEVE1 MENT OP
Vo121 No. . 5 Ma 201 v 1

ห้องสมุดไป่ตู้
种 消 除 中文 分 词 中交 集 型 歧 义 的 方 法
O 引 言
s se . e e p rme tr s l k h o d p r c p e p o r s . y tm Th x e i n e ut ma e te g o a t i l r g e s s i Ke r s Ch n s r e me tt n; t a n o mai n: v ra p n mb g i y wo d : i e e wo d s g n a o mu u li f r t i o o e lp i g a i u t y
Pr d i g i o ucn n Chi s a c i g ne e M t h n
WE o c e g WA G A - ig S i -u , N n I - hn , N i p ,HA X a jn WA G Yo g B n n
( iit fE u ai n Ke a . fI tl g n mp t g & S g a P o e sn M n s y o d c t y L b o ne l e t r o i Co u i n in l r c si g.
高的问题 , 采用 了双层 h s 结 构的 明典机制来 提升分 词 的速 度 , ah 对于匹配 结果 中出现 的交集型歧 义字 段 , 通过 互 信息 的方
法来 消除 , 以提 高分 词精 度 。l对该分 词系 统进 行 实现 。通 过 传 统 的 中文 分词 系 统 的分 词 速度 以及 分 谢效 果 的对 并 比, 发现该 系统 在分 词速 度和精 度上都 有所进 步 , 而取得较 好 的分词效 果。 从
关键词 : 中文分测 ; 互信 息 ; 交集 型歧 义
中图分 类号 : P 1 T 3 文献标识 码 : A 文章 编号 :6 3 6 9 2 1 ) 5 0 6 — 4 1 7 — 2 X( 0 1 0 — 0 0 0
A e ho bo tRe o i g Ov ra pi g Am b g t M t d a u m v n e lp n i uiy
A h i nvrt, ee 20 3 , hn ) n u U iesy H f 30 9 C ia i i
Ab t a t S g n a in a c r c n p e r h wo ma n p fo n n e i d x s o h i e e wo d s g sr c : e me tto c u a y a d s e d a e t e t i e n a c n e e ft e Ch n s r e me t t n s se . c r i g na i y t m Ac o d n o t h u si n o l w p e d p e ii n o e wo d i h r d t n lCh n s r e me tt n, tu e h tu t r it n r f o teq et fs o o s e d a r c s ft r n t e ta i o a i e e wo d s g n a i i s s t e sr c u e dc i a y o n o h i o o d u l—d c e a h me h n s t r n e t e s e d o r e me tt n o b e e k d h s c a im o p o mt p e fwo d s g n i .To i r v h e me tt n a c r c u e t e me o f h a o mp o e t e s g n a i c u a y, s h t d o o h
魏博 诚 , 爱平 , 王 沙先 军 , 王 永
( 安徽 大学 计 算智 能与信 号处理教 育部 重点 实验 室 , 安徽 合肥 2 0 3 ) 3 0 9

要 : 分速度 和精度 足 中文分词 系统的两 个主要性 能指 标 。针对 传统 的中文 分 浏 [ 出脱 的分 词速 度慢 币 分 词精度 不 切 } J ¨
to y tm sa h e e Th ys m si p ov n t e s e d a d a c r c o p r d wi e t d to a i e o d s g e t t n l i n s se i c i v d es t e i m r e i h p e d n c u a y c m a e t t r i n lCh n s w r e m n a i a h h a i e o
t e mu a n o mai n t l n t t e o e lp ig a i u t t n ih a p a e n t ema c i g r s l ,t e Ch n s r e me t- h t lif r t o ei a e h v ra p n mb g i sr g wh c p e d i th n e u t h i e e wo d s g n a u o mi y i r h s
相关文档
最新文档