基于规则的哈萨克语基本名词短语识别研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2 7卷 第 1 2期
2l 0 0年 1 2月
计 算 机 应 用 研 究
Ap l a i n Re e r h o mp tr p i t s a c fCo u e s c o
Vo | 7 No 1 l2 . 2 De . 2 0 c 01
基 于规 则 的 哈萨 克 语 基 本 名 词 短 语 识 别研 究
0 3条哈语基本名词短语 的短语库 , 1 为开发 具有语法功 能的 自 动校对 系统 , 完成哈语短语 、 子相似度 计算等 应用 系统 提供 句 重要信息源 。
重要任务之 一 , 自然语言研 究领域 越来越 受到重 视 , 在 基本名
词短语 的识别与分析对 机器 翻译 、 息检索 、 本处理 和句法 信 文 分 析均具有 重要作 用。 目前 , 随着 哈 萨克语 ( 简称 哈语 ) 息 信
Ke o d y w r s: c r us o p ;ba i un ph a e;Ka a sc no r s z kh;p r s tucu e; r ls h a e sr t r u e
近 年来 , 本 名 词 短 语 识 别 作 为 自然 语 言 浅 层 句 法 分 析 的 基
1 短 语 是 由语 义 上 能 够 搭 配 的 两 个 或 两 个 以
本 名词短 语 自动识别 系统 , 实现 了对 3 O万词级 哈 萨克语语 料库 的基 本名词 短语 标 注。 实验 结果表 明, 方 法可 该
行 。 别精确 率达 到 8 . % 。 识 O8
关键 词 :语 料库 ; 本 名词短语 ; 萨克语 ; 基 哈 短语 结 构 ; 则 规 中图分类 号 :T 3 1 P 9 文献标 志码 :A 文章编 号 :1 0 —6 5 2 1 ) 2 4 1 一 3 0 1 3 9 ( 0 0 1 — 5 1O
Ab t a t T e ams a e ie t c t n o z k a i o n p r s ,u i g t emeh d b s d o h u e n z k a i s r c : h i t h d n i ai f t i f o Ka a h b sc n u h a e sn h t o a e n t e r l sa d Ka a h b sc n u h a e p r o -p e h tg i fr t n a d t e a d t n lc mp n n o f u ai n i fr t n , trig fo t e b sc o n p r s a t fs e c a n omai n h d i o a o o e t c n g r t no ma i — o i i o o sat r m h a i n n u h a e s u t r r mma d l sa l h d a b scn u h a er l e , e i n d a tmai e t c t n s se o a o n p r s t cu e g a r r mo e ,e t bi e a i o n p r s u es t d sg e u o t i ni ai y tm fK — s cd i f o z k ih c u d c mp ee tg i g t eb s o n p rs f 0 0 o d o p sKa a h a h wh c o l o lt a gn a i n u h a eo 0 0 0 w r sc r u z k .E p r n a e u t s o t a e h c 3 x ei me tlr s l h w tt s h h meh d i e s l .a d t e p e iin i 8 8 . t o sf a i e n h r cso s 0. % b
d i1 .9 9 ji n 10 —6 5 2 1 . 2 0 3 o :0 3 6 /.s . 0 13 9 . 0 0 1 . 3 s
Ka a h b sc n u h a e r c g i o a e n r ls z k a i o n p r s e o n t n b s d o u e i
SUN Ruin — a,GULI A ・ tnb k L Ale e
( oeeo fr ainSi c E gneig Xnin n e i ,Uu q 8 04 ,C ia C lg I om t c ne& n i r , i ag U ir t rm i 3 0 6 hn ) l fn o e e n j v sy
处 理研究 的进展 , 对哈语语料 库标 注加工 的研究 , 已基本 完成 了词处理 阶段上 的标 注 , 而对哈语短语级标注方法 的研究还未 开始 , 这使得 建立 大规模 实用 的哈语熟 语料 库 的 目标 很难 实 现, 对哈语标 注语 料库在信 息处理 中的应用成为限制 。现阶段 系统研究短语 内部结 构特 征 , 完成 对 哈语语 料库 短语 级 的标
孙瑞娜 , 古丽拉 ・ 阿东别 克
( 疆 大 学 信 息科 学与 工程 学院 ,乌鲁 木 齐 8 0 4 ) 新 30 6 摘 要 :以哈 萨克语基 本 名词短 语识 别为 目标 , 用基 于规 则 的方法 , 采 从基 本名 词短 语结 构语 法模 型 出发 , 用 利
哈 萨克语 基本 名词短 语 的词性标 记信 息及 构形 附加成 分信 息 , 立 了基 本 名词 短语 规 则 集 , 计 了哈 萨克语 基 建 设
2l 0 0年 1 2月
计 算 机 应 用 研 究
Ap l a i n Re e r h o mp tr p i t s a c fCo u e s c o
Vo | 7 No 1 l2 . 2 De . 2 0 c 01
基 于规 则 的 哈萨 克 语 基 本 名 词 短 语 识 别研 究
0 3条哈语基本名词短语 的短语库 , 1 为开发 具有语法功 能的 自 动校对 系统 , 完成哈语短语 、 子相似度 计算等 应用 系统 提供 句 重要信息源 。
重要任务之 一 , 自然语言研 究领域 越来越 受到重 视 , 在 基本名
词短语 的识别与分析对 机器 翻译 、 息检索 、 本处理 和句法 信 文 分 析均具有 重要作 用。 目前 , 随着 哈 萨克语 ( 简称 哈语 ) 息 信
Ke o d y w r s: c r us o p ;ba i un ph a e;Ka a sc no r s z kh;p r s tucu e; r ls h a e sr t r u e
近 年来 , 本 名 词 短 语 识 别 作 为 自然 语 言 浅 层 句 法 分 析 的 基
1 短 语 是 由语 义 上 能 够 搭 配 的 两 个 或 两 个 以
本 名词短 语 自动识别 系统 , 实现 了对 3 O万词级 哈 萨克语语 料库 的基 本名词 短语 标 注。 实验 结果表 明, 方 法可 该
行 。 别精确 率达 到 8 . % 。 识 O8
关键 词 :语 料库 ; 本 名词短语 ; 萨克语 ; 基 哈 短语 结 构 ; 则 规 中图分类 号 :T 3 1 P 9 文献标 志码 :A 文章编 号 :1 0 —6 5 2 1 ) 2 4 1 一 3 0 1 3 9 ( 0 0 1 — 5 1O
Ab t a t T e ams a e ie t c t n o z k a i o n p r s ,u i g t emeh d b s d o h u e n z k a i s r c : h i t h d n i ai f t i f o Ka a h b sc n u h a e sn h t o a e n t e r l sa d Ka a h b sc n u h a e p r o -p e h tg i fr t n a d t e a d t n lc mp n n o f u ai n i fr t n , trig fo t e b sc o n p r s a t fs e c a n omai n h d i o a o o e t c n g r t no ma i — o i i o o sat r m h a i n n u h a e s u t r r mma d l sa l h d a b scn u h a er l e , e i n d a tmai e t c t n s se o a o n p r s t cu e g a r r mo e ,e t bi e a i o n p r s u es t d sg e u o t i ni ai y tm fK — s cd i f o z k ih c u d c mp ee tg i g t eb s o n p rs f 0 0 o d o p sKa a h a h wh c o l o lt a gn a i n u h a eo 0 0 0 w r sc r u z k .E p r n a e u t s o t a e h c 3 x ei me tlr s l h w tt s h h meh d i e s l .a d t e p e iin i 8 8 . t o sf a i e n h r cso s 0. % b
d i1 .9 9 ji n 10 —6 5 2 1 . 2 0 3 o :0 3 6 /.s . 0 13 9 . 0 0 1 . 3 s
Ka a h b sc n u h a e r c g i o a e n r ls z k a i o n p r s e o n t n b s d o u e i
SUN Ruin — a,GULI A ・ tnb k L Ale e
( oeeo fr ainSi c E gneig Xnin n e i ,Uu q 8 04 ,C ia C lg I om t c ne& n i r , i ag U ir t rm i 3 0 6 hn ) l fn o e e n j v sy
处 理研究 的进展 , 对哈语语料 库标 注加工 的研究 , 已基本 完成 了词处理 阶段上 的标 注 , 而对哈语短语级标注方法 的研究还未 开始 , 这使得 建立 大规模 实用 的哈语熟 语料 库 的 目标 很难 实 现, 对哈语标 注语 料库在信 息处理 中的应用成为限制 。现阶段 系统研究短语 内部结 构特 征 , 完成 对 哈语语 料库 短语 级 的标
孙瑞娜 , 古丽拉 ・ 阿东别 克
( 疆 大 学 信 息科 学与 工程 学院 ,乌鲁 木 齐 8 0 4 ) 新 30 6 摘 要 :以哈 萨克语基 本 名词短 语识 别为 目标 , 用基 于规 则 的方法 , 采 从基 本名 词短 语结 构语 法模 型 出发 , 用 利
哈 萨克语 基本 名词短 语 的词性标 记信 息及 构形 附加成 分信 息 , 立 了基 本 名词 短语 规 则 集 , 计 了哈 萨克语 基 建 设