基于统计方法的蒙古语依存句法分析模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纵 观各 种语 言 以往 的句法标 注 及分 析情 况不 难
1 引 言
蒙 古语 文信 息 处理 工 作 始 于 2 O世 纪 8 0年 代 , 虽 然起 步较 晚 , 发 展很 快 。经过 3 但 0余 年 的努 力 , 语 料库 、 法信 息词 典等 基础 性建 设初 具规 模 , 语 编辑
( l g fM o g l n S u i s n e o g l ie st Co l eo n o i t d e ,I n r M n o i Un v r i e a a y,Hu h t h o, I n rM o g l t n mo sRe i n 0 0 2 n e n o i Au o o u go 1 0 1,Ch n ) a ia
Absr c t a t:M o ngo in l ngu ge i f m a i n pr c s i g as o plt d he ba i t s o d pr e sng s a la a a n or to o e sn h c m e e t sc a k ofw r oc s i t ge, a nd
n w s e t r g t e s a e o e t n e p o e sn . Un e h u p r f Na i n l Na u a ce c u d t n we o i n e i h t g f s n e c r c s ig n d r t e s p o t o t a t r lS in e Fo n a i , o o h v o s r c e h o g l n De e d n y Tr e a k ( DTB) n t i a e ,weu eM DTB a r i i g a d e au a ec n tu t d t eM n o i p n e c e b n a M .I h sp p r s s ta n n n v l — ain d t t a a.d sg ig a d i lme t g a M o g l n d p n e c a sn d l a e n lx c l e e d n r b b l o e i n n n mp e n i n o i e e d n y p r i g mo e s d o e ia d p n e t o a i — n a b p i
t .Cu rn l 。t emo e a he e c u a iso 1 2 ,6 . 2 a d 9 . 5 i h na eld a n tt ns o e y re ty h d l c iv sa c r ce f7 . 4 1 4 % n 3 0 n te u lb l n o ai c r , e o
基 于统 计 方 法 的 蒙 古语 依 存 句 法分 析 模 型
斯 ・劳格 劳 , 沙 宝 , 如拉 华 萨
( 蒙古大学 蒙古学学 院 , 内 内蒙 古 自治 区 呼 和 浩 特 0 0 2 ) 10 1
摘 要 :蒙 古语 文信 息 处 理 已初 步 完成 字 、 处 理 阶 段 的基 本任 务 , 在 步 入 句处 理 阶 段 , 且 在 国 家 自然 科 学 基 词 正 并 金 的 资 助 下 构 建 了 蒙古 语 依 存 树 库 MD B。该 文 以 MD T TB为 训 练 和 评 测 数 据 , 计 实现 了一 种 基 于 词 汇 依 存 概 设
第 2 6卷
第 3 期
中文 信息 学报
J oURNAL oF CH I NES NFORM ATI EI ON ROCES I P S NG
Vo .2 I 6,No .3
Ma y,2 2 O1
21 0 2年 5月
文 章 编 号 :1 0 —0 7 2 1 ) 30 2 — 6 0 30 7 ( 0 2 0 —0 70
排 版系 统 、 办公 软件 等 已实用 化 , 种蒙 古 文 网络资 各
源 也 正 在 稳 步 增 长 。 从 处 理 层 面 上 看 , 步 完 成 了 初
发 现短语 结 构语 法 占据着 主流 地位 , 但近 年来 , 存 依
语 法 由于其 形式 简洁 、 于标注 、 于应 用等 特点 受 易 便 到 了研究 人 员 的重 视 _ , 1 并在 英语 、 语 、 ] 汉 德语 、 克 捷
中 图分 类 号 : P 9 T 31
文 献 标 识 码 :A
M o o i n De e d nc r i g Ba e n S a itc lM e h d ng la p n e y Pa sn s d o t ts ia to s
S Lo l H Байду номын сангаас A ha a S r l . g o, S b o, a ua
率 的 蒙 古语 依 存 句 法 分 析 模 型 。 目前 , 模 型 的 无 标 记 准 确 率 、 标 记 准 确 率 和 核 心 词 准 确 率 分 剐 达 到 了 该 有
7 . 4 、 1 4 和 9 . 5 。 1 2 6 . 2 3 O
关 键 词 :蒙 古文 ; 存 语 法 ; 法 分 析 ; 率模 型 依 句 概
t e lb l d a n t t n s o e a d t e h a r n o a in s o e e p c ie y h a e e n o a i c r n h e d wo d a n t to c r ,r s e tv l . o
K e r s:M on la y wo d go in; d pe de y g a m a e n nc r m r;pa sng;pr a lt o l ri ob biiy m de