基于统计方法的蒙古语依存句法分析模型

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Ａｂｓｒｃｔａｔ：Ｍｏｎｇｏｉｎｌｎｇｕｇｅｉｆｍａｉｎｐｒｃｓｉｇａｓｏｐｌｔｄｈｅｂａｉｔｓｏｄｐｒｅｓｎｇｓａｌａａａｎｏｒｔｏｏｅｓｎｈｃｍｅｅｔｓｃａｋｏｆｗｒｏｃｓｉｔｇｅ，ａｎｄ
ｔｅｌｂｌｄａｎｔｔｎｓｏｅａｄｔｅｈａｒｎｏａｉｎｓｏｅｅｐｃｉｅｙｈａｅｅｎｏａｉｃｒｎｈｅｄｗｏｄａｎｔｔｏｃｒ，ｒｓｅｔｖｌ．ｏ
Ｋｅｒｓ：Ｍｏｎｌａｙｗｏｄｇｏｉｎ；ｄｐｅｄｅｙｇａｍａｅｎｎｃｒｍｒ；ｐａｓｎｇ；ｐｒａｌｔｏｌｒｉｏｂｂｉｉｙｍｄｅ
纵观各种语言以往的句法标注及分析情况不难
１引言
蒙古语文信息处理工作始于２Ｏ世纪８０年代，虽然起步较晚，发展很快。经过３但０余年的努力，语料库、法信息词典等基础性建设初具规模，语编辑
基于统计方法的蒙古语依存句法分析模型
斯・劳格劳，沙宝，如拉华萨
（蒙古大学蒙古学学院，内内蒙古自治区呼和浩特００２）１０１
摘要：蒙古语文信息处理已初步完成字、处理阶段的基本任务，在步入句处理阶段，且在国家自然科学基词正并金的资助下构建了蒙古语依存树库ＭＤＢ。该文以ＭＤＴＴＢ为训练和评测数据，计实现了一种基于词汇依存概设
（ｌｇｆＭｏｇｌｎＳｕｉｓｎｅｏｇｌｉｅｓｔＣｏｌｅｏｎｏｉｔｄｅ，ＩｎｒＭｎｏｉＵｎｖｒｉｅａａｙ，Ｈｕｈｔｈｏ，ＩｎｒＭｏｇｌｔｎｍｏｓＲｅｉｎ００２ｎｅｎｏｉＡｕｏｏｕｇｏ１０１，Ｃｈｎ）ａｉａ
排版系统、办公软件等已实用化，种蒙古文网络资各
源也正在稳步增长。从处理层面上看，步完成了初
发现短语结构语法占据着主流地位，但近年来，存依
语法由于其形式简洁、于标注、于应用等特点受易便到了研究人员的重视＿，１并在英语、语、］汉德语、克捷
ｔ．Ｃｕｒｎｌ。ｔｅｍｏｅａｈｅｅｃｕａｉｓｏ１２，６．２ａｄ９．５ｉｈｎａｅｌｄａｎｔｔｎｓｏｅｙｒｅｔｙｈｄｌｃｉｖｓａｃｒｃｅｆ７．４１４％ｎ３０ｎｔｅｕｌｂｌｎｏａｉｃｒ，ｅｏ
中图分类号：Ｐ９Ｔ３１
文献标识码：Ａ
ＭｏｏｉｎＤｅｅｄｎｃｒｉｇＢａｅｎＳａｉｔｃｌＭｅｈｄｎｇｌａｐｎｅｙＰａｓｎｓｄｏｔｔｓｉａｔｏｓ
ＳＬｏｌＨＵＡｈａａＳｒｌ．ｇｏ，Ｓｂｏ，ａｕａ
ｎｗｓｅｔｒｇｔｅｓａｅｏｅｔｎｅｐｏｅｓｎ．ＵｎｅｈｕｐｒｆＮａｉｎｌＮａｕａｃｅｃｕｄｔｎｗｅｏｉｎｅｉｈｔｇｆｓｎｅｃｒｃｓｉｇｎｄｒｔｅｓｐｏｔｏｔａｔｒｌＳｉｎｅＦｏｎａｉ，ｏｏｈｖｏｓｒｃｅｈｏｇｌｎＤｅｅｄｎｙＴｒｅａｋ（ＤＴＢ）ｎｔｉａｅ，ｗｅｕｅＭＤＴＢａｒｉｉｇａｄｅａｕａｅｃｎｔｕｔｄｔｅＭｎｏｉｐｎｅｃｅｂｎａＭ．Ｉｈｓｐｐｒｓｓｔａｎｎｎｖｌ — ａｉｎｄｔｔａａ．ｄｓｇｉｇａｄｉｌｍｅｔｇａＭｏｇｌｎｄｐｎｅｃａｓｎｄｌａｅｎｌｘｃｌｅｅｄｎｒｂｂｌｏｅｉｎｎｎｍｐｅｎｉｎｏｉｅｅｄｎｙｐｒｉｇｍｏｅｓｄｏｅｉａｄｐｎｅｔｏａｉ — ｎａｂｐｉ
第２６卷
第３期
中文信息学报
ＪｏＵＲＮＡＬｏＦＣＨＩＮＥＳＮＦＯＲＭＡＴＩＥＩＯＮＲＯＣＥＳＩＰＳＮＧ
Ｖｏ．２Ｉ６，Ｎｏ．３
Ｍａｙ，２２Ｏ１
２１０２年５月
文章编号：１０ —０７２１）３０２ — ６０３０７（０２０ —０７０
率的蒙古语依存句法分析模型。目前，模型的无标记准确率、标记准确率和核心词准确率分剐达到了该有
７．４、１４和９．５。１２６．２３Ｏ
关键词：蒙古文；存语法；法分析；率模型依句概