基于信息处理的藏文框架语义关系研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Se , 1 p 20 0
基于信息处理 的藏文框架语 义关系研究
多杰 卓玛
( 西北 民族 大学 中国民族信 息技 术研 究院, 肃 兰 州 7 0 3 ) 甘 3 0 0
[ 摘
要 ]藏 文 框 架语 义 知 识 语 义 关 系分 析 的 关键 就 是 建 立 句子 中各 词 语 之 间的 语 义 关 联 关 系。 实现 各 框 架 间 知 识
一
1 — 6
短语 语义 结构 :
’ 。 ’ 司 _ 日叩i’ ’ +q q 卜一 1 1 占 j 司. 这 个词 语可 以激 活一 个语境 , 司
该语 包括:司 气I ‘ ‘ 1萄 ’ ’ ’ ‘ ’ 。 ‘ ’ 哥 气 旨 1 司 ‘ 境 蓠 。 。 。 ‘ 司 茂 气 q 每 l琶 寻 ‘舌‘ ’ 琶 萝5 气 『 < 日 暂 萝 。 日 茂 翻1i 。 蓠 日 ’ ‘ 5 ’ 昌 司 ‘ 。 日 琶 。、 R 日‘ 。 日 日 1 ‘ 甏 I 1 ’ ’ 司 1 1 1 ’ 琶 ’ ’ ’ 旨 日 写I 等信 语 息. 境是由萄 。日l体 耄 。 l 琶。对 罄 I 等多个方 qI 主 5 『 地点 1象 昌 c i 时间 面来定义的. 前面
【 键 词 】藏 文 ; 榘 ; 识 ; 关 框 知 分析 【 中图 分 类 号 ]T 3 11 H 1 P 9 .i07 [ 献 标 识 码 ]A 文 [ 章 编 号 ]10 —2 0 (0 00 —0 1 一O 文 0 9 12 2 1 )1 0 6 4
O 引言 语言信 息处 理的研 究 中, 国外 , 在 早在 2 0世纪 7 代 末美 国语言学 家 Fl r 从计 算机 科学 中引 0年 imoe l
第3 1卷总 第7 7期
2 010 年 3 月
西 北 民 族 大 学 学 报( 自然科 学版 )
Vo . 1 No 1 1 3 , .
Ju a o N r wsU i rt f aoa tsNaua S i c ) or l f o h e n e i r t nli ( trl c n e n t t v sy o N i i e e
”“ ‘ 闽 、商 ’
“ ’
。 5 日 日 是组成这个句子 的一些词语和短语 . { 1” 其中, 句子 中的“ 1 1 l’ 日叩i 。 ’ 5
司 f q’ 有学 习各 种文 化知识 的意 思 . 并含 并且 , 语 “ 司 ’ 目标词 , 们从 这 个 目标 词 出发 , 词 日 ” 为 我 通过 对
的 共 享 , 取 更 多的 信 息 . 章 引 出 了藏 文 框 架 语 义 知 识 、 架 及 框 架 元 素 并结 合 实 例 分 析 了以藏 语 句子 为 主 , 成 该 获 文 框 组
句子 的词 语 或 短 语 间 的语 义 关 系及 框 架 形 式表 示 该 句子 的语 义 为结 构 化 .
该短 语进行 分析 , 得到 了以 日标词为 中心的词 语或短 浯的语 义 关系形 式化结 构 .
短语 : 司 1 剖 司 1 ’ 司 短语语义形式 : ’ ‘ l 司 —— ’ +司 一 —哥 q ’ +司 司 +舌 q 目 1 — 旨 ‘ 气+司 吾+
入“ 架” 框 的概念 , 并把 它应用 到 19 9 7年在美 国加 州大 学 的 伯克 利 分院 由 Fl r imoe主持 的 项 目“ 于 语 l 基 料库 的计 算词典 编篡工 程 ” 中, 2 0 … 到 0 9年 5月为 止 , 收录 了英 语的 1 0 共 16 0个词元 , 构建 了 英语 的 共
9 0个框架 , 中 6 8 0个 词 完 成 了 例 举 标 注 , 标 注 了 1 6 其 0 共 5万 的 框 架 语 义 信 息【 . 个 语 义 框 架 2 这 】 ( e ni F a ) S ma t rme 的构 建, 人 们提 供 了研 究英 语词 汇语义 及句 法结构 意义 的方法 . 国内 ,0 6年 由 c 为 在 20 山西大学 的刘开 瑛 、 由丽 萍 等人创 建了一 个 以有限词 语集合 为描 述对 象的汉 语框架 语义 知识库 , 共对汉
部 成分 间的关系 .
1 藏 文 框 架 语 义 知 识
在藏 语言研 究 中, 组成 藏语 句 子 的词 语及 短 语 在 句子 中 占有 重 要 的地 位 .比如 : 句 “ ’ 例 商
< ‘ ’习 气 r ’ . q 。
、
‘气 旨 。司 ’日 。 列 。<日 目’ “ 气q 。 ” “ a ‘ 磊 。 ’ 1 1 r 司 中, 吾司 、 1 i ’
— —
+ 目
【 收稿 日期]2 1 2—1 00—0 2
[ 金 项 目 】国家 语委 科 研 基 金 项 目( 目号 : l 5 9 基 项 MZ l —6 )
[ 作者简介 】多杰 卓玛 (9 0 )女( 17 一 , 藏族 )青海贵德人 , 师, , 讲 硕士, 主要从事藏文信息处理方面的研究
语 170个词元 ( 个义下 的一个 词 ) 建 了 10个 框架 , 及 动 词词 元 12个、 容 词词 元 10个 、 6 一 构 3 涉 4 形 4 事 件 名词词 元 12个 , 注 82 0条句子 J 到 目前位 置 , 9 标 0 . 藏语 在这 个 领域 的研 究 可以 称得 上是 一 块未 开 发 和挖掘 的处女 地 . 了加快藏文 信 息处 理 的进 程 , 文框 架 语义 知 识 的研 究和 建 设 也是 迫 在眉 睫 . 为 藏 因此 , 本文 是对藏 文 框架 语义知识 的语义 关 系这一 角度 出发 , 逐一分析 并揭 示组成 语义 的词语 及短语 内