汉语句子框架语义结构分析技术研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
汉语句子框架语义结构分析技术研究
【摘要】:语义分析是自然语言处理领域中最重要也是最为困难的问题。如何对句子进行有效的、深入的自动语义分析,一直是国内外学者关注的主要目标之一。汉语句子的框架语义结构分析技术是以框架语义学为理论基础,借助山西大学的汉语框架网语义资源,针对汉语句子语义结构,展开了汉语句子框架语义结构建模、目标词识别、框架排歧和框架语义角色标注等核心技术研究,同时,对基于汉语框架语义分析的旅游问答系统进行了应用研究。主要研究成果如下:(1)针对汉语句子语义结构,系统地进行了汉语句子框架语义结构分析,提出了汉语框架语义依存图模型,包括单框架语义依存图、完全框架语义依存图、核心框架语义依存图,为汉语句子语义结构表示提供了新的方法。(2)针对目标词识别问题,提出了基于相似度计算、最大熵模型的未登录目标词识别方法,充分考虑了词义信息、依存特征及上下文语境,有效地解决了未登录目标词的识别,为实现准确的框架排歧提供了保障。(3)针对框架排歧问题,提出了基于T-CRF的框架排歧方法,通过加入依存特征中长距离的依存关系提升了汉语框架排歧的性能,同时与基于SVM和最大熵模型排歧方法进行了对比实验,验证了基于T-CRF框架排歧的有效性。(4)针对框架语义角色标注问题,在总结对比现有主流算法的基础上,提出了基于T-CRF模型的框架语义角色标注方法,并通过加入依存特征提升了标注准确率。其次,基于框架语义角色标注进行了句子相似度计算,从框架语义的角度出发,提出了基于
多框架及其重要度的句子语义相似度计算方法,实验结果验证了框架语义角色对句子语义相似度计算的有效性。(5)针对汉语框架网语义资源与语义分析方法的应用研究,设计并实现了面向山西旅游领域的问答实验原型系统。系统以旅游景点五台山为例,针对每个景点的简介文本进行了全文框架语义角色标注。系统包括问题输入、问句分析及答案抽取,验证了基于框架语义分析进行问答系统应用的可行性。本文的研究成果进一步丰富了汉语句子框架语义结构分析理论与方法,为实现汉语句子深层语义分析提供了新的途径,为自然语言处理领域基于语义分析的应用系统提供了一种新的技术支撑。【关键词】:汉语框架网框架语义依存图语义结构未登录目标词框架排歧语义角色标注
【学位授予单位】:山西大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP391.1
【目录】:中文摘要9-11ABSTRACT11-13第一章绪论13-231.1研究背景及意义13-141.2研究现状及分析14-191.3本文的主要研究内容、创新点与组织结构19-23第二章汉语框架网平台23-332.1框架语义学23-242.2汉语框架网工程24-272.2.1相关概念24-262.2.2CFN语义资
源内容描述26-272.3平台资源数据表示27-302.4汉语框架网平台网络服务30-312.5本章小结31-33第三章汉语句子框架语义结构建模33-393.1引言33-343.2单框架语义依存图34-353.3完全框架语义依存图35-363.4核心框架语义依存图36-373.5框架语义依存图抽取的关键技术37-383.6本章小结38-39第四章目标词识别39-494.1引言39-404.2基于相似度计算的未登录目标词识别40-414.3基于最大熵模型的未登录目标词识别41-464.3.1最大熵模型41-434.3.2最大熵模型特征模板设计43-444.3.3未登录目标词识别流程44-464.4实验结果与分析46-484.5本章小结48-49第五章基于T-CRF模型的汉语框架排歧49-615.1引言495.2汉语框架排歧方法的流程49-515.3T-CRF模型51-525.4T-CRF模型的特征选择及实验语料52-535.5实验结果与分析53-545.6相关模型的框架排歧方法54-595.6.1SVM模型及特征选择54-565.6.2最大熵模型及特征选择56-585.6.3实验结果与分析58-595.7本章小结59-61第六章基于T-CRF模型的汉语框架语义角色标注61-776.1引言61-626.2依存特征选取及标注语料62-636.3框架语义角色标注实验结果及分析63-646.4基于框架语义角色标注的句子语义相似度计算64-746.5本章小结74-77第七章基于汉语框架语义分析的山西旅游自动问答系统77-837.1旅游信息本体的构建777.2系统构架77-787.3基于汉语框架网的问句语义分析78-807.4问句语义的抽取807.5实验结果与分析80-827.6本章小结82-83结论与展望83-85参考文献85-95攻读博士学位期间研究成果95-97致谢97-99个人简况及联系方式99-103 本论文购买请联系页眉网站。