蒙古语WordNet多义词管理功能

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

内蒙古师范大学计算机与信息工程学院

毕业论文

题目:蒙古语WordNet多义词管理功能

姓名:德力和

学号:20092102769

指导老师:哈斯

目录

1 WordNet的介绍 (1)

1.1 WordNet多义词数据库的介绍 (1)

2 JSP技术简介 (2)

2.1 JSP技术的涉及 (3)

2.1.1 JDK概述 (3)

2.1.2 Tomcat服务器概述 (4)

3 具体实现方法 (4)

3.1 遇到的困难 (4)

3.2 连接数据库的方法 (4)

3.3 整体设计组成 (5)

3.3.1 设计组成结构图 (5)

3.3.3 查询功能 (7)

3.3.4 编辑修改功能 (8)

蒙古语WordNet多义词管理功能

计算机与信息工程学院2009级师范蒙班德力和20092102769

指导教师哈斯副教授

摘要蒙古语WordNet多义词管理功能是用JSP技术开发的一则管理功能。包括对多义词数据库的查询、添加、修改等等。JSP技术是基于整个Java体系的Web开发技术。利用这一技术可以建立安全、夸平台的先进动态网站。

关键词多义词管理;JSP技术;数据库

1 WordNet的介绍

WordNet就是一种传统的词典信息与现代计算机技术以及心理语言学的研

究成果有效结合的一个产物。在1985年,Princeton大学的一组心理词汇学家和语言学家的开始研究开发的一部词典数据库,这就是WordNet。他们最开始的想法只是打算研发一个能与传统的在线词典紧密结合的辅助工具,但是随着词典库的不断开发与研究工作的进展,WordNet的组织结构以及它所追求的目标都与先前的发生了变化。

1.1 WordNet多义词数据库的介绍

在蒙古文中多义词是普遍存在的。多义词的问题是蒙语文信息处理中词义分析、语句分析阶段中重要的研究对象。而且有关蒙古文多义词的研究很早就有了。把词语的多重意思让计算机能够识别是我们蒙古文信息处理技术中的具体工作。也就说词汇输入系统的研发,机器翻译,语料库的建设等等是整个工程项目中语

法或语义分析研究的重点所在。

多义词数据库有多个分段,其中包括数据库的ID、词语的GALIG、词语的UGES UN AYIMAG、词语的TAYILBVRI、synset_id、词语的HITAD等信息。其中,ID是数据库中想要查找该词的整个信息的物理地址。GALIG也是我们数据库中要查找该词的一个重要信息,通常我们在查询的时候就是用GALIG去查找的。UGES UN AYIMAG是该词的性质,例如,AYIL这个词是名词,等等。

如图1所示:

图1

2 JSP技术简介

蒙古语WordNet多义词管理功能是用JSP技术开发的一则管理功能。JSP

(Java Server Pages)是由Sun Microsystems公司倡导、许多公司参与一起建立的一种动态网页技术标准。JSP技术有点类似ASP技术,它是在传统的网页HTML 文件(*.htm,*.html)中插入Java程序段(Scriptlet)和JSP标记(tag),从而形成JSP文件(*.jsp)。用JSP开发的Web应用是跨平台的,既能在Linux下运行,也能在其他操作系统上运行。

JSP全名为java server page,其根本是一个简化的Servlet设计,他实现了Html语法中的java扩张(以 <%, %>形式)。JSP与Servlet一样,是在服务器端执行的,通常返回给客户端的就是一个HTML文本,因此客户端只要有浏览器就能浏览。Web服务器在遇到访问JSP网页的请求时,首先执行其中的程序段,然后将执行结果连同JSP文件中的HTML代码一起返回给客户端。插入的Java

程序段可以操作数据库、重新定向网页等,以实现建立动态网页所需要的功能。

JSP页面由HTML代码和嵌入其中的Java代码所组成。服务器在页面被客户端请求以后对这些Java代码进行处理,然后将生成的HTML页面返回给客户端的浏览器。Java Servlet是JSP的技术基础,而且大型的Web应用程序的开发需要Java Servlet和JSP配合才能完成。JSP具备了Java技术的简单易用,完全的面向对象,具有平台无关性且安全可靠,主要面向因特网的所有特点。

2.1 JSP技术的涉及

JSP是一种执行于服务器端的动态网页开发技术,它基于Java技术,所以我们首先要安装的就是Java开发软件包JDK。执行JSP时需要在Web服务器上架设一个编译JSP网页的引擎。配置JSP环境可以有多种途径,但主要工作就是安装和配置Web服务器和JSP引擎。

我们所用到的Web服务器是Tomcat。除了安装着两个必备的开发软件外,我们还要熟悉MyEclipse开发工具。熟悉MyEclipse中有最基础的,在MyEclipse 中部署Tomcat,这使我们更好的开发Web项目以及一些实际操作案例。

2.1.1 JDK概述

JDK(Java Development Kit)是Sun Microsystems公司针对Java开发的

产品。自从Java推出以来,JDK已经成为使用最广泛的Java SDK。

JDK是整个Java的核心,包括Java运行的环境,各类Java工具和Java基础的类库。

2.1.2 Tomcat服务器概述

Tomcat很受广大程序员的喜爱,因为它运行时占用的系统资源小,扩展性好,支持负载平衡与邮件服务等开发应用系统常用的功能。

Tomcat是一个小型的轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试JSP程序的首选。对于一个初学者来说,可以这样认为,当在一台机器上配置好Apache服务器后,可利用它相应对HTML页面的访问请求。

当正确配置Tomcat后,Apache为HTML页面服务,而Tomcat实际上运行JSP 页面和Servelt。

3 具体实现方法

3.1 遇到的困难

起初对Java语言的认识以及了解学习,初步领略了Java语言的奥秘。学习了解Java的同时也学习了My Eclipse的使用。通过一段时间的学习,初步了解了在My Eclipse中开发项目的知识。正因为刚开始接触Java语言不久,在做本次毕业设计中遇到了很多不懂得和不会的地方。其中最大的困难就是连接数据库的问题。刚开始在网上查过相关的资料,再后来问过同组的同学。都不行,最后去书店买了相应的图书资料才解决了连接数据库的问题。

3.2 连接数据库的方法

数据库wn_monggol_polysemy是多义词数据库表格。其中包含了多义词的

相关文档
最新文档