计算机处理自然语言的探索
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
甘肃政法学院
本科学年论文(设计)题目计算机处理自然语言的探索
计算机科学学院信息管理与信息系统专业
2010级信管班
学号: 201081020142
姓名:____ 杨雨龙______
指导教师:______魏___芸_______
成绩:___________________
完成时间:_________年 _______月
计算机处理自然语言的探索
摘要:自然语言处理是研究人与计算机之间语言交互的一门交叉型学科,也称为计算机语言学。它的研究主要是研究人与计算机之间用自然语言进行有效通信的各种理论与方法。它涉及了数学、语言学、逻辑学、和心理学等诸多研究领域,是一门非常复杂的学科。所以本文主要通过描述性语言来简单介绍一下计算机处理自然语言的发展历史,自然语言处理的基本问题,包括汉语自动分词,汉语文本自动标注,句法分析,语料库处理等,以及在实现语言的人机交互处理时的一些简单技术和自然语言处理在现实生活中的应用以及发展趋势。
关键词:计算机;自然语言;人工智能;人机交互
The Exploration Of Computer Processing Natural Language
Abstract:natural language processing is human and computer language interaction between a door cross type discipline, Its research mainly is used between human and computer natural language effectively all kinds of communication theory and method. It involved mathematics, linguistics, logic, and psychology and so on many research fields, is a very complicated subject. So this paper mainly through the descriptive language to a brief introduction of computer processing natural language development history, The basic problem in natural language processing, including Chinese automatic word segmentation, Chinese text automatic tagging, syntactic analysis, corpus processing, as well as in achieving language interactive processing some simple technology and natural language processing in real life application and development trend.
Key words:Computer; Natural language; Artificial intelligence;
Human-computer interaction
目录
计算机处理自然语言的探索 (1)
第一章引言 (3)
第二章自然语言处理的定义 (4)
1.1自然语言 (4)
1.2 自然语言处理 (5)
第三章自然语言处理研究的历程 (5)
3.1以关键词匹配为主流的早期历史 (5)
3.2 以句法-语义分析为主流的中期历史 (6)
3.3 走向实用化和工程化的近期历史 (7)
第四章自然语言处理的基本技术 (8)
4.1自动文摘技术 (8)
4.1.1基于统计的自动文摘 (8)
4.1.2 理解生成文摘 (8)
4.1.3 基于信息抽取的自动文摘 (9)
4.2文本的自动校对技术 (9)
4.2.1 英文文本中的错误发现与纠正方法 (9)
4.2.2上下文相关错误的纠错方法 (10)
4.3 人机交互技术 (10)
第五章自然语言处理的应用、意义及发展趋势 (11)
5.1自然语言处理的应用 (11)
5.2 自然语言处理的意义 (12)
5.3 自然语言处理的发展新趋势 (12)
第六章总结 (13)
参考文献 (14)
第一章引言
自然语言处理是研究如何利用计算机来理解和处理自然语言的,即把计算机作为语言的研究工具,来实现人机间自然语言的通信,这就要求计算机不仅要能
理解自然语言文本的意义,也能以自然语言文本来表达给定的意图,思想等。
如今是一个在线信息,电子通信和互联网流行的年代,我们不难感受到日常生活中所能触及到的这样或那样的大量的文本信息,包括商业部门、政府机构以及个人所面对的各种各样的工作,所以每天都有大量的信息在遍布世界各地的互联网上产生、发布、交换、存储和获的,然而如何从这些大量的文本中挖掘潜在的,有使用价值的信息,任然是一个难题。
自然语言处理是一项十分庞杂的工程,它是自然科学与社会科学交叉的学科,特别是计算机科学、语言学、逻辑学和心理学的交叉科学。自然语言处理的目的是实现计算机语言信息的自动分析和解释,他立足于实验、理论和计算三大支柱,通过对人脑以及语言认识的实现途径进行模拟研究,建立起多层次网络处理模型来阐明人脑语言信息处理系统,以期取得突破性进展。它的研究具有突破性进展。它的研究具有很强的生命力,是当代科学的生长点,这不仅对信息科学,而且是对人是语言学,心理学以及国民对经济和社会的发展都会起到推动作用。因此,计算机对自然语言处理的究也成了一个国家国民生产好坏的标志之一。
然而自然与语言处理的研究却不可能一步就达到对大规模真是文本的完善处理,必须逐层逐步的加以分析和解决,各层次的研究既相互独立又有着十分密切的联系,对每一层次的研究都应考虑更高层次的研究需要。
第二章自然语言处理的定义
1.1自然语言
语言是人么类区别于其他动物的本质特征,是人思维的载体。是指生物同类之间由于沟通需要而制定的具有统一编码解码标准的声音讯号。是人们交流思想的媒体,它必然会对政治、经济和社会、科技乃至文化本身产生影响。语言是人们生活中不可缺少的组成部分。
自然语言通常是指一种自然地随文化演化的语言。是人类语言集体的本族语,如汉语、英语、德语等,自然语言是相对人造语言而言的,人造语是指世界语或计算机的各种程序设计语言。
语言这种文化现象是不断发展的,其现今的空间分布也是过去扩散、变化和发展的结果。根据其语音、语法和词汇等方面特征的共同之处与起源关系,把世界上的语言分成语系。每个语系包括有数量不等的语种,这些语系与语种在地域上都有一定的分布区,很多文化特征都与此有密切的关系。人类的多种智能都与语言有着密切的关系,人类大多数只是