自然语言信息系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自然语言信息系统
计算机术语
目录
01 简介
03 自然语言理解
02 自然语言处理 04 信息系统
目录
05 功能
07 汉字信息处理系统
06 结构
自然语言是人们日常使用的口头语言和书面语言。相对于计算机应用的人工语言(程序设计语言、机器语言、 受控检索语言等)而言。自然语言信息系统是对自然语言进行处理和理解的系统。自然语言信息系统的主要功能是 机器对人们输入的自然语言进行处理和理解,并返回响应的结果。
功能
信息系统的五个基本功能:输入、存储、处理、输出和控制。 输入功能:信息系统的输入功能决定于系统所要达到的目的及系统的能力和信息环境的许可。 存储功能:存储功能指的是系统存储各种信息资料和数据的能力。 处理功能:基于数据仓库技术的联机分析处理(OLAP)和数据挖掘(DM)技术。 输出功能:信息系统的各种功能都是为了保证最终实现最佳的输出功能。 控制功能:对构成系统的各种信息处理设备进行控制和管理,对整个信息加工、处理、传输、输出等环节通 过各种程序进行控制。
现代NLP算法是基于机器学习,特别是统计机器学习。机器学习范式是不同于一般之前的尝试语言处理。语 言处理任务的实现,通常涉及直接用手的大套规则编码。
许多不同类的机器学习算法已应用于自然语言处理任务。这些算法的输入是一大组从输入数据生成的“特 征”。一些最早使用的算法,如决策树,产生硬的if-then规则类似于手写的规则,是再普通的系统体系。然而, 越来越多的研究集中于统计模型,这使得基于附加实数值的权重,每个输入要素柔软,概率的决策。此类模型具 有能够表达许多不同的可能的答案,而不是只有一个相对的确定性,产生更可靠的结果时,这种模型被包括作为 较大系统的一个组成部分的优点。
汉字输出设备有显示器和打印机等。一般的字符显示器在软件的支持下,都可把汉字点阵显示出来;打印机一 般采用针式打印机,16针、24针、32针的打印机,采用点阵印刷方式,打印出汉字点阵,字形都比较好看;也有 采用激光打印机的,速度更快些。无论是显示或打印输出,都是在软件支持下,把汉字点阵送到输出设备上,驱 动输出点阵组成汉字的。
简介
自然语言信息系统是对自然语言进行处理和理解的系统,是人工智能是计算机科学领域与人工智能领域中的 一个重要方向。自然语言信息系统中最重要的两个技术是自然语言处理和自然语言理解。
自然语言处理
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语 言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这 一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的,但又有重要的区别。 自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的 软件系统。因而它是计算机科学的一部分。
自然语言理解是一门新兴的边缘学科,内容涉及语言学、心理学、逻辑学、声学、数学和计算机科学,而以 语言学为基础。自然语言理解的研究,综合应用了现代语音学、音系学语法学、语义学、语用学的知识,同时也 向现代语言学提出了一系列的问题和要求。本学科需要解决的中心问题是:语言究竟是怎样组织起来传输信息的? 人又是怎样从一连串的语言符号中获取信息的?
汉字的输入设备决定于系统采用的汉字输入方法。汉字的输入方法很多,主要有以下几种:(1)把汉字分类 定义在键盘的各个键上,一般是一个键上定义4个汉字,先按某个功能键,再按某个键,便输入某个汉字。因为汉 字很多,这样汉字输入的键盘就很大,叫大键盘输入方法。(当然有的专用系统,用的汉字少,也有用小键盘的)。 (2)按照某种计算机汉字编码法,用标准键盘便可输入汉字。汉字编码方法很多,全国有几百种,现在用得较多 的有:区位码输入法、拼音输入法、笔形编码法、五笔输入法、联想输入法等。(3)把汉字的偏旁部首定义在键 盘的各个键上,按键即输入用偏旁部首组成的汉字。不管哪一种输入方法,都要有软件支持,都是输入一个代码, 然后经过程序处理,存入计算机一个汉字机内代码。
4应用表现层是通过人机交互等方式,将业务逻辑和资源紧密结合在一起,并以多媒体等丰富的形式向用户展 现信息处理的结果 。
汉字信息处理系统
指能处理汉字的计算机系统,由硬件和软件两部分组成,能输入输出汉字及进行汉字处理。硬件除有一般的 计算机设备外,还应有汉字输入设备,汉字输出设备以及汉字字库或汉字发生器等。软件主要有汉字处理程序(对 汉字的输入、检索、加工及输出格式等进行处理的程序)、汉字库调用程序、汉字文件编辑程序和其他有关的应用 程序等。
自然语言处理研究逐渐从词汇语义成分的语义转移,进一步的,叙事的理解。然而人类水平的自然语言处理, 是一个人工智能完全问题。它是相当于解决中央的人工智能问题使计算机和人一样聪明,或强大的AI。
自然语言理解
自然语言理解(Natural Language Understanding )俗称人机对话。人工智能的分支学科。研究用电子计 算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然 语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信 息的加工处理。这在当前新技术革命的浪潮中占有十分重要的地位。研制第 5代计算机的主要目标之一,就是要 使计算机具有理解和运用自然语言的功能。
结构
ቤተ መጻሕፍቲ ባይዱ
1基础设施层由支持计算机信息系统运行的硬件、系统软件和络组成。
2资源管理层包括各类结构化、半结构化和非结构化的数据信息,以及实现信息采集、存储、传输、存取和管 理的各种资源管理系统,主要有数据库管理系统、目录服务系统、内容管理系统等。
3业务逻辑层由实现各种业务功能、流程、规则、策略等应用业务的一组信息处理代码构成。
感谢观看
这一领域的研究将涉及自然语言,即人们日常使用的语言,包括中文、英文、俄文、日文、德文、法文等等, 所以它与语言学的研究有着密切的,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制 能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。
信息系统
信息系统(Information system)是由计算机硬件、络和通讯设备、计算机软件、信息资源、信息用户和 规章制度组成的以处理信息流为目的的人机一体化系统。
相关文档
最新文档