现代计算机智能识别技术处理自然语言研究的应用与进展
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
李翠霞
( 安顺学院数学与计算机科学系,贵阳 561000)
摘 要 以计算机智能识别技术为核心的基于自然语言处理的应用研究获得了长足的发展。不断获得实际的应用,使得基
于计算机智能识别技术的自然语言处理研究成为语音识别的重点领域。以自然语言处理为对象,通过自然语言处理在文本
及语音智能方面的具体应用为视点,分析说明计算机智能识别技术在自然语言方面的应用。最后,结合当今自然语言领域研
究的现状,总结基于现代计算机智能识别技术的自然语言处理研究进展及其前景。
关键词 智能识别技术 自然语言 应用进展
中图法分类号 TP391. 9;
文献标志码 A
语言,是人类相互之间进行信息交流的主要手 段和媒介,是相互沟通的桥梁。因此各种语言间的 相互理解和 认 同,在 当 今 社 会 全 球 化 的 状 况 下,便 显得尤为重要。自计算机以及计算机技术的发明 以来,科学家和语言研究专家将精力专注于怎样使 得计算机能够理解自然语言的特有含义并进行不 同语言间的准确翻译。可以说,计算机语言处理的 研究,是集 语 言 学、声 学、语 音 学、计 算 机 技 术 和 人 工智能等多 种 领 域 于 一 体 的 一 项 综 合 性 研 究[1—4]。 而且其需 求 前 景 十 分 广 阔,使 得 该 项 研 究 成 为 热 点。在 20 世纪 50 年代,基于自然语言的处理便作 为智 能 识 别 的 一 个 重 点 研 究 分 支[5—10],但 是,限 于 当时的计算机识别技术的局限及自然语言本身的 特性,令该研究徘徊不前,研究成果不多; 随着计算 机技术的快速发展,使得自然语言的处理研究成为 可能并逐渐应用于不同语言间的交流,使得语言在 智能识别技术系统中的应用越来越广泛,但是自然 语言处理由 于 在 其 词 库、意 义、语 义 和 国 家 民 族 的 适用性方面的歧义性和复杂性,给智能识别带来了
2 计算机智能识别技术与自然语言研究的 交叉结合
机器能够识别的编码方式。第二,在对语言的语音 信号的时间序列的正确编码后,这种编码以可阅读 的形式,即 声 学 信 号 的 形 式 来 传 达 语 言 的 信 息 内 容,在这种 情 况 下,以 不 同 编 码 的 语 音 信 号 用 数 十 个有区别 的、离 散 型 的 符 号 来 表 示。 最 后,这 种 符 号的表示通过智能机器的智能认知,辨识出语言的 具体语义和语音。以语言的语法、语义和情景结构 的整体整合下通过智能识别技术的人工智能的具 体设计以类似人类的语音的方式表示出来[34—39]。 2. 2 基于 智 能 识 别 技 术 的 自 然 语 言 处 理 研 究 的
36 期
李翠霞: 现代计算机智能识别技术处理自然语言研究的应用与进展
Leabharlann Baidu
9913
自然语言进行解读翻译,进而对结果进行评估。所 以自然语言的处理是一种集多学科( 计算机、数学、 语言学人工 智 能) 交 叉 的 研 究[17—21]。自 然 语 言 的 处理,以人 类 的 自 然 语 言 为 本 质,以 计 算 机 智 能 识 别技术为 媒 介,通 过 词 法、句 法、语 音 和 语 义 的 解 读,逐渐由智能机器的翻译逼近到与人类相似的语 言思维。目前,基于计算机智能识别技术的自然语 言研究包括了言语行为和言语含义理论,通过对语 言句法结构的理解和具体语境下的语用推理,达到 在具体的语言环境下的动态语境的理解,达到人类 语言思维交 流 的 程 度[22—27]。 虽 然 自 然 语 言 的 处 理 及自然语言的处理技术,通过计算机智能技术的更 新发展有了 重 要 的 研 究 成 果 和 应 用 领 域,但 是,语 言的复杂性和多情景语义性,自然语言处理技术的 研究还有巨大的发展空间和相关的研究成果出现。
2012 年 8 月 8 日收到,8 月 27 日修改 作者简介: 李翠霞,女。硕士。E-mail: lnx1003@ 126. com。
研究的困难,可 以 说,如 何 准 确 地 识 别 自 然 语 言 的 正确含义,提 高 智 能 识 别 技 术 的 智 能 型,将 是 基 于 智能识别的自然语言处理研究的长期任务[11—16]。
模型 目前,主要的计算机智能识别语言系统均采用 统计的模型方式进行技术构建,这是因为语言的语 音和语义在一定的频率上的相近,以统计的模式进 行识别具有高准确性和语言语义精确性[40—45],该模 块结构图如图 1 所示。
以计算机智能识别技术为基础的自然语言研 究现阶段已 经 发 展 成 为 了 包 括 语 言 学、信 息 学、声 学、统计学、人工智能和视觉原理在内的多学科、宽 领域的一项综合性研究领域。不同的语言应用情 景也使得语音识别技术的处理不同。自然语言的 研究,依靠 计 算 机 识 别 技 术,通 过 对 具 体 对 象 的 特 征要求的提 取 研 究,结 合 语 言 语 音 学、数 理 统 计 的 有效筛选,识 别 出 特 定 的 语 言 含 义,这 说 明 计 算 机 智能识别技术与自然语言研究的交叉结合是该项 研究的一大特征。最终使得机器能够精确地识别 人类的语言语音并快速转换翻译,这就要求智能机 器能够逐字逐句地辨识并理解非书面化的文字语 言,还要在 此 前 提 下,将 文 字 语 言 所 包 含 的 具 体 意 义加以响应,不 拘 泥 于 一 隅,准 确 地 进 行 语 言 语 音 的转换[28—33]。 2. 1 基于 智 能 识 别 技 术 的 自 然 语 言 处 理 研 究 的
第 12 卷 第 36 期 2012 年 12 月 1671—1815( 2012) 36-9912-07
计算机技术
科学技术与工程
Science Technology and Engineering
Vol. 12 No. 36 Dec. 2012 2012 Sci. Tech. Engrg.
现代计算机智能识别技术处理自然 语言研究的应用与进展
1 自然语言处理技术简介
自然语言处理技术诞生于 20 世纪 40—50 年 代,主要是通过计算机技术的研究成果来对自然语 言进行模拟加工使用,主要是为了便于人类之间或 人类与智能机器间的准确交流。因计算机的严密 逻辑规范的特点及自然语言的灵活多变的性质,使 得自然语言的处理技术较为复杂,涉足多学科间的 知识应用,但 通 过 几 十 年 的 发 展,该 项 技 术 已 经 有 了巨大的进展。自然语言处理技术的具体处理过 程,可以概括为以下几个部分: 对语言的形式化描 述、具体计算算法的构建、算法的成功应用、对语言 形式化处理的分析研究,由于在自然语言处理过程 中,需要对 自 然 语 言 在 其 语 言 的 结 构、语 义 的 归 纳 和语音的解读等方面的成功理解以及对自然语言 自身规律的归纳总结,并以数学化的描述方法与计 算机能够处理的语言的形式进行研究,所以需要对 自然语言进行数学模型的构建,并以计算机能够理 解和认同的方式进行计算机的操作,最终使得以该 算法所以为基础的数学模型的构建能够准确地对