自然语言理解浅谈
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语 言理解 方法理 论体系归根结底都 毫无例外地 遵 循下面 的原 根据信息耦合属性 , 从信息 自身中去提取而不是人为去赋予。
则: 1 . 把 所需要研 究的语言 问题 形式化。 2 . 找出解决问题 的相应 算法 。 那么, 信息在什么结构环 境下, 怎样 交互作用才会 解 出事 物关 系呢 , 这会不会是一种极 为复杂 的情况呢? 有^ 为, 在对
对 于 自然 语言理 解 , 之所 以长 久 以来 找不 到能真正 解决
这一难题 。 但人们最终发现 , 计算机 执行命令是必 须要有算法 问题 的答案 , 问题在于前提条 件的错误 。 人们假 定了这 样前提
为基础 的应 用语言学所研 究的层 次太低 , 谈不上 是真 正的 自然 万物的呢? 既然不是 内有, 那 么就一定是外来 。 这些关系一定存
语言理解 。 就 国内而言, 其特点是: 课题 比较分散 , 应 用项 目偏 在于事物信息之中。
多, 基础研 究比例略少; 选题 时, 容易跟着国外的选 题走 , 立项
试想 , 人类是在 自然环境下进化而来 的。 这 是个极为缓慢
研 究 的语言 问题 形式化 , 得出其相应算 法, 就像长久 以来人们 的过 程。 从单细胞生物开始, 到目 前经历 了数十亿年 , 生物 体长 对其认 知的情况一样 , 不 需要 再考虑 , 还是另有信息属性促成 久以来 绝大部分机 能还只是用在维 系生命体 的存 活上 了。 万千
然而审视 问题角度的差异 常常会从根本上制 约我们对事物 人脑 没有透彻 的了解之前, 无法实现真正的智能。 这就好比是在
的认 知。 就 如同我们怎样看待苹果落地一样 。 是苹果天 经地义 说, 在没有找 到能飞上 月球 的鸟进行研 究之前, 人类 是不可能 就应该落地 , 就像我们已经认知 的其他 万千 事物一样, 不需要 制造 出登月飞船 的。 再考虑, 还是另有引力促成 ? 对于 自然语言理 解是必须 把所要
年代 以来, 在众 多语言学家、 逻辑 学家、 心理学家等的努力下, 有: 转换生 成语法、 依存语法、 语义 网络、 蒙 塔鸠语法、 扩展转
点及信息与信息之 间的关 系, 并将其 赋予计算 机, 使得计算机 从算法 的角度 看, 人 的智能是灵活 无限的, 而计算机 只能
各种关于 自然语言理解 的理论体系纷纷诞生 。 其中较有影 响的 能够对任 何信息做 出合理反应 。 换网络、 系 统语法、 格语法、 概 念依存 理论、 境况语义学 等。 近 按照人编 排好 的算法 去执行有 限的命令。目前,尚无一种算法 年来 , 语料库语言学又得到迅速 发展 。 国 内自然语言理 解研 究 能够完成对所有事物关系的认知。 只要 我们赋予计算 机以一定 起步较 晚, 要从二十世 纪7 O 年代末 算起 。 早期阶段 以语 形分析 的算法, 就无法使其 真正智能化 。 而没有算法, 计算机解决 问题 为主 , 中期及中后期开始注 重语义分析并开始探索基于语料库 就无 从谈 起。除非 能找 到一种无 算法算法, 才可能使 其从根本
的统计方 法。 近期则语料库统计与规则分析并重。 对于 自然语言理解 , 从 国际上看当前的问题 主要表 现为,
一
上有所突 破 , 否则就谈不上是真正 的自然语言理解 。 而这听起 来就是矛盾的。 那么, 从审视计算机的角度来看, 人脑 的智能应是何来呢?
方面是哲学, 认 知科学 , 思维科 学和心理学等 学科所研 究的
设计分析 ・
自然语言理解浅谈
胡振波 赵靖岩 ( 长春大 学, 吉 林 长春 1 3 0 0 2 2 )
摘 要 : 长 久以来 , 作为人 工智能的关键 问题 , 自 然语言理解 的发 展—直局 限于以词 汇、 句法 、 语 义、 语用的分析 为基 础 。 无论 是机 器翻译 , 语 料 库研 究, 语篇 理解研 究, 还 是概念 层次 网络 理论 , 只是 研究形式 不同, 究其根 本 都是 在进 行语言规 则与统计 的研 究 , 都未 能脱 离传 统模 式
层 次太高 , 太抽 象 , 宏观与 微观 隔离, 提 出的方 案根本无法 付 是人脑 中天生就存 有宇宙中所有事物 的关系 , 所 以才有着 无限
诸具体实施 ; 另一方面是 , 一直局 限于 以语法、 语义、 语境研 究 的认 知能力么? 显然 , 这是荒谬 的。 那 么, 人是如何能了解宇宙
呢?
生物当中, 目前, 也只有人类一种生命 体达 到了智能 的水平。因
众 所周知 , 计算 机解决 问题 的关键 是算法。 但我们人类为 此 , 从历史 的角度来 看, 智 能到 目前为止 还应该 是一个基于生 计算 机赋 予某种 算法 后, 计 算机 也只能解 决这些 算法 能使其 物性基础上萌发的一个相对极为简单而绝非复杂 的事物才对。 解决 的问题 。自图灵测试提 出以来 , 人们想尽 各种方 案来解决
破。
如果事物关系是存在于信息 自身当中, 那 么就恰 恰为无算 法就 是指 赋予计算机 以一定 的算法去处理信息 , 无算法就 是对
论 证 时, 关键考 虑国外怎么做 , 来自百度文库多课 题没有取得理论 上的突 法算法 的实现 提供了充分必要 条件。 所谓 无算法算法, 其 中算 总的来看, 无论是 国外 的研 究还 是国内的探索, 各种 自然 于外部世界无限数量 的具体信息 问的逻辑关系与处理方案 , 是
的束缚。 本文突破传统, 从信 属性着手, 提 出了 信息耦合属性概念。
关键词 : 自 然语言理 解; 人 工智 能; 信息耦 合
自然语言理解是人 工智能 的一个重要分支 。 国外 自然语言 看 , 这似乎 是不 可能的。因为外界万事万物 的信息数量 是无 限 理解研 究较早 , 也诞 生了诸 多较有影 响的理 论。白二十世 纪5 O 的, 其变化发 展亦是无 限的。 我们根 本无法 找出所有信息 的特