基于规则的英语名词短语结构自动识别研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[ 关键词 ] 规则 ; 英语 名词短语 ; 短语结构 ; 自动识别 ; 语料库 [ 中图分类号 ]H 3 1 3 [ 文献标 识码 ]A [ 文章编号 ]1 0 0 9 - 9 0 4 2 ( 2 0 1 3 ) 0 7 - 0 0 7 0 - 0 3
Re s e a r c h o n Aut o ma t i c Re c o g n i t i o n o f No u n Phr a s e S t r uc t u r e Ba s e d o n Ru l e s
Ke y wo r ds: ul r e s;Eng l i s h no u n p h r a s e s ;p hr a s e s t uc r t u r e;a u t o ma t i c r e c o g ni t i o n;c o r p u s
名 词短 语 是 英 语 句子 的核 心组 成 部 分 , 然 而 不 同名词 短语类 型 的结构 用法 及其 在 句子 中所作 成 分 的复杂 性一 直 困扰 着英 语 的机 器识 别 技术 。基本 名
作者简介 : 章忠宪( 1 9 6 3 一 ) , 男, 安徽安庆人 , 漳州职业技术学院计 算机工程 系副教授 , 硕士 , 主要从事人工智 能研究 。
第2 9卷 第 7期
章 忠宪 : 基于 规则 的英语 名 词短 语结 构 自动识 别研 究
・ 7 1・
串在逻 辑上 可 能发生 的各种 情 况 , 即 改变 、 减 少 和 增 加, 总之都是 一种变 化。同化规则 属于转 换规则 。
s e ma nt i c c o l l o c a t i o n,r e v e a l s t he r e l a t i o n s h i p b e t we e n t h e n o u n p h r a s e t y p e a n d i t s c o mp o s i t i o n i n t he s e n t e n c e,o b v i o us l y i mp r o v e s t h e a c c u r a c y o f n o u n p h r a s e r e c o g n i t i o n .
词 短语 ( B a s e N P ) 是C h u r c h在 英语 中首次 提 出 的 , 他
式” : 限定 词 + 形 容 词 + 中心 名词 ( h e a d w o r d )+ 六类 后 置定语 ( 定语从 句 、 同位语 从 句 、 形容 词 短语 、 分 词短语 、 不 定式短 语 、 介 词短 语 ) 。其 中 , 限定 词 和
p u s( 1 9 9 8 ) , d i s c u s s e s t h e u s a g e o f E n g l i s h n o u n p h r a s e s t uc r t u r e r u l e s ,t h e c l a s s i f i c a t i o n a l —
g o r i t h m o f h e a d —w o r d c o l l o c a t i o n o f w o r d s ,p a t t e r n e x t r a c t i o n a l g o r i t h m o f p a r t o f s p e e c h a n d
Abs t r a c t: Th e n o un p h r a s e i s a c o r e p a r t o f En g l i s h s e n t e n c e s t r u c t u r e,b u t s t uc r t u r e a n d u s a g e o f d i f f e r e n t n o u n p h r a s e t y p e s a n d t h e i r c o mp l e x i t y o f c o n s t i t u e n t s i n t h e s e nt e n c e ha v e pl a g u e d t he En g l i s h ma c h i n e r e c o g n i t i o n t e c h n o l o g y .T hi s pa p e r ,o n t h e b a s i s o f t h e P e o p l e s Da i l y c o r -
我 需要 一本 书来 消磨 时 间 。
I p l a n t o r e a d t h e b o o k b o ug h t y e s t e r d a y t o k i l l t he
t i me。
同化 的作用 是 使 一个 元 音 或辅 音 与 另 一个 更 近 似 , 甚 至 同一 。原 则上 , 同化 对 元音 和 辅 音 都 能起 作 用 。 同化具 体 可 以从 三个 方 面说 来 : 对象 、 方 向 和 范 围。 同化 的对 象 可 能 是 一 个 语 音 的 某 些 甚 至 全 部 特 征 : 清浊 、 音 位或 音式 。同化作 用 在两 者 之 间发 生 , 所 以
置 定语 复式 的 出现 。在 英语 里 , 修饰 名 词 的 定语 , 其 语 序 的位 置 也 是 极 有 规 律 的 , 下 面是 一 个 “ 黄 金 公
收 稿 日期 : 2 0 1 3 - 0 4 - 2 2
英语变换规则类型有三个 : 转换规则——词素 的某个 位置 , 一个音 被 另一个 不 同 的音 替换 ; 脱 略规 则——解释一个音、 几个音从一个词素脱落、 省略的 现象 ; 扩充规 则—— 在 现存结 构 下 , 插入 一 个 新音 以 扩展该 词素 。这 些分类 没有 遗 漏地 说 明 了一 个 语音
p r o f e s s o r i n t h e s c h o o 1 .
( u n i v e r s a 1 ) 限定 词 ( 如 a l 1 ) 以及 部 分 性 ( p a r t i t i v e ) 限
定词( 如 s o me ) ; 根 据 限定 词 的性 质 可 以分成 限制 性 ( d e i f n i t e ) 限定词如 t h i s 、 y o u r s 、 J o h n ’ S等 , 以及 非 限 制性( i n d e f i n i t e ) 限定 词 如 a n 、 s o me 、 m a n y 。而 与英 文 写 作 比较 密切相 关 的一种 分 类 法是 根 据 限定 词 与 限 定 词 之 间 的搭 配关 系 , 即不 同 限定 词 在 名 词 词 组 中
形 容词 为前 置 定语 , 后 面六 种 则 为 后 置 定 语 , 因此 ,
可 以称 之为英 语定语 的“ 左二 右六 ” 规律 。本 文就 英
将 英语 中的 B a s e N P定义 为“ 非嵌 套 的名词 短语 ” , 也
就 是说 , 一个 B a s e N P内部 不能 再 包含 有更 小 的名 词
称 为 限定词 。 限定词 的分 类 , 根 据 限 定 范 围 可 以分 为 全 称 性
2 ) 用在 序数词 和 形容 词最 高 级前 , 如: a : D e c e m —
b e r i s t he l a s t mo n t h o f t h e y e a r ; b: He i s t h e y o u n g e s t
置 定语 , 即修 饰语 位于 被修饰 名 词 的前 面 ; 后 置定 语 即修饰语 位 于被修 饰名 词 的后 面 。后置 修 饰定 语 包 括 同位语 从句 、 定语 从句 、 不定式 、 介词短语 、 分 词 短
语、 副词 短语 和形 容词 短语 等 , 而且 还会 有 不 同的后
( 一) 基 于变换的规 则
具有 方 向性 。A、 B两 个音 , 如 果 同化 的方 向是 A —B ( 从 右到 左 ) , 这 就 是 逆 向 同化 。反 之 , A— B型 ( 从 左 到右 ) 同化 也就 是正 向同化 。 ( 二) 基 于实例 的规 则
我计划读昨天买的那本书来消磨时间。 在第 一句 中 , a b o o k只是 o n e b o o k或 a n y b o o k , 是泛指 某 一 本 书 , 用 不 定 冠词 。在 第 二 句 中, t h e b o o k就 是 t h a t b o o k , 特 别 指 出是 昨天买 的那 本 , 所 以
语 名词 短 语 结 构 基 于 规 则 的 自动识 别 技 术 进 行 研 究, 以提高名 词短语 的识 别精 度 。

短 语 。而名 词 与 它 的修 饰 语 一 起 构 成 名 词 短 语 , 二
者 之 间有 两 种 位 置 关 系 : 前 置 定 语 及 后 置 定 语 。前

基 于规则 的方 法
Vo 1 . 2 9 No
基 于规 则 的 英语 名 词短 语 结 构 自动 识 别 研 究
章 忠 宪
( 漳州 职业技术学 院 计算机工程系 , 福建 漳州 3 6 3 0 0 0 ) [ 摘 要] 名词短语是英语句子的核心组成部分 , 然而不 同名词短语类型 的结 构用法及其在 句子 中成分
第2 9卷 第 7期
2 0 1 3年 7月
吉 林 工 程 技 术 师 范 学 院 学 报
J o u r n a l o f J i l i n Te a c h e r s I n s t i t u t e o f E n g i n e e r i n g a n d T e c h n o l o g y
ZHANG Z ho n g - x i a n
( C o m p u t e r E n g i n e e r i n g D e p a r t m e n t , Z h a n g z h o u I n s t i t u t e o f T e c h n o l o g y , Z h a n g z h o u F u j i a n 3 6 3 0 0 0 ,C h i n a )
的复杂性一 直困扰着英语 的机器识别技术 。本文以人民 E l 报语料库( 1 9 9 8年) 为基础 , 探讨 了基于规则 的英语名 词短语结 构用 法 、 搭配 中心词归类算法 、 词性与语 义搭配模式抽 取算法 , 揭示 了名词 短语类 型
与其 在句 子中所作成分 的关 系, 明显地提高了名词 短语识别精度 。
用定 冠词 。 定冠 词 的一些 基本 用法 规则 :
1 ) 特指某 ( 些) 人或 事物 , 如: T h i s i s t h e h o u s e
whe r e my s i s t e r o n c e l i v e d.
1 .限定 词 。名 词 短 语 中对 名 词 中 心词 起 类 指 、 特指 以及表 示 确 定 与非 确 定 数 量 等 限定 作 用 的词 ,
相关文档
最新文档