以“的”字结构为核心的最长名词短语识别研究
汉语最长名词短语的自动识别
汉语最长名词短语的自动识别*周强孙茂松黄昌宁智能技术与系统国家重点实验室清华大学计算机科学与技术系,北京100084摘要:本文通过对包含5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分析,提出了两种有效的汉语最长名词短语自动识别算法:基于边界分布概率的识别算法(算法1)和基于内部结构组合的识别算法(算法2)。
实验结果显示,算法2的识别正确率和召回率分别达到了85.4%和82.3%,取得了较好的自动识别效果。
关键词:最长名词短语,边界识别,句法分析。
1 引言在自然语言句子的理解过程中,能否准确地识别其中的名词短语(np)起了很重要的作用。
按照认知科学的观点,人类必须首先识别、学习和理解文本中的实体(entity)或者概念(具体的或抽象的),才能很好地理解自然语言文本,而这些实体和概念大都是由文本句子中的名词短语所描述的。
因此,如果我们掌握了文本中的名词短语,就可以在很大程度上把握文本所表达的主要意思。
从组成结构上看,句子中的名词短语可分为以下三类:1) 最短名词短语(mNP):即不包含其他任何名词短语的名词短语;2) 最长名词短语(MNP):即不被其他任何名词短语所包含的名词短语;3) 一般名词短语(GNP):所有不是mNP和MNP的名词短语。
从mNP到GNP再到MNP,自动识别的难度是在不断增加的。
而在自然语言处理领域,MNP的自动识别具有更为重要的意义。
因为我们一旦很好地识别出了句子中所有的MNP,就可以很方便地把握句子的整体结构框架,从而很快构建出句子的完整句法树(森林)。
正是认识到了这一点,近几年来,许多研究人员在MNP的自动识别方面进行了许多有益的探索,提出了一些行之有效的识别方法。
在英语方面的工作主要有:1) Church的简单名词短语抽取器[1],利用概率矩阵信息来确定句子中np的起始和终止位置。
2) Bourigault的术语抽取器LEXTER[2],通过构造两个阶段的自动分析器发现文本中的术语(即部分MNP)3) Voutilainen的MNP获取工具:NPTool[3],利用两种有限状态分析机制(NP_否定机制和NP_肯定机制)来发现文本中可能的MNP。
名词短语的可及性与关系化一项类型学视野下的英汉对比研究
名词短语的可及性与关系化一项类型学视野下的英汉对比研究一、本文概述本文旨在通过类型学的视角,对英汉两种语言中的名词短语可及性与关系化现象进行深入对比研究。
我们将探讨两种语言在处理名词短语时的共性与差异,特别是它们在构建和表达复杂语义关系时的不同策略。
本文的研究不仅有助于我们更深入地理解英汉语言的本质特点,也有助于揭示人类语言的普遍规律。
在概述部分,我们将首先界定名词短语可及性与关系化的概念,并阐述这两种现象在语言研究中的重要性。
接着,我们将回顾以往的相关研究,分析当前研究的不足,并说明本文的研究目的和研究问题。
我们还将介绍本文的研究方法,包括语料来源、数据处理方法以及数据分析工具等。
通过本文的研究,我们期望能够揭示英汉两种语言在名词短语可及性与关系化方面的异同,为语言类型学研究提供新的视角和证据。
我们也希望能够为英汉语言的教学和翻译实践提供有益的启示和建议。
二、文献综述可及性(Accessibility)和关系化(Relationalization)是语言学中两个核心概念,尤其在类型学视野下,对于不同语言的名词短语结构和功能差异具有重要的解释力。
本文旨在从类型学的角度出发,对英汉两种语言中的名词短语可及性与关系化现象进行深入的对比研究。
名词短语的可及性通常指的是在语言中名词短语被识别、提取和加工的难易程度。
这一概念与句法结构、语义关系以及认知心理等多个方面紧密相关。
在汉语和英语中,名词短语的可及性受到多种因素的影响,如词序、修饰语的位置和类型、以及名词短语内部的层级结构等。
通过对比研究,我们可以发现英汉两种语言在名词短语可及性方面的异同,以及这些差异如何影响语言的表达和理解。
关系化则是指通过一定的语法手段将名词短语转化为从句的过程。
关系化现象在不同语言中表现出不同的类型和特点,反映了语言类型学的多样性。
在汉语中,关系化通常通过“的”字结构来实现;而在英语中,则主要依赖于关系代词和关系副词。
通过对比英汉两种语言的关系化手段,我们可以深入了解它们在句法结构、语义功能和信息组织方面的差异。
浅谈“的”字短语
浅谈“的”字短语摘要:“的”字短语是现代汉语中比较常见的一种短语,也是现代汉语所特有的一类短语,其使用频率相当高,应用相当广泛,情况也比较复杂,在很多方面都具有独特性,很多专家学者都对这类短语进行了研究。
在本文中我们就来简单探讨一下一些与“的”字短语相关的问题。
论文关键词:“的”字短语形式特点称代规则表达功能“VP的”“的”字短语由助词“的”附着在实词或短语后面组成,属于名词性短语,指称人或事物,能做主语、宾语。
“的”字短语是现代汉语中比较常见的一种短语,使用频率也很高,吕叔湘先生曾指出过:“的”字短语应用广泛,情况复杂,很值得研究。
下面,我们就来对“的”字短语做一个粗浅的探讨。
一、“的”字短语的形式与特点“的”字短语在形式上是由实词和短语加上一个“的”字构成的,因此,如名词、动词、形容词等各类实词加上“的”都可以构成“的”字短语,如:吃的大的学校的各类短语加上“的”也可以构成“的”字短语,如:看戏的跑得快的送票给我的帮她干活的“的”字短语属于名词性短语。
从意义上看,“的”字短语指称人或事物,相当于人物名词,如:“大的要照顾小的。
”这里“大的”、“小的”指称的是“大的人”、“小的人”。
体育论文“我的书在包里,你的我不知道。
”这里“你的”指称“你的书”。
此外,还有一些“的”字短语除了具有名词性特征以外,还表示“等等、之类”的意思,这类“的”字短语通常由两个同类词语或结构加“的”的形式或者是以“什么的”形式出现,如:“他整日寻点糖儿豆儿的到处骗人。
”“你去买点花生瓜子什么的。
”从句法功能上看,“的”字短语也像名词一样经常做句子的主语或宾语,如:“大的要照顾小的。
”“我的书在包里,你的我不知道。
”“的”字短语后面添加上一个相应的名词,这就转换为了偏正形式,但是意义会有一定的变化,由概括意义变成了具体意义,因为相比较偏正短语,“的”字短语的意义要抽象概括些,不像偏正短语那样具体,例如:“绿色的”可以泛指任何一个带有绿色的对象,如“草原、森林、世界”等等,而与之意义相近的偏正短语“绿色的草原、绿色的森林、绿色的世界”等等,都只能指称单个具体的绿色对象。
“地”字结构识别
地”字结构识别[摘要 ] “地”字结构是汉语中有标记的状语结构, 字结构的自动识别作为浅层句法分析的任务之一可以减少 自动句法分析的歧义。
本文在分析“地”字结构性质的基础 上,利用规则与统计相结合的方法,基于分词文本对“地” 字结构进行了对比性的识别研究。
实验利用 200 万字的语料 进行训练, 将获取的数据用于自动识别, 获得了较好的效果。
[关键词 ] “地”字结构 句法分析 规则 概率 汉语是一种缺乏形态变化的语言,传达了较少的形式化信息,增加了自然语言处理的歧义。
在自动句法分析的过程 中,汉语缺少可直接利用的形式信息,增加了分析的难度。
20世纪80年代末,国外开始了关于组块 (Chunk )的研究,并提出了浅层句法分析的概念,希望通过语块的识别和 语块之间依附关系的分析来实现对完全句法分析任务的分解。
90 年代以来, 国内学者在汉语的浅层句法分析方面也做 的结构和边界。
王立霞、吴云芳使用概率模型识别了介词短 语的边界。
赵军提出了基于转换的汉语基本名词短语(baseNP )识别模型。
周强利用边界概率分布和内部结构组 合对最长名词短语(MNP )进行了较为全面的识别分析。
这 些研究主要集中于对名词短语和介词短语的识别,为汉语的 自动处理做出了有益的探索。
作为浅层句法分析的任务之一, “地”字结构的自动识别可以有效地减少句法分析的歧义。
由于“地”字结构在句 中处于状语的地” 了很多工作。
郭志立利用广义互信息研究了“的”字短语位置,对于一些简单的单句而言,该结构的自动识别常常可以帮助找到谓语中心,划定句子的基本结构,我们可以给出这样的形式化表示:S=[SZ]+Subj+[SZ]+DS+P+[Obj]其中,S表示单句,SZ表示句首或小句状语,DS表示“地”字结构,P 表示谓语中心,Subj 表示主语,Obj 表示宾语,[] 表示可以出现也可以不出现,+表示语法分隔。
本文分为四个部分,第一部分对“地”字结构进行定义和分类,第二部分介绍统计与规则相结合的“地”字结构识别算法,第三部分分析实验结果,第四部分结语。
基于规则的英语名词短语结构自动识别研究
Re s e a r c h o n Aut o ma t i c Re c o g n i t i o n o f No u n Phr a s e S t r uc t u r e Ba s e d o n Ru l e s
Ke y wo r ds: ul r e s;Eng l i s h no u n p h r a s e s ;p hr a s e s t uc r t u r e;a u t o ma t i c r e c o g ni t i o n;c o r p u s
名 词短 语 是 英 语 句子 的核 心组 成 部 分 , 然 而 不 同名词 短语类 型 的结构 用法 及其 在 句子 中所作 成 分 的复杂 性一 直 困扰 着英 语 的机 器识 别 技术 。基本 名
作者简介 : 章忠宪( 1 9 6 3 一 ) , 男, 安徽安庆人 , 漳州职业技术学院计 算机工程 系副教授 , 硕士 , 主要从事人工智 能研究 。
第2 9卷 第 7期
章 忠宪 : 基于 规则 的英语 名 词短 语结 构 自动识 别研 究
・ 7 1・
串在逻 辑上 可 能发生 的各种 情 况 , 即 改变 、 减 少 和 增 加, 总之都是 一种变 化。同化规则 属于转 换规则 。
s e ma nt i c c o l l o c a t i o n,r e v e a l s t he r e l a t i o n s h i p b e t we e n t h e n o u n p h r a s e t y p e a n d i t s c o mp o s i t i o n i n t he s e n t e n c e,o b v i o us l y i mp r o v e s t h e a c c u r a c y o f n o u n p h r a s e r e c o g n i t i o n .
基于归约的汉语最长名词短语识别方法
模 型 观 察 窗 口受 限 的 矛盾 。 开放 测 试 取 得 了 8 8 . 6 8 的正 确率和 8 9 . 2 1 的 召回率 ; 归 约 方 法 全 面提 升 了识 别 性
能, 特 别是 将 多词 结 构 的 调 和 平 均 值提 高 1 , 优化幅度达 6 以上 , 并且 对 长距 离 复 杂 结 构 有 着 更好 的识 别 效 果 。
wi n d o ws i o d e l s .Th e e x p e r i me n t i n d i c a t e s a g o o d p r e c i s i o n o f 8 8 . 6 8 % a n d a r e c a l l o f 8 9 . 2 1 .Th e r e —
关 键 词 :最 长 名 词 短 语 ; 识 别; 归约 ; 基 本 名 词 短 语
中 图分 类 号 :TP 3 9 1 文 献 标 识 码 :A
C h i ne s e Ma x i ma l No u n Ph r a s e Re c o g n i t i o n Ba s e d o n Re d u c t i o n
duc t i o n me t h od c om p r e h e ns i v e l y i mp r ove s s ys t e m pe r f or ma nc e,e s pe c i a l l y i t i mp r ov e s F1 一 s c o r e b y 1
浅谈“的”字结构
浅谈“的”字结构摘要:“的”是现代汉语中出现频率非常高的一个词,也是各种虚词中被研究的最为彻底的。
“的”字结构不但可以充当修饰一个名词性成分的定语,而且还可以不依附于任何成分独立充当名词性成分。
本文首先列举了几种学术界目前对“的”字结构的看法,进而简要分析“的”字结构的性质、作用以及特点,便于我们更全面的理解“的”字结构。
关键词:“的”字结构;名词性;特点“的”是现代汉语中使用频率非常高的一个词,“的”字结构是现代汉语中比较常见、使用频率也很高的一种短语类型。
它们是语法中非常热门的语言现象,各位学者也从未停止过对它们的研究。
一、学术界对“的”字结构的不同看法现代汉语语法意义上的深入研究,始于朱德熙在1961年发表的论文《说“的”》。
他将“的”分为三种:一是副词性语法单位的后附成分,二是形容词语法单位的后附成分,三是名词性语法单位的后附成分。
朱德熙先生所说的“的”字结构包括两种:一种是用“的”连接定中短语的修饰语,“的”后是定中短语的中心语,例如“白色的布”;另一种是“词或短语+的”构成的指代名词的结构,用来指人或者指物,例如“这匹布是白色的。
”吕叔湘在《现代汉语八百词》中说道:“‘的’字短语可修饰名词,除连词、助词、叹词外,各种词语都可构成‘的’字短语修饰名词。
”吕叔湘在《汉语语法分析问题》中也将“的”字短语分成了两种,文中称为D1短语和D2短语。
D1短语如“我的”,“买的”,“找你的”等;D2短语如“高高的”,“亮亮堂堂的”等。
《现代汉语常用虚词词典》指出:“用在词或词组的后边,合起来表示人或事物的名称的作用。
这样的词组叫‘的’字词组。
‘的’字词组相当于一个名词,一般以名词的性质在句中实现其相应的句法功能”。
沈家煊的《有界与无界》从人类在认知上形成的“有界”和“无界”的对立语法结构中的具体反映这一角度出发,提出“的”跟数量词相似,“具有使无界变为有界的功能”。
例如:“干干净净衣服”是不能成立的,因为“干干净净”是有界的,而衣服是无界的,有界和无界在语义上不能搭配,只有加上“的”或数量词才可以使“衣服”从无界变为有界,才可以成立。
基于BPS理论的英汉语生成性名词短语对比研究
1 “ 容词 短语 十的 ” ) 形 ,如 :漂亮 的他 不敢 要 ,丑 的他不 想要 。
2 “ 词短语 +的” ) 动 ,如 :这 年头 ,教 书 的还没 卖茶 叶蛋 的挣 钱 多 。 3 “ ) 句子 +的” ,如 :小 张挑 的 比小 李 挑 的好 得 多 。 通过 对 限定词 两个 值 的假 设 ,何 元 建 提 出 了汉 语 中存 在 隐性 的 限定 词 的 观 点 ,在 此 基 础 上 , 笔者 在转换 生 成语法 的框 架 内提 出 了一 种新 型 的 “ ” 字 结构 ,具 体来 说 就 是具 有 所 指 的 “ 的 的” 字
与句子 的相似 性 以及英 语与 汉语 的共性 。另外还 用 到 了 “ 后 附 接 假说 ” 和 “ 最 动词 短 语 内部 主语 假 说 ” 核查理 论 ” 移 位理论 ” 等 理论 。 ,“ ,“
一
、
汉 语 生 成 性 名 词 短 语分 析
笔者认 为 在汉语 中有 两种 结构 可 以生成名 词 短语 ,即 “ 的” 字结 构 和 “ ” 字 结构 。 者
形容词 短语 “ 漂亮 ” 的移 位导致 D位 置 的出现 ,但是 构 建过 程 还 没有 完成 . 限定 词短 语 继续 与具 有
本 文拟 在 限定词假 说下 ,用 最 简方 案 框 架 下 的光 杆 短 语 结 构 理 论 ( a haeS utr T er, B r理论 ) 描述 英汉 语 中生成 名词 短语 的句 法结 构 ,将 其 统一 为限定 词 短语 ,并 证 明名 词 短语 P
共 性 ,名 词 短 语 与 句子 也 呈 现 共 性 。
[ 关键词 ] 生成性名词短语 ;光杆短语结构理论 ;限定词 ;移位
[ 中图分类 号]H 3 [ 0 文献标志码 ]A [ 文章编号] 10 0 8—30 (0 0 2— 13— 5 84 2 1 )0 00 0
打听一下的短语结构类型
打听一下的短语结构类型短语是由一个或多个词汇组成的固定结构,它在句子中作为一个整体来表达特定的意思。
根据短语结构的不同,可以分为多种类型。
以下是一些常见的短语结构类型:1. 名词短语 (Noun Phrase,NP): 以名词为核心,可以包含所有修饰词,如形容词、冠词、名定主语和同位语等。
- 例子:a red car, the big house, my best friend2. 动词短语 (Verb Phrase,VP): 以动词为核心,可以包含所有修饰词,如副词、形容词、名词和介词短语等。
- 例子:is playing football, has been studying, will go home3. 形容词短语 (Adjective Phrase,AdjP): 以形容词为核心,可以包含所有修饰词,如副词、名词和介词短语等。
- 例子:very beautiful, really interesting, quite difficult4. 副词短语 (Adverb Phrase,AdvP): 以副词为核心,可以包含所有修饰词,如形容词、副词和介词短语等。
- 例子:very slowly, quite loudly, quite well5. 介词短语 (Prepositional Phrase,PP): 以介词为核心,通常由介词、名词短语和动词短语构成。
- 例子:in the house, on the table, with my friends6. 不定式短语 (Infinitive Phrase): 以动词不定式为核心,可以包含修饰词和状语从句等。
- 例子:to study English, to go to the movies, to eat dinner7. 分词短语 (Participle Phrase): 以现在分词或过去分词为核心,可以包含所有修饰词和状语从句等。
- 例子:running in the park, driven by a professional driver8. 并列短语 (Coordinate Phrase): 由两个或多个相同类型的短语连接而成,起到并列关系。
最长名词短语识别研究
一
、
引言
模 仿 / 是 / C 更 为/ D 巧妙 / 的/ 一 / 位 / N 艺 术家 v v d a u m q
( )[ 2 电荷 / 周 围/ ] 有 / [ 场 / ] n s伴 v 电 n ,/ [ , 电场
最 长 名 词 短 语 识 别 研 究
口钱 小飞
摘 要 :本 文分 析 了最 长 名 词短 语 的 内部 构 成 特征 ,提 出 了一种 基 于基 本 名 词 短语 中心 归约 的最 长 名词 短 语
识别方法,并使用条件 随机场模型识别 了最长名词短语 实验取得 了8. 8 的正确率和8 . 1的召回率 。 7 5% 83%
{ ”
汉 语 最 长 名词 短语 的识 别 效 果 逐 步 提 高 , 但 由于M P自身 构 / 已/ 发 布 / 在 / 先 / 者 / ],/ N d d v p f k ,N/ 尽行 / 削 c d 造 的 复 杂 性 ,M P 别 问题 还 有 待 进 一 步 的研 究 。在 前 人 研 芸 N识
造 概 率模 型识  ̄ M P 周 强 、孙 茂 松 等 ( 0 0 IN ; J 2 0 )提 出两 种 不 展 / N 与 / 联 机/ 情 报/ 系 统/ 的 / 建 立/ N 为 /C v c b n n u v v
同的 识 别 算法 , 其 中基 于 内 部 结 构 组 合 的算 法 通 过 基 本 组 特 征 / 的/ ] 。/ n u 。
最长 名词 短 语 (N )的 识 别 能够 显 著 地 改 善 句 法 分 析 / ”/ 的 / 评 说/ N 。/ MP n ” u v] 。 等 系 统 的 性 能 。如 对 于 句 法 分 析 而 言 , 最 长 名 词 短 语 在 句 识 别 出这 些 结 构 , 可 以大 大 降低 句 法 分 析 过 程 中 的 浅层 歧
短语结构类型
短语结构类型短语结构是语言学中的一个重要概念,用于描述语言中的短语组成方式和结构类型。
下面将介绍几种常见的短语结构类型。
1. 名词短语结构名词短语结构是以名词为核心的短语。
它可以由一个单个名词组成,也可以由修饰词、限定词、介词短语或从句等构成。
例如:- 爸爸的汽车- 一个高大的建筑物- 在公园里玩耍的孩子们2. 动词短语结构动词短语结构是以动词为核心的短语。
它可以由一个单个动词组成,也可以由副词、介词短语、名词短语或从句等构成。
例如:- 跑步- 快速地跳跃- 去学校上课的学生们3. 形容词短语结构形容词短语结构是以形容词为核心的短语。
它可以由一个单个形容词组成,也可以由副词、介词短语、名词短语或从句等构成。
例如:- 美丽的花园- 非常漂亮地装扮- 对这个问题很感兴趣的人们4. 副词短语结构副词短语结构是以副词为核心的短语。
它可以由一个单个副词组成,也可以由介词短语、名词短语或从句等构成。
例如:- 快速地行走- 很慢地说话- 在这个问题上非常认真地思考5. 介词短语结构介词短语结构是以介词为核心的短语。
它由介词短语后面跟随的名词短语、动词短语、形容词短语或副词短语等构成。
例如:- 在学校里- 对这个问题感兴趣- 在桌子下面以上是常见的几种短语结构类型。
通过组合不同的短语结构,可以形成更复杂的句子和表达方式。
在学习和运用语言时,我们需要熟悉各种类型的短语结构,以便更准确地理解和表达信息。
(3000字)。
基于混合策略的汉语最长名词短语识别
基于混合策略的汉语最长名词短语识别钱小飞;侯敏【摘要】该文提出一种基于语言知识评价的分类器集成方法,利用自动获得的搭配资源和人工评价规则,融合了基于支持向量机的最长名词短语识别结果和基于条件随机场的归约识别结果,进一步基于确定性规则有针对性地识别了分类器易出错的特殊结构,提高了对连续动词介词和连续名词造成的边界歧义的识别能力.实验取得了89.30%的正确率和89.62%的召回率,多词结构F1值较归约方法提高了0.75%.【期刊名称】《中文信息学报》【年(卷),期】2013(027)006【总页数】7页(P16-22)【关键词】最长名词短语识别;语言知识评价;分类器集成;规则【作者】钱小飞;侯敏【作者单位】上海大学文学院,上海200444;中国传媒大学国家语言资源监测与研究中心有声媒体语言分中心,北京100024【正文语种】中文【中图分类】TP3911 引言最长名词短语(Maximal Noun Phrase,MNP)是句子中不被其他名词短语包含的名词短语,是一种内部构造复杂的长距离依赖结构,平均占据句子长度的60%以上。
识别MNP可以为完全句法分析、机器翻译、指代消解等基础研究和应用技术提供有力的支持。
MNP识别有三种基本方法:基于规则的方法[1]、基于统计的方法[2]和基于机器学习的方法[3]。
其中,统计机器学习方法是当前的主流方法。
从识别策略看,2-phase策略[4]的和分类器集成的方法[5]取得了较好效果。
以往研究关注算法改进,对MNP的语言学特性关注不够,使得识别系统过于依赖线性特征,复杂MNP和简单MNP识别F1值往往相差13%~22%[5-6];从识别策略看,两阶段(2-phase)的策略以较高训练代价提高识别精度,但也引入了级联错误[7];而分类器集成方法多基于经验或数学手段获取基本分类器权重,系统复杂性因此大大提高,变得更加难以解释,分类对象的特点也很难得到充分的考虑。
针对以上问题,本文提出一种基于语言知识评价的分类器集成方法,融合非归约和归约的MNP识别结果,并基于确定性规则识别易出错的特殊结构,提高了MNP 识别效果。
“的”字短语句法结构和“的”的句法功能研究
的 字短语句法结构和 的 的句法功能研究范晓倩(天津大学国际教育学院ꎬ天津300072)摘㊀要:文章分析了三例经典 的 字短语句法结构的利弊ꎬ并根据其中存在的问题深入研究 的 字短语结构ꎮ首先论证了 的 字短语句法核心是 的 后成分ꎻ然后推论出 的 的句法位置是附加于核心的详指位置(Spec)ꎬ揭示了 的 具有名词性探针选择功能ꎬ 的 的这一句法功能是语义上的名物化在句法上的体现ꎬ是语义与句法的完美接口ꎮ关键词: 的 ꎻ句法结构ꎻ句法功能中图分类号:H043㊀㊀文献标志码:A㊀㊀文章编号:1008 ̄4339(2019)06 ̄549 ̄07收稿日期:2018 ̄12 ̄06.基金项目:2018年度天津大学自主创新基金社会影响力项目(2018XSC ̄0052).作者简介:范晓倩(1983 ㊀)ꎬ女ꎬ讲师.通讯作者:范晓倩ꎬfanxiaoqian@tju.edu.cn.㊀㊀ 的 字短语句法结构理论纷繁复杂ꎬ纵观语言学界ꎬ不同学者对此都有不同的观点ꎬ至今未能达成统一ꎬ没能形成很好的理论来解释 的 字短语中存在的语言现象ꎮ围绕 的 字短语句法结构这一难题展开讨论ꎬ探索较为统一的句法理论ꎬ揭开句法与语义接口的谜题是本文研究的最终目的ꎮ一㊁ 的 字短语句法结构理论的争论背景的 的词类归属问题以及由 的 引出的句法结构分析一直是语言学界关注的焦点ꎮ从上世纪80年代直至现在仍无定论ꎬ究其原因在于汉语无形态标记的语言特点使隐藏在 的 后的句法功能和句法结构无法得到统一的认知和论证ꎮ纵观 的 字短语的句法结构理论ꎬ争论的焦点主要集中在3个方面ꎮ一是 的 字短语的句法属性ꎮ虽然学者们普遍将 的 字短语视为名词性短语ꎬ但对 的 字短语在句法中的属性却众说纷纭ꎮ有学者认为 的 字短语是以名词为核心的名词短语NP[1 ̄2]ꎻ有学者认为 的 字短语是以限定词为核心的限定词短语DP[3]ꎻ还有学者认为 的 字短语既可以是名词短语NPꎬ也可以是限定词短语DP[4]ꎻ有的学者甚至创造了一种句法短语DePꎬ显示了汉语中 的 字短语独立的句法特性[5]ꎮ争论的另一焦点是 的 字短语的核心ꎮ本文所提的核心是指短语句法结构的核心ꎬ与定中结构语义上的中心语不同ꎮ司富珍[5]㊁熊仲儒[3]认为 的 字短语的核心就是 的 ꎬ 的 后成分是核心 的 的补足语ꎻChiu[2]㊁石定栩[4]㊁完权[6]认为 的 字短语的核心是 的 后成分ꎬ属于核心后置ꎮ第三个争议的焦点是在承认 的 后成分为整个的 字短语核心的前提下ꎬ学者们对 的 与 的 前成分构成的附加短语的句法属性以及 的 的句法属性各执一词ꎮChiu认为 的 与 的 前成分构成关系小句CPꎬ 的 为小句短语CP的核心C[2]ꎻ石定栩认为 的 与 的 前成分构成了以De(的)为核心的附加短语DeP[4]ꎻ完权将 的 分析为后置介词ꎬ 的 与 的 前成分构成了以后置介词Pos(的)为核心的后置介词短语PosP[6]ꎮ上述学者对 的 的研究都是值得肯定的ꎬ这些争议也无疑将我们推向 的 背后更深层的语言本质ꎬ因为只有从不同的角度论证才有可能看清真相ꎬ至于如何才能揭开这层面纱去看清 的 这一语言现象背后真正的句法结构是发人深省的ꎮ笔者认为最接近 的 本质的句法结构分析应该是能够统一 的 的一种分析ꎬ也就是对 的 的高度统一的分析ꎮ一种 的 字短语句法结构的分析对与 的 有关的语言现象越统一ꎬ这种分析就越接近 的 的句法本质ꎮ笔者在下文将本着这一思路对 的 的句法功能和句法结构展㊀ 550㊀ 天㊀津㊀大㊀学㊀学㊀报㊀(社会科学版)2019年11月㊀开研究ꎬ通过对比司富珍[5]㊁石定栩[4]和完权[6]这三位学者的 的 字结构分析ꎬ讨论其中存在的问题ꎬ探索出一种高度统一的 的 字短语句法结构分析ꎮ最后理论结合实际ꎬ笔者利用本文提出的 的 的句法结构解释与 的 有关的语言现象ꎬ以此来检验该句法结构的合理性和现实意义ꎮ二㊁ 的 字短语的句法核心关于 的 字短语的核心有两类代表性的观点ꎬ一派是以司富珍为代表的ꎬ认为 的 就是 的字短语的句法核心ꎬ另一派认为 的 后成分是 的 字短语的句法核心ꎮ首先来回顾一下司富珍[5]关于 的 字短语的句法结构ꎬ见图1ꎮ图1㊀司富珍 的 字短语句法结构司富珍认为采用 的 为短语句法核心的观点可以使 的 字短语的所有情况都在布龙菲尔德向心结构理论的框架之内得到圆满解答[5]ꎮ但司富珍要想证实自己的理论ꎬ就得回答周国光提出的质疑ꎬ即为何采用该理论分析的 的 字短语违反正常语感ꎬ而且还得解释作为功能性成分的 的 是如何承载整个 的字短语的核心内容并对其后成分ZP完成支配的[7]ꎮ例如ꎬ在 我的远大的理想 中如何将中心语认定为 的 而不是 理想 ꎮ正如邓思颖指出的那样ꎬ如果要将 的 分析为短语句法核心ꎬ就需要证明 的 有一定的语义内容[8]ꎮ而 的 是否能像实词一样具有语义内容至今无人论证过ꎬ该观点也不被主流学者认同ꎬ学界的主流观点认为 的 是虚词ꎮ此外该句法结构还要直面石定栩提出的挑战ꎬ即生成句法结构得表示各成分之间的句法关系和语义内容[4]ꎬ而在司富珍的DeP句法结构图中ꎬ 的 与 的 前成分割裂开ꎬ只是间接关系ꎬ无法体现定中修饰关系所代表的语义内容ꎮ可见ꎬ以 的 为整个 的 字短语的核心ꎬ 的 后成分作为 的 的补足语说面临着句法层与语义层相悖的矛盾ꎮ石定栩[4]提出了一个以 的 后成分为 的 字短语句法核心ꎬ 的 和 的 前成分构成了以 的 为核心的DeP短语ꎬ该DeP短语作为 的字短语核心成分的附加成分ꎬ见图2ꎮ笔者赞成石定栩的观点ꎬ句法结构要体现句法关系和语义内容的对应性ꎮ 的 后成分既是语义上的中心语ꎬ也是句法上的核心ꎬ 的 与 的 前成分在句图2㊀石定栩 的 字短语句法结构法上的组合关系与组合后的成分附加在核心上的句法关系显示出语义层面定语对中心语的修饰关系ꎮ但石定栩提出的这种广义 的 字结构也存在一定的问题ꎮ按照石定栩的分析ꎬ 的 后成分YP可以是名词短语NP或者限定词短语DPꎬ根据布龙菲尔德理论ꎬ 的 字短语要与核心成分形类相同ꎬ所以 的 字短语既可以是名词短语ꎬ也可以是限定词短语ꎬ这就给整个 的 字短语句法地位带来了困惑ꎬ这种不唯一的句法属性是否违反了最简原则ꎮ虽然NP和DP都是名词性的ꎬ但 的 字短语的整体句法属性㊁句法结构分析应该要体现出句法上的同一性ꎮ因此ꎬ笔者认为这一核心成分的句法结构有待商榷ꎮ再者ꎬ虽然 的 与 的 前成分直接相关构成DePꎬ但是这一结构切断了 的 前成分和 的 以及 的 后成分的关系ꎬ无法像Chiu[2]的关系小句说那样能通过移位建立 的 前成分和 的 后成分的句法空位关系ꎬ所以他的句法结构图也不能完全按照自己所主张的那样让句法结构体现出句法和语义的相互映照ꎮ最后ꎬ石定栩想通过名物化来解释 的 后成分是动词短语或形容词短语的情况ꎮ但动词短语或形容词短语如何带上了一个名词短语的外壳ꎬ这种名物化现象可否体现在句法层而不只是语义层ꎬ这些都是值得进一步思考的问题ꎮ总之ꎬ石定栩提出的 的 字结构一是没能给 的 字短语一个清晰的句法定位ꎬ造成了 的 字短语属于NP和DP两种句法成分的可能性ꎬ二是切断了 的 前成分与 的 和 的 后成分的句法相关性ꎬ没能建立 的 后成分与 的 前成分的句法结构关系ꎬ三是名物化对 的 后成分为动词短语或形容词短语的解释没能上升到句法层面ꎬ名物化的解释没能在句法层面让 的 字结构的各个句法成分体现出结构关系ꎮ完权[6]也支持 的 后成分是 的字短语的核心ꎬ但他给 的 与 的 前成分的组合赋予了一个新的句法地位ꎬ即后置介词短语ꎮ他认为 的 是后置介词ꎬ可作为后置介词短语的功能核心ꎬ见图3ꎮ图3㊀完权 的 字短语句法结构第21卷第6期范晓倩: 的 字短语句法结构和 的 的句法功能研究 551㊀ ㊀笔者认为完权的 的 字短语句法结构一大优点就是给 的 赋予了一个词类ꎬ给以 的 为核心的短语一个句法地位ꎬ不再采用一个命名的成分DePꎮ另一优点是通过 的 的赋格作用建立了 的 前成分与的 后成分的关系ꎮ该理论还有一个优点ꎬ就是反对汉语名词化理论ꎬ完权认为 的 前后成分的动词或形容词本来就包含于名词中ꎬ具有名词特征ꎬ所以不算词类转变[6]ꎮ但是后置介词说违反了语义的递归性ꎬ使句法结构与语义内容无法相互照应ꎬ而且也不能统一说明 的 赋予名词什么格ꎬ也不能将 的 前后成分的关系在句法层面中有机地联系在一起ꎮ例(1)a.[NP马的奔跑]b.[NP放养的马](完权ꎬ2015)如完权所述ꎬ因为有介词 的 ꎬ所以名词性的 马 在例(1)a中不能被动词赋予主格ꎬ在例(1)b中也不能被动词赋予宾格ꎬ那么 的 给名词性的 马 赋了什么格呢?如果按照完权所述 的 给 马 赋的是领格的话ꎬ例(1)a能解释得通ꎬ那例(1)b如何解释? 的 跟动词 放养 相连ꎬ还起赋格作用吗? 的 给 的 后成分 马 赋格吗?又如例(2)所示:例(2)大卫买的书ꎮ像在例(2)这种句子里ꎬ 的 与专有名词 大卫 不直接相邻ꎬ又如何给 大卫 赋格呢?如果是动词 买 给 大卫 赋格ꎬ那 的 就可以不起作用了ꎮ如果是这样ꎬ 的 的赋格作用在句法层中无法表现出一致性ꎬ呈现出时有时无的特点ꎮ因此ꎬ完权提出的 的 作为后置介词说不能统一解释 的 的赋格作用ꎬ其在句法层对 的 字结构的阐释也无法将 的 前后成分的结构关系有机联系在一起ꎮ综上所述ꎬ司富珍㊁石定栩和完权的 的 字短语句法结构都各有利弊ꎬ每位学者的理论都对前人的有所突破ꎬ但也都有各自要面对的句法难题ꎮ以 的 为 的 字短语核心的句法理论可以解释所有 的 字短语情况ꎬ甚至包括 的 后成分无法补出的情况ꎬ如 生活是美好的 ꎬ但会受到语感和句法-语义相悖的质疑ꎮ以 的 后成分为 的 字短语核心的句法理论就无法统一所有带 的 字的句法结构ꎮ因为像上面 的 后成分缺失的情况就等于 的 字短语句法核心缺失ꎬ没有核心的 的 字短语句法结构就如同散了架一样ꎬ失去了其句法属性ꎮ那在这两类 的 字短语句法核心的观点中ꎬ到底哪一个最接近语言的本质呢?笔者将通过汉语中一个真实的语言现象来论证 的 后成分为整个 的 字短语的核心ꎮ例(3)她是生的男孩ꎮ(完权[9]ꎬ2013)在例(3)中 是 是焦点标记ꎬ可标记其后成分 生 为焦点ꎬ但句中有焦点重音表现的是 的 后成分 男孩 ꎬ而不是与 是 相连的 的 前成分 生 ꎮ这一非常规焦点标记现象从一个侧面可以说明 的 后成分是 的 字短语的核心ꎮ为了证明此观点ꎬ笔者先介绍袁毓林关于Selkirk的一条焦点投射规则ꎮ例(4) 给一个中心语的内在论元加上焦点标记就允准给这个中心语①加上焦点标记 [10]ꎮ袁毓林指出该理论研究思路是正确的ꎬ因为这是基于句法结构来研究焦点语义[10]ꎮ笔者认为这种研究思路正好符合石定栩的观点ꎬ即句法结构要体现语义内容[4]ꎮ虽然Selkirk的理论不完善ꎬ但不能就此否定该理论关于句法中心语㊁内在论元与焦点标记呈现出的规律性ꎬ因此ꎬ不妨通过焦点语义来反推句法结构ꎮ其实Selkirk提出的句法中心语和内在论元是动词短语VP结构中的动词和名词短语ꎬ当动词短语 生男孩 之间插入 的 就无法体现出动词短语句法中心语 生 与内在论元 男孩 的句法结构ꎬ但短语 生的男孩 的语义与动词短语 生男孩 有相关性ꎬ基于句法结构研究焦点语义的思路可以对Selkirk的焦点投射规则稍作改动ꎬ变成例(5)ꎮ例(5)给一个中心语的内在成分加上焦点标记就允准给这个中心语加上焦点标记ꎮ在例(3)中ꎬ 是 给 生 加焦点标记ꎬ 男孩 却获得了焦点语义ꎬ具有重音表现ꎮ套用上面改动后的规则ꎬ 的 字短语的内在成分是 生 ꎬ于是可以反推出 的 字短语的句法中心语是 男孩 ꎬ即 的 后成分ꎮ由此可推论 的 后成分就是 的 字短语的句法核心ꎮ再如例(6)例(6)a.他是去的北京ꎮb.他是去北京ꎮ在例(6)a中ꎬ 是 给 的 前成分 去 加焦点标记ꎬ但 的 后成分 北京 具有重音表现ꎬ获得了焦点语义ꎮ笔者发现在 是+V+的+O 这一结构普遍呈现出这种非常规焦点标记现象ꎬ而且 的 后成分是这种焦点结构唯一可能的焦点ꎮ例(6)b有两种焦点解释ꎬ第一种 是 呈现焦点重音ꎬ 是 本身就是焦点ꎬ传达承认后边动词短语 去北京 这件事ꎮ在这种焦点解释中ꎬ笔者认为 是去北京 是一个句法短语ꎬ 是 是这个短语的中心语ꎬ根据袁毓林关于Selkirk的另一条焦点投射规则ꎮ例(7) 给一个短语的中心语加上焦点标记就允准给这个短语加上焦点标记 [10]ꎮ正是因为 是 使得 是去北京 在句中整个被标记为焦点短语ꎬ才有承认 去北京 这件事的语义内㊀ 552㊀ 天㊀津㊀大㊀学㊀学㊀报㊀(社会科学版)2019年11月㊀容ꎮ例(6)b的第二种焦点解释为动词短语中的内在论元 北京 被标记为焦点ꎮ这种焦点是在语用作用下产生的对比焦点ꎬ是上下文中为了区别目的地 北京 的需要ꎮ上文可能存在问题 他是去上海吗? ꎬ下文的回答是 不是ꎬ他是去北京 ꎮ通过例(6)a和b的对比ꎬ可推断 是+V+的+O 这一结构中的唯一焦点表达就是基于句法结构的焦点语义表达ꎬ于是就可以根据稍作修改的焦点投射规则(5)来反推出 的 后成分就是 的 字短语的句法核心ꎮ除了上述论证以外ꎬ笔者根据石定栩[4]的观点认为 的 后成分是 的 字短语的核心有句法结构和语义关系的支撑ꎮ将 的 前成分与 的 作为附加结构附属在 的 后核心成分之上可以充分体现修饰语对中心语的修饰功能和定语修饰中心语的语义内涵ꎮ这是将 的 作为整个 的 字短语的句法核心所无法表达的语义关系ꎬ那样的句法结构和语义关系不匹配ꎬ不能实现句法层面和语义层面之间的相互照应ꎮ而且ꎬ的 前成分与 的 在韵律层面上联系得更紧密ꎬ 的 后成分在韵律上更为独立ꎬ因为韵律与句法构造有一定的交互性ꎬ所以从这一点上来说ꎬ 的 与 的 前成分更容易在句法结构上形成一个附加成分ꎬ共同附属在 的 后核心成分之上ꎮ综上所述ꎬ把 的 后成分作为 的 字短语的句法核心更为合理ꎮ三㊁ 的 的句法位置和句法功能经过上文论证 的 字短语的句法核心就是 的 后成分ꎮ由于 的 字短语的名词性被学者们所公认ꎬ因此 的 后成分应该体现名词短语的特性ꎬ在句法结构中可以确定为名词短语NPꎬ整个 的 字短语也确定为名词短语NPꎬ至于 的 后位置由形容词短语AP㊁动词短语VP或者限定词短语DP占据时该如何体现出名词短语的特性仍需进一步讨论ꎬ在此之前ꎬ先对 的 的句法位置进行论证分析ꎮ1. 的 的句法位置熊仲儒[11]和曾美燕㊁石毓智[12]认为 的 与指示代词 那/这 存在某种语法共性ꎬ如例(8)所示ꎮ例(8)a.我这本书b.你那本书在例(8)中ꎬ有指示代词 这/那 出现ꎬ 的 可不出现ꎬ不必说 我的这本书 或 你的那本书 ꎮ这说明 的 的句法功能与指示代词 这/那 重合ꎬ即存在语法共性ꎬ 的 可省去ꎮ笔者认为这种语法共性也可体现在句法位置上ꎬ也就是说指示代词 这/那 的句法位置与 的 的句法位置存在共性ꎮ据此ꎬ可由 这/那 的句法位置来推断的 的句法位置ꎮ汉语学界普遍采用西方语言学句法理论ꎬ把指示代词 这/那 与名词构成的短语分析成限定词短语DPꎬ把指示代词这/那 分析成限定词Dꎬ见图4ꎮ图4㊀限定词短语DP中英文句法结构与图4不同ꎬ李亚非[13]把汉语名词短语分析成核心后置结构ꎬ从跨语言的角度说明了指示代词 这/那 不在核心Dꎬ而是在限定词短语DP的详指位置(Spec)DP1ꎬ见图5ꎮ图5㊀李亚非汉语名词短语句法结构根据上述两种理论的分析ꎬ无论把汉语中限定词短语DP分析成限定词D核心前置还是后置ꎬ指示代词 这/那 都占据DP短语的左侧位置ꎮ由于指示代词 这/那 的句法位置与 的 的句法位置存在共性ꎬ而且上文已经论证了 的 字短语的核心是 的 后成分ꎬ那 的 就不能像图4一样作为句法核心支配右侧的补足语ꎬ所以可以推断 的 与图5中指示代词 这/那 一样占据 的 字短语的左侧详指位置(Spec)ꎮ至此ꎬ 的 字短语的句法结构就论证出来了ꎬ 的 后成分为核心后置ꎬ 的 与 的 前成分占据详指位置(Spec)并附加在核心成分上ꎬ这一 的 字短语的句法结构体现了 的 前成分对 的 后成分的修饰关系ꎬ正与石定栩[4]提出的广义句法结构相吻合ꎮ现在明确了 的 与 的 前成分占据详指位置(Spec)ꎬ但问题是 的 与 的 前成分可以构成什么类型的短语ꎬ用DeP来命名显然无法体现 的 的句法地位和功能ꎮ邓思颖指出 的 属于功能词[8]ꎮ郭戈㊁李京廉在评介John的«论元即关系»一文中提到 派生名物化结构中的高位功能语类D和Nom可为名词提供上移位置 [14]ꎮ笔者认为 的 可分析为功能语类Nomꎬ 的 与 的 前成分可构成功能短语NomPꎬ而将 的 分析为功能语类D的做法是有一定问题的ꎬ下文将做论述ꎮ将名物化结构引入句法形态实现了句法层和语义层的结合ꎬ 的 字短语也有名物化的情况ꎬ比如:这本书的出版㊁长城的伟大ꎮ所以将 的 字短语第21卷第6期范晓倩: 的 字短语句法结构和 的 的句法功能研究 553㊀ ㊀与派生名物化结构相连有一定的合理性ꎮ在派生名物化结构中Nom是高位功能语类ꎬ而 的 被大部分学者认定为结构助词ꎬ 的 是虚词ꎬ在句法层面中也可以对应为功能语类Nomꎮ此外ꎬ 的 作为 的 字短语的关键成分ꎬ连接前后句法成分ꎬ使整个 的 字短语呈现名词性ꎬ将 的 分析为Nom语类是有一定句法价值的ꎬ这对 的 前后句法成分名词性特征的选择ꎬ以及名物化在句法中的转化起到了积极的作用ꎮ2. 的 的句法功能的 的功能语类有别于指示代词 这/那 的功能语类ꎮ虽然二者之间存在语法共性ꎬ但并不代表完全相同ꎮ指示代词 这/那 具有指示功能ꎬ有限定义ꎬ可以归为功能语类Dꎮ而 的 作为连接 的 前成分与 的 后成分的词ꎬ在句法上也一定会体现出 的 与其前后成分的关联性ꎬ又因为 的 可以与 这/那 共现ꎬ如 你的那个漂亮的姐姐 ꎬ所以 的 与指示代词 这/那 不同ꎬ不属于功能语类Dꎮ 的 字短语被汉语学界公认为名词性的短语ꎬ 的 字短语若要保持这种名词性ꎬ其内部各成分也应该体现出名词性ꎬ但 的 前后成分可以是动词㊁形容词或者谓词小句ꎬ如例(9)所示ꎮ例(9)a.长城的伟大(陆俭明[15]ꎬ2003)b.这本书的出版(陆俭明[15]ꎬ2003)c.这本书的不出版(任鹰[16]ꎬ2008)d.我买的书e.幽默的故事石定栩[4]把 的 后非名词成分解释为名物化ꎮ根据郭戈㊁李京廉[14]对于派生名物化结构的论述ꎬ笔者认为 的 字短语的这种名物化过程可以体现在句法层面上ꎬ语义上的名物化可以在句法层中体现出来ꎮ上述语义与句法接口的关键就是 的 的句法功能ꎬ位于详指位置(Spec)的 的 可以指示 的 前成分和 的 后成分选择名词性ꎮ那动词㊁形容词或者谓词小句怎么会有名词性ꎬ又如何选择名词性呢?沈家煊提出了 名动包含 说ꎬ指出动词具有名词性[17]ꎻ完权指出除了词类的名动包含外ꎬ事件句可表达事态ꎬ具有名词性[9]ꎮ石定栩认为词在词库中带着句法信息ꎬ当进入句法层后ꎬ通过句法手段执行该词携带的句法信息[18]ꎮ笔者认为汉语动词㊁形容词在词库中各自携带了动词性㊁形容词性ꎬ与此同时它们也携带了名词性特征ꎬ正如沈家煊[17]指出汉语动词通过本体隐喻可以从陈述一个抽象的活动到指称一个具体的事物ꎬ比如:这本书的出版ꎻ汉语形容词也可以通过表达一个事物的性质特点到指称事物的状态ꎬ比如:长城的伟大ꎮ汉语谓词小句也是如此ꎬ除表示行为事件的动态意义外ꎬ也具有指称事件状态或属性的静态特征ꎬ即名词性特征ꎮ因此汉语在句法层中需要通过其他句法手段来执行动词㊁形容词或者谓词小句的名词性特征ꎬ处在详指位置(Spec)的 的 的句法功能就是选择名词性的句法手段ꎮ完权指出的 是由后置方位名词 底(下) 演变发展而来[6]ꎬ这说明 的 与名词的渊源很深ꎬ更进一步说明 的 在句法层面有名词性探针选择功能ꎮ而且 的 是连接 的 前后成分的纽带ꎬ通过 的 连接后的 的 字短语呈现名词性特征是语言学界不争的事实ꎬ这种连接体现出的句法功能性ꎬ其实就是通过 的 的名词性探针选择功能来连接 的 前后的语法成分ꎮ此外ꎬ 的 后成分可以省略转指事物ꎬ这就使得 的 的名词性探针功能更为凸显ꎬ省略了中心语的 的 字短语所具有的名词性特征是由 的 的名词性探针功能实现的ꎬ位于详指位置的 的 使得 的 前成分选择名词性特征ꎬ同时使得整个 的 字短语具有名词性特征ꎮ总之ꎬ 的 使 的 前成分与 的 后成分中的动词㊁形容词或者词语组合生成的谓词小句选择名词性ꎬ从而使 的 前后成分与 的 相关联ꎬ保证了整个 的 字短语的名词性ꎮ根据李亚非[13]的 详指-核心一致性原则 ꎬ可以推断 的 ㊁ 的 前成分以及 的 后非名词成分的句法位置ꎮ 的 若要指示 的 前成分与 的 后非名词成分的名词性ꎬ就得占据详指位置(Spec)的核心ꎬ 的 前成分与 的 后非名词成分则分别占据各自小短语中的详指位置(Spec)ꎬ见图6ꎮ图6 的 后非名词成分 的 字短语句法结构在例(9)a㊁(9)b和(9)c中 的 后成分形容词 伟大 ㊁动词 出版 和谓词小句 不出版 都是非名词成分ꎬ当它们进入到句法结构中会占据详指YP位置ꎬ通过详指-核心一致性(Spec ̄headagreement)原则ꎬ 的 开启名词性探针选择功能ꎬ指示 的 后非名词成分选择它们自身携带的名词性ꎬYP可以是动词短语VP㊁形容词短语AP㊁谓词小句IP㊁限定词短语DPꎮ也就是说当 的 位于NP详指位置的核心Nom时可以通过详指-核心一致性原则的理论使NP中的空核心N具有名词性特征ꎬ然后NP中的空核心N再通过详指-核心一致性原则的理论使位于NP中的详指位置的YP选择它们自身携带的名词性ꎬ这样 的 的名。
短语结构类型的语义解释
短语结构类型的语义解释
短语结构是语言的基本组织单位,由一个或多个词组成。
短语
结构类型是指根据语义属性和结构特征将短语划分成不同的类别。
短语结构类型的语义解释包括以下几种常见类型:
1. 名词短语(Noun Phrase,NP):以名词为核心的短语。
例如:“大学生”、“红苹果”。
名词短语可以是一个单词,也可以是由
限定词、形容词、名词等组成的复杂结构。
2. 动词短语(Verb Phrase,VP):以动词为核心的短语。
例如:“走进教室”、“吃早饭”。
动词短语可以包含名词、副词、介词短语
等修饰成分。
3. 形容词短语(Adjective Phrase,AdjP):以形容词为核心的
短语。
例如:“非常漂亮的花”、“很有趣的电影”。
形容词短语用来
修饰名词或代词。
4. 副词短语(Adverb Phrase,AdvP):以副词为核心的短语。
例如:“非常快速地跑”、“很慢慢地说”。
副词短语用来修饰动词、形容词或其他副词。
5. 介词短语(Prepositional Phrase,PP):以介词为核心的短语。
例如:“在桌子上”、“在学校里”。
介词短语由介词和其后的名词短语组成,用来表示位置、方向、时间等关系。
短语结构类型的语义解释有助于理解和使用语言。
通过区分不同的短语结构类型,我们可以更准确地表达自己的意思,同时也能更好地理解他人的表达。
“的”字短语的界定及其主要特点
(11) 他和骆驼都是·逃·出·来·的。 (老舍《骆驼祥子》)
( 12) 这儿·有·的是二十世纪的技术、机械、体 制和对这种体制忠实服役的十六世纪封建制度
“的”在“的”字短语中也是一种标志[ 4 ]。《提要》等“省
上后反而显得不简洁。例如 (例中[ ]里的内容为“添 “的”字短语不是“省去名词”的问题, 而是没有必要用
补”上的名词中心语) :
上名词 (中心词)。
( 8) ·他·满·意的[ 原因 ]是我居然告饶, 承认了 国 民党, 而·我·要·当·众·宣·布·的 [ 原因 ]却是“没领过 党证”这一事实。
(6) ·做·夜·班·的有·做·夜·班·的难处。 (引自张斌主编《现代汉语精解》)
编的《现代汉语》, 吕冀平 (1993 年) 主编的《汉语语法 基础》, 吴桂海、鲍庆林 (1992 年) 主编的《语法修辞新
(7) 那孩子·老·王·家·的, 这孩子·老·李·家·的。 例 (1) 的“莲灰色”是名词, 例 (2) 的“干”是动词,
的”(其中的“×”可以是名词、动词、形容词、人称代词 “的、底、地、得”的分合》中就指出:“我以为, 与其说
或短语) , 相当于一个名词,“具有称代人或事物名称 ‘的’是代名词, 来多建一条文法上的规则, 倒不如看
的作用”[1]。 在具体使用中, 它具有名词的语法功能, 主要用作句子的主语、宾语, 也可作定语、状语或谓 语。对“的”字短语的探讨, 虽始于 30 年代, 但由于 “的”字短语本身的复杂性, 所以几十年来各种语法著 作和各类现代汉语教材对“的”字短语所作的解释很
点。如: 胡裕树 (1981 年) 主编的《现代汉语》这样解 释:“助词‘的’也可以附着在词或词组后边, 合起来成
浅析“的”字短语
浅析“的”字短语“的”字短语是指以“的”字为核心的短语。
在中文语言中,“的”字短语是一种非常常见的语言现象,几乎遍布中文的各个领域中,具有非常重要的作用。
本文将从以下几个方面进行浅析“的”字短语。
一、概念和组成“的”字短语是由“的”字作为核心的一种短语,通常包括修饰语和被修饰语两部分。
例如:“红色的花”中,“红色”的是修饰语,“花”是被修饰语。
二、作用和功能1. 修饰名词“的”字短语最常见的作用就是修饰名词。
通过“的”字短语的修饰,可以使名词的含义更加准确、具体、生动。
例如:“美丽的风景”、“奇特的建筑”,就比单单的“风景”、“建筑”更具表现力。
2. 强调属性在“的”字短语中,修饰语通常也是名词,用于形容被修饰名词的属性。
如果这个属性很关键,需要强调,就可以通过“的”字短语来实现。
例如:“金属的手环”中,“金属”的属性是很关键的,强调了手环的材质。
3. 表达关系“的”字短语也可以用以表达关系,常常出现在表示“属于”、“拥有”、“从属”等概念的场合。
例如:“他的书”、“公司的利润”,都是通过“的”字短语来表达一个属于关系。
4. 替代动词或形容词在某些情况下,我们可以使用“的”字短语来替代动词或形容词,从而达到简洁、生动、具体的表达效果。
例如:“跳跃的心情”中,“跳跃”的意思相当于“兴奋”的意思。
三、注意事项在“的”字短语中,修饰语通常在前,被修饰名词在后,这是中文语言的习惯规则。
例如:“漂亮的衣服”正确,“衣服漂亮的”不正确。
2. 省略“的”字在口语中,有时候可以省略“的”字短语中的“的”字,这种现象称为“的”字的舌尖音变。
例如:“好看衣服”,“我家房子”。
综上所述,“的”字短语是中文语言中的一个重要特点,具有修饰、强调、表达关系和替代动词形容词的功能。
在使用时,我们需要注意修饰语和被修饰名词的顺序、不能滥用省略“的”字等问题。
汉语最长名词短语的自动识别
汉语最长名词短语的自动识别
周强;孙茂松;黄昌宁
【期刊名称】《软件学报》
【年(卷),期】2000(11)2
【摘要】通过对包含5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分析,提出了两种有效的汉语最长名词短语自动识别算法:基于边界分布概率的识别算法和基于内部结构组合的识别算法.实验结果显示,后者的识别正确率和召回率分别达到了85.4%和82.3%,取得了较好的自动识别效果.
【总页数】7页(P195-201)
【作者】周强;孙茂松;黄昌宁
【作者单位】不详;不详
【正文语种】中文
【中图分类】TP18
【相关文献】
1.基于归约的汉语最长名词短语识别方法 [J], 钱小飞;侯敏
2.基于混合策略的汉语最长名词短语识别 [J], 钱小飞;侯敏
3.统计和规则相结合的汉语最长名词短语自动识别 [J], 代翠;周俏丽;蔡东风;杨洁
4.汉语内层最长名词短语的识别研究 [J], 钱小飞
5.汉语内层最长名词短语的识别研究 [J], 钱小飞
因版权原因,仅展示原文概要,查看原文内容请购买。
国外硕士论文英语标题的特征与启示:以生物学为例
校园英语 / 高等教育国外硕士论文英语标题的特征与启示:以生物学为例渭南范学师院外国语学院/谢韶亮【摘要】从PQDT学位论文库和CNKI优秀硕士论文库,按要求分别收集了400个英语标题,并基于前人的研究将共800个论文标题分为四类,对比研究了国内外生物学方向的硕士论文英语标题。
同时考察了生物学硕士论文英语标题的平均长度和用词。
研究结果表明国内外生物学方向的硕士论文标题在标题类型,长度和用词方面都存在显著差异。
以高质量的欧美优秀硕士论文英语标题的特征为参照,以此启发国内同行注重标题的英语表达和功能,从而促进学术交流。
【关键词】硕士论文 英语标题 生物学一、研究背景我国用汉语写作的硕士学位论文通常需要为其撰写或翻译出相应的英语标题,这无疑会促进研究成果在世界范围内的传播与交流。
然而英语标题的这一作用却并未受到我国研究生和研究者的重视。
一方面,英语专业的研究者更多的只关注本专业研究生英语论文质量并对其进行研究。
另一方面,由于缺乏对语言的敏感性,非英语专业的研究者忽略了对论文英语标题的研究。
硕士论文英语标题研究的数量与国内外各大硕博论文库中呈爆炸式增长的论文数量的比例极不对称。
这种“井水不犯河水”的研究格局最终造成了对非英语专业学位论文英语标题研究的盲点。
在国外,硕博论文的语言和结构是专门用途英语研究的主要内容之一,相比英语期刊论文的研究,它同时也是新兴的研究课题之一。
在体裁分析的研究框架之下,研究者通过实证研究发现期刊论文和学位论文的体裁结构及语言特征,为更好的教授学术英语提供了坚实的指导材料和方法。
另一方面,随着英语在全球范围内的扩散,一些“外圈”英语国家的学术语篇的研究者希望借助对比修辞视角和手段发现英语为母语和英语为外语者的英语学位论文或学术论文体裁结构和语言使用上的异同,从英语为母语国家的论文中探寻“规范”,从而为本国的研究者指出一条“国际道路”。
在上述的研究背景之下,考虑到我国非英语专业硕士生在撰写或翻译其硕士论文英语标题时也会遇到一些无所适从的情况,并且在多数情况下这种境况将使其学位论文英语标题尽管是表达了论文的内容但难以实现英语版标题应具有的其他功能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n w s b u t n t h a k o i e e MNP r c g i o . e p p r frt a ay e h i r u i n a d t e sr cu e f au e o h e u s mp i o t e ts f Ch n s o e o n t nTh a e s n lz s t e d si t n h t t r e t r f t e i i tb o u
摘
要: 的” 以“ 字结构为核 心的最长名词短语是 汉语最长名词短语 的一个特殊子类。以该短语 的 自动识别为基础 重新分化 了汉语
MN P的识别任务。在 考察其结构和分布特征 的基础 上 , 出“ 提 先识 别右 边界 , 识别成果参与左边界识别” 的策略 , 并使 用边界 分布
概率模 型分治 了左右边界。实验基 于 8 5万字的新 闻语料 上进行训练 , 并在 4 2万字的同质语料上进行 了开放测试 , 取得 了 8 . % 06 3
meh d “ o n ay Dit b t n Po a it” t rcg i h h aeA c ru (b u .5 miin hn s C aa tr )o e s s to B u d r s iui rb bly o e o nz te p rs . op s a o t0 8 lo C ie e h rce r o i e l s f n w i
E- al q efyng 1 .o m i: i r i @ 63c n l
QI N io fi e o nt n o A X a - e. c g i o fMNP t “ e P r s ”c r . o ue n i e r g a d A pia o s 2 1 , 6 1 )1 8 1 1 R i h D - h a e o e mp tr E gn e i n p l t n , 0 0 4 ( 8 :3 - 4 . C n ci
的 正确 率 和 7 . %的 召回 率 。 56 8
关键词 : 最长名词短语 ; 的” “ 字结构 ; 识别; 浅层句法分析 D :03 7  ̄i n10 — 3 1 001. 4 文 章 编 号 :0 2 83 (0 0 1 — 18 0 文献 标 识 码 : 中 图分 类 号 :P 9 OI 1. 8 .s . 2 8 3 . 1.8 4 7 s 0 2 0 1 0— 3 1 2 1 )8 0 3 — 4 A T 31
中国传媒大学 文学院 , 北京 10 2 004
S ho o h ee Ln ug n irtr, o muiao nvr t o C ia B in 0 4 C ia col fC i s agaea d Lt aue C m nctn U i s y f hn , e i 10 2 , h n e i e i jg 0 n
Ab t a t nl sr c : e MNP w t i h “ - h a e c r s a s e il s b l s f MNP T e ie t c t n o h h a e i h s p p r gv s a De P r s ” o e i p ca u c a s o .h d ni ai f t e p r s n t i a e ie i f o
1 引言
最长 名词短语 ( P 是 指句子 中不被其他 名词短语 直接 MN ) 包含 的名词短语。它 的Байду номын сангаас别能够为 自动句法分析 、 机器翻译系
2 以“ ” 的 字结构 为核 心 的最 长 名词短 语的 界定
以“ 字结构为核心的最长名词短语( e M P 是 “ 字 的” d P N ) 的” 结构参与最长 名词短语句法核心 的构成的名词最长名词短 语。 “ 字结构(e ) 的” dP 的定义是界定该短语的关键 。
p r s t e i d a c s s ae y f “ d n i te i h b u d r f s , e i e t y h lf n ”F r e mo e i d p s h h a e, n t v n e a t t g o h a r I e t y h f t o n ay i t t n d n i t e e t e .u t r r , a o t t e f g r h f o h t
me a hiv s 0.3% i p e iin n 75. % i r c l. nt c e e 8 6 n r cso a d 68 n e a1
Ke r s y wo d :Ma i lN u hae MN ; - h ae ie t c t n;h l w asn xma o n P rs ( P) De P rs ;d ni ai s al p rig i f o o
1 8 2 1 ,6 1 ) 3 0 0 4 (8
C m ue ni ei n p l ao s o p trE g e r g ad A pi t n 计算机工程 与应用 n n ci
以“ 的” 字结构 为核心 的最 长名词短语识别研究
钱 小飞
Q A i -e I N X a fi o
u e o h uo t d nic t n t iig a d a oh ra o t04 lo hn s h rces i u e r ts.n h x e — sd fr te a tmai ie t ai r nn n n te( b u .2 mi in C iee C aa tr) S sd f eta d te e p f c i f o a l o i