句法语义接口问题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n a t u r a l l a n g u a g e p r o c e s s i n g . W e p r o p o s e t h e v a r i o u s a p p r o a c h e s t o l i n k s y n t a c t i c a n d s e m a n t i c e r p r e s e n t a t i o n s t o
f e a t u r e s t r u c t u r e
L U P a n - mi n g
现在世界范围的自 然语言处理研究工作, 大致都停留在句处理阶段。其进展不像希望的 那样快。 句处理的核心问题是怎么让计算机处 理、理解 自 然语言中一个句子的意思,又怎么 让计算机自 动生成一个符合自 然语言规则的、 让人能理解的句子。在这个问题的解决上,现 在可以说是八仙过海、各显神通。从大的方面 说,大致有两种策略,一种是基于规则的处理 策略,要求研究者拥有两方面的语言知识:一
是范 畴( c a t e g o y r ) 知识, 二是 规则 ( u r l e ) 知
识。范畴知识有句法的,有语义的;句法的如 主语、谓语、宾语、定语以及名词、动词、形 容词等, 语义的如施事、 受事、 工具以及数量、 领属、自 主、位移等。范畴用来刻画语言对象 的一个或一组特征。规则用来表述范畴间的关
( 着重看计算机的分析结果是否跟预期的要 求或目标相符) ,来调整原有的范畴体系、具 体语言成分的属性取值以及相关的规则,即改 进词库和规则库的内容。 基于统计的“ 句处理”
处理的汉语资源建设,已成为中文信息处理, 乃至我国的信息科技发展的关键性工程。在汉 语资源的建设中, 揭示、 描述句法语义的互动、
第四层: “ 存在”构式 ( C )
根据构式意义的需要在词库中物色具体词语而构 成具体句子一一 “ 湖面上漂着一条船”
第五层:存在句 ( S ) 以上当然也还只是一种假设。但这一假设为我 们深入探索句法与语义的接口问题提供了一 种思考的基础:而且,从实际的话语交际中, 我们确实也可以体会到: 说话者与听话者在下列认识上取得一致 义框架又一定通过特定的构式来加以表达,这 个特定的构式为能准确表述语义框架的内 容, 就在语言层面词库中选择最恰当、合适的词 语,选择最恰当、合适的词语组合规则, 形成交际需要的句子。
词义标记 ( W o r d s e n s e t a g g i n g )
篇 章 指 代标 记( A n a p h o r i c a n n o t a t i o n )
( 韵律标记 P r o s o d i c a n n o t a t i o n ) 以上是从大的方面说的。从小的方面说还各有 招术。但不管用什么策略, 用什么招术,都有 赖于或者说都离不开有关 自然语言的各种资 源,特别需要语法、语义等多方面分析研究成 果的支撑。具体到中文信息处理,那就是离不 开有关汉语的资源或者说知识。面向中文信息
现在先且不说一个句子的意思是不是由这些 意义组成的,即使承认是由 这些意义组成的,
就后一种思路来说, 王黎[ 6 ] 提出了 这样一 种看法:从客观世界到最后用言辞把人的感知
也还存在一个问题:这些不同的意义是怎样编 所得表达出来,这中间一共可以分为五层 ( 以 制成句子的意思的? 存在事件为例) : 客观存在一一一个湖面,一条船,船在湖面上 第一层:“ 存在”事件 ( E )
( 一) 具体的词汇意
( 甲) 句子语段成分的意义
句子的意义
( 1 ) 语法结构关系赋予的意义
( 二 ) W S A X
( 2 ) 语义结构关系赋予的意义 ( 乙) 句子超语段成分的意义一一句调所赋予的语气、情感意义
后来受到A d e l e E . G o l g b e r g [ 1 3 ] 的 构式语法
就是说,中间到底可以分析为几个层级 ( 或者 说层面,或者说阶段)?具体是什么样的层级 ( 或者说层面,或者说阶段)? 2 .我们该怎么研究意义框架?对于意义 框架的研究是否可以采取从上而下和从下而 上两头挤压的办法?譬如说研究 “ 获取”这一 意义框架,是否既可以研究 “ 获取”这一意义 框架可能会有哪些子框架— 诸如“ 抢” 框架、 “ 偷”框架、 “ 买”框架、“ 赢”框架、, ’ 拿” 框架,等等;也可以反过来,研究诸如 “ 抢” 框架、 “ 偷” 框架、 “ 买” 框架、 “ 赢” 框架、 “ 拿” 框架等,可以概括为什么样的上位意义框架。 3 .意义框架是否可以认为是由框架元素 以及框架元素之间的合乎逻辑的概念关系所 形成的?或者说是否可以认为意义框架是由 框架元素以及框架元素之间的合乎逻辑的概 念关系所构成的?意义框架内各个框架元素 之间是主从依存关系呢还是平等依存关系? 该理解为主从依存关系能更好地解释种种语 义现象呢, 还是该理解为平等依存关系能更好 地解释种种语义现象?这里,我还觉得,不管 你认为是主从依存关系还是平等依存关系,都 必须除了正面证明你所认可的依存关系之外, 还得证明为你所否定的那种依存关系之不可 取,以便强化人们对你所认可的那种依存关系 的认识和认同。 4 .单个意义框架,只能表述简单的意思, 要表达复杂的意思,必须要求多个意义框架参 与。这是不是就意味着存在着不同意义框架之 间的连接、协调和整合的问题?是不是还应该 研究各个意义框架之间的连接问题,还应该相 应地研究各个构式之间语言层面的相互连接
研究, 主要借助于计算机对大规模语料库真实
文本的统计分析,由计算机来抽象出语言知 识。因此,基于统计的 “ 句处理” ,其重要依 靠就是存放实际的语言交际中真实出现的语
接口 ( i n t e r f a c e )问 题是其中的一个重要组成 部分f 2 ] 4
朱德熙先生[ [ 9 ] 生前一直强调语法研究中
形式和意义的结合。这是从汉语本体研究的角 度来说的,是从汉语本体研究中悟出的道理。 从中文信息处理的角度说,巫需从交际过程中 编码、解码的角度来考虑问题。从交际过程中 编码、解码的过程来说,就是要解决好句法、 语义的接口问题。 怎么解决好句法语义的接口问题?现在 大家还是在探索之中。句法语义的接口问题, 我想,是否可以有不同的研究、探索的思路。 一种是从考虑句子意思的组成的角度来 研究探索,研究探索一个句子的意思是由哪些 意义编织成的,这些意思是怎样编制成一个句 子的意思的。这个思路可以看作是由外往里的 思路。另一种是考虑人到底是怎么把自己对于 客观世界的认知所得通过言辞表达出来的。这 个思路可以看作是由里往外的思路。 就前一种思路说, 一个句子的意思是由哪 些意义编织成的,是值得考虑、研究的。我先 前曾认为,句子的意思是由这样一些意义组成 的[ 3 ] :
A b s t r a c t : I n t h i s p a p e r , w e d i s c u s s t h e i s s u e o f i n t e r f a c e b e t w e e n s y n t a x a n d s e m a n t i c s f r o m t h e p e r s p e c t i v e o f
e a c h o t h e r . H o w e v e r , t h e r e a r e d i f f e r e n t p r o b l e m s f o r e a c h a p p r o a c h n e e d t o b e t a k e n i n t o c o n s i d e r a t i o n . K e y w o r d s : i n t e r f a c e b e t w e e n s y n t a x a n d s e m a n t i c s ; n a t u r a l l a n g u a g e p r o c e s s i n g ; c o n s t r u c t i o n ; s t u d y o f l e x i c a l
客观存在的事件通过感觉器官感知而 形成认知图式
第二层:“ 存在”认知图式 ( I )
告 认知图式投射到人类语言层面形成意义框架一一
存在物/ 事件、存在处所、存在方式 第三层: “ 存在”意义框架 ( F )
告 告
意义框架投射到一个具体语言 ( 如汉语) 而 形成 构式一一 “ 处所词语一动词一着一名词”
个范畴间建立起了一种联系,尽管这条规则所 描述的联系是粗糙的, 甚至不那么正确, 但是, 以这样的方式建立范畴之间的联系,是分析语 言的结构时必不可少的。而语言学家所要做 的,正是去寻找正确的和好的联系。范畴知识 一般用词库 ( 机器可读词典 MR D)来负载, 规则知识则由所谓规则库 ( 规则的集合)来承 担。计算机建立了词库和规则库,就可以利用 这些词库和规则库,按研究者的需要进行运 算、分析,然后研究者根据计算机的分析结果
文章编号:1 0 0 4 - 5 1 3 9 ( 2 0 0 6 ) 0 3 - 0 0 3 0 - 0 6
中图分类号:H 0 4 3
文献标识码:A
句法语义接口问题
陆俭 明
( 北京大学汉语语言学研究中心 /中文系,北京 1 0 0 0 8 9 )
摘 要:本文从自 然语言处理的角度探讨句法和语义的接口问 题,认为可以有不同的探索的思路,文章 对不同的探索思路作了 一定的分析,并就每一种探索思路提出了一连串 需要我们进一步研究、解决的问
终 最
才能 进行正常的、 顺畅的交际: 人对客观世界
的认知将形成一个概念框架, 这个概念框架一 定投射为某个特定的语义框架,这个特定的语 如果我们承认存在上面假设的内容,
还 也
有许多带关键性的问题需要我们去进一步研 究和探索: 1 .从客观存在的事物与现象到用言语表
达出 来,王黎〔 6 ] 设想了五个层面或者说阶段, 并作了具体说明,实际情况是不是这样呢?也
题.
关键词:句法语义接 口; 自 然语言处理;构式;词语的特征研究
O n I n t e r f a c e b e t w e e n S y n t a x a n d S e m a n t i c s
( D e p a r t m e n t o f C h i n e s e / t h e C e n t e r f o r C h i n e s e L i n g u i s t i c s , B e i j i n g 1 0 0 0 8 9 , C h i n a )
2 0 0 6 年第3 期
N o . 3 , Ma y 2 0 0 6
外 国语 J o u r n a l o f F o r e i g n L an g u a g e s
总第 1 6 3 期
Ge n e r a l S e r i a l No . 1 6 3
言材料的 语料库 ( c o r p u s ) 。 语料库可以 分“ 生
语料库”和 “ 熟语料库” 。所谓生语料库,是 指未加工的、未带有任何语言学信息标注的语 料库; 所谓熟语料库是指经过词的切分、词性 标注等一定加工的、带有语言学信息标注的语
料库。( [ 7 ] . [ s ] ) 可见,建设一个语料库,
( c o n s t r u c t i o n g r a m m a r ) 理论的 影响, 又认
为句子的意思是由 这样一些意义组成的[ 4 ] :
( 一) 具体的词汇意
Leabharlann Baidu
( 1 ) 语法结构关系赋予的意义
( 甲) 句子语段成分的意义
句子的意义
抽 象 的 ( 二 )关 系 义
( 2 ) 语义结构关系 赋予的意义 ( 三) 抽象的 句式义 ( 乙) 句子超语段成分的意义一一句调所赋予的 语气、 情感意义
除了通过某种手段录入大量语料外,重要的是 要对所录入的语料进行如下的标注加工:
词的 切分 ( S e g m e n t a t i o n , 或者说“ 分词” ) 词性标记 ( P a r t - o f - s p e e c h t a g g i n g )
句法 层 次和 范 畴 标 记 ( G r a m m a t i c a l p a r s i n g )
系。一个范畴可能刻画为几个特征,一个特征 也可能用来刻画多个范畴。所有规则都是建立 在已知的或者更确切点说是假设的范畴的基 础上。从逻辑上来说,所有规则都可以表示为
P i Q这样的 蕴涵式。 比 如, 可以 有这样的 规则, 如果某个词W . 是 主. 词 一 ( P ) , 那么W鱼生垫 ( Q ) 。 这条规则在 “ ‘ 名词” , 跟“ ‘ 主语” , 两
相关文档
最新文档