语义指向分析刍议

语义指向分析刍议
语义指向分析刍议

语文研究 1998年第3期(总第68期)

语义指向分析刍议

周 刚

80年代以来,我国汉语语法研究出现了一种新的语义分析方法,就是语义指向分析。随着语法研究从描写到解释不断深入和发展,语义指向分析已经越来越受到重视。但是,对这一方法的系统探讨和研究还不多见,本文旨在对语义指向分析的演进、类型、作用和语义指向的形式标志等问题加以探讨,以期起到抛砖引玉的作用。

1 语义指向分析的演进

1 1 语义指向分析的来源

关于语义指向分析的来源,语法学界已有两种说法:一种认为,(陆俭明1995)语义指向分析产生于80年代,胡树鲜(1982)在 两组副词的语义特点及其多项作用点 一文中已有萌芽,沈开木(1983)开始提到语义关系上的 指向 ,而第一次完整使用语义指向这个术语的是刘宁生(1984)。另一种则认为(沈开木1996),语义指向是由 指向 演化而来, 指向 是吕叔湘对沈开木(1983)一文审稿时提出来的,后来邵敬敏(1985)提出 语义指向 这一术语。

笔者有不同的看法。其实语义指向分析的源头还可以追溯到60年代,文炼(1960)就已指出汉语的句子在形式和意义上的不一致性,并且具体分析了这种语法现象: 他洗衣服洗得干干净净。 他看小说看得着了迷。

第 两句的格式相同,都是 主 谓 宾 谓(重用) 补 。但是表达的语义关系不完全一样:第 句的补语是说明宾语的,而第 句的补语是说明主语的。

文章虽然没有用到 语义指向 这一术语,但是使用了 说明 一词,相当于语义的指向。接着,李临定(1963)进一步讨论了有关补语跟其他成分的语义关系问题,却也没有使用 语义指向 这一术语,而延续使用 说明 一词。语义指向分析方法至此呈现萌芽状态。到70年代末,著名语言学家吕叔湘(1979)第一次明确地提出了 在语义上A指向C 的说法: 也有这种情形:论结构关系,A应该属于B,但是在语义上A指向C,例如:(a) 圆圆的排成一个圈 (圆的圈)|(b) 走了一大截冤枉路 (走得冤枉)|(c) 几个大商场我都跑了 (都总括几个)。

吕先生提纲挈领地分析了形容词状语、定语和副词状语三种成分的语义指向,为语法研究指出了一个新的方向。进入80年代,沈开木(1983)开始使用 指向 这一术语,分析了 也 字语义上的 多项指向 问题。刘宁生(1984)首次使用 语义指向 这一术语,论述了在句首的 在 介词结构的语义指向,指出 在 句法上是全句的修饰语,其语义指向却不一致,有时指向主语,有时指向谓语。此后, 语义指向 这一术语就使用开了,运用语

义指向分析方法研究汉语语法的论文也陆续发表出来。

1 2 语义指向分析的理论基础

语义指向分析发源于60年代,成型于80年代,有其必然性。我国汉语语法研究自第一部语法著作 马氏文通 出版到50年代初,基本上走的是传统语法学的路子,注重意义,而不注重形式。50年代起,开始受到美国结构主义语法理论和方法的影响,先后出现了一批成功运用描写语法学理论和方法的论著。但是也出现了只注重形式,不考虑意义的倾向。60年代初,汉语语法学界就已经注意到这个倾向,并有人撰文批评这种倾向,提倡 形式和意义相结合 的原则,文炼(1960)就批评一些人注重形式, 把不同的形式当作同一形式 , 割裂了形式和意义的关系 ,并指出: 同一形式可以表示不同的意义,而同样的意义也可以用不同的形式来表现。这个原则当然也适用于汉语。 又指出: 比较复杂一点儿的情形是表面上好像一个形式,骨子里是两个不同的形式。 并以歧义句式的分析揭示了形式和意义既统一又矛盾的关系。这篇文章揭示的歧义句式和补语在语义上 说明 主、宾语等一些语法现象给后来的研究以有益的启迪。70年代末,我国语法研究有了新的发展,形式和意义相结合的原则得到共识。著名语言学家朱德熙(1978、1979)很好地贯彻了形式和意义相结合的原则,接着(1980)提出了显性语法关系和隐性语法关系两个概念。陆俭明(1980)则更加明确地指出,这两种关系是语法结构关系和语义结构关系。他们把形式和意义相结合这个原则加以具体化了。这就是后来总结的(朱德熙1985): 真正的结合是要使形式和意义互相渗透。讲形式的时候能够得到语义方面的验证,讲意义的时候能够得到形式方面的验证。 与此同时,胡裕树(1981)文炼(1982)提出: 必须区别三种不同的语序:语义的、语用的、句法的。 在汉语语法研究中引进了 三个平面 的理论和方法。胡裕树、范晓(1985)进一步提出: 在汉语的语法分析中全面地、系统地把句法分析、语义分析和语用分析既界限分明地区别开来,又互相兼顾地结合起来。 三个平面理论的提出,为深化汉语语法研究指出了一条新路,使我们更加重视形式和意义的结合,静态和动态的结合,对语法现象进行多角度、多层面的分析。语义指向分析正是在这样的理论基础上产生和发展的。

2 语义指向分析的类型

2 0 所谓语义指向就是指句子中某一个成分跟句中或句外的一个或几个成分在语义上有直接联系,其中包括了一般所认为的语义辖域。运用语义指向来说明、解释语法现象,就称为语义指向分析。

句法结构和语义结构既有联系又有区别,成分之间的句法关系和语义关系有一致又有不一致的现象。例如:

(1)我重重地摔了一跤。 (2)我狼狈地摔了一跤。

例(1)的状语 重重地 语义指向谓语动词,二者之间的句法关系和语义关系是一致的。例(2)的状语 狼狈地 语义指向主语,二者之间的句法关系和语义关系不一致。语义指向分析着重用于句法关系和语法关系不一致的语法现象,换言之,语义指向主要考虑句法上非直接成分之间所发生的语义上的直接联系。

根据目前汉语语法关于语义指向分析的研究情况考察,可以以分析中是否考虑语境因素的影响而使语义指向发生变化为依据,把语义指向分析方法分为动态和静态两大类

型。

2 1 静态语义指向分析

我们在考察一个句子的某个成分的语义指向时,孤立地从这个句子出发,不考虑句外的语境等因素的影响,就可以直接分析出它的指向,而且这种语义指向一般是固定不变的。我们把这种语义指向分析称为静态语义指向分析。这种分析方法适合所有的句子,包括没有具体句外语境的抽象的句子,适合考察的句子成分是补语、状语、定语、谓语动词等。

(一)补语 例如:

(3)我干累了。 (4)他干完了活儿。

(5)我干快了。 (6)这活儿可把我干苦了。

例(3)补语 累 的语义指向主语 我 ,例(4)补语 完 的语义指向宾语 活儿 ,例(5)补语 快 的语义指向谓语动词 干 ,例(6)补语 苦 的语义指向介词 把 的宾语 我 。

(二)状语 如例(1)、(2),再如:

(7)大家圆圆地围成一个圈。

例(7)状语 圆圆地 的语义指向宾语 圈 。

(三)定语 例如:

(8)她昨天想了一天的心事。 (9)他买了十块钱的饲料。

(10)小王过了一个愉快的假期。(11)小李拔了十块钱的草。

例(8)定语 一天的 语义指向谓语动词 想 。例(9)定语 十块钱的 语义指向宾语 饲料 。例(10)定语 愉快的 语义指向主语 小王 。例(11)定语 十块钱的 语义既可以指向宾语 草 ,意思是 草值十块钱 ,也可以指向 小李拔草 这一行为,意思是 小李给人拔草得到十块钱 ,因此这是一个歧义结构。

(四)谓语中的动词 例如:

(12)我找个老师问。 (13)我找个老师教。

(14)我找个人一起去。 (15)三顿饭就把他吃厌了。

(16)一句话就把小张说火了。

例(12)谓语中的后一个动词 问 的语义指向主语 我 ,例(13)谓语中的后一个动词 教 的语义指向谓语中的前一个动词的宾语 老师 ,例(14)谓语中的后一个动词 去 的语义指向主语 我 和前一个动词的宾语 人 ,例(15)谓语动词 吃 的语义指向介词宾语 他 ,例(16)谓语动词 说 的语义指向并不是指向主语 一句话 ,而是指向句外某个表施事的成分。

这些语义指向跟句外的语境没有关系,都是从句子本身直接分析出来的,并且只有一种分析,不会变化。这种静态语义指向分析不涉及语用因素,因此也可以称为单纯语义指向分析。

2 2 动态语义指向分析

如果我们考察分析某个句子成分的语义指向时,需要考虑语境(主要是上下文)因素,那么语境不同,其语义指向也随之而不同。我们把这种语义指向分析称为动态语义指向分析。这种分析方法常用于副词的语义指向,例如:

(17)我只买了一本杂志。

这个句子中副词 只 的语义指向会受语境的影响而所指不同,例如:

(18)我没干什么,只买了一本杂志。 (19)我没买什么,只买了一本杂志。

(20)我没买多少,只买了一本杂志。

例(18)由于前一分句的谓词性成分是 干什么 ,后一分句的谓词性成分 买了一本杂志 成了全句的焦点,因此 只 在语义上指向述宾结构 买了一本杂志 。例(19)由于前一分句的谓词性成分是 买什么 ,后一分句的名词性成分 一本杂志 成了全句的焦点,因此 只 在语义上指向定中结构 一本杂志 。例(20)由于前一分句的谓词性成分是 买多少 ,后一分句的数量词语 一本 成了全句的焦点,因此 只 在语义上指向数量结构 一本 。以上这些语义指向跟语境密切相关,随着语境变化而变化。这种动态语义指向分析涉及语境、焦点等语用因素,因此也可以称为语用语义指向分析。

3 语义指向分析的作用

3 0 语义指向分析给我们揭示了句子成分之间,尤其是句法平面上间接成分之间的各种语义联系,证明了句法结构和语义结构之间的不一致性,从而可以帮助我们深入认识和解释语法现象。语义指向分析的具体作用大致有以下几方面。

3 1 作为进一步分析句子语义结构的有效手段。

句子的语义结构是以逻辑意义为基础而构成的深层结构,其基础部分是一个谓核结构,它是由谓词和谓词相联系的几个语义成分即论元组成,谓词是谓核结构的核心。根据逻辑推导,可以推出谓词联系哪几个强制性的语义成分,以这些成分的数目给谓词定 价 。此外,还考察动词跟名词之间的及物性关系,分析名词所担当的语义角色,如施事、受事、与事、工具、处所、时间等。而句子的语义结构远不止如此简单,在谓核结构的基础上还要加上各种修饰和补充成分,从而形成一个语义网络。一个复杂的语义结构往往同时包含好几个命题。分析这样的语义结构,用格语法和配价语法的理论和方法显然是不够的,它们只能分析名词和谓词之间的语义关系,而不能分析其他成分之间的语义关系。语义指向分析正弥补了这一缺陷,语义指向分析不限于名词和谓词之间的语义关系,还可以考察其他各种非直接成分之间语义上的直接联系。例如补语和主语(例(3))、宾语(例(4))之间,状语和主语(例(2))、宾语(例(7))之间,定语和谓语动词(例(8))之间在句法上不是直接成分,而在语义上有着直接的关系,我们可以运用语义指向分析方法来进行分析。如例(3)中补语 累 语义上指向施事主语 我 ;例(8)中定语 一天的 语义上指向动作 想 。实际上,语义指向分析就是分析句子的语义结构中的直接成分之间的关系。因此运用语义指向分析方法可以进一步分析句子的语义结构,揭示语义结构的特点。

3 2 帮助分化句子的歧义结构。

汉语句子存在着许多歧义结构,分化这些歧义结构各自的性质和特点,可以运用不同的方法。一般有层次切分法、成分定性法、变换分析法等。但是有些句子的歧义结构无法用这三种方法来加以分化。例如:

(21)你别锯坏了。

这个句子有歧义,既可以表示为(a) 你别把木头(或者其他被锯的东西)锯坏了 ,也可以表示(b) 你别把锯锯坏了 。对这种歧义,我们无法用上述的三种方法来加以分化,无论

从层次构造、句法关系上,还是从句式变换上看,在表示这两种意思的时候,都是一样的,其格式都是 NP+别+V+A+了 。分化这种歧义结构,就可以用语义指向分析法。这个格式的补语A(坏)的语义指向不同。表示(a)的意义时,补语A(坏)语义上指向V(锯)的受事,如木头等。表示(b)的意义时,补语A(坏)语义上指向V(锯)的工具,如锯。这样就分化了 你别锯坏了 这一歧义结构。

有时某些歧义结构运用语义指向分析法来加以分化,比较简单方便。例如:

(22)他只给了十元钱。

这个句子有歧义,既可以理解为(a)他光给了十元钱,(没有给别的什么)。也可以理解为(b)他仅给了十元钱,(没有多给一点儿)。这个格式的歧义是由限定副词 只 具有两个不同的义项造成的: 表示限定范围, 表示数量少。 只 表示 的意义时,理解为(a)义; 只 表示 的意义时,理解为(b)义。用说明词义虽然能分化歧义,但是比较复杂,不如用语义指向分析法来分化,比较简单方便。只需要指出 只 不同的语义指向就可以了。当句式表示(a)义时, 只 在语义上指向 钱 ;当句式表示(b)义时, 只 在语义上指向 十元 。

3 3 简要解释某些结构成分的句法语义功能。

语义指向分析方法也能够用来帮助说明解释一些比较复杂的结构成分的句法语义功能。比如说 动词+结果补语 ,(也称动结式述补结构,简称动结式)。有的能带宾语,有的不能带宾语;有的除了能带宾语外,还要求一个其他的成分与之共现。用配价概念来说,动结式有一价、二价、三价的区别。那么哪些动结式是一价的,哪些动结式是二价的,哪些动结式是三价的?有哪些规律?动结式的配价有不少因素在起作用,十分复杂,其中语义指向就是一个主要因素。(王红旗1995)动结式的配价要受动词和补语共同制约,补语的语义指向往往会直接影响动结式的配价。根据补语在语义指向上的差别,可以把动结式分成两大类型:一类是补语无语义指向的,另一类是补语有语义指向的。补语无语义指向的动结式的配价,只由动词的价来决定。即动词是一价的,由它构成的动结式的配价也是一价的;动词是二价的,由它构成的动结式的配价也是二价的。例如:

(23)孩子睡着了。 (24)他找到了钥匙。

补语有语义指向的动结式又可以分成两类:语义指向为述语动词的和语义指向为体词的。语义指向为述语动词的动结式的配价,也是决定于述语动词的价。例如:

(25)你走早了(一个小时)。 (26)他们查清了事故的原因。

例(25)动结式的补语 早 语义指向述语动词 走 , 走 是一价的,动结式的配价也是一价的。例(26)动结式的补语 清 语义指向述语动词 查 , 查 是二价的,动结式的配价也是二价的。

语义指向为体词性成分的动结式可以分成以下四种。

(一)语义指向为过程或状态的主体。这类动结式的述语由一价动词或形容词充当,表示过程或状态。补语语义指向过程或状态的主体,这类动结式的配价是一价。例如:

(27)天变冷了。

(二)语义指向为动作的施事。这类动结式的述语表示动作,补语语义指向动作的施事。这类动结式的配价是一价。例如:

(28)他们跳疯了。

(三)语义指向为动作的施事和其他语义角色。这类动结式的补语都是二价谓词,有两个语义指向,一个是施事,另一个是其他语义角色。这类动结式的配价是二价。例如:

(29)他干腻了这种活儿。

(四)语义指向为动作的受事、对象、结果、工具、处所、伴随、旁及、致使。这类动结式的述语表示动作,补语的语义指向是上述八种语义角色。这类动结式的配价是二价。例如:

(30)妈妈哭红了眼。

3 4 结合语用,拓宽语法研究的视野。

语义指向分析法开始运用于分析补语、形容词状语等在句中的语义指向,它是属于语义平面的。既而发展为分析副词的语义指向,而且不只限于句中,也可以在句外。同时又引进了语境、预设、意愿、焦点、已知信息、新信息等概念和分析的手段,把语义分析和语用分析,静态分析和动态分析有机地结合起来,开拓了语法研究的视野。

语义指向分析方法在上述方面成功的运用,给我们以启示:可以进一步发展运用到其他方面,比如连词和代词等。

有些连词由于位置不同其语义指向也不同。例如: 只有、只要、不管 等用在主语之前,其语义指向后边整个主谓结构;用在主语和谓语之间,其语义指向后边的谓语部分。从而可以引起句子意义的变化。例如:

(31)只有经理外出洽谈生意,他才能借此轻松一下。

(32)只要小张说清楚,他是不会有意见的。

这两句中的连词 只有 和 只要 都用在主语之前,其语义指向都是后边的整个主谓结构,后一分句的主语 他 也都是在一定语境中另有所指的对象,句子没有歧义。如果这两句中的连词都用在主语之后:

(31 )经理只有外出洽谈生意,他才能借此轻松一下。

(32 )小张只要说清楚,他是不会有意见的。

那么连词的语义指向就是后边的谓语部分,谓语动词的施事可能是前边的主语,也可能是一定语境另有所指的对象,后一分句的主语 他 既可以回指前一分句的主语;也可以另有所指。

关于代词的语义指向,已对 这样 的语义指向作了初步探索。其语义指向有三种情况:语义指上,语义指下和语义同步。语义指上即语义指向上面的整段话语或是句子、分句。语义指下即语义指向下面的话语。语义同步即语义就指向紧跟在它后面的词语;二者在语义上互相照应。(段业辉1987)这一分析虽然还有待商榷,但是它把语义指向分析的视域扩大到篇章,给人以启发。

4 语义指向的形式标志

4 0 我们在运用语义指向方法进行分析时,如何确定某一个成分的语义指向,似乎是不成问题的,往往依靠语感,就可以确定。静态的语义指向的对象一般就在句中,容易判断,尤其是谓语动词、补语、形容词状语的语义指向。因为这些成分都是谓词,如果跟哪个成分发生联系,在逻辑深层就构成一个简单命题,在语法表层转换为一个表述。例如:

例(3)补语 累 的语义指向主语 我 ,就可以成为一个表述: 我累 。但是有时并不好确定,例如:

(44)他竟倒霉地碰上这件事。

例(44)形容词状语 倒霉地 的语义指向,有人认为是 他 ,可以表述为 他倒霉 ;有人认为是 他+碰上这么件事 ,可以表述为 他碰上这么件事,倒霉 ;有人认为两可。谓词尚且如此,何况意义较虚的副词呢?因此,仅靠语感,语义指向分析就会见仁见智而产生分歧。所以,我们认为语义指向也需要用句法形式来加以验证。

语法研究的最终目的是要探究形式和意义之间的对应关系,即什么样的意义用什么样的形式来表示,反之,什么样的形式可以表示什么样的意义。虽然语义指向和句法结构之间存在着矛盾,表面看来二者不对应,但是形式和意义之间的对应关系是错综复杂的,我们应该把考察的视野开拓得更宽一些,不但可以考察语义指向所在的原句形式,还可以考察这个句子的变换形式。

4 1 我们可以考察句子中的标志词。比如:在 N1+(P+N2)+VR V 句式中确定动结式补语的语义指向,介词往往就是补语语义指向的形式标志。在 把 字句里补语在语义上总是指向 把 的宾语,我们就可以把 把 看作补语语义指向的标志词。在 被 字句里补语在语义上只指向自身的支配成分, 被 是V的支配成分标志,因此可以通过 被 判断出R V的指向。(张国宪1988)例如:

(45)我把刀砍坏了。 (46)孩子被狗吓哭了。

例(45) 把 指明补语 坏 的语义指向是 刀 ,例(46) 被 指明补语 哭 的语义指向是 孩子 。

4 2 我们还可以考察句子的语序。还是拿动结式补语的语义指向来说,当动结式前后都有支配成分时,补语的语义有较强的后指倾向。(张国宪1988)例如:

(47) a 保姆吓醒了。 (48) a 中国队打败了。

b 保姆吓醒了孩子。 b 中国队打败了美国队。

上述两个句子中,a例补语 醒 和 败 的语义分别指向主语 保姆 和 中国队 ,而b例在原句的动结式后边出现一个新的支配成分,补语原先的语义指向就改为指向后边的宾语 孩子 和 美国队 。

4 3 我们还可以考察句子格式。比如表限定的 只 的语义一定指向后边的成分,如果它出现在 N1+ 只 +V+N2 格式里,例如:

(49)她只学了英语。

例(49) 只 的语义指向宾语 英语 ,这时 英语 不能像一般的动宾句,提到动词或者主语的前边,否则句子站不住。那么我们可以说 只 的语义指向是用N1+ 只 +V+N2这种格式来表达,而不可以是主谓谓语句或 把 字句,前者就是它的形式标志。再比如表总括的 都 的语义一般指向前边的成分,如果它出现在 N+N+ 都 +V 格式里,例如:

(50) a 这些书我都读过。 b 我这些书都读过。

例(50) 都 的语义指向 这些书 ,这时 这些书 不能移到动词的后边。否则句子站不住。那么 都 的语义指向是用a和b两种格式来表达,而不可以是一般的动宾句,前者就是它的形式标志。

4 4 我们再可以考察句子的变换形式。比较:

(51)他喝醉了酒 他喝酒喝醉了 *他喝酒,酒醉了

(52)他吃腻了肉 他吃肉吃腻了 *他吃肉,肉腻了

(53)他踢破了球 *他踢球踢破了 他踢球,球破了

(54)他吃光了饭 *他吃饭吃光了 他吃饭,饭光了

上述四句可以分为两组,各组动结式中补语的语义指向不同,各组的变换形式也相应地不同,像这类句子的变换形式也可以看作语义指向的对应的句法形式。

以上只是举例性地谈谈,具体问题则有待于深入研究,不当之处还请方家批评指教。

参考文献

段业辉 1980 这样 的语义指向和已知信息的代词化, 汉语学习 第6期。

范开泰 1985 语用分析说略, 中国语文 第6期。

1993 三个平面语法分析, 语言教学与研究 第2期。

胡裕树 1981 现代汉语(增订本),上海教育出版社。

胡裕树 范 晓 1985 试论语法研究的三个平面, 新疆师范大学学报 第2期。

1992 有关语法研究三个平面的几个问题, 中国语文 第4期。

李临定 1963 带 得 字补语句, 中国语文 第5期。

刘宁生 1984 句首介词结构 在 的语义指向, 汉语学习 第2期。

陆俭明 1980 汉语口语句法里的易位现象, 中国语文 第1期。

1990/VA了0述补结构语义分析,5汉语学习6第1期。

1995关于语义指向分析,在日本东京日中友好会馆演讲稿。

卢英顺1995语义指向研究漫谈,5世界汉语教学6第3期。

吕叔湘1979汉语语法分析问题,商务印书馆。

邵敬敏1990副词在句法结构中的语义指向初探,5汉语论丛6,华东师范大学出版社。

沈开木1983表示/异中有同0的/也0字独用的探索,5中国语文6第1期。

1996论/语义指向0,5华南师范大学学报6社科版第6期。

沈阳1994现代汉语空语类研究,山东教育出版社。

王红旗1995动结式述补结构配价研究,5现代汉语配价语法研究6,北京大学出版社。

文炼1960论语法学中/形式和意义相结合0的原则,5上海师范学院学报6第2期。

1982句子分析漫谈,5中国语文6第3期。

1991与语言符号有关的问题)))兼论语法分析中的三个平面,5中国语文6第2期。

张国宪1988结果补语语义指向分析,5汉语学习6第4期。

张力军1990论/N P1+A+V P+N P20格式中A的语义指向,5烟台大学学报6社科版第3期。

朱德熙1978/的0字结构和判断句,5中国语文6第1)2期。

1979与动词/给0相关的句法问题,5方言6第2期。

1980汉语句法中的歧义现象,5中国语文6第2期。

1985语法答问,商务印书馆。

(周刚上海师范大学中文系200234)

语义分析

语义分析 1.语义分析? 机器机和人不一样的地方是人可以直接理解词的意思,文章的意思,机器机不能理解。 人看到苹果这两个字就知道指的是那个圆圆的,挺好吃的东西,搜索引擎却不能从感性上理解。但搜索引擎可以掌握词之间的关系,这就牵扯到语义分析。 可参考:https://www.360docs.net/doc/3913066891.html,/dispbbs.asp?boardID=2&ID=74541 2.为什么要使用语义分析? 我国中文自然语言处理普遍采用西基于拉丁语系的“关键词”技术,以此来分析理解中文。然而,中文本身的特点决定它与西语之间巨大的区别,所以从汉语信息处理的需要看,当前急迫需要突破的是语义问题。 可参考: https://www.360docs.net/doc/3913066891.html,/dicksong2008/blog/item/88fb751e9ac9501a4134 17f4.html 2.1中文与西语不同决定我们无法采用西语的架构体系来处理中文,具体区别在于: 西语词间有间隔,汉语词间无间隔。众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。 例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。 “我是一个学生”,分词的结果是:“我是一个学生”。中文分词就成了计算机处理的难题。 汉语形态不发达,句尾没有形态标记。英语动词、名词很清楚,加上词尾可以是副词;西语有时态,过去式、现在式等等非常清楚,中文则依靠词语或者依靠自己的判断来确定时态。 同音字多增加了机器识别的难度。 汉语语义灵活,由于形态不发达,所以语序无规律。在一次学术会议上,一位著名的人工智能专家说:“按…主-谓-宾?或…名-动-名?这一规则,计算机可显出…牛吃草?,也可显出…草吃牛?。从语法格式上看,…草吃牛?也不错,但这句话是说不通的。 人依靠自己的经验可以判断,机器如何来判断呢?

第三节 语义关系、语义指向和语义特征

第三节语义关系、语义指向和语义特征 一、语义关系 语义关系是指隐藏在句法结构后面由该词语的语义范畴所建立起来的关系。小李吃了/ 苹果吃了 吃饭了/ 来人了 (一)动词和名词语义关系的类别 1.施事:指动作行为的发出者,也可用介词“被(叫、让、给)”引进。 小牛在吃草。/杯子被王华打碎了。 2.受事:指动作行为的承受者,也可用介词“把(将)”引进。 小花猫逮住了一只大老鼠。/他把书拿走了。 3.系事:指联系动词连接的对象。 他是学生。/陈伟成了一名画家。 4.与事:指动作行为的间接承受者,也可用介词“给”引进。 他们送母校一幅油画。/他还给我一支笔。 5.结果:指动作行为产生的结果。 她在房间里打毛衣。/我们学校盖了一幢教学大楼。 6.工具:指动作行为的凭借物,也可用介词“用(拿)”引进。 你吃大碗,我吃小碗。/王涛用毛笔在写字。 7.方式:指动作行为进行的方法、形式。 明天考口试。/他用蝶泳游完了全程。 8.处所:指动作发生的处所或起总、终点,也可用介词“在(从、到)”引进。我住二楼。/陈小玉去了师大。 9.时间:指动作行为发生的时间,可用介词“在(从、到)”引进。 他回家乡过春节。/我的课请排在星期五。 10.目的:指动作行为发生的目的,可用介词“为(为了)”引进。 他在筹备展览会。/刘玲为考大学在复习。 11.原因:指动作行为发生的原因,也可用介词“因为”引进。 他在外呆了一个月避避风头。/他爷爷因为肺病住了院。 12.材料:指动作行为所使用的材料,也可用介词“用”引进。 他在给青菜浇水。/地板用油漆涂了一层。 13.致使:指动作行为使动的对象,也可用介词“使”引进。 我们要端正学习态度。/我们要使环境更加漂亮。 14.对象:指动作的对象,也可用介词“对(向)”引进。 他在教育孩子。/向同学们表示感谢。 (二)语义关系的解释力 同一个动词,与不同的名词性词语搭配就可能产生不同的语义关系。 吃面条、吃大碗、吃食堂、吃低保 妈妈在包衣服、他们在包饺子、外头包牛皮纸、礼品包小包 同一个名词性词语,与不同的谓词搭配也可能产生不同的语义关系。例如: 买毛衣、织毛衣 打人、来人 二、语义指向

情感分析简述

情感分析简述 分类:NLP2012-04-08 12:38 1022人阅读评论(3) 收藏举报情感classification算法测试translationmatrix 情感分析,我研究了也有半年有余了,ACL Anthology上关于情感分析的论文也基本看过了一遍,但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文基本上是ACL 和COLING还有EMNLP上历年关于情感分析的论文,本文应该学术性比较强一点,本文虽不打算发表,但由于将来可能还有用,以及关于学术上的原因,请大家如果要引用请务必标明出处 (https://www.360docs.net/doc/3913066891.html,/s/blog_48f3f8b10100irhl.html)。 概述 情感分析自从2002年由Bo Pang提出之后,获得了很大程度的研究的,特别是在在线评论的情感倾向性分析上获得了很大的发展,目前基于在线评论文本的情感倾向性分析的准确率最高能达到90%以上,但是由于深层情感分析必然涉及到语义的分析,以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。情感分析还存在的一个问题是尚未存在一个标准的情感测试语料库,虽然Bo Pang实验用的电影评论数据集(https://www.360docs.net/doc/3913066891.html,/people/pabo/movie-review-data/)以及Theresa Wilson等建立的MPQA(https://www.360docs.net/doc/3913066891.html,/mpqa/)是目前广泛使用的两类情感分析数据集,但是并没有公认的标准加以确认。 目前情感分析的研究基本借鉴文本分类等机器学习的方法,还没有根据自身的特点形成一套独立的研究方法,当然在某种程度上也可以把情感分析看出一种特殊的文本分类。比较成熟的方法是基于监督学习的机器学习方法,半监督学习和无监督学习目前的研究不是很多,单纯的基于规则的情感分析这两年已很少研究了。既然目前很多情感分析的研究基于机器学习,那么特征选择就是一个很重要的问题,N元语法等句法特征是使用最多的一类特征,而语义特征(语义计算)和结构特征(树核函数)从文本分类的角度看效果远没有句法特征效果好,所以目前的研究不是很多的。 由于基于监督学习情感分析的研究已经很成熟了,而且在真实世界中由于测试集的数量要远远多于训练集的数量,并且测试集的领域也不像在监督学习中被限制为和训练集一致,也就是说目前情感分析所应用的归纳偏置假设在真实世界中显得太强的,为了和真实世界相一致,基于半监督学习或弱指导学习的情感分析和跨领域的情感分析势必是将来的研究趋势之一。 在情感分析的最初阶段基于语义和基于规则的情感分析曾获得了比较大的重视,但是由于本身实现的复杂性以及文本分类和机器学习方法在情感分析应用上获得的成功,目前关于这方面的研究以及很少了,但是事实上,语义的相关性和上下文的相关性正是情感分析和文本分类最大的不同之处,所以将基于语义和规则的情感分析与基于机器学习的情感分析相结合也将是未来的研究趋势之一。 以下将分别对情感分析的起源,目前基于监督学习,无监督学习,基于规则和跨领域的情感分析的一些研究工作进行简单的介绍。 起源 虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al., 2002)基于监督学习(supervised learning)方法对电影评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。(Pang et al., 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。 在此之后的大部分都是基于(Pang et al., 2002)的研究。而相对来说,(Turney et al.,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。 监督学习 目前,基于监督学习的情感分析仍然是主流,除了(Li et al.,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al.,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。 一个和文本分类不同地方就是情感分析有时需要提取文本的真正表达情感的句子。(Pang et al., 2004)基于文本中的主观句的选择和(Wilson el al.,2009)基于文本中的中性实例(neutral instances)的分析,都是为了能够尽量获得文本中真正表达情感的句子。(Abbasi et al.,2008)提出通过信息增益(Information Gain,IG)的方法来选择大量特征集中对于情感分析有益的特征。 而对于特征选择,除了N元语法和词类特征之外,(Wilson el al.,2009)提出混合单词特征,否定词特征,情感修饰特征,情感转移特征等各类句法特征的情感分析,(Abbasi et al.,2008)提出混合句子的句法(N元语法,词类,标点)和结构特征(单词的长度,词类中单词的个数,文本的结构特征等)的情感分析。 除了对于文本的预处理,对于监督学习中情感分析还进行了以下方面的研究的。(Melville et al., 2009)和(Li et al.,2009)提出结合情感词的先验的基于词典的情感倾向性和训练文本中后验的基于上下文的情感情感倾向性共同判断文本的情感倾向性。(Taboada et al.,2009)提出结合文本的题材(描述,评论,背景,解释等)和文本本身的特征共同判断文本的情感倾向性。(Tsutsumi et al.,2007)提出利用多分类器融合技术来对文本情感分类。(Wan, 2008)和(Wan, 2009)提出结合英文中丰富的情感分析资源来提高中文情感分析的效果。 基于规则/无监督学习

副词“才”和“就”的语义指向研究

副词“才”和“就”的语义指向研究 专业:汉语国际教育学号:2014134117 姓名:方皓玥指导老师:刘伶俐摘要:“才”和“就”是现代汉语使用频率较高且在用法上有所联系和区别的副词,因此针对“才”和“就”的义项作为切入点,进行语义指向分析,并进行对比,得出:副词“才”在表示“刚刚”、“量多”、“表示强调或肯定”、“表示只有在某种情况或者由于某种原因产生的结果”时为前指;表示“事情发生或结束得晚”、“只,仅仅”、“量少”时为后指。副词“就”在表示“强调事情很早已经发生”、作为范围副词时限制范围义和“就”前动词/名词有联系、加强肯定的“就+动/形”结构,强调主语已符合谓语所提要求时为前指;“立刻,马上”、作为范围副词(一般情况下)、加强肯定的“就+是(在)”结构和“就+动”结构,表示意志坚决,不容改变、表示“承接上下文得出结论”时为后指。副词“才”和“就”在限制范围量小时语义指向都为后指,而在其他情况下两者语义指向并不相同。 关键词:语义指向;副词;对比;才;就

一、“语义指向”的界定 汉语语法学界关于语义指向分析的产生有着比较一致的看法:语义指向分析产生于我国上个世纪八十年代,并且这对世界语言学来说是一个贡献。 那么什么是语义指向呢?这一点学术界亦有诸多论断,不过大体是一致的。以下三个说法从不同方面对语义指向进行了说明: 周刚(1998)在《语义指向分析刍议》中指出所谓语义指向就是指句子中某一个成分跟句中或句外的一个或几个成分在语义上有直接联系,其中包括了一般所认为的语义辖域。句法结构和语义结构既有联系又有区别,成分之间的句法关系和语义关系有一致又有不一致的现象。即语义指向主要考虑句法上非直接成分之间所发生的语义上的直接联系。[1] 程树铭(2013)亦在相关论文中说明任何一个句子的组成成分之间总是同时并存着两种不同性质的关系:句法结构关系和语义结构关系。但这种关系并非一一对应:其一,相同的句法结构关系可以表示不同的语义结构关系;其二,不同的句法结构关系可以表示相同的语义结构关系。语义指向分析产生的缘由首先在于结构层次分析或者说直接成分分析的不足。[2] 陆俭明(1996)指出实际上,根据句法研究的需要,只有补语、修饰语(定语和状语)、谓语的语义指向值得考察。[3] 副词最主要的语法特征即副词都能做状语,有部分程度副词(很、极—好得很,好极了)还能做补语。因此在语义指向的研究中,副词是主要研究对象。本文便选择了“才”和“就”这两个副词进行语义指向的研究,选择这两个副词的原因是“才”和“就”在语义上对立,但在一定语境下也可以意义相同进行互换,这两个副词联系较为紧密。 二、副词“才”的语义指向研究 根据《现代汉语八百词(增订本)》(1999年)和《现代汉语虚词词典》(王自强主编,1998年1月第一版),“才”的副词语义大致可以分为:A.时间副词。(a)刚刚,表示事情在前不久发生;(b)表示事情发生或结束得晚。 B.范围副词。(a)表示“只”、“仅仅”;(b)表示数量少,程度低。 C.语气

现代汉语语法研究方法的演变及原因

现代汉语语法研究方法的演变及原因 摘要:本文以特定时期著名的语法理论和语法著作为研究对象,分析现代汉语语法研究方法在一个世纪的演变与发展,并试图找出语法研究方法演变与发展的原因。 关键词:语法研究、方法 一、现代汉语语法研究概况 1898年,马建忠参阅西洋语法,写出了《马氏文通》,才标志着中国现代语法学的全面建立。1924年,黎锦熙的《新著国语文法》问世,这是以白话文为对象,全面研究现代汉语语法的第一部力作。《新著国语文法》建立句本位,打破了《马氏文通》以来的“词类本位”的传统。他把句子划分成主语、述语、宾语、补足语、形容性的附加语、副词性附加语等六种成分,第一次明确地规定了分析句子的方法,建立了完备的现代汉语语法体系。这个时期,语法专题论文较少,最重要的当推赵元任的《北京、苏州、常州语助词的研究》(1926)。1938年,陈望道等人在上海发起了关于文法革新的讨论,这场讨论的目的是“以科学的方法严谨的态度缔造中国文法体系”。真正建立起新的汉语语法体系的是吕叔湘的《中国文法要略》(1942)和王力的《中国现代语法》(1943)此外,还有高名凯的《汉语语法论》(1948)美国赵元任的《国语入门》(1948)(《北京口语语法》)等重要作品问世。1949年新中国的成立,给汉语语法学带来了前所未有的变化,由于党和政府的提倡,社会上很快掀起了学习语法修辞的热潮。这个

时期可以称作语法学的发展时期。毛泽东对有关人士指示:“在报上写文章及为学校写文法教科书”,要在全社会普及“文法教育”。1951年6月6日,《人民日报》发表社论《正确使用祖国的语言,为语言的纯洁和健康而斗争!》。从此开始普及语法知识,重要的著作有吕叔湘、朱德熙的《语法修辞讲话》(1951)、吕叔湘的《语法学习》(1951)和张志公《汉语语法常识》(1952)等。一些学者进行科学的语法研究,对当时及以后的语言学产生了重要影响,如丁声树的《现代汉语语法讲话》、王力的《汉语史稿》和陆志韦的《汉语构词法》等。这个时期的语法研究还有一项引人注目的成果,即教学语法。中国第一次有了全国统一使用的教学语法体系——“暂拟汉语教学语法系统”。它划分词类是根据词的意义和语法特点,往往对每类词的语法特点都详加说明,分析句子时采用中心词分析法,在确定主语宾语时不依据施受关系,而大体依据位置的先后。到了新时期,汉语语法研究空前活跃,空前繁荣,空前深入,是语言学科中发展最快的一个部门,取得了举世瞩目的成就。吕叔湘的《汉语语法分析问题》(1979)、朱德熙的《现代汉语语法研究》(1980)影响深远。80年代以来,研究的实践越来越证明,对于现代汉语语法研究来说,“多角验证”的思路是既宽展又有效的。90年代以后,现代汉语语法研究比以往更加活跃,研究领域涉及汉语语法的各个方面,研究队伍更加壮大,取得的成果更加引人注目,新的理论、新的见解被提出来。“三个平面”理论、本位理论、配价语法、汉语的时体研究等问题都成为二十世纪末汉语语法研究的热点。这个时期,进一步加强了句法

在线词频、语义、情感分析工具试用心得

根据之前在@数据化管理 微博那里看到的一些在线效率工具,来试用一下。首先就从在线词频、语义、情感分析工具开始吧。 @数据化管理 推荐了三个网站,分别是图悦、大数据搜索与挖掘平台和腾讯文智。 以新浪微博“英国公投决定脱欧 新浪正实时解读”的直播页面为试用对象,地址 为https://www.360docs.net/doc/3913066891.html,/zt/l/v/news/ygtogt2016/ ①图悦:https://www.360docs.net/doc/3913066891.html,/ 初始页面背景是黑色的,看着不舒服,页面换肤后变成白底还可以接受。 左边文本栏可输入待分析的文本,也可以直接复制链接,很人性化。贴入要分析的网页地址,点击分析出图,右边就获得了分析结果。、 结果显示有多种模式,下面截图显示的是默认的热词权重图-标准模式。热词词频图是每个热词后面带括号显示词频,比较乱,不好看。微信模式是圆形的显示框变成扁椭圆式,地图模式是显示框为中国地图的轮廓。 可以导出EXCEL,列明分析出来的关键词、词频和权重。 ②大数据搜索与挖掘平台:https://www.360docs.net/doc/3913066891.html,/nlpir/ 看上去功能比较强大,同样可以输入网页URL进行文本抓取。分析结果分为多个板块: 分词标注:可以对词语的词性进行分类分析,发现新词

实体抽取:对文本的实体类型和实体内容进行分析,下图是图表效果,●代表实体类型,●代表实体内容。另外还有文本效果,内容是一样的,效果不如这个好看,就不截图了。 词频统计:按照名词、动词、形容词分类显示词频,有柱状图和折线图两类图表,鼠标停留在某个词上会显示词频数量。 文本分类:似乎是对文本所讨论的问题进行归类,猜哒。 情感分析:不太明确是啥意思 -。-,什么叫正面,什么又叫负面呢,特定人物又是谁?

语义指向分析刍议

语文研究 1998年第3期(总第68期) 语义指向分析刍议 周 刚 80年代以来,我国汉语语法研究出现了一种新的语义分析方法,就是语义指向分析。随着语法研究从描写到解释不断深入和发展,语义指向分析已经越来越受到重视。但是,对这一方法的系统探讨和研究还不多见,本文旨在对语义指向分析的演进、类型、作用和语义指向的形式标志等问题加以探讨,以期起到抛砖引玉的作用。 1 语义指向分析的演进 1 1 语义指向分析的来源 关于语义指向分析的来源,语法学界已有两种说法:一种认为,(陆俭明1995)语义指向分析产生于80年代,胡树鲜(1982)在 两组副词的语义特点及其多项作用点 一文中已有萌芽,沈开木(1983)开始提到语义关系上的 指向 ,而第一次完整使用语义指向这个术语的是刘宁生(1984)。另一种则认为(沈开木1996),语义指向是由 指向 演化而来, 指向 是吕叔湘对沈开木(1983)一文审稿时提出来的,后来邵敬敏(1985)提出 语义指向 这一术语。 笔者有不同的看法。其实语义指向分析的源头还可以追溯到60年代,文炼(1960)就已指出汉语的句子在形式和意义上的不一致性,并且具体分析了这种语法现象: 他洗衣服洗得干干净净。 他看小说看得着了迷。 第 两句的格式相同,都是 主 谓 宾 谓(重用) 补 。但是表达的语义关系不完全一样:第 句的补语是说明宾语的,而第 句的补语是说明主语的。 文章虽然没有用到 语义指向 这一术语,但是使用了 说明 一词,相当于语义的指向。接着,李临定(1963)进一步讨论了有关补语跟其他成分的语义关系问题,却也没有使用 语义指向 这一术语,而延续使用 说明 一词。语义指向分析方法至此呈现萌芽状态。到70年代末,著名语言学家吕叔湘(1979)第一次明确地提出了 在语义上A指向C 的说法: 也有这种情形:论结构关系,A应该属于B,但是在语义上A指向C,例如:(a) 圆圆的排成一个圈 (圆的圈)|(b) 走了一大截冤枉路 (走得冤枉)|(c) 几个大商场我都跑了 (都总括几个)。 吕先生提纲挈领地分析了形容词状语、定语和副词状语三种成分的语义指向,为语法研究指出了一个新的方向。进入80年代,沈开木(1983)开始使用 指向 这一术语,分析了 也 字语义上的 多项指向 问题。刘宁生(1984)首次使用 语义指向 这一术语,论述了在句首的 在 介词结构的语义指向,指出 在 句法上是全句的修饰语,其语义指向却不一致,有时指向主语,有时指向谓语。此后, 语义指向 这一术语就使用开了,运用语

语言学概论分类模拟语法(四)

语言学概论分类模拟语法(四) 分析题 1. 分析下面两个有歧义的语言片段,分析造成歧义的原因: (1)你这倒霉蛋的弟弟(2)三个艺术学院的学生 答案:(1)你这倒霉蛋的弟弟 属于组合歧义中的词义歧义,语义指向不同造成歧义。“倒霉蛋”可以指向“我”,意思是我是个倒霉蛋,我有个弟弟。“倒霉蛋”还可以指向“弟弟”,意思是我的弟弟是个倒霉蛋。 (2)三个艺术学院的学生 属于组合歧义中的语法歧义,层次不同造成歧义。“三个”可以修饰“艺术学院”,意思是有三个艺术学院,学生是这三个艺术学院的。“三个”也可以修饰“学生”,意思是艺术学院的三个学生。 2. 分析下面语段的层次,并说明其中含有哪几个词组、哪几个词、哪几个语素: 两本儿书、一份报纸我都收起来了。 答案:分析下面语段的层次,并说明其中含有哪几个词组、哪几个词、哪几个语素: 词组:两本儿书一份报纸我都收起来了 词:两本书一份报纸我都收起来了 语素:两本书一份报纸我都收起来了 3. 下面是台湾高山族阿眉斯语的一些句子和对应的汉语意义: nipatafaj kaku tiniraan. 我去陪伴他。 陪伴我他 niala tnira tura awaw. 他去拿那盏灯。 拿他那灯 u parakataj tmi. 阿麦是司机。 是司机阿麦 tku wama nimi. 阿麦父亲叫古拉斯。

古拉斯叫父亲阿麦 nitala hu kaku tmian. 我再去等一下阿麦。 等再我阿麦 niama kami tmian. 我们去阿麦那儿玩。 去玩我们阿麦 (1)写出上述材料反映的句子成分的语序。 (2)上述材料反映出来的表人专名有什么语法范畴? (3)上述材料反映出来的人称代词有什么语法范畴? (4)上述语法范畴是用什么语法手段表示的? (5)写出阿眉斯语表示宾格的语素。 答案:(1)上述材料反映阿眉斯语的句子成分的优势语序是BAC,即动词——施事——受事。 (2)上述材料反映表人专名的语法范畴有“格”,包括主格(如阿麦的主格mi)、所有格(如阿麦的形容词性所有格nimi和名词性所有格mian)和宾格(如阿麦的宾格mian)。 (3)上述材料反映出来的人称代词的语法范畴有“格”和“数”,“格”包括主格(如他nira)、宾格(如他iniraan),“数”包括单数(如我kaku)和复数(如我们kami). (4)上述语法范畴是用外部附加(ni)和内部屈折(如kaku—kaini)表示的。 (5)阿眉斯语表示宾格的语素有前加的i和后加的an。 4. 试以变换分析法说明下列句子的意义差异。 (1)墙上挂着画。 (2)台上演着梆子戏。 (3)山上架着炮。 答案:以上句子可以变换为: (1)墙上挂着画。………………………………………(1)a画挂在墙上。√ (2)台上演着梆子戏。…………………………………(2)a梆子戏演在台上。× (3)山上架着炮。………………………………………(3)a炮架在山上。√ (1)墙上挂着画。………………………………………(1)b墙上正在挂画。× (2)台上演着梆子戏。…………………………………(2)b台上正在演梆子戏。√ (3)山上架着炮。………………………………………(3)b山上正在架炮。√ 通过变换可见:“挂”的语义特征[+存现][-持续],“演”的语义特征[-存现][+持续],“架”的语义特征[+存现][+持续],即(1)墙上挂着画。表示存现、附着。(2)台上演着梆子戏。表示持续。(3)山上架着炮。有歧义,既可表示存现,又可表示持续。

语义分析

三、词法、语法、语义分析结合 一、实验目的与要求 在实现词法、语法分析程序的基础上,编写相应的语义子程序,进行语义处理,加深对语法制导翻译原理的理解,进一步掌握将语法分析所识别的语法范畴变换为某种中间代码(四元式)的语义分析方法,并完成相关语义分析器的代码开发。 二、实验内容 语法制导翻译模式是在语法分析的基础上,增加语义操作来实现的。对于给定文法中的每一产生式,编写相应的语义子程序。在语法分析过程中,每当用一个产生式进行推导或归约时,语法分析程序除执行相应的语法分析动作之外,还要调用相应的语义子程序,以便完成生成中间代码、查填有关表格、检查并报告源程序中的语义错误等工作。每个语义子程序需指明相应产生式中各个符号的具体含义,并规定使用该产生式进行分析时所应采取的语义动作。这样,语法制导翻译程序在对源程序从左到右进行的一遍扫描中,既完成语法分析任务,又完成语义分析和中间代码生成方面的工作。 输入:包含测试用例,如由无符号数和+、?、*、/、(、)构成的算术表达式的源程序文件。 输出:将源程序转换为中间代码形式表示,并将中间代码序列输出到文件中。若源程序中有错误,应指出错误信息。 三、实验设计 语法制导翻译模式实际上是对前后文无关文法的一种扩展。一般而言,首先需要根据进行的语义工作,完成对文法的必要拆分和语义动作的编写,从而为每个产生式都配备相应的语义子程序,以便在进行语法分析的同时进行语义解释。要求从编译器的整体设计出发,重点通过对实验二中语法分析程序的扩展,完成一个编译器前端程序的编写、调试和测试工作,形成一个将源程序翻译为中间代码序列的编译系统。 对文法G3[<算术表达式>]中的产生式添加语义处理子程序,完成无符号数的四则运算的计值处理,将输入的四则运算转换为四元式形式的中间代码。本实验只进行了算术表达式四元式的翻译。 四、源代码 1、在.h文件中添加了 //语义分析部分 #define PMAX 5//define 后面不加括号,定义产生式符号属性字符串的长度 int NXQ=0; /*全局变量NXQ用于指示所要产生的下一个四元式的编号*/ int NXTemp=1;//整型变量NXTemp指示临时变量的编号 int SentenceCount=1;//存放文件中句子的个数 struct QUATERNION /*四元式表的结构*/ { char op[PMAX]; /*操作符*/ char arg1[PMAX]; /*第一个操作数*/ char arg2[PMAX]; /*第二个操作数*/ char result[PMAX]; /*运算结果*/ }pQuad[256]; /*存放四元式的数组*/ char EBracket_Place[PMAX];//(E)的语义属性

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法 很有用,请好好学习之。 北语之声论坛专业精华转贴 现代汉语语法的五种分析方法是语法学基础里 很重要的一个内容,老师上课也会讲到,我在这 里把最简略的内容写在下面,希望能对本科生的专业课学习有所帮助 详细阐释中心词分析法、层次分析、变换分析法、语义特征分析法和语义指向分析的具体内涵:一. 中心词分析法: 分析要点: 1.分析的对象是单句; 2.认为句子又六大成分组成——主语、谓语(或述语)、宾语、补足语、形容词附加语(即定语)和副词性附加语(即状语和补语)。 这六种成分分为三个级别:主语、谓语(或述语)是主要成分,宾语、补足语是连 带成分,形容词附加语和副词性附加语是附加成分; 3.作为句子成分的只能是词; 4.分析时,先找出全句的中心词作为主语和谓

语,让其他成分分别依附于它们; 5.分析步骤是,先分清句子的主要成分,再决定有无连带成分,最后指出附加成分。 标记: 一般用║来分隔主语部分和谓语部分,用══标注主语,用——标注谓语,用~~~~~~标注宾语,用()标注定语,用[ ]标注状语,用< >标注补语。 作用: 因其清晰明了得显示了句子的主干,可以一下子把握住一个句子的脉络,适合于中小学语文教学,对于推动汉语教学语法的发展作出了很大贡献。 还可以分化一些歧义句式。比如:我们五个人一组。 (1)我们║五个人一组。(2)我们五个人║一组。 总结:中心词分析法可以分化一些由于某些词或词组在句子中可以做不同的句子成分而造成的歧义关系。 局限性: 1.在一个层面上分析句子,

层次性不强; 2.对于一些否定句和带有修饰成分的句子,往往难以划分; 如:我们不走。≠我们走。 封建思想必须清除。≠思想清除。 3. 一些由于句子的层次关系 不同而造成的歧义句子无法分析; 如:照片放大了一点儿。咬死了猎人的狗。 二. 层次分析: 含义: 在分析一个句子或句法结构时,将句法构造的层次性考虑进来,并按其构造层次逐层进行分析,在分析时,指出每一层面的直接组成成分,这种分析就叫层次分析。 朱德熙先生认为,层次分析不能简单地将其看作是一种分析方法,而是应当看做一种分析原则,是必须遵守的。(可以说说为什么) 层次分析实际包含两部分内容:一是切分,一是定性。切分,是解决一个结构的直接组成成分到底是哪些;而定性,是解决切分所得的直接组成成分之间在句法上是什么关系。

副词才和就的语义指向研究

副词才和就的语义指向 研究 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

副词“才”和“就”的语义指向研究专业:汉语国际教育学号:姓名:方皓玥指导老师:刘伶俐 摘要:“才”和“就”是现代汉语使用频率较高且在用法上有所联系和区别的副词,因此针对“才”和“就”的义项作为切入点,进行语义指向分析,并进行对比,得出:副词“才”在表示“刚刚”、“量多”、“表示强调或肯定”、“表示只有在某种情况或者由于某种原因产生的结果”时为前指;表示“事情发生或结束得晚”、“只,仅仅”、“量少”时为后指。副词“就”在表示“强调事情很早已经发生”、作为范围副词时限制范围义和“就”前动词/名词有联系、加强肯定的“就+动/形”结构,强调主语已符合谓语所提要求时为前指;“立刻,马上”、作为范围副词(一般情况下)、加强肯定的“就+是(在)”结构和“就+动”结构,表示意志坚决,不容改变、表示“承接上下文得出结论”时为后指。副词“才”和“就”在限制范围量小时语义指向都为后指,而在其他情况下两者语义指向并不相同。 关键词:语义指向;副词;对比;才;就

一、“语义指向”的界定 汉语语法学界关于语义指向分析的产生有着比较一致的看法:语义指向分析产生于我国上个世纪八十年代,并且这对世界语言学来说是一个贡献。 那么什么是语义指向呢?这一点学术界亦有诸多论断,不过大体是一致的。以下三个说法从不同方面对语义指向进行了说明: 周刚(1998)在《语义指向分析刍议》中指出所谓语义指向就是指句子中某一个成分跟句中或句外的一个或几个成分在语义上有直接联系,其中包括了一般所认为的语义辖域。句法结构和语义结构既有联系又有区别,成分之间的句法关系和语义关系有一致又有不一致的现象。即语义指向主要考虑句法上非直接成分之间所发生的语义上的直接联系。[1] 程树铭(2013)亦在相关论文中说明任何一个句子的组成成分之间总是同时并存着两种不同性质的关系:句法结构关系和语义结构关系。但这种关系并非一一对应:其一,相同的句法结构关系可以表示不同的语义结构关系;其二,不同的句法结构关系可以表示相同的语义结构关系。语义指向分析产生的缘由首先在于结构层次分析或者说直接成分分析的不足。[2] 陆俭明(1996)指出实际上,根据句法研究的需要,只有补语、修饰语(定语和状语)、谓语的语义指向值得考察。[3] 副词最主要的语法特征即副词都能做状语,有部分程度副词(很、极—好得很,好极了)还能做补语。因此在语义指向的研究中,副词是主要研究对象。本文便选择了“才”和“就”这两个副词进行语义指向的研究,选择这两个副词的原因是“才”和“就”在语义上对立,但在一定语境下也可以意义相同进行互换,这两个副词联系较为紧密。 二、副词“才”的语义指向研究 根据《现代汉语八百词(增订本)》(1999年)和《现代汉语虚词词典》(王自强主编,1998年1月第一版),“才”的副词语义大致可以分为:A.时间副词。(a)刚刚,表示事情在前不久发生;(b)表示事情发生或结束得晚。B.范围副词。(a)表示“只”、“仅仅”;(b)表示数量少,程度低。C.语气副词,表示肯定、强调。D.表示只有在某种情况或者由于某种原因产生的结果。 “才”既可前指也可后指,但“才”是单指向副词,即在一个句子中,“才”的语义指向只有一个。下文会讨论“才”作为副词每一个义项的语义指向。 (一)作为时间副词 作为时间副词,“才”有两个义项,当它表示“刚刚,事情才发生不久”时,既可放在单句中,也能放在前一小句,后一小句用“就”呼应,表示两件事紧接着 发生,如: (1)我才从上海回来不久。(吕叔湘《现代汉语八百词(增订本)》) (2)你才来就走,忙什么呢(王自强《现代汉语虚词词典》) (3)这是他们在莫干山消夏的纪念品,前几天断了线,新近才换好的。(茅盾《创造》)

名词解释

名词解释 32.音节结构的元辅音分析法 这种音节结构分析方法以元辅音为基本分析单位,把音节结构分为V、C—V、V—C、C—V-C等四种基本类型(其中的V代表元音,C代表辅 音)。 例如汉语普通话中的(一)、[t‘i](题)、[an](安)、[t‘an](谈)等四个音节分别属于上述四种基本类型。 33.语义指向 语义指向是指句子中某个成分在语义上指向哪儿,或者说同哪个或哪些成分发生语义联系。例如,补语位臵上的成分,在语义上既可能 指向主语,如?我吃饱了?中的?我?;也可能指向宾语,如?我吃光了碗里的饭?中的?碗里的饭?。 34.意音文字 意音文字指一部分字符是意符,一部分字符是音符的文字。如汉字就是意音文字,汉字中许多字符是直接表意的,而假借字则是假借意符直接表音、间接表意的音符。 35.语言规划 语言规划是指社会对语言文字问题所作出的有组织的、有意识的管理、调节和改进。例如,我国国家语言文字工作委员会所作的推广普 通话、文字改革、语言规范化、制定正确的民族语言政策等工作。 四、简答题 36.举例说明为什么说音位的辨义功能实际上是由区别特征负担的。

(1)具体语言中的每个音位都可以分解为几个区别特征,不同音位之间的对立实际上可以进一步分解为区别特征之间的对立,因此音位 的辨义功能实际上是由区别特征来负担的。 (2)例如,汉语普通话里/k//k‘/和/p/三个音位具有辨义功能,它们的语音特征分别是?舌根、闭塞、不送气?、?舌根、闭塞、送气?和?双唇、闭塞、不送气,?/k/通过?不送气?和/k‘/相区别〃,通过?舌根?和/p/相区别。因此,像 ?干?/kan51八?看?/k‘an51/和?办?/pan51/等三个词在语音形式上的区别可以归结为这三个音位在区别特征上的对立。 37.请结合实例说明语法的抽象性表现在哪些方面。 (1)所谓?抽象?即对具体的东西进行类的概括。语法规则就是对人们说的话中的单位、结构和关系的某种类的概括。(2)语法单位类别的抽象。如以从词的用法建立词类为例。(3)语法关系类别的抽象。如以从结构形式建立语法结构为例。(4)语法意义类别的抽象。如以从形态或格式建立时态意义、句式意义等为例。 38.以实例说明义素分析的方法和主要步骤。 (1)确定对比的范围。一般来说,义素分析应该先从指称事物最小类别成员的一组词语开始,如有需要,再进一步扩大对比分析的范围。分析?男人?的义素,可以先从?男人?与?女人?、?男孩?的对比开始,因为它们同属于?人?这个最小类别。 (2)比较词义的异同。对比的范围确定之后:下一步就是运用对比分析的方法,找出不同词义在语义成分上的共同点和不同点,也就是提取它们的共同义素和区别义素。比如要分析?男人、女人、男孩?的义素,可以首先比较这三个词的意义,从中提取出共同义素[人],然后将?男人?与?女人?比较,提取出区别义素[±男性],再将?男人?和?男孩?比较,提取出区别义素[±成年]。利用这些共同义素和区别义素,不仅可以使这三个词的意义互相区别开来,而且也可以使它们同其他的词语相区别。通过对比分析,找出不同词语的共同义素和区别义

语义指向分析

现代语法研究课程 ——语义指向分析 (汉语言文学082班曾庆飞080501110079) 关于语义指向分析的来源,语法学界已有两种说法:一种认为:(陆俭明1995) 语义指向分析产生于80 年代,胡树鲜(1982) 在《两组副词的语义特点及其多项作用点》一文中已有萌芽,沈开木(1983) 开始提到语义关系上的“指向”,而第一次完整使用语义指向这个术语的是刘宁生(1984) 。另一种则认为:(沈开木1996) ,语义指向是由“指向”演化而来,“指向”是吕叔湘对沈开木(1983) 一文审稿时提出来的,后来邵敬敏(1985) 提出“语义指向”这一术语。在语法分析中运用语义指向分析的文章很多,重要的研究者还有马希文、张力军、周小兵、李小荣、沈阳等。 语义指向指句中某个成分与哪一个成分之间有语义联系。例如:“我和他只有一个弟弟”,状语“都”与主语“我和他”有意义联系,是前指,状语“只”只是后指宾语“一个弟弟”。两者语义指向不同。通过分析句中某一成分的语义指向来揭示、说明、解释某种语法现象,这种分析手段就称为“语义指向分析”。语义指向分析其实就是要在“相同的句法结构关系”中发现“不同的语义结构关系”,或者说是通过辨认句法结构成分之间的不同联系来确定可能存在的多种语义结构关系中的一种。 句法结构和语义结构既有联系又有区别,成分之间的句法关系和语义关系有一致又有不一致的现象。例如: (1) 我重重地摔了一跤。(2) 我狼狈地摔了一跤。 例(1) 的状语“重重地”语义指向谓语动词,二者之间的句法关系和语义关系是一致的。例(2) 的状语“狼狈地”语义指向主语,二者之间的句法关系和语义关系不一致。语义指向分析着重用于句法关系和语法关系不一致的语法现象。 汉语句法的分析很多种,常见的有层次分析法、变换分析法、语义特征分析法、配价分析法、语义指向分析等。陆俭明《现代汉语语法研究教程》(第三版)中指出有三种句法成分的语义指向,很值得大家考察。 (一)是补语。例如: (1)砍光了 (2)砍累了 (3)砍钝了 (4)砍快了 (5)砍疼了 (6)砍坏了 其中,“光”、“累”、“钝”、“快”、“疼”、“坏”都是“砍”的补语,但这些补语的语义指向各不同。“光”在语义上指向“砍”的受事,如“树砍光了”。“累”在语义上指砍的施事,如“我砍累了”。“钝”在语义上指向“砍”的工具,如“刀砍钝了”。“快”在语义上指向“砍”这一动作本身,用来表现动作的速度,如“你砍快了,慢点儿砍”。“疼”在语义上有可能指向“砍”的受事,如“你把砍疼了”,

面向理解的文本情感分析研究

面向理解的文本情感分析研究 伴随着互联网的飞速发展,用户使用网络的方式悄然转变。用户 正在从单纯的信息获取者成为信息的发布者。这种转变使得大量带有个人情感的信息在网络中传播、发酵、聚集,并作用于真实社会。如 何对网络中的情感信息进行分析和理解是自然语言处理研究的重要 课题,同时,相关技术也具有广泛的应用。目前情感分析的相关研究取得了很大进展,但是依然存在一些问题:第一、在数据层面,对于面向 具体语言或领域的标注数据不足,往往影响了情感分析系统的性能。 针对这一问题,基于迁移学习的情感分析方法取得了一定的进展,但 是相关研究对于数据迁移过程中的错误累积以及由此引起的负面迁 移现象缺乏深入的研究,导致基于迁移学习的情感分析性能受到制约。第二、在语义层面,目前主流的基于表示学习的情感分析方法往往将 情感文本和情感要素作为多个孤立的研究对象,缺乏统一的计算体系 对这些对象之间的潜在语义关系进行分析和理解,影响细粒度情感分 析性能的同时,也阻碍了对文本情感理解的深入。第三、在认知层面,目前的文本情感分析研究大多数集中在对文本情感表达的分析,但对 于如何发现文本中所蕴含的情感产生原因缺乏系统地研究,阻碍了面 向理解的情感分析研究的深入。针对上述三个层面的问题,本文主要 进行了以下的研究工作:在数据层面,针对样例迁移过程中的负面迁 移问题,本文提出了一种基于高斯分布负面迁移检测的情感分析方法。该方法一方面通过基于高斯分布的类噪声估计结果对迁移过程中可 能误选的错误样本进行检测和筛选,另一方面利用类噪声估计的结果

对当前分类器进行基于近似可学习理论的性能估计,从而预估当前迁移周期之后分类器的性能变化趋势,以避免负面迁移的产生。在跨语言和跨领域情感分析数据集上的实验结果显示,基于高斯分布负面迁移检测的方法可以有效地迁移来自其他语言和领域的标注数据,有效提高了目标语言和目标领域情感分析的性能。分析显示,基于高斯分布负面迁移检测方法性能优于其他典型样例迁移方法,同时该方法可以保证分类器性能的总体上升趋势。对基于高斯分布负面迁移检测方法的理论分析显示,该方法受到稠密的数据分布以及数据先验知识要求的制约。为此,本文提出了一种基于拉德马赫和分布的类噪声估计算法。这一算法利用最大熵对噪声的先验分布进行约减,并使用拉德马赫和分布替代高斯分布进行类噪声的估计,从而规避了对稠密数据分布以及数据先验知识的要求。在此基础上,提出了一种基于类噪声估计结果的损失函数修正算法,通过理论分析证明了在训练数据足够多的前提下该算法的收敛性。在面向跨语言和跨领域的情感分析数据集上的实验结果显示,基于拉德马赫和分布的负面迁移检测方法比目前主流方法性能更为可靠,进一步提高了跨语言和跨领域情感分析的准确性与通用性。这一结果也显示在数据层面上进行迁移学习对提高文本情感分析性能的有效性。在语义层面,针对现有基于表示学习的情感分析方法往往将词语语义表示、情感持有者语义表示、情感对象语义表示作为孤立表示任务的不足,本文提出了一种面向多源异质信息的统一语义表示方法。通过构建基于共现统计信息的多源异质网络,对情感词语、情感持有者、情感对象之间的潜在关系进行基于网络结

语义分析练习题

练习题: 一、指出下列语句中加“·”的名词性成分所担任的语义角色: 1、售票处 .. ..都在挤电影...围满了人.,大家 票.。 2、昨天 ..我买了一部词典 ....。 3、我家去年盖了一幢小楼 ....。 4、李老师退休时赠给学校图书馆 .....一批书。 5、他.是跳舞明星,他会跳探戈 ..。 6、这个小店方便了周围的群众 .....。 7、食堂 ..吃。 ..我吃不惯,我还是在家里 8、陈朗用红木 ....。 ..打了一套家具 9、这件事 ...他有他的想法。 10、他对我.说了许多大道理 .....。 二、分析下列语句中加“·”的词语的语义指向: 1、有一天,他在饭店里喝醉.了酒。 2、你干得太快 ..了。

3、老师傅手把手教会.了两个徒弟。 4、他在院子里深深 ..地挖了一个坑,栽了一棵树。 5、他把各种书籍杂乱无章 ....地装在书架上。 6、妈妈给儿子找了一件干净 ..的内衣。 7、我走了一大段冤枉 ..路。 8、我们忽然 ..发现了老虎。 9、这篇论文可把我写苦.了。 10、孙梅一听到这个消息慌慌张张 ....地转身就走。 三、同样一个动词“考”,可以说:考大学、考研究生、考数学、考笔试、考五分,请分析它们的语义关系。 四、“老张有辆新车很得意”、“老张有条小狗很聪明”没有歧义,而“老张有个女儿很骄傲”则有歧义,请运用语义指向以及语义特征分析法作出解释。 五、我们可以说:“谦虚点儿”“老实点儿”“灵活点儿”,但是,不能说:“健康

点儿”“伟大点儿”“高尚点儿”。为什么?试运用语义特征分析法做出解释。 六、请举例说明带“得”的述补谓语句,补语的语义指向分别指向谓语、主语和宾语的情况。 七、请运用语义指向的分析法分化下列歧义结构: 1、他不吃面条。 2、国王的脾气你也知道的。 思考题: 一、名词和名词可以构成偏正短语,试放心它们的语义关系。 二、请分析一下“今年又是一个丰收年”的语义指向。“又”指向哪里? 三、“厂里有一辆新车”是歧义的,请用语义特征分析法解释其中的道理。

相关文档
最新文档