语义成分分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
成分分析
Componential Analysis
制作人:陈杰
意 义 研 究 方 法
分析词汇间的横向和纵向关 系 成分分析法
历史背景
丹麦语言学家叶尔姆斯列夫(L. Hjelmslev)在1943年 提出了词义可分的想法,即一个词项可以分解为一组 an] 、[adult] 、 [female] 这几个成分。这一设想得 到了很多语言学家的支持,美国的语言学家布龙菲尔 德还提出了“语义特征”(semantic feature)的术语, 即语义成分(semantic component),来为这最小的意 义单位命名。随着结构主义语言学的发展,语义成分 分析法(Componential Analysis)应运而生,并成为研 究语义成分的核心方法。 这一方法是1956年,人类学家古迪纳夫在《成分分析 以及意义研究》一文中提出的,最初只是人类学家用 来分析不同语言中的亲属词语的。随后,很多语言学 家,如鲍狄埃、卡茨(J. Kats)、福多(J. A. Fodor)等 人都相继提出了相关理论,引起了语法学和语义学界 的高度重视。
1 语义成分分析能够判 断词语的搭配是否合理 例如, A. A boy kicked a ball. B. A ball kicked a boy. 从语法的角度和从句法结构来看,这两句话的句型都是“主 语+ 谓语+ 宾语”结构,并且所用的词语完全一样。然而我们 认为A 句是合理的、可接受的,而B 句是不合理、不可接受 的,属于“ 异常组合” 中的“ 不合适组合 (inappropriateness)”———即“违反了某种选择性规则的 限制的组合”。因为通过语义成分分析我们知道,谓语动词 “kicked”要求主语必须是动物名词,即带有语义成分 [+ANIMATE]的名词,而“ball”并不含有语义成分 [+ANIMATE]。
语义成分分析方法的初衷主 要是研究词汇的语义含义
定义
Componential analysis, also called feature analysis or contrast analysis, refers to the description of the meaning of words through structured sets of semantic features, which are given as “present”, “absent” or “indifferent with reference to feature”. (Ottenheimer, 2006, p. 20) One way of formalizing, or making absolutely precise, the sense-relations that hold among lexemes is by means of componential analysis. As its name implies, this involves the analysis of the sense of a lexeme into its component parts.(Lyons,2000,p.107) 简单说就是:语义成分分析就是从一组意义相关的 词语中抽取其共同特征的做法,这些共同成分就是 语义成分(sense components)或称义素(semes)。
2 语义成分分析能够衡量短语和句子的意义能否被接受 我们运用语义成分分析对“bachelor”一词进行分析: bachelor = [+HUMAN] & [+MALE] & [+ADULT]&[MARRIED] 这样我们就可以断定“He is a married bachelor.”是个语 义异常的句子,属于“异常组 合”中的“自相矛盾(paradox)”- - 即“词组中的义素 发生了矛盾”。因为“bachelor”一词中含有一个语义成 分[-MARRIED],这与其修饰语“married”相矛盾。
(二)语义成分分析能够揭示和分析其具体关系 语义成分分析能够揭示和分析对称关系、同义关系、 近义关系、多义关系、反义关系、上下 义关系,有利于人们区别词义和运用联想式思维掌 握词义。 例1 语义成分分析可以揭示词汇之间的对称关系 通过语义成分分析,我们得知“man”与 “ woman”, “ boy” 与“ girl”, “ father” 与 “mother”,“husband”与“wife”,“uncle”与 “aunt”,“bachelor”与“spinster”之间存在着相 同的对应关系,而这种对应关系事实上就是语义成 分[+MALE]与[-MALE]的对立。
语义成分的描述形式 通常有两种:语义成分结构式、语义成分矩形图
语义成分结构式 man= [+HUMAN]&[+MALE]&[+ADULT] woman=[+HUMAN]&[-MALE]&[+ADULT] boy=[+HUMAN]&[+MALE]&[-ADULT] girl=[+HUMAN]&[-MALE]&[-DAULT]
3. 提取区别义素 例如:仍然拿词群“man”“woman”“boy”“girl” 来举例,“man”和“woman”,“boy”和“girl”的 区别性特征在于性别,于是二者的区别性语义成分分别 为[+MALE] 和[+FEMALE] “man”和“boy”, “woman”和“girl”的区别性特征在于是否成年,于 是二者的区别性语义成分分别为[+ADULT]和[-ADULT]。 提取对比词群中的共同语义成分与区别语义成分是进行 语义成分分析的关键,因此,值得我们注意的有两点: 1.在提取共同语义成分与区别语义成分时,我们要抓住 最能够反映事物本质特征的语义成分,对于那些非本质 特征的语义成分,我们可以忽略。 2.提取出来的语义成分,必须是最小的、不能够继续分 析的。
例2 语义成分分析能够精确地区分近义词 如果两个词的多数语义成分相同,个别语义成分有 差别,那么这两个词可以被视为一对近义词,如: “kill”和“murder”这两个词都有cause (somebody / something) die (使...死亡)的 意思。通过语义成分分析,我们可以将它们分解为:
word kill murder
sense components 0INTEND INTEND +CAUSE +CAUSE +DIE +DIE
这样我们可以清楚地看出,“kill”在语义成分 [±INTEND]上处于一种中间状态(用符号“0” 表示),即“kill”的动作既可以是“in an intended way ( 有意的, 蓄意的)”, 也可以是“in an unintended way(无意的)”。而“murder”一词含有 语义成分[+INTEND], 即“murder”的动作是“kill in an intended way(谋杀,即有意的,蓄意的杀害)”, 这点是与“kill (杀死)”相区别的。
语义成分分析的方法
语义成分分析的步骤 1. 确定分析对象,选准对比词群 例如:我们想通过语义成分分析来分析“bull”这个词, 我们就可以把这个词和“cow”“calf”放在一起进行 比较和分析,因为这三个词有共同之处—都属于 “bovine”,即拥有同一个语义成分[BOVINE]。 2. 提取共同义素 例如:我们要分析一组词 “man”“woman”“boy”“girl”,显而易见,这组词 有共同的语义成分[HUMAN]。 “man”“woman”有共 同的语义成分[ADULT]。 “boy”“girl”有共同的语义 成分[NON-ADULT]。 “man”和“boy”有共同的语义成 分[MALE]。 “woman” 和“girl”有共同的语义成分 [FEMALE]。因此我们就可以把这些共同的语义成分提取 出来。
成分分析,即把一个词的意义剖析到它最终的 对比成分,就像把数字分解成因子的数学过程。 (利奇,1987,P127-128)
借鉴音位学中区分因素和语音区别性特征的方法, 对词的意义构成也进行切分,试图找出一些普遍的 语义成分,用于词义的分析,这种方法被称为语义 成分分析法(componential analysis)。(束定 芳,2000,P62)
(五) 语义成分分析“能够使语义描写形式 化” 语义成分分析实际上是对词义的形式化描写,是 计算机处理自然语言过程中所必需的知识,可以 帮助我们编写一部语义形式化的词典,对建立机 器翻译系统、人工智能系统有非常重要的意义。 近来,我国很多学者将语义成分分析用在很多语 义场的分析中,如:丰富的烹调词语、军衔、坐 具等方面,做出了十分有益的尝试。
语义成分分析的作用
语义成分分析是对词语的形式化的描写,揭示了语义的 微观层次,提供了语义结构,从而说明了词义的构成以 及词与词之间的语义关系,因而,语义成分分析对语义 的研究具有很大的作用, 其作用主要表现在以下几个方面:
(一)语义成分分析能够简明、精确地揭示词语的概念意义, 词语的概念意义是指“一个词的中心意义或核心意义” 一种语言中构成所有词义的义素数量要比词义数量少得多, 因为不同义位包含共同义素是极普遍的现象。采用义素分析 方法归纳词义,是一种简化而精确的方法 例如: 我们运用语义成分分析对单词“bachelor”和“spinster” 进行分析: bachelor = [+HUMAN] & [+MALE] & [+ADULT]&[-MARRIED] spinster = [+HUMAN] & [-MALE] & [+ADULT] &[-MARRIED] 这样,这两个词语的语义特征和概念意义就显而易见了.
语义成分矩形图 word man woman boy girl sense components HUMAN + + + + 或 word Man Woman Boy girl sense components +HUMAN +HUMAN +HUMAN +HUMAN +MALE -MALE +MALE -MALE +ADULT +ADULT -ADULT -ADULT MALE + + ADULT + + -
4.义素分析的描写 要用元语言将语义特征简明地记录下来。这里 需要说明的是,语义成分代表的是独立于任何 个别语言的成分,具有语言中立性质的一些抽 象的概念,因此,作为语义成分的[HUMAN], [MALE]与英语单词“human”“male”是不能 混为一谈的。因此,我们就可以用[+HUMAN], [+MALE],[-HUMAN],[-MALE]来进行描述语 义成分(“+”表示具有此语义特征“-”表示 不具有此语义特征)。
(三) “语义特征可以用来定义自然类别事物” 语义特征可以用来定义自然类别事物,因此 [HUMAN] 可以定义有关人类的名词,[[ANIMATE]可以定义非动物名词。这对确定语义 限制条件很有作用。因此语义成分分析能够“科 学地解释词的组合搭配特点和局限性”,判断词 语的搭配是否合理,衡量短语和句子的意义能否 被接受, 并帮助我们处理语义混乱(anomaly)。
(四) 语义成分分析“可以解释句子之间的蕴涵、同义和 矛盾关系” 如: a. He picked a tulip. b. He picked a flower.。 通过进行语义成分分析, 我们知道,“tulip”的语义成分 包含了“flower”所有的语义成分,即“tulip”和“flower” 之间存在着上下义关系,“tulip”是“flower”的下义词, “flower”是“tulip”的上义词。因此句子a 与句子b 之间 是蕴涵关系。 c. Elizabeth II is Queen of England. d. Elizabeth II is a man. 通过进行语义成分分析, 我们知道,“queen”含有一个 语义成分[-MALE], 这与“man”所含有的语义成分 [+MALE]相矛盾。因此句子e 与句子f 之间是矛盾关系。
Componential Analysis
制作人:陈杰
意 义 研 究 方 法
分析词汇间的横向和纵向关 系 成分分析法
历史背景
丹麦语言学家叶尔姆斯列夫(L. Hjelmslev)在1943年 提出了词义可分的想法,即一个词项可以分解为一组 an] 、[adult] 、 [female] 这几个成分。这一设想得 到了很多语言学家的支持,美国的语言学家布龙菲尔 德还提出了“语义特征”(semantic feature)的术语, 即语义成分(semantic component),来为这最小的意 义单位命名。随着结构主义语言学的发展,语义成分 分析法(Componential Analysis)应运而生,并成为研 究语义成分的核心方法。 这一方法是1956年,人类学家古迪纳夫在《成分分析 以及意义研究》一文中提出的,最初只是人类学家用 来分析不同语言中的亲属词语的。随后,很多语言学 家,如鲍狄埃、卡茨(J. Kats)、福多(J. A. Fodor)等 人都相继提出了相关理论,引起了语法学和语义学界 的高度重视。
1 语义成分分析能够判 断词语的搭配是否合理 例如, A. A boy kicked a ball. B. A ball kicked a boy. 从语法的角度和从句法结构来看,这两句话的句型都是“主 语+ 谓语+ 宾语”结构,并且所用的词语完全一样。然而我们 认为A 句是合理的、可接受的,而B 句是不合理、不可接受 的,属于“ 异常组合” 中的“ 不合适组合 (inappropriateness)”———即“违反了某种选择性规则的 限制的组合”。因为通过语义成分分析我们知道,谓语动词 “kicked”要求主语必须是动物名词,即带有语义成分 [+ANIMATE]的名词,而“ball”并不含有语义成分 [+ANIMATE]。
语义成分分析方法的初衷主 要是研究词汇的语义含义
定义
Componential analysis, also called feature analysis or contrast analysis, refers to the description of the meaning of words through structured sets of semantic features, which are given as “present”, “absent” or “indifferent with reference to feature”. (Ottenheimer, 2006, p. 20) One way of formalizing, or making absolutely precise, the sense-relations that hold among lexemes is by means of componential analysis. As its name implies, this involves the analysis of the sense of a lexeme into its component parts.(Lyons,2000,p.107) 简单说就是:语义成分分析就是从一组意义相关的 词语中抽取其共同特征的做法,这些共同成分就是 语义成分(sense components)或称义素(semes)。
2 语义成分分析能够衡量短语和句子的意义能否被接受 我们运用语义成分分析对“bachelor”一词进行分析: bachelor = [+HUMAN] & [+MALE] & [+ADULT]&[MARRIED] 这样我们就可以断定“He is a married bachelor.”是个语 义异常的句子,属于“异常组 合”中的“自相矛盾(paradox)”- - 即“词组中的义素 发生了矛盾”。因为“bachelor”一词中含有一个语义成 分[-MARRIED],这与其修饰语“married”相矛盾。
(二)语义成分分析能够揭示和分析其具体关系 语义成分分析能够揭示和分析对称关系、同义关系、 近义关系、多义关系、反义关系、上下 义关系,有利于人们区别词义和运用联想式思维掌 握词义。 例1 语义成分分析可以揭示词汇之间的对称关系 通过语义成分分析,我们得知“man”与 “ woman”, “ boy” 与“ girl”, “ father” 与 “mother”,“husband”与“wife”,“uncle”与 “aunt”,“bachelor”与“spinster”之间存在着相 同的对应关系,而这种对应关系事实上就是语义成 分[+MALE]与[-MALE]的对立。
语义成分的描述形式 通常有两种:语义成分结构式、语义成分矩形图
语义成分结构式 man= [+HUMAN]&[+MALE]&[+ADULT] woman=[+HUMAN]&[-MALE]&[+ADULT] boy=[+HUMAN]&[+MALE]&[-ADULT] girl=[+HUMAN]&[-MALE]&[-DAULT]
3. 提取区别义素 例如:仍然拿词群“man”“woman”“boy”“girl” 来举例,“man”和“woman”,“boy”和“girl”的 区别性特征在于性别,于是二者的区别性语义成分分别 为[+MALE] 和[+FEMALE] “man”和“boy”, “woman”和“girl”的区别性特征在于是否成年,于 是二者的区别性语义成分分别为[+ADULT]和[-ADULT]。 提取对比词群中的共同语义成分与区别语义成分是进行 语义成分分析的关键,因此,值得我们注意的有两点: 1.在提取共同语义成分与区别语义成分时,我们要抓住 最能够反映事物本质特征的语义成分,对于那些非本质 特征的语义成分,我们可以忽略。 2.提取出来的语义成分,必须是最小的、不能够继续分 析的。
例2 语义成分分析能够精确地区分近义词 如果两个词的多数语义成分相同,个别语义成分有 差别,那么这两个词可以被视为一对近义词,如: “kill”和“murder”这两个词都有cause (somebody / something) die (使...死亡)的 意思。通过语义成分分析,我们可以将它们分解为:
word kill murder
sense components 0INTEND INTEND +CAUSE +CAUSE +DIE +DIE
这样我们可以清楚地看出,“kill”在语义成分 [±INTEND]上处于一种中间状态(用符号“0” 表示),即“kill”的动作既可以是“in an intended way ( 有意的, 蓄意的)”, 也可以是“in an unintended way(无意的)”。而“murder”一词含有 语义成分[+INTEND], 即“murder”的动作是“kill in an intended way(谋杀,即有意的,蓄意的杀害)”, 这点是与“kill (杀死)”相区别的。
语义成分分析的方法
语义成分分析的步骤 1. 确定分析对象,选准对比词群 例如:我们想通过语义成分分析来分析“bull”这个词, 我们就可以把这个词和“cow”“calf”放在一起进行 比较和分析,因为这三个词有共同之处—都属于 “bovine”,即拥有同一个语义成分[BOVINE]。 2. 提取共同义素 例如:我们要分析一组词 “man”“woman”“boy”“girl”,显而易见,这组词 有共同的语义成分[HUMAN]。 “man”“woman”有共 同的语义成分[ADULT]。 “boy”“girl”有共同的语义 成分[NON-ADULT]。 “man”和“boy”有共同的语义成 分[MALE]。 “woman” 和“girl”有共同的语义成分 [FEMALE]。因此我们就可以把这些共同的语义成分提取 出来。
成分分析,即把一个词的意义剖析到它最终的 对比成分,就像把数字分解成因子的数学过程。 (利奇,1987,P127-128)
借鉴音位学中区分因素和语音区别性特征的方法, 对词的意义构成也进行切分,试图找出一些普遍的 语义成分,用于词义的分析,这种方法被称为语义 成分分析法(componential analysis)。(束定 芳,2000,P62)
(五) 语义成分分析“能够使语义描写形式 化” 语义成分分析实际上是对词义的形式化描写,是 计算机处理自然语言过程中所必需的知识,可以 帮助我们编写一部语义形式化的词典,对建立机 器翻译系统、人工智能系统有非常重要的意义。 近来,我国很多学者将语义成分分析用在很多语 义场的分析中,如:丰富的烹调词语、军衔、坐 具等方面,做出了十分有益的尝试。
语义成分分析的作用
语义成分分析是对词语的形式化的描写,揭示了语义的 微观层次,提供了语义结构,从而说明了词义的构成以 及词与词之间的语义关系,因而,语义成分分析对语义 的研究具有很大的作用, 其作用主要表现在以下几个方面:
(一)语义成分分析能够简明、精确地揭示词语的概念意义, 词语的概念意义是指“一个词的中心意义或核心意义” 一种语言中构成所有词义的义素数量要比词义数量少得多, 因为不同义位包含共同义素是极普遍的现象。采用义素分析 方法归纳词义,是一种简化而精确的方法 例如: 我们运用语义成分分析对单词“bachelor”和“spinster” 进行分析: bachelor = [+HUMAN] & [+MALE] & [+ADULT]&[-MARRIED] spinster = [+HUMAN] & [-MALE] & [+ADULT] &[-MARRIED] 这样,这两个词语的语义特征和概念意义就显而易见了.
语义成分矩形图 word man woman boy girl sense components HUMAN + + + + 或 word Man Woman Boy girl sense components +HUMAN +HUMAN +HUMAN +HUMAN +MALE -MALE +MALE -MALE +ADULT +ADULT -ADULT -ADULT MALE + + ADULT + + -
4.义素分析的描写 要用元语言将语义特征简明地记录下来。这里 需要说明的是,语义成分代表的是独立于任何 个别语言的成分,具有语言中立性质的一些抽 象的概念,因此,作为语义成分的[HUMAN], [MALE]与英语单词“human”“male”是不能 混为一谈的。因此,我们就可以用[+HUMAN], [+MALE],[-HUMAN],[-MALE]来进行描述语 义成分(“+”表示具有此语义特征“-”表示 不具有此语义特征)。
(三) “语义特征可以用来定义自然类别事物” 语义特征可以用来定义自然类别事物,因此 [HUMAN] 可以定义有关人类的名词,[[ANIMATE]可以定义非动物名词。这对确定语义 限制条件很有作用。因此语义成分分析能够“科 学地解释词的组合搭配特点和局限性”,判断词 语的搭配是否合理,衡量短语和句子的意义能否 被接受, 并帮助我们处理语义混乱(anomaly)。
(四) 语义成分分析“可以解释句子之间的蕴涵、同义和 矛盾关系” 如: a. He picked a tulip. b. He picked a flower.。 通过进行语义成分分析, 我们知道,“tulip”的语义成分 包含了“flower”所有的语义成分,即“tulip”和“flower” 之间存在着上下义关系,“tulip”是“flower”的下义词, “flower”是“tulip”的上义词。因此句子a 与句子b 之间 是蕴涵关系。 c. Elizabeth II is Queen of England. d. Elizabeth II is a man. 通过进行语义成分分析, 我们知道,“queen”含有一个 语义成分[-MALE], 这与“man”所含有的语义成分 [+MALE]相矛盾。因此句子e 与句子f 之间是矛盾关系。