第8讲 语义分析(2012)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结构上是合乎语法的,但语义上是不合情 理的!
meaning
word meaning
meaningful
(flick) & meaningless (blick)
sentence meaning
meaningful
(Jack swims.) meaningless (swims metaphorical(比喻) every.)
(ran (the machine))). 有多层意思 ran(跑run,操作…)
(Tom
句子:Every boy loves a dog.
((Every
boy) (loves ( a dog))).
每个男孩都喜欢那只狗
每个男孩都有自己喜欢的狗
语义分析的重要性
看中文的例子: 猴子吃香蕉 学生吃食堂 老乡吃大碗
格表
菲尔摩认为命题中需要的格包括:
施事格:
工具格: 承受格 使成格 方位格 客体格 受益格 源点格
he laguhed. he cut the rope with a knife. he is tall. John dreamed a dream about Mary. He is in the house. He bought a book. He sang a song for Mary. I bought a book from Mary.
知网(Hownet)3
义原总数:1500多个 义原分类:共8类
–
基本义原 事件、实体、次要特征 属性、属性值、数量、数量值
– 语法义原:描述语法特征,如POS
语法
动态角色 动态属性
– 关系义原:描述意义关系,类似于格关系
知网
HowNet: www.keenage.com
而这些语义关系经过变换后,才在表层结构 中成为主语或宾语。
格的含义
“格”-case: 原指某些屈折语中用于表示词间语 法关系的名词和代词的形态变化。如主格、宾格 等--这些是传统上的格,属于表层格。
格语法中的格是“深层格”,是指句子中词与 词之间的及物性关系,如:动作和施事者的关系、 动作和受事者的关系等,这些关系就是语义关系。
格语法
菲尔摩(C.J.Fillmore)在题为《格辩》的论 文中,提出了格语法 格语法中,利用句子的动词周围的名词性 成分与动词的语义组合关系来形成表达句 子意义的格结构。
格语法
格语法是美国语言学家菲尔摩于1966年提出 的一种新理论。 他认为:句法分析中的主语、宾语等语法关 系只是表层结构上的概念,在语言的底层,所需 要的不是这些表层的语法关系,而是用施事、受 事、工具、受益等概念所表示的句法语义关系。
例1:资料已经看完了; 例2:他写毛笔
[中心1:“看” 角色[施事: “ ” 受事: “资料”]] 时态[完成态]] [中心2:“写” 角色[施事: “他” 受事: “ ” 工具: “毛笔”]]
通过计算食堂和地方的距离,可以看到“地方”的正 确词义
wordnet的应用例
WORDNET在计算语言界备受热衷
如:仅仅依靠wordnet,名词的语义消歧就超
过60% 它被广泛应用于主题含义识别;图像检索; 文本语义分类;网上文本过滤;语料库语义 标注等方面
wordnet
WordNet : http://wordnet.princeton.edu
ambiguous
bear
Jack
saw a man with a telescope.
从以上例子分析知道,仅仅在句法结构的层 次上分析出句子的结构,并不能妥善地解决机器 理解与翻译或其它方面的问题。 因此,还必须进行语义分析。
1 如果不考虑单词所具有的语义,就不能进行语 言的翻译。 2 句法结构相同的句子,它们的语义往往有着很 大的不同。这时,如果不进行语义分析,整个 分析工作就几乎寸步难行。 那么语义分析又是采用什么样的理论和方法 达到确切理解句子意思的目的呢? 下面我们具体来学习这些理论和方法,并回 过头来看看能否解决以上的问题。
wordnet
watery damp
parched
arid
moist humid
wet
dry dried-up
anhydrous sere
soggy
wordnet的应用例
通过句子内部概念密度的计算,可以消除 一部分歧义 例:食堂没地方,我在餐馆吃了蛋炒饭。
wordnet的应用例
Βιβλιοθήκη Baidu
食堂没地方,我在餐馆吃了蛋炒饭
第8讲 语义分析 semantics analysis
Language without meaning is meaningless!
语义分析的重要性
目前我们已经学习了:
分词、词性标注、统计和规则句法分析 演示同学作业
语义分析的重要性
仅仅知道了句子的结构,是否就可以了? 句子:Tom ran the machine.
词汇部分
为了实现语义分析,系统需设置各个动词的抽象的 框架结构。 如:“看”、“写”的抽象的框架结构分别为:
[中心1:“看” 角色[施事: (动物) 受事: (具体物)]] [中心2:“写” 角色[施事: (人类) 受事: (作品) 工具: (器具)]]
计算机根据以上框架结构和语义词典,可以分析 下面两个句子,得到具体的格框架结构:
关于语义的一些基本概念
义位 语义场 语义特征 格语法
语义网络
。。。
义位
在词典编撰中,称每一个词义为一个义项, 在语义学中也称之为义位:
如,“明白”有4个不同的意思:
内容、意思等使人容易了解;清楚;明确;
公开的、不含糊的;
聪明;懂道理; 知道;了解
这表明“明白”这个词包含四个不同的义位.
语义场的组成不是随意的,要求场内的各个义 位之间是互相联系、互相制约和互相规定的, 这种内在关系是外部世界中的关系决定的。 例:
“师傅和徒弟”,两个义位构成一个语义场,二者
共同规定外部世界中的一种关系。 但是单独“师傅”或“师傅和儿子”连个义位集合 都不是语义场,因为不是互相联系、制约或必然联 系。
格表
终点格:
I sold a car to Mary. 伴随格: he sang a song with Mary.
底层格是格语法解释语义和句法现象的 基本工具。但确定一张完整的格的清单却十 分困难。
每个框架都包含了一批词语,理解这些词语 的词义,必须以理解整个框架为前提。
比 如 “ Removing” 这 个 框 架 中 就 包 含 了 “abduct、clear、confiscate、……”等动词, 也包含了“ejection、elimination、……”等名词。 这些词语的“共性”(尽管句法上分属不同词类), 在同一个“语义框架”中得到了体现。
分析以上各句: “表层结构”不同:
各句的语法结构有所不同;
主语、谓语等属性也有所不同;
“深层结构”却是一致的:
施事格:the
boy 客体格:the door (也称受事格) 工具格:the key
均是针对动词“open”的语义关系。
格语法
格语法通常有三部分组成:
最初列出的6个格:
施事格(Agentive)
句子主动词所表现的事件、行为或状态等的主动发
起者,如:Tom broke the windows.
工具格(Instrumental)
该成分代表的对象是句子主动词所表现的事件、行
为中使用的工具,如Tom broke the windows with a ball.
分词: 食堂
没 地方, 我 在 餐馆 吃 了 蛋 炒饭
利用地方在wordnet的意思:
#1指地理位置 #2指空间 #3指部分
如祖国的某个地方 如没地方 如:他说话有对的地方
wordnet的应用例
将三种含义分别列在两棵不同的名词集成语义树上, 其中一个树的部分如图:
实在物 物体 空间 地区 地理范围 地方#1 区域 地方#2 人工物 建筑物 大厦 饭馆 食堂 粮食 炒饭 物质 营养物 食品 蛋
知网(Hownet)2
打017144 exercise|锻练,sport|体育 男人059349 human|人,family|家,male|男 生日072280 time|时间,day|日,@ComeToWorld|问 世,$congratulate|祝贺 写信089834 write|写,ContentProduct=letter|信件 北京003815 place|地方,capital|国都,ProperName| 专,(China|中国) 儿童基金会024083 part|部件,%institution|机构, politics|政,#young|幼,#fund|资金,(institution|机构 =UN|联合国)
语义场
任何义位都会与其他的义位通过某一种或 几种关系关联起来,这种由几个相互的义 位的语义系统称为语义场
语义场理论:一种语言的所有义位的集合是
该语言最大的语义场,这个大的语义场可分 成较小的子场,子场又可以继续分成更小的 场,这样一层层分下去,会在某个时候得到 不能再分的最小语义场。
语义场
看下面几个例子:
(1) The door opened. (2) The key opened the door. (3) The boy opened the door. (4) The door was opened by the boy. (5) The boy opened the door with a key.
表示由动词或状态的处所或空间方位 如.
He is in the house.
客体格(objective)
表示由动词确定的动作或状态所影响的事物
如.
He bought a book.
格语法
菲尔摩的格也被称为语义角色,深层格等。 格体现了句子动词和名词的语义组合关系。
举 例
(1)义位间的关系
上下义关系
指两个义位(上义义位和下义义位)间存在类属
关系
动物
生物
植物
… …
狮子
狗
牛
梧桐 杨树 槐树
狮子和狗是同位关系(co-hyponyms)
杨树是植物的下位关系词(hyponym) 生物是动物和植物的上义词(hypernymy)
上下位关系 例
(2) 整体-部分关系 part-meronym
作者:董振东董强 网站:http://www.keenage.com 概念描述举例 NO.=017144
W_C=打 G_C=V E_C=~网球,~牌,~秋千,~太极,球~得很棒 W_E=play DEF=exercise|锻练,sport|体育 其中DEF是核心,采用特定的“知识描述语言”
与格(Dative)
该成分代表的对象是句子主动词所表现的事件、行
为的参与者,如Tome give me a ball.
最初列出的6个格:
使成格(Factitive)
由动词确定的动作或状态所形成的客体 如:John
dreamed a dream about Mary.
方位格(locative)
基本规则 词汇部分
转换部分
基本规则
(1) S → M(形态)+P(命题) 形态→时、态、句式、情态和时间等 (2) P → V+C1+C2+…Cn P→Vb+格变元 Vb → run, walk, break,… (3) C → K+NP 格变元→格关系+[NP|S] 格关系→AGT,OBJ,SOUR,LOC,TIME…
一个义位所表达的对象是另一个义位所表 达的对象的组成部分。
例如:手是身体的一部分;
body, arm house, roof
整体-部分关系 例
其它
(3) 同义关系 synonym
hope,
wish narrow; old, young
(4) 反义关系 antonymy
wide,
分类:分类义场、关系义场、两极义场、同义义场
等;
语义特征
所有义位都能利用有限数量的语义特征进行组合而得 到。 例如:对“男人,女人”义场,可以通过义位分解 提取一些语义特征: 义位 男人 特征 人 是 性别 男
女人
是
女
例
wordnet 知网hownet
知网(Hownet)1