知网 HowNet - 清华大学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于WordNet的评述(3) 的评述( ) 关于 的评述
Princeton paper continues: To address these shortcomings, we are working to enhance WordNet by adding a radically different kind of information. The idea is to add quantified, oriented arcs between pairs of synsets, e.g. from {car, auto} to {road, route}, from {buy, purchase} to {shop, store}, and also in the opposite direction. Each of these arcs will bear a number corresponding to the strength of the relationship. We chose to use the concept of evocation – how much one concept evokes or brings to mind the other – to model the relationships between synsets.
Entity thing (physical, mental, fact) component (part, fitting) time space (direction, location) Event (relation, state; action) Attribute AttributeValue
知网不是什么?( 开场白 --知网不是什么?( ) 知网不是什么?(2)
近年他在另外的场合又说: 近年他在另外的场合又说 “HowNet is a database/network of semantic relationships among Chinese words. Conceptually it’s similar to WordNet of English, but the author claims they differ substantially. For one thing, HowNet is NOT free. Well, they are making words A-D free for download, as a teaser.”
Can a doctor walk? (2)
3. “event”义原分类体系表 义原分类体系表
│ ├ {AlterLocation|变空间位置 变空间位置} 变空间位置 │ │ ├ {SelfMove|自移 自移} 自移 │ │ │ ├ {SelfMoveInManner|方式性自移 方式性自移} 方式性自移 │ │ │ │ ├ {roam|流浪 流浪} 流浪 │ │ │ │ ├ {walk|走} 走
概念相似度计算
贪官 <> 学生 贪官 <> 教师 贪官 <> 校长 贪官 <> 市长 walk <> run walk <> jump walk <> swim walk <> fly walk <> buy 0.307692 0.355556 0.386667 0.454545 0.144444 0.144444 0.130159 0.124444 0.018605
概念相关关系的建立
试比较HowNet 试比较 关于WordNet的评述 关于 的评述
试比较HowNet 试比较
举例: 举例
buy 床
关于WordNet的评述(1) 的评述( ) 关于 的评述
On WordNet [1] Jordan Bo Boyd-Graber et al., Oct. 2005, Adding Dense, Weighted Connections to WordNet (Princeton paper) [2] Rila Mandala et al., ACL W98, 1998, The Use of WordNet in Information Retrieval (TIT paper)
知网中概念的定义 (2) )
Concept definitions in HowNet – “buyer”
{human|人:domain={commerce|商业 人 商业},{buy|买:agent={~}}} 商业 买 Cf.
Synset definition in WordNet – “buyer”
知网中概念的定义 (1) )
Concept definitions in HowNet – “buy” 1. {GiveAsGift|赠:manner={guilty|有罪 有罪}, 赠 有罪 purpose={entice|勾引 勾引}} 勾引 2. {buy|买} 买 Cf. Synset definition in WordNet – “buy” 1. buy, purchase (obtain by purchase;) 2. bribe, corrupt, buy, make grease palm (make illeagal payment)
知网不是什么?( 开场白 --知网不是什么?( ) 知网不是什么?(3)
知网不是语义词典、义类词典、概念词典、 知网不是语义词典、义类词典、概念词典、 英汉双语词典 – 知网不是词典 知网不是汉化的WordNet、不是WordNet的 、不是 知网不是汉化的 的 中文代用品 知网不是语言学研究的产物
2090
150
810 245 885
Secondary feature
121
义原的组织和分类体系的建构
实体 Entity 事件 Event 属性 Attribute 属性值 AttributeValue 次要特征 Secondary features 事件角色 Event roles 事件角色的典型演员 Typical actors of event roles 公理关系与角色转换 Axiomatic relations and role shifting 反义义原对 Antonymous sememe pairs 对义义原对 Converse sememe pairs
公理关系与角色转换 - 1
我在南京买了几本很好的词典,到家发现全都丢 我在南京买了几本很好的词典,到家发现全都丢了。 {buy|买} <----> {obtain|得到 [consequence]; 买 得到} 得到 agent OF {buy|买}=possessor OF {obtain|得到 得到}; 买 得到 possession OF {buy|买}=possession OF {obtain|得到 得到}. 买 得到 {obtain|得到 <----> {own|有} [hypernym]; 得到} 得到 有 possessor OF {obtain|得到 得到}=possessor OF {own|有}; 得到 有 possession OF {obtain|得到 得到}=possession OF {own|有}. 得到 有
关于WordNet的评述(2) 的评述( ) 关于 的评述
Princeton paper reads:
“1.1 Shortcomings of WordNet No cross-part-of-speech links [traffic (n) – stop (v)] Too few relations [chopsticks – Chinese restaurant] No weighted arcs [run:jog; run:move]”
知网的创新点
理论创新 知识获取和表达创新 知网的知识力量
理论创新
知识论 事件类概念间关系 – 双轴论
知识获取和表达创新
义原的获取和选择 义原的组织和分类体系的建构 用结构化语言( 用结构化语言(KDML)来定义概念, ) 定义概念, 定义由两种语言词语表示的概念
义原的获取和选择
Sememes
公理关系与角色转换 - 2
{lose|失去 <----> {own|有} [precondition]; 失去} 失去 有 possessor OF {lose|失去 失去}=possessor OF {own|有}; 失去 有 possession OF {lose|失去 失去}=possession OF {own|有}. 失去 有 {lose|失去 <----> {obtain|得到 [mutual precondition]; 失去} 得到} 失去 得到 possessor OF {lose|失去 失去}=possessor OF {obtain|得到 得到}; 失去 得到 possession OF {lose|失去 失去}=possession OF {obtain|得到 得到}. 失去 得到
buyer, purchaser, emptor, vendee (a person who buys) 中是歧义的; 哪个 “buy”? -- 在 WordNet中是歧义的; 中是歧义的 但在 HowNet中是没有歧义的 中是没有歧义的
知网的知识力量 – 动态的激活
知网常识推理举例 概念相似度计算 概念相关关系的建立
静态的表达 与 动态的激活
董振东
dzd@keenage.com WWW.keenage.Байду номын сангаасom
清华 2007-12
提纲 知网不是什么? 开场白 -- 知网不是什么? 知网系统的概貌 知网的创新点 结语
知网不是什么?( ?(1) 开场白 -- 知网不是什么?( )
在中文方面,也已有了一个类似词汇网路的资源, 在中文方面,也已有了一个类似词汇网路的资源,叫做 知网》( 》(HowNet, http://www.keenage.com)。 )。《 知网》(HowNet, http://www.keenage.com)。《知 做法的特色是独树一帜; 网》做法的特色是独树一帜;不采用英文词汇网路的 架构只要采取他自己的架构。 架构只要采取他自己的架构。而且他先把世界知识本 体做个定义,在这定义里再去做区分。 体做个定义,在这定义里再去做区分。这个由上而下 的方法,与英语与欧语词汇网路由下而上的方法不同, 的方法,与英语与欧语词汇网路由下而上的方法不同, 当然有其可取之处。可惜的是, 当然有其可取之处。可惜的是,由于当年资源与讯息 的限制,并未与世界相关的研究接轨。 的限制,并未与世界相关的研究接轨。基本上跟其他 语言的词汇网路连接,并无架构上的基础, 语言的词汇网路连接,并无架构上的基础,而其上层 知识分类,也是两人的自由心证,不能说错, 知识分类,也是两人的自由心证,不能说错,却也缺 乏理论的基础,面临一些其他系统互通性(inter乏理论的基础,面临一些其他系统互通性(interoperability)的问题。 operability)的问题。
知网常识推理举例
Can a doctor walk? 下列句子的省略如何推导的? 下列句子的省略如何推导的?
“我在南京买了几本很好的词典,到家发现全 我在南京买了几本很好的词典, 都丢了。”
-- 谁丢?丢什么? 谁丢?丢什么?
Can a doctor walk? (1)
1. “doctor”的定义 DEF={human|人:HostOf={Occupation|职位 职位}, 人 职位 domain={medical|医},{doctor|医治 医 医治:agent={~}}} 医治 2. “entity”义原分类体系表 义原分类体系表 │ │ │ ├ {AnimalHuman|动物 {animate|生 动物} 动物 生 性别},{AlterLocation|变空间位 物:HostOf={Sex|性别 性别 变空间位 精神状 置:agent={~}},{StateMental|精神状 态:experiencer={~}}} │ │ │ │ ├ {human|人} {AnimalHuman|动 人 动 姓名}{Wisdom|智慧 智慧}{Ability|能 物:HostOf={Name|姓名 姓名 智慧 能 思考:agent={~}},{speak|说:agent={~}}} 力},{think|思考 思考 说
知网系统的概貌
数据统计 系统组成
数据统计
Chinese character Chinese word & expression English word & expression Chinese meaning English meaning Definition Record 7152 92159 86141 106591 106731 27877 172097
相关文档
最新文档