一种基于本体的句子相似度计算方法

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

A b s t r a c t h i s a e r r o o s e d s e n t e n c e s i m i l a r i t c o m u t i n b a s e d o n o n t o l o . U s i n t h e r e l a t i o n s b e t w e e n t h e o n t o l T - p p p p y p g g y g o c o n c e t s a n d k e w o r d s i n t h e s e n t e n c e s t o e s t a b l i s h s e m a n t i c i n d e x t o e x t r a c t t h e d i r e c t a n d i n d i r e c t s e m a n t i c r e l a - g y p y , , t i o n o n t o l o b a s e d s e m a n t i c v e c t o r w a s r e r e s e n t e d t o c a l c u l a t e t h e s e m a n t i c s i m i l a r i t b e t w e e n s e n t e n c e s t h u s t h e g y p y s e n t e n c e s i m i l a r i t c o m u t i n m e t h o d w a s r o o s e d . T h i s m e t h o d i s a l i e d i n t h e M i c r o s o f t R e s e a r c h I n s t i t u t e o f a r a - y p g p p p p p , h r a s e c o r u s( M S R P) . E x e r i m e n t s s h o w t h a t c o m a r e d w i t h t h e r e l a t e d s i m i l a r i t c o m u t i n m e t h o d s t h i s m e t h o d p p p p y p g a c c u r a c a n d r e c a l l r a t e i n t h e i n c o m l e t e a d d i t i o n a l i n f o r m a t i o n b a c k r o u n d . o b t a i n s o o d y p g g , , K e w o r d s e n t e n c e s i m i l a r i t c o m u t i n O n t o l o W o r d N e t S y p g g y y 随时获取到。在这种情况下, 这些简短段落或句子之间的 相似度只能从 有 限 的 表 述 中 提 取。本 文 研 究 如 何 仅 通 过 本体结构所表达 出 来 的 概 念 间 的 语 义 关 系 来 计 算 句 子 的 相似度。
1 简介
通常情况下 , 如果句子对有相同意思或者主旨一致 , 那么 就认为该句子对是相似的 。 许多自然语言处理应用要求简 短 准 确 地 计 算 出 来。一 文字段落或句子间 的 相 似 度 能 够 快 速 、
1, 2] 、 种能自 动 计 算 语 义 相 似 度 的 方 法 在 自 动 问 答 [ 信息过 3] 4] 5] 、 、 滤[ 文献摘要 [ 机器翻译 [ 等方面十分有价值 。 除了 基 于
摘 要 提出了一种基于树结构本体的句子相似度计算 方 法 。 利 用 本 体 概 念 与 句 子 中 关 键 词 之 间 建 立 的 语 义 索 引 , 构建句子与本体间的直接和间接语义联系 , 据此提取描述句子的语义向量 , 从而计算句子间的语义相似度 。 应用 微 软 研究院的意译语料库 ( 对本方法进行了验证 , 结 果 表 明: 与 相 关 的 计 算 方 法 相 比, 本方法在不完备附加信息应 M S R P) 用前提下获得了较好的准确率和召回率 。 关键词 句子相似度计算 , 本体 , W o r d N e t 中图法分类号 T P 3 9 1 文献标识码 A
第4 0卷 第1期 2 0 1 3年1月
计 算 机 科 学 C o m u t e r c i e n c e S p
V o l . 4 0N o . 1 J a n 2 0 1 3
一种基于本体的句子相似度计算方法
刘宏wk.baidu.com ( ) 北京联合大学北京市信息服务工程重点实验室 北京 1 0 0 1 0 1
O n t o l o B a s e d S e n t e n c e S i m i l a r i t M e a s u r e m e n t g y y
L I U H o n z h e - g
( , , ) B e i i n K e L a b o r a t o r o f I n f o r m a t i o n S e r v i c e E n i n e e r i n B e i i n U n i o n U n i v e r s i t B e i i n 1 0 0 1 0 1, C h i n a j g y y g g j g y j g
相关文档
最新文档