面向知识图谱应用的图数据库系统介绍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据,并给出置信度。 对于存在数据库之中的数据,经过D2RQ导入到图数据库 之中。
大循环
对数据进行循环迭代:把测试数据分为两组,先测试记录结 果,当其中一组置信度大于0.9的数据加入先验数据后,比较 对另一组数据此时的提升率。进行在不同阈值下对最终结果 的提升率,选择合适的阈值。
对数据进行循环迭代:如100k先验数据,同时对50k测试数据 进行抽取,将置信度高的数据作为先验数据。计算每次先验 数据的增长率。当增长趋于平缓时,不再进行循环。
Facebook Graph Search
“Photos of my friends who live in Canada”
EVI---原名True Knowledge
年度 2007-09 2008-07 2012-01
获得风投 120万 USD 400万 USD 被亚马逊收购
William Tunstall-Pedoe: True Knowledge: Open-Domain Question Answering using Structured Knowledge and Inference. AI Magazine 31(3): 80-92 (2010)
Abraham Lincoln:hasName "Abraham Lincoln" Abraham Lincoln:BornOnDate: "1809-02-12" Abraham Lincoln:DiedOnDate: "1865-04-15"
DiedIn
y:Washington_DC
RDF 数据 & SPARQL查询语言
面向知识图谱应用的图数据库系统 gStore介绍
技术创新,变革未来
提纲
1 知识图谱概述 2 知识图谱构建 3 gStore:基于图的知识图谱数据管理系统 4 系统应用 5 总结
2012年5月16日, Google发布“知识图谱”的 新一代“智能”搜索功能。
知识图谱 (Knowledge Graph)
United_States
foundingYear
“1776”
Facebook Social Graph
Facebook Graph Search
2013年1月16日 Facebook Graph Search 产品发布会---Mark Zuckerberg
“My friends who live in Canada”
系统框架
系统的输入分为三类数据:结构化数据,非结构化数据, 半结构化数据;结构化数据之间导入数据库;半结构化数 据经过处理导入数据库。而非结构化数据库,会经过系统 处理转化三元组存入数据库。
在系统中,数据会经过以下处理: ➢ 自然语言处理,生成候选实体对,抽取特征。 ➢ 通过规则对候选实体对打标,并对打标结果投票融合。 ➢ 构建因子图模型,学习已经打标的数据,预测未打标的
Abraham Lincoln:hasName "Abraham Lincoln" Abraham Lincoln:BornOnDate: "1809-02-12" Abraham Lincoln:DiedOnDate: "1865-04-15"
DiedIn
y:Washington_DC
提纲
1 知识图谱概述 2 知识图谱构建 3 gStore:基于图的知识图谱数据管理系统 4 系统应用 5 总结
ቤተ መጻሕፍቲ ባይዱDF 数据模型
• RDF中任何实体都被称之为资 源(Resource),用URI来表示。
• 实体的属性以及实体间关系都 是以三元组形式表示
• 不同数据集直接互相链接构成 海量的关联数据 一个集成的Web”数据库”
xmlns:y=http://en.wikipedia.org/wiki y:Abraham Lincoln
知识图谱 (Knowledge Graph)
本质上是基于图的语义网络,表示实体和实体之间的关系!
资源描述框架(RDF)数据
• RDF是知识图谱数据的事实标准 • RDF是由W3C组织提出的一种描
述资源概念模型的语言 • RDF是语义网的一个基石
(Building Block) • 语义网的目标是网络上的资源
是“机器可理解”(Machine understandable)
RDF 数据模型
• RDF中任何实体都被称之为资源 (Resource),用URI来表示。
• 实体的属性需要被定义 • 实体间关系需要被定义 • 不同数据集直接互相链接构成
海量的关联数据 一个集成的Web”数据库”
xmlns:y=http://en.wikipedia.org/wiki y:Abraham Lincoln
的城市的人有哪些?”
Abraham_Lincoln Abraham_Lincoln Reese_Witherspoon
Reese_Witherspoon
DiedIn bornIn bornOnDate
bornIn
Washington_DC Hodgenville KY "1976-03-22"
New_Orleans_LA
SELECT ?name SPARQL
WHERE { ?m <bornIn> ? c i t y . ?m <hasName> ?name .
New_Orleans_LA New Orleans LA United_States
United_States
foundingYear locatedIn hasName
hasCapital
“1718” United_States “United States
” Washington_DC
?m <bornOnDate> ?bd . ? c i t y <foundingYear> ` `1718 ' ' . FILTER( regex (str (?bd ), “1976 ' ' ) ) }
RDF 数据库
主语
Abraham_Lincoln
Abraham_Lincoln Abraham_Lincoln
谓词
hasName
BornOnDate DiedOnDate
宾语
“Abraham Lincoln"
“1809-02-12" “1865-04-15"”
“找到出生1976年生的, 并且出生地是1718年构建
相关文档
最新文档