知识图谱在知识库网站建设中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
148 •电子技术与软件工程 Electronic Technology & Software Engineering
数据库技术
• Data Base Technique
【关键词】华夏文明 知识库 知识图谱华夏文明凝聚着中华民族自强不息的精神追求和历久弥新的精神财富,是发展社会主义先进文化的深厚基础,是建设中华民族共有精神家园的重要支撑。甘肃华夏文明传承创新区建设,按照国家关于甘肃发展的战略定位和建设文化大省的总要求,以文化建设为主题,以经济结构战略性调整和经济发展方式根本性转变为主线,确定了围绕“一带”,建设“三区”,打造“十三板块”(简称“1313工程”)的工作布局。其中包括以敦煌文化为核心的河西走廊文化生态区,以形成集遗产保护、景观旅游、事业服务、产业发展、产品交易、文化交流为一体的文化展示研究基地和文化园区。
网站建设是指使用标识语言(markup language),通过一系列设计、建模、和执行的过程将电子格式的信息通过互联网传输,最终以图形用户界面(GUI )的形式被用户所浏览。随着人工智能的发展,网站建设的相关技术也在不断革新。知识谱图因其在建模、推理等方面的强大作用,不断被运用到网站建设中来。本文对知识谱图、以及其在华夏文明视角下知识库网站建设中的相关应用进行梳理,以便作者对于知识图谱的网站建设中的应用有个综合性的了解,为以后的相关研究提供指导。
1 知识图谱
1.1 关于知识图谱
知识图谱(Knowledge Graph )由Google 提出,其目标在于改善搜索结果,描述真实世界中存在的各种实体和概念,以及这些实体、概念之间的关联关系。知识图谱本质上是语义网络,具有关联性的知识集合,把所有不同种类的信息连接在一起而得到的关系网络,实现
知识图谱在知识库网站建设中的应用
文/董翔1,2 蒋伟2 史志林1
对客观世界的结构化语义描述,提供了从关系
的角度去分析问题的能力。在信息搜索领域中,知识图谱可用来描述复杂的关联关系,从语义层面理解用户意图,改进搜索质量。
知识图谱主要的目标是用来描述真实世界中间存在的各种实体和概念,以及它们之间的关联关系。知识图谱并不是一个全新的东西,而是在以前的技术或理论上面,进行的一个重
新的定义,引入了一个新的概念。
(1)知识图谱本身不是本体的一个替代品,是在本体的基础上面做了一个丰富和扩充,
这种扩充主要体现在实体层面。
(2)本体中突出的主要是概念和概念之间的关联关系,而知识图谱描述的主要是实体,对这些实体我们通常还会去描述它更加丰富的信息。
(3)用一句简单的话来说就是:本体描述了知识图谱的数据模式,本体的动态的特性赋予了知识图谱动态数据模式支持的能力。
这一特性很重要,会用在我们很多的地方,比如说我们在Linked Open Data 里面就用到了这种理念,同时我们提到了在后面企业大数据的应用里面,其实也会用到这个特性,它可以支持数据动态变迁的能力。1.2 知识图谱应用1.2.1 智能搜索
基于知识图谱的智能搜索是一种基于长尾的搜索,搜索引擎以知识卡片的形式将搜索结果展现出来。用户的查询请求将经过查询式语义理解与知识检索两个阶段。
查询式语义理解。知识图谱对查询式的语义分析主要包括:
(1)对查询请求文本进行分词、词性标注以及纠错;
(2)描述归一化,使其与知识库中的相关知识进行匹配;
(3)语境分析,在不同的语境下,用户查询式中的对象会有所差别,因此,知识图谱需要结合用户当时的情感,将用户此时需要的答案及时反馈给用户;
(4)查询扩展,明确了用户的查询意图以及相关概念后,需要加入当前语境下的相关概念进行扩展。
知识检索。经过查询式语义分析后,标
准查询语境进行知识库检索引擎,引擎会在知识库中检索相应的实体以及与其在类别、关系、相关性等方面匹配度较高的实体。通过对知识库的深层挖掘与提炼后,引擎将给出具有重要性排序的完整知识体系。
智能搜索引擎主要以3种形式展现知识:1.2.2 深度问答
问答系统是信息检索系统的一种高级形式,能够以准确简洁的自然语言为用户提供问题的解答。多数问答系统更倾向于将给定的问题分解为多个小的问题,然后逐一去知识库中抽取匹配的答案,并自动检测其在时间与空间上的吻合度等,最后将答案进行合并,以直观的方式展现给用户。
针对知识图谱在门户网站构建方面的优势,主要运用于数据库构建、数据检索、分析决策中。
2 知识图谱在网站建设中应用
2.1 数据库构建
知识图谱里面有两个基本元素,一个是实体,一个是概念。
我们可以以实体为主体目标,实现对不同来源的数据进行映射与合并,因为企业碰到的数据很大的一个应用场景就是数据在不同的系统里面,但是描述的是同一个事物,怎么去把他们合并起来?可以用实体的机制进行建模,然后通过实体合并相关的技术,把不同数据里描述同一个实体的数据进行融合;
融合后可以利用实体的属性来表示不同数据源中针对实体的描述,即A 处过来的数据可以用一部分属性进行描述,B 处来的也可以用一些属性进行描述,用属性进行统一描述之后,就会形成对实体全方位的描述,这里面用到属性的映射和归并,因为从不同数据源中来的,可能有些属性是重复的,甚至是冲突的,需要考虑怎么去合并;
其次就是利用知识图谱里面的关联关系去描述各种数据源之间数据的关系,知识图谱里面这种关系是非常灵活的,所以数据间的关系可以很容易的转换成为知识图谱来进行描述,从而支持关联分析,这里面主要用到的就
●基金项目:1.本文系2013年度甘肃省社科规划项目(项目编号:13YD080)研究成果之一。2.2014年度教育部人文社科规划基金项目(项目编号:14XJAZH001)研究成果之一。
<<下转149页
Data Base Technique •
数据库技术
Electronic Technology & Software Engineering 电子技术与软件工程• 149
【关键词】一体化 线损管理 线损系统
自进入信息化时代后,我国各领域都开始加强对先进技术的应用,实现了信息化发展。
基于一体化电量线损管理的同期线损系统建设
文/黄欣1 刘娜2 张进2
在电网企业经营管理进程中,实现对电网企业
的电量损耗管理,是提高企业管理效率的基础。从某种角度而言,受传统手抄电表的影响,不少电网企业的新损率月度波动较为明显,线损率存在失真的情况。此种现象,在极大程度上隐藏了电网企业经营管理中存在的深层次线损
问题,无法为供电作业提供有力的指导。线损统一管理的缺乏,导致电网企业电量线损系统对供电作业支撑力度不足。为此,本文展开了对一体化电量线损管理的相关研究。
1 一体化电量线损管理的同期线损系统概述
是关系抽取的一个技术;
剩余的数据可能信息抽取也比较难解决,可以通过实体链接的技术,并不一定要把所有文本都转换成为结构化的数据,可以把它们进行链接,比如在做企业知识图谱的时候,可以把企业相关的新闻,不用把新闻的时间、地点、人物都抽取,这块难度较高,但是可以把新闻和实体做关联,即通过实体链接技术,实现围绕实体的多种类型数据的关联存储;
然后还有一个动态的数据,因为现实中间,数据都是在不断动态变化的,这主要通过事件的机制来进行描述,体现事件与实体间的关联,并利用时序的概念来描述事件的发展状况,把历史的事件和当前事件联系起来,有了动态变化之后,可以做时序的预测,这里涉及的技术主要是动态事件的提取相关技术。2.2 数据提取
智能信息搜索是从知识理解和逻辑推理的角度,分析信息对象与检索请求的搜索方法。智能信息搜索与传统搜索引擎的最大差别在于搜索过程和结果的智能化,通过语义网、知识图谱等技术,能够充分表达信息对象的语义联
系,有效地理解用户的信息检索需求和信息对象包含的内容,从而使得搜索引擎具备理解语义和有效推理的能力2.3 分析决策
知识图谱,通过自然语言等形式的输入,即可迅速调用PB 及以上量级数据之间的关系,系统自动推理辅助分析并得出结果。由于知识图谱和本体关系非常密切,所以里面最重要的就是基于本体的知识推理,即知识图谱核心知识内容部分的推理。然后因为知识图谱在大数据应用里面用的非常多,我们可以做知识图谱大数据预测分析与关联挖掘,也就是围绕知识图谱组织的大数据,怎么去做预测分析和关联挖掘。
3 综述
目前,知识图谱在知识库网站构建中主
要应用于数据库建设、数据检索、分析决策等相关方面。从华夏文明传承创新角度开展知识库的构建研究,将为华夏文明传承创新区建设提供了有机的组成部分,为华夏文明传承创新区建设的任务和路径选择,提供了新思路。<<上接148页
参考文献
[1]胡泽文,孙建军.国内知识图谱应用研究
综述[J].图书情报工作,2013(02):131-137.
[2]李海涛,宋琳琳.基于科学知识图
谱的政府门户网站绩效评价研究[J],2012,31(08):134-14.
作者简介
董翔(1972-),女,甘肃省灵台县人。兰州大学图书馆副研究员。研究方向为敦煌学与科学评价。
蒋伟(1989-),
男,江苏省淮安市人。理学硕士。研究方向计算机软件与应用。
史志林(1988-),男,云南省曲靖市人。兰州大学敦煌学研究所2010级硕士研究生。研究方向为敦煌学与西北历史地理。
作者单位
1.兰州大学 甘肃省兰州市 730000
2.兰州大学淮安高新技术研究院 江苏省淮安市 223005
图1:一体化电量线损管理的同期线损系统集成图