基于知识图谱的可视化技术研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电子设计工程
Electronic Design Engineering
第26卷Vol.26第14期No.142018年7月Jul.2018
收稿日期:2017-11-01
稿件编号:201711003
基金项目:科技部科技支撑项目(2015BAH12F01-05);国家青年自然科学基金(61402173);网络教学教育研究项
目(WJY2016012);国家高技术研究发展计划(2015AA020107);上海市科研计划项目(16511101000)
作者简介:秦锦玉(1997—),女,江苏南通人。研究方向:计算机科学与工程。
众所周知,中医是中国古代医者同大量未知疾病斗争所得的经验,经历持久的医学实践逐步形成和发展医学理论体系。其中,中医药的研究和发展是中医理论必不可少且相当重要的一部分。但由于国外对中医药学的无人问津,国内知识图谱的发展还不够面面俱到,导致中医药的知识网络相对零散,更多的以文字作为载体的呈现形式,以静态的图形来表述关联性,缺乏一定的交互性,也致使了大多数非相关人员很难接触和了解这门学科,甚至从事者也难以在大量的文献和文字资源中高效的获取所需求的知识。
针对以上问题,设计了关于中医药知识图谱的可视化系统,对中药数据采集后进行清理和分类,提供一个所想即所得的方式,以“图”的方式提供一种引导性学习,将大量的中医药知识之间的关联以简单的图谱形式展示,可视化效果好。
1可视化的流程
中医药知识图谱的可视化流程如下所述:1)层析结构设计
基于知识图谱的可视化技术研究
秦锦玉,翟洁,陈程,赵维杰,蔡婷婷,武海霞
(华东理工大学信息科学与工程学院,上海200237)
摘要:针对当前中医药领域知识多且相对零散的现状,为了实现中医药知识资源的有效整合及可视化表示,本文研究了中医药知识图谱可视化的相关技术。可视化的流程涉及层析结构设计、节点生成、html 页面生成、力导引布局4个部分。本文给出了这4部分的关键技术和实现算法,并利用以上技术实现了一个高交互性的可视化系统。该系统以图谱形式可视化展示中医药,将会为用户提供全面、及时、可靠的知识服务。
关键词:知识图谱;力导引布局;节点生成算法;中医药中图分类号:TN02
文献标识码:A
文章编号:1674-6236(2018)14-0001-05
Research on visualization technology based on knowledge map
QIN Jin⁃yu ,ZHAI Jie ,CHEN Cheng ,ZHAO Wei⁃jie ,CAI Ting⁃ting ,WU Hai⁃xia
(School of Information Science and Engineering ,East China University of Science and Technology ,
Shanghai 200237,China )
Abstract:With the phenomenon that the current Traditional Chinese medicine (TCM )knowledge is so much and relatively scattered ,in order to realize the effective integration and visualization of knowledge resources of traditional Chinese medicine ,this paper studies the related technology of visualization of TCM knowledge map.The visualization process involves four parts:tomographic structure design ,node generation ,html page generation ,and force guidance layout.This paper discusses the four key technologies and implementation algorithms.With the above technologies ,we achieve a highly interactive visualization system.The system is displayed in a graphical form to showcase Chinese medicine ,which will provide users with comprehensive ,timely and reliable knowledge services.
Key words:knowledge graph ;algorithms for graph drawing ;node generation algorithm ;traditional chi⁃
nese medicine
-
-1
《电子设计工程》2018年第14期
对展示的数据内容进行层次结构分析,确定上
下位关系、数据模型和图模型。
2)节点生成
对主页面、分类页和详情页根据其节点特点,设计
不同的节点生成算法,获得相应的节点和连线信息。
3)html页面生成
节点和连线准备好之后,需要将其转换为图
形。本文设计了html页面生成算法,将节点和连线
信息写入html页中。
4)力导引布局
以上步骤生成的知识图谱整体平衡,但存在很
多交叉点,很不美观。我们可以利用KK算法来优化
节点布局,减少交叉点的数量。流程图如图1
所示。
图1中医药知识图谱的可视化流程图
2技术实现
2.1层次结构设计
领域内的层次结构直观反应了领域内知识的上下位关系,为实现中药知识图谱可视化,首先要建立中药层次结构图。
在中药领域中,存在着很多上下位关系。本文中,采用药性、药味、归经等等作为中药知识的下层知识。药性、药味、归经又有各自包含的子概念,形成了具体的上下位关系,即是层次结构。
另外,考虑到有多处的一对多及多对一关系,数据模型选择不完全连接网状结构,因包含关系的单向性,图模型选择有向图。
综上,图谱设计规则为:上位元素作为起始节点,下位元素作为终止节点。
2.2节点生成算法分析
生成知识图谱节点,便是将数据图形化,因而数据的提取、合并就成了重中之重。文中,设计了适合这个中医药知识图谱各种特性的节点及连线生成算法。
2.2.1主页面及分类页节点生成算法
为形成清晰美观而又实用的主页面及分类页,采用排序算法及随机数生成算法,将点击率较高和另一些随机的中药节点呈现出来,总数不多于20。
图2
为主页图和分类节点图的生成流程。
图2主页图和分类节点图的生成流程
具体思想是:
1)实例化自定义类Edges,其中包括属性source (起点),target(终点),weight(线段粗细)。
2)使用sql语句搜索得到所有具备当前属性的节点,并以主表中的点击率字段从高到低排列。
3)判断所有节点数是否大于20,若不大于则全部添加进节点列表,并添加所有连线。
4)若节点数大于20,先添加点击率最高的10个节点进节点列表,并在剩余节点中调用随机函数生成10个节点
5)随机函数原理则是生成10个0到n-10的节点(n为所有节点总数),得到随机数后+10则是所需节点的下标。
6)添加所有连线,起点均是中间属性节点,而终点则是节点列表中的节点,遍历添加即可。
2.2.2详细页节点生成算法
详细页的节点需要二次查重,节点省略,还需要对连线进行合理分配起点终点。具体流程如下:
1)使用sql语句搜索得到当前中药所有分类总数,并将当前中药作为0号节点添加至节点列表。
2)记录所有分类节点数量parentNodes。
3)对每个分类节点再进行一次搜索,使用sql语句找到当前分类的中药,当搜索结果数量小于5时,全部添加,大于等于5时,添加点击率最高的4个节点,再添加一个“…”节点,表示有其他未添加的节点。
4)当添加节点时,某些子节点会和父节点具有多个相同分类,相同节点不应多次添加,即需要查重。则每次添加节点时必须对已有的节点列表进行遍历检查是否存在,若存在则只添加新的连线,而连线的起点则设置为遍历过程中,搜到重复节点的下标。
5)当节点和连线列表填充完毕后,再次记录节点列表的总节点数,目的是得到所有的子节点数量
--2