科学知识图谱方法及应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
耗时、 费力、 难以重复、 较主观 盲人摸象
20
2.知识图谱概述——基本概念
21
2.知识图谱概述——基本概念
上世纪50年代,加菲尔德创制 SCI,并以编年体形式手工绘制 引文网络图谱;随后 “文献耦 合”(Kessler,1963),“科 学引文网络”(Price,1965), “同被引”(Small,1973)、 “共词”(Callon,1983)、 “引文可视化”(White, 1998)相继提出
• 网络中各节点代表高 频词和爆炸词 • 节点大小代表该词达 到最大爆炸水平 • 颜色代表词常用和达 到最大爆炸水平的年 代
26
2.知识图谱概述——发展历程
有维斯(J. Wise)等提出“信息 地图”information landscape
利用地理信息系统的可视化信息,地理地图的自然组织 框架,构建隐含大量信息的可视化主题地图
scaling map,PFNET
将数据以及数据间关系表达 成一个图,图中节点表示数 据,线表示数据间关系
运用较小生成树法及复杂连 接删除算法,删除网络中大 部分连接,保留最重要连接 ,最大限度简化网络
25
2.知识图谱概述——发展历程
印第安纳大学Ketan K Mane 和泊尔纳提出“PNAS主题爆 炸图谱”,用以发现主要主 题和复杂趋势 用克林伯格跳变算法和共生词分析法和图示 技术,研制主要主题和复杂趋势的发现地图
11
1.知识可视化概述
信息可视化 可视化对象 可视化目的 可视化方式
交互类型
知识可视化 人类的知识
知识图谱 科学知识
非空间数据
从大量抽象数据中 促进群体的知识创新 展示学科,促进科学 发现新的信息 和传播 发展 计算机图形图像 绘制草图、知识图表、 多维图表、视觉隐喻 视觉隐喻
人-交互 人-交互
12
基本原理是分析知识单元 (科学文献、科学家、关 键词等)的相似性及测度。 采用不同的方法和技术绘 制不同类型的图谱。
22
科学知识图谱
2.知识图谱概述——发展历程
传统的科学图谱以简单的二维、三 维图形(如:柱形图、线性图、点 布图、扇形图、平面图等)表示科 学统计结果
文献摘要或关键词纪录比例图
10
1.知识可视化概述
知识可视化发展时间很短,正式起源于 2004 年, M.J.Eppler 和 R.A.Burkhard 共 同 发 表 论 文 (knowledge Visualization -Towards a New Discipline and its Fields of Application)。 Eppler 认为:知识可视化主要研究视觉表征的使 用,主要目的是改进两人或多人间知识的创造与 转移;知识可视化是指能用来构建和传递复杂观 点和内容的所有图形手段和方式。
国内数据库:CNKI、CSSCI、CSCD、万方等
网络数据源:Google Scholar、arXiv、CiteSeerX
30
3.2样本数据清洗
基于文献数据库进行知识可视化的质量、合理 性和可靠性很大程度上依赖于所用数据的精确 性和全面性,不准确或不全面的数据往往造成 不精确甚至错误的结果。即使目前最权威、公 认质量最高的WoS,也存在数据著录格式(如 人名和地名的不统一)和遗漏的问题。 改正字符错误,统一或增补 分时段 有代表性的抽取
文献共被引分析是计量 文献之间关系的一种新 方法。即2篇文献共同 被1篇文献引用,这2篇 文献就构成共引关系。 共被引频率定义为这2 篇文献一起被引用频次 ——马沙科娃、斯莫尔
(苏联、美国)
35
CR 2001, NY TIMES 1226, B2 *AM PSYCH ASS, 1994, DIAGN STAT MAN MENT *DEP HLTH HUMAN SE, 1999, MENT HLTH REP SURG G *US BUR CENS, 2000, STF3A DEP COMM BUR C BLAZER DG, 1994, AM J PSYCHIAT, V151, P979 EATON L, 2001, NY TIMES 1116, A1 FOTHERGILL A, 1999, DISASTERS, V23, P156 FULLERTON CS, 1999, AVIAT SPACE ENVIR MD, V70, P902 GINEXI EM, 2000, AM J COMMUN PSYCHOL, V28, P495 GOENJIAN AK, 2001, AM J PSYCHIAT, V158, P788 GREEN BL, 1990, J APPL SOC PSYCHOL, V20, P1033 HANSON RF, 1995, J CONSULT CLIN PSYCH, V63, P987 HARVEY AG, 1999, J CONSULT CLIN PSYCH, V67, P985 KAWACHI I, 2001, J URBAN HEALTH, V78, P458 KESSLER RC, 1995, ARCH GEN PSYCHIAT, V52, P1048 KILPATRICK DG, 1987, CRIME DELINQUENCY, V33, P479 MADAKASIRA S, 1987, J NERV MENT DIS, V175, P286 MAZURE CM, 2000, AM J PSYCHIAT, V157, P896 NORTH CS, 1999, JAMA-J AM MED ASSOC, V282, P755 ORTEGA AN, 2000, AM J PSYCHIAT, V157, P615 POLE N, 2001, J NERV MENT DIS, V189, P442 RESNICK H, 1999, J ANXIETY DISORD, V13, P359 RESNICK HS, 1993, J CONSULT CLIN PSYCH, V61, P984 ROTHBAUM BO, 1992, J TRAUMA STRESS, V5, P455 RUBONIS AV, 1991, PSYCHOL BULL, V109, P384 RUEF AM, 2000, CULTURAL DIVERSITY E, V6, P235 SHAH B, 1997, SUDAAN USERS MANUAL SHALEV AY, 1998, AM J PSYCHIAT, V155, P630 SHALEV AY, 2000, J CLIN PSYCHIAT S5, V61, P33 SHERBOURNE CD, 1991, SOC SCI MED, V32, P705 SHORE JH, 1989, J NERV MENT DIS, V177,36 P681 TUCKER P, 2000, J BEHAV HEALTH SER R, V27, P406
15
15
阅读下面黑体的词汇,然后立刻闭上眼睛, 持续30秒,思考它。
水果
16
16
17
2.知识图谱概述——基本概念 知识是一个内涵非常丰富的概念;知识广 泛存在于社会各个领域。科学知识图谱广 义上包括:生物的基因图谱、教育教学中 的认知地图、探索太空的天体图、描绘地 形的GIS、模拟人脑的神经网络图、各种 金属图谱等。 科学知识图谱是以科学知识为对象,显示 学科的发展进程与结构关系的一种图形, 具有“图”和“谱”的双重性质与特征。
networt analysis map
默创立“三维构型图谱”three
dimensional configuration map
之后出现“多维尺度图谱”multidimensional scaling map
卡尔提出“自组织映射图谱 ”self-organizing map
实 例 : 某 学 术 群 体 知 识 图 谱
了解领域历史、现状热点、前沿趋势
选题,寻求切入点和突破点 寻求新的研究方法和有力的论证依据 避免重复劳动
网络环境,大数据。。。
4
如果说我比别人看得更远些,那是因为我站在 了巨人的肩膀上。
我不知道在别人看来,我是 什么样的人;但在我自己看 来,我不过就象是一个在海 滨玩耍的小孩,为不时发现 比寻常更为光滑的一块卵石 或比寻常更为美丽的一片贝 壳而沾沾自喜,而对于展现 在我面前的浩瀚的真理的海 洋,却全然没有发现 ——牛顿
24
实例:
某学科期刊高频关键词共词网络2个知识群
2.知识图谱概述——发展历程
PFNET算法根据经验性数据, 对不同概念或实体间联系的相 似性或差异程度做出评估,然 后引用图论中的基本概念或原 理生成特殊的网状模型
1990美国心理 学家斯克沃斯 兹恩巴克提出 “寻径网络图 谱”pathfinder network
应用案例: 期刊文章的数量与 资助基金间的动态 关系图谱
27
2.知识图谱概述——发展趋势
随计算机处理能力日益提高、文献数字化,知识图谱工具在模拟人类信息分 析等方面,可帮助人类进行某些领域的判读、搜索、决策、预测……
利用专利分析工具形成的专利知识图谱
IN-SPIRE发现工具可整合交互
式信息可视化与询问功能
31
3.3选择知识单元
知识单元是知识处理的基本单位:关键词、题 名、作者、机构、刊名、分类号、学科等等。目 前也扩展到摘要、参考文献和全文。多种结合。
32
3.4 构建知识单元关系
引文分 析理论 与方法
1、说明科学知 识和情报内容的 继承和利用 2、标志科学的 发展
33
耦合
34
知识单元 的共被引 关系
5

1
2 3 4 5 6

知识可视化概述 知识图谱概述
知识图谱绘制方法 知识图谱绘制工具
CiteSpace简介与操作 知识图谱应用案例
6
1.知识可视化概述 语言
文字
知识
肢体
图像
其它
一图展春秋,一览无余;一图胜万言,一目了然
——大连理工大学教授刘则渊
7
知识可视化实质 1.知识可视化概述
知识
图解
论文的最小生成树图谱
最小生成树导航图谱
28
3.科学知识图谱的绘制方法步骤
29
3.1样本数据获取
主要数据来源:Web of Science 科学文献数据: (SCI) (SSCI) 专利文献数据:德温特创新索引DII 国际会议文献数据:(CPCI) 另外还有Scopus,Science Direct,L
第六 科学知识图谱方法及应用
杨思洛 信息管理学院
工欲善其事,必先利其器
课程考核:相关的课程论文,6月1号前交 信息管理学院336办公室。 包括学号、姓名、联系方式
2
引言
对学科(领域、主题)过去、现状、前沿、热 点、趋势的把握可通过什么方法手段?
3
引言的重要性! 文献是记录有知识的一切载体 文献是科学交流的主要途径与手段
人-交互
1.知识可视化概述
概念图 知识可视化 工具及其教 育学习应用
概 念 组 成
设 计 制 作
教 育 应 用
思维导图
此外,在科研写作中也需要绘制图表,呈现知识
13
关于 “概念图”的概念图
14
思维导图:用于放射性思考
子题 1 子题 2 子题 3
子题 7
思考的主题 主題
子题 6 子题 5
子题 4
50 45 40 35 30 25 20 15 10 5 0 50 40 30 20 10 0 1 2 3 4 1 2 3 4
200
150 100 50 0 1 2 3 系„ 系„
4
某学科某结构三维图
X论文增长趋势线型图
23
2.知识图谱概述——发展历程
1987年,美国基金会发表研究报告《科学计算中的可视》,开始长期资助科 学可视化(scientific visualization)研究 1987年,著名计量学家克雷奇 20世纪20、30年代英国人类学研 究提出“社会网络分析图谱”social
18
2.知识图谱概述——基本概念
科学知识图谱 是显示科学知 识的发展进程 与结构关系的 一种图形
以科学知识为 计量研究对象, 属于科学计量 学范畴
在以数学模型 表达科学知识 单元及其关系 基础上
进而以可视化 形式绘制成二 维或三维图形, 即知识图谱
19
2.知识图谱概述——基本概念
①较形象、定量、客观、真实地显示学科结构、 热点、演化与趋势,是学科基础研究新视角。 ②知识图谱可发现、描述、解释、预测和评价 科学知识。 ③对图书情报学科具有更重要意义,也有助于 信息检索、信息分类与信息服务等。
可视化 Biblioteka Baidu式
促进
传播 创新
百闻不如一见、一图胜万言!
纽约大学心理学专家吉米· 布洛诺(Jerome Bruner)在实验中发现,人们能记住10%听 到的东西,30%读到的东西,但是却可以记 住 80%看到的东西
8
9
1.知识可视化概述
科 学 计 算 可 视 化 (Visualization in Scientific; Computing) 、数据可视化 (Data visualization) 、 信息可视化、知识可视化、知识域可视化。 “Information Visualization”术语是由斯图尔特•卡 德、约克 • 麦金利和乔治 • 罗伯逊于 1989 年创造出 来的; 美藉华人陈超美1999年率先发表了该领域的第一 部专著《信息可视化》,创办了国际期刊《 Information visualization》。
相关文档
最新文档