科学知识图谱方法及应用完整版本

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

document cocitation
MAZURE CM, 2000, AM J PSYCHIAT, V157, P896
NORTH CS, 1999, JAMA-J AM MED ASSOC, V282, P755
ORTEGA AN, 2000, AM J PSYCHIAT, V157, P615
5
目录
1
知识可视化概述
2
知识图谱概述
3
知识图谱绘制方法
4
知识图谱绘制工具
5
CiteSpace简介与操作
6
知识图谱应用案例
6
1.知识可视化概述
语言
文字 知识 肢体
图像 其它
❖ 一图展春秋,一览无余;一图胜万言,一目了然
——大连理工大学教授刘则渊
7
1.知识可视知化识概可述视化实质
图解
知识
可视化 促进 形式
33
耦合
34
知识单元 的共被引
关系
文献共被引分析是计量 文献之间关系的一种新 方法。即2篇文献共同 被1篇文献引用,这2篇 文献就构成共引关系。 共被引频率定义为这2 篇文献一起被引用频次
——马沙科娃、斯莫尔 (苏联、美国)
35
CR 2001, NY TIMES
1226, B2
*AM PSYCH ASS, 1994, DIAGN STAT MAN MENT
*DEP HLTH HUMAN SE, 1999, MENT HLTH REP SURG G
*US BUR CENS, 2000, STF3A DEP COMM BUR C
BLAZER DG, 1994, AM J PSYCHIAT, V151, P979
EATON L, 2001, NY TIMES
KAWACHI I, 2001, J URBAN HEALTH, V78, P458
KESSLER RC, 1995, ARCH GEN PSYCHIAT, V52, P1048 KILPATRICK DG, 1987, CRIME DELINQUENCY, V33, P479 MADAKASIRA S, 1987, J NERV MENT DIS, V175, P286
默创立“三维构型图谱”three
dimensional configuration map
之后出现“多维尺度图谱”multi-
dimensional scaling map
卡尔提出“自组织映射图谱 ”self-organizing map


: 某 学 术 群
体 知 识 图
谱 24
实例:
某学科期刊高频关键词共词网络2个知识群
第六 科学知识图谱方法及应用
杨思洛 信息管理学院
工欲善其事,必先利其器
❖课程考核:相关的课程论文,6月1号前交 信息管理学院336办公室。
❖包括学号、姓名、联系方式
2
引言
❖对学科(领域、主题)过去、现状、前沿、热 点、趋势的把握可通过什么方法手段?
3
引言的重要性! ❖文献是记录有知识的一切载体 ❖文献是科学交流的主要途径与手段
❖了解领域历史、现状热点、前沿趋势
❖ 选题,寻求切入点和突破点 ❖ 寻求新的研究方法和有力的论证依据 ❖ 避免重复劳动
❖网络环境,大数据。。。
4
如果说我比别人看得更远些,那是因为我站在 了巨人的肩膀上。
❖ 我不知道在别人看来,我是 什么样的人;但在我自己看 来,我不过就象是一个在海 滨玩耍的小孩,为不时发现 比寻常更为光滑的一块卵石 或比寻常更为美丽的一片贝 壳而沾沾自喜,而对于展现 在我面前的浩瀚的真理的海 洋,却全然没有发现 ——牛顿
传播 创新
百闻不如一见、一图胜万言!
纽约大学心理学专家吉米·布洛诺(Jerome Bruner)在实验中发现,人们能记住10%听 到的东西,30%读到的东西,但是却可以记 住 80%看到的东西
8
9
1.知识可视化概述
❖科 学 计 算 可 视 化 (Visualization in Scientific; Computing)、数据可视化(Data visualization)、 信息可视化、知识可视化、知识域可视化。
20
2.知识图谱概述Βιβλιοθήκη Baidu—基本概念
21
2.知识图谱概述——基本概念
❖ 上世纪50年代,加菲尔德创制 SCI,并以编年体形式手工绘制 引文网络图谱;随后 “文献耦 合”(Kessler,1963),“科 学引文网络”(Price,1965), “同被引”(Small,1973)、 “共词”(Callon,1983)、 “引文可视化”(White, 1998)相继提出
journal cocitation
RUBONIS AV, 1991, PSYCHOL BULL, V109, P384
RUEF AM, 2000, CULTURAL DIVERSITY E, V6, P235
SHAH B, 1997, SUDAAN USERS MANUAL
X论文增长趋势线型图
23
2.知识图谱概述——发展历程
1987年,美国基金会发表研究报告《科学计算中的可视》,开始长期资助科
学可视化(scientific visualization)研究 1987年,著名计量学家克雷奇
20世纪20、30年代英国人类学研 究提出“社会网络分析图谱”social
networt analysis map
POLE N, 2001, J NERV MENT DIS, V189, P442
RESNICK H, 1999, J ANXIETY DISORD, V13, P359 RESNICK HS, 1993, J CONSULT CLIN PSYCH, V61, P984 ROTHBAUM BO, 1992, J TRAUMA STRESS, V5, P455
11
1.知识可视化概述
可视化对象 可视化目的
可视化方式
交互类型
信息可视化
知识可视化
知识图谱
非空间数据
人类的知识
科学知识
从大量抽象数据中 促进群体的知识创新 展示学科,促进科学
发现新的信息
和传播
发展
计算机图形图像 绘制草图、知识图表、 多维图表、视觉隐喻 视觉隐喻
人-交互
人-交互
人-交互
12
1.知识可视化概述
将数据以及数据间关系表达 成一个图,图中节点表示数 据,线表示数据间关系
运用较小生成树法及复杂连 接删除算法,删除网络中大 部分连接,保留最重要连接 ,最大限度简化网络
25
2.知识图谱概述——发展历程
印第安纳大学Ketan K Mane 和泊尔纳提出“PNAS主题爆 炸图谱”,用以发现主要主 题和复杂趋势
1116, A1
FOTHERGILL A, 1999, DISASTERS, V23, P156
FULLERTON CS, 1999, AVIAT SPACE ENVIR MD, V70, P902
GINEXI EM, 2000, AM J COMMUN PSYCHOL, V28, P495
GOENJIAN AK, 2001, AM J PSYCHIAT, V158, P788
❖ 改正字符错误,统一或增补 ❖ 分时段 ❖ 有代表性的抽取
31
3.3选择知识单元
❖ 知识单元是知识处理的基本单位:关键词、题名、 作者、机构、刊名、分类号、学科等等。目前也 扩展到摘要、参考文献和全文。多种结合。
32
3.4 构建知识单元关系
1、说明科学知 识和情报内容的 继承和利用 2、标志科学的 发展
GREEN BL, 1990, J APPL SOC PSYCHOL, V20, P1033 HANSON RF, 1995, J CONSULT CLIN PSYCH, V63, P987 HARVEY AG, 1999, J CONSULT CLIN PSYCH, V67, P985
author cocitation
国内数据库:CNKI、CSSCI、CSCD、万方等
网络数据源:Google Scholar、arXiv、CiteSeerX
30
3.2样本数据清洗
❖ 基于文献数据库进行知识可视化的质量、合理 性和可靠性很大程度上依赖于所用数据的精确 性和全面性,不准确或不全面的数据往往造成 不精确甚至错误的结果。即使目前最权威、公 认质量最高的WoS,也存在数据著录格式(如 人名和地名的不统一)和遗漏的问题。
2.知识图谱概述——发展历程
❖ PFNET算法根据经验性数据, 对不同概念或实体间联系的相 似性或差异程度做出评估,然 后引用图论中的基本概念或原 理生成特殊的网状模型
1990美国心理 学家斯克沃斯 兹恩巴克提出 “寻径网络图 谱”pathfinder network
scaling map,PFNET
18
2.知识图谱概述——基本概念
19
2.知识图谱概述——基本概念
❖ ①较形象、定量、客观、真实地显示学科结构、 热点、演化与趋势,是学科基础研究新视角。
❖ ②知识图谱可发现、描述、解释、预测和评价 科学知识。
❖ ③对图书情报学科具有更重要意义,也有助于 信息检索、信息分类与信息服务等。
耗时、 费力、 难以重复、 较主观 盲人摸象
水果
16
17
2.知识图谱概述——基本概念 ❖知识是一个内涵非常丰富的概念;知识广
泛存在于社会各个领域。科学知识图谱广 义上包括:生物的基因图谱、教育教学中 的认知地图、探索太空的天体图、描绘地 形的GIS、模拟人脑的神经网络图、各种 金属图谱等。 ❖科学知识图谱是以科学知识为对象,显示 学科的发展进程与结构关系的一种图形, 具有“图”和“谱”的双重性质与特征。
❖“Information Visualization”术语是由斯图尔特•卡 德、约克•麦金利和乔治•罗伯逊于1989年创造出 来的;
❖ 美藉华人陈超美1999年率先发表了该领域的第一 部专著《信息可视化》,创办了国际期刊《 Information visualization》。
10
1.知识可视化概述
利用专利分析工具形成的专利知识图谱
IN-SPIRE发现工具可整合交互
式信息可视化与询问功能
论文的最小生成树图谱
最小生成树导航图谱
28
3.科学知识图谱的绘制方法步骤
29
3.1样本数据获取
主要数据来源:Web of Science ❖ 科学文献数据:
(SCI) (SSCI) ❖ 专利文献数据:德温特创新索引DII ❖ 国际会议文献数据:(CPCI) ❖另外还有Scopus,Science Direct,L
❖ 基本原理是分析知识单元 (科学文献、科学家、关 键词等)的相似性及测度。 采用不同的方法和技术绘 制不同类型的图谱。
科学知识图谱
22
2.知识图谱概述——发展历程
❖ 传统的科学图谱以简单的二维、三 维图形(如:柱形图、线性图、点 布图、扇形图、平面图等)表示科 学统计结果
文献摘要或关键词纪录比例图
利用地理信息系统的可视化信息,地理地图的自然组织 框架,构建隐含大量信息的可视化主题地图
应用案例: 期刊文章的数量与 资助基金间的动态 关系图谱
27
2.知识图谱概述——发展趋势
❖ 随计算机处理能力日益提高、文献数字化,知识图谱工具在模拟人类信息分 析等方面,可帮助人类进行某些领域的判读、搜索、决策、预测……
概念图
概设 教 念计 育 组制 应 成作 用
知识可视化 工具及其教 育学习应用
思维导图
此外,在科研写作中也需要绘制图表,呈现知识
13
关于 “概念图”的概念图
14
思维导图:用于放射性思考
子题 1
子题 7
子题 思考主的題主题 子题
2
6
子题 3
子题 4
子题 5
15
❖阅读下面黑体的词汇,然后立刻闭上眼睛, 持续30秒,思考它。
❖ 知识可视化发展时间很短 ,正式起源于 2004年, M.J.Eppler 和 R.A.Burkhard 共 同 发 表 论 文 (knowledge Visualization -Towards a New Discipline and its Fields of Application)。
❖ Eppler 认为 : 知 识 可 视 化 主 要 研 究 视觉 表 征 的使 用,主要目的是改进两人或多人间知识的创造与 转移;知识可视化是指能用来构建和传递复杂观 点和内容的所有图形手段和方式。
❖ 用克林伯格跳变算法和共生词分析法和图示 技术,研制主要主题和复杂趋势的发现地图
• 网络中各节点代表高 频词和爆炸词 • 节点大小代表该词达 到最大爆炸水平 • 颜色代表词常用和达 到最大爆炸水平的年 代
26
2.知识图谱概述——发展历程
有维斯(J. Wise)等提出“信息 地图”information landscape
相关文档
最新文档