基于Citespace_的信息可视化文献的量化分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1引 言
所谓信息可视化(Information Visualization)是指 利用计算机实现对抽象数据的交互式可视表示,来 增强人们对这些抽象信息的认知【1】。 信息可视化有 助于人们通过视觉的通道快速地观察、认知、加工有 关信息,以利于分析数据、发现规律和制定决策。 信 息可视化可以揭示出信息之间的关系和信息中隐藏 的本质规律。
ROBERTSON GG
1991 P ACM C HUM FACT COM 0.33
9
27
4 KOHONEN T 1997 SELF ORG MAPS
0.28 6 14
5 CARD SK
1999
READINGS INFORMATION
0.22 1 22
6 AHLBERG C 1994 P CHI 94
3.1 关键节点文献分析
进行主题分析, 需要将网络节点设定为参考文
献 (reference)和 主 题 词 ,将 主 题 词 来 源 设 定 为 文 献 标题、文摘、描述符(descriptor)三种。 由于 Citespace II 软 件 中 主 题 词 又 包 括 名 词 短 语 (noun phrase)与 “涌现”词(burst terms)两种,我们先将主题词设定为 “涌 现 ”词 ,然 后 运 行 Citespace II,即 可 得 出 输 出 网 络 所 涵 盖 的 节 点 (Nodes=269)与 连 接 线(Links=472) 数, 同时也绘制出了信息可视化研究领域的文献共 引网络图谱,见图 1。
本文使用的引文分析可视化工具是基于 JAVA 平台的 CiteSpace II 版本号为 2.2.R5,是由美国费城 德 雷 克 塞 尔 大 学 (Drexe1) 信 息 科 学 与 技 术 学 院 陈 超 美博士开发, 他是国际上信息可视化领域的权威专 家, 多年致力于信息可视化方法及相关算法研究。 Citespace II 可 用 于 探 测 和 分 析 学 科 研 究 前 沿 的 变 化趋势以及研究前沿与其知识基础之间、 不同研究 前沿之间的相互关系。通过对文献信息的可视化,能 够较为直观地识别学科前沿的演进路径及学科领域 的经典基础文献。 同时,选择机构共现分析,可得到 基于研究机构共现网络的机构合作网络图谱, 实现 对某技术研究领域中研究机构合作情况的可视化分 析【5】。 CiteSpace II 可以在其主页(http://cluster.cis.dre xe1.edu/~cchen/citespaee/)上自由下载,免费使用。
Abstract:The article utilizing the latest famous information visualization and analysis software Citespace II Thomson.ISI from SCI (Web version) (web of science in the Science Citation Index Expanded Edition) that you downloaded in 1989 - the 2009 years information visualization literature made a detailed visual analysis to clarify the information visualization of its evolution, rencent, explore the study and research institutions in the country. Key words: information visualization; citespace II; atlas of cocitation network
1期
基于 Citespace II 的信息可视化文献的量化分析
99
dex Expanded)数据库为数据来源。 检索方法选定为 高级检索,检索式为:“TS=Information visualization”。 检索年限设定为 1998—2009,其中文献类型设定为 “article”,共计 4025 条记录符合条件。数据下载的方 式设定为 “全纪录并且包含所引用的参考文献”,数 据下载结束的时间为 2010 年 1 月 29 日。
3 结果分析
将下 载 的 相 关 数 据 全 部 录 入 Citespace II 软 件 中,然后进行相关选项的设定。 首先设置时间,由于 本文检索年限为 1998—2009 共计 12 年, 所以设定 时间跨度为 1 年,这样就形成 12 个时间段。 其次设 定 c,cc,ccv (其中 c 为文献被引频次;cc 为两篇文献 的共引频次;ccv 为文献的共引系数)的阈值分别为 (3,2,20)、(4,3,20) 和 (5,3,20), 选 定 路 径 搜 索 (pathfinder)算法。 最后依据分析内容的不同,选定 相应的网络节点,如:作者、关键词、机构、国家等等。
3.2 研究热点的演进分析
科学文献在发表之后,随着时间的推移,相对于 科学技术的迅猛发展,其内容会逐渐变得陈旧过时。 而研究内容的陈旧过时, 具体体现在代表该研究内 容的词汇或短语出现的次数的变化【4】。 由于 CiteS-
Science 中的科学引文索引扩展版) 中下载的 1998--2009 年间信息可视化研究文献做了详细的可
视化分析,厘清了信息可视化研究的演进轨迹,揭示了研究热点,探讨了此项研究的国家与研究机
构分布情况。
关键词:信息可视化;Citespace II;共引网络图谱
中图分类号:G350
文献标识码:A 文章编号:1007-7634(2011)01-0098-04
点文献的相关信息见表 1。
表 1 关键节点文献的综合信息表
序 号
作者
出版 年
文献名称
中心 半衰 被引 度 期 频次
1 TUFTE ER 1983 VISUAL DISPLAY QUANT 0.44 15 37
2 ALTSCHUL SF 1997 NUCLEIC ACIDS RES
0.38 3 50
3
第 29 卷 第 1 期 2011 年 1 月
情报科学
Vol . 29 , No . 1 January,2011
基于 Citespace II 的信息可视化文献的量化分析
周金侠
(河北科技师范学院 图书馆,河北 昌黎 066600)
Hale Waihona Puke Baidu
摘 要:利用当前最著名的信息可视化分析软件 Citespace II 对从 SCI(Thomson.ISI)网络版(web of
100
情报科学
29 卷
年 出 版 的 著 作 《The Visual Display of Quantitative Information》中,提出了数据图形学的理论,强调有用 信息密度的最大化问题。 后来塔夫特的这些理论在 众多的领域当中变得闻名遐迩,且富于影响力,从而 使得信息可视化发展成为了一门学科。 其次是美国 国 家 生 物 技 术 中 心 的 著 名 学 者 Altschul SF。 他 于 1997 年在 《Nucleic Acids Research》 上发表的论文 “Gapped BLAST and PSI -BLAST: a new generation of protein database search programs”中提出了数据库 搜索程序迭代算法也广泛引用, 在一定程度上推动 了 信 息 可 视 化 这 门 科 学 的 发 展 。 排 在 第 三 位 的 乔 治· 罗 伯 逊 (George G. Robertson)是 美 国 信 息 可 视 化 专 家和高级研究员、可视化和交互 (VIBE) 研究小组成 员, 他发明了多种信息可视化技术,1989 年他与斯 图 尔 特·卡 德 (Stuart K. Card)和 约 克·麦 金 利 (Jock D. Mackinlay) 一 起 创 立 了 信 息 可 视 化 的 英 文 术 语— ——“information visualization”。 第 四 位 Teuvo Kohonen 是芬兰赫尔辛基大学神经网络研究中心的 著名教授,也是芬兰最杰出的科学家,曾经担任欧洲 神经网络学会主席等职务,其在学习矢量量化算法、 基本理论的分布式联想记忆和优化的联想映射等方 面都有卓越建树, 其最突出的贡献就是发明了神经 网络地图(又称作“Kohonen 地图”)。 第五位斯图尔 特·卡德是美国 Xerox PARC 的一位高级研究员,也 是率先在人机交互方面运用人员因素的开拓者之 一。 他与托马斯·莫阑(Thomas P. Moran)和艾伦·纽 威 尔 (Allen Newell) 合 著 的 《 人 机 交 互 心 理 学 (The Psychology of Human-Computer Interaction)》已 经 成 为该领域极富影响力的经典著作。 第六位克里斯托 弗·阿尔贝格(Christopher Ahlberg)是瑞典马里兰大 学计算机教授,人机交互研究中心研究员,因其突出 的学术贡献,被选入 2002 全球技术新锐 TR100。 最 后一位 Susumu Mori 是美国约翰霍普金斯大学巴尔 的摩医学院核磁共振造影领域的专家, 他用实验证 明了大脑与复杂行为之间的神经网络控制关系,提 出了全新的神经网络可视化观点。 以上检索结果再 次证明了表 1 中所列学者及其文献在信息可视化研 究领域中的重要作用。
图 1 信息可视化研究的文献共引网络图谱
从图 1 中可以看出网络中有七个关键节点 (关
键节点是共引网络中连接两个以上聚类群组且具有
中介作用的节点)。 一般而言,关键节点的点度中心
性比较高,在整个网络中所起的桥梁作用也很大。从
知识理论的角度看, 关键节点文献通常是在该领域
中提出重大理论或是创新概念的文献, 也是最容易 引起新的研究前沿热点的关键文献【6】。 本文关键节
“信息可视化”这一术语最早出现在 1989 年 G. Robertson、S. Card 与 J. Mackinlay 的论文中【2】。 虽然 还处于发展时期, 但它方法技术的研究和应用正在
日益成熟, 也给信息资源管理科学带来了根本性的 变革。为了厘清信息可视化研究的发展脉络,把握该 领域的研究热点, 笔者拟用国际信息计量学中最先 进 的 软 件 Citespace II 对 Web of Science 中 有 关 信 息可视化研究的数据进行可视化分析, 以期有益于 我国信息可视化的研究工作。
2.2 可视化工具
引文分析可视化是信息可视化的重要分支,其 首先处理海量的引文数据, 之后利用信息可视化技 术使人们更容易地观察、浏览和理解信息,进而找到 数据中隐藏的规律和模式 【3】。 不过当前对此分析的 作者, 多应用统计学中的一些工具, 如 SPSS、Pajek 等,但是其可视化的效果不仅单调,而且分析解读比 较 烦 琐 【4】。
2 数据来源与可视化工具
2.1 数据来源
本文以 SCI(Thomson.ISI)网络版— ——web of Science 中的科学引文索引扩展版 (Science Citation In-
收 稿 日 期 :2010-04-08 作 者 简 介 :周 金 侠 (1965-),女 ,大 学 本 科 ,馆 员 ,主 要 从 事 图 书 馆 工 作 与 文 献 计 量 学 研 究 .
Documents Visibilization Analysis of Information Visibilization Based on the Citespace II
ZHOU Jin-xia
(Library of Hebei Normal University of Science & Technology,Changli 066600,China)
0.17 7 21
7 MORI S
1999 ANN NEUROL
0.12 4 16
为验证关键节点文献的重要性, 笔者利用 Google Scholar 对 表 1 中 按 中 心 度 的 排 序 的 文 献 做 了进一步的检索。 发现中心度最大的文献是美国耶 鲁 大 学 教 授 爱 德 华·塔 夫 特 (Edward Tufte)于 1983