citespace使用 讲课版
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 3 CiteSpace基本原理
基本理论
1、研究前沿(research front)
一组突现的动态概念和潜在的研究问题
2、知识基础(intellecture base)
在科学文献中(引用研究前沿术语的科学文献所形成的演化网络)的
引文和共被引轨迹
3、社会网络分析
以强调(学术或作者间)关系(节点间路径)的研究,映射学术(研
术关联等
----引自《科学知识图谱方法与应用》
可以解决问题 1、识别研究前沿
将新兴的研究趋势和新出现的科研主题,映射于对应的知识基础(高共引文献) 2、标注研究前沿
从 Title 、 Abstract 、 Descriptors 、 Identifiers 中提取突变词( burst terms),以识别学科新趋势、新方向、新 领域、新主题
Citation tree-rings 引文年环—代表着某篇文章的引文历史。
……并同时具有艺术享受
CiteSpace 2.2 R11 Chaomei Chen
2、CiteSpace应用案例及方法
• 学科领域---前沿、新兴、领域、 进展
概要 • 科研竞争力---国家、机构、领军人物、
研究水平 • 核心文献---热点论文、核心期刊
2.1.1 研究前沿、新兴前沿分析
研究前沿析出方法
分析结论: “六维力传感 器”近10年的 10篇高词频或 高引频文献
“六维力传感器”共现(引)文献网
2.3.2 核心文献 — 核心资源分析
分析策略 通过共引期刊(cited journal)分析,获得核心学科资源
数据设置
“红外器件”共引期刊词频排行
分析结论: 得到“红外 器件”近10 年6种高中性 度文献资源
分析结论:“红外器
件”3名高发文作者,分 别为美国、加拿大等
2.2.4 科研竞争力 -- 研究水平分析
需求分析 对X所X引进人才“InN纳米花结构”研究水平评估 数据处理
1. 数据制备
用SCI、ISTP、EI数据库,采用XX检索式,在主题项中检 到“2000-2010 InN纳米花结构”XX条文献数据
• 科研竞争力---国家、机构、领军人物、
概要 研究水平
• 核心文献---热点论文、核心期刊 • 完整案例---六维力传感器发展趋势研究
2.2.1 科研竞争力 — 国家分布
分析策略:通过国家(country)或 +术语词组 (noun phrases)(或学科聚类),获得研究国
家、竞争国以及学科间关系
“红外器件”共引期刊网
分析结论: 得到“红外器件”近10年70多 种高词频核心文献资源
2.4 研究主题全球分布概览
“六维力传感器”在中国 研究的地区分布
“六维力传感器”在西欧等 世界个地区的研究分布
利用CiteSpace在Google地图上, 生成研究主题在世界各地区的分布
3、CiteSpace使用方法
2.1.2 研究(学科)转折(关键)点分析
研究(学科)转折(关键)点析出方法
利用共引(现)词、款目词( category、term、keyword或cited reference)+术语词 组( noun phraces) ,从DCA混合分析网络揭示关键/转折研究前沿
数据设置
图谱分析: 按中性度大于0.1原理,析出5个紫色 节点,表征5个关键/转折研究前沿
分析策略:通过机构(institu*)或 +术语词组(noun phrases)(或学科聚类),获得研究机构
分布、竞争对手以及机构研究间关系
数据设置
“红外器件”机构网
“红外器件”国际机构排行
“红外器件” 国际研究 机构分布
“红外器件”机构+术语词组网
从发文角度分析,
“红外器件”中科院为高发文机构
概要
• 概念名词
• 数据类型 • 图谱判读 • 使用步骤 • 地球地图生成法
3.1 概念词定义 1
Nodes节点--在图谱中节点即曲线中的控制点、交叉点,
网络连接的端点,根据共引(共现)频次统计而形成的
节点
各色方圆节点
Centrality 节点中心性(度)--是指其所在网络中通过某节 点的任意最短路径的条数,是网络中节点在整体网络中 所起连接作用大小的度量
1.2 科学知识图谱基本原理
科学知识图谱以科学知识为计量研究
对象,显示科学知识的发展进程与结构 关系,用数学方程式表达科学发展规律, 采用引文分析方法以及信息可视化技术, 采用曲线、图谱等形式将科学发展规律 绘制成二、三维、知识图谱、知识地图 等图形
科学知识图谱基本原理是分析信息
知识单位(科学文献、科学家、关键词 等)的相似性及测度。采用不同的方法 和技术绘制不同类型的科学知识图谱
这个系统利用可视化技术,在知
采用PathFinder关键路径网络法、Minimum Spanning Tree 最小生成树法
识领域中帮助用户进行突发趋势 和技术预测等分析
选择地控制图中点连接密度,精简复杂的分析网络 6、时间抓拍的概念模型
用时间切片抓拍( Time-sliced snapshot )来显示学科(研究)演变、学
数据设置
“红外量子点-阱”新兴前沿分析网
分析结论:
NSF “水体污染控制与治理技术” 的研究前沿为2个领域:2003-05 年 间 的 “ 环 境 工 程 ” ; 20062009年间的“合作研究”
图谱分析: 按突现率3.09指标,析出1个红 色方节点,表征1个新兴前沿
分析结论: “红外量子论”研究在05-10年间 出现一个新兴前沿:In-A量子点阱
Betweenness centrality 中间中心性—用来进行中心性测度 的指标,指网络中经过某点并连接这两点的最短路径占 这两点之间最短路径线总数之比。中间中心性高的节点 为关键节点,呈紫色方圆节点;位于连接两个不同聚类 的路径上的节点为“转折点”
Burst terms 突现词—通过考察词频,将某段时间内频次变 化率高的词从大量的主题词中探测出来
3、寻找关键节点 关键节点控制科研走向;其余节点以关键节点为核心形成学科结构
1.4 科学知识图谱CiteSpace为科研能做……
用科学计量学和知识图谱方法,为科 学观察、发现、跟踪提供参考途径
识别科研前沿,发现科学问题 揭示科研进展,跟踪科研演变 构建学科结构,明晰科研布局 观察学术关系,了解竞争对手 判断经典文献,辅助科研概述
“NSF水污染”研究前沿分析
用共被引(现)词+研究聚类,揭示研究结构 构成
数据设置
图谱分析及其结论:
根据研究聚类分析,从1979-2009 年,NSF资助项目“水污染” 的 研究结构分布于20多个方面:
“NSF水污染研究结构”分析网
3、CiteSpace应用案例及方法
• 学科领域---前沿、新兴、领域、进展
2. 导入CiteSpace;数据处理、构建分析网:
节点类型:phrases、cited reference 分析网类型:ACA + 学科聚类
“纳米花”共引作 者+学科聚类网
数据设置
“InN纳米花”” 共现作者+学科
聚类网
分析结论: 从分析网图谱1-2分析出近10年国际“纳米花”或“InN纳米花”晶体结构
聚类),获得领军人员、合著者、竞争对手以及合作关系
数据设置
“红外器件”作者+前沿主题网
分析结论:
“红外光电探测 器”主研人员均 是国外科研人员
“红外器件”(发文)共现作者网
“红外器件” 共引作者网
分析结论:
“红外器件” 高共引 文作者,分别为美国、 加拿大、韩国等;中 国高校、中科院等多 数为合著者,如…
究者)关联;突出节点在关系网络中位置,构建关键节点
4、标签(聚类)词选取
基于信息论的3种算法tf*idf、Log-Likelihood Ratio 、Mutual Information,
CiteSpace是2003年由美国
找出合适聚类词,以标识学科(研究)领域、前沿
Drexel大学 陈超美教授开发的。 5、精简网络
图谱分析:
根据点群颜色、构成、高 词频文献,分析得出研究 进展,发展态势
分析结论: NSF水污染-人口与社会生态群 落” 研究进展: 1 、1977-79年 水环境生态系统、生化研究。。 4、1990-92年 跨系统研究。。。 5、2001-09年 。。。。
用时区图 (timeline、timezone)分析, 显示学科进展、发展态势: 从1976年以来,NSF“纳米环境健康与 安全” 研究经历了三个发展阶段: 1 、第一阶段:1996年 最早始于1996年,资助项目主要侧重污 染防护研究项目建议,典型的有:“乳
科学知识图谱
科学知识图谱绘制:通过数据挖掘、信息处理、知识计量
和图形绘制把复杂的学科知识显示出来,直观地标注研究领域 在科学知识版图上的位置,构建其知识结构与框架 分析方法:社会网络法、聚类分析、(共)引文分析、因子分 析、多维尺度分析等 分析软件:CiteSpace、Pajek 、Ucinet、Netword、Scimap、 Aureka、Bibexel、Wordsmith等
用共引(现)词频( category、term、keyword或cited reference)+术语词组( noun phraces)分析,从分析网图揭示研究 前沿
数据设置
图谱分析: 根据“研究前沿”理论,析出2 个聚类,对应表征2个研究前沿
新兴研究前沿析出方法
“NSF水污染”研究前沿分析网
利用突现词频(burst term)+共引(现)词频( category、term、keyword或cited reference,从DCA混合分析网络揭示新兴前沿
清渗透生物降解除冰两级发酵”研究建 议等。。。。。
数据设置 时区图timeline
2.1.4 研究领域、结构分布
用分类(categrey)揭示研究领域分布
数据设置
“红外器件研究领域”分析网
图谱分析: 根据学术专业词聚类,析出若 干节点,表征研究领域、结构
分析结论:
红外器件研究主要涉及十几个领域, 其中重点领域为:光学、光谱学、 成像、材料、计算机
“红外器件”国家分布网
数据设置
法国
美国
日本
分析结论:
“红外器件”研究 (发文)大国为: 美国、中国、日 本、德国、法国 等
“红外器件”国家+术语网
分析结论:“红外器件”方面,
中国主攻领域:量子阱红外 探测器等方面;美国、英国、 澳大利亚等分别涉及2个前沿 领域:红外光电探测器、毫 微米红外探测器
2.2.2 科研竞争力 — 研究机构分析
主要内容
科技知识查获路径
知识图谱及CiteSpace基本概念
CiteSpace应用案例分析
CiteSpace使用方法
1、知识图谱应用原理
概要
• 社会网络法 • 科学知识图情 • CiteSpace应用领域 • CiteSpace原理&概念
1.1 社会网络法基本概念
社会网络分析(Social Network Analysis) 社会网络分析方法是由社会学家根据数学方法﹑图论 等发展起来的定量分析方法。社会网络代表着一种结 构关系,它可反映行动者之间的社会关系,构成社会 关系结构及其属性
生长方面,无论“第一人”或“第一时间”或“首创方法”等方面,都
没有这位引进人员
3、CBaidu NhomakorabeateSpace应用案例及方法
概要
• 学科领域---前沿、新兴、领域、进展 • 科研竞争力---国家、机构、领军人物、
研究水平
• 核心文献---热点论文、核心期刊
2.3.1 核心文献 — 重点科技论文分析
分析策略 通过共现词频(term或keyword)或共引文献(cited reference)分析,获得关键文献
分析结论: “红外探测器” 近年5个关键研
究前沿:超晶格、红外探测器、 光探测器、镓化合物、光吸收
“红外 探测器”关键前沿分析网
2.1.3 学科进展、发展态势分析
数据设置
分析方法: 用共引(现)词频( category、term、 keyword或cited reference)构建分析网
“研究进展”分析网
“红外器件”机构+学科聚类网
分析结论:
在前沿主题分布中,中科院机构侧重“红外量子阱”、 “光电探测器”、“红外焦平面”研究;与澳大利亚国 家研究院“、”中国科大“等研究主题非常接近
分析结论:
在“红外器件”学 科中,中科院机 构占有很大份额
2.2.3 科研竞争力 — 学术个人(作者)分析
分析策略:通过作者(author)或 共引作者(cited author)+术语词组(noun phrases)(或学科