文献信息分析理论方法及应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文献信息分析的内容
影响因子(Impact Factor,IF)是指某一期刊的文章在 特定年份或时期被引用的平均频率。影响因子的计算 方法是:用某刊的被引用次数除以该刊刊载的论文数, 实际计算影响因子的方法为某年某一期刊在过去两年 中所发表的论文被引用的总次数与该刊在同一时期内 发表论文的总数之比。
文献信息分析软件
Vosviewer 的优势在于可视化,能从多个视图对结果进行 展示,可构建多种矩阵,并支持文本挖掘,但其无法实现数 据的去重,不能通过时间演变展示一个领域的演进路径。
SciMAT 具有强大的预处理能力,能构建多种文献计量学 网络,并以文献计量学指标对结果的影响力进行定量分析, 还可通过配置向导的方式引导用户进行分析。
问题,其最大的优势在于其强大的聚类分析功能。
文献信息分析软件
每一个工具都有着不同的特点,没有一个工具能够囊括 所有的功能。比较结果显示,Citespace,SCI2,SciMAT功能较 完整,其他工具也有各自的优势。 在开展分析时,应了解不同工具的特点,再根据不同的分 析目的、特性和拟解决的问题,选择恰当的分析工具。
北京大学图书馆
《中文核心期刊要目总览》
中国科技信息研究所
《中国科技期刊引证报告》
中国科学院文献情报中心 《中国科学引文数据库来源期刊》
文献信息分析的内容
论文的作者与核心作者 洛特卡定律:
f(x)为写x篇论文的作者占作者总数的百分比,x为论文篇 数,C为某主题领域的特征常数。
文献信息分析的内容
论文的作者与核心作者 普赖斯(Derek John De Solla Price)提出了核心生产者 的“平方根定律”,即在某一特定领域中,全部论文 的半数系由该领域中全部作者的平方根的那些人撰写 的。这些人无疑是核心或高产作者。
对文献主题进行分析,可以直接展示整个研究领域的现 状,发现不同研究之间的联系,从而了解知识之间的潜 在联系。
文献信息分析的内容
分类号、主题词与关键词 频次排序分析 共现分析 聚类分析 基于文献的知识发现
文献信息分析的内容
分类号、主题词与关键词 在信息管理领域中,对文献内容的标识主要采用分类语 言和主题语言。 分类语言:分类号 分类表 知识体系结构 《中国图书馆图书分类法》 主题语言:标题词、单元词、主题词、关键词等。
文献信息分析的内容
在文献信息分析的过程中,都要经历一个选择“检索 途径”的步骤,比如按照主题词、作者、期刊等途径 来检索到相关文献。如果从信息“存储”(信息组织) 的角度来看待数据库中的文献信息记录,我们就会发 现,每一个检索途径,比如文献的题名、著者等途径, 对应的都是文献的特征。
文献信息分析的内容
对13 种分析工具特点归纳如下: Histcite 主要用于对书目数据进行基本的统计分析,以时间序 列编制引文编年史图展示领域的演变路径,但无法对数据进行 标准化处理,分析方法较少。
Citespace 支持中文数据库在内的多个数据库,可以构建常见的 关系网络,采用多种文献计量学分析方法定量分析可视化结果, 从多个角度展示某领域的演变历程,但其无法实现数据的去重。
文献信息分析的内容
聚类分析 获得了相似矩阵之后,我们可以将其输入到统计分析软 件(如SAS,SPSS等),选择相应的模块进行聚类分析 (cluster analysis)。
聚类是通过计算分类对象在各个属性上的相似程度,将 对象分类到不同的类或者簇的过程,使得同一个类中的 对象有很大的相似性,不同类间的对象有很大的相异性。
文献信息分析的目的和意义
文献信息分析的理论与方法
文献信息分析采用的主要方法是文献计量学中常用的 分析方法。
文献计量学就是借助文献的各种特征的数量,采用数 学与统计学方法来描述、评价和预测科学技术的现状 与发展趋势的学科。其分析指标主要是:文献量、作 者数、词汇数。
文献信息分析的理论与方法
随着数据挖掘(Data Mining)和信息可视化 (Information Visualization)技术的兴起,根据上述指 标的共现情况(如两篇论文同时被其他论文引用的次数) 进行深入挖掘,发现新的知识、表现某一领域研究状 况的方法也逐渐引入到文献信息分析之中,成为其核 心技术之一。
文献信息分析软件
现有的文献信息分析工具主要分为:
基于统计的分析工具: SPSS,SAS,Excel 等。 基于文献计量的分析工具: Histcite ,Citespace, Bibexcel,
Inspire , ColPalRed ,SATI , Leydesdorff 系列软件 , Bicomb ,SCI2 , Network Workbench Tool , Vantagepoint , Vosviewer , Citnetexplore ,Refviz, SciMAT等。 基于社会网络的分析工具:Pajek ,Ucinet等。 基于PubMed 的分析工具:GOPubMed ,PubMedplus,本地 PubMed,PubFocus等。
文献外部特征的分析
题目
作者
作者工作单位
出版者
出版地
版次
期刊名称
引文
专利号
文献信息分析的内容
文献信息分析的内容
文献信息分析的内容
文献信息分析的内容
文献信息分析的内容
文献信息分析的内容
发表论文的期刊与核心期刊 论文的作者与核心作者 引文与引文分析指标
文献信息分析的内容
发表论文的期刊与核心期刊 关于某一特定课题、学科或领域的论文,我们称之为 该课题的“相关论文”。相关论文在期刊中不是均匀 分布的,即除了发表在本专业的期刊上,也发表在相 关专业bMed 是最早使用基于本体的语义分类工具,支持分类导 航分析,使用户能快速找到最相关的文献,但创建的关系矩阵 单一。
本地PubMed 使用多个计量学指标对文献进行评价,可以从多 个角度对分析结果进行可视化。
PubMedplus 基于PubMed,在数据处理方面解决了作者重名的
文献信息分析软件
文献信息分析软件
文献信息分析软件
文献信息分析软件
文献信息分析软件
文献信息分析软件
文献信息分析软件
每一个工具都有着不同的特点,没有一个工具能够囊括所 有的功能。比较结果显示,Citespace,SCI2,SciMAT功能较完 整,其他工具也有各自的优势。
文献信息分析软件
文献信息分析的内容
基于文献的知识发现 (1)科学研究的深入,造成了客观知识的总量与人类吸 收知识的能力之间的差距越来越大。 (2)科学技术越来越专业化,跨学科的信息传递变得 更加困难,就会产生知识的分裂。 一个专业领域的信息可能对另一个专业领域是有价值的, 跨学科间一定存在着潜在的未被发现的关联。
文献信息分析的理论与方法
4. 统计这些高频指标在同一个文献记录中共同出现的 频次,形成共现矩阵。
5. 利用统计分析软件,根据共现矩阵,采用聚类分析、 引文分析、社会网络分析等方法对相关指标进行分类。
6. 对形成的类别进行内容分析,以此说明该领域的科 学研究活动的基本状况,如研究热点、核心期刊等等。
文献信息分析的内容
频次排序分析 将被统计的对象(如作者、期刊和主题词)都按照它们 出现的频次从高到低排序,由此发现其中的规律。
文献信息分析的内容
共现分析 主题词的共现分析是根据主题词在同一篇论文中共同出 现的次数来表示主题词之间的联系。一般认为,如果两 个主题词频繁在同一篇论文中同时出现,往往表明这两 个主题词之间具有比较密切的联系。
文献信息分析的理论与方法
文献信息分析的基本步骤包括: 1. 确定研究主题的范围,检索相关文献的记录,下载相关
文献记录。 2. 抽取相关指标(如期刊、作者、引文等)进行频次统计。 3. 将统计指标按照出现频次由高到低排列,截取其中高于
某个阈值的部分,如高频主题词、高频期刊、高产作者等 等,作为进一步分析的样本。
ESI的内容包括引文排位(Citation Rankings)、高被引论文 (Most Cited Paper)以及引文分析(Citation Analysis)三大主 要模块。
文献信息分析的内容
除了ESI指标之外,美国科学情报研究所(ISI)创始人 尤金·加菲得(Eugene Garfield)在上个世纪60年代还 创立通过被引次数评价期刊的指标:影响因子和即时 指标。这两个指标自1975年以来,每年定期发布于 “期刊引用报告”。
文献信息分析软件
SATI 支持中文数据库,实现基本的统计分析,能构建多类矩阵。 Pajek 支持大型的网络数据,不仅可以构建一些普通的网络图, 还支持特殊网络的构建,具有强大的图形处理能力,但不支持 文献计量关系矩阵的创建,数据预处理能力差。 Ucinet 可导入矩阵,也可自行创建,具有网络分析功能,内置可 视化软件,但不支持文献计量学矩阵的创建。
文献信息分析的内容
美国芝加哥大学的信息科学荣誉教授Don R.Swanson 于1986年首次在医学文献研究中发现了这种关系的存在: 雷诺氏病(A) 血液黏度升高(B) 食用鱼油(C) Swanson把这两种知识联系起来得出食用鱼油(C)应该对 雷诺氏病(A)患者有帮助的假设 。在这个假说提出大约 两年后,有人通过临床实验证实了这一点。
文献信息分析的内容
引文与引文分析指标 参考文献(reference) 引文(Citation) 我们可以通过一篇论文被其他文献引用次数来表示该论 文的影响力或者重要性,这一类的分析叫做引文分析 (citation analysis)。
文献信息分析的内容
引文与引文分析指标
2001年,美国费城科学情报所(Institute for Scientific Information,ISI) 根据引文分析的原理,推出一种定量地 评估科学研究水平的重要研究工具:基本科学指标 (Essential Science Indicators,ESI)。
1934年 布拉德福(Samuel Clement Bradford)
文献信息分析的内容
目前,核心期刊的定义已经转化为“某学科所涉及的期刊 中,刊载论文较多的(信息量较大的)、论文学术水平较 高的,并能反映本学科最新研究成果及本学科前沿研究状 况和发展趋势的,较受该学科读者重视的期刊”。
自然科学领域:
文献信息分析的内容
即时指标(Immediacy Index)表示特定年份发表于某 刊的论文在同一年中被引用的指标。
即时指标是表示的是期刊被利用的速度,因而也反映 了所研究内容的“热门”程度。
文献信息分析的内容
文献内部特征分析 在文献数据库中,每一条文献记录中一般有分类号和主 题词、关键词的字段,用以表示文献的内容。
文献信息分析软件
SCI2 是一个模块化工具集,集合了多个工具的功能,支持多种 格式的输入,分析方法多样,在可视化方面拥有丰富的插件,但 在使用上有一定的难度。
Bibexcel 专门用来构建文献计量学关系矩阵,具有高度的灵活 性,需借助其他的可视化软件来进行可视化分析。 Bicomb 支持中文数据库,能进行基本的统计分析,并生成多种 共现矩阵和词篇矩阵,但数据处理和可视化方面存在不足。
文献信息分析的内容
ARROWSMITH 具有隐藏联系的例子: 消炎痛与阿尔茨海默氏症(1996年) 雌激素与阿尔茨海默氏症(1996年) 游离钙磷脂酶A2与精神分裂症(1998年)
文献信息分析软件
文献信息分析工具通过结合文献计量学、社会计量学、 统计学、图形学、信息科学、计算机科学的技术和方 法,帮助用户快速地获取高价值信息,高效追踪学科前沿。
信息中心科技情报室 王崴
文献信息分析理论方法及应用
文献信息分析的目的和意义 文献信息分析的理论与方法 文献信息分析的内容 文献信息分析软件 书目共现分析系统(Bicomb)、CiteSpace功能及使用
简介
文献信息分析的目的和意义
信息分析主要是指以对大量已知信息的内容进行整理 和科学抽象为主要特征的信息深加工活动。在此过程 中,要对信息的价值进行评估,然后选取可靠的、先 进的、实用的信息进行信息的整序甚至统计,提取信 息中隐含的知识,从而获得增值的信息产品。