引文分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
引文分析研究方法
将引文款目作为独立单位的引文分析 这类研究是以引文款目中任一著录事项或 某些著录事项间的组合作为计量单位l,并做简 单加和的计量统计。 款目之间的联系作为计量单位的引文分析
款目之间的联系作为计量单位的引文分析
款目之间的联系作为计量单位的引文分析
款目之间的联系作为计量单位的引文分析
参考文献与引用文献
例如,如果论文R将论文C 做为参考文献,则论文R就f一 篇参考文献C,而论文C则有了 一篇引用文献(引文)R。如果 以射线箭指向被引文献,而箭 尾指向引用文献,就可清楚地 表现出科学文献之间纵向继承 和横向联系的交流态势,通常 将这种相互引证的关系结构称 为引文网络(Citation Network)。
第七章 引文分析
基本概念和方法 科技期刊的引文分析 引文网络与聚类分析 引文分析的局限性与应用
基本概念和方法
引文分析的基本概念 引文分析研究方法 引文款目的独立计量分析
引文分析的基本概念
参考文献与引用文献 引用动机 引文分析 引文分析的基本假设
参考文献与引用文献
19世纪以来,西方科学界开始形成严格的科学传统,要求 科学家在撰写论文时,必须参照前人所写的与之有关的论文。 这就使得一篇完整的科学论文通常要包括两部分:作者的正 文部分和附于其后的参考文献部分。人们认为这些参考文献 反映了作者在构思自己的论文时吸收或利用早期研究者的概 念、方法,技术设备等。 普赖斯在论及文献的引证与被引证关系时曾建议:每一 篇被引文献,对于引证者(论文作者)来说,就是有了一篇参 参 考文献(Reference) (Reference),而对于校引证者(被引用文献作者)来说, 考文献(Reference) 则是有了一篇引用文献(引文)(Citation) 引用文献( )(Citation)。 引用文献 引文)(Citation)
引用动机
引用的非正常动机 为阿谀某人的引用; 为自诩为目的的引用; 为相互吹捧而带有偏见的引用; 为支持某一观点牵强的引用; 为维护某一学术研究派别利益的不正常引用; 因迫于某种压力的引用。
引文分析
引文分析最早被应用于法律界 引文分析的主要应用领域 对科研机构的作用和科学文献交流的状况 做出定量和定性的评价; 追踪研究科学技术的发展和文献交流的历 史过程; 文献的检索和评价。
评价期刊的指标
期刊载文量 在抽样时间内,某刊登载论文的数量 某刊登载论文的数量。 在抽样时间内 某刊登载论文的数量。 期刊引用率 某刊引用它刊的次数。另外: 某刊引用它刊的次数。另外:有时是期刊所 有参考文献的数量。 有参考文献的数量。 期刊被引率 在抽样时间内,某刊被别的期刊引用的数量 某刊被别的期刊引用的数量。 在抽样时间内 某刊被别的期刊引用的数量。
评价期刊的指标
平均引文率(平均引用率和平均被引率) 平均引用率是给定时间内,期刊引用参考 文献的数量除以相应期刊的载文量。 平均被引率是给定时间内,期刊被引用的 数量除以相应期刊的载文量。 影响因子 除用于评价期刊外,还可以评价学科、单 篇文献等。
评价期刊的指标
即年指标 它一般为期刊某年发表的论文的当年被引 用的平均次数,即:即年指标=某年度对该刊当年 发表论文的引用次数/当年发表论文的总数。 期刊自引率 在给定时间内,某刊全部引用论文中,引 用本刊论文所占的比例。 期刊自被引率 在给定时间内,某刊全部被引用论文中, 引用本刊论文所占的比例。
来源期刊总体情况分类统计表
引文分析
引文量的分析(M,m) 引文量按被引作者的分布(M,A) 引文量按文献类型的分布(M,K) 引文量按语种的分布( M,L) 引文量按时间的分布( M,T) 文献自引分析(E,e=E)1、2
科技期刊的引文分析
加菲尔德期刊引文集中定律 评价期刊的指标 SCI和JCR JCR的应用
引用动机
文献被引用的正常动机 对开拓者表示尊重;对有关著作给予荣誉; 核对其所用的方法及仪器;提供背景阅读材料; 对自己的著作予以更正;对别人的著作予以更正; 评价以前的著作;为自己的主张寻求充分的论证; 提供研究者现有的著作;鉴定数据及物理常数等; 对未被传播,很少被引或未被引证的文献提供向导; 核对原始资料中某个观点或概念是否被讨论过; 核对原始资料或其他著作中的起因人物的某个概念或 名词; 承认他人的著作或概念;对他人的优先权要求提出争 议。
评价期刊的其他相关指标
期望影响因数 (Expected Impact factor) 从众多的期刊中随机收集到一批论文,混 合地计算它们的被引文率,计算时不再强调严格 的时间规定性,这就是期望影响因数(EIF)。例 如,收集到的是给定时间内出版的某一指定专题 的一批被引证论文,统计出这些引证论文所载期 刊在给定时间的发文量,前者除以后者就得到期 望影响因数,也可称期望被引证率。
评价期刊的其他相关指标
重要性系数(S)=A期刊对B期刊的引证数量/A期刊 对所有的文献的引证数量 例如,一个有3种期刊(A、B、C)的期刊组,用此 公式来分析该组中一种期刊的重要性系数。假设在规 定的研究期间内,A期刊引证了B期刊的论文15次。计 算这一时间内A期刊对所有论文的引证频次,假定为 200次,其中125次引自A、B、C三刊的,而其余75次 是引自其他期刊的。那么,A期刊对B期刊的重要性系 数就是: S~=15/200=0.075 更为完善的分析认为,一种期刊的重要性系数应该 是该刊与其对应的期刊逐年的重要性系数的平均值。
评价期刊的其他相关指标
因此,在这个例子中: (Nind,a)p=(Nind,1995)1997=22; C1997=340; =340 S1994=50。 所以,这种期刊的回应因数便是: Ne=22/(340×50)=0.00129 EF与IF不同之外在于:EF不仅与本身的发文量, 同时还与全部施引期刊的载文量成反比,而IF仅与自身 的发文量成反比。换言之,两个平均值意义不同;IF的 分子一定是计算年度前两年间的受引数量,而EF的分 子为任一规定年度的受引数量,同时由于考虑了施引期 刊论文因素,所以对一种期刊影响力度的反映更为深刻、 有力。
引文分析的基本假设
假设1:文献间形式上存在的联系表明,文献 间在内容上必然存在某种联系。 假设2:若引用形式一样,则文献间内容联系 的程度一样,对于每种内容间的联系均可定义 相应的计量单位。若ai引用了bi,则ai与bi之 间的联系即为1,否则即为0。 假设3:上述联系均具有简单的可加性。 根据上述假设,可形成以下的引文矩阵。
引文款目的独立计量分析
前期准备工作 引文分析
前期准备工作
统计对象的选择 1、明确学科选择的范围。 2、明确时间的选择 范围 数据的统计 在选取的若干篇论文中,分项统计每篇论文 后面引文的数量,引文的出版年代、语种、类 型,论文作者的自引量等。统计项目可根据具 体的研究目的和要求,灵活掌握,自行确定。 或者直接从《科学引文索引》等工具中,选取 有关的引文数据,作为引文分析的基础。
加菲尔德期刊引文集中定律
加菲尔德发现,一个学科的非核心期刊在很 加菲尔德发现 一个学科的非核心期刊在很 大程度上是由其它学科的核心期刊构成的。 大程度上是由其它学科的核心期刊构成的。他 认为实际上所有学科的核心期刊合在一起不会 超过1000种,或许甚至少于 或许甚至少于500种。 超过 种 或许甚至少于 种
评价期刊的其他相关指标
重要性系数(Importance index) 在给定的主题领域内,期刊集合(组)中的一种期刊相 对重要性的测度。 1992年Salancik在其论文中,首次提出了重要性系数, 并用它比较了应用心理学中的两种期刊。这两种期刊被看 作是本领域中的一组期刊中的“成员”。他所赋予重要性 系数的定义是:“对其它(成员期刊)的相关重要性以及同 这些成员自己本身的重要性的比值。”重要性的界定则是: 一种期刊所登载论文所实施的引证数量比值。重要性系数 通常是分析一组期刊并且收集它们之间互相引证频次的数 据,再把数据置于引证文献矩阵中,经计算而得出。 1992年Kim著文计算了9种图书馆学情报学期刊的重 要性系数。在给定时间内,A期刊对B期刊重要性系数的 计算公式如下:
(2)m1=m2=m(即M,M被同一篇文献所引用),则 我们认为文献M1与文献M2之间有一个由于有一篇 共同的引文存在的共(同)引文联系,并也将其定 义为1。若这样的m有n篇,则根据假设3,可知M1 与M2之间的联系为n个单位。以上两种文献问的 联系构成文献聚类、学科聚类的理论基础,这一 问题将在后面讨论。
评价期刊的其他相关指标
引文位置(Citation location) 内部引文(Internal citation) 外域引文(Outside citation)
SCI和 SCI和JCR
SCI JCR
JCR的应用 JCR的应用
期刊研究和选择 (garfield ch.9 table46) 判断某种期刊的老化速度和利用规律 (garfield ch.9 table7&8) 深入研究文献情报流的结构及变化规律 (garfield ch.9 table12&13) 科学学的研究(garfield ch.9 table14)
引文的款目特征(BACK) 引文的款目特征
说明:(Ai)j----被引作者姓名 Ci--------作者国籍 Li --------语种 (Si)j --------被引文献标题 (Ki)j --------刊载被引论文的文献类型 (Ni)j --------刊载被引论文的文献名称 (Ti)j --------被引文献发表的时间 aj -------- 引用作者姓名 sj --------引用文献标题 kj --------刊载引用论文的文献类型 nj --------刊载引用论文的文献名称
A引文总量; b 来源期刊种数; c来源期刊册数
Leabharlann Baidu
引文的款目特征
(Ai)j (Si)j (Ki)j, (Ni)j aj VICKERY,B.C. (U.K.)(Eng) Bradford’s Law of Scattering J.Doc., 4(3),19—203(1948) 杨殿梅(中国)(中文) 布拉德福分布理论的产生和发展 情报学报 2(1)FEB.(1983) Kj, nj sj Ci, Li (Ti)j,卷,期, 页码
评价期刊的其他相关指标
连续性引证(Successive citation) 持续数年和数十年,频繁、不间断地获得引证(出 版物)的行为称为连续性引证(SC)。例如,当一种出版物 作为在本学科领域内一直发挥着指导学术方向或理论基 础的作用,从而多年来一直为人所熟知时,这种持续性 引证便可能会出现并保持几年。Vlachy1983年在一篇讨 论物理学论文持续引证的论文中,首次运用这一概念。 曾追踪探索多年的引证文献,最终以图形显示文献得到 引文数量持续的增长的定量趋势。
引文分析
引文分析的特点和影响因素 1、引文的数量巨大 2、引文含有丰富的内容 3、计算机使得引文分析更为便利 例如,SCI、SSCI、CSSCI、CSBD等引文索引 数据库的出版,以及ENDNOTE、REFERENCE MANAGER等引文标注和统计的工具。(GO)
SCI有关统计数据逐年的变化(BACK) 有关统计数据逐年的变化( 有关统计数据逐年的变化 )
评价期刊的其他相关指标
回应因数(Echo factor) 一种期刊获得引证程度的测度(EF)。它与影响因素 (IF)相似但不同。 Zmaic和Maricic以及Simeon于1989年在一篇讨论 “SCI”与期刊明显性关系的文章中,首次提出这一测 度并定义如下式: Ne=(N ind,a) p/(Cp*Sa) 其中:Ne是期刊的回应因素;(Nind,a)p是p年引 证a年该期刊发表的独立论文数;Cp是p年内可能实施 引证的论文数;Sa是本期刊在a年刊载的论文数。例如, 某期刊在1995年刊载了50篇论文。1997年这50篇论文 中有22篇被15种期刊所引证。这15种期刊1997年总共 刊载了340篇论文。