文献计量三定律
文献计量学

26 / 12
洛特卡定律的应用
1、在图书馆学情报学方面,一般是用它来预测 发表不同数目文章的著者数量和特定学科的文献数 量;
2、在预测科学方面,按照洛特卡定律,可以从 统计或计算科学著者数量来预测文献数量的增长速 度和文献流的动向,便于掌握文献的交流规律,同 时从文献计量学的角度出发,也可以预测科学家数 量的增长和科学发展的规模及趋势等;
25 / 12
洛特卡定律的局限性
LOTKA 定律是有局限性的,平方反比率是科学 生产率一般的理论估计,不是一个精确的统计分布, 它是对 CA 中收录的物理、化学两个领域十年间著 者(姓氏以A A 、B B 开头)抽样研究结果的推广。 后来的学者沿着这个思路进行的研究,有些数据符 合这个规律,有些则不符合。
核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
11 / 12
图像分析
此外,布拉德福还对收集的数据进行图像分析:取 上述等级排列的期刊数量的对数㏒为横坐标,以相 应的论文累计数R(n)为纵坐标进行图像描述,就得 到了布拉德福分散曲线。
20 / 12
基本内容
从洛特卡定律的产生过程可以看出,该定律的目的 和基本内容是:描述科学工作者人数与其所论著论 文之间的关系。 如果设f(x)为写了x篇论文的作者数占作者总数的 比例,则洛特卡定律可表示为:
C——某特定主题领域的特正常数。 洛特卡统计的指数a约:a=2,即“平方反比率”。
21 / 12
齐夫在做了大量艰苦的统计工作后,将单词以其出现 的频次的多寡进行了等级排队,经过计算,论证了描述词 的频率与等级序号之间关系的定量形式。
文献计量学

齐普夫定律
7 / 12
布拉德福定律
的含义:信息流的序性结构经验定律,
也叫文献分散定律。 布氏定律, 是英国文献学家布拉德福于1934 年在 《 Engineering 》 杂志上发表的《 Sources of information onspecific subjects 》 上提出的描述文分散规律的经验定律。 在其专著 《 文献工作 》 中,他又一次阐述了文献分散定律。 认为‚“在数量很大的文献体中,文献按某一规律的模型分散…… ”。 科学信息很大程度上是以科技期刊的形式出现的,借助期刊这 个载体得以交流传播,科技期刊对促进科学技术发展起着举足轻重 的作用。 布拉德福定律 (Bradford’ Law of Scattering)就是描述某一学 科论文在相关期刊中的分布规律。它定量的揭示了 ,今天仍然具有不可替代的理论价值和实 际意义。
10 / 12
区域分析
布拉德福定律的区域分析:如果将科学期刊按其登 载某个学科的论文数量的大小,以减序排序,那么 可以把期刊分为专门面向这个学科的核心区、相关 区、非相关区,3个区的论文数量相等,此时核心区、 相关区、非相关区期刊数量之比为:1∶a∶a² ,a 为 布拉德福常数。 核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
洛特卡定律的发展
一. 洛特卡定律的验证工作
1926年,洛特卡定律诞生; 1941年,Davis对洛特卡的结果进行验证; 1949年,Zipf在《人类行为和最小努力法则》中 肯定洛特卡定律的同时也指出它的不足之处在于只 是一种近似的计算方法,而不是一种严格意义上的 分布。 后来,众多的学者在不同的领域取得数据进行研 究,对洛特卡定律的验证、完善与发展起到一定的 作用。 (在洛特卡定律的基础上,普莱斯进一步研究了科学家人数
科技文献三大定律

科技文献三大定律
科技文献中存在一些著名的定律,其中三大定律是指摘录或总结了科技发展的一些规律。
这些定律描述了科技领域中的一些普遍趋势和规律。
以下是三大定律的简要介绍:
1.摩尔定律(Moore's Law):
•表述:由英特尔创始人戈登·摩尔(Gordon Moore)提出。
摩尔定律指出,集成电路上可容纳的晶体管数量每隔约
18至24个月翻一番,而成本则保持不变。
•含义:随着时间的推移,芯片上的晶体管数量呈指数增长,导致计算能力的迅速提升。
2.瓦茨定律(Wirth's Law):
•表述:由计算机科学家尼基劳斯·瓦茨(Niklaus Wirth)提出。
瓦茨定律宣称“软件在硬件的背后迅速变慢”。
•含义:瓦茨认为,尽管硬件性能不断提高,但由于软件的复杂性和功能需求的增加,软件系统的性能提升速度远
远跟不上硬件性能的提升。
3.基德尔定律(Gilder's Law):
•表述:由经济学家乔治·基德尔(George Gilder)提出。
基德尔定律指出:“网络的带宽每21个月翻一番,同时也
翻一番使用带宽的应用程序。
”
•含义:随着时间的推移,网络的带宽不断增加,这推动了新型应用程序和服务的出现,这些应用对网络的带宽要
求也在增加。
这三大定律都反映了科技领域中的一些长期趋势,对于理解科技发展的规律和走向具有一定的指导意义。
需要注意的是,这些定律虽然在一段时间内总结了一些规律,但并非普适于所有情况,科技发展仍然受到各种因素的影响。
郑州大学信息计量学期末考试整理答案

文献计量学:1、文献计量的三大规律的基本内容、发展状况、局限性和常见的应用1)、洛特卡经验规律:a、是揭示文献著者与数量关系的基本定律。
b、数字表达式为:f(x)=c/x的平方,x表示科学工作者发表的论文数量,f(x)表示发表x 篇论文的著者出现的频率。
上式也称倒数平方定律。
发表一篇论文的著者出现的频率为60%;发两篇论文的著者数量大约是发表一篇论文的著者数量的1/4;发表n篇论文的著者数量大约是发表一篇论文的著者数量的1/n的平方;C、在某一时间内,写了x篇论文的作者数占作者总数的百分比f(x)与其撰写的论文数x的平方成反比。
特点:1、科学论文在作者上集中与分散的分布现象2、采用频次排序的方法,即按某类作者出现的频次大小(实际发表论文数)的排位,而非按照作者所写的论文多少比较来对作者进行等级排序,因而等级上会有空位。
3、论文在作者上的集中与分散程度只限于平方反比关系,即只给出了这种集中与分散程度的单一描述。
4、目前对洛特卡定律的研究主要集中在两个方面:a、对洛特卡一般公式的推导,验证公式的应用范围和估计参数。
B、对洛特卡定理的机理及适用性的研究。
2)、洛特卡定律的局限性:局限性:洛特卡定律是对两组数据统计的推广,是对信息生产的一般理论估计,不是一个精确的统计分布统计,因而有其局限性。
有以下局限:A、统计数据不全,洛特卡定律是根据化学、物理学科得出的结论,其他学科应用是应作一定的修改。
B、对合作者的处理过于简单。
C、对高产作者的处理。
D、洛特卡的数学抽取方法欠科学,在数量大的情况下预测结果才比较客观。
3)、洛特卡定律的具体应用:a、在情报图书馆学方面,一般用它来发表不同数目文章的著者数量和特定学科的文献数量,从而便于掌握文献的增长趋势,进行文献情报的科学管理和情报学的理论研究。
b、在预测科学方面,从统计或估计的科学著者数量懒预测文献数目的增长速度很文献的流动方向,也可以预测科学家数量的增长和科学发展的规模及趋势。
洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典

洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典洛特卡定律(Lotka's Law)、齐夫定律(Zipf's Law)、布拉德福定律(Bradford's Law)和普赖斯定律(Price's Law)是文献计量学中的重要经典定律,它们用来描述和分析作者、文章、期刊等在学术领域的分布和产出规律。
洛特卡定律,由美国数学家洛特卡于1926年提出,也被称为洛特卡-派尔分布。
该定律以作者产出的分布规律为基础,认为作者的产出量和其对应的排名呈反比关系。
具体地说,洛特卡定律指出,一个领域的作者人数(n)和其产出量(N)之间满足一个幂次关系:N=k/n^a。
其中,k和a是常数,n是排名。
这意味着,排名为n的作者的产出量约为总产出量的1/n^a倍。
洛特卡定律揭示了科学创新中存在少数人多产和多数人少产的现象。
齐夫定律,由美国语言学家乔治.齐夫于1949年提出,主要用来描述自然语言词频的分布规律。
根据齐夫定律,一个给定的词在自然语言中的出现频率(f)与该词在词频排名中的位置(r)之间大致呈反比关系:f = C/r^b。
其中,C和b是常数。
换句话说,词频排名越靠前,该词的出现频率越低,而排名越靠后,该词的出现频率越高。
齐夫定律适用于许多自然语言现象,如词频、城市人口、个人财富等。
布拉德福定律,由美国图书馆学家萨美鲁.布拉德福于1934年提出,用来描述同一领域内期刊的核心文献与边缘文献的分布规律。
根据布拉德福定律,核心文献的产出量与总产出量之间呈幂次关系。
布拉德福定律指出,核心文献的产出量通常占总产出量的一小部分,而边缘文献的产出量则占总产出量的较大部分。
具体而言,布拉德福定律认为,如果n篇核心文献的总产出量为N,那么边缘文献的总产出量通常是核心文献总产出量的a * n倍。
其中,a是常数,n是核心文献的个数。
布拉德福定律可用于期刊评估、信息组织和知识管理等领域。
普赖斯定律,由经济学家德鲁.普赖斯于1976年提出,用来描述科学家在科学研究中的产出分布规律。
洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典

洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典洛特卡定律(Lotka's Law)洛特卡定律,也称为洛特卡分布或洛特卡-布伦茨定律,是文献计量学中一种描述科学家(或作者)发表的论文数量与发表论文数量排名之间关系的经验定律。
该定律由库尔特·洛特卡(Kurt Lotka)于1926年提出,被广泛应用于研究科学家的科研产出。
洛特卡定律的数学表达式为:N(n) = K/n^α其中,N(n)表示在科学家排名为n的科学家所发表的文章数量,K是一个与科学领域有关的常数,α是一个介于1和2之间的指数。
根据洛特卡定律,科学家排名越高,他们发表的文章数量越少。
洛特卡定律的应用有助于了解科学家之间的科研产量差异以及科学合作网络的形成与演化。
在研究领域的科学家群体中,往往只有少部分科学家占据主导地位,发表了大量的论文,而大部分科学家则发表较少的论文。
这种不平衡的分布特征在许多领域得到了验证。
齐夫定律(Zipf's Law)齐夫定律,又称作齐夫定律分布,是一种描述单词、城市、公司等各种现象频率与其排名之间关系的经验定律。
该定律最早由美国语言学家乔治·金斯里·齐夫(George Kingsley Zipf)于1949年提出。
齐夫定律的数学表达式为:f(n) = N/Rank^(s)其中,f(n)表示排名为n的现象的频率,N是总现象的数量,Rank表示排名,s是介于0和1之间的指数。
齐夫定律被广泛应用于语言学、经济学、计算机科学等领域的研究中。
例如,齐夫定律可以用来描述自然语言中单词的频率分布,即常用单词的出现频率远高于不常用单词。
在城市研究中,齐夫定律可以用来解释城市的人口分布与城市规模之间的关系。
布拉德福定律(Bradford's Law)布拉德福定律,也称为布拉德福定律分布,是一种描述文献集合的核心和边际部分之间关系的经验定律。
该定律由英国图书馆学家萨缪尔·C·布拉德福(Samuel C. Bradford)于1934年提出。
文献计量学六大规律

文献计量学:文献分布定律,布拉德福定律,词频分布定律,齐普夫定律,科学论文作者分布定律,洛特卡定律,文献增长,科学文献老化,引文分析,情报冗余等。
文献信息源的定量研究开始于20世纪初。
在20世纪70年代末,就形成了布拉德福定律、齐普夫定律、洛特卡定律、文献增长规律、文献老化规律、文献引用规律等六大规律,并在后来的研究中得到不断的完善与发展。
布拉德福定律:也称文献分散定律。
是由英国文献学家布拉德福(S.C.Bradford)1934 年首先提出。
它是定量描述科学论文在相关期刊中集中——分散状况的一个规律。
经过后来的许多研究者的修正和研究,发展成为著名的文献分布理论。
布氏定律的文字描述为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区中所含的期刊数成1:a:a 2 …… 的关系(a>1)。
”布氏定律主要反映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布规律。
布氏定律的应用研究也获得了许多切实有效的成果,应用于指导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和科学评价的科学性。
洛特卡定律:是由美国的统计学家、情报学家洛特卡(A.J.lotka)研究出来的描述科学论文作者动态的最早的量化规律。
在科研活动中,不同人的科研能力及其成果著述数量肯定是不同的。
那么,在同样的一段抽样时间内,不同的科技工作者的论著数量分布有没有什么规律呢?1926 年,洛特卡发表了论文“科学生产率的频率分布”。
他在文中统计分析了化学和物理学两大学科中一段时间内科学家们的著述情况,提出了定量描述科学生产率的平方反比分布规律,又被称为“倒平方定律”。
其经典公式为:f(x) =(C为常数)上式的意义为:设撰写X 篇论文的作者出现频率为f(X) ,则撰写X篇论文的作者数量与他们所写的论文数量呈平方反比关系。
科学计量学的几个定律

科学计量学的几个基本定律1.描述文献增长定律——普赖斯指数文献增长定律是描述文献数量随时间而有规律地增长。
令F表示文献数量,t表示时间,则文献增长定律的数学表达形式为:F=f)(t式中)(t f的总趋势满足t增大时,F也应相应增大。
描述文献增长规律的主要函数是:线性函数、指数函数、逻辑曲线函数等。
其中以D.J.普赖斯(Price)建立的指数增长定律最为著名bt)(F=aet式中,)(tF为某年)(t的文献累积数量;t为时间(以年为单位);b为文献持续增长率,即每一年文献的增长率。
(半对数坐标,直线实际上指数曲线经对数转换后的结果)图:《化学文摘》年度文献累积曲线图:1600—1950年代科学发明的指数增长(据赵红洲)指数增长规律只有在没有限制或干扰的情况下才会出现,如果受到智力的、物质的和经济的限制,普赖斯指出文献增长更趋于逻辑曲线。
苏联学者弗勒杜茨和B.纳利莫夫提出了著名的逻辑曲线方程式bt ae KF -+=1式中,F(t)表示t 年的文献累积量,K 为F(t)增长的最大值,a 与b 为参数。
2.描述文献老化规律──半衰期,普赖斯老化指数对于科技文献来说,除物理形态上的破损、载体的变质,随时间流逝,文献所载的科技信息逐渐过时,以致于文献本身不再被使用。
老化的量度主要有:(1)半衰期:所谓半衰期是一个时间概念,意指在该时间内发表了某一学科或领域正在被利用的全部文献一半,或者目前所利用的文献的一半是在该时间内发表的。
进行文献老化研究,可采用引用文献分析法,它是对收集文献后而所附参考文献进行研究。
例如,为了对我国化学期刊文献的老化规律进行研究,首先收集某一年,例如1988年出版的重要化学期刊40种,共得到了2000篇有关论文,然后再统计每篇论文后面所附的参考文献(或称引文),共得25000条参考文献。
再按其出版年代进行统计,其结果可用图形表示。
图中纵坐标代表引文量,可以采用绝对数量亦可采用相对数量来表示;横坐标为引文出版年龄,所谓出版年龄是指被引文献出版年代与其被引用年代之差。
洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典

洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典洛特卡定律是文献计量学中的重要定律之一,是一种描述科技文献数量分布的经验规律。
它指出,少数文章具有巨大的引文频次,而大部分文章则很少被引用。
具体来说,约20%的文章产生了80%的引文,而80%的文章仅产生了20%的引文。
这个规律适用于各类文献,可以用来评估文章、作者和期刊的影响力。
齐夫定律是文献计量学中的另一条重要定律,描述的是作者数量和其发表文章数量之间的关系。
齐夫定律认为,存在着一种稳定的比例关系,即20%的作者贡献了80%的文章。
这个定律同样可以用来评估作者对某个领域的贡献和影响力。
布拉德福定律是对科学期刊分区的一种经验规律。
它指出,所有与某一主题相关的文章所在的期刊,可以分为三个部分,第一部分包括核心期刊,约占总数的15%,主要涵盖该领域最重要的论文;第二部分包括次核心期刊,约占总数的35%,涵盖一部分重要文章;第三部分包括边缘期刊,约占总数的50%,涵盖余下的文章。
这个定律给出了一种优化期刊分区的思路,使最受关注的论文能够更快地传播和传承。
普赖斯定律是一种有关单个作者的发文数量和其引文频次之间关系的定律。
普赖斯定律认为,作者发表的文章数量和其被引用的次数呈正比关系。
具体来说,每个作者的第n篇文章的引用频次是其前n-1篇文章的引用频次的平均值。
这个定律可以用作评估作者质量的指标,在作者选择发文数量时提供一种思路。
以上四个定律都是文献计量学中的重要定律,它们提供了对科技文献、作者、期刊等方面的理解和评估方法。
研究者可以根据这些定律来指导自己的研究,提高自己的学术影响力和质量。
文献计量学

文献计量学(Bibliometrics)文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科[5-12]。
这一术语最早是1969年由英国人A.普里查德(Alan Britchard)提出的。
文献计量学中常用的定律有如下几种。
布拉德福定律:布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
文字表述为:如果将科技期刊按其刊载某专业论文的数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个区域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2……的关系。
洛特卡定律:洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写3篇论文的作者数量约为写1篇论文作者数量的1/9;写n篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
齐普夫定律:齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。
若用f 表示频次,r表示等级序号,则有fr=C(C为常数)。
人们称该式为齐普夫定律。
普赖斯指数:1971年美国科学学家D.普赖斯提出了一个衡量各个知识领域文献老化的数量指标,即后人所称的“普赖斯指数”。
就是在某一知识领域内,把对年限不超过五年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。
文献计量学三大定律

文献计量学三大定律文献计量学是一门研究文献数量和质量的学科,它包含了很多的经验法则和定律,其中三大定律是文献计量学中最重要的定律。
它们为我们研究文献的分布、发展和质量提供了基础,因此在学术界得到了广泛的应用。
本文将为您详细介绍这三大定律,希望能够对您的学术研究提供指导意义。
第一定律:布拉德福定律(Bradford's Law)布拉德福定律是文献计量学中最基本的规律之一,它告诉我们一种文献集合的核心文献数量与文献的总量呈指数关系。
也就是说,文献数量往往呈现出“少数精品、中等常规、大量琐碎”的分布模式。
布拉德福定律得名于英国图书馆学家萨缪尔·布拉德福德。
布拉德福德定律的应用十分广泛。
例如,我们可以通过找出一个领域内的核心期刊来节省研究时间和资源。
如果我们研究文献数量超过核心期刊集合的3倍,那么我们将会开始浪费时间和资源。
因此,布拉德福定律为我们提供了快速、高效的研究方法。
第二定律:洛蒂卡定律(Lotka's Law)洛蒂卡定律是文献计量学中的一个重要定律,它告诉我们作者数量与其发表文章数呈反比例关系。
也就是说,少数作者贡献了大部分的文章,而剩余大部分的作者则只贡献了少部分文章。
洛蒂卡定律得名于美国图书馆学家阿尔弗雷德·洛蒂卡。
洛蒂卡定律的应用十分广泛。
我们可以通过找到一个领域内的核心作者来节省研究时间和资源。
如果我们研究文献数量超过核心作者的3倍,那么我们就会开始浪费时间和资源。
因此,洛蒂卡定律为我们提供了快速、高效的研究方法。
第三定律:普里斯定律(Price's Law)普里斯定律是文献计量学中的一个重要定律,它告诉我们一个机构、部门或团队所产生的工作贡献前n个人的贡献总和等于该机构、部门或团队总贡献的1/2,或n的平方根,具体取决于个别贡献的大小和分布,因此普里斯定律也被称为方根定律。
普里斯定律得名于英国图书馆学家德雷弗斯·普里斯,它是文献计量学中应用广泛的一个定律。
文献计量学综述

文献计量学综述一、起源及发展早在20世纪初,人们已经开始对文献进行定量化研究,但是当时文献计量学并没有作为一门独立的学科而存在。
直到1969年,英国着名情报学家阿伦.普理查德首次提出术语“Bibliometrics”,这一术语的出现标志着文献计量学的正式诞生。
三阶段:萌芽、发展和分化萌芽(1917-1933)这一时期文献研究人员首创文献统计方法,并在一些学科领域解剖学和化学专业进行了文献计量分析的大胆尝试,取得了一定的成果。
这些研究都为文献计量学的诞生与后期的发展奠定了基础发展(1934- 1960)年注重理论研究与规律发现,着名的文献计量学的三大基本定律中的布拉德福定律以及齐普夫定律就是在这一时期发现的到成熟与分化阶段全面发展与分化时期(1960年至今) 这一时期文献计量学已由狭隘的理论研究发展到了广阔的应用研究和指标的研究,同时涉及的领域和主题也越来越多。
迁移衍生:专利计量学文献计量学网络计量学政策计量学二、概念界定文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,研究文献信息的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。
可以定量地揭示某一学术领域的发展历程、研究重点以及未来的研究方向。
目前,文献计量分析已被看作总结历史研究成果、揭示未来研究趋势的一种重要工具。
学科交叉使得文献计量研究内容体系日益丰富。
数学中的图论、社会学中的社会网络分析、物理学中的复杂网络等理论与方法均被移植到文献计量学的研究体系中。
三、三大定律布拉德福定律该定律描述文献分布规律,利用刊载某专业论文的数量来确定该专业的核心期刊,应用于指导文献情报工作和科学评价。
齐普夫定律该定律用以统计文献中的词频,通过文献的词频分析可确定学科或行业的研究热点和研究趋势。
洛特卡定律该定律描述着者人数与所着论文之间的关系。
探讨了科学论文着者分布平衡的规律,在宏观的科学着作活动中,少数作者写出了大量文章,大多数人的着作还是很少的。
文献计量特征及变量问题研究

文献档案图书情报\2019年第7期 113文献计量特征及变量问题研究李 路中国农业科学院农业信息研究所,北京 100081摘要:文献计量是文献变量变化的结果,影响因子是文献变量变化的特征解,相当于文献变量的权重。
文献计量一定包括可能性,包括计量的变化,因此它的影响因子应该是一个常数和文献变量变化的可能性的乘积。
我们把影响因子写成:A(x)exp(bx+c),文献变量的变化,它形成的影响因子也不一样。
文献计量的几个特征,影响因子,文献创新点,布拉德福区域计量法,离散率统计法,文献的选择性,核心期刊,文献下载量,文献引用量,文献创新点,文献雷同性,文献的唯一性等。
由未知数和可能性组成计算机数据库软件中间件Sybase 。
由未知数和可能性构成了量子力学中的波函数。
关键词:文献计量;文献变量;变化学 中图分类号:G8文献标识码:A文献计量学有三大定律:表征出科技文献作者分布的洛特卡定律(1926);表征文献中词频分布的齐普夫定律(1948);确定某一学科论文在期刊中分布的布拉德福定律(1934)等。
这三个定律是经验定律,是根据洛特卡、齐普夫和布拉德福的研究文献变量经验得出的。
它们都可以由作者分布,文献中的词频分布和期刊中的论文分布得出,都可以由文献变量的变化得出。
影响因子是文献变量变化的特征解,相当于文献变量的权重。
期刊的影响因子=期刊文献被引用次数/期刊可引用文献总量。
文献变量的变化,它形成的影响因子也不一样。
有好的稿源对期刊评为核心期刊有很大的影响。
文献变量的影响因子是期刊评比核心期刊的很重要的因素。
文献计量是文献变量变化的结果,文献变量每年都要变化。
每年文献计量都要统计文献计量学的文献变量变化的结果。
中国图书资料法是文献计量很好的分类方法,每年文献计量的变量变化的结果可以按照中国图书资料分类法来分类。
文献变量是依靠作者的稿源来变化的,文献变量的变化是作者稿源质量的变化。
文献计量的几个特征,影响因子,文献创新点,布拉德福区域计量法,离散率统计法,文献的选择性,核心期刊,文献下载量,文献引用量,文献创新点,文献雷同性,文献的唯一性等。
传统文献计量学三点假设

传统文献计量学三点假设传统文献计量学评价方法是依托各类文献数据库而开展的学术影响力的评价,主要指标包括论文总数、总被引频次、篇均被引频次、高被引论文数、期刊影响因子等。
这些指标在一定程度上反映了科研人员在学术界的影响力,但各自存在一定局限性,例如论文总数代表一位科研人员的科研生产力,但是不能反应成果的质量,引文总数、篇均引文数考虑了论文的质量,但是评价受科研人员的学术时间的影响,重要论文数和引文数虽然避免了“灌水”论文的评价偏误,但对于重要论文的衡量标准存在较大的主观性,并且单一指标的使用很难同时兼顾数量和质量问题,因此,VanLeeuween 早在2003年就强烈建议将不同指标进行联合使用[5]。
因此,部分科研人员采用一些计算模型将反应学术数量和质量的指标进行综合考虑,例如叶鹰(2014)[6]提出了一种将所有发文和所有引文进行整体综合考虑的学术评价指标的新的设计思想,称其为“学术矩阵方法”,矩阵中的数值综合考虑发文和引文的所有分布,将高影响和无影响的产出纳入统一测度,其缺点是计算复杂度高。
文献计量的指数方法是指利用文献的基本数据构建不同的指标,比较常见的有h指数、g指数等。
h指数及其衍生指数的提出兼顾了论文的数量和质量,并且计算简单,能大规模地在数据库中使用,成为科研人员学术影响力评价的广泛使用的方法[7]。
但h指数也存在一些缺点,例如只能增加,不能减少,无法表征科研人员影响力变小的情况,也不利于论文数量少但被引频次高的科研人员,没有考虑科研人员在论文中的贡献,缺乏灵活性等。
因此,h指数的变体或其他指数被开发出来用以测度科研人员的学术影响力,例如提出了按照被引次数降序排序计算的g指数[8]。
一些科研人员比较了g指数与h指数,认为g指数比h指数灵敏性更高,但并不能替代h指数,而将g指数和h指数结合使用,对于评价结果更为稳定[9]。
此外,还有评价不同学科领域科研人员学术影响力的n指数、Normalizedh指数、hf指数、x指数,以及考虑合作者的替代h 指数、Hp指数、Hm指数、hap指数等[4]。
文献计量与引文分析

•
齐普夫定律
齐普夫定律的基本内容
•
洛特卡定律
•
洛特卡定律基本内容
从洛特卡定律的产生过程可以看出,该定律的目的和基本内容是:描述科学 工作者人数与其所著论文之间的关系。
如果设f(x)为写了x篇论文的作者数占作者总数的比例,则洛特卡定律可表 示为:
•
C f ( x) a x
• •
其中,C和a是某特定主题领域的特征常数。 洛特卡统计的数据约:a=2,即“平方反比率”。
n N ln s n s( N ) f f N s N ln s
如果等级排列分布中的N,s已知,对于确定的f, 可以由左式检验检索工具的完整性。
齐普夫定律
•
齐普夫定律的产生
1949 年,美国语言学家齐普夫发表了专著《人类行为与最省力法 则》,提出了最省力法则这个概念。齐普夫通过研究大量的统计资 料,试图证明自然语言词汇在文献中的分布服从一个简单的定律, 他称这一定律为“最省力法则”。齐普夫认为:人们在解决任何一 个问题时,总是力图把所能付出的平均工作消耗最小化,达到最省 力的地步。
R(n) n , (1 n C ) R(n) k log(n s), (C n N )
R(n)是相关论文累积数;n是杂志等级排列的序号 (级);a是第一级杂志中的相关文章数R(1),也就是 载文章最高的杂志中的相关文章数;C是"核心区" 中的杂志数量;N是等级排列的杂志总数;k,s是待
文献计量学方法

三、文献信息的指数增长规律
信息量度指标和方法 1 绝对值指标:数量/累积数量(增长规律研究) 2 相对值指标:比例/累积比例 普赖斯,1949,哲学汇刊,
F(t)
科学文献的指数增长曲线
网络信息计量学研究
第一部分 文献计量学基本规律
第一节
文献信息增长规律
一.文献增长的基本估计 增长年率 6%~8% CA 发表100万篇文摘所用年数 1. 32年(1907~1938) 2. 18年 3. 8年 4. 4.75年 5. 3.3年 6. 2年
二、文献激增带来的影响
图书馆:经费紧张、人力缺少、馆藏空间
1. 确定核心期刊 2. 制定文献采购策略 3. 评价检索工作 4. 根据流通数据确定采藏策略
第四节
齐普夫词频—等级分布定律
一.齐普夫与词频分布研究
齐普夫的研究工作 美国哈佛大学教授,语言学家 词频分布的概念 不同词汇的出现频次具有一定的统计规律 性 词频分布的早期研究 编辑频率词典,频率与等级序号之间反比 关系 法国艾斯杜和美国康登的工作
bt -bt
= K e-
观察SCI的引用数据表
概率密度函数
f ( x) = be -bx
-bt
2)伯顿-开普勒公式 y = 1-- ( a/e x + b/ e 2x ) (a+b=1) 3)莫德列夫修正式 y = 1-- (a / e x-0.1 + b / e 2x-0.2 ) (a + b = 1)
蒙代尔布罗从信息理论出发,建立 广义齐普夫定律。
4. 齐普夫定律基本原理 定律的文字与图象描述 文字描述:f r r = C 图象描述:直角坐标系下为双曲线 双对数坐标系下为直线 5. 齐普夫定律的局限性 对高频词和低频词的解释存在不足
文献计量学三大定律

文献计量学三大定律
布拉德福定律:如果将科技期刊按其刊载某学科专业论文的数量多少,以递减顺序排列,那么可以把期刊分为专门面对这个学科的核心区、相关区和非相关区。
各个区的文章数量相等,此时核心区、相关区,非相关区期刊数量成的关系。
洛特卡定律:它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;写N篇论文的作者数量约为写一篇论文作者数量的1n2,……,而写一篇论文作者的数量约占所有作者数量的60%。
齐夫定律(二八原则):如果把单词出现的频率按由大到小的顺序排列,则每个单词出现的频率与它的名次的常数次幂存在简单的反比关系,这种分布就称为Zipf定律。
它表明在英语单词中,只有极少数的词被经常使用,而绝大多数词很少被使用。
实际上,包括汉语在内的许多国家的语言都有这种特点。
这个定律后来在很多领域得到了同样的验证,包括网站的访问者数量、城镇的大小和每个国家公司的数量。
所以以其名字命名的定律却早已走出语言学,进入了信息学、计算机科学、经济学、社会学、生物学、地理学、物理学等众多研究领域。
例如:80%的财富集中在20%的人手中;80%的用户只使用20%的功能;20%的用户贡献了80%的访问量。
科学计量学的几个定律

科学计量学的几个基本定律1.描述文献增长定律——普赖斯指数文献增长定律是描述文献数量随时间而有规律地增长。
令F表示文献数量,t表示时间,则文献增长定律的数学表达形式为:F=f)(t式中)(t f的总趋势满足t增大时,F也应相应增大。
描述文献增长规律的主要函数是:线性函数、指数函数、逻辑曲线函数等。
其中以D.J.普赖斯(Price)建立的指数增长定律最为著名bt)(F=aet式中,)(tF为某年)(t的文献累积数量;t为时间(以年为单位);b为文献持续增长率,即每一年文献的增长率。
(半对数坐标,直线实际上指数曲线经对数转换后的结果)图:《化学文摘》年度文献累积曲线图:1600—1950年代科学发明的指数增长(据赵红洲)指数增长规律只有在没有限制或干扰的情况下才会出现,如果受到智力的、物质的和经济的限制,普赖斯指出文献增长更趋于逻辑曲线。
苏联学者弗勒杜茨和B.纳利莫夫提出了著名的逻辑曲线方程式bt ae KF -+=1式中,F(t)表示t 年的文献累积量,K 为F(t)增长的最大值,a 与b 为参数。
2.描述文献老化规律──半衰期,普赖斯老化指数对于科技文献来说,除物理形态上的破损、载体的变质,随时间流逝,文献所载的科技信息逐渐过时,以致于文献本身不再被使用。
老化的量度主要有:(1)半衰期:所谓半衰期是一个时间概念,意指在该时间内发表了某一学科或领域正在被利用的全部文献一半,或者目前所利用的文献的一半是在该时间内发表的。
进行文献老化研究,可采用引用文献分析法,它是对收集文献后而所附参考文献进行研究。
例如,为了对我国化学期刊文献的老化规律进行研究,首先收集某一年,例如1988年出版的重要化学期刊40种,共得到了2000篇有关论文,然后再统计每篇论文后面所附的参考文献(或称引文),共得25000条参考文献。
再按其出版年代进行统计,其结果可用图形表示。
图中纵坐标代表引文量,可以采用绝对数量亦可采用相对数量来表示;横坐标为引文出版年龄,所谓出版年龄是指被引文献出版年代与其被引用年代之差。
文献计量学综述

文献计量学综述一、起源及发展早在20世纪初,人们已经开始对文献进行定量化研究,但是当时文献计量学并没有作为一门独立的学科而存在。
直到1969年,英国着名情报学家阿伦.普理查德首次提出术语“Bibliometrics”,这一术语的出现标志着文献计量学的正式诞生。
三阶段:萌芽、发展和分化萌芽(1917-1933)这一时期文献研究人员首创文献统计方法,并在一些学科领域解剖学和化学专业进行了文献计量分析的大胆尝试,取得了一定的成果。
这些研究都为文献计量学的诞生与后期的发展奠定了基础发展(1934- 1960)年注重理论研究与规律发现,着名的文献计量学的三大基本定律中的布拉德福定律以及齐普夫定律就是在这一时期发现的到成熟与分化阶段全面发展与分化时期(1960年至今) 这一时期文献计量学已由狭隘的理论研究发展到了广阔的应用研究和指标的研究,同时涉及的领域和主题也越来越多。
迁移衍生:专利计量学文献计量学网络计量学政策计量学二、概念界定文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,研究文献信息的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。
可以定量地揭示某一学术领域的发展历程、研究重点以及未来的研究方向。
目前,文献计量分析已被看作总结历史研究成果、揭示未来研究趋势的一种重要工具。
学科交叉使得文献计量研究内容体系日益丰富。
数学中的图论、社会学中的社会网络分析、物理学中的复杂网络等理论与方法均被移植到文献计量学的研究体系中。
三、三大定律布拉德福定律该定律描述文献分布规律,利用刊载某专业论文的数量来确定该专业的核心期刊,应用于指导文献情报工作和科学评价。
齐普夫定律该定律用以统计文献中的词频,通过文献的词频分析可确定学科或行业的研究热点和研究趋势。
洛特卡定律该定律描述着者人数与所着论文之间的关系。
探讨了科学论文着者分布平衡的规律,在宏观的科学着作活动中,少数作者写出了大量文章,大多数人的着作还是很少的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文献计量学三定律
一、布拉德福定律
布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
其文字表述为:如果将科技期刊按其刊载某学科专业论文的数量多少,以递减顺序排列,那么可以把期刊分为专门面对这个学科的核心区、相关区和非相关区。
各个区的文章数量相等,此时核心区、相关区,非相关区期刊数量成1:n:n2(n的平方)的关系。
布拉德福定律的应用:为文献情报部门使用有限的资金、获取情报密度最高的情报源提供定量依据。
它的作用在帮助确定核心期刊、文献检索、考察专著的分布、动态馆藏的维护、检索工具完整性的测定、学科幅度的比较、指导读者利用期刊、指导期刊订购工作等方面。
二、洛特卡定律
洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;写N篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
洛特卡定律的应用:(1)在情报学图书馆学方面,一般是用它来预测发表不同数目文章的著者数量和特定学科的文献数量。
(2)在预测科学方面,从社会科学著者数量来预测文献数量的增长速度和文献流的动向;预测学者数量的增长和科学发展的规模及趋势。
(3)在科学学和人才学方面,研究科学家的活动规律,研究人才的著述特征。
三、齐夫定律
美国哈佛大学教授G.K.齐夫(G.K.Zipf)1935年通过对文献词频规律的研究,认为:若把一篇较长的文章中每个词出现的频次从高到低进行递减排列,其数量关系特征呈双曲线分布。
该定律应用于情报检索用的词表的编制和情报检索系统中文档结构的设计。
齐夫定律的应用:(1)文献标引和词表编制。
(2)情报检索,通过齐夫定律求出数据库所需的存储量。
(3)图书情报管理,帮助合理选择图书馆或情报中心的最佳地理位置,以及设计图书馆的排架,以使得在存取文献时所走的路程最短。