科学计量学的几个定律
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
科学计量学的几个基本定律
1.描述文献增长定律——普赖斯指数
文献增长定律是描述文献数量随时间而有规律地增长。令F表示文献数量,t表示时间,则文献增长定律的数学表达形式为:
F=
f
)(t
式中)(t f的总趋势满足t增大时,F也应相应增大。描述文献增长规律的主要函数是:线性函数、指数函数、逻辑曲线函数等。其中以D.J.普赖斯(Price)建立的指数增长定律最为著名
bt
)(
F=
ae
t
式中,)(t
F为某年)(t的文献累积数量;t为时间(以年为单位);b为文献持续增长率,即每一年文献的增长率。
(半对数坐标,直线实际上指数曲线经对数转换后的结果)
图:《化学文摘》年度文献累积曲线
图:1600—1950年代科学发明的指数增长(据赵红洲)
指数增长规律只有在没有限制或干扰的情况下才会出现,如果受到智力的、物质的和经济的限制,普赖
斯指出文献增长更趋于逻辑曲线。苏联学者弗勒杜茨和B.纳利莫夫提出了著名的逻辑曲线方程式
bt ae K
F -+=1
式中,F(t)表示t 年的文献累积量,K 为F(t)增长的最大值,a 与b 为参数。
2.描述文献老化规律──半衰期,普赖斯老化指数
对于科技文献来说,除物理形态上的破损、载体的变质,随时间流逝,文献所载的科技信息逐渐过时,以致于文献本身不再被使用。老化的量度主要有:
(1)半衰期:所谓半衰期是一个时间概念,意指在该时间内发表了某一学科或领域正在被利用的全部文献一半,或者目前所利用的文献的一半是在该时间内发表的。
进行文献老化研究,可采用引用文献分析法,它是对收集文献后而所附参考文献进行研究。
例如,为了对我国化学期刊文献的老化规律进行研究,首先收集某一年,例如1988年出版的重要化学期刊40种,共得到了2000篇有关论文,然后再统计每篇论文后面所附的参考文献(或称引文),共得25000条参考文献。再按其出版年代进行统计,其结果可用图形表示。图中纵坐标代表引文量,可以采用绝对数量亦可采用相对数量来表示;横坐标为引文出版年龄,所谓出版年龄是指被引文献出版年代与其被引用年代之差。
图:引文量按时间分布曲线
若将上图中纵坐标换为引文累积量,则可得如下图形
图:引文累积量按时间分布图
(2)普赖斯指数:1971年提出。规定年限不超过5年的文献引文数量同引文总量之比作为指数。依据这一指数,可将所有被利用的文献分成两大类:档案性文献、现时应用的文献.年龄超过5年仍被引证的文献则属于现时应用的文献。
例:有A、B两个学科,研究其引用文献的情况。(假设研究时间为2004年底)A学科:假设全部引用文献共674篇,其中发表于近5年的文献为
409篇文献
B学科:假设全部引用文献共2419篇,其中发表于近5年的文献为
1796篇文献
则A学科的普赖斯老化指数为:409/674=60.68%
B学科的普赖斯老化指数为:1796/2419=74.25%
3.论文作者分布规律──洛特卡定律
关于科技文献作者分布规律的描述方式很多,它们的主要目的是考察科技人员的著述能力与文献量之间的关系。其中最著名的是洛特卡定律。
1926年末,美国一家人寿保险公司的统计员A .J .洛特卡(Lotka),以《化学文摘》和《物理学史一览表》为来源资料,考察了1907—19l6这10年间的累积索引。他得出撰写x 篇论文的作者相对频率y(x)的公式
n x C x y )(
格特卡指出“这两个例子表明的指数近似等于2.0。”于是,上式被C .K .齐普夫(zipf)称为“倒平方定律”。但是后人的继续研究表明,指数2仅是一个特例。1974年,J .维拉奇,对不同的学科而言,n 可以从1.2浮动到3.5以上。
根据所得到的结果,洛特卡是这样描述科学工作者人数与其所著论文之间关系的:“……写两篇论文作者数量约为写一篇论文作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;而写一篇论文作者的数量约为所有作者数量的60%。”科学工作者对科学贡献量的差异是非常大的。大约有60&的人,在其一生中仅发表过一篇论文,而发表论文数量在10篇以上者不足全部作者的1%。
此外,普赖斯的一项研究也支持了上述结果:
4.科技文献离散定律──布拉德福定律
科学论文在科技期刊中的分布是不均匀的,少数期刊中“拥挤”着大量的论文,大量的期刊中“稀释”着少量的论文。1934年英国文献学家S.C.布拉德福(Bradford)明确地指出这种倾向:“对某一主题而言,将科学期刊按刊登相关论文减少的顺序排列时,可以划分为对该主题最有贡献的核心区,以及含有与该区域论文数量相同的几个区域。每个区域里的期刊数量成2
:
n”。(布拉德福定律)(n 是经验数据,布拉德
:1n
福推算n=5)
根据多年的实际工作经验,他猜测,专业文献除密集地登裁于相应的专业期刊(约占1/3)外,还登载于大量的专业边缘(相关的)期刊(约占1/3)和更一般化的期刊(约占1/3)。
(图中:X:期刊累积量的对数;Y相应论文数量的累积量
α为第一区期刊数累积量β:为第一区和第二区期刊数累积量;
γ为一区二区三区期刊数累积量)
例:我们将某一年发表某学科(流媒体)的期刊论文全部收集齐全(只要有一篇就进行统计),然后按照各
期刊发文量的多少将期刊降序排列。假设全部论文数量为1504篇。
期刊1 期刊2 期刊3 期刊4 期刊5 期刊6 刊7…期刊8 期刊9 期刊10 ……期刊期刊期刊……期刊102篇 84篇 79篇 74篇 70篇 50篇 43篇…37篇 28篇 28篇…… 5篇 4篇 4篇…… 1篇(502篇,约占1/3)(499篇:约占1/3)(503篇,约占1/3)核心区相关区一般区
核心区:期刊数P1=7 (约占总期刊数的3.23%)
相关区:期刊数P2=35 (约占总期刊数的16.13%)一般区:期刊数P3=175 (约占总期刊数的80.65%)
(总期刊数为217种)