文献计量学六大规律
文献计量三定律
文献计量学三定律一、布拉德福定律布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
其文字表述为:如果将科技期刊按其刊载某学科专业论文的数量多少,以递减顺序排列,那么可以把期刊分为专门面对这个学科的核心区、相关区和非相关区。
各个区的文章数量相等,此时核心区、相关区,非相关区期刊数量成1:n:n2(n的平方)的关系。
布拉德福定律的应用:为文献情报部门使用有限的资金、获取情报密度最高的情报源提供定量依据。
它的作用在帮助确定核心期刊、文献检索、考察专著的分布、动态馆藏的维护、检索工具完整性的测定、学科幅度的比较、指导读者利用期刊、指导期刊订购工作等方面。
二、洛特卡定律洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;写N篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
洛特卡定律的应用:(1)在情报学图书馆学方面,一般是用它来预测发表不同数目文章的著者数量和特定学科的文献数量。
(2)在预测科学方面,从社会科学著者数量来预测文献数量的增长速度和文献流的动向;预测学者数量的增长和科学发展的规模及趋势。
(3)在科学学和人才学方面,研究科学家的活动规律,研究人才的著述特征。
三、齐夫定律美国哈佛大学教授G.K.齐夫(G.K.Zipf)1935年通过对文献词频规律的研究,认为:若把一篇较长的文章中每个词出现的频次从高到低进行递减排列,其数量关系特征呈双曲线分布。
该定律应用于情报检索用的词表的编制和情报检索系统中文档结构的设计。
齐夫定律的应用:(1)文献标引和词表编制。
文献计量学
齐普夫定律
7 / 12
布拉德福定律
的含义:信息流的序性结构经验定律,
也叫文献分散定律。 布氏定律, 是英国文献学家布拉德福于1934 年在 《 Engineering 》 杂志上发表的《 Sources of information onspecific subjects 》 上提出的描述文分散规律的经验定律。 在其专著 《 文献工作 》 中,他又一次阐述了文献分散定律。 认为‚“在数量很大的文献体中,文献按某一规律的模型分散…… ”。 科学信息很大程度上是以科技期刊的形式出现的,借助期刊这 个载体得以交流传播,科技期刊对促进科学技术发展起着举足轻重 的作用。 布拉德福定律 (Bradford’ Law of Scattering)就是描述某一学 科论文在相关期刊中的分布规律。它定量的揭示了 ,今天仍然具有不可替代的理论价值和实 际意义。
10 / 12
区域分析
布拉德福定律的区域分析:如果将科学期刊按其登 载某个学科的论文数量的大小,以减序排序,那么 可以把期刊分为专门面向这个学科的核心区、相关 区、非相关区,3个区的论文数量相等,此时核心区、 相关区、非相关区期刊数量之比为:1∶a∶a² ,a 为 布拉德福常数。 核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
洛特卡定律的发展
一. 洛特卡定律的验证工作
1926年,洛特卡定律诞生; 1941年,Davis对洛特卡的结果进行验证; 1949年,Zipf在《人类行为和最小努力法则》中 肯定洛特卡定律的同时也指出它的不足之处在于只 是一种近似的计算方法,而不是一种严格意义上的 分布。 后来,众多的学者在不同的领域取得数据进行研 究,对洛特卡定律的验证、完善与发展起到一定的 作用。 (在洛特卡定律的基础上,普莱斯进一步研究了科学家人数
信息计量学
1. 文献计量学:是采用数学统计方法,对各类文献的诸计量特征进行统计分析,进而揭示、研究文献情报规律,文献情报科学管理以及科学发展趋势的一门学科。
2. 质量牵制原则:出版物的增长数量与其质量有关,不同质量的出版物有不同的出版速度;质量高的文献增长速度慢。
3. 文献老化:科学文献随着其年龄的增长,逐渐失去了作为科学情报源的价值,越来越少的被用户利用的过程。
4. 半衰期:某学科现在尚在被使用的全部文献中,较新的一半是在多长时间内发表的。
5. 普赖斯指数:指在某一领域内,出版年龄不超过5 年的被引证文献与被引证文献总数之比。
6. 文献耦合:是指引用文献通过参考文献建立起来的耦合,如果 A 、B 两篇文献共同引用了一篇或多篇相同的论文,则 A 、B 两篇论文的关系即为耦合关系,也叫文献合配。
7 文献信息流:文献所含情报的汇流称文献信息流。
8 文献老化:科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。
9 科学生产率:个体科研人员在一定时期内所撰写的论文数量。
10 引文分析:利用各种方法对科学期刊、论文、著者等分析对象的引证和被引证现象进行分析,以揭示其特征和内在规律。
11 影响因子:即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
12 信息计量学:是以信息作为对象进行计量研究的学问,采用数学、统计学等定量方法,对信息基本循环图式所描述的社会化的信息交流过程中的信息组织,存储,分布,传递,相互引用和开发利用等进行定量描述和统计分析,以便揭示社会信息交流过程的数量特征和内在规律。
13 网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示七数量特征和内资规律的一门新兴学科。
文献信息老化的主要度量指标有哪两个?两者有何异同?文献信息老化的主要度量指标是半衰期和普赖斯指数。
情报学 六大定律
1、布拉德福定律
布拉德福定律是描述专业论文在期刊中分 布情况的经验规律,由英国著名文献学家 布拉德福(S.C。Bradford,1878-1948) 于1934年提出。
布拉德福定律的文字表述
如果将期刊按其刊载专业论文数量的多寡 以递减顺序排列,则可分出一个核心区和 相继的几个领域,当每区刊载的论文量相 等时,核心期刊数Nc和外围一区期刊数N1、 外围二区期刊数N2成 Nc:N1:N2=1:a:a2 其中a为布拉德福常数
最小努力原则
齐普夫(C.K.Zlpf)博士在他的专著 《人类行为和最小努力原则》中,首先阐 明了“最小努力原则” 齐普夫认为:每一个人在日常生活中都必 定要在他所处的环境里进行一定程度的运 动,这可视为走某种道路。无论哪一种运 动、哪一种道路,人们在这个过程中都有 意无意地按照某一个原则来进行,这个原 则就是“最小努力原则”。
洛特卡定律的应用
洛特卡定律描述了作者人数与其发表论文数 量之间的关系,首次揭示了两者之间存在 的规律。 主要用于研究“科学生产率” 可用于预测发表不同篇数论文的作者数量 和特定学科的论文总量 根据作者数量估计科学论文数量
3、齐夫定律
描述文献中的词与其出现频次之间关系的 经验规律 是一条与语言学密切相关的文献学规律。 由哈佛大学语言学教授齐夫(G.K.Zipf)于 1935年提出
其中,f(x)是发表x篇论文的作者占作者总数 的百分比(作者频率),常数a>1,c是常数。
a值的研究
后经研究,发现物理学等学科领域的作者 与论文之间的关系基本符合平方反比率, 即a=2; 生物、工程、计算机等领域则不符合平方 反比关系 人文科学、社会科学中,a值将变大 规模较大、科研合作程度较高的学科中,a 值会变小。
洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典
洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典洛特卡定律(Lotka's Law)、齐夫定律(Zipf's Law)、布拉德福定律(Bradford's Law)和普赖斯定律(Price's Law)是文献计量学中的重要经典定律,它们用来描述和分析作者、文章、期刊等在学术领域的分布和产出规律。
洛特卡定律,由美国数学家洛特卡于1926年提出,也被称为洛特卡-派尔分布。
该定律以作者产出的分布规律为基础,认为作者的产出量和其对应的排名呈反比关系。
具体地说,洛特卡定律指出,一个领域的作者人数(n)和其产出量(N)之间满足一个幂次关系:N=k/n^a。
其中,k和a是常数,n是排名。
这意味着,排名为n的作者的产出量约为总产出量的1/n^a倍。
洛特卡定律揭示了科学创新中存在少数人多产和多数人少产的现象。
齐夫定律,由美国语言学家乔治.齐夫于1949年提出,主要用来描述自然语言词频的分布规律。
根据齐夫定律,一个给定的词在自然语言中的出现频率(f)与该词在词频排名中的位置(r)之间大致呈反比关系:f = C/r^b。
其中,C和b是常数。
换句话说,词频排名越靠前,该词的出现频率越低,而排名越靠后,该词的出现频率越高。
齐夫定律适用于许多自然语言现象,如词频、城市人口、个人财富等。
布拉德福定律,由美国图书馆学家萨美鲁.布拉德福于1934年提出,用来描述同一领域内期刊的核心文献与边缘文献的分布规律。
根据布拉德福定律,核心文献的产出量与总产出量之间呈幂次关系。
布拉德福定律指出,核心文献的产出量通常占总产出量的一小部分,而边缘文献的产出量则占总产出量的较大部分。
具体而言,布拉德福定律认为,如果n篇核心文献的总产出量为N,那么边缘文献的总产出量通常是核心文献总产出量的a * n倍。
其中,a是常数,n是核心文献的个数。
布拉德福定律可用于期刊评估、信息组织和知识管理等领域。
普赖斯定律,由经济学家德鲁.普赖斯于1976年提出,用来描述科学家在科学研究中的产出分布规律。
科学计量学的几个定律
科学计量学的几个定律1.描述文献增长定律——普赖斯指数文献增长定律是描述文献数量随时间而有规律地增长。
令F表示文献数量,t表示时间,则文献增长定律的数学表达形式为:Ff(t)式中f(t)的总趋势满足t增大时,F也应相应增大。
描述文献增长规律的主要函数是:线性函数、指数函数、逻辑曲线函数等。
其中以D.J.普赖斯(Price)建立的指数增长定律最为著名F(t)aebt式中,F(t)为某年(t)的文献累积数量;t为时间(以年为单位);b为文献持续增长率,即每一年文献的增长率。
图:科学期刊与文摘期刊按指数增长示意图(据普赖斯)(半对数坐标,直线实际上指数曲线经对数转换后的结果)《化学文摘》年度文献累积曲线图:图:1600—1950年代科学发明的指数增长(据赵红洲)指数增长规律只有在没有限制或干扰的情况下才会出现,如果受到智力的、物质的和经济的限制,普赖斯指出文献增长更趋于逻辑曲线。
苏联学者弗勒杜茨和B.纳利莫夫提出了著名的逻辑曲线方程式FK1aebt式中,F(t)表示t年的文献累积量,K为F(t)增长的最大值,a与b为参数。
例:有A、B两个学科,研究其引用文献的情况。
(假设研究时间为2004年底)A学科:假设全部引用文献共674篇,其中发表于近5年的文献为409篇文献B学科:假设全部引用文献共2419篇,其中发表于近5年的文献为1796篇文献则A学科的普赖斯老化指数为:409/674=60.68%B学科的普赖斯老化指数为:1796/2419=74.25%Cy(某)n某格特卡指出“这两个例子表明的指数近似等于2.0。
”于是,上式被C.K.齐普夫(zipf)称为“倒平方定律”。
但是后人的继续研究表明,指数2仅是一个特例。
1974年,J.维拉奇,对不同的学科而言,n可以从1.2浮动到3.5以上。
此外,普赖斯的一项研究也支持了上述结果:60&的人,4.科技文献离散定律──布拉德福定律科学论文在科技期刊中的分布是不均匀的,少数期刊中“拥挤”着大量的论文,大量的期刊中“稀释”着少量的论文。
文献计量学方法图文
文献计量学在科学评价中的应用方式
文献计量指标
通过文献的被引频次、下载量、影响因子等 指标来衡量其学术价值。
学术期刊评价
利用文献计量学方法评估学术期刊的学术水 平和质量。
学科领域发展态势分析
通过文献计量学方法分析学科领域的研究热 点和发展趋势。
科研机构和学者评价
通过文献计量学方法对科研机构和学者的研 究成果进行评价。
文献计量学在科学评价中的作用
科学评价的基本原则
01
客观性原则
科学评价应以客观事实为基础,避 免主观臆断和偏见。
准确性原则
科学评价应准确反映研究对象的实 际情况,避免误导和错误。
03
02
全面性原则
科学评价应全面考虑研究对象的各 个方面,避免片面和偏颇。
可重复性原则
科学评价应具备可重复性,以便他 人验证和进一步研究。
跨文化比较研究
随着全球化的加速,跨文化比较研究成为文献计 量学的重要发展方向,有助于深入了解不同文化 背景下的学术发展状况和趋势。
文献计量学的未来展望
深化理论体系
未来文献计量学需要进一步深化和完善自身的理论体系, 明确核心概念、原理和方法,提高学科的严谨性和科学性 。
强化方法创新
随着研究问题的复杂化,文献计量学需要不断强化方法创 新,吸收借鉴其他学科的方法和技术,提高分析的准确性 和可靠性。
。
词频分析法
总结词
通过分析文献中词汇的现频率,揭示 学科领域的研究重点和发展趋势。
VS
详细描述
词频分析法是一种通过统计文献中词汇的 出现频率,来揭示学科领域的研究重点和 发展趋势的方法。这种方法可以帮助研究 者快速了解某一学科领域的热点话题和变 化趋势。
文献计量学
文献计量学一.科技文献的增长规律什么是科学指标科学指标(Scientific indicators)是指人类科研活动的数量研究首先应确定的定量对象。
科学指标的类型- 人员与机构的数量。
其中人员数量包括科学工作者、工程师、教师和学生的数量等。
机构数量是指各类科研院所、学会及高等学校的数量。
- 科研成果的数量。
其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。
- 科研过程及成果记录载体的数量。
其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。
- 科研资金投入的数量。
主要指直接投入于理论与应用研究的资金数量。
文献指标使用最为频繁,主要原因:- 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。
其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。
- 与其他指标相比,科技文献数量巨大、易于收集。
这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。
- 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。
文献量度指标1)绝对值指标,是表示文献数量多少的指标。
2)相对值指标,是表示不同部分文献的数量比例的。
3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研究。
4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非规则曲线,难以用某种函数来描述。
文献指数增长模型文献指数增长规律文献指数增长规律的局限性(1)科学文献并不总是按指数函数关系增长。
普赖斯指数增长模型与所研究的文献的学科和时间有关。
文献计量学第五章
5齐普夫定律的应用
5.1 在文献标引和词表编制中的应用 5.2 在情报检索中的应用 5.3 在科学评价中的应用
29
5齐普夫定律的应用
齐普夫定律有着普遍的意义和广泛的应用: 齐普夫定律有着普遍的意义和广泛的应用:
在广阔的社会领域,如科学文献出版量分布、城市人口分布、 地理特征分布、生物种属分布等,都普遍呈现出齐普夫分布 形式或特征; 齐普夫定律是解决社会科学分布现象的最好定律; 在图书馆学、情报学、信息管理和科技管理领域
30
5.1在文献标引和词表编制中的应用
5.1.1词表编制 词表编制 5.1.2自动标引 自动标引
31
5.2在情报检索中的应用
一个文献集的词表通常服从齐普夫分布; 一个文献集的词表通常服从齐普夫分布; 如果有N篇文献,某一个检索词涉及其中的 篇文献, n篇,那么给这个词以log(N/n)+1的权 ( ) 将取得较好的检索效果。 值,将取得较好的检索效果。
12
设有一包含N个词的文献 设有一包含 个词的文献(N>5000),统计 个词的文献 统计 其中每个词的出现频次( ), ),按频次递减 其中每个词的出现频次(F),按频次递减 顺序将它们排列起来, 顺序将它们排列起来,并用自然数给这些 词编上等级序号( ),那么每个词的等级r ),那么每个词的等级 词编上等级序号(r),那么每个词的等级 与相应的频次F 之积为: 与相应的频次 r之积为:Fr r=C = C为常数,但不是绝对不变的恒量。 为常数, 为常数 但不是绝对不变的恒量。
16
2.4齐普夫定律的分析 齐普夫定律的分析
优点:一般来说, 优点:一般来说,齐普夫定律较符合西文文献 中词频分布的实际情况, 中词频分布的实际情况,定量揭示文献信息的 词频分布规律; 词频分布规律; 局限性; 局限性;对出现频次特别高的词和特别低的 词,不能圆满地反映其分布规律。 不能圆满地反映其分布规律。
文献计量学复习资料
文献计量学复习资料第一章绪论1、什么叫文献计量学?其研究对象和基本内容是什么?文献计量学是以文献信息体系为研究对象,采用数学、统计学等计量方法,研究文献信息的分布状况和变化规律,并进而探索科学技术的发展规律的一门分支学科。
研究对象:信息计量学的研究对象目前主要是各种事务信息的数量方面。
其内容包括信息、数据、事件、事务、文本和文献等。
其中,文献信息指特征信息如作者、主题、分类号。
文献体系指一次、二次、三次文献。
基本内容包括三大部分,(1)理论部分:a.文献信息体系的结构研究b.文献信息流的规律研究:“六大规律三大定律”c.文献信息流的数量关系研究d.文献信息工作系统的研究(2)方法部分:三个特征:a.定量分析;b.移植性;c.综合性(3)应用部分:a.应用原理:为什么?b.应用途径:理论、方法c.应用领域:相关领域:科学学、管理、预测;本体领域:图书情报研究和工作2、什么叫科学计量学、信息计量学?文献计量学与科学计量学、信息计量学的关系怎么样?科学计量学:采用定量方法研究科学本身发展规律的科学学的新型分支学科。
信息计量学:采用数学、统计学等定量方法研究信息现象、过程和规律的一门分支学科。
文献计量学与科学计量学的关系:(1)从研究目的来看:两者相同(2)从研究途径来看:文献计量学是从文献入手(3)从研究方法来看:相似——都用定量法文献计量学与信息计量学的关系:相同:交叉的内容;二者关系密切、相辅相成;不同:(1)范围不同;(2)信息计量学任务更加艰巨3、什么叫网络计量学?其产生的背景和基本内容是什么?网络计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示其数量特征和内在规律的一门新兴分支学科。
网络计量学的产生背景:(1)信息资源的电子化、网络化,及网上数据信息数量的激增,既是网络计量学产生的基础和条件,也是要求其产生迫切的需求;(2)电子文献信息资源统计分析的研究成果为网络计量学产生奠定了基础、积累了经验;(3)是学科发展的需要;(4)是网络管理的需要。
文献计量学培训课件.ppt
2. 莱姆库勒对区域法的发展 F ( x ) = ln (1 + Bx ) / ln ( 1 + B ) 公式形式简单,单参数,便于应用。在确定 了参数B以后,只要知道论文的覆盖比例就 可以确定期刊的最低数量。
在情报研究中的应用
专利文献是科技发展的最敏感指标
精品课件
为技术引进提供决策依据
半导体扩散 技术专利数
日本 世界其他国家
1950 1954 1958 1962 1966 1970
精品课件
第二节 科技文献的老化规律
一、文献老化现象
1. 科技文献老化的概念
科技文献随时间的推移,使用频次逐渐减少的现象 美国,Gosnell,1944《大学图书馆藏书的老化率》: 在知识的累积过程中,一些知识及其载体会逐渐失 去其原有价值。 普赖斯:被引用数据,一篇文献平均寿命十年,对 老化进行了定量研究
2.模拟老化过程的数学模型
1)负指数模型 布鲁克斯的基本假设:科技文献的被引用数 量随时间推移的衰减过程近似服从负指数模 型,当文献达到被引用峰值后,便开始经历 文献老化的衰减过程,于是就可以得到拟合 度很高的负指数曲线
负指数模型的形式 C (t ) = Co e -bt = K e -
bt
观察SCI的引用数据表 概率密度函数 f ( x) = be -bx
精品课件
-bt
2)伯顿-开普勒公式 y = 1-- ( a/e x + b/ e 2x ) (a+b=1)
3)莫德列夫修正式 y = 1-- (a / e x-0.1 + b / e 2x-0.2 ) (a + b = 1)
文献计量学
-- 大量\规范数据源 -- 数据处理和分析工具
• 网络信息计量学研究
第一部分 文献计量学基本规律
第一节 文献信息增长规律
一.文献增长的基本估计 增长年率 6%~8% CA 发表100万篇文摘所用年数 1. 32年(1907~1938) 2. 18年 3. 8年 4. 4.75年 5. 3.3年 6. 2年
1952-1982 世界图书,倍增率20年 1907-1977 世界化学,倍增率10年
• 局限性 --科学文献并不总是按指数函数增长,还与 学科和统计时间有关。学科范围越广泛, 符合指数规律的时间越长;开始统计的时 间越晚,增长率值越大。 -- 指数增长曲线已有平缓趋势 -- 指数规律不能预测文献的未来增长趋势
七、文献信息增长规律的应用
• 在科学学和科技史研究中的应用
模拟科学技术发展过程,探讨规律,普赖斯,在文献指数增长 规律基础上得出科学技术呈指数规律增长的结论.
• 在文献信息管理中的应用
图书馆经费的预算/资料收集的原则/馆藏增加的策略/存储 空间扩大
• 在情报研究中的应用
专利文献是科技发展的最敏感指标
F(t)
科学文献的指数增长曲线
t
• F(t)=aebt (a>0,b>0) a: 统计初始时刻的文献量 b: 持续增长率 • 评价文献增长速度的定量标准:文献量增加 一倍所需的时间(倍增期) • 不同学科的文献增长速度是不同的 化学化工: 8-9年 原子能与环境科学:2-3年
洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典
洛特卡定律、齐夫定律、布拉德福定律和普赖斯定律都是文献计量学的重要的经典洛特卡定律是文献计量学中的重要定律之一,是一种描述科技文献数量分布的经验规律。
它指出,少数文章具有巨大的引文频次,而大部分文章则很少被引用。
具体来说,约20%的文章产生了80%的引文,而80%的文章仅产生了20%的引文。
这个规律适用于各类文献,可以用来评估文章、作者和期刊的影响力。
齐夫定律是文献计量学中的另一条重要定律,描述的是作者数量和其发表文章数量之间的关系。
齐夫定律认为,存在着一种稳定的比例关系,即20%的作者贡献了80%的文章。
这个定律同样可以用来评估作者对某个领域的贡献和影响力。
布拉德福定律是对科学期刊分区的一种经验规律。
它指出,所有与某一主题相关的文章所在的期刊,可以分为三个部分,第一部分包括核心期刊,约占总数的15%,主要涵盖该领域最重要的论文;第二部分包括次核心期刊,约占总数的35%,涵盖一部分重要文章;第三部分包括边缘期刊,约占总数的50%,涵盖余下的文章。
这个定律给出了一种优化期刊分区的思路,使最受关注的论文能够更快地传播和传承。
普赖斯定律是一种有关单个作者的发文数量和其引文频次之间关系的定律。
普赖斯定律认为,作者发表的文章数量和其被引用的次数呈正比关系。
具体来说,每个作者的第n篇文章的引用频次是其前n-1篇文章的引用频次的平均值。
这个定律可以用作评估作者质量的指标,在作者选择发文数量时提供一种思路。
以上四个定律都是文献计量学中的重要定律,它们提供了对科技文献、作者、期刊等方面的理解和评估方法。
研究者可以根据这些定律来指导自己的研究,提高自己的学术影响力和质量。
文献计量学
文献计量学(Bibliometrics)文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科[5-12]。
这一术语最早是1969年由英国人A.普里查德(Alan Britchard)提出的。
文献计量学中常用的定律有如下几种。
布拉德福定律:布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
文字表述为:如果将科技期刊按其刊载某专业论文的数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个区域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2……的关系。
洛特卡定律:洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写3篇论文的作者数量约为写1篇论文作者数量的1/9;写n篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
齐普夫定律:齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。
若用f 表示频次,r表示等级序号,则有fr=C(C为常数)。
人们称该式为齐普夫定律。
普赖斯指数:1971年美国科学学家D.普赖斯提出了一个衡量各个知识领域文献老化的数量指标,即后人所称的“普赖斯指数”。
就是在某一知识领域内,把对年限不超过五年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。
文献计量学第五章文献信息词频分布规律
1.2艾思杜的发现
1916年,法国速记学家艾思杜(J.Estoup)发现: 在较长文章中,词的出现频率分布的定量化形式
词的绝对频率n与它相应的词的序号r的乘积大体上 稳定于一个常数K: nr×r=K
6
1.3贡东的研究
lgnr
B
α
0
A
lgr
词频分布
8
1928年,美国物理学家贡东根据德韦 (Dewey)和阿叶斯(X.Ayres)关于词频统计 资料,作出了图像。
5.1.1词表编制 5.1.2自动标引
31
5.2在情报检索中的应用
一个文献集的词表通常服从齐普夫分布;
如果有N篇文献,某一个检索词涉及其中的 n篇,那么给这个词以log(N/n)+1的权
值,将取得较好的检索效果。
32
5.3在科学评价中的应用
齐普夫定律所使用的词频分析方法现在已经被 越来越多地运用到科学评价和科技管理中来。
比如说,运用关键词计量分析的方法展示一个 学科领域的研究动向,就是一项很有价值的实 证研究。
33
2.2齐普夫定律的图象描述
15
2.3齐普夫定律的一般数学形 式
经过计算及转化,可得其一般数学形式: Fr×rb=C
16
2.4齐普夫定律的分析
优点:一般来说,齐普夫定律较符合西文文献 中词频分布的实际情况,定量揭示文献信息的 词频分布规律;
局限性;对出现频次特别高的词和特别低的 词,不能圆满地反映其分布规律。
21
齐普夫第二定律
In表示出现频次为n的词的个数,则 In / I1 的大小与文献长度无关,仅取 决 与频次n, 即 In / I1 = 2/n(n+1)
文献计量学第二章
3 文献信息增长机理的分析
3.1 文献信息数量增长的原因 3.2 文献信息增长规律的解释 3.3 文献信息增长规律的应用
25
3.1文献信息数量增长的原因
科研经费和科技人员数量的激增
专业范围的扩大和细分化
学科之间相互渗透
科学技术的国际化
研究的合作化和集体化 研究的周期缩短、产生成果和转化的速度加快 通讯、出版技术的改进和情报工作的加强
(2)动态特性:一定时间内,科学文献
在空间的分布性质。ຫໍສະໝຸດ 3前苏联著名情报学家米哈依洛夫
(А.И.Михайлов)指出:“当前,已发
表文章的增长、老化和离散规律,理所当
然地被视为标志科学文献发展的最根本的
规律。”
1.2 科学知识量与科学文献
1.2.1科学知识量的增长与科学文献增长的关系 (1)关系密切: 同步增长的趋势 增长的规律有很大程度的相似性
普赖斯是一位高产的科学家,他一生共发 表240多件论著,汇集成14本专集。他的论著被 其它文献引用的次数高达2000次以上,其中被引 频次最高的(按出版年)是《巴比伦以来的科学 》(1961)、《小科学,大科学》(1963)和 《科学论文网络》(1965)。他提出的科学本身 以及科学文献的指数增长规律是科学学和文献计 量学的基本规律之一,他提出的“引证网络”概 念 使引证分析成为文献计量学的重要的科学研究方 法。1978年普赖斯与加菲尔德共同主编的国际性
16
(l)线性增长模型的内容
科学文献的线性增长的数学模型是: F(t)=bt+a 式中:F(t)—t年的文献累积数; b—文献的年增长数 a__ 当 t=0时的文献数量
线性增长模型的分析
1963年,普赖斯在《小科学,大科学》一书中指出, 指数规律有可能被破坏,文献的指数增长不可能永远继 续下去。实际上有些知识领域内的文献既不遵循指数曲 线增长模式,也不符合逻辑曲线增长模式,而是呈现出 直线增长模式。正如A. 14.米哈依洛夫指出,在东欧经 互 会成员国范围内有关科学图书、期刊和专利说明书的数 量均是呈直线规律增长的。有关统计表明:1960一1972 年全世界出版的图书和小册子数量也呈直线规律增长。 科学文献线性增长模型不仅适用于描述某些知识领 域或某些类型的文献增长,而且科学文献未来的发展将 更多地倾向于直线模型。正如勒希尔(Rescher)所指 出:我们将从文献指数增长的过去,迎向线性增长的未
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文献计量学:文献分布定律,布拉德福定律,词频分布定律,齐普夫定律,科学论文作者分布定律,洛特卡定律,文献增长,科学文献老化,引文分析,情报冗余等。
文献信息源的定量研究开始于20世纪初。
在20世纪70年代末,就形成了布拉德福定律、齐普夫定律、洛特卡定律、文献增长规律、文献老化规律、文献引用规律等六大规律,并在后来的研究中得到不断的完善与发展。
布拉德福定律:也称文献分散定律。
是由英国文献学家布拉德福(S.C.Bradford)1934 年首先提出。
它是定量描述科学论文在相关期刊中集中——分散状况的一个规律。
经过后来的许多研究者的修正和研究,发展成为著名的文献分布理论。
布氏定律的文字描述为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区中所含的期刊数成1:a:a 2 …… 的关系(a>1)。
”布氏定律主要反映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布规律。
布氏定律的应用研究也获得了许多切实有效的成果,应用于指导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和科学评价的科学性。
洛特卡定律:是由美国的统计学家、情报学家洛特卡(A.J.lotka)研究出来的描述科学论文作者动态的最早的量化规律。
在科研活动中,不同人的科研能力及其成果著述数量肯定是不同的。
那么,在同样的一段抽样时间内,不同的科技工作者的论著数量分布有没有什么规律呢?1926 年,洛特卡发表了论文“科学生产率的频率分布”。
他在文中统计分析了化学和物理学两大学科中一段时间内科学家们的著述情况,提出了定量描述科学生产率的平方反比分布规律,又被称为“倒平方定律”。
其经典公式为:f(x) =(C为常数)上式的意义为:设撰写X 篇论文的作者出现频率为f(X) ,则撰写X篇论文的作者数量与他们所写的论文数量呈平方反比关系。
如撰写了2篇论文的作者数量大约是撰写了一篇论文的作者数量的1/4 (即1/2 2 ),写3篇论文的作者数量大约是一篇论文作者数量的1/9(即1/32),写n篇论文的作者数量大约是写一篇论文作者数量的1/n 2。
洛特卡定律,探讨了科学论文著者的不平衡分布规律。
通过他的研究成果,我们可以明确:在宏观的科学著述活动中,少数作者写出了大量的文章;反之,而大多数人的著述则是不多的。
研究科技工作者及其论著间的数量关系有很重要的现实意义。
在信息资源管理和信息利用过程中,可以用它来预测著者数量和文献数量,掌握作者的研究动态,提示不同领域中文献现状和趋势,便于对文献信息源进行有效的选择,搜集和科学管理。
在科学学中,还可用它来研究科研工作者的创造活动规律,研究人才及其成果分布规律。
如普赖斯就从洛特卡定律推论出“杰出科学家数量仅仅是科学家数量的平方根”。
齐普夫定律:是由美国语言学家齐普夫(G.K.Zipf)于1935年研究发现的关于文献中的词频分布规律。
其具体表述如下:如果将一篇达到一定长度的文章中的词按其出现频率递减排序,根据频率高低编上相应的等顺序号,次最高的为 1 级,其次为2 级…… ,这样一直到若干级,如果用f 表示词在文章中出现的频率,用r 表示词的等级序号,则有:
fr = c (c 为常数) 应用词频分布规律及其参数,可以预测关键词的数量,计算各词汇的重要程度,对于文献标引与词汇控制、词表的编制、文献信息检索等方面都具有重要的应用价值。
文献增长规律:随着科学的不断发展,科学文献的增长也成为一种客观的社会现象。
对于这一现象人们在20 世纪初就已注意到。
但一直到20 世纪40 年代后,由于当时图书馆管理的需要,特别是科学史研究以及科技情报工作发展的需要,文献增长规律才被研究者重视,取得了一系列研究成果。
其中最具代表性的是普赖斯(D.Price )提出的科学文献的指数增长规律。
普赖斯在其著作《巴比伦以来的科学》中考察统计了科学期刊的增长情况,发现科学期刊的数量大约每50 年增长10 倍。
他以科技文献量为纵轴,以历史年代为横轴,不同
年代的科技文献量的变化过程表现为一根光滑的曲线,这条曲线十分近似地表示了科技文献量指数增长的规律。
这就是著名的普赖斯曲线,其表达式为:F(t) = ae bt
其中F (t )表示时刻t 的文献量,a 是统计初始时刻(t=0 )的起始文献量,e=2.718 ,b 是常数,表示持续增长率。
从一些实例看,科技文献的指数增长定律作为一个理想模型,在一定程度上正确反映了文献的实际增长情况,但由于没有考虑许多复杂因素对科学文献增长的限制。
真正对于实际的应用,该定律还有许多局限性。
鉴于此,有些学者又提出了科技文献按逻辑曲线增长的理论,作为对指数增长的一种补充和修正,其方程式为:F(t)= F(t) 代表时刻t 的文献量,K 为文献增长的最大值。
其逻辑曲线表明,在科学文献增长的初始阶段,是符合指数增长规律的。
但这种增长趋势到一定时期将会减弱。
当文献增至最大值的一半时,其增长率开始变小,最后缓慢增长,并以K 为极限。
逻辑曲线在描述科学文献增长规律时,取得了一定成功,也仍存在一些缺陷。
后来的学者们关于文献增长规律的研究又有许多新成果,还提出了一些新的定量模型。
文献增长研究多姿多彩,广泛应用于知识度量与知识管理、科学评价、科技政策制定和科技管理、信息研究、信息管理当中。
文献老化规律:科技文献发表之后,随着时间的推移,相对于科学技术的迅速发展,其内容会起来越“落伍”。
文献的老化,就在于随其“年龄”增长,会逐渐失去作为科技情报源的价值,利用率愈来愈低,甚至失去生命力。
1958 年美国学者贝尔纳(J.D.Bernal )首先提出用“半衰期”(Half life )来衡量文献老化速度。
所谓“半衰期”,是指某学科领域现时尚在利用全部文献中的一半是在多长一段时间内发表的。
如中文医学期刊文献半衰期为 4.2 年,则表示现在尚在被使用的这类文献有50% 是在K 1+ae -kbt 近 4.2 年内发表的。
文献的“半衰期”因其学科性质、学科稳定性、文献类型不同而有不同的值。
文献老化规律还可以用普赖斯指数来衡量。
相应的方程式为:C(t)=ke -at C(t) 表示发表了t 年的文献的被利用次数,k 是常数,随学科不同而异,a 为老化率。
目前,关于文献老化规律的研究仍很活跃。
文献老化的应用研究有助于指导文献信息源选择、采集,评价馆藏老化程度,评价文献价值等。
文献引用规律:在科学研究的过程中,必然要借鉴前人或他人的相关研究成果。
因此,科学文献间也存在一种必然联系。
这种相互联系突出地表现为文献间的相互引用。
文献引用关系分析是文献引用规律研究的基础,除了文献间的直接引用关系之外,引文分析理论还着重考察文献的其它最具代表性的间接引证关系,包括引文耦合(两篇或多篇文献同时引用一篇或多篇相同文章,称之为引文耦合)、同被引(co-citation,两篇或多篇文献共同被后来的一篇或多篇文献所引用即为同被引)、自引(著者引用自己以前的著述)等,从而研究科学引文的分布结构和规律性。
引文量的分析是文献引用规律研究的主要内容,通过量的指标对引文所共同具有的一些基
本要素或特征,如文献类型、学科主题、语种、出版年代、引文来源等进行分析和描
述,可以得出引文量按文献类型分布、按语种的分布、按出版时间的分布、按出版学
科或主题的分布、按作者的分布、按国别、期刊的分布等。
引文分析所使用的最主要
的工具是由美国著名的情报学家所创立、现由美国科学情报研究所编制的《科学引文
索引》(SCI )。
这是一套庞大的引文索引系统,其“来源出版物”涵盖了自然科学、
技术科学、医学、农业科学和行为科学领域的优秀期刊4000 多种,引文数据包括了
这4000 多种期刊上登载论文所引用的参考文献数据。
SCI 还有一个副产品——《期刊
引证报告》(JCR ),它已成为期刊评价的一种最重要的工具。
文献引用规律的研究有
着广泛的应用价值,对于文献老化研究、期刊评价、科学评价、科技预测,人才评价
等均有十分重要的意义。