文献老化规律
信息计量学
1. 文献计量学:是采用数学统计方法,对各类文献的诸计量特征进行统计分析,进而揭示、研究文献情报规律,文献情报科学管理以及科学发展趋势的一门学科。
2. 质量牵制原则:出版物的增长数量与其质量有关,不同质量的出版物有不同的出版速度;质量高的文献增长速度慢。
3. 文献老化:科学文献随着其年龄的增长,逐渐失去了作为科学情报源的价值,越来越少的被用户利用的过程。
4. 半衰期:某学科现在尚在被使用的全部文献中,较新的一半是在多长时间内发表的。
5. 普赖斯指数:指在某一领域内,出版年龄不超过5 年的被引证文献与被引证文献总数之比。
6. 文献耦合:是指引用文献通过参考文献建立起来的耦合,如果 A 、B 两篇文献共同引用了一篇或多篇相同的论文,则 A 、B 两篇论文的关系即为耦合关系,也叫文献合配。
7 文献信息流:文献所含情报的汇流称文献信息流。
8 文献老化:科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。
9 科学生产率:个体科研人员在一定时期内所撰写的论文数量。
10 引文分析:利用各种方法对科学期刊、论文、著者等分析对象的引证和被引证现象进行分析,以揭示其特征和内在规律。
11 影响因子:即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
12 信息计量学:是以信息作为对象进行计量研究的学问,采用数学、统计学等定量方法,对信息基本循环图式所描述的社会化的信息交流过程中的信息组织,存储,分布,传递,相互引用和开发利用等进行定量描述和统计分析,以便揭示社会信息交流过程的数量特征和内在规律。
13 网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示七数量特征和内资规律的一门新兴学科。
文献信息老化的主要度量指标有哪两个?两者有何异同?文献信息老化的主要度量指标是半衰期和普赖斯指数。
第三章 科技文献的老化规律
第三章科技文献的老化规律文献老化我们采用前苏联情报学家米哈依诺夫的提法作为定义:科技文献的老化是科技文献随着其“年龄”的增长失去了作为科学情报的价值,以及因此越来越少被科学工作者和专家利用的过程。
“老化”是一个过程,是一个动态的概念。
即给定的文献集合在不同的时期将有不同的使用价值。
不能将文献老化等同于废弃不用,废弃不用是一个静态的概念。
文献的老化必定会导致其使用数量随着时间的推移而减少,但文献使用量随时间推移的减少却并不一定仅是由文献老化一种因素造成的。
不同认识观念:-过程观-状态观-过程状态辩证观文献老化的原因:(1)文献中的情报被后来研究证明是错误的;(2)文献中的情报是正确的,但被载有新的,更全面的内容的文献所代替,原有文献的内容已进入了更广泛的交流领域;(3)文献中的情报是正确的,但研究者的兴趣已发生了转移;(4)文献情报是正确的,且被后人普遍接受,一般人们就不会再去查询那些原始文献。
引文分析法是将所研究学科领域在一定时间内的全部文献收集起来,通过统计每篇文章所附的引文的发表时间及其别引用时间等数据来研究该领域内文献老化的情况。
引用文献分析法(同时法,符合状态观)被引文献分析法(历时法,符合过程观)文献老化的测度指标:半衰期普赖斯指数期刊有益性系数(1)半衰期半衰期(Half-life)是首先由英国著名学者贝尔纳(Bernal)在情报科学中采用的。
1958年在华盛顿召开了国际情报科学会议,贝尔纳发表一篇《科技情报传递:用户分析》的论文。
他在描述科技文献使用情况时,借用了化学中放射性衰变的一个术语—半衰期。
(2)普赖斯指数“普赖斯指数”和半衰期是既有联系又有区别的两个衡量文献老化的指标。
他们都是从文献被利用的角度出发,但以不同的方式来反映文献老化的情况。
普赖斯认为“有现时作用”的引文数量与“档案性”引文数量的比例,是比引文的“一半寿命”更为重要的特征。
文献的“半衰期”只能笼统的衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者和某篇文献的老化特点。
3文献信息老化规律
第三章
文献信息老化规律
第一节 文献信息老化的概念和度量指标
一,文献老化现象
–(二)文献老化的本质 科技文献的老化不单指科学知识的老化,而是包含 科技文献的老化不单指科学知识的老化, 这些知识的文献的老化. 这些知识的文献的老化. 科技文献的老化是一个动态的过程 . 文献的老化 科技文献的老化是一个动态的过程. (obsolescence)≠文献的废弃(obsoleteness) (obsolescence)≠文献的废弃(obsoleteness) 科技文献的老化受多因素的影响. 科技文献的老化受多因素的影响. 科技文献的老化是文献利用过程中的一个特定的阶 段. 科技文献的老化是针对某一"文献群体"而言的. 科技文献的老化是针对某一"文献群体"而言的.
信息计量学
第三章
文献信息老化规律
第一节 文献老化的概念及其测度指标
二,文献老化的量度指标 3.半衰期与普赖斯指数
两个指标都是从文献被引用的角度出发, 两个指标都是从文献被引用的角度出发 , 来衡量 科学文献老化.一般来说,普赖斯指数越大, 科学文献老化 .一般来说 , 普赖斯指数越大 , 半衰期 越短,说明其文献的老化速度就越快.但是"半衰期" 越短 , 说明其文献的老化速度就越快. 但是 " 半衰期 " 只能笼统得地衡量某一学科领域全部文献的老化情况, 只能笼统得地衡量某一学科领域全部文献的老化情况 , 普赖斯指数"既可用于某一领域的全部文献, 而 " 普赖斯指数 " 既可用于某一领域的全部文献 , 也 可用于评价某种期刊,某一机构, 可用于评价某种期刊 , 某一机构 , 甚至某一作者和某 篇文章的老化特点. 篇文章的老化特点.
情报学 六大定律
1、布拉德福定律
布拉德福定律是描述专业论文在期刊中分 布情况的经验规律,由英国著名文献学家 布拉德福(S.C。Bradford,1878-1948) 于1934年提出。
布拉德福定律的文字表述
如果将期刊按其刊载专业论文数量的多寡 以递减顺序排列,则可分出一个核心区和 相继的几个领域,当每区刊载的论文量相 等时,核心期刊数Nc和外围一区期刊数N1、 外围二区期刊数N2成 Nc:N1:N2=1:a:a2 其中a为布拉德福常数
最小努力原则
齐普夫(C.K.Zlpf)博士在他的专著 《人类行为和最小努力原则》中,首先阐 明了“最小努力原则” 齐普夫认为:每一个人在日常生活中都必 定要在他所处的环境里进行一定程度的运 动,这可视为走某种道路。无论哪一种运 动、哪一种道路,人们在这个过程中都有 意无意地按照某一个原则来进行,这个原 则就是“最小努力原则”。
洛特卡定律的应用
洛特卡定律描述了作者人数与其发表论文数 量之间的关系,首次揭示了两者之间存在 的规律。 主要用于研究“科学生产率” 可用于预测发表不同篇数论文的作者数量 和特定学科的论文总量 根据作者数量估计科学论文数量
3、齐夫定律
描述文献中的词与其出现频次之间关系的 经验规律 是一条与语言学密切相关的文献学规律。 由哈佛大学语言学教授齐夫(G.K.Zipf)于 1935年提出
其中,f(x)是发表x篇论文的作者占作者总数 的百分比(作者频率),常数a>1,c是常数。
a值的研究
后经研究,发现物理学等学科领域的作者 与论文之间的关系基本符合平方反比率, 即a=2; 生物、工程、计算机等领域则不符合平方 反比关系 人文科学、社会科学中,a值将变大 规模较大、科研合作程度较高的学科中,a 值会变小。
文献老化
被引百分比
以10年为单位的被引频次分布
曲线拟合的结果:负指数曲线
相对数
30 y = 10.92e-0.26x R²= 0.864 25
20
15
相对数 指数 (相对数)
10
5
0
然后呢?
30
相对数
y = 10.92e-0.26x R²= 0.864
25
20
15 相对数 10 指数 (相对数)
5
0 10 30 50 70 90 110 130 150 170 190 210 230 250 270 290 310
2.半衰期
半衰期(Half-life):
放射性元素的原子核有半数发生衰变时所需要的时 间。
文献“半衰期”
由贝尔纳在1958年,其“科学信息的传递:使用者 分析”论文中,将此名词引入科学文献领域。 1960,美国的图书馆员巴尔顿(R. E. Burton)和
物理学家(R. W. Kebler)
1 pt e 2
t ---文献的半衰期 a ---每篇论文的平均引文率 N ---引用时间上限,即被引 用论文中,最久远的论文发 表年限。
p a/N
Burton估计的半衰期
学科名称 生物医学 冶金工程 半衰期(年) 学科名称 3.0 3.9 生理学 化学 半衰期(年) 7.2 8.1
物理学
0.5 1 2 3
1.5
2.5
被引用相对频次的年代分布
0 8 16 24 32 40 48 56 64 72 80 88 96 1… 1… 1… 1… 1… 1… 1… 1… 1… 1… 1… 1… 2… 2… 2… 2… 2… 2… 2… 2… 2… 2… 2… 2… 2… 3… 3… 3…
科技情报研究的重要定律
科技情报研究的重要定律⽂献分布定律、词频分布定律、作者分布定律、⽂献⽼化定律、⽂献增长定律、⽂献引⽤定律等六条定律是情报学产⽣和发展的基⽯,它们共同揭⽰了信息爆炸、解释了信息爆炸,并解决了信息爆炸社会中的信息有效利⽤问题,是情报学对信息社会的重要贡献。
⼀、布拉德福定律——⽂献分布定律由英国著名⽂献学家B.C.Bradford于⼆⼗世纪30年代率先提出的描述⽂献分散规律的经验定律。
定律描述:如果将科技期刊按其刊载某学科专业论⽂的数量多少,以递减顺序排列,那么可以把期刊分为专门⾯对这个学科定律描述的核⼼区、相关区和⾮相关区。
各个区的⽂章数量相等,此时核⼼区、相关区,⾮相关区期刊数量成 1:n:n^2的关系。
科学应⽤:确定某⼀领域核⼼期刊⽬录科学应⽤⼆、齐普夫定律——词频分布定律美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
定律描述:如果把⼀篇较长⽂章中每个词出现的频次统计起来,按照⾼频词在前、低频词在后的递减顺序排列,并⽤⾃然数定律描述给这些词编上等级序号,即频次最⾼的词等级为1,频次次之的等级为2,……,频次最⼩的词等级为D。
若⽤f表⽰频次,r表⽰等级序号,则有fr=C(C为常数)。
齐普夫的表达仅适宜于中频词的情况,⾼频与低频词与该表述偏差较⼤。
科学应⽤:识别⽂献核⼼主题,可应⽤于基于内容(知识)的统计、挖掘与关联分析科学应⽤三、洛特卡定律——作者分布定律美国学者A.J.洛特卡在20世纪20年代率先提出的描述科学⽣产率的经验规律,⼜称“倒数平⽅定律”。
定律描述:写两篇论⽂的作者数量约为写⼀篇论⽂的作者数量的1/4;写三篇论⽂的作者数量约为写⼀篇论⽂作者数量的 1/9;写定律描述:N篇论⽂的作者数量约为写⼀篇论⽂作者数量的1/ n2……,⽽写⼀篇论⽂作者的数量约占所有作者数量的60%。
科学应⽤:识别领域核⼼作者,根据作者数量预测领域研究活动活跃程度科学应⽤:在洛特卡定律的基础上,普赖斯提出普赖斯定律和⼀些其他重要结论。
文献计量学六大规律
文献计量学:文献分布定律,布拉德福定律,词频分布定律,齐普夫定律,科学论文作者分布定律,洛特卡定律,文献增长,科学文献老化,引文分析,情报冗余等。
文献信息源的定量研究开始于20世纪初。
在20世纪70年代末,就形成了布拉德福定律、齐普夫定律、洛特卡定律、文献增长规律、文献老化规律、文献引用规律等六大规律,并在后来的研究中得到不断的完善与发展。
布拉德福定律:也称文献分散定律。
是由英国文献学家布拉德福(S.C.Bradford)1934 年首先提出。
它是定量描述科学论文在相关期刊中集中——分散状况的一个规律。
经过后来的许多研究者的修正和研究,发展成为著名的文献分布理论。
布氏定律的文字描述为“如果将科学期刊按其刊载某个学科领域的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文量最多的‘核心’区和包含着与核心区同等数量论文的随后几个区,这时核心区和后继各区中所含的期刊数成1:a:a 2 …… 的关系(a>1)。
”布氏定律主要反映的是同一学科专业的期刊论文在相关的期刊信息源中的不平衡分布规律。
布氏定律的应用研究也获得了许多切实有效的成果,应用于指导文献情报工作和科学评价,选择和评价核心期刊,改善文献资源建设的策略,确立入藏重点,了解读者阅读倾向,评价论文的学术价值以节约经费、节约时间,切实提高文献信息服务和信息利用的效率和科学评价的科学性。
洛特卡定律:是由美国的统计学家、情报学家洛特卡(A.J.lotka)研究出来的描述科学论文作者动态的最早的量化规律。
在科研活动中,不同人的科研能力及其成果著述数量肯定是不同的。
那么,在同样的一段抽样时间内,不同的科技工作者的论著数量分布有没有什么规律呢?1926 年,洛特卡发表了论文“科学生产率的频率分布”。
他在文中统计分析了化学和物理学两大学科中一段时间内科学家们的著述情况,提出了定量描述科学生产率的平方反比分布规律,又被称为“倒平方定律”。
其经典公式为:f(x) =(C为常数)上式的意义为:设撰写X 篇论文的作者出现频率为f(X) ,则撰写X篇论文的作者数量与他们所写的论文数量呈平方反比关系。
文献老化规律
文献老化规律《文献老化规律》文献老化规律,简单来说就是随着时间的推移,文献的使用价值或被引用的频率逐渐降低的一种规律。
想象一下文献就像一个个明星。
新出道的明星总是备受瞩目,大家都抢着去看他的表演、听他的歌,各种媒体都在报道他,这就好比新发表的文献,刚出来的时候大家都急于引用,关注度非常高。
但是随着时间的流逝,就像明星逐渐过气一样,文献也会慢慢变得不那么引人注目了。
我们可以把文献看成是水果。
刚摘下来的新鲜水果,色泽鲜艳、口感鲜美,大家都争着购买品尝,这就如同新的文献有着新鲜的观点、数据和研究成果,在学术界就像“香饽饽”一样被人们追捧。
然而,随着时间的推移,水果会慢慢腐烂变质,失去它原本的吸引力,文献也会因为学科的发展、新研究的不断涌现而失去它在前沿领域的“新鲜度”,被引用的次数越来越少。
在现实生活中,这样的例子屡见不鲜。
以计算机科学领域为例,在20世纪80年代关于计算机基础编程的文献,在当时是非常热门的,因为那时候计算机编程刚刚兴起,很多学者和程序员都需要参考这些文献来进行学习和开发。
但是随着技术的飞速发展,到了现在,那些文献已经很少被引用了。
现在的研究更多地集中在人工智能、大数据等新兴领域,新的文献不断涌现,旧的文献就像被时间遗忘在角落里的古董,虽然还有一定的历史价值,但在日常的科研引用中已经逐渐边缘化了。
从数据上来看,根据对某些学科核心期刊文献引用情况的统计,在发表后的前5年,大部分文献会达到引用高峰,之后引用数量就开始逐年递减。
比如在医学领域的一些研究论文,有关新型疾病诊断方法的文献在刚发表后的几年内,被世界各地的医学研究者频繁引用,用来验证、改进或者进一步研究。
可是10年之后,除非是具有非常经典的、开创性的研究成果,否则很少会被再次引用。
文献老化规律在学术界有着非常重要的意义。
对于科研工作者来说,了解这个规律有助于他们及时把握学科前沿动态,知道哪些研究是新的热点,哪些已经是过时的研究方向。
表征文献老化速度的指标
表征文献老化速度的指标
表征文献老化速度的指标主要包括半衰期(H)、普赖斯指数(P)和最大引文年限等。
1. 半衰期(H):这是衡量文献老化程度的重要指标。
具体来说,半衰期被定义为“某期刊或学科现时引用的全部文献(即参考文献)中,较新的一半是在多长时间内发表的”。
这个指标可以用来衡量文献的老化速度,即随着时间的推移,文献被引用的频率会逐渐降低。
2. 普赖斯指数(P):这是由美国学者普赖斯于1971年提出的,用于衡量文献老化速度与程度的指数。
它是指在某一学科领域里,把发表年限不超过5年的引文数量同引文总量之比作为指数。
这个指数越高,说明文献老化速度越快。
3. 最大引文年限:这个指标是指某一文献被引用的最大时间跨度。
一般来说,随着时间的推移,文献被引用的时间跨度会逐渐减小,这也反映了文献老化速度的增加。
此外,文献老化还受到许多其他因素的影响,如文献的增长、文献的类型和性质、学科性质及其发展阶段、用户需求特点和情报环境质量等。
通过研究文献老化问题,可以揭示文献传播的动态规律,指导文献采购、剔旧、排架等;还能对未来文献的利用情况作出预测,进而对整个文献情报的组织管理具有一定指导意义;
还能为科学学及科技史的研究提供定量依据和途径。
如需了解更多关于文献老化的知识,可以咨询情报学专家或查阅相关文献资料。
文献老化规律教程文件
文献老化——巴-凯老化方程
巴尔顿和开普勒选择了9个学科领域的期刊文献,进行了引文数据的
统计分析,提出了文献被引率与时间的关系式
a+b=1; y---一定时间内的文献被 引率; x---时间,以10年为单位
y
1
(
a ex
b e2x
)
根据半衰期定义,令y=1/2,这时x即为半衰期xH
xH 10ln(a a2 2a 2)
文献老化规律
高思嘉 S20155011253
目录
1 含义 指标、模型
2
影响因素、应用
3
网络信息资源的老化
4
文献老化
含义:科技文献随着其"年龄"的增长,其内容日益变得陈旧 过时,失去了作为科学情报源的价值,以及因此越来越少被 科学工作者和专家们利用的过程。
四种情况: ① 文献中所含情报仍然有用,但现已经被包含在新的其
他论著中。 ② 文献中所含情报仍然有用,但是人们对它的兴趣逐渐
下降 ③ 文献中所含情报仍然有用,但为后来的著作所超越 ④ 情报失去价值,不再有用 ⑤ 情报已经成为常识
文献老化—提出
1958年,英国物理学家兼科学专家贝尔纳 (J.D.Bernal)建议
物理学中测度放 射性核素寿命长 短的指标
“半衰期”
概念:在某一知识领域,年限不超过5年的引文数量与引文总量之比作为 指数来衡量文献的老化速度和程度,后人成为“普赖斯指数”。
意义:一般而言,普赖斯指数越大,文献的老化速度越快。
文献老化— 普莱斯指数 VS 半衰期
相同点:从文献被引用的角度出发,来衡量科学 文献老化。
区别: “半衰期”可以用于一般信息老化的度量 “普赖斯指数”只适用于文献信息老化现象的研究
计算机科学文献的老化速度
也叫快指标 ,是指在指定年度里 ( 2001 年) 引文 中引及当年的引文数与总引文数之比 , 它揭示了研 究者利用当年成果的敏锐程度 。从表 2 查得 , 计算 机科学文献中引文的当年指标为 0. 0323 ,外文引文 的为 0. 0040 ,前者明显高于后者 。
2. 3 最大引文年限 5
图 1 绘出了计算机科学文献中文引文数量 、 外 文引文数量和总引文数量随时间变化的曲线 , 符合 二项分布 ,遵循引文数量随时间的延续而递减的规 律 。中文引文的高峰区明显前倾 。在 19556 条引文 中 ,中文引文 4712 条 , 发表于 1956 - 2001 年 , 外文 引文 14844 条 ,发表于 1809 - 2001 年 。
表4 计算机科学文献引文时间分布 年份
2001 2000 1999 1998 1997 1996 1995 1994 1993 1992 1991 1990 1989 1988 1987 1986 1985 1984 1983 1982 1981 1980 1979 1978 1977 1976 1975 1974 1973 1972 1971 1970 196921809
2004 年 6 月 晋 图 学 刊 J un. ,2004 2004 年第 3 期 ( 总第 82 期) Shanxi Library Journal No . 3 ,2004 ( Issue No . 82)
1993 1992 1991 1990 1989 1988 1987 1986 1985 1984 1983 1982 1981 1980 1979 1978 197721956 156 116 90 73 62 56 40 34 14 28 25 16 12 19 15 6 10 4096 4212 4302 4375 4437 4493 4533 4567 4581 4609 4634 4650 4662 4681 4696 4702 4712 0. 8693 0. 8939 0. 9130 0. 9285 0. 9416 0. 9535 0. 9620 0. 9692 0. 9722 0. 9781 0. 9835 0. 9868 0. 9894 0. 9934 0. 9966 0. 9979 1. 0000
科学文献的增长规律和老化规律及其新的一般模型
() 3
—
式 中A =aep 一b ]容易看 出, () x [ c 。 式 1 是下列方
d () N t
: g() () £ N £
() 7
式中 g t 是一个 时间函数 , () 并且 它是 非增 函数 ,
作者简介: 辉 (9 1 , , 林 1 7 一)女 馆员 , 研究方 向为图书馆学 ; 林
家知道 , 由于存在着环境 限制, 文献量不可能无限地增 长。 为了描述这种情况 , 前苏联学者费勒杜茨和纳利莫
夫从逻辑斯谛增长模 型出发 , 研究 了文献增长规律[ 。
这时, 需要将式( ) 4 作些 改变 , 即在该式 的右端乘上一
项 ( 一 N/ , 1 K)得
d N
—
1 科 学文献增 长规 律
问题 。用一些 包含著名模 型的例子来说明新的模 型具有 良好 的综合性。
关键词 中 图分 类 号 G 5 20 文献 标 识 码
众所周知 , 分析和研 究科 学文 献变化 的一 些规律
是人们关注的课题 。多年来 , 经过人们的不断努 力 , 已 取得许 多研究成果 。在此 基础上 , 文研究 了科学文 本
示增长率 , p ] e [ 表示指数 函数 。 x 或者 , 将指数增 长规律 表示为 :
N ( )= a ep b( —C ] t C t x [ t ) ≥
() 2 可以改写成
() 2
斯 托 帕 尔 ( M.hs p1 布 勒 曼 ( . B r a ) V. S et a o )和 L N. um n
1 1 科技文献 的指数增长 规律 . 美 国著名学 者普
=b ( N 1一N / K)
() 5
文献信息老化规律
第三章 文献信息老化规律人们 围绕文献信息老化的机理、量度指标、数学模型及其影响因素主要从三个方面进行研究:一.文献老化理论的研究,进而探索文献信息传播的动态规律二.对研究方法与定量描述方法的研究,以便准确把握老化规律及其动力机制三.对文献信息老化的应用研究,以便更好地指导书刊选购、馆藏优化、排架流通等活动,更快地提高文献利用率和服务效益3.1 文献信息老化的概念对文献信息老化的不同认识观念,可以概括为:过程观、状态观、过程状态辩证观。
3.1.2 一般来说,“老化”包括文献老化和情报老化。
文献老化和情报老化是两个不同的概念。
情报的老化是相对于情报对象而言的,而文献的老化是相对于情报用户而言的。
3.1.3 情报老化的概念?情报的有效价值随时间流逝而衰减的现象。
3.1.4 半衰期的精确定义:定义 3 —8 对∀ X ∈ x ,Pt ()X =21Po ()X ,则称T 为X 的历时半衰期。
定义 3—9 选定某一观测时刻,对∀X ∈ x ,X ={ X ()t t=0,1,2, ,K},如果()()∑=10T t t X P =21()()∑=k t t X P 0,则称T1为X 的平均共时半衰期。
如果 P ()()2T X =21P ()()0,则称T2为X 的分布共时半衰期。
3.1.5 普莱斯指数概念的推广:定义 3-10 对)(()()∑∑∞===∈∀040Pr ,t t X Pt X Pt X x X 为X 的历时普莱斯指数。
定义 3-11 选定某一观测时刻,对 x X ∈∀ , X = .{X.()t t =0 ,1,2,,K },Pr ()X = ())(())(∑∑==k t t t X P t X P 040. 为X 的共时普莱斯指数。
3.2 文献信息老化的量度指标 ?1) 半衰期、普赖斯指数、剩余有益性指标等⑴半衰期的计算:①作图法 ②定量模型计算法.⑵普赖斯指数与半衰期的比较:①一般来说,某一学科或领域文献的“普赖斯指数越大”,半衰期就越短,说明其文献的老化速度就越快。
增长老化规律
文献老化规律
下降 ③ 文献中所含情报仍然有用,但为后来的著作所超越 ④ 情报失去价值,不再有用 ⑤ 情报已经成为常识
文献老化—提出
1958年,英国物理学家兼科学专家贝尔纳 (J.D.Berna
文献老化——应用
一、在馆藏资源优化管理中的应用 -----图书馆数目挖掘 -----剔除滞架期刊
二、在指导用户信息选择中的应用 三、在学科发展规律研究中的应用
文献老化——网络信息资源老化
特征:
非累积性 动态性 不完全性
更新频繁
增长速度
替代性资源 的出现
过快
网络信息资 源的消失
原因
文献老化—普莱斯指数Price’s index
1971年,普赖斯研究发现,现时一年中被利用的(被引证的)的过去 年代中发表的文献的半数,“年龄”不超过五年。这样所有被利用的文 献,可以假定分为“档案性的”(大于五年)和“有现时作用的”(不大于 五年)两类。
利用迅速老化的文献与长期起作用的经典著作的关系,可以说明各 学科的特点。
文献老化——巴-凯老化方程
巴尔顿和开普勒选择了9个学科领域的期刊文献,进行了引文数据的
统计分析,提出了文献被引率与时间的关系式
a+b=1; y---一定时间内的文献被 引率; x---时间,以10年为单位
y
1
(eax
b e2x
)
根据半衰期定义,令y=1/2,这时x即为半衰期xH
xH 10ln(a a2 2a 2)
文献老化规律
高思嘉 S20155011253
目录
1 含义 指标、模型
2
影响因素、应用
3
文献计量学
文献计量学一.科技文献的增长规律什么是科学指标科学指标( Scientific indicators )是指人类科研活动的数量研究首先应确定的定量对象。
科学指标的类型- 人员与机构的数量。
其中人员数量包括科学工作者、工程师、教师和学生的数量等。
机构数量是指各类科研院所、学会及高等学校的数量。
- 科研成果的数量。
其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。
- 科研过程及成果记录载体的数量。
其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。
- 科研资金投入的数量。
主要指直接投入于理论与应用研究的资金数量。
文献指标使用最为频繁,主要原因:- 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。
其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。
- 与其他指标相比,科技文献数量巨大、易于收集。
这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。
- 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。
文献量度指标1)绝对值指标,是表示文献数量多少的指标。
2)相对值指标,是表示不同部分文献的数量比例的。
3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研究。
4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非规则曲线,难以用某种函数来描述。
文献指数增长模型文献指数增长规律文献指数增长规律的局限性( 1) 科学文献并不总是按指数函数关系增长。
普赖斯指数增长模型与所研究的文献的学科和时间有关。
情报学 六大定律
文献计量学的几大定律
普赖斯曲线(文献增长规律) ——以文献量为纵轴,以历史年代为横轴, 把不同年代的文献量在坐标上逐点描述出 来,然后以一光滑曲线连接各点,则可十 分近似地表征文献所时间增长的规律。 老化规律(文献老化规律) ——文献老化是一个过程,可用半衰期衡量 文献的老化。 引文规律 ——主要的引文关系为同被引,自引和引文 耦合。
6、引文规律
由于科学知识和信息内容之间有着各种复 杂的关系,记载科学知识和信息内容的科 学文献必然会反映这种复杂的关系,因此 科学文献体系中的每一份文献都不是孤立 的,而是有着干丝万缕的联系,其表现之 一便是科学文献之间的相互引用。
科学文献的引用原因
科学文献的引用与被引用,是科学知识的 继承与利用所决定的,是科学发展的必然 规律和研究活动规律所决定的。 M.Weinstock在对科学文献相互引用关系 进行了系统的归纳后指出,文献被引用有 以下15种原因
分析引用关系的作用3
论文的耦合及同被引关系还可推广至两个 学科、两个专业、两个著者、两种科技期 刊耦合及同被引现象,帮助我们了解学科、 专业的发展历史和发展方向以及学科专业 间交叉渗透关系; 帮助我们了解学科专业人员的结构成分组 成上的复杂关系以及相关著者群的情况; 帮助我们了解科技期刊的专业性质、判断 科学期刊之间的关系以及确定核心期刊。
齐夫定律
设有一篇含有N个词的文献(N≥5000), 用自然数1,2,3,…给文献中的词编级, 出现频次最高的为1,其次为2,直到r(r <N),则高频词的频次f与词级r的乘积是 一个常数: fr=C 其中,0<c<0.1
齐夫定律的应用
在图书情报领域得到了较广泛的应用,在图书情报工作人 员实践中常常要和语言文字打交道,需要语言学和数学方 法来研究问题,此时齐普夫定律便可发挥作用。 在情报的标引和词汇控制问题上,有些学者按照齐普夫定 律的词频分布,通过标引试验,找出被标引文献与叙词使 用频率的分布特征,确定符合使用频率的词,编入词表, 解决叙词表的选词问题。 可用于文献标引 可在数据库的文档组织中得到应用 “最小努力原则”对于确定信息中心的最佳地理位置,对 于信息中心资料库的合理排架方面也有指导作用
浅谈图书文献档案的老化与保护
文 章 编 号 : O 7 6 2 ( O 2 1 一 O 2 一 O 1 O— 9 121 ) 1 17 2
图 书 文 献 档 案 是 社 会 发 展 的 历 史 记 录 , 国 家 是 的 宝贵 财 富 , 从 事各 种 工 作所 需 要 的第 一 手 资料 是 和 必 要 条 件 。 在 这 些 文 献 档 案 中 ,O 以上 的 档 案 而 6 基本 都是 用文 化纸 印刷 而成 的 。 着 时 间的 推移 , 随 这 些 档 案 的载 体—— 纸张 逐 渐 老化 , 接 影 响 了文献 直 档 案 的保存 年限 。 1 传 统 的 保 护 方 法 我 国 是 一 个 历 史 悠 久 的 文 明 古 国 , 辈 们 为 了 先 其 世 代 长 存 延 绵 , 造 发 明 了 许 多 保 护 图 书 文 献 档 创 案 的有效 方 法 。 1 1 杀 青 防 虫 法 . 因为 当 时承 载 书写 公 文 、 札等 一 切文 献 档案 信 的 材 料 是 竹 简 。 竹 简 的 组 成 成 分 是 植 物 纤 维 , 是 而 它 有 害 生物 的营养成 分 , 受有 害 虫生物 的侵蚀 , 其 易 尤
2 济
I n rM o g l ce c c n lg L o o n e n oi S in eTe h oo y8 n my a Ec
J n 0 2 u e 2 1
N o.1 t lN o. 1 1 To a 26
第 1 期 总第 2 1 1 6 期
2 2 做 好 室 内 温 、 度 的 控 制 和 调 节 . 湿
高 分 子 多 糖 体 , 生 虫 易 霉 变 。 人 们 创 造 出 的 避 虫 易 古 纸 就 是 在 纸 中 加 进 防 虫 药 物 能 散 发 出 异 味 , 到 驱 起
图书资料的剔除工作要利用文献规律
线
.
这 条 曲线 表征 出 科 学 文 献 量 与时 间成 指数 函 数 增 长
.
应 该承 认 有
,
的规 津
据有关 统计数据 按 普赖斯 曲 线 计 算 科 学 文
.
,
“
”
,
极 少 数 科学 文 献具 有 长 期 或 永久 保 存 的 价 值 但是 绝 大
0 番 献量 每 5 0 年翻 1 全 世 界 出 版的 图 书 6 0
支 而 没 有考 虑 这 种 剔除 对 读 者 的 长 期 影 响 这 样 就 难 以
进 行 慎重 细 致 的 复审 对 每 一 份 图 书 资 料 的 取 舍 作 出 恰 如其 分的 决 定
. . ,
建 筑 面 积 增 长速度 永 远 也 赶 不 上 藏 书 的 增 长 速度
个 是 同 人 吸 收 信息 知 识 的现 实 能 力 的 矛 盾
,
在这种 压 力
0 年 内的变化及 牛顿 之 前 3 0 年 化 就 相 当 于 本世 纪 初 3 内 的变化 学 成果的
。
下 图书资料的剔 除 工 作 ( 也 称 剔 旧 但 剔 旧 一 词 不 甚 严 密 因 为剔除的 对 象 不 一 定都 是 旧 的 图 书 资料 ) 往 往 出 于
,
年来的新发 明 和 新创 造 占 当 今世 界 科 文献 量 的激增 带来 了 两 个 矛 盾 一个 是 同
万篇
.
16。 。
戳
令 豁 龄 铃 妙 嘟 畏 侮
影 砒
,
贝
轰 晓 趣 命
口文 黄海江
量 的激增
, .
随 着 近 十年 来 我 国 图 书 资 料 的 激 增 许 多 图 书 馆 和 资料 室发 生 了书库 紧 张 和 人 手 不 够的危 机
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一个提出“文献老化”的人
Gosnell, C.R. (1943) The rate of obsolescence in college library book collections. Dissertation: New York University.
1.科学文献老化的概念
文献老化的概念(obsolescence,aging)
被引百分比
以10年为单位的被引频次分布
曲线拟合的结果:负指数曲线
相对数
30 y = 10.92e-0.26x R²= 0.864 25
20
15
相对数 指数 (相对数)
10
5
0
然后呢?
30
相对数
y = 10.92e-0.26x R²= 0.864
25
20
15 相对数 10 指数 (相对数)
5
0 10 30 50 70 90 110 130 150 170 190 210 230 250 270 290 310
科学文献随其“年龄” 的增长,其内容日益变 得陈旧过时,作为情报源的价值不断减小,甚 至完全失去利用价值。 老化的标志
年龄增长 内容陈旧 价值减小 被利用减少
2.科学文献老化的表示
文献的利用:
浏览:阅览室,印刷版 借阅:流通部门,印刷版 下载:文献数据库,电子版 复印:印刷版 引用:发表论文中列出
化学工程 社会学 机械工程
4.6
4.8 5.0 5.2
植物学
数学 地质学 地理学
10.0
10.5 11.8 16.0
文献半衰期的计算方法(续)
Motylev 修正式
对Burton-Kebler老化方程进行修正,考察了实际统计 的数列与理论计算数列的差异,x2检验表明此差异非常 显著。
b a y 1 x 0 .1 2 x 0 . 2 e e
1980, P. Brown利用数学上著名的泊松分布公式求出化学期刊 文献的“半衰期”
综合分析法 以引文资料、流通资料、馆内使用资料、文献归架资料、复印 资料以及文献利用的总资料为基础,吸取上述方法的长处,力 求克服引文分析法和流通统计中的局限性,从各种实际利用文 献的角度综合分析文献的利用和老化情况 较客观和全面,但必须进行大规模的、多方面的文献统计,一 般用于某些专业领域或学科的文献老化研究
11,889篇来源文献
参考文献:111,530
如何计算和表示文献被利用?
11,889篇来源文献:
目前关于“引用研究”论文的样本
其参考文献:111,530
目前从事“引用研究”的人们正在使用的文献。
这些文献的年代分布是怎样的呢?
用BICOMB软件抽取引文年代并统计
结果导入EXCEL:
3.科学文献老化的数学模型
布鲁克斯负指数函数 巴尔顿–凯普勒老化方程
Brookes文献老化
1970年Brookes提出描述文献老化的规 律,反映文献利用率的衰减现象。 负指数函数
c(t ) Re at
•t ------ 文献的出版年龄(以10 年为单位)
•C(t) -- 表示t 年所发表的文献之引用频率
2.文献老化研究的历史
早期研究 Gosnell, C.R. (1943) The rate of obsolescence in college library book collections. Dissertation: New York University.
•一个学科的期刊文献是由多方面的内容组成的,很多相关学科 都有使用的可能;半衰期必然会受到不同内容文献的支配。已发 表文献的老化速度会受到这些文献所属的学科领域以及文献的种 类和性质影响
理论学科、历史悠久的学科半衰期较长 应用学科、新兴活跃的学科半衰期较短
文献的学科特点
不同的发展阶段
诞生和发展的初期
文献数量呈指数增长,文献的老化符合负指数函数的关系。
相对成熟时期
文献增长速度减慢,老化曲线也变得平缓
文献增长速率增长;老化曲线恢复到负指数曲线
学科进入新的高度和层次或衍生新的分支学科
《一些科技文献的半衰期》: 对9 个学科领域的期刊文献进行引文资料的统计分析,发现 9种不同的引文资料的曲线形状上非常相似,同放射性元素 铀235 的衰变曲线一样同是负指数曲线。
巴尔顿–凯普勒老化方程
b a y 1 x 2x e e
y ---经过一定时间该学科尚在利用的文献之相对数量 x ---时间,以10年为单位 当y = 0.5 时,可以计算文献的半衰期。
2.半衰期
半衰期(Half-life):
放射性元素的原子核有半数发生衰变时所需要的时 间。
文献“半衰期”
由贝尔纳在1958年,其“科学信息的传递:使用者 分析”论文中,将此名词引入科学文献领域。 1960,美国的图书馆员巴尔顿(R. E. Burton)和
物理学家(R. W. Kebler)
文献老化
大纲
1. 2. 3. 4. 5. 6. 7. 8. 科学文献老化的概念 文献老化的研究过程 和度量指标 科学文献老化的研究及方法 科学文献老化的数学模型 科学文献半衰期的研究及计算 科学文献老化机制的分析 科学文献老化规律的应用
老化
为什么要研究老化?
社会需要 科学文献的迅速增长; 图书情报单位面临书刊数量激增; 存放空间有限;
5.科学文献老化机制的分析
文献老化的几种类型 文献老化的影响因素
文献老化的几种类型
文献中所含的情报已失效 文献信息已包含在其它文献 被更新的文献所代替 研究兴趣下降造成有关文献的利用减少 新观念与新理论的发现
文献老化的影响因素
文献的增长
文献增长的越快,文献的半衰期越短 文献的内容所属学科的性质和特点不同,其老化差异甚大。
文献老化的影响因素(续)
文献的类型和性质
科学专著> 期刊论文、科技报告、会议文献 理论性刊物> 通讯报导刊物 论述性文章> 介绍性文章 评论性文献> 研究论文
使用者需求及信息环境
不同背景使用者对文献的需求不同 科学发达和科学较落后的国家或地区对文献使用的年限 亦不同
档案性文献:年龄超过5年仍被引证的文献
地理学、地质学 生物医学
有现时作用文献:年龄不大于5年的被引文献
文献老化的度量指标
半衰期VS.普赖斯指数 相同:皆是从文献被利用的角度出发 相异:
半衰期:只能笼统地衡量某一学科领域全部文献的老化情况 普赖斯指数:既可用于某一领域的全部文献,也可用于评价某种 期刊、某一机构、甚至某一作者和某篇文章的老化特点
1.科学文献老化的概念和度量指标
文献老化的度量指标
半衰期 普赖斯指数 剩余有益性指标
文献老化的度量指标
普赖斯(Price)指数(1971) 某一知识领域内,把对年限不超过5年的文献引文数量与引文 总数之比当作指数,用以度量文献的老化速度和程度。 Price指数愈大,半衰期则愈短,文献老化的速度则愈快。 普赖斯将所有被利用的文献分成二类
a b 1
某学科现时尚在利用的全部文献中较新的一半是在多 长一段时间内(X年)发表的 意义:经过X年,某学科领域其一半文献的利用价值已 逐渐衰减。
1963,普赖斯的研究
一篇论文的半衰期约15年;引用这篇论文的全部其 它论文的二分之一是在这篇论文发表后的15年内发 表的
扩大了半衰期研究的适用范围。
•R ----- 常数,随不同学科而异 •e ------ 自然对数的底,等于2.718… • a ------文献的老化率
文献半衰期的计算方法
Burton-Kebler老化方程 Pauline公式
从概率论出发,设法计算出每篇科学文献的平均引用 机率,就可以按文献引文率呈负指数函数而减小的规 律,当文献引用量降低到一半以上时,便有:
1 pt e 2
t ---文献的半衰期 a ---每篇论文的平均引文率 N ---引用时间上限,即被引 用论文中,最久远的论文发 表年限。
p a/N
Burton估计的半衰期
学科名称 生物医学 冶金工程 半衰期(年) 学科名称 3.0 3.9 生理学 化学 半衰期(年) 7.2 8.1
物理学
0.5 1 2 3
1.5
2.5
被引用相对频次的年代分布
0 8 16 24 32 40 48 56 64 72 80 88 96 1… 1… 1… 1… 1… 1… 1… 1… 1… 1… 1… 1… 2… 2… 2… 2… 2… 2… 2… 2… 2… 2… 2… 2… 2… 3… 3… 3…
0
被引百分比
文献“半衰期” 的影响因素
文献的学科性质、类型、增和长研究方法;时代的特 点、人类的需要、社会的条件、情报的环境等
文献老化的度量指标
半衰期的理解
现时尚在利用的全部文献=? 如何计算其中的较新的一半?
五、六十年代–半衰期的研究 七十年代–更重视相关研究,以解决图书馆经费紧缩和库容危 机。 目前相关研究 文献老化的理论研究:探讨文献情报传播的动态规律。 文献老化的应用研究:指导书刊选购、馆藏最佳化,排架流通 等工作,提高文献利用率和流通率
2.文献半衰期研究的发展
文献“半衰期” 研究的发展
1960,巴尔顿和凯普勒– 国际上出现第一篇研究半衰期的论文
文献半衰期研究的发展(续)
1970,莱茵(M. B. Line) 半衰期研究必须考虑文献增长率的因素。 1970,布鲁克斯(B.C. Brookes) 文献老化负指数函数 1980,布朗 考虑文献增长的前提下,对化学期刊文献的半衰期进行 研究