文献计量学复习要点
文献计量学
26 / 12
洛特卡定律的应用
1、在图书馆学情报学方面,一般是用它来预测 发表不同数目文章的著者数量和特定学科的文献数 量;
2、在预测科学方面,按照洛特卡定律,可以从 统计或计算科学著者数量来预测文献数量的增长速 度和文献流的动向,便于掌握文献的交流规律,同 时从文献计量学的角度出发,也可以预测科学家数 量的增长和科学发展的规模及趋势等;
25 / 12
洛特卡定律的局限性
LOTKA 定律是有局限性的,平方反比率是科学 生产率一般的理论估计,不是一个精确的统计分布, 它是对 CA 中收录的物理、化学两个领域十年间著 者(姓氏以A A 、B B 开头)抽样研究结果的推广。 后来的学者沿着这个思路进行的研究,有些数据符 合这个规律,有些则不符合。
核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
11 / 12
图像分析
此外,布拉德福还对收集的数据进行图像分析:取 上述等级排列的期刊数量的对数㏒为横坐标,以相 应的论文累计数R(n)为纵坐标进行图像描述,就得 到了布拉德福分散曲线。
20 / 12
基本内容
从洛特卡定律的产生过程可以看出,该定律的目的 和基本内容是:描述科学工作者人数与其所论著论 文之间的关系。 如果设f(x)为写了x篇论文的作者数占作者总数的 比例,则洛特卡定律可表示为:
C——某特定主题领域的特正常数。 洛特卡统计的指数a约:a=2,即“平方反比率”。
21 / 12
齐夫在做了大量艰苦的统计工作后,将单词以其出现 的频次的多寡进行了等级排队,经过计算,论证了描述词 的频率与等级序号之间关系的定量形式。
文献计量学
齐普夫定律
7 / 12
布拉德福定律
的含义:信息流的序性结构经验定律,
也叫文献分散定律。 布氏定律, 是英国文献学家布拉德福于1934 年在 《 Engineering 》 杂志上发表的《 Sources of information onspecific subjects 》 上提出的描述文分散规律的经验定律。 在其专著 《 文献工作 》 中,他又一次阐述了文献分散定律。 认为‚“在数量很大的文献体中,文献按某一规律的模型分散…… ”。 科学信息很大程度上是以科技期刊的形式出现的,借助期刊这 个载体得以交流传播,科技期刊对促进科学技术发展起着举足轻重 的作用。 布拉德福定律 (Bradford’ Law of Scattering)就是描述某一学 科论文在相关期刊中的分布规律。它定量的揭示了 ,今天仍然具有不可替代的理论价值和实 际意义。
10 / 12
区域分析
布拉德福定律的区域分析:如果将科学期刊按其登 载某个学科的论文数量的大小,以减序排序,那么 可以把期刊分为专门面向这个学科的核心区、相关 区、非相关区,3个区的论文数量相等,此时核心区、 相关区、非相关区期刊数量之比为:1∶a∶a² ,a 为 布拉德福常数。 核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
洛特卡定律的发展
一. 洛特卡定律的验证工作
1926年,洛特卡定律诞生; 1941年,Davis对洛特卡的结果进行验证; 1949年,Zipf在《人类行为和最小努力法则》中 肯定洛特卡定律的同时也指出它的不足之处在于只 是一种近似的计算方法,而不是一种严格意义上的 分布。 后来,众多的学者在不同的领域取得数据进行研 究,对洛特卡定律的验证、完善与发展起到一定的 作用。 (在洛特卡定律的基础上,普莱斯进一步研究了科学家人数
文献计量学
文献计量学一.科技文献的增长规律什么是科学指标科学指标(Scientific indicators)是指人类科研活动的数量研究首先应确定的定量对象。
科学指标的类型- 人员与机构的数量。
其中人员数量包括科学工作者、工程师、教师和学生的数量等。
机构数量是指各类科研院所、学会及高等学校的数量。
- 科研成果的数量。
其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。
- 科研过程及成果记录载体的数量。
其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。
- 科研资金投入的数量。
主要指直接投入于理论与应用研究的资金数量。
文献指标使用最为频繁,主要原因:- 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。
其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。
- 与其他指标相比,科技文献数量巨大、易于收集。
这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。
- 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。
文献量度指标1)绝对值指标,是表示文献数量多少的指标。
2)相对值指标,是表示不同部分文献的数量比例的。
3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研究。
4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非规则曲线,难以用某种函数来描述。
文献指数增长模型文献指数增长规律文献指数增长规律的局限性(1)科学文献并不总是按指数函数关系增长。
普赖斯指数增长模型与所研究的文献的学科和时间有关。
文献计量学复习要点
《文献计量学》复习要点(初稿)一、题型1、填空题(共10分,每空1分)2、选择题(共20分,每空2分)(不定项)3、问答题(共50分,每题10分)4、计算题(共20分,每题10分)二、复习要点1、文献计量学、统计目录学各是谁提出来的。
文献计量学起源于英国学者休姆(E .W .Hulme)于1923年提出的统计书目学(statistical bibliography )。
1969年,英国学者普里查德(A .Pritchard)提出用文献计量学命名这个领域的研究,以替代统计书目学。
2、科学文献数量增长的规律是由科学发展的客观过程决定的,而科学发展的实际过程主要受哪两种因素的制约?科学文献数量增长的规律是由科学发展的客观过程决定的,而科学发展的实际过程主要受两种因素的制约:一是科学自身固有的发展规律,二是科学所处的环境条件。
3、半衰期的定义。
比较普赖斯指数和半衰期。
普赖斯指数的计算。
物理学中的半衰期:任何放射性物质都以这样的方式衰变:在相等的时间间隔内它按相同的比率减少。
减少到一半量的时间间隔就是“半衰期”,也是表示这种物质的放射性特性。
文献半衰期:某学科(专业)现时正在被利用的全部文献中的一半的出版年限。
它是衡量文献老化的指标之一。
“普赖斯指数”和“半衰期”是既有联系又有区别的两个衡量科学文献老化的指标。
半衰期是指某一学科或专业领域的文献总和而言的;而普赖斯指数既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者的文章的老化特点。
一般而言,如果某一学科或专业的文献的普赖斯指数越大,则半衰期就越短,说明其老化速度就越快。
“普赖斯指数”:就是在某一个知识领域内,把对年限不超过5年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。
其计算公式为:5P 100%=⨯出版年限不超过年的被引文献数量被引文献总量4、从文献利用的角度来说,科学文献的老化有以下哪几种情形?有五种情形:① 献包含的信息失效。
文献计量学-详解
文献计量学-详解目录• 1 什么是文献计量学• 2 文献计量学的分析数据• 3 文献计量学的应用分析• 4 我国文献计量学o 4.1 发展历程o 4.2 存在的问题及解决对策• 5 文献计量学的局限性什么是文献计量学文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。
文献计量学的分析数据文献计量学的分析数据指标取自各种不同的数据源,在机读文献数据库出现之前,对科学文献的定量分析都是以印刷型出版物为分析对象的。
随着各类型电子版出版物的不断涌现,获取分析数据的方法与途径也在不断扩展。
目前,获取分析数据的主要途径有:① 使用机构内部的文件,如:研究报告、年度报告等;② 如果所需信息不包括在书目数据库中,要通过查找原始文献;③ 大规模的分析需要利用商用文献数据库来获取;④ 利用专门为指标统计而提供数据的数据库来获取数据;⑤ 选择与国际上某机构签订协议来获取这方面的服务。
另外,还可以通过一些机构获取有关文献计量学方面的统计分析指标,如:美国费城的ISI和新泽西州的CHI研究公司、荷兰莱顿大学的科学技术研究中心(CWTS)、匈牙利科学院图书馆,以及中国科学院文献情报中心等。
这些机构都设有专门部门,从事与文献计量学有关的开放指标数据源的创新性研究,收集、加工和整理基于文献统计分析的各种指标。
由于各单位统计的指标使用不同的统计方法和不同的来源数据,相互之间可比性较差,所以使用从不同单位获得的数据进行文献计量学研究时,要全面了解具体指标产生的方法和依据,客观衡量和评价每一项分析研究成果。
文献计量学的应用分析作为一个科技评估的工具,文献计量学的测度体系提供了科技成果的各种定量和定性指标。
虽然,这些成果只涵盖了已发表的科学成果,但它们适用于不同的科研层次,小到科学家个人,大到一个学科、机构、地区,甚至国家。
文献计量学基础知识2-PPT精品文档
•参考文献链接
•相关记录链接
3. ISI的发展历程与知识链接
引文索引:不断发展
1997
1992
1989
SCI, 1963 SSCI, AHCI on CD Science Citation Index Current Contents THOMSON Scientific ISI Web Of Science ISI Web of Knowledge
• 另一种定义 若文献A将文献B作为参考文献,则文献A就 有了一篇参考文献B,而文献B则有了一篇引用 文献 (引文) A。
引文网络
1. 科学文献之间不是孤立的,而是相互联系、不
断延伸的系统。 2. 科学文献的相互引证反映了科学发展的客观规 律,体现了科学知识的累积性、连续性和继承 性及学科之间的交叉、渗透。 3. 通过引文网络向前可以追根溯源,向后可以跟 踪发展,是一种特殊形式的检索系统。 4. 科学文献的引用频率不是均衡的,引文网络的 稀疏与密集反映了引文分布的分散与集中规律。
• 知识服务是以信息知识的搜寻、组织、分 析、重组为基础,根据用户的问题和环境, 提出能够有效支持知识应用和知识创新的 服务。
互联网与知识链接
• 用户梦想的是一个覆盖全部学术信息资源 的信息系统,所有的信息互通互联,信息 获取简单准确。
快速获取信息的知识链接
• 知识链接的价值就在于通过连接,一 篇文章或其他检索到的信息资源可以 成为一个相关研究领域或研究方法的 门户。
2004 2019
ISI Web of Knowledge 3.0 ISI Web of Science 7.0 BIOSIS
1958
Current Contents Connect Derwent Innovations Index
文献计量学知识
文献计量学知识1、文献计量学文献计量学是借助文献的各种特征的数量,采用数学与统计学方法来描述、评价和预测科学技术的现状与发展趋势的图书情报学分支学科。
这一术语最早是1969年由英国人A.普里查德提出的。
2、科学计量学科学计量学是对科学活动过程与管理实施量化评估、刻画和预测的科学学分支学科。
这一术语最早是1969年由前苏联科学学家提出的。
3、情报计量学情报计量学是量化处理情报行为与过程的情报学分支学科。
这一术语最早是1979年由德国学者提出的。
4、布拉德福定律布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
其文字表述为:如果将科技期刊按其刊载某专业论文的数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个区域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2……的关系。
5、洛特卡定律洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;写N篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
6、齐普夫定律齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。
若用f表示频次,r表示等级序号,则有fr=C(C为常数)。
人们称该式为齐普夫定律。
7、普赖斯指数1971年,美国科学学家D. 普赖斯提出了一个衡量各个知识领域文献老化的数量指标,即后人所称的“普赖斯指数”。
文献计量学专业复习资料
信息计量学复习预测参考一.名词解释信息论:采用数理统计方法来研究信息的度量,传输和变换规律的一门学科。
信息计量学:采用定量方法来描述和研究情报(信息)的现象,过程和规律的一门学科。
期刊载文量:在给定时间内,期刊发表的全部论文数量。
期刊引证率:在给定时间内,期刊引证的全部参考文献数量。
期刊被引率:在给定时间内,期刊被引证的全部次数。
平均引文率:反映期刊平均引文水平的统计量,以修正由于载文量大小不同带来的偏差。
知识发现:对数据中隐含的,以前不知道的,潜在的有用的信息的有价值的提取。
聚类:利用论文间的同被引关系把本来无外部联系的论文“聚”在一起而形成“类”的过程。
引文聚类:引文之间都具有一定程度的学科专业相关性,根据专业属性,引文可聚集成为一个个聚类群体。
引文耦合:引证文献通过其参考文献(被引证文献)建立的耦合关系。
文献同被引:指两篇(或多篇)文献同时被后来的一篇或多篇论文所引证,则称这两篇论文具有“同被引“关系。
期刊同被引:以期刊为基本单元而建立的同被引关系。
普赖斯定律:撰写全部论文一半的高产作者的数量,等于全部科学作者总数的平方根,这就是普赖斯定律.普赖斯指数:普赖斯指数等于(出版年限不超过5年的被引文献数量/被引文献总量)X100%文献信息流:在信息计量学中,通常把文献所含信息的汇流称为文献信息流。
由于文献是信息的最基本的载体形式,文献信息流是具有一系列主题特征的科学文献的集合,所以有时将文献信息流简称为文献流。
文献信息老化:科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,甚至完全s丧失其利用价值。
过程观认为文献老化是一种过程,状态观认为文献老化是一种状态,过程状态辩证观认为文献老化既是一种过程又是一种状态。
半衰期:某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的(共时半衰期);该学科一半文献失效所经历的时间(历时半衰期)。
引文分析法:就是利用各种数学及统计学的方法和比较,归纳,抽象,概括等逻辑方法,对科学期刊,论文,著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。
文献计量学方法【精选】
提纲
1. 概述 2. 文献计量学方法的基本原理及其应用
1. 概述
文献计量学(bibliometrics) 文献计量学是采用数学、统计学方法定量研究 文献信息的分布和变化规律的一门学科。
科学计量学(scientometrics) 1968年,前苏联学者提出的关于科学技术进 步的计量研究。
① 布拉德福定律及其应用
布拉德福定律是文献计量学最基本的定律之一, 是关于专业文献与登载专业文献的期刊的数量分 布规律。
如果将科技期刊按其刊载某专业论文的数量的多 少以递减顺序排列起来,则可以在这些期刊中区 分出载文率最高的核心区和包含着与核心区同等 数量论文的后继几区。此时,核心区和后继各区 中所含的期刊数成1:n:n2 的关系(n>1)。
2. 文献计量学方法的基本原理及其应用
④ 引文分析及其应用
引文分析是运用数学、统计学和逻辑学的方法对 论文、专著等各种文献的相互引用现象进行分析, 以揭示出其数量特征和内在规律的一种研究方法。
在进行引文分析时,经常采用的计量指标有:引 文率、被引用率、自引率、被自引率、影响因子、 即年指标、引文耦合强度、同被引强度等。这些 计量指标从不同的侧面体现了文献之间的内在联 系,并在更深的层次上反映了文献所代表的事物 运动的规律。
情报计量学(informetrics) 1979年,德国,otto nacke
1. 概述
图书馆学
学
情报学
1. 概述
发展趋势:
从文献计量向信息计量发展 文献计量学、科学计量学、信息计量学的合流趋势 计算机辅助的计量研究和应用
大量\规范数据源 数据处理和分析工具
文献计量学方法包含一系列描述文献信息 流动态特征的经验定律和规律。这些经验定律 和规律源于实践,又反过来对实践产生指导作 用。
文献计量学
-- 大量\规范数据源 -- 数据处理和分析工具
• 网络信息计量学研究
第一部分 文献计量学基本规律
第一节 文献信息增长规律
一.文献增长的基本估计 增长年率 6%~8% CA 发表100万篇文摘所用年数 1. 32年(1907~1938) 2. 18年 3. 8年 4. 4.75年 5. 3.3年 6. 2年
1952-1982 世界图书,倍增率20年 1907-1977 世界化学,倍增率10年
• 局限性 --科学文献并不总是按指数函数增长,还与 学科和统计时间有关。学科范围越广泛, 符合指数规律的时间越长;开始统计的时 间越晚,增长率值越大。 -- 指数增长曲线已有平缓趋势 -- 指数规律不能预测文献的未来增长趋势
七、文献信息增长规律的应用
• 在科学学和科技史研究中的应用
模拟科学技术发展过程,探讨规律,普赖斯,在文献指数增长 规律基础上得出科学技术呈指数规律增长的结论.
• 在文献信息管理中的应用
图书馆经费的预算/资料收集的原则/馆藏增加的策略/存储 空间扩大
• 在情报研究中的应用
专利文献是科技发展的最敏感指标
F(t)
科学文献的指数增长曲线
t
• F(t)=aebt (a>0,b>0) a: 统计初始时刻的文献量 b: 持续增长率 • 评价文献增长速度的定量标准:文献量增加 一倍所需的时间(倍增期) • 不同学科的文献增长速度是不同的 化学化工: 8-9年 原子能与环境科学:2-3年
文献计量学复习资料【精选】
文献计量学复习资料第一章绪论1、什么叫文献计量学?其研究对象和基本内容是什么?文献计量学是以文献信息体系为研究对象,采用数学、统计学等计量方法,研究文献信息的分布状况和变化规律,并进而探索科学技术的发展规律的一门分支学科。
研究对象:信息计量学的研究对象目前主要是各种事务信息的数量方面。
其内容包括信息、数据、事件、事务、文本和文献等。
其中,文献信息指特征信息如作者、主题、分类号。
文献体系指一次、二次、三次文献。
基本内容包括三大部分,(1)理论部分:a.文献信息体系的结构研究b.文献信息流的规律研究:“六大规律三大定律”c.文献信息流的数量关系研究d.文献信息工作系统的研究(2)方法部分:三个特征:a.定量分析;b.移植性;c.综合性(3)应用部分:a.应用原理:为什么?b.应用途径:理论、方法c.应用领域:相关领域:科学学、管理、预测;本体领域:图书情报研究和工作2、什么叫科学计量学、信息计量学?文献计量学与科学计量学、信息计量学的关系怎么样?科学计量学:采用定量方法研究科学本身发展规律的科学学的新型分支学科。
信息计量学:采用数学、统计学等定量方法研究信息现象、过程和规律的一门分支学科。
文献计量学与科学计量学的关系:(1)从研究目的来看:两者相同(2)从研究途径来看:文献计量学是从文献入手(3)从研究方法来看:相似——都用定量法文献计量学与信息计量学的关系:相同:交叉的内容;二者关系密切、相辅相成;不同:(1)范围不同;(2)信息计量学任务更加艰巨3、什么叫网络计量学?其产生的背景和基本内容是什么?网络计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示其数量特征和内在规律的一门新兴分支学科。
网络计量学的产生背景:(1)信息资源的电子化、网络化,及网上数据信息数量的激增,既是网络计量学产生的基础和条件,也是要求其产生迫切的需求;(2)电子文献信息资源统计分析的研究成果为网络计量学产生奠定了基础、积累了经验;(3)是学科发展的需要;(4)是网络管理的需要。
文献计量学方法
2. 文献计量学方法的基本原理及其应用
文献计量学方法包含一系列描述文献信息 流动态特征的经验定律和规律。这些经验定律 和规律源于实践,又反过来对实践产生指导作 用。
2. 文献计量学方法的基本原理及其应用
① ② ③
④
布拉德福定律及其应用 洛特卡定律及其应用 齐普夫定律及其应用 引文分析及其应用
2. 文献计量学方法的基本原理及其应用
1. 概述
图书馆学
文献计量学
科学计量学
情报计量学
科学学
情报学
1. 概述
发展趋势:
从文献计量向信息计量发展 文献计量学、科学计量学、信息计量学的合流趋势 计算机辅助的计量研究和应用
大量\规范数据源 数据处理和分析工具
重视文献计量学在科技管理和决策中的应用 网络信息计量学研究 网络信息计量学是采用数学、统计学等各种定量方法, 对网 络信息的组织、存贮、分布、传递、相互引证和开发利用等 进行定量描述和统计分析,以便揭示网络信息数量特征和内 在规律的一门新兴分支学科。
2. 文献计量学方法的基本原理及其应用①Βιβλιοθήκη 布拉德福定律及其应用
布拉德福定律在信息分析与预测中的应用主要体现在文献 信息的搜集环节上。 布拉德福定律也可用于研究某一学科发展的特点以及学科 之间的交叉影响和相互渗透关系,并以此确定某些新学科 的生长点。
例如,对某一学科主题而言,布拉德福定律中的第一区(核心 区)往往由该学科内比较成熟的方向的期刊构成;第二区往往 由该学科内不太成熟的方向以及与该学科关系最紧密的其他学 科的期刊构成;第三区以及后继各区的期刊构成与第二区类似, 但在成熟性以及与该学科的关系上依次减弱。分析这种变化, 可以帮助我们推测该学科的哪些方向发展得比较成熟、哪些不 太成熟,以及哪些学科与该学科有交叉影响和相互渗透关系。
文献计量学复习资料
文献计量学复习资料第一章1.信息计量学的产生背景2.信息计量学的发展3.信息计量学的研究目的和应用4.信息计量学的研究对象5.信息计量学的概念6.信息计量学的内容体系7.信息计量的数据来源8.信息计量的方法体系9.信息计量学与相关学科的异同第二章1.文献信息流的特性2.文献信息增长的影响及对策3.文献信息的指数增长规律4.文献信息的逻辑增长规律5.文献信息增长的其他数学模型6.文献信息增长的原因7.文献信息增长规律的应用第三章1.文献信息老化的概念和量度指标2.文献信息老化的研究方法3.文献信息老化的数学模型及老化指标4.文献信息老化的几种类型5.文献信息老化的几种情形6.文献信息老化的影响因素7.文献信息老化规律的应用第四章1.布氏定律的创始人2.布氏定律的产生背景3.布拉德福定律的基本内容4.布氏定律的发展过程5.布氏定律应用的基本方法及应用领域6.布氏定律应用的条件与局限第五章1.齐普夫定律的理论基础2.最省力法则3.齐普夫定律的基本内容4.齐普夫定律的应用第六章1.信息计量学的三大基本定律2.洛特卡定律的形成和基本内容3.洛特卡定律的应用第七章1.信息计量学的基础与结构模型2.文献信息分布特征、规律及其理论解释3.信息计量学分布规律的理论体系研究第八章1.统计资料2.统计学方法的功能3.文献信息统计中的一般概念4.文献信息统计的原则要求5.文献信息统计的指标体系6.文献信息统计的主要类型7.文献信息统计分析法的基本步骤8.文献信息统计分析法的应用9.数理统计方法概述10数理统计方法的应用第九章1.数学方法的特征2.数学模型法原理3.数学模型的类型4.数学模型法的基本步骤5.数理统计常用的参数指标6.数学模型分析法的应用7.回归分析法及其应用第十章1.引文分析的基本概念2.引文分析的基本类型和步骤3.引文分析的主要工具4.引文分布规律及主要指标分析5.评价期刊的主要测度指标6.引文耦合与同被引的概念7.引文的聚类分析8.引文分析法的应用领域第十一章1.计算机辅助信息计量分析的意义2.计算机辅助信息计量分析的可行性3.计算机辅助信息计量分析的基本原理4.引文分析数据库5.引文分析系统的设计6.引文数据的挖掘分析方法7.计算机辅助信息计量分析法的应用8.计算机辅助信息计量分析的发展方向第十二章1.核心期刊的概念和测定的重要意义2.核心期刊的测定方法3.文献收藏工作的评价4.检索工具完整性的测定5.布氏定律用于信息检索6.文献信息利用规律的研究方法7.科技人员利用文献信息规律的研究第十三章1.信息计量学在科学学研究中的应用2.信息计量学评价人才的原理3.信息计量学评价人才的方法4.科技预测及其基本内容第十四章1.网络信息计量学2.网络信息计量学研究意义3.网络信息计量学的研究对象和内容4.网络信息计量学的主要特征5.网络信息计量学的研究方法6.网络信息计量学的应用。
文献计量学
文献计量学一.科技文献的增长规律什么是科学指标科学指标( Scientific indicators )是指人类科研活动的数量研究首先应确定的定量对象。
科学指标的类型- 人员与机构的数量。
其中人员数量包括科学工作者、工程师、教师和学生的数量等。
机构数量是指各类科研院所、学会及高等学校的数量。
- 科研成果的数量。
其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。
- 科研过程及成果记录载体的数量。
其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。
- 科研资金投入的数量。
主要指直接投入于理论与应用研究的资金数量。
文献指标使用最为频繁,主要原因:- 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。
其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。
- 与其他指标相比,科技文献数量巨大、易于收集。
这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。
- 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。
文献量度指标1)绝对值指标,是表示文献数量多少的指标。
2)相对值指标,是表示不同部分文献的数量比例的。
3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研究。
4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非规则曲线,难以用某种函数来描述。
文献指数增长模型文献指数增长规律文献指数增长规律的局限性( 1) 科学文献并不总是按指数函数关系增长。
普赖斯指数增长模型与所研究的文献的学科和时间有关。
文献计量学2-基础知识(第4-5节)
六大专业学科引文索引数据库
• • • • • • • • • • CompuMath Citation Index (计算机与数学引文索引) Biochemistry & Biophysics Citation Index (生物化学于生物物理引文索引) Biotechnology Citation Index (生物技术引文索引) Chemistry Citation Index (化学引文索引) Neuroscience Citation Index (神经科学引文索引) Materials Science Citation Index(材料科学引文索引)
出版年 2001被引用 次数 累计百分比 % 年数 2001 49 2000 152 1999 232 1998 212 1997 168 1996 104 1995 115 … 全部 1916
2.56 10.49 22.60 33.66 42.43 47.86 53.86 1 2 3 4 5 6 7
特点:
• 1.轻松查找相关研究早期、当时和最近的学术文 献,同时获取原文摘要。 • 2.“Related Records”检索共同引用相同的一份或几 份文献的论文,这一功能为学术研究提供了新的 思维方式。 • 3.数据库每周更新,确保及时反映研究动态。
特点:
• 检索所有被引用的著者,而非仅仅是第一作者。 • 标记了论文的“Times Cited”(被引用次数)并 链接到相应的论文,从而揭示该研究中最有价值 的资料。 • 检索时可以选择一次检索全部年份、特定年份或 最近一期的资料。
SCI是Science Citation Index(科学引文 索引)的简称,是科学、医学、农业、工程 技术诸领域跨学科的国际性索引。
第9章 文献计量学方法
第9 章文献计量学方法9.1 文献计量学方法概述9.1.1文献计量学的产生与发展文献计量学是采用数学、统计学方法定量研究文献信息的分布和变化规律的一门学科。
文献计量研究是以文献为基础的定量分析研究,始于20世纪初。
9.1.2文献计量学的研究对象与特点1.文献计量学的研究对象1)文献体系2)文献计量特征2.文献计量学的特点1)有独到的研究方法和特定的统计规律2)围绕几个核心定律展开文献计量研究3)研究结果的定量输出4)理论与方法形成的周期很长9.1.3文献计量学的发展趋势1)定量化深度和广度发展2)知识体系化方向发展3)应用领域拓宽,重视在科技管理和决策中的应用4)向信息计量发展5)文献计量学、科学计量学和信息计量学合流6)研究手段及工具向现代化发展7)网络信息计量学成为其新的分支和发展方向9.2 文献计量学三大定律文字表述为:某一时间段内,撰写x 篇论文的作者数占作者总数的百分比y(x),与其所撰写的论文数x的平方成反比,故洛特卡定律也称为平方反比定律。
实际使用中,只是在一些学科中近似的符合平方反比规律,而在有些学科中,洛特卡定律就不适用。
从信息分析与预测的角度看,洛特卡定律以及由其推出的普赖斯定律,可以帮助我们鉴别学科研究发展的学者分布情况,并从中获得有价值的启示。
如果将一定时期内刊载某学科论文的期这是早期的经典布拉德福曲线,后来,随着研究的深入,格鲁斯(O.V.Groos)在1967年发现布拉德福曲线在进入直线部分(图9-1中PB)以后,并不总是呈现直线延伸状态,而是要发生弯曲,会出现“格鲁斯下垂”。
9.2.3词频统计定律——齐普夫定律1.齐普夫定律的产生2.齐普夫定律的描述N≥5000),统计其9.3 网络计量学方法1、概念●T. C. Almind认为:网络信息计量学包括了所有实用信息计量和其他计量方法对网络通信有关问题的研究。
●网络信息计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术等对网络信息规律进行计量分析的一门科学。
文献计量学第二章
3 文献信息增长机理的分析
3.1 文献信息数量增长的原因 3.2 文献信息增长规律的解释 3.3 文献信息增长规律的应用
25
3.1文献信息数量增长的原因
科研经费和科技人员数量的激增
专业范围的扩大和细分化
学科之间相互渗透
科学技术的国际化
研究的合作化和集体化 研究的周期缩短、产生成果和转化的速度加快 通讯、出版技术的改进和情报工作的加强
(2)动态特性:一定时间内,科学文献
在空间的分布性质。ຫໍສະໝຸດ 3前苏联著名情报学家米哈依洛夫
(А.И.Михайлов)指出:“当前,已发
表文章的增长、老化和离散规律,理所当
然地被视为标志科学文献发展的最根本的
规律。”
1.2 科学知识量与科学文献
1.2.1科学知识量的增长与科学文献增长的关系 (1)关系密切: 同步增长的趋势 增长的规律有很大程度的相似性
普赖斯是一位高产的科学家,他一生共发 表240多件论著,汇集成14本专集。他的论著被 其它文献引用的次数高达2000次以上,其中被引 频次最高的(按出版年)是《巴比伦以来的科学 》(1961)、《小科学,大科学》(1963)和 《科学论文网络》(1965)。他提出的科学本身 以及科学文献的指数增长规律是科学学和文献计 量学的基本规律之一,他提出的“引证网络”概 念 使引证分析成为文献计量学的重要的科学研究方 法。1978年普赖斯与加菲尔德共同主编的国际性
16
(l)线性增长模型的内容
科学文献的线性增长的数学模型是: F(t)=bt+a 式中:F(t)—t年的文献累积数; b—文献的年增长数 a__ 当 t=0时的文献数量
线性增长模型的分析
1963年,普赖斯在《小科学,大科学》一书中指出, 指数规律有可能被破坏,文献的指数增长不可能永远继 续下去。实际上有些知识领域内的文献既不遵循指数曲 线增长模式,也不符合逻辑曲线增长模式,而是呈现出 直线增长模式。正如A. 14.米哈依洛夫指出,在东欧经 互 会成员国范围内有关科学图书、期刊和专利说明书的数 量均是呈直线规律增长的。有关统计表明:1960一1972 年全世界出版的图书和小册子数量也呈直线规律增长。 科学文献线性增长模型不仅适用于描述某些知识领 域或某些类型的文献增长,而且科学文献未来的发展将 更多地倾向于直线模型。正如勒希尔(Rescher)所指 出:我们将从文献指数增长的过去,迎向线性增长的未
第一章 文献计量的理论基础
• 在知识流动过程中,一个节点既可以是知识的供给者, 也可以是知识的接受者。随着时间的推移,各个节点所 拥有的知识水平也在不断地发生变化,在某一时段一个 节点是另一个节点的知识需求者,在下一时段很可能这 个节点就成为另一节点的知识供给者。随着知识流动, 专有知识完成了向公共知识的转化,隐性知识完成了向 显性知识的转化,是一个动态变化的过程。
• 针对科学文献形成的网络,英国情报学家布鲁克斯 (B. C. Brookes)提出了“认知地图”的概念,认为文 献分析应该突破以组织文献为目的,分析文献中的知 识内容或情报,发现人类在创造知识过程中的联系和 规律,并把知识的结构像地图一样展示出来。布鲁克 斯的思想展现了现代科学知识图谱研究的雏形。
• 从知识地图理论视角来看,知识地图揭示了知识网络 的本质和知识的有序性:知识单元是知识有序化的起 点,通过对知识单元的研究,将离散的知识单元按照 一定的结构规律组合、集成和自适应之后,可以发现 和挖掘隐含的、未知的和潜在的有用知识;利用数据 挖掘、知识发现、人工智能等技术实现知识单元的描 述和标引,以及知识节点逻辑关系的揭示;通过揭示 知识单元之间的关系,发现以往没有发现的某些知识 之间的关系,从而产生新的知识,实现知识创新。
• 2002年在《关于知识计量学研究的方法论思考》一文中, 他将知识计量学定义为:“知识计量学是以整个人类知识 体系为对象,运用定量分析和计算技术对社会的知识能力 和知识的社会关系进行综合研究的一门交叉学科,是正在 形成的知识科学中的一门方法性的分支学科。”
• 此后,以知识单元为分析基础的知识计量学,逐渐成为人 们分析知识结构的新视角。
• 从知识场理论视角来看,知识网络是一个知识场网络, 国内学者李喜岷认为,“知识场是建立在知识单元基 础上的更高一个层次的知识体系,是科学发展到一定 阶段的产物”。知识网络中的知识节点在空间中相互 作用构成了知识场,知识单元在场中按照一定规律流 动,各个知识节点的知识势能不断变化,随着势能的 变化知识节点不断运动,在场中通过知识流动完成知 识的继承与创新。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《文献计量学》复习要点(初稿)一、题型1、填空题(共10分,每空1分)2、选择题(共20分,每空2分)(不定项)3、问答题(共50分,每题10分)4、计算题(共20分,每题10分)二、复习要点1、文献计量学、统计目录学各是谁提出来的。
文献计量学起源于英国学者休姆(E .W .Hulme)于1923年提出的统计书目学(statistical bibliography )。
1969年,英国学者普里查德(A .Pritchard)提出用文献计量学命名这个领域的研究,以替代统计书目学。
2、科学文献数量增长的规律是由科学发展的客观过程决定的,而科学发展的实际过程主要受哪两种因素的制约?科学文献数量增长的规律是由科学发展的客观过程决定的,而科学发展的实际过程主要受两种因素的制约:一是科学自身固有的发展规律,二是科学所处的环境条件。
3、半衰期的定义。
比较普赖斯指数和半衰期。
普赖斯指数的计算。
物理学中的半衰期:任何放射性物质都以这样的方式衰变:在相等的时间间隔内它按相同的比率减少。
减少到一半量的时间间隔就是“半衰期”,也是表示这种物质的放射性特性。
文献半衰期:某学科(专业)现时正在被利用的全部文献中的一半的出版年限。
它是衡量文献老化的指标之一。
“普赖斯指数”和“半衰期”是既有联系又有区别的两个衡量科学文献老化的指标。
半衰期是指某一学科或专业领域的文献总和而言的;而普赖斯指数既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者的文章的老化特点。
一般而言,如果某一学科或专业的文献的普赖斯指数越大,则半衰期就越短,说明其老化速度就越快。
“普赖斯指数”:就是在某一个知识领域内,把对年限不超过5年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。
其计算公式为:5P 100%=⨯出版年限不超过年的被引文献数量被引文献总量4、从文献利用的角度来说,科学文献的老化有以下哪几种情形?有五种情形:① 献包含的信息失效。
如被证明是不可靠的、或者是错误的。
②文献包含的知识已经被人们广泛接受而不再被提及③文献被新的文献取代④研究兴趣的下降及研究转移⑤信息不通而不被引用致使老化。
5、文献信息老化的影响因素。
文献的老化要受到许多因素的影响,其机理可从以下5个方面来分析: (1) 文献的增长在文献的动态规律中,增长与老化是一个事物的两个方面,它们从不同的方面来阐述科学知识的修正率,亦即科学的进步,因此文献的老化首先是与文献的增长联系在一起的。
众所周知,科学文献大量增加时,意指科学知识的叠加、完善和更新速率加快,科学出现突破;此时原来知识内容不完善、不全面的旧文献逐渐被人们所遗忘,引用频率迅速降低。
当然旧文献包含的知识不会消亡,但其应用价值则逐渐趋向于零,使之成为“档案性”资料。
相反,若由于某种原因文献增长缓慢,此时文献老化曲线的梯度会趋于平缓。
(2)文献的学科特点文献内容所属学科的性质和特点不同,其老化率差异甚大。
一般来说,基础理论学科的文献半衰期要长,而应用技术学科的文献半衰期相对短一些,其老化也较快;历史悠久的学科的文献要比新兴学科的半衰期长。
比较稳定的学科的文献,要比在内容上或技术上正在经历重大变化的学科的文献半衰期长。
(3)学科的不同发展阶段在学科发展的整个时域中,每个学科均要经历诞生、发展和相对成熟等不同历史阶段。
即使是同一学科不同的发展时期或阶段,文献的半衰期也不尽相同,其老化曲线也并非全部都符合负指数曲线。
当学科处于诞生和发展的初期,由于原始文献较少,文献数量呈指数增长,文献的老化符合负指数函数关系,其对应的老化曲线表现为负指数曲线。
随着学科研究的深入,学科发展进入相对成熟时期后,文献的增长就不能再继续保持原有的指数增长,文献的增长速率变小、其相应的老化曲线也变得平缓,半定期加长。
(4)文献的类型和性质文献的老化速度不仅取决于文献的学科内容,而且还与文献的类型和性质有关。
通常,科学专著要比期刊论文、科技报告、会议文献等的半衰期长,经典论著要比一般论著的半衰期长,理论性刊物要比通讯报道性刊物的半衰期长,论述性文章要比介绍性文章的半衰期长,评论性文献比研究论文的老化要慢一些,等等。
(5)用户需求及情报环境文献用户的需求特点及所处的情报环境的质量也是影响文献老化不可忽视的因素。
例如,不同素质的用户对文献的要求各不相同。
科研工作的骨干对最新文献感兴趣,而刚刚踏上研究工作岗位的人员则还需了解历史背景材料,即使同一类读者在不同时期、为了不同的研究目的,对文献的需求亦有不同的特点,有些文献对研究者无用,但对专业历史工作者来说仍然是有用的。
所以从知识的使用者来说,文献的利用年限因人而异。
不同的国家或地区对文献使用的年限也不完全相同。
科学发达的国家对近期发表的新文献感兴趣,而科学较落后的国家则要借鉴别国已有的经验,因而需要查阅前一段时间的文献。
6、一般来说“老化”问题包括哪两种老化?一般来说:文献的老化问题,从不同的角度有不同的分法①文献载体的老化和文献所包含的知识的老化②静态老化和动态老化静态老化就是不考虑文献增长因素的老化过程,动态老化就是考虑文献增长因素的老化过程。
③局部老化和普遍老化局部老化就是某一图书馆内部文献的老化,普遍老化是指某一学科或者世界范围内的文献的老化。
标准参考答案:文献老化和情报老化7、文献信息逻辑增长规律的局限性表现在哪里?其局限性的原因是什么?在回答文献信息逻辑增长规律的局限性之前,先列出文献信息的逻辑增长规律函数和逻辑增长模型。
kbtF(t)=k/(1+a) (b>0)-,F(t)t k t a b →∞式中——年的文献积累量;——当时的文献积累量;,——参数;k/2Lna/bkt科学文献的逻辑增长曲线由kbtF(t)=k/(1+a) (b>0)-可知,当t 趋于∞时,F(t)→k ,令F(t)=y ,则dyby(k-y)0dt=→。
即科学发展到一定的阶段时,科学文献的增长率趋近于零。
科学文献总量达到了它不可逾越的最大值。
这就意味着某个年代之后,再也没有新的科学文献产生,科学文献作为情报传递的一种手段,将从人类科学交流的领域中隐退。
但是。
科技文献数量增长速度的减缓,并不完全意味着科学发展的速度将会下降,因为除了文献这种反映人类科学认识、科学研究及发展水平的知识载体形式以外,必将陆续出现一些新的、更完善的传播科技情报的方法和手段,使我们有可能用以补充或逐步取代现有传统形式的科技文献。
导致文献信息逻辑增长规律局限性的原因在于:①逻辑增长模型本身的缺陷性②利用逻辑增长曲线预测文献增长的依据是预测学中的趋势外推法,这种方法并不系统,而文献信息增长的规律复杂多变,受到诸多方面因素的影响。
8、普赖斯的两本重要著作是哪两本?普赖斯的文献信息指数增长模型的内容被收集于他的哪本著作中?普赖斯的最得意的两本著作:《巴比伦以来的科学》、《小科学,大科学》。
普赖斯的文献信息指数增长模型的内容被收集于《巴比伦以来的科学》。
9、科学文献的增长的原因。
①科学技术发展和科技成果不断涌现(根本原因)②科研经费和科研人员的递增③专业范围的扩大和细化④学科之间相互渗透⑤科学技术的国际化⑥研究的合作化和集体化⑦研究周期缩短,产生成果和转化的速度加快⑧通信出版技术的改进和情报工作的加强。
10、布拉德福文献集中与离散规律是在其哪篇论文中公开的。
布拉德福定律产生的背景。
在《专门学科的情报源》(sources of information of specific subject )中。
布拉德福德定律产生的背景,按照邱均平的说法有三点:①文献分散是普遍的客观现象②科学统一的原则③统计学的发展促进了文献统计的研究,这是布式定律产生的基础。
11、略12、按照布拉德福论述的文献分散定律,计算三个区各区的期刊数量。
友情提示:在计算各个区的期刊文献数量之前,先把布拉德福德定律的描述弄清楚。
布拉德福德定律描述可以分为区域描述、图像描述、公式描述 (1)区域描述:S .C .布拉德福在《文献工作》一书中写道:“如果将科学期刊按其登载某个学科的论文数量的大小,以渐减顺序排列,那么可以把期刊分为专门面向这个学科的核心区和包含着与核心区同等数量论文的几个区。
这时,核心区与相继各区的期刊数量成1:a :a 2……的关系。
”布氏定律的文字表述结论是建立在将等级排列的期刊进行区域分析的方法之上的。
如果将一定时间内(通常一年)的按某学科载文量等级排列的期刊划分为三个区,使每一个区所包含的相关论文数量相等。
即恰好等于全部期刊发表的该学科文章总数的三分之一,便可发现:第一区(核心区)所涉及的文章来自数量不多但效率最高的n 1种期刊;第二区(相关区)包括数量较大、效率中等的n 2种期刊;第三区(外围区)包括数量最大而效率很低的n 3种期刊。
那么,三个区中的期刊数量成下列关系:2123::1::(1)n n n a a a =>上式经过推广后为:2123::1::(1)n n n a a a =>……(2)图像描述:如果取上述等级排列的期刊数量的对数lg n 为横坐标,相应的论文累计数R(n)为纵坐标。
便可得到一条曲线。
lgnR(n)A经典的布拉德福分散曲线(3)公式描述()(1)()ln ():n ::c :N::K:CB :a n n c R n n K c n N s R n n a AC s n ββ⎧⋅≤≤⎪=⎨⎛⎫<≤ ⎪⎪⎝⎭⎩对应于的相关论文累积数;期刊等级的排列序号;第一等级期刊的相关伦文量;核心期刊的种数;期刊的总数;的斜率;的斜率;参数,直线反向延长与横坐标的交点的值。
()(1)()ln a n n c R n n K c n N s β⎧⋅≤≤⎪=⎨⎛⎫<≤ ⎪⎪⎝⎭⎩也叫做布鲁克斯数学公式。
13、是什么导致布拉德福曲线由直线进入格鲁斯下垂。
随着研究的深入,格鲁斯(O .V .·Groos)在1967年发现布拉德福曲线在进人直线部分(12题图中的CB)以后,并不总是呈现直线延伸状态,而是要发生弯曲下垂,即“格鲁斯下垂”。
导致格鲁斯下垂的原因主要有三个:①运用布拉德福定律是,学科之间必须泾渭分明,但是现代的学科交叉重复,显然做不到这一点。
②分析工具本身存在一定的缺陷。
在应用布式定律时,一般要借助目录、文摘、索引等。
而编辑这些工具的人员却“选择性”地加工。
导致有部分文献被遗漏了。
③统计数据时,受到各种各样的干扰。
比如论文重复发表、期刊更名等。
14、利用布鲁克斯的数学公式测定检索工具的完整性;计算如何把有限的资金合理的分配在文献采购上,即订购某学科领域多少种期刊可满足要求。
()(1)()ln a n n c R n n K c n N s β⎧⋅≤≤⎪=⎨⎛⎫<≤ ⎪⎪⎝⎭⎩将期刊按照布拉德福排列,考察等级排列最前的n 种期刊,设其所刊载的论文数与全部期刊载文量之比为f ,则有下式:N ln N ln n N f s s ⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭ ()c n N <<即fn N s s ⎛⎫= ⎪⎝⎭ f N n s s ⎛⎫= ⎪⎝⎭这样,对于等级排列分布中的N ,s 已知,对于确定的f ,可以由上式来检验检索工具的完整性。