文献计量学分解
《文献计量学方法》PPT课件(2024版)
1
4.1文献计量学概述 文献计量学的发展历史 文献计量学的特点
4.2文献计量学方法 文献计量学方法的基础 引文分析方法 文献计量学方法的类型 文献计量学方法的特点 文献计量学方法的应用
4.3网络计量学
2
4.1文献计量学概述
文献计量学的发展历史
Bibliometrics, Scientometrics, Informetrics
24
引文分析方法概述 引文分析方法的概念 引文分析方法就是利用各种数学及统计学的 方法进行比较、归纳、抽象、概括等的逻辑方法, 对科学期刊、论文、著者等分析对象的引用和被 引用现象进行分析,以揭示其数量特征和内在规 律的一种信息计量研究方法。
25
引文分析方法的理论基础 文献的相互引用是由科学发展的规律和科学
Y
1
(
a ex
b e2x
)
a,b 为系数,a+b=1
Y为一定时期内,总的引文比率(Y<1);
x为时间(以10年计)。
14
文献作者分布理论——洛特卡定律
洛特卡定律的基础———科学生产率概念 “科学生产率” (Scientific Productivity) 是指
科学家(科研人员)在科学上所表现出的能力和工作效 率,通常用其生产的科学文献的数量来衡量。
科学活动的评价指标、科技 管理决策与科技政策等
信息的定义与测度及 信息检索性能测度量 的类型与特征等
内
容
同
语言、词和词组的频率统计,作者特征,出版源特征,引文分析,文献 失效或老化
4
文献计量学 文献计量学是以文献体系和文献相关媒介为研
究对象,采用数学、统计学等的计量方法,研究文献 信息的分布、结构、数量关系、规律,并进而探讨科 学技术的某些结构、特征和规律的一门学科。简言之, 就是应用数学、统计学等方法对文献情报进行定量分 析研究的科学。
文献计量学方法
内容分析法局限—— • 文献需具备两个条件:形式化原则,即能从文献 中抽出便于可靠统计的、具有语义特征的分析单 元。 统计原则,即要有一定数量的文献。 • 方法的背景是归纳法。即不可能超越和脱离所分 析的文献。不是一种发挥想象的开放式方法。 • 方法实施的工作量大,投入时间较长。特别是长 期跟踪或大范围扫描的内容分析工作,对人力和 时间的要求更加突出,需要计算机辅助分析。
分析样本——凡10万人口以上的城市的所有的州政府的 地方报纸均作为分析的对象,并考虑报纸质量和代表性。 约6000种地方报纸。 分析的框架——一级共10个,即教育、就业、环境、政 府和政策、健康、住房、人际关系和经济联系、法律和 正义、交通、福利和贫困。这些一级主题再分解为二级、 三级和四级主题。每一个一级主题大致分为8~16个小主 题,总共有117个小主题。 分析单元——以单篇报道作为分析单元,按主题框架对 每篇报道归类编码,建立可多种途径检索的全文数据库。 篇幅分析——利用所建的数据库可以实现多方面的内容 分析,如某一议题的篇幅变动分析,某一时期内各类主 题的比例结构等,从而完成系统化的定量和定性分析。
分 析 方 法
内容分析的 类 型
指定分析:统计分析指定的人、 事、物出现的频次。 归因分析:统计分析相关特征 贾尼斯(美国内容分析专家)划分法 的频次。如分析某人物时统计 实用内容分析——对某些主题词或特定的词汇进行统计分 其不诚实信息出现的次数。 断言分析:统计对某人、事、 析,并赋予不同的权重(如对不同的字体、版面位置、排 物作出反应的有关信息次数, 名顺序等),推断其出现的原因和可能的后果。对报纸、 以分析特定的主题(如对某项 新闻进行内容分析时,常属该类型。 政策的反应)。 语义内容分析——针对文字的语义内容,对特定词汇作统
文献计量学
F(t)
科学文献的指数增长曲线
t
F(t)=aebt (a>0,b>0) a: 统计初始时刻的文献量 b: 持续增长率 评价文献增长速度的定量标准:文献量增加 一倍所需的时间(倍增期) 不同学科的文献增长速度是不同的 化学化工: 8-9年 原子能与环境科学:2-3年
从统计实例来看,科学文献指数增长率正确 反映了文献的实际增长情况. 1952-1982 世界图书,倍增率20年 1907-1977 世界化学,倍增率10年
情报计量学(informetrics) 1979年,德国,otto nacke
图书馆学
文献计量学
科学学
科学计量学
情报计量学
情报科学
目前发展的趋势
从文献计量向情报计量发展
-- 情报学定量化研究: 文献计量学及其应用 (46.4%);情报检 索; 情报学理论研究;情报经济学与情报成果评价.
-- 计量单元:册\本为单位的文献单元->内部知识单元
3. 布鲁克斯对图形法的发展
anB R(n) = {
k ln n / s
(1<n<C) (C<n<N)
参数讨论:
1)当期刊总数N充分大时,N = K ,N 等于 图形直线部分的斜率。
2)S为重要参数,标度学科专业范围大小的 指标。
3)其他参数 A = R(1) ,表示等级为1的期刊的载文量
C 为核心期刊数 B 为参数,等于曲线部分的曲线 K 为参数,等于直线部分的斜率
2.模拟老化过程的数学模型
1)负指数模型 布鲁克斯的基本假设:科技文献的被引用数 量随时间推移的衰减过程近似服从负指数模 型,当文献达到被引用峰值后,便开始经历 文献老化的衰减过程,于是就可以得到拟合 度很高的负指数曲线
文献计量学方法
03
文献计量学在科学研究中 的应用
学科发展评估
学科发展趋势分析
通过分析特定学科领域内的文献 发表情况、引用频次、关键词等 数据,评估学科的发展趋势和未 来发展方向。
学科交叉融合研究
利用文献计量学方法分析不同学 科领域之间的交叉融合情况,揭 示学科交叉对创新发展的影响。
学科结构优化建议
基于文献计量学分析结果,为学 科结构的优化提供建议,促进学 科的均衡发展。
总结词
通过共词网络分析,探究某领域内关键词之 间的关联和结构。
详细描述
利用文献计量学方法,对某领域的大量文献 进行关键词提取和共词分析,构建共词网络 ,探究关键词之间的关联和结构,从而揭示
该领域的研究重点和主题分布。
案例三:某期刊的质量评价与影响因子预测
总结词
通过文献计量学方法,评价某期刊的质量和预测其影响 因子。
共词分析法
总结词
通过分析同一篇文献中词汇或短语共同 出现的情况,揭示学科领域内主题间的 关系。
VS
详细描述
共词分析法是文献计量学中的一种重要方 法,通过分析同一篇文献中词汇或短语共 同出现的情况,可以揭示学科领域内主题 间的关系。这种方法可以帮助研究人员了 解学科领域内的主题分布、主题交叉和主 题演化,进而为学科领域的知识组织和知 识服务提供支持。
学术期刊评价
期刊质量评估
通过分析期刊发表的论文质量、影响因子、被引频次 等指标,对学术期刊的质量进行评估。
期刊影响力排名
根据学术期刊的质量、学术影响力和学术声誉等指标, 对学术期刊进行排名,为学术交流提供参考。
期刊发展建议
基于文献计量学分析结果,为学术期刊的发展提供建 议,促进期刊质量的提升和学术交流的繁荣。
文献计量学方法图文
文献计量学在科学评价中的应用方式
文献计量指标
通过文献的被引频次、下载量、影响因子等 指标来衡量其学术价值。
学术期刊评价
利用文献计量学方法评估学术期刊的学术水 平和质量。
学科领域发展态势分析
通过文献计量学方法分析学科领域的研究热 点和发展趋势。
科研机构和学者评价
通过文献计量学方法对科研机构和学者的研 究成果进行评价。
文献计量学在科学评价中的作用
科学评价的基本原则
01
客观性原则
科学评价应以客观事实为基础,避 免主观臆断和偏见。
准确性原则
科学评价应准确反映研究对象的实 际情况,避免误导和错误。
03
02
全面性原则
科学评价应全面考虑研究对象的各 个方面,避免片面和偏颇。
可重复性原则
科学评价应具备可重复性,以便他 人验证和进一步研究。
跨文化比较研究
随着全球化的加速,跨文化比较研究成为文献计 量学的重要发展方向,有助于深入了解不同文化 背景下的学术发展状况和趋势。
文献计量学的未来展望
深化理论体系
未来文献计量学需要进一步深化和完善自身的理论体系, 明确核心概念、原理和方法,提高学科的严谨性和科学性 。
强化方法创新
随着研究问题的复杂化,文献计量学需要不断强化方法创 新,吸收借鉴其他学科的方法和技术,提高分析的准确性 和可靠性。
。
词频分析法
总结词
通过分析文献中词汇的现频率,揭示 学科领域的研究重点和发展趋势。
VS
详细描述
词频分析法是一种通过统计文献中词汇的 出现频率,来揭示学科领域的研究重点和 发展趋势的方法。这种方法可以帮助研究 者快速了解某一学科领域的热点话题和变 化趋势。
文献计量学-详解
文献计量学-详解目录• 1 什么是文献计量学• 2 文献计量学的分析数据• 3 文献计量学的应用分析• 4 我国文献计量学o 4.1 发展历程o 4.2 存在的问题及解决对策• 5 文献计量学的局限性什么是文献计量学文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。
文献计量学的分析数据文献计量学的分析数据指标取自各种不同的数据源,在机读文献数据库出现之前,对科学文献的定量分析都是以印刷型出版物为分析对象的。
随着各类型电子版出版物的不断涌现,获取分析数据的方法与途径也在不断扩展。
目前,获取分析数据的主要途径有:① 使用机构内部的文件,如:研究报告、年度报告等;② 如果所需信息不包括在书目数据库中,要通过查找原始文献;③ 大规模的分析需要利用商用文献数据库来获取;④ 利用专门为指标统计而提供数据的数据库来获取数据;⑤ 选择与国际上某机构签订协议来获取这方面的服务。
另外,还可以通过一些机构获取有关文献计量学方面的统计分析指标,如:美国费城的ISI和新泽西州的CHI研究公司、荷兰莱顿大学的科学技术研究中心(CWTS)、匈牙利科学院图书馆,以及中国科学院文献情报中心等。
这些机构都设有专门部门,从事与文献计量学有关的开放指标数据源的创新性研究,收集、加工和整理基于文献统计分析的各种指标。
由于各单位统计的指标使用不同的统计方法和不同的来源数据,相互之间可比性较差,所以使用从不同单位获得的数据进行文献计量学研究时,要全面了解具体指标产生的方法和依据,客观衡量和评价每一项分析研究成果。
文献计量学的应用分析作为一个科技评估的工具,文献计量学的测度体系提供了科技成果的各种定量和定性指标。
虽然,这些成果只涵盖了已发表的科学成果,但它们适用于不同的科研层次,小到科学家个人,大到一个学科、机构、地区,甚至国家。
文献计量学方法ppt课件
3.1.1 方法的概念
方法(Method)是人类认识世界、适应世界和改造世 界的思路、途径、方式和程序。方法包含的要素包括四 个方面: ①目的性:为了达到什么样的研究目的。 ②工具:如利用问卷、统计软件实现问题的解决。 ③对象:针对的受众群体使用不同的研究方法。 ④合乎规律性的活动:学生的就业会与家庭、学校、学
3.2.2 系统分析的方法
系统分析方法是对整个信息分析过程起支配、指导作用 的方法,尤其分析复杂的对象或系统时,系统分析的方法贡 献更大。在信息分析中课题目标的选择、目标的分解、研究 框架的建构、结论的综合等环节尤其离不开系统分析方法。 信息分析运用的一些具体方法。
如ERP项目实施方法
3.2.3 图书情报学的方法
整合, 以便将所研究的问题概念化) 4. Hypothesizing - 建立假定(根据推断众多变量之间的理论
联系, 一些可测试的假定或有价值的猜想就可能产生) 5. Further scientific data collection
进一步的科学数据收集 6. Data analysis - 数据分析 7. Deduction - 演绎推理
3.3.3 信息分析方法的体系结构
王秀梅根据方法论的三个层次,也提出了信息分析方法 的体系结构
其中处于最高层的是 由马克思主义的唯物 辩证法、认识论、科 学哲学等组成的哲学 基础;处于中层的是 由定性、定量、定性 和定量相结合的方法 组成的一般科学方法; 处于体系最底层的是 一些具体方法。
3.3.3 信息分析方法的体系结构
3.2.5 统计学的方法
信息分析中进行多因素之间关系的定量研究,主要依 赖统计学的方法。
相关分析、回归分析、聚类分析、确立模型等具体的 专门方法,大多来源于统计学,主要是数理统计学。信息 分析的定量化趋势和数学的运用,相当大的程度上是指统 计方法的应用,因此,统计学方法是信息分析定量研究的 基础和最重要的方法来源。
文献计量学综述
文献计量学综述一、起源及发展早在20世纪初,人们已经开始对文献进行定量化研究,但是当时文献计量学并没有作为一门独立的学科而存在。
直到1969年,英国着名情报学家阿伦.普理查德首次提出术语“Bibliometrics”,这一术语的出现标志着文献计量学的正式诞生。
三阶段:萌芽、发展和分化萌芽(1917-1933)这一时期文献研究人员首创文献统计方法,并在一些学科领域解剖学和化学专业进行了文献计量分析的大胆尝试,取得了一定的成果。
这些研究都为文献计量学的诞生与后期的发展奠定了基础发展(1934- 1960)年注重理论研究与规律发现,着名的文献计量学的三大基本定律中的布拉德福定律以及齐普夫定律就是在这一时期发现的到成熟与分化阶段全面发展与分化时期(1960年至今) 这一时期文献计量学已由狭隘的理论研究发展到了广阔的应用研究和指标的研究,同时涉及的领域和主题也越来越多。
迁移衍生:专利计量学文献计量学网络计量学政策计量学二、概念界定文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,研究文献信息的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。
可以定量地揭示某一学术领域的发展历程、研究重点以及未来的研究方向。
目前,文献计量分析已被看作总结历史研究成果、揭示未来研究趋势的一种重要工具。
学科交叉使得文献计量研究内容体系日益丰富。
数学中的图论、社会学中的社会网络分析、物理学中的复杂网络等理论与方法均被移植到文献计量学的研究体系中。
三、三大定律布拉德福定律该定律描述文献分布规律,利用刊载某专业论文的数量来确定该专业的核心期刊,应用于指导文献情报工作和科学评价。
齐普夫定律该定律用以统计文献中的词频,通过文献的词频分析可确定学科或行业的研究热点和研究趋势。
洛特卡定律该定律描述着者人数与所着论文之间的关系。
探讨了科学论文着者分布平衡的规律,在宏观的科学着作活动中,少数作者写出了大量文章,大多数人的着作还是很少的。
文献计量简介
文献计量学的发展
成果
9
3.拓宽研究领域并取得进展。 我国文献计量学研究的选题范围在持续增大,不 仅涉及到理论、方法的研究,还涉及到应用研究、 国外研究评价等等。尤其是在应用范围的领域中, 得到了不断的拓宽,已经涉及多个学科领域。
文献计量学的发展
成果
10
4.文献工具与现代化方式取得进展。 文献计量学具有突出的定量性计量和实用性,需要 建立在一定规模的资料支持的基础之上。所以,就 一定要具备一个系统化、规范化的资料来源工具。 美国的SCI 为文献计量学研究提供了有力工具,是 文献计量学的里程碑。我国同样,建立了“中国科 技论文与引文数据库”、“中国社会科学引文索引” 等都为我国文献计量学提高了现代化工具,很大程 度的推进了我国文献计量学的发展。
文献计量学的应用
3.在科学评价中的应用 文献是科研活动的存在形式,是科研成果的固化, 它贯穿于整个科研过程,文献的数量和质量也是对 科研水平和能力的反映和体现。因此,利用文献计 量学理论和方法,对科学研究进行定量评价是一种 新的途径和有效方法。文献计量学对科学的评价主 要包括学科评价、 期刊评价、 学术团体及个人评 价、 机构评价等几个方面。
LOGO
18
文献计量学方法
引文分析法的主要内容
4.引文类型分析:
科学研究中引用的文献很广,有期刊论文、图书和 特种文献(专利说明书、科技报告、会议文献、 技术标准、学位论文等)一般来说,在被引文献 中,期刊论文所占比例最大;其次是图书。对被 引文献的类型进行分析,将有利于确定文献情报 搜集的重点。
19
文献计量学方法
Contents
文献计量学概述
主要 内容
5
文献计量学的发展
文献计量学方法
医院档案管理文献计量学分析
论文增长 呈直线型增长模式, 增长速度逐步 S P S S软件对其 年度 数量 、 载文期刊 、 著者 分布情况进行 统计研 学科阶段进行分析:
管理 /制度
《 合 作 经 济 与 科 技 》
N o . 9 x 2 0 1 5
医院档 案 管理 文献 计量 学分析
口文 / 董 雪艳 王 景文 杨金 明 3
( 1 . 唐 山市人 民医院; 2 . 华北理工大学 图书馆 ; 3 . 唐 山市档案局 河北 ・ 唐 山)
[ 提要] 本文 以 中国生物 医学文献数据 库》 为数据 源 , 检 变量 与因变量之间的相 关关系 , 统计 时域 内, 我国医院档案管理 索2 0 0 5~2 0 1 4年 1 0 年 间我 国医院档案管理研 究论 文 , 对论 文 研究论文 的分布为一条拟合度很好 的直线 。( 表1 、 图1 ) 的增长规律 、 核 心期刊分布、 核心作者分布及其研究方向等进行 表 1 论文的年度分布 文 献计 量学分析 , 以便 为我 国医院档案管理研究与 实践提供 参 年度 2 0 o 5 2 O 0 6 2 0 o 7 2 0 0 8 2 O 0 9 2 0 1 0 2 0 1 l 2 0 1 2 2 0 1 3 2 0 1 4 考信息 。 年发文 4 5 7 2 8 8 1 3 0 1 6 4 1 7 8 1 8 9 2 3 8 2 4 4 2 7 8 关键词 : 档 案管理 ; 文献增长规律 ; 核心期刊 ; 核 心作者
逐年累
本文 为 2 0 1 5年度河 北省档 案科技项 目计划 : “ 档 案转 化为 积量 4 5 l 1 7 2 0 5 3 3 5 4 9 9 6 7 7 8 6 6 1 1 0 4 1 3 4 8 1 6 2 6 医院文 化的方法和途径探析 ” ( 项 目编号 : 2 0 1 5 - R - 0 7 ) 成果之一
文献计量学(Bibliometrics)(共3页)
文献(wénxiàn)计量学(Bibliometrics)文献计量学是以文献体系和文献计量特征为研究(yánjiū)对象,采用数学、统计学等计量方法,研究文献情报的分布结构、数量关系、变化规律和定量(dìngliàng)管理,并进而探讨科学技术的某些结构、特征和规律的一门学科[5-12]。
这一术语(shùyǔ)最早是1969年由英国人A.普里查德(Alan Britchard)提出的。
文献(wénxiàn)计量学中常用的定律有如下几种。
布拉德福定律:布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
文字表述为:如果将科技期刊按其刊载某专业论文的数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个区域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2……的关系。
洛特卡定律:洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写3篇论文的作者数量约为写1篇论文作者数量的1/9;写n篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
齐普夫定律:齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。
若用f表示频次,r表示等级序号,则有fr=C(C为常数)。
人们称该式为齐普夫定律。
文献计量学方法
2. 文献计量学方法的基本原理及其应用
文献计量学方法包含一系列描述文献信息 流动态特征的经验定律和规律。这些经验定律 和规律源于实践,又反过来对实践产生指导作 用。
2. 文献计量学方法的基本原理及其应用
① ② ③
④
布拉德福定律及其应用 洛特卡定律及其应用 齐普夫定律及其应用 引文分析及其应用
2. 文献计量学方法的基本原理及其应用
1. 概述
图书馆学
文献计量学
科学计量学
情报计量学
科学学
情报学
1. 概述
发展趋势:
从文献计量向信息计量发展 文献计量学、科学计量学、信息计量学的合流趋势 计算机辅助的计量研究和应用
大量\规范数据源 数据处理和分析工具
重视文献计量学在科技管理和决策中的应用 网络信息计量学研究 网络信息计量学是采用数学、统计学等各种定量方法, 对网 络信息的组织、存贮、分布、传递、相互引证和开发利用等 进行定量描述和统计分析,以便揭示网络信息数量特征和内 在规律的一门新兴分支学科。
2. 文献计量学方法的基本原理及其应用①Βιβλιοθήκη 布拉德福定律及其应用
布拉德福定律在信息分析与预测中的应用主要体现在文献 信息的搜集环节上。 布拉德福定律也可用于研究某一学科发展的特点以及学科 之间的交叉影响和相互渗透关系,并以此确定某些新学科 的生长点。
例如,对某一学科主题而言,布拉德福定律中的第一区(核心 区)往往由该学科内比较成熟的方向的期刊构成;第二区往往 由该学科内不太成熟的方向以及与该学科关系最紧密的其他学 科的期刊构成;第三区以及后继各区的期刊构成与第二区类似, 但在成熟性以及与该学科的关系上依次减弱。分析这种变化, 可以帮助我们推测该学科的哪些方向发展得比较成熟、哪些不 太成熟,以及哪些学科与该学科有交叉影响和相互渗透关系。
文献计量学
三大定律
如果将科技期刊按其刊载某学科 专业论文的数量多少,以递减顺 序排列,那么可以把期刊分为专 门面对这个学科的核心区、相关 区和非相关区。各个区的文章数 量相等,此时核心区、相关区, 非相关区期刊数量成的关系
它描述的是科学工作者人数与其 所著论文之间的关系:写两篇论 文的作者数量约为写一篇论文的 作者数量的1/4;写三篇论文的作 者数量约为写一篇论文作者数量 的1/9;写N篇论文的作者数量约 为写一篇论文作者数量的1n2 , ……,而写一篇论文作者的数量 约占所有作者数量的60%。
国内引文分析的检索工具
引文网络与聚类分析
• 文献耦合 • 1963,麻省理工学院,kessier,同时引用一篇论文的论文之间称
作耦合 • 耦合强度的测度:共有的参考文献篇数 • 文献同引 • 1973年,两篇论文同时被后来的文献所引用 • 文献耦合与文献同引的比较
网络计量学(webometrics)
• 文献计量学(biliometrics) • 1969年,美国目录学家,alan pritchard:将数学和统计学的方法
运用于图书及其他介质的研究的一门学科
• 科学计量学(scientometrics) • 1968年,前苏联学者提出,环宇科学技术进步的计量研究 • 情报计量学(informetrics) • 1979年,德国,Otto nacke
目前的发展趋势
• 从文献计量向情报计量发展 • 情报学定量化研究;文献计量学及其应用;情报检索;情报学
理论研究;情报经济学与情报成果评价‘ • 计算机辅助的计量研究和应用 • 大量规范的数据源 • 处理数据和分析工具 • 网络信息计量学研究
核心与应用
• 文献计量学是以几个经验统计规律为核心的。例如:表征出科技 文献作者分布的洛特卡定律(1926);表征文献中词频分布的齐夫 定律(1948);确定某一学科论文在期刊中分布的布拉德福定律 (1934)等。文献计量学一直围绕这几个定律,沿着两个方向发展: 其一是验证与完善这些经验定律;其二是扩大与推广这些经验定 律的实际应用。目前,文献计量学应用十分广泛。微观的应用有 确定核心文献,评价出版物,考察文献利用率,实现图书情报部 门的科学管理。宏观的应用有设计更经济的情报系统和网络,提 高情报处理效率,寻找文献服务中的弊端与缺陷,预测出版方向, 发展并完善情报基础理论等。
第六章文献计量学
6.1 文献计量学概述
2. 文献计量研究工具现代化。随着计算机的普及,
研究者开始利用计算机进行文献计量工作。通过建 立系统化、规范化的数据来源体系和原始数据的获 取渠道,利用计算机等现代方法和手段进行数据处 理和分析研究。
6.1 文献计量学概述
3.网络计量学产生并且有了一定的发展。信息资源 网络化的发展为网络计量学的产生提供了基础条 件和研究对象。1997年T.C.Almind提出了 Webometrics。其后又有一个具有相似含义的术语 Cybermetrics出现。有研究者将这两个术语译为 网络信息计量学,并且给出定义:网络信息计量 学是采用数学、统计学等各种定量方法,对网上 信息的组织、存贮、分布、传递,相互引证和开 发利用等进行定量描述和统计分析,以便揭示网 络信息数量特征和内在规律的一门新兴分支学
6.2 文献计量学方法
一些学者发现洛特卡定律有一定的局 限性。第一,因为它是根据化学和物理学 两大学科得出的结论,在其他学科的应用 时就需要作一定的修正。其次,洛特卡的 数据抽取方法有欠科学,只有在数据量大 (时间跨度大、著者数量多)的情况下, 预测结果才会比较客观。
6.2 文献计量学方法
(3)洛特卡定律的应用 在情报学图书馆学方面的应用。一般是用它来预测发表 不同数目文章的著者数量和特定学科的文献数量。这样, 便于掌握文献的增长趋势,便于进行文献情报的科学管理 以及情报学的理论研究等。 在预测科学方面的应用。按照洛特卡定律,可以从统计 或估算的科学著者数量来预测文献数目的增长速度和文献 流的动向,便于掌握文献的交流规律;同时,从文献计量 的角度出发,也可预测科学家数量的增长和科学发展的规 模及趋势等。 在科学学和人才学方面的应用。可以用它来研究科学家 的活动规律,研究人才的著述特征,便于科学学的理论研 究和科学史的探讨,从而为整个科学学和人才学的研究提 供新的途径和手段。
文献计量学分析
文献计量学用数学和统计学的方法,定量地分析一切知识载体的交叉科学。
它是集数学、统计学、文献学为一体,注重量化的综合性知识体系。
其计量对象主要是:文献量(各种出版物,尤以期刊论文和引文居多)、作者数(个人集体或团体)、词汇数(各种文献标识,其中以叙词居多)文献计量学最本质的特征在于其输出务必是“量”。
文献计量学是以几个经验统计规律为核心的。
例如:表征出科技文献作者分布的洛特卡定律(1926);表征文献中词频分布的齐普夫定律(1948);确定某一学科论文在期刊中分布的布拉德福定律(1934)等。
文献计量学一直围绕这几个定律,沿着两个方向发展:其一是验证与完善这些经验定律;其二是扩大与推广这些经验定律的实际应用。
洛特卡定律:洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。
它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写3篇论文的作者数量约为写1篇论文作者数量的1/9;写n篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。
该定律被认为是第一次揭示了作者与数量之间的关系。
f x=∁/x2=0.6079/x2x为科学工作者发表的论文数量;f x为发表x篇论文的著者出现的频率;C 为常数。
齐普夫定律:齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。
它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D。
若用f表示频次,r表示等级序号,则有f*r=C(C为常数)。
人们称该式为齐普夫定律。
布拉德福定律:布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。
文献计量学-第一章
3.文献计量学统计分析的对象
❖ (1)根据计量数据的类型,文献计量学的 研究对象可大致有以下四大类: ① .出版物 ② .著者指标 ③ .服务指标 ④ .词语指标
❖ ① .出版物 各个学科和技术领域所发表和被引用的各类文献是文 献计量学的主要对象。上述文献载有大量可资分析的 信息,是数理统计施展其威力的绝好用武之地。在进 行这类研究时,应充分利用它们的控制工具,如各类 检索工具:文摘、索引、年鉴、手册、百科全书、指 南等,例如,美国科学情报社出版的《科学引文索引》 (SCI)就是当今进行引文分析不可缺少的工具。
❖ 文献计量学向情报(信息)计量学发展: 文献计量学术语提出的同年,苏联学者纳利莫夫 和穆利钦提出了“科学计量学”—“用以研究科 学发展过程的各种定量方法的总和”即应用定量 方法研究科学学的一门学科。 情报(信息)计量学最早是1980年由德国学者昂 托 • 纳 克 教 授 ( Otto Nacke ) 提 出 。 ( 德 文 : Informetrie,英文:Informetrics)
①引文分析的重大进展。 加菲尔德领导下建立的一系列引文数据库(SCI、 SSCI、A&HCI),并为引文分析的理论建设做出 了突出贡献。
计算机在引文的研究中取得了重要成果。
②已有经验公式的验证与完善。 对三大基本公式及其它公式进行了反复验证和讨 论,使已有的经验公式逐步得到完善。
3. 文献计量学的发展时期(1960年代--)(续)
3. 文献计量学的发展时期(1960年代--)(续)
1997年T.C.lmind和Ingwersen首次提出网络环境 下引文分析的概念和“网络计量学” (Webometrics)和另一名词“赛博计量学” (Cybermetrics)。
这是将信息计量方法使用在Web分析上,对诸如 语言、单词、词汇、频次、作者特征、作者合作 的能力和程度,以及对作者的引文分析,学科或 数据库增长的测量,新概念、新定义的增长、信 息的测量,检索措施的形式与特征进行了研究。
文献计量学分析
文献计量学分析
文献计量学分析是在学术领域中一种被广泛使用的数据分析方法,它不但能够提供有关某个学术领域的相关信息,还能有助于评估研究
人员的研究贡献。
它主要通过使用图书馆的学术文献数据库来索引、
分析和绘制情况,以表征特定学科领域的影响力。
文献计量学分析主要使用统计学方法及数字化技术来研究和评估
学术文献的影响力和关联性,可以帮助教育者和研究者了解某个特定
领域的情况,并发现有用的信息,以便做出最佳决策。
可以使用文献
计量学分析来获取最新信息,确定学科特定的引文模式以及研究机构
和作者的研究关系,从而改进研究生产力并提升研究成果。
文献计量学分析可以用来评估个人在学术领域的影响力,可以追
踪引文及其引用者,同时也可以确定哪些文献受到最多关注。
由于它
的可靠性和准确性,文献计量学分析正成为越来越多的学者和研究机
构所使用的研究分析工具。
此外,文献计量学分析也可以用来评估学
术期刊和出版社的有效性,以帮助决策者选择最合适的文献资源供读
者使用。
文献计量简介PPT课件
学科热点研究
通过文献计量分析,挖掘 学科领域的研究热点和前 沿,为科研人员提供研究 方向。
学科知识图谱构建
利用文献计量数据,构建 学科知识图谱,展示学科 领域的知识结构和关系。
科研评价与决策支持
科研项目立项评估
通过文献计量分析,评估科研项 目的创新性、可行性和价值,为
项目立项提供决策支持。
科研成果转化评估
会议论文集收录了各领 专利文献是技术创新和 学
域的最新研究成果和学 知识产权保护的重要载
术动态,对于了解学科 体,通过对专利数据的
领域的前沿和热点具有 分析可以了解技术发展
重要意义。
趋势和市场动态。
05
文献计量学的实际应用
学术评价
01
02
03
学术影响力评估
通过分析文献的被引频次、 下载量等指标,衡量学者、 研究机构和期刊的学术影 响力。
引文分析法是通过分析文献之间的引证关系,揭 示学科领域的知识流动和知识结构。
共词分析法是通过分析同一篇文献中关键词或主 题词的共现关系,揭示学科领域的研究热点和知 识结构。
文献计量学的工具
文献计量学的工具主要包括文献数据库、文献管理软 件、文献分析软件等。这些工具为文献计量学的研究
提供了便利的数据获取和分析手段。
国际化与合作
随着全球化的进程,不同国家和地区的文献计量学研究将有更多的机会进行交流和合作。 这种国际化的合作将有助于推动文献计量学的发展,并促进全球范围内的知识共享。
THANKS
感谢观看
领域和应用场景。
它利用数据挖掘、机器学习和人工智能 现代的文献计量学还涉及到跨学科的研
等技术手段,对海量的文献数据进行深 究领域,如科学交流与合作、学术不端
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6、指导读者利用期刊 以“核心期刊”的概念指导读者利用期刊
17 / 12
洛特卡定律
1926年,洛特卡最先研究了科学文献数 量与著者数量之间的关系,并创造性地提出 了“科学生产率”的概念。所谓“科学生产率” 是指科学家在科学上所表现出来的能力和工 作效率,通常用其生产的科学文献的数量来 衡量。洛特卡就是从“科学生产率”这个概 念出发,通过统计和分析科研人员的论著数 量,首次揭示了科学文献按著者的分布规律。
25 / 12
洛特卡定律的局限性
LOTKA 定律是有局限性的,平方反比率是科学 生产率一般的理论估计,不是一个精确的统计分布, 它是对 CA 中收录的物理、化学两个领域十年间著 者(姓氏以A A 、B B 开头)抽样研究结果的推广。 后来的学者沿着这个思路进行的研究,有些数据符 合这个规律,有些则不符合。 总而言之,只有统计时间区间足够长,统计数 据充分才严格符合该定律。
采用了情报学与数学、统计学相结合的研究手段。文献计量学通 过采集和处理数据,深刻、准确地观察和描述各种现象及规律。
布拉德福定律、洛特卡定律和齐普夫定律的建立,为文献计量学 奠定了坚实的基础。
最后,以若干基本定律和规律为基础进行文献分布研究。
4 / 12
发展趋势
21世纪,随着信息科学和信息技术的迅速发展,信息资源 向着电子化、数字化、网络化的方向发展,给人类社会、 政治、经济、科技和文化带来的巨大的影响和深刻的变革。 在新的社会环境和技术条件下,文献计量学的发展呈现新 的趋势。具体表现为:
。
信息资源网络化的发展为网络计量学的产生提供了基础 条件和研究对象。
定义:网络信息计量学是采用数学、统计学等各种定量 方法,对网上信息的组织、存贮、分布、传递、相互引证和 开发利用等进行定量描述和统计分析,以便指示网络信息数 量特征和内在规律的一门新兴分支学科。
6 / 12
三大定律
布拉德福定律
洛特卡定律
n1:n2:…:nm=1:a:…:a^m-1
13 / 12
英国情报学家布鲁克斯首次用数学公式描述了布拉 德福的经验定律,发展了图像描述方法,从而完成 了布氏定律的这一重要的后续工作,并创造性地提 出用两个部分组成的数学表达式来描述布拉德福定 律,分别表示图像的曲线部分和直线部分:
14 / 12
总结:发展过程
26 / 12
洛特卡定律的应用
1、在图书馆学情报学方面,一般是用它来预测 发表不同数目文章的著者数量和特定学科的文献数 量; 2、在预测科学方面,按照洛特卡定律,可以从 统计或计算科学著者数量来预测文献数量的增长速 度和文献流的动向,便于掌握文献的交流规律,同 时从文献计量学的角度出发,也可以预测科学家数 量的增长和科学发展的规模及趋势等; 3、在科学学和人才学方面,可以用来研究科学 家的活动规律,研究人才的著述特征等。
洛特卡定律的发展
一. 洛特卡定律的验证工作
1926年,洛特卡定律诞生; 1941年,Davis对洛特卡的结果进行验证; 1949年,Zipf在《人类行为和最小努力法则》中 肯定洛特卡定律的同时也指出它的不足之处在于只 是一种近似的计算方法,而不是一种严格意义上的 分布。 后来,众多的学者在不同的领域取得数据进行研 究,对洛特卡定律的验证、完善与发展起到一定的 作用。 (在洛特卡定律的基础上,普莱斯进一步研究了科学家人数
15 / 12
应用
1、指导期刊采购工作 确定“核心期刊”,为期刊选订提供依据 2、考察专著的分布 分析各个出版社关于某一学科或专业的著作出版情 况,确定此学科的“核心出版社”,以指导图书馆的 采购工作 3、动态馆藏的维护 可分析流通期刊的最小核心,以及核心读者所感兴 趣的学科的最小核心,准确的为收藏服务,使馆藏 保持为一种有序状态
特点
文献计量学的概念是不统一的,不同研究者有不同的解释。同一 研究者也在不断修正自己的观点。其具有如下特点:
首先,文献计量学的研究内容主要是文献情报流的机理 探讨。
如论文作者指标、引证文献与被引证文献及二者之间的关系、文 献的利用情况、书目、文献、索引等。
其次,文献计量学的关键是定量,用定量化方法对文献 特征进行分析处理。
27 / 12
齐普夫定律
词汇在科技文献中的使用和出现频率是有一定规律的。 许多学者对词频分布理论进行了探索和研究,其中最为著 名的是齐普夫定律。 齐夫主要是根据汉莱 (M.Hanley) 为朱伊斯(J.Jayee) 的 中篇小说 《 尤利西斯 》( ( 《Ullysses 》) ) 一书所编的 频率词典来进行工作的。该词典文句容量为 260,432 个, 词典中收词 29,899 个。后来,齐普夫还根据其它一些文 句中的词频统计来论证单参数词频分布公式的正确性。 齐夫在做了大量艰苦的统计工作后,将单词以其出现 的频次的多寡进行了等级排队,经过计算,论证了描述词 的频率与等级序号之间关系的定量形式。
18 / 12
产生背景
19世纪末20世纪初,是科学发展史上一个 重要的转折时期。物理学和化学领域取得了 革命性的进展,同时文献领域科研人员和文 献骤增。洛特卡首先注意到这种情况,着手 研究了科研人员与其撰写的论著间的数量关 系。 洛特卡首先引入“科学生产率”的概念来测 量科研人员撰写科学文献的能力。
文献计量学已经不仅仅停留在以篇、册、本为单位 的文献单元的计量上,而开始深入到文献的内部知识单元 和文献的相关信息进行计量研究,如题目、关键词、词频、 知识项、引文信息、著者、出版者、日期、语言、格式等 都已成为计量的对象。
5 / 12
随着计算机的普及,研究者开始利用计算机进行文献计量 工作。通过建立系统化、规范化的数据来源体系和原始数据 的获取渠道,利用计算机等现代化方法和手段进行数据处理 和分析研究。
8 / 12
产生背景
1、文献分散是普遍的客观现象 在科学研究和文献工作中,布拉德福深深感到科学文献的 分散。他发现:一门学科的论文分散在其他学科的期刊杂 志上是屡见不鲜的。 2、科学统一性 科学统一性原则是布拉德福定律产生的思想基础。布拉德 福认为;按照科学统一性原则,科学技术的每一个学科都 或多或少、或远或近地与其他任何一个学科相关联。 3、文献统计研究是布氏定律产生的基础 布拉德福本人在 长期的文献工作中,对科学文献进行大量的统计研究,掌 握了文献分散的特点,发现了其中的某些规律性;并在文 献统计的基础上经过数学推导,得出了与上述理论推导一 致的结论,为布拉德福分散定律的正式确立奠定了基础。
16 / 12
4、检索工具完整性的测定 用来确定某一覆盖面的文摘索引至少要索及多少情 报源 评价某一学科的检索工具的完整性,为这些工具的 选择和利用提供科学依据 5、学科幅度的比较 可确定不同学科核心区和S值
核心区出现的期刊数量可作为两门学科重叠程度的依据 S值可以用来比较学科的领域范围和发展成熟程度
20 / 12
基本内容
从洛特卡定律的产生过程可以看出,该定律的目的 和基本内容是:描述科学工作者人数与其所论著论 文之间的关系。
如果设f(x)为写了x篇论文的作者数占作者总数的 比例,则洛特卡定律可表示为:
C——某特定主题领域的特正常数。
洛特卡统计的指数a约:a=2,即“平方反比率”。
21 / 12
9 / 12
产生和基本内容
1933年,英国科学博物图书馆的布拉德福选择了“应 用地球物理学”和“润滑”专业领域为样本,组织图书馆的工 作人员统计所收集的科技期刊上的相关论文,共统计了4 90种期刊,1727篇论文,并将期刊按照相关论文载文量 的多少减序排列。 然后他采用3种不同的方法,即区域分析、图像观察 和数学推导的方法对文献统计数据进行了分析研究,结果 发现,尽管学科不同,但相关论文在相应的期刊有着同样 的分布规律。 布拉德福于1934年1月在《工程》发表了题为《专门 学科的情报源》一文,首次公开提出了定量描述文献分散 规律的经验定律,即布拉德福定律。
齐普夫定律
7 / 12
布拉德福定律
的含义:信息流的序性结构经验定律,
也叫文献分散定律。 布氏定律, 是英国文献学家布拉德福于1934 年在 《 Engineering 》 杂志上发表的《 Sources of information onspecific subjects 》 上提出的描述文分散规律的经验定律。 在其专著 《 文献工作 》 中,他又一次阐述了文献分散定律。 认为‚“在数量很大的文献体中,文献按某一规律的模型分散…… ”。 科学信息很大程度上是以科技期刊的形式出现的,借助期刊这 个载体得以交流传播,科技期刊对促进科学技术发展起着举足轻重 的作用。 布拉德福定律 (Bradford’ Law of Scattering)就是描述某一学 科论文在相关期刊中的分布规律。它定量的揭示了 ,今天仍然具有不可替代的理论价值和实 际意义。
与科学文献的数量,以及不同能力层次的科学家之间的定量 关系,提出了著名的普莱斯定律和一些其他重要结论)
22 / 12
二.弗拉奇的贡献
对洛特卡定律的验证工作作了一个客观、严谨 的总结; 发现了影响洛特卡分布的两个因素。 (a)研究者本人所处的时代或环境直接影响着研究结 果,即该定律的验证工作具有一定的人为性 (b)论文作者的数量,即统计样本中有关作者的数据 量或统计样本的容量与研究结果有关
10 / 12
区域分析
布拉德福定律的区域分析:如果将科学期刊按其登 载某个学科的论文数量的大小,以减序排序,那么 可以把期刊分为专门面向这个学科的核心区、相关 区、非相关区,3个区的论文数量相等,此时核心区、 相关区、非相关区期刊数量之比为:1∶a∶a² ,a 为 布拉德福常数。 核心区:所发表的论文来自数量不多但是效率最高 的期刊 相关区:数量较多的中等效率的期刊 非相关区:数量众多但效率最低的期刊
19 / 12
基本内容
洛特卡对这些数据的统计结果表包含两部分的内容: 1.与论著数量相对应的作者数量;2.著者频率,即相应的 著者占著者总数的百分比。这两个部分均按论著数量增序 排列。