科学计量学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
C 为核心期刊数 B 为参数,等于曲线部分的曲线
K 为参数,等于直线部分的斜率
三.布拉德福定律的应用
1. 确定核心期刊 2. 制定文献采购策略 3. 评价检索工作 4. 根据流通数据确定采藏策略
第四节
齐普夫词频—等级分布
一.齐普夫与词频分布研究
齐普夫的研究工作
词频分布的概念
词频分布的早期研究 法国艾斯杜和美国康登的工作
第五节
科学知识指数增长规律
一.科学知识指数增长规律
1.科学知识按指数增长的规律 恩格斯指出:科学按加速度发展,即按 指数函数增长规律性发展。 图书文献的增长 科学知识的增长 科学指标的翻番时间
2.普赖斯文献增长公式
N = N0 ebt
半对数坐标系 LnN = bt +LnN0
其中b为文献连续增长率(或称增长系数) 在一般情况下,可近似认为 b= r (年相对增长率) 所以计算时可用年相对增长率代替b。 3.翻番时间计算 d = Ln2 / b = 0.693 / b 可见 b 是很重要的量。
第六节 科学生产率的洛特卡分布
一.科学生产率研究与洛特卡定律
1.科学生产率研究 洛特卡的研究工作 科学生产力—在给定时间内,科学工作者 所发表的论文数量。
2.洛特卡定律 lnfx = -2lnx + lnC fx = C / X2
利用级数可定义C值, C = 0.6079
fx = 0.6079 / X2 C 值的实际意义是f1 的数值,即发表过一篇论文 的作者数所占的比例。 洛特卡定律的文字表述
三. 科学计量研究的发展
1.科学计量研究发展简史
创立时期(19世纪末~20世纪30年代) 19世纪重要科学家:德堪多和高尔顿
代表著作:《二百年科学和科学家的 历史》、《遗传天赋》和《英国科学家》
20世纪主要研究工作:
科尔和伊尔斯的文献统计分析 休姆的文献增长研究和提出统计书目学术语 格罗斯夫妇的引文分析研究 洛特卡的科学生产率研究 布拉德福关于文献分散定律的研究 齐普夫关于词频分布的研究
三. 逻辑斯蒂增长曲线
1.逻辑增长模型 原指生物学中的“生长曲线”,描述生物界一 类典型的繁殖过程,即开始阶段按指数规律 增长得很快,但随着时间的推移,繁殖速度 减慢,并逐渐趋于不增。一般称为饱和的指 数增长曲线。 2.逻辑曲线的机理分析 逻辑模型与指数模型的关系 dN / dt = bN(k – N) 与 dN / dt = bN
普赖斯指出:科学发展的所有明显的指数型 终将成 为逻辑Байду номын сангаас模型。
指数型是逻辑型的发展的初始阶段,而逻辑 型是指数型最终的发展趋势。
逻辑型曲线的局限性是导致科学发展的极限 论,增长率为零。
3.普赖斯—纳里莫夫循环曲线
4.科学知识增长规律总结
四.科学文献增长的一般模型
1.科学文献增长一般模型
将 dN / dt = qN 变易为 dN / dt = q(t)N, 然后两边积分。 2.不同质量科学文献的增长模型 雷舍假设, 雷舍模型
杰出科学家人数与全体科学家总数的比例 R。
三.洛特卡定律的应用与评价
1.洛特卡定律的应用
2.洛特卡定律数据规范化处理
第七节 文献计量学理论模型研究
一.经验双曲分布系与负幂分布
1. 布拉德福现象(布-齐-洛分布系) 2. 布鲁克斯关于信息源( Source )和信息 单元(iterm)的提法。 3. 负幂型分布 P( x )= C / x P
科学计量学提纲
第一章
第一节
一.
科学计量学概述
科学计量学的形成与发展
科学计量学的概念
1. 科学计量学的形成 现代科学技术的发展促进科学本身的发展 现代数学的发展促进各门学科的数学化和计量化 现代科学活动的日益社会化是科学计量学 发展的条件和动力
2. 科学计量学的概念
科学计量学定义和概念的演变和进步 科学计量学定义: 博采各种数量技术,定量地研究科学技术进 步的发展规律和内在机制。
3. 布鲁克斯对图形法的发展
anB
R(n) = { k ln n / s 参数讨论:
(1<n<C)
(C<n<N)
1)当期刊总数N充分大时,N = K ,N 等于 图形直线部分的斜率。 2 ) S为重要参数,标度学科专业范围大小的 指标。
3)其他参数 A = R(1) ,表示等级为1的期刊的载文量
3) 科学计量指标的频次分布
研究频次分布的意义 研究文献统计数据的集中与分散现象,以及科 学工作者集中与分散处理数据的行为。利用 频次-等级或频次-规模方法处理数据,就会表 现出文献的集中与分散现象。 频次—规模分布: f(X)~ X 特例:洛特 卡分布 频次—等级分布: g (r) ~ r 特例:齐普 夫分布,布拉德福分布
二.洛特卡定律的修正与推广
1.洛特卡定律的局限性
统计数据不全 合著者处理过于简单 高产作者的处理
2.洛特卡定律的修正与推广
广义洛特卡定律 fx = C / Xa (1.2 < a < 3.8 )
3.普赖斯定律
完成该专业论文总和一半的高产作者的人数在数 量上应等于该专业作者总数的平方根。 M 值的确定。
3.科学计量研究的局限性
4. 统计数据的经验分布
1) 统计量或统计累积量按时间的分布
统计量~时间分布 N~t 变化速度~时间分布 dn / dt ~ t 通过微积分运算可求出许多重要的累积分布 例如:dn / dt = k => N = kt+N0 线性增长 分布 注意:引文出版年龄的概念
2) 半对数与对数分布
四.文献老化规律的应用
1. 在文献管理中的应用
2. 在科学学和科技史研究中的应用
第三节 布拉德福文献分散定律
一.布拉德福及其文献分散定律
1. 布拉德福与文献工作 2. S.C.布拉德福(1878—1948) 英国 著名的文献学家和化学家 3. 文献杂志——Documentation
4. 布拉德福关于文献分散现象的思考
通过期刊相关论文载文率的高低进行区域 划分,这些区域所含期刊的数目随着载文 率的下降而增多,呈现反比例关系。以此 可以定量测定学科间的联系程度和描述相 关论文在登载其期刊中的数量分布。
5. 布拉德福定律的基本原理
布拉德福定律的基本原理
统计数据的处理,半对数坐标系 区域表示法和图形表示法 n1 : n2 : n3 = 1 : a : a2 n1 : ( n1 + n2 ) : ( n1 + n2 + n3 ) = 1 : A : A2 两种表示法的差异
蒙代尔布罗从信息理论出发,建立 广义齐普夫定律。
4. 齐普夫定律基本原理 定律的文字与图象描述 文字描述:f r r = C 图象描述:直角坐标系下为双曲线 双对数坐标系下为直线 5. 齐普夫定律的局限性 对高频词和低频词的解释存在不足
三.齐普夫定律的理论发展
主要研究方向:关于参数的讨论;关于低频词 分 布的推导,建立齐普夫第二定律。 1. 朱斯修正式 fr . r B = C 2. 蒙代尔布罗修正式 fr (r + m)B = C 参数M主要功能是对高频词的修正。 参数B用以描述低频词。 M = 0 为朱斯修正式,B = 1为齐普夫定律。
3.文献计量学、科学计量学和情报计量学 三个相关术语的定义 三个相关术语的相互联系与区别
二. 科学计量研究的原理和方法
1. 科学计量研究基本原理 科学计量研究的特点 科学计量研究的类型
2.科学计量研究常用方法 出版物数量计量方法 著者数量计量方法 引文分析方法
词频分析方法
内容分析方法 统计分析方法
3. 布什低频词词频定律
确定具有相同词频等级的方法 (1)平均等级法 (2)随机等级法 (3)最大等级法
齐普夫第二定律 尽管文章的单词量各不相同,但是比值 I1/D 却十分接近。布什据此导出齐普夫第二定律, 也称布什低频词词频定律。
四.齐普夫定律的应用
1. 词表编制 2. 利用齐普夫定律,导出被引文献与叙词使 用频率的分布特征,解决词汇控制,词表 规模确定,选词标准等问题。 3. 文献标引控制 齐普夫定律主要应用于统计标引法。 确定有效词的词频值。 从而可通过计算机确定有效词。 4. 情报检索的文献组织 倒排挡中,入挡词出现的频次 Pr =A/r (A 近 似为0.1), 可确定倒排挡大小。
三.老化速度的测度指标
1. 半衰期和中值引文年龄 两种定义的区别 贝尔纳定义适用于历时法 伯顿—开普勒定义适用于同时法(中值引文 年龄) SCI 中的引用半衰期和被引半衰期定义
2. 计算方法 作图法、公式法
3.普赖斯指数
定义的表述 普赖斯指数与中值引文年龄的区别 4. 老化系数
测度文献老化速率的重要参数 其值大则老化慢,其值小则老化快
半对数坐标系:(X, ㏒Y)或(㏒X, Y) 布拉德福分布 对数坐标系:(㏒X, ㏒Y)洛特卡分布 一般说,在对数坐标系中,等量的线性位移 可以表示变量的等比例变化,这时常可使非 线性关系转化为线性关系。 例如: Y = Cax (指数函数) ㏒Y =㏒C + X㏒a => ㏒Y = AX + B Y = BXa (幂函数) ㏒Y = ㏒B + a㏒X => ㏒Y = a㏒X + C
第二节 科技文献的老化规律
一.科技文献的老化现象
1. 科技文献老化的概念 2. 情报老化与文献老化的区别 3. 影响文献老化的因素: 1)文献内容发生变化的 2)文献增长对老化的影响 3)学科性质差异的影响 4)学科发展阶段对老化的影响 5)用户需求对老化的影响
二.文献老化过程的定量研究
1. 文献老化过程的定量研究方法
理论形成时期 (20世纪30~60年代) 重要科学家:贝尔纳、普赖斯、默顿 重要著作:《科学的社会功能》、《科学与 社会》、《巴比伦以来的科学》、《大科学、 小科学》 应用发展时期(20世纪60年代~现在) 重要科学家:加菲尔德、布劳温 2.我国的科学计量研究
思考题
1.科学计量学的形成与发展。 2.谈谈你对科学计量学各种定义的认识和理解。 3.科学计量研究的常用方法有哪些,它们与自 然科学研究有哪些区别和差异? 4.简述科学计量研究的发展过程。 5. 科学计量指标的频次分布有哪些类型?说明其 意义和作用。
二.文献计量学理论模型简介
1. 布—齐分布系统一概率模型的研究 西蒙的斜分布函数族泊松分布模型 普赖斯的累计优势分布 布恩斯坦的经验负幂分布 布鲁克斯的混合泊松模型 巴瑞尔的贝塔—负二项分布 西切尔的通用逆高斯—泊松分布模型
二.指数增长规律机理分析
1.基本机理
事物的增长速度与现存的事物数量成正比。 即: dN / dt = bN dN / N = bdt = > LnN = bt + C = > N = N0 e bt 2.指数增长规律的局限性
3.智力潜热现象
科学技术发展的波浪式前进,永无止境。
4.科技文献增长的四个阶段 科技文献的阶跃型增长曲线
二.齐普夫定律的基本原理
1. 齐普夫第一定律 f r = C r -1 其中:f r = n r / N 为词汇出现的频率,r 为词汇的等级序号。 2. 最省力法则 人类行为与最省力法则—人类生态学引论。 任何人在做任何事时, 都希望付出的代价 最小,而获得的收获最大。 3. 用最省力法则解释齐普夫定律 齐普夫提出“单一化的力”和“多样化的力” 作用概念。
1)文献流通统计数据分析法 2)引文分析法
引用文献分析法(同时法) 被引文献分析法(历时法)
2.模拟老化过程的数学模型
1)负指数模型 布鲁克斯的基本假设 负指数模型的形式 C (t ) = Co e -bt = K e -bt 观察SCI的引用数据表 概率密度函数 f ( x) = be -bx 累计分布函数 F (t ) = 1 -- e -bt 老化系数 a = e -b 2)伯顿-开普勒公式 y = 1-- ( a/e x + b/ e 2x ) (a+b=1) 3)莫德列夫修正式 y = 1-- (a / e x-0.1 + b / e 2x-0.2 ) (a + b = 1)
二.布拉德福定律的修正与发展
1. 维克利的修正式 n1 : ( n1 + n2 ) : (n1 + n2 + n3 ) : ……… = 1 : b : b2 ……….
2. 莱姆库勒对区域法的发展 F ( x ) = ln (1 + Bx ) / ln ( 1 + B ) 公式形式简单,单参数,便于应用。在确定 了参数 B 以后,只要知道论文的覆盖比例就 可以确定期刊的最低数量。