文献计量学方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢文献计量学的研究对象
✓文献及其内容信息 ✓与文献相关的指标
➢文献计量学的研究内容
✓文献计量学的基本理论 ✓文献计量学的方法 ✓文献计量学的应用
8.2 文献计量学方法
的基本原理及其应用
▪布拉德福定律及其应用
英国文献学家布拉德福提出了定量描述文献序性结构的经验定 律:“如果将科技期刊按其刊载某专业论文的数量的多少以递 减顺序排列起来,则可以在这些期刊中区分出载文率最高的核 心区和包含着与核心区同等数量论文的后继几区。此时,核心 区和后继各区中所含的期刊数成1:n:n2……的关系(n>1)。
与样本有关的常数
f*r=C
某一单词的词频
该单词的等级序号
▪齐普夫定律及其应用
❖美国语言学家朱斯(M.Joos)提出了广义的齐普夫定律数 学公式:
F*rB=C B为与样本有关的常数 ❖法国数学家芒代尔布罗(B.Mandelbrot)运用信息论原理 和概率论方法在式8-5的基础上,进一步提出了新的修正式: F*(r+m)B=C m为与样本有关的常数;
▪齐普夫定律的运用实例
❖ 电子邮件列表成员的相对价值。 按照齐普夫定律,这种网络的成员可以像齐普夫定律排列
单词那样来排序——按照你收件箱当中电子邮件的数量。每个 人所发的电子邮件都会给你收件箱的总“价值”贡献1/k,这 里的k是指每个人的排名。
▪引文分析及其应用
➢引文分析是运用数学、统计学和逻辑学的方法对论文、专著 等各种文献的相互引用现象进行分析,以揭示出其数量特征和 内在规律的一种研究方法。
➢结论汇总——在综合统计结果和定性分析的 基础上,得出某些结论性的看法,同时指出 所作的内容分析的适用范围或边界。
分析的核心是推理和比较。常见的有: ✓趋势比较——历史性纵向比较,着眼于同一
事件在时间序列中的变化趋势。 ✓不同内容体比较——同一主题下,比较来源
不同的信息内容,从而得出结论。如各国对 同一事件的反应。这种比较是共时性的横向 比较。 ✓内容内比较——对同一文献中不同主题的比 较,以分析其相关性和差异。如比较某报纸 对白人和黑人的不同用词。 ✓带标准的内容比较——有一给定的标准作为 比较尺度,对文献内容进行相应的比较。即 事先确立某种评估标准,在该标准下得出比 较结果。
发表x篇论文的著者出现的频率(在所 统计的著者总数中所占的比例)
f(x)=C/X2 ≈0.6/X2
C为常数,C的极 限值为0.6079
科学工作者发表 的论文数量
▪齐普夫定律及其应用
美国哈佛大学语言学教授齐普夫于1935年提出齐普夫定律: 在一篇足够长的文章(5000字以上)中,如果我们以单词词 频的高低进行等级排列(约定词频越高,则单词的等级越高), 词频最高的单词等级为1,次之为2,再次之为3,……,则词 频与等级之间存在着一次反比关系。
➢在进行引文分析时,经常采用的计量指标有:引文率、被引 用率、自引率、被自引率、影响因数、即年指标、引文耦合强 度、同被引强度等。
内容分析法
补充
内容分析法(Content Analysis)是对 文献内容进行系统的定量分析的一种 专门方法,其目的一般是弄清或测度 文献中本质性的事实或趋势。
20世纪初,人们提出在一般性阅读文献获得理解 之外,采用半定量的统计方法对文献的内容进行 深入分析和解释。二战中,美国传播学家拉斯韦 尔等在进行战时军事和政治信息分析中,以德国 公开出版的报纸为分析对象,分析获取法西斯政 权重要军政机密情报,取得了出乎意料的成功, 使内容分析法显示出实际效果。60年代,前苏联 学者在社会科学研究中采用内容分析法。60年代 日本巧妙获取大庆油田的相关情报。
应用:
▪主要体现在文献信息的搜集环节上。
▪也可用于研究某一学科发展的特点以及学科之间的交叉影响 和相互渗透关系,并以此确定某些新学科的生长点。
▪布拉德福定律及其应用
▪也可用于研究某一学科发展的特点以及学科之间的交叉影响 和相互渗透关系,并以此确定某些新学科的生长点。
▪洛特卡定律及其应用
✓洛特卡定律是揭示文献著者与数量关系的基本定律,是为了 评价科学工作者的贡献,由洛特卡于1926年提出的。 ✓洛特卡定律的数学表达式为:
➢制定分析框架——体现分析思路和保证系统性的 核心步骤。要求分析人员对问题本身和分析对象 二者都有深透的认识。其基本出发点是使分析单 元的测度结果能反映和说明实质性的问题。例如, 用图书馆中通用的主题词表作词频分析有时意义 不大,原因在于通用的主题词表并不是为分析专 门问题而设计的。
➢频数统计——一种规范性的操作,包括计数 和数据处理,需要通过大数量的统计反映统 计意义上的相关性。在内容分析中,最常用 的是词频统计。
分 析 方 法
内容分析的 类型
指定分析:统计分析指定的人、 事、物出现的频次。
8 文献计量学方法
内容提要
8.1 概述 8.2 文献计量学方法的
基本原理及其应用
8.1 概 述
▪ 文献计量学的产生和发展
➢值得关注的趋势
✓从文献计量向信息计量发展 ✓文献计量学、科学计量学、信息计量学的合流趋势 ✓文献计量研究手段的现代化趋势 ✓重视文献计量学在科技管理和决策中的应用
▪ 文献计量学的研究对象和内容
➢半定量分析方法。 ➢对大量样本进行特征识别的系统方
法,具有统计性。
➢可以揭示出隐性的内容。是一种从 公开资料中萃取秘密信息的方法。
建立假设 检验假设
确定目的 选择样本 定义分析单元 制定分析框架 频数统计 结论汇总
内容 分析 步骤 框图
➢确定目的——Fra Baidu bibliotek须首先明确。
➢选择样本——力求样本信息量大,有 连续性,便于统计分析并尽可能是分 析人员所熟悉的。
➢分析单元——是内容的“指示器”。一般先依 据目的确定分析范畴,即确定符合目的要求的 最一般的关键性概念。确定范畴时应避免两个 极端:过大的范畴可能使分析结果表面化和简 单化;过细的范畴造成几乎重复原文。范畴选 择之后,再明确相对应的分析单元。分析单元 是不再细分析测度单位。对文字对象,词是最 小的分析单元。此外,意义独立的词组、简单 句、段和意群甚至独立的篇也可视作分析单元。 在复杂的内容分析中,可同时采用几种分析单 元。
✓文献及其内容信息 ✓与文献相关的指标
➢文献计量学的研究内容
✓文献计量学的基本理论 ✓文献计量学的方法 ✓文献计量学的应用
8.2 文献计量学方法
的基本原理及其应用
▪布拉德福定律及其应用
英国文献学家布拉德福提出了定量描述文献序性结构的经验定 律:“如果将科技期刊按其刊载某专业论文的数量的多少以递 减顺序排列起来,则可以在这些期刊中区分出载文率最高的核 心区和包含着与核心区同等数量论文的后继几区。此时,核心 区和后继各区中所含的期刊数成1:n:n2……的关系(n>1)。
与样本有关的常数
f*r=C
某一单词的词频
该单词的等级序号
▪齐普夫定律及其应用
❖美国语言学家朱斯(M.Joos)提出了广义的齐普夫定律数 学公式:
F*rB=C B为与样本有关的常数 ❖法国数学家芒代尔布罗(B.Mandelbrot)运用信息论原理 和概率论方法在式8-5的基础上,进一步提出了新的修正式: F*(r+m)B=C m为与样本有关的常数;
▪齐普夫定律的运用实例
❖ 电子邮件列表成员的相对价值。 按照齐普夫定律,这种网络的成员可以像齐普夫定律排列
单词那样来排序——按照你收件箱当中电子邮件的数量。每个 人所发的电子邮件都会给你收件箱的总“价值”贡献1/k,这 里的k是指每个人的排名。
▪引文分析及其应用
➢引文分析是运用数学、统计学和逻辑学的方法对论文、专著 等各种文献的相互引用现象进行分析,以揭示出其数量特征和 内在规律的一种研究方法。
➢结论汇总——在综合统计结果和定性分析的 基础上,得出某些结论性的看法,同时指出 所作的内容分析的适用范围或边界。
分析的核心是推理和比较。常见的有: ✓趋势比较——历史性纵向比较,着眼于同一
事件在时间序列中的变化趋势。 ✓不同内容体比较——同一主题下,比较来源
不同的信息内容,从而得出结论。如各国对 同一事件的反应。这种比较是共时性的横向 比较。 ✓内容内比较——对同一文献中不同主题的比 较,以分析其相关性和差异。如比较某报纸 对白人和黑人的不同用词。 ✓带标准的内容比较——有一给定的标准作为 比较尺度,对文献内容进行相应的比较。即 事先确立某种评估标准,在该标准下得出比 较结果。
发表x篇论文的著者出现的频率(在所 统计的著者总数中所占的比例)
f(x)=C/X2 ≈0.6/X2
C为常数,C的极 限值为0.6079
科学工作者发表 的论文数量
▪齐普夫定律及其应用
美国哈佛大学语言学教授齐普夫于1935年提出齐普夫定律: 在一篇足够长的文章(5000字以上)中,如果我们以单词词 频的高低进行等级排列(约定词频越高,则单词的等级越高), 词频最高的单词等级为1,次之为2,再次之为3,……,则词 频与等级之间存在着一次反比关系。
➢在进行引文分析时,经常采用的计量指标有:引文率、被引 用率、自引率、被自引率、影响因数、即年指标、引文耦合强 度、同被引强度等。
内容分析法
补充
内容分析法(Content Analysis)是对 文献内容进行系统的定量分析的一种 专门方法,其目的一般是弄清或测度 文献中本质性的事实或趋势。
20世纪初,人们提出在一般性阅读文献获得理解 之外,采用半定量的统计方法对文献的内容进行 深入分析和解释。二战中,美国传播学家拉斯韦 尔等在进行战时军事和政治信息分析中,以德国 公开出版的报纸为分析对象,分析获取法西斯政 权重要军政机密情报,取得了出乎意料的成功, 使内容分析法显示出实际效果。60年代,前苏联 学者在社会科学研究中采用内容分析法。60年代 日本巧妙获取大庆油田的相关情报。
应用:
▪主要体现在文献信息的搜集环节上。
▪也可用于研究某一学科发展的特点以及学科之间的交叉影响 和相互渗透关系,并以此确定某些新学科的生长点。
▪布拉德福定律及其应用
▪也可用于研究某一学科发展的特点以及学科之间的交叉影响 和相互渗透关系,并以此确定某些新学科的生长点。
▪洛特卡定律及其应用
✓洛特卡定律是揭示文献著者与数量关系的基本定律,是为了 评价科学工作者的贡献,由洛特卡于1926年提出的。 ✓洛特卡定律的数学表达式为:
➢制定分析框架——体现分析思路和保证系统性的 核心步骤。要求分析人员对问题本身和分析对象 二者都有深透的认识。其基本出发点是使分析单 元的测度结果能反映和说明实质性的问题。例如, 用图书馆中通用的主题词表作词频分析有时意义 不大,原因在于通用的主题词表并不是为分析专 门问题而设计的。
➢频数统计——一种规范性的操作,包括计数 和数据处理,需要通过大数量的统计反映统 计意义上的相关性。在内容分析中,最常用 的是词频统计。
分 析 方 法
内容分析的 类型
指定分析:统计分析指定的人、 事、物出现的频次。
8 文献计量学方法
内容提要
8.1 概述 8.2 文献计量学方法的
基本原理及其应用
8.1 概 述
▪ 文献计量学的产生和发展
➢值得关注的趋势
✓从文献计量向信息计量发展 ✓文献计量学、科学计量学、信息计量学的合流趋势 ✓文献计量研究手段的现代化趋势 ✓重视文献计量学在科技管理和决策中的应用
▪ 文献计量学的研究对象和内容
➢半定量分析方法。 ➢对大量样本进行特征识别的系统方
法,具有统计性。
➢可以揭示出隐性的内容。是一种从 公开资料中萃取秘密信息的方法。
建立假设 检验假设
确定目的 选择样本 定义分析单元 制定分析框架 频数统计 结论汇总
内容 分析 步骤 框图
➢确定目的——Fra Baidu bibliotek须首先明确。
➢选择样本——力求样本信息量大,有 连续性,便于统计分析并尽可能是分 析人员所熟悉的。
➢分析单元——是内容的“指示器”。一般先依 据目的确定分析范畴,即确定符合目的要求的 最一般的关键性概念。确定范畴时应避免两个 极端:过大的范畴可能使分析结果表面化和简 单化;过细的范畴造成几乎重复原文。范畴选 择之后,再明确相对应的分析单元。分析单元 是不再细分析测度单位。对文字对象,词是最 小的分析单元。此外,意义独立的词组、简单 句、段和意群甚至独立的篇也可视作分析单元。 在复杂的内容分析中,可同时采用几种分析单 元。