引文分析法共词分析法浅析ppt

合集下载

文献分析法PPT课件

文献分析法PPT课件

• 1.纵贯分析或历史研究。
• 作为一种完全独立的、完整的、非辅助性的研究方法,文献研究可以应用 在认识社会历史发展趋势的研究中。
• 文献研究法尤其适用于作长时段的研究,研究的对象往往是一种趋势。
• 随着时间的流逝,各个不同历史时期的社会现象和社会生活,或多或少总 会以各种不同的文献形式记录和描述下来。
• 2.探索性研究。创新性(论文的研究综述)
• 在正式对课题研究之前,一般要进行探索性研究或前
期研究。方法有:观察、访问、走访专家、文献研究
法。
-
21
(四)文献研究的适用范围
• 2.探索性研究。创新性(论文的研究综述)
• 一般整体印象获取:文献研究可以有效地帮助了解有 关问题和研究对象的历史与现状,形成对有关问题和 研究对象的一般整体印象;
近、从而不能以其他方法进行研究的对象做研究。 • 比如:要了解早就不在人世间的人群的情况,通过文献研究法之外的任何
其他一种研究法都是无法实现的。
• 【例如:1968年,美国社会学家兰兹等人打算研究工业革命前美国的婚姻 和家庭。可是,生活在那个时期(1700年前后)的人们没有一个活着的, 他们无法采用调查或访问的方法去收集资料,于是他们采用了文献研究的 方法,对美国独立前的13州当时的杂志进行分析。尽管他们所用的资料存 在某些问题,但是这却是要达到其研- 究目的的唯一可行的途径。】 11
(三)文献研究法的特点
• 第二、无反应性。 • 直接接触性的研究方法缺点:资料不够客观。 • 文献研究法 :不会出现“干扰效应”,即在研究过
程中,不会使研究对象有意识或无意识地改变原有的 状况而导致收集到的资料失真的情况出现。 • 可能的局限:研究者主观偏见的影响。【但是收集资 料的方法本身却不会使正在收集的资料性质发生变 化。 】

引文分析法

引文分析法

引文分析法除了前面两节介绍的内容分析法,内容相关分析涉及到的另外两个主要的领域是情报检索和引文分析。

本节在扼要阐述和比较这两者之后,集中介绍引用相关分析的方法—引文分析法如何进行内容相关分析。

一、检索相关检索相关是指以情报检索为目的的内容相关分析。

可以说,各种情报检索理论和方法都围绕着准确、高效地显示、识别和判断检索对象内容或概念上的相关关系。

例如,任何一种检索语言在编制技巧上的一个最重要而又最困难的问题就是如何显示概念之间的相互关系。

不能充分显示或未显示概念之间真正的相关关系,就会影响检索语言的缩检扩检功能,发生漏检误检。

从相关分析的角度上,可以将查全率理解为相关内容的菠盖程度,将查准率理解为内容真正相关的显示程度。

又如,在数据库检索中,发展出了详尽显示概念或内容相关关系的词典,这种词典可以帮助用户揭示相关的主题词从而提高检索效果。

美国能源部的一个能源数据库配有约1000页及2.5万个表的词典,能显示出相关的代替词或不同层次的相关词项,如词典在“蒸馏”之下列出的拓宽词为“分离处理”,而缩小词为“干馏”和“真空蒸馏”,还显示出约12个相关的代替词,包括“共沸混合物”、“蒸发”等。

情报检索的相关分析在方法上的特征是:(1)以标引和标识为基础。

由此发展出了多种情报检索语言和查找途径。

概念内容是通过标识来显示的;(2)以标识是否一致或符合作为判断是否相关的判据。

我们将这种相关分析称之为“符合相关”,即标识相符时才被看作是相关的,否则为不相关。

二、引用相关引用相关是指通过科学活动中的引用行为来揭示文献内容之间的相关关系。

由于在科学活动中,任何一个人的劳动及其知识产品都不是孤立存在的,而是以前人的劳动为前提和条件的,因此,知识劳动的主要形式一一科技文献在内容上存在必然的相关联系。

通过引用行为来显示这种内容上的相关联系并进而作出种种推论,是一种独特的途径。

尽管关于引用能否从本质上真正揭示出相关,以及引用行为的复杂性等间题,尚有种种的讨论,但在统计的意义上,通过引用分析来反映相关,的确是一种有特色、有价值的方法,其有效性已经被大量实例所证明和肯定。

引文分析词频分析PPT42页

引文分析词频分析PPT42页
40、人类法律,事物有规律,这是不 容忽视 的。— —爱献 生
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
引文分析词频分析
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·吐 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的迅速累 聚,进 而变成 法律。 ——朱 尼厄斯

第七章 引文分析法

第七章  引文分析法

第七章引文分析法第一节引文分析概述在科学文献体系中,科学文献之间并不是孤立的,而是相互联系的。

现代科学文献,尤其是科技期刊论文有一个很重要的书面特征,就是在之后罗列出作者参考、借鉴较早发表的文献。

科学文献的相互关系突出的表现在文献的相互引用方面,形成了科学论文之间的引用与被引用关系。

引用文献是科学论文的基本属性之一,科学文献的相互引证关系是引文分析的主要依据。

正如英国学者吉曼所说:没有一篇科学论文是孤立存在的,它是被深嵌在整个学科的文献体之中。

就书面现象而言,被参考、引鉴、推荐的文献还有不同的称谓。

常见的术语是:note(注释)footnote(脚注),reference(参考文献),bibliography(参考书),citation(引用文献),further readings(补充书目)。

1.概念所谓引文分析()就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法对科学期刊、论文、著者等各种分析对象的引证或被引证现象进行分析,以便揭示出研究对象所具有的特征或它们之间的关系及其规律性的一种文献计量研究的方法。

2.引文分析发展简史最早运用科学论文的参考文献加以分析,以求达到某种目的的实践的是俄国科学院院士瓦尔金,他于1911年首次利用引文分析的方法,研究了包括俄国在内的化学家们对世界化学发展所作出的贡献。

但是当年的化学史之类的著作并没有现代引文制度所规范的引文形式,瓦尔金所研究的是在正文中直接引的叙述及脚注中出现的叙述,所以人们并没有一致地认为,开引文先河者是瓦尔金。

比较普遍承认的先行者是格鲁斯(Gross)等人,他们统计并分析了化学中某些科技期刊论文的参考文献。

1927年依据期刊刊登被引论文多少将期刊排列制表,建立起围绕化学教育所必备期刊的顺序表,他们称为核心期刊表,格鲁斯等人的工作开创了利用参考文献进行比较期刊重要性的先例。

1956年,布朗(Brown)依据统计所得的引文频次,评价并确定了期刊的重要性,其领域扩大到化学、物理、地理、生理、植物、动物、昆虫学等学科。

引文分析法

引文分析法

引文分析法引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。

引文分析方法的数学基础是概率论与数理统计。

在进行分析比较时,已将其作用排除在测度结果之外了。

引文分析法的类型从不同的角度和标准来划分,引文分析方法有着不同的类型。

如果从获取引文数据的方式来看,有直接法和间接法之分。

前者是直接从来源期刊中统计原始论文所附的被引文献,从而取得数据并进行引文分析的方法;后者则是通过“科学引文索引”(SCI)、“期刊引用报告”(JCR)等引文分析工具,查得引文数据再进行分析的一种方法。

若从文献引证的相关程度来看,则有自引分析、双引分析、三引分析等类型。

如果从分析的出发点和内容来看,引文分析大致有三种基本类型:1.引文数量分析:主要用于评价期刊和论文;研究文献情报流的规律等。

2.引文网状分析:主要用于揭示科学结构、学科相关程度和进行文献检索等。

3.引文链状分析:科技论文间存在着一种“引文链”,如文献A 被文献B引,B被文献C引,C又被文献D引,等等。

对这种引文的链状结构进行研究可以揭示科学的发展过程并展望未来的前景。

引文分析法的基本内容从不同的角度或从各种基本要素出发,对科学引文的分布结构进行描述和分析,便形成引文分析的基本内容,一般包括:1.引文年代分析:一般来说,随着年度的由远而近,引文量呈增长趋势,即时间愈近,被引用的文献愈多;文献被利用的峰值是该文章发生以后的第二年。

如果以引文年代为横轴,各年引文量为纵轴,在坐标图上描绘各年数据点,然后用一条线连接起来,便可得到一条引文年代分布曲线。

通过对该曲线的分析,不仅可以了解被引文献的出版、传播和利用情况,而且可以研究科学发展的进程和规律,特别是在文献老化和科技史的研究中,引文年代分析更是一种广泛应用的有效方法。

2.引文量分析:引文量是某一主体对象含有的参考文献数量。

简述文献探索的主要方法

简述文献探索的主要方法

简述文献探索的主要方法
文献探索是指通过阅读、分析和综合各种文献资料,来获取有关研究主题的信息和知识的过程。

以下是一些常见的文献探索方法:
1. 系统评价法:通过全面、系统地收集、筛选、评价和整合已有的研究文献,以回答特定的研究问题或概括现有研究的现状。

2. 文献综述法:对特定主题的已有文献进行综合分析和评论,梳理出该领域的研究进展、现状和存在的问题。

3. 引文分析法:通过分析引用文献的特征和关系,了解研究领域内的知识结构、学术传承和研究热点。

4. 共词分析法:利用文献中共同出现的关键词或主题词,揭示出该领域的研究热点、趋势和潜在的研究方向。

5. 内容分析法:对文献的内容进行定量和定性分析,以提取关键信息、主题和观点。

6. 实证研究法:通过对文献中的数据进行统计分析和实证研究,验证假设或得出结论。

7. 专家咨询法:请教领域内的专家,了解他们对相关文献的看法和建议,获取专业的意见和指导。

8. 网络搜索法:利用互联网搜索引擎和学术数据库,查找与研究主题相关的文献资料。

引文分析法共词分析法浅析课件

引文分析法共词分析法浅析课件

聚类分析与可视化
讲解采用聚类算法对共词矩阵 进行分析,将相似词汇聚成一 类,并通过可视化工具展示聚 类结果。
结果解读与讨论
指导如何解读共词分析结果, 包括词汇关联程度、主题结构 等方面,并结合实际案例进行
讨论。
04
引文分析法与共词分析法比较
方法差异与优劣分析
数据来源
方法原理
引文分析法主要基于期刊、论文等文献的 引用关系,而共词分析法则依赖于文本中 的词汇共同出现情况。
数据来源
说明本研究所使用的数据来源, 如学术论文、专利、会议论文等 ,以及数据的预处理和清洗过程 。
02
引文分析法基础
引文分析法概述
01
02
03
定义
引文分析法是一种利用数 学和统计学方法,对学术 文献的引用关系进行定量 分析的方法。
目的
揭示学术文献之间的内在 联系,评价学术影响力, 发现研究热点和趋势。
引文分析法步骤
数据清洗
对收集到的数据进行清洗和处 理,去除无效数据和异常值。
可视化分析
利用可视化工具对引用矩阵进 行可视化分析,如聚类分析、 网络分析等。
数据收集
收集相关学术文献的引用数据 ,包括引用频次、被引频次、 共被引频次等。
构建引用矩阵
根据清洗后的数据构建引用矩 阵,用于后续的数学和统计学 分析。
加强可视化技术应用
结合可视化技术手段,如知识图谱、网络分析等,未来研究可进一步挖掘和展示共词分析法、引文分析 法所揭示的知识结构和发展动态,以提高研究成果的可读性和易用性。
THANK YOU
适用范围与限制讨论
适用范围
引文分析法适用于期刊、论文等文献的计量分析,共词分析 法适用于文本数据的挖掘和分析。

引文分析法

引文分析法

引文分析法.txt人永远不知道谁哪次不经意的跟你说了再见之后就真的再也不见了。

一分钟有多长?这要看你是蹲在厕所里面,还是等在厕所外面……引文分析法除了前面两节介绍的内容分析法,内容相关分析涉及到的另外两个主要的领域是情报检索和引文分析。

本节在扼要阐述和比较这两者之后,集中介绍引用相关分析的方法—引文分析法如何进行内容相关分析。

一、检索相关检索相关是指以情报检索为目的的内容相关分析。

可以说,各种情报检索理论和方法都围绕着准确、高效地显示、识别和判断检索对象内容或概念上的相关关系。

例如,任何一种检索语言在编制技巧上的一个最重要而又最困难的问题就是如何显示概念之间的相互关系。

不能充分显示或未显示概念之间真正的相关关系,就会影响检索语言的缩检扩检功能,发生漏检误检。

从相关分析的角度上,可以将查全率理解为相关内容的菠盖程度,将查准率理解为内容真正相关的显示程度。

又如,在数据库检索中,发展出了详尽显示概念或内容相关关系的词典,这种词典可以帮助用户揭示相关的主题词从而提高检索效果。

美国能源部的一个能源数据库配有约1000页及2.5万个表的词典,能显示出相关的代替词或不同层次的相关词项,如词典在“蒸馏”之下列出的拓宽词为“分离处理”,而缩小词为“干馏”和“真空蒸馏”,还显示出约12个相关的代替词,包括“共沸混合物”、“蒸发”等。

情报检索的相关分析在方法上的特征是:(1)以标引和标识为基础。

由此发展出了多种情报检索语言和查找途径。

概念内容是通过标识来显示的;(2)以标识是否一致或符合作为判断是否相关的判据。

我们将这种相关分析称之为“符合相关”,即标识相符时才被看作是相关的,否则为不相关。

二、引用相关引用相关是指通过科学活动中的引用行为来揭示文献内容之间的相关关系。

由于在科学活动中,任何一个人的劳动及其知识产品都不是孤立存在的,而是以前人的劳动为前提和条件的,因此,知识劳动的主要形式一一科技文献在内容上存在必然的相关联系。

文献计量学10引文分析法

文献计量学10引文分析法
(2)任何一个学科所需要的“尾部期刊”,即布拉德福 定律中所描述的非本专业的科学期刊,绝大多数构成其它学 科的核心期刊。
42
4.2评价期刊的主要测度指标
4.2.1期刊载文量 4.2.2期刊引证率 4.2.3期刊被引率 4.2.4引文率 4.2.5影响因子 4.2.6即年指标 4.2.7期刊自引率 4.2.8期刊自被引率
文献之间的相互联系,而且可以定量地反 映出主体之间的联系程度。
被引文篇数分布受到许多因素的影响
首先, 被引文篇数分布与论文的学科性质 有关。一般来说,基础理论学科研 究论文被引证量大于应用技术学科 研究论文。
其次, 被引文篇数分布与论文语种有关。 一 般来说,外文文献的平均被引证 量比中文每篇论文被引证量大。
信息计量学
第十章 引文分析法
本章主要内容
1 引文分析的基本概念和方法 2 引文分析的主要工具 3 引文分布规律及主要指标分析 4 科学期刊的引文分析 5 引文网络与聚类分析 6 引文分析法的评价
2
1 引文分析的基本概念和方法
1.1 引文分析的基本概念 1.2 引证行为与引证动机 1.3 引文分析的基本类型和步骤
3
1.1引文分析的基本概念
1.1.1引文分析:
利用各种数学及统计学的方法和比较、 归纳、抽象、概括等逻辑方法,对科学期刊、 论文、著者等各种分析对象的引证与被引证现 象进行分析,以揭示其数量特征和内在规律.
4
1.1.2 引证分析的发展
第一次引证分析是P.L.K.Cross和E.M.Cross 于 1927年进行的。
2 引文分析的主要工具
2.1 美国《科学引文索引》(SCI) 2.2 美国《基本科学指标》(ESI) 2.3 国内引文分析的主要工具

引文分析

引文分析

(1)洛特卡定律反映的是作者发表论文数量分布的规 律,属于输出信息。而表7-5结果所表明的是发表论 文被引用的情况。属于反馈信息。 (2)两者的集中与离散的程度不同。统计数据表明, 引文的集中程度更大一些。 这是因为引文量按被引作者的分布不仅反映了 编辑人员对文献作者的选择,还反映了有关科学工 作者对所需文献的选择,因此要求更苛刻,集中程 度更高。 另外,一般讲这两种选择在统计上现为同一种 趋势。
引文分析步骤

选择统计科中具有代表性的 刊物(即来源期刊)(能较完整地反映学科的发展状况)。
明确时间的选择范围
为能客观地反映学科发展的动态规律,时间间隔一 般不宜过长。但也不宜过短,否则不易反映学科发展的 相对稳定状态。在来源期刊数量不是很少的情况下,根 据经验,一般以1-2年为宜。当学科范围过窄至使来源 期刊过少时,可适当延长时间选择范围。

文献自引分析举例(E;e=E)

自引率:是指某类自引次数在该类总引证次数所占的比例。 被自引率:是指某类被自引次数(数值上等于自引次数)在该类 总被引证次数中所占的比例。 以作者自引(A;a=A)为例,建立引文矩阵: 其中,矩阵元dij代表第i名著者引用第j名 著者的次数。 把dij按行相加,则得n名著者被引用的总和。


萨顿余弦方程 (其各项与雅可俾指数中各项相同) coc(i, j ) S S (i, j ) 1 cit(i) cit( j) 2 当文献i,j间不存在引文联系时两个指标均为0;而当 cit(i)=cit(j)=coc(i,j)时且等于1,特别当Ss/SJ=2时,相
第二节 引文款目作为独立计量单位 的引文分析
引文网络:约定以箭头指 向被引用文献,箭尾指向 引用文献,可得文献群体 及相互引关系,即引文网 络(图7-1)。

10引文分析法

10引文分析法
Present Past
Subject
第十章 引文分析法
第一节 引文分析的基本概念和方法
一、引文分析的相关概念 引文分析就是利用各种数学及统计学的方法和比较、归纳、抽象、概
括等逻辑方法,对期刊、论文、著者等各种分析对象的引证和被引证 现象进行分析,以揭示其数量特征和内在规律的一种文献计量学分析 方法。
信息计量学
第十章 引文分析法
第一节 引文分析的基本概念和方法
二、引文行为与引证动机
科学知识具有明显的累积性和继承性; 科学是一个统一的整体,学科之间是相互联系、交叉、渗透的。
引用
说明资料的出处,强调其可靠性; 便于读者查考、核对; 尊重他们的劳动成果。
信息计量学
第十章 引文分析法
第一节 引文分析的基本概念和方法
二、引文行为与引证动机
• 索恩(F.C.Thorne)
– 为阿谀某人引用; – 以自诩为目的引用; – 为相互吹捧而带有偏见的引用; – 为支持某一观点牵强的引用; – 为维护某一学术研究派别利益的不正常引用; – 因迫于某种压力的引用。
——Thorne F.C. The citation index: author case of spurious validity[J]. Journal of Clinical Psychology,1977, (33):1157-1161
信息计量学
参考论文 参考书
参考专利
引证关系示例
一篇论文
这篇论文的 参考文献
单一引文关系
1957
1992
2004
Related Records
该课题的起源、 修正、变迁、发展
相关文献
该课题的演变、 最新进展

文献计量简介PPT课件

文献计量简介PPT课件

学科热点研究
通过文献计量分析,挖掘 学科领域的研究热点和前 沿,为科研人员提供研究 方向。
学科知识图谱构建
利用文献计量数据,构建 学科知识图谱,展示学科 领域的知识结构和关系。
科研评价与决策支持
科研项目立项评估
通过文献计量分析,评估科研项 目的创新性、可行性和价值,为
项目立项提供决策支持。
科研成果转化评估
会议论文集收录了各领 专利文献是技术创新和 学
域的最新研究成果和学 知识产权保护的重要载
术动态,对于了解学科 体,通过对专利数据的
领域的前沿和热点具有 分析可以了解技术发展
重要意义。
趋势和市场动态。
05
文献计量学的实际应用
学术评价
01
02
03
学术影响力评估
通过分析文献的被引频次、 下载量等指标,衡量学者、 研究机构和期刊的学术影 响力。
引文分析法是通过分析文献之间的引证关系,揭 示学科领域的知识流动和知识结构。
共词分析法是通过分析同一篇文献中关键词或主 题词的共现关系,揭示学科领域的研究热点和知 识结构。
文献计量学的工具
文献计量学的工具主要包括文献数据库、文献管理软 件、文献分析软件等。这些工具为文献计量学的研究
提供了便利的数据获取和分析手段。
国际化与合作
随着全球化的进程,不同国家和地区的文献计量学研究将有更多的机会进行交流和合作。 这种国际化的合作将有助于推动文献计量学的发展,并促进全球范围内的知识共享。
THANKS
感谢观看
领域和应用场景。
它利用数据挖掘、机器学习和人工智能 现代的文献计量学还涉及到跨学科的研
等技术手段,对海量的文献数据进行深 究领域,如科学交流与合作、学术不端
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-
共引的意义
自1973 年被提出以来,共引分析已 成为引文分析里面一种潜在多产的分析方法, 它不仅可以用来揭示科学结构的发展现状乃 至变化情况, 还可以用来进行前沿分析、领 域分析、科研评价等,进而为宏观科技决策 提供先行支持, 为科技规划与评估提供基 础。
-
共引分析的一般过程
共引分析方法的一般过程可以概括 为分析领域的确定分析对象的选择及共引矩 阵的形成共引数据的处理聚类分析和多维标 度结果分析和解释。方法的演进过程以分析 过程中分析对象的选择和聚类方法中的参数 修正为主。
-
-
引文网络的结构特点有: ①引文网络是静 态的,不可以在任何已有节点上增加新的代表引用 的单向箭头,也不可以随意删除已有的代表引用的 单向箭头,因为文献一经出版之后,它的参考文献 就一成不变了; ②引文网络中的引用是单向的,即 只能是后期的文献引用前期的文献,而前期的文献 不能反过来引用后期的文献; ③引文网络中的引 文不可以自引,引文不能自己引用自己,在引文分 析中,自引主体只能是作者、期刊、学科、机构等 ; ④引文网络中的引用是有固定时间的,即文献A 引用文献B是有固定时间的,这个固定时间正好是 文献A 的发表时间,且文献A的发表时间必然在文 献B之后,如图3中8和8′同时发表,故不存在8引用 8′或8′引用8; ⑤引文网络中引文间的引用呈现 出主题集中,因为引文间引用的正式性和文献出版 的质量控制,引文基本来自同一科学领域或关系紧 密的领域。
-
共引(cocitation)
就是两篇文献同时被其他文献引用。 一般认为同被引用的文献在主题上具有或多 或少的相似性, 因此同被引次数即共引强度 可以测度文献在内容方面的相关度。由此, 通过一组文献之间的共引关系可以形成共引 网络, 该网络内节点之间的远近便可以反映 它们主题内容的亲疏关系。
-
共引分析方法始于small于1973年 提出的以文献为单位的共引分析, 但共引概 念可以推广到与文献相关的各种特征对象上, 形成各种类型的共引概念,如词的共引、文献 共引、著者共引、期刊共引、主题共引和类 的共引等。
-
引文分析
引文分析是利用各种数学、统计学以及逻 辑方法,对科技期刊、论文、著作等各种分析 对象的引用或被引用现象进行分析研究, 以便 揭示其数量特征和内在规律, 达到评价、预测 科学发展趋势的目的。近几年主要的关注研究 对象或热点集中在“引文网络”、“自引与自 引率”、“共引分析”、“影响因子”以及 “引文分析和统计中的误差”等方面。
-
选择对象 搜索数据 构建矩阵 聚类分析/多维尺度分析/计算战略坐标 分析结果
-
几乎国内外所有学者都是按照统一的方法 模式来进行共被引分析,即第一步构造共被引矩阵 ;第二步将该矩阵转化为相似系数矩阵,方法大多 为皮尔逊相关系数法(Pearson’S Correlation Coeficient);第三步是进行聚类(Cluster)和多维 尺度分析(MDS)。这基本是大家默认的方法,在我国 许多相关教材和相关论文中也多是采用这样的方法 。
-
Pearson’s只是一种测度变量相似性的方法,是 为了更好地发现变量之间的关系,而许多方法都可以取代它 。我们认为Squared Euclidean distance是代替它的最好方 法。理由如下:
-
在引文网络中存在大量的同引和耦合 。同引(或称同被引)是指两篇或两篇以上文 献共同被之后的一篇或多篇文献引用,如图中 5和6同时被之后的8和8′引用;引用它们的论 文的多少,即同被引程度,称为同被引强度。 耦合则是指两篇文献共同引用了一篇或多篇 文献,如图中2和4共同引用了1;耦合的文献之 间总存在着这样或那样的联系,其联系的程度 称为耦合强度。
-
常见的引文网络测度指标可以分为 四类: ①引文数量特征测度指标:引文数; ②引文分布特征测度指标:平均引用数、自 引数与自引率、被引次数与引用数的比值; ③期刊(论文)影响力测度指标:被引用数、 同引和耦合、期刊影响因子即年指标; ④文 献老化规律测度指标:衰减系数等
-
自引自引率
关于自引和自引率的研究是引文分 析的内容之一。目前在国外研究最多的是关 于期刊的自引和自引率。一般认为, 期刊高 自引有助于提升其影响因子; 也有研究人员 研究去除期刊自引数对影响因子的影响,认 为未去除影响因子的数据可以采用;还有研 究显示期刊自引与自引率与影响因子的负相 关性。
引文分析法、共词分析法 浅析
于伟
-
科学研究前沿代表了科学发展的难点、 热点以及发展趋势,从浩瀚的科技信息中探测 研究前沿是科技创新的关键任务之一。因此, 如何能够科学、准确地把握研究前沿已经成 为科学研究人员及其管理者关注的焦点。
科学家提出各种方法与技术用于探 测研究前沿,其中以利用引文分析和共词分析 的研究最为常见。
从2003年开始,在科学计量学学者之间又 引发了关于共被引分析方法的讨论。焦点主要集中 在对皮尔逊相关系数是否适合应用到共被引分析这ቤተ መጻሕፍቲ ባይዱ一问题,及共被引矩阵对角线如何取值这一问题的 讨论。
-
McCain将其定为:默认值,这也是影响最 广泛的一种对角线确定方法;Ahlgren等认为应该使 用自己与自己实际共被引次数;White则建议使用最 大值来确定对角线的值。邱均平等认为根据共被引 原理来看,从临近矩阵的定义来看,Wh ite的建议 则更正确。共被引矩阵本来就是考察各对象之间亲 疏关系的临近矩阵,只不过研究的目标选定了有特 殊意义的作者、论文、期刊、学科等而已。从这点 出发,我们自然而然的认为自己和自己的关系最亲 近,所以应该是该作者与其他作者共被引频次中最 高的。表达方式可以是最大值。但我们认为为了突 出自己与自己的亲密关系,可以用最大值+l来凸显 。所以我们大体倾向于White的提法,但可做适当的 调整。
-
引文网络
在引文分析中, 引文网络得到了学 者们的高重视。国外方面,将引文看作代表 信赖的原型。他们认为在虚拟环境中,引文 实际上代表了一种信赖。当A 引用B 的文章 时,A认为B 的观点是支持性的,而B 引用的 内容是被协商许可了的, 引用内容的同时也 就影响了B 的思维。因此,引文网络系统可 以被看成是信赖系统,引文索引则可以被看 成是一个推荐系统———推荐被引次数多的 文章。
相关文档
最新文档