网络信息计量学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(4)统计分析法
统计分析法是利用统计、概率的原理对 关系中各属性进行统计分析,从而找出它们 之间关系和规律的一种方法。 常用的统计分析法有判别分析、因子分 析、相关分析、多元回归分析等。
(5)可视化方法
信息可视化技术是帮助人们表现数据或 蕴含信息的手段,目的是辅助人们得出某种 结论性观点。
其特点主要有:①交互性、②多维性、 ③可视性。
(1)计量方便 (3)结果准确 (5)方法精致 (7)更新更快
(2)统计全面 (4)学科新颖 (6)应用广泛
2. 网络信息计量学的产生与发展
网络信息计量学的产生背景
网络信息计量学研究的发展趋势
2.1 网络信息计量学的产生背景
(一)社会背景和技术条件
1.
2.
3.
4.
信息资源数字化、网络化的进程不断加快, 网上数字信息的计量研究已成了摆在人们 面前的一个新课题,这直接促成了网络信 息计量学的诞生。 电子信息的统计分析及研究成果为该学科 的形成奠定了基础,积累了经验。 信息计量学发展的客观需要。 加强和改善网络管理的迫切需要。
1.2研究意义
意义之一:为网上信息的有序化组织和合理分 布、网络信息资源的优化配臵、网络管理的规 范化和科学化提供必要的依据,促进其经济效 益和社会效益的充分发挥。 意义之二:有助于网络资源的开发利用。
意义之三:有利于研究网络环境下的科学 信息交流和传播,分析和掌握科学发展状 况,探讨科学的发展趋势。
1.1 概念
T. C. Almind认为:网络信息计量学包括了 所有实用信息计量和其他计量方法对网络通信 有关问题的研究。
网络信息计量学是综合采用文献计量、信 息计量、统计学方法、计算机技术和网络技术 等对网络信息规律进行计量分析的一门科学。
从网络信息计量学的研究对象、方法、内 容和目标等方面来看: 网络信息计量学是采用数学、统计学等定 量分析方法,对网上信息的组织、存储、分布、 传递、相互引证和开发利用等进行定量描述和 统计分析,以便解释其数量特征和内在规律的 一门新兴分支学科。
7
21 161 23 77 26
225
146 43133 3921 1595 22566
116
44 944 341 132 401
127
38 986 227 211 442
10
67 306 23 69 51
34
3 141 33 29 92
914
7 464 47 30 94
.org
表14-3 中、美、法、英等7国国家图书馆网站被连接量的发展变化情况
中国 407 20
美国
英国
法国
日本
德国 1147 15 104
西班牙 1339 30 99
85410 15996 15996 1433 247 68 57 200 7 36 15806 352
Ms Word 6
5.4 几点有关的建议
重视新技术的利用
注重内容特色 注重网络信息资源的科学组织
1.
(二)网上信息数据调查收集方法
网络调查--------采用计算机网上自动搜寻、 网上联机调查和网下抽样调查等方法,收 集因特网网络信息和网络用户信息等。
(三)搜索引擎数据搜集方法
1. 搜索引擎的两个用途: 直接用于查找所需信息,探寻有价值的信息线 索。这时搜索引擎的搜索结果可以直接作为抽 样的依据,进而作相关的统计分析。 专门用于网络链接分析。
2.2 网络信息计量学研究的发展趋势
存在问题
实证研究多于和先于理论研究 网络信息计量学研究对象具有不确定性、 实验结果的不可重复性。 网上引用与被引用关系变得十分复杂。
发展趋势
1.
2.
信息计量的可操作性与有效性将消除和缓解 网络时代信息无序带来的知识积累与利用间 的矛盾激化,使各学科的社会功能得以实现。 网络信息计量学的根本任务是不断开拓新方 向、发现新问题、采用新手段、开发新的网 络计算工具和方法,探讨网络信息计量学的 有关规律。
第十四章 信息计量学的新发展 ---网络信息计量学
网络信息计量学概述
网络信息计量学的产生与发展
网络信息计量学的研究方法
网络信息计量学的应用 案例
1.网络信息计量学概述
网络信息计量学的概念 网络信息计量学的研究意义 网络信息计量学的研究对象和内容 网络信息计量学的主要特征
(三)研究重点
网络媒体信息本身的计量分析 网络站点结构的计量分析 网络文献信息的计量分析 网页影响因子的分析 网络数据库中的知识发现
网页影响因子
在一给定时间,某个国家的网址(或某个网址) 被其他网址和其自身所链接的网页数目的逻辑 和除以该国(或该网址)的所有网页数。
1.4 网络信息计量学的主要特征
2.搜索引擎必须具备的条件
具有能够包括所研究的网络环境的所有 网页及其链接的大型数据库。 具有能够辨别一定网络环境下网页数量 和链接数量的搜索命令。 具有统计网页和其链接结果的布尔逻辑 命令。
3.2 来自百度文库络信息计量学的主要研究方法
1. 2. 3. 4. 5. 6.
网络链接分析法 相关分析法 内容分析法 统计分析法 可视化方法 数据挖掘法
(二)发展过程
目前所知道的关于网络信息计量的最早研 究是伍德鲁夫(Woodruff)对网络文献特征 的测度。 1997年,阿曼德和英格维森提出了用 “webometrics”一词来描述将文献计量学 方法应用于万维网上的研究。 在这之后,许多学者在其有关网络空间的 信息计量研究中使用“webometrics”一词。 1997年因特网上出现了以“cybermetrics” 命名的电子期刊和网上学术论坛,
3. 网络信息计量学的研究方法
网络信息计量学研究的数据搜集方法 网络信息计量学的主要研究方法
3.1 网络信息计量学研究的数据收集方法
网上日志文件数据库搜集方法
1.
2.
网上信息数据调查收集法 搜索引擎数据收集方法
3.
(一)网上日志文件数据库收集方法
意义:有助于定制自己格式的日志文件, 保证其真实性和可靠性,并降低传递日志 文件所产生的网络流量,便于第三方机构 惊醒网站访问量的认证度量工作。 2. 具体方法和测度指标 (1)网站访问者的度量方法 (2)网站访问量指标的度量方法 (3)访问者特征的指标及度量的方法
(6)数据挖掘法
数据挖掘是从数据集合中自动发现隐含 的、有意义的知识,进而预测未来可能发生 的行为的一种方法。 功能主要有:①预测趋势和行为、②关 联分析、③聚类、④概念描述、⑤偏差检测。
4. 网络信息计量学的应用
分析网络用户的特性及信息需求 对搜索引擎进行比较分析 指导网络信息资源的建设与组织管理 研究网络环境下的科学信息交流 研究网络信息资源的评价方法 应用于网络关系的计量分析 应用于网络信息老化的研究 在数字图书馆建设中的应用
意义之四:提高网络信息检索的效率。 意义之五:为有关的决策服务。
1.3网络信息计量学研究对象和内容 (一)研究对象:
第一层次:网上信息的直接计量问题。 第二层次:网上文献、文献信息及其 相关特征信息的计量问题。 第三层次:网络结构单元的信息计量 问题。
(二)基本内容
网络信息计量学的基本问题研究; 网络信息计量学的理论问题研究; 网络信息计量学的方法问题研究; 网络信息计量的技术问题研究; 网络信息计量的应用问题研究; 网络信息资源计量管理对策问题研究。
英国
20662 20 56 14568 179 97 154
法国
18186 12 10 1189 7555 77 181
日本
1817 14 25 187 11 1381 9
德国
1479 5 8 286 48 14 861
西班牙
1659 11 7 374 47 8 38
西班牙语
朝鲜语 .com 域 名 .edu .net
(2)相关分析法
任何相关分析都建立在资料和数据的基 础上,因此,进行网络相关分析的第一个环 节必然是根据研究目的,开展调查和试验, 应对所获得的数据、资料进行整理。
(3)内容分析法
内容分析是对文献内容进行系统的定量分 析的一种方法,其目的一般是弄清或测度文献 中本质性的事实和趋势。 内容分析法将用语言表示的信息内容转换 为用数量表示的资料,并将分析的结果用统计 数字描述。是一种定性和定量结合十分紧密的 方法。
5 案例:国家图书馆网站被链接情况的计量分析
研究的意义
调查对象与方法
调查结果与分析
几点有关的建议
表14-2 中、美、法、英等7国国家图书馆网站的被链接量
检索条件 默认设臵
简体中文 繁体中文 英语 语 言 法语 日语 德语
中国
820 392 25 100 2 23 4
美国
99883 115 69 95027 229 113 348
368
1046 1208 13997
827
2310 2502 36849
1479
20662 18186 99883
图14-1 美、法、英国家图书馆网站的被链接量的对比
图14-2 中、日、德、西国家图书馆网站的被链接量的对比
表14-4 中、美、英、法等7国国家图书馆网站不同类型文件的被链接量
文件类 型 Image PDF
(三)基本状况:
基于实证和应用的研究较多,而对理论方法 的研究较少,相关的理论和方法在许多方面 至今仍然没有成熟。 基于某一方面和专题的研究较多,而从整体 上进行综合分析的较少,缺乏系统的研究。 基于一般性的问题介绍较多,而对某一方面 的深入研究较少,目前还缺少具有普遍规律 意义的认识。
(1)网络链接分析法
网络链接分析主要是比照文献计量学中引文分析 的方法,用来计算网络影响因子Web-IF,评价核心网站 和网络信息资源的质量等。 链接分析法是网络信息计量学方法之一。网络链 接的自组织性所带来的链接的社会性意义,以及网络 链接所起到的间接评价功能,都使网络超链接分析成 为一个极有潜力的情报分析工具。
年份 中国 西班牙 日本
1998 1 42 22
1999 5 84 64
2000 58 180 161
2001 152 347 370
2002 308 861 800
2003.7 820 1659 1817
德国
英国 法国 美国
36
75 88 334
88
236 211 963
211
500 477 1908