pajek

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.3可视化成图功能 可视化成图功能
接下来就可以在Pajek中读取该文件 接下来就可以在Pajek中读取该文件。在菜单中 Pajek中读取该文件。
信 息 管 理 系
选 择 File ( 文 件 ) ﹥ Network ( 网 络 ) ﹥ Read (读取),或者直接在窗口界面的左侧点击 Networks(网络)栏中最左侧的打开按钮。 Networks(网络)栏中最左侧的打开按钮。
编号 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
大学名称 同济大学 华南理工大学 重庆大学 华东师范大学 兰州大学 北京理工大学 中国农业大学 湖南大学 东北大学 郑州大学 南京航空航天大学 苏州大学 华东理工大学 武汉理工大学 南京农业大学 中国石油大学 北京科技大学 上海大学 西安电子科技大学 中国矿业大学 西南大学 暨南大学 电子科技大学 东北师范大学 华中师范大学
网站地址
网站地址
编号 1 2 3 4 5 6 7 8
大学名称 清华大学 北京大学 浙江大学 上海交通大学 南京大学 复旦大学 中国科学技术大学 华中科技大学 武汉大学 西安交通大学 吉林大学 中山大学 四川大学 哈尔滨工业大学 山东大学 南开大学 天津大学 北京师范大学 中南大学 东南大学 厦门大学 中国人民大学 北京航空航天大学 大连理工大学 西北工业大学
3.1实例数据来源 实例数据来源
本实例选取中国管理科学研究院武书连等人发布的
信 息 管 理 系
《2008中国大学评价》中排名前50的大学的网站作 2008中国大学评价》中排名前50的大学的网站作 中国大学评价 50 为研究对象。截至2008年 为研究对象。截至2008年7月31日,借助Altavista 2008 31日 借助Altavista 搜索到了50个大学的网站之间所有的互链共22094条 搜索到了50个大学的网站之间所有的互链共22094条 50个大学的网站之间所有的互链共220功能简介
Pajek中有 Files Net选项 选项, Ucinet软件中的 Data和 软件中的Data Pajek 中有Files 和 Net 选项 , 与 Ucinet 软件中的 Data 和 中有 Files和 Transform选项对应 其中Files菜单还有一些常用功能, 选项对应。 Files菜单还有一些常用功能 Transform选项对应。其中Files菜单还有一些常用功能, Read(读取) Edit(编辑)或者Sort 分类) Sort( 如Read(读取)和Edit(编辑)或者Sort(分类)等。 Pajek文件与 Ucinet数据文件在格式上类似 文件与Ucinet数据文件在格式上类似, Pajek 文件与 Ucinet 数据文件在格式上类似 , 在形式上 可以是邻接矩阵本身, 可以是邻接矩阵本身,也可以是对数据进行分区或聚类 分析的结果。使用Net选项, Net选项 分析的结果 。 使用 Net 选项 , 可以对网络进行转置或简 化处理。 因为Pajek 包括很多用来检测成份的命令, Pajek包括很多用来检测成份的命令 化处理 。 因为 Pajek 包括很多用来检测成份的命令 , 其 他菜单选项也可以进行各种分区和聚类, 他菜单选项也可以进行各种分区和聚类,它们是专门设 计用来减少巨型网络的规模的。Pajek可以对一个巨大 计用来减少巨型网络的规模的 。 Pajek 可以对一个巨大 的网络进行分析和分区, 的网络进行分析和分区,然后对每个分区进行更细致的 分析。 分析。
信 息 管 理 系
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
3.2数据预处理 数据预处理
使 用 Altavista 搜 索 到 的 链 接 数 据 , 需 要 转 化 为
信 息 管 理 系
Pajek软件所能够读取的格式。 Pajek软件所能够读取的格式。具体的转化主要包括 软件所能够读取的格式 两步: 两步: 将下载的链接文件转化为Excel 格式的数据 , 该 将下载的链接文件转化为 Excel格式的数据 Excel 格式的数据, 数据表示50所大学之间互链的下三角邻接矩阵。 数据表示50所大学之间互链的下三角邻接矩阵。 50所大学之间互链的下三角邻接矩阵 xls格式的链接数据转化为可以被 Pajek识别 格式的链接数据转化为可以被Pajek 将 .xls 格式的链接数据转化为可以被 Pajek 识别 的.net文件:中国50所大学.net。 net文件:中国50所大学.net。 文件 50所大学
Excel格式的链接数据(部分) 格式的链接数据(部分) 格式的链接数据
信 息 管 理 系
Pajek文件中国 所.net格式(部分) 文件中国50所 格式( 文件中国 格式 部分)
信 息 管 理 系
信 息 管 理 系
Pajek可识别的.net文件由两部分组成 Vertices( 文件由两部分组成: Pajek可识别的.net文件由两部分组成:Vertices(顶 可识别的 点)部分和Arcs(弧)部分。第一部分以“*Vertices” 部分和Arcs( 部分。第一部分以“ Vertices Arcs 开头, 50”表示顶点数 以下依次为各顶点的信息。 表示顶点数, 开头,“50 表示顶点数,以下依次为各顶点的信息。 下面我们以第一条记录为例,详细解释Pajek Pajek文件中顶 下面我们以第一条记录为例,详细解释Pajek文件中顶 点信息的记录格式: 点信息的记录格式 : “ 1”和 “ 和 ” 表示该顶点的编号为1 名称为www ; www. 表示该顶点的编号为 1 , 名称为 ; 4970”表示该顶点在可视化图中 表示该顶点在可视化图中x “0.6909 0.4970 表示该顶点在可视化图中x、y轴的 坐标值,该值可以由使用者自行设定或者省略。 坐标值 , 该值可以由使用者自行设定或者省略 。 第二 部分以“ Arcs”开头 表示各顶点之间的关系。 开头, 部分以 “ * Arcs 开头 , 表示各顶点之间的关系 。 我们 仍然以第一条记录为例: 216.0000”表示编号为 仍然以第一条记录为例:“1 2 216.0000 表示编号为 1与编号为2的顶点之间的链接数为216次。 与编号为2的顶点之间的链接数为216次 216
3、具体功能详细介绍 、
下面将结合具体的链接分析研究实例, 下面将结合具体的链接分析研究实例,来详细介绍
信 息 管 理 系
Pajek在网络信息计量研究中的应用。 Pajek在网络信息计量研究中的应用。 在网络信息计量研究中的应用 大学网站之间的学术信息交流是网络信息分析的一 个重要方面。 个重要方面。大学之间的学术信息交流情况是学术 研究情况评估、大学科研情况评估, 研究情况评估、大学科研情况评估,以及大学之间 的交流活跃情况评估的一个重要考察指标。因此, 的交流活跃情况评估的一个重要考察指标。因此, 选择大学网站之间的互链情况作为实际使用的案例。 选择大学网站之间的互链情况作为实际使用的案例。
可视化工具 Pajek
Pajek
信 息 管 理 系
Pajek软件是由Vladimir Batagelj和Andrej Pajek软件是由Vladimir Batagelj和 软件是由 Mrvar共同编写的 共同编写的, Mrvar共同编写的,可以免费提供给非商业用 途的用户。Pajek在斯洛文尼亚语中是蜘蛛的 途的用户。Pajek在斯洛文尼亚语中是蜘蛛的 意思, 该软件的Logo 就是一只蜘蛛, Logo就是一只蜘蛛 意思 , 该软件的 Logo 就是一只蜘蛛 , 暗示其 具有网络绘制的功能。 具有网络绘制的功能。
步骤1 Pajek中读取文件 中国50所大学.net 中读取文件: 50所大学 步骤1 在Pajek中读取文件:中国50所大学.net
信 息 管 理 系
Pajek主界面 主界面
信 息 管 理 系
2、Pajek功能特点 、 功能特点
Pajek可以对大型网络进行有效的分析。 Pajek可以对大型网络进行有效的分析。最显著的功 可以对大型网络进行有效的分析
信 息 管 理 系
能就是该软件可以在屏幕上绘出二维、 能就是该软件可以在屏幕上绘出二维、三维甚至动 态的社群图,并具有强大的图形生成和导出功能。 态的社群图,并具有强大的图形生成和导出功能。 与MDS类似,Pajek也使用弹性嵌入程序对结果图进 MDS类似,Pajek也使用弹性嵌入程序对结果图进 类似 行着色处理,确定标签, 行着色处理,确定标签,以便直观的突出网络关系 的核心特征, 的核心特征,还可以利用选项功能对社群图进行平 面旋转或空间旋转,以便从不同的角度观察图形, 面旋转或空间旋转,以便从不同的角度观察图形, 同时也提供鼠标自由移动所生成的网络节点。 同时也提供鼠标自由移动所生成的网络节点。所有 的操作都可以精确细致的控制。 的操作都可以精确细致的控制。
Pajek
信 息 管 理 系
Pajek是一种基于Windows Pajek是一种基于Windows的用于将大型网络可视化的社 是一种基于Windows的用于将大型网络可视化的社 会网络分析软件,是基于图论、 会网络分析软件,是基于图论、网络分析以及可视化软 件等等发展而来的。它的特点是将信息可视化。 件等等发展而来的。它的特点是将信息可视化。它允许 人们对大量抽象的数据进行分析。 人们对大量抽象的数据进行分析。事实上人的创造性不 仅取决于人的逻辑思维,同时取决于人的形象思维。 仅取决于人的逻辑思维,同时取决于人的形象思维。海 量的数据只有通过可视化变成形象, 量的数据只有通过可视化变成形象,才能激发人的形象 思维, 思维,才能在表面上看来是杂乱无章的海量数据中找出 隐藏的规律,为科学发现、 隐藏的规律,为科学发现、工程开发和业务决策等提供 依据。 依据。
相关文档
最新文档