EXCEL实现共词分析的方法_以国内图书情报领域知识管理研究为例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2005
第二步,作者合列: 将三列作者数据,复制
到 sheet2 中,然后将第二列数据剪贴到第一列
某位,再将第 三 列 数 据 剪 贴 到 刚 才 第 二 列 的 末
尾,也就是将 三 列 数 据 汇 总 到 一 列。 接 着 将 该
数列降序排列,使空白行全部归到末尾。此目的
是为了进行作者频次统计,得作者人次数为 624。
为知识服务。
·46·
情报杂志
第 30 卷
1 数据采集和预处理
本文以情报学 代 表 性 刊 物《情 报 学 报》、《图 书 情 报工作》、《情报理论与实践》、《情报资料工作》《情报 科学》、《情 报 杂 志 》为 数 据 源,按 照 时 间 为 2000 ~ 2009、标题包含“知识管理”的检索限制,对 CNKI 全文 库进行检索,去掉一篇非学术论文,共有检索文献 400 篇。将这些文献的简明题录首先在 Word 中转换成表 格形式,转换的方法是: 将形如“. ,: ”的字段分隔符, 替换成制表符,然后使用 Word 中插入表格的功能将 数据转换 成 表 格,再 将 其 整 体 导 入 到 Excel 数 据 表。 并将第一行作为字 段 行,每 一 列 分 别 标 上 年 代 、作 者、 标题、期刊名、关键词、作者机构。
和技巧,基本步骤有: 题录数据导入、筛选高频词、共词矩阵构建。
关键词 知识管理 共词分析 Excel 图书情报
中图分类号 F270 / G25
文献标识码 A
文章编号 1002 - 1965( Βιβλιοθήκη Baidu011) 03 - 0045 -
05
Co - word Analysis Method Based on EXCEL— TakingDomestic Knowledge Management in the Library and Information Science as an Example
BLOG 与知识管理
知识管理学科体系构建 研究
国内外知识管理理论发 展与流派研究
试论企业知识管理的风 险
转型企业知识管理探讨 安徽电力科学研究院企 业知识管理分析
期刊 情报理论与 实践 情报科学 情报理论与 实践 图书情报工 作 情报理论与 实践
年代 2002 2006 2008
2007
2004
情报杂志
OrderCustom: = 1,M atchCase: = False, Orientation: = xlLeftToRight,SortM ethod _
: = xlPinYin,DataOption1: = xlSortNormal
Next End Sub 由于文章总篇数是 400,故 i 的最大值设为 400。 读者可根据自己研究的情况设定 i 的值。 执行上述程序,可以一次对所有作者排序。该程 序也适合超过 3 位合作者的情况。 第三步,将作者两两组对。为了分析合作者的基 本情况,将列 B、列 C 的数据复制至列 A、列 B 的末尾。
第二步,对作者按照行进行排序,注意是每一行单 独排序。Excel 提供了整体排序的功能,单独每一行排 序必须一个一个执行,很费时间。因此,本文采用 Excel 提供的 VBA 语言进行编程[4]。程序如下。
Sub 行排序( ) For i = 1 To 400
Rows( i) . Select Selection. Sort Key1: = Cells ( i,1 ) ,Order1: = xlAscending,Header: = xlGuess,_
图 2 知识管理论文的期刊分布
2. 2 作者研究
2. 2. 1 高产作者。高产作者在 Excel 中的计算,
按照以下步骤进行:
第一步,作者分列: 导入到 Excel 数据表中的作者
栏要做适当处理,多作者无法直接统计,不过作者之间
是用逗号分隔,使用 Excel 提供的分列功能,将多个作
者分成多列。需要注意的是,首先要检查合作者最多
再运用 Excel 排序去重,操作方法: 数据 - 筛选 - 高级筛选,选 择“将 筛 选 结 果 复 制 到 其 他 区 域 ”,并 选 择“选择 不 重 复 的 记 录 ”。 将 数 据 复 制 到 一 个 新 的 区 域,然后将原有数据清除,该数据就是去重后的题录数 据。
2 数据分析处理
2. 1 年代和期刊分布 年代分布计算比较简单。 将年代列数据复制到空白工作表 A 列,在 B 列另建一 列年代数据: 2000 ~ 2009。建一行做表头。在 C1 中输 入公式 = COUNTIF( A2: A401,B2 ) ,即可得出按年代 统计的论文数[2]。
第三步,计 算 作 者 频 次: 在 首 行 插 入 字 段
名: 作者,启动 Excel 的数据透视表和数据透视
表向导图———布局,将作者字段拖至行,并将作
者字段拖至计数项,如图 3 所示。双击计数项, 弹出数据透视表字段,汇总方式选择“计数”[3],如图 4
第3 期
储节旺,等: EXCEL 实现共词分析的方法
第 30 卷 第 3 期 2011 年 3 月
情报杂志
JOURNAL OF INTELLIGENCE
Vol. 30 No. 3 Mar. 2011
EXCEL 实现共词分析的方法*
———以国内图书情报领域知识管理研究为例
储节旺 郭春侠
( 安徽大学管理学院 合肥 230039)
摘 要 以国内图书情报学知识管理研究热点作为实例,系统探讨了用大众化软件 Excel 在共词分析中的使用方法
·47·
所示。
第四步,显示高产作者: 在透视结果图上,选择数 据透视表—“排序并显示前 10 项”,自动排序选择降 序,使用字段为“计数项 - 作者”,自动显示前 10 项, 将最大改为前 20 项,如图 5 所示,则显示前 20 个结 果,即前 20 个作为高产作者发表的论文数量,如图 6 所示。
图 1 知识管理论文的年代分布
统计期刊的论文 分 布 也 可 以 采 用 上 面 的 方 法 ,不
过使用数据透视表更方便( 该方法下文详述) 。 从发表的期刊上看,载文最多的是《情报杂志》和
《情报科 学》,载 文 分 别 为 153 和 97 篇,各 占 38% 和 24% ,其次是《情报资料工作》和《情报理论与实践》, 各载文 52 篇和 48 篇,所占比例分别是 13% 和 12% , 载文最少的为《情报学报》,仅占 5% ,如图 2 所示。某 一主题的载文量与 期 刊 的 选 题 特 色 、办 刊 宗 旨 都 有 非 常大的关系,与论文质量本身关联不大。
图 5 数据透视表( 三)
图 6 数据透视表( 四)
2. 2. 2 作者合作网络。第一步,分析作者合作网 络,首先要排除单独作者。为此,将上述第一步分列的 数据复制到 sheet2 的 A、B、C 三列内,然后按照列 B 降 序排序,将第 B 列是空白的记录剔除,得合作者文献 记录 189 条。由此可知,合作论文在总体论文中占到 的比例是 47% ,这应该是比较高的。反映了合作研究 是当前知识管理研究的重要组织形态。
收稿日期: 2010 - 11 - 09
修回日期: 2010 - 12 - 30
基金项目: 国家社会科学基金项目“文献计量分析的知识管理学科规范研究”( 编号: 10BTQ035) ; 安徽大学创新团队项目( 编号: SKTD010B )
的阶段成果之一。
作者简介: 储节旺( 1969 - ) ,男,博士,教授,硕士生导师,研究方向为知识管理、教育管理、科技管理; 郭春侠( 1973 - ) ,女,副教授,研究方向
数据表明,自 2000 ~ 2009 年,论文发表的数量总 体呈上升趋势,2004 年和 2009 年是两个高峰期,这和 笔者进行的另一次大规模统计基本相同。这 10 年中, 知识管理研究可以划分为一个半周期,2000 ~ 2006 年 为一个周期,其中 2004 年为本周期的顶点,第二个周 期从 2007 年开始,到目前是 2009 年为本次的最高点, 是否 2010 年会超过 2009 年,目前还不能确切预测,但 如果根据第一周期表现,则 2010 年可能会有短暂下 降,而 2011 年将会攀登到一个新的高度。因此,2011 年可能是一个知识管理研究的热点年,如图 1 所示。
是多少人,然后在作者栏后增加( n - 1) 列,以确保分
列的数据可以存放。本研究作者最多是两人,因此增
加两栏即可,如表 1 所示。
表 1 Excel 中题录( 局部)
作者 钱 敏、胡漫江、解 曾 红、张树人 储节旺、郭春侠 储节旺 储节旺、郭春侠
陈国宏、汪传雷
标题

KRM 整 合 ERP 与 知 识 管理
为了方便 用 户 使 用,还 有 一 些 专 门 强 化 EXCEL
统计分析 功 能 的 第 三 方 软 件,如 WinSTAT 等[1]。通 过 WinSTAT 的使用,用户可以在 EXCEL 中实现许多 复杂的统计分析功能,如方差分析、协方差分析、多元 回归、因子分析、聚类分析、生存分析、判别分析等。
本文以 Excel 为工具,研究国内图书情报学知识 管理研究热点。Excel 作为文献计量的有效工具,不仅 体现在简便、易用、精确,而且计算过程都是直接可以 控制的。但在国内文献计量研究中,一般采用专门的 软件进行处理,如 spss 等。而内容分析中使用的共词 矩阵,一般采用 Bibexcel、Citespace 等软件,或者直接 用 VB、VC 语言编写,也有少数人直接两两组对检索, 这些方法要么比 较 复 杂 ,要 么 很 费 时 间。 笔 者 经 过 较 长时间的研究发现,Excel 可以很好地成为文献计量研 究的基本工具,尤为重要的是在内容分析中构建共词 矩阵,不仅简单易行,且比常规方法更精确。
接着将 列 A、C 的 数 据 复 制 至 列 A、B 的 末 尾。然后删除列 A、B 以 外的数据。按列 B 为主要字段降序排列,将排在后边的列 B 为 空白的行删除。得两两合作者记录为 259 条。
第四步,合 作 情 况 分 析。 将 第 四 步 的 原 始数据的列 B 复制到列 A 末尾,将列 A 复制 至列 B 末 尾,则 构 成 了 完 整 的 作 者 共 现 矩 阵,然后启动数据透视表,采用交叉列联表的
0引言
Excel 是微软公司 office 的组件之一,是目前公认 的功能最强、技 术 最 先 进、使 用 最 广 泛 的 电 子 表 格 软 件。由于其简单易用、数据呈现直观,深受用户喜爱。 一般用户使用其基本功能,包括内嵌的函数,就可以完 成绝大部分数据管理和分析工作。对于高级用户,Excel 携带的数据分析和规划求解两个模块,也能满足基 本需要。如果充分利用其内含的 VBA 语言进行编程, 几乎可以满足所有数据分析处理的要求。另外,Excel 还有一个优势,只要进行了一次数据处理,后面再有其 他数据更新,只要输 入,可 立 即 得 到 结 果 ,实 现 了 数 据 分析处理的动态化。因此,Excel 在国内外科研和教学 中广泛运用于各种问题的数据分析和处理。
CHU Jiew ang GUO Chunxia
( School of M anagement,Anhui University,Hefei 230039)
Abstract Taking domestic know ledge management in the Library and Information Science as an example,this paper makes a study on how to use the popular softw are Excel to construct co - w ords matrix,w hich includes three steps: Bibliographic data importing,high - frequency w ords screening and Co - w ord matrix constructing. Key words know ledge management co - w ords analysis Excel Library and Information Science
相关文档
最新文档