词频共现矩阵分析步骤

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

作者:侯风飞

词频共现矩阵分析步骤

目录

1将所选的几百篇期刊导出 (1)

2进行关键字的词频分析 (2)

3找出几百篇期刊的关键字 (7)

4用BibExcel进行运行,得出“词频共现矩阵” (10)

5将“词频共现矩阵”粘贴到“Ucinet软件”中,用NetDraw画图 (25)

1将所选的几百篇期刊导出

2进行关键字的词频分析

3找出几百篇期刊的关键字

4用BibExcel进行运行,得出“词频共现矩阵”

(1)使用bibexcel打开数据文件(关键词.txt),特别注意的是,事先要将数据文件进行格式化(上面已经进行了格式化),如图1所示:

(2)在窗口“Frequency distribution”的下拉菜单中选中“Whole string”,并选中“Make new out-file”,以及“Old tag”中填写字段“DE”,单击按钮“Start”,将产生一个后缀名为.oux 的新文件。如图2所示

(3)选中文件“关键词.oux”,并在“The List”窗口打开,从窗口“Select field to be analysed…”的下拉菜单中选中“Any;separated field”(数据文件中单个关键词以;隔开),并单击“Prep”按钮,将产生一个新文件“关键词.out”,所有单个关键词以文件为单位分别列出。如文件1含有3个关键词分别为“竞争情报”、“装备制造业”、“技术创新”。如图3所示:

(4)打开数据文件“关键词.out”,在工具栏选中“Analyze——Add frequencies”,得到后缀名为.cit的文件,在此统计得出关键词的词频。

如图中,在这1425篇文献中,关键词“竞争情报”出现1109次,“企业竞争情报”出现47次,知识管理出现40次。

(5)这一步有两种方法:第一种:将上图中的词频统计列表拷贝到Excel文件中,并按词频降序排列,选择频次20以上的关键词(共35个,排除关键词“竞争情报”)做进一步分析,将关键词及其频次复制回BibExcel。

第二种:将本文上面“第二步进行关键字的词频统计”的结果,进行筛选,比如关键字出现3次以上的,将出现3次以上的关键字粘贴回BibExcel中去,其格式和下图一样。第二种方式能够自由选择出现在几次以上的关键字进行词频共现分析。《一般数据量大时一定要用第二种方法》更精确一些!

(6)接下来,选中数据文件“关键词.out”,选择工具“Analyze_Co-occurrence_Make pairs via listbox.”,得到后缀为.coc的文件,得到关键词共现频次。

(7)选中数据文件“关键词.coc”,并选择工具“Analyze_List units in pairs”,得到后缀名为.ccc的文件,

(8)打开数据文件“关键词.ccc”,并在文件列表中单击文件“关键词.coc”,选择工具“Analyze_”Make a matrix for MDS etc”,得到共词矩阵。

(9)将共词矩阵导入EXCEL文件中,进行下一步分析。

5将“词频共现矩阵”粘贴到“Ucinet软件”中,用NetDraw画图

相关文档
最新文档