基于关键词共现聚类的新型城镇化研究热点分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于关键词共现聚类的新型城镇化研究热点分析

(作者虞昌亮)

摘要:以“新型城镇化”为关键词,选取2011-2015年的1085篇CSSCI期刊论文为样本,分析新型城镇化研究的新趋势。通过对文献的外部特征如发表年份、期刊分布、文献作者等进行统计分析,近五年新型城镇化已成为热点。通过关键词共现和聚类分析,研究聚焦于新型城镇化发展路径模式、城镇化公共服务保障机制、城镇化实证分析及顶层设计、人的城镇化与绿色协调发展、土地管理与金融创新、户籍改革与房地产业发展等六个领域。

关键词:新型城镇化;关键词共现;聚类分析;研究热点

20世纪80年代初期,在改革从农村向城市发展的背景下,城镇化一词在我国出现并进入了学者研究的领域,较早的学术论文是1979年《城市规划》上刊发的吴友仁教授《关于我国社会主义城市化问题》。多年来,城镇化的研究不断发展,成果累累,随着《国家新型城镇化规划(2014-2020年)》的发布,新型城镇化的关注将不断深入。

一、新型城镇化研究文献概况

通过对文献的外部特征如发表年份、期刊分布、文献作者等进行统计分析,了解2011- 2015年近5年来学者研究新型城镇化的基本概况。

(一)数据来源

通过CNKI期刊高级检索,以关键词“新型城镇化”为对象,时间跨度从2011年到2015年,来源类别选取CSSCI,检索日期为2016年1月12日,共检索到1085篇文献。

(二)发表年份

近五年新型城镇化研究公开发表的文献数见图1,如图所示,基本趋势是逐年上升,2015年有所下降。2013年数量有了量级的飞跃,是前一年的数10倍,主要原因是2012年党的十八大把新型城镇化列为重要发展战略,当年底中央首次召开了城镇化工作会议,学者研究急国家之所需,出现井喷之势。虽然2015年呈下降,但数量依然很大,整体上新型城镇化研究热度不减,未来可期。

图1 近五年新型城镇化研究文献数量

(三)期刊分布

新型城镇化相关的研究文献1085篇发表在276种期刊上,节选出刊发量较多的期刊见表1。其中刊文量最多的是《经济研究参考》,该刊定位于反映国家改革开放和经济发展的全局性问题和深层次问题,新型城镇化自然是近年来我国经济发展突出问题,另一方面该刊出版周期为周刊,发文总数量也较多。其次是《城市发展研究》和《宏观经济管理》,《城市发展研究》是中国城市科学研究会的会刊,服务于国家城镇化和城市科学发展;《宏观经济管理》是国家发改委的委刊,注重研究探讨国民经济运行中的重大问题。通过分析,期刊的发文量一方面与该刊的定位宗旨有很大的关系,另一方面近年来多种期刊在选题上也非常青

睐新型城镇化方面的文献。

表1 期刊分布情况(部分)

(四)文献作者

文献的作者可能是某个课题组或是多人,某个课题组在本文分析中视为一个文献作者,多个作者视为每个作者均独立发表了这篇文章。通过excel 分列排序统计,发表两篇及以上文献的作者达到了209人,发表3篇及以上文献的作者有41人,充分说明对新型城镇化的研究百家争鸣,成果丰硕。发表4篇及以上文献的高产作者有16人,具体信息如图2所示。

图2 高产作者

二、新型城镇化高频关键词共现分析

通过CNKI 中国知网文献输出功能,自定义导出excel 文件,对1085篇文献进行关键词提取,使用excel 相关功能,形成新型城镇化高频关键词的共词矩阵,并进一步转化为相关矩阵、相异矩阵,再导入SPSS20.0,进行因子分析和聚类分析,做研究热点的归纳分析总结。

(一)关键词提取处理

对1085篇文献,使用excel 对关键词列进行分列、排序、统计和数据透视图,共提取关键词2803个,节选部分高频词得到表2。根据Donohue 的高频词低频词界分公式

)811(2

1

1I n ++-=,I 1是词频为1的关键词数量[1],I 1值为2211,得到n=65,高频词阀

值是65新型城镇化

923

经济增长

20

农民

13

城镇化78 农民工18 可持续发展12

城市群38 农民工市民化18 路径12

转移人口38 以人为本17 民族地区12

人口城镇化32 城市规模16 城镇化道路11

中国城镇化31 对策15 基础设施11

城乡一体化29 土地财政15 金融支持11

市民化27 中国特色15 内涵11

农业现代化23 地区城镇化14 生态环境11

生态文明22 城市发展13 指标体系11

表2高频词(部分)

接下来本文选取词频大于等于5 的关键词,数量达到了118个,见表3。本文对这118

关键词词频关键词词频关键词词频

城市化10 产业发展8 财经大学 6

城镇经济10 产业结构8 产业转型升级 6

......10 ......8 (6)

城市经济9 保障房7 成本分担机制 5

发展路径9 城乡规划7 城市规划 5

......9 ......7 (5)

通过分析,有些关键词对本文研究无实质意义,如“财经大学、河南省、学术委员会、亿人、征文活动启事”等,还有很多关键词虽不完全一致,但涵义基本相同,如“人口城镇化、人的城镇化”,“户籍制度、户籍制度改革”,“基本公共服务、公共服务”等”,这些因素干扰了分析统计。本文对118个词频大于等于5 的关键词,进行清洗归纳,去掉本文研究“新型城镇化”本身这个关键词、去掉无意义的关键词、并进行关键词的同义替换,因篇幅所限,节选部分关键词词映射表,见表4,把118个关键词替换成26个新关键词,本文接下来就基于这26个关键词开展分析。

表4 关键词替换(部分)

(二)高频关键词共词矩阵构建

关键词之间的共现频率越高,说明它们之间的关系越紧密。通过excel 对26个关键词进行配对,构建共词矩阵,形成26*26的矩阵,见表5。

高频关键词 城市发展管理 城市规模 城乡统筹 城镇化过程 城镇化建设 房地产业 公共服务 城市发展管理 83 15 8 5 8 1 1 城市规模 15 181 9 14 16 4 0 城乡统筹 8 9 81 4 11 2 0 城镇化过程 5 14 4 79 5 1 0 城镇化建设 8 16 11 5 165 5 1 房地产业 1 4 2 1 5 28 0 公共服务

1

1

8

表5 新型城镇化高频关键词共词矩阵(部分)

共词矩阵是对称的,对角线上的数字是该关键词出现的频次,如“城市发展管理”出现频次为83次,它与“城市规模”共同出现的频次为15次;“城市规模”出现频次为181次,它与“城镇化建设”共同出现的频次为16次。 (三)标准相关相异矩阵转化 共词矩阵中,两两关键词共现频次受两个关键词出现频次的影响,难以真正的反映彼此关系程度。为消除影响,引入Ochiai 系数,将共词矩阵转换成相关矩阵,反映高频关键词之间的实质性共现关系。

)(/Ochiai ,j i j i n n n *=

在公式中,j i n ,表示关键词i 和j 共同出现的频次,n i ,n j 分别表示关键词i ,j 共同的频次[2]

。通过计算得到共词相关矩阵,见表6。

Ochiai 系数 城市发展管理

城市规模 城乡统筹

城镇化过程

城镇化建设 房地产业 公共服务

城市发展管理 1 0.1224 0.0976 0.0617 0.0684 0.0207 0.0388 城市规模 0.1224 1 0.0743 0.1171 0.0926 0.0562 0 城乡统筹 0.0976 0.0743 1 0.05 0.0951 0.042 0 城镇化过程 0.0617 0.1171 0.05 1 0.0438 0.0213 0 城镇化建设 0.0684 0.0926 0.0951 0.0438 1 0.0736 0.0275 房地产业 0.0207 0.0562 0.042 0.0213 0.0736 1 0 公共服务

0.0388

0.0275

1

表6 共词相关矩阵(部分)

相关矩阵中的元素数值在0-1之间,数值越大越接近1表示这两个关键词的相似度越大;相反,数值越小表明两个关键词相似度越小。对角线上的数据表示该关键词自身的相关程度,均为1。通过计算得到的相关矩阵中0值过多,容易造成误差,为方便进一步分析,用1与相关矩阵中的各个数字相减,就得到了表示两个关键词相异程度的相异矩阵,在相异矩阵中,

相关文档
最新文档