基于文本挖掘的能源与环境保护政策大数据研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于文本挖掘的能源与环境保护政策大数据研究杨承启 庄心怡中国石油大学(北京)经济管理学院
摘要:本文以2006-2020年国务院和31个省(自治区、直辖市)的政府工作报告为样本,基于PMC指数模型对能源与环境保护政策进行量化评价,构建一套科学的评价指标体系。

本文研究有利于提升政府在环境治理领域的注意力水平,建立长效机制。

关键词:能源与环境保护政策;文本挖掘;大数据
引言
党的十八大以来,政府更加重视环境治理与监管,提出加强污染防治和生态建设,大力推动绿色发展,打好污染防治攻坚战。

政府决策者在能源与环境保护政策方面注意力分配的概率大小促成了我国“中央政府管制型运动式治理”的环境治理路径。

一、文献综述
当前,关于能源与环境保护政策效果的研究主要集中于设计系统、可执行的有效评价方法。

陈天祥和杨蕊对35年内的广东省政府工作报告进行文本分析,以词频变化、重点占比和关键词分析作为测量指标,指出“全能型”政府逐渐向“服务型”政府过渡。

邓雪琳通过对中央政府工作报告高频词的计量分析,回溯性地测量了改革开放以来中国政府职能转变的特点。

王印红和李萌竹探讨了地方政府生态环境治理注意力的变化规律,但并未涉及政府注意力变化对环境治理效果的影响。

董纪昌等基于“十三五”以来的住房租赁政策,构建了房地产政策的PMC指数模型,量化评价了六项样本房地产政策。

周海炜等基于PMC指数及其曲面图量化评价分析了我国八项大数据发展政策,并提出了合理的优化路径。

综上所述,国内外学者在政府工作报告和PMC指数模型方面已经取得大量的研究成果。

然而,现有文献较少考虑以政府工作报告为文本来分析能源与环境保护政策。

本文基于PMC指数模型计算各项政策的PMC指数并绘制PMC曲面图,量化评价各项能源与环境保护政策,探究政府注意力变化对能源与环境保护政策的影响。

二、能源与环境保护政策量化评价
由于政策文本数量庞大且无效信息较多,通过阅读所有政策文本并从中筛选关键词来形成有效信息,工作量巨大。

因此,本文基于PMC指数模型对能源与环境保护政策进行文本挖掘及评价分析,以期为政府工作提供有效参考。

(一)政策选取
本文选取了一份中央文件和八份具有代表性的省份政策文件作为能源与环境保护政策量化评价实证研究的数据来源,具体如表1所示。

中央政策文件在发展和环境保护政策分析中具有指导意义,另外选取的八个代表性省份是北京市、四川省、黑龙江省、山东省、山西省、上海市、湖北省、广东省。

作为首都,北京市的环境保护政策更为重要,能够给其他省份做一个明确的参考。

作为西电东送路线的起点,四川省拥有丰富的水能资源,其提高能源利用率的方法对其他省份具有借鉴意义。

黑龙江省是我国最大油田——大庆油田的所在地,其能源转型方案尤为重要。

山东省的能源消耗总量和主要污染物排放量均居全国前列,未来能源的发展方向变化是研究山东省政策文本需要关注的重点。

作为西气东输路线的三个代表性省份,山西省、上海市和湖北省结合各自的
表1 九项政策组合汇总
序号名称发文字号发布日期1“十三五”节能减排综合工作方案国发〔2016〕74号2017年1月5日2北京市进一步促进能源清洁高效安全发展的实施意见京政办发〔2015〕28号2015年5月14日3四川省“十三五”能源发展规划川府发〔2017〕12号2017年2月23日4黑龙江省能源发展“十三五”规划黑发改煤炭〔2017〕568号2017年12月25日5山东省新能源产业发展规划鲁政字〔2018〕204号2018年9月17日6山西省人民政府办公厅关于推进全省煤炭洗选行业产业升级实现规范发展的意见晋政办发〔2019〕58号2019年8月2日7上海能源发展“十三五”规划沪府发〔2017〕14号2017年4月11日8省人民政府关于加快推动能源生产和消费革命的指导意见鄂政发〔2015〕9号2015年1月19日9广东省能源发展“十三五”规划无2018年7月6日
146
经济发展状况,对能源政策的研究具有重要意义。

西电东送的输
入地广东省响应国家号召大力发展光伏产业,已然成为光伏产业的领先者。

同时,本文选取的八个代表性省份也考虑到其所在的地理位置及经济发展状况。

北京市、广东省、上海市、山东省位于东部地区,黑龙江省、山西省、湖北省位于中部地区,四川省位于西部地区。

(二)变量分类及参数识别
本文结合能源与环境保护政策的自身特点,共设置10个一级变量和45个二级变量来构建能源与环境保护政策的PMC指数模型,变量均采用二进制位数,假设45个二级变量所占的权重相同,若满足变量定义条件则记为1,不满足变量定义条件则记
为0,具体如表2所示。

(三)计算PMC指数值
首先,基于公式(1)和公式(2),根据政策内容对二级变量进行赋值;然后,根据公式(3)分别计算一级变量;最后,根据公式(4)对一级变量加总,得到政策PMC指数。

(1)
(2)
(3)
(4)其中,式(3)中,t为一级变量,j为二级变量,T为各项的和。

根据PMC指数,可以有效分析各项能源与环境保护政策的实施力度。

同时,根据各项政策的PMC指数及政策评分等级对各项政策进行排序和分析,具体如表3所示。

(四)绘制PMC曲面
本文最初选取了10项指标,但由于所有政策文件里都具有文件引用(X10),该指标对政策评价并无影响。

因此,为了矩阵的对称性,剔除X10,利用Matlab软件绘制九项能源与环境保护政策的PMC曲面图,具体如图1所示。

(五)各项政策的PMC曲面评价
政策性质(X1)、政策功能(X2)、政策时效(X3)、政策评价(X4)及社会效益(X5)共同决定了政策的有效性,激励措施(X8)和保障措施(X9)可以表现政策作用手段,作用客体(X6)和政策级别(X7)则可以反映政策作用机制。

根据各项代表性能源与环境保护政策的PMC指数及PMC曲面图,分别从政策有效性、政策作用手段及政策作用机制等方面对各项政策
表2 政策变量设置
编号一级变量编号二级变量编号二级变量
X1政策性质
X1:1描述X1:2识别
X1:3建议X1:4导向
X1:5支持X1:6保障
X2政策功能
X2:1明确职责X2:2分类监管
X2:3联动管理X2:4规范引导
X2:5合作创新X2:6制度约束
X2:7环境优化
X3政策时效
X3:1短期(<3年)X3:2中期(3-5年)
X3:3长期(>5年)
X4政策评价
X4:1依据充分X4:2内容详实
X4:3规划科学X4:4目标明确
X4:5鼓励创新
X5社会效益
X5:1环境保护X5:2产业发展
X5:3基础设施建设X5:4可持续性
X5:5健全机制
X6作用客体
X6:1产业X6:2企业
X6:3管理体系X6:4相关部门
X7政策级别X7:1国家级X7:2地方级
X8激励措施
X8:1人才激励X8:2税费优惠
X8:3财政补贴X8:4法律保障
X8:5土地供应X8:6政策支持
X8:7资金投入X8:8便利服务
X8:9知识产权
X9保障措施
X9:1行业自律X9:2政府监管
X9:3行政处罚X9:4法治规范
X10文件引用
表3 九项能源与环境保护政策的PMC指数及排序
对比项国务院北京四川黑龙江山东山西上海湖北广东平均值X1 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 X2 1.00 1.00 1.00 1.000.860.71 1.00 1.000.710.92 X30.330.330.330.330.330.330.330.330.330.33 X4 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 X5 1.00 1.00 1.000.80 1.00 1.00 1.00 1.000.800.96 X6 1.00 1.00 1.00 1.00 1.000.750.75 1.000.250.86 X7 1.000.500.500.500.500.500.500.500.500.56 X80.890.330.780.670.780.330.560.780.330.60 X9 1.000.50 1.000.500.50 1.000.50 1.000.500.72
X10 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 PMC指数9.227.678.617.807.977.637.648.61 6.437.95排名162548729
政策力度优秀良好优秀良好良好良好良好优秀可接受良好
147
148
进行评价分析。

X1、X2、X3、X4及X5的平均值为0.84,说明目标省市各项政策具有良好的有效性,各省市在做到保障社会利益的同时,能够积极推进能源发展与环境保护,有效落实政策的实施与后续发展。

X8和X9的平均值为0.66,说明政策的作用手段较差,强有力的作用手段能够起到鼓励及约束作用,目标省市后续政策应注意加强在政策作用手段方面的力度。

X6和X7的平均值为0.71,说明政策的作用机制有待完善,扩大作用客体将有利于提高政策的作用机制。

三、政府注意力研究
(一)数据获取
本文在中国政府网站及各省人民政府网站,采集2006-2020
年间国务院及31个省份(或直辖市)的政府工作报告,共获得8262511字的文本数据,以此作为数据源,分析能源与环境保护方面的政府注意力。

(二)中文分词及去停用词
本文将收集到的475份政府工作报告进行分词及去停用词处
理。

首先,采用jieba 中文分词模型进行分词处理。

其次,借鉴停用词表,将“加快、建设、推进、发展、加强以及、以上、实施、实现、期间”等指代不明的词语和虚词加入停用词表中,进而得到停用词表,完成停用词处理。

(三)主题词词频统计
TF-IDF 算法可以用来衡量字词对于语料库中一份文件的重
要程度。

字词的重要性与其在文件中的出现次数成正比,并且与其在语料库中的出现频率成反比。

TF-IDF 算法的公式如下:
(5)
(6)
其中,F jc 词汇j 在文本c 中的出现频率,N jc 是文本c 中含有词汇j 问题的数量,N c 文本c 中所有问题的数量,K 是文本c 中所有词汇的数量,即经过分词及去重处理之后获得的词汇列表中的词汇数量,是分类的总数量。

基于475份政府工作报告文本数据,利用TF-IDF 算法获取具有实际意义词语的TF-IDF 值,并编写Python 程序,通过类比相关的能源与环境保护类文本,提取政府工作报告中关于能源与环境保护的主题词,将国务院及各省份(或直辖市)处理结果排名前70的词语分别保存到TXT 文档中。

本文提取了475份政府工作报告中排名前列的能源与环境保护类主题词,根据其TF-IDF 值,制作了主题词词云图,具体如图2
所示。

图2 政府工作报告中能源与环境保护主题词词云
图1
九项能源与环境保护政策的PMC曲面图
149
图3 政府工作报告中能源与环境保护主题词的语义网络
由图2可知,国务院及全国各省份(或直辖市)政府对于能源与环境保护方面的注意力主要集中在煤炭领域。

其中,加强企业管理以及完善产业体系是各地政府聚焦的重要举措。

在推动环境保护方面,政府更加重视技术,鼓励和推动再生能源。

新能源的发展已经成为国务院及各地政府一致强调的重点项目。

通过编写Python 程序,利用NetworkX 软件包,制作了政府工作报告中能源与环境保护类词语的语义网络,结果如图3所示。

由图3可知,国务院及全国各省份(或直辖市)政府对于能源与环境保护方面的注意力以能源与环境保护体系建设为中心,企业、产业为副中心向外扩张,关注领域包括天然气、电力、煤炭、新能源及再生能源等,其中,对于新兴能源(如再生能源、新能源)体系建设的重视程度要高于传统能源(如天然气、煤炭)。

结语
能源与环境保护政策的推进与落实很大程度上影响国家经济的顺利发展与人民生活的健康保障。

本文以2006-2020年国务院和31个省份(或直辖市)的政府工作报告为样本,基于PMC 指数模型对能源与环境保护政策进行量化评价,分析了各省市对能源与环境保护政策的政府注意力。

研究结果表明:① 政府对生态环境问题的重视程度会影响环境治理效果,政府注意力水平
越高,环境治理效果越好;② 各地政府在能源与环境保护方面的注意力主要集中于煤炭行业,各省市的政策激励措施均有所欠缺;③ 各地政府对能源与环境保护政策的重视程度存在差异,但整体保持在较高水平,说明政府唯GDP 观念明显转变。


参考文献
[1]陈天祥,杨蕊.地方政府职能转变测量——基于广东省政府工
作报告的文本分析(1981—2015)[J].华南师范大学学报(社会科学版),2017(01):101–112+190–191.
[2]邓雪琳.改革开放以来中国政府职能转变的测量——基于国务院政府工作报告(1978—2015)的文本分析[J].中国行政管理,2015(08):30–36.
[3]王印红,李萌竹.地方政府生态环境治理注意力研究——基于30个省市政府工作报告(2006—2015)文本分析[J].中国人口·资源与环境,2017,27(02):28–35.
[4]董纪昌,袁铨,尹利君,等.基于PMC 指数模型的单项房地产政策量化评价研究——以我国“十三五”以来住房租赁政策为例[J].管理评论,2020,32(05):3–13+75.
[5]周海炜,陈青青.大数据发展政策的量化评价及优化路径探究——基于PMC 指数模型[J].管理现代化,2020,40(04):74–78.。

相关文档
最新文档