贵州省易地扶贫搬迁现状的数据可视化分析——以黔南州为主要研究对象
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、引言
由于经济社会发展滞后,农村贫困问题突出,贵州省长期以来都被视为全国农村贫困人口最多、
贫困面最广、贫困开发任务最重的省份之一。伴随我国迈向全面小康社会的进程进入历史性阶段,
“十三五”时期易地扶贫搬迁时间更紧、任务更重、难度更大,为有序推进“十三五”时期贵州省易地扶贫搬迁工程,顺利完成“十三五”期间对2018年底调整后的全省共188万人口实施易地扶贫搬迁,对当下扶贫搬迁情况的分析总结具有重要意义。从现有的研究来看,主要还是以案例调查为主,缺乏较大规模的实证调查数据支持,并且一些研究年代较为久远,研究结论已无法保证适用于新形势下的易地扶贫搬迁,且很少有学者从微观角度对中国易地扶贫搬迁进行细致深入
的摸底调查。
目前,国内许多学者根据各种各样的理论分析和技术方法,结合当前政策的实际,对易地扶贫搬迁开展了一系列的学术研究。如孙晗霖等通过对有效数据的分析,用地理坐标建立地图可视化,选取构建结构方程模型(Structural Equation M odel )方法来展开对重庆市酉阳自治县易地扶贫生计满意度的研究;陈烨烽等基于国务院下发的数据,建立信息可视化,并通过线性回归及指标贡献度分解挖掘致贫因素,再利用最小方法模型进行分析,得出结论;张全红和周强在已有的多维贫困维度基础上,增添了收入指标维度、建立了多维贫困模型、观察单维度及多维度的贫困发生率,把数据通过文本可视化来展示,最后得出对于当地政策的建议及结论;刘艳华和徐勇建立
贵州省易地扶贫搬迁现状的数据可视化分析
——
—以黔南州为主要研究对象胡楚翼,吴亚星,杨全诚,胡
尧
(贵州大学,贵州贵阳550025)
【摘
要】在相关文献研究的基础上,利用统计分析软件SPSS24.0,通过聚类分析中的层次聚类法和单
因素方差分析法,对黔南州易地扶贫搬迁的现状进行了研究,结合Tableau 软件,对2016年和2017年贵州省黔南州的易地扶贫搬迁数据进行了可视化分析,作出了一些直观而简便的数据可视化图形及有关分析。结合当前政策指向与实际搬迁效果分布,得出结论,为改进易地扶贫工作提出了有效建议。
【关键词】易地扶贫搬迁;聚类分析;数据可视化;Tableau 【中图分类号】F126
【文献标识码】A
【文章编号】1004-2768(2019)08-0080-07
【收稿日期】2019-04-26
【基金项目】贵州大学大学生创新创业训练计划资助项目(贵大国创字(2018)025号)
【作者简介】胡楚翼,女(侗族),湖南会同人,贵州大学经济学院,研究方向:金融统计;吴亚星,女,贵州都匀人,贵州大学数学与统计学院,研究方向:统计学;杨全诚,男(土家族),贵州铜仁人,贵州大学资源与环境学院,研究方向:统计学;胡尧(1971-),男,贵州遵义人,贵州大学数学与统计学院教授,研究方向:应用统计。胡尧为通讯作者。
DOI:10.19374/ki.14-1145/f.2019.08.015
可持续生计方法、分析五大生计资本、剖析脆弱性的相关指标,丰富了多维贫困度量方法,得出相关结论,与政策期望符合。
黔南州位于贵州省中南部,自2016年实施《贵州省易地扶贫搬迁工程实施规划》以来,坚持把易地扶贫搬迁作为脱贫攻坚的重头戏和主战场,充分发挥各部门职能作用和群众主观能动性,成功摸索出了被时任贵州省委书记陈敏尔提炼升华并在全国全省推广的“五个三”易地扶贫搬迁后续扶持服务发展经验,并取得了显著成效。为了探索新时期易地扶贫的主要特征,我们采取了重点对象分析法,通过实地调查与走访,采集到了黔南州易地扶贫搬迁现状的第一手数据,本文采用聚类分析的方法对黔南州易地扶贫调查数据进行了研究并利用Tableau软件对2016—2017年贵州省易地扶贫搬迁数据进行可视化分析。
二、研究方法与数据来源
(一)研究方法
本文所用的聚类方法是层次聚类法(Hierarchical Cluster Analysis)。本文从宅基地流转率、山林地流转率、承包地流转率、就业落实率、已投资经济占比和贫困发生率这6个指标对我们所要研究的56个安置点进行层次聚类分析。
首先,考虑是否有必要把6个变量都作为分类变量时,我们可以先做一个R型聚类分析,使聚类数为3~5类这个范围内,对这6个变量进行降维处理,输出“近似值矩阵”,得到每个变量之间的相似性系数r jk,有助于变量降维。使用的是最远距离法来计算出R(G i,G k),变量与变量之间的聚类过程使用的是平方欧几里得距离法,得到d i。
r jl=
n
i=1
Σ(x ij-x軃j)(x il-x軃l)
n
i=1
Σ(x ij-x軃j)2n
i=1
Σ(x il-x軃l)2
軃軃12(1)
d i(x,y)=
p
k=1
Σx k-y k2(2)
R(G i,G k)=max{d jl}(3)
其次,在确定R型聚类后,对个案进行Q型聚类,即对具体观测值数据(56个安置点)聚类分析,采用瓦尔德方法(Wald M ethod),类与类间的聚类过程采用平方欧几里得距离。
最后,关于聚类效果的验证,本文选用单因素方差分析法对聚类后的各个类别进行分析,利用SPSS中的means过程进行检验,差异显著则结果可靠。
D1=∑(x i-x軃1)T(x i-x軃1)
D2=∑(x j-x軃2)T(x j-x軃2)
D12=∑(x k-x軃)T(x k-x軃)
D(G1,G2)=D12-D1-D2(4)其中:
x軃1=1
n1
∑x
i;x
軃
2
=1
n2
∑x
j;x=
1
n1+n2
∑x
k
(二)数据来源与指标选取
考虑到数据的可得性和分析的客观性,我们把研究空间从贵州全省范围聚焦到黔南州的县份、安置区,有针对性地分析该地区的搬迁现状和扶贫工作的推进情况。本文所得的相关数据主要包括安置地情况数据和基础地理空间数据两部分。前者主要来源于黔南州人民政府网依申请公开的易地扶贫工作数据及披露出来的资金使用情况;后者基于ArcGis软件的应用,提取了各个安置点以及县市级的经纬度坐标,有利于热力图的分析与应用。同时,采用了聚类分析方法和方差分析法对黔南州2016年扶贫搬迁安置点的指标变量划分及类型区域划分,分为了五类变量指标和6类安置点区域。
(三)数据可视化软件介绍
Tableau软件依靠新的处理引擎,能够处理各种规模数据,并同时保证数据提取分析,提供可视化交互。本文的数据来源于贵州省各市州水库与生态移民局,数据包括2016—2017年贵州省贫困人口数量、贫困发生率等指标,利用Tableau软件和现有数据生成各种图形,并对贵州省易地扶贫搬迁数据进行可视化分析。
x j∈G1 x l∈G2x i∈G1
x j∈G2
x k∈G1∪G2
x i∈G1x j∈G2x
k
∈G1∪G2