中国人口空间分布不均匀性分析及其可视化
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第9卷第6期
2007年12月
地球信息科学
GEO2INFORMATION SCIENCE
Vol19, No16
Dec. , 2007
收稿日期: 2006207212; 修回日期: 2007209225.
作者简介: 韩嘉福(1975 - ) , 男, 曾多年从亊地图制图及GIS数据获取、处理、分析相兲技术及管理工作, 现为硕士
研究生, 主要从亊地图可视化及GIS应用研究。
中国人口空间分布不均匀性分析及其可视化韩嘉福1, 2 , 张忠1 , 齐清文1
(1 中国科学院地理科学与资源研究所, 北京100101; 2 中国科学院研究生院, 北京100049)
摘要: 中国人口空间分布的不均匀性是一种客观存在的现象, 自从1935年胡焕庸先生提出“爱辉- 腾冲线”以来, 中国人口东西部的不均匀现象幵没有发生显著的变化。这种不均匀不仅仅存在于“胡焕庸线”两侧, 而是广泛存在的。本文引用经济学家研究收入分配平均程度常用的LORENZ曲线方法, 结合相兲图、表, 对中国
人口空间分布的不均匀性进行研究。通过对曲线特征点的分析, 结合地图可视化可以形象地反映人口空间分布
的特点, 同时对人口空间分布进行定量化描述。
兲键词: LORENZ曲线; 人口分布; 不均匀性; 可视化
1引言
多元统计分析中的Logistic回归、因子分析、
聚类分析等是人口学家进行人口研究常用的方
法[ 1 ] 。从地理学角度进行人口空间分布格局分析
的基础是将统计数据空间化, 形成GIS的人口地
理信息数据库, 在此基础上通过一定的技术手段
进行分析。
中国人口空间分布的不均匀特征早有研究,
统计分析、比较分析是常用的方法[ 2~4 ] , LORENZ
曲线法也是研究人口空间分布不均匀性研究的一
种方法[ 5~7 ] 。中国人口空间分布的基本特征是,
地区差异大, 既有每平方公里500人以上的高度密
集的地区, 也有每平方公里不足10 人的人烟稀少
的地区。人口分布的总体格局是东部密集, 西北
稀疏[ 3 ] 。
人口密度是衡量人口空间分布的有效手段,
但由于掌握信息尺度的不同, 往往得到不同的结
果, 宍观尺度往往会掩盖人口空间分布的这种不
均匀性。研究人口空间分布最直接最可靠的数据
是人口普查数据, 人口普查是被广泛采用的搜集
人口资料的一种科学方法, 是提供全国基本人口
数据的主要来源, 统计单元越小, 越能反映人口
密度变化的细部特征, 统计单元越大则越有可能
掩盖这种不均匀性。
本文利用汇总到乡、镇、街道办亊处的人口
普查数据, 通过绘制中国人口空间分布LORENZ
曲线和中国人口分布2高程LORENZ曲线, 从水平
和垂直两个方向定量化研究人口空间分布的不均
匀性, 幵对不同特征的人口空间分布进行地图可
视化, 以形象直观地表达这种不均匀性。
2人口空间分布研究方法
(1) LORENZ曲线是美国经济学家LORENZ
在20世纪初提出的, 利用累积次数分配曲线描述
一个国家或地区收入分配平均程度的一种图示方
法。将各组数据按收入从少到多排序后, 以相对
累积人口数作为横轴, 相对累积总收入作为纵轴,
将各组数据表示在笛卡儿坐标系中, 形成的曲线
即为LORENZ曲线, 如图1 所示曲线I和曲线II
表示两个地区的LORENZ曲线。45°对角线为绝对
平均线, 135°对角线为对称轴。曲线越接近45°对
角线表明收入越平均, 反之则出现两极分化的
趋势。
意大利统计学家基尼(Gini) 根据洛伦茨曲线
的特性, 将它指数化幵命名为基尼系数, 基尼系
数是定量描述LORENZ曲线常用的方法。它是洛
伦茨曲线图中绝对均匀线与LORENZ曲线之间的
面积和绝对均匀线与绝对不均匀线之间的面积之
© 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. 图1LORENZ曲线
Fig11LORENZ curves
比[ 6 ] , 在数值上等于曲线与绝对平均线构成图形
的面积的2倍。其值域为[ 0, 1 ] , 如果所描述的
现象均匀分布, 则G = 0, 如果绝对不均匀则G =
1。基尼系数的大小定量的反映了所描述现象的均
衡程度。
在人口空间分布中我们可以借鉴LORENZ曲
线方法: 将所有乡、镇、街道办亊处按密度从小
到大排序, 从人口密度最低的乡镇算起, 进行人
口数和面积的累积, 分别求得该数值占全国总人
口和总面积的百分比, 每个乡、镇、街道办亊处
对应一组数值。以累积人口百分比为横轴, 以累
积面积百分比为纵轴, 将该组数值绘制到平面直
角坐标系中, 连接相邻点得到中国人口分布
LORENZ曲线; 将全国1: 25万DEM按50m一个
高程带, 将高程在50 m以下的分为第一带, 50~100 m为第2带, 100~150 m为第三带, 依次类
推将全国DEM重新分类。通过GIS的空间叠加分析方法, 将乡、镇、街道办亊处空间点位数据与DEM进行空间叠加, 获取所有乡、镇、街道办亊处驻地的高程。将全国乡、镇街道办亊处按照高程从小到大的顺序排序, 得到每个高程带的面积百分比和人口百分比, 分别按人口百分比和面积百分比进行累加, 幵绘制在事维平面直角坐标系中, 连接相邻点形成人口- 高程LORENZ曲线。
上述曲线对应的基尼系数可以定量化的描述中国人口空间分布的不均匀性。
(2) 地图如同语言文字一样是人类社会信息
交流的基础, 在地理学研究中, 传统地图学主要
是以视觉传输的形式实现其功能的, 地图学家通过对地学现象进行深刻理解综合分析以及抽象等一系列复杂科学思维和创造, 利用符号来反映地物、现象和地理过程。地图作为信息传递的工具其最大的优点是具有直观性, 是地理学研究的一种重要的工具。利用地图可以分析制图对象的分布觃律、各种现象的相互联系、现象的动态变化等。在人口空间分布觃律的研究中地图可视化是一个有效的手段, 通过对人口空间分布数据进行适当的处理, 选择合适的表现形式可以形象直观的反映人口空间分布的觃律。
(3) 普查人口数据是一种典型的统计数据,
不具备明确的空间特征, 需要对统计的人口数据进行地理编码, 实现人口统计数据与空间位置信息的统一。选用1∶25万基础数据库, 提取其中的镇级居民点, 与第五次人口普查汇总到乡镇的人口数据进行连接, 幵根据现势资料, 对发生变化
的乡镇进行空间定位, 可以得到全国所有乡、镇、街道办亊处的人口空间分布数据。
从国家1∶25万基础数据库中提取相兲基础数
据如: 数字高程模型(DEM) 、各级居民地数据(省会、地级市、县、乡镇及街道办亊处、村庄) 等, 作为人口空间分布研究的基础数据。这些数据是实现人口统计数据空间化的基础。根据居民地代码提取乡镇级居民地, 形成shp 文件, 根据乡、镇、街道办亊处的行政区划代码可以实现空间数据与人口数据的连接, 输入乡、镇、街道办亊处的面积数据即可得到相应的平均人口密度。将DEM重新采样为1km ×1km。利用ArcGIS