068.基于多源数据的北京存量空间功能识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于多源数据的北京存量空间功能识别
李颖,段冰若,蔡玉蘅
摘要:多源数据获取技术和应用方法的成熟使城市研究尺度的细化和功能使用主体的行为采集成为可能,对存量空间的识别具有重要意义。
研究利用互联网兴趣点(POI)数据,采取TF-IDF1处理技术去除量级影响,对城市空间单元进行识别和划分;同时结合出租车出行量数据,通过各单元不同时段的人口活力的差异对各功能进行成熟度的解读为城市存量空间识别提供量化依据。
关键词:多源数据,存量空间,功能识别
Abstract:With the maturity of multi-source data acquisition technology and application method,refinement of urban research scale,quantization of functional attributes and the acquisition of function users’behavior are possible,which is of great significance to identifying urban stock space and improving scientificity of urban planning.This paper applies latest place of interest(POI)data,and taking TF-IDF processing technology to remove the magnitude impact,which used to identify the dominant function of urban spatial units.The study found that the commercial distribution of Beijing was clustered,and the eastern part of the city had replaced the core area to become new commercial center.The development of recreational and entertainment functions in South city are still obviously under-developed.Moreover,the paper conducts spatial evolution analysis to clarify the maturity of each function through the difference of the population vitality by the taxi data.Results of the study provide an objective reflection on the spatial function of Beijing,which will help planners understanding functional differences and facilities deficiency in the city,and provide the quantitative basis for the further identification of urban space.Contributing to providing a more scientific reference for enhancing the fairness and livability of the city.
Keywords:Multi-source Data,Stock Space,Function Identification
1引言
城市功能区是城市各项职能及社会活动实现的物理空间载体,城市功能布局的问题往往会成为制约城市经济社会发展的问题,因此一直是城市规划的重点关注对象。
目前国内的城市建设阶段正逐渐由“增量”转向“存量”,北京、上海等大城市受限于政策与土地资源难以进行大量大规模的城市扩张。
局部快速发展与总体结构调整并行互动的特征逐渐凸显[1]。
因此,城市存量功能和城市空间演变的识别,对新阶段认识城市结构、制定实施规划以进行城市建成区的功能优化调整有重要的基础性意义。
然而,城市是由各类不同功能区和使用者相互交错而运行的。
识别这些功能区并理解其分布特征、演化特点在实际操作层面十分困难。
对于城市功能布局曾经产生如中心地理论[2]、重力模型以及其演进的零售引力模型等[3],为城市功能布局与人口出行模式提供了理论支撑。
我国城市地域类型和空间结构的研究起初多通过对大尺度城市空间的定性描述[4]。
一
1Term Frequency-Inverse Document Frequency,是一种用于信息检索与数据挖掘的常用加权技术,应用详解见文章3-1.
些学者利用经济普查和调查问卷获取数据对北京市的功能结构进行了研究,如张珣等利用2004、2008两年的经济普查数据对北京商业网点进行了分析,认为北京市的商业网点的集聚中心主要分布在五环内;冯健等利用天津、北京居民购物消费行为的问卷结果总结出城市居民购物出行的空间圈层结构[5];另外,还有学者通过实地调研对北京的体育设施[6]、医疗设施[7]等专项功能进行了布局研究。
这类研究虽然从空间分布的角度对特定城市功能布局进行了分析,却未能完成对城市功能全面的精确识别。
一方面由于传统数据获取难度大、更新时效慢、数据粒度粗,对各类用地、设施的布局及功能演化难于进行大范围追踪;另一方面城市业态空间与使用者的行为高度相关,而在以往的研究却因为使用者主体行为获取成本巨大而相对缺失,导致城市功能的研究上未能客观完整地反映出城市各类功能的使用情况。
随着大数据的获取和分析技术的逐渐成熟,利用多源数据对城市功能的解读克服了传统研究中存在的数据粒度粗和使用者行为缺失等问题,为城市功能研究提供了较为科学和客观的量化依据。
近些年已有一些学者开始尝试利用POI兴趣点(Point of Interest)进行城市空间的研究,如韩昊英等将POI数据和公交刷卡记录结合后的聚类结果用于城市功能区的重新分类[8];焦耀等利用POI的分布密度研究了广州市的商业业态空间分布[9]。
然而核密度的方法存在规模量级权重因素的影响,只能反映空间集聚程度,不足以对主导功能进行识别;而商业面积计算法等估算模型计算商业活动量,并不能真实反映人流活动情况。
本研究使用POI作为数据基础,同时利用TF-IDF模型去除其规模量级影响来研究城市功能布局。
出租车不同时段出行量的数据也将会引入,作为个功能区人群活动和功能时空演化的重要指标。
本研究将北京市划分为500米*500米的网格细化研究单元,旨在全面、综合和精细的识别北京市目前的存量空间,研究发现北京市商业呈集聚式分布,且城市东部已取代核心区成为新的商业中心;南城休闲娱乐功能发展仍存在明显滞后等空间功能分布特征;对进一步提高存量空间使用效率,规划决策制定提供有量化依据的参考。
2研究数据与范围概况
2.1数据介绍
POI是一种表达真实地理位置的空间点状数据,包含名称、类别、经纬度以及地址等基本信息。
本研究使用的POI是通过百度地图提供的应用程序编程接口采集的2015年初北京市域范围内的5大类、20小类约20万个POI,涵盖居住、商业、娱乐、公共服务设施、交通等大类以及更细分的小类信息(图1)。
图1POI数据样例
出租车出行量数据为北京市2015年12月连续一周的出行量数据,每条数据主要记载了出租车的ID、经纬度坐标、坐标上报时间和出租车行驶状态(包括空车、重车、异常等)。
每日数据总量在5000万条左右,涵盖北京市域内约35000辆出租车,每车上报数据在1500条左右。
图2为出行点分布情况示意。
图2出租车出行点分布示意图
除此之外,研究还使用了北京市区县边界、路网等空间矢量地图数据作为城市功能解读的辅助数据。
2.2研究范围与尺度
研究采取“大范围、小尺度”的分析原则,以北京市六环内为功能识别和人口出行主要研究区域。
为了细化识别尺度,充分发挥POI数据粒度细的优势,研究将北京市划分为500米*500米的空间格网,对POI进行空间分布识别(图中每一个黑色麻点即为一个POI)。
打破传统用地边界,对城市功能分布进行客观反映。
图3研究范围及研究尺度(500米*500米)示意图
3研究方法
本研究以POI功能类型作为反映城市功能的主要指标,以出租车分时段出行量作为反映各功能单元使用主体活力的指标,对各功能单元的功能及该功能不同程度的使用情况进行推演。
具体主要分为四个步骤:第一步对POI数据点和出租车出行数据进行清洗和整理,将之转化为可用于地理空间定位的同等尺度的信息;第二步利用TF-IDF对各类POI信息进行处理,得到去除量级规模影响的各类功能权重;第三步将POI和出租车出行量与空间网格进行关联,可视化功能识别的结果;第四步结合出租车出行量对各类城市功能进行时空演化树分析,从物理空间和使用主体活性两方面出发对城市功能进行识别和推演。
图4研究框架流程图
3.1POI数据加权处理
常见的POI研究中,核密度2是最常用的集聚程度分析方法[9]。
但是密度分析只能反映POI点数据的集聚情况,对功能的分析往往存在识别错误或者无法识别的情况。
因为不同功能的POI在地图均以大小相同的点表示,但在出现的概率却完全不同。
例如,一个小区的规模很大,但其对应的POI点数据可能只有1个,但是其周边存在着大量的餐馆和超市POI
点数据,简单的密度分析会错误地将该地区识别为商业功能主导。
又如某地区不仅餐饮娱乐类POI数量众多,其他类型POI的数量也远远高于其他地区,单纯的密度分析无法识别出该地区的主导功能。
为了解决数据量级问题造成的识别错误,本研究引入TF()-IDF(Term Frequency—Inverse Document Frequency)3词语权重分析方法,以500米*500米为空间单元对北京市的各类POI数量进行计算、确定权重。
其中,TF词频模型应用模型:
其中i为某类POI在此网格单元中出现次数,j为网格单元中POI总数,k为网格数量。
IDF-逆向文件频率应用模型:
2.根据离散点数据插值的不同,计算整个区域的数据聚集状况。
3TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。
字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。
其中D为POI总数,j为种类为i的POI数量。
在计算完每个POI的TF和IDF之后,我们把这两个值的乘积作为这个POI的最后权重,也就是说,如果一个我们计算TF得出的高频POI在某个空间单元中出现频率很高,但是在其他空间单元中出现的频率却很低,那个这类POI则是影响该单元功能识别的高权重种类。
3.2空间关联与可视化
通过TF-IDF加权对所有类型的POI进行再次统计,得到北京1.5万个功能地块各类型POI加权后的结果,即各空间单元基于POI种类加权的功能分布(结果已去掉极小值)。
研究分别对住宅小区、学校科研院所、商业大厦、公司企业、餐饮娱乐和宾馆酒店六类对生产生活影响较大的POI进行空间关联可视化(图5)。
可以明显地发现,住宅小区(居住功能)最为集中分布在北京南二环-北三环的环形区域,如东部崇文门内、朝阳北路、青年路、方庄等地,和西北部的万柳和亚运村等。
相比于单一住宅功能且规模庞大的天通苑、回龙观等新城地区,这类空间单元的居住有着更高多样性和集中度;而学校科研院所类高权重地块则集中分布在西北四环至五环之间,教育资源倾斜非常明显,与北京市的传统教育资源空间分布相符;商业大厦主导功能单元多分布于东三环的国贸,以及中关村和上地等市级主要就业中心内。
但餐饮娱乐类功能在上地却未见明显分布,表明在上地地区,生活服务类配套存在缺失;公司企业类主导地块分布较广。
其中,南四环和亦庄等地分布集中;而值得注意的是,宾馆酒店主导地块全部位于二环以内,包括西直门内地区和前门地区。
图5北京六环内各类功能识别图(500米*500米空间单元)
对各类功能权重的前TOP15‰空间单元进行综合识别可以发现:商业大厦、餐饮娱乐、科研院校和宾馆酒店类功能主导地块均分布在城区北部,北京南城除公司企业外,其他功能主导地块均相对缺失。
虽然北京市于2009年实施了《促进城市南部地区加快发展的城市计划》[10]引导南部地区发展,但南城的发展滞后现象却依旧存在。
从功能空间分布来看南北城的城市面貌截然不同,各功能繁荣程度差异巨大;另外,从商业休闲娱乐主导功能空间分布来看,东三环地区已经取代传统的核心区(西单、王府井等)成为了北京新的商业服务中心。
图6各功能前15‰空间单元分布图(500米*500米空间单元)
3.3关联地块活力的功能时空演化分析
除物理空间功能的分布之外,本研究还引入出租车出行量数据作为空间单元的活力测度指标,探索出行活力对各功能发展阶段的影响,从使用主体出发对地块功能进行进一步评估。
时空演化树[11]是一种关联不同维度的数据对同一主体的不同演化程度进行解析的统计方法。
研究以出租车出行量大小作为功能活性程度的指标,对各主导功能进行分析。
图7利用出租车出行量和POI对城市空间单元功能演进识别框架
空间单元功能演进的识别结果显示,城市东三环(国贸、建外)地区无论商业大厦、公司企业还是餐饮娱乐功能均表现出了较高的活力,功能使用阶段较为成熟,而北四环和南城部分虽然也存在主导功能地块,但其在使用活力上仍存在很大的提升空间。
图8早高峰、晚高峰、全天各功能使用活力分布图
4研究结论
基于出租车出行量、互联网POI数据,本研究完成了对北京市精确尺度的空间功能识别,并对六大与居住生活高度相关的功能类别进行了主导空间单元分布可视化研究与使用情况分析。
从研究方法上,构建了空间功能研究的基本框架,分析得到了全北京市精确到500
米*500米尺度的功能分布,为城市存量规划的局部空间调整和复杂空间识别问题提供了大量的数据支撑和量化依据。
研究结论发现,北京商业服务设施具有明显的集聚分布态势,尤其以东三环(国贸、建外等地区)分布最为集中,且功能使用情况最为成熟。
已逐渐取代西单、王府井等传统的商业中心,成为北京新的商业服务设施集聚地。
另外,北京教育资源向北城倾斜的现象十分显著;而南城除了公司企业这一功能主导空间单元较多外,其他设施均存在功能发展滞后,休闲娱乐功能缺失的情况。
公司企业的空间单元的使用活力也未达到成熟阶段。
可见已经实施多年的《促进城市南部地区加快发展的城市计划》并未见显著成效。
由于商业服务设施与居民“生活中心”息息相关,城市发展应注重这一地区的产业配套设施,
如交通设施、商务大厦、金融服务点等,增强空间的使用成熟度,避免由用地功能分布不均衡造成的社会阶级分异,有针对性地解决城市发展的不均衡性。
研究的不足之处在于评估人口活动和功能使用情况的数据并不完善,后续研究中可对这一步进行数据补充;同时可以对功能时空演化树统计模型进行下一步的完善,即对各功能使用程度成熟后可能发生的功能转变进行预测,对进一步检测城市用地空间演化进行补充研究。
参考文献
[1]杨震,城市设计与城市更新:英国经验及其对中国的镜鉴[J].城市规划学刊,2016(01).
[2](德)克里斯塔勒.德国南部中心地原理[M].商务印书馆.2010.
[3]W.J.Reilly.The law of retail gravitation:Second Edition[M].New York,1953:P5.
[4]王芳,高晓路,许泽宁.基于街区尺度的城市商业区识别与分类及其空间分布格局——以北京为例[J].
地理研究.2015(06).
[5]冯健,陈秀欣,兰宗敏.北京市居民购物行为空间结构演变[J].地理学报.2007(10).
[6]刘熹熹.北京市中心城社区体育设施现状问题及对策研究[D].北京建筑工程学院,2012.
[7]刘静,朱青.城市公共服务设施布局的均衡性探究——以北京市城六区医疗设施为例[J].城市发展研
究,2016(05).
[8]韩昊英,于翔,龙瀛.基于北京公交刷卡数据和兴趣点的功能区识别[J].城市规划,2016(06).
[9]焦耀,刘望保,石恩名.基于多源POI数据下的广州市商业业态空间分布及其机理研究[J].城市观察,
2015(06).
[10]北京市发展和改革委员会.未来的“新北京富有活力的地区”:《促进城市南部地区加快发展行动计划》
解读[J].前线,2009(12):29-31.
[11]王劲峰,葛咏,李连发,孟斌,武继磊,柏延臣,杜世宏,廖一兰,胡茂桂,徐成东.地理学时空数据分
析方法[J].地理学报,2014(09)
作者简介
李颖,北京清华同衡规划设计研究院有限公司,规划师
段冰若,深圳交研中心北京分院,规划师
蔡玉蘅,北京清华同衡规划设计研究院有限公司,规划师。