类分析的交通小区动态划分方法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

最后,将这所有的c;点相连接,即可得到点集的相应边
界,如图5所示。
遗 彭 、 ?t

确N |
图5边界点相连
4试验平台搭建与实例分析
4.1试验平台搭建 为了检验划分结果的准确度,本文搭建了具有GIS功能
的试验平台。平台使用Java语言进行开发,GIS功能采用 C,oode Maps API解决方案。平台通信过程如图6所示。
目前对于交通小区的研究主要集中在应用层次,在交通 小区的动态划分理论与技术方面的研究有所缺乏。本文针对 交通出行数据的宅间分布特征,利用K—Means空间聚类算法 进行交通小区的自动划分,为城市交通系统的管理、控制及规 划提供技术支持。
2问题的提出
2.1 交通小区概念
交通小区是具有一定交通关联度和相似度的节点或连线 的集合,反映了城市路网交通特征的时空变化特性。交通小区
一86—
万方数据
吕玉强,等:基于出租车GPS数据聚类分析的交通小区动态划分方法研究
技术与方法
的数量在逐渐增加。 表I交通小区平均面积
时间
1995 1995 1997 2001 2002
城市 上海 北京 无锡 苏州 蚌埠
平均面积(k而
6.34 4.00 1.85 1.28 1.11
通过对美国74个城市的交通小区划分结果的分析,得到

8613910943290 123001030l 3986714
11643313

8613910943290 1230010347 3986970 11643313

8613910943290 1230010649 398702l 11638921

8613910943290 123001095l 3986456 l 1636770
【关键词】交通小区;动态分析;k均值聚类;边界计算
【中圈分类号】u12l
【文献标识码】A
【文章编号]t005—152X(20 20)09--0086--03
Dynamic Traffic Zone PartitionBased on Cluster Analysis ofTaxi GPS Data
LV Yu-qiang.QIN Yong,JIA Li-min,DONG Hong-hui,JIA Xian—bo,SUN Zhi—yuan (StateKeyLaboratoryofRailTrafficControl&Safety,BeijingJiaotongUniversity,Beijin9100044。China)
技术与方法
doi:1 0.39694.issn.1005-1 52X.201 0.09.029
物流技术2010年5月刊(总第216期)
基于出租车G PS数据聚类分析的 交通小区动态划分方法研究
吕玉强,秦勇,贾利民,董宏辉,贾献博,孙智源 (北京交通大学轨道交通控制与安全国家重点实验室,北京 100044)
Abstract:The paper optimizes traffic travel data by extracting the Taxi GPS position coordinates of the pas冉enger boarding and alight spots.The paper employs K-means cluster analysis to the partition of traffic zon麟.First it obtains the traffic trip OD matrix through clustering, which is then used as reference for the partitioning of traffic zones.It has also set up a software platform based on Google Maps API.Finally, thraush a experimental study,the dynamic partition method is proven to be able to yield outcomes conforming to the existing traffic zones.
空重牟状态
由于每天的数据量庞大(2.5千万条,天),基于缩短数据
查询时间以及提高褴体运算性能等方面的考虑,需要对原始
数据进行优化。原始数据内容见表4。
表4原始表数据
C凸删ADI)R
UTC
LAT
LaN
STAFLAG
8613910943290 l 230004375 3986265
1164377l

8613910943290 1230004623 3986263 l 1643768
堕堕生塑!:垫堡
工孰掘预处埋
M++
图1 交通小区划分过程
3基于K均值聚类算法的交通小区划分方法
3.1 划分方法
Leabharlann Baidu
本划分方法首先对坐标数据进行空间聚类运算,得到出 行起讫点的OD矩阵,最后以此为依据进行交通小区的划分。
划分过程如图l所示嘲。
3.2出租车GPS数据预处理
试验中所用到的数据来源于北京奇华通讯有限公司,主

i//
彩二f钿,n
\。}j
\劁.·
% ’兮 畅 p
图3 360度分为n份 图4距离中心点的距离
然后.将某个聚类的点集放人该坐标系,使得区域中心点 与坐标原点重合。通过计算其它点与中心所形成的角的正、余 弦,即可得到每个点与中心点所形成的夹角.进而将这些点归 人上一步所划分的区域。依次计算第i个区域里每个点距离中 心点的距离,记录距离中心点最远的点为Ci。如图4中P点等。

8613910943290 12300lll37 3986243
1163—219

3.3聚类计算 经过上一步的数据优化,即可得到甫起讫点数据组成的
数据集。现在需要对这些数据进行聚类运算:一段时间内的起 点或者讫点被划分为若干个区域。每个区域中的点分布紧凑,
~87—
万方数据
技术与方法
物流技术2010年5月刊(总第216期)
到。根据这一特性剔除原始表中的无用数据,优化后的数据见
表5。
COI‘tADDR
表5优化后的数据

_—-JL
UTc
LAT
LON
S1AFLAG
8613910943290 123001030l 3986714
11643313

8613910943290 1230010347 3986970 11643313

8613910943290 123001 1105 3986228 11637248

其中STAFLAG字段代表的是}l{租车的空重车状态,当值
为O时表示车的状态为空车,值为l时表示车的状态为重车。
当STAFIAG值由0变为1时,STAFLAG值为l的车的位置 即为乘客上车时的位置;相反地,乘客下车时的位置也可以得
首先从n个数据点随机选择k个点作为初始聚类中心; 通过运算其它点与这些聚类中心点的相似度(距离),将其分 别分配给与其相似度最高(距离最近)的中心点所在的聚类; 然后对划分好后的聚类重新运算聚类中心m。这一过程不断重 复直到标准测度函数开始收敛I“。 3.4对区域数据进行边界运算
聚类运算结束之后,得到若干组包含中心点在内的一些 坐标点,如图2所示(点x表示出租车的坐标点,实心圆点表 示交通小区中心)。
区域与区域之间自然分开。本文采用了K—Means聚类算法。 K—Means聚类算法是一种分割式聚类方法.它是数据挖掘技 术中一种经典的基于划分的聚类算法。其目的在于从大量数 据点中找出具有代表性的数据点,即中心点,然后再根据这些 中心点进行后续的处理。
K—Means算法采用了迭代更新的运算思想,聚类过程如 下:
城市区域规模与交通小区面积、人口间的关系141,见表2。
表2人口与交通小区面积的关系
,NX面洲
小l一人口/人
人H/万人
范围
、Ⅳ匀值
范围
平均值
<7.5
O.罄一曩25
1.38
120—2 700
872
7.5—1&O
0.6-8.48
2 77
357一l 692
954
l&伊3cLo O.60一10.03
&30
545 2 400
【收稿日期]20t0-03—04 【基金项目】国家科技支撑计划项目(2007BAKl2804—15);国家“863”高科技资助项目(2006AAIlZ231);北京市科技计划重点项目
(I)()7020601400707);北京市教育委员会学科建设与研究牛教育建设项目 【作者简介】吕玉强(i983一),男JIJ东东营人。北京交通大学交通运输学院研究生,主要研究方向:安伞技术及工程。
Keywords:trafiqc zone;dynamic analysis;K-means cluster;,boundary calculation
1 引言
一个完整的城市交通系统非常庞大、复杂,这种情况使得 数学建模、交通问题分析求解的困难、复杂度提高。将完整的 城市交通系统按照交通流向、路网布局等特性划分为若干交 通小区,然后对不同的交通小区进行数学建模,町以有效地降 低这种复杂性。
具有同质性、关联性、动态性、稳定性、自组织性等特性111。 交通小区的划分是分析城市交通刚络的一个很好的方式,
因为交通小医内具有相似的交通特征和较强的交通关联性。 交通小区的划分与该城市的人口、面积、经济特征、产业结构 等密切相关12|,并在一定程度f:反应了一个城市的吸引力。
一般来说,交通小区的划分应该遵循以下原则㈣: (1)同质性。分区内的经济、社会等特性尽苣一致。 (2)小区划分尽量不打破行政区的划分,以便可以利用行 政区的统计资料。 (3)分区数量适当,中等城市不超过50个.大城市最多不 超过100-150个。数量太多将加重规划的工作量,数量太少又 会降低调查和分析的精度。 (4)对于已做过OD调查的城市,最好维持原已划分的小 区。 2.2交通小区划分概况 国内部分城市在不同时期的交通小区的平均面积见表l。 可以看}}j,单个小区的平均面积有逐年变小的趋势。划分小区
要包括车辆GPS实时数据和车辆类犁等相关数据信息。原始 数据表主要保存了出租车上装配的GPS终端所采集的数据,
这些数据包括设备通讯地址、UTC时间、经纬度、速度以及该
车的空重车状态等。字段定义见表3。
表3原始表数据定义
字段名
含义
C0删ADDR UTc LAT LaN 旺AD
SPⅡ卫 STAFL^G
终端通讯地址 UTc时『HJ 维度 经度 方向 速度
【摘 要】对交通出行数据进行优化.抽取m租车载客过程中乘客}=下车的GPS佗置坐标。基于聚类与交通小区划分的相似
性,采用K—Means聚类法进行交通小Ⅸ的划分。首先,通过聚类得到交通出行OD矩阵。然后据此划分出交通小区。基于Goosle
Maps APl,搭建r软件平台。通过试验可以看出,这种动态划分方法得到的区域能够与现有的交通小区相吻合。这种高实时的交 通小区划分方法将对动态的OD估计有着极大的参考价值。
一88一
图6系统通信 4.2实例分析
通过上述方法,利用2008年8月3号北京市出租车GPS 数据进行交通小区的划分,并将划分结果输出到GIS平台上, 如图7所示。
图7区域划分结果 可以看出这种动态划分方法产生的结果能够与现有的部 分交通小区相吻合(标注A为CBD小区,标注B为西郊小 区)。详细的OD矩阵数据见表6。 表6中“O”代表起点,“D”代表讫点。比如坐标位置(2,5) 的值为2,代表某一段时间内。共有2辆出租车从5号区域前 往2号区域,并且乘客是在5号区域上车,在2号区域下车。
图2坐标点
将所有聚类后的坐标通过GIS平台输出,通过这种方式 很难看出不同区域之间的界线。这时需要将区域的边界绘制 出来。本文采用的边界运算过程如下:
首先建立平面直角坐标系.将坐标系以(0,0)为中心点均 分为n等份区域(n的值将决定边界运算结果的精度)。每个区 域的角度为3601n。如图3所示。
心; I眵 |
1四6
30.O一100.0 2.03_25.68
五55
1 316—7 175
2 828
>IOO
1.45<j3.32
7.83
2 214—24 6围
7 33国
传统的进行交通小区划分的方法主要基于大规模的人工 抽样调查。这种划分方法成本高、周期长.调查的数据存在抽 样率低、抽样统计的精度不高、数据更新周期长等问题。由于 我国大部分城市正处于快速发展期,土地利用不断变化,人口 高速增长闭,通过这种方式进行交通小区的划分时效性较差。 本文通过交通出行数据的聚类运算,提供实时的交通小区的 分布状态。这种快速、动态的划分方法弥补了传统划分方式的 不足。
相关文档
最新文档