手机信令数据研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据质量情况分析
类型天
平均用户数
平均总记录数 平均单位用户记录数
周末
5373392
214935680
40
周一
5345430
267271500
50
周五
5385325
296192875
55
平时工作日
5265075
247458525
47
国庆
5426703
232494823
43
40条以上
03
PART
关键算法技术研究
5.6 江北江南的人口和岗位分布情况
• 江北新区不同年龄段切片人口岗位分布
22~35岁人口分布
22~35岁岗位分布
不同年龄段人群居住和工作活跃地不一样。
60岁以上人口分布
36~60岁岗位分布
5.7 江北江南的人口和岗位分布情况
• 江北新区不同年龄段切片人口岗位分布
从年龄切片数据来看,江北新区是年龄结构比较年轻的组团,18~25岁人口占比最大,40 岁以下人口占总人口的比例约为62%。60岁以上人口占比为8.31%,尚未达到老龄化社会。
Gsd Age Cov
居住与工作人口空间联系结果表
字段类型 String String String String Int
字段含义 居住地栅格编号(500*500m) 工作地栅格编号(500*500m)
归属地 年龄段 人数
常住与流动人口统计数据
字段名称
Date F
Gsd Age Mark Cov
人口流动结果表
职住判别算法研究
职住判别算法研究
① 夜间在家时段 居民夜间在家时段为22点至次日6点
② 夜间在家停留时长分析(候选栅格的判断标准) 夜间停留时间>2小时,出现天数频率>阈值
用户居住地判断流程:
阈值选取范围0.5-0.8 根据RMSE判断结构性偏差
③ 如果用户仅识别出一个夜间停留地点,则该地点 即为家
(当一个国家或地区60岁以上老年人口占人口总数的10%,或65岁以上老年人口占人口总数的7%,即意味着这个国家或地区的人口处于老龄化社会)
40岁以下人口数量占比
40岁以上人口数量占比
5.8 江北江南通勤出行情况分析
早高峰时段各行政区通勤期望线
• 全市各行政区工作日早高峰通勤OD
九个行政区的区内早高峰出行OD量均大于除自身外的其他行政区, 即早高峰区内出行明显。道里区、南岗区和香坊区具有较强岗位吸引的 出行需求,九区范围内早高峰通勤量为326660人。
25.00% 20.00% 15.00% 10.00%
5.00% 0.00%
0
100
200
300
400
500
600
日均信令数
数据质量分析结果
各类型天各时段信令数分布
10.00%
周末
周一
周五
平时工作日
国庆
5.00%
除国庆外来人口大量 涌入外,其他类型天信 令数据产生规律稳定。
0.00% 0 1 2 3 4 5 6 7 8 9 10111213141516171819202122232425
家
移动用户24小时的连续记录形成轨迹,追踪人的出行活动
工作 休闲、娱乐、办事…
反映人口岗位现状
通过连续样本可以确定单个手机用 户的居住地和工作地,从而确定出 行链特征
对城市空间结构的判断
手机数据可以识别并获取全省乃至全国范围的数据,从而可以 从国家、区域层面来分析数据,获得过去难以达到的视野高度
特征人群分布分析
④ 如果识别出多个夜间停留地点,出现频率最大 和总时长最大的地点即为家
⑤ 居住地扩样分析
职住判别算法研究
① 白天工作时段 居民白天工作时段为09点至18点
② 白天停留时长分析(候选栅格的判断标准) 白天单次停留时间>3小时,出现天数频率>阈值
用户工作地判断流程:
阈值选取范围0.5-0.8 根据RMSE判断结构性偏差
• 外围郊区普遍职住比较低; • 哈尔滨北部区域职住平衡情况要
好于南部区域,跟城市发展还有 产业布局等因素有关; • 平房区出现了较为明显的岗位和 居住的不平衡情况。
5.3 江北江南的人口和岗位分布情况
• 九区范围内总体人口岗位分布
行政区级别人口岗位密度分布
街道办事处级别人口岗位密度分布
交通小区级别人口岗位密度分布
本项目采集的手机信令数据由黑龙江省移动公司提供。采集研究范围内中国移动手机用户 (包含漫游至该区域的手机用户)产生的手机信令数据。哈尔滨市市域采集的手机基站共 71361个,结合九大行政区范围筛选后基站数量为52581个。
数据加工处理(数据标准化)
封箱法
市域空间栅格化 以栅格形心替代栅格内其他基站
出行信息数据
字段类型 String String String String String String String String String Int Double Double
字段含义 时间戳(精确到小时) 出行起点栅格编号(500*500m) 出行终点栅格编号(500*500m) 居住地栅格编号(500*500m) 工作地栅格编号(500*500m) 是否为进出城(0进城、1出城) 进出城标记(0道口、1机场、2火车站)
双城区
33 361 52 11 392 242 16459 136 176
松北区
109 1946 1335 850 1614
34 24 9576 549
香坊区
396 4476 4008 588 14966 1935 113 1282 31459
5.8 江北江南通勤出行情况分析
• 全市各行政区工作日早高峰通勤平均出行距离
二环至三环之间 781139
647629
531396
0.8
0.68
5.5 江北江南的人口和岗位分布情况
• 江北新区范围内人口岗位分布
在江北CBD区域内工作的人员居住地来源主要在 江北范围内占总居住人口的96%,区内出行强度明显, 跨江交换量较少。
江北新区总体人口岗位分布
江北新区CBD区域岗位密度
江北CBD工作人口居住地分布
各行政区内部平均出行距离为4公里左右,全市9区范围内的早高峰通勤平均距离为7.2公里。 对于岗位所在地的强吸引基本是随着通勤距离的大小而变化,但也有例外,由于呼兰岗位吸引 力不足导致虽然松北和呼兰距离较近但早高峰通勤吸引力不足。
O D 阿城区 道里区 道外区 呼兰区 南岗区 平房区 双城区 松北区 香坊区
字段类型
String String String String String
Int
字段含义
日期 栅格编号(500*500m)
归属地 年龄段 白天夜间标记 人数
出行信息数据
字段名称 Timestamp
F_from F_to
F_home F_work Mark_city Type_city
Gsd Age Cov Dis Time
04
PART
主要中间成果表
常住与流动人口统计数据
字段名称 F
Gsd Age Cov_home Cov_work
职住人口结果表
字段类型 String String String Int Int
字段含义 栅格编号(500*500m)
归属地 年龄段 居住人数 工作人口
字段名称 F_home F_work
③ 如果用户仅识别出一个白天工作停留地点,则该 地点即为工作地
④ 如果识别出多个白天停留地点,出现频率最大 和总时长最大的地点即为工作地
⑤ 工作地扩样分析
职住判别算法研究
出行OD算法研究
3个用户一段时间内的轨迹图 基于有效停靠点算法得到的中间表,根据用户相邻停靠点的出 行距离(大于500M),停靠点停留时间(大于30分钟)作为特征 判断阈值。
1
LAC
位置区编码
2
CellID
基站编码
3
Lon
基站位置的经度
4
Lat
基站位置的纬度
工作思路
技术路线
02
PART
哈尔滨数据情况介绍
研究范围
研究范围:
覆盖9个行政区(南岗区、道里 区、香坊区、道外区、松北区、平 房区、呼兰区、双城区、阿城区) 以及相对应的交通小区区划。
数据范围与数据周期
• 数据范围
道外区
165 4716 23293 505 10154 159
37 1185 3711
呼兰区
20 999 848 15876 834 55
1 1813 288
南岗区
449 9566 5371 891 45759 1279 315 2062 9783
平房区
100 277 61 65 944 9873 124 56 3588
归属地 年龄段
人数 出行距离(米) 出行时耗(秒)
24小时人口分布数据
字段名称
Timestamp F
F_home F_work
Gsd Age Cov
24小时人口分布数据
字段类型
String String String String String String
Int
字段含义
时间戳(精确到小时) 栅格编号(500*500m) 居住地栅格编号(500*500m) 工作地栅格编号(500*500m)
5.4 江北江南的人口和岗位分布情况
• 城市不同范围内职住比分析
二环内居住人口和岗位数量基本持平,但是二环至三环之间,岗位数量为居住人口的68%, 二环外的岗位数量较少,这就导致外围区域的居住人口会发生大量的工作通勤需求来进出二环。
研究范围 居住人口 岗位数量
职住比
城市二环、三环范围人口岗位数量
二环内 814318
哈尔滨岗位分布情况图(行政区/小区)
5.1 哈尔滨市城市人口岗位分布特征
岗位分布(老小区)
人口分布(老小区)
配合叠加的卫星影像 图对各交通小区的人口 和岗位数的分布结果进 行了抽样校核,基本符 合现状特征。
5.2 哈尔滨市职住平衡分析
哈尔滨职住平衡情况分析图(行政区)
• 从行政区层面上来看,职住平衡 情况较高的行政区依次为道里区、 南岗区和香坊区;
手机信令数据应用研究
结合交通状况进行分析
目录
CONTENTS
01 手机数据简介 02 哈尔滨数据情况介绍 03 关键算法技术研究 04 主要中间成果表 05 以案例为导向的指标特征分析 06 冬季数据获取的必要性及未来研究方向
01
PART
手机数据简介
应用背景
城市化 机动化 城市群 外来人口
交通需求压 力的增加
数据范围与数据周期
• 数据周期
2018年6月23日-7月1日和2018年9月13日-10月3日(共30天有效数据),日平均记录 数为用户数为530万,日平均总记录数为2.4亿次,平均用户记录数为50条。日均信令数在 40条的用户频次最高(超过总数的22%),日均信令数的用户频次没有出现异常情况。
用户频率
早高峰时段各行政区通勤起终点出行量分布
O D 阿城区 道里区 道外区 呼兰区 南岗区 平房区 双城区 松北区 香坊区
阿城区
15157 218 185 27 383 137 75 212 422
早高峰行政区级别OD出行量
道里区
320 36401 3474 1077 12493
467 121 2962 4185
阿城区
4.60 55.80 48.11 76.27 50.37 17.73 19.73 73.57 29.58
早高峰行政区级别平均出行距离
道里区
53.58 4.46 11.94 26.26 8.15 25.18 37.13 13.91 13.52
道外区
47.84 9.90 3.82 22.39 6.69 30.41 54.27 14.80 11.55
缓解措施
科学规划 交通基础设
施建设 交通信息化
智慧城市ห้องสมุดไป่ตู้
数据基础、定量分析
结合大数据的利用 (包括手机数据)
为规划、运营、管理提 供支撑
研究目的
01 摸清现状
摸清职住分布现状状情况以及掌握居 民出行时空特征。在此基础上,实现 交通规划、交通设计与交通运营管理 的定量化、科学化、层次化,有助于 对症下药地缓解城市交通问题。
归属地 年龄段 人数
05
PART
以案例为导向的指标 特征分析
5.1 哈尔滨市城市人口岗位分布特征
哈尔滨市人口分布情况图(行政区/小 区)
5.1 哈尔滨市城市人口岗位分布特征
南岗区的人口密度和岗位密度均位列第 一位,其次是道里区和香坊区;平房区的 岗位数相对其他行政区来说较少;外围郊 区的岗位数和人口数普遍低于中心城区。
手机数据既能对海量大样本的全样 数据进行观察,也可以通过长期连 续的数据学习对特征人群行为特征 进行识别
用户画像特征数据与基站信息
序号
1 2 3 4
用户画像特征
字段名称
描述
MSID REGIONID
Age Sex
手机识别号,唯一标识手机 所属区域(归属地)编码
年龄 性别
基站信息表
序号 字段名称
描述
02 丰富数据资源
旨在弥补甲方现有数据采集手段的不 足,通过机房内提取的通用格式的中 间成果数据为哈尔滨市今后相关规划 提供了充足的数据支持。尤其是在城 市空间发展模式的评估、城镇空间联 系判断以及城市群一体化发展评估等 方面提供了有力的支撑。
手机信令数据在交通规划领域中的应用优势
对用户的出行活动的追踪