利用自行车借还记录分析与挖掘空间位置信息_张亦汉_等
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014 年 第 7 期
张亦汉,等: 利用自行车借还记录分析与挖掘空间位置信息
115
为。通过分析可以得出: ①由于实验楼离宿舍较远, 上课时迟到的人数还是占较大的比重; ②从人数分 配上可以看出实验楼的主要功能是服务于教学,而 专门去实验楼办事的人较少( 总共有 15 人) ; ③在 实验楼安排课程的时间上,实验楼上午上课的人数 ( 包括迟到的共有 43 人) 比下午( 包括迟到的共有 78 人) 的人数多。
一、引 言
目前,个体活动行为过程的研究越来越受到国 内外学者的重视,逐渐形成了如时间地理学等的理 论方法[1-2]。时间地理学是一种能够有效分析个体 活动的方法。它认为个体活动只能在特定时间和特 定地点发 生,即 遵 守 时 间 和 空 间 的 制 约[3]。 因 此, 一些学者根据个体受到的限制的不同将其分成如下 几类: ①能力制约,受到个人自身能力( 如休息、用 餐等生理性需求) 制约的一类; ②组合制约,个体为 了进行某种活动( 如社交、聚会等) 和其他人同时存 在于某一特定场所; ③权威制约,由于法律规范等把 个体从某些特定时间和空间内排除的一类。由于每 个人活动均受到空间和时间的约束,因此,一些学者 通过时 空 棱 柱 把 个 人 在 时 空 活 动 的 制 约 用 图 表 示[4-7]。
表 3 一饭和二饭自行车借出数据统计
日期
18 日 21 日
一饭 62 32
借出地
二饭 66 44
4. 上课分析 广东财 经 大 学 三 水 校 区 白 天 的 上 课 时 间 为 8 ∶ 30—10 ∶ 00、10 ∶ 15—11 ∶ 45、14 ∶ 00—15 ∶ 30 和15 ∶ 45—17 ∶ 15。笔者选择去实验楼的人为研究 对象,对借出时间和归还时间进行排序,得出借出时 间和归还时间的间隔时长,再筛选和统计相关信息 ( 见表 4) ,最后分析每条数据的信息及借车人的行
的两个出行人是存在着同学关系的。而借出时间差 和归还时间差相差较大( 5 min 以上) 的,两个出行 人之间没有明显的关系。
表 5 训练样本示例
组数
借出 时间差
归还 时间差
借出地点
归还地点
1
9
2
0
3
0
4
0
5
1
6
0
7
0
8
10
9
1
10
2
3
二饭
二饭
0
二饭
二饭
0
实验楼 二饭
0
一饭
二饭
6
一饭
二饭
0
紫园
李园
0
2. 网点间自行车流动情况 由于出行距离、个人的需求及环境的影响,各网 点间自行车流动次数也不尽相同。从表 2 中可知, 从紫园到实验楼的流动频率最高,其次是紫园借出 并归还的流动情况; 同时也可以发现宿舍区之间流 动频率比较低,而宿舍区到实验楼和饭堂的频率远
3. 就餐分析 笔者认为并非所有到饭堂的人都是去就餐,因 此本文中对数据进行筛选。首先对样本中的数据按 借出地点和归还地点进行排序,找出借出地点和归 还地点一 样 的 数 据,以 判 断 出 行 人 的 行 为 为 就 餐。 根据实 地 调 查 结 果,本 文 认 为 饭 点 时 间 分 别 是 11 ∶ 20—12 ∶ 50 和 17 ∶ 00—19 ∶ 00。若借出时间 和归还时间的时间期间不在饭点,则判断这些人不 是外出就餐,有可能是去拿快递或到小卖部; 否则判 定他们的行为是就餐。经过筛选后,得到如表 3 的 结果。从表 3 可知,在饭点时间,二饭的人数比一饭 的人数稍多,可以推断二饭的规模比较大或饭菜更 丰富、更符合学生的口味。通过实地调查,笔者发现 第二饭堂有 3 层,其中一层为教师餐厅,而第一饭堂 只有二层; 相比第一饭堂,第二饭堂有较多的风味小 炒,学生的可选性较大。此外,笔者还发现第二饭堂 离一教、二教和众多宿舍区近,而第一饭堂只有一个 门出入且地理位置较为偏僻。
表 1 自行车借还记录统计
分布点
一饭 二饭 实验楼 李园 竹园
借车次数
18 日 102 104 143 78 78
21 日 67 49 187 69 108
总计
169 153 340 147 186
归还次数
18 日 117 90 164 68 95
21 日 50 57 144 47 182
总计
167 147 308 115 277
收稿日期: 2013-10-11
基金项目: 国家 重 点 基 础 研 究 发 展 规 划“973 ”资 助 项 目 ( 2011CB707103 ) ; 国 家 自 然 科 学 基 金 ( 41301408 ) ; 广 东 省 自 然 科 学 基 金 ( S2013040016071)
作者简介: 张亦汉( 1985—) ,男,广东五华人,博士,讲师,研究方向为地理信息模型。
研究只能根据数据收集的结果对活动空间的特征进 行粗略的描述,而无法挖掘个体之间的联系,更为重 要的是验证数据往往非常难以获取。
因此,本文拟利用时间地理学概念及其理论,对 地理时空数据进行探讨和分析,可得出描述区域的 规模、个人的行为和研究对象之间的关系; 并将这些 理论和方法应用到广东财经大学三水校区的自行车 借还记录中,分析学生的分布、地点间的联系紧密程 度、就餐偏好分析、课程安排及人际关系情况。
有学者认为个体行为的活动空间还是研究城市 社会空间的重要指标[7-8]。研究个体行为常常采用问 卷调查的方式。该方法也常常应用于个人生活质量、 可达性、社会分异和社会公平等研究[9]。也有学者认 为该方式只考虑起点与终点,却忽略了居民出行穿过 的区域,而这些被忽略的区域对个体活动有着极大影 响[10]。近年来,基于 GPS、手机等定位技术的移动数 据被应用于居民日常活动与出行行为的研究中[11-12], 但是这一技术需要电信运营商的支持。目前,大多数
2014 年 第 7 期
张亦汉,等: 利用自行车借还记录分析与挖掘空间位置信息
113
引文格式: 张亦汉,钟欣梅,李建程. 利用自行车借还记录分析与挖掘空间位置信息[J].测绘通报,2014( 7) : 113-116. DOI: 10.13474 / j.cnki.112246.2014.0240
利用自行车借还记录分析与挖掘空间位置信息
114
测绘通报
2014 年 第 7 期
图 1 三水校区平面图
远高于宿舍间的频率。因此本文认为学生借还车的 目的主要是上课和就餐。
表 2 网点间自行车流动统计
归还点
借出点
总计
二饭 李园 实验楼 一饭 竹园 紫园
二饭 18 18 22 18 16 3
7 23
0 78
实验楼 28 16 21 29 16 33 143
张亦汉1 ,钟欣梅2 ,李建程1
( 1. 广东财经大学 地理与旅游学院,广东 广州 510320; 2. 贵州师范大学 中国南方喀斯特 研究院,贵州 贵阳 550001)
Analysis and Mining of Location Information Based on Bike Records of Lending and Returning
二饭 实验楼
0
实验楼 实验楼
0
紫园 实验楼
8
紫园
一饭
关系
无 同学 同学 同学
无 同学 同学
无 同学
无
真实
同学关系 无关系 合计
表 6 人际关系挖掘精度
分类
同学关系 20 1 21
无关系 2 16 18
合计
22 17 39
四、结 论
结合行为地理学和时间地理学概念及其理论, 对地理时空数据进行探讨和分析,可得出区域的规 模、个人的行为和研究对象之间的关系。通过将这 些理论和方法应用到广东财经大学三水校区的自行 车借还记录中,笔者得到如下结论: ①从借还地点的 频率可以推断出该地点人员的分布相对多少; ②从 自行车借还记录进行分析,可以方便地得出任意两 个地点之间的联系,本文得出宿舍区之间流动频率 低,而宿舍区到实验楼和饭堂的频率高,主要原因是 学生借还车的主要目的是上课和就餐; ③通过在饭 点时间的人员分析,得出去第二学生饭堂的人比第 一饭堂的人多,主要是因为第二饭堂规模较大且离 一教、二教和众多宿舍区近; ④通过在上课期间的分 析,得出广东财经大学三水校区实验楼下午的课程 比上午多; ⑤运用决策树算法可以挖掘出人际关系 的规则,把规则应用到测试样本中能够得出较高的 精度。
本文研究的样本数据来自广东财经大学三水校 区信息学院青年协会举办的“爱在单行”活动,该活 动分别在李园、竹园、实验楼、一饭和二饭设置了自 行车服务点。本文选取了 2013 年 3 月 18 日和 21 日两天的自行车出借信息,分别提取学号、班级、自 行车编号、借出时间和借出地点、归还时间和归还地 点七项数据,最终得到 1130 条信息作为样本,将样 本记录保存为 Excel 文件。
ZHANG Yihan,ZHONG Xinmei,LI Jiancheng
摘要: 目前,大多数基于个体空间位置信息的研究只能对个体活动空间的特征进行粗略的描述,而无法挖掘群体偏好和个体间的
关系。本文结合利用时间地理学理论方法,对地理时空数据进行分析和挖掘,得出个人活动区域的规模、个人行为及其相关对象
35
15 ∶ 30 15 ∶ 45
6
15 ∶ 45 17 ∶ 30
7
分析
准备上 1、2 节课 上课迟到
准备上 3、4 节课 上课迟到
办事,如充饭卡费 准备上 5、6 节课
上课迟到 准备上 7、8 节课
上课迟到 办事,如充饭卡费
5. 人际关系分析 在时间地理学中,个人和集体为了进行某项活 动而必须同其他人同时存在于同一场所的制约被称 为结合限制,如社交、聚会等活动。在本文样本中存 在着相同或相近的借出时间和归还时间、借出地点 和归还地点,借鉴结合限制的概念,笔者可以认为这 些数据反映了出行人之间的关系。笔者对 18 日样 本中的借出时间和归还时间、借出地点和归还地点 进行排序,随机抽取 78 组借出地点和归还地点相 同、借出时间和归还时间相近的数据。然后把这 78 组随机分为两组,每组各有 39 个样本。第 1 组为训 练样本( 见表 5) ,此训练样本中包含借出和归还时 间差、借出地点和归还地点及关系。第 2 组为测试 样本,包含了借出和归还时间差、借出地点和归还地 点。本文应用 Clementine 数据挖掘软件中的决策树 C5 算法,对训练样本数据进行挖掘得出规则,然后 应用到测试样本中,检验规则的准确性。 把规则应 用 到 测 试 样 本 中,可 得 到 分 类 结 果。 把该分类结果和真实情况对比,结果见表 6。 由表 6 可知,决策树挖掘的总精度达到 36 /39, 约为 92.3%,说明了本文中的训练样本具有较高的 可信度,同时也说明了采用数据挖掘方法能够很好 地从位置数据中挖掘出人际关系。通过分析数据还 可以发现,在借出地点和归还地点相同的前提下,借 出时间差和归还时间差相近( 在 5 min 以内) 或相同
间的关系等。试验表明,利用广东财经大学三水校区的自行车借还记录可以分析出学生的分布、地点间的联系紧密程度、就餐偏
好、课程安排及人际关系等情况。
关键词: 空间位置信息; 个体行为; 时间地理; 数据挖掘
中图分类号: P208
文献标识码: B
文章编号: 0494-0911( 2014) 07-0113-04
表 4 3 月 18 日自行车流动时间分析
借出时间 归还时间 人数统计
8 ∶ 00
8 ∶ 30
20
8 ∶ 30
9 ∶ 45
7
9 ∶ 45 10 ∶ 15
13
10 ∶ 15 10 ∶ 30
3
10 ∶ 30 12 ∶ 30
8
12 ∶ 30 14 ∶ 00
27
14 ∶ 00 14 ∶ 15
10
14 ∶ 15 15 ∶ 30
一饭 15
7 15 29
8 28 102
竹园 12
6 20 14 26
0 78
紫园
8
5 63 20
6 43 145
总计 90 68 164 117 95 116 650
三、数据分析
1. 自行车统计分布特征 根据自行车借出和归还表( 见表 1) 可以看出, 总体而言各网点的自行车使用频率不均衡。其中实 验楼的总借车次数、总归还次数明显高于其他网点 的借车次数和归还次数; 其次是宿舍楼竹园、学生第 一饭堂、第二饭堂和宿舍楼李园。这主要因为实验 楼是学生上课和课外活动( 协会活动和舞蹈等) 比 较多的场所,是学生集中的地方。此外,实验楼离食 堂和宿舍区较远,需要自行车这一代步工具。从表 中还可推断竹园宿舍区的学生人数比李园多。通过 查阅相关资料,竹园有 4 栋宿舍楼,每栋有 6 层,休 息时段内每栋有 816 人。李园有 3 栋宿舍楼,每栋 有6 层,休息时段内李园每栋宿舍楼有 720 人。这 一资料也直接证明了本文的样本数据能够很好地反 映实际情况。
二、研究区及其数据来源
广东财经大学三水校区占地面积 105 hm2,在校 学生约有 10 007 人。宿舍楼有桃园、李园、杏园、桂 园、紫园和竹园( 如图 1 所示) 。校区的学生饭堂都 临近宿舍,其中第一学生饭堂( 一饭) 和第二学生饭 堂( 二饭) 最临近李园,紫园次之,竹园最远。教学 楼包括第一、第二教学楼和实验楼。