谷歌地图是怎样炼成的:揭秘谷歌地图的制作过程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
谷歌地图是怎样炼成的:揭秘谷歌地图的制作过程
9月11日消息,美国《大西洋月刊》(The Atlantic)资深编辑亚历克斯·马德里加尔(Alexis Madrigal)日前发表长篇文章,独家披露了谷歌地图服务的制作过程以及该服务幕后的Ground Truth项目。
以下为文章全文:
谷歌地图的幕后制作有一个专门项目为“Ground Truth”
在每幅谷歌地图(Google Map)的后面,都有一幅制作过程更为复杂的地图。这种地图对于网民的查询要求至为关键,但网民却无法看到这类地图。这种深层次地图包含了各处地点的更多综合信息:街口驾车禁止左转、免费高速公路、公路限速和交通状况等等。在你向谷歌询问驾车出行路线时,谷歌就会调出这些数据,然后对数据加以分析再向你返回相应答案。
上周期间,谷歌向我展示了该公司的这种内部地图,并演示了其制作过程。谷歌地图的幕后制作有一个专门项目名称,为“Ground Truth”(简称GT)。这也是谷歌首次对外演示GT项目的工作原理。
在谷歌业务演进的关键时刻,该公司进一步扩展自身规模。谷歌最初是一家搜索引擎公司,其主要收入来源为文本搜索广告,即在搜索结果页面发布与用户查询要求相关的广告内容。后来移动服务大行其道。如此一来,搜索者所处位置的重要性,已能够与搜索内容本身处于同等重要位置。面对这种市场新趋势,谷歌有了Android移动操作系统,并为此建立了相应生态系统,并成为唯一能够同苹果iOS相抗衡的产品。
而且谷歌的业务扩张也有着很好理由。假如说谷歌的使命就是对全球信息进行有序整理,那么其中的最大挑战就是:如何将全球的真实世界信息全部搜集起来,并能够让网民们使用且真正能够给他们提供帮助。
谷歌地图高级产品经理曼尼克·谷普塔(Manik Gupta)对此表示:“如果你关注一下我们生活的现实世界就会发现,真实世界的大量信息尚未完全被发布到互联网上。为了满足网民们在现实生活中的需求,我们希望能够在现实世界和网络世界之间搭起一座桥梁。在此过程中,谷歌地图就扮演了这种桥梁角色。”
这并不仅仅是理论上的担忧。手机上的地图系统之所以至关重要,原因就是它们正是现实世界和网络世界之间的接合点。如果你与我一样,你肯定会频繁使用地图服务,其频繁程度超过了任何其他应用程序,但通信套装除外(手机、电子邮件、社交网络和短信)。
谷歌正同全球第一大公司苹果展开激烈厮杀。双方争夺的焦点,意在取得移动服务未来发展的控制权。就苹果一方而言,其实力在于产品设计、供应链管理和零售市场营销。而谷歌的强项在于提供信息的能力。地理位置数据(以及使用这些数据的应用程序),正是谷歌能够取得胜利的法宝。在旧款iPhone手机中,这种争夺并无实质意义,原因是它们本身使用谷歌地图服务。时至今日,苹果已计划推出自家地图服务。无论是Android还是iOS操作系统,它们如何整合地理位置数据、以及这些数据易用性如何,无论将成为谷歌、苹果移动大战的主攻战场。
而这种争夺战,势必也就涉及双方如何制作性能更好的数字地图。
谷歌办公地并未处于显眼之地,但这些场所能够提供免费食品以及乒乓球桌等娱乐设施。与我会面的谷歌地图团队成员包括:谷普塔、前美国国家航空航天局 (NASA)工程师迈克尔·韦斯-马利克(Michael Weiss-Malik)以及尼克·沃尔马(Nick Volmar)。其中韦斯-马利克用他的“20%时间”参与谷歌火星项目,沃尔马则负责谷歌地图的数据处理。
我们在一台大型显示器前坐下来后,韦斯-马利克说:“如果要制作一幅地图,就得有数个步骤。首先你必须从合伙伙伴那儿获得数据,然后对这些数据进行相应技术处理,使其转换成合适的格式,再后再同其他来源的数据混合在一起。然后再使用相关工具对这些数据进行处理,并把这些数据以信息方式输出。这样一来,在机器的另一端,就能给出高质量的信息。这些信息的整体质量远远高于单独的部分。”
这就是谷歌地图的最开始资料,即来自美国普查局(US Census Bureau)的TIGER数据(在不同国家,此类数据的发布机构也可能有所差异),如下图:
谷歌地图的最开始资料
粗略一看,该数据似乎也很不错,公路、街道都已经标明。如果不挑剔的话,这幅地图的质量应该说已经相当不错。但我们不妨再看得仔细一点儿。在这幅地图上,部分数字数据与现实世界并不匹配。我会在后面的文字中举出部分具体例子。
部分数字数据与现实世界并不匹配
这还仅仅是将该地图与卫星成像相比较,就能发现上述不足。此外,谷歌还会使用多种类型的工具对该原始图像加以处理。其中一条就是引进其他来源的数据,比如说使用美国地质调查局(US Geological Survey)的数据。但谷歌地图技术开发团队还拥有独此一家的解决方案:利用谷歌街景(Street View)摄像车拍摄的
图片和相关数据。为执行谷歌“更多数据就更好数据”的理念,谷歌地图团队(主要由谷歌街景团队组成)每两周所发布的图像数据,就会比谷歌2006年全年拥有的相应数据还多。
我们不妨试想一下,谷歌没有任何合作伙伴,而独自决定使用安装上摄像头的汽车,并让这些汽车跑遍每条不禁止通行的街道。截止目前,谷歌汽车已经跑了500万英里。这种汽车摄像,主要能够带来两类可供地图服务使用的数据。一是汽车实际运行的轨迹,这就表明“此路已通”。二是汽车所拍摄的图片。谷歌街景图片服务的令人叫绝之处,就在谷歌甚至可通过算法来提取街道当中的红绿灯信号,然而再将这些信号粘贴在谷歌的深度地图当中。如此一来,如果是旧金山市中心一个交通流量很复杂的十字路口,那么这个深度地图看上去就是如同下图这样:
谷歌汽车摄像,主要能够带来两类可供地图服务使用的数据
当然谷歌街景并不是希望创建这样的地图。然而通过该地图,谷歌地图工作人员可以很快知道,这些标记能够让他们制作出质量上乘的地图。上面这个过程看似复杂,但这不过是谷歌如何使用街景图片的开始。别忘了,谷歌早期就是网络爬虫,以抓取全球范围的网页信息。谷歌街景也是采取类似方法:首先找到街道信号(以及地址),然后谷歌就能更加了解人工交通系统的内在联系。随着计算机视觉和光学字符识别(OCR)技术的进步,现实生活中道路上所出现的任何字迹,谷歌都能为其建立其相应索引。
那天晚些时候,谷歌地图副总裁布赖恩·麦克伦顿(Brian McClendon)这样总结道:“如果我们能够使用OCR技术进行相应识别,就能将全球现实生活中的所有手写信息加以归类。我们现在主要利用OCR技术来提取街道名称和地址,但OCR技术在该业务领域内仍有很大应用空间。”
麦克伦顿接着表示:“利用这项技术,我们已经获得了600万家商家名称和2000万个地址。如此一来,我们就能获得非常准确的信息。我们能够将公司商标与图像匹配,然后查找出哪儿有肯德基快餐店……对于我们拍摄到的图像,我们能够使用语义分析工具进行处理。这就是我们从事的基础工作。”