阿里大数据之战
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
阿里大数据之战
作者:郭夏星葛欣
来源:《经济视野》2015年第03期
【摘要】21世纪的第二个十年已经获得和新技术提供的数据量有关的多个巨额标签:“大数据” (CORDIS,2010; Manyika, 2011; ORT, 2011)、“数据爆炸” (Miller, 2010)和“数据洪水”(Swanson,2007)。“大数据”正改变着我们的工作能力。本文将通过阿里巴巴十年“大数据之路”,解析IT企业中大数据的应用。
【关键词】大数据时代阿里巴巴
大数据产生于现代信息大量冲击的背景下,具有非凡新颖的用途。事实上,全球商业巨头早已意识到了数据的重要意义: ZARA规定每个店铺经理要用平板电脑收集客户信息与建议等海量数据,为生产销售决策提供意见,大大降低存货率;农夫山泉2011年引入数据库平台SAP Hana,加强数据分析能力;阿迪达斯基于外部环境、消费者调研和门店销售数据的收集、分析,挖掘细分市场,促进战略转型—由批发转为零售;还有搜狗热词、微博热门排行榜等,无一不在显示大数据带来的商机。本文以阿里巴巴为例,解析IT企业中大数据的应用。
一、阿里巴巴十年数据路
数据和信用体系堪称阿里最独特的地方,这也是其有望实现爆发的关键。阿里巴巴十年数据建设最早可以追溯到2003年。2003年5月,阿里集团用一亿元人民币建立个人网上贸易市场平台——淘宝网。2004年10月,创建支付宝公司,推出起中介作用的安全交易服务。公司业务做大,海量数据涌来,阿里“淘数据”应运而生。随后,阿里相继推出“数据门户”、“数据魔方”,进行了初步的数据开放,为2012年“聚贤塔”产品发布奠定基础。至此,阿里正式宣布“数据”、“平台”、“金融” 三步走战略。阿里运用大数据,具体包括以下几个方面。
1、提高数据精度,去粗取精
阿里巴巴是中国最大的、世界第二大网络公司。其数据量之大,已经没有公司能够给它提供相关数据业务,因此阿里开始了自行开发之路。从“淘数据”起步,阿里将淘宝每天的交易量、用户支付金额、年龄、购买时段等进行简单收集,随着数据数量、种类愈渐繁杂,阿里将传统存储系统扩展为Hadoop数据库存储。
数据一旦庞大,精度问题就成为关注点。稍微的偏差是可以被容忍的,但我们要呈现的是更为真实的数据,净化数据质量就是首要任务。因而阿里相继开发了多种数据软件,尤其“聚宝塔”出现,为其提供数据存储和数据云计算服务。云计算会成为下一代互联网经济的基础设施。这种分析方法拨开了表面,看到最原始的数据。
2、扩宽数据广度,海纳百川
根据IBM公司调查,大多数公司大数据处于起步阶段,也只是简单重复的收集内部数据,并未特别关注外部数据,内外部数据并未做到相互联系。从阿里大数据发展史不难看出,它曾与微软合作,相继收购中国雅虎、口碑网、phpwind、万网、美国电子商务软件提供商Vendio Services、Auctiva、CNZZ、虾米网,先后入股星辰急便、易图通、美团网、丁丁网、新浪微博、高德、快的打车、360等,几乎是没有企业能达到阿里集团的数据规模。阿里并购之广,帮助它得到一份堪称完整的用户数据地图,涵盖生活各个方面。
3、判断数据关联,执掌方向
阿里的模式决定了它赚不到各种国资背景银行的大钱,只能赚赚小钱,但这正是国内缺乏的销售式银行。阿里集团建立的数据和信用评价体系平台,为阿里金融提供大量商家和消费者信息,这是阿里金融的核心地带,是商业银行无法企及的部分。这些数据为小微金融提供良好的业务支撑,这也是银行无法做到的。阿里运用大数据关联性,在金融领域扮演了越来越重要的角色,随着余额宝的出现,更暴露了阿里企图占据每一分剩余资金的野心。2008年,阿里通过分析买家询盘数急剧下滑,预测一场金融危机的到来,阿里逃过2008年危机,率先突出重围。
二、改进思考
首先,在大数据路上,我们不得不考虑投入产出比,如何能使其最大化。阿里的大数据收集与分析技术其实十分成熟,种类多,应用广,只是投资巨大。阿里投入数据和信用体系平台,支撑金融体系,再加上近两年阿里集团对外扩张步子过大,资金消耗过多,稳妥的走路和降低成本势在必行。资金得到周转,企业稳步前进时,开始着手长期效益的投资。
其次,保护隐私要与收集数据并重。近些天我们都有体会,淘宝也会根据用户最近搜索记录,推荐给用户相同相似产品。如何保护好数据隐私,成为当下热点讨论问题。每个数据分析部门,都要提高防火墙的安全系数,设立专门的小组,来讨论“什么数据可以用,什么数据不能用,什么数据必须在何种条件下才可以使用”。这样商家可以免去竞争对手盗用,同时保护了消费者隐私不受侵犯。
最后,数据科学家早已被各商业领导者看中,然后招聘结果却往往不如意。支付宝用户价值创新中心的负责人秦予表示,“国内不缺数据挖掘人才,但很难找到数据科学家”。公司在招聘中除了提供必要物质条件,还要给予人才广阔的发展空间。创新对于电商领域是致命的,要让他们把整个数据“玩起来”,而并非算出来。大数据在未来成为一种根本性资源,大数据科学家是建设这种资源的主要动力。
三、结论
大多数企业都已经认识到“大数据”改善决策流程和业务成效的潜能,但他们却不知道该如何入手。调查显示,各行各业、全球各地的组织都已经开始采取一种注重实效的方式开展“大数据”工作。虽然这些组织大多还处于早期接受阶段,但其中的佼佼者已经开始从“大数据”项目中获得巨大的价值。为了迎接即将到来的大数据时代,各大互联网公司都在争分夺秒。大数据时代,掌握数据就是掌握财富。
参考文献
[1]崔婧.阿里玩大数据[J].中国经济和信息化,2013,4:36~41.
[2]焦丽莎.云计算应用落地阿里“掘金”大数据[J].中国经济时报,2012,12.
[3]蔡君.大数据:从全新的角度挖掘数据价值[J].通讯世界,2013,08:19~20.