大数据的11个维度
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据的11个维度
作者:张宇婷
来源:《商业价值》2014年第05期
阿里巴巴集团副总裁、数据委员会会长车品觉在新书《决战大数据》中回顾到:2005年,淘宝有了第一个数据分析师,一直致力于用数据来帮助企业运营和解决问题。
阿里巴巴在不断使用数据的同时,也发现了数据本身的问题——大数据需要更主动的管理,也需要更多的创新。
数据化运营是用数据解决问题,但如果想把数据做得更好,解决更多新的问题,就需要去做一件以前从未做过的新事情——运营数据。
2011年,阿里巴巴才开始有计划地进行这件事:主动收集数据,并以此去创造更优质的新数据,让新数据更好地服务于企业的运营。
这是一个“从用数据到养数据”的过程;是一个“从数据化运营到运营数据”的过程,也是一个“从看到用”的过程。
全书分十一个章节,车品觉从数据化运营到运营数据、阿里巴巴的大数据秘密两大角度、十一个维度,用鲜活的例子详细阐述了其数据化思考。
以下是书中一些精彩观点的提炼。
1.大数据面临的最大问题——人。
断层是大数据面临的最严重问题。
收集数据的人并不清楚未来使用数据的人要做什么,这是目前大数据的一大关键命门。
使用数据建模的人,同样不清楚当前数据是如何获得的。
从公司管理层角度看,投资人了解数据的意义吗?高层管理者对数据的期望和中层管理者之间有不同吗?他们知道数据能够帮助企业做什么吗?这些答案因立场而异。
当我们讲到数据价值时,没有人能对此给出一个合理的定位,原因就在于几个关键问题没有分清楚:一是要明确这是谁心里的数据价值,投资人、管理者、中层、数据分析师们心中对数据所产生的价值自然不同;二是要明确数据的分类,不同类型的数据所产生的价值各不相同。
2.大数据的本质是还原用户真实需求。
每个人都在通过不同的设备产生着数据,使数据更多在“量”这个维度上不断膨胀,但是“量”的单纯膨胀对企业真正了解一个用户的需求产生了极大的挑战。
所以,如何更好地识别各个设备的使用者是否为同一个人,如何更好地理解用户在各个不同场景下表现出来的不同需求,如何更好地理解数据融合后产生的价值,将是未来商业中企业必须考虑的问题。
随着O2O的深入和可穿戴设备的兴起,企业和企业之间必须进行更多的数据融合和交换,必须进行更多的跨行业的数据交流,才能更好地还原用户的真实需求,让用户在任何一个场景中,都能获得由数据带来的便利。
3.“活”的数据才是大数据。
盲目进行大数据投资,收集越来越多的数据,但这些数据却是“死”数据。
“死”数据就是单纯存在数据库中,无法进行分析和使用,并且不能够产生价值的数据。
大数据的真正价值是将数据用于形成主动收集数据的良性循环中,以带动更多的数据进入这个自循环中,应用于各个行业。
多样的自循环方式打开了大数据之门,进入这个循环的关键是从解决问题出发。
4.无线数据,大数据的颠覆者。
面对无线数据,我们需要一种多屏思维——需要考虑到现在用户使用互联网的多场景问题。
当多屏变成一种常态,不管是数据分析师的分析方法还是推荐系统的推荐算法都必须多屏化,这其中要解决两个主要问题:一是做到高效准确的收集,二是培养数据分析师的多屏思维。
5.四种数据分类与五种数据价值。
数据按照是否可再生,分为不可再生和可再生数据;按照所处存储层次,可分基础层、中间层和应用层;按照数据业务归属,可分为各个数据主体;按照是否为隐私,可分为隐私数据和非隐私数据。
数据价值的主要体现在:①识别与串联价值,②描述价值,③时间价值,④预测价值,⑤产出的数据价值。
6.从用数据到养数据。
“养数据”通常有两类,一类是网站自身没有的数据,需要用户自主提供;另一类是公司拥有的,但没有进行数据的收集。
“用数据”更多的是一种方法论,“养数据”则是一种数据战略,是基于深入业务理解的更高层次的商业决策,数据养的时间越早,积累的数据也就越多。
养数据也是一种管理和商业艺术,在养之前可能谁也不确定最终会出现的后果,一旦养成会产生非常大的商业价值。
7.数据的盲点。
数据盲点可以分为两类,物理盲点和逻辑盲点。
物理盲点是指在数据库中不存在这样的数据,即企业没有收集到应该收集的数据,这一类数据问题的产生通常是数据收集策略出了问题。
逻辑盲点是有数据,但没有被很好地发掘出来。
数据逻辑盲点的出现与数据分析师或数据使用者的经验和敏感度有关。
除了这两种,还有一些人为制造的“盲点”,比如故意把数据进行掩盖,或者人为地调整数据口径。
衡量数据盲点价值的核心是,有没有看到应该看到的数据,有没有错失不应该错失的数据。
8.阿里巴巴的大数据实验。
一般用户在网站注册时,性别登记只会显示男、女,阿里巴巴会有18个标签。
阿里巴巴的内部数据化运营流程是:例如,要为一个童装类目做营销推广以征集新客户,会先找到目标客户群,把这个类目感兴趣的消费者用标签找出来,通过发邮件或短信吸引其关注。
数据从“用”上升到“养”,即运营数据的过程。
例如,调查12岁年龄以之下儿童商品市场,此时要在用户中搜索有多少用户家中有12岁以下的孩子,但却未发生过从这个类目购买商品的行为。
以前淘宝只能运营有过购买行为的几百万用户,现在可以达到几千万。
从几百万到几千万,这是一个从主动收集数据到运营数据,再到产生新数据的过程。
9.阿里数据化运营的内三板斧——混、通、晒。
作为数据分析师,如果不和业务部混在一起,商业敏感就不会凭空出现在你的面前。
坚持带着业务问题来观察数据或者带着数据来观察业务,兼备二者的敏感,就做到“通”,更深层次的通是存在于公司组织中的数据。
数据能不能做到在获取、使用、分享、协同、链接、组合之上,让自己变得超级简单和便捷,这时数据化运营里面非常重要的一点,正是晒的内容。
10.阿里运营数据的外三板斧——存、管、用。
收集数据不是目的,让收集起来的数据如何产生价值才是最终的目的。
学会用数据产品来解决获取及使用数据的问题。
阿里巴巴数据管理最不一样的地方在于非常依赖数据产品,希望用数据产品来解决获取以及使用数据的问题。
在“用”数据的问题上,数据的分裂和重组,都能做到颠覆性创新。
11.大数据,未来商业利器。
数据扮演的三个角色分别是:第一个阶段是从点上指导运营;第二个阶段是从点到线或到面;第三个阶段为做数据模型,分析外围数据开始变得异常重要,可以为公司的下一步战略找到出路,数据真正能充当爆发角色的一定是第三个阶段。
爆发,是做每一件事情和解决每一个企业问题的人都需要的,尤其是做数据的人,一定要时时刻刻想到数据能够为企业产生什么价值,能够用数据解决什么问题,是不是能够用数据来发现企业中的爆发点。
如果做数据的人时刻都有这样的意识,那企业将会因为数据获得非常大的收益。