决战大数据讲义
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无线
用户联网请求服务器记 录用户行为数据适时传 给网站
无线数据需要解决的问题
高效准确的收集数据
1.收集数据注意系统的差异 2.收集数据注意同一系统不同版本的差异
培养数据分析师的多屏思维
数据分类的四大维度
? 不可再生数据 ? 可再生数据
是否可再生
? 基础层(统一) ? 中间层 ? 应用层
数据所处存储层
亚马逊收集用户 IP地址,判断用户附近多远有书店
“活”看数据指标,动态的使用数据
把数据激活,从静态数据变成动态数据,必须要用场景 来验证,静态数据是没有用的。
衔接
商业数据
展现多屏接入互联网
互联网
同一用户用以下不同的方式接入互联网
PC
用户ID和cookies识别
WAP
APP
用户ID和cookies识别
数据业务归属
数据是否为隐私
? 交易数据主体 ? 会员数据主体 ? 日志数据主体
? 隐私数据 ? 非隐私数据
数据的 5大价值
识别与串联价值 用户识别
BIG
描述价值 标签
DATA
用框架做决策
1、首先确定有什么问题,从解决问题的角度出发收集数据
2、把收集的数据整理好,放入一个“数据框架”(场 景)内 3、看框架与决策的关系
通
使得商业理解和 部门数据进行互 通。
晒
将数据晒出来有 效的指导业务运 营。
数据化运营的外三板斧
存
把数据收集起来, 存起来。
管
管理好数据,保 护好数据。
用
高效的应用数据, 并使得产生价值。
数据应用的例子
如何为用户打标签?
第一步 建立用户的标签
1、通过业务规则结合数据分析来建立标签 (给用户贴上一个“家有老人”的标签 ) 2、通过模型来建立标签 (给用户打上婚庆标签) 3、通过模型的组合生成新的标签 (要对模型不断地进行整合)
4、根据决策行动,然后检查行动是否达到目的
数据盲点
物理盲点
逻辑盲点
企业应该收集却没有收集的数据 那些应该被考虑却被忽略的数据
使用数据
数据 创新 /改善
阿里巴巴的大数据实践
假设数据是稳定的 数据化运营
判断 创新
解决问题 收集数据
运营数据 假设数据是可以获取的
数据化运营的内三板斧
混
和业务部门混熟, 积极的了解业务 运营方式。
从数据化运营到运营数据
大数据应用
海量数据收集
创建数据模型
数据化运营
运营数据
数据化运营 : 用数据来帮助企业运营和解决问题 运营数据 : 企业主动收集数据,并且以此去创造更优质的新数据,让新数据更好地服务于企业的运营。 从用数据到养数据,从数据化运营到运营数据
识别个体
把碎片化的个体拼接成一个整体
价值体现
《决战大数据》主要内容
《决战大数据》是继经典畅销书《大数据时代》之后聚焦中国大数据实践的重磅 新作。
《决战大数据》系统的介绍了“大数据实践”领域,对数据收集、数据化运营、 运营数据、无线数据、数据盲点和噪音、数据分类和数据价值等大数据应用进行了 说明。
《决战大数据》揭开了阿里巴巴数据应用的神秘面纱,解密了其数据运营中的 “三板斧”、“三利剑”和“化骨绵掌”等实战秘籍,对于当今绝大多数的电子商 务企业来说十分有借鉴意义。
决Βιβλιοθήκη Baidu 大数据
车品觉 - 产品人,数据分析师,未来趋势观察家
生于香港,在美国、英国、澳洲等地接受西方教育 曾先后在 HSBC, PCCW, Microsoft, eBay 等多家著名跨国公司任总监职务 2001年 加入微软MSN亚州事业部作为资深产品经理 2006年 加入敦煌网为产品总监 2011-2012年 加入阿里巴巴支付宝 现任阿里巴巴集团商业智能部副总裁、数据委员会会长 国内大数据实践先行者、数据观察家
第二步 标签的应用
标签的使用,最核心的就是数据中间层和前台业务的对接,并且能够让运营人员非常方便的进行 商品设置。
谢谢!
企业价值 ---企业资源的合理分配 客户价值 ---顾客体验的提升
场景还原
数据收集的本质是还原数据发生的场景
数据价值的三大维度
活数据才是大数据
据 数 的 来 起 用 应 被 ,
活数据 发
出 题 问 决 解 从
死数据
单纯存放在数据库中,
如何把数据做活
活
行为数据
“活”做数据收集,抓住相关性
跳出既定的思维框架,从相关的行业和业务中去收集能 够为现在所用的数据,找到能够更好的佐证企业现有的 业务决策和发展的数据。