大数据案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

每个ID号还会对号入座的记录下你的人口统计信息:年龄、是否已婚、是 否有子女、所住市区、住址离Target的车程、薪水情况、最近是否搬过家、 钱包里的信用卡情况、常访问的网址等等。Target还可以从其他相关机构 那里购买你的其他信息:种族、就业史、喜欢读的杂志、破产记录、婚姻 史、购房记录、求学记录、阅读习惯等等。乍一看,你会觉得这些数据毫 无意义,但在Andrew Pole和顾客数据分析部的手里,这些看似无用的数 据便爆发了前述强劲的威力
CUC MBA 2012 P3
Fra Baidu bibliotek
一、未卜先知怀孕案例
关键环节三:建立和用户沟通渠道
那么,顾客收到这样的广告会不会吓坏了呢?Target很聪明地避免了这 种情况,它把孕妇用品的优惠广告夹杂在其他一大堆与怀孕不相关的商品优 惠广告当中,这样顾客就不知道Target知道她怀孕了
CUC MBA 2012 P3
更加全面、深入的分析 形成知识库指导决策、再分析
CUC MBA 2012 P3
四、关系型数据库
关系型数据库就是由二维表及其之间的联系组成的一个数据组 织,关系数据库中的数据结构就是一张二维表,以表格(关系) 的形式存放数据
典型的商业订单条目数据库会包括一个用列表示的描述一个客 户信息的表格:名字、住址、电话号码,等等。 另外的一个表 格会描述一个订单:产品、客户、日期、销售价格,等等
七、数据挖掘
描述性数据挖掘
基本目标
以数据统计和分析为目的
啤酒和尿布的故事 预测性数据挖掘
基本目标 以未来预测和模拟为目的
数理统计 求和、平均、方差等 各种报表和即席查询 多维分析
分类分析
分类函数
数据挖掘
分类模型
回归分析 关联分析 关联规则 序列模式 线性回归 非线性回归 决策树 神经网络 聚类分析
啤酒和尿布的故事
当然“啤酒与尿布”的故事必须具有技术方面的支持。1993年美国学者 Agrawal (个人翻译--艾格拉沃)提出通过分析购物篮中的商品集合,从 而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客 户的购买行为。艾格拉沃从数学及计算机算法角度提出了商品关联关系 的计算方法——A prior算法(关联模型)。沃尔玛从上个世纪90年代尝 试将A prior算法引入到POS机数据分析中,并获得了成功,于是产生了 “啤酒与尿布”的故事
相似特征挖掘
分类识别
时间序列 移动平均
CUC MBA 2012 P3
七、数据挖掘案例
“啤酒与尿布”的故事产生于20世纪90年代的美国沃尔玛超市中,沃尔 玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在 某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会 经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注 意,经过后续调查发现,这种现象出现在年轻的父亲身上。
1、关系型数据库 (销售记录、用户购买记录,提供报表)
2、数据仓库
(数据系统整合,收集,清洗)
3、多维分析
4、数据挖掘
(不同维度之间的剖析,自定义)
(灵魂,产生价值的地方)
5、展示:可视化界面
CUC MBA 2012 P3
三、商务智能体系
数据仓库技术
在线分析处理技术 数据挖掘技术
( Data Warehousing)
提问: 为什么塔吉特能知道这个用户怀孕了?必须有哪几个关键环节 A:用户数据收集 B:怀孕特征库 C:怀孕潜在用户筛选
塔吉特在和顾客沟通过程中采用了哪种营销方式
A:电子邮件 B:直邮 C:电话营销 D:数据库营销
CUC MBA 2012 P3
一、未卜先知怀孕案例
关键环节一:数据信息记录 一家零售商是如何比一位女孩的亲生父亲更早得知其怀孕消息的呢?每位 顾客初次到塔吉特刷卡消费时,都会获得一组顾客识别编号,内含顾客姓 名、信用卡卡号及电子邮件等个人资料。日后凡是顾客在塔吉特消费,计 算机系统就会自动记录消费内容、时间等信息。再加上从其他管道取得的 统计资料,塔吉特便能形成一个庞大数据库,运用于分析顾客喜好与需求。
商业智能技术,它以数据仓库(Data Warehousing)、在线 分析处理(OLAP)、数据挖掘(Data Mining)3种技术的整合为 基础,建立企业数据中心和业务分析模型,以提高企业获取经营分 析信息的能力,从而提高企业经营和决策的质量与速度。
CUC MBA 2012 P3
三、商务智能四个产业链
六、多维分析 OALP
什么叫多维:
沃尔玛2011年在北京的销量是多少?这就是地区和时间两个 维度交叉
百度投放:在2013年5月份广东产生多少个口语计划的注册?
其惊艳之美在于 可以根据用户自己的需要随时创建万维动态 报表,报表的定制权由后台开发人员直接转移到前端的用户 其代表:国双的动态分析
CUC MBA 2012 P3
数据整合 集成各系统的历史 数据,建立面向主 题的企业数据中心
(OLAP:Online Analytical Processing) 数据分析 灵活、动态、快速 的多维分析、随机 查询、即席报表
(Data Mining)
知识发现 通过数学模型发现 隐藏的、潜在的规 律,以辅助决策
商业智能技术体系(BI——Business Intelligence )
CUC MBA 2012 P3
六、多维分析 OALP
CUC MBA 2012 P3
六、多维分析
CUC MBA 2012 P3
六、多维分析
讨论:通过上图我们可以看到哪些维度的数据
1、某月东北 冰箱
2、西北电器总和 3、6月西北产品销量
CUC MBA 2012 P3
六、多维分析和数据仓库关系
CUC MBA 2012 P3
CUC MBA 2012 P3
一、数据输入到输出的基本流程
CUC MBA 2012 P3
二、决策支持系统
CUC MBA 2012 P3
三、商务智能是什么
人们对商务智能的理解如同那七个印度盲人对大象的理解: 有人认为它是高级管理人员信息系统(EIS),有人认为它是管理 信息系统(MIS),有人认为它是决策支持系统(DSS); 有人 说它是数据库技术,有人说它是数据仓库,有人说它是数据集市, 有人说它是数据整合与清洗工具,有人说它是查询和报告工具,有 人说它是在线分析处理工具,有人说它是数据挖掘,有人说它是统 计分析;有人把它当做分析性ERP, 有人把它当做分析性CRM, 有 人把它当做分析性SCM, 有人把它当做企业绩效管理,有人把它当 作平衡记分卡……
一、未卜先知怀孕案例
Target取得的成就:
根据Andrew Pole的大数据模型,Target制订了全新的广告营销方案, 结果Target的孕期用品销售呈现了爆炸性的增长。Andrew Pole的大数据分 析技术从孕妇这个细分顾客群开始向其他各种细分客户群推广,从Andrew Pole加入Target的2002年到2010年间,Target的销售额从440亿美元增长到 了670亿美元。
六、多维分析—普通钻取
★普通钻取是改变维的层次,包括上卷(roll up)与 下钻(drill down)。上卷是从维的细节层向颗粒较 大高层钻取,以便宏观把握数据的汇总情况;下钻 是从维的高层向颗粒较小的细节层钻取,以便观察 数据明细情况。
★举例来说:某电信运营商在分析2003年总体话务量 时发现全年话务量为100亿分钟,这除了说明全年的 总体话务量情况,不能说明任何问题。现在分析人 员想进一步了解2003年各个月份的话务量情况,就 必须针对时间维度进行下钻操作,以看到颗粒较细 的月份数据。反之就必须进行上卷钻取。
CUC MBA 2012 P3
一、未卜先知怀孕案例
关键环节二:数据模型建立
Andrew Pole想到了Target有一个迎婴聚会(baby shower)的登记表。 Andrew Pole开始对这些登记表里的顾客的消费数据进行建模分析,不久就 发现了许多非常有用的数据模式。比如模型发现,许多孕妇在第2个妊娠期 的开始会买许多大包装的无香味护手霜;在怀孕的最初20周大量购买补充钙、 镁、锌的善存片之类的保健品。最后Andrew Pole选出了25种典型商品的消 费数据构建了“怀孕预测指数”,通过这个指数,Target能够在很小的误差 范围内预测到顾客的怀孕情况,因此Target就能早早地把孕妇优惠广告寄发 给顾客。
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目 前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决 策更积极目的的资讯。
大约从2009年开始,“大数据”才成为互联网信息技术行业的流行词汇。
从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起被称为 “大数据”。
大数据的营销案例 大数据如何实施 我们的大数据
CUC MBA 2012 P3
一、未卜先知怀孕案例
塔吉特:比父亲更早知道女儿怀孕 曾经有一位男性顾客到一家塔吉特超市店中投诉,商店竟然给他还 在读书的女儿寄婴儿用品的优惠券。这家全美第二大零售商,会搞 出如此大的乌龙?但经过这位父亲与女儿进一步沟通,才发现自己 女儿真的已经怀孕了。
报表:是关系型数据库时代将数据转化为信息的主要手段
但是报表是需要事先由开发人员定制的 比如:2013年5月份的废单报表
CUC MBA 2012 P3
五、数据仓库
我们可以从多个 菜市场,挑选我 们做需要的蔬菜, 肉类等。当然, 我们处在一个选 择的过程。如果 菜不新鲜,我们 完全可以不要它.
CUC MBA 2012 P3
CUC MBA 2012 P3
二、美国警察降低犯罪案例
纽约的犯罪凶杀从1994年1561起下降到1177起 车辆盗窃从95420下降到72679起
到2009年,凶杀案下降到466起
CUC MBA 2012 P3
二、美国警察降低犯罪案例
CompStat项目的工作人员每天通过电话和传真向全纽约76个警区 收集数据,再将数据统一录入到CompStat,进行加总和分析。 每周二、周四的早晨7点,布雷特就召集全部警区的指挥官开会。 最新发生的案件以圆点的形式出现在各个辖区的地图上,不同颜色 代表着不同类型的犯罪,特定位置的成串圆点则表明那里发生了一 系列的案件。各个指挥官在这些“绩效指示灯”前面依次陈述自己 辖区的情况、对策以及警力的调配
——“数据和信息是执法工作当中制定战略和决策的基 础。”
CUC MBA 2012 P3
1、决策支持系统 1947年,美国科学家 西蒙提出,1978年因为商务决策过程的研究获得诺贝尔经 济学奖 2、商务智能 利用数据仓库、数据挖掘技术对客户数据进行系统地储存和管理,并通过各种数 据统计分析工具对客户数据进行分析,提供各种分析报告,如客户价值评价、客户满 意度评价、服务质量评价、营销效果评价、未来市场需求等,为企业的各种经营活动 提供决策信息。 3、大数据时代 标志着一个时代的来临,一个概念,而不是真正的技术
CUC MBA 2012 P3
六、多维分析—切片与切块
★切片与切块是指选择某一/些维度的具体类别,分析 该类别的数据关于其他维的情况。
★举例来说:某烟草公司分析发现2012年全年烟草销 售为10亿元,现在想了解2012年中华(软)这种规 格的卷烟在第一季度的销售情况,就必须针对时间 维度选择第一季度,针对卷烟规格维度选择中华( 软),通过这样的切块的方式可以观察相关维度的 具体类别(如本例中的中华(软)在第一季度)的 数据状况,分析这些数据得出有效的信息,以针对 这些具体类别进行针对性的决策。当仅针对一个维 度进行切块时称为切片。
CUC MBA 2012 P3
六、多维分析—穿透钻取
★穿透钻取是指从一个模型钻透到另一个模型。
★举例来说:某电信运营商发现本月通话时长下降5% ,经过下钻发现是IP的本月通话时长下降了20%带 动了整个通话时长下降3%,为了找到IP的通话时长 下降的具体原因就需要钻取到面向IP业务的分析主 题,详尽分析通话时长下降原因。这种跨越模型的 钻取就称为穿透钻取。 ★举例:网络营销部广告投放这个月的注册比上个月 少了20%注册,通过下钻发现是腾讯比上个月下降 80%,为了找到腾讯的原因必须钻取到涉及到腾讯 下降的其他原因(流量?页面转化率?)。
相关文档
最新文档