电商数据挖掘 第1章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章,引言:电子商务运营和数据
电子商务覆盖面很广,为了使叙述更有针对性,本书主要针对电商卖家来探讨如何利用基于数据的运营来提高电子商务网站的业绩和做好更长远的发展。
✓选择哪些商品可以吸引最多的客户?
✓怎样用最少的钱引入最多的流量?
✓怎样把网站访客的转化率从1%提升到5%?
✓怎样选择给哪些老客户优惠?
✓怎样把每个客户在网站上的单次消费金额从¥100提升到¥150?
以上这些问题都是本书试图帮助您解决的问题。
我们这本书的两个关键词就是“电子商务运营”和“数据”。
电子商务的运营涉及平台的选择、商品的选择、网站的构建、页面的设置、为网站引入流量乃至最后提升网站的整体收入,其范围包括营销,但要超出营销的范围。
而正因为电子商务是基于互联网的,数据充斥在电子商务运营的各个环节,所以成功的运营一定是基于数据的。
在电子商务运营的各个环节,都需要以数据为基础。
当我们养成以数据为导向的习惯之后,做运营就有了依据,不再是凭经验盲目运作,而是有的放矢。
除此之外,电子商务还有物流、仓储等环节,也和数据相关,不过不是本书讨论的主要内容。
在互联网上进行交易的最大优点是电子商务企业可以在互联网中取到大量的真实数据,包括真实的市场数据、网站流量数据、产品被关注和浏览数据、产品销售数据等,从而使我们可以有效地估计出访客的兴趣和对各种商品的不同反应。
当我们有明确的且可以量化的目标时,采用数据分析和数据挖掘技术的效果是更加好的。
当我们很清晰地得到客户的行为数据,分析客户的各种行为之后,我们就能更深入地了解客户。
本书中涉及的话题覆盖了电子商务企业运营的各个层面,不过核心的内容是在于以数据为基础的运营。
如何能够通过数据,帮助电子商务企业制定合理的KPI,提升运营效率,提升广告投放的性价比,提升网站访问的转化率,照顾好老客户,提升电子商务网站(店)的整体收入,是我们在本书中要讨论的主要内容。
1.1节, 2012年最大的赌局
在2012年,大家所知道最大的赌局自然是在年度经济人物颁奖晚会上,万达集团的王健林与马云同台,就电商与传统商铺的未来展开辩论。
对于电商的前景,王健林称:“电商再厉害,但像洗澡、捏脚、掏耳这些业务,电商是取代不了的。
我跟马云打赌:2022年,如果电商在中国零售市场占50%,我给他一个亿,如果没到他还我一个亿。
”
这个十年的赌约可能不过是个玩笑,但是电子商务的重要性是毋庸置疑的。
网购现在占到社会消费品总额4%,五年后占到15%,十年后占到50%以上,也就意味着平均每家消费品企业都要有一半的产品通过电商卖掉,每个消费者一半的消费品会通过互联网购买,这是完全可能的现实。
不要只是看行业与产品是否合适做电商,要看我们的客户,只要客户天天都在网
络上获得资讯,那么,你所在的行业就已经电商化了。
人们对电子商务的接受程度不断提升,除原有的互联网电子商务企业外,传统行业的企业互联网化趋势明显,纷纷将电子商务平台作为线下产品推广渠道的线上补充。
当然,外贸行业的不景气也是触动传统企业转型的一个重大原因。
传统企业对于电子商务的认知与应用于是成为2011年以来中国电子商务市场蓬勃发展的主要原动力之一。
在宏观经济的寒冬之中,中国的电子商务产业已成为拉动中国消费经济增长的新引擎。
图1-2中列出的是中国电子商务和数据相关的一些问题。
当然,正是因为存在大量的问题,才会有更多的机会,而我们认为要解决这些问题,成功的关键在于数据。
图中展示的问题都可以通过数据来改善。
我们可以通过数据来改善广告投放问题、商品选择问题、客户选择问题和转化率的问题,甚至品牌忠诚度都可以通过数据来改善。
在互联网上我们可以详细了解每个消费者个性化的需求和真实购物行为模式,根据数据,选择商品、选择针对的客户、选择合适的平台、选择经营策略、选择正确的推广方式,并通过数据分析,提升流量的转化率,深入挖掘客户的价值。
电子商务,其实没那么复杂。
请看下面这张图:
图1-3 电子商务相关概念示意图
在图1-3中,最中间的是电子商务E-commerce,而周围的三个圈Search(搜索)、Social(社
会化)和Mobile(移动)是在互联网电子商务发展到今天的三个方向:商品搜索、社会化电子商务和移动电子商务。
而最外层的这一圈列出的是基于电子商务的技术和概念的功能,基本覆盖了电子商务运营的全部手段,其中和本书相关的概念列举如下,如果我们能够成功做好本书中提到的这些功能,我们的电子商务运营就能够上一个台阶,而这些功能大多都是建筑在数据和数据分析的基础之上的。
●Analytics&Measurement(分析和衡量)。
从第2章我们开始介绍数据分析的概念,而在
第6章我们会引入衡量指标KPI。
●Conversion Analysis(转化分析)讲述的转化率概念是电子商务运营的重要概念之一,在
本书中会多次提及。
●Social Media(社会化媒体)和Search Engine Optimization(搜索引擎优化)是在第7章
免费流量中的内容;
●Pay Per Click(按点击付费)、Email(电子邮件)、Online Media Buying(媒介购买)和
Retargeting(重定向)是在第8章广告一章中的内容;
●Shopping Cart Analysis(购物车分析)是在第10章流量转化中的内容。
图1-3中列出的其他功能也都和电子商务运营相关,不过在本书的讨论范围之外。
1.2节,为三百万人建三百万个网站
上一节中提到的美国互联网零售领跑者亚马逊Amazon是电子商务业界的巨无霸,2011年全年的总收入在481亿美元,预计2012年的总收入在573亿美元,远高于美国十大电商中的其余九家。
而亚马逊之所以能够领跑全世界的电子商务,原因就是他们对数据的重视和应用。
亚马逊的总裁Jeff Bezos曾说过,“如果我在网上有3百万个客户,我将要建立3百万个商店”,其意思就是说要为每一个客户建立一个完全个性化的电子商铺,提供最个性化的客户服务。
亚马逊的商品不是最廉价的,不过就是因为亚马逊独一无二的推荐系统和用户体验,当很多人在做网上购物的时候,亚马逊一定是首选,包括作者本人。
电子商务个性化推荐系统在实践中对电子商务具有重要意义,而亚马逊在个性化推荐方面是做的最成功的。
推荐系统是电子商务数据运营的一个关键环节,我们在3.4节中会介绍推荐系统的原理和案例,并在第10章中介绍如何在我们的电子商务网站上引入推荐系统。
从推荐的形式来看,亚马逊把推荐服务应用到了网站的每一个角落,从首页到产品内页无所不至;而在推荐方法技术上,亚马逊也综合了多种类型的推荐服务,有的基于项目相似性和相关性,有的基于客户浏览和购买历史记录,也有基于协同过滤等技术。
亚马逊能够根据客户当前所查看页面的类型和内容,当前和之前关注的产品信息等内容动态地组合这些推荐服务。
大家都在说云计算,但是早在2006年,亚马逊就推出云计算服务S3和EC2。
而亚马逊的许多商业优化和数据优势正是由于他们的技术创新而产生的。
我们可以毫不犹豫地说亚马逊是电子商务公司中技术最强的。
和其他的电子商务公司不同,亚马逊的Jeff Bezos从一开始就是以技术为导向的。
早在2003
年他接受Money杂志访问的时候,就说过"The three most important things for us are technology, technology, technology."“对于亚马逊公司,最重要的三件事情就是技术、技术、技术”。
而正是由于亚马逊对技术的重视,数据在亚马逊才能够得到充分的应用。
亚马逊之所以能够成功,是因为整个公司自上而下的所有人都是以数据和技术为导向的。
1.2.1, 电子商务的RUPI概念
因为是基于互联网的关系,电子商务上有传统商业所无法比拟的一些优势,作者把这些优势总结为RUPI(Richness、Ubiquity、Personalization和Interactivity):
●Richness(丰富的):不再有篇幅的和类别的限制,顾客可以通过图片、视频、文章、问
答全方位地了解商家及其提供的产品。
●Ubiquity(无处不在的):因为互联网的关系,电子商务的发生是随时随地的。
●Personalization(个性化的):商家可以针对小众提供个性化的服务。
某些商家甚至可以
大量地为个人提供定制化的服务。
●Interactivity(交互的):通过互联网,商家与商家、商家与顾客、顾客与顾客之间可以无
限制地以多种形式进行一对一的沟通。
图1-5 电子商务RUPI概念示意图
本书的重点在于如何把数据运营和电子商务结合起来,更好的利用数据把电子商务的RUPI 特性发挥到极致。
“电子商务公司”是一个阶段性的词汇,我们会看到在不久的将来,这个词汇不再被人使用,因为所有的公司都将成为电子商务公司或者有常规性的电子商务职能部门。
1.2.2 在互联网上卖米
“台湾经营之神”王永庆是台塑集团的创办人,他16岁时靠父亲借来的钱开了一家米店。
由于居民都已经有了自己熟识的米店,王永庆新开的米店生意很冷清。
但王永庆并未放弃,他一家家地走访附近的居民,当他发现买米的主要是家庭主妇时,他提出了当时其他米店所没有的一项服务——送货上门。
不仅如此,每当王永庆把米背到主顾家里的时候,他还会热心地询问家里有多少人,每天大概会用掉多少米,并细心地连同主顾本次购米的数量、家中
米缸大小、家庭住址等信息一起记录在随身携带的小本子上。
通过这些信息的收集,王永庆
很容易计算出主顾大概什么时候需要新购大米。
这样,每到哪家的米快吃完的时候,他就会主动将米送上门来。
如此以往,王永庆的米店立刻就红火了起来。
“王永庆卖米”的故事经常会被作为营销学经典案例来讲解,王永庆之所以成功就在他对于客户的了解和对老客户的深度服务。
衍生到电子商务上,如果电子商务卖家能对买家有深入的了解,势必会对业绩的提高有所帮助。
可喜的是,作为电子商务卖家,搜集客户资料的方式不需要像王永庆那样一家一家询问,因为客户在互联网上的行为都是有迹可循的。
客户只要登录到卖家的页面,他的一举一动都可以变成数据记载下来,但困难的是电子商务企业(个人)所面对的客户和客户访问轨迹的信息量往往是巨大的,也是无序的。
如何有效的利用这些客户数据来充分了解每一个客户并挖掘出背后的客户价值则成为在企业电子商务成功运营的关键。
销售最简单的需求就是增加尽量多的新客户,留住更多的老客户。
而在互联网做销售,也是一样的。
如果再细化,电子商务可能会考虑这样一些目标:提高转化率;增加每次会话的平均浏览页数;增加每次结账的平均利润;减少退货;增加总顾客数量;提高商标知名度;提高回访率(在一定时间,比如30天内做第二次购买的顾客的数量);增加每次访问的平均结账次数;提高客单价等。
我们要做的就是通过充分了解客户来满足这些需求。
我们来看一下如何通过这些数据来帮助网络厂商达成目标,做到像王永庆这样在互联网上成功地卖米。
像当年在卖米的王永庆一样,随着电子商务付费推广流量的上涨,越来越多的电子商务公司开始关注老客户价值。
怎么样像“王永庆卖米”这样最高程度上抓住老客户,也是我们在本书中要研究的课题中比较重要的一项。
1.2.3, 电子商务怎么能离开数据
亚马逊的故事告诉我们,电子商务运营,需要用数据来说话。
电子商务的销售从何而来?因为所有的销售额都来自于网站的访客,我们可以用下面的公式来计算:
营业额=访客数*转化率*客单价。
网站上有访客,我们成功吸引该访客下单购买,我们就有了营业收入。
而这里的四个数据也正是我们前面在1.1.4章节中提及的淘宝网店的四个核心关键数据。
淘宝店也罢,独立电子商务网站也罢,或者电子商务平台上的店中店也罢,这个公式都是成立的。
在淘宝量子恒道工具中,也列出了几乎一样的公式:
销售额=访客数*店铺成交转化率*客单价。
图1-6 电子商务企业营业额组成示意图
从图5-2中可以很简单地看出,营业收入等于访客数乘以转化率再乘以平均客单价。
访客数越多,转化率越高,客单价越高,营业额也会更高。
所以如果我们要提升网店的总收入,需要在其中的一个或者多个数据点上花功夫。
当电子商务网站的老客户的比例比较高的时候,转化率会比较高,所以提升老客户的活跃度是提升转化率从而增加整体收入的一个有效手段。
对于大部分电商,我们可以做这样的估算:
●每天新增的用户数大概是引流UV的1-5%,UV(Unique Visitor)是独立访客的意思。
●活跃用户大概是注册用户数的3-15%
●每天在线用户大概是活跃用户的5-20%
●付费用户大概是活跃用户的2-20%
这里波动的范围比较大,而我们列出的数据也是一般情况下常见的数字,处于这个范围的高端说明您的网店运营得比较成功,而如果您的数据是处在这个数字的低端,那么说明您的网店的运营需要有所提高。
当然如果您的运营是由高手来操作的,那么数字超过这个范围也是有可能的。
我们以一家电商为例,来看下总体的数据。
这家电子商务网站每天引入的独立访客(UV)是10000,而网站开张三个月之后的注册用户有20000人,平均每次顾客的购买消费是200元
人民币,那么数字大概是这样的:
●该网店每天新增的用户数大概是UV数的1-5%,也就是100到500人
●该网店的活跃用户大概是总注册用户数的3-15%,也就是600到3000人
●每天在线用户大概是活跃用户数的5-20%,也就是600到3000人的5-20%。
这个数字
最少可能是30人,而最多可能到600人
●付费用户是活跃用户的2-20%,也就是600到3000人的2-20%。
这个数字最少可能是600
人的2%,也就是12人;而最多可能到3000人的20%,也就是600人
●按照每笔的客单价为200元来算,该网店每天的营业额应该在2400元到12万元人民
币之间。
每天的营业额从2400元到12万元之间的差距非常大,这就告诉我们运营做得好坏之间的差别可以说是天壤之别。
平均每天2400元,全年是不到一百万元的,而如果平均每天12万,全年的数字要超过3千万,就是一个有相当规模的电子商务公司了。
当我们有了足够的数据之后,我们可以不再依赖主观判断,而让数据成为公司里的裁判。
理想情况下,如果我们能够追踪一切数据,那么我们所有的决策都可以理所当然地基于数据。
图1-7 商务运营示意图
在电子商务企业,当我们从整体战略到目标设定,然后找出可以驱动商务运营的方法,最后采用一定的度量来衡量数据运营的效果。
数据在电子商务企业的作用是巨大的。
不同层面的人,需要对数据做不同的操作。
●决策层:商业智能=战略,电子商务的运营策略
●管理层:商业智能=战术,商务运营的计划
●运营层:商业智能=操作,电子商务运营具体的实施
图1-13 数据作用示意图
1.2.4 淘宝店的4个核心数据
几乎每个人都听过这样的故事,一个什么都没有的90后,在义乌小商品市场或者服装批发市场找到一个供货商,然后开了一家淘宝店,迅速进入年收入百万元的行列。
这样的事情在早期的淘宝比比皆是,而在目前依然可能发生,不过前提是在运营中成功用好数据。
我有的朋友有些闲钱想开家店丰富一下业余生活。
有些开的是实体店,还有些开的是淘宝店,不过开网店的这些朋友很多都不了了之。
开网店的一个明显优势是门槛低,需要的资金也少。
但是一旦开启之后,如何在运营中有太多琐碎的事情,经常会顾此失彼。
还有两位朋友很典型,他们是一对处女座夫妇开的淘宝店,在做小规模的时候,所有的活都是自己干,做的还不错,每天的销售额很快就到了一万多。
这时,他们都从各自的单位辞职,专心来开店了。
他们招募了一个团队,然后做到差不多一年近一千万的收入。
具体的利润我不是很清楚,应该是在百万的级别。
而令他们困扰的是,现在他们的团队扩展到了30人,销售额也在每月环比创新高,但是由于做类似产品的网店越来越多,竞争的压力使得他们的利润额大不如以前,广告投放的性价比提升不了,多年积累下来的老客户总体消费也没能提升。
如何能够通过数据,帮助电子商务企业制定合理的KPI,提升运营效率,提升广告投放的性价比和转化率,照顾好老客户,提升网站(店)的整体收入,是我们在本书中要讨论的主要内容。
我们从淘宝店铺的数据开始讨论如何做数据运营。
在淘宝店上有很多数据,一步到位实现全部的数据标准化运营是不太现实的,而且同时关注和提升所有的数据指标也是不太可能的。
所以在本节中我们只看4个核心的数据点:平均收入、访客数、转化率和平均客单价。
一、平均收入
淘宝店的平均收入是4个核心数据点中大家最关注的一点。
平均收入是网站在一定区间内的收入,这个区间可以是日、周、月、季度或者年。
我们通常可以用支付宝成交金额作为收入数据。
图1-8 Justyle天猫旗舰店收入示意图
在图1-8中列出的是Justyle天猫旗舰店的收入情况。
二、访客数UV
UV是unique visitor的首字母缩写,意为唯一访客数,指的是来访问我们店铺的人数。
和UV 相关的另外一个词是PV。
PV(page view)是页面浏览量的意思。
UV和PV数字的区别在于,当一个用户A访问我们网站的10个页面,PV算是10,而UV只算1个。
下图截自淘宝量子恒道工具,展示了浏览量(PV)和访客数(UV)的对比。
图1-9 浏览量和访客数对比示意图
在图1-9中的浏览量7天的平均数字是在18031,而访客数的平均数字是在14460,也就是说平均5个访客中才有1个会访问第2个网页。
对于一家淘宝店铺来说,我们最关心的基础数据就是访客数UV。
没有一定数量的访客数字作为基础,店铺是不可能成功的。
同时,这个数字也是任何一家电子商务网站最关心的数据点,因为有足够的访客是电子商务的基础。
三、转化率
转化率(Conversion Rate)指的是产生实际消费的用户和来到用户网页的总用户数量的比值,是将流量转化为实际的销售额的一种衡量方式。
每一个电子商务的最终目的都是为了赚钱,显然提高转化率是电子商务企业提高销售额最直接的方式。
在下图中我们来看截自量子恒道里转化率的一个展示。
这里的案例来自于一家天猫商城上的一家男装店铺。
图1-10 转化率示意图
在图1-10中,全店的成交转化率是1.81%,而相对应该同类的其他男装店铺的2.47%的转化率,还有不少的提升空间。
转化率有多种不同的计算方式,不过差别不是很大。
我们在本章使用的计算是这样的:成交转化率=成交用户数/总访客数
四、平均客单价
客单价,平均客单价,客单价均值,或者别的说法,指的是一个客户在电子商务网站上的平均消费。
客单价越高,网站的整体收入就会越高。
在相同访客数的情况下,提升客单价可以有效提升网站的收入。
客单价的公式是:
客单价= 总成交金额/ 成交笔数。
我们解释一下平均(average)客单价和中间值(mean)客单价的区别。
假设用户在商城中购买了三次,客单价分别是10元,20元和120元,那么平均客单价是50元(数学平均值),而中间值是20元(中间的这个数值)。
对于主要销售同一品类商品的电子商务网站,平均客单价和中间值客单价的差别不会太大,不过当我们的网站上商品差值较大时,这两个数字之间会有一定的差异。
例如,我们平均每天10000个UV,能在100元人民币的平均客单价下成交250单。
在单数
不变的情况下,把客单价提升25%,每天的收入可以从25000元上升到31000元,我们的企业就可以从一年百万级的电子商务企业跨入年千万级的行业。
图1-11 平均客单价示意图
对于图1-11的这家店铺,我们可以看到在2013年1月平均客单价的数值是172.53。
1.3节, 让电商运营不再那么辛苦
我们来看一下在运营电子商务企业的同学们都做得怎样。
我周围有非常多从业于电子商务运营的同学们,工作都非常辛苦,不过我们很遗憾地发现,他们中有很多人忽略了数据在电子商务运营中的作用。
1.3.1 电商人的蓝精灵之歌
电子商务运营不应该是个体力活儿,但是在2012年的运营工作看起来就是最拼体力的工作,因为大家比拼的是广告投放数量和种类,比拼在线时长,比拼商品数量,比拼活动数量。
大部分的电子商务运营都是很辛苦的体力活儿。
这里有一首“蓝精灵体”的电商人之歌就是描述我们做电商的同学们的:
他们苦逼又无奈,
他们在线到天明,
他们一稿再稿写死在那坑爹的画面里,
他们抄来抄去相互都唾弃。
噢可怜的小电商,噢可怜的小电商,
他们天天在岗时时在线,
为了把货卖出去,
他们又马不停蹄做起了大促销。
这里的电商人指的主要是做电子商务运营的同学们。
如何能让我们的电商人通过数据不再那
价、平均转化率、客户重复购买率和整体ROI等数据,而数据报表有以下这些可以用来做店铺诊断:
●收入的周期变化表
●总客户数和成交客户数变化表
●访客数和浏览量变化表
●交易量变化表
我们先来看下收入的变化表。
图1-12 收入周期变化示意图
从图1-12的收入变化示意图中我们可以看到在1月9日和1月10日两天收入有明显的攀升。
我们再看下访客数和成交用户数的对比。
表1-1 访客数和成交用户数对比示意表
日期访客数成交用户数转化率
3月1日一周103768 1911 1.84%
3月8日一周121408 2296 1.89%
3月15日一周110481 3199 2.90%。