淘宝数据魔方介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据魔方创立于2010年4月,是一个基于淘宝海量数据分析的商业数据产品,也是淘宝首个全网商业数据产品。
数据魔方可以分析淘宝全行业的浏览、交易、收藏、搜索等数据,以及消费者的用户特征,可用于店铺数据化运营、市场行业研究等。
专业版各标签列出的分析,以下根据官网的体验版作出修订,
O、数据简报
一、市场研究分析
市场分析
市场整体行情:不同时间段的成交金额、人数、商品数等趋势状况,新增热卖子行业和飙升子行业排行
——对于行业的趋势及子行业的趋势分析对于大卖家或者是线下企业要进入线上经营的卖家来说尤为重要。
投身这个行业就要了解这个行业的发展趋势,它是处在上升期、成熟期还是衰退期。
而在这个大的行业下又有哪些子行业是快速发展的,结合企业自身的经营资源、生产资源找到可以被利用的趋势和市场机会;
买家规模:不同时间段的成交、关注、搜索、收藏人数趋势
热销品牌排行:不同时间段内热门销售品牌的排行,1.5新增热卖飙升榜和热搜飙升榜——对于热销品牌排行可以对我们目前的市场竞争状况做一个概括性的了解,什么品牌是卖
的好的,可以去看看这样的品牌格调和推广方式,他们是以什么样的品牌价值打动了消费者!文化?格调?价格?这些可以与自己店铺宝贝做对应比照。
——通过品牌的飙升排行及弹出层的数字分析,一方面可以了解品牌的飙升状况,另外,可以通过弹出层确切的了解该品牌的详细信息。
品牌的分布与TOP的产品是直接影响和支撑品牌排行的。
如果想要在这个行业中切分精品的份额可以有两种方式:一种以一个性价比高的产品直接与其主力产品对决;第二种是采用替代互补策略,找到现在精品主力产品的替代和互补产品进行大力度的推进,这样才有机会更大的切分精品份额
热销产品排行:不同时间段内热门销售产品的排行(只针对标类产品可查),1.5新增热卖飙升榜
——1.对于非标类的产品,数据魔方预计在10年5月中下旬推出热卖宝贝排行,并同步有关键词和关联宝贝信息;2.对于热门产品的排行能具体到单品的售卖状况,在分析师如果结合后面的关键词成交排行将更加有参考价值(相关说明请参见后面热门搜索产品页)
——对于品牌和产品飙升排行榜是可以了解流行趋势的:对于卖家来说一方面是了解行业变化,另外需要的就是创造消费,从飙升排行榜中可以清楚的了解近一段时间内的流行趋势…………
热销宝贝排行:
——宝贝排行从根本上解决的对于热销品的了解:通过宝贝的排行关键词,可以有效的了解目前热销品的命名定义、关键词;并可以点击进
去查看图片风格,这样结合自己宝贝的特点进行有针对性的优化和组合。
关联宝贝,可以清楚的知道购买这个宝贝的人同时购买了哪些东西、浏览的哪些类目。
通过这些一方面可以优化产品、另外对于组合促销、关联促销都可以提供有效的信息。
飙升宝贝排行:
——飙升宝贝排行结合飙升子行业信息,可以有效的把握行业流行趋势,创造消费。
通过飙升宝贝的展现,可以看到近期的热门机会,在某种意义上,可以通过与这些宝贝关联的词定义自己的产品如:夏季凉席飙升速度较快,而一个人是卖床单的,他就把床单的名字增加了凉席字段,虽然销售的根本不是凉席,但是有很多人最后产生的购买行为…
热销特征排行:
——从属性上可以更清楚的了解到产品归类化的特点。
在进行生产准备的时候可以根据这个趋势重点在哪一方面进行产品改造和生产;在店铺展现上,可以根据属性的分布将重要属性的产品体现在关键部位,在宝贝图片的处理上能明确的体现出属性特点;在命名上,可以通过关键词、搜索热证、热卖宝贝排行中的参考加上属性特征共同找到适合的名字…
关键词成交分析:不同时间段内买家键入关键词搜索并产生成交的相关数据分布
——关键词对于使用直通车的卖家来说是非常重要的。
通过关键词成交分析,可以很清楚知道哪些关键词产生的成交靠前,而在选择的时候尽量结合热门搜索特征去寻找高关注、竞价低的关键词,然后结合买家的地域分析、性别年龄分析、成交时段分析这些维度更精准的投放,这样省时省力功效大。
买家分析:
购买时段:买家在24小时内的分段成交状况及一天内的成交趋势
——1.从时间段的排位状况可以有效的配置店铺的客服及后台资源,这样可以把效率最大化;
2.通过对高成交段的了解,对于投放广告的精准度大大提升,可以对投放时间精确到每个小时;
3.应用时间段和客单价的交叉对比,可以找寻特殊个性化商品的卖点,有些个性化商品成交的高峰期可能客单价低;而非高峰时段客单价较高。
这些需要深度挖掘。
来访时段:
——来访时段与成交时段的交叉分析可以更好的优化配置我们的资源:如:大多数的职业女性(OL)一般会选在午饭后上班时间浏览网页,而成交时间一般在晚上回家使用老公或男
朋友的付款账户。
这就要求在访问时段对于页面的更新、风格、上新等要保持新鲜度,才能让他更
喜欢停留更长时间;而成交时段部分就是配置客服、物流、仓库等等资源的支持加强。
买家地域:买家在不同时间段内在全国省份(可点击进入市)的成交排名
——1.通过对买家地域分布的详细了解,结合时间段分析就能更好的提升广告投放的针对性,有效的沟通最大最有效的目标消费者;2.买家几种的区域对于后期如果采用统仓配送建立异地物流配送提升物品的及时到达率也会给出一定的方向;3.买家地域与卖家地域结合分析:卖家主要分区域与产品买家主要分布区域重合区,基本可以确认该地区、该产品、行业发展程度高、消费者对于该行业的关注对和对新品的了解程度一般会高于其他区域。
那么这些重叠的区域则就是我们未来推新、开发对新产品消费人群的主力区域。
性别年龄:不同时间段内买家的性别、年龄分布
——1.男女的性别比例对于投放相关广告(如直通车等)有一定的指导作用,可以有针对性的对于性别,年龄段的顾客进行有效沟通,降低投放成本、提高投放效率;2.对于行业及品牌的性别、年龄段了解,可以对于未来的市场拓展有一定的目标直营,找到最高的年龄段和潜力年龄段,并能针对年龄段的不同研究他们的消费习性和购买习惯,从而更大的开发自己的目标市场,提升业绩。
客单价:不同时间段内单人次购买的金额分布
——买家单次购买的金额对卖家相当重要:1.单纯的价格定位,可以参考客单价的分布;2.对比自我店铺售价进行组合营销:A看一下自己店铺的主流价格和淘宝类目客单价的差异;
B.如果客单价100-200的占比在21%,自己店铺的主流价格在100多,那么就可以通过搭配促销套餐争取这部分价格区间的买家。
买家信用:不同时间段内买家信用等级的分布
——买家的信用等级可以对我们沟通人群和相关资源投放路径、行业发展有所参考:1.从等级分布来看,如果买家信用主要集中在心级段的,说明这个市场是非常开放化的,潜在的客户全巨大,可以多方利用营销手段进行与消费者沟通;2.如果买家信用等级集中在钻以上,说
明这个行业的集中化较高,买家的目标导向非常强烈,会员制、VIP等等专属个性化的服务要求就要非常的高。
购买频次:不同时间段内买家购买该类目产品的频率
——购买频次的分析对于行业(产品)的发展有一定的参考价值:1.通过购买频次的分布判断可以了解目前产品的使用周期,在营销上可以考虑在节点上适度增加单次购买量(金额)从而延长使用时间,提供消费黏度;2.对于使用周期的判定可以对于特殊行业、产品的存储、备货等后台管理做参考价值。
商品标价分析:
——后续新增的,待补充
卖家分析
热卖店铺排行:
——店铺排行可以更清楚的知道在这个行业中那个店铺卖的好,甚至可以点击查看该店铺下TO5的产品名单;使用店铺排行可以在对竞争者分析的时候,了解主要的行业标杆者的装
修风格、产品构成、活动推动…通过TO5的产品,也可以采购“田忌赛马”理论进行针对性
的打压抢占。
卖家规模分析:
——卖家的规模标示了这个行业的竞争趋势,如果是一个持续增长的状况,那么表明这个行业发展繁荣,并竞争逐步加剧;反之,则标示行业衰落对于了解行业状况有一定参考作用。
卖家地域分析:不同时间段内卖家在全国省份(可点击进入市)的成交排名
——1.卖家的地域分布表明了这个区域行业的发展状况;2.而卖家与买家地域的结合分析可以找到更多的信息:产品卖家主要分区域与产品
买家主要分布区域重合区:基本可以确认该地区、该产品、行业发展程度高、消费者对于该行业的关注对和对新品的了解程度一般会高于其他区域。
那么这些重叠的区域则就是我们未来推新、开发对新产品消费人群的主力区域…
卖家信用分析:
——卖家的等级分布可以看出目前该行业在淘宝上经营的基本状况和竞争状况:1.从等级分布来看,如果买家信用主要集中在心级段的,说明这个市场是非常开放化的,可以多方利用营销手段进行与消费者沟通;2.如果买家信用等级集中在皇冠以上,说明这个行业的集中化较高,形成垄断经营,对于进入的卖家来说门槛较高。
热门搜索分析
热门搜索品牌:不同时间段内被搜索的品牌排行
——热门的搜索表明了目前市场的关注品牌方向,给予卖家货品准备提供参考或者说是季节指数的风向标。
热门搜索产品:不同时间段内被搜索的产品排行(只针对标类产品可查)
——搜索产品排行是对品牌排行的细化,对于主要竞争对手的了解会更加清晰,品牌靠前是因为那个产品的转化或者是高市占靠前,如果要进行市场参与和掠夺,是采用主攻第一产品还是主攻辅助产品?这样你就更有效的切分主竞争对手的市场份额。
热销产品与热门搜索产品的交叉分析我们可以发现:1.高搜索低成交:表明该款产品时流行的趋势,是大家公认的热门产品,应该对于产品未来的价格,维护和渠道引导方向加强管理,因为这是你的未来;
2.低搜索高成交:这样的产品基本上是非主流产品,大家对产品价格、基础性能等都了如指掌,购买目的性很强!这样的产品应提高对忠诚客户的维护,促进对更新换代产品的告知;
3.高搜索高成交:目前主流的产品,重要的是建立客户的信心,对于宝贝详情、功能、技巧的描述要注意;
4.低搜索低成交:低搜索低成交,这一类的产品基本属于已经过时的,或者还没有被消费
者熟知的!如果是过时的就要考虑库存的掌握,而如果是上市前的,那就应该考量对于消费者认知的教育。
热门搜索特征:不同时间段内买家所搜过关注的特征相关数据分布
——特征代表了一个产品的特点,通过热门搜索特征可以有效的优化你的宝贝名称,让买家更快的找到你的宝贝,从而产生成交。
搜索特征就是买家对产品的基础习惯认识,所以在一定程度上,也反映了消费者对于产品的基本理想需求和认知,这些对产品的开发和消费者潜在需求是有参考价值的。
二、店铺分析
店铺概况
热销品牌分析
热销宝贝分析
顾客性别分析
顾客年龄分析
购买频次分析
客单价分析
三、消费者研究
流失顾客
流失顾客去向
四、淘词
行业热词榜
全网关键词查询
宝贝标题诊断
专业版的功能涵盖:
1.分析淘宝网所有历史数据,研究历史预测未来:通过时间选择器,可以选择长时段分析淘宝网行业数据;可以研究从2009年10月至今的所有任意时间段内的数据
2.动态观察各类目走势:动态趋势图可以展现3个月范围内,多个类目对比的历史数据,帮助网商研究类目季节变化趋势;把握细分类目生命周期;
3.精细化市场数据监测:及时分析行业下所有品牌,产品,店铺,宝贝,属性值的成交数据,以及消费者特征,做到竞争信息第一时间感知,做到商业机会第一时间把握。
4.淘词——关键词查询:任意搜索全网的关键词,提升宝贝搜索排序,比直通车省钱!
5.淘宝-宝贝标题诊断:自动展示标题所含关键词的搜索数据,方便替换宝贝标题,优化自然搜索,让你的宝贝起名更自动智能化。
6.实时数据展示:第一时间知道你的店铺运营状况
淘宝数据平台的产品
一、数据魔方
二、量子恒道
量子恒道统计是淘宝官方唯一专注于卖家店铺经营数据的统计与分析产品,也是淘宝唯一能够提供实时店铺数据服务的商业产品。
2009年10月,量子恒道团队正式推出第一版店铺统计产品,在此后不到两年的时间里,量子恒道统计已经服务于超过200万淘宝卖家。
量子恒道统计不仅帮助淘宝卖家分析店铺的流量、转化、跳失、交易、收藏等经营数据,还提供多种流量来源及其效果的数据分析服务。
网址:
三、淘宝指数
淘宝指数是基于淘宝4亿消费者数据交叉分析的数据分享平台。
• 1、基于精准人群和CPV 的数据• 2、基于单品、品牌、店铺的数据,基于搜索的数据• 3、长期的流行趋势,深度挖掘人群标签• 4、基于消费者个人的购物数据• 5、数据输出和可视化的创新尝试
网址:
淘宝指数的四大优势:
四、淘宝情报
淘宝情报于2011年8月全面开放给淘宝百万卖家,是淘宝店铺经营的战地局势图,以数据记录每一天、每一个店铺的成长,揭示店铺在百万对手中的位置,披露同行业竞争变化与商机。
淘宝情报是淘宝第一份给卖家量身打造的数据情报。
网址: 五、汇金
汇金平台是淘宝订购、收费、结算、账务处理的业务支撑平台,为淘宝的各业务线完成软件服务订购、充值支付、服务开通、合作伙伴分成结算,商城保证金、技术年费管理、佣金、积分计费扣款,以及各新垂直市场的供应链结算业务。
汇金平台以基于各种业务建立了业务领域模型,产品的设计上充分抽象业务类型,形成通用性较高的产品解决方案,同时在结算、
账务处理环节进行了严密的稽核、校验及预警机制来保证准确、及时地收费。
产品上划分为产品管理、订购管理、计费结算、账务管理、数据监控,业务可以根据各自业务特征,选择在产品、订购、计费、账务各环节进行接入汇金,接入点后续的流程由汇金为您完成。
网址:
六、淘数据
淘数据,是淘宝数据平台对海量数据进行清洗、聚合,提炼之后产生的所有淘宝价值数据的集中展现平台。
淘数据通过丰富的产品体系,为淘宝内部运营人员提供全面的数据服务,是淘宝网日常运营与管理的重要数据支撑工具。
七、用户中心
用户中心是淘宝的用户数据中心,存储了用户的核心信息,包括用户名,密码,属性,身份证,支付宝绑定等等。
是淘宝的一级核心应用,为淘宝的300多个应用提供服务,每天的访问量在200亿左右,注册用户数6亿左右。
用户中心基本思路是采用分布式方式对用户信息的访问提供统一集中式管理,对外提供用户信息基础服务。
用户中心为淘宝最稳定的系统之一,保证了淘宝每年4000亿的交易量。
我们的目标是稳定为先,简单高效
八、云梯
全淘宝所有部门共享的统一分布式数据处理平台,整合hadoop,hive,hbase,timetunnel,datax,dbsync,天网调度等各项核心技术产品,支撑全公司所有研发人员,产品人员,运营人员,数据挖掘人员的数据采集,处理,分析,挖掘的各项需求。
计算平台:2000+ nodes CPU:24000 core Memory:48000G Disk:24000片
数据规模:存储容量45P左右、综合资源利用率80%以上、日增商业数据50T/Day
计算任务: 计算任务数(50000+个/天)、15%Map-Reduce作业,75%Hive作业,
5%streaming作业
数据服务:报表查询(淘数据)、推荐引擎、量子统计、数据魔方、搜索平台的index building、广告平台的dump数据、淘宝指数、点击流日志分析、各类日志分析、搜索广告算法等。