实用数据报表分析案例之一
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实用数据报表分析案例之一
关键字: 数据挖掘统计分析excel透视表
最近做了一些简单的数据分析工作,个人觉得比较简明,也适合一些初级者使用,就想记录下来与大家分享。具体的长论就不多说了,数据都一样,都需要不同的方式处理加工,重要的是思路和最终目的,是要将数据分析的结果指导未来发展,产生价值。这里,我以一个简单的例子为文,将一些基本的处理步骤记录下来,供参考。
表1(全表部分截图)
表1是一张原始数据报表截图,这张数据报表很普通,总共有6个项,分别是ID,关键字,IP,省份、发起搜索页和搜索时间。首先,我们需要有个指导方向,就是目的。根据这张报表,我假设了一些问题,并根据问题对报表数据进行挖掘分析。
假设问题如下:
1、我的用户什么时间来?趋势如何?
2、我的用户主要来自哪里,趋势如何?
3、他们主要搜索什么,搜索的趋势如何?
4、重点区域在哪里?梯度的占比如何?
5、重点区域用户主要搜索了什么?趋势如何?
6、重点区域用户什么时间来?趋势如何?
7、重点区域用户的主要发起页有哪些,趋势如何?
8、假设投入方案参考
方向有了,再看一下报表,为了是之后的分析理解更方便,我需要稍微加工一下。当然,加工是原始数据的一些形式变化,为了回答问题需要,绝对不是凭空的增加数据,保持数据的真实性,只有真实的数据才有分析的价值。
我在原始报表里增加了一个数据项,现在变成表2的样子:
表2(全表部分截图)
这个多出来的项就是星期,它的函数”=WEEKDAY( )”,这样,我就可以按照日常的工作时间模式来分析,便于理解。
通过上面的调整后,我们再看下报表,得到报表2的情况如下:
*数据项7个,分析增加1个
实际分析,我主要用到上面的4个数据项,关键字,IP,省份和发起页面。ID 是统计计数,当然也可以和搜索时间和星期一起做个统计的,这里以时间为轴,其他的不多做分析。
好了,进入正题,我们开始回答问题:
1、我的用户什么时间来?趋势如何?
这个问题很实际,时间就是金钱啊。我们选择表2,选择excel工具栏插入下面的数据透视表,然后按照下面表样式,选择对应的数据项,得到日统计报表1.6,图形展示表1.7和月统计报表1.8。我在表1.1的边上增加了百分比,之后类似的报表也是如此,这里是手动增加的。
选择透视表,在行标签插入搜索时间项
表1.1(选项)
点击任意数据,点鼠标右键,选择”组合”
表1.2(组合)选择小时、日、月
表1.3(系统时间)
表1.4
表1.5
表1.6
表1.7
表1.8
总结:通过上面3张表,我们可以从月到日再到时,有了一个清晰的时间维度认识。用户月初和月末来的相对较多,其中,周一,周四,周六较多,而且,他们喜欢下午和晚上来哦,还有其它想法的可以根据图表再猜猜。
2、我的用户主要来自哪里,趋势如何?
选择表2,选择excel工具栏插入下面的数据透视表,然后按照下面表样式,选择对应的数据项,得到表2.2,由表2.3进行前20统计得出表2.5,表2.6是表2.5的图示;
报表项目分别插入省份,月份和IP,点击月份里任意数字,点击排序按钮,操作画面如下。
表2.1
表2.2(排序)
表2.3(全表部分截图)
表2.4(筛选)
表2.5
表2.6
总结:用户主要来自的20个区域中,去除未知因素和国内来源,国际来源也不少,出乎意料之外。当然,里面还有些嘈杂的数据没有处理,如果处理了就更完美了;其中,有14个地区的流量呈现出连续增长的趋势。
3、他们主要搜索什么,搜索的趋势如何?
选择表2,选择excel工具栏插入下面的数据透视表,然后按照下面表样式,选择对应的数据项,得到表3.1,由表3.1进行前20统计得出表3.2,表3.3是表3.2的图示;上面两个分析过程已经将选项、组合、排序、筛选等步骤依依图示介绍,下面的过程将不在重复展示操作示图。
表3.1(全表部分截图)
表3.2
表3.3
总结:虽然前20个关键字所占比例较小,但是他们给了我们明确的产品和产品搜索趋势,比如凉鞋、拖鞋等应季产品呈现出明显的下降趋势,而书包却在开学前突飞猛进,应该抓住这个机会,做好投入的调整。还有一些关键词可能受到厂家的营销影响,在不同时间呈现不同的搜索变化,比如耐克是不是最近又在传统媒体做了新的广告投放,这样,我们就要留意相关品牌的市场营销活动,配合做一些调整,没准能有意外惊喜,让厂家和用户都能获得实惠。
4、重点区域在哪里?梯度的占比如何?
选择表2,选择excel工具栏插入下面的数据透视表,然后按照下面表样式,选择对应的数据项,得到表4.1,表4.2,表4.3,表4.4;这一章很重要,因为大家都知道的2/8原则,其实不仅在现实世界,在虚拟世界同样重要,但是,这些产品可能不会占到绝对的2/8销量比例,但是,它可能带来的关联流量和销量绝对值得你去关注。在这里,除了做统计之外,需要做一些分析和测试,找到重点中的重点,并且是真实的,而这一章节的筛选,也将决定后面3个部分的统计内容。
表4.1(全表部分截图)
表4.2(全表部分截图)
表4.3
表4.4
总结:这次表稍微有点多,多的可是有价值的。这里面有个分析步骤,就是20个主要用户来源区域中,欧洲一个单一的IP搜索量很大,需要验证,去查一下,是否有问题,不然,它会影响我们的判断。搜索次数占比反应了不同梯度用户的搜索习惯,搜索的最多的20个用户,所占比例很少。但是搜索做多的20个用户,他们在周一的搜索量明显高于其他时间。这里,我们也可以在这里增加分析的难度,如同一IP不同时间下的搜索等。
5、重点用户主要搜索了什么?趋势如何?
通过上面一个阶段,我们大概知道我们的重点区域在哪里了,接下来,我们将进入重点区域的统计分析。这里我选的是北京。选择表2,选择excel工具栏插入下面的数据透视表,然后按照下面表样式,选择对应的数据项,得到表5.1,表5.2,表5.3时表5.2的图示;哈哈,考眼力的时候到了,这里面的广告,应该能看出来吧。