新手如何学数据分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析新手入门资料(系列一)
来源:知数教育网
什么是数据分析? (2)
如何用数据? (5)
在数据分析、挖掘方面,有哪些好书值得推荐(43本全)? (6)
一、到底什么是数据分析
之前在微博上发起一个话题,大家一句话向外行说说什么是数据分析?有100多位同学参与讨论和转发,其中一些有意思的、不错的说法,大家一起来看看。
最专业的数据分析:
@沈浩老师: 有针对性的收集、加工、整理数据,并采用统计和挖掘技术分析和解释数据的科学与艺术!
最简洁的数据分析:
@小蚊子乐园:简单的很,就是分析数据。
@Terensu:描述数据特征,预测数据趋势,展示分析结果。
@wangman02:从一大堆数据中提取到你想要的信息,就是数据分析。
最浪漫的数据分析:
@数据化管理:数据分析就是:茫茫人海中,你通过观察、跟踪、记录等手段找到你生命中最想爱的那个人,进而根据对方的喜好,成功的展示了自己的优点,改进了自己的缺点,并且说服了对方的父母,承诺终身与ta为伴的一项工作。
@刘万祥ExcelPro: 你喜欢上一个姑娘,你会搜集她的兴趣、爱好、星座、闺密、乃至三围。。。等等各种信息吧,然后想自己怎么能搭讪上、约出来,碰壁了会继续找原因、想办法,这里面你都有在做数据分析呀。
@CIVN可视化社区:从你每天发的微博研究你喜欢哪个明星、是哪个星座的、喜欢吃什么买什么、大概几岁会嫁出去。
最IT的数据分析:
@穆浩然:所以我一般都说我是做IT的。
@YicoLeung:复制粘贴。
@仓鼠_茄子把:你应该对男的低调说自己是码农,对女的高调说自己是分析师!现在甭管是什么职业,加个师字就显得特牛B,比如策划师,揉奶师,面包师,搬砖师等等。
最实用的数据分析:
@ETwise:我告诉别人:你买了牙膏我还会推荐你买牙刷,我就是做这样的工作的。
@老仲琢磨:可以知道刚当爹的男人买尿布时最可能顺便买点啥。
@张勇往前行:每个月月底,老婆问你,这个月的钱你是怎么花的?你的回答就是数据分析。
最神化的数据分析:
@张启仁:数据分析是算命的。
最霸气的数据分析:
@淘货郎:数据分析就是企业的军统和中统。
@牧羊人_DM:这是一个很有前途特牛B的职业,具体细节你没必要知道。
最恐怖的数据分析:
@游走的背包:数据分析就是文革时的查人祖上三代,最后定义你这代什么成份!
@宝泥马冷死了:从你爸的日常行为统计中推测你下次考试不及格他会用什么东西揍你。
那到底什么是数据分析呢?
说说数据哥的理解:数据分析是基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价信息的一个过程。
其过程概括起来主要包括:明确分析目的与框架、数据收集、数据处理、数据分析、数据展现和撰写报告等6个阶段。
1、明确分析目的与框架
一个分析项目,你的数据对象是谁?商业目的是什么?要解决什么业务问题?数据分析师对这些都要了然于心。
基于商业的理解,整理分析框架和分析思路。例如,减少新客户的流失、优化活动效果、提高客户响应率等等。不同的项目对数据的要求,使用的分析手段也是不一样的。
2、数据收集
数据收集是按照确定的数据分析和框架内容,有目的的收集、整合相关数据的一个过程,它是数据分析的一个基础。
3、数据处理
数据处理是指对收集到的数据进行加工、整理,以便开展数据分析,它是数据分析前必不可少的阶段。这个过程是数据分析整个过程中最占据时间的,也在一定程度上取决于数据仓库的搭建和数据质量的保证。
数据处理主要包括数据清洗、数据转化等处理方法。
4、数据分析
数据分析是指通过分析手段、方法和技巧对准备好的数据进行探索、分析,从中发现因果关系、内部联系和业务规律,为商业目提供决策参考。
到了这个阶段,要能驾驭数据、开展数据分析,就要涉及到工具和方法的使用。其一要熟悉常规数据分析方法,最基本的要了解例如方差、回归、因子、聚类、分类、时间序列等多元和数据分析方法的原理、使用范围、优缺点和结果的解释;其二是熟悉1+1种数据分析工具,Excel是最常见,一般的数据分析我们可以通过Excel完成,后而要熟悉一个专业的分析软件,如数据分析工具SPSS/SAS/R/Matlab等,便于进行一些专业的统计分析、数据建模等。
5、数据展现
一般情况下,数据分析的结果都是通过图、表的方式来呈现,俗话说:字不如表,表不如图。。借助数据展现手段,能更直观的让数据分析师表述想要呈现的信息、观点和建议。。
常用的图表包括饼图、折线图、柱形图/条形图、散点图、雷达图等、金字塔图、矩阵图、漏斗图、帕雷托图等。
6、撰写报告
最后阶段,就是撰写数据分析报告,这是对整个数据分析成果的一个呈现。通过分析报告,把数据分析的目的、过程、结果及方案完整呈现出来,以供商业目的提供参考。
一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
另外,数据分析报告需要有明确的结论、建议和解决方案,不仅仅是找出问题,后者是更重要的,否则称不上好的分析,同时也失去了报告的意义,数据的初衷就是为解决一个商业目的才进行的分析,不能舍本求末。
二、如何用数据
光知道怎么看数据,还是不成,你得熟悉这些数据拿到手上之后怎么去用它,怎么让数据显示出来它本身的威力来。最后总结下来有这么几个部分。
第一个部分,是看历史数据,发现规律。以社区中的活动和电商中的促销为例,这些都是常见的活动,活动做得好的话有意想不到的效果。在做这样的活动,最好是拿到前一个月或者两个月的历史数据。对电商来说,从这里面要去分析各个品类的销售情况,那个品类销量最大,那个品类销量最小,每月或者每周的平均增长率和符合增长率是多少。通过原始数据把上面的这些指标分析出来之后,就可以看到哪些品类是优势品类,不用促销就可有很大的量,哪些是弱势的品类等等,这样可以确定出来拿那个品类出来做促销。对于内容社区也是一样,我们要从内容分类,和内容类型两个维度上去看,找到数量少类型单一的分类,对于这些分类下的内容数量及质量都需要提高。
第二部分,是从历史数据和现有数据中,发现端倪,找出问题所在。我们在工作中,每天都会接触到大量的数据,但是大部分看数据就流于表面了。例如对于社区来说,很关注总注册用户数,每日登录用户数,每日新用户注册数。这些数据不能说不可以看,但是更要看到最重要的数据点:每天有多少老用户登录、每天发布的内容中有多少能够称得上是优质的精品内容,这两个数据决定着说这个社区的质量怎么样,对于内容社区来说,初期如果不重视质量建设,那么等用户到50W、100W之后再去看质量,已经有点晚了。还有一个是市场部门用的会很多,在市场宣传过程中,我们会有很多广告和链接放出去,每天要监测这些链接数据量,当出现数据波动非常大的时候我们应该怎么去做,是要看到链接放置的媒体出现了问题,是不是对方做活动突然吸引了大量的人来,还要去看到我们的着陆页面,是不是吸引用户点击等等。数据就是我们的助手,帮助我们发现问题,同时顺藤摸瓜找到问题的根源所在。这个能力是非常重要的,不管是不是做数据相关工作的人,都要能够掌握。
第三部分,数据预测。通过分析数据,发现其中的规律,那么则可实现数据驱动运营,驱动产品,驱动市场。例如,对电商来说,知道一年内每个月的各个品类的增长率,也清楚各月之间的影响情况,那么按照这个量就可预测未来月度里面交易量的增长情况,我们能够达到什么样的水平。同时,在某个大型活动完结之后,不是立即看数据,要看活动结束后一个月后的数据,这样才能看到多少用户是因为活动的奖品过来,活动结束之后就走了,为什么选一个月,因为在一个月内流失率什么的就一目了然了。
第四部分,学会拆解数据。这个拆解数据在我看来有两方面的维度一个是每年的数据指标怎么去分拆到每个季度,或者每个月,这个有点绩效驱动的意思了。另外一个就是说每天产品的运营数据,推广数据或者销售数据有很多,要会对这些数据进行拆分,知道每个数据都是来自哪些方面,增高或者降低的趋势是什么。