谁说菜鸟不懂数据分析(入门篇)-读书笔记
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3. 数据加工
1) 数据抽取: 字段分列, 截取某字段一部分的信息, 根据分隔符菜单操作、 用 left 和 right 函数;字段合并(concatenate、&) ;字段匹配,将几个数据表中的数 据有效匹配(vlookup) 。 2) 数据计算:简单计算,通过加减乘除就能计算出来的;函数计算,常用的如下 用途 平均值 求和 自动输入日期 日期年月日加减 日期年月日间隔 函数 Average() Sum() now()、today() Date(year(),month(),day()) Dateif(start,end,unit)
2. 数据来源:
1) 2) 导入数据:文本导入(确定分隔符) ,网站导入(可选择自动更新) 调查问卷录入:单选(录入对应数值) ,多选(二分法) ,排序,开放性 第3题 编号 112 年 2001 月 9 第 7 题 2 第 10 题 A 1 B 0 C 1 D 0 第一 重要 3 第 23 题 第二 重要 4 第三 重要 1 第 40 题 建议增加培训费 用
谁说菜鸟不懂数据分析
张文霖 刘夏璐 狄松
一、简要说明 采用《如何阅读一本书》中的规则进行分析,不涉及主题阅读,按照主动阅读的顺序: 从检视阅读到分析阅读进行。
二、检视阅读 1. 有系统略读: 了解书的架构, 适用于不知道想不想读, 不知道有没有必要做分析阅读, 或者时间有限。 具体做法有: (一) 先看书名页,如果有序就先看序。了解书的主题,特别注意副标题,或者其他的相 关说明,或作者写本书的特殊角度。 本书题目是谁说菜鸟不懂数据分析-入门篇,副标题是告诉你职场图表背后的故事。通 过前言,评论和内容简介可知,本书是基于 excel 的各种实用技巧,加上基础性的数据分析 概念,以风趣的小说形式,为初入数据分析大门的人解释什么是数据分析,以及如何有效的 数据分析。 (二) 研究目录页,对这本书的基本架构做概括性的理解。 本书分为 8 章,分别是关于数据分析的基本介绍,以及数据分析的整个流程,包括确定 分析目的和思路、数据准备、数据处理、数据分析、数据展现和撰写报告。 (三) 索引和出版者的介绍没有,略去。 (四) 挑几个和主题息息相关的篇章来看。也可以是感兴趣的章节。 略,经推荐的书准备认真研究。 (五) 快翻整本书。尤其是最后一页总结。 略,只有每章总结,无全书总结。 2. 粗浅的阅读:了解全书内容的第一个步骤。 整体性的浏览全书。
目录
(一) 数据分析的那些事儿..................................................... 2 1. 什么是数据分析及作用: ............................................... 2 2. 数据分析六部曲: ..................................................... 3 3. 数据分析三大误区: ................................................... 3 4. 数据分析师的要求: ................................................... 3 5. 常用术语和指标: ..................................................... 3 6. 数据分析心法:....................................................... 4 (二) 结构为王——确定分析思路 ............................................... 4 (三) 无米难为巧妇——数据准备 ............................................... 7 1. 理解数据:........................................................... 7 2. 数据来源:........................................................... 7 (四) 数据处理............................................................... 7 1. 何谓数据处理:....................................................... 7 2. 数据清洗............................................................. 8 3. 数据加工............................................................. 8 4. 数据抽样:........................................................... 9 (五) 工欲善其事必先利其器——数据分析 ....................................... 9 1. 数据分析方法......................................................... 9 2. 数据分析工具........................................................ 15 (六) 给数据量体裁衣——数据展现 ............................................ 15 1. 图表................................................................ 15 2. 表格................................................................ 16 3. 给图表换装.......................................................... 16 (七) 专业化生存——图标可以更美的 .......................................... 21 1. 别让图表犯错........................................................ 21 2. 图表美化............................................................ 23 3. 数据报告............................................................ 26
4P 营销理论
了解公司的 整体运营情 况
PEST
行业分析, 宏 观环境的分 析, 指影响一 切行业和企 业的各种宏 观力量
5W2H
逻辑树
5W2H
Pest
逻辑树
4P
用户行为分析
(三) 1. 理解数据:
1) 2) 3)
无米难为巧妇——数据准备
字段与记录:列与行,特征与特征的具体表现 数据类型:字符和数据 数据表:标题行+数据;第一行是字段名,不能重复;第二行是数据,不允许出现 空白行和空白列; 数据表中无合并单元格; 数据表与其他数据至少隔开一个空白行 和列;一般用一维表,二维表用数据透视表转化
6. 数据分析心法:
学习:先了解,后深入;先记录,后记忆;先理论,后实践;先模仿,后创新 方法:先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动手 分析:先业务,后数据;先假设,后验证;先总体,后局部;先总结,后建议
(二)
结构为王——确定分析思路
数据分析方法论:跟数据分析相关的营销和管理理论,宏观指导数据分析 数据分析法:具体的数据分析方法,如对比分析等,微观指导数据分析 名称 适用范围 基本要素 产品(product) ; 价格(price)——最高价取决于需求,最低价取决于成 本,中间取决于竞争; 渠道(place) ; 促销(promotion)——促销四大要素(广告、宣传推 广、人员推销、销售促进) ; 用户行为理论 用户行为分 析 用户获取产品的各种行动: 认知——熟悉——试用—— 使用——忠诚客户 政治(political)——社会制度,执政党性质以及政府 的方针、法令 经济(economic)——宏观(国家总体情况) 、微观(企 业所在地或者服务区的情况) 社会(social)——文化水平(需求层次) 、宗教信仰/ 风俗习惯(禁止或者抵触某些活动) 、价值观念(活动 目的或者组织本身的认可) 、审美观念(活动内容、方 式及成果的态度) 技术(technology)——直接技术手段,技术领域的发 展和政策 用户行为研 究或者业务 专题分析的 逻辑分析方 法 业务问题专 题分析 5W——何因(why) 、何事(what) 、何人(who) 、何 时(when) 、何地(where) 、 2H——如何做(how) 、何价(how much) 问题树,演绎树,分解树: 将问题的所有子问题分层罗列, 从最高层开始, 逐步向 下扩展,要素化、框架化、关联化
5. 常用术语和指标:
名称 平均数 绝对数 相对数 解释 一般指算数平均数,代表总体的一般水平,掩盖了总体内各单位的差异 一定时间地点条件下 总体情况的综合指标或者数量增减变化的绝对数 =比较数值(比数)/基础数值(基数) ,两个有联系的指标对比计算而 得到的数值,反应客观现象之间数量联系程度的综合指标 百分比 百分点 相对数的一种,百分数 不同时期以百分数形式表示的相对指标的变动幅度。 变动幅度最好用百 分点,比如“今年公司利润比去年提高了 10 个百分点” ,而不是“10 个百分比” 频数 频率 比例 比率 某个别数据出现的次数,绝对数 个别数据出现次数占总次数的比值,相对数 部分与总体的关系,反应总体的构成 部分与部分的关系。比如,我国人口性别比,指的是每 100 名女性相对 的男性数量 倍数 番数 同比 环比 表示数量增长或者上升幅度的商。下降可以用百分比 原来数量的 2 的 N 次方,翻一番是 2 倍 与历史发展同时期比较,反应事物发展的相对情况 与上一个统计时期,反应事物逐渐发展的情况
百度文库
2. 数据分析六部曲:
明确分析目的和思路——数据准备——数据处理——数据分析——数据呈现—— 撰写分析报告。
3. 数据分析三大误区:
分析目的不明确,缺乏业务知识,以为追求高级分析方法
4. 数据分析师的要求:
职业要求:懂业务、懂管理(分析框架和建议) 、懂分析、懂工具、懂设计 职业素质:态度严谨、好奇心强、逻辑清晰、擅长模仿、勇于创新
(一)
数据分析的那些事儿
1. 什么是数据分析及作用:
数据分析是为了提取有用信息和形成结论,而对数据进行研究和概括总结的过程, 一般分为描述性数据分析、探索性数据分析和验证性数据分析。其中,探索性数据 分析重在发现新的特征,验证性数据分析则是验证已有假设。
数据分析的作用是现状分析、原因分析及预测分析。
( 四) 1. 何谓数据处理:
数据处理
1) 2)
三心二意:信心、细心和平常心;诚意和合意 数据处理过程:数据清洗(删除重复、处理异常和缺失) ,数据加工(提取想 要的信息)
根据数据分析的目的,将数据处理成数据分析的要求样式。
2. 数据清洗
1) 重复数据: 函数(countif 对满足条件的计数) ,高级筛选(高级筛选+选择不重复的项) , 数据透视表(选择编号到行,同时到汇总) ,删除重复(菜单、countif 后排序 删除等) 2) 缺失值:可接受的是 10%以下 查找中的条件定位——处理,一般有 4 种处理方法,样本平均值代替(典型做 法) ,删除,模型计算值代替,缺失值保留在分析时处理——定位条件配合 ctrl+enter 3) 异常值:从逻辑和业务上去检查,用 if 函数检查错误,用条件格式标记错误
三、分析阅读 1. 第一阶段:找出一本书在谈些什么。 规则一:依照书本的种类与主题做分类。 论说类的作品,具体是实用性的。 规则二:用最简短的句子说出整本书在谈些什么。 入门级别的基于 excel 的数据分析方法和方法论。 规则三:按照顺序与关系,列出全书的重要部分。将全书的纲要拟出来之后,再将各
个部分的纲要也一一列出。