谁说菜鸟不懂数据分析(工具篇)-读书笔记
谁说菜鸟不会数据分析(一)
谁说菜鸟不会数据分析(一)一、数据分析六步曲:1.明确分析目的和内容2.数据收集3.数据处理4.数据分析5.数据展现:能用图说明问题的,就不用表格,能用表格说明问题的,就不用文字。
6.报告撰写几个常用指标或术语:相对数=比较数值(比数)/基础数值(基数)分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。
3.百分比与百分点:百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度。
4.频数与频率:频数是指一组数据中个别数据重复出现的次数。
频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。
所以频数是绝对数,频率是相对数。
5.比例与比率:比例与比率都属于相对数。
比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
6.倍数与番数:倍数与番数同样属于相对数,但使用时容易混淆。
倍数是一个数除以另一个数所得的商。
需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。
番数是指原来数量的2的N次方倍。
7.同比与环比:同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况,例如2022年12月与2022年12月相比。
环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况,例如2022年12月与2022年11月相比。
二、数据准备2.1理解数据2.1.1字段与记录字段:字段是事物或现象的某种特征。
比如成绩表中的“学号”“姓名”“总分”等都是字段,在统计学中称为变量。
记录:记录是事物或现象某种特征的具体表现。
比如成绩表中的“性别”可以是男或女,“总分”可以是273或者230等,记录也称为数据或变量值。
谁说菜鸟不会数据分析(工具篇)--笔记
1、Accessa)函数计算i.DATADIFF1.DATADIFF(“参数”,起始时间,结束时间)2.3.例句SELECT 用户ID,注册日期,DATEDIFF(“D”,注册日期,#2011-12-31#) AS 注册天数FROM 用户明细;b)数值分组i.IIF函数法1.与Excel中的IF函数用法及功能一样。
在Access数据库中,IIF函数最多可进行13层嵌套2.IFF(表达式,表达式成立时返回的值,表达式不成立时返回的值)3.例句a)SQLSELECT 用户ID,年龄,IIF(年龄<=20,”20岁及其以下”,IIF(年龄<=30,”21-30岁”,IIF(年龄<=40,”31-40岁”,“40岁以上”))) AS 年龄分组FROM 用户明细;b)ii.CHOOSE1.与Excel中的CHOOSE函数用法及功能一样。
2.CHOOSE(参数,结果1,结果2,……,结果N)3.说明:a)参数可为表达式,如果参数或表达式返回的值为1,则函数CHOOSE返回结果1;如果参数或表达式返回的值为2,函数CHOOSE返回结果2,以此类推。
b)参数或表达式返回的值必须为1~254的数字,如果小于1或者大于254,则Access数据库将返回错误值“#VALUE!”。
c)如果参数为小数,则在使用前将被截尾取整,即相当于Excel中的INT函数效果。
4.例句SELECT 用户ID,年龄,CHOOSE((年龄-1)/10+1,”10岁及其以下”,”11-20岁”,”21-30岁”,”31-40岁”,”40岁以上”) AS 年龄分组FROM 用户明细;5.结果iii.SWITCH1.SWITCH(条件1,结果1,条件2,结果2,……,条件N,结果N)2.说明a)如果条件1为True,SWITCH将返回结果1,如果条件2为True,SWITCH将返回结果2,以此类推。
b)参数由成对的条件表达式和结果值组成,条件表达式按照从左到右的顺序求值,将返回与第一个求职结果为True的表达式相对应的结果值。
【读书笔记】数据分析学习总结(一):数据分析那些事儿
1.明确分析思路:首先要明确分析目的:菜鸟与数据分析师的区别就在于菜鸟做分析时目的不明确,从而导致分析过程非常盲目。
这点有比较深的体会,在公司里做过关于搜索和新手的产品数据分析,自己对分析目的没考虑太多,靠的是前人留下的上期数据分析结果,倘若让我从零开始做,估计会很盲目。
然后确定分析思路:梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
最后还要确保分析框架的体系化,使分析结果具有说服力:营销方面的理论模型有4P、用户使用行为、ST P理论、SWOT等;管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART等。
在上周一个汇报上使用了SWOT分析方法,对这些营销或管理的模型还都很陌生。
2.数据收集:一般数据来源于以下几种方式:数据库、公开出版物(统计年鉴或报告)、互联网、市场调查。
3.数据处理:数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。
导师提过在做数据处理时,不要在原始数据上进行数据处理以防原始数据丢失,保留数据处理过程以便发现错误时查找。
4.数据分析:数据分析是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
与数据挖掘的关系是数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
5.数据展现:一般情况下,数据是通过表格和图形的方式来呈现的。
常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等。
进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
在一般情况下,能用图说明问题的就不用表格,能用表说明问题的就不用文字。
6.报告撰写:一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。
结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
谁说菜鸟不会数据分析2篇
谁说菜鸟不会数据分析2篇第一篇:菜鸟也能成为数据分析达人随着信息时代的到来,数据分析成为了越来越多企业必备的技能和能力,成为了一个非常有前途的职业。
也就有了一种误解,认为只有那些具备数学和计算机技能的人才能够从事数据分析。
其实,这个想法是错误的。
即使是一个菜鸟,只要打好基础,也可以成为一位出色的数据分析师。
1、学会自己动手首先,菜鸟在开始数据分析这个工作之前,需要有自学能力。
虽然在学校里或培训课程上可以学到很多,但在实践中,自学才是最实用的方法。
不断地练习和探索,不断研究文档并跟进最新研究成果,这样才能不断进步。
推荐几个学习数据分析的网站:DataCamp、Coursera、Kaggle。
2、学好数学和编程菜鸟要将数据分析这个技能掌握到位,必须学好数学和编程。
不要只是停留在基础的计算思想上,要结合实际问题进行学习。
通过逐渐深入理解各种算法,建立数学模型和计算机模型,学习编程语言等,提高自己的数据分析技能,从而把这些算法应用到实际的问题应用中。
3、学习数据可视化技能学会数据分析,只是开始,但如何把数据分析结果以清晰明了的方式呈现给别人就非常关键了。
这时候就需要菜鸟掌握数据可视化技能。
通过各种可视化工具,菜鸟可以将自己的数据分析结果转化为图表、地图、甚至是3D可视化,使数据分析结果更加直观,有力地支持决策。
推荐几个数据可视化工具: Tableau 、Plotly、D3.js。
4、多交流多接受挑战在数据分析中,多交流是非常重要的。
菜鸟可以参加各种在线活动,参加博客、社群的讨论,了解前沿内容并讨论数据分析中的挑战以及如何解决难题。
通过与其他专业人士和同行的交流,菜鸟可以发现自己在哪些方面比较薄弱和不足,并且通过交流中的互相提高,让自己变得更加专业。
通过以上这些方法,一个菜鸟也可以成为一位出色的数据分析师。
这要求需要菜鸟自己付出时间和精力,不断提升自己的能力。
当然,这一切都是基于良好的基础知识,对于一个充满激情和雄心的菜鸟来说,取得成功就不是一个梦想,而是一个可能实现的目标。
谁说菜鸟不会数据分析_精华内容总结 (2)
#
数据分析综合方法
• 综合评价分析法
1、确定评价的指标 2、对指标数据进行标 准化处理 3、确定各指标权重 4、汇总计算出综合评 价分值 5、根据分值排序,得 出结论
数据标准化
标准值=(原始值-min)/(max-min)
权重确定方法
目标优化矩阵
纵向指标比横向重要时,输入1,否则为0
人才评价 人品 动手能力 创新意识 教育背景 合计 排序 人品 0 1 1 2 2 动手能力 1 1 1 3 1 创新意识 0 0 1 1 3 教育背景 0 0 0 0 4
#
数据分组 1、利用VLOOKUP函数
=VLOOKUP(A2,$D$2:$E$10,2)中, “2”代表“寻找最接近A2,又不能大于A2的值”
#
第3章 数据分析
• 数据分析方法论 • 数据分析方法 • 数据分析工具
#
数据分析方法论
方法论 PEST 4P 逻辑树 用户使用 行为 5W2H 说明 Political, Economic, Social, Technological Product, Price, Place(渠道), Promotion 将问题分层罗列,逐步向下展开 认知→熟悉→试用→使用→忠诚 Why, What, Who, When, Where How, How much 使用范围 行业分析 公司整体经营情况分析 业务问题专题分析 用户行为研究 用途广泛
YD:为start-date,end-date日期中天数的差,忽略日期中的年
入职日期 现在日期 2000-10-1 2011-11-7
工龄(年)
4年
=DATEIF(B1,B2,“Y”)&“年” =DATEIF(B1,B2,“Y”)&“年”&DATEIF(B1,B2,“YM”)&“月”)
谁说菜鸟不会数据分析--整理概括版本
谁说菜鸟不会数据分析-- 整理概括版本数据分析的三大作用一、现状分析简单来说告诉你过去发生了什么第一: 告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明整体经营是好还是坏,以及好坏的程度。
第二: 告诉你企业各项业务的构成,让你了解企业各项业务的发展及变动情况,对企业运营情况有更深入的了解。
二、原因分析简单来说告诉你某一现状为什么发生。
运营情况具体好在哪里,差在哪里。
三、预测分析将来会发生什么对企业的未来发展趋势作出预测,一般通过专题分析来完成的,通常在制定企业季度、年度等计划时进行的,其开展的频率没有现状分析及原因分析高。
数据分析六部曲一、明确分析目的和思路1、明确分析目的(为什么开展数据分析,通过这次数据分析我要解决什么问题等等) 2 、确定分析思路(如何具体开展数据分析,需要从那几个角度进行分析,采用那些分析指标。
要知道先分析什么,后分析什么,使得各个分析点之间有逻辑关系。
通俗来说以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,这样才能确保分析维度的完整性,分析结果的有效性及正确性。
营销理论模型有4p、用户使用行为、stp 理论、swot等,管理方面理论pest、5w2h时间管理、生命周期)3、数据分析方法论(指数据分析思路比如从哪几方面开展数据分析, 各方面包含什么内容和指标, 是数据分析的前期规划,指导着后期数据分析工作的开展。
与数据分析方法不同,前者是宏观角度分析的,后者是从微观角度分析的包括对比分析、交叉分析等等方法。
)常用的方法论有:PEST是指影响一切行业和企业的各种宏观力量。
一般应对的是政治、经济、技术、社会);5W2H何因、何事、何人、何时、何地、如何做、何价);逻辑树分析法(将问题的所有子问题分层罗列,从最高层开始,并逐步向下拓展。
遵循 3 个原则:要素化;把相同问题总结归纳成要素,框架化: 将各个要素组织成框架,遵守不重不漏的原则,,关联化; 框架内的各要保持必要的相互关系,简单而不孤立);4P营销理论(四要素:产品(有形产品、服务、人员、组织、观念和它们的组合)、价格(基本价格、折扣价格、支付期限。
《谁说菜鸟不会数据分析》读后感精选10篇
《谁说菜鸟不会数据分析》读后感精选10篇《谁说菜鸟不会数据分析》是一本由张文霖/刘夏璐/狄松编著著作,电子工业出版社出版的16开胶版纸图书,本书定价:59.00元,页数:306,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。
《谁说菜鸟不会数据分析》读后感(一):我觉得使用excel更合适做这本书的书名我觉得使用excel更合适做这本书的书名,书写的很浅,没有讲太多数据分析的思路,更多的是在说excel的使用。
比起这本书,我还是更推荐《headfirstdataanalysis》作为入门书籍。
《谁说菜鸟不会数据分析》读后感(二):菜鸟看完还是菜鸟本来没多些料,还要讲故事,大部分篇幅可以略过。
收获的可能就是些excel的用法了。
内文图表风格也不一致,有的比较模糊,可以简化或合并一些示例表格。
值得借来翻一遍。
《谁说菜鸟不会数据分析》读后感(三):不错的入门书介绍了一下数据分析的基本知识,外加一些excel技巧,挺适合初入职场的用户入门,尤其是方法论和方法的部分值得好好学。
虽然看标题就知道不会有高深的内容,但如果能基于某一行业或例子一以贯之或许会更好。
《谁说菜鸟不会数据分析》读后感(四):不错的入门书介绍了一下数据分析的基本知识,外加一些excel技巧,挺适合初入职场的用户入门,尤其是方法论和方法的部分值得好好学。
虽然看标题就知道不会有高深的内容,但如果能基于某一行业或例子一以贯之或许会更好。
《谁说菜鸟不会数据分析》读后感(五):只适合连excel都不会的初级者书是全彩图的,不知道是不是为了迎合女性读者。
内容真的就是excel基础,当你要是用它来学excel也根本不行,因为不系统。
大家不要被名字给蒙蔽了,真想看,去书店看一会你就基本都明白了。
不推荐购买。
我买后悔了啊。
《谁说菜鸟不会数据分析》读后感(六):在公司上班的都应该看看的这本书的东西还是写得很有趣的,对于那些在公司上班的人,都值得拥有一本,不知不觉中提升竞争力。
谁说菜鸟不会数据分析(入门篇)笔记5.1数据分析方法-1对比2分组3结构4平均分析法
谁说菜鸟不会数据分析(入门篇)5.1数据分析方法数据分析作用与对应的分析方法数据分析作用 基本方法 数据分析方法现状分析 对比 对比分析平均分析综合评价分析 ……原因分析 细分 分组分析结构分析交叉分析杜邦分析漏斗图分析 矩阵关联分析 聚类分析 ……预测分析 预测 回归分析 时间分析 决策树 神经网络 ……一、定义• 对比分析法 – 将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律。
• 对比分析法的特点:可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是对少。
二、分类分为静态比较和动态比较★ 静态比较 – 在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较,也叫横向比较,简称横比。
★ 动态比较 – 在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比。
三、实践运用1. 与目标对比实际完成值与目标进行对比,属于横比。
例如将公司目前的业绩与全年的业绩目标进行对比,看是否完成目标。
2. 不同时期对比选择不同时期的指标数值作为对比标准,属于纵比。
例如将公司目前的业绩与自身的去年同期及上个月完成情况进行对比。
• 同比 - 与去年同期对比。
• 环比 - 与上个月完成情况对比。
3. 同级部门、单位、地区对比与同级部门、单位、地区对比属于横比。
4. 行业内对比与行业中的标杆企业、竞争对手或行业的平均水平进行对比,属于横比。
5. 活动效果对比对某项营销活动开展前后进行对比,属于纵比。
对活动的开展状况进行分组对比,属于横比。
四、注意事项1. 指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准取衡量。
2. 对比的对象要有可比性。
3. 对比的指标类型必须一致。
• 分组分析法 – 根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。
谁说菜鸟不会数据分析精华内容总结精品PPT课件
输入“0;0;0”或“0.0;0.0;0.0”或“0%;0%;0%” 4、翻转:“坐标轴选项”,选择逆序刻度 1、设置上方横坐标:主次刻度类型,坐标轴标签均选无 2、设置纵坐标:主次刻度类型选无,坐标轴标签选低
#
第5章 图表常见问题
• 让图表“五脏俱全”
V.S
2010年XX公司产品销售情况
(单位:百万元)
*第三季度品牌A的产品包装发现有毒物质 者理解
资料来源:增强数据 可信度
#
• 饼图制作原则
一些简单的原则:
1. 尽量不要用3D效果,如果要用尽量薄一些 2. 饼图的结构中,最多包含5种数据 3. 标注写在图中,不要标记在一边 4. 边界线使用白色,突出边缘感
#
第6章 专业的报告
项目 总成本 成本A 成本B 成本C 成本D
占位数 0
300 200 50
0
成本 500 200 100 150 50
堆积柱形图
选择蓝色柱体,选择 无填充,无边框
#
• 旋风图—成对条形图/对称条形图
用于两组数据对比
1、制作条形双坐标图 2、上下横坐标,都设置为最大100,最小-100 3、不显示负数:在“坐标轴选项”→“数字”→“格式代码”中
数据分析报告的种类 1. 专题分析报告 2. 综合分析报告 3. 日常数据通报
再次强调,对于分析报告而言,需要画龙 点睛的指出报告的结论以及的建议
#
为更好满足学习和使用需求,课件在下载后 可以自由编辑,请根据实际情况进行调整
In order to better meet the needs of learning and using, the courseware is freely edited after downloading
【读书笔记】数据分析学习总结(三):磨刀不误砍柴工——数据理解
如果你想知道到底有多少种数据类型,最简单的方法就是在Excel中任意选择一个单元格,单击鼠标右键-设置单元格格式中可以查看所有数据类型,如图所示:
这么多的数据类型,最终可以归为两大类:字符型数据和数值型数据。
两种类型顾名思义,区分的重要依据为后者可以直接用算术方法进行汇总和分析。
3. 数据表
一张数据表的制作,可以侧面反映出制作者的数据沉淀及应用水平,数据表的设计是否合理,关系着后期数据分析的效率及深度。
数据表设计的六点要求:
1)数据表由标题行和数据部分组成;
2)第一行是表的列标题(字段名),列标题不能重复;
3)第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列;
4)数据表中不能有合并单元格存在;
5)数据表与其他数据之间应该留出至少一个空白行和一个空白列;
6)数据表需要以一维的形式存储,但是在实际操作中接触的数据往往是以二维表格的形式存在的,此时应将二维表转化为一维表的形式存储数据;
对于以上数据表设计的几点要求,本人有所体会,我做的数据报表里有不少的合并单元格,基本都是为了满足一时之需,没有为后续数据分析做长远考虑和规划,还有就是在数据部分不要有空白行和空别列,这些都不是规范的数据表。
读《谁说菜鸟不会数据分析》
读《谁说菜鸟不会数据分析》有感————资讯部陈罗东一提到数据分析很多人就望而却步,无法迈入经常有朋友问:数据分析应该怎么去做?有什么快捷的分析技巧?而最近我们读了一本“谁说菜鸟不会数据分析”从中了解了海量数据分析方法和技巧,本书基于通用的工具EXCEL,加上必知必会的数据分析概念,然后采用通俗易懂的讲解方式,全书共分为8章,以对话问答的形式故事化的情境设计来讲解完成,让读者更有一口气读下去的兴致。
下面就由我来讲述一下对本书的一些感想。
第1章数据分析那些事儿数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它他加以汇总、理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
数据分析是为了提取有用信和形成结论而对数据加以详细研究和概括总结的过程。
主要讲述了所谓数据分析,菜鸟与数据分析师的区别,对数据分析产生的好奇心,数据分析应该做到怎么样的流程,数据分析前应该有那些准备。
从中的数据分析六步曲,首先明确分析目的和内容,然后是数据收集,数据处理,分析,展现,最后撰写数据分析报告,还有数据分析中经常用到的几个术语,平均数绝对数与相对数,百分比,比例等这些采用图形来分类讲述数据分析结果容易出现的错误,这些数据分析流程很值得我们去学习和运用。
第2章无米难为巧妇――数据准备当我们做某件事情时都首先要了解做这一件事情前我们要准备些什么,事情的经过及事情的结果,相同数据分析也必须先要有数据,从一开始的数据收集、数据处理、数据分析都离不开数据。
所以要想数据能达到更效的说服力数据前期准备是相当重要。
了解数据最基本于EXCEL,主要有四种方法,如菜单操作、函数、图表和宏,以及常用的快捷键。
通过简单的工具对数据事先分类汇总处理。
在这里我们还要了解到数据的来源,其主要有两种:导入外部数据和自己录入数据。
自己录入数据为我们提供了四种很好的方法让我们输入时更准确更省时。
第3章三心二意——数据处理数据处理无疑就是对一些数据作增加删除,以及无效数据的筛选,分析数据的可用性及真实性,使得出来的数据具有一的说服力,这是我没读这本书时的个人理解。
《谁说菜鸟不会数据分析》
第 章数据分析那些事儿数据分析是“神马”数据分析六步曲几个常用指标或术语1>> 12谁说菜鸟不会数据分析出场人物:牛董,关键词:私企董事长、要求严格、为人苛刻;小白,关键词:应届毕业生,刚入职场的伪白骨精(白领+骨干+精英)、牛董助手、爱臆想;Mr.林,关键词:小白同事、数据分析达人、成熟男士、乐于助人、做事严谨。
话说小白过五关斩六将,通过严格的面试,最终从众多优秀毕业生中脱颖而出,成为公司的一员。
在报到的第一天,公司HR向小白介绍了她的职位——公司牛董的助理,负责文秘工作,可能需要做一些数据分析之类的活儿。
小白一听到数据分析这个词,就感觉头皮发麻,这时,她的脑子里幻想出一些穿白大褂的科研人员在实验室的计算机前不断忙碌的场景。
虽然在上大学时也使用过Excel,但是如果要做数据分析工作,她还真的有些不知如何下手。
无数个问号涌到她的脑海中:数据分析到底要做什么呢?我要怎么做数据分析?老板想要看什么样的结果呢?……唉,只好边走边干了。
HR看出小白的心事,说道:关于数据分析你不用太担心,如果遇到难题,你可以请教我们公司的Mr.林,他在这方面可是专家喔!小白一听有救星,立马兴奋起来,好像抓到救命稻草一样,想赶紧找到这位大师级人物,然后一股脑把疑问全倒出来。
HR:小白,你跟我来吧,我给你引荐下Mr.林。
小白:好的。
说着小白跟HR来到了Mr.林的办公桌旁,HR说道:Mr.林,这是我们公司新来的同事,叫小白,现担任牛董助理,她的部分工作涉及数据分析,到时候有问题还要麻烦您多多指点了。
小白紧跟着说道:Mr.林,您好,请多多指教。
Mr.林:呵呵,太客气了,有问题直接来找我就可以了。
小白趁机说道:我现在就有问题,您现在是否有时间帮我解答下?数据分析是干什么的,具体要怎么做?Mr.林听完后,笑了起来:你还真是不客气呀,好吧,你刚进公司,我就先给你做个简单的培训,带你入个门吧,以后的修行可就靠你自己努力了。
小白用力点着头,HR见这“师徒”二人颇有一见如故之感,大致交代一番后,就离开了。
谁说菜鸟不会数据分析
图表作用:表达形象化、突出重点、 体现专业化
常用图表:柱形图、条形图、饼图、 折线图、散点图等
关系-图表
图表制作五步法
表格妙用:突出显示单元格、项目 选取、数据条、图标、集迷你图
图表换装:帕累托图的制作、旋风 图、人口金字塔、漏斗图、矩阵图
第六章:给数据量体裁衣-数据展现
第六章:给数据量体裁衣-数据展现
PART ONE
01 第 一 章 : 数 据 分 析 那 些 事
数据分析步 骤
数据分析误 区
数据分析定 义
数据分析分 类
数据分析作 用
数据分析师职 业发展要求
第一章:数据分析那些事
第一章: 数据分析 那些事
常用指标术语:平均数、绝对数、相对数、 百分比、百分点、频数、频率、倍数、番 数
第一章:数据分析 那些事
数据分析师职业发展要求
据严 客谨 壹 观负 、责 准( 确保 )证
数
么一好 ?般奇 贰 ),心
无强 数烈 个( 为侦 什探
构逻 为辑 叁 王思 )维
清 晰 ( 结
路鉴擅 、他长 肆 方人模 法优仿 )秀学
分习 析( 思借
提创
出新 伍 改(
进模 、仿 创中 新总 )结
、
基本素质
PART ONE
02 第 二 章 : 结 构 为 王 - 确 定 分 析 思 路
感谢聆听
图成 壹 、分
瀑关 布系 图饼
形频 肆 图率
分 布 柱
-
-
-
排 贰序
柱 状 图
图相
伍
关
性
散 点
-
线时 叁 图间
序 列 折
达多 陆 图重
比 较 雷
《谁说菜鸟不会数据分析》读后感
《谁说菜鸟不会数据分析》读后感对小蚊子老师的大作《谁说菜鸟不会数据分析》期待了许久。
当拿到这本书的时候,我迫不及待地开始翻阅起来。
读后收获颇多:一.收获了清晰的数据分析流程。
数据分析是一个完整的流程。
正如书中的逻辑,数据分析时由数据收集、数据处理、数据分析、数据展现及数据分析的报告撰写等环节构成。
而这些环节环环相扣,每一环节都必须注意其中的细节。
《菜鸟》这本书按照数据分析的流程来介绍数据分析,对刚开始接触数据分析的我来说,帮助无疑是很大的。
通读本书,使我对数据分析的整体有了深刻而全局的认识。
二.收获了职场经验和职场技能。
书中以故事对白的形式介绍数据分析。
阅读的时候,读者可以根据自己的数据分析水平来选择Mr林或者小白作为自己的角色,从而给人一种置身职场的感觉。
对于我来说,小白就是我阅读时的角色。
故事中小白的虚心好学,这无疑是职场新手应该具备的素质。
另外,以小白作为角色,用一种学习的态度去掌握数据分析技能,从而提高职场技能。
对于即将踏入职场的我,感受最深的的是图表呈现、数据分析报告的撰写以及excel 的一些函数和公式的应用。
这些技能将对我带来很大的帮助。
三.收获数据图表的使用原那么及方法。
做论文的时候,作为初学者一般会犯这样的错误:把数据分析的结果都呈现到文章中去。
《菜鸟》多处强调了图表的使用应该以简约为原那么,并且要以观点为导向,及图表应该为观点阐述效劳。
虽然在别的书也看过这些警示,而这本书不但给出警示,还教我们怎样做到简约。
以上简要总结了三点收获,其实从这本书所收获的知识还不止这三点,比方还收获了许多学习数据分析的网站、博客、名人等,收获了ppt的一些展示原那么以及颜色搭配的知识等。
《菜鸟》是一本详细、信息丰富,适合数据分析入门者阅读的好书。
数据分析心得体会
数据分析心得体会数据分析是一门重要的技能,它可以帮助我们更好地理解数据背后的信息和规律。
在进行数据分析的过程中,我积累了一些心得体会,希望能够与大家分享。
一、数据清洗与准备1.1 确保数据的准确性在进行数据分析之前,首先要对数据进行清洗和准备。
确保数据的准确性是非常重要的,因为准确的数据才能够为我们提供正确的分析结果。
1.2 处理缺失值和异常值在清洗数据的过程中,我们需要处理缺失值和异常值。
缺失值和异常值会对分析结果产生影响,因此需要采取相应的方法进行处理,如填充缺失值或剔除异常值。
1.3 数据格式转换在数据准备阶段,我们还需要对数据进行格式转换。
比如将日期格式转换为标准的日期格式,或者将文本数据转换为数值数据,以便进行后续的分析。
二、数据探索与可视化2.1 探索性数据分析在进行数据分析的过程中,我们需要进行探索性数据分析。
通过绘制直方图、散点图等可视化图表,可以更直观地了解数据的分布情况,发现数据之间的关系。
2.2 利用统计方法进行分析除了可视化分析,我们还可以利用统计方法进行数据分析。
比如计算均值、标准差、相关系数等指标,来量化数据之间的关系和趋势。
2.3 利用工具进行数据可视化在进行数据可视化的过程中,我们可以利用各种工具来帮助我们更好地展示数据。
比如使用Python的matplotlib库或Tableau等工具,可以制作出美观且直观的图表。
三、数据建模与预测3.1 选择合适的模型在进行数据建模和预测的过程中,我们需要选择合适的模型。
根据数据的特点和问题的需求,选择适合的回归模型、分类模型或聚类模型进行分析。
3.2 模型评估与调优在建立模型之后,我们需要对模型进行评估和调优。
通过计算模型的准确率、精确率、召回率等指标,可以评估模型的表现,并对模型进行调优以提高预测效果。
3.3 模型应用与结果解释最后,在进行数据建模和预测之后,我们需要将模型应用到实际问题中,并解释模型的结果。
通过解释模型的预测结果,可以为决策提供参考依据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8)
分组统计,只要在简单统计的基础上加上 group by,比如按产品分类 Select 产品, Count(订单编号)AS 订单总数, Sum(订单金额) AS 订单总金额, From 订单明细 Group by 产品; 如果分类复杂一点,比如按下单时间段分布,可以加上日期函数 Select format(订购日期,“h”) AS 时段, Count(订单编号)AS 订单总数, Sum(订单金额) AS 订单总金额, From 订单明细 Group by format(订购日期,“h”) ; 如果分类再复杂一点,按另一个表的年龄段分组,并且要去除重复的项,需要先关 联两个表,然后去重。 Select 年龄分组,count(用户 ID) AS 用户数 From (select distinct A.用户 ID, partition(B.年龄,1,100,20) AS 年龄分组 From 订单明细 A, 用户明细 B Where A.用户 ID=B.用户 ID) Group by 年龄分组;
2据检索到 office 应用中,特别是 Excel,主要是使用 sql 语句,一般适用于 数据量较小,不要处理数据或者简单的数据处理,使用流程如下
建立数据源连接数 据
使用“查询向导”, 选择数据
使用sql语句
结果返回Excel
1)
数据导入:在 Excel 中,用获取外部数据导入,进来连接;用查询向导选择数据时,要 先建立关系,拖动字段方式建立的内部连接。
(四) 挑几个和主题息息相关的篇章来看。也可以是感兴趣的章节。 略,经推荐的书准备认真研究。 (五) 快翻整本书。尤其是最后一页总结。 略,只有每章总结,无全书总结。 2. 粗浅的阅读:了解全书内容的第一个步骤。 整体性的浏览全书。
三、分析阅读
1.
第一阶段:找出一本书在谈些什么。 规则一:依照书本的种类与主题做分类。 论说类的作品,具体是实用性的。 规则二:用最简短的句子说出整本书在谈些什么。 基于 Excel,结合 access 和 VBA 技术,说明数据分析的工具 规则三:按照顺序与关系,列出全书的重要部分。将全书的纲要拟出来之后,再将各 个部分的纲要也一一列出。
5)
快速数据计算 简单计算:加减乘除等算术运算,菜单是查询向导,sql 语句用简单计算+新建字段 函数计算:比如日期函数,datediff(“参数”,起始日期,结束日期),如果是日期和
6)
时间类型的字段名,一定要加“#”。 数据分组:常见的数据分组,主要有数值分组和日期/时间分组 数值分组 函数 IIF Choose Switch Partition 函数形式 IFF( 表达式,表达式成立返 回值,表达式不成立返回值) Choose(参数,结果 1,结 果 2,结果 3……) Switch(条件 1,结果 1,条 件 2,结果 2……) 优点 可进行不等距分 组 分组可达 254 个 可进行不等距分 组 缺点 语句冗长易错 最多进行 13 层嵌套 只能等距分组 条件最多 14 个
2)
Select Delete Insert into Create table Drop table •
按照一定条件选择 删除记录 插入记录 新建数据表 删除数据表
•
核心是 select 语句,一般格式为如下 Select 字段 1,字段 2,…… From 表 Where 条件 注意事项有 9 条,分别如下 语句中字母大小写均可; 关键字用空格分开,如 select 字段 from 表 字段或参数用逗号分隔; 语句中有字符,则用单引号,数值型不使用 语句结束要结尾加分号 字段、表名中出现空格、“/”、“\”等特殊字符,要用方括号[]将特殊字符 括起 Select *代表所有字段 参数或查询条件为日期和时间类型数据,需要在数据值两端加上# 标点符号是英文状态下的 尽量避免全表扫描,首先 where 语句筛选出需要的数据,其次 where 语 句避免“!=”、“<>”、“OR”等;最后避免对字段进行函数操作。
(一) 高效处理千万数据
运营分析部门的主要职责: • 运营周报、日报、月报等日常通报 • 开展业务分析专题 • 开展市场研究,如果现有数据无法满足,就加入用户调研数据 • 开展预测分析 • 搭建公司经营分析体系
1 最容易上手的数据库
1) 数据库的基本功能:新增、编辑、删除、以不同方式查看 • Access: 记录不超过亿条就可以用, 主要用表和查询, 查询实际上是一个固定筛选, 将指定条件的数据筛选出来,并以表的形式返回结果。 SQL:结构化查询语言,常用语法如下 基本语句 说明
2)
数据处理:主要是用 sql 语句,直接在 microsoft query 中的菜单中找到 sql,按照 access 的方法进行处理
3)
数据分析:就是在数据处理的基础上,继续用 sql 进行分组等,最后可以把结果保存为 数据透视表,操作起来更灵活一点。
3) 4)
导入数据:直接导入法 VS 链接导入法,后者能够即时同步数据。 数据合并:横向合并 VS 纵向合并 横向合并:根据不同表共有的关键字段,合并更多的字段,可以用关系+查询向导 菜单,也可以用 sql 中的 select 语句,并且可以简化如下 Select B.用户 ID, B.产品, A.性别 From 用户明细 A, 订购明细 B (重新命名表名) Where A.用户 ID = B.用户 ID 纵向合并:记录的合并,相同的字段结构,字段数目,字段的数据类型。可以通过 菜单的追加查询功能,或者 sql 语句,用 union 或者 union all,前者删除重复,后 者不删除。 Select * into 订购明细 201109 From (select * from 订购明细 20110901 Union all Select* from 订购明细 20110902);
交叉表统计:二维表。菜单查询向导中的交叉查询, sql 语句需要在前面加上 transform,增加行和列交叉的函数及字段,后面加上 pivot,作为列分组字段。 Transform count(用户 ID)AS 用户 ID 统计数 Select 省份,count(用户 ID)AS 用户 ID 统计数 From 用户明细 Group by 省份 Pivot 性别;
目录
(一) 高效处理千万数据....................................................... 2 1 最容易上手的数据库 ................................................... 2 2 Microsoft query ........................................................ 5 (二) 玩转数据分析........................................................... 6 1. Excel 数据分析工具-power pivot ......................................... 6 2. Excel 数据分析工具库.................................................. 7 (三) Show 出你的数据....................................................... 12 1. 数据可视化.......................................................... 12 2. Excel 可视化伴侣:水晶易表 .......................................... 13 3. 水晶易表实战........................................................ 13 (四) 让报告自动化.......................................................... 14 1. 自动化神器——VBA ................................................... 14 2. Excel 报告自动化 .................................................... 15
Partition (数值参数, 开始值, 分组不限 只能等距分组 结束值,组距) 语句简单、清晰、 明了
7)
日期/时间分组 Year、month、day 等常用函数,还可以用 format 按指定要求格式化。 Format(时间/日期,格式参数)AS 新参数名称 重复数据处理,主要是 sql 中 group by 语句的运用,其中 first 是找到第一条,count 是计 数,having + group by 相当于 where。 重复项查询 Select first(用户 ID), count(用户 ID) AS numberofdups From 订单明细 Group by 用户 ID Having count(用户 ID)>1; 不重复项查询 Select first(用户 ID), count(用户 ID) AS numberofdups From 订单明细 Group by 用户 ID Having count(用户 ID)=1; 删除重复项 Select first(用户 ID), count(用户 ID) AS numberofdups From 订单明细 Group by 用户 ID; Distinct 函数也可以进行删除重复项,很简单,如下 Select distinct 用户 ID From 订单明细; Access 中的数据分析:主要有简单统计、分组统计和交叉统计三种 简单统计:不要使用数据透视表,会拖慢速度,用 sql 语句,主要是函数的使用, 比如计数 Select Count(订单编号)AS 订单总数, Sum(订单金额) AS 订单总金额, From 订单明细;