谁说菜鸟不会数据分析(完整版)课件
谁说菜鸟不会数据分析(一)
谁说菜鸟不会数据分析(一)一、数据分析六步曲:1.明确分析目的和内容2.数据收集3.数据处理4.数据分析5.数据展现:能用图说明问题的,就不用表格,能用表格说明问题的,就不用文字。
6.报告撰写几个常用指标或术语:相对数=比较数值(比数)/基础数值(基数)分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。
3.百分比与百分点:百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度。
4.频数与频率:频数是指一组数据中个别数据重复出现的次数。
频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。
所以频数是绝对数,频率是相对数。
5.比例与比率:比例与比率都属于相对数。
比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
6.倍数与番数:倍数与番数同样属于相对数,但使用时容易混淆。
倍数是一个数除以另一个数所得的商。
需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。
番数是指原来数量的2的N次方倍。
7.同比与环比:同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况,例如2022年12月与2022年12月相比。
环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况,例如2022年12月与2022年11月相比。
二、数据准备2.1理解数据2.1.1字段与记录字段:字段是事物或现象的某种特征。
比如成绩表中的“学号”“姓名”“总分”等都是字段,在统计学中称为变量。
记录:记录是事物或现象某种特征的具体表现。
比如成绩表中的“性别”可以是男或女,“总分”可以是273或者230等,记录也称为数据或变量值。
谁说菜鸟不会数据分析_精华内容总结 (2)
#
数据分析综合方法
• 综合评价分析法
1、确定评价的指标 2、对指标数据进行标 准化处理 3、确定各指标权重 4、汇总计算出综合评 价分值 5、根据分值排序,得 出结论
数据标准化
标准值=(原始值-min)/(max-min)
权重确定方法
目标优化矩阵
纵向指标比横向重要时,输入1,否则为0
人才评价 人品 动手能力 创新意识 教育背景 合计 排序 人品 0 1 1 2 2 动手能力 1 1 1 3 1 创新意识 0 0 1 1 3 教育背景 0 0 0 0 4
#
数据分组 1、利用VLOOKUP函数
=VLOOKUP(A2,$D$2:$E$10,2)中, “2”代表“寻找最接近A2,又不能大于A2的值”
#
第3章 数据分析
• 数据分析方法论 • 数据分析方法 • 数据分析工具
#
数据分析方法论
方法论 PEST 4P 逻辑树 用户使用 行为 5W2H 说明 Political, Economic, Social, Technological Product, Price, Place(渠道), Promotion 将问题分层罗列,逐步向下展开 认知→熟悉→试用→使用→忠诚 Why, What, Who, When, Where How, How much 使用范围 行业分析 公司整体经营情况分析 业务问题专题分析 用户行为研究 用途广泛
YD:为start-date,end-date日期中天数的差,忽略日期中的年
入职日期 现在日期 2000-10-1 2011-11-7
工龄(年)
4年
=DATEIF(B1,B2,“Y”)&“年” =DATEIF(B1,B2,“Y”)&“年”&DATEIF(B1,B2,“YM”)&“月”)
谁说菜鸟不会数据分析_精华内容总结
#
2、用菜单操作来筛选
“数据”→“排序与筛选”→ 高级
3、使用条件格式
“开始”→“条件格式”→“突出显示单元格规格”→“重复值”
#
数据错误识别
#
数据分析是“神马”
• 数据分析师的基本素质 态度严谨负责
好奇心强烈
逻辑思维清晰
擅长模仿
勇于创新
#
数据分析六步曲
数据收集
• 先决条件
• 提供方向 • 数据库 • 其他媒介
• 清洗、转 化、提取、 计算
数据分析
• 统计分析 • 数据挖掘
报告撰写
• 图表→表 格→文字
• 框架清晰 • 明确结论 • 提出建议
明确目的
数据处理
数据展现
一般数据分析用Excel可以完成,若高级数据分析,则需要使 用数据分析工具,如SPSS Statistics等。
#
第2章 数据准备与数据处理 Excel常用工具
导入外部数据
“数据”→“自文本”→ 分栏处理
重复数据处理 1、使用COUNTIF函数 重复次数COUNTIF(A:A,A2) 第几次出现COUNTIF(A$2:A2,A2)
#
• 杜邦分析法
又称杜邦财务分析体系,可对财务状况进行综合分析评
价,也可用于其他分析。
#
• 漏斗分析法
浏览商品
40%
100%
40%
30%
放入购物车
75%
生成订单
67%
支付订单
85%
20%
菜鸟数据分析
第壹章数据分析那些事儿数据分析是“神马”数据分析六步曲几个常用指标或术语w>>谁说菜鸟不会数据分析出场人物:牛董,关键词:私企董事长、要求严格、为人苛刻;小白,关键词:应届毕业生,刚入职场的伪白骨精(白领+骨干+精英)、牛董助手、爱臆想;Mr.林,关键词:小白同事、数据分析达人、成熟男士、乐于助人、做事严谨。
话说小白过五关斩六将,通过严格的面试,最终从众多优秀毕业生中脱颖而出,成为公司的一员。
在报到的第一天,公司HR向小白介绍了她的职位——公司牛董的助理,负责文秘工作,可能需要做一些数据分析之类的活儿。
小白一听到数据分析这个词,就感觉头皮发麻,这时,她的脑子里幻想出一些穿白大褂的科研人员在实验室的计算机前不断忙碌的场景。
虽然在上大学时也使用过Excel,但是如果要做数据分析工作,她还真的有些不知如何下手。
无数个问号涌到她的脑海中:数据分析到底要做什么呢?我要怎么做数据分析?老板想要看什么样的结果呢?……唉,只好边走边干了。
HR看出小白的心事,说道:关于数据分析你不用太担心,如果遇到难题,你可以请教我们公司的Mr.林,他在这方面可是专家喔!小白一听有救星,立马兴奋起来,好像抓到救命稻草一样,想赶紧找到这位大师级人物,然后一股脑把疑问全倒出来。
HR:小白,你跟我来吧,我给你引荐下Mr.林。
小白:好的。
说着小白跟HR来到了Mr.林的办公桌旁,HR说道:Mr.林,这是我们公司新来的同事,叫小白,现担任牛董助理,她的部分工作涉及数据分析,到时候有问题还要麻烦您多多指点了。
小白紧跟着说道:Mr.林,您好,请多多指教。
Mr.林:呵呵,太客气了,有问题直接来找我就可以了。
小白趁机说道:我现在就有问题,您现在是否有时间帮我解答下?数据分析是干什么的,具体要怎么做?Mr.林听完后,笑了起来:你还真是不客气呀,好吧,你刚进公司,我就先给你做个简单的培训,带你入个门吧,以后的修行可就靠你自己努力了。
小白用力点着头,HR见这“师徒”二人颇有一见如故之感,大致交代一番后,就离开了。
谁说菜鸟不会数据分析(完整)课件
CHAPTER
大数据处理与机器学习
大数据处理技术
数据清洗
。
数据集成
数据存储 数据压缩
机器学习算法介绍
分类算法
回归算法
聚类算法 深度学习算法
大数据与机器学习的结合应用
推荐系统 利用用户行为数据,通过机器学习算 法实现个性化推荐。
金融风控
利用大数据和机器学习算法,实现风 险评估和预警。
数据清洗
数据分析
数据收集
数据探索
结果呈现
数据分析的常用工具
01
Excel
02
Python
03
R语言
04
Tableau
CHAPTER
数据清洗与预处理
数据清洗
缺失值处理 删除含有缺失值的行或列。
使用平均值、中位数或众数填充缺失值。
数据清洗
使用插值方法预测缺失值。 异常值处理
基于统计方法识别异常值。
数据清洗
根据业务逻辑判断异常值。
数据类型转换
将异常值替换或删除。
数据清洗
数据预处理
数据预处理
01 02 03
数据预处理
1 2 3
数据探索
01 02 03
数据探索
数据探索
CHAPTER
描述性统计分析
数据的中心趋势
01
02
03
平均数
中位数
众数
数据的离散程度
方差
标准差
变异系数
数据的分布形 态
CHAPTER
数据可视化
图表类型选择
柱状图
折线图
饼图
散点图
用于比较不同类别之间 的数据,适合展示分类 数据和连续数据的比较。
谁说菜鸟不会数据分析
图表作用:表达形象化、突出重点、 体现专业化
常用图表:柱形图、条形图、饼图、 折线图、散点图等
关系-图表
图表制作五步法
表格妙用:突出显示单元格、项目 选取、数据条、图标、集迷你图
图表换装:帕累托图的制作、旋风 图、人口金字塔、漏斗图、矩阵图
第六章:给数据量体裁衣-数据展现
第六章:给数据量体裁衣-数据展现
PART ONE
01 第 一 章 : 数 据 分 析 那 些 事
数据分析步 骤
数据分析误 区
数据分析定 义
数据分析分 类
数据分析作 用
数据分析师职 业发展要求
第一章:数据分析那些事
第一章: 数据分析 那些事
常用指标术语:平均数、绝对数、相对数、 百分比、百分点、频数、频率、倍数、番 数
第一章:数据分析 那些事
数据分析师职业发展要求
据严 客谨 壹 观负 、责 准( 确保 )证
数
么一好 ?般奇 贰 ),心
无强 数烈 个( 为侦 什探
构逻 为辑 叁 王思 )维
清 晰 ( 结
路鉴擅 、他长 肆 方人模 法优仿 )秀学
分习 析( 思借
提创
出新 伍 改(
进模 、仿 创中 新总 )结
、
基本素质
PART ONE
02 第 二 章 : 结 构 为 王 - 确 定 分 析 思 路
感谢聆听
图成 壹 、分
瀑关 布系 图饼
形频 肆 图率
分 布 柱
-
-
-
排 贰序
柱 状 图
图相
伍
关
性
散 点
-
线时 叁 图间
序 列 折
达多 陆 图重
比 较 雷
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
……
……
PPT学习交流
5
A、数据分析哪些事儿
数据分析师的基本素质
模仿主要是参 考他人优秀的分析思 路和方法。但不能: 一直在模仿,从未超 越过。
PPT学习交流
不论说话还是写 文章,都要有条理,有 目的,不可眉毛胡子一 把抓,不分主次。
6
A、数据分析哪些事儿
数据分析六步曲
• 一般数据分析用Excel可以完成,若高级数 据分析,则需要使用数据分析工具,如SPSS Statistics等。
区别就在于
菜鸟会想
分析师会想目的是否明确
这张曲线图真好看,怎么做的?
数据变化的背后真相是什么?
这些数据可以做什么样的分析?
从哪些角度分析数据才系统?
高级分析的方法在这儿能用吗?
用什么分析方法最有效?
要做多少张图表?
除了为数据添加文字说明还需说什 么?
数据分析报告要写多少页?
图表是否表达出有效的观点? 数据分析的目的达到了吗? 数据分析报告有说服力吗?
15
B、数据处理
数据清洗
• 冻结窗格 • 自动筛选 • 快速隐藏 • Ctrl+箭头键 • F4的妙用,绝对引用和相对引用 • 重复数据处理
重复数据处理
数据 A
重复次数 第几次出现
4
1
B
3
1
1、使用COUNTIF函数
C
2
1
D
1
1
E
1
1
重复次数COUNTIF(A:A,A2)
A
4
2
A
4
3
第几次出现
A
4
PPT学习交流
18
常B、数用据处理数据处理公式或技 巧
• 数据抽取 • 抽取函数 • 字段合并 • 字段匹配
• 数据计算 • 求和,平均值 • 最大最小值
PPT学习交流
19
常B、数用据处理数据处理公式或技 巧
• 日期的相关处理 • 1、快速录入当前日期
• TODAY( ) NOW( )
• 2、单纯日数加减
谁说菜鸟 不会 数据分析 ?
培训
PPT学习交流
1
• 目录
• A、 数据分析哪些事儿 • B、 数据处理 • C、 数据分析 • D、 数据展现 • E、 报告撰写
PPT学习交流
2
• A、数据分析哪些事儿
➢ 数据分析是“神马” ➢ 数据分析六部曲 ➢ 常用指标或术语
PPT学习交流
3
A、数据分析哪些事儿
PPT学习交流
12
B、数据处理
数据处理方式和技巧
• F2编辑单元格 • 填充柄 • Ctrl+D • ‘+007,变成007的有效输入。 • 快速设置单元格格式:Ctrl+1 • 1/3的输入,0+空格+1/3
PPT学习交流
13
B、数据处理
数据处理方式和技巧
数据错误识别
错误符号
错误原因
#DIV/0!
PPT学习交流
7
A、数据分析哪些事儿
常用指标或术语
ห้องสมุดไป่ตู้
• 倍数一般是表示数量的增 长或上升幅度,而不适用
PPT学习交流
8
• B、数据处理
➢ 初识EXCEL & 数据准备
➢ 数据处理方式和技巧
➢ 数据处理原则
➢ 数据清洗
PPT学习交流
9
B、数据处理
• 初识EXCEL
做数据分析讲究的是原则、思考方法和解决方案,任何软件都只是一
数据分析是“神马”
• 数据分析是指用适当的统计分析方法对收
集来的大量数据进行分析,将它们加以汇总、
理解并消化,以求最大化地开发数据的功能,
发挥·数数据分据析的是为作了用提。取有用信息和形成结论而对数据加以详细
研究和概括总结的过程。
PPT学习交流
4
菜A、数鸟据分析与哪些数事儿据分析师的区
别
他们主要的
• 简单情况
• 如A1中录入“2011-1-1”,B1中录入“A1+5”,
结果:“2011-1-6”
PPT学习交流
20
常B、数用据处理数据处理公式或技 巧
• 3、利用函数DATEIF计算工龄
• DATEIF( start-date,end-date,unit)
• Unit有Y/M/D/MD/YM/YD六种格式
4
B
3
2
COUNTIF(A$2:A2,A2) PPT学习交流 B
3
3
16
C
2
2
B、数据处理
2、用菜单操作来筛选
• “数据”→“排序与筛选”→ 高级
3、使用条件格式 “开始”→“条件格式”→“突出显示单元格规格”→“重复值”
PPT学习交流
17
常B、数用据处理数据处理公式或技 巧
• 查找和替换 • 通配符 * ? • IF函数 • AND和OR • 数据统计
种工具,我们只要掌握并精通一种工具不足够了。这比什么软件都只懂但都
只是略懂皮毛要好很多。本培训所涉PP及T学内习交容流,均以Excel 2010为例。
10
B、数据处理
• 数据准备:对数据表的要求
序号 1 2 3 4 5
6
7
要求
数据表由标明行和数据部分组成
第一行是表的列标题(字段名),列标题不能重复 第二行起是数据部分,数据部分的每一行数据称为一个记录,并 且数据部分不允许出现空白行和空白列 数据表中不能有合并单元桥存在 数据表与其他数据之间应该留出至少一个空白行和一个空白列 数据表需要以一维的形式存储,但是在实际操作中接触的数据往 往是以二维表格的形式存在的,此时应将二维表转化为一维表的 形式储存数据。
✓ MD:为start-date,end-date日期中天数的差,忽
略入职日日期期中2的007月-10-1和年 ✓ Y现M在日:期 为st2a01r1t-1-1-d7 ate,end-date日期中月数的差,忽
略日期中的日和年 工龄(年) 4年
=DATEIF(B1,B2,“Y”)&“年”
工龄(年月) 4年1月
除数为0
#N/A
函数或公式中没有可用的数值
#NAME? 在公式中使用了不能识别的文本
#NULL!
使用了不正确的区域运算符或引用的单元格区域的交集为空
#NUM!
公式或函数中某些数字有问题
#REF!
单元格引用无效
#VALUE! 在公式中使用了错误的数据类型
PPT学习交流
14
B、数据处理
数据处理原则
PPT学习交流
数据部分每一列的数据项,内容、格式统一。
PPT学习交流
11
B、数据处理—数据准备
数据处理方式和技巧
函数
• 函数是指定的数据按 照一定的规则转化为
图表需 就 式要 是 。的我结们果所,用规到则的也公
图表的主要目的是为了表现数据、 传递信息。
宏
宏是一个指令集,用来告诉Excel完成用户指定的动作。宏 类似于计算机程序,但它是完全运行于Excel中的。
=DATEIF(B1,B2,“Y”)&“年”&DATEIF(B1,B2,“YM”)&“月”)
✓ YD:为start-date,end-date日期中天数的差,忽