数据分析基础入门课程
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
是确定两种或两种以上变数间相互依赖的定
量关系的一种统计分析方法。运用十分广泛
,回归分析按照涉及的自变量的多少,可分
为一元回归分析和多元回归分析;按照自变
量和因变量之间的关系类型,可分为线性回
归分析和非线性回归分析。
• 方差分析(ANOVA/Analysis of Variance)
•
又称“变异数分析”或“F检验”,是
H
价格-区域分析
从区域的价格分布来看产品的提升空间,即 不同区域的价格构成的合理性,从中分析市 场提升的空间和方向
分析方法
• 此类项目特殊分析法: • 三维数据分析法 • 6个月纵向分析法 • 区域分类分析法
• 常用数据分析方法: ✦聚类分析 ✦因子分析 ✦相关分析
✦对应分析 ✦回归分析 ✦方差分析
• 相关分析(Correlation Analysis)
•
相关分析(correlation analysis),相
关分析是研究现象之间是否存在某种依存关
系,并对具体有依存关系的现象探讨其相关
方向以及相关程度。相关关系是一种非确定
性的关系,例如,以X和Y分别记一个人的
身高和体重,或分别记每公顷施肥量与每公
常用数据分析方法
• 聚类分析(Cluster Analysis)
•
聚类分析指将物理或抽象对象的集合分
组成为由类似的对象组成的多个类的分析过
程。聚类是将数据分类到不同的类或者簇这
样的一个过程,所以同一个簇中的对象有很
大的相似性,而不同簇间的对象有很大的相
异性。聚类分析是一种探索性的分析,在分
类的过程中,人们不必事先给出一个分类的
数据挖掘是一种高级的数据分析方法,侧重解决四类数据分析问题: 分类、聚类、关联和预测,重点在寻找模式与规律。
05
数据展现
一般情况下,数据是通过表格和图形的方式来呈现的。
常用的数据图表包括饼图、柱形图、条形图、折线图、气泡图、散 点图、雷达图等。 进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗 图、帕雷托图等。
PART
03
常用指标和术语
常用指标和术语
• 平均数 • 绝对数与相对数 • 百分比与百分点 • 频数与频率 • 比例与比率 • 倍数与番数 • 同比与环比
PART
04
经典案例分析
经典电商销售数据模型分析
1
主线分析
2
分析思路
3
整体分析
4
分析方法
主线分析
1 产品
各种产品及产品属性的销售数据
客户
标准,聚类分析能够从样本数据出发,自动
进行分类。聚类分析所使用方法的不同,常
常会得到不同的结论。不同研究者对于同一
组数据进行聚类分析,所得到的聚类数未必
一致。
• 因子分析(Factor Analysis)
•
因子分析是指研究从变量群中提取共性
因子的统计技术。因子分析就是从大量的数
据中寻找内在的联系,减少决策的困难
数据分析基础入门课程
云联科技-运营部
课程目录
1 数据分析是什么? 2 数据分析六部曲 3 常用指标和术语 4 经典案例分析
PART
01
数据分析是什么?
数据分析是什么?
• 数据分析是指使用适当的“统计分析”方法来对收集来的大量数据进行 分析,将它们加以汇总、理解并消化的过程,以求最大化地开发数据的 功能,发挥数据的作用。
R.A.Fisher发明的,用于两个及两个以上样
本均数差别的显著性检验。由于各种因素的
影响,研究所得的数据呈现波动状。造成波
动的原因可分成两类,一是不可控的随机因
素,另一是研究中施加的对结果形成影响的
可控因素。方差分析是从观测变量的方差入
手,研究诸多控制变量中哪些变量是对观测
变量有显著影响的变量。
COMPANY
04 数据分析
数据统计、数据挖掘
06 报告撰写
架构清晰、明确za结论、提出建议
01 明确目的和思路 先决条件、提供项目方向 数据处理
03 清洗、转化、提取、计算 05 数据展现
图标、表格、文字
01
明确目的和思路
梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的 分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析, 采用哪些分析指标
联系。可以揭示同一变量的各个类别之间的
差异,以及不同变量各个类别之间的对应关
系。对应分析的基本思想是将一个联列表的
行和列中各元素的比例结构以点的形式在较
低维的空间中表示出来。
常用百度文库据分析方法
• 回归分析
•
研究一个随机变量Y对另一个(X)或一组
(X1,X2,…,Xk)变量的相依关系的统计分
析方法。回归分析(regression analysis)
•
因子分析的方法约有10多种,如重心法
、影像分析法,最大似然解、最小平方法、
阿尔发抽因法、拉奥典型抽因法等等。这些
方法本质上大都属近似方法,是以相关系数
矩阵为基础的,所不同的是相关系数矩阵对
角线上的值,采用不同的共同性□2估值。
在社会学研究中,因子分析常采用以主成分
分析为基础的反覆法。
常用数据分析方法
E
区域分布分析
从销售区域分布看市场布局的合理性; 区域布局和整体战略目标的一致性; 明确下阶段企业区域布局的规划方向
F
销售异动分析
通过对数据的分析,发现存在异动的产品或 区域;并从中分析出异动发生的原因
G
区域-价格分析
从区域内的产品动态来看区域内的产品组成 变化,即区域的产品适应性,从而发现潜力 产品、老话产品等
02
数据收集
一般数据来源于四种方式:数据库、第三方数据统计工具、专业的 调研机构的统计年鉴或报告(如艾瑞资讯)、市场调查。
03
数据处理
数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处 理方法,将各种原始数据加工成为项目需要的直观的可看数据。
04
数据分析
常用的数据分析工具,掌握Excel的数据透视表,就能解决大多数的 问题。需要的话,可以再有针对性的学习SPSS、SAS等。
为什么要做数据分析?
• 数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中 和提炼出来,总结出研究对象的内在规律。
数据分析的常见类型及其作用
1 描述性数据分析 2 探索性数据分析 3 验证性数据分析
1 现状分析 2 原因分析 3 预测分析
PART
02
数据分析六部曲
02 数据收集
数据库建立
B
季节性分析
很多消费品/行业存在明显的季节性 /周期性趋势;通过分析时间数据即 可为企业提出合理的生产运作及渠 道供货规划
C
产品结构分析
从产品结构可以分析主导产品和产 品成长的合理性,及企业利润源和 销售量是否对应,初步判断企业未 来的产品规划和调整方向
D
价格体系分析
从价格结构看产品分布合理性,也 可以判断目前发展现状与战略发展 方向是否一致
顷小麦产量,则X与Y显然有关系,而又没
有确切到可由其中的一个去精确地决定另一
个的程度,这就是相关关系。
• 对应分析(Correspondence Analysis)
•
对应分析(Correspondence analysis)也
称关联分析、R-Q型因子分析,通过分析由
定性变量构成的交互汇总表来揭示变量间的
常用图表类型和作用
作用
成分 (整体的一部分)
排序 (数据的比较)
时间序列 (走势、趋势)
频率分布 (数据频次)
相关性 (数据的关系)
多重数据 的对比
饼图
柱形图
条形图
折线图
气泡图
其他
06
报告撰写
一份好的数据分析报告,首先需要有一个好的分析框架,并且图文 并茂,层次明晰,能够让阅读者一目了然。
报告需要有明确的结论、建议或解决方案。
THANKS!
WinLinks 2019/08
与行业标准比较,从 与销售数据中的销售 析,了解整体产品结
而分析得到业绩状况 额形成对比,分析淡 构分布和重点产品表
及判断业绩变换类型 旺季发展规律,可为 现
生产运作做规划
价格体系 通过整体价格结构分 析,了解优势价位区 间,提供价格结构调 整的合理性建议
整体分析
A
销售数据分析
通过销售额和销售量的增长分析,可以找出客户增长或下滑的本 质;如果销售额增长大于销售量,说明增长主要来源于产品平均 价格提高,它反应了市场平均价格的提高或者是客户产品结构上 升,即结构性增长;反之则为容量性增长
2
不同属性的客户的销售数据
3
区域
不同区域的销售数据
阶段整体数据
阶段业绩达成率 销售数据构成分析
分析思路-数据分解
1 2
销售质量
单额情况 重点产品比率
43
累计数据
档期任务达成率 同比完成情况
发货情况
客户数量 发货次数
分析思路-关键指标
1234
销售额
季节因素
产品线
总体销售额、销售量, 依据行业淡旺季规律, 通过总体产品结构分