部分数据分析方法的应用基于
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• RFM模型的分类没有统一的分类标准,只 能按照实际情况做大概的分类。
整理课件
8
• 我们综合以上步骤,可得到如下表格:
客户编号
R
1
2
2
3
3
5
4
1
5
2
6
4
7
1
8
3
9
4
10
2
F
M来自百度文库
1
2
3
4
5
5
1
1
2
3
4
4
1
1
3
3
2
2
2
3
整理课件
总分 5 10 15 3 7 12 3 9 8 7
9
• 我们对此表格做简单的分析,如果销售人 员的精力与成本有限,可以重点考虑满足 以下条件的客户:
销售量
单价与销售量的关系
125
120
120
115
115
110
111210108
系列1
105
105
线性 (系列1)
100
102
95
90
0
10
20
30
40
50
单价
整理课件
13
• 我们建立两变量的线性回归模型:
yabx
• 其中~N(0,2),即服从期望为0,方差为 的正态 分布。利用历史数据,我们可以得到 的值,由 于历史数据可能不止两组,由gramer 法则知道 (1)式的解可能不存在。数学上认为使得
8
2010.11.06
7
43286
9
2010.12.12
5
10
2010.10.09
整理4课件
10234
25643
4
• 我们先处理最近交易日期的数据,我们按照距2010.12.31 日期的远近来划分等级,假设一周之内的数据设为5,如 客户3的最近交易日期这分项可以设为5;大于一周且在一 个月内的数据设为4,可得到客户6、9的最近交易日期这 一分项可设为4;大于一个月且在两个月内设为3,可得客 户2、8的最近交易日期这一分项可设为3;大于2个月且在 四个月内设为2,可得客户1、5、10的最近交易日期这一 分项可设为2;大于四个月且在六个月内设为1,可得客户 4、7的最近交易日期这一分项可设为1。这样分类是否合 理要由实践验证。
• 我们先在excel表格中按升序或者降序排列交易金 额,再计算占所有客户总金额的累计比例。我们 计算可得到:
0.30 0.55 0.74 0.82 0.88 0.94 0.96 0.98 0.99 1
整理课件
7
• 我们做如下分类:客户3此分项为5,客户2、 6此分项为4,客户5、8、10此分项为3,客 户1、9此分项为2,客户4、7此分项为1.
• 依次分类如下:2,3,5,1,2,4,1,3,4,2.
整理课件
5
• 累计交易次数我们可以简单地按等分的办 法分类,即1-3次设为1,4-6次设为2,7-9次 设为3,10-12次设为4,13-15次设为5,可依 次得到客户的对应数值如下:
•
1,3,5,1,2,4,1,3,2,2 .
整理课件
6
• 对于交易金额,我们按照所谓的“帕雷托法 则”(Pareto’s Law)来分类,即:公司80%的收 入来自20%的顾客,不过我们不必拘泥于此法则。
• 2.2根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇 的要素,这三个要素构成了数据分析最好 的指标:最近一次消费(Recency),消费频 率(Frequency),消费金额(Monetary)。
整理课件
3
• 2.3例1:我们分析2010.7.1—2010.12.31的交易数
• 大家也可以把此模型中的方法运用到准备 考试的时间分配上,
整理课件
11
3、回归分析
• 3.1回归分析(regression analysis)是确定两种或两种以上变数间相互依
赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的 自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变 量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归 分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近 似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个 或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线 性回归分析。
• 1.3对于数据分析,自然要有比较深厚的数学功底, 但是大家的数学基础有限,因此本讲既有必要节 制性地引入数学知识,又不必对数学方法做炫耀 性的滥用。
整理课件
2
2、RFM模型
• 2.1对于销售人员,经常会遇到这样的问题: 假设你的客户很多,但是由于你本人的精 力与成本有限,哪么你应当通过什么样的 办法辨别哪些是应当重点处理的客户?
第二讲:部分数据分析方法的 应用(基于spss)
主讲人:邓光耀
整理课件
1
1、概述
• 1.1数据分析的方法多种多样,具体选择哪种方法 分析数据,要由数据分析的目的来定。
• 1.2本讲叙述几种在销售等数据分析中可能用到的 方法,如RFM模型、回归分析、相关分析等,这 些方法都有一定的适用范围,听者不必拘泥于这 些方法。
• 3.2例2:我们回到第一讲的例子(例5),价格与销售量的关系表:
单价
45
42
40
38
37
35
32
销售量
102 105
108 110 112
115 120
• 我们解决以下问题:价格与销售量的函数表达式?并预测单价下降到30时 的销售量?销售金额最大化时的价格与销售量分别是多少?
整理课件
12
• 在上一讲中我们得到如下散点图:
•
i 2 [y i (a bix )2 ]
i
i
• 最小的a,b 的值是最佳估计值。
整理课件
14
• 令 i2,我们求它的偏导数,并令它们为零,
即i • •
a b 22 ii[yy ii ((aa bbix)ix )] xi00
据,如下表:
客户编号 最近一次消费日期 交易累计次数
交易累计金额/元
1
2010.9.30
3
10625
2
2010.11.25
8
92364
3
2010.12.28
15
152362
4
2010.8.20
2
8654
5
2010.10.16
5
30128
6
2010.12.10
12
125696
7
2010.7.23
1
3026
R2,F2,M 3,总分 9
• 因为相比于R,F,销售人员可能更看重M
(累计金额),故取 M3
• 另外对总分也有一定的要求,这里我们取
9
整理课件
10
• 以上分类标准的合理性需要销售人员的实 践验证。
• 另外我们可以对其他指标做类似的分类, 对客户群得到更好的管理。
• 例如送货上门的话,应当考虑运输成本, 距离近的客户要优先考虑。运输成本,可 以参考河南禹州拉沙车的例子。
整理课件
8
• 我们综合以上步骤,可得到如下表格:
客户编号
R
1
2
2
3
3
5
4
1
5
2
6
4
7
1
8
3
9
4
10
2
F
M来自百度文库
1
2
3
4
5
5
1
1
2
3
4
4
1
1
3
3
2
2
2
3
整理课件
总分 5 10 15 3 7 12 3 9 8 7
9
• 我们对此表格做简单的分析,如果销售人 员的精力与成本有限,可以重点考虑满足 以下条件的客户:
销售量
单价与销售量的关系
125
120
120
115
115
110
111210108
系列1
105
105
线性 (系列1)
100
102
95
90
0
10
20
30
40
50
单价
整理课件
13
• 我们建立两变量的线性回归模型:
yabx
• 其中~N(0,2),即服从期望为0,方差为 的正态 分布。利用历史数据,我们可以得到 的值,由 于历史数据可能不止两组,由gramer 法则知道 (1)式的解可能不存在。数学上认为使得
8
2010.11.06
7
43286
9
2010.12.12
5
10
2010.10.09
整理4课件
10234
25643
4
• 我们先处理最近交易日期的数据,我们按照距2010.12.31 日期的远近来划分等级,假设一周之内的数据设为5,如 客户3的最近交易日期这分项可以设为5;大于一周且在一 个月内的数据设为4,可得到客户6、9的最近交易日期这 一分项可设为4;大于一个月且在两个月内设为3,可得客 户2、8的最近交易日期这一分项可设为3;大于2个月且在 四个月内设为2,可得客户1、5、10的最近交易日期这一 分项可设为2;大于四个月且在六个月内设为1,可得客户 4、7的最近交易日期这一分项可设为1。这样分类是否合 理要由实践验证。
• 我们先在excel表格中按升序或者降序排列交易金 额,再计算占所有客户总金额的累计比例。我们 计算可得到:
0.30 0.55 0.74 0.82 0.88 0.94 0.96 0.98 0.99 1
整理课件
7
• 我们做如下分类:客户3此分项为5,客户2、 6此分项为4,客户5、8、10此分项为3,客 户1、9此分项为2,客户4、7此分项为1.
• 依次分类如下:2,3,5,1,2,4,1,3,4,2.
整理课件
5
• 累计交易次数我们可以简单地按等分的办 法分类,即1-3次设为1,4-6次设为2,7-9次 设为3,10-12次设为4,13-15次设为5,可依 次得到客户的对应数值如下:
•
1,3,5,1,2,4,1,3,2,2 .
整理课件
6
• 对于交易金额,我们按照所谓的“帕雷托法 则”(Pareto’s Law)来分类,即:公司80%的收 入来自20%的顾客,不过我们不必拘泥于此法则。
• 2.2根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇 的要素,这三个要素构成了数据分析最好 的指标:最近一次消费(Recency),消费频 率(Frequency),消费金额(Monetary)。
整理课件
3
• 2.3例1:我们分析2010.7.1—2010.12.31的交易数
• 大家也可以把此模型中的方法运用到准备 考试的时间分配上,
整理课件
11
3、回归分析
• 3.1回归分析(regression analysis)是确定两种或两种以上变数间相互依
赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的 自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变 量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归 分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近 似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个 或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线 性回归分析。
• 1.3对于数据分析,自然要有比较深厚的数学功底, 但是大家的数学基础有限,因此本讲既有必要节 制性地引入数学知识,又不必对数学方法做炫耀 性的滥用。
整理课件
2
2、RFM模型
• 2.1对于销售人员,经常会遇到这样的问题: 假设你的客户很多,但是由于你本人的精 力与成本有限,哪么你应当通过什么样的 办法辨别哪些是应当重点处理的客户?
第二讲:部分数据分析方法的 应用(基于spss)
主讲人:邓光耀
整理课件
1
1、概述
• 1.1数据分析的方法多种多样,具体选择哪种方法 分析数据,要由数据分析的目的来定。
• 1.2本讲叙述几种在销售等数据分析中可能用到的 方法,如RFM模型、回归分析、相关分析等,这 些方法都有一定的适用范围,听者不必拘泥于这 些方法。
• 3.2例2:我们回到第一讲的例子(例5),价格与销售量的关系表:
单价
45
42
40
38
37
35
32
销售量
102 105
108 110 112
115 120
• 我们解决以下问题:价格与销售量的函数表达式?并预测单价下降到30时 的销售量?销售金额最大化时的价格与销售量分别是多少?
整理课件
12
• 在上一讲中我们得到如下散点图:
•
i 2 [y i (a bix )2 ]
i
i
• 最小的a,b 的值是最佳估计值。
整理课件
14
• 令 i2,我们求它的偏导数,并令它们为零,
即i • •
a b 22 ii[yy ii ((aa bbix)ix )] xi00
据,如下表:
客户编号 最近一次消费日期 交易累计次数
交易累计金额/元
1
2010.9.30
3
10625
2
2010.11.25
8
92364
3
2010.12.28
15
152362
4
2010.8.20
2
8654
5
2010.10.16
5
30128
6
2010.12.10
12
125696
7
2010.7.23
1
3026
R2,F2,M 3,总分 9
• 因为相比于R,F,销售人员可能更看重M
(累计金额),故取 M3
• 另外对总分也有一定的要求,这里我们取
9
整理课件
10
• 以上分类标准的合理性需要销售人员的实 践验证。
• 另外我们可以对其他指标做类似的分类, 对客户群得到更好的管理。
• 例如送货上门的话,应当考虑运输成本, 距离近的客户要优先考虑。运输成本,可 以参考河南禹州拉沙车的例子。