市场研究——聚类分析法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS结果
在开始的操 作中,通过 相应的选项 可以把分类 结果存储起 来。
2、SPSS快速聚类法
选项
人为固定分类数 ANOVA表, 初始凝聚点等 读写凝聚点
快速聚类法的聚类数由用户指定,分类是唯一的。
1.分类数:初步判定聚成K类
2.聚类方法:method: iterate and clussify(聚类分 析的每一步都重新计算新的类中心点) clussify only(聚类分析过程类中心点始终为初始类中心点,仅作 一次迭代)
这一步合并了1和17
这一步合并了第9和 12。但这里9代表第 8步中形成的类,12 代表第9步中形成的 类。依此类推可知 这一步合并之后的 新类包括出9,20, 10,12,13。
冰 柱 图
从图中可以 读出所有的 分类结果。 图中标出的 是分5类的 情况。
聚类树形图
图形反映了类间的距离和聚类过程。
SPSS软件进行聚类分析
1、SPSS系统聚类法 2、SPSS快速聚类法
www.themegallery.com
Company Logo
1、SPSS系统聚类法
以 啤 酒 分 类 为 例
啤酒名 Budweiser Schlitz Ionenbrau Kronensourc Heineken Old-milnaukee Aucsberger Strchsbohemi Miller-lite Sudeiser-lich Coors Coorslicht Michelos Secrs Kkirin Pabst Hamms Heilemans Olympia Schlite 热量 钠含量 酒精 144.00 19.00 4.70 181.00 19.00 4.90 157.00 15.00 4.90 170.00 7.00 5.20 152.00 11.00 5.00 145.00 23.00 4.60 175.00 24.00 5.50 149.00 27.00 4.70 99.00 10.00 4.30 113.00 6.00 3.70 140.00 16.00 4.60 102.00 15.00 4.10 135.00 11.00 4.20 150.00 19.00 4.70 149.00 6.00 5.00 68.00 15.00 2.30 136.00 19.00 4.40 144.00 24.00 4.90 72.00 6.00 2.90 97.00 7.00 4.20 价格 .43 .43 .48 .73 .77 .26 .40 .42 .43 .44 .44 .46 .50 .76 .79 .36 .43 .43 .46 .47
方差为1,这样表4-1中5列具有不同量纲、不同数量级的数据 就能放在一起比较;其次用表4-2中经过标准化处理后的30个
不同地区数据求出欧氏距离。
表 4-2
数据标准化
聚类树形图
例 饮料分类
•16种饮料的热量、咖啡因、钠及价格四种变量
指定聚成四类
Ini tial Clust er Ce nters Cluster CALORIE CAFFEINE SODIUM PRICE 1 207.20 3.30 15.50 2.80 2 146.70 4.30 9.70 1.80 3 95.90 .00 8.50 1.30 4 .00 4.20 13.10 2.20
•
x1 , y1
•
x2 , y2
离差平方和法( Ward’s method word)
使小类内各样本的欧氏距离总平方和增加最小 的两小类合并为一类。
St ( X i (t ) X (t ))(X i (t ) X (t ))
i 1 nt
S St ( X i (t ) X (t ))(X i (t ) X (t ))
聚类分析法案例研究
www.themegallery.com
Company Logo
Байду номын сангаас
聚类分析
系统聚类法 案例:汽车 市场需求情 况研究
www.themegallery.com
快速聚类法
案例:饮料 产品竞争分 析
Company Logo
系统聚类分析应用举例:
汽车市场需求情况研究
4-1
表4-1
首先对表4-1中的原始数据进行标准化变换处理,经过 运算使数据标准化得到表4-2,使它的每列数据的平均值为0,
红绿(1,2,7,9) 44.75 离差平方和增加44.75-2.5=42.25 黄绿(4,5,7,9)14.75 离差平方和增加14.75-2.5=12.25 黄红(1,2,4,5)10 离差平方和增加10-1=9 故按在离差平方和方法下首先连接黄红两类。
聚类要注意的问题
聚类结果受所选择的变量影响。如果去掉一些变 量,或者增加一些变量,结果会很不同。 从分层聚类的计算机结果可以得到任何可能数量 的类。 聚类的目的是要使各类距离尽可能地远,而类内 点的距离尽可能的近,而且分类结果还要有令人 信服的解释。这一点就不是数学可以解决的了。
LOGO
聚类分析
学生:胡琪玲
主要内容
聚类分析概述 聚类分析原理
利用SPSS进行聚类分析 聚类分析法案例研究
www.themegallery.com
Company Logo
聚类分析概述
聚类分析是根据事物本身的特性研究个体的一种 方法,进行聚类分析的目的在于将相似的事物归 类。“物以类聚,人以群分”。
聚类分析在市场机会研究中的应用
企业制定市场营销战略时,弄清在同一市场中哪些企业是 直接竞争者,哪些是间接竞争者是非常关键的一个环节。 要解决这个问题,企业首先可以通过市场调查,获取自己 和所有主要竞争者在品牌方面的第一提及知名度、提示前 知名度和提示后知名度的指标值。 聚类分析将市场调查获得的变量数据,进行聚类分析,将 企业和竞争对手的产品或品牌进行归类,属于同一类别的 产品和品牌就是所分析企业的直接竞争对手;并结合每一 产品或品牌的多种不同属性的研究,发现哪些属性组合目 前还没有融入产品或品牌中。从而寻找企业在市场中的机 会,为企业制定有效的竞争战略提供基础性的资料。
4明考夫斯基距离(明氏距离)**
dij (q) ( X ik X jk )
k 1 p q 1/ q
如何进行聚类分析?
最短距离法 最长距离法 重心法 Ward法(离差平方和法)等
最短距离
S1 S2 S3
S4 S5
最短距离
S1 S3
S4 S5
最长距离
重心法(Centroid clustering): 均值点的距离
聚类是指将数据分类到不同的类或者簇的过程; 基本原则是同一个类别中的对象有很大相似性, 而不同类别间的对象有很大相异性。
聚类分析的种类
聚类分析的方法主要有两种: (一):系统聚类分析方法 (Hierarchical Cluster Analysis) (二):快速聚类分析方法 (K-Means Cluster Analysis)
SPSS软件进行系统聚类操作步骤
选择分析-分类-系统聚类 把热量、钠含量、酒精、价格选入变量框; 把啤酒名选入“标注个案”框。
选择“绘制”,选中“树状图”;
方法设定
在聚类方法框中选 择需要的方法; 在度量标准框中选 择距离的计算方法 ; 在“标准化”框中 选择Z得分。
输出结果 :聚类表
两点距离公式可以从不同角度进行定义,按q的取值不同 可以包括多种距离计算方法。 常用的距离的计算方法有:
1欧氏距离(Euclidean)
( xik x jk ) 2
2平方欧氏距离Squared Euclidean
( xik x jk ) 2
3切比雪夫距离(Chebychev) max | xik x jk |
www.themegallery.com Company Logo
系统聚类法需要计算出不同样品或变量的距离, 还要在聚类的每一步都要计算“类间距离”,相 应的计算量自然比较大;特别是当样本的容量很 大时,需要占据非常大的计算机内存空间,这给 应用带来一定的困难。 快速聚类法,又称k-均值聚类(k-means cluster)可以避免上述问题,适用于样本点很多 的情况,但要求你先确定要分多少类。
2. 传统统计法,根据客户属性特征的简单统计来划分客户 类别; 3. 非传统统计方法,即基于人工智能技术的非数值方法。 聚类分析法兼有后两类方法的特点,能够有效完成客户 细分的过程。消费同一种类的商品或服务时,不同的客 户有不同的消费特点,通过研究这些特点,企业可以制 定出不同的营销组合,从而获取最大的消费者剩余,这 就是客户细分的主要目的。
t 1 t 1 i 1
q
q
nt
离差平方和法: 合并”离差平方和”变动最小的两个类
(1 1.5) 2 (2 1.5) 2 0.5
1,2 红 7,9 绿 4,5 黄
(7 8) (9 8) 2
2 2
(4 4.5) 2 (5 4.5) 2 0.5
离差平方和法: 合并离差平方和变动最小的两个类
3.聚类中心:centers
4.迭代次数:iterate 5.保存分类结果:save
聚类分析在市场研究中的应用
实验市场选择
市场机会研究 客户细分 销售片区确定
www.themegallery.com
Company Logo
聚类分析在客户细分中的应用
常用的客户分类方法主要有三类:
1. 经验描述法,由决策者根据经验对客户进行类别划分;
销售片区的确定和片区经理的任命在企业的市场营销中 发挥着重要的作用。合理地将企业所拥有的子市场归成几 大片区,能有效地制定符合片区特点的市场营销战略和策 略,并任命合适的片区经理。
聚类分析可以通过对公司全球或全国所有子市场在人口数 量、人均可支配收入、地区零售总额、该公司某种商品的 销售量等决定市场需求量的变量作为聚类变量,结合决策 者的主观愿望和相关统计软件提供的客观标准来进行。然 后根据聚类的结果进行片区划分,并针对不同的片区制定 合理的战略和策略,任命合适的片区经理。
聚类分析原理
www.themegallery.com
Company Logo
聚类分析起点——衡量距离
进行聚类分析时,用样本间的距离来测度不同样本 间是否具有相似性。 因此,在进行分析前,首先要解决的一个问题—— 如何衡量样本点之间的距离? 设每个样品有p个指标,把n个样本看成p维空间 中的n个点,则两个样本间相似程度就可用p维空 间中的两点距离公式来度量。 (当变量的测量值相差悬殊时,要先对样本进行标 准化,以消除计量单位对计算结果的影响。)
聚类分析在实验市场选择中的应用
通过聚类分析,可将待选的实验市场(商场、居 民区、城市等)分成同质的几类小组,在同一组 内选择实验单位和非实验单位,这样便保证了这 两个单位之间具有了一定的可比性。
聚类分析以商店的规模、类型、设备状况、所处 的地段、管理水平等作为变量,进而将不同的市 场分类。
聚类分析在销售片区确定中的应用
Initial Cluster Center:快速聚类的初始类中心点(本例由 系统自行指定四个类的初始类中心点)
K-均值聚类的步骤
先确定k个点为“凝聚点”(SPSS软件自动确定 );也就是说,把这k个点作为k类中每一类的凝 聚点。 然后,根据和这k个点的距离远近,把所有点分 成k类。再把这k类的中心(均值)作为新的凝聚点 ,再重新按照距离分类。 如此叠代下去,直到达到停止叠代的要求(比如 ,各类最后变化不大了,或者叠代次数太多了) 。
系统聚类法
是按个体在性质或成因上的亲疏关系,把个体 逐级聚集成类的一种多元统计分析方法。按照 分类对象不同又可以分为:
1、对变量(指标)进行分类,称为R型聚类
2、对观测值(样品)来分类,称为Q型聚类
www.themegallery.com
Company Logo
系统聚类法步骤: 开始时,每个个体各自为一类, 然后以某种表示个体亲疏关系的统计量为分类 依据,把彼此关系相对密切的个体合并为小类 ,再把关系相对密切的小类进一步合并,循环 进行此步骤。 直到合并成一个大类为止,最终得到一个反映 各对象间亲疏关系的分类结果。