数据挖掘技术在汽车行业CRM中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
南京财经大学本科毕业设计学校代码:10327
学号:2112804136
本科毕业设计
中文题目:数据挖掘技术在汽车行业CRM中的应用
英文题目: Data Mining use to mine CRM in Auto Industry
所在院系:信息工程学院
专业班级:信息管理与信息系统041班
学生姓名:鄢柱
学号: 2112804136
指导教师:蒋伟伟
完成时间: 2007年6月
数据挖掘技术在汽车行业CRM中的应用摘要:随着中国经济的发展,人们对汽车的需求越来越强烈,汽车工业经历着前所未有的大好发展时机。
但是随着汽车市场的发展,竞争的剧烈程度也在加剧,如何能在这么剧烈的竞争中能获得更多的客户是现在各大汽车供应商们所关注的问题,我们可以利用客户关系管理以及数据挖掘等相关知识来帮助汽车供应商们来解决这个问题。
在这篇文章里将利用数据挖掘中的聚类和关联规则技术来对汽车行业中潜在客户的挖掘进行研究,从而帮助供应商们认识到自己潜在客户在哪里,然后利用正确的营销手段来把潜在客户发展成为自己的客户,从而提高自己的市场份额以及市场竞争力。
关键词:聚类关联规则客户关系管理汽车行业潜在客户
Data Mining use to mine CRM in Auto
Industry
Abstract:As the Chinese economy grows , the people’s requirement for automobile will become stronger and stronger, it was a unprecedented opportunity for the auto industry experienced. But the competition will become more and more intense, the chiefly problem to the auto suppliers is how to win in the intense competition. We can use CRM and Data Mining to help the auto suppliers. In this article we will introduce “Cluster and Associative Rules technology use to mine Potential Customer in Auto Industry”, so that to help the auto suppliers know where theirs potential customer. Thus unite the right marketing to become the potential customer to the successful customer, this can improve their marketability.
Keywords: Cluster Associative Rules CRM Auto Industry Potential Customer
目录
一、引言 (4)
二、客户关系管理 (5)
(一)客户关系管理定义 (5)
(二)客户关系管理 (6)
三、汽车行业导入CRM的必要性 (6)
(一)中国汽车行业客户关系管理应用现状 (6)
(二)客户关系管理在汽车行业中的应用 (7)
(三)CRM中潜在客户挖掘的重要性 (9)
三数据挖掘及其算法研究 (10)
(一)数据挖掘简介 (10)
1,数据挖掘介绍 (10)
2,数据挖掘的一般过程 (11)
(二)聚类分析以及K_MEANS算法 (12)
1,聚类分析概述 (12)
2,K-means算法 (13)
(三)关联规则挖掘以及A PRIORI算法 (14)
1,关联规则概述 (14)
2,关联规则经典算法——Apriori算法 (15)
四聚类和关联技术在挖掘汽车行业潜在客户的应用 (15)
(一)应用思想和工具 (15)
(二)聚类算法对客户属性分类 (16)
1,数据搜集 (16)
2,利用马克威分析系统软件具体操作 (17)
3,聚类结果 (19)
(三)关联规则挖掘客户与购买汽车的联系 (20)
(四)软件分析 (25)
五,总结 (26)
致谢 (28)
参考文献 (29)
一、引言
随着社会经济的发展,产品日益丰富,市场格局也发生了变化,市场竞争逐步升级,企业必须对市场变化迅速做出反应,而市场的变化又源于客户行为的变化,所以,企业必须把注意力集中在客户的需求上,客户应被作为一种宝贵的资源纳入到企业的经营发展中。
汽车工业作为一个传统产业,在国民经济的发展中起着非常重要的作用。
随着人民收入水平的持续提高和消费结构的升级,中国汽车市场已经成为世界上最具潜力的新兴市场。
从本世纪初开始,中国就被描绘成“全球最大的,也是最后一块未被开垦的轿车市场”。
2002年中国出现汽车消费的“井喷”式增长,家用轿车购买量这年已达万辆。
美国通用轿车公司甚至对中国轿车市场作了一个预测,到2010年中国就应成为全球第三大汽车市场,占全球6%份额,仅次于美国和日本。
然而这样也使中国的汽车市场竞争日益剧烈,随着汽车消费竞争日趋白热化,“谁拥有更多的消费者,谁就是胜者”。
如何去去争取更多的客户呢?这里就可以看出客户关系管理至关重要,所以汽车供应商导入CRM 是市场竞争加剧的要求。
潜在客户是一个巨大的市场,如何能把潜在客户挖掘成为自己的客户是汽车供应商们一直所关注的一个很大的问题。
只有以客户为中心,一切从客户利益出发才能有机会争取到潜在客户,使他们成为自己真正的客户。
这样就要充分利用客户关系管理知识,并结合数据挖掘技术来通过一定的数据分析来研究哪些人群是自己的潜在客户。
以这些客户为目标通过各种营销手段来把他们变成真正的客户从而提高自己的市场份额,提高自身的竞争力。
以上这些就是本文所要研究的内容,下面将做详细介绍。
二、客户关系管理
(一)客户关系管理定义
CRM (Customer Relationship Management) , 中文译名是“客户关系管理”, 最早由Gartner Group提出。
它是指一种以客户为中心, 以企业与外部的交流为主导, 以企业的前端业务应用为主的一种管理模式; 直接表现为以现代信息技术为手段,包括业务操作、客户信息和数据分析为主要内容的软、硬件系统的集成。
CRM是一种经营和管理理念, 是把业务和管理有机集成在一起的系统工程。
CRM是一个获取、保持和增加可获利客户的方法和过程。
CRM是以客户为中心的企业管理理论、商业理念和运作模式。
CRM最大程度地改善和提高了整个客户关系生命周期的绩效。
CRM 整合了客户、公司、员工等资源,对资源有效地、结构化地进行分配和重组,便于在整个客户关系生命周期内及时了解、使用有关资源和知识;简化、优化了各项业务流程,使得公司和员工在销售、服务、市场营销活动中,能够把注意力集中到改善客户关系、提升绩效的重要方面与核心业务上。
CRM 又是一种新型管理机制。
CRM 的核心管理思想就是把客户作为企业最重要的资源之一,企业必须由过去的“产品”导向向“客户”导向转变,对企业与客户之间发生的各种关系进行全面的管理。
CRM是一种手段,它的根本目的是通过不断改善客户关系、互动方式、资源调配、业务流程和自动化程度等,达到降低运营成本、提高企业销售收入、客户满意度和员工生产力。
企业以追求最大赢利为最终目的,进行好客户关系管理是达到上述目的的手段,从这个角度可以不加掩饰地讲——CRM应用是立足企业利益的,同时方便了客户、让客户满意。
(二)客户关系管理
在市场营销和企业管理中,CRM将首当其冲地应用于各企业的销售组织和服务组织,为企业带来长久增值和竞争力。
使用客户关系管理的好处有:
1.提高销售额:利用CRM系统提供的多渠道的客户信息,确切了解客户的需求,增加销售的成功几率,进而提高销售收入。
2.增加利润率: 由于对客户的更多了解,业务人员能够有效地抓住客户的兴趣点,有效进行销售,避免盲目的以价格让利取得交易成功,从而提高销售利润。
3.提高客户满意程度: CRM系统提供给客户多种形式的沟通渠道,同时又确保各类沟通方式中数据的一致性与连贯性,利用这些数据,销售部门可以对客户要求做出迅速而正确的反应,让用户在对购买产品满意的同时也认可并愿意保持与企业的有效沟通关系。
4.降低市场销售成本: 由于对客户进行了具体分别和群组分类,并对其特性进行分析。
使市场推广和销售策略的制定与执行避免了盲目性,节省时间和资金。
三、汽车行业导入CRM的必要性
(一)中国汽车行业客户关系管理应用现状
汽车是国民经济的“支柱产业”,近几年以及将来中国汽车行业都保持着持续高速增长,汽车工业总产值占国民生产总值的比例也不断上升。
在汽车工业进入大规模定制的今天,人们发现竞争形势已与过去大规模批量生产时代完全不同。
各汽车企业之间的竞争很大程度上就是客户资源的竞争,谁能把握住客户的需求,尽最大量满足客户利益需求,谁就能吸引新客户、保持老客户并且提高客户的忠诚度,以致能在竞争中获胜。
原先的产品是标准化的,市场是统一的,产品生命周期和开发周期也比较长,一切都是有规律的,没有意外发生。
今天,多样化的市场从统一市场中快速成长,多样化和定制的产
品代替了标准化产品,产品的生命周期和开发周期日益缩短,客户的要求也越来越苛刻,越来越多的客户更加看重的是商家能为其提供何种服务以及服务的质量和及时程度。
所以汽车供应商们导入CRM将是一个明智的选择。
随着2000年9月,通用汽车公司全球CRM系统的部署,上海通用公司CRM系统也正式上线使用,紧跟着2001年初上海大众也正式启用CRM系统,2003年11月新雅阁下线,广州本田CRM系统也开始运行。
2003年9月3日,上海通用经销商的CRM系统第一阶段内容也开始全面实施,同时,汽车经销商、汽车零部件企业及配套行业也都涉足CRM,或开始部署或进行选型准备。
这也可以看出,作为必要的营销服务工具,CRM系统的应用也成为国内汽车厂商发展的必然趋势。
(二)客户关系管理在汽车行业中的应用
汽车企业应用CRM可以在多方面应用,比如:
1、CRM可以帮助企业识别潜在客户,对于每一个汽车厂家来说,都一定会存在大量的潜在客户,而这些客户在决定购买之前肯定要进行大量的研究和调查,那么如何能将这些潜在客户变成自己真正的客户呢,这需要进行大量的工作。
上海通用不仅从授权经销商那里挖掘潜在顾客的名单,而且采用了一个“顾客推荐”法,即请现有的顾客推荐其有购买意向的朋友、亲戚、商业伙伴等,推荐他人的顾客可从中获益。
这种方法为取得潜在客户得到了事半功倍的效果。
2、CRM能提供顾客购买行为参考功能,即通过相类似的客户购买可以判断其他同种类型的客户购买行为。
通用汽车公司通过研究发现,他们的一款别克车的用户有喜好歌剧,而且他们的车也特别适合这一部分人群,所以他们通过这样的行为分析制定一个策略,在上海各大歌剧院门口做海报宣传广告,结果很大程度的提高了他们在这个人群中的销售量。
3、CRM能细心了解客户需求,专注于建立长期客户关系,并通过在企业内部实施“以客户为中心”的战略来强化这一关系,通过统一的客户联系渠道为客户提供比竞争对手
更好的客户服务。
优质的服务可以促使客户回头购买更多的产品或服务,企业也将从每位客户未来不断的采购中获益。
据调查统计资料表明:城市居民近一半的家庭财产集中在15——30万元之间,最高收入的家庭约占城市居民家庭总数的10%,约占居民财产总数的45%;最低收入的家庭也约占城市居民家庭总数的10%,而有80%的家庭收入属于一般性收入。
所以我们要看清每一种家庭他们的信息需求,给他们更多的选择。
上海通用汽车公司通过全新的中文网站和“百车通”在线导购栏目,即每一个注册客户都可以通过“百车通”选购自己中意的别克,并可进行个性化的选择,如配臵、颜色、价格以及供货地点等,这是尽最大程度的满足了客户的需求。
4、CRM帮助车主提高售后服务满意度,提高客户的忠诚度。
它能动态的、整合的客户数据管理和查询功能。
还有客户识别功能,它能够识别重要客户。
即2/8原则中提到的20%的客户将为企业带来80%的利益。
所以在吸引客户多次消费和提高购买量,给予重要客户区别于一般客户的服务,会使老顾客满意,提高他们的忠诚度。
全国主要经销商反馈的信息显示,上海通用顾客忠诚度指数达到60% 以上,这就意味着60% 以上的顾客会介绍朋友购买别克,或大部分别克轿车使用单位在购买新车时仍然会选择别克。
在汽车行业,这算得上是一个比较高的比例了。
他们运用的策略是:首先,使品牌成为顾客心目中的第一品牌,通过持续的双向沟通,增强品牌亲和力,并与其它竞争品牌拉开距离。
其次,通过对自身产品特点的宣传,潜移默化地让顾客相信自己的选择是正确的。
更重要的是,通过举办顾客专享的活动,使顾客产生拥有此品牌的优越感和自豪感。
具体的做法是:顾客购买新车的第一个月内,销售人员必须对客户进行拜访,与客户沟通,倾听客户的意见,并将这些情况详细记录在CRM 系统中。
顾客购车后的4~5 年内,系统会提示销售人员、服务人员经常与顾客进行联系和沟通,为顾客提供各种关怀和服务。
5、CRM能把营销、销售、服务活动的执行、评估、调整等与客户满意度、忠诚度、客户收益等密切联系起来,提高了企业的整体营销和服务的有效性。
首先, 通用汽车公司将中国的业务融入到全球业务中, 为中国消费者提供更丰富
的汽车产品和更高质量的服务, 强调企业与环境的和谐共存,实现合作伙伴、消费者、中国汽车工业、通用汽车共赢; 其次, 放弃滚动发展战略, 采取大规模投资, 一流的机器设备, 国际水平的柔性化生产线, 多品种的生产方式, 为高质量宽系列产品的生产
打下物质基础; 第三, 首家建立中国研发中心, 培养本土汽车设计人才, 提高本土汽
车设计能力, 真正做到产品符合中国市场; 第四, 协助其合作伙伴走出国门, 帮助上
汽的配套企业融入到通用的全球配套网络中。
实践证明, 通用汽车在中国实施的“融全球资源于本土”的战略, 使其在中国得到稳定健康的发展。
6、CRM有顾客流失警示功能,通过客户的交易行为的观察分析。
例如,老顾客出现购买周期或者购买量出现显著变化,可能会存在潜在流失的迹象。
(三)CRM中潜在客户挖掘的重要性
老客户是企业稳定收入的主要来源,是企业发展的基石,特别是2/8原则中那20%的客户,对企业的可持续发展有着非常重大的影响。
然而,挖掘新客户与稳定老客户有着同等重要的地位。
新客户的加入,为企业注入了新的血液,特别是大的潜在客户的加入,对企业赢利产生重要的影响。
所谓潜在顾客是针对现实顾客而言的, 是可能成为现实顾客的个人或组织。
这类顾客或有购买兴趣、购买需求, 或有购买欲望、购买能力, 但尚未与企业或组织发生交易关系。
所谓现实顾客是已经实现了需求的顾客, 或需求已经得到满足的顾客。
这类顾客既有购买需求, 又有购买能力, 且与企业或组织已发生交易关系。
在汽车行业中要想成功地把潜在用户变成现实客户来提升销量,要有很多工作要做。
首先,要搜集潜在客户的资料,潜在用户会有多种不同的联系方式——电话、Email、网络、传真、短信等等,我们都要一一记录,最好能得到客户的其他信息,比如在做什么行业工作,以及在工作中担任什么样的角色,收入和家庭情况等等。
厂家需要及时处理每天收到的大量纷繁杂乱的信息,我们如何识别哪些潜在客户可能成为自己的真正客
户群呢?这里就要结合数据挖掘知识,通过对现有顾客的分析我们可以用聚类方法为汽车厂商和销售商寻找目标客户,然后利用关联规则技术来分析顾客之间的属性联系辅助对目标客户销售决策。
再结合前期所搜集的潜在客户数据进行分析从中识别出那些有诚意的潜在购买者,对他们的个人资料做详细的收集,并有条理地记录下他们的历史联系记录,以供下次联系时参考。
这样才能使每个潜在用户都有一种受到重视的感觉,并且要结合电话普查的方法,对客户资料进行确认,并从中调查客户更多信息,以及是否有需求,并要做适当的引导,提供适合他们车的信息,并要赠送相关资料,获得客户的信任,并且定期保持联系,为拜访客户制造良好的机会,如果能成功的拜访客户,那么潜在客户到现实客户的距离就不会太遥远啦。
前面的过程我们还得考虑消费者购车的主要因素,这些包括燃油经济性、价格高低、亲戚朋友推荐、车型、维修成本,售后服务等等。
所以我们在跟客户交流的时候,一定要弄清楚我们所面对的潜在客户这些因素中那些是主要因素,抓住他们的真正需求,从而来迎合消费者的口味,提高自己的效率。
这里可能遇到的难点就是数据挖掘方面如何在挖掘潜在客户这方面的应用,下面我们将对数据挖掘以及两种方法进行详细的探讨。
三数据挖掘及其算法研究
(一)数据挖掘简介
1,数据挖掘介绍
数据挖掘(Data Mining,简称DM ) 是从大型数据库或数据仓库中发现并提取隐藏在其中的有用信息的一种新技术, 是数据库研究中的一个很有应用价值的领域。
它可以从大量的数据中抽取出潜在的、有价值的知识、模型或规则, 有助于企业发现业务的趋势, 揭示已知的事实, 预测未知的结果。
其主要特点是对数据库中的大量数据进行抽取、转
换、分析和其他模型化处理, 并从中提取辅助决策的关键性数据。
数据挖掘是知识发现——KDD (Knowledge Discovery in Database) 中的重要技术, 它并不是用规范的数据库查询语言进行查询, 而是对查询的内容进行模式的总结和内在规律的搜索。
数据挖掘则主要了解事件发生的原因, 并且以一定的臵信度对未来进行预测, 用来为决策行为
提供有利的支持。
2,数据挖掘的一般过程
第一,确定业务对象。
清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。
挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的。
第二,数据准备。
包括三个步骤:(1)数据的选择。
搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。
(2)数据的预处理。
研究数据的质量,为进一步的分析做准备。
并确定将要进行的挖掘操作的类型。
(3)数据的转换。
将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。
建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。
第三,数据挖掘。
对所得到的经过转换的数据进行挖掘,除了完善选择合适的挖掘算法外,其余一切工作都能自动地完成。
第四,结果分析、评估与展示。
解释并评估结果,在所得模型中选取有意义的模型,并且将所得的知识用表格,图表等可视化其使用的分析方法一般应根据数据挖掘的结果形式和商业目标而定。
第五,知识的同化。
将分析所得到的知识集成到业务信息系统的组织结构中去。
过程如图所示:
数据挖掘的功能和它们可以发现的模式类型主要有:特征化和区分、分类、聚类、孤立点分析、关联分析、演变分析。
本文在分析汽车客户属性分类还有关联属性的时候将只用到聚类分析和关联规则挖掘技术这两种方法,并且对其中的K-means算法和Apriori算法要通过软件做具体的应用。
所以下面就介绍这2种方法和具体的算法。
(二)聚类分析以及K_means算法
1,聚类分析概述
聚类是指将数据分组成为多个类,在同一个类内对象之间具有较高的相似度,不同类之间的对象差别较大。
聚类是无指导的学习方法,它区别于分类。
分类是按照一定的标准或规则, 将事物归属到某个事先已知的类别之中。
而聚类是分析事物的内在特点或规律,根据最大化类内的相似性和最小化类间的相似性的原则, 对事物进行分组。
聚类分析是指用数学的方法研究和处理给定对象的分类,是认识和探索事物内在联系的一种手段,是数据挖掘中的一个功能,它的应用很广泛。
通过聚类分析技术,能够识别密集的和稀疏的区域,从而发现全局的分布模式和数据属性之间有趣的相互关系。
聚类的质量是基于对象的相似度来衡量评估的。
2,K-means算法
(1)K-means算法的基本思想
K-means 聚类算法属于聚类分析方法中一种基本的且应用最广的划分方法,是一种在无类标号数据中发现簇和簇中心的方法。
选择期望的簇中心数K, K-means 过程反复移动中心以极小化整个簇内方差。
该算法的基本思想是:给定一个包含n个数据对象的数据库, 以及要生成的簇的数目K,随机选取K个对象作为初始的K个聚类中心, 然后计算剩余各个样本到每一个聚类中心的距离,把该样本归到离它最近的那个聚类中心所在的类,对调整后的新类使用平均值的方法计算新的聚类中心,如果相邻两次的聚类中心
没有任何变化, 说明样本调整结束且聚类平均误差准则函数E 已经收敛. 本算法在每次迭代中都要考察每个样本的分类是否正确,若不正确,就要调整,在全部样本调整完后,再修改聚类中心,进入下一次迭代。
如果在一次迭代算法中,所有的样本被正确分类, 则不会有调整,聚类中心也不会有任何变化。
在算法迭代的过程中E 的值在不断减小,最终收敛至一个固定的值,该准则也是衡量算法是否正确的依据之一。
(2)K-means算法的步骤
步骤1:确定值以及初始化聚类中心,选择个初始凝聚点,做为欲形成类的中心。
步骤2:计算每一个观测到个初始凝聚点的距离,将每个观测和最近的凝聚点分到一组,形成个初始分类。
步骤3:计算初始分类的重心(或均值),做为新的凝聚点,重新计算每一个观测到初始分类重心的距离,将每个观测和最近的凝聚点分为一组。
步骤4:重复进行步骤和步骤,直至初始分类的重心或均值没有明显变化为止。
算法的第一步需要我们做出一个初始判断,即认为数据中应表示多少个簇。
下一步, 算法任意选择K个数据点作为初始簇中心。
然后,每个实例被放臵在与它最相似的簇里, 相似性右以以多种方式来定义。
不过, 最常使用的相似性度量指标是简单欧氏距离。
在聚类的过程中,我们要在海量的数据中选取与数据挖掘目的相关的数据进行整理,
可以根据研究的主题在企业已有的数据库中提取或重新收集所需要的数据。
一般来说,收集到的数据并不满足进行数据分析或数据挖掘的要求, 因而需要根据研究目的进行
数据清理、整合以及格式变换, 使之满足数据分析目标的要求。
(三)关联规则挖掘以及Apriori算法
1,关联规则概述
关联规则是数据挖掘技术在商业领域运用非常广泛的一种技术,它旨在寻找数据库中各项之间的相关性,即寻找在同一个事件中出现不同项的关联程度,比如在一次购买活动中所买不同商品的相关性。
如顾客购买牛奶,他也购买面包的可能性有多大?什么商品集合顾客多半会一次购物时同时购买?例如,买牛奶的顾客有80%也同时买面包等。
关联规则的问题描述如下:
设: I={i1,i2......,im }是所有项目的集合。
D 是所有事务的集合(即数据库),每个事务T是一些项目的集合,T包含在I中,每个事务可以用唯一的标识符TD来标识。
设X为某些项目的集合,如果X包含在T中,则称事务T包含X,关联规则则表示为如下形式(X包含在T) => (Y包含在T)的蕴涵式,这里X 包含在I中,Y包含在I中,并且X∧Y=∮。
其意义在于一个事务中某些项的出现,可推导出另一些项在同一事务中也出现。
事务集D 中的规则X => Y是由支持度s (support)和确信度c (confidence)约束。
确信度表示规则的强度, 支持度表示在规则中出现的频度。
数据项集X的支持度s(X)是D中包含X的事务数量与D的总事务数量之比,但为下文便于叙述, 数据项集X的支持度是用数据库D中包含X的数量来表示;规则X => Y的支持度s定义为:在D中包含X∪Y的事务所占比例为s% ,表示同时包含X 和Y 的事务数量与D 的总事务量之比;规则X => Y的确信度c定义为:在D
中,c%的事务包含X的同时也包含Y,表示D中包含X的事务中有多大可能性包含Y。
最小支持度阈值minsupport表示数据项集在统计意义上的最低主要性。
最小确信度阈值minconfidence表示规则的最低可靠性。
如果数据项集X满足X.suppo rt >=。