基于生存分析法的顾客生命周期计量研究——以商业银行信用卡顾客为例
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Key
way
to
calculate the lire—
words:customer lifetime cycle;credit card customers;measurement method;survival analy—
sis;product-limit method
顾客生命周期即顾客关系生命周期,不仅 是计算顾客终生价值的重要参数之一,也是研 究顾客关系动态发展的重要工具。国外学者 HELSEN等J1指出,生存分析方法在处理持续 时间型数据时具有优越性。LI。2。也指出,生存 分析法在生命周期时间的研究中会产生更有价 值的信息,可用来估计顾客生命长度,尤其是在 处理删失数据时更具有无法替代的作用。齐佳 音等。3也分别采用生存分析法中的威布尔分布 法和生命表法对顾客生命周期进行了计量,但 限于我国企业顾客生存资料的局限性,其计量 结果并不能代表该行业顾客的普遍生命周期时 间。本研究在现有计量方法的基础上,选取在 生物学、医学、经济学以及人口统计学中广泛应 用的生存分析法,并结合商业银行信用卡顾客
表2分位数估计表
客流失率的下降速度得到缓和,生存率只下降
了0.261
6。从37个月到71个月,顾客生存率
仅下降了0.165 9。由此可见,信用卡顾客在持 有期1年内,注销的可能性最大,在1到3年内 进入稳定期,3年以后信用卡的忠诚顾客群逐 步形成,只有很少的顾客流失。 2.3计量方法的对比说明 (1)从计量结果方面看,参数法中的威布 尔分布法和非参数法中的乘积极限法求得的商 业银行信用卡顾客的半数生存期都为30个月。 由于参数法中的数学模型较多,除了威布尔分 布法、指数分布法以外,还有对数正态分布、龚 泊兹分布等多种参数模型,使用者可以根据生 存数据特点选择不同的模型进行拟合,并根据 拟合优度检验判断模型的优劣;而乘积极限法 属于非参数法,不考虑生存数据的分布。由此, 对于理论研究者来说,采用参数法对信用卡顾客 的生命周期进行计量将使结果更加精准、有效。 (2)从实践应用方面看,生存数据是否符 合参数分布需要事先进行模型拟合研究,这就 要求使用者能够熟练掌握几种参数模型的拟合 过程,一旦几种参数模型的拟合效果均不理想 时,便只能采用非参数模型。这是因为非参数 模型对生命数据的分布类型无任何要求,只需 根据样本提供的顺序统计量对生存率进行估 计。同时,SAS和SPSS 2种统计分析软件都有 相应的分析模块进行数据分析,使用者只需建 立一个生存数据库,省去模型选取、拟合这2个 步骤,因此,在实践中非参数法更便于企业管理 者掌握使用。
In(t)
图2威布尔分布拟合图 表1 2个分布的拟合方程
由图1和图2可知,2种参数模型的拟合 图形直线趋势都较好,回归方程的判决系数R2 都大于0.7,且威布尔分布的判决系数为0.784, 比指数分布的拟合程度还要好,表明该信用卡 顾客生存数据可采用威布尔分布进行拟合,拟 合方程如下:
s(£)一exp(一0.022t)o・903。 (3)
on
the actual credit card customers information data.The research draws the conclusion that
a
the half survival period of credit card customers iS 30 months and provides time cycle of credit card customers using these two methods.
收稿日期:2009—08—10
的生存数据特点,探索出适合商业银行的顾客 生命周期计量方法。
1
数据说明与处理
1.1数据来源及整理 本研究的数据搜集采用问卷调查方式,在 西安地区的各大商业银行网点进行了重点发 放,同时结合网络进行发放,发放对象为曾使用 过信用卡的已注销用户和目前正在使用的顾 客,但不包括“信用卡睡眠顾客”(即本文中定义 为年刷卡次数不足6次的顾客)。 本研究共发放问卷320份,回收298份,有 效问卷260份,回收率和有效率均较高,问卷基 本为当场填答,且整个过程均有课题组成员全 程跟踪。在260份问卷中,中国银行信用卡57
中图分类号:C93 文献标识码:A文章编号:1672—884X(2011)03—0471—04
A Study
on
Measurement of Customer Lifetime Cycle Based
on
Survival Analysis:
Learning From the Example of the Credit Card Customers of Commercial Banks TIAN Xinyuan ZHOU Lei
第8卷第3期 2011年3月
管理学报
Chinese
V01.8 No.3
Journal of Management
Mar.2011
基于生存分析法的顾客生命周期计量研究——以商业银行 Nhomakorabea用卡顾客为例
田欣媛 周镭
(西安工程大学管理学院)
摘要:截至目前,国内学者对于顾客生命周期的计量问题,无论是方法研究方面还是实证 研究方面都未形成统一的结论。在生物学、医学等领域较为流行的生存分析方法基础上,针对 实际的顾客生存资料调研数据,采用威布尔分布法和乘积极限法来估计商业银行信用卡顾客 的生命周期,得出信用卡顾客的半数生存期为30个月的结论。这种将参数与非参数相结合的 计量方法为国内信用卡顾客的生命周期计量提供了一种思路。 关键词:顾客生命周期;信用卡顾客;计量方法;生存分析;乘积极限法
对于持有期较长的这部分顾客他们是商业银行信用卡利润的主要贡献者因此应相应加大对这部分顾客的特殊服务例如对过生日的顾客赠送礼品以及提高在一些消费场所的打折和优惠力此外对顾客生命周期的计量不但要考虑生存数据本身所包含的行业特点而且还要考基于生存分析法的顾客生命周期计量研究田欣媛周镭201205152012051520120515201205152012051520120515虑在实践中计量方法应用的简便性即将计量目的数据特点方法实用性这三者充分综合考虑后选择出最佳的方便企业各级管理者使用的计量方法
3
碍 让
剥 :k
略
结语 综上所述,本研究认为,商业银行应对信用
图3
生存分布函数曲线图
卡持有期不同的顾客开展不同的营销手段:① 对于新办卡顾客,要耐心指导他们如何更好地 充分利用信用卡的各种功能,消除他们使用信 用卡尤其是还款时的各种顾虑;②对于处于稳 定期的顾客,要及时了解他们在使用过程中不 太满意的地方,及时改进银行的服务或产品功 能,尽量挽留住这部分潜在流失顾客;③对于持 有期较长的这部分顾客,他们是商业银行信用 卡利润的主要贡献者,因此,应相应加大对这部 分顾客的特殊服务,例如对过生日的顾客赠送 礼品以及提高在一些消费场所的打折和优惠力
右删失。
布的拟合效果。常用的图示法有危险率图和生 存率图2种。本研究采用直观的图示法,结合有 关学者的研究[3“],用生存率图拟合指数分布、威 布尔分布2种参数模型,见式(1)和式(2)。
s(£)=e-,l。, s(f)=exp(一砧)7。 (1) (2)
指数分布拟合时,以生存时间t为横轴、以 lns(£)为纵轴作图;威布尔分布拟合时,以In(£) 为横轴、以ln[一Ins(t)]为纵轴作图,若图形呈 直线趋势,则表明该生存资料可用此分布拟合。 本研究借助SPSS 15.0统计分析软件,做出指 数分布拟合图和威布尔分布拟合图(见图1、图 2),同时得到2个分布的拟合方程,见表l。
度等。
从表2可知,信用卡顾客的中位生存时间 (即当累计生存率为0.50时所对应的生存时间) 是30个月,当累计生存率为0.75时,信用卡顾 客的生存时间为71个月,而当累计生存率为0. 25时,顾客的生存时间迅速下降为10个月。 由均数37.128可知,全部信用卡顾客的平 均生存时间有37个月多,即顾客持有信用卡的 平均时间长度有3年多。 图3显示出了信用卡顾客持有情况,随着 时间的延长,顾客的累积生存率逐步下降,特别 是在12个月之前,累积生存率由1.0直接下降
0
7 9
1 1
l 1 3 5
l 2 2 7 0 2
2 2 4 9
3 3 3 1 3 5
f
3 4 7 I
4 4 5 5 5 7 5 9 3 5 8 0
7 4
2
2.1
计量方法的确定 生存分析法的分类 生存分析方法包括3类:①非参数估计方
图1指数分布拟合图
法,如生命表分析和乘积限方法;②半参数估计 方法,如Cox比例风险模型;③参数估计方法, 如威布尔分布、指数分布、对数正态分布、龚泊 兹分布等。 对于一批生存数据,在事先不知道寿命分 布的总体趋势,且又不好判断应该用何种模型 最合适时,多数学者一般直接采用非参数方法 或半参数法。但是,由于非参数方法的精度一 般低于参数方法,如果一批数据确实符合一定 的参数模型,按照非参数方法进行的分析就不 能有效地利用和阐述样本数据所包含的信息, 同时它对样本量的要求也高于参数方法口]。鉴 于此,在对顾客生命周期进行计量时,首先要判 断顾客生存数据是否符合某种参数模型,如果不 符合则再考虑非参数法和半参数法。由于本研 究仅考察顾客生命周期时间,不考虑对其时间长 度造成影响的诸多因素,故暂不考虑半参数法。 2.2判断生存数据的适用方法 2.2.1 判断数据置否符合参数模型 目前,对生存分布数学模型的拟合有多种 方法,可粗略地分为图示法和数值法¨]。前者 就是先构造似然函数,然后用最大似然估计法 估计参数,后者为拟合优度检验来考核理论分
・472・
1.2.2.2.2.3.3.3.3.3.3.3.3.4.4. 388197 484 708 944 091 295433 528 610737 89l 988 080 262 294225 907050439 042837 987 33l 918670 820984 443 680
e
n 口 口
基金项目:陕西省教育厅专项科研计划资助项目(08JK062)
・
471
・
万方数据
管理学报第8卷第3期2011年3月
份、招商银行信用卡39份、建设银行信用卡39 份、工商银行信用卡34份、农业银行31份、交 通银行信用卡18份、浦发银行信用卡13份、光 大银行信用卡10份,其余19份信用卡问卷来 自华夏银行、兴业银行等其他银行。 1.2对生存数据的分析 在医学领域中,一个人(或病人)从出生(或 治疗开始)到死亡(或痊愈)的时间叫做生存时 间。同样,可将该生存时间概念引入到企业的 顾客中,即认为生存时间即为顾客与企业建立 业务关系从开始到终止的全过程。按照此概 念,将收集到的顾客生存数据分为2种:①完全 数据,即在调查时刻该顾客已经将信用卡注销 不再使用;②删失数据,即在调查时刻仍在继续 使用手中信用卡的顾客,对于这部分顾客由于 无法观测到其真正的顾客生命周期时间,只能 知道该生存时间大于某个值,故又称作右删失。 在本次调查的260份有效问卷中,有60份完全 数据,200份删失数据,且删失数据类型全部为
(Xi’an Polytechnic University,Xi’an,China) Abstract:So far,the Chinese scholars have
not
agreed
on
methodology
or
empirical methods for
the measurement of the customer life cycle.This paper applies survival analysis which is widely used in biology,medicine and other research fields.The Weibull distribution and the Product—I。imit method iS used
万方数据
基于牛存分析法的顾客生命周期计量研究——田欣媛周
镭
根据威布尔拟合公式,可求得商业银行信 用卡顾客的中位生存时间,即当s(£)一0.5时, 可求得t一30.3个月。 2.2.2 判断数据所适合的非参数法 常用的非参数法为生命表分析法和乘积极 限方法。生命表方法又称为寿命表方法,它要 求使用大样本,生存函数和生存率的估计依赖 于生命表中所有的区间,其应用假定是总体在 每个区间内各处有近似相等的生存概率,如果 区间太长,这个假定可能受到破坏从而估计不 精确。乘积限方法是基于一个个数据的估计, 而非生命表中按区间分组的数据,其假设为事 件发生的概率仅依赖于时间,可看成是生命表 估计的一种特殊情形。本研究基于现有生存数 据特点,认为采用乘积极限估计更为恰当。 通过建立本次调研的生存数据库,并运行 SAS8.01软件,得到分位数估计(见表2)、均数 为31.128、标准误差为1.798,以及生存分布函 数(见图3)。
way
to
calculate the lire—
words:customer lifetime cycle;credit card customers;measurement method;survival analy—
sis;product-limit method
顾客生命周期即顾客关系生命周期,不仅 是计算顾客终生价值的重要参数之一,也是研 究顾客关系动态发展的重要工具。国外学者 HELSEN等J1指出,生存分析方法在处理持续 时间型数据时具有优越性。LI。2。也指出,生存 分析法在生命周期时间的研究中会产生更有价 值的信息,可用来估计顾客生命长度,尤其是在 处理删失数据时更具有无法替代的作用。齐佳 音等。3也分别采用生存分析法中的威布尔分布 法和生命表法对顾客生命周期进行了计量,但 限于我国企业顾客生存资料的局限性,其计量 结果并不能代表该行业顾客的普遍生命周期时 间。本研究在现有计量方法的基础上,选取在 生物学、医学、经济学以及人口统计学中广泛应 用的生存分析法,并结合商业银行信用卡顾客
表2分位数估计表
客流失率的下降速度得到缓和,生存率只下降
了0.261
6。从37个月到71个月,顾客生存率
仅下降了0.165 9。由此可见,信用卡顾客在持 有期1年内,注销的可能性最大,在1到3年内 进入稳定期,3年以后信用卡的忠诚顾客群逐 步形成,只有很少的顾客流失。 2.3计量方法的对比说明 (1)从计量结果方面看,参数法中的威布 尔分布法和非参数法中的乘积极限法求得的商 业银行信用卡顾客的半数生存期都为30个月。 由于参数法中的数学模型较多,除了威布尔分 布法、指数分布法以外,还有对数正态分布、龚 泊兹分布等多种参数模型,使用者可以根据生 存数据特点选择不同的模型进行拟合,并根据 拟合优度检验判断模型的优劣;而乘积极限法 属于非参数法,不考虑生存数据的分布。由此, 对于理论研究者来说,采用参数法对信用卡顾客 的生命周期进行计量将使结果更加精准、有效。 (2)从实践应用方面看,生存数据是否符 合参数分布需要事先进行模型拟合研究,这就 要求使用者能够熟练掌握几种参数模型的拟合 过程,一旦几种参数模型的拟合效果均不理想 时,便只能采用非参数模型。这是因为非参数 模型对生命数据的分布类型无任何要求,只需 根据样本提供的顺序统计量对生存率进行估 计。同时,SAS和SPSS 2种统计分析软件都有 相应的分析模块进行数据分析,使用者只需建 立一个生存数据库,省去模型选取、拟合这2个 步骤,因此,在实践中非参数法更便于企业管理 者掌握使用。
In(t)
图2威布尔分布拟合图 表1 2个分布的拟合方程
由图1和图2可知,2种参数模型的拟合 图形直线趋势都较好,回归方程的判决系数R2 都大于0.7,且威布尔分布的判决系数为0.784, 比指数分布的拟合程度还要好,表明该信用卡 顾客生存数据可采用威布尔分布进行拟合,拟 合方程如下:
s(£)一exp(一0.022t)o・903。 (3)
on
the actual credit card customers information data.The research draws the conclusion that
a
the half survival period of credit card customers iS 30 months and provides time cycle of credit card customers using these two methods.
收稿日期:2009—08—10
的生存数据特点,探索出适合商业银行的顾客 生命周期计量方法。
1
数据说明与处理
1.1数据来源及整理 本研究的数据搜集采用问卷调查方式,在 西安地区的各大商业银行网点进行了重点发 放,同时结合网络进行发放,发放对象为曾使用 过信用卡的已注销用户和目前正在使用的顾 客,但不包括“信用卡睡眠顾客”(即本文中定义 为年刷卡次数不足6次的顾客)。 本研究共发放问卷320份,回收298份,有 效问卷260份,回收率和有效率均较高,问卷基 本为当场填答,且整个过程均有课题组成员全 程跟踪。在260份问卷中,中国银行信用卡57
中图分类号:C93 文献标识码:A文章编号:1672—884X(2011)03—0471—04
A Study
on
Measurement of Customer Lifetime Cycle Based
on
Survival Analysis:
Learning From the Example of the Credit Card Customers of Commercial Banks TIAN Xinyuan ZHOU Lei
第8卷第3期 2011年3月
管理学报
Chinese
V01.8 No.3
Journal of Management
Mar.2011
基于生存分析法的顾客生命周期计量研究——以商业银行 Nhomakorabea用卡顾客为例
田欣媛 周镭
(西安工程大学管理学院)
摘要:截至目前,国内学者对于顾客生命周期的计量问题,无论是方法研究方面还是实证 研究方面都未形成统一的结论。在生物学、医学等领域较为流行的生存分析方法基础上,针对 实际的顾客生存资料调研数据,采用威布尔分布法和乘积极限法来估计商业银行信用卡顾客 的生命周期,得出信用卡顾客的半数生存期为30个月的结论。这种将参数与非参数相结合的 计量方法为国内信用卡顾客的生命周期计量提供了一种思路。 关键词:顾客生命周期;信用卡顾客;计量方法;生存分析;乘积极限法
对于持有期较长的这部分顾客他们是商业银行信用卡利润的主要贡献者因此应相应加大对这部分顾客的特殊服务例如对过生日的顾客赠送礼品以及提高在一些消费场所的打折和优惠力此外对顾客生命周期的计量不但要考虑生存数据本身所包含的行业特点而且还要考基于生存分析法的顾客生命周期计量研究田欣媛周镭201205152012051520120515201205152012051520120515虑在实践中计量方法应用的简便性即将计量目的数据特点方法实用性这三者充分综合考虑后选择出最佳的方便企业各级管理者使用的计量方法
3
碍 让
剥 :k
略
结语 综上所述,本研究认为,商业银行应对信用
图3
生存分布函数曲线图
卡持有期不同的顾客开展不同的营销手段:① 对于新办卡顾客,要耐心指导他们如何更好地 充分利用信用卡的各种功能,消除他们使用信 用卡尤其是还款时的各种顾虑;②对于处于稳 定期的顾客,要及时了解他们在使用过程中不 太满意的地方,及时改进银行的服务或产品功 能,尽量挽留住这部分潜在流失顾客;③对于持 有期较长的这部分顾客,他们是商业银行信用 卡利润的主要贡献者,因此,应相应加大对这部 分顾客的特殊服务,例如对过生日的顾客赠送 礼品以及提高在一些消费场所的打折和优惠力
右删失。
布的拟合效果。常用的图示法有危险率图和生 存率图2种。本研究采用直观的图示法,结合有 关学者的研究[3“],用生存率图拟合指数分布、威 布尔分布2种参数模型,见式(1)和式(2)。
s(£)=e-,l。, s(f)=exp(一砧)7。 (1) (2)
指数分布拟合时,以生存时间t为横轴、以 lns(£)为纵轴作图;威布尔分布拟合时,以In(£) 为横轴、以ln[一Ins(t)]为纵轴作图,若图形呈 直线趋势,则表明该生存资料可用此分布拟合。 本研究借助SPSS 15.0统计分析软件,做出指 数分布拟合图和威布尔分布拟合图(见图1、图 2),同时得到2个分布的拟合方程,见表l。
度等。
从表2可知,信用卡顾客的中位生存时间 (即当累计生存率为0.50时所对应的生存时间) 是30个月,当累计生存率为0.75时,信用卡顾 客的生存时间为71个月,而当累计生存率为0. 25时,顾客的生存时间迅速下降为10个月。 由均数37.128可知,全部信用卡顾客的平 均生存时间有37个月多,即顾客持有信用卡的 平均时间长度有3年多。 图3显示出了信用卡顾客持有情况,随着 时间的延长,顾客的累积生存率逐步下降,特别 是在12个月之前,累积生存率由1.0直接下降
0
7 9
1 1
l 1 3 5
l 2 2 7 0 2
2 2 4 9
3 3 3 1 3 5
f
3 4 7 I
4 4 5 5 5 7 5 9 3 5 8 0
7 4
2
2.1
计量方法的确定 生存分析法的分类 生存分析方法包括3类:①非参数估计方
图1指数分布拟合图
法,如生命表分析和乘积限方法;②半参数估计 方法,如Cox比例风险模型;③参数估计方法, 如威布尔分布、指数分布、对数正态分布、龚泊 兹分布等。 对于一批生存数据,在事先不知道寿命分 布的总体趋势,且又不好判断应该用何种模型 最合适时,多数学者一般直接采用非参数方法 或半参数法。但是,由于非参数方法的精度一 般低于参数方法,如果一批数据确实符合一定 的参数模型,按照非参数方法进行的分析就不 能有效地利用和阐述样本数据所包含的信息, 同时它对样本量的要求也高于参数方法口]。鉴 于此,在对顾客生命周期进行计量时,首先要判 断顾客生存数据是否符合某种参数模型,如果不 符合则再考虑非参数法和半参数法。由于本研 究仅考察顾客生命周期时间,不考虑对其时间长 度造成影响的诸多因素,故暂不考虑半参数法。 2.2判断生存数据的适用方法 2.2.1 判断数据置否符合参数模型 目前,对生存分布数学模型的拟合有多种 方法,可粗略地分为图示法和数值法¨]。前者 就是先构造似然函数,然后用最大似然估计法 估计参数,后者为拟合优度检验来考核理论分
・472・
1.2.2.2.2.3.3.3.3.3.3.3.3.4.4. 388197 484 708 944 091 295433 528 610737 89l 988 080 262 294225 907050439 042837 987 33l 918670 820984 443 680
e
n 口 口
基金项目:陕西省教育厅专项科研计划资助项目(08JK062)
・
471
・
万方数据
管理学报第8卷第3期2011年3月
份、招商银行信用卡39份、建设银行信用卡39 份、工商银行信用卡34份、农业银行31份、交 通银行信用卡18份、浦发银行信用卡13份、光 大银行信用卡10份,其余19份信用卡问卷来 自华夏银行、兴业银行等其他银行。 1.2对生存数据的分析 在医学领域中,一个人(或病人)从出生(或 治疗开始)到死亡(或痊愈)的时间叫做生存时 间。同样,可将该生存时间概念引入到企业的 顾客中,即认为生存时间即为顾客与企业建立 业务关系从开始到终止的全过程。按照此概 念,将收集到的顾客生存数据分为2种:①完全 数据,即在调查时刻该顾客已经将信用卡注销 不再使用;②删失数据,即在调查时刻仍在继续 使用手中信用卡的顾客,对于这部分顾客由于 无法观测到其真正的顾客生命周期时间,只能 知道该生存时间大于某个值,故又称作右删失。 在本次调查的260份有效问卷中,有60份完全 数据,200份删失数据,且删失数据类型全部为
(Xi’an Polytechnic University,Xi’an,China) Abstract:So far,the Chinese scholars have
not
agreed
on
methodology
or
empirical methods for
the measurement of the customer life cycle.This paper applies survival analysis which is widely used in biology,medicine and other research fields.The Weibull distribution and the Product—I。imit method iS used
万方数据
基于牛存分析法的顾客生命周期计量研究——田欣媛周
镭
根据威布尔拟合公式,可求得商业银行信 用卡顾客的中位生存时间,即当s(£)一0.5时, 可求得t一30.3个月。 2.2.2 判断数据所适合的非参数法 常用的非参数法为生命表分析法和乘积极 限方法。生命表方法又称为寿命表方法,它要 求使用大样本,生存函数和生存率的估计依赖 于生命表中所有的区间,其应用假定是总体在 每个区间内各处有近似相等的生存概率,如果 区间太长,这个假定可能受到破坏从而估计不 精确。乘积限方法是基于一个个数据的估计, 而非生命表中按区间分组的数据,其假设为事 件发生的概率仅依赖于时间,可看成是生命表 估计的一种特殊情形。本研究基于现有生存数 据特点,认为采用乘积极限估计更为恰当。 通过建立本次调研的生存数据库,并运行 SAS8.01软件,得到分位数估计(见表2)、均数 为31.128、标准误差为1.798,以及生存分布函 数(见图3)。