NNPLS方法在顾客满意度测评中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文章编号:100725429(2007)0420055206
收稿日期:2006205230; 修回日期:2006208215
作者简介:刘燕(19782),女,湖南常德人,博士,主要研究方向为系统规划与管理决策技术。
NNPLS 方法在顾客满意度测评中的应用
刘 燕,陈英武
(国防科技大学信息系统与管理学院,湖南长沙410073)
摘要:分析了顾客满意度测评模型中各变量间存在的非线性关系,将神经网络偏最小二乘法
(NN PL S )应用到顾客满意度测评中。
算例的计算结果表明,与传统顾客满意度测评模型所采用的偏最小二乘法,以及神经网络的方法相比,NN PL S 具有更高的拟合精度和较低的预测误差。
因此NN PL S 在顾客满意、顾客忠诚与其影响因素之间建立了一个稳健的模型,并为顾客满意度测评提
供一种新的思路。
关键词:神经网络偏最小二乘法;顾客满意度;非线性中图分类号:F273.1 文献标识码:A
Application of NNPLS in Measuring Customer Satisfaction
L IU Yan ,CH EN Y ing 2wu
(National U niversity of Defense Technology information system and Management
School ,Hunan Changsha 410073)
Abstract :Based on t he analysis of t he non -linear relationship between variables in customer satisfaction measurement model ,a neural networks partial least squares met hod is applied to measure customer pared wit h PL S and NN ,t he NN PL S met hod can achieve higher imitating p recision and smaller prediction errors.Therefore a robust model expressed by NN PL S succeeds in correlating t he relations between customer satisfaction ,customer loyalty and t heir drivers.
K ey w ords :NN PL S ;customer satisfaction ;non 2linear
1 引言
在20世纪70年代早期,美国开始对顾客满意度(customer satisfaction )进行了大量的研究。
随后自80年代初期,欧洲、日本等发达国家的一些先进企业开始将顾客满意引进企业的经营战略之中,对顾客满意度进行测评研究成为了质量管理中的重要组成部分。
目前顾客满意度测评中使用得较多的模型是结构方程模型(St ruct ural Equation Model ,SEM )。
结构方程模型属于一种因果关系模型,是一种从统计的角度构建模型的参数化研究方法。
但是,在研究中发现顾客满意度和其结构变量之间存在非线性关系,而结构方程模型由于自身前提假设的局限性不能处理这种非线性问题,从而影响了顾
客满意度的测评精度。
基于此本文提出应用神经网
络偏最小二乘(Neural Networks Partial Least Squares ,NN PL S )的方法对顾客满意度进行测评。
NN PL S 法[1]是将神经网络(NN )结合到偏最小二
乘法(PL S )中的一种系统建模方法,它结合了偏最小二乘的鲁棒性和神经网络表现输入输出非线性关系的能力。
2 顾客满意度模型中各变量间的非线
性关系
目前国外学者对顾客满意度进行了大量的研究,研究结果表明许多产品和服务的顾客满意度与结构变量之间存在非线性关系。
2.1 相关研究成果
Anderson 和Mittal 两位学者对顾客满意因果
链中的服务绩效、顾客满意、顾客忠诚和利润之间的
非线性关系进行了深入的研究[2]。
其中服务绩效与
顾客满意之间的关系见图1,顾客满意和顾客忠诚之间的关系见图2。
图1 绩效-满意关系图
从图1可以看出服务绩效与顾客满意之间存在
三种关系,既有线性对称的,也有非线性、不对称的。
从图2可以看出顾客满意度与顾客忠诚度之间不是线性关系,而是一种曲线关系。
Kano 模型的研究中发现顾客满意和感知质量之间存在着非线性关系[3],见图3。
图2 顾客满意-
顾客忠诚关系图
图3 K ano 模型
从图3可以看出,在这三类感知质量中,只有期
望质量与顾客满意之间成线性正相关关系,这种关系提供了目前顾客满意度测评的理论基础。
但是当然质量和惊喜质量与顾客满意之间则为非线性关系,这是结构方程模型所不能解释的。
2.2 结构方程模型的局限性
结构方程模型(SEM )是最近几十年来在应用统计学领域发展最为迅速的一个分支。
该模型源于20世纪20年代遗传学者Sewall Wright 发明的路径分析[4,5],70年代开始应用于心理学、社会学等领域,80年代初SEM 应用到了计量经济学领域,如今SEM 技术已经广泛应用到众多的领域。
但是,在研究中发现结构方程模型存在以下问题。
(1)变量间“线性结构”的置疑。
SEM 在建模时,对模型中变量之间的关系,均采用了线性假设。
但是,顾客满意研究中也发现变量之间常存在一种非线性关系,如果用线性关系去拟合会带来评估精度的降低。
(2)难以合并交互作用,不能处理定性数据和缺失数据。
(3)研究数据需要严格的分布假设,例如正态分布等。
但在实际研究中不同属性的数据往往不符合数据正态分布的假设。
由于结构方程模型存在的局限性,国内外学者开始尝试使用神经网络的方法对顾客满意度进行测评,该方法具有很强的自适应学习能力和非线性映射能力[6-10]。
但是直接的神经网络方法计算量较大,对样本的选择有较高的要求,并且不能处理变量
之间的多重相关关系。
偏最小二乘法能够较好地克服变量多重相关性在系统建模过程中的不良影响,对样本数量也没有过多地限制。
基于此,本文将神经网络与偏最小二乘法结合的NN PL S 方法应用于顾客满意度测评。
3 NNPLS 建模法
3.1 偏最小二乘法原理与算法
偏最小二乘法是一种新型的多元统计数据分析方法,是S.Wold 等在1983年首次提出的[11]。
其优点在于回归建模中采用了信息综合与筛选技术,在解释变量多重相关性及变量个数多于观察个体时,是一种较好的新型数据分析方法。
设有q 个因变量y 1,y 2,…,y q 和p 个自变量
x 1,x 2,…,x p ,为了研究自变量和因变量之间的关
系,采集n 个样本,构成自变量和因变量的数据表:
X =
x 1,x 2,
…,x p
n ×p
和Y =y 1,y 2,…,y q
n ×q
,各
变量均以标准化。
PL S 算法由求外部关系和内部关系组成[12],步骤如下。
(1)求取X 、Y 的外部关系,即分别求X 、Y 的
主成分。
假设主成分的个数为k 时,X 、Y 的主成分分解式为
X =T P T
k
+E =∑k
n =1t n p
n
+E (1)Y =UQ
T k
+F =
∑k
n =1
u n
q
n
+F
(2)
其中T 、U 为X 、Y 的主成分向量,p 、Q 为X 、Y 的载荷向量,E 、F 为误差。
(2)求解X 、Y 的主成分向量U 和T 之间的内
部关系(inner relation )
U =f (T )
(3)
线性PL S 中的f (・
)为线性函数,求解上述关系时可采用基于最小二乘原理的多元线性回归法求解。
3.2 基于递推算法的NNPLS
为了引进处理非线性数据的处理能力,在PL S 中利用神经网络建立输入和输出对应主成分(U ,T )间的关系以提高整个输入输出模型的精度的方法,就形成了NN PL S 建模的基本思路。
NN PL S 递推算法的步骤如下。
(1)X 、Y 已按列标准化,主成分数初值h =1。
(2)利用PL S 求取外部关系。
分别求解PL S
因子:w h 、p h 、t h 和q h 、u h
(3)利用神经网络f (・)求解内部关系
u h =f (t h )
(4)
用神经网络求解内部关系时,只是一个单输入单输出的模型,因此可采用简单的前向网络(例如三层的B P 网络),另外训练网络也比较容易。
由于
u h ,t h 具有以下的性质:
∑n
i =1
u
h i
=0,
∑n
i =1
t
h i
=0(5)
因此在选择神经元的非线性函数时,可采用分
布范围在(-1,1)的S 曲线
f (Z )=
1-e -z
1+e -z
(6) 这样可以保证对应零输入的输出也为零。
利用三层的BP 网络求解输入输出的映射关系时,采用交叉确认(cross 2validation method )的方法来确定中间层(隐含层)的节点数[13]。
首先将样本分成学习用
样本和测试样本,然后对测试样本求取u test h 和t test
h ,
t test
h
=E test h-1w h ,u test
h
=F test
h-1q h
(7)
其中,E test 0=X test ,F test 0=Y test 。
首先,网络可取单个隐含层节点,然后利用(t h ,u h )训练网络,再利用(t test h ,u test
h )来计算网络的预报
误差,然后逐次增加节点数目。
如果每增加一个节点会降低预报误差,则保留这个节点;如果增加节点时导致误差上升,则不增加节点,网络训练完毕。
(4)计算残差:
E h =E h-1-t h P T
h
F h =F h-1-f (t h )q T
h
(8)
(5)决定主成分的个数。
如果上述建立的输入输出模型还不满足所需的精度时,令h =h +1,转至第二步,否则结束。
4 算例
4.1 数据
本文为了验证NN PL S 在顾客满意度测评中的
有效性,利用文献[14]中的案例。
本案例是2002年元旦,北京富隆企业研究中心,受北京市各著名商场的委托,对北京市的各著名商场进行顾客满意度、企业知名度调查。
调查共涉及7个自变量指标:企业形象、顾客预期、顾客对功能与质量的感知、顾客对时间因素的感知、顾客对价值的感知、购物环境和企业的服务质量。
调查所涉及的因变量指标有两个:顾客满意度和顾客忠诚度。
根据案例,本文建立的NN PL S 模型共有7个输入、2个输出,共抽取100个调研数据,其中80组数据作为神经网络的学习数据,20组数据作为测试数据。
4.2 结果
4.2.1 各变量之间的相关性分析
经相关分析检验,各变量之间的相关系数r 值
见表1。
表1 各变量间相关系数
Var x 1x 2x 3x 4x 5x 6x 7y 1y 2
x 11.0000.2820.1670.1370.6260.4580.5860.1680.365x 21.000
0.2320.5890.2840.3320.4470.7540.638x 31.000
0.5320.1280.6350.4450.4320.125x 41.000
0.2160.6280.3220.8320.511x 51.000
0.5960.4710.2450.628x 61.000
0.5820.6370.441x 71.000
0.3560.743y 11.000
0.423y 2
1.000
注:x 1:企业形象;x 2:顾客预期;x 3:顾客对功能与质量的感知;x 4:顾客对时间因素的感知;x 5:顾客对价值的感知;x 6:购物环境;x 7:企业的服
务质量;y 1:顾客满意度;y 2:顾客忠诚度。
由表1可知,各变量间存在较强的相关性,最大相关系数为0.832,各变量至少与其中一个变量的相
关系数在0.500以上,说明各变量之间存在多重共线性关系。
因此,可以用偏最小二乘回归进行分析。
4.2.2 主成分个数的确定
和PL S 方法一样,在使用NN PL S 时,必须确
定使用主成分的个数。
从图4(a )可以看出,增加主成分的个数,模型对学习样本更能很好地近似输入输出关系,输出误差均方差(RMSE )值越小;但对于测试样本却不相同,
从图4(b )可以看出主成分的增加会导致增加学习样本的噪音,而导致测试误差的增大,因此最佳的主成分的个数是5。
图4 输出误差和模型使用主成分个数的关系
4.2.3 模型效果的检验
为评价NN PL S 方法的建模效果,本文将NN PL S 与PL S 、NN 方法进行比较,其中NN PL S
和NN 方法的计算结果通过MA TL AB 编程实现,
PL S 的估计结果在软件LV PL S1.8上运行。
三种方法的模型拟合效果见表2,三种方法输出变量的误差均方差(RMSE )
值见表3。
表2中的E h -E h
∧
是学习样本的拟合误差模
数,E test h -E test h
∧
是测试样本的拟合误差模数。
从表2可以看出,不管是学习样本还是测试样本,NN PL S 的拟合误差都小于PL S 和NN 的拟合误差,这说明NN PL S 在建模中,要比PL S 和NN 的拟合精度高,拟合效果好。
表2 NNPLS 、PLS 和NN 的模型拟合效果比较
主成分个数
NN PL S
PL S
NN
E h -E h ∧
E test h -E test h
∧
E h -E h ∧
E test h -E test h
∧
E h -E h ∧
E test h -E test h
∧
10.02800.8845 2.6325 3.6587 1.3256 2.556720.01600.4726 1.8736 3.6672 1.3675 2.77623
0.0180
0.1432
1.2678
2.0845
1.0658
1.9673
(续表)
主成分个数
NN PL S PL S
NN
E h -E h ∧
E test h -E test h
∧
E h -E h ∧
E test h -E test h
∧
E h -E h ∧
E test h -E test h
∧
40.00720.11660.9563 1.65770.7635 1.332750.00630.10280.8758 1.59850.6623 1.217960.00580.16890.7588 1.62540.5462 1.33697
0.0055
0.2231
0.7635
1.5879
0.5598
1.4965
表3 NNP LS 、P LS 和NN 预测能力的相对RMSE 值
NN PL S
PL S NN 输出1
15.26%28.55%22.63%输出2
13.28%
18.76%
15.79%
从表3中可以看出,NN PL S 的每一个输出变量的预测误差都低于PL S 和NN ,说明NN PL S 具有较好的预测功能。
5 结论
本文将神经网络偏最小二乘法应用到顾客满意度的测评中。
该方法是神经网络与偏最小二乘法的结合,神经网络很好的解决了变量间的非线性问题,弥补了结构方程模型的不足;另一方面,偏最小二乘法解决了变量间的多重相关性问题。
因此NN PL S 为顾客满意度测评提供一种新思路。
从算例的训练结果可以看出,NN PL S 收敛速度快,求解稳定,误差小,并且实例验证表明NN PL S 模型的精度高,误差小,对实测数据具有较好的拟合效果和较高的预测精度。
但本文还需进行更深入的研究,例如将顾客满意模型的因果关系引入到测评模型中,模型建立在理论基础之上;另一方面可以进行NN PL S 方法的灵敏度分析,确定顾客满意度各结构变量对顾客满意度的影响程度。
参考文献:
[1]Holcomb T R Morari M.PL S/neural networks[J ].Computers
Chem Engng ,1992,16(4):3932411.
[2]Anderson ,Eugene W ,Vikas Mittal.St rengt hening t he Satis 2
faction 2Profit Chain [J ].Journal of Service Research 2000,3(2):1072120.
[3]Berger C.Kano ’s met hods for understanding customer 2defined
quality[J ].Center for Quality Management Journal.1993,2(4),3236.
[4]Wright S.Correlation and causation [J ].Journal of Agricul 2
tural.1921(20):5572585.
[5]Wright S.The met hod of pat h coefficient [J ].Annals of Mat h 2
ematical Studies ,1934(5):1612215.
[6]金少胜,周洁红.神经网络在顾客满意度研究中的应用[J ].统
计与决策,2003,5:82.
[7]曾凤章,王元华.神经网络在顾客满意度测评中的应用[J ].北
京理工大学学报(社会科学版),2005,2:45247.
[8]赵海峰,万迪 .结构方程模型与人工神经网络模型的比较
[J ].系统工程理论方法应用,2003,12(3):2622269.
[9]Gronholdt L ,Martensen A.Analysing Customer Satisfaction
Data :A Comparison Of Regression And Artificial Neural Net 2works [J ].International Journal of Market Research 2005,47(2).
[10]Hruschka ,Harald.An Artificial Neural Net Attraction Model
(Annam )To Analyze Market Share Effect s Of Marketing In 2strument s [J ].Schmalenbach Business Review.2001(53):27240.
[11]Wold S ,Martens H ,Wold H.The multivariate calibration
problem in chemistry sovled by t he PL S met hod[M ].Edited by A.Rule and B.Kagstron ,Springer 2Verlag ,Heidelberg ,1983.[12]Wold S ,Sjostrom M ,Eriksson L.PL S 2regression :a basic tool
of chemometrics[J ].Chemometrics and Intelligent Laboratory Systems.
[13]Qin S J ,McAvoy T J ,Nonlinear PL S modeling using neural
network [J ].Computer Chem Engng ,1992,16(4):3792391.[14]刘宇.顾客满意度测评[M ].北京:社会科学文献出版社,2003.
书刊评介
《运筹学:应用随机模型》
“国外大学优秀教材———工业工程系列(影印版)”之一。
由Kulkarni 编纂的《Modeling ,Analysis ,Design ,and Control of Stochastic Systems 》一书较系统地讲解了随机模型的有关内容,其特点是重点介绍各种原理和方法的基本概念及其应用,对于较简单的一般问题,以容易理解和接受的方式给出其详细的证明过程,
而对于较复杂的问题,则用直观的说明来代替复杂而抽象的证明过程,同时每个章节都有丰富的例子和大量的练习题,习题按照概念题和计算题分类,易于学生消化和巩固。
《运筹学(应用随机模型)》即为该书的影印版,其主要内容包括:基础概率论、马尔科夫过程、排队系统、最优设计、最优控制等。
该书可作为工科类及经管类本科生教材。
该书由V.G.Kulkarni 编著,其影印版已由清华大学出版社出
版,16开本,374页,定价38元。
(徐秋栋)。