数据包络分析(DEA)方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、 数据包络分析(DEA)方法
数据包络分析(data envelopment analysis, DEA)是由著名运筹学家Charnes, Cooper 和Rhodes 于1978年提出的,它以相对效率概念为基础,以凸分析和线性规划为工具,计算比较具有相同类型的决策单元(Decision making unit ,DMU)之间的相对效率,依此对评价对象做出评价[1]。
DEA 方法一出现,就以其独特的优势而受到众多学者的青睐,现已被应用于各个领域的绩效评价中[2],[3]。
在介绍DEA 方法的原理之前,先介绍几个基本概念:
1. 决策单元
一个经济系统或一个生产过程都可以看成是一个单位(或一个部门)在一定可能范围内,通过投入一定数量的生产要素并产出一定数量的“产品”的活动。
虽然这种活动的具体内容各不相同,但其目的都是尽可能地使这一活动取得最大的“效益”。
由于从“投入”到“产出”需要经过一系列决策才能实现,或者说,由于“产出”是决策的结果,所以这样的单位(或部门)被称为决策单元(DMU)。
因此,可以认为,每个DMU(第i 个DMU 常记作DMU i )都表现出一定的经济意义,它的基本特点是具有一定的投入和产出,并且将投入转化成产出的过程中,努力实现自身的决策目标。
在许多情况下,我们对多个同类型的DMU 更感兴趣。
所谓同类型的DMU ,是指具有以下三个特征的DMU 集合:具有相同的目标和任务;具有相同的外部环境;具有相同的投入和产出指标。
2. 生产可能集
设某个DMU 在一项经济(生产)活动中有m 项投入,写成向量形式为1(,,)T m x x x =;产出有s 项,写成向量形式为1(,,)T s y y y =。
于是我们可以用(,)x y 来表示这个DMU 的整个生产活动。
定义1. 称集合{(,)|T x y y x =产出能用投入生产出来}为所有可能的生产活动构成的生产可能集。
在使用DEA 方法时,一般假设生产可能集T 满足下面四条公理: 公理1(平凡公理): (,),1,2,
,j j x y T j n ∈=。
公理2(凸性公理): 集合T 为凸集。
如果 (,),1,2,,j j x y T j n ∈=, 且存在 0j λ≥ 满足
1
1n j j λ==∑
则 11(,)n
n
j j j j j j x y T λλ==∈∑∑。
公理3(无效性公理):若()ˆˆ,,,x y T x
x y y ∈≥≤,则ˆˆ(,)x y T ∈。
, 公理4 (锥性公理): 集合T 为锥。
如果(),x y T ∈那么 (,)kx ky T ∈对任意的0k >。
若生产可能集T是所有满足公理1 , 2 , 3和4的最小者,则T 有如下的唯一表示形式
()11
,|,
,0,1,2,
,n n
j j j j j j j T x y x x y y j n λλλ==⎧
⎫
=≤≥≥=⎨⎬⎩
⎭
∑∑。
3. 技术有效与规模收益
(1) 技术有效:对于任意的(,)x y T ∈,若不存在'y y >,且'(,)x y T ∈,则称(,)x y T ∈为技术有效的生产活动。
(2) 规模收益:将产出和投入的同期相对变化比值/y x
k y x
=
称为规模效益。
若1k >,说明规模收益递增,这时可以考虑增大投入;若1k <,说明规模收益递减,这时可以考虑减小投入;若1k =,说明规模收益不变,且称为规模有效。
(一) DEA 方法原理与CCR 模型
DEA 方法的基本原理是:设有n 个决策单元(1,2,,)j DMU j n =,它们的投入,产出向量分别为:12(,,
,)0,T j j j mj X x x x =>,12(,,
,)0,
1,
,T j j j sj Y y y y j n =>=。
由于在生产过程中各种投入和产出的地位
与作用各不相同,因此,要对DMU 进行评价,必须对它的投入和产出进行“综合”,即把它们看作只有一个投入总体和一个产出总体的生产过程,这样就需要赋予每个投入和产出恰当的权重。
假设投入、产出的权向量分别为12(,,
,)T m v v v v =和12(,,
,)T s u u u u =,从而就可以获得如下的定义。
定义2. 称11
,(1,2,
)s
T r rj
j r j T m
j
i ij
i u y
u Y j n v X v x
θ===
=
=∑∑为第j 个决策单元j DMU 的效率评价指数。
根据定义可知,我们总可以选取适当的权向量使得1j θ≤。
如果想了解某个决策单元,假设为({1,2,
,})o DMU o n ∈在这n 个决策单元中相对是不是“最优”的,可以考察当u 和v 尽可能地变化时,o θ的
最大值究竟为多少? 为了测得o θ的值,Charnes 等人于1978年提出了如下的CCR(三位作者名字首字母缩写)模型:
1111
1,1,2,,,0,0,,.
s
r ro
r o
m
i io
i s
r
rj
r m
i ij
i r i u y
Maximize
v x
u y
subject to
j n v x
u v r i θ=====≤=≥≥∀∑∑∑∑ (1)
利用Charnes 和Cooper (1962)[4]提出的分式规划的Charnes-Cooper 变换: 11/
m
i io
i t v x ==∑
,
,(1,,)r r tu r s μ==,,(1,,)i i tv i m ω==变换后我们可以得到如下的线性规划模型:
11
1
1
,
1,
0,1,
,,,0,
1,,;1,
,.
s
r ro o r m
i io i s
m
r rj i ij r i r i Maximize y subject to x y x j n r s i m μθωμωμω======-≤=≥==∑∑∑∑ (2)
根据线性规划的相关基本理论,可知模型(2)的对偶问题表达形式:
11
,1,2,
,,
,1,2,
,,
0,1,2,
,.
o n
ij j
o io j n
rj
j ro j j Minimize subject to
x x i m y
y r s j n θλ
θλλ==≤=≥=≥=∑∑ (3)
上述的模型是基于所有决策单元中“最优”的决策单元作为参照对象,从而求得的相对效率都是小于等于1的。
模型(2)或者(3)将被求解n 次,每次即得一个决策单元的相对效率。
模型(3)的经济含义是:为了评价({1,2,,})o DMU o n ∈的绩效,可以用一组假想的组合决策单元与其进行比较。
模型(3)的第一和第二个约束条件的右端项分别是这个组合决策单元的投入和产出。
从而,模型(3)意味着,如果所求出的效率最优值小于1,则表明可以找到这样一个假想的决策单元,它可以用少于被评价决策单元的投入来获取不少于该单元的产出,即表明被评价的决策单元为非DEA 有效。
而当效率值为1时,决策单元为DEA 有效。
有关DEA 有效根据松弛变量是否都为零还可以进一步分为弱DEA 有效与DEA 有效两类。
即通过考察如下模型中的(1,
)i s i m -=与(1,
,)r s r s +
=的值来判别。
11
11
(
)
,1,
,,1,
,,,0,,,.
m
s
i r i r n
ij j
i o io j n
rj j
r ro j j i r Minimize s s
subject to x s x i m y
s y r s
s s i j r θελ
θλλ-
+
==-=+=-+
-+
+==-==≥∀∑
∑∑∑o
(4)
其中ε为非阿基米德无穷小量。
根据上述模型给出被评价决策单元({1,2,,})o DMU o n ∈有效性的定义:
定义3. 若模型(4)的最优解满足*
1o
θ=,则称o DMU 为弱DEA 有效。
定义4. 若模型(4)的最优解满足*1o
θ=,且有0i s -=,0r s +=成立,则称o DMU 为DEA 有效。
定义5. 若模型(4)的最优解满足*
1o
θ<,则称o DMU 为非DEA 有效。
对于非DEA 有效的决策单元,有三种方式可以将决策单元改进为有效决策单元:保持产出不变,减
少投入;保持投入不变增大产出;减小投入的同时也增大产出。
CCR 模型容许DMU 在减小投入的同时也增加产出。
对于CCR 模型,可以通过如下投影的方式将其投向效率前沿面,从而投影所得的点投入产出组合即为DEA 有效。
***
**ˆ(1),1,,ˆ,1,
,.
io o io i io o io i io ro ro r ro x x s x x s x i m
y y s y r s θθ--+=-=---≤==+≥=
上述投影所得值与原始投入产出值之间的差异即为被评价决策单元欲达到有效应改善的数值,设投入的变化量为io x ,产出的变化量为ro y :
*
**ˆ(),1,,ˆ(),1,
,.
io io io io o io i ro ro ro ro r ro x x x x x s i m y y y y s y r s θ-+=-=--==-=+-=
(二) BCC 模型
CCR 模型是假设生产过程属于属于固定规模收益,即当投入量以等比例增加时,产出量应以等比增加。
然而实际的生产过程亦可能属于规模报酬递增或者规模报酬递减的状态。
为了分析决策单元的规模报酬变化情况,Banker, Charnes 与Cooper 以生产可能集的四个公理以及Shepard 距离函数为基础在1984年提出了一个可变规模收益的模型,后来被称为BCC 的模型[5]。
线性形式的BCC 模型可表示为:
111
1
,
1,
0, 1,
,,
,0,
1,,;1,,.
s
r ro o r m i io i s
m
r rj i ij o r i r i Maximize y u subject to x y x u j n r s i m μωμωμω====-=--≤=≥==∑∑∑∑ (5)
含松弛变量形式的BCC 对偶模型
11
111
(
)
,1,
,,1,
,1
,,0,,,m
s
i r i r n
ij j
i o io j n
rj j
r ro j n
j
j j i r Maximize s s
subject to x s x i m y
s y r s
s s i j r
θελ
θλλ
λ-
+
==-=+==-+
-+
+==-===≥∀∑
∑∑∑∑o
(6)
其中ε为非阿基米德无穷小量。
根据BCC 模型中的o u 的取值大小,Banker 和Thrall(1992) [6]提出如下判别方法来判断模型(5)的规模收益。
定理1[6]. 假设含有投入产出组合(,)o o x y 的o DMU 是有效的,那么下面的条件可以判别模型(1)之下o
DMU
的规模收益:
(i) 对于投入产出组合(,)o o x y 规模收益不变当且仅当在某个最优解情况下有*
0o u =;
(ii) 对于投入产出组合(,)o o x y 规模收益递增当且仅当在所有最优解情况下都有*0o u <;
(iii) 对于投入产出组合(,)o o x y 规模收益递减当且仅当在所有最优解情况下都有*0o u >。
其中*o u 代表模型(5)中的最优解。
该定理的证明参见文献[6]。
CCR 模型或者BCC 模型计算出来的效率可能存在多个效率值为1的情形,为了进一步区分这些有效决策单元,常用的方法有超效率模型,交叉效率模型以及双前沿数据包络分析模型。
下面依次做个简单介绍。
(三) 超效率模型
CCR 模型在计算效率值时,经常会出现多个有效的决策单元(效率值为1)的情形,从而使得有效决策单元之间无法进行比较分析。
Andersen 和 Petersen (1993) [7]为了实现决策单元的完全排序,将被评价的决策单元从效率边界中剔除,以剩余的决策单元为基础,形成新的效率边界,计算剔除的决策单元到新的效率边界的距离。
由于剔除的决策单元不被效率边界所包围,对于有效的决策单元而言,其计算出来的新效率值就会大于1,而对于无效的决策单元而言,其所得的效率值不变,仍小于1,从而使得全体决策单元可以实现完全排序。
由于有效的决策单元效率大于1,从而就有了超效率(Super-efficiency) 的概念。
基于CCR 模型的超效率DEA 模型为:
1
1,1,2,
,,
,1,2,
,,
0,.
n
ij j
io j j o n
rj
j ro j j o
j Minimize subject to
x x i m y
y r s j o θλ
θλλ=≠=≠≤=≥=≥≠∑∑ (7)
Banker 和Chang(2006)[8]证实了超效率极易受离群值的影响,因此该方法可以用来检测数据集中是否存在离群值。
(四)交叉效率模型
为了解决DEA 有效决策单元的排序和比较问题,Sexton 等人(1986)[9]提出了交叉效率评价的概念。
所谓交叉效率评价就是每个DMU 分别确定一组输入输出权重,供所有的DMUs 评价使用,其中:用DMU 自身确定的权重评价自己的效率,称为自我评价效率;用其它DMU 确定的权重评价自己的效率,称为交叉效率或同行评价效率。
以表5—1为例,交叉效率评价的实质是对每个DMU 同时进行自评和同行评价,这样不仅考虑DMU 自评的最好相对效率,而且还考虑了DMU 同行评价给出的交叉效率,利用自我评价和交叉效率的平均值作为衡量DMU 绩效的综合指标,该指标不仅较好地解决了DMUs 间排序和比较问题,而且解决了CCR 模型由于输入输出权重不一致性导致的不可比较问题。
Sexton 等人(1986)通过引入二级目标来确定输入输出权重、消除权重的不唯一性。
随后Doyle 和Green(1994,1995) [10],[11]从同行评价的角度解释了交叉效率的含义,并给出了后来的到广泛引用的二级目标函数-攻击型计算方式和仁慈型计算方式,下面两个模型依次为攻击型交叉效率模型和仁慈型交叉效率模型:
表5—1 交叉效率示意表
决策单元
交叉效率
算术平均值 1 2 … n
1 11θ
12θ … 1n θ 11
1n
j j n θ=∑ 2 21θ 22θ … 2n θ 211n
j
j n
θ=∑
n
1n θ 2n θ …
nn θ
1
1n
nj j n θ=∑ 攻击型交叉效率模型: 11,11,*
11
1
1
Subject to 1,
0,
0,1,
,;,
0, 1,,,0, 1,
,.
s
n rk rj r j j k m n ik ij i j j k s
m
rk
rk kk
i ik
r i s
m
rk
rj ik ij r i rk ik Minimize u y v x u
y v x
u
y v x j n j k u r s v i m θ==≠==≠====⎛⎫
⎪
⎝⎭⎛⎫
= ⎪⎝⎭
-=-≤=≠≥=≥=∑∑∑∑∑∑∑∑ (8)
仁慈型交叉效率模型: 11,11,*11
1
1
Subject to 1,
0, 0,1,
,;,
0, 1,,,0, 1,
,.
s
n rk rj r j j k m n ik ij i j j k s
m
rk rk kk i ik r i s
m
rk
rj ik ij r i rk ik Maximize u y v x u y v x u
y v x j n j k u r s v i m θ==≠==≠====⎛⎫
⎪
⎝⎭⎛⎫
= ⎪⎝⎭
-=-≤=≠≥=≥=∑∑∑∑∑∑∑∑ (9)
然而,至今仍无一个准则来判别什么情况下使用攻击型或者是仁慈型。
为了避免目标函数选择上的两难, Wang 和 Chin (2010a)[12] 提出了一种中性交叉效率模型。
其模型形式如下所示:
{1,,}
1*
1111 , ,
1, 1,
,;, 0,1,,,
0,
1,
,.
oo
ro ro m r s io io i s
ro ro
r m io io
i s
ro rj r jo
m
io ij
i ro io u y Maximize Minimize v x u y subject to v x u y j n j o v x
u r s v i m δθθ∈=====⎧⎫⎪⎪
=⎨⎬⎪⎪⎩⎭==≤=≠≥=≥=∑∑∑∑∑
(10)
利用Charnes-Cooper 的变换公式,可得中性交叉效率模型的线性模型 1
*
11
1
1,
,
0, 1,
,;, 0,1,,,
0,1,
,.
0.
m
io io i s ro ro oo r s m
ro rj io ij r i ro ro io Maximize subject to v x u y u y v x j n j o u y r s v i m δ
θδδ======-≤=≠-≥=≥=≥∑∑∑∑ (11)
交叉效率模型还有其他一些改进方式,例如:Liang 等人(2008a)[13]年提出了3个可供选择的二级目标计算方式;Liang 等人(2008b)[14]将非合作博弈理论与交叉效率评价方法结合起来,提出了博弈交叉效率的概念,并设计了算法求解博弈交叉效率值,同时证明了该博弈交叉效率值即为纳什均衡点;Wang 和Chin (2010b)[15]提出了一些可选择性交叉效率评价模型;Wang 和Chin(2011)[16]在交叉效率的研究中率先引入有序加权平均算子(Ordered weighted averaging operator , OWA),很好的体现了决策者的各种偏好,尤其是对不合理的交叉效率评价值赋予较小的权重,从而使得最终的评价结果更为科学合理。
有兴趣的读者可以进一步参阅其他有关交叉效率的相关论文。
(五)几何平均效率模型
为了区分有效决策单元的排序难问题,Wang 等人(2007)[17]于2007提出了悲观效率模型,并将其与乐观效率模型相结合,提出了基于几何平均值的双前面数据包络分析方法。
基于悲观前沿面的数据包络分析模型为:
111
1
,
1,
0,1,2,
,,,0,1,2,
,;1,2,
,,
s
r ro r m
i io
i s m
r rj i ij r i r i Minimize y subject to
x
y x j n r s i m φμνμνμν======-≥=≥==∑∑∑∑ (12)
其中r μ和i v 是非负权重。
模型(12)与模型(2)的区别在于:模型(12)计算所得效率均大于等于1,而模型(2)
所得的效率值均小于等于1。
基于几何平均值的双前沿数据包络分析方法就是将模型(12)所得的效率与模型(2)所得的效率通过几何平均的方式加以综合,即:
*o ϕ其中*
o ϕ为综合后的({1,2,,})o DMU o n ∈的效率值,而*o θ和*o φ分别对应该决策单元在模型(2)与模型(12)下
的最优效率值。
下图为有效前沿面和无效前沿面的一个演示图。
图5-1 决策单元的有效和无效前沿面
(六)最优决策单元的选择
在实际应用中,决策者有时候关心的是哪个方案或者哪个决策单元是最优的,而对于其他单元的排序并不在意。
因此,如何利用DEA 模型直接寻求最优决策单元成为学者们所感兴趣的问题。
Amin 和Toloo (2007)[18]提出了一个混合整数线性规划模型,采用两步法以期实现寻求最优决策单元。
然而随后Amin (2009)[19]发现这种两步法有时会产生两个或者两个以上的最优决策单元,因此他提出一个非线性混合整数模型。
Foroughi (2011)[20]发现Amin 的非线性规划模型在有些情况下是不可行的。
不过Foroughi (2011)的模型存在着一些冗余的约束且对输入输出权重给定了保证域,并且该模型易受离群值(outliers)的影响,从而导致所选择的最优决策单元不正确。
因此,Wang 和 Jiang (2012)[21]提出了三种混合整数线性规划模型来改进Foroughi (2011)的模型中所存在的问题。
这三种最优决策单元选择的模型分别为:
1. 基于不变规模收益的混合整数线性规划模型的最优决策单元选择方法
Minimize ∑∑∑∑====⎪⎪⎭
⎫
⎝⎛-⎪⎪⎭⎫ ⎝⎛s r n j rj r m
i n j ij i y u x v 1111
1 2 4 6 8 产出1/投入
Subject to
j m
i ij i s
r rj r
I x v y u
≤-∑∑==1
1
, n j ,,1 =,
11
=∑=n
j j
I
, (13)
}1 ,0{∈j I , n j ,,1 =,
}
{max )(1
rj j
r y s m u +≥
, s r ,,1 =,
}
{max )(1
ij j
i x s m v +≥
, m i ,,1 =,
其中j I (1,
,j n =)是二元变量,且只有一个变量可以取非零值1。
如果1o I =,那么约束条件
1
1
s
m
r rj i ij j r i u y v x I ==-≤∑∑ 对应的 o DMU 的约束为
111s m
r ro i io r i u y v x ==-≤∑∑, 即允许o DMU 的效率值大于1,而
其余的DMU 的约束1
1
s
m
r rj i ij j r i u y v x I ==-≤∑∑与原始的CCR 模型的约束相同, 也就是 1
1
0s
m
r rj
i ij
r i u y v x
==-≤∑∑对于任
意的{1,
,}j n ∈除了j o ≠。
因此, 只有最有效的决策单元的效率值会大于1,而其余决策单元的效率均小于等于1。
权重约束沿用 (Sueyoshi, 1999[22])提出的松弛变量模型中的形式,该约束形式在实际应用中被广泛采用,即(1/(()max{}))r rj j
u m s y ≥+ (1,,r s =);(1/(()max{}))i ij j
v m s x ≥+对于任意的 (1,,i m =).
2. 基于投入导向的BCC 模型的混合整数线性规划最优决策单元选择方法
模型(13)是基于不变规模收益下的最优决策单元的选择方法。
该方法可以拓展到可变规模收益的情形如下所示,该模型的形式是基于投入导向的BCC 模型下的形式 :
Minimize ∑∑∑∑====⎪⎪⎭
⎫
⎝⎛--⎪⎪⎭⎫ ⎝⎛s r n j rj r m i n j ij i y u nv x v 11011
Subject to
j m
i ij i s
r rj r
I v x v y u
≤+-∑∑==01
1
, n j ,,1 =,
11
=∑=n
j j
I
, (14)
}1 ,0{∈j I , n j ,,1 =,
}
{max )(1
rj j
r y s m u +≥
, s r ,,1 =,
}
{max )(1
ij j
i x s m v +≥
, m i ,,1 =,
0v 无符号限制.
3. 基于产出导向的BCC 模型的混合整数线性规划最优决策单元选择方法
同理可得,基于产出导向的可变规模收益的BCC 形式下的混合整数线性规划模型如下:
Minimize 01111nu y u x v s r n j rj r m
i n j ij i -⎪⎪⎭
⎫
⎝⎛-⎪⎪⎭⎫ ⎝⎛∑∑∑∑====
Subject to
j m
i ij i s
r rj r
I x v u y u
≤-+∑∑==1
01, n j ,,1 =,
001
≥+∑=u y u
s
r rj r
, n j ,,1 =,
11
=∑=n
j j
I
, (15)
}1 ,0{∈j I , n j ,,1 =,
}
{max )(1
rj j
r y s m u +≥
, s r ,,1 =,
}
{max )(1
ij j
i x s m v +≥
, m i ,,1 =,
0u is free in sign,
其中约束条件
001
≥+∑=u y u
s
r rj r
(n j ,,1 =)是为了保证全体产出是非负的,因为负的产出没有意义。
(七)举例说明
下面用3个例子来说明DEA 方法的应用。
例1:假设现有七个被评价的决策单元,投入、产出项各有一项,投入项为X ,产出项为Y ,输入如下表所示。
此时七个决策单元的相对位置如图5—2所示。
在CCR 模型下,连接原点与点B 的射线构成前沿面,如图中所示,其余的点均位于该前沿面的下方。
表5—2 七个决策单元的投入、产出数据
DMU X Y Efficiency A 2 1 0.5000 B 3 3 1.0000 C 8 6 0.7500 D 6 2 0.3333 E 5 4 0.8000 F 10 6 0.6000 G
7
4.5
0.6429
图5—2 七个决策单元的分布及其在生产前沿面上的投影
从图2中可以看出,只有决策单元B位于生产前沿面上,而其他所有决策单元均位于该生产前沿面的下方,即A, C, D, E, F, G均为非DEA有效,从表5—2最后一列的效率值大小也很容易得到确认。
为了使非DEA 有效决策单元为DEA有效,可依图中箭头所示的方向将非DEA有效的决策单元往前沿面上投影。
A, C, D, F, G均为减小投入而保持产出不变;而E给出了三种投影方式(减小投入产出不变;保持投入不变增大产出;或者同时减小投入和增大产出)。
例2:五个先进制造技术的甄别, 数据来源于Wang和Chin(2009)[23]。
表5—3五个先进制造技术的数据及其乐观、悲观以及几何平均值
决策单元
投入
产出
Y 乐观效率值悲观效率值几何平均值X1X2
A 40 7 210 1.0000 1.6000 1.2469
B 32 12 105 0.5639 1.0000 0.7509
C 52 20 304 1.0000 1.7371 1.3180
D 35 13 200 0.9838 1.7415 1.3089
E 32 8 150 0.8580 1.4286 1.1071
对于每一个决策单元而言,可通过求解模型(2)和(12)获得全体DMUs的乐观和悲观效率,结果如上表所示。
下面简单介绍一下求解过程和技术实现。
以第一个决策单元的CCR效率(即乐观效率)为例,将数据代入模型(2)即得模型(16),显然这是个较为复杂的线性规划模型,需要借助软件计算才会更为简便。
因此本书分别给出了Lingo以及Matlab下的CCR模型的编程。
Lingo的编程一次也只能计算一个(见下面程序后的计算说明),而Maltab程序相对而言更为简便,其可以很快地计算出所有决策单元的效率。
此例中通
过软件计算所得,在乐观效率下,所得效率为表5—3的第五列所示,全体单元的优序关系为: C=A>D>E>B 。
,决策单元A 与C 均为DEA 有效,而B, D, E 为非DEA 有效。
在悲观模型下,所得的效率值为表5—3的第六列所示,决策单元B 为DEA 无效,而其他单元均为非DEA 无效,其优序顺序为:D>C>A>E>B 。
由此可见,在乐观前沿面和在悲观前沿面下的排序存在着一定的差异。
表5—3的最后一列的值为乐观和悲观效率的几何平均值,显然Wang 等人(2007)提出的该几何平均值较好的综合了乐观和悲观前面的两部分信息,从而五个单元合理的排序为:C>D>A>E>B 。
11
12112112112112112112 21040+7=1,
210(40+7)0, 105(32+12)0,
304(52+20)0,
200(35+13)0,
150(32+8)0, 0,0,0.
Maximize subject to θμωωμωωμωωμωωμωωμωωμωω=⎧⎪
-≤⎪⎪-≤⎪
-≤⎨⎪-≤⎪
⎪-≤⎪
≥≥≥⎩ (16) 下面给出LINGO 与Matlab 的程序:
例2的LINGO 程序实现:(以计算第一个决策单元的乐观效率为例)
MODEL : sets :
DMU/1..5/:S,T,P; !Decision making units; II/1..2/:w; !input index; OI/1/:u; !output index;
IV(II,DMU):X; !input variable; OV(OI,DMU):Y; !output variable; endsets data :
P=1 0 0 0 0;
X=40 32 52 35 32 7 12 20 13 8; Y=210 105 304 200 150; enddata
max =@sum (DMU: P*T); @for (DMU(j):
S(j)=@sum (II(i): w(i)*X(i,j)); T(j)=@sum (OI(i): u(i)*Y(i,j)); S(j)>=T(j));
@sum (DMU:P*S)=1; END
在上述程序中,P 的值(1 0 0 0 0)分别替换为 (0 1 0 0 0), (0 0 1 0 0), (0 0 0 1 0), (0 0 0 0 1), 可得5个决策单元的最优效率值依次为
1.0000, 0.5639, 1.0000, 0.9838, 0.8580。
例2的Matlab 程序实现: clear all;
X=[ 40 32 52 35 32
7 12 20 13 8];
Y=[ 210 105 304 200 150];
n=size(X',1);m=size(X,1);s=size(Y,1);
A=[-X' Y'];
b=zeros(n,1); LB=zeros(m+s,1);UB=[];
for i=1:n;
F=[zeros(1,m) -Y(:,i)'];
Aeq=[X(:,i)' zeros(1,s)];
beq=1;w(:,i)=linprog(F,A,b,Aeq,beq,LB,UB);
E(i,i)=Y(:,i)'*w(m+1:m+s,i);
end
w
E
omega=w(1:m,:)
mu=w(m+1:m+s,:)
EE=diag(E)
运行上述Matlab程序,即可得全体DMUs的CCR效率值。
例3. 现有14家国际航空公司,数据来源于Tofallis(1997)[24]。
已知投入有三项,产出有两项,分别为:1
x:飞机容量吨公里
2
x:营业费用
3
x:其他资产(预定系统,便利性以及流动资产)
1
y: 每公里乘客数
2
y: 非客运收益
表5—414家航空公司的数据
DMU
投入产出
1
x
2
x
3
x
1
y
2
y
1 5723 3239 2003 26677 697
2 5895 4225 4557 3081 539
3 24099 9560 6267 124055 1266
4 1356
5 7499 3213 64734 1563
5 5183 1880 783 23604 513
6 19080 8032 3272 95011 572
7 4603 3457 2360 22112 969
8 12097 6779 6474 52363 2001
9 6587 3341 3581 26504 1297
10 5654 1878 1916 19277 972
11 12559 8098 3310 41925 3398
12 5728 2481 2254 27754 982
13 4715 1792 2485 31332 543
14 22793 9874 4145 122528 1404
表5—5CCR效率及其非有效决策单元的改进
DMU j CCR 效率.
投入产出
x1j x2j x3j y1j y2j
1 0.8684 -753 -916 -264 0 0
2 0.3379 -390
3 -2940 -4032 3569 0
3 0.9475 -1265 -502 -329 0 731
4 0.9581 -569 -123
5 -135 0 0
5 1 0 0 0 0 0
6 0.9766 -44
7 -402 -77 0 810
7 1 0 0 0 0 0
8 0.8588 -1709 -957 -2008 0 0
9 0.9477 -344 -175 -1392 0 0
10 1 0 0 0 0 0
11 1 0 0 0 0 0
12 1 0 0 0 0 0
13 1 0 0 0 0 0
14 1 0 0 0 0 0
利用CCR模型以及将非有效DMU改进为有效DMU的投影公式,可得表5—5的结果。
从表中可知,决策单元5, 7, 10, 11,12, 13, 14为DEA有效,而其它单元为非DEA有效。
对于非有效决策单元,例如对第一家航空公司而言,它的第一项投入应减少753,第二项投入应减少916,第三项投入应减少264,同时保持产出不变,这时该航空公司可达DEA有效。
DMU4,DMU8和DMU9与DMU1类似也均需减少该三项投入。
而对DMU2而言,其前三项投入应分别减少3903,2940和4032,第一项产出需增加3569,第二项产出保持不变可达有效。
而DMU3和DMU6在减少三项投入的同时,还需要增加第二项产出才会有效。
利用攻击型交叉效率模型,我们可得如下表(表5—6)所示的14家航空公司的交叉效率表以及其排序。
从表中可以看出第5家航空公司的相对效率为0.7983,为所有航空公司中最优,其次是第11家航空公司,其交叉效率值为0.7742。
而第2家航空公司的交叉效率值为0.1652,为14家航空公司中最差。
利用仁慈型交叉效率模型,我们可得如下表(表5—7)所示的14家航空公司的交叉效率表以及其排序。
从表中可以看出第11家航空公司的相对效率为0.9193,为所有航空公司中最优,其次是第13家航空公司,其交叉效率值为0.9190。
而第2家航空公司的交叉效率值为0.1894,为14家航空公司中最差。
此结果与攻击型交叉效率模型所得的结果又较大的差异,然而至今仍无一个准则可以清晰的告诉决策者何时该选择攻击型模型或者是仁慈型模型。
因此均对不同的决策问题,选择的模型的不同,所得结果可能出入较大。
为此,学者们提出了一些改进模型,例如Wang 和Chin(2010a)的中性交叉效率模型,以及Liang等人(2008a)的博弈交叉效率模型都可以较好的避免这个问题。
表5—6攻击型交叉效率值表
DMU 目标DMU 平均
交叉
效率
排
序
1 2 3 4 5 6 7 8 9 10 11 12 13 14
1 0.8684 0.4501 0.6225 0.8684 0.4418 0.4726 0.7679 0.7881 0.7031 0.4158 0.3390 0.7043 0.4711 0.4726 0.5990 12
2 0.1719 0.3379 0.0472 0.1719 0.0224 0.0247 0.2770 0.2724 0.2808 0.2465 0.1152 0.2789 0.0417 0.0247 0.1652 14
3 0.8826 0.1942 0.9475 0.8826 0.6566 0.6898 0.6468 0.6833 0.6225 0.2559 0.1968 0.6261 0.7422 0.6898 0.6226 11
4 0.9581 0.4259 0.7034 0.9581 0.6683 0.6973 0.7629 0.7850 0.6991 0.4027 0.4739 0.7016 0.4937 0.6973 0.6734 7
5 0.9653 0.3658 1.0000 0.9653 1.0000 1.0000 0.7011 0.7359 0.7778 0.5272 0.6382 0.7819 0.7181 1.0000 0.7983 1
6 0.8818 0.1108 0.9563 0.8818 0.9632 0.9766 0.5745 0.6084 0.5099 0.1376 0.1703 0.5141 0.6766 0.9766 0.6385 9
7 0.9211 0.7781 0.4773 0.9211 0.3108 0.3382 1.0000 1.0000 0.8395 0.5416 0.4000 0.8383 0.3658 0.3382 0.6478 8
8 0.7813 0.6114 0.5162 0.7813 0.2683 0.2924 0.8415 0.8588 0.8208 0.5703 0.3011 0.8194 0.4418 0.2924 0.5855 13
9 0.7855 0.7278 0.5075 0.7855 0.2455 0.2677 0.8881 0.9072 0.9477 0.7501 0.3528 0.9452 0.4537 0.2677 0.6309 10
10 0.7821 0.6354 0.6520 0.7821 0.3337 0.3564 0.7650 0.7944 1.0000 1.0000 0.4942 1.0000 0.5871 0.3564 0.6813 6
11 1.0000 1.0000 0.4287 1.0000 0.4202 0.4418 1.0000 1.0000 1.0000 0.8107 1.0000 1.0000 0.2961 0.4418 0.7742 2
12 0.9462 0.6336 0.7500 0.9462 0.4085 0.4395 0.9082 0.9395 0.9998 0.7647 0.4244 1.0000 0.6398 0.4395 0.7314 5
13 1.0000 0.4256 1.0000 1.0000 0.4183 0.4555 0.9511 1.0000 1.0000 0.5855 0.2129 1.0000 1.0000 0.4555 0.7503 3
14 1.0000 0.2277 1.0000 1.0000 0.9806 1.0000 0.6919 0.7275 0.6478 0.2747 0.3299 0.6521 0.7097 1.0000 0.7316 4 表5—7仁慈型交叉效率值表
DMU 目标DMU
平均
交叉
效率
排
序
1 2 3 4 5 6 7 8 9 10 11 12 13 14
1 0.8684 0.4501 0.6225 0.8684 0.849
2 0.4726 0.8108 0.7881 0.7031 0.7512 0.8684 0.771
3 0.868
4 0.8684 0.7543 12
2 0.1719 0.3379 0.0472 0.1719 0.1735 0.0247 0.2479 0.2724 0.2808 0.2058 0.1719 0.2025 0.1719 0.1719 0.1894 14
3 0.8826 0.1942 0.9475 0.8826 0.884
4 0.6898 0.7232 0.6833 0.622
5 0.784
6 0.8826 0.8072 0.8826 0.8826 0.7678 9
4 0.9581 0.4259 0.7034 0.9581 0.9413 0.6973 0.8228 0.7850 0.6991 0.8112 0.9581 0.8341 0.9581 0.9581 0.8222 6
5 0.9653 0.3658 1.0000 0.9653 1.0000 1.0000 0.7704 0.7359 0.7778 1.0000 0.9653 1.0000 0.9653 0.9653 0.8912 3
6 0.8818 0.1108 0.9563 0.8818 0.8780 0.9766 0.6615 0.6084 0.5099 0.7176 0.8818 0.7478 0.8818 0.8818 0.7554 11
7 0.9211 0.7781 0.4773 0.9211 0.8795 0.3382 1.0000 1.0000 0.8395 0.7808 0.9211 0.8012 0.9211 0.9211 0.8214 7
8 0.7813 0.6114 0.5162 0.7813 0.7702 0.2924 0.8458 0.8588 0.8208 0.7532 0.7813 0.7631 0.7813 0.7813 0.7242 13
9 0.7855 0.7278 0.5075 0.7855 0.7889 0.2677 0.8782 0.9072 0.9477 0.8375 0.7855 0.8369 0.7855 0.7855 0.7590 10
10 0.7821 0.6354 0.6520 0.7821 0.8250 0.3564 0.7780 0.7944 1.0000 1.0000 0.7821 0.9719 0.7821 0.7821 0.7803 8
11 1.0000 1.0000 0.4287 1.0000 1.0000 0.4418 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9193 1
12 0.9462 0.6336 0.7500 0.9462 0.9602 0.4395 0.9362 0.9395 0.9998 1.0000 0.9462 1.0000 0.9462 0.9462 0.8850 4
13 1.0000 0.4256 1.0000 1.0000 1.0000 0.4555 1.0000 1.0000 1.0000 0.9843 1.0000 1.0000 1.0000 1.0000 0.9190 2
14 1.0000 0.2277 1.0000 1.0000 1.0000 1.0000 0.7795 0.7275 0.6478 0.8569 1.0000 0.8838 1.0000 1.0000 0.8659 5
应用数据包络分析需注意的事项:
1.DEA 作为一种非参数方法,将数学、经济和管理的概念与方法相结合,是处理多目标决策问题,解决
在经济和管理中评价具有多个投入、多个产出问题的有力工具。
主要适合于同种类型部门或单位间的相对有效性排序和评价,可以通过在生产前沿面上的投影分析,发现非DEA有效的产生原因以及改进方向,调整资源投入量和效益产出量使决策单元达到DEA有效。
2.应用DEA模型进行评价,不必事先确定指标权重,只需假定由决策单元的投入产出指标组成的状态可
能集满足凸性、无效性、锥性以及最小性等条件即可。
DEA方法本身包含指标的权重分配过程,在计
算不同决策单元的最大有效性时,指标的权重是动态可变的,最后排序的结果是每个决策单元在最有利于自身的权重下的结果。
3.应用DEA方法进行评价分析时,一般要求决策单元数目应大于投入产出变量数目之和。
根据经验法则,
最好是决策单元数目应大于投入产出变量数目之和的两倍,这样计算所得的结果才能具有较好的区分性,否则容易出现多个决策单元有效而无法进一步区分的情形。
此时,可以采用超效率模型或者是交叉效率模型进行相对效率分析。
也可以将这些有效决策单元再采用其他综合评价方法进行分析。
4.投入产出指标的确定,一般是根据资源投入量与效益产出量确定。
DEA模型求解时,一般要求投入产
出指标具有非负性。
如果遇到负的投入指标,一些学者认为可以考虑将取绝对值后纳入产出指标进行考虑,不过这种方法的合理性以及此方面的研究还尚未取得一致的认识。
5.在实践中,通常有两种导向的模型可以供决策者选择,一类是投入导向模型(即在相同产出水平下,
比较投入资源的使用情况),一类是产出导向模型,人们通常只从投入导向或者产出导向的角度去分析决策单元的相对有效性,不过这两种角度在很多时候计算所得的结果是不一致的,只有CCR模型计算所得的投入导向与产出导向的效率是一致的。
对于采用其他DEA模型时所得结果存在的不一致性,在实际中也可以将两个角度通过加权综合的方式一起考虑,相关研究可以参考最新的国内外文献。
6.DEA方法不仅能对管理效率进行横向对比,也可以进行纵向、动态的分析,即评价样本的数据可以选
择截面数据、时间序列数据或者是面板数据。
面板数据常用的方法为DEA视窗分析法与DEA-Malmquist 生产力指数法。
7.当前已有较多的现成的DEA软件可以用于求解DEA模型,例如DEAP,DEA solver以及MyDEA等。
不过这些软件只能求解常见的DEA模型,对于改进型的DEA模型,通常需要编程,此时可借助于:EXCEL的线性规划求解器,Lingo软件以及Matlab软件等编程软件。
习题:
1.现有10家医院,每家医院有2个投入(医生人数以及护士人数)和2个产出(门诊病人人数以及住院
病人人数),投入产出表如下所示,试用DEA方法分析这10家医院的相对有效性。
表5—8十家医院投入产出数据表
第7节案例分析
本节以一个实例来说明数据包络分析方法的使用,评估对象为中国台湾的森林经营。
宝岛台湾面积为36000平方公里,台湾森林覆盖面积占全省土地总面积的一半以上,在1989年以前有13个林区,主要以保护林地和木材为主要任务。
森林的经营具有非盈利性质,了解各个林区的经营效率,检讨投入资源的使用是否有效,是一个值得探讨的问题。
以下将以台湾省各林区的效率评估,探讨DEA使用的各个步骤,来说明DEA方法在实际中的应用。
案例分析中主要集中探讨三个部分内容:(1)确认投入产出项,(2)选择恰当的DEA模型,(3)结果的分析与解释。
使用DEA方法首先需要选择适当的投入产出项目。
根据森林经营的多目标性及其非营利性等特点,其目标包括实质产出(如:木材、野生动物)以及森林效用(如:净化空气,调节气温,美化环境,洁净水源,保持水土,旅游等),为了筛选投入产出项以衡量森林经营目标,参考Kao和Yang(1992)[25]的研究与高强等人(2003)[26]编写的书籍。
筛选的步骤如下:
(1) 访问林业局的管理层,确立其组织目标及其管理目标。
(2) 要求受访者确认投入产出项目。
进行过程中间研究者从文献以及经验得知的各种投入产出种类列
出,以供受访者参考
(3) 要求受访者确定投入产出的衡量指标。
进行过程中间研究者从文献以及经验得知的各种投入产出
衡量指标列出,以供受访者参考
(4) 收集并整理投入产出数据
(5) 确认投入产出项目及衡量指标并完成数据收集整理后,进一步与受访者探讨,分析其含义。
产出项目根据森林一般多目标经营的想法,例如美国1960年颁布的Multiple Use-Sustained Yield 法案,森林的功能包括木材生产、野生动物、水源涵养、放牧、森林游乐等五项。
通过与林业局的深访,决定台湾省林业经营目标有林产、水源涵养、游乐三项,而采用以下三个指标来衡量:
(1)主产物:木材的产量,度量单位为立方公尺;
(2)平均蓄积:用以衡量水土保持、调节气温、洁净水源等森林功效,以林地林木蓄积量
表示,单位为千立方公尺;
(3)游乐:用以衡量森林之游乐功效,单位为游客人数。
投入项依据生产经济理论,基本上是土地、资本与劳力,在森林经营中,林地上林木蓄积量亦可视为资本。
因此,林业局的相关人员认为因采用如下四项指标来衡量投入,即:
(1)预算:以千元为单位;
(2)原始蓄积:林地之林木蓄积量越大,其林木的生产量也越大,水源涵养效果也越佳,
因此以评估期开始的林地为林地蓄积为指标,单位为千立方公尺;。