数据包络分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据包络分析
3.1 数据包络分析的介绍
在人们的生产活动和社会活动,经常会遇到这样一个问题:在一段时间后,你需要有相同类型的部门或单位(称为决策单元)的基础上进行评价,“输入”数据及其评价“输出”的数据,该输入数据是指在某些决策单元的资金总额中需要消耗的某些活动,诸如投资,劳动投入的总数,占地面积等;输出数据是所述决策单元中的一定量的输入后,将得到的显示的某些信息的活动,如不同类型的产品,产品质量,经济效益等的数量的效果。再具体地,例如,在一所大学,各高校的评价时,投入的总数可以是每年大学基金,工作人员,并占领了课堂教学的总数,各种职称的教师人数等上;输出可以是博士生的人数,研究生人数,本科在校大学生人数,学生的素质“(德,智,体),教师的教学工作量,科研(数量和质量)的学校等等。基于输入和输出的数据,以评估之间的决策单元,即所谓的相对有效性评估单元(或单元)的优点。
数据包络分析(the Data Envelopment Analysis,称为DEA)是于1978年由美国著名的运筹学W.W.Cooper和A.Charnes等学者的概念作为发展高效的评价方法的基础的相对效率。他们的第一款模型被命名为C2R模型,从生产函数的角度来看,这种模式是用于多个输入学习,特别是那些与多重输出“生产部门”同时为“有效规模”与“技术有效”非常良好的和富有成效的做法。1984年R.D.Banker,A.Charnes和W.W.Cooper给出的模型称为B C2模型。
数据包络分析(即DEA)可以被看作是统计分析,这是基于一组输入的新方法对于输出的观察来估计有效生产前沿。在有效性的评价中,除了DEA方法,还有一些其他的方法,但这些方法几乎仅限于单一输出的情况下。与此相反,DEA 方法特别问题的多输入,多输出能力是具有绝对的优势。并且,可以使用不仅DEA线性编程方法来确定是否该决策单元对应于位于有效生产前沿的表面上的一个点,而提供了许多有用的管理信息。因此,它是优越的,但也比一些其它方法(包括使用的统计方法)更广泛地是有用的。
3.2 DEA的C2R模型的建立
数据包络的模型有很多种,根据评价的目的选择相应的模型,其中最常用的模型是C2R模型。一般假设生产可能集T满足以下公里性假设,是一个凸锥。
相应的定理有:
(1)凸性假设:如果(X1,Y1)∈T,(X2,Y2)∈T ,则λ∈ [0, 1 ] ,λ(X1,Y1) + (1-λ)(X2,Y2)∈T ,即总是存在一个系数λ,使得λX1+ ( 1 - λ) X2,作为新的投入,得到的产出是λY1+ (1–λ) Y2。
(2)无效性假设:如果(X1,Y1 )∈ T ,X1≤X2,,Y1≥Y2,则(X2,Y2)∈T,即在原来的基础上,单方面地增加投入或者减少产出总是可行的。
(3)规模报酬不变性假设:如果(X,Y)∈T ,K≥0,则K(X,Y)∈T,即如果投入量增加K倍,产出也增加K倍。
(4) 最小性:生产可能集T是满足上述3个条件所有集合的交集。
假设有t个被评价的同类部分,称为决策单元DMU,每个决策单元均有m投入变量和n个产出变量.如下,其中X ij表示第j个DMU对第i种输入的投入量,X ij>0; Y rj表示第j个DMU对第r种输出的产出量, Y rj>0;V i表示第i种输入的一种度量(或称“权”);U r表示第r中输出的一种度量(或称“权”),i=1,2,…,m; r=1,2,…,n。 X ij, Y ij为已知数据,可以根据历史资料得到。 V i,U r为变量。
对于一组权系数V=(v1⋯v m)T ,U=(u1⋯u n)T。
则输入矩阵为(x11⋯x1n
⋮⋱⋮
x m1⋯x mn
) ,输出矩阵为(
y11⋯y1n
⋮⋱⋮
y s1⋯x sn
)
其中每个的定义有:
X ij-------- 第j个决策单元对第i种类型输入的投入总量,X ij〉0。 Y rj-------- 第j个决策单元对第r种类型输出的产出总量,Y rj〉0。 V i-------- 对第i种类型输入的一种度量,是权系数。
U r-------- 对第r种类型输出的一种度量,是权系数。
i----------1,2,…,m
r ----------1,2,…,s
j ----------1,2,…,n
则对每一个决策单元DMU都有相应的效率评价指数:
h j=u T y j
v x j =∑u r y rj
n
r=1
∑v i x ij
m
i=1
, j=1,2,⋯t
其中x j=(x1j,x2j⋯x mj)T
,y j=(y1j,y2j⋯y nj)
T
j=1,2,⋯,t
可以适当的取权系数和,使得其满足:
h j≤1, j=1,2,⋯,t
对第j0个决策单元进行效率评价,一般说来,h j0越大表明DUM j0能够用相对较少的输入而取得相对较多的输出。
这样我们如果对DUM j0进行评价,看DUM j0在这n个DMU中相对来说是不是最优的,我们可以考察当尽可能的变化权重时,h j0的最大值究竟是多少。
则有:
{
max u T y j0
v T x j0
,
st. u T y j
V x j
≤1,j=1,2⋯,t
u>0,v>0
其中1≤j0≤t
对该分式规划进行Charnes-Cooper变换,
令s=
1
v T x0
>0, ω=sv,μ=su
则可以把上式变换成:
{max h j0=μT y j0
st.ωT x j−μT y j≥0,j=1,2,⋯,t
ωT x j0=1
ω≥0,μ≥0
又有其对偶规划为:
{
min θ
st.∑φj x j≤θx j0, t
j=1
∑φj y j
t
j=1
≥y j0
φj≥0,j=1,2,⋯,t 引入松弛变量有: