数据包络分析概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据包络分析概述
数据包络分析是线性规划模型的应用之一,常被用来衡量拥有相同目标的运营单位的相对效率。
数据包络分析是一种基于线性规划的用于评价同类型组织(或项目)工作绩效相对有效性的特殊工具手段。
这类组织例如学校、医院、银行的分支机构、超市的各个营业部等,各自具有相同(或相近)的投入和相同的产出。
衡量这类组织之间的绩效高低,通常采用投入产出比这个指标,当各自的投入产出均可折算成同一单位计量时,容易计算出各自的投入产出比并按其大小进行绩效排序。
但当被衡量的同类型组织有多项投入和多项产出,且不能折算成统一单位时,就无法算出投入产出比的数值。
例如,大部分机构的运营单位有多种投入要素,如员工规模、工资数目、运作时间和广告投入,同时也有多种产出要素,如利润、市场份额和成长率。
在这些情况下,很难让经理或董事会知道,当输入量转换为输出量时,哪个运营单位效率高,哪个单位效率低。
因而,需采用一种全新的方法进行绩效比较。
这种方法就是二十世纪七十年代末产生的数据包络分析(DEA)。
DEA方法处理多输入,特别是多输出的问题的能力是具有绝对优势的。
数据包络分析(DEA)源起
1978年,著名运筹学家、美国德克萨斯大学教授A.Charnes及W.W.Cooper和E.Rhodes发表了一篇重要论文:“Measuring the efficiency of decision making units”(决策单元的有效性度量),刊登在权威的“欧洲运筹学杂志”上。
正式提出了运筹学的一个新领域:数据包络分析,其模型简称C2R 模型。
该模型用以评价部门间的相对有效性(因此被称为DEA有效)。
数据包络分析应用现状
DEA的优点吸引了众多的应用者,应用范围已扩展到美国军用飞机的飞行、基地维修与保养,以及陆军征兵、城市、银行等方面.目前,这一方法应用的领域正在不断地扩大。
它也可以用来研究多种方案之间的相对有效性(例如投资项目评价);研究在做决策之前去预测一旦做出决策后它的相对效果如何(例如建立新厂后,新厂相对于已有的一些工厂是否为有效)。
DEA模型甚至可以用来进行政策评价。
最引人注目的研究是把DEA与其它评价方法进行比较。
例如将DEA应用于北卡罗来纳州各医院的有效性评价。
已有的按计量经济学方式给出的回归生产函数认为,此例中不存在规模收益。
DEA的研究发现,尽管使用同样的数据,回归生产函数不能象DEA那样正确测定规模收益.其关键在于:
•DEA和回归方法虽然都使用给定的同样数据,但使用方式不一样;
•DEA致力于每个单个医院的优化,而不是对整个集合的统计回归优化。
在其它的研究中,例如在评价医院经营有效性时,将DEA与马萨诸塞州有效性评定委员会使用的比例方法进行了比较,当使用模拟方法对DEA进行检验后认为,尽管由回归函数产生的数据有利于回归方法的使用,但是DEA 方法显得更有效.
DEA法另一個與其他多屬性決策分析模式不同之處,在於DEA不須預設屬性之相對權重,乃是由實證資料中推導產生,每個受評方案的效率衡量乃是分別採取對該受評方案最有利的權重組合。
数据包络分析(DEA)模型简介
DEA是使用数学规划(包括线性规划、多目标规划、具有锥形结构的广义最优化、半无限规划、随机规划等)模型,评价具有多个输入、特别是多个输出的“部门”或“单位”(称为“决策单元”,简记DMU)间的相对有效性(称为DEA有效)。
实际上“效率”或“相对有效性”的概念也是指产出与投入之比,不过是加权意义之下的产出投入比。
根据对各DMU观察的数据判断DMU是否为DEA有效,本质上是判断DMU是否位于可能集的“生产前沿面”上。
早期的學者以經濟學觀點來闡釋效率,提出以生產邊界(production frontier)為衡量效率之基礎,估計主要有兩種方法
●參數法(parameter approach)利用理論建構或實證推導的方式預先設定生產函數之形式。
●無母數法(non-parametricapproach)恰好相反,DEA法即為一種無母數的生產函數分析法不預設
投入與產出屬性之相對權重,藉由實際投入產出的資料形成包絡面(envelopment surface),推測出生產邊界。
DEA 使用步驟
(1)決策單位之選取;
(2)投入產出項之選取;
(3)DEA模式之選取;
(4)評估結果之分析。
應用DEA於多屬性評估問題時,必須先定義問題瞭解問題本質,釐清相對績效評估的目的經由目
標之建立設定評估準則。
取DEA 模式構建效率邊界,並將決策單位的實績與效率邊界比較以衡量其效率,再將評估之結果加以分析,檢視決策單位是否有效率。
相對無效率的決策單位,則分析其未達最佳效率的原因,提出努力方向和矯正行動以改善其效率。
数据包络分析基本概念
在DEA 中一般称被衡量绩效的组织为决策单元(decision making unit ——DMU )。
设:n 个决策单元( j = 1,2,…,n )
每个决策单元有相同的 m 项投入(输入)(i = 1,2,…,m ) 每个决策单元有相同的 s 项产出(输出) (r = 1,2,…,s ) X ij ——第 j 决策单元的第 i 项投入 y rj ——第 j 决策单元的第 r 项产出
输入型与输出型的DEA 模型
• Input-DEA 模型:基于投入的技术效率,即在一定产出下,以最小投入与实际投入之比来估计。
或者说,决
策者追求的倾向是输入的减少,即求θ的最小。
• Output-DEA 模型:基于产出的技术效率,即在一定的投入组合下,以实际产出与最大产出之比来估计。
或
者说,决策者追求的倾向是输出的增大,即求z 的最大。
CCR 模式假設固定規模報酬(constant return to scale),也就是每一單位投入可得產出量是固定的,不會因規模大小而改變
Banker 等人將CCR 模式修正為變動規模報酬(Variable Returns to Scale, VRS)的假設下衡量決策單位之相對效率,稱之為BCC 模式(Banker et al., 1984)。
此模式將決策單位是否達到有效的生產規模也納入評估,故可同時衡量規模效率(scale efficiency)與技術效率(technical efficiency)。
C 2R 模型 C 2R 的对偶输入模型模型 C 2R 的对偶输出模型模型
,0,,,1,1.max 00
00
≥≥=≤v u n j X v Y u t
s X v Y u T
T T
T n
j Y Y X X
t
s j
j
n
j j j n
j j
,,1,0,
,
.min 01
01 =≥≥≤∑∑==λλ
θλθ
n
j zY Y X X t
s z
j j
n
j j j
n
j j
,,1,0,
,.max 01
01 =≥≥≤∑∑==λλ
λ
BC 2的对偶输入模型模型Banker, Charnes and Cooper(1984)
n
j Y Y X X
t
s j n
j j
j
n
j j j n
j j
,,1,01
,
,
.min 1
0101 =≥=≥≤∑∑∑===λλ
λθλθ
构建DEA 模型的思路
衡量某一决策单元 j 0是否DEA 有效——是否处于由包络线组成的生产前沿面上,先构造一个由 n 个决策单元组成(线性组合成)的假想决策单元。
如果该假想单元的各项产出均不低于 j 0 决策单元的各项产出,它的各项投入均低于 j0 决策单元的各项的各项投入。
即有:
(j=1…n)∑λj y rj ≥ y rj0 (r = 1,2,…,s ) (j=1…n)∑λj x ij ≤ E x ij0 (i = 1,2,…,m ,E <1) (j=1…n)∑λj = 1 ,λj ≥0 (j = 1,2,…,n ) 这说明 j 0 决策单元不处于生产前沿面上。
基于上述事实,可以写出如下线性规划的数学模型:(把cita 变成E)
n
j Y Y X X
t
s j n
j j
j
n
j j j n
j j
,,1,01
,
,
.min 1
0101 =≥=≥≤∑∑∑===λλ
λθλθ
结果分析:
1、当求解结果有 E <1 时,则 j0 决策单元非DEA 有效;
2、否则,则 j0 决策单元DEA 有效。
具有非阿基米德无穷小量的C 2R 对偶输入模型
,0,,1,0,
,
.)]([min 01
01^≥≥=≥=-=++-+-+=-=+-∑∑S S n
j Y S Y X S X
t
s S e S e j j
n
j j j n
j j
T T
λλ
θλεθ
例1:考虑具有4个决策单元,2个输入和1个输出,相应的输入数据和输出数据由下表给出: 1 2 3 4
1——1 3 3 4 输入 2——3 1 3 2
1 1
2 1——1 输出
考察DMU 1,取ε=10-
5
,,,,,1
23233433.)]
([min 121,4321143212432114321121≥=-+++=++++=++++++-+--+-
-+-
-s s s s s s t s s s s λλλλλλλλθ
λλλλθ
λλλλεθ
最优解为
1
)0,0,0,1(0010
2010=====+--θλs s s T
所以,DMU 1为DEA 有效。
DEA 有效性的判断
• 对具有非阿基米德无穷小量的C 2R 对偶输入模型,可以根据以下规则判断DEA 有效性:
• 若θ<1,则DMU j0不为弱DEA 有效;
• 若θ=1,
0>++-S e S e T T 则DMU j0仅为弱DEA 有效; • 若θ=1,
0=++-S e S e T T 则DMU j0为DEA 有效; 关于DEA 模型的基本定理
• 存在性定理:至少存在一个决策单元,它是DEA 有效的。
• 有效性与量纲选取无关定理:决策单元的DEA 有效性与输入和输出量纲的选取无关。
• 有效性与DMU 同倍“增长”无关定理:决策单元的DEA 有效性与决策单元对应的输入和输出同倍“增长”无关。
生产前沿面
生产前沿面实际上是指由观察到的决策单元的输入数据和输出数据的包络面的有效部分,这也是称谓“数据包络分析”的原因所在。
决策单元为DEA 有效,也即相应于生产可能集而言,以投入最小、产出最大为目标的Pareto 最优。
因此,生产前沿面即为Pareto 面(Pareto 最优点构成的面)。
技术有效与规模有效
• 技术有效:输出相对输入而言已达最大,即该决策单元位于生产函数的曲线上。
(其实这就是前面一直提到
的相对有效性,注意,技术有效于纯技术有效是不同的,有文献指出,技术效率等于纯技术效率与规模效率的乘积)
• 规模有效:指投入量既不偏大,也不过小,是介于规模收入收益由递增到递减之间的状态,即处于规模收
益不变的状态。
DMU1、 DMU2、 DMU3都处于技术有效状态;DMU1不为规模有效,实际上它处于规模收益递增状态; DMU3不为规模有效,实际上它处于规模收益递减状态; DMU2是规模有效的。
如果用DEA 模型来判断DEA 有效性,只有DMU2对应的最优值θ0=1。
可见,在C 2R 模型下的DEA 有效,其经济含义 是:既为“技术有效”,也为“规模有效”。
相对有效性评价问题举例
例2:硕士点教育质量评价
某系统工程研究所对我国金属热处理专业的26个硕士点的教育质量,进行了有效性评价。
评价采用的指标体系为:
输入:导师人数;实验设备;图书资料;学生入学情况。
输出:科研成果;论文篇数;学生毕业时的情况。
例3:行风(行业作风)建设有效性评价
本项目研究人员选定江苏省S 市交通客运系统作为对象,包括7家交通客运汽车公司。
选定了输入指标4 项,输出指标4 项。
分别是:
输入指标:1、年末职工总数(单位:人);
2、单位成本(单位:元/千人公里);
3、燃料单位消耗(单位:升/千人公里);
4、行车责任事故率(单位:次/千人公里)。
输出指标:1、劳动生产率(单位:元/人);
2、行车准点率(%);
3、群众满意率(按问卷调查)(%)
4、车辆服务合格率(包括:服务态度、服务措施、车辆设施等)(%)
例4:银行分理处相对有效性评价
振华银行的4 个分理处的投入产出如下表。
求各个分理处的运行是否DEA有效。
(产出单位:处理笔数/月)
解:若先确定分理处1的运行是否DEA有效。
建立线性规划模型:
min E
1800λ1 +1000λ2 + 800λ3 + 900λ4≥1800
200λ1 + 350λ2 + 450λ3 + 420λ4≥ 200
1600λ1 +1000λ2 +1300λ3 +1500λ4≥1600
S.t. 15λ1 + 20λ2 + 21λ3 + 20λ4≤ 15E
140λ1 + 130λ2 + 120λ3 + 135λ4≤140E
λ1 + λ2 + λ3 + λ4=1
λj≥0 (j = 1,2,3,4 )
求解结果分析:
对分理处1,E =1,说明分理处1的运行DEA有效。
对分理处2,E =0.996,说明分理处2的运行非DEA有效。
对分理处3,E =1,说明分理处3的运行DEA有效。
对分理处4,E =1,说明分理处4的运行DEA有效。
例5:医院相对效率评价
•利用DEA模型分析4类医院(普通医院、校医院、镇医院和国家医院)的相对效率。
这些医院具有相同(或相似)的投入(输入量)和产出(输出量)。
•例如,建立一个用于分析镇医院相对效率的线性模型。
•输入量
•全职非主治医师人数
•提供的经费
•可供住院的床位数
•输出量
•开诊日的药物治疗服务
•开诊日的非药物治疗服务
•接受过培训的护士数目
•接受过培训的实习医师数目
•4类医院的年输入量(年消耗)
镇医院相对效率评价——DEA分析
•通过建立一个线性规划模型,以4类医院的输入量和输出量为基础建立一个假设的合成医院。
通过将4类医院的输入量(或输出量)的加权平均值作为假设的合成医院的输入量(或输出量)。
•在线性规划模型中的约束条件中,合成医院所有的输出量必须大于或等于镇医院的输出量。
假如合成医院的输入量显示小于镇医院输入量,那么合成医院就是有更大的输出量而拥有更小的输入量。
因而,镇医院比合成医院(四类医院的加权平均)相对低效,进而可被认为比其他医院相对低效。
•wg为普通医院在合成医院中所占的份额或比重;
•wu为校医院在合成医院中所占的份额或比重;
•wc为镇医院在合成医院中所占的份额或比重;
•ws为国家医院在合成医院中所占的份额或比重
所以,DEA模型的第一个约束条件为
wg+wu+wc+ws=1
•为了使模型符合逻辑,合成医院的输出量必须大于或等于镇医院的输出量。
即
合成医院的输出量≥镇医院的输出量
•我们可写出输出量的约束条件:
48.14wg+34.62wu+36.72wc+33.16ws≥36.72(药物治疗)
43.10wg+27.11wu+45.98wc+56.46ws≥45.98(非药物治疗)
253wg+148wu+175wc+160ws≥175(护士)
41wg+27wu+23wc+84ws≥23(实习医师)
•为了使模型符合逻辑,合成医院的输入量必须小于或等于镇医院的输入量。
即
合成医院的输入量≤镇医院的输入量
•引入效率指数E,如镇医院全职非主治医生人数为275.70,则275.70E为合成医院全职非主治医生人数。
•当E=1时,合成医院需要与镇医院相同的输入量资源;
•当E>1时,合成医院需要的输入量资源大于镇医院的输入量资源;
•当E<1时,合成医院需要的输入量资源小于镇医院的输入量资源。
(模型的目标)
•我们可写出输入量的约束条件:
285.20wg+162.30wu+275.70wc+210.40ws≤275.70E(全职非主治医师)
123.80wg+128.70wu+348.50wc+154.10ws≤348.50E(提供的经费)
106.72wg+64.21wu+104.10wc+104.04ws≤104.10E(可提供的住院床位数)
•DEA模型的逻辑就是寻求一种合成能否在取得相同的或更多的输出量的同时只需更少的输入量。
假如这种合成可以得到,那么合成的一部分(如镇医院)将被判定比合成(合成医院)低效。
•min E
•s.t. wg+wu+wc+ws=1
•48.14wg+34.62wu+36.72wc+33.16ws≥36.7
•243.10wg+27.11wu+45.98wc+56.46ws≥45.98
•253wg+148wu+175wc+160ws≥175
•41wg+27wu+23wc+84ws≥23
•285.20wg+162.30wu+275.70wc+210.40ws≤275.70E
•123.80wg+128.70wu+348.50wc+154.10ws≤348.50E
•106.72wg+64.21wu+104.10wc+104.04ws≤104.10E
•E, wg, wu, wc, ws ≥0
•模型解得E=0.905
•这说明合成医院能获得镇医院的每一个输出量的同时而同时只用镇医院最多90.5%的输入量资源。
因此,镇医院是相对低效(或DEA无效)的。