数据包络分析法DEA总结

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

DEA（Data Envelopment Analysis）数据包络分析
目录
一、DEA的起源与发展（参考网络等相关文献） (2)
二、基本概念 (2)
1.决策单元（Decision Making Unit，DMU） (2)
2.生产可能集（Production Possibility Set，PPS） (3)
3.生产前沿面（Production Frontier） (3)
4.效率（Efficiency） (4)
三、模型 (5)
R模型 (5)
2.BBC模型 (5)
3.FG模型 (5)
4.ST模型 (5)
5.加性模型(additive model，简称ADD) (5)
6.基于松弛变量的模型(Slacks-based Measure，简称SBM) (5)
7.其他模型 (5)
四、指标选取 (6)
五、DEA的步骤（参考于网络） (6)
六、优缺点（参考一篇博客） (7)
七、非期望产出 (7)
1.非期望产出的处理方法： (8)
2.非期望产出的性质： (8)
八、DEA几个注意点 (9)
九、DEA相关文献的总结 (9)
1.能源环境效率 (9)
2.碳减排与经济增长 (10)
3.关于工业、制造业、产业的DEA (10)
4.关于企业的DEA (11)
5.其他 (12)
一、DEA的起源与发展（参考网络等相关文献）
数据包络分析（DEA）是一种常用的效率评估的方法，用以评价一组具有多个投入、多个产出的决策单元（Decision Making Units，DMUs）之间的相对效率。

1978年，A.Chames（查恩斯），W.Cooper（库伯）和E.Rhodes（罗兹）提出了第一个DEA模型，这个模型被命名为CCR模型。

该模型在评价多投入多产出DMU的规模有效性和技术有效性方面十分有效。

1985年，A.Chames，W.Cooper，B.Golany（格拉尼），L.Seiford（赛福德）和J.Stutz（斯图茨）给出另一个模型，称为C2GS2模型，这一模型用来研究生产部门间的“技术有效性”。

1987年，A.Chames，W.Cooper，魏权龄和黄志明又得到了称为锥比率的数据包络模型C2WH模型。

这一模型可用来处理具有过多的输入及输出的情况，而且锥的选取可以体现决策者的“偏好”，灵活地应用这一模型，可以将C2R模型中确定出的DEA有效决策单元进行分类或排队。

此后，在国内外学者们的共同努力下，不断有新的DEA模型问世，DEA方法也得以不断完善和发展。

随着理论研究的进一步深入，DEA的应用领域日益广泛，成为社会、经济和管理领域的一种重要而有效的分析工具，并取得了许多应用成果。

二、基本概念
主要参考的是这两篇文章：
杨国梁，刘文斌，郑海军. 数据包络分析法(DEA)综述[J].系统工程学报，2013,28(6)：840-860.
罗艳. 基于DEA方法的指标选取和环境效率评价研究[D].中国科学技术大学博士学位论文，2012.
1.决策单元（Decision Making Unit，DMU）
DMU是效率评价的对象，可以理解为一个将一定“投入”转化为一定“产出”的实体。

每个DMU都在生产过程中将一定数量的生产要素转化成产品，努力实现自身的决策目标，因此他们都表现出一定的经济意义。

DMU的概念是广义的，可以是工厂、银行等盈利性组织，也可以是学校、医院等非营利性组织。

在多数情况下，我们说的DMU指的是同质的（或同类型的）个体，也即具有以下特征的DMU：
(1)具有相同的目标；
(2)具有相同的外部环境；
(3)具有相同的投入和产出指标。

同质性保证了决策单元之间的可比性和评价结果的公平性。

但当我们进一步
把“黑箱”打开，深入研究决策单元的内部结构和子单元的生产效率时，有时会涉及非同质决策单元。

例如：隶属于同一公司的若干个分公司，虽然他们具有相同的投入和产出，但由于地理位置的原因而处于不同的外部环境中。

总部在进行绩效考评时，必须釆取合适的方法处理分公司非同质的问题，以刺激内部竞争，从而提高整体效率。

Castelli等人（2001）曾建立DEA-like模型来评价非同质的多个决策单元。

2.生产可能集（Production Possibility Set，PPS）
记X、Y为某个DMU在其生产活动中的投入、产出向量，则可以用（X,Y）来表示这个DMU的整个生产活动。

考虑n个DMU单元，单元DMU j（j=1,2,3…,n）有m个投入X ij（i=1,2,3…,m），s个产出Y rj（r=1,2,3…,s）。

定义1：称集合T={(X,Y)|产出Y能用投入X生产出来}为所有可能的生产活动构成的生产可能集合。

根据Banker的研究，生产可能集需要满足四个假设：
假设1表明生产可能集T是一个凸集；假设2即若以原投入的k倍进行生产，可以得到原产出k倍的产出；假设3即在原来的生产活动的基础上增加或减少产出的生产总是可能的。

假设2还分为2-1收缩性假设0＜k≤1，2-2扩张性假设k ≥1。

在DEA模型中，几种最基本的生产可能集是T CCR，T BBC，T FG，T ST，分别对应于CCR模型，BCC模型，FG模型，ST模型。

T CCR满足假设1-4，T BBC满足假设1、3、4，T FG满足假设1、2-1、3、4，T ST 满足假设1、2-2、3、4。

3.生产前沿面（Production Frontier）
定义2：
则称L为生产可能集T的弱有效面，称L∩T为生产可能集T的弱生产前沿面。

特别地，若ω>0，μ>0则称L为T的有效面，称L∩T为生产可能集T的生产前沿面（魏权龄，2004）。

在DEA理论中，判断一个DMU是否为DEA有效，实质上就是判断该DMU 是否落在生产可能集的生产前沿面上。

4.效率（Efficiency）
在DEA理论中，效率通常包括：技术效率(technical efficiency)、规模效率(scale efficiency)和配置效率(allocation efficiency)。

技术效率指的是在保持决策单元投入不变的前提下，实际产出同理想产出的比值。

技术效率反映了决策单元在给定投入情况下获取最大产出的潜力。

一般情况下，技术效率取值在0和1之间。

若技术效率值等于1，则说明DMU在现有投入水平下实现了产出的最大化，是技术有效的；若技术效率值小于1，则说明DMU的实际产出和理想产出之间还存在差距，没有位于生产前沿面上。

规模效率是在CCR效率和BCC效率的基础上定义的。

在Cooper et al.(2000)的著作中，CCR效率值称为全局技术效率，BCC效率值称为局部纯技术效率，两者的比值称为规模效率，即DMU在规模报酬不变下的技术效率和规模报酬可变下的技术效率的比值。

同样，规模效率值等于1，说明决策单元是规模有效的；规模效率值小于1，说明决策单元是规模无效的。

配置效率指的是在保持决策单元产出不变的前提下，决策单元的总体效率和技术效率的比值(Hartman et al., 2001 )。

其中，总体效率定义为决策单元的最小成本与实际成本的比值。

在计算总体效率时，考虑了所有投入变量的价格信息，总体效率越接近于1，说明决策单元的运营成本越接近理想状态。

当配置效率等于1时，说明决策单元的配置是有效的。

A、B、C三点均在生产前沿面上，其效率值均为1，也即都是技术有效的。

A点为弱有效，B、C点为有效。

三、模型
主要参考了这篇文章：
罗艳. 基于DEA方法的指标选取和环境效率评价研究[J].中国科学技术大学博士论文，2012.
以下部分只是简要列举了各种类型的DEA模型，详细的模型建模及相关公式详见相关参考文献。

R模型
CCR模型是第一个DEA模型，也是最基本的DEA模型之一，由Chames，Cooper 和Rhodes于1978年建立。

该模型是以规模收益不变(Constant Returns to Scale, CRS)为前提，对决策单元进行效率评价。

2.BBC模型
Banker，Chames 和Cooper (1984)对Chames 等人(1978)的工作进行拓展，建立了BCC模型，将其应用于规模收益可变(Variable Returns to Scale, VRS)情况下的效率评价问题。

3.FG模型
FG模型是Rire和Grosskopf (1985)在使用费用方法研究规模收益问题时提出的，用于规模收益非递增情况下的决策单元的效率评价问题。

4.ST模型
Seiford和Thrall (1990)提出了ST模型，用于规模收益非递减情况下的决策单元的效率评价问题。

5.加性模型(additive model，简称ADD)
以上四种基本模型中，除CCR模型外，其他投入导向和产出导向模型的求解结果并不一定保持一致，因此在计算时需要对导向加以区分，而加性模型(Chames et al., 1985)的好处是能够将两种导向结合在一个模型中。

6.基于松弛变量的模型(Slacks-based Measure，简称SBM)
SBM模型(Tone, 2001)是对ADD模型的拓展，解决了投入或产出变量的单位不一致的情况下的效率评价问题，即具有单位不变性(units invariant)。

7.其他模型
随着DEA理论体系的不断发展和完善，国内外学者相继提出了一系列DEA 模型，除了以上介绍的几种，还包括：Russell测量模型；保证域模型；考虑偏好的锥比率模型；FDH 模型；超效率模型；交叉效率模型；逆DEA模型；网络DEA 模型；含有不可控变量的DEA模型；含有分类变量的DEA模型；时间序列DEA 模型；随机DEA模型；含有非期望产出的环境效率模型等等。

四、指标选取
主要参考的是这篇文章：
罗艳. 基于DEA方法的指标选取和环境效率评价研究[D].中国科学技术大学博士学位论文，2012.
运用数据包络分析方法对一组决策单元进行效率评价的前提是建立一套合理的评价指标体系。

评价目的不同，选取的评价指标也不同。

即使针对同样的目的，选取的评价指标不同，得到的结果也千差万别。

DEA是一种基于数据的评价方法，所以科学地选择评价指标是效率评价工作的关键，也是保证评价结果合理性的前提。

在指标选取中，需要注意这样几个问题：
(1)指标个数要合适。

DEA理论中的拇指法则(rule of thumb)规定，决策单元个数至少要为评价指标个数的两倍。

一旦指标个数较多，违背了拇指法则，将会导致有效决策单元个数较多，大大降低DEA模型的区分度；而指标个数较少，则不利于发现问题，也无法为决策者提供充分的信息以辅助决策。

(2)选取的指标能够真实反映生产过程。

这就要求指标选取要尽量避免任意性和主观性，并能正确定义每一个指标的属性（或为投入变量，或为产出变量1）。

(3)所选指标要易于获取数据。

因为DEA是基于数据的一种效率评价方法，效率值也通过投入、产出数据表示，没有数据，也就无法进行计算。

目前，常用的指标选取方法有经验判断法（定性）、主成分分析法、因子分析法等。

现金增加值(Cash Value Added, CVA)
基于现金增加值的指标选取方法：同时使用现金流量表和资产负债表中的数据。

Eg：银行效率评价的实证分析。

与其他方法相比，CVA指标选取过程具有一些显著优势：第一，它保证了选择的客观性，避免了主观因素对DEA计算结果的影响；第二，能够在指标选取的同时，为决策者和研究者提供有关变量属性的相关信息，属性确定对于DEA 计算是非常重要的；第三，每一个变量都是从资产负债表和现金流量表中选取的，因此数据获取变得非常容易。

五、DEA的步骤（参考于网络）
1.确定评价目的
2.选择DMU
3.建立输入输出指标体系
4.DEA模型的选择
5.评价工作的设计与表述
(1) 确定各DMU的DEA有效性；
(2) 了解各DMU的相对规模收益情况；
(3) 确定相对有效生产前沿面；
(4) 确定各DMU在有效生产前沿面上的“投影”；
(5) 分析各DMU的相对有效性与各输入（输出）指标间的关系；
(6) 各DMU之间相对有效性的关系；
(7) 不同指标体系对各DMU相对有效性的影响；
(8) 其他。

六、优缺点（参考一篇博客）
首先，DEA方法可用于评价多投入、多产出的决策单位之生产（经营）绩效。

DEA方法无需指定投入产出的生产函数形态，因此可评价具有较复杂生产关系的决策单位（DMU，decision making units）的效率。

其次，它具有单位不变性（unit invariant）的特点，即DEA衡量的DMU的结果不受投入产出数据所选择单位的影响。

只要投入、产出数据的单位是统一的，那么任何一个投入、产出数据的单位发生变化，都不会影响效率结果。

它能同时处理比例数据和非比例数据，即投入、产出数据中可以同时使用比例数据和非比例数据，只要该数据是能够反映决策单位投入面或产出面的主要指标即可。

第三，DEA中模型的权重由数学规划根据数据产生，不需要事前设定投入与产出的权重，因此不受人为主观因素的影响。

而事前设定权重的方法，如专家评估法，容易受到人为主观因素的影响。

（这个优点很重要哦！）
第四，DEA可以进行目标值与实际值的比较分析、敏感度分析和效率分析。

可以进一步了解决策单位资源使用的情况，可以供管理者的经营决策参考。

DEA方法的缺点在于它衡量的生产函数边界是确定性的。

因此，所有随机干扰项都被看成是效率因素。

同时，该方法的评价容易受到极值的影响。

七、非期望产出
主要参考的是这篇文章：
罗艳. 基于DEA方法的指标选取和环境效率评价研究[D].中国科学技术大学博士学位论文，2012.
在DEA理论中，我们通常将产生的污染物（如废水、废气、固体废弃物等）称为非期望产出(undesirable outputs)，对应的好的产出（如发电量、工业总产值、利润等）称为期望产出(desirable outputs)。

Koopmans (1951)最早提出了非期望产出的概念。

事实上，非期望因素并非仅有产出，还包括非期望投入，如循环生产中的“废水”即为一个非期望投入，人们希望循环过程可以尽可能多地处理废水，也就是投入越多越好。

1.非期望产出的处理方法：
因为不同于一般意义上的产出，非期望产出的增加反而会造成决策单元效率的降低，所以在评价环境效率时，最关键的一点就是如何处理非期望产出。

Seford 和Zhu (2002)在他们的文章中，总结了五种处理非期望产出的方法，具体如下。

(1)简单忽略
即完全不考虑非期望产出，这时的DEA模型同传统模型并无差异，因此得到的效率值也不能说是环境效率。

(2)期望产出和非期望产出以同比例增减
此方法考虑了非期望产出的特性，它规定：当期望产出以某一比例增加时，非期望产出以同一比例减少。

但是此方法建立的模型为非线性的，需要通过线性逼近转化成线性规划来计算。

(3)方向距离函数
方向距离函数是对第二种方法的扩展，它允许期望产出和非期望产出按照任意方向增减。

当方向变为(1,-1)时，即为第二种情况。

(4)视为投入
此方法是将非期望产出作为投入处理，在模型中只是增加了投入变量的个数，并没有改变生产可能集的结构。

这种方法是基于非期望产出同投入一样都是越少越好的思想。

如Pittman (1981)，Cropper 和Oates (1992),，Reinhard et al. (1999)等人的研究都釆用这种方法。

但是，它违背了非期望产出的属性特征，并不能真实地反映生产过程。

(5)单调递减转换
这是Seford和Zhu (2002)提出的方法，它保持了原有规划模型的线性和凸性，并能够实现分类不变性（不改变决策单元的有效性：。

具体做法是：将非期望产出的原始数据乘以(-1)，再加上一个足够大的数(M)，使其值大于零，然后以转换后的数据作为非期望产出的数据，并将其作为普通产出进行处理。

综合来看，处理非期望产出的方法可以归纳为间接和直接两种方法。

所谓间接方法就是用一个单调递减函数f对原始数据进行转换，并将转换后的数据视为期望产出，即Seford和Zhu (2002)的方法。

Hua et al. (2008)在评价淮河流域造纸厂的生态效率时釆用的也是这种方法。

而直接方法则是不改变数据值，通过修改生产可能集的假设条件以恰当的方法处理非期望产出。

针对直接方法，Chung和Fare (1997)指出可以按照两条路径进行研究：一是如何对联合产出（期望产出和非期望产出）建模，二是如何减少非期望产出，这也是使用DEA方法研究环境效率的两条主线。

2.非期望产出的性质：
非期望产出是伴随着期望产出被一起生产出来的，因此二者之间必然存在着
某种特定的关系。

根据Fareetal. (2004)的研究，他们的关系如下：
(1)空连接性(null-joint)
(2)弱可处置性(weak disposability)
任何减少污染的行为都是以牺牲一部分期望产出为代价的，我们通常将期望产出和非期望产出之间的这种数量关系称为“trade-off”。

八、DEA几个注意点
1.DEA软件：DEAP
2.1软件；Matlab软件等。

2.不同的投入和产出数据不要求单位一致，可包含人数、面积、费用等。

3.关于模型中径向和角度的意思：
“径向”意味着在评价效率时要求投入或产出同比例变动，当存在非零松弛时，径向测度会高估决策单元的效率，进而导致所有决策单元之间的效率区别度较差。

“角度”意味着评价效率时必须在基于投入角度（即产出既定条件下寻求成本最小化）或者基于产出角度（成本既定情况下实现产出最大化）之间做出选择，选择一个角度而忽略另一个角度的计算结果并不准确。

李涛. 资源约束下中国碳减排与经济增长的双赢绩效研究——基于非径向DEA方法的RAM模型的测度[J].经济学（季刊），2013,12(2)：667-692.
九、DEA相关文献的总结
1.能源环境效率
林伯强的这篇文章是看的有关DEA的第一篇文章，刚开始大部分的内容都看不懂，只是对DEA这个方法有了一个大概的了解。

林伯强，刘泓汛. 对外贸易是否有利于提高能源环境效率——以中国工业行业为例[J].经济研究，2015(9)：127-141.
文章首先运用非径向方向距离函数测算了中国工业两位数行业的能源环境效率，并通过高度细分的联合国商品贸易统计数据整理得到各行业的进出口数
据，然后，构建包含Tobit模型的联立方程组，就对外贸易等因素如何影响能源环境效率进行了实证分析。

Zhang(2014)：The effect of size-control policy on unified energy and carbon efficiency for Chinese fossil fuel power plants.（我国活力发电厂规模控制政策对能源和碳效率的影响）
林伯强的文章投入产出指标是参考的这篇文章Zhang(2014)。

Zhou(2012)：Energy and CO2 emission performance in electricity generation：A non-radial directional distance function approach.（发电中的能量和CO2排放性能：非径向方向距离函数的方法）
林伯强文章用的非径向方向距离函数的方法是参考的这篇文章Zhou(2012)。

2.碳减排与经济增长
李涛. 资源约束下中国碳减排与经济增长的双赢绩效研究——基于非径向DEA方法的RAM模型的测度[J].经济学（季刊），2013,12(2)：667-692.
运用非径向DEA方法——RAM模型估算了1998-2010年中国29个省份的经济效率、碳环境效率，并将两者整合在统一的联合效率框架以测度碳排放与经济增长的耦合程度。

文章谈到，关于此文所研究的中国碳排放问题，目前的文献主要关注三个方面：(1)基于环境库兹涅茨曲线(EKC)检验碳排放与经济增长是否呈现先污染后改善的倒U形曲线的实证研究；(2)碳税政策工具，这类研究主要从碳税的环境效应、经济效应、收入分配效应等方面对中国未来征收碳税能否实现“双重红利”进行论证；(3)经济因素对碳排放的影响，这类研究从出口贸易、经济发展方式转变、经济结构演变等方面对碳排放构成的影响进行分析。

3.关于工业、制造业、产业的DEA
(1)赵萌. 中国制造业生产效率评价：基于并联决策单元的动态DEA方法[J].系统工程理论与实践，2012,32(6)：1251-1260.
采用的是时间序列数据，投入中所使用的行业总产出及资本投入等数据进行了价格平减。

(2)陈洪转，舒亮亮. 基于DEA模型的我国高新技术产业园区投入产出效率评价[J].科学学与科学技术管理，2013,34(4)：104-109.
CCR模型，对31个省（直辖市、自治区）的高新技术产业园区的投入产出效率进行了实证分析，并对非有效的省份进行了规模有效性和投影分析计算。

MATLAB求解。

(3)郭亚军. 基于三阶段DEA模型的工业生产效率研究[J].科研管理，2012,33(11)：16-23.
(4)刘睿劼，张智慧. 基于WTP-DEA方法的中国工业经济—环境效率评价[J].
中国人口·资源与环境，2012,22(2)：125-129.
WTP：社会支付意愿。

超效率DEA。

2000-2008年的数据。

4.关于企业的DEA
(1)杨妮娜. 日本企业环境业绩评价指标体系及其借鉴[J].改革之窗，2013(4)：28-31.
(2)王波，张群，王飞. 考虑环境因素的企业DEA有效性分析[J].控制与决策，2002,17(1)：24-28.
(3)胡剑波，刘辉. 我国区域工业生态创新效率评价——基于SBM模型和CCR 模型的比较分析[J].科技管理研究，2014(14):47-52.
采用我国30个省市区2011年的截面数据为样本。

运用MATLAB软件。

引入生态创新的概念，SBM模型处理非期望产出，CCR模型仅考虑经济效益，这两个模型比较分析。

传统的CCR模型是径向的，没有考虑投入产出的松弛性问题，导致测度经济效率失真；而处理非期望产出的DEA-SBM模型将松弛变量考虑到目标函数中，一方面解决了传统CCR模型不能解释的投入产出的松弛性问题，另一方面考虑了非期望产出对环境效率测度影响问题。

(4)余立平. 企业性质与创新效率——基于国家大中型企业的研究[J].数量经济技术经济研究，2007(5)：108-115.
DEA方法，结合Malmquist指数，应用于生产率变化的测算。

Malmquist指数，可分解为不变规模报酬假定下技术效率变化指数和技术进步指数。

(5)陈伟，刘井建. 基于DEA-Malmquist指数的企业创新效率变动研究——对我国电子行业的15家上市企业的实证分析[J].科技进步与对策，2008,25(8)：139-142.
(6)熊婵，买忆媛，何晓斌，肖仁桥. 基于DEA方法的中国高科技创新企业运营效率研究[J].管理科学，2014,27(2)：26-37.
综合基本DEA效率评价模型及改进竞争型DEA交叉效率模型，以企业的技术创新、广告投入、品牌价值等若干高科技企业的重要运营指标作为评价指标，对中国不同地区的高科技创业企业的运营效率进行评价，并对各地区非DEA有效的高科技创业企业投入冗余和产出不足情况进行分析。

指标选取：根据高科技创业企业的创新特征及数据的可得性。

输入：研发费用、研发人员数量、广告投入、人力资源成本、管理费用。

产出：销售额、品牌资产（个）（这个点是一个不足，对大多数企业来讲不具有区分能力）
DEAP2.1软件，投入径向的方法。

(7)王坚强，阳建军. 基于DEA模型的企业投资效率分析[J].科研管理，
2010,31(4)：73-80.
基于TOPSIS方法的DEA投资效率评价模型，对30家房地产企业进行了实证分析。

分别用CCR，TOPSIS-DEA，投入资本回报率等三种方法对30家企业进行了排名。

(8) 赵树宽，余晴海，巩顺龙. 基于DEA方法的吉林省高技术企业创新效率的研究[J].科研管理，2013，34(2)：36-43.
5.其他
(1) 罗艳. 基于DEA方法的指标选取和环境效率评价研究[D].中国科学技术大学博士学位论文，2012.
(2)丁晶晶. 基于DEA的并联生产系统评价与资源分配方法研究[D].中国科学技术大学博士学位论文，2011.
这两篇文章是博士学位论文，对DEA的介绍比较详细且有条理。