数据包络分析CCR、BCC、SBM、TFP等
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图14-1中SS'表示完全有效的公司(或单位)的产出等高线,代表生产前沿面。 点P表示一个公司用相应数量投入来生产一单位产出,技术非有效可以用距离QP 来表示,表示在不减少产出的前提下所有的投入可以成比例缩减的数量,通常用 百分比率QP/0P表示。故一个公司的技术效率通常用下述比率表示
TE=0Q/0P=1-QP/0P 其取值范围在0和1之间。如果值等于1,则表示这个公司是完全技术有效率的, 图14-1中的点Q就是技术有效的。技术有效的所有点就构成了生产前沿面,如图 14-1中曲线SS'上的点。 如果我们已经知道了投入的价格信息,如图14-1中直线AA所示,则可计算分 配效率(Allocative efficiency, AE)和经济效率(Economic Efficiency, EE)。在点P的分 配效率(AE)定义为:AE=0R/0Q;而经济效率定义为:EE=0R/0P。因为有(0Q /0P)×(0R/0P)=0R/0P,所以EE=TE×AE。 图14-1中定义的这些效率方法是假定完全技术有效单位的生产函数已知。但
Charnes,Cooper和Rhodes(1978)提出的应用于前沿面估算的非参数数学规划 的数据包络分析方法(即CCR模型)是DEA模型类中最基本、最重要的技术。随后 有大量的论文,考虑到了其它一系列假设, 对DEA方法进行扩展。如Banker, Charnes和Cooper (1984) 提出的可变规模收益(VRS)模式下数据把罗分析技术,亦 即BCC模型。但DEA中的面向投入的CCR模型的提出最早、且应用最广泛。
一个有效前沿面点,把一个非效率前沿面点(例如图14-5中的A)移至一个有效率
前沿面点(C点)上。这个第二级线性规划可以通过以下定义实现:
图14-2 分段线性凸面等值曲线来自以上是面向投入的技术效率分析方法。这就提出了一个疑问: “在没有改变产 出量的前提下有多少投入量能够适当比例减少? 或者在投入量不变的情况下如何 使产出量以适当比例扩大?”。这就是一个与上面讨论的面向投入的方法相反的面 向产出的方法。
面向产出和面向投入方法之间的不同可以用一个简单的关于单一投入和单一 产出的例子来阐述(图14-3)。
根据Farrell的基本观点,采用投入/产出加以说明,并以减少投入为中心,这 在计量经济学中通常称为面向投入的方法。
Farrell使用了一个简单的例子,即各个单位以两项投入(x1和x2)得到单一产出 (y),其前提是具有固定规模收益,即具不变的规模报酬(图14-1)。
图14-1 技术效率和分配效率示意图
图14-3 面向投入、产出的技术效率方法和规模收益
在图14-3(a)中描述了用f(x)表示规模技术收益的减少,点P表示一个非效率单 位。Farrell的技术效率,如果是面向投入的方法,那么其比值为AB/AP,但如果采 用面向产出的方法,则等于CP/CD。当固定规模收益存在时,面向产出和面向投 入方法得到的技术效率是一样的。但当规模收益出现增加或降低时它们将会不相 等 (Fare and Lovell 1978). 固定规模收益情况可用图14-3(b)中来描述,对于我们谨 慎选择的某一非效率点P,可以看出AB/AP=CP/CD。
形式:
minθ ,λ st
θ − yi + Y λ ≥ 0 θ xi − X λ ≥ 0, λ≥0
(14.1)
其中θ是一个标量而λ是一个N×1常数向量。这种包络形式要比乘数形式的少 许多约束条件(M×S < N×1),所以它通常是首选的解题形式。获得的θ值就是第i
个决策单元的效率值。根据Farrell (1957)的定义,它满足θ≤1, 当取值为1时表示该 点在前沿面上,也就是说该决策单元是技术有效的。
图14-4 产出定向的技术和分配效率
Farrell面向产出的效率方法如图14-4中的定义:AB的距离代表技术非有效。 也就是在无需额外投入的条件下产出所增加的量。因此面向产出的技术效率也即 比值TEO = 0A/0B。如果已知价格信息那么我们就可绘出收益等高线DD′,并且可定 义分配效率为AEO = 0B/0C,且经济效益可以定义为:
14.2 数据包络分析基本模型 CCR
·5·
14.2.1 CCR 模型
若有N个公司或单位(决策单元),每一公司单位或决策单位都有M项投入和S 项产出。分别用向量xi和yi表示决策单元的投入和产出。M×N为投入矩阵X, S×N 为产出矩阵Y, 用它们来表示N个决策单元的所有数据。DEA的目的是在数据点的 基础上建立一个非参数包络前沿面,这样所有可观测点就会在生产前沿面上或者
图14-5 效率测度和投入的松弛变量
在图14-5中,与点A′相关的投入松弛变量是投入x2的CA′。当有比这个简单
例子更多的投入和产出时,视作与“最近”的有效前沿面点(例如C)是相同的,这样
接下来的松弛变量计算就不再是一个繁琐的工作了。一些作者(像Ali和Seiford
1993)提出第二级的线性规划用于解决该问题,通过增大所需的总松弛变量来移动
第14章 数据包络分析及其生产效率评价
(浙江大学 唐启义 联系电话 0571-86971892)
生产效率评价与分析,主要目的是根据实际观测数据,使用有关的效率测度 方法,并借助于有效的计算技术进行评估、决策。生产效率通常用一些前沿面的 形式来描述,在过去50多年里,许多不同方法被应用在前沿面的估计上。其中两 个主要的方法是数据包络分析(Data Envelopment Analysis,DEA)以及随机前沿面 分析(Stochastic Frontier Analysis, SFA)。
要深入的理解面向产出的方法可以考虑包括两项产出(y1和y2)和一个投入 (x1) 的情况。并且假设有固定的规模收益。这时可用在二维空间中的一个单位产出的
·4·
数据包络分析及其生产效率评价
可能性曲线来表示(如图14-4)。图14-4中,其直线ZZ′是单位产出曲线,点A则对应 一个非有效单位。需要注意的是在这种情况下非有效单位点(A)位于曲线之下,因 为ZZ′代表产出可能性以上的区域。
·6·
数据包络分析及其生产效率评价
14.2.2 松弛变量
在DEA中的非参数前沿面的分段线性形式会导致在效率测度中出现一些问 题,如在于分段线性前沿面部分地平行于轴线(图14-2)而在大部分参数函数中并非 如此(见14-1)。这种现象可参见图14-5,其中决策单元C和D是有效的,并且由它 们定义了前沿面,但决策单元A和B是非有效的。
14.1 生产效率分析基本原理
·3·
实际情况下并非如此,因此完全有效的等值曲线必须从样本数据中估算。Farrell 建议使用 (a)建立一个非参数的分段线性凸面等值曲线使不可观测的点位于它的 左侧或者下方(图14-2) ;或者(b)建立一个参数函数,如 Cobb-Douglas 形式的模 型,拟合数据,同样使得不可观测的点应该位于它的左侧或者下方。
在其下方。例如,若有一个公司用两项投入获得一项产出,这时可以视作在三维
空间中许多相交的面组成的覆盖有许多分散点的闭合空间。当假定固定规模收益
存在时,也同样可以在投入1和投入2的空间中用一个单位的等值线来表示(图 14-2)。图14-2中对于每一个决策单位我们通常能够得到其所有产出与所有投入之
间的比值,如u′yi/v′xi,其中u是产出权重的一个S×1向量,v是投入权重的一个M×1
生产效率评价的参数方法,主要有随机前沿面分析(SFA)技术。随机前沿生产 函数于1977年分别由Aigner, Lovell, Schmidt, Meeusen和van den Broeck独立提出。 该生产函数对包含由两个成分组成的误差进行了描述,可应用于面板数据;估计 随时间变化和不变的效率;成本和产量函数等。
解。为了避免这个问题,我们可以限定v′xi = 1,这时有:
maxµ,ν ( µ′yi )
st
ν ′xi = 1
µ′y j −ν ′xj ≤ 0, j = 1, 2,", N
µ,ν ≥ 0
其中从u和v到µ和ν的符号变化反映了它的转变。这种形式通常称为线性规划 问题的乘数形式。利用线性规划中对偶性质,可得到这个问题的一个相同的包络
向量。为了选择最佳权重,我们需定义如下数学规划的问题:
maxu,v (u′yi v′xi )
st
u′y j v′xj ≤ 1, j = 1, 2,", N
u,v ≥ 0
找出u和v的值,使得第i个决策单元的效率测度值达到最大,其受限于所有的效
率测度值都小于或等于1。求这个特殊的比值公式的一个问题是在于它有无穷多个
EEO = (0A/0C) = (0A/0B)-(0B/0C) = TEO×AEO 这些效率的取值都在0~1之间。各种效率,从原点到可观测点之间的线都是规 格化的,也就是,即使改变测度单位(例如在测量劳动者数量时用年人数来取代小 时人数)也不对效率测量值有影响。
14.2 数据包络分析基本模型 CCR
数据包络分析(DEA)是Charnes、Coopor和Rhodes于1978年首先提出的评价生 产效率的重要的非参数方法。该方法的原理主要是通过保持决策单元(Decision Making Units,DMU)的输入或者输入不变,借助于数学规划方法确定相对有效的 生产前沿面,将各个决策单元投影到DEA的生产前沿面上,并通过比较决策单元 偏离DEA前沿面的程度来评价它们的相对有效性。
实际工作中,一般多应用数据包络分析方法,以计算生产效率为目的,并考 虑到了成本效率和分配效率,以及应用面板数据来计算总的因素生产率(TFP)的变 化、技术变化、技术效率变化和规模效率变化的指数,即由Färe et al(1994)提出的 Malmquist指数。
·2·
数据包络分析及其生产效率评价
14.1 生产效率分析基本原理
DEA方法以相对效率概念为基础,以凸分析和线形规划为工具的一种评价方 法,应用数学规划模型计算比较决策单元之间的相对效率,对评价对象做出评价, 它能充分考虑对于决策单元本身最优的投入产出方案,因而能够更理想地反映评 价对象自身的信息和特点;同时对于评价复杂系统的多投入多产出分析具有独到 之处。适用于多输出-多输入的有效性综合评价问题,在处理多输出-多输入的有 效性评价方面具有绝对优势。DEA方法并不直接对数据进行综合,因此决策单元 的最优效率指标与投入指标值及产出指标值的量纲选取无关,应用DEA方法建立 模型前无须对数据进行无量纲化处理。
现代效率的测度由Farrell(1957)首创,他在Debreu (1951) and Koopmans(1951) 方法的基础上定义了一个单位化(取值在0~1之间)的能考虑到多种投入的效率测 度方法,该单位效率由两部分组成: 即技术效率和分配效率,前者反映了一个单 位在给定一系列的投入后获得最大产出量的能力,后者,即分配效率反映了一个单 位以最佳的比例投入后所获得可观价值的能力。这两个方法都与提供一个总的经 济效率测度方法有关。
前沿面估算的分段线性凸面体法是由Farrell(1957)提出的,但在提出后的近20 年里,认可Farrell的方法的人并不多。如Boles (1966)和Afriat(1972)提出的数学规 划方法虽能完成估算,但是这种方法并没有得到广泛的关注。直到Charnes,Cooper 和Rhodes (1978)提出了数据包络分析(DEA)技术,即CCR模型之后,情形得到了 根本的改变。
Farrell (1957)的技术效率测度分别赋予决策单元A和B为0A′/0A和0B′/0B。然 而,问题是点A′是否为一个有效率点,因为可以减少已投入量x2(通过CA′)而仍然 得到相同的产出。在文献中这称为投入的松弛变量。当考虑包括更多投入和多种 产出的情况时,图表就不再是这样简单,但松弛变量也可能出现。这样,在某一项 DEA分析中,为提供精准的技术效率信息,同时列出的Farrell的技术效率测度(θ) 和其他非零的投入或产出松弛变量就会有冲突的地方,这是因为对第i个决策单元 而言,仅当Yλ-yi=0时, 其产出的松弛变量为0;以及仅当xi-Xλ=0(给θ和λ赋适当的值) 时,投入松弛变量为0。
TE=0Q/0P=1-QP/0P 其取值范围在0和1之间。如果值等于1,则表示这个公司是完全技术有效率的, 图14-1中的点Q就是技术有效的。技术有效的所有点就构成了生产前沿面,如图 14-1中曲线SS'上的点。 如果我们已经知道了投入的价格信息,如图14-1中直线AA所示,则可计算分 配效率(Allocative efficiency, AE)和经济效率(Economic Efficiency, EE)。在点P的分 配效率(AE)定义为:AE=0R/0Q;而经济效率定义为:EE=0R/0P。因为有(0Q /0P)×(0R/0P)=0R/0P,所以EE=TE×AE。 图14-1中定义的这些效率方法是假定完全技术有效单位的生产函数已知。但
Charnes,Cooper和Rhodes(1978)提出的应用于前沿面估算的非参数数学规划 的数据包络分析方法(即CCR模型)是DEA模型类中最基本、最重要的技术。随后 有大量的论文,考虑到了其它一系列假设, 对DEA方法进行扩展。如Banker, Charnes和Cooper (1984) 提出的可变规模收益(VRS)模式下数据把罗分析技术,亦 即BCC模型。但DEA中的面向投入的CCR模型的提出最早、且应用最广泛。
一个有效前沿面点,把一个非效率前沿面点(例如图14-5中的A)移至一个有效率
前沿面点(C点)上。这个第二级线性规划可以通过以下定义实现:
图14-2 分段线性凸面等值曲线来自以上是面向投入的技术效率分析方法。这就提出了一个疑问: “在没有改变产 出量的前提下有多少投入量能够适当比例减少? 或者在投入量不变的情况下如何 使产出量以适当比例扩大?”。这就是一个与上面讨论的面向投入的方法相反的面 向产出的方法。
面向产出和面向投入方法之间的不同可以用一个简单的关于单一投入和单一 产出的例子来阐述(图14-3)。
根据Farrell的基本观点,采用投入/产出加以说明,并以减少投入为中心,这 在计量经济学中通常称为面向投入的方法。
Farrell使用了一个简单的例子,即各个单位以两项投入(x1和x2)得到单一产出 (y),其前提是具有固定规模收益,即具不变的规模报酬(图14-1)。
图14-1 技术效率和分配效率示意图
图14-3 面向投入、产出的技术效率方法和规模收益
在图14-3(a)中描述了用f(x)表示规模技术收益的减少,点P表示一个非效率单 位。Farrell的技术效率,如果是面向投入的方法,那么其比值为AB/AP,但如果采 用面向产出的方法,则等于CP/CD。当固定规模收益存在时,面向产出和面向投 入方法得到的技术效率是一样的。但当规模收益出现增加或降低时它们将会不相 等 (Fare and Lovell 1978). 固定规模收益情况可用图14-3(b)中来描述,对于我们谨 慎选择的某一非效率点P,可以看出AB/AP=CP/CD。
形式:
minθ ,λ st
θ − yi + Y λ ≥ 0 θ xi − X λ ≥ 0, λ≥0
(14.1)
其中θ是一个标量而λ是一个N×1常数向量。这种包络形式要比乘数形式的少 许多约束条件(M×S < N×1),所以它通常是首选的解题形式。获得的θ值就是第i
个决策单元的效率值。根据Farrell (1957)的定义,它满足θ≤1, 当取值为1时表示该 点在前沿面上,也就是说该决策单元是技术有效的。
图14-4 产出定向的技术和分配效率
Farrell面向产出的效率方法如图14-4中的定义:AB的距离代表技术非有效。 也就是在无需额外投入的条件下产出所增加的量。因此面向产出的技术效率也即 比值TEO = 0A/0B。如果已知价格信息那么我们就可绘出收益等高线DD′,并且可定 义分配效率为AEO = 0B/0C,且经济效益可以定义为:
14.2 数据包络分析基本模型 CCR
·5·
14.2.1 CCR 模型
若有N个公司或单位(决策单元),每一公司单位或决策单位都有M项投入和S 项产出。分别用向量xi和yi表示决策单元的投入和产出。M×N为投入矩阵X, S×N 为产出矩阵Y, 用它们来表示N个决策单元的所有数据。DEA的目的是在数据点的 基础上建立一个非参数包络前沿面,这样所有可观测点就会在生产前沿面上或者
图14-5 效率测度和投入的松弛变量
在图14-5中,与点A′相关的投入松弛变量是投入x2的CA′。当有比这个简单
例子更多的投入和产出时,视作与“最近”的有效前沿面点(例如C)是相同的,这样
接下来的松弛变量计算就不再是一个繁琐的工作了。一些作者(像Ali和Seiford
1993)提出第二级的线性规划用于解决该问题,通过增大所需的总松弛变量来移动
第14章 数据包络分析及其生产效率评价
(浙江大学 唐启义 联系电话 0571-86971892)
生产效率评价与分析,主要目的是根据实际观测数据,使用有关的效率测度 方法,并借助于有效的计算技术进行评估、决策。生产效率通常用一些前沿面的 形式来描述,在过去50多年里,许多不同方法被应用在前沿面的估计上。其中两 个主要的方法是数据包络分析(Data Envelopment Analysis,DEA)以及随机前沿面 分析(Stochastic Frontier Analysis, SFA)。
要深入的理解面向产出的方法可以考虑包括两项产出(y1和y2)和一个投入 (x1) 的情况。并且假设有固定的规模收益。这时可用在二维空间中的一个单位产出的
·4·
数据包络分析及其生产效率评价
可能性曲线来表示(如图14-4)。图14-4中,其直线ZZ′是单位产出曲线,点A则对应 一个非有效单位。需要注意的是在这种情况下非有效单位点(A)位于曲线之下,因 为ZZ′代表产出可能性以上的区域。
·6·
数据包络分析及其生产效率评价
14.2.2 松弛变量
在DEA中的非参数前沿面的分段线性形式会导致在效率测度中出现一些问 题,如在于分段线性前沿面部分地平行于轴线(图14-2)而在大部分参数函数中并非 如此(见14-1)。这种现象可参见图14-5,其中决策单元C和D是有效的,并且由它 们定义了前沿面,但决策单元A和B是非有效的。
14.1 生产效率分析基本原理
·3·
实际情况下并非如此,因此完全有效的等值曲线必须从样本数据中估算。Farrell 建议使用 (a)建立一个非参数的分段线性凸面等值曲线使不可观测的点位于它的 左侧或者下方(图14-2) ;或者(b)建立一个参数函数,如 Cobb-Douglas 形式的模 型,拟合数据,同样使得不可观测的点应该位于它的左侧或者下方。
在其下方。例如,若有一个公司用两项投入获得一项产出,这时可以视作在三维
空间中许多相交的面组成的覆盖有许多分散点的闭合空间。当假定固定规模收益
存在时,也同样可以在投入1和投入2的空间中用一个单位的等值线来表示(图 14-2)。图14-2中对于每一个决策单位我们通常能够得到其所有产出与所有投入之
间的比值,如u′yi/v′xi,其中u是产出权重的一个S×1向量,v是投入权重的一个M×1
生产效率评价的参数方法,主要有随机前沿面分析(SFA)技术。随机前沿生产 函数于1977年分别由Aigner, Lovell, Schmidt, Meeusen和van den Broeck独立提出。 该生产函数对包含由两个成分组成的误差进行了描述,可应用于面板数据;估计 随时间变化和不变的效率;成本和产量函数等。
解。为了避免这个问题,我们可以限定v′xi = 1,这时有:
maxµ,ν ( µ′yi )
st
ν ′xi = 1
µ′y j −ν ′xj ≤ 0, j = 1, 2,", N
µ,ν ≥ 0
其中从u和v到µ和ν的符号变化反映了它的转变。这种形式通常称为线性规划 问题的乘数形式。利用线性规划中对偶性质,可得到这个问题的一个相同的包络
向量。为了选择最佳权重,我们需定义如下数学规划的问题:
maxu,v (u′yi v′xi )
st
u′y j v′xj ≤ 1, j = 1, 2,", N
u,v ≥ 0
找出u和v的值,使得第i个决策单元的效率测度值达到最大,其受限于所有的效
率测度值都小于或等于1。求这个特殊的比值公式的一个问题是在于它有无穷多个
EEO = (0A/0C) = (0A/0B)-(0B/0C) = TEO×AEO 这些效率的取值都在0~1之间。各种效率,从原点到可观测点之间的线都是规 格化的,也就是,即使改变测度单位(例如在测量劳动者数量时用年人数来取代小 时人数)也不对效率测量值有影响。
14.2 数据包络分析基本模型 CCR
数据包络分析(DEA)是Charnes、Coopor和Rhodes于1978年首先提出的评价生 产效率的重要的非参数方法。该方法的原理主要是通过保持决策单元(Decision Making Units,DMU)的输入或者输入不变,借助于数学规划方法确定相对有效的 生产前沿面,将各个决策单元投影到DEA的生产前沿面上,并通过比较决策单元 偏离DEA前沿面的程度来评价它们的相对有效性。
实际工作中,一般多应用数据包络分析方法,以计算生产效率为目的,并考 虑到了成本效率和分配效率,以及应用面板数据来计算总的因素生产率(TFP)的变 化、技术变化、技术效率变化和规模效率变化的指数,即由Färe et al(1994)提出的 Malmquist指数。
·2·
数据包络分析及其生产效率评价
14.1 生产效率分析基本原理
DEA方法以相对效率概念为基础,以凸分析和线形规划为工具的一种评价方 法,应用数学规划模型计算比较决策单元之间的相对效率,对评价对象做出评价, 它能充分考虑对于决策单元本身最优的投入产出方案,因而能够更理想地反映评 价对象自身的信息和特点;同时对于评价复杂系统的多投入多产出分析具有独到 之处。适用于多输出-多输入的有效性综合评价问题,在处理多输出-多输入的有 效性评价方面具有绝对优势。DEA方法并不直接对数据进行综合,因此决策单元 的最优效率指标与投入指标值及产出指标值的量纲选取无关,应用DEA方法建立 模型前无须对数据进行无量纲化处理。
现代效率的测度由Farrell(1957)首创,他在Debreu (1951) and Koopmans(1951) 方法的基础上定义了一个单位化(取值在0~1之间)的能考虑到多种投入的效率测 度方法,该单位效率由两部分组成: 即技术效率和分配效率,前者反映了一个单 位在给定一系列的投入后获得最大产出量的能力,后者,即分配效率反映了一个单 位以最佳的比例投入后所获得可观价值的能力。这两个方法都与提供一个总的经 济效率测度方法有关。
前沿面估算的分段线性凸面体法是由Farrell(1957)提出的,但在提出后的近20 年里,认可Farrell的方法的人并不多。如Boles (1966)和Afriat(1972)提出的数学规 划方法虽能完成估算,但是这种方法并没有得到广泛的关注。直到Charnes,Cooper 和Rhodes (1978)提出了数据包络分析(DEA)技术,即CCR模型之后,情形得到了 根本的改变。
Farrell (1957)的技术效率测度分别赋予决策单元A和B为0A′/0A和0B′/0B。然 而,问题是点A′是否为一个有效率点,因为可以减少已投入量x2(通过CA′)而仍然 得到相同的产出。在文献中这称为投入的松弛变量。当考虑包括更多投入和多种 产出的情况时,图表就不再是这样简单,但松弛变量也可能出现。这样,在某一项 DEA分析中,为提供精准的技术效率信息,同时列出的Farrell的技术效率测度(θ) 和其他非零的投入或产出松弛变量就会有冲突的地方,这是因为对第i个决策单元 而言,仅当Yλ-yi=0时, 其产出的松弛变量为0;以及仅当xi-Xλ=0(给θ和λ赋适当的值) 时,投入松弛变量为0。