公共品的社区提供 博弈论的一个应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
公共品的社区提供:博弈论的一个应用
——从“脏乱的男生宿舍”导出的一般性分析
苏创
(财政系00级)
[内容提要]
东汉的陈蕃曾说:“一屋不扫,何以扫天下?”但现在的大学男生宿舍不扫一屋的现象颇为普遍。
本文就试图分析为什么没有人扫这区区一屋,如何才能保证有人打扫这一屋?出于自由主义的哲学观,我排除掉了学校的管制,考察大学生内部能够演化出来一种机制来,是宿舍有人打扫清洁。
我运用了博弈论为基本的理论框架,进行了经济学分析,这很有益处,但后来发现新古典的人的行为假定实在是太过简单,于是我后来回到常识,接受了“利他主义”的“意识形态”,从而证明男生宿舍每人打扫清洁关键不在于个人成本-收益不合算,而在于我们的教育对“利他主义”的宣传和弘扬不够。
[关键词]
公共资源、域、关联博弈、利他主义、意识形态
经济学似乎不甘于仅仅研究经济现象的寂寞,而逐渐把它的触须伸到客观世界中普遍存
在的两难困境1。
比如在大学男生宿舍里面,同学一方面想享受干净的环境,另一方面却又希望别人代自己打扫而做一个“自由骑士”(free rider );如果每个人都这样投机的话,则室友们估计只能望着堆积如山的垃圾默默兴叹,而对拿起扫帚犹疑不决。
这是大多数男生宿舍的现实,不合适的现实,因为清洁对我们的身体健康和宿舍形象显然是有利的。
于是,我要在本文讨论的就是,为什么会没人主动的打扫清洁?有没有可能走出这个两难困境?如果有可能,那要靠什么规则,内生的演化抑或外生的规制?
任何经济分析,思路是至关重要的;在一个框架下进行系统的展开,可以得出一个比较全面的认识,可以避免古代士大夫发表大而无当的宏论所引起的“此亦一是非,彼亦一是非”的莫衷一是的局面。
研究宿舍成员的行为,甚至一切人类行为,的本质是探讨人们之间的相互关系;而这正是博弈论的看家本领。
并且据我了解,博弈论框架下的参与人不再被简单的假定为传统意义上的理性(这是理性被等同于“自利”,阿尔蒂亚⋅森把这称为“自利理性观”,认为把任何偏离自利最大化的行为都看成是非理性行为,就意味着拒绝伦理考虑在实际决策
中的作用2)或者有限理性,而是立足于基本的常识:一个现实生活中真实而普通的人。
比如在公共品提供的问题上的林达尔机制,精致的模型画了一大通,最后由于不能保证人们诚实的显示偏好即在对付人们搭便车(社会上大部分人都会如此,我坚信这是事实)面前无能为力而被轻易的驳倒了。
于是我们需要按照常识设定参与人(这些参与人没有学过经济学,不懂得那些假造的术语,他们不仅懂得追求自身利益最大化,而且也会对可能产生的“集体非理性”表示忧虑),这里我假定宿舍只有两个成员1和2,也就是考虑最通常的二人博弈,他们的行动集相同A i ={打扫,不打扫},重要的是考察他们的收益函数中的自变量是哪些。
根据我的观察,由两部分:一是清洁的环境带来的正的效用,记为Cl ;另一个应是打扫清洁带来负效用的努力成本,记为e = θ i E (>0,E 表示打扫一次清洁需要的总的劳动付出,θ
i 则表示努力的每人分担,在二人博弈中可以认为θ 1=θ2=12),于是可以将每个人的效用简单
的记为u i = Cl –e 。
首先,我们考虑一次性的阶段博弈(静态,两人同时行动)。
而我认为人们是完全信息的,因为每个人的类型都是可以观测到的,比如平时着装的整洁程度,枕巾被单的干净程度都是很容易得到的信息。
于是,在静态的分析中我们可以画出下面这个收益矩阵:
参与人2
打扫 不打扫
用画线法可以求出该博弈的纳什均衡。
当参与人1“打扫”时,参与人自然“不打扫”,因为Cl>Cl-12E ;问题是,当参与人1“不打扫”的时候,参与人2就面临两种选择,关键看Cl 和E 的大小:如果Cl>E ,这时我把参与人类型定义为“清洁的强偏好”,选择“打扫”;反之,参与人2就是“清洁的弱偏好”者,选择“不打扫”的行动。
根据参与人的不同偏好,我们可以将这个博弈分成三种:一、两人都是“清洁的弱偏好者”,那么这个博弈就是“囚徒困境”,(不打扫,不打扫)成为一次性博弈的纳什均衡。
二、如果1是“强偏好者”而2是“弱偏好者”,那么最后的纳什均衡是(打扫,不打扫);着类似于“智猪博弈”。
三、如
1
《新兴古典主义与超边际分析》P??,杨小凯 张永生,中国人民大学出版社,北京。
参
与人1
果两人都是“强偏好者”的话,最后会形成“你进我退,你退我进”的“斗鸡博弈”状态,
有双重纳什均衡(打扫,不打扫)或者(不打扫,打扫)3。
在第二、三种情况下,爱干净的人自然会打扫清洁,比如女生宿舍大多干净整洁就与这种偏好有关。
而在第一种情况下,则是没有人愿意打扫清洁的;然而我们需要而且学校希望我们的居住环境保持卫生,以利于正常的生活和学习。
于是,谁来打扫清洁,提供“宿舍清洁”这种公共品就成为“相关参与人”共同关心的话题。
我借着“关联博弈”的概念造出“关联参与人”,用来指将一个特定博弈中的追求目标(如宿舍成员博弈中的“宿舍清洁”)纳入自身效用函数的参与人,这里至少可以举出处于这个特定博弈中的“宿舍成员”和不处于其中的“学校”两个。
很明显,赏罚并重的学校管制是督促同学打扫清洁的一个可行制度选择,比如规定每周一早上楼长检查清洁,检查到如果打扫清洁了,则每人奖励一个洗衣币;否则,则要通报批评以使名誉受损。
这或许确实是一种很好的办法,但是出于自由主义的经济哲学观
..........,我是不太欢迎这种外生制度安排的。
向来崇尚自由民主的北大学生对管制是很是反感。
我在本文主要想探讨的是在博弈主体内部内生衍化出来的制度。
显然,在一次性的博弈中,达不到(打扫,打扫)的合作解,但是博弈是不断重复下去的,在完全信息动态博弈的框架下,可以求出一个贴现值δ,使得当这一贴现值大于某一个具体的值的时候,参与人采取触发策略(trigger strategy)对重复的阶段博弈的总收益是有利的:即对方打扫,我就打扫;对方不打扫,我就永远不打扫。
4但是我对该观点有两点疑问:一、时间价值如何计算,即使参与人根据自己的耐心可以大致的估计出δ从而采取策略,忍受不了长期的肮脏环境的人可以预料他会主动打扫,但是仍然存在二、无限重复的阶段博弈假定的最初的合作状态是如何形成的?触发战略的理论背景是无限重复的阶段博弈,人的生命有限,我们不可能也没必要在这个芝麻大点(并不是特指“宿舍清洁”,而可以推广到许多公共品的提供上)的问题上“千
年等一回”,所以这个策略尽管可以维持
..合作状态,然而未免悲观了些,我想知道是否还有
其他一些内生的(排除掉楼长的条例)制约机制在起作用,促使参与人更快的形成
..提供公共品的制度,也即打扫宿舍,消除恶臭。
顺藤摸瓜,我们有必要沿着第二和第三点疑问进一步的思考,制度作为“旨在约束追求主体福利或效用最大化利益的个人行为”的“一系列被制定出来的规则、守法程序和行为的道德伦理规范”5是如何起源的?我也曾经冥思苦想,但青木昌彦将制度分析纳入博弈论框架的著作《比较制度分析》已经对这一问题作了比较好的解释,于是我愿意这里介绍一下。
“域”(domain)的概念具有“一语惊醒梦中人”的功效。
他写道,“把参与人的行动集合的总和成为博弈的域。
”6显然,“如果域中所有的参与人,给定其自身关于别人策略选择的预期,均选择一定的行动计划,使其当期报酬或当期和未来报酬的现值之和达到最大,那么,这种情形就成为是一种博弈。
”7这只不过是博弈的一般性描述,传统的博弈理论都仅仅考察在一个特定的情形(即一个特定的“域”)下进行,但真实的世界并非如此,世界是各种事物如此复杂的交织在一起以至根本不可能明确的划分出一个特定的域来(移民、交叉学科、模糊产权都是例子),各种域相互影响相互联接。
青木昌彦将“域”分成六种基本的类型:公用资源、交易(经济交换)、组织、社会交换、政体和一般性组织领域。
8考察相关域或跨域的博弈被认为是有生命力的,我觉得这不仅仅包括不同类型的“域”之间的互动,还包括同一种“域”的不同情形之间的互动(一个特例是“社会嵌入”social embeddedness)。
本3关于智猪博弈和斗鸡博弈可参见张维迎《博弈论与信息经济学》导论,上海三联上海人民出版社,1996 4参见《博弈论基础》P71,Robert Gibbens 著,高峰译,中国社会科学出版社,北京,1999
5《经济史中的结构与变迁》P225-226,Douglass North 著,陈郁罗华平等译,上海三联上海人民出版社,1994
6《比较制度分析》P12,青木昌彦著,周黎安译,上海远东出版社,上海,2001
7《比较制度分析》P24
文讨论公共品的提供问题,切合“共用资源域”(Commons Domain):在该域内的参与人集合
是由那些使用共用资源的个人构成的,共用资源是任何参与人都可获得的(或由他们联合生产提供的)资源。
其实“宿舍清洁”这种公共品更侧重于“非排他性”,于是“共用资源”还不够清晰的话,不妨引用“Common-Pool Resource”,指一个自然的或人造的资源系统(resource system)足够大以至排除潜在的获利者获利是相当费事的。
9这里没有提到德姆塞茨的“非竞争性”。
青木昌彦在书中举的德川时期日本村庄灌溉系统的例子10。
灌溉系统是一个非排他性的公共品,一旦村民在村民在灌溉系统建成之后成了使用者,即便他在集体劳动中偷懒,也很难不让他接近水源,以示处罚。
在出钱修建灌溉系统时或者集体劳动中就不可避免地出现机会主义者,如果人们预测到这一结局,很可能在最初出现囚徒困境村民出钱的激励很小,从而个体理性导致集体非理性,灌溉系统不会修建。
但实际上灌溉系统修建好了,而且大多数村民得到了好处。
为什么呢?因为“抬头不见低头见”的村民不仅进行“灌溉博弈”,还要进行广泛的“社区的交换博弈”,联结两个博弈和汇合不同的激励约束有助于放松激励约束。
经过一些简单的数学运用,青木昌彦证明了这个策略是重复博弈的均衡:⑴如果在一个博弈中选择了偷懒,那么在灌溉博弈中就会选择偷懒,在社区的交换博弈中选择不合作;否则在灌溉博弈和社区的社会交换博弈中均采取合作;⑵对于任何在灌溉博弈中曾经偷过懒的农户,其他农户一律将他驱逐出所有未来的社会活动,而且只驱逐那些偷过懒的农户。
也就是说,尽管存在技术上的非排他性,禁止偷懒者参加村庄其他日常社会、政治和经济生活,仍然可以构成一种可信
..的威胁。
做个类比,清洁博弈显然只是宿舍成员众多博弈(青木昌彦两个博弈只是一个简化,重要的是关联博弈的精髓)中的一个。
比如,涉及“共用资源域”的还有打水博弈、学习博弈(学习优秀者的作业往往成为共用资源);还有“社会交换域”博弈,比如聚餐博弈(AA制已然形成一种习俗了);还有一些类似处于“交易(经济交换)域”中的博弈,该类型的域是由那些私人拥有可以自由交换或处置的物品的个人构成,比如使用电脑博弈(拥有个人电脑的宿舍成员提供墨水使用权一定程度上可以换取别人的好感,从而作为贡献获得在其他一
些博弈中的一些优惠或者“特权
..”);等等。
现在看来,清洁博弈是绝对的简单了,尽管同学
们打扫清洁的愿望
..与我在最前面提到的清洁偏好有关(Cl>E还是Cl<E),但又由于害怕承担全部的努力(E)甚至考虑到另外一些因素从另外一些博弈中为自己寻找一些特权;结果人人都这么想,也就迟迟不能形成打扫清洁的局面。
有人打扫清洁的可能性在于,突然有一天一个人意识到他打扫清洁可以获取的同学的好感是如此具有吸引力,而不打扫清洁将是取同学的好感是如此的可怕,那么这个同学也就率先拿起了扫帚;这是其他同学也将很快意识到这一点,从而跟着拿起扫帚,共同提供“宿舍清洁”,因为如果在这时还眼睁睁的看着别人
动手的话,将被直接
..的观察为“不关心他人”“冷漠”“懒惰”,这不利于这个同学在以后的其他博弈(如社区的社会交换博弈)中的影响力,甚至可能被开除掉。
但我的分析还是丢分了,它建立在个人自利的基础(个人收益大于个人成本成为做出决定的标准)之上。
青木昌彦提供的灌溉博弈和社区的社会交换博弈之所以最终能达到合作的结果,是因为社区的社会交换博弈中开除偷懒者是可以置信的。
但根据这种理论,这个结果
只是一个巧合
..。
如果社区的社会交换博弈的“开除”是不可置信的,而且是根本不可能的,那又怎么办呢?经济学家可能会去寻找其他的一个博弈,尽管找到的可能性很大。
不同程度的利他主义,这个人人都有的或者人人应有的美德,被偷懒的经济学家省去了,从而自己造出很多无稽之谈。
在乡村中,“鸡犬之声相闻,老死不相往来”,邻里之间的感情如果说不够9Elinor Ostrom,1999,Governing the Commons P30,Cambridge University Press
The term “common-pool resource” refers to a natural or man-made resource system this sufficiently large as to make it costly ( but not impossible ) to exclude potential beneficiaries from obtaining benefits from its use.
身后以至于很少有人利他的话,那么在宿舍中朝夕相处的成员的利他主义倾向应该高很多。
从一次性的博弈“囚徒困境”到“无限重复的阶段博弈”,经济学家在寻找合作的理由。
但是无限次的重复很少,一般是“有限次重复博弈”,这根据“倒推法”是无法得出合作解的:在博弈的最后一轮中,没有人偏离自利目标,因为没有下一轮了;既然如此,在倒数第二轮,也不会有非自利行为的发生;依此类推,在整个博弈的各个轮次中,都不会有偏离自利目标的选择。
但是实验经济学家的结论异常醒目,他们的工作表明“有限重复的囚徒困境”中局中人总是选择不合作未免失之武断了。
11所以传统的博弈论的解释力确实有限。
森的研究表明,合作行为可能存在着另外一种解释。
不仅在无重复
...的博弈中,而且在无重复的现实生活中,合作行为都是经常可见的。
对于这一现象,一种可能的解释是,一个人的真正目标并非其正在努力最大化的那一目标。
同时,下面的这种情况也有可能存在,即人们清楚的理解他们的目标所在,并希望实现自己目标最大化,但是,由于认识到了成功的相互依赖性,从而关心他人的目标。
12森继续写道,博弈论的语言——还有经济学理论的语言——使得对于这类行为模式的研究变得十分困难,这是因为他们很容易误导人类,使其认为无论一个人表面上最大化的是什么,基于一个简单的解释,都必定是他的真正目标。
但实际上,为了一般的追求个人目标而接受特定的社会准则(我觉得这就是每个博弈者做出判断所依据的常识)的工具价值时,一个人的真正目标与其最大化的目标之间的区别就会变得模糊起来。
13而经济学者发明了几个词语,把这两个目标截然的分开了,到头来弄得自己莫衷一是,甚至泯灭了最基本的道德,正如“建议者-反应者”实验,作为建议者,经济学学生提出的留给自己的钱要比非经济学的学生要多:$6.15>$5.44。
14学了经济学的机会主义等概念,连最初有的公平的观念都没有了,不能不说是有缺陷的经济学误人子弟。
如果一个人从社会策略的角度进行行为选择,关心“囚徒困境”中他人的目标,那么,采取合作的策略就具有一定的适宜性:他对我们所以人各自的目标都更为有利。
于是乎,继续保持和宣传利他主义的“意识形态”是非常有意义的,也是符合大多数人所能够接受的常识的。
我们大约都不会随便乱扔垃圾,不会向车窗外扔酒罐,经济学家的做法复杂化了,他们要计算我乱扔垃圾的成本和找到一个垃圾箱(或需要找很久才能找到)的成本孰大孰小,显然是后者大,但是我为什么不乱扔垃圾呢,甚至清洁工根本无法抓到我对我罚款?这就是我从家庭、教育和我自身的生活体验中获取的意识形态对我的行为的制约,以致我不会做出搭便车的行为来,事实上,通过意识形态,我可以认识到我所处的环境,并被一种“世界观”导引,从而使决策过程简单了15,降低了“交易成本”。
实际上“任何一个
成功的意识形态必须克服搭便车问题,其基本目的在于促进一些群体不再按有关成本与收益
.......
的简单的、享乐主义的和个人的计算
................来行事。
…………如果一个美丽的乡村被认为是公共“物品”,个人就不会随便抛扔杂物。
”16正如North指出,如果没有一种明确的意识形态理论或知识社会学理论,那么,我们在说明无论是资源的现代配置还是历史变迁的能力上就存在着无数的困境。
在解释“宿舍清洁”便陷入了这种困境,我们成员的问题在于在打扫清洁这一具体博弈是还未形成“意识形态”,使每个人不需要太多的计较,而是看到宿舍脏了就义不容辞的拿起扫帚,打扫清洁。
问题的症结不在于我们是如此的聪明而计算出了搭便车比自己动手打扫清洁更为合算,而在于一个字:懒。
这根本不需要经济学来作出任何说明。
学校需要做的也不应是高高在上、
11《当代西方财政学》P118,刘宇飞著,北京大学出版社,北京,2000
12《伦理学与经济学》P85,Amartya Sen 著,王宇王文玉译,商务印书馆,北京,2000
13同上书,P86
14《当代西方财政学》P118-119,刘宇飞著,北京大学出版社,北京,2000
15《经济史中的结构与变迁》P53,Douglass North 著,陈郁罗华平等译,上海三联上海人民出版社,1999
每月初定期检查了事,而应“众恶之,必察焉;众好之,必察焉”17,合适的对同学们加强道德教育、教化。
而不打扫清洁也折射出我们作为一个人.的基本价值观和道德修养似乎出了故障,这是涉及当代大学生和青年普遍的缺乏道德优越感,提高一点可以归结到“信仰”,的大问题。
因此我们需要做的是“正心、修身”,不以善小而不为。
让我以圣人教诲来结束这篇论文:
子路问政,子曰:“先之,劳之。
”
请益,曰:“无倦。
”18
[参考文献]
1、孔子:《论语》;
2、青木昌彦:《比较制度分析》,上海远东出版社,2002年;
3、罗伯特·吉本斯:《博弈论基础》,中国社会科学出版社,1999年;
4、张维迎:《博弈论与信息经济学》,上海三联书店,1996年;
5、道格拉斯·C·诺思:《经济史中的结构与变迁》,上海人民出版社,1994年;
6、阿马蒂亚·森:《伦理学与经济学》,商务印书馆,2000年;
7、刘宇飞:《当代西方财政学》,北京大学出版社,2000年。
17《论语⋅卫灵公》。