博弈论论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
制度与博弈
摘要:制度应该被视为博弈规则――“制度是社会的博弈规则,或严格地说,是人类设计的制约人们相互行为的约束条件。
用经济学的术语说,制度定义和限制了个人的决策集合”。
制度不仅可以把不同的不交互的主体联系起来使之具有交互关系,而且可以改变博弈主体的收益状况,不同的制度设计,博弈的结果也不尽相同。
关键词:制度博弈企业
假设一条河流两侧有两家企业A和B。
A企业的利润为a元,B企业的利润为b元,(该利润不包括排污处理费用)排污处理费为利润的n%
制度一假设此时A. B企业排放污水不会受到处罚。
(非博弈行为)
A B 排放污水处理污水
排放污水(a b)(a b-n%b)
处理污水( a-n%a b) (a-n%a b-n%b)
分析:在没有制度的干预下,AB企业之间无利益交互,所以企业追求利润最大化,A B企业均采取排污水行为。
制度二假设现在开始对排污水的企业罚款,罚款为利润的m%。
(非博弈行为)
A B 排放污水处理污水
排放污水(a-m%a b-m%b)(a-m%a b-n%b)
处理污水(a-n%a b-m%b) (a-n%a b-n%b)
分析:此种制度的设计仍没有使双方利益交互,只是改变了企业的经济成本和社会成本,双方仍没有博弈的行为,只是各自按照利润最大化原则选择。
(1)若排污处理费百分比大于罚款百分比即n>m,那么该种制度对企业排污处罚力度过小,虽然排污的企业会增加经济成本减少社会成本,但增加的经济成本明显小于社会成本,企业排污的行为仍然有利可图,此时AB企业仍然选择(排污水排污水)(2)若排污处理费百分比小于罚款百分比即n<m,那么该种制度对企业排污处罚力度较大,使企业排污行为导致企业经济成本的增加明显大于社会成本的减少。
企业均选择(处理污水处理污水)注(企业成本由经济成本+社会成本,经济成本是企业需要承担的,但社会成本是社会承担的,换言之企业成本一定时,经济成本的增加和社会成本的减少会导致企业利润的减少,企业经济成本的减少和社会成本的增加会导致企业利润增加,其实经济成本就是社会的利益或资源)
制度三假设现在开始对排污水的企业罚款只有一方排污水,罚款百分比为利润的g%,双方都排放罚款百分比为各自利润的f% (g%<n%<f%)(注:g与f不相等,因为g 与f相等若都大于n则是上述制度二的情形,若都小于n则是制度一的情形)(完全信息静态博弈)
A B 排放污水处理污水
排放污水(a-f%a b-f%b) (a-g%a b-n%b)
处理污水(a-n%a b-g%b) (a-n%a b-n%b)
分析:此种制度使AB企业利益交互起来,使得对方的选择影响自己的决策,但此种情形是一种混合策略博弈,即双方都有两种最优的纯策略,也就说双方都不会采取单一的纯策略行动,双方的行动都是先观察对方的策略然后采取针对性策略。
的具体分析涉及双方各种策略的概率,分析如下:
概率y 1-y
A B 排放污水处理污水
x 排放污水(a-f%a b-f%b) (a-g%a b-n%b) 1-x 处理污水(a-n%a b-g%b)(a-n%a b-n%b)
分析:(1)支付最大化法,A 企业的期望效用函数V A =xy(a-f%a )+x(1-y)(a-g%a)+(1-x)y(a-n%a)+(1-x)(1-y)(a-n%a)=xya%(g-f)+a-na%+xa%(n-g) 对上述效用函数求导得到A 企业最优化的一阶条件为:d V A
/dx=ya%(g-f)+a%(n-g)=0 →y=(n-g)/(f-g) 同理:V B =xy(b-f%b)+x(1-y)(b-n%b)+(1-x)y(b-g%b)+(1-x)(1-y)(b-n%b)=.xya%(g-f)+b-nb%+yb%(n-g) 对上述效用函数求导得到A 企业最优化的一阶条件为:d V B
/dy=xa%(g-f)+b%(n-g)=0 →x=(n-g)/(f-g) (2)支付等值法:
A 企业选择排放污水策略 A 企业选择处理污水策略
x=1 x=0
V A (1,y)=y(a-f%a) +(1-y)(a-g%a) V A =(0,y)=y(a-n%a)+(1-y)(a-n%a) 如果一个混合策略是B 企业的最优策略,那么对A 企业来讲选择排放污水与处理污水是无差异的即:V A (1,y)=V A =(0,y) →y=(n-g)/(f-g)
同上,如果一个混合策略是A 企业的最优策略,那么对B 企业来讲选择排放污水与处理污水是无差异的即:V B (x ,1)=V B (x,0)
→x=(n-g)/(f-g) (3)反应函数法:
A 企业的期望效用函数是
V A =xy(a-f%a )+x(1-y)(a-g%a)+(1-x)y(a-n%a)+(1-x)(1-y)(a-n%a)=xya%(g-f)+a-na%+xa%(n-g) =ax%[y(g-f)-(g-n)]-na%
B 企业的期望效用函数是
V B =xy(b-f%b)+x(1-y)(b-n%b)+(1-x)y(b-g%b)+(1-x)(1-y)(b-n%b)=.xya%(g-f)+b-nb%+yb%(n-g)
0 y>(n-g)/(f-g) 0 x>(n-g)/(f-g) x= [0, 1] y=(n-g)/(f-g) y= [0, 1] x=(n-g)/(f-g) 1 y<(n-g)/(f-g) 1 y<(n-g)/(f-g)
制度 四 现在对排放污水企业罚款,只有一方排放污水,罚款比例为利润的h%,并且将此罚款奖励给没排放的企业,若双方都排放污水,罚款比例为利润的m% ( h%<n%<m%和n%<h%<m%两种情形)(完全信息静态博弈)
x y x=(n-g)/(f-g) y=(n-g)/(f-g)
A B
排放污水 处理污水 排放污水
(a-m%a b-m%b) (a-h%a b-n%b+h%a ) 处理污水 (a-n%a +h%b b-h%b ) (a-n%a b-n%b ) 分析:若 h%<n%<m% 则A B 企业的策略是混合策略博弈(排放污水 处理污水) (处理污水 排放污水)这时情形与制度三相似进一步分析略,若n%<h%<m%则A B 企业是纯策略完全信息静态博弈,双方选择的策略均为(处理污水 处理污水)。
假设市场上有1,2两个寡头垄断厂商,他们生产相同的产品,消费者从中察觉不出任何差异。
市场出清价格由两家厂商决定。
厂商1的产量为q1厂商2的产量为q2,则市场的总产量Q=q1+q2。
设P 为市场出清价格,则P 是市场量为Q 的函数,即反需求函数P=P (Q )=8-Q ,再假设两家厂商无固定成本,且边际成本相等。
C1=C2=2,即他们分别生产产量为q1,q2的成本为2q1,2q2。
最后两个厂商各自决定各自的产量以达到各自的利润的最大化,即在决策前不知道另一家产量。
制度一 市场上没有统一的组织协调两家垄断行为,任由其行动。
分析:q1,q2是连续的,所以厂商1和2可选择的策略是无限的,故这是非有限博弈,该博弈的两博弈方的得益U 是各自的利润,即各自的销售收益减去各自的成本,根据给定的情况应分别为;U1=q1p(Q)-c1q1=q1[8-(q1+q2)]-2q1=6q1-q1q2-q1^2 U2=q2p(q)-c2q2=q2[8-(q1+q2)]-2q2=6q2-q1q2-q2^2 双方都要使自己润最大化,两个人的得益也都取决于对方的决策,由于本博弈是个非有限博弈,这里用反应函数法。
这样,对于某个参与人来说就是先要在假定其他参与人策略确定的情况下寻找使自己得益最大化的最优策略。
这里先考察厂商1选取q1的最佳策略,厂商1可以根据厂商2的每一个可能的产量q2找到自己的最佳反应策略q1*即厂商1有一个最佳反应函数q1*(q2)对厂商2也同样可以求得厂商2对厂商1的每一个可能的策略q1的最佳反应函数q2*(q1)。
这样两个厂商就可以找到纳什均衡点。
Max U1(q1,q2)=max(6q1-q1q2-q1^2) ӘU1/Әq1=6-q2-2q1 q1*=3-q2/2 maxU2(q1,q2)=max(6q2-q1q1-q2^2) 分别求偏导 令=0 q1>=0, q2>=0 ӘU2Әq2= 6-q1-2q2 q2*=3-q1/2 反应函数曲线图如下:
(6,0) (0,3) q2 q1*
(3,0) (0,6) q2* q1 (2,2 )
结果分析:
这两个厂商根据自身利益最大化原则同时独立作出产量决策的古诺模型均衡结果。
从社会的角度看效率。
在上述例子中社会的总产量Q=q1*+q2*=4,此时两家厂商的利润U1=U2=6*2-2*2-2^2=4,两家厂商的利润和为8;市场出清价格为P=8-4=4
制度二市场上有统一的组织协调两家垄断行为。
从另一个角度看,市场上存在统一的协调者比喻像卡特尔,辛迪加,托拉斯那样的结盟。
如果两家厂商联合起来像一个垄断者一样在市场上行动,以总体利益最大化为目标来考虑市场的最佳产量。
首先根据市场条件求得实现最大总利润的总产量。
设总产量为Q总收益U=QP(Q)-CQ=Q(8-Q)-2Q=6Q-Q2。
令U的一阶导数为0,求得总收益最大化产量为Q=3.,最大总收益为9,将此结果与两家厂商独立决策,只追求自身利益的博弈结果相比,总产量较少,而利润较高。
从这个结果可以知道为什么在制度一下当一家厂商产量为0时,另一家厂商的最佳策略是3。
因为此时实际上就是一家在垄断。
其当然要将产量压低,保持最大化利润。
而当对方产量大于6是,其最佳策略为停产。
因为此时市场已饱和,再生产已无利可图,所以理性的厂家应停产。
从这一结果看我们还可以得出结论,从两家厂商的总体来看,进行合作,联合起来决定产量,对其效率更高。
此时双方各生产使总体利益最大化产量的产量的享到一半1.5,而可以分比双方不合作,之开哦率自身利益独立决策时更高的利润4.5。
但是,这种合作尽管双方都了解其好处,但如果没有足够强制力的话,即这种制度保证。
这种合作是不可能实现的,即这个合作是不能自动实现。
因为(1.5,1.5)不是纳什均衡,即再这样的策略组合下,任何一个理性的参与人都有足够的积极性通过提高自己的产量来增加自己的收益。
在这个例子中,假定有一方采取合作态度,固定产量为q1=1.5,那么根据反应函数,另一方有足够的积极性将产量定在q2=3-1.5、2=2.25,此时可以获得更大利益U2=6*2..25-1.5*2.25-2.25^2=5.0625,大于遵守协议的得益而另一方得益U1=6*1.5-1.5*2.25-1.5^2=3.375,小于不合作得益4,所以双方尽管都知道合作的好处,但最终都不得不接受不合作的结果。
这就是集体的非理性,也就需要制度约束。
总结
在人类社会的大棋盘上,每个个体都有其自身的行动规律,和立法者试图施加的规则不是一回事。
如果它们能够相互一致,按同一方向作用,人类社会的博弈就会如行云流水,结局圆满。
但如果两者相互抵牾,,那博弈的结果将苦不堪言,社会在任何时候都会陷入高度的混乱之中。
制度就如同博弈双方游戏的规则,这个规则可以使双方利益交互起来,使毫不相关的主体的行为成为博弈行为,也可以改变博弈的类型和博弈的结果。
参考文献:
郑伟林《云南财贸学院学报:经济管理版》2002年第3期
关越《中国流通经济》2013
黎秀蓉,刘光岭 - 《经济问题》2008年10期。