MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5、如何走出囚徒困境?
Page 35
从以上例子我们可以看出:生活中存在着大量的“囚徒 困境”事例,有很多对我们的生活与合作不利。那么怎样才 能有效避免囚徒困境的出现,从而改善我们的生活呢?
囚徒困境延伸——合作:团体理性
Page 36
若要不是经济学,理性的选择,反而是选择优势策略
(次优的结果),即帕累托效率。
Page 32
如果其他牧民约束放牧规模,我单独一家人过度放 牧不会破坏广褒的牧场,但自己却获得了高额的收益。 因此,任何一位牧民的结论都会是:无论其他牧民是否 过度放牧,我选择“约束自己的放牧规模”都是劣战略, 从而被剔除。大家最终都会选择过度放牧,结果导致草 地消失,生态破坏。
内蒙古草原的沙漠化
信息和动态分类
Page 16
完全 信息
静态
完全信息静态博弈; 纳什均衡; Nash(1950)
动态
完全信息动态博弈; 子博弈精炼纳什均衡;泽尔腾 (1965)
不完全 信息
不完全信息静态博弈;贝叶斯纳 什均衡; 海萨尼(1967-1968)
不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
3、囚徒困境结论
Page 20
结论1 不要选择严格劣势策略,因为选择优势策略,我们每次
都能得到更好的收益. 结论2
汝欲得之,必先知之。 结论3
站在别人的立场上去分析他们会怎么做。
思考1
Page 21
如果你是个“恶魔饭桶”,你的对手是个“愤怒天使”,这种情 况下我们该怎么办?
博弈论信息整理表格如下
信息甄别 道德风险和逆向选择
Page 2
游戏 选数字
Page 3
从1到100之间选择一个号码填到下面 的方框内,不要让你同桌看到,我们会计 算全班的平均数,谁选的数字最接近平均 数的三分之二,谁就是赢家,赢家的奖金 是5分的平时分减去他所选数和平均数的 三分之二之差的百分之一。
Page 4
为了让大家都听明白,我举一个例 子。三个同学分别选了25,5,60,于是 25+5+60=90平均数是30,平均数的三分 之二是20,选25的是赢家,他的奖金是 5分减0.05分,就是4.95分。
MBA必修课
Page 1
博弈论
(Game Theory)
目录
第Ⅰ部分 博弈论导论 案例 诺贝尔经济学奖与博弈论
第Ⅱ部分 博弈论与纳什均衡 基本概念(策略、局中人)与 分类 囚徒困境及延伸(合作博弈、口头承诺) 智猪博弈及延伸 纳什均衡、零和博弈
第Ⅲ部分 博弈论与其他三类博弈 第Ⅳ部分 博弈论与信息(与机制设计)
这就是我们看到的为什么大多数路、桥等公共设施 都是由政府出资修建的原因。同样的道理,国防、教育、 社会保障,环境卫生等都由政府承担资金投入,私人一 般没有积极性承担这方面服务的积极性和能力。
案例(2)苏格兰的草地消失了
Page 30
在18世纪以前,英国苏格兰地区有大量的草地,其 产权没有界定,属公共资源,大家都可以自由地在那里 放牧。草地属于“可再生资源”,如果限制放牧的数量, 没有被牛羊吃掉的剩余草皮还会重新长出大面积草场, 但如果不限制放牧规模,过多的牛羊将草吃得一光二净, 则今后不会再有新草生长出来,草场就会消失。
“搭便车”不出资但仍然可以使用修好的路 的另一户人家获得支付3-0=3,见下表。
修 甲
不修
修路博弈


不修
1,1
-1,3
3,-1
0,0
Page 28
Page 29
我们看到,对甲和乙两家居民来说,“修路”都是 劣战略,因而他们都不会出资修路。
这里,为了解决这条新路的建设问题,需要政府强 制性地分别向每家征税2单位,然后投入4单位资金修好 这条对大家都有好处的路,并使两家居民的生活水平都 得到改善。
解决方案
Page 6
44×2/3=29,所以不能选择29-44之间的数。现实中 有13个左右选择了30-34区间。选择这个数区间的学生 想法是1-100平均数是50,50×2/3=33,所以选择33附 近的数可能比较接近。这些学生低估了同班同学的智商。 29×2/3=19,所以不能选择19-29之间的数。现实中 有12个选择了。选择这个区间的学生就像螳螂捕蝉中的 螳螂,却没有想到还有更多的黄雀在后。 ......
非合作与合作
Page 15
博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈 理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束 力的协议。倘若不能,则称非合作博弈Non-Cooperative Game。
Collective Rationality, 是效率、公平、公正。
非合作博弈主要研究人们在利益相互影响的局势中如何选择策略使 得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效 率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也 就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量 均衡。
Page 31
由于草地的产权没有界定,政府也没有对放牧作出 规模限制,每家牧民都会如此盘算:如果其他牧民不约 束自己的放牧规模,让自己的牛羊过多地到草地上吃草, 那么,我自己一家约束自己的放牧规模规模对保护草场 的贡献是微乎其微的,不会使草场免于破坏;相反,我 也加入过度放牧的行列,至少在草场消失之前还会获得 一部分短期的收益。
Page 12
参与人在给定信息集的情况下的行动规则,它规定参与 人在什么时候选择什么行动。
战略与行动:战略是行动的规则而不是行动本身。 在静态博弈中,战略和行动是相同的。 战略必须是完备的,要给出参与人在每一种可想象得到 的情况下的行动选择。
5、支付payoff(效用utility)
Page 13
因为不管你的对手怎么定价,你总有想削弱他们的动机。如果双 方都采取这种策略,那么价格将会下降到边际成本,行业利润将会遭 受损失。如果两家企业相互削弱,最终会压低价格,这对消费者有利, 但对企业不利。
思考4
Page 25
假如有一个可利用的公共资源,比如是个 鱼群,或者是新鲜空气,这其中也会导致囚徒 困境。你有过量捕鱼的动机。为什么呢?
Page 33
Page 34
渤海中的鱼愈来愈少了,工业化中的大气及河流污 染,森林植被的破坏等。解决公共资源过度利用的出路 是政府制订相应的规制政策加强管理,如我国政府规定 海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止 捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并 对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼, 保护幼鱼的生存。又如在三峡库区,为了保护库区水体 环境,关闭了前些年泛滥成灾的许多小造纸厂等。
在一个特定的战略组合下参与人得到的确定效用水平, 或是指参与人得到的期望效用水平。
均衡equilibrium:指所有参与人的最优战略的组合。
囚徒甲
坦白 抵赖
囚徒乙
坦白
抵赖
-8,-8
0,-10
-10,0
-1,-1
二、分类
•合作与非合作 •信息、动态
完全信息静态、动态 不完全信息静态、动态
Page 14
解决方案
Page 7
这么一直迭代下去,理论上如果所有学生都是 理性人。平均数应当是1。应该说选择了1的学生都 看出了这个博弈的窍门。但是他们的选择不是最接 近平均数的。因为在现实中不可能所有人都是理性 人。
最终12是最接近平均数2/3的数。
案例——囚徒困境
Page 8
两个嫌疑犯甲和乙作案后被警察抓住,分别关在不同的 屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。
警察将两人分别置于两间房间分开审讯:如果两人都抵 赖,各判刑一年;如果两人都坦白,各判八年;如果两人中 一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
如何选择?
一、博弈的要素
Page 9
1、参与人 players
一个博弈中的决策主体,他的目的是通过选择行动 (或战略)以最大化自己的支付(效用水平)。参与人可能 是自然人,也可能是团体,如企业,国家等。囚徒困境中甲 和乙是参与博弈的人,称为“局中人”。
Page 11
参与人有关博弈的知识,特别是有关自然的选择,其他 参与人的特征和行动的知识。
表中每一个小方格内的数字被称为局中人的支付,其中 左边的数字代表甲的支付,右边的是乙的支付。表1中的双变 量矩阵称为博弈支付矩阵。 囚徒乙
坦白
抵赖
囚徒甲
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
4、战略strategies
如果其他国家拥有这个鱼群,假设这个鱼群在大西洋,如果其 他国家打算正常捕捞,你应该也会正常捕捞。如果其他国家不打算 减少捕捞量,那么你现在就想把鱼捞出来,因为没准明天就会没鱼 可捞了。
思考5
Page 26
全球变暖和碳排放问题 大家能理解碳排放也是一种囚徒困境吗?
4、囚徒困境案例
Page 27
(1)政府要负责修建公共设施
恶魔饭桶
α
β
愤怒天使 α 0,0 -1,1
β 3,-3 1,1
21
Page 22
大揭秘
正确答案选 ,因为 是优势策略, 是
劣势策略。
22
思考2 市场进入阻挠(静态)
Page 23
在位者
默许
斗争
进入 进入者
不进入
40,50 0,300
-10,0 0,300
思考3
Page 24
价格竞争
两家互相打价格战的企业,可能会陷入囚徒困 境。为什么?
解决方案
Page 5
假设每个人都选择100,平均数100×2/3=66.66。 所以不能选择67-100之间的数(严格劣势策略)。现 实中有两名学生选择了。 剔除了step1中的严格劣势策略后,重复迭代, 66×2/3=44。所以不能选择44-67之间的数(弱劣势 策略)。现实中有四名学生选择了。
三、囚徒困境详解和延伸
1、囚徒困境详解
Page 17
囚徒乙
S i 称为占优策略,或占优于其他策略 坦白
抵赖
囚徒甲 坦白 -8,-8 0,-10
抵赖 -10,0 -1,-1
占优策略均衡 囚徒甲
坦白 抵赖
囚徒乙
坦白
抵赖
-8,-8
0,-10
-10,0
-1,-1
Βιβλιοθήκη Baidu
Page 18
每个参与人组成的优势策略称为占优策略均衡。 甲和乙都不会选择劣战略“抵赖”,称为“剔除劣战略的占优战 略均衡”。其中“坦白”是占优于(优于)“抵赖”的占优战略。
2、囚徒困境特点
Page 19
•利己、理性
•非合作
•存在严格劣策略
囚徒困境假定每个参与者(即“囚徒”)都是利己的, 即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他 策略要低的话,此策略称为“严格劣势”,理性的参与者绝 不会选择。另外,没有任何其他力量干预个人决策,参与者 可完全按照自己意愿选择策略。
重要的是:每个参与人必须有可供选择的行动和一个 很好定义的偏好函数。不做决策的被动主体只能被当作环境 参数。
2、行动 ACTIONS OR MOVES
参与人在博弈的某个时点的决策变量。 ( 坦白)
N个参与人的行动的有序集称为行动组合 (坦白,抵赖)
Page 10
3、信息 information
设想有两户相居为邻的农家,十分需要有一 条好路从居住地通往公路。修一条路的成本为4, 每个农家从修好的好路上获得的好处为3。如果 两户居民共同出资联合修路,并平均分摊修路成 本 , 则 每 户 居 民 获 得 净 的 好 处 ( 支 付 ) 为 34/2=1;当只有一户人家单独出资修路时,修路 的居民获得的支付为3-4=-1(亏损)
“囚徒的两难选择”有着广泛而深刻的意义。个人理 性与集体理性的冲突,是对所有人都不利的结局。他们 两人都是在坦白与抵赖策略上首先想到自己,这样他们 必然要服长的刑期。只有当他们都首先替对方着想时, 或者相互合谋(串供)时,才可以得到最短时间的监禁的 结果。
Page 38
“纳什均衡”对亚当·斯密的“看不见的手”的原理 提出挑战。按照斯密的理论,在市场经济中,每一个 人都从利己的目的出发,而最终全社会达到利他的效 果。《国富论》中有这样一句名言:“通过追求(个人 的)自身利益,他常常会比其实际上想做的那样更有效 地促进社会利益”。从“纳什均衡”我们引出了“看 不见的手”的原理的一个悖论:从利己目的出发,结 果损人不利己,既不利己也不利他。两个囚徒的命运 就是如此。
不顾及团体利益。“囚徒的困境”问题都是个体理性和 集体理性的矛盾引起的。
以全体利益而言,如果两个参与者都合作保持沉默,两
人都只会被判刑1年,总体利益更高,结果也比两人背叛对
方、判刑8年的情况较佳。
囚徒乙
坦白
抵赖
囚徒甲
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒困境的启示
Page 37
相关文档
最新文档