经济博弈论_1__完全信息静态博弈0.1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全信息静态博弈
信息
决策需要信息,但是几乎所有需要决策的场合,我们都只 掌握着有限信息,这使得现实中往往是有限信息博弈。 完全信息:每个参与人对其他参与人的支付函数有完全的 了解。 不完全信息:每个参与人对其他参与人的支付函数不完全 的了解。
市场进入博弈
进入者决定是否进入一个新的产业,在 位者选择斗争或默许,但不知道在位企 在位者 业的成本函数是高还是低,也不知道各 默许 斗争 种战略组合下的利润水平。 40,50 -10,0 进入 进入者 在位者高成本 0,300 不进入 0,300 若进入者知道在位者是高成本还是低成本——完全信息 若进入者不知道在位者是高成 本还是低成本——不完全信息
吃掉7个包子,小猪只能吃到1个; 若大猪按,按完后跑过来,大、小猪各吃掉4个包子;
若同时按,则大猪吃5个,小猪吃3个。
如果都不去按开关,就会一起饿死。
2 智猪博弈与重复剔除劣战略均衡
按 大猪
小猪
等 2,4 0,0
按 等
3,1 7,-1
小猪有占优战略——“等” 但大猪无占优战略——因为大猪战略将随小猪战略改变 而改变。
可信的(由第三方实施的)报复和惩罚 若两囚徒是意大利黑手党成员,结果会如何? 历史上的 “人质”或“通婚”方案,以克服信任问题
“如果每个人都相信对方不会坦白,且每个人都相信对方相信 自己不会坦白,每个人都相信每个人都相信对方相信自己不会 坦白……”,则合作抵赖的结果会出现。——合作的关键是相 互的信任,以及相互信任的信任……——如何克服信任问题? 人质方案的例子:秦始皇的父亲子楚
“按”是小猪的劣战略,理性的小猪是不会选择按。 大猪知道小猪是理性的,意即知道小猪不会选择“按”
2 智猪博弈与重复剔除劣战略均衡
小猪
按 按
大猪 等 3,1
等 2,4 0,0
按为小猪 劣战略
小猪 等
大猪
按
等
2,4 0,0
7,-1
等为大猪劣 战略
排除劣策略减少了博弈的规模,得到的“新”博弈有可能又 有了其他的(对自己或对手的)劣势策略,又可以被排除。
博弈论与信息经济学
(Game Theory and Information Economics)
第2章:完全信息静态博弈
Chapter 2: Static Game of Complete Information
完全信息静态博弈
静态博弈(同时行动博弈)
所有参与人同时选择行动,而且只选择一次 如,罚点球时,守门员和对方射手必须同时决策 “同时”是一个信息概念,而不一定与日历上的时间一致 在博弈中,如果参与者在不知道对手如何选择的情况下行 动,该博弈就是静态的。
A 提供 不提供
不提供
-1,3 0,0
1,1 3,-1
NE: (不提供,不提供)
集体行动的障碍:个人最优选择从社会整体的角度看并不 是最优的。社会最优结果是(提供,提供)——“大家的事 情反而无人管”(英国历史学家麦考莱)
1 囚徒困境与占优战略均衡
价格战
市场中常见现象,如旅游、机票、家电。
中国的几个生产彩电的寡头厂商于2000年合谋成立“彩电厂 家自律联盟”以求将彩电价格维持高位。 双方合作制定较高的价格, 彩电价格能维持高位吗? 那么都可获得较高利润。 B 但是这些联盟处于利益驱 降价 不降价 动的“囚徒困境”中,双 不降价 0,0 -100,80 赢成为泡影。企业之间五 A -50,-50 花八门的价格联盟总是非 降价 80,-100 常短命,道理也就在于此
囚犯两人都从利己目的出发,最终导致结果损人不利己, 合作没有产生。 "囚徒困境"是典型的非合作博弈的范例
反之,彼此达成合作是最好的“利己策略”,但合作必须 符合黄金定律:“己所不欲,勿施于人”(前提是“人所不 欲,勿施于我”)。
1 囚徒困境与占优战略均衡
现实生活中诸多的问题和现象,都是囚徒困境问 题的翻版。 实际上,“囚徒困境”是现实生活中许多现象的一 抽象概括,有着广泛而深刻的意义。
审计师 隐瞒 实报 A
5,5 6,-1
-1,6 0,0
如一个诚实一个谎报,则诚 实者奖励0.6万,对谎报者罚 款1.1万,但谎报者得到1万贿 金
1 囚徒困境与占优战略均衡
利用囚徒困境压低供应商价格
假设:两供应商成本都为6元/件,报价都为10元/件。 策略:如果二者报价都为10元/件或8.5元/件,则从每家订 购50件;若一家报价10元/件而另一家报价8.5元/件,则从 价低者订购100件。 供应商 B 10 8.5 供应商 A 8.5 10 125,125 250,0
离散型策略静态博弈通常用支付表来表示 ——博弈的战略式表述
1 囚徒困境与占优战略均衡
从一方的角度看,选择“坦白”比选择“抵赖”好,无论他 关 于对方的选择持有何等信念。 我们就说,对于囚徒而言,“坦白”的策略是一个占优策略, 以不变应万变 或者说“抵赖”的策略是一个劣策略。
占优战略/优势策略/上策(dominant strategy)
1 囚徒困境与占优战略均衡
相互忠诚的文化或者规范:“江湖义气”/部队的“同生 共死” 组织中团队生产面临的囚徒困境问题的轻重程度不 同。——不同的企业文化
组织克服囚徒困境的途径之一是企业文化 电视剧《亮剑》 长期关系,即博弈必须重复“多次”,人们可能为了 长远的将来利益而牺牲眼前利益,从而达成合作。
2 智猪博弈与重复剔除劣战略均衡
囚徒 A
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒 A 的支付
囚徒 B 的支付
1 囚徒困境与占优战略均衡
博弈中参与人只拥有有限个离散型的纯战略供其选择。 如篮球比赛中的运球、过人和投篮 离散型策略 另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数。如厂商定价 连续策略
0,250
200,200
2 智猪博弈与重复剔除劣战略均衡
智猪博弈(Boxed Pigs)
一头大猪和一只小猪生活在同一猪圈里,共用一食槽。 食槽的一端有一个开关,猪用嘴一拱,食槽的另一端会掉 下包子。假定按一下会掉下8个包子,而跑去按开关的猪会 耗费2个包子的能量。
如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪
1 囚徒困境与占优战略均衡
委托-代理关系中被设计的囚徒困境
囚徒困境对于人们来说是糟糕的,是应当竭力避免的? 在一些委托-代理关系中,故意创造出代理人之间的囚徒困 境有时对委托人有好处。这样的囚徒困境反而促进效率。 委托-代理关系:通常指委托人请代理人代理某件事情。其中 的关键问题是二者利益不一致,并且委托人与代理人之间存 在信息不对称。为此,需要设计一种制度(system)或机制 (mechanism) ,使代理人追求自己利益的同时也最大化委托 人的利益,如何设计这样的制度就是信息经济学研究的问题。
1 囚徒困境与占优战略均衡
团队生产中的偷懒
假设团队中10名员工,每人选择“努力”都要承担成本1 元,同时为团队的预期产出增加2元;每人偷懒则无须付 出成本,也不会增加团队预期产出。 如果其他人努力,自己偷懒可以获得好处;若别人偷懒, 则自己更应该偷懒,因为自己努力付出成本1元,但为团 队增加的2元产出中自己得到1/10元。
无论其他局中人如何行动,总是(严格地)优于其他战略 的战略,称为(严格)占优战略。而被(严格地)占优的战 略称为(严格)劣战略。
1 囚徒困境与占优战略均衡
参与人是理性的 囚徒A应选择坦白,同样的逻辑适用于囚徒B的选择—— 他也应选择坦白。 因而,(坦白,坦白)就是该博弈可预测的结果,也是 一个均衡(甚至是唯一的)。
在位者 默许 斗争 进入
30,80 -10,100
在位者低成本
进入者
不进入 0,400
0,400
1 完全信息静态博弈
囚徒困境与占优均衡 智猪博弈与重复剔除的占优均衡 纳什均衡 多重均衡与协调 纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性
1 囚徒困境与占优战略均衡
囚徒困境(Prisoners’ Dilemma)(塔克,1950)
个
当我们面临需要加以解析的经济现象时,首先要做的事就 是看该现象的发生机制是否可归于某种已知的博弈模型。如 可以,就可立即知道现象的本质和发生机制,并预测结果。 如不能,则很可能为博弈论经济学做出创造性贡献。
1 囚徒困境与占优战略均衡
公共品(public goods)的供给
B 公共品的理解?
提供
2 智猪博弈与重复剔除劣战略均衡
“重复剔除严格劣战略”的思路
首先找出博弈参与人的劣战略(dominated strategy)(假定 存在的话),把这个劣战略剔除后,剩下的是一个不包含已 剔除劣战略的新的博弈;然后再剔除这个新的博弈中的劣战 略;继续这个过程,直到没有劣战略存在。 如果剩下唯一的策略组合,那么该策略组合称为“重复剔除 的占优均衡”
2 智猪博弈与重复剔除劣战略均衡
例
L
A
B M
R
U
D
1,பைடு நூலகம்0 0, 3
1, 2 0, 1
0, 1 2, 0
A知道B是理性的
B L
A
剩下唯一的策略组 合(U,M)——重复剔 除的占优均衡
B M
M
B知道A是理性的,且B知 道A知道B是理性的
L
A U
U
D
1, 0 0, 3
1, 2 0, 1
1, 0
1, 2
所以,无论其他人是否努力地工作,我自己的最 优选择都是偷懒。——偷懒是每个人的占优战略
1 囚徒困境与占优战略均衡
小学生减负
政府“减负”政策:减少小学生的某些课时内容和家
“减负”之后,家长们恐怕孩子学业荒废,纷纷请家
庭 作业。但“减负”后学生反而更累了!
教。给定其他孩子“减负”好耍,我家孩子在家苦读,将 来考 上个北大清华什么的,那些“减负”好耍的孩子只能垫底 了! 给定其他孩子也在家苦读,我家孩子则更需要加倍苦学 了,否则不就会在将来的高考中为别人垫底了吗!
2 智猪博弈与重复剔除劣战略均衡
重复剔除严格劣战略
严格劣战略:不管其他参与人如何选择,参与人从选择战 略A得到的支付,严格小于选择策略B给得到的支付 称策略A是相对于B的“严格劣战略”,或者称策略A 严格劣于策略B
称策略B是相对于策略A的“严格占优战略”,或者称 策略B严格占优于策略A
在求解均衡过程中,可以剔除局中人的严格劣战略以简 化博弈,因为严格劣战略肯定不会被实施。
1 囚徒困境与占优战略均衡
预防审计合谋—双头审计
经理与审计师之间可能合谋,隐瞒不良信息
股东解决这一问题的一种做法是双头审计,请两位审计师 进行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告 问题的审计师以更多的报酬。
审计师 B 隐瞒 实报
如果都谎报,得奖金0, 但分享贿金1万
如果都诚实,则得到0
两个小偷行窃未果被抓,隔离审讯。 “坦白从宽,抗拒从严”:如果两人都 坦白则各判8年;如果一人坦白另一人 不坦白,坦白的放出去,不坦白的判10 年;如果都不坦白则因证据不足各判1 年。
坦白否?
1 囚徒困境与占优战略均衡
基于收益矩阵的模型描述: 参与人
囚徒 B 坦白 抵赖
囚徒B的可 选策略
1 囚徒困境与占优战略均衡
现实生活中其他囚徒困境的例子
曾经威胁世界整个甚至人类的军备竞赛
公共资源过度开采/公共品供给短缺
大学扩招、研究生扩招、大学贷款基建 年年都有的评优评先活动 各种资格考试广泛盛行 备受批评却日益严重的应试教育
1 囚徒困境与占优战略均衡
如何走出囚徒困境?
占优均衡
若所有参与人都有自己的占优战略,则由占优战略 组成的战略组合为占优均衡。 占优均衡并不常见,因为很多时候不存在占优战略
1 囚徒困境与占优战略均衡
两个囚徒双双选择坦白是博弈的最坏结果
“困境”
博弈双方都遵循常规智慧选择占优策略,但是这种均衡结 果所产生的支付比两人合作、都选择自己的劣战略时要低。 囚徒困境反映了个人理性与集体理性的冲突
2 智猪博弈与重复剔除劣战略均衡
例
1 U D L 0,0 2 M 1,1 对1而言,U不是D的严格劣战略 对2而言,L不是M的严格劣战略
1,1
1,1
对于某些参与者而言,无论其他参与者选择什么,如果A策略 至少和B策略一样好,而且至少在某些时候严格更好,就称策 略A为相对于策略B的弱占优策略,或称弱占优于策略B,反 之称策略B为相对于策略B的弱劣策略,或称弱劣于策略B 警告:逐次剔除弱劣势策略可能去掉了某些纳什均衡。