博弈论与政治学应用讲义

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论简史 对于博弈论的研究开始于恩斯特·策梅洛(1913)、埃
米尔·博雷尔(1921)及冯·诺伊曼(1928),后来由冯·诺伊曼和奥斯卡·摩 根斯坦(1944,1947)首次将其系统化和形式化(参照Myerson, 1991)。 随后约翰·福布斯·纳什(1950,1951)利用不动点定理证明了均衡点的存在, 为博弈论的一般化奠定了坚实的基础。
政治学应用:
例2: 贿选(由简单到复杂,逐渐完善模型)
考虑两个候选人在一职位竞选中是否进行贿选。若两人都不贿选,候选人1胜 出的概率为P,候选人2胜出的概率为1-P。贿选给候选人带来优势。候选人1 进行贿选的话其胜出的概率提高V1(导致候选人2胜出的概率降低V1 );候 选人2进行贿选的话其胜出的概率提高V2(导致候选人1胜出的概率降低V2) 博弈均衡解?
博弈的分类
行动次序
信息
静态(策略式)
动态(扩展式)
完全信息
纳什均衡
(纳什)
子博弈精练 纳什均衡
(泽尔腾)
不完全信息
贝叶斯纳什均 精炼贝叶斯纳什 衡 均衡 (泽尔腾等) (海萨尼)
二、策略式博弈和纳什均衡 策略式(normal form)表达又称为标准式表达,在这种表达中,所有
参人同时选择自己的策略,所有参与人选择的策略一起决定每个参与人的收 益。
情景的形式化表述(建模的过程)
警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。 如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供, 警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲 清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较 轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。 问:两个罪犯会如何选择(即是坦白还是抵赖)?
博弈论与政治学应用
林辉程 S131920005
一、博弈论简介 二、策略式博弈—纳什均衡
形式化建模 求解(占优、最优回应) 政治学应用
三、扩展式博弈—子博弈精炼 纳什均衡
博弈树 求解(逆向归纳) 政治学应用
四、小结
一、关于博弈论 博弈论(Game theory),是研究相互依赖、相互影
响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依 赖、相互影响的决策行为及其结果的组合称为博弈(Game)。
Player 2 不贿选 Payer 1 不贿选 贿选 加入监督、反腐因素后的博弈 信息、信念因素 P,1- P P+V1,1- P- V1 贿选 P - V2,1- P+V2 P+V1- V2,1- PV1+V2
政治学应用:
例3: 中位数投票者定理 其它:美苏争霸、军备竞赛 、政治改革、政治分赃、政党竞争……
政治学博弈论p109 田忌赛马—混合策略……引入到下篇的扩展式博弈
二、扩展式博弈和逆向归纳法求解纳什均衡 扩展式(extensive form)表达,是博弈论的另一种常用表达形式,扩
展式博弈给出了每个策略的动态描述:参与者及其可供选择的策略,行动的 顺序及结果,以及选择时所知道的信息。扩展式博弈以博弈树的图像方式来 描述。
5, 5
混合策略纳什均衡 定理(纳什):每一个有限的非零和博弈都有至少一个混合策略纳什均衡。
政治学应用:
例1: 战国联盟 Player 2 N Payer 1 N Y 0, 0 — 10,0 Y 0,— 10 5, 5
自我实施、强化 协调、说服(vs囚徒困境) (公开课p41)投资博弈(引申:协调博弈,2NE ,party,银行挤兑、美丽人生..力挽狂澜 战国 联盟说客苏秦张仪合纵连横 协调之所以能达成在于它不同于囚徒困境,他没有去说服人们采取一 个严格劣势策略)
3. 最优回应与纳什均衡
最优回应与纳什均衡
最优回应:一位参与者针对另一方的某个特定策略,选择能为自己带来最高 收益的策略
纳什均衡:如果每个参与人的策略都是对其他参与人策略的最优回应,那么 各参与人的策略组合构成一个纳什均衡。
PlaFra Baidu biblioteker 2 N Y
Payer 1
N
Y
0, 0
— 10,0
0,— 10
一个策略式博弈包含以下要素: 1. 参与人(players) 2. 参与人的策略(strategies) 3. 收益/效用(payoff/utility)
(效用理论的简单介绍,买房子的选择 定性描述与定量描述的转化 今天天气很好—晴,气温, 湿度,风速,pm2.5;大多数人都喜欢上田老师的课– 12位同学中的10人都喜欢;收益函数、期望 效用、效用最大化– Max 函数求导)
约翰·福布斯·纳什、约翰·C·海萨尼及莱因哈德·泽尔腾因为他们对博弈论的突 出贡献而获得1994年的瑞典银行经济学奖。罗伯特·J·奥曼、肯·宾摩尔、戴 维·克瑞普斯及阿里尔·鲁宾斯坦对于博弈论也做出重大贡献。
博弈的构成要素一个博弈一般由以下几个要素组成,包括:参与
人、行动、信息、策略、收益、均衡等。 1、参与人 指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人, 也可以是团体); 2、行动 指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 3、策略 指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么 行动的预先安排; 4、信息 参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及 其得益函数等知识; 5、收益 参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策 略或行动的函数,这是每个参与人最关心的东西; 6、均衡 所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博 弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参 与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是 使用博弈规则来决定均衡。
囚徒B 坦白 囚徒A 坦白 不坦白 — 8,—8 — 10,0 不坦白 0,— 10 — 1, — 1
求解策略式博弈的均衡解(博弈的三种不同解):
1. 占优策略与占优均衡 占优均衡:如果每一个参与人的策略都是占优策略,那么称这个策略的组 合为占优策略均衡。eg:囚徒博弈 2. 迭代剔除劣势策略与占优均衡(略)
相关文档
最新文档