博弈论与政治学应用讲义
十章博弈论课件

无新品
无新品 4 ,
厂商1
4
有新品 厂商2的最小收益 63,3
有新品 3, 6
2 2
, 2
25
威胁信号?
➢公司之间经常相互发出信号以表明他们的意图、动机 和目标。有些信号是威胁性的。
➢例如, A公司宣布,如果谁挑起价格战,它将坚决奉陪 到底,并宣称其规模在本行业中名列前茅,最有降价 的实力。
➢是否所有的威胁都是可信的?
33
重复博奕
在下图的价格博弈中,如果是静态博弈,厂商很容易陷 入囚徒的困境(低价,低价)。但如果博弈可以无限 重复下去,则厂商的最佳策略是“以牙还牙”。这样, 考虑到对手会以牙还牙,从长远和整体来看,降低价 格不会有什么好处,博弈可能达到合作的结果。
厂商2
低价
高价
低价 10, 10
100 ,-50
第十章 博奕论
通过前面分析可知,寡头想达到垄断 的结果,需要进行合作,而合作往往 难以维持。其均衡是博弈的结果。 博弈论:研究人们在各种战略情况下 如何行事。
1
囚犯的两难处境
李四
坦白
抵赖
张三 坦白 -8 ,-8
抵赖 -20 ,0
0 ,-20 -1 ,-1
2
红与黑的游戏
MAX:profit
红,红 -3, -3 黑,黑 +3,+3 红,黑 +5,-5
• 全部相互了解即为完全信息博弈; • 否则是不完全信息博弈
13
五、博弈的均衡概念
• 博弈方的不同策略将导致各种不同的均衡,而均 衡的特征又与博弈方的行为假设有密切关系。
• 首先分析静态的非合作的博弈,并且对博弈双方 的行为作出以下假设: ①假定博弈双方是理性的 ②假定博弈双方具有完全的信息 ③假定博弈双方独立地进行决策
博弈论本科讲义

在中观经济研究中,劳动力经济学和金融理 论都有关于企业要素投入品市场的博弈模型, 即使在一个企业内部也存在博弈问题:工人之 间会为同一个升迁机会勾心斗角,不同部门之 间为争取公司的资金投入相互竞争;从宏观角 度看,国际经济学中有关于国家间的相互竞争 或相互串谋、选择关税或其他贸易政策的模型; 至于产业组织理论更是大量应用博弈论的方法 (见Jean Tirole的《产业组织理论》)。
如果n个参与人每人从自己的Si中选择一个策略 siategy profile),参与人i之外的其他参 与人的策略组合可记为s-i=( s1,s2,﹍,si-1 , si+1 ,﹍, sn)。
例如田忌的某个策略s田忌=上中下,或中下上, 等等;S田忌={上中下,上下中,中上下,中下 上 ,下上中,下中上}
贷市场的过高利息。此外,阿克尔洛夫还把信 息不对称运用于解释各种社会问题,比如因为信 息不对称,医疗保险市场上,老年人、个体劳动 者的医疗保险利益得不到保障。
三、基本概念
1、参与人Players:一个博弈中的决策主体, 他们各自的目的是通过选择行动(策略)以最 大化自己的目标函数/效用水平/支付函数。他们 可以是自然人或团体或法人,如企业、国家、 地区、社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决 策后果的被动主体不是参与人,而只能当做环 境参数来处理。如指手划脚的看牌人、看棋人, 企业的顾问等。 对参与人的决策来说,最重要的是必须有
教材——P5 博弈论就是系统研究各种各 样博弈中参与人的合理选择及其 均衡的理论。
关于“经济博弈论”:
博弈论是研究人们在利益相互影响的格局 中的策略选择问题、是研究多人决策问题的理 论。而策略选择是人们经济行为的核心内容, 此外,经济学和博弈论的研究模式是一样的: 即强调个人理性,也就是在给定的约束条件下 追求效用最大化。可见,经济学和博弈论具 有内在的联系。在经济学和博弈论具有的这 种天然联系的基础上产生了经济博弈论。
第六讲博弈论课件

例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪
踩
踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
博弈论讲义完整PPT课件

如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
大学课程《博弈论及其应用》PPT课件:第二章(1234节)

博弈方2
左
中
右
上 博弈方1
下
1,0 0,4
1,3 0,2
0,1 2,0
图 2-7 划线法
博弈的相对优势策略位置在图2-7标出,策略组合{上,中}格 子中的两个数字下面都划了短线,这个格子对应的策略组合 就是由划线法得到的纳什均衡。
第四节 箭头方法
还有一种寻找纳什均衡的方法,和划线法的分析理念的出发 点不同,这种方法的思路是对博弈中的每个策略组合进行分 析,判断各博弈方是否能够通过单独改变自己的策略而改善 自己的得益,如果可以,则从所考察的策略组合的得益引一 个箭头到改变策略后的策略组合对应的得益。这样对每个可 能的策略组合都分析考察过以后,根据箭头反映的情况来判 断博弈的结果。
博弈方2
Hale Waihona Puke 左中上 博弈方1
下
1,0 0,4
1,3 0,2
右
0,1 2,0
图 2-8 箭头法
观察图2-8,在策略组合{上,中}中只有指向的箭头,没有指 出的格子所代表的就是纳什均衡。
略“上”改变的倾向,用一个竖着的箭头表示这个倾向;横 着比较后面的得益,4比2大,4比0大,博弈方2没有改变的 动力。在策略组合{上,左}中,横着比较后面,分析博弈方2 的得益,3比0大,1比0大,所以博弈方2有从策略“左”向
策略“中”和策略“右”改变的倾向,用两个横向的箭头表 示这两个改变的倾向。
在策略组合{上,中}中,竖着比较前面的得益,还是横着比较后 面的得益,博弈方1和博弈方2都没有改变的倾向。在策略组合 {上,右}中,竖着比较前面,2比0大,博弈方1有从策略“上”
向策略“下”改变的倾向,用一个竖向的箭头表示这个倾向; 横着比较后面,3比1大,博弈方2有从策略“右”向策略“中” 改变的倾向,用一个横向的箭头表示这个倾向。
博弈论导论专题知识讲座

• 正因为这么旳博弈对全部参加者存在着或大或小旳潜在成本,
怎样达成和维护互利旳合作就成为一种值得探究旳主要问题。
• 存在双赢旳博弈吗?
例2:焦点博弈 “We Can’t Take the Exam, Because We Had a Flat Tire”
博弈论所研究旳就是两个以上行为主体旳互 动决策及策略均衡。
博弈论(Game Theory) 又称为对策 论、游戏理论以及策略运筹学。它 最早由德国数学家、哲学家莱布尼
茨于1723年提出。 博弈论是研究决策主体行为发生直 接相互作用时候旳决策及谋求这种
决策旳均衡问题。
博弈论能够划分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。 纳什、泽尔腾和海萨尼旳贡献主要是在非合作 博弈方面,而且目前经济学家谈到博弈论,一
3、最带根本性意义旳原因是经济学和博弈论旳研 究模式是一样旳,即强调个人理性,也就是在给定 旳约束条件下追求利益最大化。在这一点上,博弈
论和经济学是完全一样旳。
博弈论在经济学中旳绝大多数应用模型都是在70年 代中期之后发展起来旳,大致从80年代开始,博弈论 逐渐成为主流经济学旳一部分,甚至能够说成为微观
• 也就是说,需要旳是对这么旳情况下该选什么旳预期
旳收敛。这一使得参加者能够成功合作旳共同预期旳 策略被称为焦点。e.g.心有灵犀一点通。
例2:焦点博弈 “We Can’t Take the Exam, Because We Had a Flat Tire”
• 我们无法从全部这么旳博弈旳构造中找到一般和本
质旳东西,来确保这么旳收敛。
• 某些博弈中,因为偶尔旳外因能够对策略贴标签,
大学课程《博弈论及其应用》PPT课件:第一章

• 博弈方:两个嫌疑犯A和 B。 • 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 • 收益:对应于每种策略组合,有相应的收益结果。 • 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种
情况(括号中前面是A的策略,后面是B的策略)。 • 每个策略组合对应下的A的结果,从优到劣,依次为: • (坦白,不坦白),结果是A被释放; • (不坦白,不坦白),A被判刑1年; • (坦白,坦白),各被判5年; • (不坦白,坦白),A被判8年。 • 同理,每个策略组合对应下的B的结果,从优到劣,依次为: • (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦
第一章 博弈概述
2021/11/19
第一节 海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有 月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩 的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商 贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等 。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在 沙滩上应该如何分布两个小商贩的位置呢?
• A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。
• 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择 ,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而 你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最 坏的策略。
2021/11/19
第三节 博弈论是什么
• 博弈论:就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素: • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌 疑犯面临的同样的动机。
博弈论与政治学应用讲义

政治学应用:
例2: 贿选(由简单到复杂,逐渐完善模型)
考虑两个候选人在一职位竞选中是否进行贿选。若两人都不贿选,候选人1胜 出的概率为P,候选人2胜出的概率为1-P。贿选给候选人带来优势。候选人1 进行贿选的话其胜出的概率提高V1(导致候选人2胜出的概率降低V1 );候 选人2进行贿选的话其胜出的概率提高V2(导致候选人1胜出的概率降低V2) 博弈均衡解?
博弈论能做什么
怎样算优美的理论
学术的突破
Out of clutter find simplicity From discord find harmony In the middle of difficulty lies opportunity.
Albert Einstein / 阿尔伯特·爱因斯坦
5, 5
混合策略纳什均衡 定理(纳什):每一个有限的非零和博弈都有至少一个混合策略纳什均衡。
政治学应用:
例1: 战国联盟 Player 2 N Payer 1 N Y 0, 0 — 10,0 Y 0,— 10 5, 5
自我实施、强化 协调、说服(vs囚徒困境) (公开课p41)投资博弈(引申:协调博弈,2NE ,party,银行挤兑、美丽人生..力挽狂澜 战国 联盟说客苏秦张仪合纵连横 协调之所以能达成在于它不同于囚徒困境,他没有去说服人们采取一 个严格劣势策略)
囚徒B 坦白 囚徒A 坦白 不坦白 — 8,—8 — 10,0 不坦白 0,— 10 — 1, — 1
求解策略式博弈的均衡解(博弈的三种不同解):
1. 占优策略与占优均衡 占优均衡:如果每一个参与人的策略都是占优策略,那么称这个策略的组 合为占优策略均衡。eg:囚徒博弈 2. 迭代剔除劣势策略与占优均衡(略)
国外博弈论课件lecture(20)

在博弈中,每个参与者的最优策略依 赖于其他参与者的策略选择。反应函 数描述了每个参与者的最优策略如何 依赖于其他参与者的策略选择。
应用
反应函数在经济学、政治学、社会学 等领域有广泛应用,可以用于解释市 场行为、政治选举、社会互动等现象 ,以及预测未来的发展趋势。
04
博弈策略与优化
博弈策略的分类与选择
03
承诺行动
在动态博弈中,某一参与者为了 影响其他参与者的决策而提前宣 布自己的决策。
03
纳什均衡与反应函数
纳什均衡的定义
纳什均衡:在博弈中,每个参与者都根据其他参与者的策略选择自己的最优策略 ,使得所有参与者的策略组合构成一个平衡状态,即没有任何一方愿意单独改变 自己的策略。
纳什均衡是一种非合作博弈中的均衡,强调的是个体理性与集体理性的矛盾和冲 突。
评估改革方案的可行性和效果。
国际关系中的博弈模型
国际合作
国际关系中的博弈论模型可以帮助国家间建立合作机制,促进国 际和平与发展。
冲突解决
博弈论可以为国际冲突提供解决方案,通过谈判和协商化解矛盾 和冲突。
国际组织
博弈论可以分析国际组织的作用和影响,评估国际组织的效率和 效果。
06
总结与展望
博弈论的未来发展方向
4 博弈论与其他学科的交叉研究
随着机器学习技术的不断发展,博弈论有望与机器学习 技术结合,为解决复杂的博弈问题提供更有效的解决方 案。
博弈论在各领域的应用前景
社会问题解决
商业领域
博弈论在商业领域中有着广泛 的应用,如市场竞争分析、企 业合作策略等,未来博弈论有 望在商业领域中发挥更大的作 用。
国际关系领域
国外博弈论课件 Lecture(20)
博弈论教学课件(全)

二、博弈论的经济学渊源
经济学的一些思想为博弈论提供了基础,其中最 重要的就是所谓的“理性人”。
描述理性人的工具就是所谓的理性偏好。为了方便, 我们又用效用函数(在博弈论中称为收益函数)来 表示偏好。
构成博弈论基础的一个重要的经济定理就是所谓的 理性选择原理:如果决策主体的偏好是理性的,那 么(有限)选择集中就一定存在最优选择,这个选 择可能是唯一的,也可能是多个。
定义2.1 博弈表达的基本式(或策略式)由博弈的参 与者N,策略空间S和收益函数u三个要素组成,即G = {N, S, u}。
这里需要注意的是,完全信息静态博弈在多数情况 下,策略就等同于行动,所以G={ A,u}。但严格来 讲,策略并不是行动。
我们可以通过一个例子来加以说明。
[例1] 进攻与防守
对称博弈和对称均衡能够大大节省工作量,这也是博弈论中所举例子通常为对 称博弈的原因。
对称博弈通俗说就是代表参与者身份的下标,在分析中可以省略掉而没有关系。
四、混合策略
博弈论里面最根本的问题是什么?就是均衡 的存在性。如果均衡不存在,所有的工作都 成了无用功,之所以引入混合策略,意义就 在这里,因为如果仅仅限制在纯策略的范围 内讨论博弈的话,均衡有可能是不存在的。
双方争夺一个据点,有两条进攻路线X和Y,攻方有 两个军,而防守方也有两个军,只有当守方的兵力 不少于攻方时,才能击退进攻,否则据点将会失守。
首先可知守方的防守方案(即策略)为(0,2),(1,1),(2,0),即在X线路和Y线路驻扎 军队数,同样可以到的攻方的进攻方案(0,2),(1,1)和(2,0)。容易看出,行动并非策 略,策略是行动方案。
需要注意的几个问题:
(1)表达同一个偏好的收益函数不唯一,但在 单调变换下却是唯一的。
博弈论课件

扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。
《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
经济学讲义--第12节 博弈论、博弈论的应用

这说明:如果列参与人选择c=0,那么行参与人就会使r值尽可能小,所 以r=0就是c=0时行参与人的最优反应。并且r=0一直都是行参与人 的最优反应,直到c=1/3为止。当c=1/3时,位于0和1之间的任意r值 都是最优反应。对于所有的c>1/3,行参与人的最优反应是r=1。对 于列参与人道理相同。从而可以画出两个参与人的最优反应曲线。如 图行参与人的最优反应曲线列参与人的最优反应曲线,如图3所示所 示。从图中可以看出,该博弈存在3个均衡,其中两个是纯策略均衡,
分析:对于选项A,囚犯对策的意义就在于它可以解释寡头垄断厂商的行 为,而且关键是赋予了合作与背叛具体的经济含义。比如在双头垄断 的情况下,合作可以解释为“保持索要一个高价”,背叛可解释为 “降价以争夺对手的市场”。 对于选项B,在囚犯难题中,每个囚犯都选择了自己的最优策略,所以个 人理性得到了体现;但最后的结果是可以进行帕雷托改进的,所以并 不是集体理性的选择。 对于选项C,如下图所示, 囚犯B
参与人B
左
参与人A
右 3,5
2,3
上
下
2,1
1,4
2.(判断题)一个对策若出现两败俱伤的结局,说明该对策是一个非合 作的零和对策。( ) 解析 零和博弈:在这类博弈中,博弈一方的收益等于另一方的损失,且 每一个方格中的总收益为零,这就显示了参与人的得分完全相反。 如表1中的“足球赛中的罚点球得分”博弈。 零和博弈既然要求博弈的参与者任一次行为策略的得益之和为0, 即“一方之所得即为另一方之所失”,那么在本题中,在两败俱伤 的局面下,该博弈肯定不是一个零和对策。
坦白 坦 囚 白 犯 A 抵 赖 -5,-5 -8,0 抵赖 0,-8 -1,-1
5.(上财07年选择题)下列博弈 中的混合策略均衡是( )。 A.1采取A的概率是3/7,采取B的 概率是4/7;2采取U的概率是 3/7,采取D的概率是4/7 B.1采取A的概率是4/7,采取B的 概率是3/7;2采取U的概率是 4/7,采取D的概率是3/7 C.1采取A的概率是4/7,采取B的 概率是3/7;2采取U的概率是 3/7,采取D的概率是4/7 D.1采取A的概率是1/2,采取B的 概率是1/2;2采取U的概率是 1/2,采取D的概率是1/2
请从博弈论的视角,谈谈你对政治的认识

一、博弈论的概念及其在政治中的应用博弈论是一门研究决策制定者之间相互影响关系的学科,它涉及策略、选项和结果之间的相互作用。
在政治领域,博弈论被广泛应用于分析政治行为和决策过程,探讨不同政治力量之间的竞争和合作关系。
通过博弈论分析政治问题,可以更好地理解政治决策的复杂性和局限性,为政治实践提供理论指导。
二、政治的本质和特征政治是指社会利益分配和权力运行的活动,是组织和管理社会的过程。
政治具有权力、利益、竞争和合作等特征,是社会治理和决策的重要领域。
在政治过程中,不同利益相关者之间存在着利益冲突和权力对抗,需要通过博弈来寻求最优解决方案。
三、博弈论对政治决策的启示1. 政治力量之间存在博弈关系。
不同政治力量之间存在着竞争和合作的关系,彼此之间的争斗和角力决定了政治格局和政策走向。
通过博弈论分析政治力量之间的互动关系,可以深入理解其战略决策和行为逻辑。
2. 政治决策具有复杂性和风险性。
政治决策涉及多方利益的博弈和权力的较量,容易受到外部环境和内部因素的影响。
博弈论提醒我们,政治决策需要全面考虑各方利益,平衡各种因素,谨慎权衡风险与利益。
3. 政治决策需要理性分析和有效交流。
博弈论强调了信息的重要性和决策者的理性思考。
政治决策者需要依靠科学、理性的分析方法,同时要善于在利益相关者之间进行有效的交流和协商,以达成共识。
四、博弈论在政治实践中的应用1. 利益集团的博弈。
在政治生活中,各种利益集团之间存在着复杂的博弈关系,它们通过游说、抗衡和联盟等方式来争夺资源和权力。
政治决策者需要在不同利益集团之间进行博弈分析,找到最合适的调和各方利益的方案。
2. 国际关系中的博弈。
在国际政治舞台上,各个国家之间的利益和安全存在着博弈关系。
博弈论可以帮助政治决策者理解国际政治格局,制定对外政策并应对外部挑战。
3. 政党和政治角力。
在多党制国家,政党之间的博弈是政治生活的常态。
政治决策者需要通过博弈分析来制定政党政治策略和协商政策方向。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最优回应与纳什均衡
最优回应:一位参与者针对另一方的某个特定策略,选择能为自己带来最高 收益的策略
纳什均衡:如果每个参与人的策略都是对其他参与人策略的最优回应,那么 各参与人的策略组合构成一个纳什均衡。
Player 2 N Y
Payer 1
N
Y
0, 0
— 10,0
0,— 10
博弈的分类
行动次序
信息
静态(策略式)
动态(扩展式)
ห้องสมุดไป่ตู้完全信息
纳什均衡
(纳什)
子博弈精练 纳什均衡
(泽尔腾)
不完全信息
贝叶斯纳什均 精炼贝叶斯纳什 衡 均衡 (泽尔腾等) (海萨尼)
二、策略式博弈和纳什均衡 策略式(normal form)表达又称为标准式表达,在这种表达中,所有
参人同时选择自己的策略,所有参与人选择的策略一起决定每个参与人的收 益。
情景的形式化表述(建模的过程)
警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。 如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供, 警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲 清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较 轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。 问:两个罪犯会如何选择(即是坦白还是抵赖)?
博弈论简史 对于博弈论的研究开始于恩斯特·策梅洛(1913)、埃
米尔·博雷尔(1921)及冯·诺伊曼(1928),后来由冯·诺伊曼和奥斯卡·摩 根斯坦(1944,1947)首次将其系统化和形式化(参照Myerson, 1991)。 随后约翰·福布斯·纳什(1950,1951)利用不动点定理证明了均衡点的存在, 为博弈论的一般化奠定了坚实的基础。
政治学应用:
例2: 贿选(由简单到复杂,逐渐完善模型)
考虑两个候选人在一职位竞选中是否进行贿选。若两人都不贿选,候选人1胜 出的概率为P,候选人2胜出的概率为1-P。贿选给候选人带来优势。候选人1 进行贿选的话其胜出的概率提高V1(导致候选人2胜出的概率降低V1 );候 选人2进行贿选的话其胜出的概率提高V2(导致候选人1胜出的概率降低V2) 博弈均衡解?
博弈论与政治学应用
林辉程 S131920005
一、博弈论简介 二、策略式博弈—纳什均衡
形式化建模 求解(占优、最优回应) 政治学应用
三、扩展式博弈—子博弈精炼 纳什均衡
博弈树 求解(逆向归纳) 政治学应用
四、小结
一、关于博弈论 博弈论(Game theory),是研究相互依赖、相互影
响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依 赖、相互影响的决策行为及其结果的组合称为博弈(Game)。
一个策略式博弈包含以下要素: 1. 参与人(players) 2. 参与人的策略(strategies) 3. 收益/效用(payoff/utility)
(效用理论的简单介绍,买房子的选择 定性描述与定量描述的转化 今天天气很好—晴,气温, 湿度,风速,pm2.5;大多数人都喜欢上田老师的课– 12位同学中的10人都喜欢;收益函数、期望 效用、效用最大化– Max 函数求导)
政治学博弈论p109 田忌赛马—混合策略……引入到下篇的扩展式博弈
二、扩展式博弈和逆向归纳法求解纳什均衡 扩展式(extensive form)表达,是博弈论的另一种常用表达形式,扩
展式博弈给出了每个策略的动态描述:参与者及其可供选择的策略,行动的 顺序及结果,以及选择时所知道的信息。扩展式博弈以博弈树的图像方式来 描述。
5, 5
混合策略纳什均衡 定理(纳什):每一个有限的非零和博弈都有至少一个混合策略纳什均衡。
政治学应用:
例1: 战国联盟 Player 2 N Payer 1 N Y 0, 0 — 10,0 Y 0,— 10 5, 5
自我实施、强化 协调、说服(vs囚徒困境) (公开课p41)投资博弈(引申:协调博弈,2NE ,party,银行挤兑、美丽人生..力挽狂澜 战国 联盟说客苏秦张仪合纵连横 协调之所以能达成在于它不同于囚徒困境,他没有去说服人们采取一 个严格劣势策略)
囚徒B 坦白 囚徒A 坦白 不坦白 — 8,—8 — 10,0 不坦白 0,— 10 — 1, — 1
求解策略式博弈的均衡解(博弈的三种不同解):
1. 占优策略与占优均衡 占优均衡:如果每一个参与人的策略都是占优策略,那么称这个策略的组 合为占优策略均衡。eg:囚徒博弈 2. 迭代剔除劣势策略与占优均衡(略)
约翰·福布斯·纳什、约翰·C·海萨尼及莱因哈德·泽尔腾因为他们对博弈论的突 出贡献而获得1994年的瑞典银行经济学奖。罗伯特·J·奥曼、肯·宾摩尔、戴 维·克瑞普斯及阿里尔·鲁宾斯坦对于博弈论也做出重大贡献。
博弈的构成要素一个博弈一般由以下几个要素组成,包括:参与
人、行动、信息、策略、收益、均衡等。 1、参与人 指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人, 也可以是团体); 2、行动 指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 3、策略 指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么 行动的预先安排; 4、信息 参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及 其得益函数等知识; 5、收益 参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策 略或行动的函数,这是每个参与人最关心的东西; 6、均衡 所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博 弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参 与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是 使用博弈规则来决定均衡。
Player 2 不贿选 Payer 1 不贿选 贿选 加入监督、反腐因素后的博弈 信息、信念因素 P,1- P P+V1,1- P- V1 贿选 P - V2,1- P+V2 P+V1- V2,1- PV1+V2
政治学应用:
例3: 中位数投票者定理 其它:美苏争霸、军备竞赛 、政治改革、政治分赃、政党竞争……