第八章╲t博弈论

合集下载

博弈论非常好的讲解ppt课件

博弈论非常好的讲解ppt课件
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选 择。
但真正起作用的是你的朋友是否使用同样的 逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。
也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
获奖原因:“通过博弈论分析加强了 我们对冲突和合作的理解”所作出 的贡献而获奖。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
1994年诺贝尔经济学奖获得者
美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.) 以及德国人莱因哈德-泽尔腾(Reinhard Selten)
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
ቤተ መጻሕፍቲ ባይዱ
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。

博弈论

博弈论

效用(英文:Utility),是经济学中最常用的概念之一。

一般而言,效用是指对于消费者通过消费或者享受闲暇等使自己的需求、欲望等得到的满足的一个度量。

正和博弈亦称为合作博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。

负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失那是定理在一个有n个博弈方的博弈G=﹛S1,…,Sn:u1,…,un}中,如果n是有限的,且Si 都是有限集(对i=1,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。

是由纳什发现的。

美苏争霸的囚徒困境军备竞赛是囚徒困境的又一个典型例子。

下面讲的,源自30年前美国的博弈论课本,本书不敢掠美。

从军事上看,30多年前,美国和苏联是世界上的两个超级大国,它们相互对垒。

假定每一方都有两种策略选择,一个是扩军,发展战略核武器,甚至实施“星球大战”计划等;另一个是彻底裁军,直至不设军备。

如果双方都扩军,则各花费2 000亿美元用于军费。

彻底裁军,则军费为0。

在一个弱肉强食的世界上,如果美国裁军不设防,但是苏联扩军,苏联就可以任意欺侮和损害美国。

这样,美国会受到很大损失。

损失之大,直至丧失主权。

这使我们可以非正式地把这种情况下美国的赢利记做–∞,即负无穷大。

这时候,欺侮人的一方的赢利是多少呢?你可能想象应该是+∞,即正无穷大。

其实不然。

你想想,砍伐一片森林所造成的损失,难道可以用所得到的木材的价值来补偿吗?更不必说占领甚至炸毁对方一座城市,你所得到的远远低于对方的损失。

被欺侮一方的损失,并不会等量地转化为欺侮人的一方的利益,这常常是对抗的规律。

所以,在一方扩军欺侮别人而另一方裁军任人欺侮的情况下,我们假定欺侮人的一方将只掠夺到一个有限数额的财富,比方说10 000亿美元。

这10 000亿美元的掠夺成本是上面讲的2 000亿美元。

第8章 博弈论

第8章 博弈论

经济学原理
18
四种主要的均衡类型
完全信息 不完全信息
静态
动态
完全信息 不完全信息 NE:纳什均衡 纳什均衡 静态 静态( 静态(BNE) BNE:贝叶斯纳什 ) 贝叶斯纳什 贝叶斯 (NE) ) 均衡 子 完全信息 不完全信息 SPNE:子博弈精练 纳什均衡 动态 动态 SPBE:子博弈精练 子 (SPNE) (SPBE) ) 贝叶斯纳什均衡 贝叶斯纳什均衡
经济学原理 11
8.3.2 纳什均衡 纳什均衡
纳什均衡 纳什均衡(Nash Equilibrium) :在博弈分析中,纳什均衡是 Equilibrium) :在博弈分析中 纳什均衡是 博弈分析中, 所有参与人的最优战略组合。 注意: •均衡的战略组合包含了所有参与者的最优战略,是最优战 略的组合; •均衡战略组合是每一个参与者最优战略的交集,每个参与 人肯定存在最优战略,但是如果不存在交集,就没有均衡的 战略组合。 •均衡意味着:给定A的战略SA,B有最优战略SB;给定B的 均衡意味着:给定A的战略SA, 有最优战略SB;给定B 战略SB, 有最优战略SA,(SA,SB)就是均衡战略。 战略SB,A有最优战略SA,(SA,SB)就是均衡战略。
经济学原理
14
纳什均衡的简单解法 纳什均衡的简单解法
给定一方的选择,另一方的选择是最优的; 反过来,给定另一方的该选择,一方的选择 也是最优的,则该选择组合是纳什均衡。
B 坦白 A 坦白 不坦白 -8,-8 -10,0 10, 不坦白 0,-10 -1,-1
经济学原理
15
两小猜枚的支付矩阵和均衡 两小猜枚的支付矩阵和均衡
经济学原理
8
囚徒困境的标准表达式
李四( 李四(B) 坦白 张三 (A) 坦白 不坦白 -8,-8 -10,0 10, 不坦白 0,-10 -1,-1

高级微观经济学 第八章 博弈论

高级微观经济学 第八章 博弈论

第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。

本章讨论这个问题,建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。

最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。

大部分经济行为都可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。

第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。

一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。

当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。

博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。

下面来举例说明。

例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。

局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。

对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。

当甲和乙都作出选择时,博弈的局势就确定了。

显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。

ch8 博弈论

ch8 博弈论

在零和博弈中,甲想要使得自己的支付最大, 而乙却想要甲的支付最小化。
对于乙所采取的每一个策略,甲都会选择一个相应的策 略来最大化自己的收益,即
max{ f1 j , f 2 j , , f mj }
i
为了使得甲的支付最小化,乙会事先选择一个策略来最 小化上述的最大值,即
min max{ f1 j , f 2 j ,, f mj }
f 21 , g21

f 22 , g22

f2n , g2n


xm

f m1 , g m1 f m 2 , gm 2
f mn , gmn
两人博弈的支付矩阵
接人博弈的扩展式表述

东出站 口出 西出站口 出
A
信息集
Information SetB 东 -等西 -等
东 -等
B
西 -等
(1,1)
二、重复剔除严格劣势策略

在这个例子中,无论大猪选择什么,对小 猪来说, “按”得到的支付都严格小于 “等待”,我们把这种类型的策略叫做严 格劣势策略。

不论其他参与人选择什么,若有一策略产 生的支付总是严格小于某些其他策略,则 这种策略就是所谓的“严格劣势策略”。

假定大猪知道小猪是理性的,则会预测到小猪一 定不会选择严格劣势策略;表现在收益矩阵中就 是小猪选择按按钮的那一列全部被删除。
小猪 大猪 按按钮 等待 3,1 7,-1 2,4 0,0 按按钮 等待
大猪只能在剩下的两格中选择,此时“等待”成
了严格劣势策略,把它剔除,所以最终的均衡是 猪选择“按按钮”、而小猪选择“等待” 。
上例中寻找均衡的思路是:先找出某个参与人的 严格劣势策略(假定存在),把它剔除,重新 构造一个不包含已剔除策略的新博弈;然后再 剔除新博弈中某个参与人的严格劣势策略;这 样一直重复下去,直至剩下唯一的策略组合。 该策略组合就是博弈的均衡解。这种方法称为 “重复剔除严格劣势策略”。

博弈论

博弈论

走近博弈论也记不清到底何时开始接触博弈论的,反正生活中总是会不经意的碰到一些与博弈有关的行行色色的问题。

在上大学之前,毕竟没有比较理性的学习与其有关的知识,对于一些问题也不会那么认真地去解决,然而接触的东西多了,使我不得不看了一些与博弈策略、心理学之类的书籍,更深入地去了解了一下它。

现如今,博弈论属于应用数学的一个分支,它已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家也使用博弈理论来理解和预测进化论的某些结果。

可见,博弈论真的为我们的生产生活带来许多重要的影响。

所以说,很有必要去认真了解一下它的比较基础的东西。

博弈的目的就是利益,而利益便是形成博弈的基础。

经济学的最基本的假设就是经济人或理性人的目的就在于使收益最大化。

参与博弈者正是为了自身收益的最大化而相互竞争。

也就是说,参与博弈的各方形成相互竞争、相互对抗的关系,以争得利益的多少来决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。

博弈的基本概念便是:决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。

对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。

他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。

局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。

博弈论PPT资料整理

博弈论PPT资料整理

博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。

1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。

2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。

博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。

于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。

中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。

博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。

生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。

而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。

特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。

由此可见,博弈论是适合所有人的科学。

在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。

博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。

可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。

从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。

第八章博弈论简要课件

第八章博弈论简要课件

11
第八章 博弈论
四、重复博弈和序列博弈
➢静态博弈是指局中人同时决策或虽非同时 决策,但后决策者不知道先决策者采取什么 策略的博弈。 ➢动态博弈是指局中人决策有先有后,后决 策者能观察到先决策者决策情况下的博弈。
12
第八章 博弈论
动态博弈的例子
进入
在位者甲
合作 斗争
进入者乙
(400 ,500) ( -100 ,100)
6
第八章 博弈论
3、策略集合: 是指所有局中人可能采取 的行动方案总和。例如:都坦白,都抵赖, 坦白与抵赖,抵赖与坦白 4、收益: 是指在每种组合情况下,局中 人采取特定策略得到的结果。例如:判3年, 6年,释放等
7
第八章 博弈论
三、上策均衡和纳什均衡
1、上策: 是指不管其他局中人采取什么策 略,某一局中人都采取自认为对自己最有 利的策略。 2、均衡: 是指博弈中所有局中人都不想改 变自己策略的一种相对静止状态。
1
第八章 博弈论
博弈论字面的意思是游戏策略,及用类 似游戏中解决问题的方法,揭示解决社会、 经济及其他领域问题的策略、对策,因此有 的还把博弈论译成对策论。准确的说博弈论 是在给定的条件下寻求最优策略,这里给定 的条件包含其他人的策略以及本人的决策对 其他决策主体的影响。
2
第八章 博弈论
策略性活动在社会、经济、政治生活中 大量存在,也可以说,整个社会、经济、政 治生活都是博弈行为。因此,博弈论作为一 种方法,广泛的应用在经济、政治、军事、 外交中,只是博弈论在经济学中应用的最广 泛、最成功。如前面介绍过的古诺均衡,就 属于经济学中的博弈过程。
8
第八章 博弈论
3、上策均衡: 不管其他局众人采取什么策 略,每个局中人都选择了对自己最有利的策 略所构成的一个策略组合。 4、纳什均衡: 是指参与博弈的每一局中人 在给定其他局中人策略的条件下选择上策所 构成的一种策略组合。 注:所有上策均衡都是纳什均衡,但不能反 过来说所有纳什均衡都是上策均衡。

博弈论课件

博弈论课件

脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。

博弈论Chapter 8

博弈论Chapter 8

• (4) Nature chooses a value for the state of the world, according to distribution G(θ), which puts equal weight on 0 and 10. Output is then q = Min (a +θ; 10). • (Thus, output is 0 or 10 for the low-ability agent, and always 10 for high-ability.)
• It is usually assumed that the players can make a binding contract at some point in the game;
• which is to say that the principal can commit to paying the agent an agreed sum if he observes a certain outcome.
Applications of the principal-agent model

Adverse Selection
• Players: The principal and the agent • The Order of Play: • (1) Nature chooses the agent's ability a, unobserved by the principal, according to distribution F(a). • (2) The principal offers the agent one or more wage contracts w1(q); w2(q); …

博弈论ppt课件

博弈论ppt课件

精选课件ppt
7
囚徒B 坦白
不坦白
囚徒A
坦白 -8,-8 0,-10
不坦白 -10,0 -1,-1
精选课件ppt
8
博弈的分类
ห้องสมุดไป่ตู้
1、从行动的先后次序来分,博弈可以分为 静态博弈 和 动态博弈。 静态博弈指在博弈中,参与人同时选择行动,或虽非同 时但后行动者并不知道前行动者采取了什么具体行动;
动态博弈指的是参与人的行动有先后顺序,且后行 动者能够观察到先行动者所选择的行动的博弈。
21世纪,应站在博弈论的前沿。尽管博弈经济学家很少,但其获诺贝尔
奖的比例最高。最能震动人类情感的是博弈,对未来最有影响力的还是
博弈。
精选课件ppt
6
著名的“囚徒困境”的例子
警察抓住了两个罪犯,但是警察局却缺乏足够的证据 指证他们所犯的罪行。如果罪犯中至少有一人供认犯 罪,就能确认罪名成立。为了得到所需的口供,警察 将这两名罪犯分别关押防止他们串供或结成攻守同盟, 并分别跟他们讲清了他们的处境和面临的选择:如果 他们两人都拒不认罪,则他们会被以较轻的妨碍公务 罪各判一年徒刑;如果两人中有一人坦白认罪,则坦 白者立即释放而另一人将重判10年徒刑;果两人都坦 白认罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放 弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说 比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分 配。这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0) 或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时 给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号) 来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己 的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号 能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分 给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2, 0)或(97,0,1,0,2)。

20博弈论-第八章

20博弈论-第八章

第八章 若干专题及扩展本书的最后一章将对纳什均衡的一些扩展进行一个介绍性的讨论,这些扩展反映着博弈论最前沿的研究与最新的运用。

同时,这些扩展也为更好地理解博弈论提供了新的角度和基础。

这一章主要涉及到三个专题,即同盟博弈及其解概念——核、演化博弈及其解概念——演化稳定策略和学习博弈。

第一节 同盟博弈与核同盟博弈(Coalitional game)所关注的是博弈参与者是如何组成各种利益集团的,以及同盟的稳定性。

一个利益集团就被看作是一个同盟(Coalition),如果一个同盟包含所有的博弈参与者就称为大同盟(Grand coalition)。

实际上,如果我们把所有博弈参与者看作一个全集,用N 表示,那么一个同盟就是N 的子集,并且是对N 的一个分割(Partition),即如果我们定义一个博弈中的各同盟为S i ,i =1, …, k ,那么,i ≠j 和i j S S =∅I 1ki i S N ==U 。

为了方便,我们用N 来表示大同盟,用S 来表示其他的任意同盟。

显然,大同盟是一个极端,而每一个参与者都是一个同盟是另一个极端,而大多数同盟分割都位于两个极端之间。

对于同盟博弈而言,主要感兴趣的是位于两个极端之间的同盟分割情况。

由于博弈参与者唯一能做的就是站队,因而参与者的偏好实际上就是对各利益集团(同盟)的行动进行排序。

定义8.1 同盟博弈可表示为G={N, A S, u},其中(1)参与者集合:N={1, …, n}。

(2)对于每一个同盟S而言的行动集合:A S。

(3)偏好:每一个参与者的偏好就是对(其参与其中的)各同盟行动的排序。

例8.1 景泰蓝的分工协作要生产出一个景泰蓝需要n个劳动者分工协作,生产出来的景泰蓝所获收益(不妨假设为1)在各工人之间进行分配。

只要有一个工人不合作,景泰蓝就无法生产出来。

每一个工人都希望自己获得的收益份额越多越好。

该情景的同盟博弈为G={N, A S, u}:(1)参与者集合:N={1, …, n}。

博弈论全套课件

博弈论全套课件

三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。

博弈论

博弈论

三、双寡头削价竞争
问两寡头最终的策略是什么?
寡 头 2
寡 头 1 高价 低价
高价
低价
100,100
150,20
10,150
70,70
§2.2 基本概念
一、定义
博弈即一些个人,队组或其他组织,面对一定的环境 条件,在一定的规则下,同时或先后,一次或多次,从各 允许选择的行为或策略中进行选择并加以实施,各自取得 相应的结果的过程。
四、博弈的过程
博弈过程也是博弈结构的重要方面。虽然我 们前面介绍的大多数博弈例子,都是几个博弈方 一次性同时进行决策选择的,但事实上社会经济 活动中也有许多策略较量的博弈问题,是先后、 反复或者重复的策略对抗。例如寡头削价竞争就 完全可能是先后进行的而不是同时进行的。博弈 过程的这种差异对博弈的结果和博弈分析也有非 常重大的影响,因此需要注意它们的区别,分类 进行研究。根据博弈过程方面的这些差异,博弈 问题通常分为“静态博弈”、“动态博弈”和 “重复博弈”几个大类。
博弈论(Game Theory)
第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 引论 基本概念 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈 合作博弈 演化博弈
第一章 引论
研究对象:冲突、竞争现象的定量分析理论。 对策: 参加竞争的各方为了获胜而需研究出一组对付对方的策略。 历史沿革:(1)我国古代围棋、国际象棋(印度)等; (2)1912年,数学家翟墨罗把对策从模拟模型抽象为数学模 型; (3)第一次、第二次世界大战,军事对策应用于战役和战 略研究; (4)1944年,冯· 诺意曼、摩根斯特合写了“博弈论和经济 行 为”,推动了博弈论在经济管理中的应用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔经济学奖 (1994),进一步推动了博弈论的研究。

博弈论(第八、九章)

博弈论(第八、九章)

类型:自然首先选择参与人的类型,参与人自己知道,其他参与人不 -不完全信息 知道。 知道。---不完全信息 行动:行动有先有后,后行动者能观测到先行动者的行动,但不能观 -动态博弈 测到其类型。 测到其类型。---动态博弈 但是,参与人是类型依存型的,每个参与人的行动都传递有关 自己类型的信息,后行动者可以通过观察先行动者的行动来推断自 己的最优行动。先行动者预测到自己的行动被后行动者利用,就会 设法传递对自己最有利的信息。 不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与 人不断修正信念的过程。
行为方(城管)行为 偷懒 认真 1 1 小贩 2 0 声明方 类型 2 0 非小贩 1 1
声明方和行为方对对方不同类型存在不同偏好,但这种偏好 正好是相反的。这时候,声明方说实话对自己显然是不利的,因 此他不愿意说实话。而且,行为方对声明方的声明也不会轻易相 信。所以,此时信息的传递机制不存在。
第二节典型不完全信息动态博弈模型 声明博弈
声明博弈有效传递信息的几个必要条件: (1)不同类型的声明方必须偏好行为方的不同行为。 (2)对应声明方的不同类型,行为方必须偏好不同的行为。 (3)行为方的偏好必须与声明方的偏好具有一致性。
第二节典型不完全信息动态博弈模型 离散型声明博弈的一般模型
设声明方有I种可能的类型,行为方有K种可能的行为,这种博弈模 型可用如下方式表述: A.“自然”从声明方类型集T={t1,…,t2}中以概率分布p(t1),…,p(ti)随 机抽取声明方的类型ti,p(ti)>0。 B. 声明方观察到ti后,从T中选择tj作为自己声明的类型。tj可以与ti 相同,也可以不相同。 C. 行为方在了解声明方的声明tj后,在自己的行为空间A= {a1,…,ak}中选择自己的行为ak。 D.声明方的得益为Us(ti,ak),行为方的得益为Ur(ti,ak)。

博弈论

博弈论

二人博弈的一个例子
参与人 B L R U 参与人A 参与人 D (0,0) (2,1) 两个博弈人的策略组合表示为象(U,R)这样的组 这样的组 两个博弈人的策略组合表示为象 第括号中第一个字母是A选择的策略 选择的策略, 合,第括号中第一个字母是 选择的策略, 第二个字母是B选择的策略 选择的策略。 第二个字母是 选择的策略。 (3,9) (1,8)
囚徒困境
对这两个囚犯的惩罚( 对这两个囚犯的惩罚(或者负的收 益)是: 如果两个人都坦白,两个人的罪行 如果两个人都坦白, 一样重; 一样重; 如果一个坦白,一个不坦白, 如果一个坦白,一个不坦白,前者 处罚较轻,后者处罚较重; 处罚较轻,后者处罚较重; 如果两个人都不坦白, 如果两个人都不坦白,则因为没有 证据, 证据,两个人的处罚较都坦白时轻 。
选择右,那么A的最优反应是下 的最优反应是下。 如果 B 选择右,那么 的最优反应是下。
二人博弈的一个例子
参与人 B L R U 参与人 A D (3,9) (1,8) (0,0) (2,1) (D,R)是可行的 是可行的 策略组合吗? 策略组合吗
如果B选择右, 的最优反应是下。 如果 选择右,那么 A的最优反应是下。如果 选择右 的最优反应是下 如果A 选择下,那么B的最优反应是右 因此. 的最优反应是右。 选择下,那么 的最优反应是右。因此 (D,R) 是 可行的策略组合。 可行的策略组合。
二人博弈的一个例子
参与人 B L R U 参与人 A D (0,0) (2,1) (3,9) (1,8) (U,R)是可行的 是可行的 策略组合吗? 策略组合吗
如果B选择右,既然 能够通过选择 能够通过选择A将自己的收 如果 选择右,既然A能够通过选择 将自己的收 选择右 益从1提高到 提高到2,那么A的最优反应是下 的最优反应是下, 益从 提高到 ,那么 的最优反应是下,因此 (U,R)不是合适的策略组合。 不是合适的策略组合。 不是合适的策略组合

第八章 博弈论

第八章 博弈论
o 但是在重复博弈中,情况就会改变。 o 首先,在无限期重复博弈中,对于任何一个参与者
的欺骗和违约行为,其他参与者总会有机会给予报 复(“以牙还牙”策略)。
24
在无限期重复博弈中,报复的机会总是存在 的,所以,每一个参与者都不会采取违约或 欺骗的行为,囚徒困境合作的均衡解是存在 的。
25
有限期重复博弈: o 用逆推的方法,在有限期重复博弈中,囚犯困境博
张三和李四会坦白吗?
4
纳什均衡
坦白 李四
不坦白
坦白
张三
(-10,-10)
(-15,-2)
不坦白
(-2,-15)
(-5,-5)
5
第一节:博弈论的发展及基本概念
一、概念:
博弈论:又称对策论,是一种分析战略 行为的方法
博弈论是描述和研究行为者之间策略相 互依存和相互作用的一种决策理论。
6
o 在每一个博弈中,都至少有两个参与者,每 一个参与者都有一组可选择的策略。作为博 弈的结局,每个参与者都得到各自的报酬。 每个参与者的报酬都是所有参与者各自所选 择的策略的共同作用的结果。
改变方案三:减量加移位方案。投食仅原来 的一半分量,但同时将投食口移到踏板附近。
40
18
囚犯的困境反映了一个问题,从个人角度出 发所选择的占优策略,从整体来看,却是最 差的结局,即个人理性和团体理性的冲突。
应用: 囚徒的困境可以应用于许多场合。前面所讲
的寡头博弈(占优策略的均衡)就是一例。
19
做广告
可口可乐的决策
做广告
不做广告
百 事 可
做 广
每家30亿美元的利润
可口可乐得到20亿美元利润
3
一个著名的例子:囚徒困境
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章博弈论一、重点和难点(一)重点1.博弈论及其基本概念2.纳什均衡3.占优策略均衡4.囚徒困境博弈(二)难点1.最小最大值(或最大最小值)策略2.子博弈精炼纳什均衡3.动态博弈战略行动4.不完全信息静态博弈5.不完全信息动态博弈二、关键概念博弈零和博弈非常和博弈囚徒困境纳什均衡支付子博弈精炼纳什均衡完全信息静态博弈占优策略均衡重复博弈战略移动可信威胁豪尔绍尼转换三、习题(一)单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。

A.规则B.占优战略均衡C.策略D.结局3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的战略称为()。

A.一报还一报的战略B.激发战略C.双头战略D.主导企业战略8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在双寡头中存在联合协议可以实现整个行业的利润最大化,则()。

A.每个企业的产量必须相等B.该行业的产出水平是有效的C.该行业的边际收益必须等于总产出水平的边际成本D.如果没有联合协议,总产量会更大10.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时11.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种战略是一种()。

A.主导战略B.激发战略C.一报还一报战略D.无用战略12.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵13.下面关于共同知识的说法,正确的是()。

A. 每一个局中人都知道的事,就是共同知识B. 一般地,假定支付为共同知识C. 共同知识的假定要求局中人的计算能力不是很强D. 纳什均衡不需要共同知识的假定14、导致价格战爆发的原因是()A.合作均衡B.使用一报还一报的战略的企业的出现,这一战略是其竞争者在前一阶段遵守联合协议时采取的C.进入该行业并立刻同意遵守联合协议的新企业的出现D.新企业进入一个行业后,所有企业发觉自己处在囚徒困境中 (二)判断说明题1.博弈论是用来分析垄断竞争企业行为的。

2.在一次性囚徒困境博弈中,对一个囚徒来说,如果他相信另一个囚徒会坦白,则他的占优战略就是坦白。

3.因为零和博弈中博弈方之间的关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

4.凡是博弈方的选择、行为有先后次序的一定是动态博弈。

5.合作博弈就是博弈方采取相互合作态度的博弈。

6.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

7.如果一博弈有两个纯策略纳什均衡,则一定还存在一个混合策略均衡。

8.在动态博弈中,因为后行为的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

9.多人博弈中的“破坏者”会对所有博弈方的利益产生不利影响。

10.纯策略纳什均衡和混合策略纳什均衡都不一定存在。

(三)计算题1.北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

2.Smith 和John 玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John 给Smith 3美元,如果不同,Smith 给John 1美元。

(1)列出收益矩阵。

(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少?3.假设双头垄断企业的成本函数分别为:1120Q C =,2222Q C =,市场需求曲线为Q P 2400-=,其中,21Q Q Q +=。

(1)求出古诺(Cournot )均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。

(2)求出斯塔克博格(Stackelberg )均衡情况下的产量、价格和利润,并以图形表示。

(3)说明导致上述两种均衡结果差异的原因。

4.假设有两个游戏者A 和B ,他们分别代表两家企业,生产不同的部件,但生产的部件在型号选择上有“大”、“小”之分。

若一家企业选择的型号为“大”,另一家企业选择的型号为“小”,则会发生不匹配的问题。

只有当两家企业选择的型号匹配时,才会有均衡。

下表给出了这一合作博弈的形式。

(1)假设企业A 先走一步,企业B 的策略选择有多少种?写出A 和B 的策略组合及相应的收益矩阵。

(2)在这些策略组合中,有无纳什均衡?如有,哪些是?(3)将上述策略组合写成广延型博弈形式,并求出子博弈完美纳什均衡。

5.假设在一个博弈模型中,有两个参与者,即政府和私人部门。

私人部门选择的是预期的通货膨胀率,政府选择的是实际的通货膨胀率。

并且政府不仅关心通货膨胀问题,而且还关心失业问题。

设政府的效用函数为:2*2)(ky y c U ---=π其中,π是通货膨胀率,*y 是自然失业率下的均衡产量,y 是实际产量,0>c ,1>k 。

同时假定产出与通货膨胀率之间的关系是由含有通货膨胀预期的菲利浦斯曲线决定,也就是说菲利浦斯曲线是:)(*e y y ππβ-+=其中,e π是预期的通货膨胀率,0>β。

如果私人都具有理性预期,那么运用博弈论的有关知识来证明,在短期内政府所采取的通货膨胀政策不能增加产出。

(四)问答题1.举一个你在现实生活中遇到的囚犯两难困境的例子。

表中每组数字前面一个表示A 企业的收益,后一个数字表示B 企业的收益。

(1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?(2)存在帕累托改进吗?如果存在,在什么条件下可以实现?福利增量是多少? (3)如何改变上述A 、B 企业的收益才能使均衡成为纳什均衡或占优策略均衡?如何改变上述A 、B 企业的收益才能使该博弈不存在均衡?3.在纳税检查的博弈中,假设A 为应纳税款,C 为检查成本,F 是偷税罚款,且C<A+F ;S 为税务机关检查的概率,E 为纳税人逃税的概率;不存在纯战略纳什均衡。

(1)写出支付矩阵。

(2)分析混合策略纳什均衡。

(五)案例分析题1.阅读以下材料,联系实际情况,运用所学理论进行评析。

囚徒困境中的宝洁公司宝洁(P&G)、联合利华和花牌同时计划进入杀虫胶带市场。

它们都面临同样的成本和需求条件,而各厂商必须在考虑到他的竞争者们的情况下决定一个价格。

如果P&G 和它的竞争者都将价格定在1.50美元,他能得到更多的利润。

这从下表中的支付矩阵中看得很清楚。

如果所有厂商都定价1.50美元,它们每月各可赚到20000美元利润,而不是定价l.40美元可以赚到的12000美元。

那么为什么它们不定价1.50美元呢?联合利华和花牌定价宝洁(P&G)l.40美元 1.50美元*假设联合利华和花牌定相同的价格。

矩阵中数字以每月千美元为单位。

因为这些厂商处在一个囚徒的困境中,不管联合利华和花牌定价多少,宝洁定价l.40美元都能赚更多的钱。

例如,若联合利华和花牌定价1.50美元,宝洁定价l.40美元每月可赚29000美元,而定价1.50美元只能赚20000美元。

这对联合利华和花牌也是正确的。

例如,宝洁定价l.50美元而联合利华和花牌定价1.40美元,它们将各赚到21000美元而不是20000美元。

结果,宝洁知道如果它定价1.50美元,它的竞争者会有强烈的低价竞争,定价l.40美元的冲动,这样P&G 将只有一个很小的市场份额和只能赚到每月3000美元的利润。

P&G 应该冒险防信任竞争者定价1.50美元吗?如果你面对这样的困境,你会怎么做呢?2.一个工人给老板干活,工资标准是100元。

工人可以选择是否偷懒,老板则选择是否克扣工资。

假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。

请问(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形式表示该博弈并作简单分析。

(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形式表示该博弈并作简单分析。

参考答案(一)单项选择题1.(B )2.(B )3.(C )4.(D )5.(A )6.(C )7.(A )8.(A )9.(C ) 10.(D ) 11.(C ) 12.(B ) 13.(B ) 14.(D ) (二)判断说明题1.错【解题思路】:本题分析博弈论与寡头垄断企业的关系。

【解析】:博弈论是用来分析寡头垄断企业行为的理论。

2.错【解题思路】:本题分析占优战略。

【解析】:在囚徒困境博弈中,占优战略是招供,即不管对方的行为是怎样的,每个囚徒都会采取招供的战略。

3.错【解题思路】:本题考察零和博弈和非合作博弈的关系。

【解析】:虽然零和博弈中博弈方的利益确实是对立的,但非合作博弈的含义并不是博弈方之间的关系是竞争性的、对立的,而是指博弈方是以个体理性、个体利益最大化为行为的逻辑和依据,是指博弈中不能包含有约束力的协议。

4.错【解题思路】:本题考察动态博弈。

【解析】:其实并不是所有选择、行为有先后次序的博弈问题都是动态博弈。

例如两个厂商先后确定自己的产量,但只要后确定产量的厂商在定产之前不知道另一厂商的产量是多少,就是静态博弈问题而非动态博弈问题。

5.错【解题思路】:本题考察合作博弈。

【解析】:合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力的协议限制行为选择的博弈问题,与博弈方的态度是否合作无关。

相关文档
最新文档