完全信息静态博弈ppt课件演示文稿

合集下载

西经第八讲.完全信息静态博弈.ppt

西经第八讲.完全信息静态博弈.ppt

重复剔除劣策略
• 在海战博弈中,将军K认为将军I会选择北, 因为这是弱占优策略,因此,将军K在考虑 中就放弃了I会选择南这个想法。从而博弈 成为:
将军I

K将军

2,-2

1,-1
重复剔除劣策略
• 此时,将军K就有了一个强占优策略-北。 • 因此,策略组合(北,北)就是重复占优
均衡。
重复剔除劣策略
• 剔除严格劣策略与剔除弱被占优策略之间 存在两个区别。
– 其次,剔除弱被占优策略存在多均衡问题。如 果存在占优策略均衡,那么就一定是唯一的。 如果是重复剔除严格劣策略,均衡存在的时候 也一定是唯一的。剔除弱被占优策略就可能存 在多均衡,因为剔除的顺序就很重要。考虑下 面的博弈:
重复剔除劣策略

c1
博弈规则
• 参与人 • 行动 • 支付 • 信息
– 知道对手的支付,但是不知道对手的行动
博弈的标准型表示
• 例如双变量矩阵
囚徒2
沉默 招认
囚徒1 沉默 -1,-1 -9,0
招认 0,-9 -6,-6
求解博弈
• 策略
– 策略与行动不可区分
• 均衡概念
– 占优策略 – 重复剔除严格劣策略 – 纳什均衡
纳什均衡
建模者困境

抵赖
坦白
抵赖 0,0
-10,0

坦白 0,-10
-8,-8
纳什均衡
• (坦白、坦白)是弱占优均衡,也是重复 剔除均衡,也是强纳什均衡。
• 不过,(抵赖、抵赖)是另一个纳什均衡。 这个结果没有上面的均衡强,但是是帕累 托最优。
• 均衡精炼:向基本的均衡概念增加限制, 直到仅仅剩下一个均衡为止。Fra bibliotek纳什均衡

完全静态博弈PPT精选文档

完全静态博弈PPT精选文档

如果外在设立一个机制——武力报复的威胁 是确定的,那么理性的和追求财富极大化的家庭 现在就会选择非暴力,这样只会有一个选择结果, ( 10 , 10 )当然要优于( 4 , 4 )。
7
§2 博弈论的基本概念——(1)参
与人
• 参与人(players):决策主体,他的目的是通过 选择行动(或战略)以最大化自己的支付(效 用)水平。每个参与人必须有可供选择的行动 和一个很好定义的偏好函数,那些不作决策的 被动主体只当作环境参数来处理。例如,在房 地产开发博弈中,有两个参与人,即开发商和 开发商,他们要作出“开发”或“不开发”的 决策,目的是最大化自己的利润水平,而写字 楼的需求则被当作环境变量放在“市场需求” 中。
3
收益矩阵
四个可能结果:
A
家庭X
N
家庭Y
A
N
(4 , 4) (18 , 2)
(2 , 18) (10 , 10)
4
博弈过程
• 在不知对方策略的情况下,要求每一方都作出 不可更改的选择,就会导致囚徒的困境,这时, 不管对方采取什么策略,每一方选择侵犯策略 可以使他的期望财富达到最大化——因为4>2、 18>10。
13
(4)策略
• 策略是参与人在给定信息集的情况下的 行动规则,它规定参与人在什么时候选 择什么行动。
• 相机行动方案(contingent action plan)。信 息集包含了一个参与人有关其他参与人 之前的行动知识。策略告诉该参与人如 何对其他参与人的行动作出反应,因而 策略是参与人的“相机行动方案”
16
§3 模型:囚徒困境
占优策略

沉默
招供
沉 默
-1,-1
-9,0

第二章完全信息静态博弈东北大学.ppt

第二章完全信息静态博弈东北大学.ppt
3 、占优战略均衡与纳什均衡
如果所有人都有占优战略存在,那么占优战 略均衡就是可以预测的唯一均衡。
占优战略只要求每个参与人是理性的,而不 要求每个参与人知道其他参与人是理性的 (也就是13
第二章 完全信息静态博弈
3 、占优战略均衡与纳什均衡
如何寻找占优战略均衡
35
第二章 完全信息静态博弈
3 、占优战略均衡与纳什均衡
如何找出纳什均衡
囚徒1
沉默 坦白
囚徒2
沉默
坦白
-1 ,-1
-9 ,0
0 ,-9
36
-6 ,-6
第二章 完全信息静态博弈
3 、占优战略均衡与纳什均衡
划线法
上 中 下
左 0,4 4,0 3,5
37
中 4,0 0,4 3,5
右 5,3 5,3 6,6
15
第二章 完全信息静态博弈
3 、占优战略均衡与纳什均衡
智猪博弈(boxed pigs)
小猪:等待
小猪
大猪不存在占优策略
大猪
按 等待
按 5 ,1 9 ,-1
16
等待 4 ,4 0 ,0
第二章 完全信息静态博弈
3 、占优战略均衡与纳什均衡
重复剔除的占优均衡 思路:首先找到某个参与人的劣战略(假定存
囚徒2
沉默
坦白
囚徒1
沉默
坦白
-1 ,-1 0 ,-9
14
-9 ,0 -6 ,-6
第二章 完全信息静态博弈
3 、占优战略均衡与纳什均衡
智猪博弈(boxed pigs) 猪圈里圈两头猪,一头大猪,一头小猪。猪圈
的一端有一个猪食槽,另一端安装一个按钮, 控制着猪食的供应。按一下按钮会有10个单 位的猪食进槽,但谁按按钮谁就需要付2个单 位的成本。若大猪先到,大猪吃到9个单位, 小猪只能吃1个单位;若同时到,大猪吃7个 单位,小猪吃3个单位;若小猪先到,大猪吃 6个单位,小猪吃4个单位。

完全信息静态博弈教学课件

完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。

第二章(完全信息静态博弈)PPT课件

第二章(完全信息静态博弈)PPT课件

q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。

完全信息静态博弈ppt课件演示文稿

完全信息静态博弈ppt课件演示文稿

招认
囚徒2 招认 沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒1
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game;(2)the strategies available to each player;(3)the payoff received by each player for each combination of strategies that could be chosen by the players.
Definition: The normal-form representation of an-n-player game specifies the players‘ strategy spaces S1 , … , Sn and their payoff functions u1 ,…, un. We denote this game by G={S1, … ,Sn;u1, … , un}. 教材 P22
≥ ui( s1*…, sn-1* , si , sn+1* ,…, sn* ) ……………………………………….(NE)
for every feasible strategy si in Si; That is , si*solves max ui( s1*…, sn-1* , si, sn+1* ,…, sn* ). si∈Si
参与人2 左 中 右 上 1, 0 1, 2 0, 1
参与人1 下 0, 3 0,1 2,0 第二
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
*Two suspects are arrested and charged with a crime. The police lack sufficient evidence to convict the suspects, unless at least one confesses.The police hold the suspects in separate cells and explain the consequences
is each player‘s payoff function (the function that determines the players payoff from the combination of actions chosen by the players) is common knowledge among all the players. 教材P21
Definition: The normal-form representation of an-n-player game specifies the players‘ strategy spaces S1 , … , Sn and their payoff functions u1 ,…, un. We denote this game by G={S1, … ,Sn;u1, … , un}. 教材 P22
*理解完全信息静态博弈时要注意事项
1 Although we stated that in a normalform game the players choose their strategies simultaneously , this does not imply that the parties necessarily act simultaneously :it suffices that each choose his or her action without knowledge of the others‘ choices, as would be the case ―the prisoners‘dilemma‖ if the prisoners reached decisions at arbitrary times (在任意时间)while in their separate cells.
Chapter 1 完全信息静态博弈 Static Games of Complete Information In this chapter we consider games of the following simple form: first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move) games,we restrict attention to games of complete information. That
一、Normal-Form Representation of Games and Nash Equilibrium
(一)Normal-Form Representation of Games
In the normal-form representation of a game ,each player simultaneously chooses a strategy, and the combination of strategies chosen by the players determines a payoff for each player. We illustrate the normal-form representation with a classical example—The prisoners‘ Dilemma.
that will follow from the actions they could take. If neither confesses then both will be convicted of a minor offense and sentenced to one year in jail. If both confess then both will be sentenced to jail five years. Finally, if one confesses but the other does not, then the confessor will be released immediately but the other will be sentenced to eight years in jail—five for the crime and a further three for obstructing justice(干扰司法)。
Hale Waihona Puke 招认囚徒2 招认 沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒1
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game;(2)the strategies available to each player;(3)the payoff received by each player for each combination of strategies that could be chosen by the players.
相关文档
最新文档