博弈论(2)
博弈论简介2
游戏:军事游戏-进攻和防守
守军的部署方案:
A:三个师,部署在A道路; B:两个师部署在A道路, 一个师部署在B道路; C:一个师部署在A道路,两个师部署在B道路; D:三个师部署在B道路。
攻方的进攻方案:
a. 集中两个师从A道路进攻; b. 兵分两路分别从A、B道路发起进攻;
c. 集中两个师从B道路进攻。
纳什均衡
猎人2
猎鹿
猎人1 猎鹿
4
4
猎兔
0
1
猎兔
1
0
1
1
(猎鹿,猎鹿)、(猎兔,猎兔)是纳什均衡
博弈分析
鲜花博弈
两男两女:帅哥和牛粪先生,鲜花小姐和芳草姑娘。 帅哥喜欢鲜花小姐;芳草小姐喜欢帅哥。
博弈分析
•鲜花博弈
1. 如果帅哥追求鲜花而牛粪先生不追求, 那么帅哥肯定会得到鲜花小姐的芳心 。
2. 如果牛粪先生追求鲜花而帅哥不追求的话,同样牛粪先生也会得到鲜花小姐的 芳心。
不坦白
-8
0 -1 -1
博弈分析
囚徒2
坦白
不坦白
囚 徒1 坦白 -5 -5 0 -8
不坦白
-8
0 -1 -1
囚徒2
坦白
不坦白
囚 徒1 坦白 -5 -5 0 -8
不坦白
-8
0 -1 -1
纳什均衡的选择和分析方法扩展
•防共谋均衡
乙
L
R
甲 U 0, 0, 10 -5, -5, 0 D -5, -5, 0 1, 1, -5
博弈结果表
a
攻方
c
守方
B
C
-1
+1
+1
博弈论(第二章)讲义
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
博弈论基础教程教学设计 (2)
博弈论基础教程教学设计引言博弈论是数学的一个分支,研究在不同决策者的利益与互动下,如何进行最优选择,并通过程序设计和算法优化得出最优解。
它涉及许多领域,例如经济学、心理学、社会学、计算机科学等等。
本文将介绍博弈论基础教程的教学设计,主要面向计算机科学领域的初学者。
教学目标本课程的教学目标是使学生了解博弈论的基础概念和解法,并掌握以下内容:•博弈论概论•常用博弈模型的分析和求解方法•Nash均衡和博弈的稳定性•博弈的应用教学方法本教程采用多种教学方法,包括讲解、演示、练习和讨论等。
在课堂上,老师将主要采用讲解的方式向学生介绍博弈论的概念和解法,同时配以案例解析,并开设问答环节。
此外,老师将设计相关的程序实验和授课录屏,让学生更直观地理解和掌握相关知识。
学生需要在课后自行完成练习题和对案例的分析,并参加相应的讨论,以进一步巩固所学内容。
教学内容博弈论概论博弈论包括两部分:博弈和解决方式。
我们将重点介绍以下几个方面:•零和博弈和非零和博弈•完美信息博弈和不完全信息博弈•合作和非合作博弈•约束和非约束博弈常用博弈模型的分析和求解方法博弈论有许多用来建模和求解的模型。
在本课程中,我们将介绍以下模型:•囚徒困境•社交困境•保卫战争•博弈树Nash均衡和博弈的稳定性Nash均衡是指在一个博弈中,每个参与者都选择自己最优的策略,而无法通过单独改变策略来获得更好的结果。
在本课程中,我们将介绍以下内容:•Nash均衡的概念和计算方法•多元博弈的Nash均衡•博弈的稳定性博弈的应用博弈论在实际中有广泛的应用,例如电子商务、金融和投资、能源和环境等领域。
在本课程中,我们将介绍以下应用:•电子拍卖•股市交易和投资•能源和环境政策教学评估本教程采用多种教学评估方法,旨在全面地了解学生的掌握情况和学习效果,包括期末考试、平时作业、实验报告和课堂讨论等。
结论通过本教程的学习,我们希望学生能够初步掌握博弈论的基本概念和解法,了解博弈论在实际中的应用,并能够运用博弈论分析和解决一些实际问题。
博弈论导论 2
图 2-5 军备竞赛
思考:现实生活中还有哪些情况属于囚徒困境? 练习:将团队生产问题模型化成囚徒困境;如何理解囚徒困境与“看不见的手”之间 的矛盾?
2.1.5 走出囚徒困境
从社会福利的角度讲,囚徒困境不是帕累托最优的,但这与理性人的假设并不矛盾。
① ②
这实际上是 Betrand 价格竞争模型。 这是 Hardin(1968)发表在 Science 上但是被经济学引用最多的例子。但是,最近有学者提出了“反公地 悲剧”理论。董志强(2007)启发我使用这个简单的收益矩阵而非复杂的数学模型。 白鲨在线 2
2.3.2 性别战
如图 2-12。两个博弈相同的地方在于:(1)存在多重均衡,而且双方各自偏向一个 均衡;(2)任何一个均衡结果都是帕累托最优的。信念扮演了重要的作用。在这个博弈中, 假设男方是一个有名的拳击手,而女方也知道这点,那么(拳击,拳击)应该是一个均衡结 果,而(芭蕾,拳击)不应该出现。
白鲨在线 5
2.3.4 协调博弈
如图 2-14,史密斯公司和琼斯公司独立地决定选择何种智能手机操作系统。若两家公 司选择同样的操作系统,销售会更好。 特征:存在多重均衡,但是一些均衡帕累托优于另一些均衡,这与性别战和斗鸡博弈 都不同。 提示:一定要注意不同博弈模型的结构性特征,而不是过于关注具体数字。 思考:现实生活中有哪些博弈是性别战、斗鸡博弈和协调博弈?
图 2-1 双边优势
图 2-2 单边优势
2.1.2 定义优势策略均衡
并且,我们有 命题:如果一个博弈 N ,{Si }i 1 ,{vi ()}i 1 存在优势策略均衡 s ,那么 s 就是惟一的 优势策略均衡,并且也是惟一的纳什均衡。 证明过程略(可做思考题或作业)。
白鲨在线 1
博弈论讲义2
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,
博弈论课程设计 (2)
博弈论课程设计1、引言博弈论是现代数学中的一个重要分支,是由经济学家和数学家共同合作发展起来的。
博弈论主要研究人类社会中的决策行为和相互关系,以及在涉及决策行为和相互关系的情景中个体或组织如何做出理性的决策。
博弈论在生物学、心理学、社会学、管理学、工程学等领域也有广泛的应用。
在博弈论的学习过程中,理论与实践相结合是必不可少的。
本文将介绍一些博弈论的课程设计,旨在帮助学生更好地理解和应用博弈论的知识。
2、课程设计2.1 美国拍卖模拟实验美国拍卖是一种竞价拍卖。
在竞拍过程中,买家通过不断提高他们的出价来争夺商品,最后出价最高者获得商品所有权。
美国拍卖的特点是出价者可以随时根据拍卖过程中的信息改变他们的出价。
该模拟实验的目的是通过竞卖过程的模拟来让学生学习博弈论中的核心概念,如策略、博弈纳什均衡等。
该实验还可以帮助学生分析竞价策略与结果的关系,提高学生思考和策略制定的能力。
2.2 博弈纳什均衡实验博弈纳什均衡是博弈论中的一个重要概念。
在一个博弈中,如果所有参与者都选择了他们各自的最优策略,那么这个博弈就到达了一个均衡状态,称为纳什均衡。
该实验可以让学生自己尝试找到博弈的纳什均衡,提高学生的逻辑推理和自主思考能力。
同时,这个实验中涉及到的博弈模型也可以用来分析和解决现实生活中的问题。
2.3 连续混合策略实验连续混合策略是博弈论中的一个重要概念,它在实际应用中有广泛的应用。
在连续混合策略中,玩家有一个概率分布,他们可以随机选择他们的行动。
在竞争和合作的情况下,连续混合策略被用来描述下注、选择行为模型等。
在本实验中,学生将学习如何制定连续混合策略并评估它们的效果。
通过该实验,学生将加深对复杂博弈策略的理解和应用,提高学生的计算能力和分析能力。
3、结语博弈论不仅仅是一种专业的数学知识,它已经成为了理解和解决社会问题的一种重要的工具。
实践是理论的检验,课程设计可以帮助学生更好地理解和应用博弈论的知识。
希望本文介绍的三个课程设计能够为读者提供一些启示,帮助读者更好地理解博弈论的知识和应用。
博弈论(第二章)
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
博弈论Game Theory2
划线法
在具有策略和利益相互依存的博弈问题中,各个 博弈方的得益既取决于自己选择的策略,还与其 他策略方选择的策略有关。因此,博弈方在决策 时必须考虑其他博弈方的存在和策略选择。 依据这种思想,科学的决策思路应该是:找出自 己针对其他博弈方每种策略和策略组合的最佳对 策,即自己的可选策略与其他博弈方每种策略配 合,给自己带来最大得益的策略,然后通过对其 他博弈方策略选择的判断,预测博弈的可能结果 和确定自己的最优策略。
举例
古诺的寡头模型 设一市场有两家厂商生产同样的产品。如果厂商1 的产量为q1,厂商2的产量为q2,则市场总产量为 Q = q1 + q2 。设市场出清价格P(可以将产品全 部卖出去的价格)是市场总产量的函数P = P(Q) = 8 -Q。再设两厂商的生产都无固定成本,且每 增加一单位产量的边际成本相等,C1 = C2 = 2, 即它们分别生产q1和q2单位产量的总成本分别为2 q1和2 q2 。最后强调两厂商同时决定各自的产量, 即他们在决策之前都不知道另一方的产量。
求解纳什均衡
博弈方就是n个农户,他们各自的策略空间就是他 们可能选择的羊群数目qi(i=1,2, …,n),取值范围, 当各户羊群数为q1, …qn时,在公共草地上放牧羊群 的总数为Q= q1+ q2+…+ qn,,每只羊的产出应是羊 群总数Q的函数V=v(Q)=v(q1+ q2+…+ qn).假设每 只羊的成本是不变的常数c,则农户i养qi只羊的得益 函数为:
u i q i V ( Q ) q i c q iV ( q 1 q 2 q n ) q i c
续
假设 n 3 , 即只有三个农户,每只 羊的产出函 数为 V 100 Q 100 ( q 1 q 2 q 3 ), 而成本 c 4 .这时,三个农户的得益 函数分别为 u 1 q 1 [100 ( q 1 q 2 q 3 )] 4 q 1 u 2 q 2 [100 ( q 1 q 2 q 3 )] 4 q 2 u 3 q 3 [100 ( q 1 q 2 q 3 )] 4 q 3 把上述得益函数看作连 续函数。
博弈论各章节课后习题答案 (2)
π2
= (10 − 4 − 2q2 )q2
−
1 2
− 4q2 ,
∂π2 ∂q 2
= 6 − 4q2
−
4
=
0
,则有
q2=
1 2
,p=5,
π1=
3 2
,π2=0.
若进入者选择不进入:q2=0,p=6,
π1=
7 2
。
由以上计算分析可以看出,垄断在位者的威慑是可信的。垄断在位者的产量为 2,进入
者进入后无利可图,所以选择不进入。市场价格为 6。
(1)
( q1*, q*2,⋯, q*n )组成该博弈的纯策略纳什均衡点。
2
∑ 式(1)两边同时求和,可得:
n
q*i
=
Q*
=
n(a
−
c
−
Q* )
,于是
Q*
=
n (a n +1
−
c)
,
i =1
q*
=
a
−c
−
Q*
=
a−c n +1
,此时
p*=a-Q*=
a + nc n +1
,当
n
趋于无群大时,有
Q*=a-c,
所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。
该博弈还有一个混合的纳什均衡(( 10 , 1 ),( 10 , 1 ))。 11 11 11 11
如果乙企业所在国政府对企业开发新产品补贴 a 个单位,则收益矩阵变为:
⎡−10,−10 + a ⎢⎣ 0,100 + a
100,0⎤ 0,0 ⎥⎦
4. 用图解法求矩阵博弈的解。
博弈论2纳什均衡及应用举例
有限策略与无限策略同时存在一个博弈问题中
零和博弈
零和博弈: 社会总得益,即各博弈方得益之和总是为 0 猜硬币方
正面 正 面 反 面 反面
盖 硬 币 方
-1,1
1,-1
1,-1
-1,1
零和博弈
零和博弈的特点:
各博弈方之间的利益对立,“你死我活”的 关系,结果不能完全确定,不能让他们猜出 自己将选择的策略 用零和博弈构成的重复博弈与非零和博弈构 成的重复博弈会表现出很大的不同,零和博 弈重复进行多次不改变博弈方之间相互对立 的关系,其他博弈的重复博弈产生新的机会
Complete and Perfect ——完全信息与完美信息
如房地产开发博弈中,如果至少有一个 参与人不知道市场需求的大小,信息是 不完全的也是不完美的 如果两个参与人都知道市场需求是大的 还是小的,信息是完全的,但如果A不知 道B选择了什么行动,那么A的信息是不 完美的。
支付Payoff
ui=ui(s1,,…si,…sn),
房地产开发博弈
参与人的利润水平即是他们的支付,如果A,B 同时行动
UA(需求大,A开发, B开发)=UB(需求大,A开发, B开 发)=4000 UA(需求小,A开发, B开发)=UB(需求小,A开发, B开 发)=-3000 UA(需求大,A开发, B不开发)=8000 UB(需求小,A不开发, B开发)=1000。。。。。。 例如A认为高需求的概率是0.5 ,给定B选择开发,A选 择开发的期望效用为: EuA(开发,开发)=0.5*4000+0.5*(-3000)=500
Complete and Perfect ——完全信息与完美信息
博弈论讲义2
三 重复剔除的占优均衡
重复剔除严格劣策略:
思路:首先找到某个参与人的劣策略(假定存 在),把这个劣策略剔除掉,重新构造一个不包 含已剔除策略的新的博弈,然后再剔除这个新的 博弈中的某个参与人的劣策略,一直重复这个过 程,直到只剩下唯一的策略组合为止。 这个唯一剩下的策略组合就是这个博弈的均衡 解,称为“重复剔除的占优均衡”。
独木桥
进
A
退
B
进退 -3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进
斗鸡博弈
村子里有两户富户,有两种可能:一家修,另 一家就不修;一家不修,另一家就得修。
冷战期间美苏抢占地盘:一方抢占一块地盘, 另一方就占另一块。
夫妻吵架,一方厉害,另一方就出去躲躲。
注意:在混合策略纳什均衡条件下,也可能两 败俱伤。
注意: 如果所有人都有(严格)占优策略存在,
那么占优策略均衡就是可以预测的唯一 均衡。 占优策略只要求每个参与人是理性的, 而不要求每个参与人知道其他参与人是 理性的(也就是说,不要求理性是共同 知识)。为什么?
二 占优策略均衡
案例-囚徒困境
囚徒A
囚徒 B
坦白
坦白 -8,-8
抵赖
0,-10 -8大于-10
相安无事;第二天,相安无事……;直到第100天 ,突然,每个妻子都把丈夫杀了。为什么会这样?
这是一个推理和行动的过程。如果她的丈夫不忠的话,她就杀 死他;如果没有证据证明她的丈夫不忠的话,她便相信他,不 杀死他。
如果村里只有一个男人是不忠的话,在老太太作了宣布之
后的第一天,这个男人的妻子在老太太宣布之后马上就能知道
两只猪一起去按,然后一起回槽边进食, 由于大猪吃得快可吃下8个单位的食物, 小猪只能吃到2个单位食物。
博弈论系列教程 (2)
Ø博弈论术语?
第一节 博弈三要素
Ø一、博弈论释义 Ø对智能的理性决策者之间冲突与合作
的数学模型的研究(Roger B. Myerson)
第一节 博弈三要素
Ø二、博弈三要素 Ø(一)参与人(局中人)
Ø一个博弈中的决策主体,i=1,2,…,n Ø1.目的
Ø通过选择行动,使个体效用最大化 Ø2.特征:智能的、理性的
第一节 博弈三要素
Ø二、博弈三要素 Ø(四)补充:其他要素 Ø2.均衡
Ø所有参与人的最优策略组合
si* si ',有ui (si*, si ) ui (si ', si ) 最优策略组合:s* (s1*,, si*,, sn*)
第一节 博弈三要素
Ø二、博弈三要素 Ø(四)补充:其他要素 Ø3.结果
c +1,-1 -1,+1
第二节 模型:诺曼底战役模拟
Ø三、分析:盟军司 令罢工吗?
Ø(三)结论 Ø双方各以50%的概
率取胜
BC a -1,+1 +1,-1 c +1,-1 -1,+1
诺贝尔经济学奖:博弈论的辉煌
1994年,纳什、泽尔腾、海萨尼 贡献:非合作博弈理论中的均衡问题 1996年,James A. Mirrlees, William Vickrey, 贡献:不对称信息条件下的激励经济理论 2001年,乔治·阿克洛夫、迈克尔·斯彭斯、约瑟夫·斯
第三节 博弈的表现形式与分类
Ø二、分类 Ø(五)标准五:所有各种策略组合下,
全体参与人得益总和是否为常数
Ø2.非零和博弈 Ø(2)变和博弈
Ø零和博弈和常和博弈以外的所有博 弈
Ø产量博弈、制式问题
博弈论(2)专业知识
假如你是第一种强盗,你该怎样提出分配 方案才干使自己旳收益最大化呢?
博弈论2023
45
➢ 启示:第五人看似安全,其实并没利益,因 为威胁不可置信。收买失意者更为轻易
为何革命者总是找穷苦人? 为何恐怖分子在阿富汗受欢迎? 为何组织中旳一把手,经常抛开二号人物, 而与会计出纳打得火热?
策略组合s*,对于任意旳ε,存在着一种位于 [0,1]区间上旳正数向量δ1,…,δn和一种完全 混合策略向量σ1,…,σn,使得每一种策略都被策 略(1-δi)si+δiσn所取代旳新博弈有一种纳什均衡, 且该纳什均衡中旳每一种策略和s*旳距离不大于ε。
博弈论2023
35
例: 出 史密斯 进
(1,1) 上
注:不完全信息不等于不对称信息
博弈论2023
8
例:扑克牌游戏下注前行为规则。
(1)全部牌洗成面朝上; (完美,拟定)
(2)全部牌洗成面朝下且不能看自己旳牌; (不完全,对称,拟定)
(3)全部牌洗成面朝下且参加人只能看自己旳牌; (不完全,不对称,拟定)
(4)全部牌洗成面朝上,但每个参加人随即都能够 用手护住并悄悄丢掉一张牌;
博弈论2023
4
博弈论2023
5
博弈论2023
6
博弈论2023
7
➢信息类型
完美perfect:每个信息集都是单结旳。
完全complete:自然(类型或支付)不首先 行动或它旳最初行动被全部人观察到。
拟定certain:自然(类型或支付)不在任何一 种参加人行动之后行动。
对称symmetric:没有人在行动时或终点结 处拥有与其他人不同旳信息。
第08章--博弈论和信息经济学 (2)全篇
2、纳什均衡(Nash equilibrium) 给代对手的选择行为后,博弈方选择了选择了他
所能选择的最好策略(或采取了他所能采取的最 好行动)。 一般来说,上策均衡一定是纳什均衡,但并非每 一个纳什均衡都是上策均衡。 因为一个参与者的上策均衡对于其他任何策略而 言都是最优的。 而纳什均衡的前提条件是给定竞争对手的选择行 为。 所以,上策均衡是纳什均衡的特例。
古董(他们坐店收购时从来不先出价,卖猫的故事) 企业选择员工 保险销售
至少有一个人不知道其他人的支付函数,即形成 “不完全信息博弈”
1、不完全信息静态博弈:贝叶斯均衡 仍以市场进入为例。
在某些情况下, “极大化极小策略”所达 到的均衡也是一种纳什均衡。
例如“囚徒困境”中的两囚徒都交待的策 略。
四、完全信息动态博弈
在完全信息静态博弈的条件下,博弈方的 策略决定都是一次性同时做出。而在完全 信息动态博弈种,博弈方的策略选择是有 先有后。而且一般都会持续一个较长的时 期。
该条件下的策略及策略选择会有什么新的 特征呢?
在实际生活中这样的例子有很多,如“上 有政策、下有对策”等。
4、威胁与承诺的可信性
上面已谈过,有些威胁是不可信的。但有 些威胁是可信的。
一种威胁在什么条件下会变得可信呢? 例如: 两家生产冰箱的厂商均打算转产空调,其
得益矩阵如下:
两厂商的得益矩阵 厂商 1
空调 冰箱
厂 空调 20,25 80,28
这也是“两害相衡取其轻”。
该策略强调在所能选择的各种最小得益中 取得益的最大化。这被称为“极大化极小 策略”(Maxmin strategy)
如果博弈的双方都采取“极大化极小策 略”,则均衡解就是(1,1)。
这一解虽没实现一般意义上的利益最大, 却保证了利益不是最小。避免了可能遭受 的巨大损失。
博弈论习题参考答案(2)
《博弈论》习题参考答案(第2次作业)一、选择题1.B2.C3.A4.A5.B6.ABCD7.C 8.B 9.C二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。
8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高三、计算与分析题1、 (1)画出A 、B 两企业的损益矩阵。
(2)求纯策略纳什均衡。
(做广告,做广告)2、画出两企业的损益矩阵求纳什均衡。
(1)画出A 、B 两企业的损益矩阵(2)求纳什均衡。
两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下:甲乙 左 右 上 下(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>? 答:a>e, b>d, f>h, g<c(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足? 答:a>e, b>d 4、答:(1)将这一市场用囚徒困境的博弈加以表示。
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
博弈论的经典案例(2)
博弈论的经典案例(2)博弈论的经典案例篇4:哈佛大学一位教授提出了这样一个博弈模型:有三个枪手,第一个枪手A的命中率是80%,B是60%,C是40%。
他们同时举枪瞄准、同时射击另两个人中的一个,要尽可能消灭对手,每个人一次机会,一颗子弹,目标是努力使自己活下来。
谁活下来的可能性最大?如果你认为枪法最准的A胜出,那么你就错了。
我们来看,如果你是A,你毫无疑问的会瞄准对你威胁最大的B,而B也会瞄准对他威胁最大的A,而C则也可能瞄准A,那么三个人存活的概率都是多少呢?A = 100% - 60% - (1-60%)* 40% = 24%B = 100% - 80% = 20% (因为命中率为80%的A在瞄准他)C = 100% (因为没有人瞄准他)原来,枪法最不准的C竟然活了下来。
那么,换一种玩法呢?如果三个人轮流开枪,谁会生存下来?如果A先开枪的话,A还是会先打B,如果B被打死了,则下一个开枪的就是C,那么此时A生存的概率为60%,而C依然是100%(他开过枪后A没有子弹了,游戏结束);如果打不死B,则下一轮在B开枪的时候一定会全力回击,A的生存率为40%,不管是否打死A,第三轮AB的命运都掌握在C的手里了。
那么,如果游戏规则规定必须由C先开枪,如果你是C怎么才能让自己活下来呢?答案是胡乱开一枪,只要不针对AB任何一人即可。
当C开枪完毕,AB还是会陷入互相攻击的困境。
博弈论的经典案例篇5:“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章完全信息静态博弈博弈论的基本概念及战略式表述纳什均衡纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性第一节博弈论的基本概念与战略式表述博弈论的基本概念与战略式表述博弈论(game theory )是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述:G={N,(S i )i ∈N ,(U i )i ∈N }有三个基本要素:(1)参与人(players )i ∈N={1,2,…,n};(2)战略(strategies ),s i ∈S i (战略空间);(3)支付(payoffs ),u i =u i (s -i ,s i )。
均衡与均衡结果均衡战略(坦白,坦白)均衡支付(-6,-6)第二节纳什均衡占优战略均衡重复剔除的占优战略均衡纳什均衡完全信息静态博弈的几点特性同时出招,出招一次;知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的承诺(非合作)一、占优战略均衡占优战略:不管对手战略为何,该参与人可找到一最佳战略。
定义:在博弈G={N,(S i )i ∈N ,(U i )i ∈N }中,如果对所有的参与人i,s i *是它的占优战略,那么所有参与人选择的战略组合(s 1*,…,s n *)成为该对策的占优战略均衡。
“囚犯困境”的扩展两个寡头企业选择产量公共产品的供给军备竞赛经济改革结论:一种制度安排,要发生效力。
必须是一种纳什均衡;否则,制度安排便不能成立。
案例2:智猪博弈猪圈里圈两头猪,一头大猪,一头小猪。
猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。
按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。
若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。
支付如表。
智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈公共产品的提供(富户与穷户)改革中不同利益分配对改革的推动二、重复剔除的占优战略均衡 绝对劣势战略:s i 是一绝对劣势战略当且仅当存在另一战略s i ’∈S i 使得u i (s i ,s -i )< u i (s i ’,s -i ) 对所有s -i ∈S -i 均成立。
(s i ’未必是优势战略)重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。
三、纳什均衡定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s 1*,…,s n *)=(s i *,s -i *)是一纳什均衡,当且仅当对所有参与人而言,u i (s i *,s -i *)≥u i (s i ’,s -i *)对所有s i ’∈S i 均成立。
简单而言,当s 1*是对s 2*的最适反应,s 2*也是s 1*的最适反应时,(s 1*,s 2*)就是二人博弈的纳什均衡。
命题1:纳什均衡在占优战略重复剔除解法中不会被剔除 命题2:重复剔除的严格占优战略均衡一定是纳什均衡。
第三节纳什均衡应用举例古诺(Cournot)寡头模型沙滩卖冰豪泰林(Hotelling)价格竞争模型公共地的悲剧一、古诺寡头模型特点:存在两家厂商;同时行动确定产量。
通过预测另一家厂商的产量来选择自己的利润最大化产量,寻求预测均衡。
厂商1表示为:max p(y 1+y 2e )y 1-c(y 1),得出y 1=f 1(y 2e ),同理得出y 2=f 2(y 1e ),称为反应函数,两条曲线的交点为古诺模型的解。
y1例题:古诺模型的解假设p=a-(y1+y2),C1=y1c,C2=y2c则根据利润最大化的一阶条件分别得到反应函数y 1=f1(y2)=(a-y2-c)/2,y 2=f2(y1)=(a-y1-c)/2,求出均衡产量为(1/3(a-c),1/3(a-c)),为纳什均衡,均衡利润为(1/9(a-c)2,1/9(a-c)2)古诺模型的解:与垄断市场的比较假设为一垄断企业,则有:Max π=y(a-y-c), 得到垄断企业的最优产量y=1/2(a-c) <y 1+y 2=2/3(a-c)垄断利润为π=1/4(a-c)2 >2/9(a-c)2 寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。
三、豪泰林模型寡头企业竞争战略是价格伯川德(Bertrand)模型:产品同质,均衡价格等于边际成本,类似于完全竞争市场均衡。
豪泰林(Hotelling)模型:存在产品差异,均衡价格不等于边际成本,垄断性提高豪泰林模型:以空间上差异为例根据两个商店的利润函数,π1=(p 1-c)x, π2=(p 2-c)(1-x)选择使利润最大化的价格,得到一阶条件,求得p 1*=p 2*=c+t,均衡利润π1=π2=t/2旅行成本越高,产品差异越大,均衡价格从而均衡利润也越高。
原因:随着旅行成本上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强, 当旅行成本为零时,不同商店的产品之间具有完全的替代性,则为伯川德均衡结果。
四、公共地的悲剧生物学家和生态学家哈丁(Garrett Harden)在《科学》(1968年,第162卷)发表《公地的悲剧》。
考虑一块对所有的人都开放的牧场,在着的制度下,可以预期,每一个放牧的人都会在公地上放牧尽可能多的牲口。
增加一头牲口既有正效用,也有负效用。
正效用是牲口的销售收入,增加一头为+1负效用使每增加一头带来的过度放牧的损失,每一个放牧着承担-1/n放牧者合理的决策是增加牲口,直至马瘦毛长,公地毁灭。
四、公共地的悲剧资源没有排他性产权:草地放牧、公海捕鱼、小煤窑的过度开发;另一类是人们向其中排放废物的公地。
草地放牧:n个农民,每个拥有羊的数量为g i,G=Σg i,v(G)代表每只羊的价值,与草地上放牧的总数G相关,饲养量增加到一定程度,随着数量继续增加,羊的价值会下降,即v’(G)<0农民的利润函数πi=g i v(Σg j)-g i c最优化的一阶条件:∂πi/∂g i=v(G)+g i v’(G)-c=0增加一只羊有正效应(羊的价值)、负效应(新增羊使之前所有羊的价值下降)个人边际成本小于社会边际成本,个人最优决定的饲养总量大于社会最优决定的饲养总量“斗鸡博弈”的扩展夫妻间吵架警察与游行队伍公共产品的供给(两富户修路)第四节混合战略纳什均衡混合战略(mixed strategies)定义:σ*=(σ1*,…,σn *)=(σi *,σ-i *)是一纳什混合战略均衡,当且仅当对所有参与人而言,σi *是σ-i *的最适反应,u i (σi *,σ-i *)≥u i (σI ’,σ-i *),对所有σi ’∈Σi 成立)。
持混合战略的前提是在均衡时两种战略的报酬会相等,是预期支付最大化的推导结果。
掷硬币的分析给定参与人1(q,1-q),参与人2的支付是:q+(-1)(1-q)(正面)=(-1)q+(1-q)(反面); 给定参与人2(p,1-p),参与人1的支付为:p(-1)+(1-p)(正面)=p+(-1)(1-p)(反面); 求得(1/2,1/2)是纳什混合战略均衡如果两种战略报酬不相等,那么就变为纯战略(pure strategies)了。
混合战略均衡的博弈原则两博弈方不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性;两博弈方选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风。
例:在掷硬币的博弈中,参与人1选正面、反面的概率q,1-q,一定要使参与人2选正面的和反面的期望得益相等。
单纯战略与混合战略的定义G={N,S,U}是一个战略式有限博弈,参与人i 的战略空间S中的任一元素s i 称为i的一个单纯战略(pure strategy);定义在S i 上的一个概率分布函数p i (s i )代表了一个混合战略(mixed strategy)——这个战略的内容是:参与人i以概率p i (s i j )选择单纯战略s i j ,而Σp i (s i j )=1。
单纯战略是混合战略的特例,因为任一单纯战略s i 都可以理解为i以概率1选择s i ,以0概率选取其他所有单纯战略。
引入混合战略,参与人的目标需要修改为“最大化自己的期望支付”Selton:小偷和守卫的博弈一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为V的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。
设小偷被抓后要坐牢,负效用为-P,守卫睡觉而未遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用为-D。
而如果小偷不偷,则他既无得也无失,守卫不睡意味着出一份力挣一分钱,他也没有得失。
(守卫睡的概率)齐威王田忌赛马古代齐威王与大将田忌赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。
比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔1000斤铜给赢方。
双方的马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下。
实际上,田忌的上马、中马要优于齐威王的中马、下马。
比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以2:1赢得比赛。
齐威王田忌赛马前述为单方面运用策略的故事,如果齐威王预料到田忌的做法,必然会改变各匹马出场的次序。
本博弈中博弈双方的利益是完全对立的,是严格竞争的零和博弈,不会有纯策略纳什均衡,必然是一个混合策略均衡。
假设齐威王采取六种战略的概率分别为p a,p b,p c,p d,p e,p f(加总为1),则田忌采取六种战略的期望得益相等,则得出齐威王与田忌均以1/6的相同概率随机选择各自的六个纯策略,构成本博弈唯一的混合策略纳什均衡。
齐威王田忌赛马在上述混合策略下,齐威王的期望得益为1/6(3+1+1+1+1-1)=1;田忌的期望得益为1/6(1-3-1-1-1-1)=-1,即多次进行这样的赛马,齐威王平均每次能赢田忌1000斤铜,这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故混合策略反应函数将博弈方的策略空间扩展到包括混合策略,将纳什均衡扩展到包括混合策略纳什均衡以后,求纳什均衡反应函数的分析方法也可以扩展到求混合策略纳什均衡。
反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反映决策构成的函数。
在纯策略的范畴内,反应函数是各博弈方选择的纯策略对其他博弈方纯策略的反应。
在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应。