博弈论(2)
博弈论2-2. sequential bargaining
2
大连理工
张醒洲
2014/3/5
动态博弈
博弈的扩展式表示 反向归纳法
3
大连理工
张醒洲
2014/3/5
序惯谈判
• 一个三阶段谈判模型 • 鲁宾斯坦 (1982)模型
2014/3/5
大连理工
张醒洲
4
一个三阶段谈判模型
参与人1和2就一美元的分配进行谈判。他们轮 流提出方案:首先参与人1提出一个分配方案,参 与人2可以接受或拒绝;如果参与人2拒绝,就由参 与人2提出分配建议,参与人1选择接受或拒绝;如 此进行下去。 一个方案一旦被拒绝,它就不再有任何约束力, 并与博弈后续进程不再相关。每一个方案都代表博 弈的一个阶段,参与人都没有足够的耐心:他们对 后面阶段得到的收益进行贴现,每一阶段的贴现因 子为δ,这里0 <δ< 1。
s2都可立即
拿到),或者拒绝这一条件(在这种情况下,博弈将继续 进行,进入第三阶段);
大连理工 张醒洲 7
一个三阶段谈判模型: 时间顺序
(3) 一旦进入第三阶段,参与人1得到美元的s
,参与人2得到1-s,这里 0 <
s
< 1。
大连理工
张醒洲
8
一个三阶段谈判模型
阶段 1
提议(s1, 1-s1)
阶段 2
• 如果第3阶段开始的博弈均衡是( s, 1-s)的话,前述三 阶段博弈开始时第1人的最优方案是(1-δ(1- δs), δ(1- δs)) • 对无限期讨价还价博弈,第一阶段开始时参与者1提出的 最优方案是s, 且有
S= (1-δ(1- δs), δ(1- δs)) 即 S= 1/(1+δ)
2014/3/5 大连理工 张醒洲 13
博弈论(第二章)讲义
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
博弈论第2章
• 托玛斯 谢林(Thomas C. Schelling )84岁,美国公民。他1951年 托玛斯-谢林( 谢林 岁 美国公民。 年 获得哈佛大学经济学博士学位。 获得哈佛大学经济学博士学位。后曾在美国哈佛大学的肯尼迪学 院教学长达20 20年 担任政治经济学教授, 院教学长达20年,担任政治经济学教授,并获得退休名誉教授 的称号。之后他还在美国马里兰大学公共政策学院和经济系担任 的称号。 教授,并获得退休名誉教授称号。 教授,并获得退休名誉教授称号。他教授的课程除包括经济学理 论外,还涉及外交、国家安全、核战略以及军控等多方面。 论外,还涉及外交、国家安全、核战略以及军控等多方面。
贡献:《冲突战略》、《武器与影响》等,其中前者是相关领域中最具 开创性的理论著作之一。他的理论和思想不仅运用在经济学分析中,在外 交、军事领域也深有影响。
Robert J. Aumann
Thomas C. Schelling
罗伯特·奥曼的博弈论
• • • • • 弈论:交互式条件下“最优理性决策” 完全竞争经济:参与者连续统模型 重复博弈论:理论系统性的发展 合作与非合作博弈论:非转移效用与理性的假设 其他贡献 “奥曼可衡量选择定理”、值集函数积分结 果等 评论:
博弈论的形成
博弈论的真正起点 博弈论的真正起点—— 真正起点—— 诺伊曼、 1944年 冯 诺伊曼、摩根斯坦 1944年《博弈论和经济行 Behavior) 为》 (Theory of Games and Economic Behavior) 在这本著作中引进了扩展形(Extensive Form)表 在这本著作中引进了扩展形( 扩展形 ) 示和正规形(Normal Form)或称策略形(Strategy 示和正规形( )或称策略形( 正规形 Form)、矩阵形(Matrix Form)表示,定义了极小化 )、矩阵形 )、矩阵形( )表示,定义了极小化 ),提出了稳定集( 极大解( ),提出了稳定集 极大解(Minmax Solution),提出了稳定集(Stable Sets)解概念等,正式提出了创造一种博弈论的一般理 )解概念等, 论的主意
博弈论导论 2
图 2-5 军备竞赛
思考:现实生活中还有哪些情况属于囚徒困境? 练习:将团队生产问题模型化成囚徒困境;如何理解囚徒困境与“看不见的手”之间 的矛盾?
2.1.5 走出囚徒困境
从社会福利的角度讲,囚徒困境不是帕累托最优的,但这与理性人的假设并不矛盾。
① ②
这实际上是 Betrand 价格竞争模型。 这是 Hardin(1968)发表在 Science 上但是被经济学引用最多的例子。但是,最近有学者提出了“反公地 悲剧”理论。董志强(2007)启发我使用这个简单的收益矩阵而非复杂的数学模型。 白鲨在线 2
2.3.2 性别战
如图 2-12。两个博弈相同的地方在于:(1)存在多重均衡,而且双方各自偏向一个 均衡;(2)任何一个均衡结果都是帕累托最优的。信念扮演了重要的作用。在这个博弈中, 假设男方是一个有名的拳击手,而女方也知道这点,那么(拳击,拳击)应该是一个均衡结 果,而(芭蕾,拳击)不应该出现。
白鲨在线 5
2.3.4 协调博弈
如图 2-14,史密斯公司和琼斯公司独立地决定选择何种智能手机操作系统。若两家公 司选择同样的操作系统,销售会更好。 特征:存在多重均衡,但是一些均衡帕累托优于另一些均衡,这与性别战和斗鸡博弈 都不同。 提示:一定要注意不同博弈模型的结构性特征,而不是过于关注具体数字。 思考:现实生活中有哪些博弈是性别战、斗鸡博弈和协调博弈?
图 2-1 双边优势
图 2-2 单边优势
2.1.2 定义优势策略均衡
并且,我们有 命题:如果一个博弈 N ,{Si }i 1 ,{vi ()}i 1 存在优势策略均衡 s ,那么 s 就是惟一的 优势策略均衡,并且也是惟一的纳什均衡。 证明过程略(可做思考题或作业)。
白鲨在线 1
博弈论讲义2
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,
2 完全信息静态博弈--博弈论
Then 1 should choose “a”.
– Player 1’s best response to “B” is “a”.
Strategy a b c
A
12,11 11,10 10,15
Player 2
B
11,12 10,11 10,13
C
14,13 12,12 13,14
Player 1
2.1.3 上策均衡
上策
– 在某个博弈中,不管其他博弈方选择什么策 略,一博弈方的某个策略给他带来的得益始 终高于其它策略,至少不低于其它策略。
上策均衡
– 一个博弈的某个组和策略中的所有策略都是 各个博弈方各自的上策。这样的策略组合为 该博弈的一个“上策均衡”。
智猪博弈(boxed pig game)
Exercise: 田忌赛马
每次双方各出三匹马,一对一比赛三场,每一 场的输方要赔一千斤铜给赢方。
齐王的上、中、下三匹马分别比田忌的上、中、 下马略胜一筹。但田忌的上马比齐王的中马和 下马好,中马比齐王的下马好。
扩展成一个博弈问题,写出支付矩阵。
田忌
上中下 上下中 中上下 中下上 下上中 下中上 上中下 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1
Scenario Analysis
Similarly, if 1 thinks 2 will choose C…
– Player 1’s best response to “C” is “a”.
Player 2
Player 1
Strategy a b c
A
12,11 11,10 10,15
B
11,12 10,11 10,13
复旦大学经济博弈论课件--经济博弈论(2)
保证提高C , 或者说卖方
好
1
差
的得益。
1 低价
1
设 C0
高价
高价
低价
赔偿 V W
2
2
买
不买
买
不买
(Ph,VPh) (0,0) ( P+h WV, V P) h(0,0) ( ,PVl )P(l0,0) ( ,WPl ) P(l0,0)
2021/3/11
31
市场完全成功的完美贝叶斯均衡
策略和判断: 卖方在车好时要高价,
要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方 的均衡策略决定
要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各 博弈方在此处可能有的均衡策略决定
2021/3/11
9
6.2.2 均衡要求的初步解释
1、判断的必要性 2、序列理性要求——实质是利益最大化要求 3、判断与策略的一致性:符合策略和BAYES法则
p(g | h) 1, p(b | h) 0 p(g | l) 0, p(b | l) 1
2021/3/11
28
其他均衡: 市场部分成功
C Ph pg (v Ph ) pb (w Ph ) 0
市场完全失败
C 0 pg (v Ph ) pb (w Ph ) 0
市场接近失败
12
6.2.3 关于判断形成的进一步解释
二手车交易为例
好1差
1 不卖 1
卖
卖
不卖
2
买 不买 买 不买
p(g | s) p(g) p(s | g) p(s)
p(g) p(s | g)
p(g) p(s | g) p(b) p(s | b)
博弈论Game Theory2
划线法
在具有策略和利益相互依存的博弈问题中,各个 博弈方的得益既取决于自己选择的策略,还与其 他策略方选择的策略有关。因此,博弈方在决策 时必须考虑其他博弈方的存在和策略选择。 依据这种思想,科学的决策思路应该是:找出自 己针对其他博弈方每种策略和策略组合的最佳对 策,即自己的可选策略与其他博弈方每种策略配 合,给自己带来最大得益的策略,然后通过对其 他博弈方策略选择的判断,预测博弈的可能结果 和确定自己的最优策略。
举例
古诺的寡头模型 设一市场有两家厂商生产同样的产品。如果厂商1 的产量为q1,厂商2的产量为q2,则市场总产量为 Q = q1 + q2 。设市场出清价格P(可以将产品全 部卖出去的价格)是市场总产量的函数P = P(Q) = 8 -Q。再设两厂商的生产都无固定成本,且每 增加一单位产量的边际成本相等,C1 = C2 = 2, 即它们分别生产q1和q2单位产量的总成本分别为2 q1和2 q2 。最后强调两厂商同时决定各自的产量, 即他们在决策之前都不知道另一方的产量。
求解纳什均衡
博弈方就是n个农户,他们各自的策略空间就是他 们可能选择的羊群数目qi(i=1,2, …,n),取值范围, 当各户羊群数为q1, …qn时,在公共草地上放牧羊群 的总数为Q= q1+ q2+…+ qn,,每只羊的产出应是羊 群总数Q的函数V=v(Q)=v(q1+ q2+…+ qn).假设每 只羊的成本是不变的常数c,则农户i养qi只羊的得益 函数为:
u i q i V ( Q ) q i c q iV ( q 1 q 2 q n ) q i c
续
假设 n 3 , 即只有三个农户,每只 羊的产出函 数为 V 100 Q 100 ( q 1 q 2 q 3 ), 而成本 c 4 .这时,三个农户的得益 函数分别为 u 1 q 1 [100 ( q 1 q 2 q 3 )] 4 q 1 u 2 q 2 [100 ( q 1 q 2 q 3 )] 4 q 2 u 3 q 3 [100 ( q 1 q 2 q 3 )] 4 q 3 把上述得益函数看作连 续函数。
第二讲纳什均衡
习题:齐威王田忌赛马矩阵
上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡
博弈论2纳什均衡及应用举例
有限策略与无限策略同时存在一个博弈问题中
零和博弈
零和博弈: 社会总得益,即各博弈方得益之和总是为 0 猜硬币方
正面 正 面 反 面 反面
盖 硬 币 方
-1,1
1,-1
1,-1
-1,1
零和博弈
零和博弈的特点:
各博弈方之间的利益对立,“你死我活”的 关系,结果不能完全确定,不能让他们猜出 自己将选择的策略 用零和博弈构成的重复博弈与非零和博弈构 成的重复博弈会表现出很大的不同,零和博 弈重复进行多次不改变博弈方之间相互对立 的关系,其他博弈的重复博弈产生新的机会
Complete and Perfect ——完全信息与完美信息
如房地产开发博弈中,如果至少有一个 参与人不知道市场需求的大小,信息是 不完全的也是不完美的 如果两个参与人都知道市场需求是大的 还是小的,信息是完全的,但如果A不知 道B选择了什么行动,那么A的信息是不 完美的。
支付Payoff
ui=ui(s1,,…si,…sn),
房地产开发博弈
参与人的利润水平即是他们的支付,如果A,B 同时行动
UA(需求大,A开发, B开发)=UB(需求大,A开发, B开 发)=4000 UA(需求小,A开发, B开发)=UB(需求小,A开发, B开 发)=-3000 UA(需求大,A开发, B不开发)=8000 UB(需求小,A不开发, B开发)=1000。。。。。。 例如A认为高需求的概率是0.5 ,给定B选择开发,A选 择开发的期望效用为: EuA(开发,开发)=0.5*4000+0.5*(-3000)=500
Complete and Perfect ——完全信息与完美信息
MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡
Page 32
如果其他牧民约束放牧规模,我单独一家人过度放 牧不会破坏广褒的牧场,但自己却获得了高额的收益。 因此,任何一位牧民的结论都会是:无论其他牧民是否 过度放牧,我选择“约束自己的放牧规模”都是劣战略, 从而被剔除。大家最终都会选择过度放牧,结果导致草 地消失,生态破坏。
内蒙古草原的沙漠化
三、囚徒困境详解和延伸
1、囚徒困境详解
Page 17
囚徒乙
S i 称为占优策略,或占优于其他策略 坦白
抵赖
囚徒甲 坦白 -8,-8 0,-10
抵赖 -10,0 -1,-1
占优策略均衡 囚徒甲
坦白 抵赖
囚徒乙
坦白
抵赖
-8,-8
0,-10
-10,0
-1,-1
Page 18
每个参与人组成的优势策略称为占优策略均衡。 甲和乙都不会选择劣战略“抵赖”,称为“剔除劣战略的占优战 略均衡”。其中“坦白”是占优于(优于)“抵赖”的占优战略。
2、囚徒困境特点
Page 19
•利己、理性
•非合作
•存在严格劣策略
囚徒困境假定每个参与者(即“囚徒”)都是利己的, 即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他 策略要低的话,此策略称为“严格劣势”,理性的参与者绝 不会选择。另外,没有任何其他力量干预个人决策,参与者 可完全按照自己意愿选择策略。
解决方案
Page 7
这么一直迭代下去,理论上如果所有学生都是 理性人。平均数应当是1。应该说选择了1的学生都 看出了这个博弈的窍门。但是他们的选择不是最接 近平均数的。因为在现实中不可能所有人都是理性 人。
最终12是最接近平均数2/3的数。
博弈论心得体会(2篇)
博弈论心得体会博弈论是一门研究决策和策略的学科,旨在分析不同参与者之间的冲突和合作关系,并寻找最优的决策策略。
在学习博弈论的过程中,我获得了一些重要的心得体会。
首先,博弈论的核心是理性决策。
博弈论的参与者通常都是理性的,他们会在选择策略时权衡利益并优化自己的收益。
这使得博弈论能够提供一种理性决策的分析框架,帮助我们理解和预测人们的决策行为。
其次,博弈论的分析需要建立准确的模型。
在博弈论中,我们需要通过建立准确的模型来描述参与者的行为和目标。
这包括确定参与者的策略空间、支付函数和信息条件等。
只有建立准确的模型,我们才能进行有效的分析和预测。
第三,博弈论强调策略选择的相互依赖性。
在博弈论中,参与者的决策往往会受到其他参与者的行为影响,他们需要考虑其他参与者的可能策略和反应。
这种相互依赖性使得博弈论的分析更加复杂,我们需要考虑不同策略选择下的不确定性和风险。
第四,博弈论能够解决冲突和合作关系。
博弈论能够帮助我们理解和分析不同参与者之间的冲突和合作关系。
通过博弈论的分析,我们可以找到最优的决策策略,并协调各方的利益,实现合作和互惠关系。
博弈论的思想和方法在经济、政治和社会等领域都有广泛的应用。
第五,博弈论的应用具有时效性和实用性。
博弈论的分析方法可以用于解决各种实际情况下的决策问题,包括竞争性市场的定价策略、国际关系中的冲突博弈、企业的战略选择等。
博弈论提供了一种系统和科学的分析框架,帮助我们作出更好的决策。
最后,博弈论的研究需要综合运用多种方法。
博弈论的研究需要综合运用数学、统计学和经济学等多种方法。
我们需要运用数学模型来描述参与者的行为和策略选择,利用统计分析来预测和验证模型的结果,借助经济学知识来理解和解释实际情况中的决策行为。
只有综合运用多种方法,我们才能全面、深入地分析和理解博弈论中的问题。
总之,博弈论是一门重要的学科,它提供了一种理性决策的分析框架,帮助我们理解和预测人们的决策行为。
在学习博弈论的过程中,我深刻体会到博弈论的重要性和应用价值。
博弈论各章节课后习题答案 (2)
高质量
低质量
甲企业
高质量 低质量
50,50 900,600
100,800 -20,-30
该矩阵博弈还有一个混合的纳什均衡
Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630,可得 x = 12 , y = 63 97 138
因此该问题的混合纳什均衡为 ((12 , 85), ( 63 , 75 )) 。 97 97 138 138
i =1 j=1
i =1 j=1
4
q
* i
=0,p*=c,
说明此时各厂商的产品价格等于边际成本,这时的市场已是完全竞争市场。
9. 对于下列的威慑进入博弈,首先计算垄断情况下的产量与价格组合,再计算存在竞争的
情况下两企业的产量与价格组合,并对这两种情况下的结果作比较分析。假定进入者相信垄
断在位者在随后的阶段将会维持它的产量水平。市场需求曲线由方程 p=10-2Q 给出,其中 p
并设企业 i 生产产量 qi 的总成本 Ci(qi)=cqi,这里 c 是常数,并假设 c<a。企业同时就产量进 行决策。求出该博弈的纳什均衡。当 n 趋于无穷大时,会发生什么情况?
解:厂商 i 的利润为:πi=p(Q)-cqi=(a-Q-c)qi
令 ∂πi ∂q i
=
0
,则有:q
* i
=a-c-Q*
由表达式(2.3.13)~(2.3.16)可得如下不等式组
Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1
将这些数据代入(2.3.19)和(2.3.22),可得混合策略 Nash 均衡(( 1 , 8 ),( 4 , 3 )) 99 77
博弈论第二章习题
问题1:博弈方2就如何分10000元钱进行讨价还价。
假设确定了以下原则:双方提出自己要求的数额1s 和2s ,10000021≤≤s s ,。
如果设博弈方1和,1000021≤+s s ,则两博弈方的要求都得到满足,即分得1s 和2s ;但如果1000021>+s s ,则该笔钱就被没收。
问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额,为什么?解:112111210000()010000s s s u s s s ≤-⎧=⎨>-⎩,那么,1210000s s =-221222110000()010000s ss u s s s ≤-⎧=⎨>-⎩那么,2110000s s =-它们是同一条直线,1210000s s +=上的任意点12(,)s s ,都是本博弈的纯策略的Nash 均衡。
假如我是其中一个博弈方,我将选择15000s =元,因为(5000,5000)是比较公平和容易接受的。
它又是一个聚点均衡。
问题2:设古诺模型中有n 家厂商。
i q 为厂商i 的产量,n q q q Q +++= 21为市场总产量。
P 为市场出清价格,且已知Q a Q P P -==)((当a Q <时,否则0=P )。
假设厂商i 生产产量i q 的总成本为ii i i cq q C C ==)(,也就是说没有固定成本且各厂的边际成本都相同,为常数)(a c c <。
假设各厂同时选择产量,该模型的纳什均衡是什么?当趋向于无穷大时博弈分析是否仍然有效?解:1()ni i i j i j pq cq a c q q π==-=--∑,1,2,,i n =令20ii j j ii a c q q q π≠∂=---=∂∑,1,2,,i n =解得:***121na c q q q n -====+,2***121na c n πππ-⎛⎫==== ⎪+⎝⎭当n 趋向于无穷大时,这是一个完全竞争市场,上述博弈分析方法其实已经失效。
博弈论习题参考答案(2)
《博弈论》习题参考答案(第2次作业)一、选择题1.B2.C3.A4.A5.B6.ABCD7.C 8.B 9.C二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。
8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高三、计算与分析题1、 (1)画出A 、B 两企业的损益矩阵。
(2)求纯策略纳什均衡。
(做广告,做广告)2、画出两企业的损益矩阵求纳什均衡。
(1)画出A 、B 两企业的损益矩阵(2)求纳什均衡。
两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下:甲乙 左 右 上 下(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>? 答:a>e, b>d, f>h, g<c(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足? 答:a>e, b>d 4、答:(1)将这一市场用囚徒困境的博弈加以表示。
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
博弈论的经典案例(2)
博弈论的经典案例(2)博弈论的经典案例篇4:哈佛大学一位教授提出了这样一个博弈模型:有三个枪手,第一个枪手A的命中率是80%,B是60%,C是40%。
他们同时举枪瞄准、同时射击另两个人中的一个,要尽可能消灭对手,每个人一次机会,一颗子弹,目标是努力使自己活下来。
谁活下来的可能性最大?如果你认为枪法最准的A胜出,那么你就错了。
我们来看,如果你是A,你毫无疑问的会瞄准对你威胁最大的B,而B也会瞄准对他威胁最大的A,而C则也可能瞄准A,那么三个人存活的概率都是多少呢?A = 100% - 60% - (1-60%)* 40% = 24%B = 100% - 80% = 20% (因为命中率为80%的A在瞄准他)C = 100% (因为没有人瞄准他)原来,枪法最不准的C竟然活了下来。
那么,换一种玩法呢?如果三个人轮流开枪,谁会生存下来?如果A先开枪的话,A还是会先打B,如果B被打死了,则下一个开枪的就是C,那么此时A生存的概率为60%,而C依然是100%(他开过枪后A没有子弹了,游戏结束);如果打不死B,则下一轮在B开枪的时候一定会全力回击,A的生存率为40%,不管是否打死A,第三轮AB的命运都掌握在C的手里了。
那么,如果游戏规则规定必须由C先开枪,如果你是C怎么才能让自己活下来呢?答案是胡乱开一枪,只要不针对AB任何一人即可。
当C开枪完毕,AB还是会陷入互相攻击的困境。
博弈论的经典案例篇5:“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
理性行为下的支付与均衡──博弈论简介(二)
朱震葆││博弈论简介二理性行为下的支付与均衡 经济学有一个公理:假定人的行为是理性的,即所谓“理性人”的“个体理性行为”。
博弈论研究的问题也都是建立在“理性人”的“个体理性行为”基础之上的“非合作博弈”。
什么是“理性人”呢?“理性人”是指:在面临给定的约束条件下追求最大化自己的个人偏好、或谓支付(pagoff)、或谓效用水平,可以由一个V —N —M (是Von Neumann and Mor ge nster n 的缩写)期望效用函数来代表。
所谓“个体行为理性”是指个体的行业始终都是以实现自身的最大利益为唯一目标,除非为了实现自身最大利益的需要,否则不会考虑其他个体或社会的利益的这样一种决策原则。
而“非合作博弈”则是指在各参与方之间不能存在任何有约束力的协议,也就是说各参与方不能公然“串通”和“共谋”的博弈问题。
为了更好地把握理性行为下的支付概念,我们以房地产开发博弈为例,加以阐述。
现在有两家房地产开发商,分别称为“开发商A ”和“开发商B ”。
正考虑在南京的某一地段开发一栋新的综合写字楼。
他们都面临的选择是开发或者不开发。
如果开发商A 决定开发,必须投入资金1亿元,当然,如果决定不开发,资金投入为0。
开发商A 在做这个决定时,他关心的当然是开发是否有利可图。
像房地产这样的市场充满了风险。
风险首先来自市场需求的不确定性。
需求可能大,也可能小。
风险的另一来源是你的竞争对手,房地产开发商B 。
假定开发商B 也面临与开发商A 同样的决策问题:是否投入1亿元资金开发一栋同样的综合写字楼。
再假定,如果市场上有两栋楼出售,需求大时,每栋售价可达1.5亿元,需求小时,售价为6千万元;如果市场上只有一栋楼出售,需求大时售价为2.0亿元,需求小时为 1.2亿元,这样,有以下8种可能的结果:1、需求大,A 开发,B 不开发;A 的利润为1亿元,B 的利润为0。
2、需求大,A 不开发,B 开发;A 的利润为0,B 的利润为1亿元。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三)大家选举一个信得过的人。
开始这位品德高尚的人还能公平分粥,但不久他便 给拍马溜须的人和自己多分,分粥又变得不公平了。
(四)成立分粥委员会和监察委员会,形成分权和制 约。这样,公平基本做到了,可是由于监察委员会经 常提出种种质疑,分粥委员会又据理力争,等到粥分 完毕,粥早就凉透了。
(五)分粥者最后喝粥。等所有人把粥领走了,分粥 者自己才能取剩下的那份。
收益-10000元
完全顺从:失去贤妻和 家园,收益-5000 提出一定合理的条件, 把航线的选择权交给持 刀者:收益-3000
收益-10000元
持刀威胁,让B顺从:
收益0
持刀威胁,满足对方要 求:收益5000
在力量对比悬殊的情况下,完全的独裁或者民主协 商都未必是理性的选择,因为各自的利益没有最大化。 至于民主的方案,在这个案例中根本不存在,因为 这是一个阿罗悖论,民主在这里就会造成问题久拖不决 的情形。而徒手者的民主要求可能的结果是挨一顿毒打, 最后被迫俯首称臣,完全听从持刀者的命令。
规则对我们的社会博弈太重要了!但良好的规则 又不是凭空产生的。对此,古今中外的大家进行了不 懈的研究探讨,其中最著名的是约翰〃罗尔斯关于正 义选择的“无知之幕”假说。
《正义论》是他积近20年的努力思考的一部心血之作。
无知之幕(Veil of Ignorance)是假定各方不知道 自己在社会中的地位、阶级出身、天生资历、自然能 力、理智和力量等情形,也没人知道自己的关于善的 观念、合理生活计划和心理特征,各方也不知道这一 社会的经济或者政治状况。在这种情况下,我们不是 根据自己的地位来观察社会秩序,而是采取了每一个 人在平等的基础上都会采纳的观点。从这个意义上说, 我们就是客观地来看我们的社会和我们在社会中的地 位:我们同别人一起具有一种共同的观点,而且我们 不是根据个人的偏见来做出判断。
蛋糕:总收益 切蛋糕有阻力,都希望对方去切 收益缩水
存在N个纳什均衡
分粥博弈
有7个人组成的团体,每个人地位都是平 等的,每个人又都是自利的。他们试图采取 非暴力的方式,通过制定制度来解决每天的 “大锅饭”问题,可是没有称量工具或有刻 度的容器。
(一)指定一个人全权负责分粥。
很快大家就发现,这个人为自己分的粥最多。于是 又换上了一个人,结果还是一样,负责分粥的人碗里 最多最好。 (二)大家轮流坐庄,每人一天。 每个人一周里总有一天胀得嘴歪眼斜,其余六天都 是饥饿难耐。这种方法不仅不能消除不公平,还造成 资源的巨大浪费。
一些关系国计民生的社会公共行业的规矩,不仅 要管社会公众,更要管住业内人士,内外统一管理标 准,社会生活才能有序而不致乱套。由于垄断着公共 资源,分粥者就应当对行内外一视同仁,不得经薄彼。 制度至关重要,制度是人选择、交易的结果。好的制 度清晰而精妙,既简洁又高效。
阿罗悖论:规则形成的民主难题
民主是个好名词,但是抽象的民主往往迷惑人 的头脑。民主绝非易事,实际上,实现真正的民主 需要解决很多难题,并非我们想象的那么简单和容 易,民主的实现往往是社会各种力量博弈的平衡状 态。我们有的规则设计的初衷是为了民主公正,但 实践中却成了民主的悖论。
自从1951年阿罗令人信服地论证出了这个结论,即 任何可以想象得到的民主选举制度都可能产生出不民主 结果,这一论证使数学家和经济学家感到震惊。这证明 了历史记录下的探索完全民主的伟大思想也是探索一种 妄想、一种逻辑上的自相矛盾。
阿罗的论证被称为“不可能定理”,它证明了完全 民主事实上在现实社会的博弈中是不可能出现的。这个 论证帮助阿罗获得了1972年度的诺贝尔经济学奖。阿 罗的“毁灭性发现”是博弈论早期的最惊人成果之一。
在权力不对称的社会里,民主的进步只能是改良性 质的而非突变性质的。
在孤立无援的汪洋大海上,一只船上有两个人: A持刀,B徒手。船由A、B二人合作才能前行。 A:去西方,那里有他的财富和梦想 B:去东方,那里有他的贤妻和家园
怎样解决?
大家期望的应该是一种最理性的民主协商的方法。 但是对于徒手B而言? 对于徒手B而言 不合作而死: 对于持刀者A而言 不合作而死:
国王手下的两个大臣:一个好,一个坏。坏大臣 为了独自掌权,总想把好大臣害死,于是他经常在国 王面前讲了好大臣的很大坏话。国王偏听偏信,决定 第二天用抽签的办法来处理好大臣。坏大臣一不做二 不休,决定堵死好大臣的最后一条生路。
死
死
从博弈的角度看,在这场生死阄博弈中,游戏的 正常规则遭到了无情践踏!坏大臣做了手脚,把明规 则变成了暗规则或潜规则,使好大臣丧失了选择策略 的机会,如果是“抓”阄,那么就必死无疑! 为了达到公平,游戏要设定良好的规则,有了良 好的规则,才可能保证优秀的人在博弈中胜出。
西安宝马彩票案
/11/0519/08/74DFSPT700052DT2.html
整个博彩的正常规则遭到了亵渎,众多彩民都被 蒙在了鼓里。当然,到了最后,法院运用法律这个以 国家强制力保障的社会规则对那些破坏体彩游戏规则 的人进行了严惩。
无知之幕:原初状态选择正义
但从这个博弈的动态发展来看,随着徒手者的日益 强大,其选择最后一种策略所获得的收益也会逐步增加, 也就是说,把民主权利转让给独裁一方的收益会逐步提 高,最终达到弥补其民主权利丧失带来的损失。
阿罗不可能定理强调的是,社会没有一种真正客观 的反映群体社会偏好的方法。
阿罗不可能性定理说明了人的有限理性的悖论。另 外,阿罗不可能定理说的是,社会的选择方法不可能既 是有效率的,又是民主的。因为循环投票本身就是无效 率的,这就再次提示了民主和效率的矛盾。
1978年的“巴克案”打响了反对“平权行动”的第一枪。巴克 是一个白人男性,连续两年被一个医学院拒绝录取,与此同时,这 个医学院根据16%黑人学生的定额制,录取了一些比巴克各方面条 件差的黑人学生。巴克不干了—我不就是白点吗?我白招谁惹谁了? 他一气之下上诉到美国最高法院。最高法院裁定对黑人学生实行定 额制是违宪的,但仍然在原则上支持“平权行动”。 紧接着,嘀咕发展成了议论,议论发展成了吆喝。最著名的吆 喝,来自90年代中期加州州长Peter Wilson。他吆喝道:“不能让 集体性权利践踏个人的权利,我们应当鼓励的是个人才干。”于是 他大刀阔斧地开展了废除“平权行动”的运动。1995年6月,公立 的加州大学及其九个分校废除了录取学生中的“平权行动”。1996 年11月,加州用公投的方式废除了包括教育、就业、政府招标等各 方面的“平权行动”。1997年4月,这一公投结果得到了最高法院 的认可。受到加州的影响,另外十几个州也开始蠢蠢欲动,要铲除 逆向歧视的“平权行动”。
“平权行动”争论的核心,正如众多社会问题的核心,是一个 “程序性正义”和“补偿性正义”的矛盾。程序性正义主张一个 中立的程序施用于任何社会群体,而无论结果如何—同一条起跑 线,兔子也好,乌龟也好,你就跑去吧。“程序性正义”的最大 问题,就是对“历史”、“经济”和“文化”的无视。 补偿性正义则主张根据历史、文化、经济条件有偏向地制定 法律和政策,以保证一个相对公平的结果。但补偿性正义面对一 个不可避免的操作性问题——由谁、如何、是否可能来计算鉴定 一个人的历史、文化和经济遭遇?一个祖上是黑奴的黑人录取时 加20分,那一个祖上是华工的亚裔应该加多少分?一个祖上四代 是贫农的人和一个祖上两代是贫农的人,分值又有什么不同?一 个穷白人和一个富黑人,谁更应该加分?这种补偿性正义的原则, 需要一个巨大的国家机器来整理、裁判历史和现实无限的复杂性, 而这种裁判权一旦被权力机器劫持,问题就不仅仅是如何抵达正 义,还有这架机器震耳欲聋的轰鸣声了。
/view/2091510.htm
“平权行动”风波
“平权行动”是60年代随着美国黑人运动、妇女运动兴起的一项政策。由 美国总统约翰逊在1965年发起,主张在大学录取学生、公司招收或晋升雇员、 政府招标时,应照顾少数种族和女性。目的是扳回历史上对黑人和女性的歧 视,把他们在历史上受的委屈折算成现实的利益。 “平权行动”实施之后,黑人和妇女的大学录取率、政府合同中的黑人中 标率大大提高。高校录取制度尤其是“平权行动”的热点。有的大学,甚至 明确地采取了给黑人、拉美裔申请者“加分”的制度,或给他们实行百分比 定额制。这种拔苗助长的善良愿望,促成了美国的大学里各种族齐头并进的 大好局面。最典型的例子是加州大学伯克利分校。到90年代中期,一个几乎 是“纯白”的学校,已经被“平权行动”粉刷得五颜六色:39%亚裔;32% 白人;14%拉美裔;6%黑人和1%印第安人。 然而从70年代开始,人们开始对“平权行动”嘀嘀咕咕—其主要的矛头, 就是它矫枉过正,形成了一种“逆向歧视”。
社会博弈论
规则——正义与非正义
规则
个体在社会中的行为往往都遵循一定的规则,比 如法律、道德、习惯,甚至还有所谓的暗规则或潜规 则,等等,不管怎样,社会生活往往是离不开规则的, 所谓“不以规矩,无以成方圆”,通过规则营造出一 定的秩序,不管这是一种什么样的秩序。
黑白灰三道:规则有正有邪
社会博弈中的规则众多,但只要良好的法律制度、 道德风俗等才是符合正义的规则,是保障我们在社会 博弈中获得公平待遇的规则,当然也是保证社会博弈 结果公正的规则。而有些社会博弈的规则却不是正义 的,甚至是邪恶的,在这样的规则支配下的博弈是不 好玩的游戏,好人难以胜出,坏人却容易得逞。
ቤተ መጻሕፍቲ ባይዱ
取消“平权行动”的效果是立竿见影,1998年是加州大学各 分校取消“平权行动”的第一年。这一年,伯克利大学黑人学生 的录取率下降了一大半,从1997年的562个黑人下降到1998年的 191个;拉美裔的学生也从1045个下降到434个。各大学校方很有 点“辛辛苦苦三十年,一夜退到解放前”的感慨。
2003年“平权行动”再次成为热点问题。因为今年最高法院 遭遇了一个新的“巴克案”—密歇根大学的格瑞兹/格鲁特对伯林 杰案。2003年6月23日,最高法院再次作出了一个八面玲珑的裁 决:密歇根大学给每个少数民族申请者加20分的本科生录取政策 是违宪的;但同时,它又裁定法学院为了增加学生的“多样性” 而照顾少数种族是合法的。这与其1978年对“巴克案”的裁定是 一样的:原则上支持“平权行动”,但反对用定量的方式来固定 这种“平权行动”。