博弈论与政治第四讲_755106771
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20
俾斯麦海战争赛局: 俾斯麦海(Bismarck Sea)在太平洋西 南部,为巴布亚新几内亚西北岸和俾斯麦 群岛所围绕。总面积24万平方公里。北 接太平洋,东南经维蒂亚兹海峡(Vitiaz)、 丹皮尔海峡(Dampier)和圣乔治海峡通所 罗门(Solomon)海。四周岛屿多山地。
21
39
守方 跑位 跑位 攻防 短传 中传 长传 2 6 6 10 max = 10 传球 5 5.6 4.5 3 max = 5.6 四分卫 13 10.5 1 -2 max = 13 min = 2 min = 5.6 min = 1 min = -2
40
If all else fails…
◦ Cell-by-cell inspection can be used to find Nash equilibria in any game
25
俾斯麦海战争赛局:
◦ 两个参与人:(日本,美国) ◦ 两个行动:日本航向 (北,南), 美国搜索(北, 南) ◦ 北航线多雨,南航线晴朗 ◦ 偏好 (等和赛局): ◦ 日本: (日北,美南)>(日南,美北)>(日北, 美北)>(日南,美南)
27
俾斯麦海战争赛局:
◦ 报酬:
(日北,美南):(3,1) (日南,美北):(2,2) (日北,美北):(2,2) (日南,美南):(1,3)
11
(a) 报酬全视图
玩家 2 石头 石头 玩家 1 布 剪刀 布 剪刀 赢,输 输,赢
(b) 零和游戏简图
玩家 2 石头 石头 玩家 1 布 剪刀 和 赢 输 布 输 和 赢 剪刀 赢 输 和
和,和 输,赢 赢, 输 和, 和
输, 赢 赢, 输 和,和
12
若每个参与者根据对其他参与者策略的信 念,采用最大自身化收益的策略,则这样 的一个策略组合就是纳什均衡。
7
同时行动博弈:
◦ 参与人在不清楚对手所做选择的情况下采取行 动。 ◦ 即使这些行动选择不是同时进行的。 ◦ 又称不完美信息博弈。 ◦ 所以你的行动不可以按照对方行动后才决择。
使用博弈矩阵(game matrix) 或称为报酬 表(payoff table)
◦ 规范式(normal form)或策略式(strategic form) ◦ 矩阵的维度等于参与人的数目 (所以参与人越多, 越难以矩阵表示). ◦ 在两人游戏中,行、列、玩家策略都是两个。
37
守方 跑位 跑位 攻防 短传 中传 长传 2 6 6 10 max = 10 传球 5 5.6 4.5 3 max = 5.6 四分卫 13 10.5 1 -2 max = 13 min = 2 min = 5.6 min = 1 min = -2
38
守方 跑位 跑位 攻防 短传 中传 长传 2 6 6 10 max = 10 传球 5 5.6 4.5 3 max = 5.6 四分卫 13 10.5 1 -2 max = 13 min = 2 min = 5.6 min = 1 min = -2
◦ 莱城——大型基地和大型机场; ◦ 萨拉莫阿——重要的港口和机场; ◦ 芬斯彻哈芬——运输中心和水上飞机及供应舰锚泊地。
为了孤立这些地方的日军,美军决定,一旦日军 船队通过俾斯麦海支援,就予以摧毁性打击。
23
日本海军官员于2月21日拟订了“81号作战 计划”,决定从拉包尔向莱城运送6900多 名官兵,250吨的弹药、车辆等作战物资。 2月28日,日军船队从拉包尔启航,沿着新 不列颠岛北海岸西进。 3月1日,日军船队被美军发现。美军太平洋 战区陆军航空兵的克耐将军认为,这是显示 陆基航空兵威力的大好时机。
L 8, 2
a
L c
H
11, 0
L
9, 0.5
GRAY GREEN,
GRAY
H
1, 1
H
GREEN
b
L 0, 2
a
L c
H
2, 0
L
0.5,0.5
2 A 1 B 2
C
3,3
D E 1
5,4
G
6,2
H F 2,2
2,6
图示同时行动赛局 纳许平衡(Nash Equilibrium) 占优策略(Dominant Strategies) 当两个玩家都有占优策略的情况 当只有一个玩家有占优策略的情况 连续删除劣策略(Dominated Strategies) 零和游戏的最大最小值方法(Minimax Strategies 逐个单位各检查法(Cell-By-Cell Inspection) 纯策略是连续型变量的情形(Continuous Variables) 三个参与人赛局 纯策略中的多重均衡点 纯策略中没有均衡点的情形
抵赖 (合作)
1 , 25
3, 3
19
任何一个有占优策略的参与人都会在均衡 中选择该策略。 如果所有的参与人都有占优策略,那纳许 解法就容易多了。
◦ 如果只有一个参与人有占优策略会发生什么事? ◦ 没有占优策略的参与人会依有占优策略的参与 人的占优策略来反应—最佳反应(best response)
If yes, then move on If no, then this is a Nash Eq There may be multiple Nash Eq’s in the game
41
必胜客 高
Байду номын сангаас
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
1942年3月,日军海上运输船队从新不列 颠的拉包尔浩浩荡荡出发,经过俾斯麦海, 抵达新几内亚,沿途几乎没有什么美军舰 机的拦截,因此损失很少。这个时候的美 军,正全力阻止日军向澳大利亚推进,无 暇它顾。
22
1943年1月,美军西南太平洋战区司令麦克阿瑟 上将开始实施“蛙跳战略”——逐个夺取日占岛 屿,最后打进日本本土。 美军经过一番琢磨,攻 击新几内亚沿海的日军集结地。那儿有三大目标:
不贡献
6, 3, 3
4, 4, 1
4, 1, 4
2, 2, 2
47
有一个以上的纳许均衡点 安全赛局(Game of Assurance) 懦夫赛局(Chicken) 性别战赛局(Battle of Sex) 弱优势(Weak Dominance)
◦ 参与人不能后悔。
在其他参与人已经选择的行动情况下,参与人 必须偏好现有选择的策略。
最直觉检查是否为纳许均衡方法,就是问参与人 是否还有比现在更好的行动可选。 如果答案为“否”,那就是纳许均衡—这也是纳 许解法(Nash Solution)。
13
纯策略: 行动中没有随机的部分 ◦ 也就是说,任意时间点上的行动都是确定 的。 混合策略: 从纯策略中随机地以概率的方 式决定行动。
32
必胜客 高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高 达美乐 中
低
60, 60 70, 36
35, 36
33
必胜客 高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高 达美乐 中
低
60, 60 70, 36
35, 36
高 达美乐 中
低
60, 60 70, 36
35, 36
42
必胜客 高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高 达美乐 中
低
60, 60 70, 36
35, 36
43
必胜客 高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
6, 3, 3
4, 4, 1
不贡献
4, 1, 4
2, 2, 2
FIGURE 4.8 Street-Garden Game
Copyright © 2000 by W.W. Norton & Company 46
TALIA 贡献 NINA 贡献 贡献 EMILY 5, 5, 5 不贡献 3, 6, 3 EMILY 贡献 不贡献 不贡献 NINA 贡献 3, 3, 6 不贡献 1, 4, 4
◦ 参与人都可以获得更好的报酬,如果两人合作。 ◦ 但是如果只是某位参与人一厢情愿,他们只会 得到更少。 ◦ 单方面背叛会是总报酬减少。
17
妻子
认罪 (背叛) 认罪 (背叛)
丈夫 抵赖 (合作) 25, 1 10, 10
抵赖 (合作)
1 , 25
3, 3
18
妻子
认罪 (背叛) 认罪 (背叛)
丈夫 抵赖 (合作) 25, 1 10, 10
第四讲:纯策略同时行动博弈
次序性博弈
◦ ◦ ◦ ◦ ◦ 博奕树 博弈树求解一人游戏 博弈树求解—逆推法 顺序的优势 博弈树求解—多人游戏
GRAY GREEN,
GRAY
H
1, 1
H
GREEN
b
L 0, 2
a
L c
H
2, 0
L
0.5,0.5
GRAY GREEN,
GRAY
H
10, 1
H
GREEN
b
Intuitive
Go to each cell and apply the Nash conditions Would any 玩家 prefer another outcome that can be reached through that 玩家’s change in strategy?
9
零和游戏与非零和游戏 在零和(等和)游戏中,我们只需要知道n-1 人的报酬,因为他们的报酬总和为零。 ◦ 在零和(非等和)游戏中,我们就需要知道 所有参与人的报酬。
10
建立赛局表 剪刀-石头-布游戏 每个参与人有三个纯策略:
◦ 剪刀 ◦ 石头 ◦布
在同时行动赛局,参与人不能以他人反应 作出行动决定 每个参与人的策略在任何一点的决策都是 相同的。
24
3月2日,美机发现,这支船队开始从俾斯麦海向 维蒂埃兹海峡行驶。 持续3天的俾斯麦之战结束了。作战中,美军只 战死13人,受伤12人,4架飞机被击落,2架负 伤落在美军机场附近。 而日军13-14艘商船被击沉,7艘驱逐舰被击沉, 死亡人数达3000多人,损失战机59架。 这是美军陆基飞机首次攻击大规模日军船队之战, 没有任何盟军水面战舰参战,但却取得巨大胜利 的一次海战。
34
必胜客 高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高 达美乐 中
低
60, 60 70, 36
35, 36
35
36
如果一个赛局没有优势策略? 在零和赛局中,一个参与人得利意味着另 一方失利,利益是完全对立的。 最大最小值法: 前提是参与人在任何情况 下仍会选择该策略。 尽量使对手收益最小
28
日本海军 北 南 2, 2
北
美国空军
2, 2 1, 3
南
3, 1
29
日本海军 北 南
北
美国空军
2 1
2 3
南
30
日本海军 北 南
北
美国空军
2 1
2 3
南
31
即是对参与人删除所有可能劣策略。 如果删除后只有一个独特结果,这就是纳
许解法。 占优可解(Dominance Solvable)赛局。
严格优势(Strict Dominance): > 弱优势(Weak Dominance):
15
一个策略比另一个策略有优势 在赛局中,一个参与人有两个以上的策略, 但这并不表示这个赛局有占优策略 在赛局中,如果每个参与人都有占优策略, 那此赛局一定有纳许均衡点。
16
囚犯困境:…… 在赛局中,如果每个参与人都有占优策略, 那纳许均衡点即是这两个占优策略的交集。 纳什么均衡点在囚犯困境赛局中是“不佳” 的
高 达美乐 中
低
60, 60 70, 36
35, 36
44
最优反应分析规则: 在均衡点的情况, 每 个参与人的行动一定是对于其他参与人最 优反应的最优反应。 最优反应曲线: 某个参与人所有相对于其 他参与人所有策略的最优反应。
45
TALIA 贡献 NINA 贡献 贡献 EMILY 不贡献 5, 5, 5 不贡献 3, 6, 3 EMILY 贡献 贡献 3, 3, 6 不贡献 NINA 不贡献 1, 4, 4
◦ 行动时具概率性的。 ◦ 如:剪刀石头布游戏。
14
对某个参与人来说,占优策略即是无论别 人选什么策略,他都会选择的策略。
◦ 最佳行动 ◦ 他的报酬可以比其他参与人行动所得的报酬低。 在策略空间中 (1:A,B,C;2:a,b,c,), C是占优的, 如果 U(C,i)U(B,i) 且 U(C,i)U(A,i) [对所有] i (a,b,c), U效用函数