第一讲静态博弈(2016)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
建立博弈模型
三要素: 参与人(player) 策略(strategy) 支付(payoff) ——谁采取什么行动得到什么
5
表述方法
标准式:数字矩阵(多用于静态博弈) 扩展式:树形图(多用于动态博弈)
6
ห้องสมุดไป่ตู้
模型:正确还是错误?
老师 接受 送 袁枚 不送 不接受
错误:策略分类不正确
7
老师 接受 不接受
袁枚
明送 暗送 不送
8
行动
老师的行动:
“接受”还是“不 接受”
袁枚的行动:
“明送”、“暗 送”和“不送” 。
9
支付的解决
斯大林时期的苏联,一位乐队指挥坐在火车 上看乐谱,克格勃认为是密码,将他作为间 谍逮捕。 指挥说看的是柴可夫斯基的小提琴协奏曲, 但无济于事。 入狱第二天,克格勃说:“你老实招了吧, 我们已经抓住你的朋友柴可夫斯基,他正在 招供。”
13
基数与序数对换
0=第1,-1=第2,-8=第3,-10=第4 基数模式
坦白 囚徒A 坦白 抵赖 囚徒B 抵赖
-8,-8 -10,0
0,-10 -1,-1
14
序数模式的囚徒困境
囚徒B
坦白 囚徒A
抵赖
坦白
抵赖
第3,第3 第4,第1
第1,第4 第2,第2
15
一、纳什均衡
萨缪尔森说:“你可以将一只 鹦鹉训练成经济学家,因为他 所要学习的只有两个词:供给 和需求。” 坎多瑞说:“要成为现代经济 学家,这只鹦鹉要多学一个词: 纳什均衡。” 纳什均衡是一种策略组合,使 得每个参与人的策略是对其他 参与人策略的最优反应。
2、查尔斯利普森“经济和安全事务领域的合作”,《新现实主义和新自 由主义》,第66页。 囚徒B
坦白 抵赖 坦白 抵赖
囚徒A
-1,-1 -10,10
10,-10 9, 9
12
支付:序数or基数
对于每个囚徒,都有四个策略组合: A=自己坦白,对方抵赖 B=自己坦白,对方坦白 C=自己抵赖,对方抵赖 D=自己抵赖,对方坦白 四个策略组合的支付按序数排列:
在英国不领导反法联盟时,其他国家(以奥地利为 例)的支付情况是RC>RD>PD>PC。奥地利在 “不加入联盟”(D)和“加入联盟”(C)之间 不存在优势策略。
英国积极领导和支持联盟行动之后,奥 地利等的支付就发生了变化。 PC>RD>RC>PD。
法国的优势策略一直是威胁进行惩罚。 发生改变的是欧洲国家与反法联盟领导国之 间的关系。 英国的加入提高了其他国家对于法国的相对 实力位置,大陆国家对于法国力量的脆弱性 随之被降低了,因此他们敢于冒险加入联盟 。
国际关系定量分析 第一讲 静态博弈
清华大学国际问题研究所 漆 海 霞
1
博弈的分类
无限多轮 博弈 有限多轮 博弈 静态博弈
贴现因 子
逆向归纳法
纳什均衡
2
一、学生与老师的博弈
我们每天生活都面临博弈: 学生与老师(投其所好) 国际谈判 博弈的实质: 分析选择、预测行为
3
例:袁枚的高帽子
清代袁枚官拜七品县令。赴任前向老师尹 文瑞辞行。 尹文瑞问他:“你此去赴任,都准备了 什么?” 袁枚回答:“学生也没准备什么,就准 备了一百顶高帽子。” 尹文瑞不高兴的说:“你年纪轻轻,怎 么就搞这一套!” 袁枚说:“如今社会上大都喜欢戴高帽 子,像您老人家这样不喜欢戴高帽子的人真 是凤毛麟角呀!” 尹文瑞听罢此言,很是受用。 袁枚出了尹文端的家门,便得意地对人 说;“还未出京城,这高帽子就送出一顶,只剩 九十九顶了。”
坦白 囚徒A 囚徒B 抵赖
坦白
抵赖
-8,-8 -10,0
0,-10 -1,-1
18
Whiteneck J. Daniel (2001), “Long-term bandwagoning and short-term balancing: the lessons of coalition behaviour from 1792 to 1815,” Review
16
囚徒困境的纳什均衡
A:若B坦白,A应坦白(-8>-10)。 若B抵赖,A应坦白(0>-1)。 B:若A坦白,B应坦白(-8>-10)。 若A抵赖,B应坦白(0>-1)。 纳什均衡:A、B都坦白。 意义:合作困难。
17
找囚徒困境的纳什均衡
合作(抵赖)帕累托优于背叛(抵赖), 但不是均衡结果。
of International Studies, Vol. 27, No. 2 (Apr., 2001), pp. 151-168.
研究问题:1792-1815年间,面临拿破仑时 期法国对欧洲大陆的威胁,欧洲国家为何有 时会退出联盟追随(bandwagoning)法国 或是采取隐藏(hiding)战略,而不是一直 采取联盟(coalition)策略制衡法国 ?
10
囚徒困境
双方都不想背叛对方,但在这个博弈下,最好 的选择就是双方都坦白。
坦白 囚徒A 坦白 抵赖 囚徒B 抵赖
-8,-8 -10,0
0,-10 -1,-1
11
为何有不同的囚徒困境
1、张维迎:《博弈论与信息经济学》,第15页
囚徒B
坦白 囚徒A 坦白 抵赖
抵赖
-8,-8 -10,0
0,-10 -1,-1