解释现实中的纳什均衡现象
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
L 参与者2
R 参与者2
参与者1战 略
L’
R’ L’
R’
3
12
0
1
21
0
参与者2战 略
4.2 子博弈精炼纳什均衡
参与者1
L
R
参与者2
参与者2
LOGO
解:解是对期望将要发生的 情况给出相应的行动及结果 均衡:均衡是战略集合(战 略又是关于行动的完全的计 划)
逆向归纳纳什均衡:
L’
R’ L’
R’ (R,(R’,L’))
1
参与人1:max Eu=q(p(-1)+(1-p)1)+(1-q)(p1+(1p)(-1))
=-pq+q-pq+p-pq-1+q+p-pq
=-4pq+2q+2p-1
一阶条件为零求得:p=1/2
2.2 扑克猜色游戏
LOGO
p
当2出红色的
1
概率q1/2,1 出黑色的概率
为1,因为他
p1=f(
出红色得到的
LOGO
占优策略
“我做我所能做最好的,不管你做什么 ”
“你做你所能做最好的,不管我做什么
”
NASH均衡: 我所做的是给定你所做的我所能做的最好的 你所做的是给定我所做的你所能做的最好的
1.6 为什么在城市中心道路上禁止汽 车鸣喇 叭?
LOGO
观察
A缓行: 9>8,司机B抢行
A抢行: 2>1,司机B抢行
A
企业 B
做广告 不做广
告
企 业
做广告
10,5
15,0
不做广 告
6,8
10,2
1.4 没有占优策略的博弈
LOGO
观察
A: 没有占优 策略,取决于 B的选择
B: 做广告
问题
A的最佳选择 是什么?
A
企业 B
做广告 不做广
告
企 业
做广告
10,5
15,0
不做广 告
6,8
20,2
1.5 占优策略和纳什均衡
LOGO
参与者2
(L’,L’) (L’,R’) (R’,L’) (R’,R’
参
)
与
者 L 3,1 3,1 1,2 1,2
R 2,1 0,0 2,1 0,0
纯战略纳什均衡:(R,(R’,L’) ; (L,(R’,R’))
1
4.3 讨论——案例标准 式
参与者1
L
R
参与者2
参与者2
LOGO
L’
R’ L’
3.2 逆向归纳法
参与者1
L
R
参与者2
2 0
L’
R’
参与者1
1
1
L’’
R’’
LOGO
3Байду номын сангаас
0
0
2
3.3 国际贸易中的博弈
LOGO
2001年中国加入了世界贸易组织。 国际贸易中倾销是指在正常贸易中一国向另一国出 口的某一产品价格低于其正常价值的价格。 倾销对市场的破坏作用,各国便采取针对措施即反 倾销来限制倾销。 倾销商往往不愿就这样失去在进口国的利益,势必 又会产生反倾销的新的对策——规避。例如转移生 产、变成品输出为零件输出、改变产品型号等。 为避免反倾销措施的失败,保护本国利益,捍卫法 制的尊严,各个国家纷纷针对规避行为制定了反规 避措施。
汇报人: 郭超
2017/04/11
3.1 完全且完美信息的动态博 弈
LOGO
动态博弈:参与人的行动有先后顺序,而且行动在
后者可以观察到行动在先者的选择,并据此做出相
应的选择。
完全信息的博弈:参与者的收益函数是共同知识的 博弈。
完全且完美信息的动态博弈:博弈进行的每一步当 中,要选择行动的参与者都知道这一步之前博弈进 行的整个过程。
LOGO
观察
A: 不管B如何 选择,做广告 都是最优的
B: 不管A如何 选择,做广告 都是最优的
A
企业 B
做广告 不做广
告
企 业
做广告
10,5
15,0
不做广 告
6,8
10,2
1.3 A、B企业广告博弈的损益矩 阵
LOGO
观察
A & B 的占优 策略都是做广 告
不理会对手的 策略
均有占优策略 均衡
R’
排除
3
12
1
21
不可置信威
0 0
胁
子博弈精炼纳什均衡:(R,(R’,L’))
纯战略纳什均衡:(R,(R’,L’) ; (L,(R’,R’))
所有以前的行动都 合下参与者的收益
可以被观察到
都是共同知识
3.2 逆向归纳法
LOGO
当在博弈的第二个阶段参与者2行动时,由于其前参 与者1已选择行动a1,他面临的决策问题可以表示为:
max u (a , a ) 假a定2对AA2 1中2的每一1 个a12,参与者2的最优化问题只有
惟一解,用R2(a1)表示,这就是参与者2对参与者 1的行动的反应(或最优反应)。
结论:抢行是B的占优策略
B缓行:9>8,司机A抢 行
司 机
缓行
A
B抢行:2>1,司机A抢 行
抢行
结论:抢行是A的占优策略
司机 B
缓行 抢行 8,8 1,9 9,1 2,2
1.7 对纳什均衡的思考
LOGO
思考
自从古典经济学家亚当· 斯密提出西方经济学的基本前提— — “经济人” ,特别是经新古典经济学家的精确论述,将“ 经济人”作为整个西方经济学的逻辑起点之后,经济学家几 乎用了一个世纪来证明斯密的核心理论,但是这种对于逻辑 起点的证明至今没有完成
3.2 逆向归纳法
LOGO
由于参考者1能够和参与者2一样解出2的问题,参与 者1可以预测到参与者2对1每一个可能行动a1所做出 的反应,这样1在第一阶段要解决的问题可以归结为:
u a R a max ( , ( ))
a1A1 1 1 2 1
假定参与者1的最优化问题同样有惟一解,表示为 a1*,我们称(a1*,R2(a1*))是这一博弈的逆向归纳 解。
Ⅳ子博弈精 炼纳什均衡
01
❖ 基本理论 ❖ 案例 ❖ 思考
0 2
❖ 基本 ❖ 扑克猜色 ❖ 案例
03
04
❖ 概念 ❖ 逆向归纳法 ❖ 国际贸易中的博
弈
❖ 案例 ❖ 定义 ❖ 讨论
LOGO
1Part 纯策略纳什均衡
◆ 基本理论 ◆案例 ◆思考
汇报人: 胡春
2017/04/11
1.1 纳什均衡
LOGO
大部分经济学家只能认为这是一个不证自明的公理前提;有 的经济学家更认为,西方“经济人”的合理性是上帝给予的
这一切表明纳什均衡理论的基础有其不扎实的一面。因为现 实中的决策者常常并不只考虑最大限度地获得经济利益,有 时候为了公平等方面的要求,会放弃部分或者全部经济利益 。
LOGO
混合策略纳什均
2 衡 Part ◆ 基本介绍 ◆ 扑克猜色游戏 ◆ 案 例
3.3 国际贸易中的博弈 出口厂商
LOGO
不倾销
倾销
进口政府
15 不反倾销 10
反倾销 出口厂商
16 不规避 8
规避 进口政府
7 不反规避 11
反规避
12
8
7
12
3.3 国际贸易中的博弈
LOGO
维护公平竞争 的贸易秩序
反倾销 的意义
使受损害的产业得 以较快康复和进行 产业结构调整
为维护我国产业的经 济安全发挥了重要作
子博弈精炼纳什均
衡
3
12
0
1
21
0
逆向归纳解: (R,L’)
4.2 子博弈精炼纳什均衡定 义
LOGO
子博弈精炼纳什均 衡
定义(赛尔滕,1965):如果参与者的战略在每一 个子博弈中都构成了纳什均衡,则称纳什均衡是子博弈精 炼的。
任何有限的完全信息动态博弈都存在子博弈精炼纳什均 衡。
4.3 讨论——案例标准 式
汇报人: 韩发丽
2017/04/11
2.1 基本介绍
LOGO
❖有些博弈不存在(纯策略的)纳什均衡 ❖谁单独改变策略都不会得到进一步的好处 ❖如果允许混合策略,那么每个有限同时博弈都有纳什
均衡
2.2 扑克猜色游戏
参与人2
LOGO
p
1-p
红色
黑色
参 与 人
q
红 色
1-q
黑 色
-1,1 1,-1
1,-1 -1,1
LOGO
解释现实中的纳什均 衡To Explain Nash Equilibrium In Reality
汇报人: 胡春
丽 郭超
韩发 周欣
2017/04/11
CONTE / 目录 LOGO
NTS
一、完全信息静态博弈
Ⅰ纯策略 Ⅱ混合策略 纳什均衡 纳什均衡
二、完全信息动态博
弈
Ⅲ完全且完 美信息动态
博弈
企业2
价格不 涨价 变
企 价格不 10, 100,-
业变
10
30
1
涨价 -20, 140, 30 企业1价格不变:10>-30,企业2应当选择“价格不变” 25
企业1涨价: 30>25,企业2应当选择“价格不变”
结论:“价格不变”是企业2的占优策略,企业1在决策时必须以此为前提
1.3 A、B企业广告博弈的损益矩 阵
用
遏制了国外对我国滥 用反倾销措施和歧视 性待遇
LOGO
子博弈精炼纳什均
4 衡 Part ◆ 案例 ◆定义 ◆讨论
汇报人: 周欣
2017/04/11
4.1 案例扩展式
参与者1
L 参与者2
R 参与者2
L’
R’ L’
R’
3
12
0
1
21
0
LOGO
4.1 案例扩展式 参与者1
LOGO
战略:参与者的一个战略是关于行 动的一个完整的计划,明确了可能 遇到的每一种情况下对可行行动的 选择。
3.1 完全且完美信息的动态博弈描述
LOGO
参与者 1
参与者 2
收益
参与者1从可行 集A1中选择一 个行动a1
参与者2观察到 a1之后,从可行 集A2中选择一 个行动a2
两人的收益分别 为u1(a1, a2)和 u2(a1, a2)
3.1 完全且完美信息的动态博弈特点
LOGO
特点一
特点二
特点三
行动是顺序发生的 下一步行动选之前, 每一可能的行动组
Nash:一个数学天才,1950年在22岁获得数学哲学 博士学位,诺贝尔经济学奖得主,电影《Beautiful Mind》 主人翁 纳什均衡:在完全信息静态博弈中各方都实现个利 益最大化的策略组合状态 纯策略:假定每个参加者每次只选择一个策略进行 博弈
1.2 占优策略
LOGO
占优策略:不论对方采取何种策略时,某一策略均为 最优策略,则此策略为占优策略。
LOGO
F上级奖励反腐部门 反腐部门的查处部门 R不腐败官员收益 K腐败官员被查处惩罚 A腐败收益 P腐败官员所耗时间、 精力 W0官员现工资 W1退休工资
2.3 收益分析
LOGO
2.3 结果解释 官员
LOGO
检察院
LOGO
完全且完美信息动态博
3 弈 Part ◆ 概念 ◆逆向归纳法 ◆国际贸易中的博弈
与
p),参与人1的支付
人
为:
2
p(-1)+(1-p)(红色)
=p+(-1)(1-p)(黑
色);
求得(1/2,1/2)是纳什混合战略均衡
2.3 案例:腐败治理
政府官员
β
1-β
腐败
不腐败
反 腐
α
查 处
F-C+R , -K
部
门1 不
0,
- 查 W0+W1+A
α处
-P
R-C , W0+W1
R, W0+W1
1/2
q)
q2=f(p)
预期收益大于 他出黑色;当
2出红色的概
率q1/2,1出
红色的概率为
0,因为他出
q 黑色的期望收
益大于他出红
0
1/2
1
色。
2.2 扑克猜色游戏
参
与 给定参与人1(q,1人 q),参与人2的支付 1 是:q+(-1)(1-q)
(红色)=(-1)q+(1q)(黑色);
LOGO
参
给定参与人2(p,1-