经济博弈论第二章a
合集下载
经济博弈论第二章a
![经济博弈论第二章a](https://img.taocdn.com/s3/m/69fd70f7fab069dc502201a5.png)
以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
分析经营管理的实践案例
28
诚信之道
当一个社会缺乏信用、蔑视契约时,是难以建 立人与人之间的互信基础的。所以从建立对信 用和契约神圣的认知,并用强制措施加以保障。
29
诚信的选择
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果严格下
* * * * 以外的所有策略组合,则 策反复消去法排除了 (s1 (s1 ,..., sn ) ,..., sn ) 一定是G的唯一的纳什均衡。
命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果
2 博弈方2利润: u2 q2 P(Q) C2q2 q2 8 (q1 q2 ) 2q2 6q2 q1q2 q2
* * * * 在本博弈中, 的最 (q1 , q2 ) 的纳什均衡的充分必要条件是 q1 和 q2 大值问题: * 2 max(6q1 q1q2 q1 ) q1 * 2 * * q2 q1 q2 q2 ) q q 2, u=8 max(6 1 2 q2
关键点:
寻找占优策略
检查一下你是否存在占优策略,如果有,就选择占优策略
站在对手的位置上思考问题
如果你没有占优策略,那么从你对手角度考虑博弈。如果对手 有占优策略,预期他将按占优策略行动
纳什均衡
我所做的是:给定你所做的,我所做的是最好的; 你所做的是:给定我所做的,你所做的是最好的
同步,一次博弈的应用
道德乎? 策略乎?
经济博弈论第二章a 博弈论课件
![经济博弈论第二章a 博弈论课件](https://img.taocdn.com/s3/m/18ba5ae1aa00b52acfc7ca99.png)
2 q P ( Q ) C q q 8 ( q q ) 2 q 6 q q q q 博弈方2利润: u 2 2 2 2 2 1 2 2 2 1 2 2
* 在本博弈中, ( q 1* , q 2 ) 的纳什均衡的充分必要条件是 q 大值问题: * 2
* 1
和q
q2 (0,6)
R1(q2)
(2,2) 6 R2(q1)
(0,3)
0
(3,0)
(6,0)q1
从左图可以看出,当一方的 选择为0时,另一方的最佳反应 为3,这正是我们前面所说过的 实现总体最大利益的产量,因为 一家产量为零,意味着另一家垄 断市场。当一方的产量达到6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
2.3.2 应用
混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样 可应用于存在多个纯策略纳什均衡的博弈问题。 丈 夫 例 夫妻之争 时装 足球 该博弈与上一个博弈的不同之处在 0, 0 于每一方所希望对方知道自己的策略选 妻 时装 2,1 择以达到有利于自己的结果。现实中, 1, 3 子 足球 0,0 这类问题多通过协商解决以免两败俱伤。 在此我们假设夫妻双方不可协商,互不通消息。 令pw(时), pw(足)分别表示妻子选择时装表演和足球的概率; ph(时), ph(足)为丈夫选择时装表演和足球的概率。 同样的分析方法可得pw(时)=0.75, pw(足)=0.25; ph(时)=1/3, ph(足)=2/3.双方的期望得益分别为uwe=0.67, uhe=0.75。
d 2 b * 1 2 P ( a bc ) ( a b c ) 1 2 22 1 1 1 4 b b dd 4 b b dd 1 2 1 2 1 2 1 2 d 2 b * 2 1 P ( a b c ) ( a bc ) 2 1 11 2 22 4 b b dd 4 b b dd 12 1 2 12 1 2
* 在本博弈中, ( q 1* , q 2 ) 的纳什均衡的充分必要条件是 q 大值问题: * 2
* 1
和q
q2 (0,6)
R1(q2)
(2,2) 6 R2(q1)
(0,3)
0
(3,0)
(6,0)q1
从左图可以看出,当一方的 选择为0时,另一方的最佳反应 为3,这正是我们前面所说过的 实现总体最大利益的产量,因为 一家产量为零,意味着另一家垄 断市场。当一方的产量达到6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
2.3.2 应用
混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样 可应用于存在多个纯策略纳什均衡的博弈问题。 丈 夫 例 夫妻之争 时装 足球 该博弈与上一个博弈的不同之处在 0, 0 于每一方所希望对方知道自己的策略选 妻 时装 2,1 择以达到有利于自己的结果。现实中, 1, 3 子 足球 0,0 这类问题多通过协商解决以免两败俱伤。 在此我们假设夫妻双方不可协商,互不通消息。 令pw(时), pw(足)分别表示妻子选择时装表演和足球的概率; ph(时), ph(足)为丈夫选择时装表演和足球的概率。 同样的分析方法可得pw(时)=0.75, pw(足)=0.25; ph(时)=1/3, ph(足)=2/3.双方的期望得益分别为uwe=0.67, uhe=0.75。
d 2 b * 1 2 P ( a bc ) ( a b c ) 1 2 22 1 1 1 4 b b dd 4 b b dd 1 2 1 2 1 2 1 2 d 2 b * 2 1 P ( a b c ) ( a bc ) 2 1 11 2 22 4 b b dd 4 b b dd 12 1 2 12 1 2
复旦大学-谢识予-经济博弈论2
![复旦大学-谢识予-经济博弈论2](https://img.taocdn.com/s3/m/9b329445e2bd960591c67742.png)
两寡头间的囚徒困境博弈
厂 不突破 商 1 突破
厂商2
不突破
突破
4.5,4.5
3.75,5
5,3.75
4,4
以自身最大利益为目标:各生产 2单位产量,各自得益为4
以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
2.3.2 反应函数
古诺模型的反应函数
max q1
u1
max(6q1
q1q2
2.4 混合策略和混合策略纳什均衡
2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数
2.4.1 严格竞争博弈和混合策略的引进
一、猜硬币博弈
盖 正面 硬 币 反面 方
猜硬币方
正面
反面
-1, 1
1, -1
-1, -1
之
境
争
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
2, 1 0, 0
0, 0 1, 3
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2.2.1 纳什均衡的定义
策略空间:S1 , S n
博弈方 i的第 j 个策略:si j Si 博弈方 i的得益:u i
博弈:G {S1,Sn;u1,un}
纳什均衡:在博弈G {S1,Sn;u1,un}中,如果由各个博弈方i
的各一个策略组成的某个策略组合(si*,sn* ) 中,任一博弈方 的策略,都是对其余博弈方策略的组合 (si*,si*1, si*1,...sn* ) 的最佳对策,也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,si*1, sij , si*1,...sn*)
经济博弈论第二讲
![经济博弈论第二讲](https://img.taocdn.com/s3/m/7f6685133d1ec5da50e2524de518964bcf84d2e3.png)
▪ 每个人的得益来自于各自对房间的干净程度的效用减去 他打扫花费的时间。
▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2
囚
0, 1
徒
困
2, 0
境
-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
夫 妻
2, 1
之
0, 0
争
0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。
▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2
囚
0, 1
徒
困
2, 0
境
-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
夫 妻
2, 1
之
0, 0
争
0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。
经济博弈论 02 完全信息静态博弈(Park)
![经济博弈论 02 完全信息静态博弈(Park)](https://img.taocdn.com/s3/m/fa028e862f60ddccda38a0fc.png)
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
经济博弈论_Chapter02
![经济博弈论_Chapter02](https://img.taocdn.com/s3/m/52757f01f12d2af90242e69e.png)
Slide 10
分类方法2:利益冲突和利益相容 Are the Players’ Interests in Total Conflict or Is There Some Commonality? 某些博弈中,一人所得即为他人所失。 In some games, one player’s gain is the other’s loss. 参与者的利益完全冲突,这就好比他们在分割 一个数量固定的收益。 The p players ’ interests are in complete y p conflict when they are dividing up any fixed amount of possible gain. 这样的博弈就是零和(或常和)博弈。 These games are zero-sum or constantsum games.
Slide 6
分类方法1:序贯博弈和同时博弈 Are the Moves in the Game Sequential or Simultaneous?
如果博弈的规则规定了一个严格的顺序,每一行动时 刻只允许 个参与者采取行动,而且他知道自己和其 刻只允许一个参与者采取行动,而且他知道自己和其 他人过去所采取的行动,则博弈中的出招是顺序的。 The moves in a game are sequential if the rules of the game specify a strict order such that at each action moment only one player takes action with knowledge of the actions taken action, (by others and himself) at previous moments.
分类方法2:利益冲突和利益相容 Are the Players’ Interests in Total Conflict or Is There Some Commonality? 某些博弈中,一人所得即为他人所失。 In some games, one player’s gain is the other’s loss. 参与者的利益完全冲突,这就好比他们在分割 一个数量固定的收益。 The p players ’ interests are in complete y p conflict when they are dividing up any fixed amount of possible gain. 这样的博弈就是零和(或常和)博弈。 These games are zero-sum or constantsum games.
Slide 6
分类方法1:序贯博弈和同时博弈 Are the Moves in the Game Sequential or Simultaneous?
如果博弈的规则规定了一个严格的顺序,每一行动时 刻只允许 个参与者采取行动,而且他知道自己和其 刻只允许一个参与者采取行动,而且他知道自己和其 他人过去所采取的行动,则博弈中的出招是顺序的。 The moves in a game are sequential if the rules of the game specify a strict order such that at each action moment only one player takes action with knowledge of the actions taken action, (by others and himself) at previous moments.
经济博弈论第2章(23) ppt课件
![经济博弈论第2章(23) ppt课件](https://img.taocdn.com/s3/m/51f16c10011ca300a7c3903e.png)
4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
uG 1, 4 1 uG 0,
0.2
PPT课件
18
• 解二: 支付等值法
如果一个混合策略是政府的最优选择,那一定意
味着流浪汉在寻找工作与游闲之间是无差异的,
即:
流浪汉
找工作
游荡
政府 救济 不救济
3,2 -1 , 1
-1 , 3 0,0
uL 1, 1 3 uL 0,
0.5
PPT课件
19
五、混合战略纳什均衡
• 对 * 0.2 的解释: • 如果流浪汉找工作的概率小于0.2, 则政府选择不
救济,如果大于0.2,政府选择救济 ,只有当概率等 于0.2时,政府才会选择混合战略或任何纯战略. • 对 * 0.5 的解释 • 如果政府救济的概率大于0.5,流浪汉的最优选择 是流浪,如果政府救济的概率小于0.5,流浪汉的最 优选择是寻找工作.
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
p 1
0, 当q 1/ 2
p [0,1],当q 1/ 2
1, 当q 1/ 2
PPT课件
0
1/2
1 q 27
第二章 完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 混合战略纳什均衡 六 纳什均衡存在性及相关讨论
PPT课件
经济博弈论ppt课件
![经济博弈论ppt课件](https://img.taocdn.com/s3/m/ad52490a326c1eb91a37f111f18583d049640f3b.png)
• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
经济博弈论潘
![经济博弈论潘](https://img.taocdn.com/s3/m/002a912cccbff121dd368391.png)
1.1.2 定义
博弈-----个人、队组或其他组织,面对一定的环境条件,在一定的 规则下,同时或先后,一次或多次,从各自允许选择的行为或策 略中进行选择并加以买施,并从中各自取得相应结果的过程。
一个博弈需要设定下列4个方面: (1)博弈的参加者 (2)各博弈方各自可选择的全部策略或行为的集合。 (3)进行博弈的次序。 (4)博弈方的得益。
而“非合作博弈”则是指在各博弈方之间不能存在任何有约束力的协 议,也就是说各博弈方不能公然“串通”、“共谋”的博弈问题。
1.1.3 博弈论研究的历史和发展述评
产量决策的古诺(Cournot)模型
价格决策的伯特兰德(Bertrand)模型
本世纪20年代,法国数学家波雷尔(Borel)用最佳策略的概念研究了下 棋和其他许多具体的决策问题,并试图把它们作为应用数学的分支加 以系统研究 1944年诺依曼(Neumann)和摩根斯坦(Morgensten)合著的《博弈论和 经济行为》一书的出版标志着系统的博弈理论的初步形成。
1.2.2齐威王与田忌赛马
传说齐威王经常要大将田忌与他赛马,赛马的规则是这样的:每次双 方各出三匹马,一对一比赛三场,每一场的输方要赔一千斤铜给赢方。 齐威王的三匹马和田忌的三匹马按实力都可分为上、中、下三等。由 于齐威王的上、中、下三匹马都分别比田忌的上、中、下三匹马略胜
一筹,因此田忌每次都是连输三场,要输掉三千斤铜。实际上,田忌 的上马虽不如齐威王的上马,却比齐威王的中马和下马都要好,同样, 田忌的中马则比齐威王的下马要好一些,田忌每次都连输三场是有些 冤枉的。后来田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自 己的上马去对抗齐威王的上马,而是用下马去对抗齐威王的上马,上 马则去对抗齐威王的中马,中马去对抗齐威王的下马。 田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自己的上马去对 抗齐威王的上马,而是用下马去对抗齐威王的上马,上马则去对抗齐 威王的中马,中马去对抗齐威王的下马。这样,虽然第一场田忌必输 无疑,但后两场田忌却都能赢,二胜一负,田忌反而能赢齐威王一千 斤铜。 这个著名的故事生动地告诉我们巧用策略是多么的重要,在实力、条 件一定的情况下,对已方力量和有利条件的巧妙调度和运用常会起到 意想不到的效果。
博弈论第二章答案
![博弈论第二章答案](https://img.taocdn.com/s3/m/85f5f30116fc700abb68fcd6.png)
2
nc + a a − c a−c a−c ⋅ −c⋅ = n +1 n +1 n +1 n +1
企业违背垄断产量时的各期利润:
n −1 (a − c ) − qi πi = a − qi − cqi 2n ∂π i (n − 1)(a − c) =a− − qi − q j − c = 0 ∂qi 2n n +1 (n + 1)a + (3n − 1)c (a − c), p = 4n 4n 2 (n + 1) 利润为 (a − c) 2 16n 2 ⇒ qi =
仅供参考! !
-4-
E-mail:beckham.23@
2
出) ,只要任何一方违背时,以后就转向阶段博弈的价格 pi = c 。 如一直使用垄断价格,则每个企业收益每期都一样为, π i = (a − c) / 8 如在t期某企业违背了战略, t+1期开始双方的收益相同都为0, 在t期它的最大收益为 ( a − c) / 4 (考虑此企业只是把价格边际上减少一点点,所有的利润都归它) ,如不违背则把以后无限期
一阶条件:
V ' ( I p − B) = kU 2' ( S + B) ,
反应函数满足:
−1 < dB* / dS = kU 2" /(−kU 2" − V " ) < 0 即,孩子储蓄减少,家
*
长给予更高的赠与。 接着最大化孩子的收益:给定反应函数 B ,来选 S:
MaxU1 ( I c − S ) + U 2 ( S + B* )
∂π i = a − ∑ qi − qi − c = 0 ∂qi a−c (i = 1,2,3 n) n +1
nc + a a − c a−c a−c ⋅ −c⋅ = n +1 n +1 n +1 n +1
企业违背垄断产量时的各期利润:
n −1 (a − c ) − qi πi = a − qi − cqi 2n ∂π i (n − 1)(a − c) =a− − qi − q j − c = 0 ∂qi 2n n +1 (n + 1)a + (3n − 1)c (a − c), p = 4n 4n 2 (n + 1) 利润为 (a − c) 2 16n 2 ⇒ qi =
仅供参考! !
-4-
E-mail:beckham.23@
2
出) ,只要任何一方违背时,以后就转向阶段博弈的价格 pi = c 。 如一直使用垄断价格,则每个企业收益每期都一样为, π i = (a − c) / 8 如在t期某企业违背了战略, t+1期开始双方的收益相同都为0, 在t期它的最大收益为 ( a − c) / 4 (考虑此企业只是把价格边际上减少一点点,所有的利润都归它) ,如不违背则把以后无限期
一阶条件:
V ' ( I p − B) = kU 2' ( S + B) ,
反应函数满足:
−1 < dB* / dS = kU 2" /(−kU 2" − V " ) < 0 即,孩子储蓄减少,家
*
长给予更高的赠与。 接着最大化孩子的收益:给定反应函数 B ,来选 S:
MaxU1 ( I c − S ) + U 2 ( S + B* )
∂π i = a − ∑ qi − qi − c = 0 ∂qi a−c (i = 1,2,3 n) n +1
最新经济博弈论2精品资料
![最新经济博弈论2精品资料](https://img.taocdn.com/s3/m/867e65caaef8941ea76e05ae.png)
19
1
下
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
2,0
1
策略组合(上,中)
博 弈 方上
博弈方2 左 中 1,0 1,3
15
1
严格下策反复消去法在分析许多博弈时都能应用,特 别是有些博弈不存在上策均衡,但却存在某些严格下 策,所以一般来讲,严格下策反复消去法的适用范围 要比上策均衡分析大一些。 但是严格下策反复消去法不能解决所有的博弈分析问 题,存在一定缺陷: (1)有些博弈无严格下策;如抛硬币博弈。 (2)即使有严格下策,也只可能消去一部分。 此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。 严格下策反复消去法是博弈分析的标准工具之一。
18
划线法——应用
通过在每一博弈方针对对方每一策略的最大可能得益下划线 以求解博弈的方法 例子: 博 弈 方
左 上
博弈方2
中
右
结论: 图中得益矩阵所表示的博弈中就存在唯一的两数字下都划有短 线 的此策略组合(上,中)是该得益矩阵表示的博弈的具有稳定性的解
2.1.1 2.1.2 2.1.3 2.1.4 上策均衡 严格下策反复消去法 划线法 箭头法
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方的某 个策略给他带来的得益始终高于其它的策略, 至少不低于其他策略 不难理解,上述“某个策略”必然是该博弈方愿意选 择的策略。 例如囚徒困境博弈中的“坦白”、双寡头削价中“低 价”,就是这样的策略(对两个博弈方都成立)。
100,100
低 价
20,105
低 价
150,20
70,70
1
下
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
2,0
1
策略组合(上,中)
博 弈 方上
博弈方2 左 中 1,0 1,3
15
1
严格下策反复消去法在分析许多博弈时都能应用,特 别是有些博弈不存在上策均衡,但却存在某些严格下 策,所以一般来讲,严格下策反复消去法的适用范围 要比上策均衡分析大一些。 但是严格下策反复消去法不能解决所有的博弈分析问 题,存在一定缺陷: (1)有些博弈无严格下策;如抛硬币博弈。 (2)即使有严格下策,也只可能消去一部分。 此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。 严格下策反复消去法是博弈分析的标准工具之一。
18
划线法——应用
通过在每一博弈方针对对方每一策略的最大可能得益下划线 以求解博弈的方法 例子: 博 弈 方
左 上
博弈方2
中
右
结论: 图中得益矩阵所表示的博弈中就存在唯一的两数字下都划有短 线 的此策略组合(上,中)是该得益矩阵表示的博弈的具有稳定性的解
2.1.1 2.1.2 2.1.3 2.1.4 上策均衡 严格下策反复消去法 划线法 箭头法
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方的某 个策略给他带来的得益始终高于其它的策略, 至少不低于其他策略 不难理解,上述“某个策略”必然是该博弈方愿意选 择的策略。 例如囚徒困境博弈中的“坦白”、双寡头削价中“低 价”,就是这样的策略(对两个博弈方都成立)。
100,100
低 价
20,105
低 价
150,20
70,70
《经济博弈论》PPT课件
![《经济博弈论》PPT课件](https://img.taocdn.com/s3/m/4104ef2ccdbff121dd36a32d7375a417866fc1fb.png)
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
西方经济学第二A博弈论.pptx
![西方经济学第二A博弈论.pptx](https://img.taocdn.com/s3/m/a3704559590216fc700abb68a98271fe900eaf04.png)
33
第34页/共43页
二、对完全垄断厂商的税收调节
所谓从量税,是指对生产者所生产的每一单位产品,征收某一固定数量的 税收。
一次总付税是指一次性征收的税收,例如营业执照税。
34
第35页/共43页
对完全 垄断厂商征收 从量税不仅不 能改进资源配 置的效率,反 而会使资源配 置的效率进一 步降低,使社 会福利的无谓 损失进一步增 大。
这一方案最初由伊伦(L.Yellen)于1984年提 出。这一方案的基本思想是,由于非对称信息,雇 主不确知雇员的生产力,为了防止雇员工作时偷懒, 雇主发给雇员效率工资。效率工资率高于市场均衡 工资率。
9
第10页/共43页
第二节 外部性与政府干预
一、外部性及其后果
二、政府干预
三、明确产权
四、排污权交易
不尽力 60 000元
100 000元
80 000元
尽力 100 000元 500 000元
300 000元
8
第9页/共43页
对于因工人不努力工作而产生的委托人-代理 人问题可以实行一种称之为效率工资(efficiency wage)的方案解决。效率工资是高于市场工资率、 同时又使雇员不发生偷懒行为的工资。
第二,委托人的目标不同于代理人的目标。
第三,有关代理人工作状况的信息是非对称的。 委托人所掌握的情况少于代理人自身掌握的信息。
• 所谓委托人-代理人问题是由于委托人不能确知代
理人的行为而产生的问题。它是指经理或工人可
7
第8页/共43页
表10-1 企业盈利情况
偶然事件发生 偶然事件不发生 期望利润
(p=0.5) (q=0.5)
24
第25页/共43页
第34页/共43页
二、对完全垄断厂商的税收调节
所谓从量税,是指对生产者所生产的每一单位产品,征收某一固定数量的 税收。
一次总付税是指一次性征收的税收,例如营业执照税。
34
第35页/共43页
对完全 垄断厂商征收 从量税不仅不 能改进资源配 置的效率,反 而会使资源配 置的效率进一 步降低,使社 会福利的无谓 损失进一步增 大。
这一方案最初由伊伦(L.Yellen)于1984年提 出。这一方案的基本思想是,由于非对称信息,雇 主不确知雇员的生产力,为了防止雇员工作时偷懒, 雇主发给雇员效率工资。效率工资率高于市场均衡 工资率。
9
第10页/共43页
第二节 外部性与政府干预
一、外部性及其后果
二、政府干预
三、明确产权
四、排污权交易
不尽力 60 000元
100 000元
80 000元
尽力 100 000元 500 000元
300 000元
8
第9页/共43页
对于因工人不努力工作而产生的委托人-代理 人问题可以实行一种称之为效率工资(efficiency wage)的方案解决。效率工资是高于市场工资率、 同时又使雇员不发生偷懒行为的工资。
第二,委托人的目标不同于代理人的目标。
第三,有关代理人工作状况的信息是非对称的。 委托人所掌握的情况少于代理人自身掌握的信息。
• 所谓委托人-代理人问题是由于委托人不能确知代
理人的行为而产生的问题。它是指经理或工人可
7
第8页/共43页
表10-1 企业盈利情况
偶然事件发生 偶然事件不发生 期望利润
(p=0.5) (q=0.5)
24
第25页/共43页
第二章 纳什均衡 《博弈论与经济》 PPT课件
![第二章 纳什均衡 《博弈论与经济》 PPT课件](https://img.taocdn.com/s3/m/2fa95a2c9ec3d5bbfc0a7492.png)
▪ G的纳什均衡可由以下划线法求得。
▪ 1.对局中人1的每个策略i (i 1,2,, m) ,寻找局中人2的最
优反应。若最优反应为
j
,即 bij
max
k 1,2,,n
bik
,则在支付矩
阵元素 bij 下划一短线。
▪ 2.对局中人2的每个策略 j ( j 1,2,, n) ,寻找局中人1的
最优反应,若最优反应为 i
▪ 考虑由商店A, B构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争。假设生产的单位成本为零。消费者 分为两类, n A ( 0)个消费者偏好于产品A,nB ( 0)个消费者 偏好于产品B。A,B两种品牌价格分别为 PA , PB 。设消费 者可从A或B处购买单位商品。
▪ 用 0表示由于购买不喜欢的产品所付出的厌恶成本,假 设消费者具有如下的效用函数
按 等待
等按待
(5,1) (9,1)
4,4
(0, 0)
▪ 严格纳什均衡为大猪“按”,小猪“等待”。
▪ 例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护
不维护
不维维护护 ((1
4,4) 0,1 4)
((1140,,1100))
▪ 利用划线法可得纳什均衡(维护,维护),(不维护, 不维护)。
▪ 为了保护生命财产的安全,政府可以立法,如果参与人
第2章 纳什均衡
2.1 纳什均衡的定义
▪ 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建 立在纳什均衡基础之上的。
▪ 纳什均衡是个策略组合 s* (si*, s*i ) ,它满足两个要求。
▪
1.对每个局中人 i N
,能够预期到对手采用策略组合s
经济博弈论2课件
![经济博弈论2课件](https://img.taocdn.com/s3/m/e018d3dabceb19e8b9f6ba2e.png)
2, 1 0, 0
0, 0 1, 3
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
剪头法说明
剪头法与划线法不同,但两者都是基于 策略之间相对优劣关系进行分析的,得 到的结论也是一致的。
这种通过反映各博弈方选择的箭头,寻 找博弈中具有稳定性的策略组合的方法, 就是“剪头法”。
2, 1 0, 0
0, 0 1, 3
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
划线法的补充说明
此法以策略之间的相对优劣关系为基础,因此 在分析用得益矩阵表示的博弈问题时具有普遍 适用性。
并不意味着每个用得益矩阵表示的博弈都可以 用划线法求出确定性的博弈结果。如猜硬币、 夫妻之争
略都是各个博弈方各自的上策,必然是该博弈
比较稳定的结果 上策均衡不是普遍存在的
寡高 价 头 1低 价
寡头2 高价 低价 5,5 1,6
6,1 3,3
双寡头的得益矩阵
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
2.1 基本分析思路和方法
2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
博弈论第二章——博弈规则
![博弈论第二章——博弈规则](https://img.taocdn.com/s3/m/84b4e2eceff9aef8951e0668.png)
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
经济博弈论02完全信息静态博弈(Park)
![经济博弈论02完全信息静态博弈(Park)](https://img.taocdn.com/s3/m/11ed0607ce84b9d528ea81c758f5f61fb6362813.png)
合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1,6
2,3 1,2
1, 4
5,4 3,3
4, 5
标准式博弈:均衡分析
如果参与者1认为参与者2选择 C… – 参与者1对“C”的最优反应是“a”.
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1,6
2,3 1,2
1, 4
5,4 3,3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
箭头法
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2.1.3 划线法
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “B”.
参与者 2 参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
标准式博弈:均衡分析
则参与者1应该选择 “a”. – 参与者1对 “B”的最优反应是 “a”.
第二章
完全信息静态博弈
所谓完全信息静态博弈即各博弈方同时决 策,且所有博弈方对博弈中的各种情况下的得 益都完全了解的博弈问题 纳什均衡 无限策略博弈的解和反应函数 混合策略 纳什均衡的存在性
2.1 纳什均衡
博弈的解和纳什均衡 严格下策反复消去法与纳什均衡
2.1.1博弈的解和纳什均衡
-8,0 -5,-5
囚 徒 1
不坦白
坦白
-1,-1 0,-8
箭头法
囚徒2
不坦白 囚 徒 1 不坦白
-1,-1
坦白
-8,0
坦白
0,-8
-5,-5
划线法
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2.1.2严格下策反复消去法与纳什均衡
严格下策:对于某一策略 (s1 ,...si ,..., sn ) ,若 ui (s1,...si ,..., sn ) ui (s1,...si* ,..., sn ) 则称 ui (s1 ,...si ,..., sn ) 为 ui (s1,...si* ,..., sn ) 的严格下策。
参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
– –
“a” 是参与者1对 “C”的最优反应. “C” 是参与者2对 “a”的最优反应. 此结果被称为纳什均衡: 在给定其他参与者策略情况下,没有一个参与者能通过单方 面改变自己的策略而使自己的得益提高,从而没有人有积极性打 破这种均衡
同步,一次博弈--标准式博弈
构成标准式博弈的要素有:
– –
–
参与者:参加博弈并做出决策的个体 策略:参与者可能采取的行动 得益:参与者采取不同策略带来的利益或损失 参与者 2
参与者 1
策略
A
B
C
a b
c
3,2 2,1
1, 6
2, 3 1, 2
1, 4
5,4 3,3
4, 5
标准式博弈:均衡分析
站到对手的立场上,想
参与者2会怎么做呢?
参与者2 没有占优策略! 但是参与者2应该能够推断出1会选择 “a” 因此参与者2会选择 “C”
参与者 2 参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
结果
参与者 2
32
矩阵分析
生产方
诚信 不诚信
交 易
-10 诚 10 销 信 15 10 售 方 0 不 15 诚 0 -10 信
33
案例研讨
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果严格下
* * * * 以外的所有策略组合,则 策反复消去法排除了 (s1 (s1 ,..., sn ) ,..., sn ) 一定是G的唯一的纳什均衡。
命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果
推销员
医生
2003年美国制药业推销员工与药物广告 花费(单位:亿美元)
120 100 80 60 40 20 0 推销员工花费 药物广告花费
27.6 120
专栏—制药公司的销售大战(摘自华尔街日报)(续)
尽管如此,没有任何一家制药商愿意第一个 单方面裁军。葛兰素史克公司( GlaxoSmithKline)的推销员队伍是如此壮大: 它只需要七天就可以联系到美国80%以上的医生 。“这有必要吗?”葛兰素史克的CEO加涅尔说 :“应该说是没有必要,但是如果我的竞争对手 能而我做不到,我们就处于劣势。这的确是以最 坏可能的方式进行的军备竞赛。” “拥有众多的推销员不是竞争优势的源泉” ,默克公司的主席和CEO吉尔马丁补充说。他说 制药商通过发现新药来获得优势。然而,默克公 司2001年起在美国已增加了1500名推销员,使得 总数达到约7000人。 既然谁都知道拥有众多的推销员并不是竞争 优势的源泉,那为什么各家制药公司的推销员仍 然在不断膨胀呢? ——引自周林,《商业战略决策:博弈论的应 用》
道德乎? 策略乎?
30
社会学家和经济学家的争辩
社会学家云:诚信是人在较低层次的需求得到 适当满足之后自然出现的一种较高层次的需求; 诚信带给人的满足感会超过逐利带来的满足 感 。 经济学家云:人们在重复博弈、反复切磋过程 中谋求长期的、稳定的物质利益的一种策略选 择。
31
诚信案例
假定A 是一名生产商,B 是一名销售商,AB 双方互 为博弈对手,会出现以下4种博弈的可能性: 双方都讲诚信,A 按约交货,B 按约付款,各得 其所,每人都得到的效用都是10; A 诚信而B不诚信,A 交了货而B 不付款,那麽B 可以获得自己最大的利益,得15,而A 吃亏了, 得-10; A 不诚信而B诚信,即A 收了钱而不发货,则A 的 利益实现了最大化,得15,而B 得-10; A B 双方互不信任,也互不守信,生意泡汤了, 各自的效用都为0。
2 博弈方2利润: u2 q2 P(Q) C2q2 q2 8 (q1 q2 ) 2q2 6q2 q1q2 q2
* * * * 在本博弈中, 的最 (q1 , q2 ) 的纳什均衡的充分必要条件是 q1 和 q2 大值问题: * 2 max(6q1 q1q2 q1 ) q1 * 2 * * q2 q1 q2 q2 ) q q 2, u=8 max(6 1 2 q2
* * (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去法一定不会将它
消去。
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左 上
下 1, 0 0, 4
中
1, 3 0, 2
右
4, 5
占优策略
不管参与者2是选择A、B还是C, 参与者1都会选择“a”! “a” 是参与者1的占优策略! 占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1, 6
2,3 1,2
1, 4
5,4 3,3
4, 5
–
–
如何均衡稳定与收益?
2.2 无限策略的解和反应函数
古诺的寡头模型 反应函数 伯特兰德的寡头模型 公共资源问题
2.2.1古诺的寡头模型
2 博弈方1利润: u1 q1P(Q) C1q1 q1 8 (q1 q2 ) 2q1 6q1 q1q2 q1
定义 在博弈 G S1,..., Sn ; u1,..., un 中,如果策略 * * 组合 ( s1 ,...sn )中任一博弈方i的策略 si* 都是对 * * 其余博弈方的策略组合 (s1 ,..., si*1, si*1,..., sn ) 的最佳 对策,也即
* * ui (s1*,..., si*1, si*1,..., sn ) ui (s1*,..., si*1, sij , si*1,..., sn )
以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
分析经营管理的实践案例
28
诚信之道
当一个社会缺乏信用、蔑视契约时,是难以建 立人与人之间的互信基础的。所以从建立对信 用和契约神圣的认知,并用强制措施加以保障。
29
诚信的选择
0, 1 2, 0
策略 A B C
a b
c
3,2 2,1
1,6
2,3 1,2
1, 4
5,4 3,3
4, 5
标准式博弈:均衡分析
如果参与者1认为参与者2选择 C… – 参与者1对“C”的最优反应是“a”.
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1,6
2,3 1,2
1, 4
5,4 3,3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
箭头法
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2.1.3 划线法
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “B”.
参与者 2 参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
标准式博弈:均衡分析
则参与者1应该选择 “a”. – 参与者1对 “B”的最优反应是 “a”.
第二章
完全信息静态博弈
所谓完全信息静态博弈即各博弈方同时决 策,且所有博弈方对博弈中的各种情况下的得 益都完全了解的博弈问题 纳什均衡 无限策略博弈的解和反应函数 混合策略 纳什均衡的存在性
2.1 纳什均衡
博弈的解和纳什均衡 严格下策反复消去法与纳什均衡
2.1.1博弈的解和纳什均衡
-8,0 -5,-5
囚 徒 1
不坦白
坦白
-1,-1 0,-8
箭头法
囚徒2
不坦白 囚 徒 1 不坦白
-1,-1
坦白
-8,0
坦白
0,-8
-5,-5
划线法
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2.1.2严格下策反复消去法与纳什均衡
严格下策:对于某一策略 (s1 ,...si ,..., sn ) ,若 ui (s1,...si ,..., sn ) ui (s1,...si* ,..., sn ) 则称 ui (s1 ,...si ,..., sn ) 为 ui (s1,...si* ,..., sn ) 的严格下策。
参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
– –
“a” 是参与者1对 “C”的最优反应. “C” 是参与者2对 “a”的最优反应. 此结果被称为纳什均衡: 在给定其他参与者策略情况下,没有一个参与者能通过单方 面改变自己的策略而使自己的得益提高,从而没有人有积极性打 破这种均衡
同步,一次博弈--标准式博弈
构成标准式博弈的要素有:
– –
–
参与者:参加博弈并做出决策的个体 策略:参与者可能采取的行动 得益:参与者采取不同策略带来的利益或损失 参与者 2
参与者 1
策略
A
B
C
a b
c
3,2 2,1
1, 6
2, 3 1, 2
1, 4
5,4 3,3
4, 5
标准式博弈:均衡分析
站到对手的立场上,想
参与者2会怎么做呢?
参与者2 没有占优策略! 但是参与者2应该能够推断出1会选择 “a” 因此参与者2会选择 “C”
参与者 2 参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
结果
参与者 2
32
矩阵分析
生产方
诚信 不诚信
交 易
-10 诚 10 销 信 15 10 售 方 0 不 15 诚 0 -10 信
33
案例研讨
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果严格下
* * * * 以外的所有策略组合,则 策反复消去法排除了 (s1 (s1 ,..., sn ) ,..., sn ) 一定是G的唯一的纳什均衡。
命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果
推销员
医生
2003年美国制药业推销员工与药物广告 花费(单位:亿美元)
120 100 80 60 40 20 0 推销员工花费 药物广告花费
27.6 120
专栏—制药公司的销售大战(摘自华尔街日报)(续)
尽管如此,没有任何一家制药商愿意第一个 单方面裁军。葛兰素史克公司( GlaxoSmithKline)的推销员队伍是如此壮大: 它只需要七天就可以联系到美国80%以上的医生 。“这有必要吗?”葛兰素史克的CEO加涅尔说 :“应该说是没有必要,但是如果我的竞争对手 能而我做不到,我们就处于劣势。这的确是以最 坏可能的方式进行的军备竞赛。” “拥有众多的推销员不是竞争优势的源泉” ,默克公司的主席和CEO吉尔马丁补充说。他说 制药商通过发现新药来获得优势。然而,默克公 司2001年起在美国已增加了1500名推销员,使得 总数达到约7000人。 既然谁都知道拥有众多的推销员并不是竞争 优势的源泉,那为什么各家制药公司的推销员仍 然在不断膨胀呢? ——引自周林,《商业战略决策:博弈论的应 用》
道德乎? 策略乎?
30
社会学家和经济学家的争辩
社会学家云:诚信是人在较低层次的需求得到 适当满足之后自然出现的一种较高层次的需求; 诚信带给人的满足感会超过逐利带来的满足 感 。 经济学家云:人们在重复博弈、反复切磋过程 中谋求长期的、稳定的物质利益的一种策略选 择。
31
诚信案例
假定A 是一名生产商,B 是一名销售商,AB 双方互 为博弈对手,会出现以下4种博弈的可能性: 双方都讲诚信,A 按约交货,B 按约付款,各得 其所,每人都得到的效用都是10; A 诚信而B不诚信,A 交了货而B 不付款,那麽B 可以获得自己最大的利益,得15,而A 吃亏了, 得-10; A 不诚信而B诚信,即A 收了钱而不发货,则A 的 利益实现了最大化,得15,而B 得-10; A B 双方互不信任,也互不守信,生意泡汤了, 各自的效用都为0。
2 博弈方2利润: u2 q2 P(Q) C2q2 q2 8 (q1 q2 ) 2q2 6q2 q1q2 q2
* * * * 在本博弈中, 的最 (q1 , q2 ) 的纳什均衡的充分必要条件是 q1 和 q2 大值问题: * 2 max(6q1 q1q2 q1 ) q1 * 2 * * q2 q1 q2 q2 ) q q 2, u=8 max(6 1 2 q2
* * (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去法一定不会将它
消去。
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左 上
下 1, 0 0, 4
中
1, 3 0, 2
右
4, 5
占优策略
不管参与者2是选择A、B还是C, 参与者1都会选择“a”! “a” 是参与者1的占优策略! 占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1, 6
2,3 1,2
1, 4
5,4 3,3
4, 5
–
–
如何均衡稳定与收益?
2.2 无限策略的解和反应函数
古诺的寡头模型 反应函数 伯特兰德的寡头模型 公共资源问题
2.2.1古诺的寡头模型
2 博弈方1利润: u1 q1P(Q) C1q1 q1 8 (q1 q2 ) 2q1 6q1 q1q2 q1
定义 在博弈 G S1,..., Sn ; u1,..., un 中,如果策略 * * 组合 ( s1 ,...sn )中任一博弈方i的策略 si* 都是对 * * 其余博弈方的策略组合 (s1 ,..., si*1, si*1,..., sn ) 的最佳 对策,也即
* * ui (s1*,..., si*1, si*1,..., sn ) ui (s1*,..., si*1, sij , si*1,..., sn )
以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
分析经营管理的实践案例
28
诚信之道
当一个社会缺乏信用、蔑视契约时,是难以建 立人与人之间的互信基础的。所以从建立对信 用和契约神圣的认知,并用强制措施加以保障。
29
诚信的选择
0, 1 2, 0