战略管理与博弈之混合策略博弈
企业战略管理中的博弈论分析

企业战略管理中的博弈论分析企业在制定战略时,除了考虑自身的利益、环境因素和市场需求等外,还需要考虑到其竞争对手的行为。
因此,运用博弈论对企业竞争策略进行分析成为了一种有力的工具。
博弈论理论中的博弈模型具备预测和预判对手行为的能力,可以帮助企业制定最优策略,同时也可以为实际应用提供决策参考。
一、博弈论基本概念博弈是一种交互行为,在这个过程中,双方(或多方)会根据自己的利益和目标做出决策,代价是对手的反应。
在博弈中,玩家可以选择不同的策略,但其决策与结果是有联系的。
博弈论研究的是这种决策与结果之间的关系,并为企业决策提供方法和工具。
博弈论通过建立博弈模型和求解博弈结果,为企业竞争决策提供指导思路。
博弈论中最基本的概念是博弈双方的策略和收益,而策略和收益的不同组合可以对应不同的博弈模型。
博弈模型的基本要素包括玩家、策略、收益和信息等。
玩家是决定事件的个体,决策后会获得一定的收益。
策略是决策者在一定的状态下的行动方案。
收益是表示关于决策的某种结果得到的利益。
信息是用来描述玩家之间的相互影响。
这些要素共同构成了博弈模型,模型的求解结果将指导实际应用。
二、博弈论在企业战略中的应用企业竞争是一种动态博弈过程,包括市场博弈、价格博弈、广告宣传博弈等。
在这个过程中,企业需要不断地优化其经营策略,以最大化自身利益。
博弈论为企业决策提供了理论和方法,包括最大化自身收益、最小化对手收益、稳定对抗等方面。
下面以三个例子分别说明博弈论在企业决策中的应用。
1.价格竞争模型在价格竞争模型中,企业需要决定自己的定价策略,以占有更多市场份额,并获得更高的利润。
同时,企业也需要考虑竞争对手的反应,以避免价格战的产生。
此时,博弈论就可以帮助企业进行分析。
以两家企业为例,设企业A和企业B的定价分别为$a$和$b$,消费者对于两家企业提供的产品有完全相同的需求,且价格是他们做购买决策的唯一考虑因素。
两家企业的成本相同,均为$c$元。
如果两家企业的定价相同,那么他们将平分市场份额,并获得利润$a-c$。
09 第九讲 混合战略博弈

谢谢大家!
依《三国演义》的作者罗贯中的逻辑,孔 明总是比曹操计高一筹,按博弈论的术语来说, 就是孔明的理性程度要比曹操高上一阶。 孔明也知道“曹操知道孔明的打算”,于 是命令关羽在点火的华容道上等着曹操。 《三国演义》中的这个故事很可能是作者 编造的,因为在《三国志》中并无这一情节。
在这里,罗贯中假设了曹操在智力上比 孔明差一些,才有华容道上被关羽抓住,要不 是关羽旧情难忘,曹操就死无葬身之地了。
田忌的谋士孙膑了解了田忌的困境后, 就打听到这样一个消息:尽管齐威王的上、 中、下三匹马都要比田忌的对应上、中、 下三匹马好,但碰巧的是田忌的上马可胜 齐威王的中马,田忌的中马可胜齐威王的 下马。 于是,孙膑为田忌献计:下一次比赛 中第一局时田忌出下马对齐威王的上马输 一局,第二局田忌出上马对齐威王的中马, 第三局田忌出中马对齐威王的下马,这样 可连赢两局,最后净胜一千两黄金。田忌 依计而行,果真赢回一千斤两黄金。
当曹操冲破赵云、张飞的阻截后,来到 华容道前,看见华容道上静悄悄的,但有 烟火萦绕。
曹操大笑道:“孔明以为我会上他的当, 故意叫人在华容道上点火让我走另一条道, 而他却伏兵于这条道上好逮住我呢!我偏 不上他的当!” 于是,曹操令大军径直上华容道上而去, 结果与关羽大军撞个正着。
曹操为何进了孔明的圈套呢?这里的道理 是这样的: 孔明知道曹操是聪明人,而聪明人见华容 道上有烟火会认为华容道上有伏兵,于是会避 开华容道而走另一条路。如果孔明令关羽在另 一条路等着,曹操就被逮住了。 但是,曹操不仅聪明,而且还聪明过人, 他也知道孔明的如此盘算来诱他上钩,他偏不 上当,知道点火的华容道上无人,孔明的队伍 在另一条道上呢!于是他会选择走华容道。
当时,第一批拦截大军是赵云率领的,第 二批拦截大军是张飞带队的,第三批才是关羽 率部伏击。 由于曹军兵多将广,前二批伏击军不能逮 住曹操,只是抢劫一些军械马匹之类。
混合策略

序贯博弈的例子
A U B L (3,9) R L D B R (2,1)
A 先行动 B 后行动
(1,8) (0,0)
假如A先选择决策U ,B后选择策略L;A 所得收益为3。 ; 假如A先选择策略D,B后选择策略R;A 所得收益为2。 , ;
序贯博弈的例子
A U B L (3,9) R L D B R (2,1)
A 先行动 B 后行动 因此(U,L)很可能为 均衡结果。
(1,8) (0,0)
假如A先选择决策U ,B后选择策略L;A 所得收益为3。 ; 假如A先选择策略D,B后选择策略R;A 所得收益为2。 , ;
序贯博弈的例子
参与者 B
L U
参与者 A
R
(1,8)
(3,9)
(0,0)
D
(2,1)
在考虑我们之前的例子。假设博弈是同步的,我们发 现这个博弈有两个纳什均衡; (U,L) 和 (D,R)。
(-5,-5)
C (-1,-30) (-10,-10)
因此不论邦妮选择什么策略,克莱德的最优策略 总是供认。供认对于克莱德来说是一个占优策略 占优策略 。
囚徒困境
克莱德
S S
邦妮
C (-30,-1)
(-5,-5)
C (-1,-30) (-10,-10)
同样地,不论克莱德选择什么策略,邦妮的最佳 策略为供认。供认对于邦妮来说也是占优策略。
决策时机
在上面来两个例子中,参与者同时做出他们的 决策。 这样的博弈称为同步博弈 同步博弈。 同步博弈 首先行动的参与者称为领导者 领导者,后行动的参与 领导者 者称为追随者 追随者。 追随者
序贯博弈的例子
有时一个博弈可能含有几个纳什均衡,很难确 定哪一种均衡结果更有可能发生。 当一个博弈为一个序贯博弈时,那么就有可能 其中的一个纳什均衡比其它均衡更有可能发生。
CH02混合策略(博弈论,张醒洲)

(1/2,1/2,0) 表示出左、中的概率相同,但不可能出右。
• 参与人的一个纯策略只
是其混合策略的一个特
例,例如参与人2出左的
上
纯策略可表示为混合策 略 (1,0.0)。
参与人 1
下
参与人 2
左
中
右
1, 0 1, 2 0, 1
0, 3 0, 1 2, 0
图 1.1.1 at Pager 6
1/24/2020
张醒洲,大连
20
给定的纯策略可以是混合策略的最优反应
• 图 1.3.2表明,一个给定的纯策略可以是一个混合策略的最优反应, 即使这一纯策略并不是其他纯策略的最优反应。
• 在这个博弈中,B不是参与人
参与人 2
1对参与人2的纯策略L或R的 最优反应;
L q R 1-q
• 但B是参与人1对参与人2的
T 3, — 0, —
1/24/2020
张醒洲,大连
9
概率的公理化定义
• 概率测度
样本空间Ω上的一个概率测度是Ω的子集的一个函数P( ·) ,它
满足三条公理:
• 公理(1) 0≤P(E) ≤1, 对任一事件E
• 公理(2) P(Ω)=1
• 公理(3) 对任何一列互不相容的事件E1,E2,….,即Ei∩Ej=Ф(空集),
件会出现.我们可以判断哪些事件有可能出现,并且能 判断每一个事件出现的可能性大小.
• 概率
–事件的概率是对一次随机试验中该事件出现的可能性 的度量
–如果对可能性的度量以某种客观规律或物质属性为基 础, 我们就用“概率”一词
–如果对可能性的度量以个人经验、主观判断为基础, 就用“主观概率”、“信念”、“置信度”等术语
博弈论---混合战略纳什均衡

义为:
n
vi ( i , i ) ( j (s j ))ui (s) sS j1
n个参与人的混合战略纳什均衡
让我们以两人博弈为例说明这一点。假定S1 (s11, , s1K ) ,
即参S2与人(s12有1 ,K 个, s2纯J )战略,参与人2有J个纯战略。若参与人1相
1k
2 j u1 ( s1k , s2 j )
1k 2 j u1 ( s1k , s2 j )
K 1
j 1
K 1 j1
这里,1k 2 j 是参与人1选择 s1k 且参与人2选择 s2 j 的概率,即纯 战略组合 (s1k , s2 j )发生的概率。
n个参与人的混合战略纳什均衡
混合战略纳什均衡
用上述方法:求该猜谜游 戏的混合战略纳什均衡
正面 反面
正面
1 -1,
-1 1,
反面
-1 1,
1 -1,
如何理解混合战略 ——虚张声势
一个参与人选择混合战略的目的是给其 他参与人造成不确定性,这样尽管其他 参与人知道他选择某个特定纯战略的概 率是多少,但不知道实际上对手会采用 哪个战略。正是因为它在几个战略之间 的无差异性,他的行为才难以预测,混 合战略均衡才会出现。
小猪
大猪
按 等待
按 5,1 9,-1
等待 4,4 0,0
正面
1
正面 -1,
反面
-1 1,
-1
反面 1,
1 -1,
混合战略纳什均衡
在n个参与人博弈的战略式表述 G S1,, Sn;u1,,un
中,假定参与人 i 有K个纯战略:Si Si1, , Sik ,那么,
与人关心的是其期望效用。 最优混合战略:是指使期望效用函数最大的混合
CH02混合策略(博弈论,张醒洲)

12/19/2019
张醒洲,大连
22
对参与人j的混合策略,参与人i的最优
混合策略
• 参与人 2: ( q, 1-q )
• 参与人 1: ( r, 1- r )
•
求解 r*(q)
参与人 1
– 当参与人2的混合策略为(q, 1 - q)
• 给定以下信念
– 如果参与人1出正面, 他的期望 收益是1 - 2q ;
–
如果参与人1出背面,他的期望 收益是2q-1.
参与人 1
正面
• 考虑参与人1可能的混合策略
r
背面
1-r
参与人2
正面
背面
q
1-q
-1, 1 1, -1
1, -1 -1, 1
– 令 (r, 1- r) 为参与人1混合策略(以概率 r 出正面,以概率1-r出背面); – 对任意 [0,1] 上的q,计算r的值, 用 r*(q)表示。因此, 参与人2选择混
件会出现.我们可以判断哪些事件有可能出现,并且能 判断每一个事件出现的可能性大小.
• 概率
–事件的概率是对一次随机试验中该事件出现的可能性 的度量
–如果对可能性的度量以某种客观规律或物质属性为基 础, 我们就用“概率”一词
–如果对可能性的度量以个人经验、主观判断为基础, 就用“主观概率”、“信念”、“置信度”等术语
12/19/2019
张醒洲,大连
9
概率的公理化定义
• 概率测度
样本空间Ω上的一个概率测度是Ω的子集的一个函数P( ·) ,它
满足三条公理:
• 公理(1) 0≤P(E) ≤1, 对任一事件E
混合战略Nash均衡

参与人1无论选择正面(O)还是反面(R)都是无差 异的。不仅如此,参与人1此时无论以什么样 的概率分布选择正面(O)和反面(R)都是无差异 的。
• 给定参与人2的战略 2 (q,1 q) 的情况下,参与人1 的最优反应
v1 (( p,1 p),(q,1 q)) pv1 (O,(q,1 q)) (1 p)v1 ( R,(q,1 q)) (2q 1) p(2 4q)
*
K
K
k=1
k=1
命题1
• 在参与人的最优混合战略 j 对 ,有 i 0
i
( ,, 中, )
1 i
K i
vi (si , i ) vi ( , i )
j * i
• 无论参与人1的选择σ1=(p,1-p)如何,参与人2 选择σ2=(0.5,0.5,0)的所得为2.5,大于选择的 所得2。所以,σ2=(0.5,0.5,0)相对于b3占优, 也就是说,在参与人可以选择混合战略的情况 下, b3成为劣战略。
si s1 ,..., si 1 , si 1 ,..., sn
i 1 ,..., i 1 , i+1 ,..., n
i ( sik, -i )=
s-i S-i
( j ( s j )) ui ( sik,s-i )
j=1 j i
• 参与人1的期望收益在2-4q>0时随p递增;在2-4q<0 1 q 时随p递减,因此,当 2 时,参与人1的最优反 1 * q 应 p (q) 1 (即选择正面);当 ,参与人1的最优 2 * p 反应 (q) 0 (即选择反面)。
p (正面) 1
p (q )
混合博弈

正面 1 正面 -1, -1 反面 1,
反面 -1 1, 1 -1,
五 混合战略纳什均衡
请举一些这样的例子:
石头、剪子、布游戏 老虎、杠子、鸡、虫子游戏 扑克游戏 橄榄球赛 战争中 这样的博弈的均衡是混合战略纳什均衡
六 纳什均衡存在性及相关讨论
大流士阴谋推翻波斯王国的故事: 当时,一群波斯贵族聚在一起决定推翻国王,其间有 人提议休会,大流士此时站出来大声疾呼,说如果休 会的话,就一定会有人去国王那里告密,因为如果别 人不那么做的话,他自己就会去做,大流士说唯一的 办法就是冲进皇宫,杀死国王。 这个谋反的故事还提供了关于协调博弈的出路。在杀 死国王之后,贵族们想从自己人中推选出一个人当国 王,他们决定不自相残杀,而是在佛晓十分到山上去, 谁的马先叫谁就当国王。大流士的马夫在这场随机的 安排中做了手脚什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 混合战略纳什均衡 六 纳什均衡存在性及相关讨论
六 纳什均衡存在性及相关讨论
占优均衡
不同均衡概念 的关系
DSE 重复剔除占优均衡 IEDE 纯战略纳什均衡 PNE 混合战略纳什均衡 MNE
B L U A D 9,9 8,0 R 0,8 7,7 A U D 聚点 L 9,9 0,0 B R 0,0 1,1
六 纳什均衡存在性及相关讨论
猎人博弈和帕累托优势:
有两个纳什均衡: (10,10)与 (4,4); 可以认为: (10,10)比(4,4) 有帕累托优势 猎人甲 打兔 猎鹿 猎人乙 猎鹿 10,10 4,0 打兔 0,4 4,4
战略管理-策略式博弈:混合策略

3.策略式博弈:混合策略3.1混合动机博弈在第2章,我们发现有些博弈存在多个纯策略纳什均衡(比如“懦夫博弈”),有些博弈不存在纯策略纳什均衡。
这使我们考虑:人们会不会在他的纯策略之间进行随机选择呢,即,将其多个纯策略以一定的选取概率组合进其一个行动计划呢?回答是肯定的!人们的确会可能将其多个纯策略以一定的选取概率组合进入其特定的行动计划,这特定的行动计划的就称为“混合策略”。
懦夫博弈中的策略混合动机考虑第2章表2.11的懦夫博弈。
当时我们得到了两个纯策略纳什均衡:(向前,转向)和(转向,向前)。
为方便,我们将这个博弈的赢利在这里再画一遍(表3.1)。
表3.1 懦夫博弈司机乙转向向前转向1,1 -2,2司机甲(你) 向前2,-2-4,-4但问题可以想得更复杂些。
假如你是司机甲,你究竟会转向还是继续向前?这很可能取决于你对司机乙的判断:司机乙选择转向还是选择向前决定着你的选择。
但是你无法肯定司机乙是否会确定地转向,因为他的行为取决于他对你的揣摩。
所以,最终你也许只能认为司机乙有多少可能转向、有多少可能向前。
假如,你认为司机乙转向的可能性为50%,向前的可能性也为50%,那么你应该选择转向还是向前?这取决于你采取不同策略的预期赢利,它们可以计算如下:你选择转向的预期赢利:1×50%+(-2)×50%=-0.5;你选择向前的预期赢利:2×50%+(-4)×50%=-1。
你将发现,当司机乙转向、向前的可能性各为50%的时候,你选择转向是最合适,因为转向的预期赢利(-0.5)比向前的预期赢利(-1)要大一些。
但是,司机乙当然知道你在猜测他选择各策略的概率,他会不会真如你所想那样以各自50%的概率来选择转向或向前呢?如果他确实以各50%的概率在两个策略间选择,那么他知道你就会一定选择转向(这是对你最适合的策略);但是既然你选择转向,那么他又何必以各自50%的概率来选择其两个策略呢,他完全可以选择向前。
博弈7混合策略及其纳什均衡

因为银行的价值是酒馆的两倍,所以用两
个签代表银行是合理的。比如,如果抽到1、
2号签去银行,抽到3号签去酒馆。这样警察
有2/3的机会去银行进行巡逻,1/3的机会
去酒馆。而小偷的最优选择是:以同样抽签
的办法决定去银行还是去酒馆偷盗,只是抽
到1、2号签去酒馆,抽到3号签去银行,那么,
小偷有l/3的机会去银行,2/3的机会去酒
2020/10/24
中南财经政法大学信息学院
7
✓ 策略:博弈方在给定信息集的情况下选择行 动的规则,它规定博弈方在什么情况下选择 什么行动,是博弈方的“相机行动方案”。
❖ 纯策略:如果一个策略规定博弈方在每一个 给定的信息情况下只选择一种特定的行动, 该策略为纯策略。
❖ 混合策略:如果一个策略规定博弈方在给定 信息情况下以某种概率分布随机地选择不同 的行动,则该策略为混合策略。
当双方采用该策略组合时,虽然不能确定 单独一次博弈的结果究竟会是四组得益中的哪 一组,但双方进行该博弈的期期得益,也就是 多次独立重复该博弈的平均结果,应该分别为:
2020/10/24
中南财经政法大学信息学院
16
u1 pA pCu1(A,C)pA pDu1(A,D) pB pCu1(B,C)pB pDu1(B,D) =0.80.82+0.80.25+0.20.83 +0.20.21=2.6
化简后可得
pA=4pB
由于
pA+pB=1
因此pA=0.8 ,pB =0.2,这就是博弈方Ⅰ应该选
择的混合策略。
2020/10/24
中南财经政法大学信息学院
14
同理,博弈方Ⅱ选择C和D的概率pC和pD也应 使博弈方Ⅰ选择A的期望得益和选择B的期望得
第二章 战略式博弈 静态博弈与纳什均衡(续).

个概率分布
i
(
1 i
,
...,
K i
)
其中ij ( j 1,..., K ) 表示参与人i选择策略 sij
的概率,即 ij 满足:
K
0
j i
1
,
ij 1
j 1
混合战略解释了一个参与人对其他 参与人所采取的行动的不确定性,它描 述了参与人在给定信息下以某种概率分 布随机地选择不同的行动或策略。
根据上述定义,纯战略可以理解 为混合战略的特例。例如,纯战略 si1等价于混合战略
Si (i ) {si Si | i (si ) 0}
定理1:最优反应的引理
在有限n人战略式博弈G ; S1,..., Sn;u1,...,un
中,混合战略组合
*
(
* 1
,
...,
* n
)为一个Nash
均衡,当且仅当
i
,
* i
的支集
Si
(
i
)中每
一个纯战略都是给定 *下i 的最优反应。
1996年3月Professor Selten于上海
Reinhard Selten (1930 - )
(一)、小偷和守卫的博弈模型
1、模型的描述
(1)小偷偷窃,守卫睡觉,则小偷偷得脏物V (V> 0), 守卫有负效用-D(管理部门对守卫的惩罚 D>0);
(2)如小偷偷窃,守卫不睡觉,则小偷被抓有惩罚
• 假设3:当企业设定不同的价格时,
消费者总是偏向价格低的企业,而另 一方的销售量为0,如果两个企业开 出的价格相同时,他们平分市场。
(
pi
c)(a
pi
),
pi p j ;