博弈论与经济行为

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

i.e.
p* q*
(0.5, (0.5,
0.5) 0.5)
15
矩阵博弈
(二) 混合策略
指( p*,q*)满足如下条件: Ef ( p*,q*) max{ Ef ( p, q*)
:
pX~}
min
{Ef
(
p*,q)
:
q
Y~}
定理(混合均衡的存在性) 任何矩阵博弈都有混合均衡。
➢矩阵博弈 f 的混合均衡正对应于函数 Ef 的鞍点。
鞍点定理(最小最大原理) ( p*, q*)是矩阵博弈G 的混合均衡
2
Introduction
(一) 两个充满理性与智慧的博弈故事
1. 智猪博弈的故事
➢ 猪圈里有一大一小两头猪,猪圈一边装有踏板,踩一下,远 离踏板的食槽端就会落下食物。若一猪去踩踏板,另一猪就 会等在槽边抢先吃到食物。
➢ 若小猪去踩,大猪会在小猪跑到食槽前吃光食物;若大猪去 踩,大猪还有机会在小猪吃完之前抢吃到食物的一半。这两 头猪会采取什么策略呢?
作广告
30
不作广告
20
单位:万元 不作广告
30 20
例2. 便士匹配:没有古诺均衡 甲、乙独立决定出示硬币正或反面。若两人出示相同,甲
赢乙1元;若出示相反,乙赢甲1元。甲的收益表如下:

乙 出示正面
出示反面
出示正面
1
1
出示反面
1
1
11
矩阵博弈
(一) 古诺均衡
3. 稳妥策略与不稳定性
➢ 只有当收益矩阵的最大最小元与最小最大元一致时,矩阵博 弈才有古诺均衡(最优解)。
➢ 假定:甲和乙彼此了解对方的收益矩阵,双方都清楚自己的 收益就是对方的损失。
博弈过程:每个人都根据对方的行动来确定自己的行动,每 个人都不断地在对方选定了策略的情况下来调整自己的策略 以使自己的收益达到最大。
博弈结局:当策略调整达到这样的局势 (xh, yk) 使得 xh 是甲在
乙选定yk的情况下的收益最大策略,同时yk是乙甲在选定xh的
➢寻找混合均衡,就是去找出 ( p*,q*)[0,1]2使得
max{Ef ( p, q*) : 0 p 1} Ef ( p*,q*) min{Ef ( p*,q) : 0 q 1}
Ef Ef
( p*,q*) ( p*,q*)
p q
2(2q* 1) 2(2 p* 1)
0 0
p* 0.5 q* 0.5
• 即使甲和乙都选择稳妥策略,但若稳妥策略不稳定,那么
博弈就无法达到古诺均衡。
12
矩阵博弈
(二) 混合策略
为了消除古诺均衡未必存在的困惑,人们提出使用混合策 略,即一种连当事人自己都不知道会采取什么行动的策略,对 手就更不得而知了,从而使得局中人的行动变得相当诡异。
➢考虑二人有限博弈G = (X, f ; Y, g): f ( fij )mn , g (gij )mn • X = {x1, x2,…, xm}:甲的纯策略集合; • Y = {y1, y2,…, yn}:乙的纯策略集合; • S = X Y :博弈 G 的纯局势集合。
(即函数 Ef 的鞍点) 当且仅当 下述等式成立:
mpaX~x mqiY~n Ef ( p, q) Ef ( p*,q*) mpiX~n mqaY~x Ef ( p, q)
14
矩阵博弈
(二) 混合策略
2. 事例:求解便士匹配博弈的混合均衡
➢ 便士匹配博弈中,甲的收益矩阵为 X~ {(1 p, p) : 0 p1} [0,1]
➢ 答案:小猪舒服地等在槽边,大猪要为争取残羹奔忙于踏板 和食槽之间。
➢ 原因:对小猪而言,去踩,吃不到食物;不去踩,反而能吃 到一半食物,当然不去踩了。反观大猪,明知小猪不为,那 么自己为之总还是要比不为强。
3
Introduction
(三) 两个充满理性与智慧的博弈故事
1. 智猪博弈的故事来自百度文库启示)
定充理G~为博常弈和G博=弈(X。, f当; GY,是g)常为和常博和弈博时弈,当G且与仅G~当具G有的相混同合的扩收
入常和。因此,矩阵博弈的混合扩充仍为二人零和博弈。
矩阵博弈 G 的混合均衡:是指 G 的混合扩充 G~的古诺均衡。
即,G的混合局势( p*,q*)叫做 G 的混合均衡(混合最优解)是
矩阵博弈的矩阵表示:甲的收益矩阵 f 即可表示矩阵博弈。
f
( fij )mn
f11
f21
f m1
f12
f22
f m1
fffm12nnn
fij f (xi , y j ) (i 1,2, , m; j 1,2, , n)
8
矩阵博弈
(一) 古诺均衡
➢ 局中人的目标:选择合适的策略以使自己的收益(对方的损 失)达到最大,也即让对方的收益(自己的损失)达到最小。
➢博弈论(game theory)为解决这些问题提供了有力工具。
➢ 博弈论以人的理性为基本假定,强调策略性——一种普遍的 行为现象。这种现象的广阔背景是市场中的竞争与合作。
➢ 20世纪80年代以来,博弈论在经济学中得到了广泛应用,在 揭示经济行为的相互影响和制约方面取得了重大进展。
➢ 大部分经济活动都可以用博弈论加以解释,甚至连市场调节 与宏观调控这样的重大问题,都可看成博弈现象来研究。
➢混合策略(mixed strategies):以一定的概率采取一种策略。
• • • • •
甲乙G 的的的混混混合合合局策策势略略集集集合合合:::XYS~~~
{p [0,1]m {q [0,1]n X~ Y~
:
m i 1
:
n j 1
pi qj
甲的预期收益:Ef
( p,q)
m n i1 j 1
元,称为最大最小元;

❖从矩阵各列的最大元中找出最小

元,称为最小最大元;
如果最大最小元与最小最大元一 致,那么该元素就是鞍点,代表 矩阵博弈的古诺均衡。
x1 x2 x4x3
y1 y2 y3 y4 y5 Y
古诺均衡
10
X
矩阵博弈
(一) 古诺均衡
2. 两个博弈事例
例1. 广告竞争:存在古诺均衡


作广告
博弈的特征表现为两个或两个以上具有利益冲突的当事人处 于一种不相容状态中,一方的行动取决于对方的行动,每个 当事人的收益都取决于所有当事人的行动。当所有当事人都 拿定主意作出决策时,博弈的局势便确定下来。
博弈论的目的是要研究人们之间这种不相容的行为,推广标 准的一人决策理论。
博弈论关注的问题:在每个当事人的收益都依赖于其他当事 人的选择的情况下,追求个人收益最大化的当事人应该如何 采取行动?
➢ 智猪故事还给竞争中的弱者以等待为最佳策略的启发。博弈 中,每一方都想方设法攻击对方、保护自己,最终取得胜利; 同时,对方也是一个与你一样的理性人,他会这么做吗?这 就需要更高明的智慧。
➢任何理性企业都必然会像智猪那样,总是选择优势策略。 4
Introduction
(三) 两个充满理性与智慧的博弈故事
13
博弈论与经济行为
Introduction
到目前为止,我们对经济活动的考察没有考虑人们之间的 相互影响。其实,一个人的行为总是受到他人行为的影响。人 们在追逐自己利益时,难免要与他人发生利益冲突或矛盾。
如何克服和解决人们之间的利益冲突?如何才能实现一种既 能让每个人都实现自己的利益,又能让每个人都不妨碍和伤 害他人利益的互利互惠的和谐局面?
➢ 智猪故事揭示了大、小企业的关系。当企业定位于“大猪” 时,应选择“主动获得”之优势策略;当定位于“小猪”时, 应选择“等待获得”,这也是优势策略。比如,研究开发、 为新产品做广告,这对大企业值得,对小企业是得不偿失的。 完全市场中,作为一个理性企业,最可能的情况是小企业把 精力花在模仿上,或等待大企业打开市场后出售廉价产品。 而大企业应当以主动的态度来开拓市场。
6
Introduction
(三) 博弈的标准形式与分类
基本要素:局中人(players)、策略(strategies)、收益(payoffs) ➢ 局中人以策略定胜负,以收益最大化为目标。
标准形式(normal form):G = (Xi, fi)n,其中 Xi 为局中人 i 的策 略集合, fi : S R 为局中人 i 的收益函数(i = 1,2, ,n)。 ➢ S = X1 X2 Xn 叫做博弈G 的局势集合。 ➢ 局势:策略 n 元组 (x1, x2, , xn) ( xiXi,i = 1,2, ,n)。
piq j
fij
乙的预期收益:Eg( p,q)
m n i1 j 1
piq j gij
1} 1}
p f qT p g qT
(( ((
p,q) S~) p,q) S~)
➢混合扩充:博弈 G~ (X~, Ef ; Y~, Eg)叫做 G 的混合扩充。 13
矩阵博弈
(二) 混合策略
1. 矩阵博弈的混合扩充
鱼竿和一篓鲜鱼。不同的是:
• 他们一起去寻找大海。每到饥饿的时候,就从鱼篓中拿出
一条鱼吃。
• 当他们最终来到海边的时候,这两个人就拿着那根鱼竿开
始了捕鱼为生的日子!
5
Introduction
(二) 博弈论的研究对象
博弈是一种普遍现象,人们总会有意、无意地运用博弈的思 想。比如企业在决策时,总是会考虑竞争对手的反应;个人 与政府之间 “上有政策,下有对策” ;金融监管与创新犹 如“猫鼠博弈”;博弈还作为消遣游戏,让人们获得快乐。
➢ 最大最小元和最小最大元总存在,但二者未必一致,从而矩 阵博弈可能没有最优解。例如,便士匹配博弈没有最优解。
矩阵博弈可能没有最优解的真正原因是什么?
➢ 稳妥策略
• 甲的稳妥策略:甲的收益矩阵的最大最小元;
• 乙的稳妥策略:甲的收益矩阵的最小最大元。
➢ 问题的答案:原因在于稳妥策略可能不稳定。
• 不稳定的稳妥策略不能使博弈中的策略调整过程结束。
矩阵博弈
我们先以矩阵博弈为重点,建立博弈论的基本分析框架。
矩阵博弈:二人零和有限博弈,这是最简单的博弈形式。 ➢ 特点:甲与乙利益冲突,一方的收益就是对方的损失。 ➢ 甲的策略集 X ={x1, x2, , xm};乙的策略集Y ={y1, y2, , yn} ➢ S = X Y ={(xi, yj): i =1,2, ,m ; j =1,2, ,n} ➢ 甲的收益函数 f : S R;乙的收益函数 g : S R ➢ 零和:f (xi, yj) + g(xi, yj) = 0 (i =1,2, ,m ; j = 1,2, ,n) ➢ 标准形式:G = (X, f ; Y, g) = (X,Y, f )
情况下的收益最大策略的时候,双方策略调整宣告结束,博
弈得以确定。此时的局势(xh, yk)就是古诺均衡(最优解),即
f (xh , yk ) max{f (x, yk ) : x X}
min{ f (xh , y) : y Y}
9
矩阵博弈
(一) 古诺均衡
1. 最大最小原理
➢依据定义,矩阵博弈 f 的古诺均衡正对应于矩阵 f 的鞍点。
f
( fij )22
1 1
11
Y~ {(1 q, q) : 0 q 1} [0,1]
( p, q) S~ X~ Y~ [0,1]2, p (1 p, p), q (1 q, q)
Ef ( p, q) Ef ( p, q) p f qT
(1 p)(1q) f11 (1 p)q f12 p(1q) f21 pq f22 (2 p 1)(2q 1)
鞍点定理(最大最小原理) fhk是矩阵 f ( fij )mn的鞍点(即局势
(xh, yk)是矩阵博弈 f 的古诺均衡)当且仅当下述等式成立:
max min fij fhk min max fij
1im 1 jn
z 1 jn 1im
矩阵博弈古诺均衡的求解步骤
从矩阵各行的最小元中找出最大
z f (x, y)
博弈的分类:一般按照博弈的基本要素进行分类。 ①按人数分:二人博弈、多人博弈 ②按策略分:有限(策略)博弈、无限(策略)博弈 ③按收益分:常和(零和)博弈、变和博弈 ④按性质分:非合作博弈、合作博弈 ⑤按次序分:同时移动博弈、先后移动博弈(序贯博弈)
交叉分类:以上分类方式的结合,比如二人零和有限博弈。7
2. 鱼与鱼竿的故事
➢从前有两个饥饿的人从一位智者那里得到了一根鱼竿和一篓 鲜鱼。
• 得到那篓鲜鱼的人在原地把鱼煮熟吃完,解决了饥饿问题, 可很快又感到肚内空空,最终饿死在空鱼篓旁边。
• 另外一个得到鱼竿的人提着鱼竿朝向遥远的大海走去,当 他终于来到海边的时候,也用尽了最后一点力气而死去。
➢不久之后,同样是两个饥饿的人,也从智者那里得到了一根
相关文档
最新文档