9博弈的矩阵形式详解
博弈论9
• 2.市场机会 设两个厂商都发现了一个市场机 会,但市场容量不大。若只有一家进入,能赚 100,若同时进入,则各亏50. • 厂商2 • 进 不进 • 进 100, 0 -50 -50 -50,-50 • 厂商1 • 不进 0 , 0
0 ,100
• 本博弈也有两个纯策略纳什均衡(不进,进), (进,不进)但它们分别有利于两个厂商,因此 这两个均衡都不容易实现,都应采取混合策略。 • 请同学们自己计算混合策略纳什均衡及得益。
• • • • •
2 s 1 s w
1,3 d 2,2 0,0 r 0,0 3,1
w
• 这是一个第二阶段为静态博弈的动态博弈问题。如 这是一个第二阶段为静态博弈的动态博弈问题。 果第一阶段1选 则博弈结束 双方各得2;如果1 则博弈结束, 果第一阶段 选d,则博弈结束,双方各得 ;如果 则第二阶段有三个纳什均衡: 选r则第二阶段有三个纳什均衡:纯策略的(s,w) 则第二阶段有三个纳什均衡 纯策略的( 和混合策略的双方以1/4和 选 和 和混合策略的双方以 和3/4选s和w.
•
• • • •
3.三寡头垄断市场的需求函数是 三寡头垄断市场的需求函数是p=100-Q, 三寡头垄断市场的需求函数是 , 市场总产量Q=q1+q2+q3 ,p为市场价格 三个企 为市场价格,三个企 市场总产量 为市场价格 业的边际成本都为2,固定成本为 如果企业1 业的边际成本都为 固定成本为0.如果企业 固定成本为 如果企业 和企业2先同时决定产量 先同时决定产量q 企业3看到 、 看到q 和企业 先同时决定产量 1和q2,企业 看到 1、 q2后同时决策,问三个企业各自的产量和利润 后同时决策, 是多少? 是多少? 解:三个企业的利润函数是 L(q1,q2,q3)=qi(100-Q)-2qi i=1,2,3 根据逆推归纳法先看企业3 的选择:( :(企业 根据逆推归纳法先看企业 的选择:(企业 3的利润对其产量求导并令其为零) 的利润对其产量求导并令其为零) 的利润对其产量求导并令其为零 q3=(98-q1-q2)/2
博弈论简单支付矩阵ppt课件
• 1.博弈要有2个或2个以上的参与者 • 2.博弈要有参与各方争夺的资源或收益 • 3.参与者有自己能够选择的策略 • 4.参与者拥有一定量的信息
5
2、博弈论的诺贝尔经济学家
约翰·冯·诺依曼 博弈论之父,《博弈论和经济行为》
1994:纳什(Nash)、海萨尼(J.Harsanyi)、泽尔腾(R.Selten)
B
进
退
进 -3,-3
2, -1
A
退
-1 ,2 -1 , -1
B
直驶
转弯
直驶 A
撞车,撞车
男子汉, 胆小鬼
转弯 胆小鬼 ,男子汉 胆小鬼 , 胆小鬼
18
5、军备竞赛 美国
竞赛
苏 联
不竞赛
竞赛
4,6 2,6
不竞赛
4,3 2,3
单位: 万枚
巴勒斯坦
武装
裁军
以
色
武装 -3000,-3000 10000 ,-∞
博弈是一种竞合游戏。
22
23
按
食 槽
钮
条件:
1、每次就餐,必须要踩一下按钮食槽才会打开, 里面只有10个食料,
2、大猪先吃能吃9个,小猪先吃能吃4个, 同时到大7小3
3、每次去踩按钮会消耗3个食料的体力
踩
大
猪
不踩
大
踩
猪 不踩
踩 7,3 9,1
小猪
不踩 6,4 0,0
踩 4,0 9,-2
小猪
不踩 3,4 0,0
17
4、斗鸡博弈
电
低价格 (150,60) (120,120) 单位:百件
乙彩电
正常价格 低价格
甲 彩
博弈矩阵
The Prisoners' Dilemma Game
• Two players, prisoners 1, 2. • Each prisoner has two possible actions.
– Prisoner 1: Don‘t Confess, Confess(不坦白或坦白) – Prisoner 2: Don't Confess, Confess
A Game Theoretic: Matrix for Game of Chicken Condition: •2 players •They make decision in a competitive situation •Their choices are interdependent相互依赖 相互依赖 •Payoff 得益 measured by numbers 得益is
• Fewer years=greater satisfaction=>higher payoff.
– Prisoner 1 payoff first, followed by prisoner 2 payoff.
Prisoners’ Dilemma in “Normal” or “Strategic” Form
Single-Peaked Preferences
八戒
第二选择
沙僧
第三选择 沙僧
八戒 悟空
选择方案 A B C
Five Elements of a Game
1. The players
• • how many players are there? does nature/chance play a role?
2. A complete description of what the players can do – the set of all possible actions. 3. The information that players have available when choosing their actions 4. A description of the payoff consequences for each player for every possible combination of actions chosen by all players playing the game. 5. A description of all players’ preferences over payoffs.
一起来涨知识:博弈矩阵
一起来涨知识:博弈矩阵博弈矩阵,你听说过么?你会用么?融金汇银相信,除了融金汇银的投资者外,很多人都不了解,也不清楚其功能吧。
当然甚至融金汇银的投资者也并非全懂,全能明白。
没关系,今天融金汇银就是带各位来涨知识的。
首先,当然是要先了解什么是博弈矩阵了。
即博弈矩阵是什么?怎么做出来的?有什么用处?融金汇银带你来瞧瞧:其实“博弈矩阵”是粤贵银专属量化交易模型,主要用于扑捉粤贵银趋势行情。
博弈矩阵是融金汇银数十位顶级工程师耗时1年封闭式研发,运用K线物理重心移动理论、分型交易原理、波浪理论等,依托大数据,通过海量历史数据回测运算(回测时间:2014-1-1至2015-10-31),首创融入风控理念-动态止盈止损及投资者偏好属性的新一代量化投资决策产品。
上面这个定义你明白了么?似懂非懂没关系,融金汇银觉得,知道博弈矩阵怎么用的就好了。
融金汇银,“博弈矩阵”将复杂的多空研判模型用红绿两维的方式可视化--“红色看涨,绿色看跌”。
以粤贵银2小时K线为时间周期,他的核心价值是趋势为王和风控当先。
博弈矩阵有哪些基本使用方法呢?融金汇银简单跟你说说:其实,融金汇银觉得,博弈矩阵的使用方法非常简单,而且易用,融入风控理念的同时考虑了投资者的投资偏好。
融金汇银,博弈矩阵:适用于粤贵银趋势行情;融金汇银,博弈矩阵:红绿一秒辩多空。
红色K线表示多头强势做多,绿色K线表示空头强势做空;融金汇银,博弈矩阵:移动止盈止损。
进场后,根据止损带边界值,合理移动设置止损止盈。
这么讲不知道大伙明白没有,不过,如此方便有效的产品。
融金汇银建议各位投资者,可以去尝试一下,学习一下。
学习一个新的知识自然是有好处的。
博弈论(第二章)
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
博弈类型及其表述形式
博弈类型及其表述形式1 博弈的分类博弈模型一般分为合作博弈(cooperative game )和非合作博弈(non- cooperative game ),如图 1.1。
合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素(Martin J.Osborne and Ariel Rubinstein ,2000,P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。
合作博弈强调的是团体理性(collective rationality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。
20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。
有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin J.Osborne and Ariel Rubinstein ,2000,P2)。
合作博弈,有时也叫做联盟博弈(coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈(coalitional game with transferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。
可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。
图1.1 博弈的分类非合作博弈的分类主要从两个角度进行划分。
9博弈论方法及其模型
江西财经大学 信息学院 2007-2008
3
经济数学模型与计算机仿真
囚徒的困境(Prisoners’ Dilemma) 博弈论中最著名的模型,1950年图克(Tuker)提出 囚徒A的战略: 坦白或抵赖 囚徒B的战略: 坦白或抵赖
囚徒B 坦白 囚徒A 坦白 抵赖
(8,8) (10,0)
(0,10) (1,1)
江西财经大学 信息学院 2007-2008
6
经济数学模型与计算机仿真
完美信息动态博弈和不完美信息动态博弈 “完全信息”指的是每一个参与人都对其他所有参与人 的特征、战略空间及支付组合(主要是支付组合)有准 确的知识;否则,称为“不完全信息”. “完美信息”指动态博弈中轮到行动的参与人对之前的 博弈进程完全了解的知识.
画线法:针对对手的每一
战略,找到自己的最优战略, 并在其支付值下面画线,最 后,双方同时画线的战略组 合就是纳什均衡
U 参与人A C D
L
参与人B M
R
(2,12)
(0,12) (0,12)
(1,10)
(0,10) (0,10)
(1,12)
(0,11) (0,13)
江西财经大学 信息学院 2007-2008小猪源自稳定的结果: 大猪按,小猪不按
大猪 按 不按
按
不按
(5,1) (9,1)
(4,4) (0,0)
江西财经大学 信息学院 2007-2008
5
经济数学模型与计算机仿真
静态博弈、动态博弈和重复博弈 博弈的次序也是博弈很重要的因素,有些博弈中的所有参 与人是同时选择战略的,但更多博弈中的参与人是先后选择战 略的,也有的博弈是反复或重复进行的. 静态博弈是指在博弈中所有的参与人同时选择战略,或者 虽然不是同时选择战略,但是后选择的参与人不知道先选择的 参与人的战略的博弈. 动态博弈是指在博弈中各参与人是按某种规则分先后行 动,并且后行动者知道先行动者的战略的博弈.
扩展式博弈与标准式博弈
• 却不知道:诸葛亮知道自己知道“实则虚之”的 用兵之道
2-2 扩展式博弈
• 扩展式博弈(extensive form game): • 描述工具是博弈树
Game tree: ultimatum bargaining game(分 配100元钱)
给B90( 9-1分) 给B10( 1-9分)
10
90
90
10
10
0
90
0
0
90
0
10
0
0
0
0
2-4 联盟博弈
– 吴、蜀之间存在利益冲突,并多次兵戎相见, 但两国为什么在赤壁之战中能结为联盟?
• 联盟:相互协调行动的一组博弈参与人 • 联盟价值:一个联盟的产出(收益)
2-4 几种著名的博弈例子
囚徒困境
1,-1
下中上 1,-1
-1,1
1,-1
强 齐 王中
弱
博弈描述的复杂性
——再谈田忌赛马
强
中
田中
田忌 弱
Hale Waihona Puke 忌弱强中强
齐王
弱
田忌 弱 强
田 忌
田 忌
中 弱
强 中
齐王 强 弱
齐王 强
弱
田忌 弱
田忌 强
弱
田忌
强 中
田忌 强
中
弱
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开 囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
(1)若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方 保持沉默,此人将即时获释,沉默者将判监10年。 (2)若二人都保持沉默(相关术语称互相“合作”),则二人同样判监 1年。 (3)若二人都互相检举(相关术语称互相“背叛”),则二人同样判监 8年。
中国象棋计算机博弈
重庆工程职业技术学院
棋局表示 Board Representation
通常我们使用状态集合来表示 n 时刻的棋局状 时刻的棋局状 态。即
S n = {S , S , P , Bn ,...}
B n M n M n
S B ——棋局状态矩阵 棋局状态矩阵 棋局状态 棋子状态矩阵 S M —— 棋子状态矩阵
棋子位置矩阵 棋子位置 P M ——棋子位置矩阵 比特棋盘矩阵 比特棋盘 B ——比特棋盘矩阵
重庆工程职业技术学院
棋盘表示与棋盘矩阵 棋盘表示与棋盘矩阵
M = m
B
路 向
1,1 1, 2 1,3 1, 4 1,5 1, 6 1, 7 1,8 1,9 2,1 2, 2 2,3 2, 4 2,5 2, 6 2, 7 2,8 2,9 3,1 3, 2 3,3 3, 4 3,5 3, 6 3, 7 3,8 3,9 4,1 4, 2 4,3 4, 4 4,5 4, 6 4, 7 4,8 4,9 5,1 5, 2 5,3 5, 4 5,5 5, 6 5, 7 5,8 5,9 MB = 6,1 6, 2 6,3 6, 4 6,5 6,6 6, 7 6,8 6,9 7,1 7, 2 7,3 7, 4 7,5 7, 6 7, 7 7,8 7,9 8,1 8, 2 8, 3 8, 4 8,5 8, 6 8, 7 8,8 8,9 9,1 9, 2 9,3 9, 4 9,5 9, 6 9,7 9,8 9,9 10,1 10, 2 10,3 10, 4 10,5 10, 6 10,7 10,8 10,9
重庆工程职业技术学院
棋局的哈希数 与 棋局的哈希数(H)与哈希变换 哈希数
基本数学模型-矩阵博弈
为
max
1t n
1msinm(ast
)
min
1t n
max
1sm
ast
收益矩阵每列元素最大值中的最小值
2
鞍点
•
max
1sm
min
1t n
ast
min
1t n
max
1sm
ast
a11
•
•
设
aij
max
1sm
min
1t n
ast
,
若 , m1asaklxmm1m1tintninnam1stsaxmm1atistnn
Neumann stood up and said, “Oh that!” Then, Von Neumann, J, Zur Theorie
for the next hour and a half, he proceeded to der Gesellschaftsspiele,
give me a lecture on the mathematical theory Mathematische Annalen, 100,
j 1
y j 0, j 1, , n.
v
m
aij xi v, j 1, , n,
i 1 m
xi 1,
i 1
xi 0,i 1, , m.
10
对偶
• In the meantime, I decided to consult with the
great, Johnny von Neumann to see what he could suggest in the way of solution techniques. He was considered by many as the leading mathematician in the world. On October 3, 1947, I met him for the first time at the Institute Advanced Study at Princeton
矩阵博弈
B 在选择不同的策略时,可能获得的收益。A1B1,表示角色 A 选择策略 1,角色 B 选择策略 1 时,角色 A 所能获得的收益(A 在前,B 在后),B1A1,则表示此时角色 B 能够获得的收益。
◇角色A累计收益(囚徒A累计收益)。角色A参与者获得的累计收益。
◇角色B(囚徒B)。某组扮演角色B的参与者。
◇角色B策略(囚徒B策略)。某角色B参与者本轮选择的策略。
◇角色B收益(囚徒B收益)。角色B参与者本轮获得的收益。收益根据对方选择的收益)。角色B参与者获得的累计收益。
兔子能保证一个人4天不挨饿,而一只鹿却能让两个人吃上10天。此时,可以将参设置如表
6.7
表6.7 猎鹿博弈的收益矩阵
猎人B
猎兔 猎鹿
猎人A
猎兔
猎鹿
4(A1B1) 4(B1A1) 4(A2B1) 0(B1A2)
0(A1B2)
4(B2A1) 10(A2B2) 10(B2A2)
◇实验设计3。性别战博弈。
A2B1 A2B2 B1A1 B1A2 B2A1 B2A2 是否公布总轮数
0 2 3 5 0 2 不公布
A 选择策略 2,B 选择策略 1 时,A 的收益。 A 选择策略 2,B 选择策略 2 时,A 的收益。 B 选择策略 1,A 选择策略 1 时,B 的收益。 B 选择策略 1,A 选择策略 2 时,B 的收益。 B 选择策略 2,A 选择策略 1 时,B 的收益。 B 选择策略 2,A 选择策略 2 时,B 的收益。 不公布时,将不提示参与者博弈进行的总轮数。
色A+角色B,不需要配对的对方也选择策略1),则点的Y轴坐标(比例)=5/20=25%。若用户
博弈的描述
后,局中人 1 从 52 张纸牌中抽出一张牌,自己看完 牌的颜色后,决定是停牌( fold )还是加注 (raise) 。 若是停牌,需要将牌出示给 2 看,然后博弈结束。 此时,牌若是红色,局中人1赢,否则,则1输。若 是加注,局中人 1 需再拿出一元钱作为赌注,然后 局中人 2 决定是放弃( pass )还是追随 (meet) ,若 放弃,局中人1赢,博弈结束;若追随,则2需要也 拿出一元钱作为赌注,然后,1出示牌,若红色,1 赢,否则,1输。
Rf
Fr
Ff
(-2,2)
(1,-1)
(-1,1)
24
三、扩展式博弈的标准式表述
第一步:找出参与人的策略
参与人1的策略 S1={Rr,,Rf,Fr,Ff} 参与人2的策略 S2={M, P}
25
三、扩展式博弈的标准式表述
第二步:计算每一个策略组合下的报酬
策略组合(Rf, M)下参与人1和2的报酬
8
一、扩展式博弈(续5)
2、构成扩展式的要素
局中人集合
行动顺序
依赖行动的报酬 采取行动时掌握的信息 外生事件的概率分布
9
一、扩展式博弈(续)
3、扩展式的严格定义
节点:xm 枝: ( xm1 , xm ) 路径: {( x1 , x2 ), ( x2 , x3 ),, ( xm1 , xm )}
(2,-2)
(1,-1)
0
1
(1,-1)
(-2,2)
raise 2
(1,-1) (-1,1)
7
一、扩展式博弈(续4)
一个人不可能在他不知道有哪些选择的情 况下作出有意义的选择。 为了保证局中人在博弈的任何节点总是知 道他面临的选择,如果两个决策节属于同 一局中人的同一个信息集,那么他们的行 动分支就必须相同。
博弈论的数学模型
博弈论的数学模型作者:竺可桢学院01混合班王大方何霈邹铭摘要博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释。
本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响。
我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性。
(一)基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括:1.1.博弈的参与者。
2.2.每一个参与者可供选择的战略集。
3.3.针对所有参与者可能选择的战略组合,每一个参与者获得的利益在n人博弈中,用Si为参与者i的可以选择战略空间,其中任意一个特定的纯战略为s i,其中任意特定的纯战略为s i,s i∈Si,n元函数u i(s1,s2,……s n), 当n个博弈者的决策为s1,s2,……s n时,表示第I各参与者的收益函数。
二, 博弈的解当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的最优反应,在此状态下没有人愿意单独背离当前的局势。
这个局势叫纳什均衡:在n个参与者标准式博弈,G={ S1,S2,……S n;u1,u2,……u n}中,若战略组合{s1*,s2*,……s n*}满足对每一个参与者i,s i*是针对{ s1*,s2*,……s i-1*,s i+1*……s n*}的最优反应战略,,目标战略组合{s1*,s2*,……s n*}为该博弈的纳什均衡。
即:u i { s1*,s2*,……s i-1*,s i*,s i+1*……s n*}≥u i { s1*,s2*,……s i-1*,s i,s i+1*……s n*},对一切s i∈Si均成立。
纳什于1950年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡。
(包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论。
博弈论
1. 混合扩充
g ( g ij ) mn 甲和乙的收益矩阵分别为: f ( f ij ) mn ~ ~ ~ 博弈G的混合扩充为博弈 G ( X , Ef ; Y , Eg) :
m n m n T Ef ( p , q ) p i q j f ij pi q j f ij p f q ~ i 1 j 1 i 1 j 1 ( p, q) S m n m n Eg( p, q) pi q j g ij pi q j g ij p g q T i 1 j 1 i 1 j 1 ~ 博弈G = (X, f ; Y, g)为常和博弈当且仅当G 的混合扩充 G 为常和博 ~ 弈。当G 是常和博弈时,G 与G 具有相同的收入常和。 ~ G的混合扩充 G 的古诺均衡(最优解)叫做G的混合均衡(混合最 优解)。换句话说,G的混合局势( p*,q*)叫做的混合均衡(混合最优 解),是指( p*,q*)满足如下条件: ~ ~ max{ Ef ( p, q*) : p X } Ef ( p*,q*) min{Ef ( p*,q) : qY }
Ef ( p*, q*) p 2(2q* 1) 0 p* 0.5 p* (0.5, 0.5) Ef ( p*, q*) q 2(2 p* 1) 0 q* 0.5 i.e. q* (0.5, 0.5)
博弈的标准形式与分类
博弈的基本要素:局中人 (玩家,players)、策略(strategies)、收 益(payoff)。局中人以策略定胜负,目标是收益最大化。 策略博弈(game of strategies):以策略定胜负的博弈。 博弈的标准形式(normal form of a game):G = (Xi, fi)n,其中 n 为局 中人人数,用 Xi 为局中人 i 的策略集合,S = X1 X2 Xn 为 G 的 局势集合,fi : S R 为局中人 i 的收益函数。 局势:当每个局中人 i 都确定了自己的策略 xiXi 时, (x1, x2,, xn) 就代表着博弈G的一种局势。 按照博弈的三大基本要素,可以对博弈进行如下分类。 按局中人数分:二人博弈、多人博弈; 按策略集合分:有限博弈、无限博弈 按收益函数分:常和(零和)博弈、非常和(非零和)博弈 按博弈性质分:非合作博弈、合作博弈 按行动次序分:同时移动博弈、先后移动博弈 (序贯博弈) 以上分类可以结合起来,从而产生更加仔细的分类。比如,二人 零和有限博弈(矩阵博弈)、多人非合作无限博弈等等。
微观经济学-博弈论及应用
参与人 A
参与人B
左
右
上 2,1 0,0 下 0,0 1,2
在上面收益矩阵描述的博弈中,存在四个策略组合:(上,左)、 (上,右)、(下,左)、(下,右)。
根据N.E.的定义,请找出N.E.
借助N.E.预测博弈的结果,往往会遇到两个问题: 1、N.E.不止一个。 2、一些博弈中不存在纳什均衡。如下面收益矩阵描述的博弈:
参与人 A
参与人B
左
右
上 0,0 0,-1 下 1,0 -1,3
28.3 混合策略 迄今为止,参与人的策略均为纯策略。纯策略指参与人以100%
概率选择的策略。
而现实中,参与人完全可以随机选择策略,例如参与人采取抛硬 币的方法确定自己的策略——硬币正面朝上就“上”,反面朝上就下。 该策略实际就是以50%的概率选择上,以50%的概率选择下。这种随机 策略称为混合策略。
左
右
下(1>0)。因此,A的最优策略
参与 上 1,2 人A 下 2,1
0,1 1,0
“下”与B的策略并没有关系,此 时A的最优策略为“下”。
B做同样的思考:如果A选上,我就选左(2>1);如果A选下,我就选 左(1>0)。因此,B决定采取“左”。
上述分析中,A的“下”、B的“左”被称为占优策略。
占优策略:不论对方采取什么策略,该策略总是最优的。 显然,在博弈中,参与人如果有占优策略,他一定选择占优策
博弈的扩展形式 B
左
• 1,9
A
上•
•
下B
右
• 1,9
左
平新乔《微观经济学十八讲》课后习题详解(第10讲 策略性博弈与纳什均衡)
平新乔《微观经济学十八讲》第10讲 策略性博弈与纳什均衡跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。
以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。
1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是50020D Q p =-(1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。
理由如下:假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。
其次,达到均衡时,A p 和B p 都不会严格大于10。
否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。
所以均衡价格一定满足10A p ≤,10B p ≤。
但是由于A p 的下限也是10,所以均衡时10A p =。
给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。
综上可知,均衡时的价格为10A p =,10B p ε=-。
(2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。
下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为:max pq cq ε>- ①其中10p ε=-,()5002010q ε=-⨯-,把这两个式子代入①式中,得到:()()0max 1085002010εεε>----⎡⎤⎣⎦解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-⨯--⎡⎤⎣⎦。
9博弈的矩阵形式
混合策略的最大最小
• (von Neumann)第2定理:
– 对一个信息隐藏的俩人零和对弈:
• 总存在一个最佳混合策略,并具有下面值: maxp min(pm11+(1-p)m21,pm12+(1-p)m22) 其中,对弈的矩阵形式为: m11 m12
m21 m22
注:这是minimax结果在混合策略上的一个直接推 广。
min(3p-1,-2p+1)
混合策略
• A不再可能找到一种纯策略。 • 需将问题稍加改变:假设对弈开始时,A随机选 择一种纯策略。 • 在此场合,A选择一种纯策略的概率为p,选择另 一种纯策略的概率为1-p。 • 混合策略:随机选择纯策略,且由概率p完全定义。 • 问题:虽然A不能找到一种最佳纯策略,但是能 找到一种最佳混合策略p,对吗? • 答案:对。从上面简单例子得出的结果对一般博 弈仍成立。由此可产生一个为零和博弈寻找最佳 混合策略的方法。
A的纯策略
Minimax:矩阵形式
每行的极小值
所有行的极大值
I -1 I -1 +2 II +4 +1 III +5 +1 IV +5
II -1 +4 +1 +1
III +2 +2 +5 +5
IV +2 +2 +1 +1
max min Mi, j
irows jcolumns
Minimax:矩阵形式
• 对于博弈矩阵每行所示的每 种策略,A应假设B会采用A 策略下的最佳策略,即行中 极小值的策略。因此,A能 获得的最佳值是各行极小值 的最大值: 每行的极小值
矩阵博弈
实验可自定义矩阵博弈角色名称、策略名称及策略收益矩阵。
2.实验引导
(1)指导语 ◇实验每两人组成一对(角色 A 和角色 B),进行若干轮次。组成一对的两人在实验中
5.图表说明
实验结束后,可以查看实验的结果图,如图 6.3。
图6.3 矩阵博弈实验结果—协同策略
在下拉列表中选择组号、参与者。 (1)选择“所有参与者”,选择“选择相同策略”,组号选择“所有组”或者第i组。
◇X轴。轮次。 ◇Y轴。比例或者数量。若选择以“比例”显示,则Y轴表示比例;若选择以“数量”显 示,则Y轴表示数量。 ◇策略1。选择后将在图中绘制一个点,表示本轮次中,博弈双方均选择“策略1”的比 例或者数量。例如:共20个参与者,其中角色A有10人(角色B也是10人),若其中有3对, 在第i轮,博弈双方均选择了策略1,则点的Y轴(比例)=3/10=30%。若用户选择“数量”而 不是“比例”方式显示,则点位置为3。 ◇策略2。选择后将在图中绘制一个点,表示在本轮次,博弈双方均选择“策略2”的比 例或者数量。例如:共20个参与者,若其中有2对,博弈双方均选择了策略2,则点的Y轴(比 例)坐标=2/10=20%。若用户选择“数量”而不是“比例”方式显示,则点的Y轴坐标为2;
5(B1A2) 2(B2A2)
说明: 实验轮次、角色、匹配方式均为变量,由实验主持者在实验参数中设置。
3.参数说明与设置
1.实验参数设置 实验的参数设置如图 6.1。
2.参数说明 名称 参与人数 轮数 每组人数 匹配方式
角色 A 角色 B 策略 1 策略 2 A1B1 A1B2