博弈论简单支付矩阵共25页文档
博弈论讲义完整版
第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈
一 博弈的基本概念及战略表述 二 占优战略(上策)均衡
三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈
完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境
囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。
思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?
微观经济学-第十章-博弈论初步PPT课件
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
博弈论完整版PPT课件
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
信息经济学第三章博弈论
没有高深的数学知识,我们同样通过博弈论的学 习成为生活中的策略高手,学习到最适合的为人 处世的方法。
一、囚徒困境——自愿坐牢的嫌疑人
两个嫌疑犯作案后被警察抓住,被分别关在不同 的房间里受审讯。警察知道两个人有罪,但缺乏足够 的证据定罪,除非两个人当中至少有一个人坦白。
1928年纳什出生于美国,1950年获普林斯顿大学数学博 士学位,其博士论文《非合作博弈》首次区分了合作博弈 与非合作博弈,并且提出了非合作博弈的所谓纳什均衡概 念。
1930年 泽尔滕出生于现属于波兰的德国 城市,1961年获法兰克福大学数学博士学位, 曾先后任教于柏林自由大学、比勒菲尔特大 学和波恩大学。其主要贡献是在博弈论中引 入了动态分析。
60年代,泽尔腾将纳什均衡的概念引入了动态 分析,提出“精炼纳什均衡”概念。1967-1968年, 海萨尼将不完全信息引入博弈论的研究。此后, 他们两人长期合作,发展了非合作博弈理论。 80年代,克瑞普斯和威尔逊于1982年合作发表 了关于动态不完全信息博弈的重要文章。
1994年诺贝尔经济学奖获得者:
⑵ 给定小猪的最优策略是等待,大猪的最优策略只 能是按。 所以,此博弈的纳什均衡是(按,等待)。
智猪博弈表明:能者多劳,但多劳者未必多得。
对管理者的启示
在“智猪博弈”的模型中,小猪搭便车的现象 是由于规则所导致。为使资源最有效配置,如何才 能激励小猪和大猪去抢按按钮?其核心问题是每次 落下食物数量和按钮与投食口之间的距离。
零和博弈指在博弈中一组局中人所得到的支付(或收益) 恰好是另一组局中人的损失。通俗地说,博弈结果总和为零 的博弈称为零和博弈。
博弈论 第5讲
博 弈 论 讲 义 完 全 信 息 动 态 博 弈
一些说明
现实中不具完美回忆的一个例子是扑克 比赛。在扑克比赛中,参与人常常忘记 别人曾出过些什么牌。
——
博 弈 论 讲 义 完 全 信 息 动 态 博 弈
一些说明
“完美回忆”的数学描述
若x1和x2属于同一个信息集,即x2∈h(x1), x∈P(x1), x是x1的前列结(排在x1前面的决 策结),且均属于同一参与人i。 那么,存在一个x‘(可能是x本身),满足 x’∈h(x); x‘是x2的前列结;在x到达x1的行 动与x‘到达x2的行动完全一致。
{开发,开发}
{开发,不开发} {不开发,开发} 开发 B
——
A 不开发 B
{不开发,不开发}
开发
不开发 开发 (1,0) (0,1)
不开发
(0,0)
(-3,-3)
图2-8 房地产开发博弈
博 弈 论 讲 义 完 全 信 息 动 态 博 弈
动态博弈的策略式表述
B的纯策略为
{开发,开发} {开发,不开发} A 开发 B 不开发 B
开发,开发 开发,不 开发 不开发, 开发 不开发, 不开发
(不开发,{开发,开 发})
开发 不开发
-3,-3 0,1
1,0 0,0
1,0 0,1
1,0 0,0
博 弈 论 讲 义 完 全 信 息 动 态 博 弈
动态博弈的策略式表述
A
在扩展式表述博弈中, 所有n个参与人的一 个纯战略组合 s=(s1,…,sn)决定了博 弈树上的一个路径。
动态博弈的策略式表述
给出了扩展式表述的战略式表述转换,就可 以像静态博弈那样,定义纯战略纳什均衡或 混合战略纳什均衡。 按照Von Neumann观点,将动态博弈模型转化 成策略式表述形式后,按照静态博弈分析方 法,即可处理动态博弈问题。 近来研究表明,存在策略式表述相同,但却 有本质差别的,不同扩展式表述的动态博弈。 说明上述观点具有一定的局限性。因此,策 略式表述并不能取代扩展式表述。
2024年微观经济学-博弈论及应用
根据以上特点可以画出A的最优反应曲线: c
1
A的最优反应曲线
1/3
0
1
r
行参与 人A
上r 下(1-r)
列参与人B
左c
右(1-c)
2,1 0,0 0,0 1,2
B的期望收益=1rc+2(1-r)(1-c)=3rc-2r-2c+2 B的边际期望收益(MR=dR/dc)=3r-2
B的边际期望收益(MR=dR/dc)=3r-2 r=2/3,MR=0,期望收益达到最大值,c为[0,1]任意值; r<2/3,MR<0,降低c可以使收益增大,c最小为0; r>1/3,MR>0,提高c可以使收益增大,c最大为1。
在该序贯博弈中,我们依据收益矩阵找到的N.E.(上,左)并 不是合理的均衡,因为A选择“上”是愚蠢的。
B
左
• 1,9
A
上•
•
下B
右
• 1,9
左
• 0,0
•
右 • 2,1
从博弈的结果看,B非常不幸,最终他只能得到1而非9。面临巨大落 差,B极有可能威胁A,声称如果A选“下”,那他就选“左”,让大家一 无所获。
博弈的扩展形式 B
左
• 1,9
A
上•
•
下B
右
• 1,9
左
• 0,0
•
右 • 2,1
参与人B
左右
参与 上 1,9 1,9 人A 下 0,0 2,1
序贯博弈中,先行者需要分析跟随者的反应,因此,分析博弈树是由 后往前推算。
首先考虑B的 选择:
如果A选“上”, 那么B选“左”或“右”无差异; 如果A选“下”, 那么B选“右”比较明智(1>0)。
博弈论课件
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏 但C不知道
B
所以我脸脏
所以B一定知道自己脸脏 但B不知道,说明我的假设不正确 故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS:
NO.1 知 占识优目策标略均衡 NO.2 能 重力复目剔标除占优均衡 NO.3 情 纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析,掌握重复剔除的占优策略、纳什均 衡与混合策略均衡理论。 培养分析问题、解决问题的能力。 体会博弈论的应用价值,开拓视野,激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频 参考书目
教学课件
Teaching courseware
目录
• 第一章 博弈论概述
006
• 第二章 完全信息静态博弈
041
第一节 占优策略均衡
043
第二节 重复剔除的占优均衡
066
第三节 纳什均衡
088
第四节 混合策略均衡
106
第一章
教学要求
知识目标 掌握博弈论的概念、发展、分类与要素
42
第二章 完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达: 策略式表达 和 扩展式表达 。策略式表达更适合于静态 博弈,而扩展式表达更适合于讨论动态博弈。
非合作博弈学习.pptx
• 政府管制使厂商从 “囚徒困境中” 解放出来,
说明自由竞争并不是最有效的经济体系,适
当的政府管制可以更有效的提高社会经济和
政治效益
10
第11页/共33页
3努力还是偷懒
甲
博弈的标准式
乙
努力
偷懒
努力 (10,10) (2,15)
偷懒
(15,2) (5,5)
要改变 合作困境,即改变博弈的均衡,可 采取奖勤罚懒措施
32
第33页/共33页
第17页/共33页
• 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另 一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小 猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关 的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪 的收益为 -1。
• 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开 关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定 时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强力壮的 大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况下,大猪 得到的收益是 4,小猪得到的收益是 2。
第22页/共33页
二存在多个纳什均衡的博弈
• 1 性别博弈
男方
看足球 听昆曲
女方
看足球
听昆曲
(10,2) (-1,-1)
(-1,-1) (2,10)
❖ 采用“划横线法”寻找“性别博弈”的纳什均衡 ❖ (男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是“性别博
弈”的纳什均衡。 ❖ 在特定情况下,惯例和传统能够提供博弈的多重纳什均衡中那个更可能出现
(a,a) (d,c)
偷懒
(c,d) (b,b)
博弈论最全完整ppt-讲解
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
2021/3/11
34
课程主要内容
第一章 完全信息静态博弈 第二章 完全信息动态博弈 第三章 不完全信息静态博弈 第四章 不完全信息动态博弈 第五章 委托-代理理论 第六章 逆向选择与信号传递
通过几次严打来获得“冷面杀手”的声 誉
2021/3/11
11
导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
2021/3/11
12
导论
一、博弈均衡与一般均衡
2021/3/11
13
案例:囚犯困境
支付
嫌疑 人B
嫌疑人A
抵赖
坦白
抵赖 -1,-1 0,-9
坦白 -9,0 -6,-6
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
2021/3/11
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
托马斯·谢林
24
导论
三、博弈论的基本类型
2021/3/11
25
合作博弈与非合作博弈
合作博弈(cooperative game)
达成有约束力的协议(binding agreement),强调团体理性,强调效 率、公正、公平
非合作博弈(non-cooperative game)
博弈论及随机算法
2.2最小化最大原则最小最大原则(minimax principle)是证明随机算法运行时间下界的一个通用技巧,只能用于对所有输入和随机选择,都可以在有限时间内中止的算法最小最大原则使用博弈论中的概念,我们首先对博弈论进行介绍。
博弈论博弈论(game theory)是研究多个理性个体间博弈过程和结果的理论,一个简单的博弈通常可以由一个收益/支付矩阵(payoff matrix)!表示,考虑两人间有先后次序的石头剪子布博弈:支付矩阵上的元!!"∈!表示行决策者Roberta选择策略#,列决策者Charles 选择策略$时,Charles付给Roberta 的钱数/收益/数目…剪刀布石头剪刀01-1布-101石头1-1RobertaCharlesØ这是一个双人零和博弈(two-person zero-sum game),即两个人的净收益总和为0Ø进一步假设这是一个零信息博弈,即没有博弈者知道对手的策略。
自然地,行博弈者想最大化支付值,列博弈者想最小化博弈值Ø如果R 选择策略i,他得到的支付值是min"!!",此时R 的最优策略是(#=max $min"!!",这是R 支付给C 值的下界Ø如果C选择策略j,他得到的支付值是m,-!!!",此时C 的最优策略是(%=m#.m,-!!",这是C 支付给R 值的上界剪刀布石头剪刀01-1布-101石头1-10RobertaCharles一般有,max*min+),+≤m<=-m>?,),+,当@.=@/=V时,称它为博弈的一个解值,对应的策略称为博弈的解、鞍点、最优策略。
对于有界的博弈,令B,D分别表示R 和C 的最优策略,有@=)01。
注意,博弈可能不只有一个最优策略,也就是说解不只一个。
混合策略前面的讨论是针对于单一策略,当可能的策略为一个概率分布时,我们称其为混合策略,此时行决策者在分布p =(H %,…,H 2)上进行决策,H ,表示选择策略<的概率,列决策者在分布K =(K %,…,K 3)上进行决策,K +表示选择策略L 的概率。
博弈论算法讲义
博弈论算法一、博弈的战略式表述及纳什均衡的定义在博弈论里,一个博弈可以用两种不同的方式来表述:一种是战略式表述(strategic form representation ),另一种是扩展式表述(或译为“展开式表述”)(extensive form representation )。
从分析的角度看,战略式表述更适合于静态博弈,而扩展式表述更适合于讨论动态博弈。
1.1博弈的战略式表述战略式表述又称为标准式表述(normal form representation )。
在这种表述中,所参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。
战略式表述给出:1.博弈的参与人集合:(),1,2,,i n ∈ΓΓ=。
2.每个参与人的战略空间:,1,2,,i S i n =。
3.每个参与人的支付函数:12(,,,),1,2,,i n u s s s i n =。
我们用()11,,;,,n n G S S u u =代表战略式表述博弈。
例如在两个寡头产量博弈里,企业是参与人,产量是战略空间,利润是支付;战略式表述博弈为:{}121122120, 0; (,), (,)G q q q q q q ππ=≥≥ (1.1)这里i q 、i π别表示第i 个企业的产量和利润。
1.2纳什均衡的定义有n 个参与人的战略式表述博弈()11,,;,,n n G S S u u =,战略组合{}1,,,,i n s s s s ****=是一个纳什均衡。
如果对于每一个i 、i s *是给定其他参与人选择{}111,,,,,i i i n s s s s s *****--+=的情况下第个参与人的最优战略,即(,)(,),,i i i i i i i i u s s u s s s S i***--≥∀∈∀ (1.2)或者用另一种表述方式,i s *是下述最大化问题的解:111argmax (,...,,,,...,),1,2,..., ;i i i i i n i i s u s s s s s i n s S *****-+∈=∈(1.3)我们用这个定义来检查一个特定的战略组合是否是一个纳什均衡。
矩阵博弈
实验可自定义矩阵博弈角色名称、策略名称及策略收益矩阵。
2.实验引导
(1)指导语 ◇实验每两人组成一对(角色 A 和角色 B),进行若干轮次。组成一对的两人在实验中
5.图表说明
实验结束后,可以查看实验的结果图,如图 6.3。
图6.3 矩阵博弈实验结果—协同策略
在下拉列表中选择组号、参与者。 (1)选择“所有参与者”,选择“选择相同策略”,组号选择“所有组”或者第i组。
◇X轴。轮次。 ◇Y轴。比例或者数量。若选择以“比例”显示,则Y轴表示比例;若选择以“数量”显 示,则Y轴表示数量。 ◇策略1。选择后将在图中绘制一个点,表示本轮次中,博弈双方均选择“策略1”的比 例或者数量。例如:共20个参与者,其中角色A有10人(角色B也是10人),若其中有3对, 在第i轮,博弈双方均选择了策略1,则点的Y轴(比例)=3/10=30%。若用户选择“数量”而 不是“比例”方式显示,则点位置为3。 ◇策略2。选择后将在图中绘制一个点,表示在本轮次,博弈双方均选择“策略2”的比 例或者数量。例如:共20个参与者,若其中有2对,博弈双方均选择了策略2,则点的Y轴(比 例)坐标=2/10=20%。若用户选择“数量”而不是“比例”方式显示,则点的Y轴坐标为2;
5(B1A2) 2(B2A2)
说明: 实验轮次、角色、匹配方式均为变量,由实验主持者在实验参数中设置。
3.参数说明与设置
1.实验参数设置 实验的参数设置如图 6.1。
2.参数说明 名称 参与人数 轮数 每组人数 匹配方式
角色 A 角色 B 策略 1 策略 2 A1B1 A1B2
博弈论简单支付矩阵课件
(4)、长街上的超市 (海滩占位模型)
0
1/4
A’ 1/2 B’
3/4
1
其它相似情形:旅行社的热门路线;黄金时间的电视节目
(5)狩猎
两个猎人围住一头鹿,各卡住两个关口中的一个,齐心协 力即可成功获得并平分猎物。此时有一群兔子跑过,任何一人去 抓兔子必可成功,但鹿会跑掉。
贡献主要在于通过实验室实验来测试根据经济学理 论而做出预测的未知或不确定性。是对以博弈论为 基础构建的理论模型进行实证证伪工作的一大创举 。
2005:奥曼(Aumann)、谢林(Schelling)
他们通过博弈理论分析增加了世人对合作与冲突的 理解。其理论模型应用在解释社会中不同性质的冲 突、贸易纠纷、价格之争以及寻求长期合作的模式 等经济学和其他社会科学领域。
博弈是一种竞合游戏。
SUCCESS
THANK YOU
2019/9/16
纳什的基本贡献是证明了非合作博弈均 衡解及其存在性,建立了作为博弈论基 础的“纳什均衡”概念;海萨尼则把不 完全信息纳入到博弈论方法体系中;泽 尔腾的贡献在于将博弈论由静态向动态 的扩展,建立了“子博弈精练纳什均衡” 的概念。
1996:莫里斯(James A.Mirrlees)和维克瑞(William Vickrey)
博弈四要素
• 1.博弈要有2个或2个以上的参与者 • 2.博弈要有参与各方争夺的资源或收益 • 3.参与者有自己能够选择的策略 • 4.参与者拥有一定量的信息
2、博弈论的诺贝尔经济学家
约翰·冯·诺依曼 博弈论之父,《博弈论和经济行为》
1994:纳什(Nash)、海萨尼(J.Harsanyi)、泽尔腾(R.Selten)
博弈论四种博弈类型
华为在阿根廷电信设备市场上的竞争博弈华为技术冇限公司是一家总部位于中国广东省除圳市的生产销售电信设备的员工持股 的民营科技公司,经过数十年的发展,成为全球最人的电信网络解决方案提供商,全球第二 人电信基站设备供应商,同时也是全球第六人手机厂商,其海外市场的利润占到其总利润的 75%:在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场山岌鼻信、阿尔卡特- 朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下來,我们将分析其不同条件下 的博弈结果: 1、完全信息情况下的静态轉弈A 、纳什均衡:我们将上述三家公司统称为原有垄断者•,华为称为虎视眈眈的潜在进入 者,原冇垄断者想要保住自己现冇的垄断地位,就会想要阻止潜在进入者进入,在这个博弈 中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同 竞争,具体的支付矩阵结果表示如下:不斗争 斗争根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的瑕 好的一组策略。
当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获彳'J 70单位 的利润;同样的,原有垄断者选择不斗争的情况2潜在进入者的最优选择是进入,获得 20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个 纳什均衡(不进入,斗争)。
B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许町证,在严格管制 情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各 自均有止的利润)在这两种情况卜考虎两者是否进行价格战的情况,具体支付矩阵如卜•所示: 原有垄断者对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进 行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润, 在原有垄断者定高价时,潜在进入者定低价町以获得额外的10单位利润,从而确定华为必 将进行价格战,在完全信息情况卜,原何垄断者会将自己豐于潜在进入者的位豐进行决策, 从而决定自己也要进行价格战,否则会失去更多的利润。
西方经济学 第五版 高鸿业 博弈论 第10章
2020年3月6日星期五
制作者:张昌廷(河北经贸大学)
18
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
3.总结 在一个单元格中,如果两个数字之下均划有线,
则两个参与人都没有单独改变策略的动机,因为这两 个数字分别是列最大值和行最大值;如果两个数字之 下均没有线,则两个参与人都有单独改变策略的动机, 因为这两个数字分别不是列最大值和行最大值;如果 两个数字中一个下面有线一个下面没线,则有线的数 字所代表的参与人没有单独改变策略的动机,没线的 数字所代表的参与人有单独改变策略的动机。
甲厂商分别有两个条件策略和条件策略组合。
2020年3月6日星期五
制作者:张昌廷(河北经贸大学)
8
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
三、条件策略和条件策略组合
2.乙厂商的条件策略和条件策略组合 把乙厂商在甲厂商选择合作条件下的最优策略即
合作叫做乙厂商的条件优势策略或相对优势策略,简 称条件策略。
一、不存在纯策略均衡时的混合策略均衡
5.混合策略的纳什均衡 参与人Fra bibliotek条件混合策略可以分别确定,确定了条
件混合策略,就可以进一步来确定混合策略的纳什均 衡。
2020年3月6日星期五
制作者:张昌廷(河北经贸大学)
四、纳什均衡
2.纳什均衡的概念 第二,对纳什均衡的理解
一是“单独改变策略”是指任何一个参与人在所 有其他人都不改变策略的情况下改变自己的策略。其 他人也同时改变策略的情况不在考虑之列。
二是“不会得到好处” 是指任何一个参与人在 单独改变策略之后自己的支付不会增加,这包括两种 情况:或者支付减少,或者支付不变。
第十章---博弈论初步精选全文完整版
甲 (式乙)
p.61
p.42
A B
混合策略组合及其支付也就有无限多的可能。
q.31 C 4,6 7,3
乙
.q72 D 9,1 2,8 9
不存在纯策略均衡时的混合策略均衡3
• 条件混合策略:参与人在假定其他参与人按某一概率选择某一策略
的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合 策略,称为“条件混合策略”。
• 对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付 多1,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的 条件策略是也不合作,乙若合作支付只有1,不合作则可得到3。
• 条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与
作为它的条件的对方策略之间的组合,称为“条件优势策略组合”或
• 假q2=定1-(q1p代1,入p甲2)与、乙(各q自1,的q2期)望的支取付值表从达0到式1有无,限经多整可理能可,得把:p2=1-p1和 E甲= p1(7-10q1)+5q1+2(式1); E乙= 5q1(2p1-1)-7p1+8(式2)
• 每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时, 己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。
e点的坐标是p1=0.5,q1=0.7,则纳什均衡 时p2=0.5,q2=0.3 。
q1 1
本题中混合策略的纳什均衡还可表示为:
((p1 , p2),(q1 ,q2) )= ((0.5 , 0.5),(0.7 , 0.3) )。 0.7 本题中,只有唯一的这个纳什均衡点。
1
q1<0.7
p1= [0,1] q1 = 0.7