微观经济学-第十章-博弈论初步PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
3
7
1
9– 8–
2
24
第三节 混合策略均衡 二、混合策略的纳什均衡
第三节 混合策略均衡
二 混合策略的纳什均衡
❖ 即使纯策略的纳什均衡不存在,相应的混合策
略纳什均衡总会存在。
❖ 纯策略纳什均衡作为 特例被包括在混合策
·q1
微观经济学
第十章 博弈论初步
主讲人:韩松
1
封二
* 自嘲*
一介学究,惶惶似狗。 东拼西凑,闲来插柳。 或存疏漏,等着挨揍。 钱财无有,知识半斗。 交流携手,相逢美酒。 余望何求?潮起云收。
2
博弈论
第十章 博弈论初步 知识结构
知识结构
基本要素
支付矩阵
完全信息 静态博弈
纯策略均衡
混合策略均衡
条件策略 下划线法
二 条件策略和策略组合
❖ 把甲厂商在乙厂商选择合作条件下的最优策略
( 不合作 )叫做甲厂商 的条件优势策略,与
乙厂商
合 作 不合作
这一条件策略相联系 的策略组合叫条件优 势策略组合。
❖ 条件策略包括参与人 的条件策略及组合。
合
甲作
厂
商
不 合
作
6 5
1 7
5
1 3
2
11
第二节 纯策略均衡 三、纳什均衡和下划线法
❖ 威胁策略一定具有可信性,才能真正发挥作用。
28
[案例] 核武环峙中国
[案例] 核武环峙中国
❖ 毛泽东说: “ 中国人 多,不怕扔原子弹”。
❖ 强权政治、单边主义 和恐怖活动都增加了 文明毁灭的危险—— 局部核战争已是不可 忽视的现实威胁。
❖ “ 难道上个世纪的梦 魇又回来了吗?”
29
第四节 动态博弈 二、博弈树的纳什均衡
❖ 根据“看不见的手”原理,理性的人在追求自 己利益中,会同时增进社会的整体福利。
19
[案例]“空城计”中的占优策略均衡
[案例] “空城计”中的占优策略均衡
❖ 诸葛亮对司马懿的思想轨迹是相当了解; ❖ 诸葛亮的行径司马懿也能做出理性判断。
司马 进攻 撤退
司马 擒拿 放走
守 诸城 葛
弃 城
大胜
平手
被擒
第四节 动态博弈
二 博弈树的纳什均衡
❖ 博弈树模型又称为扩展型博弈模型,用博弈树
来描述的序贯博弈又叫做扩展型博弈。
起点
· · 竞争者
垄断者 不抵制
进入
b
抵制
a
· 不进入 c 不抵制
中间点
垄断者 抵制
··(11,,44))
dd
·e (-2, 2)
· (0, 5)
f
·g
终点
(0, 3)
30
[资料] 下棋程序的算法与深度
放 刘走 备捉
拿
孙权 联合 反目
10
-15
12 1
5
-5 20
-20
❖ 刘备军事集团参与赤壁 之战有三个战略目标:
❖ 首先,必须联合孙权打 败曹操,从而为自己赢 得生存的时间与空间;
❖ 其次,又不能让曹操一 方消失,曹操的存在使 刘备的存在具有价值;
❖ 最后,还要争取在混乱 中尽可能地多捞私利。
15
b p1(b11 b12 ) (1 p1)(b21 b22 )
❖
A的条件混合策略为:参
p1
策 略
0
p1 0,1
1
a 0 a 0 a 0
与1
人
A
p2
策 略
2
参与人B
q1
q2
策略1 策略2
b11
b12
a11 b21
a21
a12 b22
a22
26
[讨论] 快餐店喜欢扎堆么?
[讨论] 快餐店喜欢扎堆么
商
不 合
❖ 都有划线的支付组合。 作
6– 5
1
7–
5
1 3–
2–
17
第二节 纯策略均衡 四、纳什均衡的特性
第二节 纯策略均衡
四 纳什均衡的特性
❖ 在同时博弈中,纯策略的纳什均衡可能存在,
也可能不存在。 ❖ 在纳什均衡存在的条
乙厂商
合 作 不合作
件下,它可能是惟一 的也可能不惟一。
❖ 如果纳什均衡存在, 它可能是最优的也可 能不是最优的。
逃脱
大胜
×
被擒
×
使 曹用 家除
掉
3 -10
-15 8
20 10
-1
-15
20
[资料] 囚徒困境
[资料] 囚徒困境
坦
甲白 方不
坦 白
乙方 坦 白 不坦白
-5
-7
-5 -1
-7
-1 -2
-2
❖ 双方都存在着偷换策略的 诱惑,处于不稳定状态。
❖ 即使两个囚徒事先订立了 攻守同盟(死不坦白), 他 们最终也会背叛同盟。
❖ 阿伦·图灵的“纸上机器”。
❖ 贝尔实验室 克劳迪 · 申朗 的“A策略”和“B策略”。
❖ 1950年 , 约翰·冯·诺依曼
( John von Neumann )
设计出 “MANIAC一
号” 。
5
[视频] 智能的较量
[视频] 智能的较量
❖ 脑力争夺、利益平衡、人生选择 … 各份 戏码精彩纷呈,显现价值取舍的智慧。
不完全信息
纳什均衡 囚徒困境
动态博弈
博弈树
逆向归纳法
3
第一节 博弈论和策略行为 一、博弈的定义
第一节 博弈论和策略行为
一 博弈的定义
❖ 厂商之间的行为是相互影响的,这种相互作用 的关系就如同赌博下棋(博弈)一样。
❖ 博弈论 (Game Theory) 是研究在策略性环境 中如何策略性地进行决定和采取行动的科学。
[资料] 下棋程序的算法与深度
❖ 第一个突破出现在 1958年,匹兹堡大 学的奈维尔、肖恩 和西蒙发现剔除相 当大的部分而不影 响最后结果,这叫 α–β算法。
❖ 这是一个纯数学领 域的技巧,独立于 任何知识而生效。
31
第四节 动态博弈 三、逆向归纳法
第四节 动态博弈
三 逆向归纳法
❖ 在所有的纳什均衡中,找到最有可能实现的策 略组合,这就是对纳什均衡的“精练”。
1
略纳什均衡之中。
·0.7
❖ 混合策略博弈的均衡
·乙厂商
·e
甲厂商
与纯策略博弈的均衡
恰好完全相同。
·o
· ·0.5
1 p1
25
第三节 混合策略均衡 三、混合博弈的一般理论
第三节 混合策略均衡
三 混合博弈的一般理论
❖ 参与人A与B的判别式为:
a q1(a11 a21) (1 q1)(a12 a22 )
❖ 经济学越来越重视对信息的研究,特别是信息 不对称对于个人选择、制度安排的影响,信息 经济学与博弈论的应用相互渗透。
8
[资料] 博弈的类型
❖ 合作博弈与非合作博弈[资:料] 博弈的类型 能否达成有约束力协议完;全信但息不博完弈美
❖ 重完复全博且弈完美与非重复博弈: 具有信息连博续弈性的特点;海萨尼转换(含自然)
5
9
1 4
4
-1 0
0
16
第二节 纯策略均衡 三、纳什均衡和下划线法
第二节 纯策略均衡
三 纳什均衡和下划线法
❖ 条件均衡策略下划线法是用下划线分别来表示
甲厂商和乙厂商的条件策略。
乙厂商
❖ 在甲厂商的支付矩阵
合 作 不合作
中,找出每一列的最
合
大数字;在乙厂商的 甲 作
ห้องสมุดไป่ตู้
支付矩阵中,找出每 厂
一行的最大数字。
[案例] “华容道”里的纳什均衡(1)
曹操 小道 大路
小 孔道 明大
路
被擒 擒住
逃脱 空等
逃脱 空等
被擒 擒住
❖ 孔明曰:“亮夜观乾象,操贼未合身亡。 留这人情, 教云长做了,亦是美事。” 玄德曰:“先生神算,世所罕及!”
14
[案例]“华容道”里的纳什均衡(2)
[案例] “华容道”里的纳什均衡(2)
❖ 每个囚徒都希望对方选择 抵赖,而自己坦白获释。 当他们都这么想并这么做 的时候,就形成了都坦白 的左上角结局。
21
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 以有限的纯策略为基础的混合策略一定是无限
的,源于概率取值的无限性。
乙厂商
❖ 甲厂商和乙厂商的混
❖ 零和博弈与非零和博弈不完:全信息博弈 你的所失正是我的所得。
类型 区别 完完全全信信息息
不完完美全信信息息
静态
内容
动态
纳什均衡针对策略集和支精付炼集纳什均衡
贝叶针斯对-纳记什忆均(过衡程),信精息炼结贝点叶是斯唯-一纳的什均衡
9
第二节 纯策略均衡 一、寡头博弈和支付矩阵
第二节 纯策略均衡
一 寡头博弈和支付矩阵
[案例] 孙刘联合的“智猪博弈”
[案例] 孙刘联合的“智猪博弈”
❖ 孔明笑曰: “亮借一
帆风,直至江东,凭三
寸不烂之舌,说南北两
军互相吞并。若南军胜,
共诛 曹操 以取荆州之 按
地;若北军胜,则我乘 小 键
势以取江南可也。” 猪
❖ 荆州是赤壁之战最重要
等 待
的战果之一,却被出力
很少的刘备摘去了。
大猪 按键 等待
合
甲作
厂
商
不 合
作
6– 45–
31
–74
14
9–1 83–
2–
18
第二节 纯策略均衡 五、纳什均衡和社会福利
第二节 纯策略均衡
五 纳什均衡和社会福利
❖ 无论其他参与者采取什么策略,某一参与者的 惟一的最优策略就是他的占优策略,任何一方 都不想偏离各自认为的最优策略。
❖ 囚徒困境(Prisoners’ Dilemma)反映了个人 理性和团体理性的冲突,从个人理性角度出发 选择的占优策略结局,从整体来看却是最差的。
❖ 1944 年, 冯·诺依曼和摩根斯顿共著《博弈 论与经济行为》,将博弈论用于经济领域。
❖ 博弈论在政治学、计算机科学、国际关系、军 事战略、生物学等领域有广泛的应用。
4
[资料] 会下棋的机器
[资料] 会下棋的机器
❖ 1769 年, 匈牙利工程师 巴朗· 沃尔夫冈 · 凡 · 坎比 林为奥地利皇后做了一台 会 “下” 象棋的机器。
资料博弈的类型类型区别静态动态完全信息纳什均衡精炼纳什均衡不完全信息精炼贝叶斯纳什均衡资料博弈的类型资料博弈的类型完全且完美信息博弈完全但不完美信息博弈不完全信息博弈海萨尼转换含自然类型区别内容完全信息针对策略集和支付集完美信息针对记忆过程信息结点是唯一的第二节纯策略均衡一寡头博弈和支付矩阵第二节纯策略均衡第二节纯策略均衡这一个只有两方参加并且同时进行决策的简单博弈
❖ 逆向归纳法包括两个步骤:第一,从最后阶段 的每一个决策点开始,确定参与人此时所选择 的策略,并把其他策略删除;第二,对简化博 弈重复删除程序,直到最后得到最简博弈。
❖ 实际上,逆向归纳策略总是属于纳什均衡,尽 管纳什均衡并不一定是逆向归纳策略。
32
第二节 纯策略均衡
三 纳什均衡和下划线法
❖ 当厂商的条件策略组合恰好相同,从而都不再 有单独改变策略的倾向时,整个博弈就达到了 均衡,是博弈的解,称为纳什均衡。
❖ 纳什均衡指的是参与者在该策略组合上,任何 单独改变策略都不会得到好处;当所有其他者 都不改变策略时,没有人会改变自己的策略。
❖ 假定支付不变时,由于存在成本和风险,参与 者也不愿意单独地改变策略。
略共同作用的结果——支付组合。
7
第一节 博弈论和策略行为 三、博弈的类型
第一节 博弈论和策略行为
三 博弈的类型
❖ 从要素可以进行一些博弈分类,如两人博弈和 多人博弈、零和博弈和非零和博弈、有限博弈 和无限博弈、同时博弈和动态博弈。
❖ 从20世纪80年代起,博弈论逐渐成为主流经济 学的一部分,转向对人们之间关系的研究。
❖ 假定在某个寡头市场上,有甲、乙两个厂商。
❖ 这一个只有两方参加 并且同时进行决策的 简单博弈。
❖ 用一个以二元数组为 元素的矩阵 ( 称博弈 矩阵或支付矩阵 ) 来 描述和分析。
合
甲作
厂
商
不 合
作
乙厂商
合 作 不合作
6
5
5 1
7
1 3
2
10
第二节 纯策略均衡 二、条件策略和策略组合
第二节 纯策略均衡
q1
q2
合策略组合就是一个
概率向量组合。
甲 p1
❖ 与纯策略不同,每一 厂 个概率向量是相应参 商 p2
与人的一个混合策略。
6– 4
3
7–
1
9– 8–
2
22
[案例] 猜拳游戏必胜招
[案例] 猜拳游戏必胜招
❖ 一位日本收藏家无 法决定让谁来拍卖 画作,于是要求佳 士得与苏富比老板 猜拳定胜负。
❖ 佳士得老板向员工 们讨教猜拳策略, 最后在一名主管的 11岁女儿建议下, 决定出 … …
6
第一节 博弈论和策略行为 二、基本的要素
第一节 博弈论和策略行为
二 基本的要素
❖ 策略性决策和行动是指每个人要根据其他人的 可能反应来决定自己的决策行动,博弈论显然 是分析寡头厂商行为的一个恰当工具。
❖ 参与者:进行决策的个体,至少有两个,有时 和可以引入一个虚拟的参与人如“自然”;
❖ 策略:是一项规则,一组可选择的行动集合; ❖ 支付:各自的报酬,所得到的支付都是所有策
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
3
7
1
9– 8–
2
24
第三节 混合策略均衡 二、混合策略的纳什均衡
第三节 混合策略均衡
二 混合策略的纳什均衡
❖ 即使纯策略的纳什均衡不存在,相应的混合策
略纳什均衡总会存在。
❖ 纯策略纳什均衡作为 特例被包括在混合策
·q1
微观经济学
第十章 博弈论初步
主讲人:韩松
1
封二
* 自嘲*
一介学究,惶惶似狗。 东拼西凑,闲来插柳。 或存疏漏,等着挨揍。 钱财无有,知识半斗。 交流携手,相逢美酒。 余望何求?潮起云收。
2
博弈论
第十章 博弈论初步 知识结构
知识结构
基本要素
支付矩阵
完全信息 静态博弈
纯策略均衡
混合策略均衡
条件策略 下划线法
二 条件策略和策略组合
❖ 把甲厂商在乙厂商选择合作条件下的最优策略
( 不合作 )叫做甲厂商 的条件优势策略,与
乙厂商
合 作 不合作
这一条件策略相联系 的策略组合叫条件优 势策略组合。
❖ 条件策略包括参与人 的条件策略及组合。
合
甲作
厂
商
不 合
作
6 5
1 7
5
1 3
2
11
第二节 纯策略均衡 三、纳什均衡和下划线法
❖ 威胁策略一定具有可信性,才能真正发挥作用。
28
[案例] 核武环峙中国
[案例] 核武环峙中国
❖ 毛泽东说: “ 中国人 多,不怕扔原子弹”。
❖ 强权政治、单边主义 和恐怖活动都增加了 文明毁灭的危险—— 局部核战争已是不可 忽视的现实威胁。
❖ “ 难道上个世纪的梦 魇又回来了吗?”
29
第四节 动态博弈 二、博弈树的纳什均衡
❖ 根据“看不见的手”原理,理性的人在追求自 己利益中,会同时增进社会的整体福利。
19
[案例]“空城计”中的占优策略均衡
[案例] “空城计”中的占优策略均衡
❖ 诸葛亮对司马懿的思想轨迹是相当了解; ❖ 诸葛亮的行径司马懿也能做出理性判断。
司马 进攻 撤退
司马 擒拿 放走
守 诸城 葛
弃 城
大胜
平手
被擒
第四节 动态博弈
二 博弈树的纳什均衡
❖ 博弈树模型又称为扩展型博弈模型,用博弈树
来描述的序贯博弈又叫做扩展型博弈。
起点
· · 竞争者
垄断者 不抵制
进入
b
抵制
a
· 不进入 c 不抵制
中间点
垄断者 抵制
··(11,,44))
dd
·e (-2, 2)
· (0, 5)
f
·g
终点
(0, 3)
30
[资料] 下棋程序的算法与深度
放 刘走 备捉
拿
孙权 联合 反目
10
-15
12 1
5
-5 20
-20
❖ 刘备军事集团参与赤壁 之战有三个战略目标:
❖ 首先,必须联合孙权打 败曹操,从而为自己赢 得生存的时间与空间;
❖ 其次,又不能让曹操一 方消失,曹操的存在使 刘备的存在具有价值;
❖ 最后,还要争取在混乱 中尽可能地多捞私利。
15
b p1(b11 b12 ) (1 p1)(b21 b22 )
❖
A的条件混合策略为:参
p1
策 略
0
p1 0,1
1
a 0 a 0 a 0
与1
人
A
p2
策 略
2
参与人B
q1
q2
策略1 策略2
b11
b12
a11 b21
a21
a12 b22
a22
26
[讨论] 快餐店喜欢扎堆么?
[讨论] 快餐店喜欢扎堆么
商
不 合
❖ 都有划线的支付组合。 作
6– 5
1
7–
5
1 3–
2–
17
第二节 纯策略均衡 四、纳什均衡的特性
第二节 纯策略均衡
四 纳什均衡的特性
❖ 在同时博弈中,纯策略的纳什均衡可能存在,
也可能不存在。 ❖ 在纳什均衡存在的条
乙厂商
合 作 不合作
件下,它可能是惟一 的也可能不惟一。
❖ 如果纳什均衡存在, 它可能是最优的也可 能不是最优的。
逃脱
大胜
×
被擒
×
使 曹用 家除
掉
3 -10
-15 8
20 10
-1
-15
20
[资料] 囚徒困境
[资料] 囚徒困境
坦
甲白 方不
坦 白
乙方 坦 白 不坦白
-5
-7
-5 -1
-7
-1 -2
-2
❖ 双方都存在着偷换策略的 诱惑,处于不稳定状态。
❖ 即使两个囚徒事先订立了 攻守同盟(死不坦白), 他 们最终也会背叛同盟。
❖ 阿伦·图灵的“纸上机器”。
❖ 贝尔实验室 克劳迪 · 申朗 的“A策略”和“B策略”。
❖ 1950年 , 约翰·冯·诺依曼
( John von Neumann )
设计出 “MANIAC一
号” 。
5
[视频] 智能的较量
[视频] 智能的较量
❖ 脑力争夺、利益平衡、人生选择 … 各份 戏码精彩纷呈,显现价值取舍的智慧。
不完全信息
纳什均衡 囚徒困境
动态博弈
博弈树
逆向归纳法
3
第一节 博弈论和策略行为 一、博弈的定义
第一节 博弈论和策略行为
一 博弈的定义
❖ 厂商之间的行为是相互影响的,这种相互作用 的关系就如同赌博下棋(博弈)一样。
❖ 博弈论 (Game Theory) 是研究在策略性环境 中如何策略性地进行决定和采取行动的科学。
[资料] 下棋程序的算法与深度
❖ 第一个突破出现在 1958年,匹兹堡大 学的奈维尔、肖恩 和西蒙发现剔除相 当大的部分而不影 响最后结果,这叫 α–β算法。
❖ 这是一个纯数学领 域的技巧,独立于 任何知识而生效。
31
第四节 动态博弈 三、逆向归纳法
第四节 动态博弈
三 逆向归纳法
❖ 在所有的纳什均衡中,找到最有可能实现的策 略组合,这就是对纳什均衡的“精练”。
1
略纳什均衡之中。
·0.7
❖ 混合策略博弈的均衡
·乙厂商
·e
甲厂商
与纯策略博弈的均衡
恰好完全相同。
·o
· ·0.5
1 p1
25
第三节 混合策略均衡 三、混合博弈的一般理论
第三节 混合策略均衡
三 混合博弈的一般理论
❖ 参与人A与B的判别式为:
a q1(a11 a21) (1 q1)(a12 a22 )
❖ 经济学越来越重视对信息的研究,特别是信息 不对称对于个人选择、制度安排的影响,信息 经济学与博弈论的应用相互渗透。
8
[资料] 博弈的类型
❖ 合作博弈与非合作博弈[资:料] 博弈的类型 能否达成有约束力协议完;全信但息不博完弈美
❖ 重完复全博且弈完美与非重复博弈: 具有信息连博续弈性的特点;海萨尼转换(含自然)
5
9
1 4
4
-1 0
0
16
第二节 纯策略均衡 三、纳什均衡和下划线法
第二节 纯策略均衡
三 纳什均衡和下划线法
❖ 条件均衡策略下划线法是用下划线分别来表示
甲厂商和乙厂商的条件策略。
乙厂商
❖ 在甲厂商的支付矩阵
合 作 不合作
中,找出每一列的最
合
大数字;在乙厂商的 甲 作
ห้องสมุดไป่ตู้
支付矩阵中,找出每 厂
一行的最大数字。
[案例] “华容道”里的纳什均衡(1)
曹操 小道 大路
小 孔道 明大
路
被擒 擒住
逃脱 空等
逃脱 空等
被擒 擒住
❖ 孔明曰:“亮夜观乾象,操贼未合身亡。 留这人情, 教云长做了,亦是美事。” 玄德曰:“先生神算,世所罕及!”
14
[案例]“华容道”里的纳什均衡(2)
[案例] “华容道”里的纳什均衡(2)
❖ 每个囚徒都希望对方选择 抵赖,而自己坦白获释。 当他们都这么想并这么做 的时候,就形成了都坦白 的左上角结局。
21
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 以有限的纯策略为基础的混合策略一定是无限
的,源于概率取值的无限性。
乙厂商
❖ 甲厂商和乙厂商的混
❖ 零和博弈与非零和博弈不完:全信息博弈 你的所失正是我的所得。
类型 区别 完完全全信信息息
不完完美全信信息息
静态
内容
动态
纳什均衡针对策略集和支精付炼集纳什均衡
贝叶针斯对-纳记什忆均(过衡程),信精息炼结贝点叶是斯唯-一纳的什均衡
9
第二节 纯策略均衡 一、寡头博弈和支付矩阵
第二节 纯策略均衡
一 寡头博弈和支付矩阵
[案例] 孙刘联合的“智猪博弈”
[案例] 孙刘联合的“智猪博弈”
❖ 孔明笑曰: “亮借一
帆风,直至江东,凭三
寸不烂之舌,说南北两
军互相吞并。若南军胜,
共诛 曹操 以取荆州之 按
地;若北军胜,则我乘 小 键
势以取江南可也。” 猪
❖ 荆州是赤壁之战最重要
等 待
的战果之一,却被出力
很少的刘备摘去了。
大猪 按键 等待
合
甲作
厂
商
不 合
作
6– 45–
31
–74
14
9–1 83–
2–
18
第二节 纯策略均衡 五、纳什均衡和社会福利
第二节 纯策略均衡
五 纳什均衡和社会福利
❖ 无论其他参与者采取什么策略,某一参与者的 惟一的最优策略就是他的占优策略,任何一方 都不想偏离各自认为的最优策略。
❖ 囚徒困境(Prisoners’ Dilemma)反映了个人 理性和团体理性的冲突,从个人理性角度出发 选择的占优策略结局,从整体来看却是最差的。
❖ 1944 年, 冯·诺依曼和摩根斯顿共著《博弈 论与经济行为》,将博弈论用于经济领域。
❖ 博弈论在政治学、计算机科学、国际关系、军 事战略、生物学等领域有广泛的应用。
4
[资料] 会下棋的机器
[资料] 会下棋的机器
❖ 1769 年, 匈牙利工程师 巴朗· 沃尔夫冈 · 凡 · 坎比 林为奥地利皇后做了一台 会 “下” 象棋的机器。
资料博弈的类型类型区别静态动态完全信息纳什均衡精炼纳什均衡不完全信息精炼贝叶斯纳什均衡资料博弈的类型资料博弈的类型完全且完美信息博弈完全但不完美信息博弈不完全信息博弈海萨尼转换含自然类型区别内容完全信息针对策略集和支付集完美信息针对记忆过程信息结点是唯一的第二节纯策略均衡一寡头博弈和支付矩阵第二节纯策略均衡第二节纯策略均衡这一个只有两方参加并且同时进行决策的简单博弈
❖ 逆向归纳法包括两个步骤:第一,从最后阶段 的每一个决策点开始,确定参与人此时所选择 的策略,并把其他策略删除;第二,对简化博 弈重复删除程序,直到最后得到最简博弈。
❖ 实际上,逆向归纳策略总是属于纳什均衡,尽 管纳什均衡并不一定是逆向归纳策略。
32
第二节 纯策略均衡
三 纳什均衡和下划线法
❖ 当厂商的条件策略组合恰好相同,从而都不再 有单独改变策略的倾向时,整个博弈就达到了 均衡,是博弈的解,称为纳什均衡。
❖ 纳什均衡指的是参与者在该策略组合上,任何 单独改变策略都不会得到好处;当所有其他者 都不改变策略时,没有人会改变自己的策略。
❖ 假定支付不变时,由于存在成本和风险,参与 者也不愿意单独地改变策略。
略共同作用的结果——支付组合。
7
第一节 博弈论和策略行为 三、博弈的类型
第一节 博弈论和策略行为
三 博弈的类型
❖ 从要素可以进行一些博弈分类,如两人博弈和 多人博弈、零和博弈和非零和博弈、有限博弈 和无限博弈、同时博弈和动态博弈。
❖ 从20世纪80年代起,博弈论逐渐成为主流经济 学的一部分,转向对人们之间关系的研究。
❖ 假定在某个寡头市场上,有甲、乙两个厂商。
❖ 这一个只有两方参加 并且同时进行决策的 简单博弈。
❖ 用一个以二元数组为 元素的矩阵 ( 称博弈 矩阵或支付矩阵 ) 来 描述和分析。
合
甲作
厂
商
不 合
作
乙厂商
合 作 不合作
6
5
5 1
7
1 3
2
10
第二节 纯策略均衡 二、条件策略和策略组合
第二节 纯策略均衡
q1
q2
合策略组合就是一个
概率向量组合。
甲 p1
❖ 与纯策略不同,每一 厂 个概率向量是相应参 商 p2
与人的一个混合策略。
6– 4
3
7–
1
9– 8–
2
22
[案例] 猜拳游戏必胜招
[案例] 猜拳游戏必胜招
❖ 一位日本收藏家无 法决定让谁来拍卖 画作,于是要求佳 士得与苏富比老板 猜拳定胜负。
❖ 佳士得老板向员工 们讨教猜拳策略, 最后在一名主管的 11岁女儿建议下, 决定出 … …
6
第一节 博弈论和策略行为 二、基本的要素
第一节 博弈论和策略行为
二 基本的要素
❖ 策略性决策和行动是指每个人要根据其他人的 可能反应来决定自己的决策行动,博弈论显然 是分析寡头厂商行为的一个恰当工具。
❖ 参与者:进行决策的个体,至少有两个,有时 和可以引入一个虚拟的参与人如“自然”;
❖ 策略:是一项规则,一组可选择的行动集合; ❖ 支付:各自的报酬,所得到的支付都是所有策