第八章 博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全信息动态博弈指的是各博弈方先后行动,后行动 者知道先行动者的具体行动是什么且各博弈方对博弈 中各种策略组合情况下所有参与人相应的得益都完全
了解的博弈。
动态博弈中我们把一个参与人的一次行动称为一个“ 阶段”,因此一个动态博弈就会有多个甚至无限个博 弈阶段。
国际视野 创新能力 创业精神 社会责任
静态博弈,参与人同时选择行动;
动态博弈,参与人的行动有先后顺序,且后行动者能够观察到先 行动者所选择的行动的博弈。 (4)从信息获得情况,分为完全信息博弈和不完全信息博弈。 完全信息指每一个参与人对所有其他参与人的特征,如策略集合 及得益函数都有准确完备的知识。 根据(3)、(4)划分组合得到四类博弈类型:完全信息静态博 弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态
罪犯乙
坦白(L) 抗拒(R)
罪犯甲
坦白(T) 抗拒(B)
-5 -9
-5 0
0 -9 -1 -1
国际视野
创新能力
创业精神
社会责任
(一)博弈论基本介绍
1. 定义:
博弈论(game theory),又译对策论。研究决策
主体的行为发生直接相互作用时的决策以及这种
决策的均衡问题。
国际视野
创新能力
创业精神
国际视野
创新能力
创业精神
社会责任
例:可口可乐与百事可乐的博弈
(1)如果双方都不涨价,各得利润10单位;
(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利 润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利 润-20,百事可乐利润30;
(4)如果双方都涨价,可口可乐利润140,百事可乐利
润35;
国际视野 创新能力 创业精神 社会责任
可口可乐与百事可乐的博弈矩阵
参与者2 百事可乐 不涨价 不涨价 涨价 涨价
参与者1
10,10 -20,30
100,-30 140,35
可口可乐
返回
3. 分类
(1)根据参与人的多少,分为两人博弈或多人博弈; (2)根据参与人是否合作,分为合作博弈或非合作博弈:
博弈
国际视野
创新能力
创业精神
社会责任
完全信息静态博弈:剪刀、石头、布
完全信息动态博弈:下棋
不完全信息静态博弈:暗标拍卖(密封标书、统一时
间公证开标,各博弈方无法知道其他人的策略) 不完全信息动态博弈:黔驴技穷,路遥知马力,日久 见人心
国际视野
创新能力
创业精神
社会责任
(二)纳什均衡概念
房地产开发博弈(静态)的收收益矩阵
开发商A 开发 不开发 开发 -4,-4 0, 2 不开发 2,0 0,0
开发商B
国际视野
创新能力
创业精神
社会责任
两个房地产开发商的例子 A先行动,B后行动 -4,-4
B
A
2,0 0,2
B
国际视野
0,0
创新能力
创业精神
社会责任
在序列博弈中,先行者处于有利地位,可得到竞争 优势。 在序列博弈中,先行者可以用既成事实获得竞争优 势。在这种情况下,怎样才能获得先行优势呢?理 性的厂商都知道先行者优势,并希望让竞争者确信 自己一定会开发,从而放弃开发。怎样才能做到这
创业精神
社会责任
1.对社会无害的合作,通过某些规则实现 • 设两辆汽车同时到达一个十字路口,每个驾驶员都
有开和等两种选择,博弈结果如下:
驾驶员2 开 开 驾驶员1 等 -8,-8 等 4, 0
0, 4
0, 0
2.对社会有害的合作,设法制止
囚徒困境中,如果两个囚徒形成攻守同盟,则罪犯得到 好处,对社会不利。例如在寡头厂商的定价博弈中,勾 结定高价对双方都有好处,但对社会不利,因此受到反 垄断法的严密监控。 寡头厂商的价格博弈收益矩阵如下:
一种无法反悔的行动。 要使对手确信自己的承诺,必须做到如果不 开 发 , 会导致自 己更大的损失。改变竞争者对自己行动的预期,从而迫使竞 争者选择对自己有利的策略,达到限制对手的目的。 承诺和策略性行动是有风险的,其效果在很大程度上取决于 参与者对各自收益函数的估计和行为准则。适当的非理性行
一点呢?
威胁、承诺
国际视野 创新能力 创业精神 社会责任
(1)空头威胁 如果厂商的努力不足以使对手相信自己 肯定会开发,如制造舆论、研究与开发投入、广告宣传 等,这种努力称为空头威胁。它不能吓退竞争者。
国际视野
创新能力
创业精神
社会责任
(2)承诺和策略性行动
如果厂商想要吓退竞争者,必须作出一定 开 发 的承诺,它是
国际视野 创新能力 创业精神 社会责任
罪犯乙
坦白(L) 抗拒(R)
罪犯甲
坦白(T) 抗拒(B)
-5 -9
-5 0
0 -9 -1 -1
国际视野
创新能力
创业精神
社会责任
2、严格劣策略的重复剔除 首先找出某个参与人的严格劣策略(假定其存在), 把这个劣策略剔除掉,重新构造一个不包含已剔 除策略的新的博弈; 所谓“严格劣策略” 是指:在博弈中,不论其他 参与人采取什么策略,某一参与人可能采取的策 略中,对自己严格不利的策略。 重复这个过程。
社会责任
在产业经济学中,许多产业市场是寡头断市场。
在分析寡头垄断市场中企业决策行为时,必须把 各种决策者之间的策略及其相互作用纳入到经济 模型中,这就是博弈分析。
国际视野
创新能力
创业精神
社会责任
2. 博弈的组成要素
参与人:决策主体;
行为:参与人的决策变量;
策略:参与人选择其行为的规制;
信息:有关其他参与人(对手)的特征和行动的知 识; 收益:参与人从博弈中获得的利益水平; 均衡:所有参与人的最优策略或行动的组合。
为的名声(勇敢、疯狂等),将有助与取得先行者优势。
国际视野 创新能力 创业精神 社会责任
破釜沉舟 背水一战
国际视野
创新能力
创业精神
社会责任
(五)合作的诱惑
在类似囚徒的困境这样的博弈中,存在着通过合作 (共谋、勾结和串通)改善博弈结果的诱惑,这样 可以是大家的收益都得到改善。
国际视野
创新能力
国际视野
创新能力
创业精神
社会责任
一个博弈可能有多个纳什均衡,而具体哪个均衡会 实现,纳什均衡本身不能给出回答,任何有限博弈 都存在至少一个纳什均衡。
剪刀、石头、布的纳什均衡是什么?
混合策略纳什均衡:各以1/3的概率出剪刀、石头 、布
国际视野
创新能力
创业精神
社会责任
(四)完全信息动态博弈求解
厂商2 高价 厂商1 高价 50,50 低价 10,70
低价
70,10
国际视野
30,30
创新能力 创业精神 社会责任
国际视野
创新能力
创业精神
社会责任
例子
剪刀、石头、布 下棋
• 囚徒困境(Prisoner’s dilemma)
有甲、乙两名罪犯,政策是坦白从宽、抗拒从严。 一人坦白另一抗拒,则坦白者关1年,抗拒者关9年; 两人全部抗拒各关1年; 两人全部坦白各关5年。 结果如果?
国际视野 创新能力 创业精神 社会责任
择策略的完全信息,因而先行动者在选择自己的
策略时,就可以预先考虑自己的选择对后行动者
选择的影响,并采取相应的对策。
上述博弈也成为序列博弈
国际视野 创新能力 创业精神 社会责任
两个房地产开发商的例子
从表可以知道,该博弈有两个纳什均衡,即(A开发,B不 开发)和(A不开发,B开发),我们无法确定是开发商A 选择开发,开发商B选择不开发,还是恰恰相反的结果。
纳什均衡(Nash equilibrium):博弈的任何
一方不能够单独改变战略来提高收益的一组战略
被称为纳什均衡(Nash equilibrium)
国际视野
创新能力
创业精神
社会责任
(三)完全信息静态博弈求解
1. 占优策略均衡
在一些博弈中,一个参与人的最优策略可能可以不依赖 于其他参与人的策略选择; 不论其他参与人选择什么策略,他的最优策略是唯一的 ,这样的最优策略被称为“占优策略”。 如果一个博弈中,某个参与人有占优策略,那么该参与 人的其他可选择策略就被称为“劣策略”。 在一个博弈里,如果所有参与人都有占优策略存在,那 么占优策略均衡是可以预测到的唯一的均衡,因为没有 一个理性的参与人会选择劣策略。
国际视野
创新能力
创业精神
社会责任
140,35 参与者2
百事可乐
-20,30 100,-30
参与者1
可口可乐
参与者2
百事可乐
10,10
在动态博弈中,参与人的行动有先后顺序,后行
动的参与人在自己行动之前就可以观察到先行动
者(参与人)的行为,并在此基础上选择相应的
策略。而且,由于先行动者拥有后行动者可能选
一个动态博弈的扩展式表达应包含以下要素: (1)参与人集合:I=1,…,n; (2)参与人的行动顺序:谁在什么时候行动; (3)参与人的行动空间:在每次行动时,参与人有 些什么行动可供选择; (4)参与人的信息集:每次行动时,参与人知道些 什么; (5)参与人的得益函数:在博弈结束后,每个参与 人得到些什么;
管理经济学
阮建青 浙江大学 管理学院 农业经济管理系 Office Room: 启真大楼 1307 Email: ruanjq@126.com
国际视野
创新能力
创业精神
社会责任
第八章 博弈论
国际视野
创新能力
创业精神
社会责任
提纲:
(一)博弈论基本介绍
(二)纳什均衡概念
(三)完全信息静态博弈求解
(四)完全信息动态博弈求解 (五)合作的诱惑
国际视野 创新能力 创业精神 社会责任
博弈树 通常用“博弈树”来表述有限策略动态博弈。 ①结:结包括决策结和终点结。 ②枝:博弈树上,枝是从一个决策结到其直接后续 结的连线,每一个枝代表参与人的一个行动选择 。在每一个枝旁标注该具体行动的代号。一般地 ,每个决策结下有多个枝,给出每次行动时参与 人的行动空间,即此时有哪些行动可供选择。
(3)根据博弈结果的不同,又可分为零和博弈、常和博弈与 变和博弈。
零和博弈。一方的赢必然伴随着另一方的输,总和为零。 常和博弈。在这种博弈中,各种结果下的各博弈方得益之和 总是等于一个非零常数。 变和博弈。不同策略组合下各博弈方的得益之和是不同的。
国际视野
创新能力
创业精神
社会责任
Biblioteka Baidu
(3)从行动的先后次序,分为静态博弈和动态博弈。
了解的博弈。
动态博弈中我们把一个参与人的一次行动称为一个“ 阶段”,因此一个动态博弈就会有多个甚至无限个博 弈阶段。
国际视野 创新能力 创业精神 社会责任
静态博弈,参与人同时选择行动;
动态博弈,参与人的行动有先后顺序,且后行动者能够观察到先 行动者所选择的行动的博弈。 (4)从信息获得情况,分为完全信息博弈和不完全信息博弈。 完全信息指每一个参与人对所有其他参与人的特征,如策略集合 及得益函数都有准确完备的知识。 根据(3)、(4)划分组合得到四类博弈类型:完全信息静态博 弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态
罪犯乙
坦白(L) 抗拒(R)
罪犯甲
坦白(T) 抗拒(B)
-5 -9
-5 0
0 -9 -1 -1
国际视野
创新能力
创业精神
社会责任
(一)博弈论基本介绍
1. 定义:
博弈论(game theory),又译对策论。研究决策
主体的行为发生直接相互作用时的决策以及这种
决策的均衡问题。
国际视野
创新能力
创业精神
国际视野
创新能力
创业精神
社会责任
例:可口可乐与百事可乐的博弈
(1)如果双方都不涨价,各得利润10单位;
(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利 润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利 润-20,百事可乐利润30;
(4)如果双方都涨价,可口可乐利润140,百事可乐利
润35;
国际视野 创新能力 创业精神 社会责任
可口可乐与百事可乐的博弈矩阵
参与者2 百事可乐 不涨价 不涨价 涨价 涨价
参与者1
10,10 -20,30
100,-30 140,35
可口可乐
返回
3. 分类
(1)根据参与人的多少,分为两人博弈或多人博弈; (2)根据参与人是否合作,分为合作博弈或非合作博弈:
博弈
国际视野
创新能力
创业精神
社会责任
完全信息静态博弈:剪刀、石头、布
完全信息动态博弈:下棋
不完全信息静态博弈:暗标拍卖(密封标书、统一时
间公证开标,各博弈方无法知道其他人的策略) 不完全信息动态博弈:黔驴技穷,路遥知马力,日久 见人心
国际视野
创新能力
创业精神
社会责任
(二)纳什均衡概念
房地产开发博弈(静态)的收收益矩阵
开发商A 开发 不开发 开发 -4,-4 0, 2 不开发 2,0 0,0
开发商B
国际视野
创新能力
创业精神
社会责任
两个房地产开发商的例子 A先行动,B后行动 -4,-4
B
A
2,0 0,2
B
国际视野
0,0
创新能力
创业精神
社会责任
在序列博弈中,先行者处于有利地位,可得到竞争 优势。 在序列博弈中,先行者可以用既成事实获得竞争优 势。在这种情况下,怎样才能获得先行优势呢?理 性的厂商都知道先行者优势,并希望让竞争者确信 自己一定会开发,从而放弃开发。怎样才能做到这
创业精神
社会责任
1.对社会无害的合作,通过某些规则实现 • 设两辆汽车同时到达一个十字路口,每个驾驶员都
有开和等两种选择,博弈结果如下:
驾驶员2 开 开 驾驶员1 等 -8,-8 等 4, 0
0, 4
0, 0
2.对社会有害的合作,设法制止
囚徒困境中,如果两个囚徒形成攻守同盟,则罪犯得到 好处,对社会不利。例如在寡头厂商的定价博弈中,勾 结定高价对双方都有好处,但对社会不利,因此受到反 垄断法的严密监控。 寡头厂商的价格博弈收益矩阵如下:
一种无法反悔的行动。 要使对手确信自己的承诺,必须做到如果不 开 发 , 会导致自 己更大的损失。改变竞争者对自己行动的预期,从而迫使竞 争者选择对自己有利的策略,达到限制对手的目的。 承诺和策略性行动是有风险的,其效果在很大程度上取决于 参与者对各自收益函数的估计和行为准则。适当的非理性行
一点呢?
威胁、承诺
国际视野 创新能力 创业精神 社会责任
(1)空头威胁 如果厂商的努力不足以使对手相信自己 肯定会开发,如制造舆论、研究与开发投入、广告宣传 等,这种努力称为空头威胁。它不能吓退竞争者。
国际视野
创新能力
创业精神
社会责任
(2)承诺和策略性行动
如果厂商想要吓退竞争者,必须作出一定 开 发 的承诺,它是
国际视野 创新能力 创业精神 社会责任
罪犯乙
坦白(L) 抗拒(R)
罪犯甲
坦白(T) 抗拒(B)
-5 -9
-5 0
0 -9 -1 -1
国际视野
创新能力
创业精神
社会责任
2、严格劣策略的重复剔除 首先找出某个参与人的严格劣策略(假定其存在), 把这个劣策略剔除掉,重新构造一个不包含已剔 除策略的新的博弈; 所谓“严格劣策略” 是指:在博弈中,不论其他 参与人采取什么策略,某一参与人可能采取的策 略中,对自己严格不利的策略。 重复这个过程。
社会责任
在产业经济学中,许多产业市场是寡头断市场。
在分析寡头垄断市场中企业决策行为时,必须把 各种决策者之间的策略及其相互作用纳入到经济 模型中,这就是博弈分析。
国际视野
创新能力
创业精神
社会责任
2. 博弈的组成要素
参与人:决策主体;
行为:参与人的决策变量;
策略:参与人选择其行为的规制;
信息:有关其他参与人(对手)的特征和行动的知 识; 收益:参与人从博弈中获得的利益水平; 均衡:所有参与人的最优策略或行动的组合。
为的名声(勇敢、疯狂等),将有助与取得先行者优势。
国际视野 创新能力 创业精神 社会责任
破釜沉舟 背水一战
国际视野
创新能力
创业精神
社会责任
(五)合作的诱惑
在类似囚徒的困境这样的博弈中,存在着通过合作 (共谋、勾结和串通)改善博弈结果的诱惑,这样 可以是大家的收益都得到改善。
国际视野
创新能力
国际视野
创新能力
创业精神
社会责任
一个博弈可能有多个纳什均衡,而具体哪个均衡会 实现,纳什均衡本身不能给出回答,任何有限博弈 都存在至少一个纳什均衡。
剪刀、石头、布的纳什均衡是什么?
混合策略纳什均衡:各以1/3的概率出剪刀、石头 、布
国际视野
创新能力
创业精神
社会责任
(四)完全信息动态博弈求解
厂商2 高价 厂商1 高价 50,50 低价 10,70
低价
70,10
国际视野
30,30
创新能力 创业精神 社会责任
国际视野
创新能力
创业精神
社会责任
例子
剪刀、石头、布 下棋
• 囚徒困境(Prisoner’s dilemma)
有甲、乙两名罪犯,政策是坦白从宽、抗拒从严。 一人坦白另一抗拒,则坦白者关1年,抗拒者关9年; 两人全部抗拒各关1年; 两人全部坦白各关5年。 结果如果?
国际视野 创新能力 创业精神 社会责任
择策略的完全信息,因而先行动者在选择自己的
策略时,就可以预先考虑自己的选择对后行动者
选择的影响,并采取相应的对策。
上述博弈也成为序列博弈
国际视野 创新能力 创业精神 社会责任
两个房地产开发商的例子
从表可以知道,该博弈有两个纳什均衡,即(A开发,B不 开发)和(A不开发,B开发),我们无法确定是开发商A 选择开发,开发商B选择不开发,还是恰恰相反的结果。
纳什均衡(Nash equilibrium):博弈的任何
一方不能够单独改变战略来提高收益的一组战略
被称为纳什均衡(Nash equilibrium)
国际视野
创新能力
创业精神
社会责任
(三)完全信息静态博弈求解
1. 占优策略均衡
在一些博弈中,一个参与人的最优策略可能可以不依赖 于其他参与人的策略选择; 不论其他参与人选择什么策略,他的最优策略是唯一的 ,这样的最优策略被称为“占优策略”。 如果一个博弈中,某个参与人有占优策略,那么该参与 人的其他可选择策略就被称为“劣策略”。 在一个博弈里,如果所有参与人都有占优策略存在,那 么占优策略均衡是可以预测到的唯一的均衡,因为没有 一个理性的参与人会选择劣策略。
国际视野
创新能力
创业精神
社会责任
140,35 参与者2
百事可乐
-20,30 100,-30
参与者1
可口可乐
参与者2
百事可乐
10,10
在动态博弈中,参与人的行动有先后顺序,后行
动的参与人在自己行动之前就可以观察到先行动
者(参与人)的行为,并在此基础上选择相应的
策略。而且,由于先行动者拥有后行动者可能选
一个动态博弈的扩展式表达应包含以下要素: (1)参与人集合:I=1,…,n; (2)参与人的行动顺序:谁在什么时候行动; (3)参与人的行动空间:在每次行动时,参与人有 些什么行动可供选择; (4)参与人的信息集:每次行动时,参与人知道些 什么; (5)参与人的得益函数:在博弈结束后,每个参与 人得到些什么;
管理经济学
阮建青 浙江大学 管理学院 农业经济管理系 Office Room: 启真大楼 1307 Email: ruanjq@126.com
国际视野
创新能力
创业精神
社会责任
第八章 博弈论
国际视野
创新能力
创业精神
社会责任
提纲:
(一)博弈论基本介绍
(二)纳什均衡概念
(三)完全信息静态博弈求解
(四)完全信息动态博弈求解 (五)合作的诱惑
国际视野 创新能力 创业精神 社会责任
博弈树 通常用“博弈树”来表述有限策略动态博弈。 ①结:结包括决策结和终点结。 ②枝:博弈树上,枝是从一个决策结到其直接后续 结的连线,每一个枝代表参与人的一个行动选择 。在每一个枝旁标注该具体行动的代号。一般地 ,每个决策结下有多个枝,给出每次行动时参与 人的行动空间,即此时有哪些行动可供选择。
(3)根据博弈结果的不同,又可分为零和博弈、常和博弈与 变和博弈。
零和博弈。一方的赢必然伴随着另一方的输,总和为零。 常和博弈。在这种博弈中,各种结果下的各博弈方得益之和 总是等于一个非零常数。 变和博弈。不同策略组合下各博弈方的得益之和是不同的。
国际视野
创新能力
创业精神
社会责任
Biblioteka Baidu
(3)从行动的先后次序,分为静态博弈和动态博弈。