第五章 博弈论

合集下载

博弈论PPT课件

博弈论PPT课件
有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

《产业经济学》第五章--(博弈1)讲解

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。

第五章 重复博弈完全且非完美信息动态博弈(博弈论张醒洲)PPT课件

第五章 重复博弈完全且非完美信息动态博弈(博弈论张醒洲)PPT课件
1. 参与人1和2同时从各自的可行集A1和A2中选择a1和a2;
2. 收益情况为ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2;
假定(a1*,a2*)为以上同时行动博弈唯一的纳什均衡,我们称 (a1*,a2*,a3*(a1*,a2*),a4*(a1*,a2*))为这一两阶段博弈的子博弈完 美结果。
2009-03-16
张醒洲,大连
7
两阶段囚徒Байду номын сангаас境
• 得到 a3*(a1,a2),a4*(a1,a2)
– 根据第一阶段的行动a1和 a2 ,预测第二阶段参与人的反应; – 请注意,在囚徒困境博弈中存在唯一的纳什均衡,因此参与人
的反应独立于其在第一阶段的行动。
• 计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2
• 两阶段囚徒困境博弈是“2×2 两人同时行动”博弈的一 个特殊例子。在这个博弈中,我们在上一节利用后向归纳 法的思路分析了“子博弈完美结果”,具体见2.2.1。
• 子博弈完美结果
如果参与人1和2预测到参与人3和4在第二阶段的行动将由 (a3*(a1,a2),a4*(a1,a2))给出,则参与人1和2在第一阶段的问题就可 以用以下的同时行动博弈表示:
参与人 1
参与人 2
L2
L1
1, 1
R1
0, 5
R2 5, 0 4, 4
图 2.3.1
• 让两个参与人进行两次囚徒困境博弈,观察第二次博弈 开始之前第一次博弈的结果,并假设整个过程博弈的总 收益等于两阶段博弈收益的简单相加 (即不考虑贴现因 素) 。
2009-03-16
张醒洲,大连
6
“2 × 2 ×2” 博弈和子博弈完美结果

博弈论第五章1

博弈论第五章1

重复博弈的基本特征

阶段博弈之间没有“物质上”的联系,即前一阶段的博弈 不改变后一阶段博弈的结构; 所有博弈方都观测到博弈过去的历史;

博弈方的总支付是所有阶段博弈支付的贴现值之和或加权
平均值。
贴现因子:
下一期的一单位支付在这一期的价值。 注意:在每个阶段,参与人可同时行动,也可不同时行动。
无限次重复博弈
• 冷酷战略
(1)开始选择抵赖; (2)选择抵赖一直到有一方选择了坦白,然后永远 选择坦白。
• 无限次重复博弈使其走出了囚徒困境,背后的原
因是:
如果博弈重复无穷次而且每个人有足够的耐心, 任何短期机会主义行为的所得都是微不足道的,参 与人有积极性为自己建立一个乐于合作的声誉,同 时也有积极性惩罚对方的机会主义的行为。
引论
• 本章介绍基本博弈重复进行构成的重复博弈。虽然形式
上是基本博弈的重复进行,但重复博弈中博弈方的行为
和博弈结果却不一定是基本博弈的简单重复,因为博弈
方对于博弈会重复进行的意识,会使他们对利益的判断
发生变化,从而使他们在重复博弈过程中的行为选择受
到影响。这意味着不能把重复博弈当作基本博弈的简单 叠加,必须把整个重复博弈过程作为整体进行研究。
• 以“利己、利他”为例,其博弈中唯一的纳什
均衡为(利己,利己),两个局中人在此均衡
下所得支付都是1;所以,只要无穷重复博弈
中局中人可行的平均单期支付不小于1,这样
的支付就是一个可能的均衡支付。
• 无穷重复博弈能够导致帕雷托改进。
触发战略
触发策略——冷酷战略(grim strategy) 博弈各方首先试探合作,一旦发觉对方不合作则
一、有限次重复博弈
• 有限次重复博弈

第五章案例

第五章案例

第五章案例案例1政府办的大型养鸡场为什么赔钱在20世纪80年代,一些城市为了保证居民的菜篮子,由政府出资办了大型养鸡场,但成功者少,许多养鸡场最后以破产告终。

这其中的原因是多方面的,重要的一点则在于鸡蛋市场是一个完全竞争市场。

政府建立的大型养鸡场在这种完全竞争的市场上并没有什么优势,它的规模不足以大到能控制市场,产品也没有特色。

它要以平等的身份与那些分散的养鸡专业户或把养鸡作为副业的农民竞争。

但这种大型养鸡场的成本都要大于行业平均成本,因为这些养鸡场固定成本远远高于农民。

它们要建大鸡舍,采用机械化方式,且有相当一批管理人员,工作人员也是有工资的工人。

这些成本的增加远远大于机械化养鸡所带来的好处,因为农民养鸡几乎没有什么固定成本,也不向自己支付工资,差别仅仅是种鸡支出和饲料支出。

大型养鸡场由政府出资办,自然是国有企业,它也同样有产权不明晰、缺乏激励机制、效率低的共性。

从这种意义上说,政府出资办大型养鸡场是出力不讨好,动机也许不错,但结果不好。

其实这些完全竞争行业,完全可以让市场调节,农民去办,政府不要与农民争利,何况也争不到利。

讨论题:1.完全竞争市场的含义与形成的条件?2.举例说明哪些市场接近完全竞争市场。

案例点评鸡蛋市场上有许多买者和卖者,其中任何一个生产者,即使是大型养鸡场,在市场总供给量中占的比例都是微不足道,难以改变产量来影响价格,只能接受市场决定的价格。

鸡蛋市场没有任何进入限制,谁想进入都可以,且投资很小。

鸡蛋是无差别产品,生产者无法以产品差别建立自己的垄断地位。

所以,鸡蛋市场是典型的完全竞争市场。

政府出资办养鸡场没有任何特色。

在一些垄断性行业,也许国有企业可以靠垄断优势存活下来,但在完全竞争行业就不行了。

(此案例来源梁小民《西方经济学》教材)案例2铁路部门的垄断定价还能掌握多久近20多年的中国季节性大迁徙——“春运”,已成为中国特色。

“春运”市场提供了世界上罕见的爆发性最大的商机。

国家铁路部为了缓解春运的高峰,在春运期间火车票的价格上涨,有关人士解释,涨价是为了“削峰平谷”,以达到“均衡运输”的目的,但我们看到的是涨价后,铁路并没有减少乘客,达到“均衡运输”的目的。

博弈论最全完整-讲解课件

博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。

博弈论课件

博弈论课件

扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。

经济博弈论基第五章动态贝叶斯博弈

经济博弈论基第五章动态贝叶斯博弈

s i
i
(B)Pi ( i
a
h i
)
是局中人
i观测到
a
h
和最优策略
i
s
*
i
(

)
后,使
用贝叶斯法则从先验概P率i (i i ) 得到的。
六、不完美信息博弈的完美贝叶斯纳什均衡
例1:完美贝叶斯纳什均衡是{M, U; p=1}
1
L (1, 3)
U
M [p] R [1-p]
2
1、Milgrom-Roberts (1982)垄断限价模型
传统解释的问题:价格作为一种承诺是不可置信的,因 为无论垄断者现在索取什么价格,一旦其他企业进入,垄断者 就会改变价格,因此,靠低价格是不可阻止进入的。
Milgrom-Roberts (1982)提出的解释:垄断限价可能反映 了这样一个事实,即其他企业不知道垄断者的生产成本,垄断 者试图用低价格来告诉其他企业自己是低成本,进入是无利可 图的。
一、KMRW声誉模型
如果下列条件满足,囚徒2将选择X=不坦白: 11p-14≥5p-12 p ≥1/3
即如果囚徒1属于非理性的概率不小于1/3,囚 徒2将在第一阶段选择“不坦白”(合作)。
一、KMRW声誉模型
下面考虑博弈重复三次(T=3)的情况:
给定p≥1/3,如果理性囚徒1和囚徒2在第一阶段都选择 “不坦白”(合作),那么第二、三阶段的均衡路径与前表相 同(X=不坦白),总的均衡路径如下表:
2、博弈顺序
(1)自然首先选择囚徒1的类型,囚徒1知道自己的类型, 囚徒2只知道囚徒1属于理性的概率是1-p,非理性的概率是p;
(2)2个囚徒进行第一阶段的博弈;
(3)观察到第一阶段博弈结果后,进行第二阶段博弈; 观察到第二阶段博弈结果后,进行第三阶段博弈;如此等等。

第五章 不完全信息静态博弈及应用 《博弈论与经济》 PPT课件

第五章  不完全信息静态博弈及应用  《博弈论与经济》 PPT课件

p(t-iti ) p(ti )
p(t-i ti )
p(t-i ti
)
pi
t-i
▪ 它描写了参与人i依据自己的类型 ti 对其余局中人类型 t-i 的推断或信
念。
▪ 以下用
G T1, T2,, Tn; A1, A2,, An; u1, u2,, un; P1, P2,, Pn
弈模型。
表示贝叶斯博
因而局中i人的策略是定义在局中人的信息集 上,Ti 取值于行动集合
的映射A:i
si : Ti Ai


si (ti ) ai , ti Ti , ai Ai
▪ 局中人的条件期望 支付函数
▪ 由于局中人i的支付函数 ui ui (a1, a2 ,, an ; t1, t2 ,, tn ) 是随机的,因而需 用期望支付作为决策的依据。对给定的其余局中人的策略组合
参与人2关于参与人1的最优反应策略为 s2(t) (C, D)
▪ 2. 求参与人1关于参与人2的最优反应策略。
▪ 对于固定的 s2(t),参与人1选择 s1 a1 ,最大化自己的期望支付,即
求解最大化问题

max u1(a1, s2 (t1),t1) (1- )u1(a1, s2(t2 ),t2) a1
己以及对手的支付值,因为支付还依赖于对手的成本是H还是L。而局 中人对于对手的这一私人信息还不了解,这样当然无法选择出对自己 有利的策略。为解决这个问题,海萨尼提出了解决的方法—海萨尼转 换。
▪ 海萨尼转换
▪ 1.海萨尼从不完全信息模型的特征入手,引入一个概念,类
型: ti Ti , i 1,2,, n 。Ti 称为局中人的类型空间或类型集合,
▪ 故 : (C, (C, D)) 是贝叶斯纳什均衡。

博弈论(第五章)

博弈论(第五章)
谢富纪 2008年4月 27
3.复制动态和进化稳定性:两人对称博弈
鹰鸽博弈的复制动态和进化稳定策略:揭示人类社会或动 物世界发生战争或冲突的可能性及频率,国际关系中霸道 和软弱,侵略与反抗等共存的原因。

博 弈 鹰 方 1 鸽
博弈方2

(v-c)/2, (v- c)/2
v ,0 v/2,v/2
0,v
谢富纪 2008年4月 18
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0
0.5
1
x
签协议博弈复制动态相位图
谢富纪 2008年4月
19
3.复制动态和进化稳定性:两人对称博弈
x*=0,x*=1是上述复制动态的两个稳定状态,其中 x*=1是对应大多数初始状态的稳定状态 。 有限理性的博弈方通过学习最终找到了本博弈比较有效 率的纳什均衡。 x*=1是进化稳定策略,而x*=0则不是。
B B
B
B A
B
A
A
A A
A A
A A
A A
初次博弈为1A的最优反应动态
谢富纪 2008年4月 11
2.最优反应动态
B
A
A
B
A
B
A
A
A
B
A
A
A
A
A
初次博弈为相邻2A的最优反应动态
谢富纪 2008年4月 12
2.最优反应动态
A B A A
A A
B
A
A
A
初次博弈为相邻3A的最优反应动态
谢富纪 2008年4月 13
第五章 有限理性和进化博弈
前面分析基本是假定博弈方具有完全的理性,但对 于现实中的决策者来说往往外很难满足这一要求,

经济博弈论基础-第五章、动态贝叶斯博弈

经济博弈论基础-第五章、动态贝叶斯博弈

2、博弈顺序
(1)自然首先选择囚徒1的类型,囚徒1知道自己的类型, 囚徒2只知道囚徒1属于理性的概率是1-p,非理性的概率是p;
(2)2个囚徒进行第一阶段的博弈;
(3)观察到第一阶段博弈结果后,进行第二阶段博弈; 观察到第二阶段博弈结果后,进行第三阶段博弈;如此等等。
(4)理性囚徒1和囚徒2的支付是阶段博弈的支付的贴现 值之和(假定贴现因子δ=1)。
2、Ross (1977) 模型:用负债比例显示企业质量
问题:什么因素决定企业的资本结构? Ross (1977) 模型:资本结构的信号传递理论
如果内部经理和外部投资者之间存在信息不对称,资本结 构就可以通过传递内部信息对企业的市场价值发生影响。经理 使用企业的负债比例(负债占总资产的比重)向投资者传递企 业利润分布的信息,投资者把较高的负债率看作是企业高质量 的表现,因为低质量的企业不敢用过度举债的办法模仿高质量 的企业。 越是好的企业,负债率越高。
s i
i
(B)Pi ( i
a
h i
)
是局中人
i观测到
a
h
和最优策略
i
s
*
i
(

)
后,使
用贝叶斯法则从先验概P率i (i i ) 得到的。
六、不完美信息博弈的完美贝叶斯纳什均衡
例1:完美贝叶斯纳什均衡是{M, U; p=1}
1
L (1, 3)
U
M [p] R [1-p]
2
B
U
B
(2,1) (0,0) (0,2)
(0,1)
第三节 信号传递博弈
一、信号传递博弈 两个局中人: 1是信号发送者;2是信号接受者
不完全信息: 局中人 1的类型是私人信息; 局中人 2 的类型是公共信息(只有一个类型)

第五章博弈论的思想方法及其应用

第五章博弈论的思想方法及其应用
❖ 对应于策略 2 ,局中人Ⅰ的赢得由5降到3,然后又 由3升到4;对应于策略 2 ,局中人Ⅰ的支付由1上升
到3,然后又由3下降到2.中间这个
Operational Research
对策论(博弈论)
要想在现代社会做一个有文化的人, 你必须对博弈论有一个大致了解.
——诺贝尔经济学奖获得者
Paul Samuelson
❖ 博弈论(The Games Theory)是运筹学学科的一个重 要分支。具有竞争或对抗性质的行为称为博弈行为, 在这类行为中,参与斗争或竞争的各方各自具有不同 的目标和利益,为了达到各自的目的,各方必须考虑 对手的各种可能的行动方案,并力图选取对自己最为 有利或最合理的方案。
仅失去1。然而,当局中人Ⅱ选择 2时,局中
人Ⅰ就会选择2,这样做比选择 1有利,可使
收益由1增加到3。这时,局中人Ⅰ、Ⅱ都不 愿再改变选择,因为如果局中人Ⅱ改变选择, 失去的不是3,而是5或4,如果局中人Ⅰ改变 选择,其得到的不是3,而是1或2。显然,这 种状态是一种平衡状态。
10.2 矩阵博弈的纯策略
10.1 博弈论的基本概念
❖ 二人有限零和博弈 在众多博弈模型中,占有重要地位的是二人有限零 和博弈,即在博弈只有两个局中人,各自的策略集 只含有限个策略,每局中两个局中人的得失总和为 零(即一个局中人的赢得恰为另一个局中人所输掉 的值),这类博弈又称为矩阵博弈.
10.1 博弈论的基本概念
❖ 【例10.1】田忌赛马 ❖ 战国时期(自公元前475周元王元年起,至公元前221
10.1 博弈论的基本概念
10.1 博弈论的基本概念
❖ 1944年,数学家冯·诺伊曼(J.von-Neumann) 和经济学家摩根施特恩(O.Morgenstern)写 成了《博弈论与经济行为》一书,这是博弈 论这一分支的经典之作.

博弈论-第五章

博弈论-第五章

第五章重复博弈在这一章中,我们将围绕着人类的合作为什么产生这一命题来展开。

人与人之间合作生产的一个原因(从经济学的角度来看)是这种做法对于参与者双方而言是一个有利可图的事,为什么说明这一点我们将用到重复博弈。

另一个解释合作生产的方法就是引入信息不对称,在这种情况下,一个人装作是好人是有利可图的(因为好名声能够给他带来收益),这在信息不对称中会加以介绍。

第一节 重复博弈的定义及扩展式 给出重复博弈定义之前,需要做若干准备,一个准备就是由于重复博弈有可能会进行一个很长的时期,甚至是无穷期,因而必须考虑收益的时间价值。

相应的表达偏好的收益函数也需要给出一定的限制。

一、贴现因子与偏好明天的一元钱和今天的一元钱价值是不一样的,最简单的理由是今天的一元钱如果存入银行那么在明天会变成1+ r ,所以明天的一元钱只相当于今天的1/(1+ r )元钱,1/(1+ r )实际上就是经济学中的贴现率。

如果假设未来没有不确定性,定义11r δ=+,未来存在收益流R 1,R 2,R 3,…,那么这个未来收益流的贴现值之和就为V =211231t t t R R R R δδδ∞-=+++=∑L(5-1)其中(0,1)δ∈称为贴现因子(Discount factor)。

严格讲,贴现因子并不等于贴现率,但贴现因子与贴现率一定是同方向变动的。

例如,我们考虑一个特殊的重复博弈,其结束之前重复进行的次数是随机的,即在博弈的每一阶段完成之后,都要通过抛若干枚(加权的)硬币的方式来决定博弈是否结束,如果硬币朝上那么博弈结束(即概率为p),如果是其他情况,那么博弈继续(即概率为1 –p)。

如果下一阶段能得到的收益为R1,那么在当前阶段硬币未抛之前的价值(即贴现后的期望值)为(1 –p)R1/(1+ r);如果下两阶段能得到的收益为R2,在当前阶段硬币未抛之前的价值为(1 –p)2R2/(1+ r)2;下三阶段、四阶段等等的收益,照此类推。

博弈论完整课件(浙江大学)5

博弈论完整课件(浙江大学)5

博弈论完整课件(浙江⼤学)5 GameTheory(5)DynamicGamesofIncompleteInformationPERFECT BAYESIANEQUILIBRIUM在完全信息静态博弈中,有PBE=BNE=SNE=NE⼀、Introduct iontoPBE例⼦GibbonsP139如果⼀个博弈没有⼦博弈,则⼦博弈精炼的要求(参与⼈的策略在每⼀个⼦博弈中君构成NE的要求)⾃然就得到满⾜,从⽽在任何没有⼦博弈的博弈中,SNE=NE。

?PBE信息动态博弈的⼦博弈前⽂中—“由⼀个动态博弈第⼀阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进⾏博弈所需要的全部信息,能够⾃成⼀个博弈的原博弈的⼀个部分”。

这个定义实际上隐含了三个⽅⾯的含义:A.因为原博弈本⾝不会成为原博弈的后续阶段,因此⼦博弈不能从原博弈的第⼀个节点开始,即原博弈不是⾃⼰的⼀个⼦博弈;B.包含所有在初始节点之后的选择节点和终点,但不包含不跟在此初始节点之后的节点;C.不分割任何的信息集。

即如果⼀选择节点包含在⼀个⼦博弈中,则包含该节点的信息集中的所有节点都必须包含在该⼦博弈中。

A和B两点针对所有类型的动态博弈,⽽C是专门针对不完美信息动态博弈的。

(⼆)PBE的要求(Requirement)要求1:在每⼀个信息集中,应该⾏动的参与者必须对博弈进⾏到该信息集中的每⼀个节点有⼀个推断(belief)。

对于⾮单节信息集,推断是在信息集中不同节点的⼀个概率分布;对于单节点的信息集,参与者的推断就是到达此单⼀节点的概率为1。

要求2:给定参与者的推断,参与者的策略必须满⾜序贯理性(sequentialrational)的要求。

即在每⼀信息集中应该⾏动的参与者(以及参与者随后的策略),对于给定的该参与者在此信息集中的推断,以及其他参与者随后的策略必须是最优反应。

(“随后策略”是在达到给定的信息集之后,包括了其后可能发⽣的每⼀种情况的完全的⾏动计划)对于前例,要求1和要求2的满⾜⾜以使我们排除不合理的均衡(R,R’)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章 博弈论
占优策略无论对方选择什么策略,都能使自己的支付大于其他选择的策略,相对于占优策略,其他策略均为劣策略。

纳什均衡是一个博弈均衡解的概念。

1、纳什均衡作为一个最优策略组合,每个局中人的策略都是给定其他局中人的策略情况下的最佳反应; 2、该策略具有自我实施的功能,没有一个人有动力改变自己的策略。

混合策略的纳什均衡在两个局中人标准式博弈{}2121,;,u u s s G =中混合策略组合),(*2*1p p 是
纳什均衡的充要条件为,每一个参与人的混合策略是另一个参与人的混合策略的最优反应,
即),(),(*211*2*11P P V P P V ≥且),(),(2*12*2*12P P V P P V ≥。

子博弈精炼纳什均衡的定义扩展式博弈的最优战略组合S=(S1,SI,Sn),如果它是原博弈的纳什均衡,且是在每一个子博弈上给出的纳什均衡,则该最优战略组合是该扩展式博弈的一个子博弈精炼纳什均衡。

1. 论述海撒尼转换的思路与目的
在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。

至于“类型”概念,可以通过两个企业博弈的例子来加以说明。

假设参与人1为在位者企业,参与人2为进入者企业。

进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。

但是进入者不知道在位者的成本是高还是低。

因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。

海萨尼提出通过引入“自然”概念解决这个问题。

由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。

即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。

2、精炼内叶斯纳什均衡的求解原理
假定有n 个参与人,参与人i 的类型是i i Θ∈θ,i θ是私人信息,)(i i i p θθ-是属于类型i θ的参与人i 认为其他1-n 个参与人属于类型),,,,,(111n i i i θθθθθ +--=的先验概率。

令i S 是参与人i 的战略空间,i i S s ∈是一个依赖于类型i θ的特定的战略。

),,,,,(111h n h i h i h h i a a a a a +--=是在第h 个信息集i 观察到其他1-n 个参与人的行动组
合,它是战略组合),,,,,(111n i i i s s s s s +--=所规定的行动的一部分。

)(~h i i i a p --θ是在
观察到h i a -的情况下,参与人i 认为其他1-n 个参与人属于类型
),,,,,(111n i i i θθθθθ +--=的后验概率。

1()()
()()P{}Pr {}()()
h k k h k k k h K h h j j j p a p p a p a ob a p a
p θθθθθθθ=≡≡∑ i
p ~是所有后验概率)(~h i i i a p --θ的集合,),,(i i i i s s u θ-表示参与人i 的效用函数。

于是,精炼贝叶斯均衡可以定义如下: 精炼贝叶斯均衡是一个战略组合))(,),(()(11n n s s s θθθ***= 和一个后验概率组合
)~,,~(~1n p p p =,满足:
(P)对于所有参与人i ,在每一个信息集h ,
);,()(~m ax arg ),(i i i i h i i i s i i i s s u a p s s i
i θθθθ----*∑-∈
(B))(~h i i i a p --θ是使用贝叶斯法则从先验概率)(i i i p θθ-,观测到的h i a -和最优战略
)(⋅*-i s 得到的。

3、比较经典均衡分析理论与博弈分析理论的异同。

相关文档
最新文档