博弈论(第三章-修改)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
归纳法分析这个博弈,确定他们各自的均衡产量,
并找出它的子博弈完美纳什均衡。
(2)里昂惕夫(Leontief)劳资模型
这个模型是里昂惕夫(Leontief)1964年提出的,博弈双方 分别代表了劳资双方的工会和厂商之间的一种博弈模型。 该博弈模型假定工资完全由工会决定,而厂商则根据工会 要求的工资高低决定雇佣工人的数量 工会代表的劳方效用u应该是工资率W和雇佣工人数L两者 的函数,即:u=u(W,L)。
(2)里昂惕夫(Leontief)劳资模型(续)
而厂商的效用直接用利润来表示,它是收益和成本之 差。假定厂商的收益是劳动雇佣数量的函数R(L), 再假定厂商只有劳动成本,这样,厂商的总成本为工 资率乘以雇佣劳动数量W x L, 假定工会和厂商之间的博弈过程是这样的:先由工会 决定工资率,然后厂商根据工会提出的工资率决定雇 佣多少劳动力。假定工资率和雇佣数量都是连续可分 的,因此博弈双方都有无限多的选择。
( 0, 10)
A ( -2, 5)仿冒 B
制止 不仿冒
(5,5)
不制止
( 2,2) (10, 4)
三、几个经典的动态博弈模型
(1)寡占的斯塔克博格模型
该模型假设寡头市场有两个厂商1和2,其中厂商1较强 而厂商2较弱,决策内容是确定他们各自的均衡产量, 并且它们的产量决策是由较强的厂商1先进行选择,较 弱的厂商2则根据较强的厂商2的产量选择自己的产量。
p(Q)= a-Q,其中Q是它们的总产量。如果厂商的 产出qi都等于雇佣的劳动力数量Li,并且除工资以外 没有其他成本。再假设工会是所有厂商唯一的劳动力 供给者。 如果先由工会决定统一的工资率w,厂商看到w后同 时选择雇佣数量Li,工会的效用函数为(w-w0)(其 中w0为工会成员到其他行业就业的收入,L= L1 + L2+· · · +Ln为工会的总就业水平)。求该博弈的子博弈 完美纳什均衡。
逆推归纳法的总结 (1)逆推归纳法就是把多阶段动态博弈化为一系列 的单人博弈进行分析; (2)逆推归纳法是严格下策反复消去法在动态博弈中
的应用。
(3)由逆推归纳法确定的各个博弈方在各阶段的选择都
是建立在后续阶段各个博弈方理性的基础上的,因
此自然排除了包含不可信的许诺; (4)逆推归纳法不适用于无限博弈和不完美信息博弈。
“仿冒和反仿冒” 的扩展式表示
A
仿冒 不仿冒
B
制止 不制止
( 0, 10)
A ( -2, 5)仿冒 B
制止 不仿冒
(5,5)
不制止
( 2,2) (10, 4)
博弈树所遵循的原则
(1)每一个结点至多有一个其他结点直接位于它 的前 面。
(2)在博弈树中没有一条路径可以使选择结点与自身
相连。 (3)每个博弈树必须有初始结点。 (4)每个博弈树只有一个初始结点。
其中,厂商1的产量为q1,厂商2的产量为q2,则市场上 的总产量为Q= q1+ q2。设上述总产量全部售出的价格为 P=P(Q)=8 - Q。 。
(1)寡占的斯塔克博格模型 (续)
再设两厂商的生产都无固定成本,且每增加一单位
产量的边际成本相等,c1= c2= 2,即他们分别生产q1 和q2单位产量的总成本分别为2 q1和2q2。试用逆推
“开发金矿”的博弈表示(法律保证不足)
乙 投 不投 甲 分 不分 打
(1,0)
乙 不打
(2,2)
(-1,0) (0,4)
“开发金矿”博弈(有法律保证)
乙 借 不借 甲 分 不分 打
( 1,0)
乙 不打
(2, 2)
( 1, 0) ( 0,4)
二、相机选择和策略中的可信性问题
相机选择问题:在动态博弈中,对于博弈方在各个阶段 针对各种情况所预先设定的策略,只要符合博弈方自己 的利益,他们完全可以在博弈过程中改变预先设定的策 略。我们称这种问题为动态博弈的相机选择问题。
借 不借 甲 分 不分 乙 不打
(1,0)
(2,2)打
(-1,0) (0,4)
子博弈(2):“开发金矿”博弈
子博弈的子博弈:称后面的这个子博弈为原博弈的“二
级子博弈”。
乙 借 不借 甲 分 不分 乙 不打 打
(1,0)
(2,2)
(-1,0) (0,4)
二、子博弈完美纳什均衡 定义:在一个完美信息的动态博弈中,如果各博弈方的 策略构成的一个策略组合满足,在整个动态博弈 以及它的所有子博弈中都构成纳什均衡,那么, 这个策略组合称为该动态博弈的一个“子博弈完
(1,0)
(2,2) (0,4)
三阶段“开发金矿”博弈表示二(法律保证不足)
乙 投 不投 甲 分 不分 打
(1,0)
乙 不打
(2,2)
(-1,0) (0,4)
三阶段“开发金矿”博弈表示三(有法律保证)
乙 借 不借 甲 分 不分 打
(1,0)
乙 不打
(2,2)
(1,0) (0,4)
“仿冒和反仿冒” 的博弈
注意:双方损益值中,第一个是先动一方的损益。
“开发金矿”的博弈
例:“开发金矿”的博弈 甲有一价值4万元的金矿,但缺1万元的开发资金,
而乙正好有1万元资金可以投资。设甲想说服乙将这
一万元资金借给自己用于开发金矿,并许诺在采到 金子后与乙对半分成,试用动态博弈的扩展式表 示。
“开发金矿”博弈表示一
乙 借 不借 甲 分 不分
第一节
动态博弈的表示方法和特点
一、阶段和扩展形表示 在动态博弈中,各个博弈方的选择策略的行为有先
后次序,所以动态博弈也称为序Hale Waihona Puke Baidu博弈,或称之为
多阶段博弈。 阶段:在动态博弈中,一个博弈方的一次选择策略的 行为我们常称为一个阶段。
二、扩展式表述
是用博弈树来表述的。而博弈树是有选择结点(信息 集),终端结点以及树枝所组成的。其中,空心圆表示 选择结点,实心圆表示终端结点,标注在博弈树终端结 点下的是博弈方的得益函数;而直线表示博弈树的树 枝,代表博弈方的一个选择。
也就是:扩展式表示动态博弈,它包括选择结点,终
端结点和树枝组成。
扩展式表述例题
例:有一个容量有限的市场已经被厂商A抢先占领,而
另一个生产同样产品的厂商B也想加入该市场发
展,分享一定的利润。厂商B知道一旦自己进入该 市场先占领市场的厂商A有可能通过降价等竞争手 段来打击自己,此时厂商B不但不能赢利,而且肯 定还会亏损。
(3)动态博弈的结果还包括实施上述策略组合的最终得
益。就是上述路径终端结点处得益数组的数字。
“仿冒和反仿冒” 的扩展式表示
A
仿冒 不仿冒
B
制止 不制止
( 0, 10)
A ( -2, 5)仿冒 B
制止 不仿冒
(5,5)
不制止
( 2,2) (10, 4)
三阶段“开发金矿”博弈表示二(法律保证不足)
乙 投 不投 甲 分 不分 打
三、动态博弈的策略
动态博弈的策略:在整个的动态博弈中,各博弈方在每 个阶段所选择的行为,以及针对前面的每个阶段的各种 行为所做的相应选择的完整过程,称之为动态博弈中博
弈方的一个策略。
“仿冒和反仿冒” 的扩展式表示
A
仿冒 不仿冒
B
制止 不制止
( 0, 10)
A ( -2, 5)仿冒 B
制止 不仿冒
试用逆推归纳法来分析博弈问题的子博弈完美纳什均 衡。
劳资模型的图示
斜率为W R(厂商的收益) R(L)
Max(R(L)- WL) ,距离最大, 此时, R’ ( L) = W
WL (斜率为 W)
L*(W) L(W)就是厂商的反应函数
L(雇佣的劳动数量)
讨论1:子博弈完美纳什均衡
假设一个n个厂商的寡头垄断市场的需求函数为
第三章
完全且完美信息的动态博弈
动态博弈:指的是博弈方的行动有先后次序,且后行
动者能够观察到先行动者所选择的行动并在此基础上 采取自己最有利的策略。 完全信息的博弈:在一个博弈中,每一个博弈方都 完全了解所有博弈方的在各种情况下得益的博弈。
完美信息的动态博弈:在动态博弈中,若所有的博
弈方在轮到自己行动时,对此前的全部过程完全了解。
(3)三个回合的讨价还价模型
假设有两人就如何分享1万元现金进行谈判,并且已经定下 如下的规则:首先由甲定下一个分割的比例,对甲提出的 比例,乙可以接受也可以拒绝;如果乙拒绝甲的方案,则 他自己必须提出另一个方案,让甲选择接受与否。 在上述循环过程中,只要任何一方接受对方的方案,博弈
设有一家企业的产品被另一家企业仿冒,如果被仿冒企 业采取措施制止,仿冒企业就会停止仿冒,如果仿冒企 业不采取措施制止,那么仿冒企业就会继续仿冒。 上述博弈有两个博弈方A,B,其中博弈方A是仿冒企 业,博弈方B是被仿冒企业,并且假设仿冒最多进行两
次。再假设第一次不仿冒,仿冒被制止以及第一次仿冒
没被制止的情况下,第二次不仿冒,仿冒被制止和仿冒 不被制止这几种情况下,写出它的扩展式表示。
“开发金矿”博弈
乙 借 不借 甲 分 不分
(1,0)
(2,2) (0,4)
“开发金矿”博弈(有法律保证)
乙 借 不借 甲 分 不分 打
( 1,0)
乙 不打
(2, 2)
( 1, 0) ( 0,4)
第二节
动态博弈的分析方法 ----逆推归纳法
逆推归纳法:从动态博弈的最后一个阶段博弈方的 行为开始分析,逐步倒推回前一个阶段相应博弈方 的行为选择,一直到第一个阶段的分析方法。我们 称之为逆推归纳法。
例题的假定
在这个“先来后到”博弈中,假设A独占市场时利润 为
10个单位;与B和平共处分享市场则双方各得5个单
位;如B进入市场而A进行打击,则B要亏损2个单 位,A的利润则降为3个单位。我们可以用博弈的扩展 式表述来表达 。
“现来后到”博弈的扩展式表示
B
进
A 不进
打击
和平
(0,10)
(-2,3)
(5,5)
美纳什均衡”。
求完美信息动态博弈的子博弈完美纳什均衡的最基本的 方法就是我们已经介绍的逆推归纳法。
“现来后到”博弈:子博弈完美纳什均衡
B
进
A 不进
打击
和平
(0,10)
(-2,3)
(5,5)
注意:双方损益值中,第一个是先动一方的损益。
“仿冒和反仿冒” :子博弈完美纳什均 衡
A
仿冒 不仿冒
B
制止 不制止
第三节
一、子博弈
子博弈完美纳什均衡
定义:由一个动态博弈的第一阶段以外的某阶段开始 的后续博弈所有阶段构成,有初始信息集和进
行博弈所需要的全部信息,能够自成一个博
弈,并且是原博弈的一部分,我们称之为原动 态博弈的一个“子博弈” 。
子博弈(1):“开发金矿”博弈
例:在“开发金矿”的博弈中,虚线框中的部分满 足 上述定义,因此是这个博弈的“子博弈”。 乙
(0,2)
逆推归纳法的例子二
有5个海盗抢来100枚金币,大家决定了下面分赃的 方式:由海盗一提出一种分赃的方式,如果同意这 种方式的人达到半数,那么该提议就通过并付诸实 施;若同意这种方式的人未达到半数,则提议不能 通过且提议人将被扔进大海喂鲨鱼,然后由接下来 的海盗继续重复提议过程。假设海盗个个都非常聪 明,也不互相合作,并且每个海盗都想尽可能多得 到金币,那么,第一个提议的海盗将怎样提议既可 以使得提议被通过又可以最大限度得到金币呢?
“开发金矿”博弈(法律保证不足)
乙 投 不投 甲 分 不分 打
(1,0)
乙 不打
(2,2)
(-1,0) (0,4)
“开发金矿”博弈(有法律保证)
乙 借 不借 甲 分 不分 打
( 1,0)
乙 不打
(2, 2)
( 1, 0) ( 0,4)
逆推归纳法的例子一
甲
上
乙
右
甲
后 (3,0)
下
左
前
(2,0)
(1,1)
(1,0)
乙 不打
(2,2)
(-1,0) (0,4)
五、动态博弈的非对称性
是指由于动态博弈中各个博弈方的选择行为有先
后次序,且后行为者可以观察到此前选择行为博 弈方的选择行为,因此动态博弈中各博弈方的地 位是不对称的。
第二节 动态博弈中的纳什均衡和可信性问题
一、动态博弈中的纳什均衡 纳什均衡的策略组合是指每一个博弈方的策略都是
针对其他博弈方策略的最佳对策,各博弈方都不愿
意改变策略的策略组合,具有一定的稳定性。
动态博弈的纳什均衡分析
例:“开发金矿的博弈” 甲有一价值4万元的金矿,但缺1万元的开发资金,
而乙正好有1万元资金可以投资。设甲想说服乙将这
一万元资金借给自己用于开发金矿,并许诺在采到 金子后与乙对半分成,试用动态博弈的扩展式表 示。
(5,5)
不制止
( 2,2) (10, 4)
三阶段“开发金矿”博弈表示二(法律保证不足)
乙 投 不投 甲 分 不分 打
(1,0)
乙 不打
(2,2)
(-1,0) (0,4)
四、动态博弈的结果
动态博弈的结果有三个含义: (1)指各博弈方由动态博弈的策略所构成的策略组合。 (2)是各博弈方的策略组合形成的一条连接各个阶段 的路径。从动态博弈的扩展式图中来看,是指连接 博弈每个阶段的一条路径。