同济大学马洪宽老师博弈论复习资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈是一些个体,面对一定的环境,在一定的规章制度下,同时或先后,一次或多次在其允许的策略集中选择其行为并加以实施,最终获得一定结果的过程

博弈论从衡量利弊得失的角度出发,分析形势得出相应的对策,在决策的过程中考虑到参与的其他人的行为会相互影响的决策者,需要博弈论,决策中不考虑他人的行为的决策者不需要博弈论。

博弈论通常记为G或Γ,局中人的集合通常为N,为局中人n,局中人的策略集记为S,则某一策略记为αi,局中人i的策略组合为(αi,α-i),其中α-i表示局中人i以外所有人的策略组合。局中人的收益U是α的函数,则博弈也记为G(N,S,U),若考虑信息则是G(N,S,U,I)

上策均衡:每个人都有上策,博弈时必取上策,形成的均衡为上策均衡。

囚徒困境:对每一行在第二个分量中划线,即甲策略不变时乙的策略。反之亦然

两人都有上策均衡,亦为纳什均衡

智猪博弈:有一开关,大猪小猪都按,则大猪得7单位,小猪得3单位;大猪按,小猪不按,大猪得6单位,小猪得4单位;小猪按,大猪不按,大猪得9单位,小猪得1单位;但是按一下会消耗2单位(此处隐含条件,两者都不按则无收益与支出)。

此时小猪有上策[不按],但是大猪无上策——小猪选择不同,大猪选择也相应不同。此时(大猪,小猪)的纳什均衡为(按,不按)此情境可推广至投资机构与散户的投资行为。机构研究市场动向,之后散户跟风。

娱乐博弈:甲爱象棋,乙爱围棋,甲乙一起下象棋,甲得5,乙得2;甲乙一起下围棋,甲得2,乙得5;但是两人选择不同则游戏无法开始。

两人均无上策,(甲,乙)的纳什均衡为(象,象)或(围,围)

便士博弈:甲乙同时放一枚硬币,如同面则乙给甲1块钱,如异面则甲给乙1块钱

此题不存在纯策略静态博弈的纳什均衡,但有混策略均衡。混策略的原则是做出某种概率,使对方的收益无差异。

设甲取正概率为p,可写出乙的期望收益,欲使乙无差异,则p=0.5;同样,对乙的选择亦如此。

定理:任意有限博弈必定存在一纳什均衡。

古诺模型(产量决策模型):甲乙两厂商生产一产品,价格函数为P=8-Q,单位成本C=2,问甲乙应如何定产量?

解:设甲产q1,乙产q2,则Q=q1+q2

π1=Pq1-Cq1=(8-q1-q2) q1-2 q1=-q12+(6-q2)q1

∂π1

=−2q1−q2+6

∂q1

同理可得:

∂π2

=−2q2−q1+6

∂q2

令两偏导数均为零,解得q1=q2=2

则π1=π2=4

卡特尔:甲乙约定“各产一半,利润均分”

π=(8-Q)Q-2Q,求导得Q=3时π最大,即各产1.5,各得4.5

但根据π1=-q12+(6-q2)q1可算出在q2=1.5时甲利润最大的产量并不是1.5,而是2.25,此时甲可得利润5.0625,因此合作不牢固

下策:无论对方如何行动,甲在α和β两个策略中都有α优于β,则称β为下策;与上策不同,上策是优于所有其他策略的策略,而下策是只要劣于任意一个其他策略的策略

博弈树:描述动态博弈的工具,注意两个节点是否因信息未知而实际为一个

借钱还钱博弈:甲向乙借钱,乙可以选择借或不借,如果不借则两者均无收益支出,选择借,则甲可以选择还或者不还,选择还则甲乙收益均为1,选择不还则乙可选择诉讼还是不诉讼,诉讼收益为甲1.5,乙0.5,不诉讼则甲4,乙-2。

画博弈树,利用递推归纳法

斯塔克伯格模型:

P=8-Q ,单位成本C=2,甲先确定其产量,之后已确定其产量,

两者产量各多少。

先看第二阶段,乙的利润函数π2=6q2-q1q2-q22,对q2求偏导,可得q2=(6-q1)/2,之后将此式代入π1,得π1=3q1-q12/2,求导得q1=3,q2=1.5

工资的确定:

第一阶段,工会定工资,收益U(w,L),w为工资,L为被雇佣人数。

第二阶段,企业雇佣人,利润π=R(L)-wL,R为L个人生产的产值。

解:先分析第二阶段,企业雇佣人数为π对L的偏导,求出L,继而进入第一阶段,将L代入U(w,L),求U对w的偏导,即可求出w。

这种方法现实中并非双方默契,而需要双方谈判达成。

折现率:明年100元在今年值a元,则折现率δ=a/100。注意:老师上课将δ称为贴现率,这是错误的。

讨价还价博弈:

甲乙分钱,甲先提出一种分法,乙可以选择同意或拒绝,如拒绝则乙提一种分法,甲同意或拒绝,如拒绝则甲提一种分法,乙必须同意。

如果规则仅仅如此,则结果必然是甲全拿,乙无收获,即(1,0)。

理由如下:如果博弈可以进入第三阶段,则甲必然将钱全部据为既有,则在第二阶段无论乙如何划分,甲都必须拒绝,则在第一阶段甲亦会做出甲得1,乙得0的划分,第一阶段乙无论同意或拒绝都改变不了最终结果。

规则修改:每一阶段的折现率为δ (0<δ<1),即假设博弈进入第二阶段,则总钱数将不为1而是δ。

解:博弈树如下:

之所以将第二阶段与第三阶段的分钱方案写为δq2与δ2q3,是因为这样会简化计算,无实质性差异。

第三阶段的分法是(δ2q3,δ2(1-q3)),而如果在第二阶段有δq2>=δ2q3,则在第二阶段甲会选择同意而不会进入第三阶段(注意,如果甲此时选择进入下一阶段则甲收益不少,但乙收益会减少,而我们假设每个

理性人只考虑自己利益最大化,而不理会其他人利益,故在保证自己利益的情况下不会去损害他人,当然零和博弈保护自己即是损害他人,如每一阶段独立来看都是广义零和博弈)。同样,如果在第一阶段有1-q1>=δ(1-q2),则乙会直接同意而不进入第二阶段。取临界等式,可得q1=1-δ+δ2q3。

即如果在第三阶段有一分法(δ2q3,δ2(1-q3)),则相应的在第一阶段必定有双方同意分法(1-δ+δ2q3,δ-δ2q3)。显然,在第三阶段甲会独吞剩余钱数,即q3=1,甲得到δ2,则第一阶段的分法将会是(1-δ+δ2,δ-δ2),即如果折现率为1或0,则甲都会独吞,但折现率在0和1之间,甲不会独吞。甲乙永远不会相等,差距最小时为δ=0.5,说明该规则先下手为强。

规则改变2:假设可进行无限多次讨价还价,即如有一方不同意,则永远按上述规则讨论下去,直到双方同意为止,同样现值也会以每回合δ的比率折减。

博弈树如图

相关文档
最新文档