博弈论经典课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12
SUCCESS
THANK YOU
2020/1/24
例 国际竞争与最优关税(具有同时选择的动态博弈)
考虑两个相似的国家,分别用i=1,2表示。每个同家各有一个企 业,分别称为企业1、企业2。企业生产既可内销又可出口的同质 产品。两个国家中的消费者在各自国家的市场上购买本国产品或
1
2、博弈树(博弈扩展式)
1)结:包括决策结(采取行动的时间)与终点结。
2)枝:决策结到它直接后接点的连线,它代表参与人的行动、 路径。
3)信息集:决策结的子集,要满足: ①信息集中每个结应属 于同一参与人; ②参与人知道博弈进入某信息集,但不知自 己处在信息集中的哪一个结(多结点信息集时); ③参与人 在同一个信息集上的每一个结上的行动空间是相同的;④信息 集中每个结应是同一时点的决策结 。
10
例 斯坦克尔伯格(Stackelberg)寡头竞争模型
例 讨价还价博弈
例 有点数为1,2,3的三张牌,先由A任抽一张,看 后反放于桌上,并喊大(H)或小(L)。然后由B从剩 下牌中任抽一张,看过后,B有两种选择: ①弃权, 付给A一元; ②翻A的牌,当A喊H时,点数小者付给对 方3元,当A喊L时,点数大者付给对方2元。要求:1) 说明A、B各有多少纯策略?2)据理性原则淘汰具有劣 势的策略。3)求双方的最优策略及各自的支付值。
第三章 完全信息动态博弈
一、博弈的扩展式表示 1、博弈扩展式描述包括的六要素 1)参与人集合; 2)参与人的行动次序:谁在什么时候行动; 3)参与人的行动空间:在每次行动时,参与人有哪些选择; 4)参与人的信息集:每次行动时,参与人知道些什么; 5)参与人的支付函数:行动结束后,每个参与人得到些什么; 6)外生事件(即自然的选择)的概率分布。
例 房地产开发博弈: ①开发商A首先行动,选择开发或不开 发; ②A决策后,自然选择市场需求大小; ③开发商B在观测到 A的决策和市场需求后,决定开发或不开发。
2
3、静态博弈的扩展式表示 例1 囚徒困境
例2 四人同时决策,每人有两种选择(L,U),请画出博弈树。 练习 用博弈树表示下述博弈。 第一步:局中人1掷一枚硬币,结果可能是正面H或反面T; 第二步:局中人2不知第一步硬币的结果,再掷一次硬币; 第三步:局中人1知第一、二步硬币的结果,又掷一次硬币; 第四步:局中人2不知第三步的结果,但知一、二两步的结果,最 后掷一次硬币,博弈结束(按每步结果,局中人2给1一笔报酬)。
7
三、子博弈精炼纳什均衡
子博弈定义:一个扩展式博弈的子博弈G由一个决策结x和所有 该决策结的后续结T(x)(包括终点结)组成,它满足如下条 件:1) x是一个单结信息集,即h(x)={x};2)对于所有的
x' T (x) ,若 x'' h x'
x'' T,x
则
。
子博弈精炼纳什均衡定义:称扩展式博弈G的策略组合
6
练习 考虑以下动态博弈。 第一步:局中人1从{1,2}中选择一数x。 第二步:局中人2知道x的值,从{1,2}中选择y。 第三步:局中人1知道y的值,从{1,2}中选择z,博弈结束。对 选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z) U1(1,1,1)=-2; U1(1,1,2)=-1; U1(1,2,1)=3; U1(1,2,2)=-4; U1(2,1,1)=5; U1(2,1,2)=-2; U1(2,2,1)=2; U1(2,2,2)=6。
9
例 海盗分金:五个海盗要分配抢来的100 枚金币,方式是,第一个人提出一种分配方 案,如果同意这种方案的人达到半数,那么 提议通过,否则提议的人就被扔进大海,由 剩下的人再进行同样的过程。假设五个人提 议的次序已定,金币不能分割,而且海盗的 本性让他们觉得,如果对自己的收益没有影 响,则很乐意看到别人被扔进大海,这时理 性结局应是如何?
5
例3 带有机会选择的动态博弈。 第一步:用一个随机装置,从{1,2}中等可能地选择数x。 第二步:局中人1知道x值,从{1,2}中选择y。 第三步:局中人2不知x,但知y,从{1,2}中选择z,博弈结束。 对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z) U1(1,1,1)=-2; U1(1,1,2)=-1; U1(1,2,1)=3; U1(1,2,2)=-4; U1(2,1,1)=5; U1(2,1,2)=-2; U1(2,2,1)=2; U1(2,2,2)=6。
11Hale Waihona Puke Baidu
例 银行挤提问题(具有同时选择的动态博弈) 设有两投资者,每人存入银行一笔存款D,银行将存款 投资于一长期项目。若在项目到期前,存款人提前支 取,银行被迫变现,共可收回2r,此处D>r。若银行等 长期项目到期支取,可回收2R,R>D。设有两个提款日 期,t=1,项目到期前,两投资者都提款,则每人可得 r。若只有一个在t=1提款,他可得D,另一人得2r-D。 若两人都未在t=1提款,在t=2,两人都提款,则每人 得R;若只有一个人在t=2提款,他得2R-D,另一人得D; 若t=2时,两人都不提款,银行向每个投资者返还R。
3
二、扩展型博弈转化为策略型博弈
例1 房地产开发博
弈
A
开发
不开发
开发 (-3,-3)
B
B
开发 不开发
不开发
(1,0)(0,1)
(0,0)
4
例2 考虑以下动态博弈。 第一步:局中人1从{1,2}中选择一数x。 第二步:局中人2知道x的值,从{1,2}中选择y。 第三步:局中人1不知y,也忘了x,从{1,2}中选择z,博弈结 束。对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z) U1(1,1,1)=-2; U1(1,1,2)=-1; U1(1,2,1)=3; U1(1,2,2)=-4; U1(2,1,1)=5; U1(2,1,2)=-2; U1(2,2,1)=2; U1(2,2,2)=6。
s*
s1*
,
,
si*
,
,
s
* n
为子博弈精炼NE,若:1)它是原博弈
的NE;2)它在每一个子博弈上给出NE。
8
定理:有限、完美信息的扩展型博弈必存在纯策略意义下的 子博弈精炼纳什均衡。
子博弈精炼纳什均衡的解法:逆向递推法。
例
1
L
R
(2,0)
2
L1
R1
(1,1)
1
L2
R2
(3,0)
(0,2)
SUCCESS
THANK YOU
2020/1/24
例 国际竞争与最优关税(具有同时选择的动态博弈)
考虑两个相似的国家,分别用i=1,2表示。每个同家各有一个企 业,分别称为企业1、企业2。企业生产既可内销又可出口的同质 产品。两个国家中的消费者在各自国家的市场上购买本国产品或
1
2、博弈树(博弈扩展式)
1)结:包括决策结(采取行动的时间)与终点结。
2)枝:决策结到它直接后接点的连线,它代表参与人的行动、 路径。
3)信息集:决策结的子集,要满足: ①信息集中每个结应属 于同一参与人; ②参与人知道博弈进入某信息集,但不知自 己处在信息集中的哪一个结(多结点信息集时); ③参与人 在同一个信息集上的每一个结上的行动空间是相同的;④信息 集中每个结应是同一时点的决策结 。
10
例 斯坦克尔伯格(Stackelberg)寡头竞争模型
例 讨价还价博弈
例 有点数为1,2,3的三张牌,先由A任抽一张,看 后反放于桌上,并喊大(H)或小(L)。然后由B从剩 下牌中任抽一张,看过后,B有两种选择: ①弃权, 付给A一元; ②翻A的牌,当A喊H时,点数小者付给对 方3元,当A喊L时,点数大者付给对方2元。要求:1) 说明A、B各有多少纯策略?2)据理性原则淘汰具有劣 势的策略。3)求双方的最优策略及各自的支付值。
第三章 完全信息动态博弈
一、博弈的扩展式表示 1、博弈扩展式描述包括的六要素 1)参与人集合; 2)参与人的行动次序:谁在什么时候行动; 3)参与人的行动空间:在每次行动时,参与人有哪些选择; 4)参与人的信息集:每次行动时,参与人知道些什么; 5)参与人的支付函数:行动结束后,每个参与人得到些什么; 6)外生事件(即自然的选择)的概率分布。
例 房地产开发博弈: ①开发商A首先行动,选择开发或不开 发; ②A决策后,自然选择市场需求大小; ③开发商B在观测到 A的决策和市场需求后,决定开发或不开发。
2
3、静态博弈的扩展式表示 例1 囚徒困境
例2 四人同时决策,每人有两种选择(L,U),请画出博弈树。 练习 用博弈树表示下述博弈。 第一步:局中人1掷一枚硬币,结果可能是正面H或反面T; 第二步:局中人2不知第一步硬币的结果,再掷一次硬币; 第三步:局中人1知第一、二步硬币的结果,又掷一次硬币; 第四步:局中人2不知第三步的结果,但知一、二两步的结果,最 后掷一次硬币,博弈结束(按每步结果,局中人2给1一笔报酬)。
7
三、子博弈精炼纳什均衡
子博弈定义:一个扩展式博弈的子博弈G由一个决策结x和所有 该决策结的后续结T(x)(包括终点结)组成,它满足如下条 件:1) x是一个单结信息集,即h(x)={x};2)对于所有的
x' T (x) ,若 x'' h x'
x'' T,x
则
。
子博弈精炼纳什均衡定义:称扩展式博弈G的策略组合
6
练习 考虑以下动态博弈。 第一步:局中人1从{1,2}中选择一数x。 第二步:局中人2知道x的值,从{1,2}中选择y。 第三步:局中人1知道y的值,从{1,2}中选择z,博弈结束。对 选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z) U1(1,1,1)=-2; U1(1,1,2)=-1; U1(1,2,1)=3; U1(1,2,2)=-4; U1(2,1,1)=5; U1(2,1,2)=-2; U1(2,2,1)=2; U1(2,2,2)=6。
9
例 海盗分金:五个海盗要分配抢来的100 枚金币,方式是,第一个人提出一种分配方 案,如果同意这种方案的人达到半数,那么 提议通过,否则提议的人就被扔进大海,由 剩下的人再进行同样的过程。假设五个人提 议的次序已定,金币不能分割,而且海盗的 本性让他们觉得,如果对自己的收益没有影 响,则很乐意看到别人被扔进大海,这时理 性结局应是如何?
5
例3 带有机会选择的动态博弈。 第一步:用一个随机装置,从{1,2}中等可能地选择数x。 第二步:局中人1知道x值,从{1,2}中选择y。 第三步:局中人2不知x,但知y,从{1,2}中选择z,博弈结束。 对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z) U1(1,1,1)=-2; U1(1,1,2)=-1; U1(1,2,1)=3; U1(1,2,2)=-4; U1(2,1,1)=5; U1(2,1,2)=-2; U1(2,2,1)=2; U1(2,2,2)=6。
11Hale Waihona Puke Baidu
例 银行挤提问题(具有同时选择的动态博弈) 设有两投资者,每人存入银行一笔存款D,银行将存款 投资于一长期项目。若在项目到期前,存款人提前支 取,银行被迫变现,共可收回2r,此处D>r。若银行等 长期项目到期支取,可回收2R,R>D。设有两个提款日 期,t=1,项目到期前,两投资者都提款,则每人可得 r。若只有一个在t=1提款,他可得D,另一人得2r-D。 若两人都未在t=1提款,在t=2,两人都提款,则每人 得R;若只有一个人在t=2提款,他得2R-D,另一人得D; 若t=2时,两人都不提款,银行向每个投资者返还R。
3
二、扩展型博弈转化为策略型博弈
例1 房地产开发博
弈
A
开发
不开发
开发 (-3,-3)
B
B
开发 不开发
不开发
(1,0)(0,1)
(0,0)
4
例2 考虑以下动态博弈。 第一步:局中人1从{1,2}中选择一数x。 第二步:局中人2知道x的值,从{1,2}中选择y。 第三步:局中人1不知y,也忘了x,从{1,2}中选择z,博弈结 束。对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z) U1(1,1,1)=-2; U1(1,1,2)=-1; U1(1,2,1)=3; U1(1,2,2)=-4; U1(2,1,1)=5; U1(2,1,2)=-2; U1(2,2,1)=2; U1(2,2,2)=6。
s*
s1*
,
,
si*
,
,
s
* n
为子博弈精炼NE,若:1)它是原博弈
的NE;2)它在每一个子博弈上给出NE。
8
定理:有限、完美信息的扩展型博弈必存在纯策略意义下的 子博弈精炼纳什均衡。
子博弈精炼纳什均衡的解法:逆向递推法。
例
1
L
R
(2,0)
2
L1
R1
(1,1)
1
L2
R2
(3,0)
(0,2)