完全信息动态博弈

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息集
• 依据这些图的样子,我们可以把信息集称 为“云”,我们可以说结点J3和J4是在同一 片云中,因此,虽然琼斯可以知道博弈已 经到了哪片云,他却不能拨开迷雾来弄清 到底抵达了哪个结点。
博弈的标准型和扩展型表示
• 时间线
– 时间线(time line)是一条表明事件发生顺序 的线,是另一种描述博弈的方法。 – 时间线在描述下述几种博弈时格外有用:存在 连续策略的博弈、存在信息的外生抵达的博弈 以及多期博弈。在会计学和财务学文献中常使 用的博弈里也能发现时间线。 – 时间线表明的是行动与事件的顺序,而不一定 是时间的流逝。某些事件是立刻发生的,某些 却可能是在一段间隔以后才发生。
• 结果矩阵(outcome matrix)由以下二者组 成:
– (1)全部可能的行动组合a1 ,a2,…,aq。 – (2)由ai映射到k维结果向量上的结果函数。
博弈的标准型和扩展型表示
• 考虑下述由分级协调演变来的博弈,跟随 领头羊Ⅰ。这一博弈与分级协调的不同之 处在于史密斯首先采取行动,即承诺自己 将采用某一种软驱规格而不管琼斯将会选 哪种。
J3
J4
S/L, L/S S/L, S/S
L
史密斯 S
2,2 E1
-1,-1
2,2 E2
1,1
-1,-1
-1,-1
-1,-1
1,1 E3
博弈的标准型和扩展型表示
均衡 策略 结果 E1 {大,(L/L,L/S)} 都选择大 E2 {大,(L/L,S/S)} 都选择大 E3 {小,(S/L,S/S)} 都选择小 • 标准式(normal form)很少应用于复杂的博弈建模。 在前面,我们已经看到了一种更简便的对序贯博 弈建模的方式:依据博弈顺序。对于跟随领头羊I, 我们有:
博弈的标准型和扩展型表示
• 扩展型(extensive form)是对博弈的一种 描述,它由下述几点组成:
– 1 由结和枝所组成的整体结构,即由单个起始 结开始直至终点结,中间无闭合的圈。 – 2 有对哪个结点属于哪个参与人的说明。 – 3 在自然作选择的结上,有自然选择不同枝的 概率。 – 4 有划分每个参与人的结的信息集。 – 5 在每一个终点结上都有对每一个参与人的支 付。
(a)
1
2
3
4 自然以 的 概率揭示
5
自然选择 企业家出价 投资者接
企业家出售 其剩余股份

( , P)
受或拒绝
(b)
1 自然选择 与 企业家 出价 ( , P ) 投资者接受 或拒绝
2 自然以 的 概率揭示
3
企业家出售 其剩余股份
信息集
• 参与人i在博弈的任何特定时点上的信息集 (information set)是指在博弈树中他认为 有可能是实际结的不同结的集合,而参与 人i靠直接观察是无法从中区分的。 • 参与人i的信息集是指属于该参与人,但却 在不同路径上的结点的集合。这其实表达 了这样一个意思,i知道现在是该谁行动了, 但却不知道博弈已到达了博弈树中的哪个 具体位置。
博弈的标准型和扩展型表示
• 简写
L L S S L, L S , L, S S , L, L S , L, S S
博弈的标准型和扩展型表示
• 标准型表示为: 琼斯
J1
L/L, L/S
J2Hale Waihona Puke Baidu
L/L, S/S
博弈的标准型和扩展型表示
• 策略式说明的是由每一种可能的策略组合 所产生的支付情况 • 结果矩阵表明的是每一种可能的行动组合 所产生的结果
博弈的标准型和扩展型表示
• 策略式[strategic form,又称标准式(normal form)]由以下二者组成:
– (1)全部可能的策略组合s1 ,s2,…,sp。 – (2)由si映射到n维支付向量上的支付函数。
完全信息动态博弈
博弈的标准型和扩展型表示
• 完全信息动态博弈
– 参与人 – 行动 – 支付 – 信息
• 了解对手的支付和行动
博弈的标准型和扩展型表示
分级协调 琼斯 大 小 大 2,2 ← -1,-1 ↑ ↓ 小-1,-1 → 1,1 支付:(史密斯,琼斯)
史密斯
博弈的标准型和扩展型表示
• 在分级协调中不仅策略与行动是等价的, 而且结果也简单,所以上面2×2形式就 同时完成了将策略组合与支付联系起来和 将行动组合与结果联系起来这两项任务。 这两项任务的结果分别称为标准型(策略 式)和结果矩阵,但在更为复杂的博弈中, 它们是截然不同的。
博弈的标准型和扩展型表示
• 新的博弈有着与分级协调如出一辙的结果 矩阵,但其策略式却有所不同,因为琼斯 的策略不再只是单一的行动,琼斯策略集 此时有四个元素:
(若史密斯选择大,则选择大;若史密斯选择小,则选择大) (若史密斯选择大,则选择大;若史密斯选择小,则选择小) (若史密斯选择大,则选择小;若史密斯选择小,则选择大) (若史密斯选择大,则选择小;若史密斯选择小,则选择小)
– 1 史密斯选择大或者小。 – 2 琼斯选择大或者小。
• 我们考虑扩展型表示和博弈树。
博弈的标准型和扩展型表示
• 结(node)是指在博弈中某一参与人或自然采取行动的时 点,或者博弈结束的时点。 • 结X的后续结(successor)是指在已经到达X之后才有可 能在随后的博弈中到达的结。 • 结X的前续结(predecessor)是指在可能到达X之前必须 到达的结。 • 起始结(starting node)是指不存在前续结的结。 • 终点结(end node)或终点(end point)是指不存在后 续结的结。 • 枝(branch)指在一个特定结上某一参与人的行动集中的 一个行动。 • 路径(path)指从起始结到终点结由结和枝所组成的系列。
博弈的标准型和扩展型表示
• 博弈树(game tree)除5以外与扩展式都 一样。在博弈树中,第5点变为:
– 5’在每一个最终结上都有结果。
• “博弈树”是一个比“扩展式”更为灵活 的术语,如果结果被定义为支付组合,对 每个参与者都有一个支付,那么博弈树与 扩展式并无二致。
博弈的标准型和扩展型表示
相关文档
最新文档