博弈论 第 三 章 完全信息动态博弈讲解

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
集包含不止一个结, 假设x 与x′ ∈h(x), 则恰 好拥有信息h(x) 并正在选择自己行动的参与 人其实对自己究竟是处于x 还界x′ 是不确定的。
要 求: 如 果x′∈h(x), 则x与x′ 应 该由同 一 个参与人采取行动,且可以选择的策略空 间 相同:A(x)=A(x′), 由此可以将信息集h上 的 行动集记 为A(h)。
展开型博弈中纯策略是由信息集与行动集 定义 的( 与静态博弈不同,静态博弈中采取纯 策略与 采取某行动是一个意思)。
纯策略组合(剖面profile) 是由参与人各自 的纯策 略空间中的任一纯策略构成的组
合,在任一纯 策略组合s下,总可以从
初始结开始,沿着博弈树的某条路径 (path), 达到s相应的终点结。 有一个事
不允许出现的情况:
由以上规则,对于博弈树中的每一个终点结, 我们,完全可以确定从初始结到终点 结的路 径,同时也展示了博弈的动态过程。
信息集:博弈树上的所有决策集分割成不同的信 息集, 我们用h∈H来表示这个信息。如果 一个信息集包含 结x, 我们就可以将该信息集 记为h(x), 如果一个信息 集只包含一个结,这 是最简的情况。我们主要关心的 是一个信息
弈的计划( 或打算)的详细集合, 而在展 开型博弈中 参与人的策略必须确定在该 参与人的每一个决 策集上 所 采 取 的 行 动,又 结 与 信 息 集 紧 密 相 连, 对 于 参 与 人i,基于信息hi的行动的
的全体记汉A(h i),如果令Hi表示参与人i的信息 集
的集合,则Ai= ∪ A(h i)就是参与人i的所有行
⑷ 当参与人作出他们的行动决策时,他所 观测到 或他所了解到的信息,即他在此时 获得的信息 集合;
⑸ 参与人的得益(支付或效用), 它们是已 知行动的函数;
⑹ 在任何外生事件的概率分布。
例 房地产开发博弈
有两个房地产开发商( 分别为参与人1, 记为 A和参与人2,记为B) 在某地开发房地产, 但该 地的房地产需求状况是不确定的, 假定该博弈 的行动顺序如下:(1) 开发商1 先行动, 选择开 发或不开发;(2) 在1 决策后,“自然”选择需求 的大小;(3) 开发商2 在 观测到1的决策和市场 的需求后, 再决定开发 或不开发。( 如 下 图)
实非常重要:s中有些信息集在博弈 树 的这条路径上,我们称这些信息集是 s 的 路 径(path), 当然也可能存在s中某些信 息集不在 此路径上。
定义了纯策略的得益函数后,我们就可以定义 展
开型博弈的 Nash 均衡;
定义 策略组合s*=(s1*,…si*,…sn*)是展开型 博弈的
一个Nash均衡,如果对每一个 i,si*最大化ui(si,s-i*):
单 位:百万元
上述博弈树给出了有限博弈的几乎所有信息。
博 弈 树 必 须 满 足 下 列 规 则:
(1) 每一个结(node) 至多有一个其他结直接位 于 它的前面;
(2) 在博弈中没有一条路径可以使决策集与自身 相连;
(3) 每一个结是唯一初始结的后续结, 即博弈树 必须有初始结;
(4) 每个博弈树“正好”只有一个初始结(多于 一个 可以用“ 自 然”连接。

h i∈Hi
的集合。参与人i 的一个纯策略是从H i 到A i 的一 个映射si:对每一个hi∈Ai,si(h i)∈Ai,所有这些 s i 的全体记为 S i ,即的的纯策略空间 S i ,由此:
Si= × A(h i)
h i∈Hi

上 2 h 2(1)


h 1(2)
1
1
1 h1(1) 下
2 h2(2)
第 三 章 完全信息动态博弈
3.1 动态博弈的表示法和特点
1. 定 义 与 博 弈树
博弈的展开式所包含的信息和内容 : ⑴ 参与人的集合,记为i=1,2, …n,用N 代表虚拟
的参与人“自然”; ⑵ 行动的次序, 即谁在什么时候行动; ⑶ 参与人的行动空间,即轮到某参与人行动时,
他从该时刻的纯策略空间中选取什么策略 ;


h 1 (3)
1
1
A
B
A
B
C
D
C
D
参与人2有两个策略集 ,相应地也有两个信息集 A(h 2(1))=A(h 2(2))={ 左,右}
其中H2={h2(1),h2(2)};参与人2的纯策略空间为: S2=(A(h2(1)),Ah2(2))={(左,右)×(左,右)}
={(左,左),(左,右),(右,左),(右,右)},其中纯策略 (左,左)表明:当1取“上”时,2取“左”;当1取
“下”时,2取“左”,…… 参与人1有三个信息集H1={hi(i),i=1,2,3},1的纯
策略空间为:S1=A(h1(1))×A(h1(2))×A(h1(3)) ={(上,下)×(A,B)×(C,D)},共8种纯策略。
一般地,参与人I的纯策略空间的纯策略数目为: #Si= Π #(A(hi))
hi∈Hi
如果博弈树的所有信息集都是单结的, 则称该 博弈为完美(perfect)息 博弈。(无虚线连接), 而完全(complete)信息博弈是指得益函数和纯 策略空间均为博弈各方的共同知识。完全信息 可以是完美的也可以是不完美的。
3.2 展开型博弈的策略与均衡
一、 行 为 策 略 在策略型博弈中, 参与人的策略是进行博
房地产开发博弈
开发
A hA(1) 不开发
h 表示信息集
N h N(1)
需求大
需求小
N hN(2)
需求大
需求小
B h B(1)
开发
不开发
B hB(2)
B hB(3)
wenku.baidu.com开发
不开发 开发 不开发 开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1)
(0,0)

si*∈arg max u i(si*,s-i*),对任一i
策略型博弈的混合策略实际上是纯策略空间上 的
概率分布,因此展开型博弈中参与人 i的混 合策略也 可以看作是其纯策略空间 Si上的任一 概率分布。
“参与人的每一个特定的纯策略si相当于一 本指导说明书,书中每一页表示到了一 个特定的信息集hi,在 该页上告诉i 如何 行动。许多的si 相当于许多的说 明书, Si表示这些说明书的全体。混合策略相当 于i 以一定的概率分布随机地抽取一本说 明书”
相关文档
最新文档