《博弈论》课程ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2,0)
成功,失败
成功,失败
失败,成功
11
2、博弈扩展式
扩展式之所以称为“扩展”根本的原因在于 它比基本式“详细”。特别是对博弈中参与 者的行动顺序和信息状态做出了比基本式 “详细”得多地刻画。正因为如此,所以扩 展式通常被用来描述复杂的动态博弈。 通俗地说,我们把博弈中所有从开始到结束 的行动序列称为一个play(全历史或完整路 径),全历史中从开始到某个阶段就叫子历 史或路径。
参与者2
左 中 1,2 3,3 0,1 右 0,1 1,1 2,0 上 中 下 1, 0 2,1 0,3
参与者1
参与者2
定义1 博弈是指利益存在冲突的决策主体(个人, 企业,集团,政党,国家等等)在相互对抗(或 合作)中,对抗双方(或多方)相互依存的一系 列策略和行动的过程集合。
5
在定义1中,我们最需要注意的就是策略的相互 依存性。对于策略的相互依存性,传统的经济学 不是不想研究,而是缺乏有效的工具。从这个意 义上而言,博弈论正是为了解决这一问题而产生 的。也是从这个意义上讲,我们有了博弈论的定 义。 定义2 博弈论是专门研究博弈如何出现均衡的规 律的学科。
12
用参与者函数来表示在每一个全历史上,当博弈进 行到某个阶段时谁来行动。因而要完整地描述一个 动态博弈,必须具备四个要素: (1)参与者集合; (2)全历史集合; (3)参与者函数; (4)偏好。
定义4 博弈的扩展式为 Γ =(N, H, P, u),其中N为参 与者集合,H为博弈的全历史集合,即H={(a1, a2, …, aK)},其中K为博弈从开始到结束依次发生的行动次 数,行动序列中的每一个a都为向量。P为参与者函 数,即P(h)={i: i∈N}, 。u为收益函数,表示博弈 参与者的偏好。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
失败,成功
失败,成功
3
例3 鸽派和鹰派
美 国 鸽派政策 苏联 鹰派政策
鸽派政策
鹰派政策
0,0
+1,–1
–1,+1
– ∞,– ∞
4
从上面的三个例子中,我们可以概括出一个博弈 所具有的共同特征:利益相冲突的参与者、参与 者总是根据对手可能采取的策略来采取相应的行 动----相互依存的策略和行动、参与者总是追求自 身利益最大化。根据这些共同特征我们就能给出 一个博弈的定义,只要符合这个定义,就可以将 其纳入到博弈论的研究范畴之中。
15
(三)博弈论基础的均衡概念——纳什均衡
纳什均衡是博弈论分析的基础,但纳什均衡
的概念实际上却非常简单。为了更好的理解 我们将从两个层面来加以理解。
一是,纳什均衡是指这样一种策略组合,其
中没有任何一个参与者有动机单方面改变策 略——单边背离。不存在单边背离的策略组 合即为纳什均衡。
16
纳什均衡——不存在单边背离
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
Biblioteka Baidu诺曼底设防 成功,失败
13
例5 取消管制 扩展式的一个等价形式就是所谓的博弈树。
政府 维持 进 2 取消 1
退 退
进
退
进
图2 取消管制
14
取消管制的扩展式为 Γ =(N, H, P, u),其中 (1)参与者集合:政府1,企业2和企业3, N={1, 2, 3}。 (2)全历史集合:维持为C,取消为D,进 入为E,退出为Q,那么全历史集合H ={(C), (D, [E, E]), (D, [E, Q]), (D, [Q, E]), (D, [Q, Q])。 (3)参与者函数:P(Ø ) = 1,P(D) = {2, 3}。 (4)偏好:对于政府而言,根据五个历史 对应的社会福利进行排序,对于企业1和企 业2而言,则为五个历史对应的利润排序。
8
定义3 博弈表达的基本式(或策略式)由博 弈的参与者N,策略空间S和收益函数u三个 要素组成,即G = {N, S, u}。其中N为自然数 集合{1, …, n},S为n重笛卡尔集,Si为参与 者i的纯策略集合,u为参与者的收益函数集 合。 完全信息静态博弈是最简单的博弈,所以通 常用策略式来描述之,策略式最常见的一种 方式就是所谓的“博弈矩阵”。我们在前面 已经接触到。
(2)博弈的扩展式 博弈的扩展式就是非常详细地描绘出一个博弈的参 与者、策略、行动顺序以及行动时拥有的信息、 可能结果和收益等细节就称为博弈的扩展式。
7
1、博弈策略式的定义 在具体情况中,不同博弈的故事千差万别, 但其中总有一些本质的东西是不变的。通常 描述一个博弈必不可少的要素包含三个: (1)参加博弈有哪些“人”; (2)每个参与者都有些什么样的“策略”, 由于策略的定义比较复杂,这里我们先将策 略理解为“行动”; (3)偏好和效用函数(收益函数)。
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。