博弈论基础PPT精品课程课件全册课件汇总
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束?
我们必须知道参与人关心什么,才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。
在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
支付(payoff),或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈,两个厂商通过选择高价或者低价进行 竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个 参与人的博弈中,i=1,2,…,n。 在某些博弈中,一个参与人可以在无限多个行动中进行选择。
的互动。树状结构由节点和分支组成。节点
表示事件的发生点,分支表示可以选择的不
同的行为方案。我们用实心圆表示节点,用
连接节点的箭头表示分支。这个树状结构称
R’
f
为扩展型表述。
K
a称为初始点,a,b,c,d,e称为决策点。f,g,h,l,m P
e
N’
g
称为终止点。表示博弈的结果。
c
P E
N
h
K
L
a
b N
3 策略
举个例子,我们看下图的博弈。
S1={OA,OB,IA,IB},S2={O,I} 请注意,在这个博弈中,参与人1的策略。不仅要定义它在开始时 怎么做,还要定义在第二个信息集中,它将采取什么行动。
你可能会问,如果参与人1在博弈开始时选择退出,为什么它还要 在第二个信息集中,决定该怎么做?
1
I
2
1 概述
策略对于社会的运行来说,是非常基本的。 我们要学会了解在策略环境下,人们实际上是如何采 取行动的,以及他们应该怎样采取行动。 相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。 这种系统的研究形成了应该策略互动的理论。
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
还有2001年获奖的米歇尔 斯彭斯,约瑟夫斯蒂克利 茨和乔治阿克洛夫。
1 概述
目前,博弈论被许多来自不同领域的专业人士使用, 这些领域包括经济学、政治学、法律、生物、国际关 系哲学以及数学。
事实上,大多数情形即包含了冲突元素,也包含了合 作的元素。我们对博弈的组成要有一个广义的理解。
简而言之,博弈是策略环境的正式描述。因此,博弈 论是研究相互依赖情形的正式的方法论。这里,“正 式”是指一种以数学化的精确,以及逻辑上的一致见 长的结构。
P
l
d
K
S
N
m
2 扩展型
我们用信息集来定义参与人在博弈中的决策节点 所拥有的信息。有一些信息集只包括一个节点,
例如在节点a,b。节点c,d则包含在一个信息集中 。每个信息集只能做出一个决策。
而正如在故事中所说的,双方都不知道对方是否
制作影片之前,决定制作自己的影片。虚线表示 P K知道自己处于这两个节点之一,但是不能区分
3 策略
一个策略组合是关于策略的向量,每一项表示一个参与人 。在研究一个有n个参与人的博弈。一个典型的策略组合 就是这样一个向量,s=(s1,s2,…,sn)。其中si是参与人i的策 略,i=1,2,…,n。 S表示策略组合的集合。在数学上表示为S=S1XS2X…XSn 。X表示笛卡尔乘积。如果S1={A,B},S2={X,Y}, 那么,S=S1XS2={A,X),(A,Y),(B,X),(B,Y)}。
S1={U,D} S2={AC,AE,BC,BE} S3={RP,RQ,TP,TQ}
3
R
A
2
T
1
U
3
P
B
Q
D
2
C
P
E
Q
6,3,2
9,2,5
2,4,4 0,5,4 3,0,0 2,2,2 1,2,2
4 标准型
4 标准型
标准型是另一种表示博弈的正式方法。在某些情况下 ,标准型更加简洁,可以优先使用。
参考书
《策略博弈》2th,阿维纳什 迪克西特,苏珊 斯克丝 《策略:博弈论导论》。乔尔 沃森 《博弈论基础》罗伯特 吉本斯 《博弈入门》马丁 奥斯本 研究生: 《博弈论》D. 弗登博格,让 梯若尔 《博弈论》R. 迈尔森 《博弈论教程》M. 奥斯本,A. 鲁宾斯坦
1 概述
在所有社会,人们经常互动。 有时,互动是合作,其他的时候,互动是竞争。 在这两种情况下,都可以用一个术语,即相互依赖性 来表示一个人的行为对另外一个人的福利造成的影响 。 相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。
2 扩展型
让我们用一个数学模型讲述这个故事。为了
把它转化成数学的抽象语言,我们必须对故
事进行适当的简化和程式化。我们的目标应
该是从中分析得出一两个策略要素。
这可以帮助我们从理论学者的角度,理解这
R’
f
K
个决策环境。
P
e
N’
g
c
K
L
a
P E
b
N
N
h
P
l
d
K
S
N
m
2 扩展型
我们可以用一个树状结构表示两个公司之间
2 扩展型
迪斯尼工作室的《虫子的一生》和梦工场的《蚂蚁》。 卡曾伯格被迪斯尼的老板艾斯纳从派拉蒙招贤,以重 振迪斯尼动画部。 卡氏于1994年8月辞职。不久,艾斯纳接受了提议, 于是《虫子的一生》进入了制作阶段。 大概同时,卡氏与斯皮尔伯格等组建了梦工场。开始 制作《蚂蚁》。 两个工作室是在决定制作两部影片之后,才得知对方 的决定的。
I
O
O
2,2
1,3
1
A
B
3,4
4,2
3 策略
原因一是,出于理性的研究,我们需要的是对于博弈 中,任意一点的最优行动的明确评估。这种评估与参 与人对彼此的信念有关。
原因而在于,万一参与人犯了错误,它们可能会需要 一个意外状况下的计划。
1
I
2
I
O
O
2,2
1,3
1
A
B
3,4
4,2
3 策略
另外一个例子,在这个博弈树中,
矩阵的每一行对应参与人1的一个策略。而每一列对 应参与人2的一个策略。
1\2
I
O
OA
2,2
2,2
OB
2,2
2,2
IA
4,2
1,3
IB
3,4
1,3
4 标准型
囚徒的困境。 警察逮捕了两个嫌疑犯,警察拥有的证据只能证明他们犯了较轻 的罪。 警察分别把他们关在不同的房间。每个囚犯都被要求高发另一个 囚犯。告发对应于策略D(背叛),不告发对应于策略C(指合作 )。 囚犯被告知,如果他们选择告发,将被免罪。他们的证据将被用 于给对方定罪。如果他们都选择告发,他们都将入狱。但是他们 的刑期由于合作将会较短。
接下去的几十年中,数学 家和经济学家丰富了它的 基础,逐步打造了社会科 学最强大和最有影响力的 工具箱之一。
1 概述
1994年诺贝尔奖颁给了, 在20世纪50-70年代对博 弈论做出了重大贡献的3 位经济学家:约翰·纳什, 约翰·海萨尼和莱茵哈特· 泽尔腾。
1 概述
接着荣膺诺贝尔经济学奖 金桂冠的经济学家有,诸 如信息和合约方面的专家威廉维克里和詹姆斯米利 斯(1996年)。
即使你打算在节点a选择“留下”,你也必须对
上述所有决策进行定义。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
3 策略
例子:该图描述了一个简单的市场博弈。两个厂商为 其生产的一种相同的产品,分别选择高价或者低价进 行相互竞争。
H
1,1
2
1பைடு நூலகம்
H
0,2 L
(该函数的定义域是策略组合的集合,值域是实数)。 对于各个参与人所选择的每一个策略组合,s∈S,
ui(s)是参与人i 在博弈中的收益。 这个函数ui称为参与人i的收益函数。
4 标准型
举个例子,我们看下图的博弈。
S1={OA,OB,IA,IB},S2={O,I}
该博弈的策略组合是S={(OA,O),(OA,I),OB,O), (OB,I),(IA,O), (IA,I)(IB,O),(IB,I)}
策略是博弈中的一组参与人完整的相机的行动计划。 这里的“完整的相机计划”是对一个参与人行为的完 整描述。它包含了它的每一个决策点上的行为。 因为信息集表示的是在博弈中各个参与人的决策点, 所以,一个参与人的策略描述的是,在它的每个信息 集中,它所做出的决策。
3 策略
例如,在下面的博弈中,你的策略必须包括在所 有的节点,即a,c-d,以及e的信息集中,所有选择 的行动。
2 扩展型
迪斯尼准备在1998年感恩节期间,发行《虫子的一生 》。而这正是梦工场原定《埃及艳后》的上映时间。 梦工场于是决定,把〉埃及艳后〉推迟到圣诞节。争 取在《虫子的一生》上映之前,让《蚂蚁》上映。 最后,《蚂蚁》为梦工场创造了超过0.9亿美元的利 润,而《虫子的一生》确保了超过1.6亿美元的利润。
对于一个用扩展型表示的博弈,每一个策略组合能够 告诉我们,该博弈在博弈树中所遵循的路径。同时告 诉我们,在博弈结束时,终止点是哪个。与每个终止 点相对应的是,各个参与人的收益向量。
因此需要注意的是,每一个策略组合,给出了一个收 益向量。
4 标准型
对于每一个参与人i,我们可以定义一个函数ui=S → R
参与人i的收益是定义在S之上的。因此,当博弈采取策略组合s时 ,ui(s)给出了参与人i在博弈中的收益。
例如,u1=(OA,O)=2,u1(IA,I)=4,u2(IA,O)=3
1
I
2
I
1
A
4,2
O
O
B
2,2
1,3
3,4
4 标准型
对于各参与人具有的策略数量有限的两方博弈,表示 各参与人的策略空间的一种简便方法,是画出它们的 收益矩阵。
yes
1
p
2
no
p,100-p 0,0
2 扩展型
一个简单的讨价还价模型,即最后通牒议价。假设1希望卖一幅 画。
各方只有一次出价的机会。假设卖方先出价,买方2可以决定是 否接受这个价格。
如果画没有成交,双方均一无所获。如果成交,卖方获得等于价 格的收益,买方获得自己的价值。
yes
1
p
2
no
p,100-p 0,0
Movie 2,1 0,0
Cricket 0,0 1,2
2 扩展型
2 扩展型
在数学上,有几种方法描述一个博弈: 1 博弈有一组参与人; 2 对于参与人可能采取的行动的完整描述(即它们的 可行行动集); 3 对于参与人采取行动时,所知信息的描述; 4 对于参与人的行为将如何导致博弈结果的规定; 5 对于参与人对结果偏好的定义。
1 概述
在19世纪的前10年,古诺 对寡头模型的均衡进行了 研究。
而埃奇沃思解决了交易经 济中的议价问题。
1 概述
1913年,关于博弈的第一 个定理(关于象棋游戏的 结论)被泽梅罗证明。
接着,博雷尔开创性地提 出了“策略”的概念。
1 概述
博弈论发展的关键事件是 1944年冯诺依曼和奥斯卡 摩根斯坦的著作《博弈论 和经济行为》的出版。此 书奠定了该领域的基石。
导言
1.1 什么是博弈论?
博弈论帮助我们理解,决策者互动的情形。 Creates a double record of bank transactions. Bank reconciliation.
Movie Cricket
Movie 2,1 0,0
Cricket 0,0 1,2
3 策略
3 策略
利用正确的理论工具,我们可以研究各种情况下的行 为,从而更好地理解经济中的相互作用。
导言
1.1 什么是博弈论?
博弈论帮助我们理解,决策者互动的情形。 Creates a double record of bank transactions. Bank reconciliation.
Movie Cricket
H’
2,0
L
L’
1/2,1/2,
3 策略
正式地说,给定某个博弈。我们用Si来表示参与人i的
策略空间。也称为策略集合。即Si包含了参与人i的每 一个可能的策略集合。
对前一个博弈,参与人1的策略空间S1={H,L}。而参与 人2的策略空间是S2={HH’,HL’,LH’,LL’}。 我们用小写字母表示单个策略(即这个集合中的一个元 素),则si ∈Si是博弈中参与人i的一个策略。例如, s1=L,s2=LH’。