第十章博弈论初步

合集下载

10博弈论的历史

10博弈论的历史
32
阿克尔洛夫、斯彭斯和斯蒂格利茨的分析 理论用途广泛,既适用于对传统的农业市 场的分析研究,也适用于对现代金融市场 的分析研究。同时,他们的理论还构成了 现代信息经济的核心。
33
乔治· 阿克尔洛夫(George A.Akerlof) (1940-) 今年61岁的乔治· 阿克尔洛夫教授出生于美 国的康涅狄格州的纽海文。1966年毕业于麻 省理工学院,获得博士学位,自1980年到现 在,一直在加州大学伯克莱分校任经济学 首席教授。
21
詹姆斯· 莫里斯
22
威廉· 维克瑞(WILLIAM VICKREY) (19141996) 威廉· 维克瑞(WILLIAM VICKREY)美 国人 ,由于他在信息经济学、激励理论、 博弈论等方面都做出了重大贡献,获得1996 年诺贝尔经济奖。
23
威廉· 维克瑞
24
问题:什么是完美贝叶斯均衡
第十章 博弈论的历史和发展
1
本章结构
第一节 博弈论的起源和形成 第二节 博弈论的成长和发展 第三节 博弈论的进一步发展
2
第一节 博弈论的起源和形成
一、博弈论的起源 博弈本质是人类的决策选择,是人们相互之 间存在互动关系、策略对抗情况下的决策选择。 博弈论来自于人们的社会实践,是人类实践 经验和古老智慧的结晶和升华发展而来的。
25
3、1980-1990年代
博弈论走向成熟的时期
(1)现代经济活动规模、对抗性和竞争性的要求 (2)信息技术和社会经济信息化的发展 (3)数学和逻辑的方法更加全面而完整的分析决 策过程
26
3、1980-1990年代
宏观博弈论 微观博弈论 金融博弈论 等
27
第三节 博弈论的进一步发展

十章博弈论课件

十章博弈论课件

无新品
无新品 4 ,
厂商1
4
有新品 厂商2的最小收益 63,3
有新品 3, 6
2 2
, 2
25
威胁信号?
➢公司之间经常相互发出信号以表明他们的意图、动机 和目标。有些信号是威胁性的。
➢例如, A公司宣布,如果谁挑起价格战,它将坚决奉陪 到底,并宣称其规模在本行业中名列前茅,最有降价 的实力。
➢是否所有的威胁都是可信的?
33
重复博奕
在下图的价格博弈中,如果是静态博弈,厂商很容易陷 入囚徒的困境(低价,低价)。但如果博弈可以无限 重复下去,则厂商的最佳策略是“以牙还牙”。这样, 考虑到对手会以牙还牙,从长远和整体来看,降低价 格不会有什么好处,博弈可能达到合作的结果。
厂商2
低价
高价
低价 10, 10
100 ,-50
第十章 博奕论
通过前面分析可知,寡头想达到垄断 的结果,需要进行合作,而合作往往 难以维持。其均衡是博弈的结果。 博弈论:研究人们在各种战略情况下 如何行事。
1
囚犯的两难处境
李四
坦白
抵赖
张三 坦白 -8 ,-8
抵赖 -20 ,0
0 ,-20 -1 ,-1
2
红与黑的游戏
MAX:profit
红,红 -3, -3 黑,黑 +3,+3 红,黑 +5,-5
• 全部相互了解即为完全信息博弈; • 否则是不完全信息博弈
13
五、博弈的均衡概念
• 博弈方的不同策略将导致各种不同的均衡,而均 衡的特征又与博弈方的行为假设有密切关系。
• 首先分析静态的非合作的博弈,并且对博弈双方 的行为作出以下假设: ①假定博弈双方是理性的 ②假定博弈双方具有完全的信息 ③假定博弈双方独立地进行决策

第10章 博弈论初步

第10章 博弈论初步

二、博弈树(扩展式博弈模型) 容忍
(原价)
(1,4)
①竞争者和垄断者的策略 组合为(进入、容忍) ②竞争者得到支付为1 垄断者得到支付4.
垄断者
进入
竞争者 ●
抵抗
(降价)
(-2, 2)
竞争者得到支付为-2 垄断者得到支付为2.
容忍 不进入 垄断者 抵抗
(预先实施 降价威胁)
(原价)
(0, 5)
(0, 3)
将p2=1-p1,q2=1-q1 代入,并整理得:
E甲 =p1(7-10q1)+5q1+2
甲的混合策略( p1 , p2 )分别选择上和下
7 10 q1 0时,E甲最大时,p1 1
为使甲的期望值E甲最大
7 10 q1 0时,E甲最大时,p1 [0,1]
7 10 q1 0时,E甲最大时,p1 0
优化决策之二:
– 当经济主体之间利益存在冲突时,一方所获得的利益不仅取决于自己 所采取的行动,而且取决于其他主体采取的行动或对自己行动的反应。 – 博弈论研究利益存在冲突时相互“斗智”的形式和结果。
寡头优化问题:寡头的决策必须考虑其他竞争寡头之间的反应。在竞争性局势下 如何采取行动,如何作出有利于己方的决策。 博弈论是在给定的条件下寻求最优策略,这里给定的条件包含其他人的策略以及
本人的决策对其他决策主体的影响。例如,下棋,军备竞赛,广告战,价格战。
博弈论:是研究在策略性环境中,如何进行策略决策和采取策略行为的科学。
应用:被广泛地应用于政治、经济、军事、外交领域。研究理性的决策者之间冲 突及合作的问题。
一、博弈的基本要素
①博弈的参与人
构成 要素
②一组可选择的策略 ③获得的报酬(支付),报酬可为正或负

第十章博弈论初步-PPT精品

第十章博弈论初步-PPT精品

▪ 1、纳什均衡的定义:
▪ 设 s(s1, .., .sn)是n人博弈G={ ; S1, .., . Sn u1,.., . un } 的一个策略组合。如果对于每个局中人 i , ui(s1 , ., .s .i 1 , si , si 1 , ., .s .n )≥ ui(s1 , ., .s .i 1 , si, si 1 , ., .s .n )
第十章 博弈论初步 Game Theory
博弈论概述 纳什均衡 序贯博弈与重复博弈 进入威慑
第一节 博弈论概述
▪ 什么是博弈? ▪ 拍卖金钱 ▪ 海盗博弈 ▪ 田忌赛马 ▪ 围棋和象棋
齐王
田忌



上 赢,输 赢,输 赢,输
中 输,赢 赢,输 赢,输
下 输,赢 输,赢 赢,输
一、博弈的基本要素
ui(si,si) ≥ ui(si,si) 对于所有si Si 都成立,则我们称策略组合
s(s1, .., .sn)
是该博弈的一个纳什均衡。
▪ 纳什简介: ▪ 约翰·纳什生于1928年6月13日。父亲是电子工程师
与教师,第一次世界大战的老兵。纳什小时孤独内 向。纳什的数学天分大约在14岁开始展现。他在普 林斯顿大学读博士时刚刚二十出头,但他的一篇关 于非合作博弈的博士论文和其他相关文章,确立了 他博弈论大师的地位。在20世纪50年代末,他已是 闻名世界的科学家了。 ▪ 然而,30岁的时候,纳什和他惟一儿子都罹患精神 分裂症。半个世纪之后,在他妻子(艾利西亚—— —麻省理工学院物理系毕业生)的精心照料下,和 她的儿子一样,纳什教授渐渐康复,并在1994年获 得诺贝尔经济学奖。 ▪ 影片《美丽心灵》是一部以纳什的生平经历为基础 而创作的人物传记片。该片荣获2019年奥斯卡金像 奖。

第10章 博弈论初步

第10章 博弈论初步
第10章 博弈论初步 · 14
甲的支付矩阵=
7
2012年10月19日星期五
乙的支付矩阵=
2
池州学院 胡鹏
1
5、寻找纳什均衡的方法——条件策略下划线法
5 甲的支付矩阵= 7 2 1 乙的支付矩阵= 1 3 6 5
其次,在甲厂商的支付矩阵中,找出每一列的最大者。 再次,在乙厂商的支付矩阵中,找出每一行的最大者。 最后,找到两个数字下均划线的支付组合,该组合 再再次,将已经画好线的甲厂商的支付矩阵和乙厂商的 所代表的策略组合就是均衡的策略组合。 支付矩阵中合并起来。 5 合并后的支付矩阵= 7
9, 1 2, 8
第10章 博弈论初步 · 16
2012年10月19日星期五
池州学院 胡鹏
6、纳什均衡的存在性、唯一性和最优性
(2)唯一性 在纳什均衡存在的条件下,它既可能是唯一的,也可能不 唯一。
乙厂商的策略 左 甲厂商 的策略 上 下 右
5, 6 4, 1
1, 4 2, 3
第10章 博弈论初步 · 17
2012年10月19日星期五
池州学院 胡鹏
第10章 博弈论初步 · 2
博弈的三个基本要素
参与人(Player):参与博弈的利益主体叫做参与者,或 在博弈中进行决策的主体。英文原意为玩主,也有译成局 中人的。 在任何一个博弈中,都至少有连个参与人。
策略(Strategy):是指一项规则,根据该规则,参与人 在博弈的每一时点上选择如何行动。 一般情况下,每个参与人至少应该有两个可供选择的策略。 支付(Payoff):所有参与人都选择了各自的策略且博弈 已经完成后,参与人获得的效用(或期望效用)。
② ④ ⑥ ⑧
b11 = b12 、b21 > b22; b11 > b12 、b21 = b22;

第10章博弈论初步

第10章博弈论初步

三、寡头厂商的共谋及其特征
厂 商 X
A:不降价
厂 商 Y
B:降价
A:不降价
10
10
6
12
B:降价
12
6
8
8
特征:共谋的不稳定性
移动-联通价格战
四、重复博弈
重复博弈的策略原则: “以牙还牙”,所谓 “善有善报,恶有恶 报”,而且“无论善恶, 立即得报”。
“以牙还牙”
(一)无限次重复博弈


(存在囚徒合作均衡)
4. 如果投食量为原来的一半,并且把投食口移到踏 板附。小猪大猪都会拼命地去抢踩踏板。等待者不得 食,多劳可以多得。 寓意:对于企业激励机制的设计,应该采用减量移位 的方法。奖励不能人人有份,而应该直接针对个人 (如业务按比例提成)。既节约了成本,又消除了“搭 便车” 现象,从而实现有效的激励。
(二)纳什均衡
问题:1.该博弈中小猪和大猪的占优策略分别是什么? 博弈的占优策略均衡是什么?并说明原因。 2.如果投食量仅为原来的一半,结果怎么变化? 3. 如果投食量为原来的二倍,结果怎么变化? 4. 如果投食量为原来的一半,并且把投食口移到踏板 附近,结果又怎么变化?
1.小猪的占优策略是选择“搭便车”策略,即舒舒服服地等在 食槽边;大猪的占优策略是为一点残羹不知疲倦地奔忙与食 槽与踏板之间。 该博弈的占优策略均衡是(不踩踏板,踩踏板)。 原因:小猪踩踏板将一无所获,不踩踏板反而能吃上食物。 因此,对小猪而言,无论大猪是否踩踏板,不踩踏板总是最 好的选择。对于大猪而言,明知小猪不会去踩动踏板的,自 己亲自去踩踏板总Байду номын сангаас不踩好,所以只好亲力而为。
(一)占优策略均衡

囚徒困境博弈

第十章博弈论初步

第十章博弈论初步

一、分析序贯博弈的工具——博弈树 博弈树的构成:
1.节点 2.枝 (1)代表参与人的策略选择以及路径 (2)不交叉
垄断者 进入
抵抗 容忍
(1, 5) (-2, 2)
进入者
(0, 10)
二、寻找序贯博弈的纳什均衡

例如:情侣博弈,分析该博弈的纳什均衡?
1、为什么在城市中心道路上禁止汽车鸣 喇叭? 2、为什么要成立WTO? 3 、为什么政府要负责修建公共设施? 4 、为什么中小企业不会花钱去开发新产 品?
第三节
序贯博弈
序贯博弈:参与人的决策有先有后, 后行动的人做出选择时已经知道先行 动的人所采取的策略。
序贯博弈
序贯博弈中各决策方的选择和行为是依次进 行的,且后行为者能够“看到”先行为者的选择 。 经济行为中的序贯博弈很多,例如商业活动 中的讨价还价,拍卖活动中的轮流竞价,信用市 场上的借贷活动,还有收购兼并及反收购兼并等 。
所有上策均衡都是纳什均衡; 但是并不是所有的纳什均衡都是上策均 衡。
案例:智猪博弈
猪圈中有一头大猪和一头小猪,在猪圈的 一端设有一个按钮,每按一下,位于猪圈另 一端的食槽中就会有10单位的猪食进槽,但 每按一下按钮会耗去相当于2单位猪食的成本。 如果大猪先到食槽,则大猪吃到9单位食物, 小猪仅能吃到1单位食物;如果两猪同时到食 槽,则大猪吃7单位,小猪吃3单位食物;如 果小猪先到,大猪吃6单位而小猪吃4单位食 物。下表给出了这个博弈的支付矩阵。

下面,将这种情形模型化。有一支军队 准备进攻一座城市,它有军力两个师。守城 军队有三个师。通往城市有甲、乙两条道路。 两军相遇时,人数居多的一方取胜。 假设攻守双方的情报很少,都不知道对 方会采取怎样的策略。如果你是守城部队的 统帅,你会怎样部署你的兵力?如果你是攻 城部队的主帅,你会怎样部署你的部队拿下 城池?

《博弈论初步》课件

《博弈论初步》课件

THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡 ,其中每个参与者都认为当前策 略是最好的,不会受到其他参与 者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略,逐步逼近纳什均衡。这 种方法适用于较简单的博弈模型,但对于复杂的博弈模型 可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题,通过求解线性规划 来找到纳什均衡。这种方法适用于具有线性特征的博弈模 型,但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊,为企业制定营销策略提供 博弈论可以用来分析选民的投票行为和政治立场,预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法,帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法 适用于具有矩阵特征的博弈模型,但需要一定的数学基础 。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中,企业之间通过价格策略进行竞争 ,最终形成价格均衡,即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求,最终 达成工资协议,这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议,强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。

第10章 博弈论初步(2010)

第10章  博弈论初步(2010)
14
当只有一家开发商在这个地段开发一栋写 字楼时,它可以全部售出,赚得利润1百万。 1 假定A先决策,B在看见A的决策后再决策 是否开发写字楼。在图2中, 用“博弈树”表示博弈过程。
15
开发 B 开发
A
不开发 B
不开发
开发
不开发
(-1,-1)
(1,0)
(0,1)
(0,0)
16
图2
房地产开发博弈
但是,如果B在向A发出威胁的同时又当 着A的面与第三者C打赌一定要在该地段上开 发出一栋写字楼,否则输给C 2百万元。B与 C为此签定合同并加以公证有效。 这时,博弈变成图3所示的动态博弈。
小猪
按 按 等待 等待
5, 1 9, -1
4, 4 0, 0
大猪
13
动态博弈与承诺行动
如果局中人在进行行动选择时有先后顺序 之分,这种博弈就被称为“动态博弈”。 在图2中,有两个房地产开发商A和B分别 决定在同一地段上开发一栋写字楼。由于市场 需求有限,如果他们都开发,则在同一地段会 有两栋写字楼,超过了市场对写字楼的需求, 难以完全出售,空置房太多导致各自亏损1百 万。
22
重复博弈
但在有限期重复博弈中,就得不到以上的结论。 但在有限期重复博弈中,就得不到以上的结论。假设 博弈只重复5 我们用逆推法来分析博弈过程。由于第5 博弈只重复5次,我们用逆推法来分析博弈过程。由于第5 期就是最末一期,以后不会再有重复博弈,那么第5 期就是最末一期,以后不会再有重复博弈,那么第5期的博 弈和一次性的静态博弈没有什么两样。在第5 弈和一次性的静态博弈没有什么两样。在第5期的某一成员 的欺骗或违约行为是不可能被报复的。于是, 的欺骗或违约行为是不可能被报复的。于是,第5期博弈中 单个成员的占优策略就是不合作的欺骗或违约。逆推到第4 单个成员的占优策略就是不合作的欺骗或违约。逆推到第4 在第4 每个参与者都推知第5期肯定是不合作, 期,在第4期,每个参与者都推知第5期肯定是不合作,所 他们在第4期也不会合作,而且, 以,他们在第4期也不会合作,而且,他们知道这种不合作 的策略在第5期并不会遭到报复。如此等等, 的策略在第5期并不会遭到报复。如此等等,一直逆推到第 在博弈一开始的第1 1期。在博弈一开始的第1期,每个参与者就会采取欺骗或 违约的不合作策略。所以,在有限期重复博弈中, 违约的不合作策略。所以,在有限期重复博弈中,囚犯困 境博弈的纳什均衡是参与者的不合作。 境博弈的纳什均衡是参与者的不合作。

博弈论初步

博弈论初步

第三节 混合策略均衡
一 混合策略与策略组合

以有限的纯策略为基础的混合策略一定是无限 的,源于概率取值的无限性。 乙厂商
q1 p1 4 3 p2 7 – 2 6 – 9 – 8 – q2 1

甲厂商和乙厂商的混
合策略组合就是一个 概率向量组合。 与纯策略不同,每一 个概率向量是相应参

甲 厂 商
与人的一个混合策略。
类型 区别 静态 内容 动态

完全信息 完全信息
完美信息 不完全信息
纳什均衡 精炼纳什均衡 针对策略集和支付集
针对记忆 (过程),信息结点是唯一的 贝叶斯 -纳什均衡 精炼贝叶斯-纳什均衡
第二节 纯策略均衡 一、寡头博弈和支付矩阵
第二节 纯策略均衡
一 寡头博弈和支付矩阵

假定在某个寡头市场上,有甲、乙两个厂商。 这是一个只有两方参加 乙厂商

他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。

[案例] “华容道”里的纳什均衡(1)
曹操 小道 大路 小 道 大 路
被擒 擒住 逃脱 空等 逃脱 空等
被擒
[案例]“华容道”里的纳什均衡(1)
博弈论 (Game Theory) 是研究在策略性环境中 如何策略性地进行决定和采取行动的科学。 1944 年, 冯· 诺依曼和摩根斯顿共著《博弈论 与经济行为》,将博弈论用于经济领域。 博弈论在政治学、计算机科学、国际关系、军 事料] 会下棋的机器
[资料] 会下棋的机器
1/2 ▲
1/2 ▲

高鸿业西方经济学-第10章博弈论初步dmqn.pptx

高鸿业西方经济学-第10章博弈论初步dmqn.pptx

30
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
二、存在纯策略均衡时的混合策略均衡
求解混合策略纳什均衡的方法不仅适用于纯策略 纳什均衡不存在的情况,而且也适用于纯策略纳什均 衡存在的情况。在后面这种情况下,纯策略纳什均衡 将作为特例被包含在相应的混合策略纳什均衡之中。
2024年9月29日星期日
12
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第二,在甲厂商的支付矩阵中,找出每一列的最大者 (每列的最大者可能不只一个),并在其下划线
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
13
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
个厂商都不再有单独改变策略的倾向时,整个博弈就 达到了均衡,即博弈均衡。
博弈均衡是博弈各方最终选取的策略组合,是博 弈的最终结果,是博弈的解。
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
8
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
四、纳什均衡
2.纳什均衡的概念 第一,纳什均衡的概念
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
24
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
一、不存在纯策略均衡时的混合策略均衡
1.混合策略 第三,“混合”策略的概念
把甲厂商和乙厂商原来的策略叫做“纯”策略, 把赋予这些纯策略的概率向量叫做“混合”策略。
2024年9月29日星期日
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
23
第十章 博弈论初步 第三节 同时博弈:混合策略均衡

高鸿业《西方经济学(微观部分)》(第2版)名校考研真题详解-第十章 博弈论初步【圣才出品】

高鸿业《西方经济学(微观部分)》(第2版)名校考研真题详解-第十章 博弈论初步【圣才出品】

第十章 博弈论初步一、名词解释1.占优策略均衡(中央财经大学2011研;兰州大学2014研)答:在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。

也就是说,无论其他参与人采取什么策略,该参与人的最优策略是唯一的,这样的策略称之为占优策略。

如表10-1所示,通过对支付矩阵的分析可以看出,如果A 、B 两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。

这种策略均衡称之为占优策略均衡。

表10-1 广告博弈的支付矩阵2.纳什均衡(华中科技大学2002研;中国海洋大学2002研;东北大学2003研;武汉大学2003、2007研;北京大学2004研;北京师范大学2005研;中南大学2005研;东华大学2006研;东北财经大学2007研;中南财经政法大学2007、2009研;中央财经大学2007研;财政部财政科学研究所2008研;华南师范大学2011研)答:纳什均衡又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字命名。

纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的情况下,他选择了最好的策略。

纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而没有人有积极性去打破这个均衡。

3.混合策略(东北大学2007研;华中科技大学2008研)答:混合策略是指在博弈中,博弈方的决策内容不是确定性的具体的策略,而是在一些策略中随机选择的概率分别的策略。

混合策略情况下的决策原则有以下两个:(1)博弈参与者互相不让对方知道或猜到自己的选择,因而必须在决策时利用随机性来选择策略,避免任何有规律性的选择。

(2)博弈参与者选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性倾向的某一种策略而在博弈中占上风。

4.以牙还牙策略(东北财经大学2012研)答:以牙还牙策略的内容是:所有的成员一开始是合作的。

第十章 博弈论初步

第十章 博弈论初步

第十章博弈论初步
一、教学目标与教学建议
教学目标:
1. 了解博弈论的基本概念其策略行为。

2. 了解同时博弈中的纯均衡策略,掌握支付矩阵、条件策略、条件策略组合以及纳什均衡的条件策略下划线法,了解纳什均衡的存在性、唯一性、最优性以及二人同时博弈的一般理论。

3.了解同时博弈中的混合策略均衡、掌握不存在纯均衡策略和存在纯均衡策略两种条件下的混合策略均衡以及混合策略模型的一般理论。

4. 了解序贯博弈、掌握博弈树及逆向归纳法。

10-博弈论初步

10-博弈论初步

一、矩阵博弈模型描述
10.2
矩阵博弈的数学模型
对任一纯局势(α 的赢得值为a 对任一纯局势 i,βj),记参与人 的赢得值为 ij, 并称 ,记参与人I的赢得值为
a11 a 21 A= ⋮ a m1
a12 a 22 am 2
⋯ ⋯ ⋯
a1 n a2n ⋮ a mn
非合作博弈
博弈
有限理性 博弈 完全信息 动态博弈 动态博弈 不完全信息 动态博弈 合作博弈
一、矩阵博弈模型描述
10.2
矩阵博弈的数学模型
矩阵博弈: 二人有限零和博弈。 矩阵博弈: 二人有限零和博弈。 一般,用I、II分别表示两个参与人, 一般, 、 分别表示两个参与人, 分别表示两个参与人 可供选择, 设参与人 I 有 m个纯策略 α1,α2 ,…,αm可供选择, 个纯策略 参与人II 可供选择, 参与人 有n 个纯策略 β1, β2, …, βn 可供选择, 则参与人I、 的策略集分别为: 则参与人 、II 的策略集分别为 S1 = {α1,α2 ,…,αm} S2 = {β1,β2,…,βn } 当参与人I选定纯策略 和参与人II选定纯策略 选定纯策略β 当参与人 选定纯策略αi 和参与人 选定纯策略 j 后 , 选定纯策略 就形成了一个纯局势(α 就形成了一个纯局势 i,βj)。可见这样的纯局势共有 m×n 。 × 个。
二、博弈的基本要素
10.1
博弈论的基本概念
参与人、行动、信息、策略、支付、结果、 参与人、行动、信息、策略、支付、结果、均衡 1)参与人(Players) 参与人( 参与人 博弈中的决策主体,在一个博弈行为( 博弈中的决策主体, 在一个博弈行为( 或一局博弈 有权决定自己行动方案。 )中,有权决定自己行动方案。通常用 I 表示参与人的 集合,如果有n个参与人,则 I = {1,2,…,n}。 个参与人, 集合,如果有 个参与人 , , 。 参与人的概念具有广义性,可理解为个人,还可理 参与人的概念具有广义性, 可理解为个人, 解为某一集体,如球队、企业等。 解为某一集体 ,如球队 、企业等。也可把大自然当作参 与人。 利益完全一致的参加者只能看成是一参与人) 与人。(利益完全一致的参加者只能看成是一参与人) 在博弈中总是假定每一个参与人都是“理智的” 在博弈中总是假定每一个参与人都是“理智的”决 策者。不存在利用他方失误来扩大自己利益的可能性。 策者。不存在利用他方失误来扩大自己利益的可能性。

第十章 博弈论初步

第十章 博弈论初步

第十章博弈论初步第十章博弈论初步第十章博弈论初步数据、模型与决策 (第二版)数据、模型与决策 (第二版)学习目的本章介绍博弈论的最基础内容。

了解博弈分析的基本框架及博弈模型的要素重点掌握均衡的基本特征及不同类型博弈的均衡初步理解博弈论的思考特点第十章博弈论初步数据、模型与决策 (第二版)数据、模型与决策 (第二版)第十章博弈论初步104>>.1 博弈的实际背景及应用10>.2 博弈论的结构与分类10>.3 完全信息静态博弈10>.4 完全信息动态博弈10>.5 不完全信息静态博弈第十章博弈论初步数据、模型与决策 (第二版)数据、模型与决策 (第二版)10>.1 博弈的实际背景及应用囚徒困境两个确实犯了罪,而未被掌握足够证据的人,入狱后被隔离开来,分别审讯。

现在,两人都面临着一个选择:“我是坦白呢,还是抵赖呢?”根据规则,如果两人都坦白,则都坐8年牢;假如一人坦白,令一人抵赖,那么坦白者立即释放,抵赖者坐10年牢;假如二人都抵赖,那么由于无法准确定罪,则都只坐1年牢。

第十章博弈论初步数据、模型与决策 (第二版)数据、模型与决策 (第二版)性别战假如有两夫妇,他们很恩爱,参加娱乐活动的时候喜欢统一行动。

但妻子爱看芭蕾舞,而丈夫爱看足球赛。

也就是说,如果两人分开活动,则对他们来讲毫无意义;如果一起看足球,则丈夫得到的享受多一些,妻子少一些;如果一起看芭蕾舞,则反之。

第十章博弈论初步数据、模型与决策 (第二版)数据、模型与决策 (第二版)鹰鸽博弈两个动物为某一食物而争斗。

它们都有两种选择:“象鹰一样行动”或者“象鸽子一样行动”。

“鹰行动”代表粗暴地取食,“鸽行动”代表温和地取食。

假如都采取“鹰行动”,则双方什么也吃不到;假如都采取“鸽行动”,则各吃到3个单位的食物;假如一个采取“鹰行动”,另一个采取“鸽行动”,那么前者吃到4个单位的食物,后者吃到1个单位的食物。

第十章---博弈论初步精选全文完整版

第十章---博弈论初步精选全文完整版
由于p1,p2和q1,q2的取值有无限多的可能,
甲 (式乙)
p.61
p.42
A B
混合策略组合及其支付也就有无限多的可能。
q.31 C 4,6 7,3

.q72 D 9,1 2,8 9
不存在纯策略均衡时的混合策略均衡3
• 条件混合策略:参与人在假定其他参与人按某一概率选择某一策略
的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合 策略,称为“条件混合策略”。
• 对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付 多1,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的 条件策略是也不合作,乙若合作支付只有1,不合作则可得到3。
• 条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与
作为它的条件的对方策略之间的组合,称为“条件优势策略组合”或
• 假q2=定1-(q1p代1,入p甲2)与、乙(各q自1,的q2期)望的支取付值表从达0到式1有无,限经多整可理能可,得把:p2=1-p1和 E甲= p1(7-10q1)+5q1+2(式1); E乙= 5q1(2p1-1)-7p1+8(式2)
• 每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时, 己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。
e点的坐标是p1=0.5,q1=0.7,则纳什均衡 时p2=0.5,q2=0.3 。
q1 1
本题中混合策略的纳什均衡还可表示为:
((p1 , p2),(q1 ,q2) )= ((0.5 , 0.5),(0.7 , 0.3) )。 0.7 本题中,只有唯一的这个纳什均衡点。
1
q1<0.7
p1= [0,1] q1 = 0.7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、博弈的基本要素 10.1 博弈论的基本概念
3)支付(Payoff) 支付有时也称赢得,是指一个特定策略组合下参与人
得到的收益水平。
在一局博弈中,各参与人所选定的策略形成的策略组
合称为一个局势,即若Si是第i个参与人的一个策略,则n个 参与人的策略组 S =(S1 ,S2 ,…,Sn )就是一个局势。
三、博弈的分类
10.1 博弈论的基本概念
博弈分类及对应的均衡概念
静态
动态
完全 信息
完全信息静态博弈 Nash Equilibrium Nash(50,51)
完全信息动态博弈
Subgame Perfect Nash Equilibrium
Selten(1965)
不完全 不完全信息静态博弈
不完全信息动态博弈
二Байду номын сангаас最优纯策略
10.2 矩阵博弈的数学模型
可以看出,矩阵A的元素a22既是其所在行的最小元素, 又是其所在列的最大元素,即:
ai2 ≤ a22 ≤ a2j , i = 1,2,3,4; j =1,2,3
将这一事实推广到一般矩阵博弈,可得如下定理: 定理1 矩阵博弈G = {S1,S2;A}在纯策略意义下有解 的充要条件是:存在纯局势
S1 = {α1,α2 ,…,αm} S2 = {β1,β2,…,βn } 当参与人I选定纯策略αi和参与人II选定纯策略βj 后, 就形成了一个纯局势(αi,βj)。可见这样的纯局势共有 m×n 个。
一、矩阵博弈模型描述 10.2 矩阵博弈的数学模型
对任一纯局势(αi,βj),记参与人I的赢得值为aij, 并称
不仅取决于自己的策略选择,还取决于其他博弈参与者的策 略选择。这种具有策略依存性的竞争性的决策行为称为博弈 行为。
博弈就是一些个人、团队或组织,面对一定的环境条件, 在一定规则下,同时或先后、一次或多次,从各自可能选择 的行为或策略中进行选择和实施,各自得到相应结果的过程。
一、博弈论和博弈行为 10.1 博弈论的基本概念
一、矩阵博弈模型描述 10.2 矩阵博弈的数学模型
田忌赛马(齐王的赢得表)
田忌的策略
β1
β2
β3
β4
β5
β6
齐王的策略
上中下 上下中 中上下 中下上 下中上 下上中
α1(上,中,下)
3
1
1
1 1 -1
α2(上,下,中)
1
3
1
1 -1 1
α3(中,上,下)
1
-1
3
1
1
1
α4(中,下,上) -1
1
1
3
二、最优纯策略
10.2 矩阵博弈的数学模型
矩阵博弈的解可以是不唯一的
α1 A = α2
α3 α4 max
β1 β2 β3 β4 6565 1 4 2 -1 8575 0262
8 5* 7 5*
min 5* -1 5* 0
于是 i* = 1,3; j* = 2,4
(α1,β2 )、(α1,β4 )、(α3,β2 )、(α3,β4 ) 四个局势都是博弈的解,且VG=5。
信息
Bayesian Nash Equilibrium Perfect Bayesian Nash Equilibrium
Harsanyi(67-68)
Selten(1975)
Kreps,Wilson(1982)
Fudenberg Tirole(1991)
三、博弈的分类
结盟博弈
静态博弈
联合博弈
合作博弈
第10章 博弈论初步
Game Theory
■10.1 博弈论的基本概念 ■10.2 矩阵博弈的数学模型 ■10.3 矩阵博弈的混合策略 ■10.4 矩阵博弈的解法
一、博弈论和博弈行为 10.1 博弈论的基本概念
博弈行为 博弈论是关于策略相互作用(Strategic interaction)和理
性行为的理论。 所谓策略依存性是指每一个博弈参与者所得结果的好坏,
1
1
α5(下,中,上)
1
1 -1 1 3 1
α6(下,上,中)
1
1
1 -1 1 3
二、最优纯策略
10.2 矩阵博弈的数学模型
1 最优纯策略的定义 矩阵博弈模型给定后,各参与人面临的问题便是:如 何选取对自己最为有利的纯策略以谋取最大的赢得(或最 少损失)。 例 设有一矩阵博弈 G = {S1、S2;A},
策略(如果最优纯策略存在)才是理智的行动。
二、最优纯策略
10.2 矩阵博弈的数学模型
例解
β1
β2
β3
Min aij
α1
6
α2
3
α3
9
α4
-3
Max aij
9
1
-5
-5
2
4
2*
-1
-10
-10
0
6
-3
2*
6
于是: max min aij = min max aij = a22 =2
ij
ji
由定义1, VG = 2, G的解为(α2 ,β2 ),α2 和β2分别是 参与人I 和II 的最优纯策略。
二、最优纯策略
10.2 矩阵博弈的数学模型
分析 市场竞争中的博弈问题,为此首先建立甲公司的支付矩阵。 根据问题,甲公司要建的两个娱乐场不会都建在同一区,故甲公司 的纯策略有三个:把娱乐场建在A,B区,或A,C区,或B,C区; 乙公司也有三个纯策略:把娱乐场建在A区、B区或C区。于是根据 背景条件,甲(乙)公司占有市场的份额(以百分比计)为:
A A,B 70
(30)

B
C
75
70
(25) (30)
甲 A,C 70
70
75
(30) (30) (25)
B,C 60
72
72
(40) (28) (28)
二、最优纯策略
10.2 矩阵博弈的数学模型
2)甲公司的支付矩阵 市场业务总额为100(按百分比计),本 来乙公司想与甲公司各占50个份额,但乙公司因财力有限不能与甲公 司分享市场份额。当甲公司使用A,B纯策略,而乙公司采用纯策略A 时,甲公司多赢20个份额(70与50的差),这个20是这一局势下甲公 司的赢得值,而此时,甲公司多得的份额恰好是乙公司失去的份额 (50与30的差),于是我们可写出甲公司的赢得矩阵如下(把上面矩 阵每个元素的数值减去20):
二人博弈
有限博弈
多人博弈
博弈
不结盟博弈
无限博弈
二人博弈 多人博弈
动态博弈
微分博弈
零和博弈
非零和博弈 零和博弈 非零和博弈 零和博弈 非零和博弈 零和博弈 非零和博弈
三、博弈的分类
完全理性 博弈
非合作博弈
博弈
有限理性 博弈
合作博弈
动态博弈
静态博弈
静态博弈
完全信息 静态博弈
不完全信息 静态博弈
动态博弈
(α*i ,β*j ) 使得对一切 i=1,2,…,m; j =1,2,…n, 均有
aij* ≤ ai*j* ≤ ai*j
二、最优纯策略
10.2 矩阵博弈的数学模型
二元函数鞍点的概念: 定义2 设f(x,y)为一个定义在 x∈A 及y∈B 上的实 值函数,如果存在x*∈A ,y*∈B,使得对一切x∈A 及 y∈B,有
完全信息 动态博弈
不完全信息 动态博弈
一、矩阵博弈模型描述 10.2 矩阵博弈的数学模型
矩阵博弈: 二人有限零和博弈。 一般,用I、II分别表示两个参与人, 设参与人 I 有 m个纯策略 α1,α2 ,…,αm可供选择,
参与人II 有n 个纯策略 β1, β2, …, βn 可供选择, 则参与人I、II 的策略集分别为:
S1 = {α1,α2 , α3, α4}, S2 = {β1, β2, β3 },
-6 1 -5 3 24 A= 9 -1 -10 -3 0 6
二、最优纯策略
10.2 矩阵博弈的数学模型
对于一般矩阵博弈,有如下定义:
设G = {S1、S2;A}为矩阵博弈,其中 S1 = {α1,α2 , …, αm}, S2 = {β1,β2, …, βn}, A = (aij)m×n, 若等式
最优纯策略的进一步解释
关于定理1的直观解释是:如果ai*j*既是矩阵A中第i*行 的最小值,又是A中j*列的最大值,则ai*j*即为博弈的值, 且(αi*,βj* )就是博弈的解。其博弈意义是:一个平衡局势 (αi*,βj* )应具有这样的性质,当参与人I 选取了纯策略αi* 后,参与人II 为了使其所失最少,只有选择纯策略βj*,否 则就可能失去的更多;反之,当参与人II 选取了纯策略βj* 后,参与人I 为了得到最大的赢得,也只能选择纯策略αi*, 否则就会赢得更少。双方的竞争局势在(αi*,βj* )下达到了 一个平衡状态。
矩阵博弈的值是唯一的。
二、最优纯策略
10.2 矩阵博弈的数学模型
例 某城市有A,B,C三个区,城市居民40%住在A区, 30%住在B区,30%住在C区,目前该城没有娱乐场。有两 个公司认为在该城修建娱乐场有利可图,甲公司要建两个 同样的娱乐场,乙公司原本也打算建两个与甲公司同样的 娱乐场与甲公司平分业务,但由于筹款不足,只能建一个。 由于每个娱乐场的规模档次差不多,故有如下情况:1)若 在某区建两个娱乐场,则该区业务将被平分;2)若在某区 只有一个娱乐场,则该区业务将被其独揽;3)若某区无娱 乐场,则该区业务将被其它区三个娱乐场所平分。问甲、 乙两公司应如何选择建设方案?
当局势出现后,博弈的结果也就确定了。也就是说,
对任一局势S,参与人i 可以得到一个赢得Hi(S)。显然, Hi(S)是局势S 的函数,称之为第i 个参与人的赢得函数 (或称支付函数)。
相关文档
最新文档