博弈论初步课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3
4、信息指的是参与人在博弈中所知道的关于 自己以及其他参与人的行动、策略及其得益函数 等知识; 5、得益是参与人在博弈结束后从博弈中获得 的效用,一般是所有参与人的策略或行动的函数, 这是每个参与人最关心的东西; 6、均衡是所有参与人的最优策略或行动的组 合;均衡结果是指博弈结束后博弈分析者感兴趣 的一些要素的集合,如在各参与人的均衡策略作 用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博 弈规则,博弈分析的目的就是使用博弈规则来决 定均衡。
16
2.交通博奕 斗鸡博弈 恋爱博弈
他
开 等 -10 1 1 -1 0 -1wk.baidu.com
你
开
-10 0
等
17
3、田忌赛马
田 忌
上 中 下
齐 威 王 上中下 上下中 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
上 下 中
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
14
几个博弈案例
1.智猪博弈(占优战略均衡) 2.交通博弈;斗鸡博弈,告白博弈 3. 田忌赛马 4.猜硬币博弈 石头剪刀布博弈
15
1.智猪博弈(占优战略均衡) 假设猪圈里有一头大猪、一头小猪。猪圈的一头 有猪食槽,另一头安装着控制猪食供应的按钮, 按一下按钮会有10个单位的猪食进槽,但是谁 按按钮就会首先付出2个单位的成本,若大猪 先到槽边,大小猪吃到食物的收益比是9∶1; 同时到槽边,收益比是7∶3;小猪先到槽边, 收益比是6∶4。那么,在两头猪都有智慧的前 提下,最终结果是小猪选择等待。
5
从行动的先后次序来分,博弈可以分为静态博 弈和动态博弈。 静态博弈指在博弈中,参与人同时选择行动, 或虽非同时但后行动者并不知道前行动者采取 了什么具体行动; 动态博弈指的是参与人的行动有先后顺序,且 后行动者能够观察到先行动者所选择的行动的 博弈。
6
从参与人对其他参与人的各种特征信息 的获得差异来分,博弈可分为完全信息博 弈和不完全信息博弈。 完全信息指的是每一个参与人对所有 其他参与人的特征,如策略集合及得益函 数都有准确完备的知识;否则就是不完全 信息。 四种不同类型的博弈:完全信息静态博弈, 完全信息动态博弈,不完全信息静态博弈 和不完全信息动态博弈。
7
博弈的分类和均衡
行动次序
信息
静态
动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均衡 泽尔腾等
8
完全信息
纳什均衡 纳什 贝叶斯均衡 海萨尼
不完全信息
著名的“囚徒困境”的例 子
警察抓住了两个罪犯,但是警察局却缺乏足 够的证据指证他们所犯的罪行。如果罪犯中至少 有一人供认犯罪,就能确认罪名成立。为了得到 所需的口供,警察将这两名罪犯分别关押防止他 们串供或结成攻守同盟,并分别跟他们讲清了他 们的处境和面临的选择:如果他们两人都拒不认 罪,则他们会被以较轻的妨碍公务罪各判一年徒 刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;如果两人都坦白 认罪,则他们将被各判5年监禁。问:两个罪犯 会如何选择(即是坦白还是抵赖)?
12
(2)囚犯困境模型的扩展应用:寡头厂商合作的不稳定性
卡特尔
寡头B
违约 守约 1296 1152 864 1152
寡头A
违约
1024 864
1024 1296
守约
13
2.纳什均衡
指一组给定对手行为前提下对各 博弈方存在的最佳选择;在纳什 均衡状态下,只要其它参与者不 变换策略选择,任何单个参与者 不可能单方面通过变换策略来提 高他的所获支付。
11
在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。 这给我们一个启示,我们学习博弈论,也许更应该研究 的是怎样设计一种制度,在满足个人理 性的同时,去争取达到“集体理性”。
9
囚徒B 坦白 囚徒A 不坦白
坦白 不坦白
-5,-5
0,-10
-10,0
-1,-1
10
(四)纳什均衡
1、占优策略均衡。一般来说,由于每个参 与人的得益是博弈中所有参与人的策略的函数, 因此每个参与人的最优策略选择依赖于所有其他 参与人的策略选择。但在一些特殊的博弈中,一 个参与人的最优策略可能可以不依赖于其他参与 人的策略选择,就是说,不论其他参与人选择什 么策略,他的最优策略是唯一的,这样的最优策 略被称为“占优策略”。 如果一个博弈中,某个参与人有占优策略, 那么该参与人的其他可选择策略就被称为“劣策 略”。
1994年诺贝尔经济学奖授予了三位博 弈论专家纳什、泽尔腾和海萨尼。 1996年诺奖授予两位博弈论与信息经济学 研究专家莫里斯、维克瑞; 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂 格利茨,表彰他们在柠檬市场、信号传 递和信号甄别等非对称信息理论研究中 的开创性贡献。 2005年诺奖授予有以色列和美国双重国 籍的罗伯特· 奥曼和美国人托马斯· 谢林, 以表彰他们在博弈论领域作出的贡献。
中 上 下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上 1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
得益矩阵
取胜关键:不让对方猜到自己策略,尽可能猜出对方策略
18
4猜硬币博弈
猜硬币方 正 面
盖 硬 币 方
反 面
1, -1 -1, 1
正 面
反 面
-1, 1 1, -1
19
4、石头、剪子、布
博弈方2
石 头
博 弈 方 1 石 头 剪 子 布 0, 0 -1, 1 1, -1
剪 子
1, -1 0, 0 -1, 1
布
-1, 1 1, -1 0, 0
20
1
博弈论的基本概念
(一)博弈论的定义
博弈论,英文为Game theory,是研究相 互依赖、相互影响的决策主体的理性决策行为 以及这些决策的均衡结果的理论。 一些相互依赖、相互影响的决策行为及其结果 的组合称为博弈(Game)。
2
(二)博弈的组成要素
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、均衡等。 1、参与人指的是博弈中选择行动以自己效用 最大化的决策主体(可以是个人,也可以是团体); 2、行动是指参与人在博弈进程中轮到自己选 择时所作的某个具体决策; 3、策略是指参与人选择行动的规则,即在博 弈进程中,什么情况下选择什么行动的预先安排;
4
(三)博弈的分类
根据参与人的多少,可将博弈分为单人博弈、 两人博弈或多人博弈; 走迷宫、选择运输线/囚徒困境、猜硬币、齐 威王田忌赛马/申办奥运会 根据参与人是否合作,可将博弈分为合作博 弈或非合作博弈;古诺/价格领导 根据博弈结果的不同,又可分为零和博弈、 常和博弈与变和博弈。 —猜硬币,田忌赛马,石头-剪刀-布 —分配固定数额的奖金、利润,遗产官司 —囚徒困境、产量博弈