《博弈论与公共政策》第1讲 完全信息静态博弈B
1 完全信息静态博弈

(Game Theory and Information Economics)
第2章:完全信息静态博弈
Chapter 2: Static Game of Complete Information
完全信息静态博弈
静态博弈(同时行动博弈)
所有参与人同时选择行动,而且只选择一次 如,罚点球时,守门员和对方射手必须同时决策 “同时”是一个信息概念,而不一定与日历上的时间一致 在博弈中,如果参与者在不知道对手如何选择的情况下行 动,该博弈就是静态的。
1 囚徒困境与占优战略均衡
现实生活中其他囚徒困境的例子
曾经威胁世界整个甚至人类的军备竞赛
公共资源过度开采/公共品供给短缺
大学扩招、研究生扩招、大学贷款基建 年年都有的评优评先活动 各种资格考试广泛盛行 备受批评却日益严重的应试教育
1 囚徒困境与占优战略均衡
如何走出囚徒困境?
基于收益矩阵的模型描述: 参与人
囚徒 B 坦白 抵赖囚徒B可 选策略囚徒 A坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒 A 的支付
囚徒 B 的支付
1 囚徒困境与占优战略均衡
博弈中参与人只拥有有限个离散型的纯战略供其选择。 如篮球比赛中的运球、过人和投篮 离散型策略 另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数。如厂商定价 连续策略
离散型策略静态博弈通常用支付表来表示 ——博弈的战略式表述
1 囚徒困境与占优战略均衡
从一方的角度看,选择“坦白”比选择“抵赖”好,无论他 关 于对方的选择持有何等信念。 我们就说,对于囚徒而言,“坦白”的策略是一个占优策略, 以不变应万变 或者说“抵赖”的策略是一个劣策略。
博弈论课件 完全信息静态博弈

2.2.2 纳什均衡的一致预测性质
一致预测: 一致预测:如果所有博弈方都预测一个特 定博弈结果会出现, 定博弈结果会出现,所有博弈方都不会利 用该预测或者这种预测能力, 用该预测或者这种预测能力,选择与预测 结果不一致的策略, 结果不一致的策略,即没有哪个博弈方有 偏离这个预测结果的愿望, 偏离这个预测结果的愿望,因此预测结果 会成为博弈的最终结果。 会成为博弈的最终结果。
2.2.1 纳什均衡的定义
纳什均衡: 纳什均衡:在博弈 G={S1,S2,…,Sn;u1,u2,…,un} 中,如果由各 个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中,任 中 一博弈方 i的策略 i*,都是对其余博弈方策略的组合 (s1*,…, si的策略s 的策略
1 *,
si+1* ,…,sn*) 的最佳对策,也即 的最佳对策,
* * ui ( si* , ⋯ si*−1 , si* , si*+1 ,...sn ) ≥ ui ( si* , ⋯ si*−1 , sij , si*+1 ,...sn )
对任意s 都成立, 对任意 ij∈Si 都成立,则称 (s1*,…,sn*) 为 G 的一个纳什均衡
根据上述纳什均衡的定义,可以判断, 根据上述纳什均衡的定义,可以判断,前 面所述各博弈方都不愿单独改变策略的策 略组合。 略组合。
左 上 下 1,0 , 0,4 , 中 1,3 , 0,2 , 右 0,1 , 2,0 , 左 1,0 , 0,4 , 中 1,3 , 0,2 , 左 1,0 , 中 1,3 ,
一完全静态博弈 ppt课件

2020/12/27
33
公共牧场的比喻
• 哈丁所讲的公共牧场则是研究具有同一行为动机结构 的一种特殊的多人情况。
• 那些在会议上高谈阔论却又言之无物的人们,可能看 上去就像牧场上的牛一样,他们一边吃一边践踏,而 另一头牛正在眼巴巴地看着草。
• 现在这个词已经被广泛地应用于研究在公共水域倾倒 污水的行为,在公共石油层开采石油行为,在公海猎 捕鲸鱼的行为,甚至于将地球和地球上的资源比喻成 一个公共养殖场,人类在其中过度繁衍后代。还有中 国的小煤窑的开发以及高校科研经费的申请等。
31
解释
• 寡头竞争的总产量大于垄断产量的原因 在于每个企业在选择自己的最优产量时, 只考虑对本企业利润的影响,而忽视对 另一个企业的外部负效应。这是典型的 囚徒困境问题。
• 这个模型使用重复剔除严格劣战略的方 法找出均衡解。
2020/12/27
32
(2)公共地的悲剧
• 公共地的悲剧(tragedy of the commons)是制度经济 学家非常熟悉的例子。
需求函数取如下线性形式
paq1q2
那么,最优化的一阶条件分别是:
1
q1
a q1 q2 q1
c 0
2020/12/27
2
q2
a q1 q2 q2 c 0
29
反应函数为
q1
R1q2
1 2
a
q2
c
q2
R2 q1
1 2
a
q1
c
解两个反应函数,我们得纳什均衡为
q1
q2
1ac
3
每个企业的纳什利润分别是
2020/12/27
12
关于行动顺序
• 同样的参与人,同样的行动集合,行动 顺序不同,每个参与人的最优选择就不 同,博弈的结果就不同。
完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。
博弈论_完全信息静态博弈

——
本章主要介绍博弈的策略式表述
博弈的策略式表述
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
参与人集合
– N人博弈的参与人集合,往往也记为N。参与人 则记为i, i∈ N – 参与人i的策略集,记为Si ,其中的一个特定策 略,可记为si.有si ∈ Si.
——
v(a)=0, v(b)=100, v ©=101
In a word, any other function w for which w(a) < w(b) < w(c)
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
——
博弈的策略式表述
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
– Si中的元素 si 表示参与人i的一个具体策略
– 一旦确定了所有参与人的策略,便形成了一个 博弈局势,表示为s=(s1, s2, … sN),s∈S。
——
博弈的策略式表述
博 弈 论 • 参与人i的支付函数 讲 – 参与人 i的支付函数,是从博弈局势集 义 S=S1×S2 …× SN 到实数集R的一个映射,记为 ui(s1, s2, … s N),表示参与人i对局势s = (s1, s2, … sn) 完 的偏好。 全 信 • 一个博弈可以表示为 息 G = {S1, … ,SN; u1, … ,uN, i ∈N} 静 态 • 这就是博弈的策略式表述 博 弈
偏好关系 (preference relation)
– 假定
• 决策者可以比较对任意一对行动的偏好(优于、等 价、劣于)。称满足上述条件的行动集的偏好关系 为完全的(complete) • 对于决策者来说,若行动a优于行动b,则可记为
博弈论与信息经济学-1完全信息静态博弈

重复上述过程,直到只剩下唯一的策略组 合。
4. 策略(strategies ):又称策略,是参与人在给 定信息集的情况下的行动规则,它规定参与人在 什么时候的什么情况下采取什么行动。因而一个 策略是参与人的一个“相机行动方案”(contingent action plan)。
记参与人i的一个策略为si,参与人i在一个博弈中 的全部可供选择的策略记为Si(策略集strategy set ),即si ∈ Si , Si ={s1 ,s2 ,… si ,…, sn},表示参与 人i 在该博弈中共有n个可行的策略。
ui(s1, s2,… ,si,…,sn-1,sn).
注意
1. 博弈的一个基本特征是一个参与 人的支付不仅取决于自己的策略选择, 而且取决于所有其他参与人的策略选择 ;是策略组合的函数。
2. 支付是参与人真正关心的东西, 参与人在博弈中的目标就是选择自己的 策略以最大化自己的支付函数。
6. 均衡(equilibrium) 均衡是所有参与人的最优策略组合。 一般记为s*=( s1*,s2*,…,si*,…, sn*)
行动的顺序(the order of play)
博弈中参与人实施决策活动的顺序。同 时或有先有后。其他因素不变,但顺序 不同,参与人的最优选择就不同,博弈 的结果也不同。事实上,不同的顺序安 排意味着不同的博弈。静态博弈和动态 博弈。
3. 信息(information)
参与人有关该博弈的知识,如关于N的选 择、其他参与人的策略集、支付函数、行 动时间等。
概念 1967—1968年海萨尼(Harsanyi)提出了贝叶斯纳什均
衡的概念
博弈论概述:发展历程
1975—1991年泽尔腾(1975)、Kreps和Wilson( 1982)、Fudenberg和Tirole(1991)提出了精炼贝 叶斯纳什均衡的概念. 1994年纳什、海萨尼和泽尔腾 获诺贝尔经济学奖。
博弈论完全信息静态博弈

我们用ui(a)表示在行动组合a=(a1,a2,…,an)下 参与人i的支付(或效用水平), u(a)=(u1(a),… ,un(a))表示n个参与人的支付 组合。
博弈的一个基本特征是一个参与人的支付 不仅取决于他自己的行动选择,而且也取 决于其他所有参与人的行动选择。
13
2.2 纳什均衡
2.2.1 占优战略(上策)均衡
对某个参与人来说,
若存在一个行动严格优于其他行动,即选择这个行 动所得到的好处大于选择其他行动所带来的好处, 并且他的这个选择不依赖于其他参与人的行动选 择,也就是说,不论其他参与人选择什么行动,
他的最优行动都是这个行动,则这个行动被称 为“ 占优战略”(上策)(dominant strategy)。
8
(3) 对每一个参与人i都有一个 建立在集合 上的偏 好关系 (参与人 i的偏好关 系)。
9
定义:集合X上的偏好表示X上的一种二元 关系,是对集合X上的所有元素的一个全 排序。它满足以下三个性质: 对任意 ,有 1) 完备性: 2) 传递性:若 那么 ; 3) 自反性: 或 且 ; ,
。
10
被定义为: a b当且仅当ui(a)
1,2 0,1
L 参与A U
1,0
M
1,2
26
例
C1 R1 R2 R3 2,12 0,12 0,12 C2 1,10 0,10 0,10 C3 1,12 0,11 0,13
C2 R2 C1 R3--Æ(R1,C3) R3 C3 C2 R2Æ(R1,C1)
27
2.2.3 纯战略纳什均衡
使用重复剔除法剔除到最后剩下的行 动组合不一定唯一,我们就需要考虑比 重复剔除占优战略纳什均衡更弱的纳什 均衡。 如:市场进入博弈
博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。
完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。
⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。
最典型的例⼦是囚徒困境与智猪博弈。
下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。
⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。
离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。
对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。
【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。
所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。
但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。
个⼈的最优选择从社会⾓度看并不是最优的。
社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。
【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。
【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。
【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、博弈的标准式表述
• 博弈的标准式表述包括三个方面的内容:
• (1)博弈的参与者
• (2)每个参与者可供选择的策略集
• (3)针对所有参与者可能选择的策略组合, 每个参与者获得的收益(即收益函数)
• 对于一个 n 人博弈,设各参与者的策略集 依次为 S1,S2, …,Sn ,收益函数分别为u1,u2, …,un ,其中 ui (s1,s2, …,sn) 为各参与者选择 策略组合 (s1,s2, …,sn) 时参与者 i 的收益, 则可用标准式将该博弈表示如下:
例7
乙
乙
左右
左右
上 -1,3 2,1
上 1,3 4,1
甲 下 0,2 3,4 甲 下 0,2 3,4
• 2、理性共识
• 重复剔除的占优均衡不仅要求每个参与者 是理性的,而且要求“理性”是参与者的 共同知识,即参与者具有“理性共识” (Common Knowledge of Rationality,简记 为CKR)。
• 比赛一开始,由于“澳大利亚二号”抢在发令枪 之前起步,不得不退回到起点线后再次起步,这 使“自由号”获得了37秒的优势。澳大利亚队的 船长John Bertrand 打算转到赛道左边,满心希望 风向发生变化,可以帮助他们赶上去,Conner则 决定将“自由号”留在赛道右边。这一回, Bertrand押宝对了,因为风向果然按照他的心愿偏 转了5度,澳大利亚人以1分47秒的巨大优势赢得 了这轮比赛。
例3:帆船比赛
• 1983年美洲杯帆船决赛前4轮结束后,Dennis Conner率领的“自由号”在这项共有7轮的重要赛 事中暂时以3胜1负的成绩排在首位。
• 那天早上,第5轮比赛即将开始,整箱整箱的香槟 送到“自由号”的甲板上,而在他们的观礼船上, 船员们的妻子全都穿着红白蓝相间的 背心和短裤, 迫不及待地要在她们的丈夫夺取美国人失落132年 之久的奖杯后参加合影。
博弈论与公共政策
刘霖 北京大学政府管理学院
第一讲 完全信息静态博弈
主要内容
• 一、博弈的标准式表述 • 二、占优策略均衡 • 三、重复剔除的占优均衡 • 四、纳什均衡 • 五、多重纳什均衡的比较 • 六、混合策略 • 七、扩展及应用
• 何谓静态博弈? • 每个参与者只行动一次,且同时行动。
• 何谓完全信息博弈?
• 新华社济南2008年1月17日电 山东省教育厅副厅 长张志勇在17日召开的全省中小学素质教育工作 会议上说,要坚决制止中小学校假期加班补课行 为,把时间还给孩子。今年寒假,小学、初中和 高一高二年级正月十五之前一律不准上课,高三 年级正月初十之前不准上课。
三、重复剔除的占优均衡
• 1、重复剔除的占优均衡
• 理性共识可划分为不同的层次:
• 零阶理性共识:每个人都是理性的,但不 知道其他人是否理性。
• 一阶理性共识:每个人是理性的,并且知 道其他人也都是理性的,但不知道其他人 是否知道自己是理性的。
• 二阶理性共识:每个人是理性的,也知道 其他人都是理性的,而且知道其他人知道 自己是理性的,但不知道其他人是否知道 自己知道他们是理性的。
C:不提供 B
提供 不提供
提 供 150,150,150
50,200,50
提 供 50,50,200
-50,100,100
A不 提 供
200,50,50
A不
100,100,-50
提 100,-50,100
供
0,0,0
例5:中小学补课博弈
• 新华社北京2008年1月16日电 1月26日,北京市 中小学将正式放寒假。北京市教委16日发出通知, 首次强调严禁中学办选拔性培训班,同时严禁中 小学补课,并要求各区县公布补课举报电话。
• 再赛两轮之后, “澳大利亚二号”赢得了决赛桂 冠。“自由号”船员们的妻子伤心不已。
例4:公共产品的提供问题
• 某小区住有A、B、C三户,每户可以自主决定是 否为大家提供一件公共产品,假设每件公共产品 给每户带来的效用是100元,而其成本为150元。
• 各户会如何决策?
C:提供 B
提供 不提供
• 首先从某一参与者的策略集里剔除掉一个 劣策略,再重新考察各个参与者剩下的策 略中哪些是劣策略并剔除其中之一,不断 重复这一过程直到每个参与者都仅剩一个 策略为止,最后得到的策略组合就称为重 复剔除的占优均衡。
例6:俾斯麦海之战
肯尼
北线 南线
木村
北线
南线
2,-2
2,-2
1,-1
3,-3
• 在单人决策中,当所有情况下的收益都增 加(至少不减少)时,当事者的境况不会 变得更坏,但在博弈中则未必。比较下面 的两个博弈:
• 在前面的囚徒困境博弈中,“招认”就是 每个囚徒的占优策略。
• 2、占优策略均衡
• 如果每个参与者都存在占优策略,那么由 这些占优策略构成的组合就称为占优策略 均衡。
• 在前面的囚徒困境中,(招认,招认)就 构成一个占优策略均衡。
• 注意:
• 占优策略均衡只要求每个参与者是理性的, 而并不要求每个参与者知道其他参与者是 理性的,也就是说,不要求“理性”是共 同知识。
G = {S1,S2, …,Sn ; u1,u2, …,un }
• 在双人有限策略的情况下,可以用双变量 矩阵更直观地表述博弈。
囚徒1
例1:囚徒困境
抵赖 招认
囚徒2
抵赖
招认
-1,-1
-9,0
0,-9
-6,-6
• 但是,如果参与者超过2人,则用双变量矩 阵形式来表示博弈就不方便了,甚至根本 无法采用这种形式。
例2:三人有限策略博弈
丙:策略A
乙
左
右
丙:策略B
乙
左
右
上 0,0,10 -5,-5,0
上 -2,-2,0 -5,-5,0
பைடு நூலகம்
甲
甲
下 -5,-5,0 1,1,-5
下 -5,-5,0 -1,-1,5
二、占优策略均衡
• 1、占优策略
• 在博弈中,如果不管其他参与者选择什么 策略,某个参与者的特定策略都优于或至 少不劣于其它任何策略,那么,我们就说 这个特定策略是该参与者的占优策略。
• 依此类推。
例8
左
上
1,0
甲
下
0,3
乙 中 1,2 0,1
右 0,1 2,0
• 选择越多(行动空间越大),对理性共识 的要求越高。
• 请看下例:
例9
乙
C1
C2
C3
C4
R1 5,10 0,11 1,20 10,10