《博弈论与公共政策》第1讲 完全信息静态博弈B

合集下载

1 完全信息静态博弈

1  完全信息静态博弈
博弈论与信息经济学
(Game Theory and Information Economics)
第2章:完全信息静态博弈
Chapter 2: Static Game of Complete Information
完全信息静态博弈

静态博弈(同时行动博弈)
所有参与人同时选择行动,而且只选择一次 如,罚点球时,守门员和对方射手必须同时决策 “同时”是一个信息概念,而不一定与日历上的时间一致 在博弈中,如果参与者在不知道对手如何选择的情况下行 动,该博弈就是静态的。
1 囚徒困境与占优战略均衡


现实生活中其他囚徒困境的例子
曾经威胁世界整个甚至人类的军备竞赛


公共资源过度开采/公共品供给短缺
大学扩招、研究生扩招、大学贷款基建 年年都有的评优评先活动 各种资格考试广泛盛行 备受批评却日益严重的应试教育
1 囚徒困境与占优战略均衡

如何走出囚徒困境?

基于收益矩阵的模型描述: 参与人
囚徒 B 坦白 抵赖囚徒B可 选策略囚徒 A坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒 A 的支付
囚徒 B 的支付
1 囚徒困境与占优战略均衡

博弈中参与人只拥有有限个离散型的纯战略供其选择。 如篮球比赛中的运球、过人和投篮 离散型策略 另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数。如厂商定价 连续策略

离散型策略静态博弈通常用支付表来表示 ——博弈的战略式表述
1 囚徒困境与占优战略均衡

从一方的角度看,选择“坦白”比选择“抵赖”好,无论他 关 于对方的选择持有何等信念。 我们就说,对于囚徒而言,“坦白”的策略是一个占优策略, 以不变应万变 或者说“抵赖”的策略是一个劣策略。

博弈论课件 完全信息静态博弈

博弈论课件 完全信息静态博弈
囚徒困境中的(坦白,坦白) 囚徒困境中的(坦白,坦白) 夫妻之争中的(时装,时装) 足球, 夫妻之争中的(时装,时装)和(足球,足球 ) 猜硬币博弈不存在纳什均衡
2.2.2 纳什均衡的一致预测性质
一致预测: 一致预测:如果所有博弈方都预测一个特 定博弈结果会出现, 定博弈结果会出现,所有博弈方都不会利 用该预测或者这种预测能力, 用该预测或者这种预测能力,选择与预测 结果不一致的策略, 结果不一致的策略,即没有哪个博弈方有 偏离这个预测结果的愿望, 偏离这个预测结果的愿望,因此预测结果 会成为博弈的最终结果。 会成为博弈的最终结果。
2.2.1 纳什均衡的定义
纳什均衡: 纳什均衡:在博弈 G={S1,S2,…,Sn;u1,u2,…,un} 中,如果由各 个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中,任 中 一博弈方 i的策略 i*,都是对其余博弈方策略的组合 (s1*,…, si的策略s 的策略
1 *,
si+1* ,…,sn*) 的最佳对策,也即 的最佳对策,
* * ui ( si* , ⋯ si*−1 , si* , si*+1 ,...sn ) ≥ ui ( si* , ⋯ si*−1 , sij , si*+1 ,...sn )
对任意s 都成立, 对任意 ij∈Si 都成立,则称 (s1*,…,sn*) 为 G 的一个纳什均衡
根据上述纳什均衡的定义,可以判断, 根据上述纳什均衡的定义,可以判断,前 面所述各博弈方都不愿单独改变策略的策 略组合。 略组合。
左 上 下 1,0 , 0,4 , 中 1,3 , 0,2 , 右 0,1 , 2,0 , 左 1,0 , 0,4 , 中 1,3 , 0,2 , 左 1,0 , 中 1,3 ,

一完全静态博弈 ppt课件

一完全静态博弈 ppt课件

2020/12/27
33
公共牧场的比喻
• 哈丁所讲的公共牧场则是研究具有同一行为动机结构 的一种特殊的多人情况。
• 那些在会议上高谈阔论却又言之无物的人们,可能看 上去就像牧场上的牛一样,他们一边吃一边践踏,而 另一头牛正在眼巴巴地看着草。
• 现在这个词已经被广泛地应用于研究在公共水域倾倒 污水的行为,在公共石油层开采石油行为,在公海猎 捕鲸鱼的行为,甚至于将地球和地球上的资源比喻成 一个公共养殖场,人类在其中过度繁衍后代。还有中 国的小煤窑的开发以及高校科研经费的申请等。
31
解释
• 寡头竞争的总产量大于垄断产量的原因 在于每个企业在选择自己的最优产量时, 只考虑对本企业利润的影响,而忽视对 另一个企业的外部负效应。这是典型的 囚徒困境问题。
• 这个模型使用重复剔除严格劣战略的方 法找出均衡解。
2020/12/27
32
(2)公共地的悲剧
• 公共地的悲剧(tragedy of the commons)是制度经济 学家非常熟悉的例子。
需求函数取如下线性形式
paq1q2
那么,最优化的一阶条件分别是:
1
q1
a q1 q2 q1
c 0
2020/12/27
2
q2
a q1 q2 q2 c 0
29
反应函数为
q1
R1q2
1 2
a
q2
c
q2
R2 q1
1 2
a
q1
c
解两个反应函数,我们得纳什均衡为
q1
q2
1ac
3
每个企业的纳什利润分别是
2020/12/27
12
关于行动顺序
• 同样的参与人,同样的行动集合,行动 顺序不同,每个参与人的最优选择就不 同,博弈的结果就不同。

完全信息静态博弈教学课件

完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。

博弈论_完全信息静态博弈

博弈论_完全信息静态博弈
– 策略式表述 (Strategic form), and – Extensive form
——
本章主要介绍博弈的策略式表述
博弈的策略式表述
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
参与人集合
– N人博弈的参与人集合,往往也记为N。参与人 则记为i, i∈ N – 参与人i的策略集,记为Si ,其中的一个特定策 略,可记为si.有si ∈ Si.
——
v(a)=0, v(b)=100, v ©=101
In a word, any other function w for which w(a) < w(b) < w(c)
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
——
博弈的策略式表述
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
– Si中的元素 si 表示参与人i的一个具体策略
– 一旦确定了所有参与人的策略,便形成了一个 博弈局势,表示为s=(s1, s2, … sN),s∈S。
——
博弈的策略式表述
博 弈 论 • 参与人i的支付函数 讲 – 参与人 i的支付函数,是从博弈局势集 义 S=S1×S2 …× SN 到实数集R的一个映射,记为 ui(s1, s2, … s N),表示参与人i对局势s = (s1, s2, … sn) 完 的偏好。 全 信 • 一个博弈可以表示为 息 G = {S1, … ,SN; u1, … ,uN, i ∈N} 静 态 • 这就是博弈的策略式表述 博 弈
偏好关系 (preference relation)
– 假定
• 决策者可以比较对任意一对行动的偏好(优于、等 价、劣于)。称满足上述条件的行动集的偏好关系 为完全的(complete) • 对于决策者来说,若行动a优于行动b,则可记为

博弈论与信息经济学-1完全信息静态博弈

博弈论与信息经济学-1完全信息静态博弈
其次,剔除新博弈中某个参与人的严格劣 策略;
重复上述过程,直到只剩下唯一的策略组 合。
4. 策略(strategies ):又称策略,是参与人在给 定信息集的情况下的行动规则,它规定参与人在 什么时候的什么情况下采取什么行动。因而一个 策略是参与人的一个“相机行动方案”(contingent action plan)。
记参与人i的一个策略为si,参与人i在一个博弈中 的全部可供选择的策略记为Si(策略集strategy set ),即si ∈ Si , Si ={s1 ,s2 ,… si ,…, sn},表示参与 人i 在该博弈中共有n个可行的策略。
ui(s1, s2,… ,si,…,sn-1,sn).
注意
1. 博弈的一个基本特征是一个参与 人的支付不仅取决于自己的策略选择, 而且取决于所有其他参与人的策略选择 ;是策略组合的函数。
2. 支付是参与人真正关心的东西, 参与人在博弈中的目标就是选择自己的 策略以最大化自己的支付函数。
6. 均衡(equilibrium) 均衡是所有参与人的最优策略组合。 一般记为s*=( s1*,s2*,…,si*,…, sn*)
行动的顺序(the order of play)
博弈中参与人实施决策活动的顺序。同 时或有先有后。其他因素不变,但顺序 不同,参与人的最优选择就不同,博弈 的结果也不同。事实上,不同的顺序安 排意味着不同的博弈。静态博弈和动态 博弈。
3. 信息(information)
参与人有关该博弈的知识,如关于N的选 择、其他参与人的策略集、支付函数、行 动时间等。
概念 1967—1968年海萨尼(Harsanyi)提出了贝叶斯纳什均
衡的概念
博弈论概述:发展历程
1975—1991年泽尔腾(1975)、Kreps和Wilson( 1982)、Fudenberg和Tirole(1991)提出了精炼贝 叶斯纳什均衡的概念. 1994年纳什、海萨尼和泽尔腾 获诺贝尔经济学奖。

博弈论完全信息静态博弈

博弈论完全信息静态博弈
12
我们用ui(a)表示在行动组合a=(a1,a2,…,an)下 参与人i的支付(或效用水平), u(a)=(u1(a),… ,un(a))表示n个参与人的支付 组合。
博弈的一个基本特征是一个参与人的支付 不仅取决于他自己的行动选择,而且也取 决于其他所有参与人的行动选择。
13
2.2 纳什均衡

2.2.1 占优战略(上策)均衡
对某个参与人来说,


若存在一个行动严格优于其他行动,即选择这个行 动所得到的好处大于选择其他行动所带来的好处, 并且他的这个选择不依赖于其他参与人的行动选 择,也就是说,不论其他参与人选择什么行动,

他的最优行动都是这个行动,则这个行动被称 为“ 占优战略”(上策)(dominant strategy)。
8
(3) 对每一个参与人i都有一个 建立在集合 上的偏 好关系 (参与人 i的偏好关 系)。
9
定义:集合X上的偏好表示X上的一种二元 关系,是对集合X上的所有元素的一个全 排序。它满足以下三个性质: 对任意 ,有 1) 完备性: 2) 传递性:若 那么 ; 3) 自反性: 或 且 ; ,

10
被定义为: a b当且仅当ui(a)
1,2 0,1

L 参与A U
1,0
M
1,2
26

C1 R1 R2 R3 2,12 0,12 0,12 C2 1,10 0,10 0,10 C3 1,12 0,11 0,13
C2 R2 C1 R3--Æ(R1,C3) R3 C3 C2 R2Æ(R1,C1)
27
2.2.3 纯战略纳什均衡

使用重复剔除法剔除到最后剩下的行 动组合不一定唯一,我们就需要考虑比 重复剔除占优战略纳什均衡更弱的纳什 均衡。 如:市场进入博弈

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。

完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。

⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。

在完全信息静态博弈中的均衡是纳什均衡。

最典型的例⼦是囚徒困境与智猪博弈。

下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。

【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。

⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。

离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。

对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。

【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。

所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。

但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。

个⼈的最优选择从社会⾓度看并不是最优的。

社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。

【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。

【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。

【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。

经济博弈论之完全信息静态博弈培训讲义(PPT 57页)

经济博弈论之完全信息静态博弈培训讲义(PPT 57页)

2.2.3 纳什均衡与严格下策反复消去法
❖ 上策均衡肯定是纳什均衡,但纳什均衡不一定是上 策均衡
❖ 命题2.1:在n个博弈方的博弈G={S1, …,Sn,u1, …,un}中,如果严格下策反复消去法排除了除 (s1*,…,sn*) 之外的所有策略组合,那么 (s1*, …,sn*) 一定是该博弈的唯一的纳什均衡.
“斗鸡博弈”
❖ 两个所谓的勇士举着长枪,准备从独木桥的两端上桥中央进
行决斗。每位勇士都有两种选择:冲上去(用U表示)或退下
来(用D)表示。若两人都冲上去,则两败俱伤;若一方上去
而另一方退下来,冲上去者获得胜利,退下来的丢了面子;
若两人都退下来,两人都丢面子。 两个Nash(U,D)和(D,U)
参与人2
解方程得:策略组合(2,2)是本博弈唯一的纳什均衡。
最终市场总产量为:2+2=4
市场价格为:8-4=4
反应函数即一博弈方对另
双方各自得利润为:2×(8-4)-2×2=4 一博弈方每种可能的决策
两厂商的利润总和为4+4=8
内容的最佳反应决策构成
的函数。
q2 6
R1(q2)
3 NE
2 1.5
1.5
3 2
❖ 命题2.2:在n个博弈方的博弈中 G={S1,…Sn;u1, …,un)}中,如果 (s1*, …,sn*) 是G 的一个纳 什均衡,那么严格下策反复消去法一定不会将它消 去.
举例
❖ 有两个候选人,在10个立场中进行选择,选 民立场均匀分布,每个立场都得到10%的选 票,选民会投给离自己最近的候选人,出现 平局票数平分。
从两厂商总体利益最大化的角度作一次产量选择。首先根据 市场条件求总体利益最大化的产量。设总产量为Q,则总得 益为 U=P(Q)-cQ=Q(8-Q)-2Q=6Q-Q2 使总得益最大的总产量Q=3 总得益u=9

北大课件:《博弈论与公共政策》之完全信息静态博弈

北大课件:《博弈论与公共政策》之完全信息静态博弈
2 纳什均衡的求解方法
介绍求解纳什均衡的方法,例如迭代删除支配策略和解析求解。
3 纳什均衡的应用案例
通过真实案例,展示纳什均衡在经济学、政治学和战略分析中的应用。
章节四:完全信息静态博弈的案例分 析
投票策略博弈
垄断博弈
使用具体的案例,阐述投票 策略博弈中候选人和选民的 策略选择和采用的分析方法。
以垄断市场为例,探讨垄断 博弈中的价格策略、市场竞 争和反垄断政策。
拍卖博弈
介绍拍卖博弈的基本概念和 常见拍卖模型,讨论竞买者 和拍卖者的策略选择。
章节五:博弈论与公共论在公共政策制定中的重要性,以及如何利用博弈论的工具和分析方法 来制定更有效的政策。
2
博弈论的局限性和未来发展趋势
探讨博弈论的局限性,例如信息不完全和不确定性,并展望未来博弈论在全球化 和技术进步中的应用。
北大精品课件:《博弈论 与公共政策》之完全信息 静态博弈
本精品课件将带你深入探索博弈论与公共政策的关系,学习完全信息静态博 弈的基本概念、模型和纳什均衡的求解方法。
章节一:博弈论基础知识回顾
1 博弈理论的基本概念
介绍博弈论的起源、定义和基本概念,例如博弈、玩家、策略等。
2 Nash均衡的定义和特点
解释Nash均衡的概念、定义和特点,以及为什么Nash均衡是博弈论重要的解决概念。
3 博弈论的应用场景
展示博弈论在经济学、政治学和生物学等领域的应用场景,增加理论的实用性。
章节二:完全信息静态博弈的概念与 模型
1
完全信息与不完全信息的区别
解释完全信息和不完全信息静态博弈的区别,包括信息的对称性和对策的制定。
2
静态博弈的基本概念和模型
介绍静态博弈的基本概念和模型,包括玩家、策略、支付矩阵和纳什均衡的定义。

1 完全信息静态博弈

1 完全信息静态博弈

1 完全信息静态博弈1.0 博弈论(对策论)的概念和分类1.0.1博弈论(对策论):研究在利益相互影响的态势下,理性的参与人为实现自己的利益最大化,如何选择各自的策略,以及这种策略的均衡问题。

或,当某个参与人的选择受其他参与人选择的影响,而且反过来又影响到其他参与人选择时的决策问题和相应的均衡问题。

博弈论与最优化理论1.0.2博弈的类型(1)参与者行动的时间与顺序同时行动——静态博弈;先后行动——动态博弈。

(2)参与者的信息多少知道对手的特征、策略空间、支付函数等——完全信息博弈;不知道对手的特征、策略空间、支付函数等——不完全信息博弈。

将上述两个角度的划分结合起来,我们就得到四种不同类型的博弈,这就是:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。

(3)参与人之间是否存在具有约束力的协议有——合作博弈无——非合作博弈(4)参与人各方的得益总和是常数还是变数。

常数——常和博弈变数——变和博弈1.1 基本理论: 博弈的标准式和纳什均衡1.1.1博弈模型的基本构成(1) 参与人( player):博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)n 个参与人:1, 2, …, i, …, n .自然(N)是虚拟的参与人,决定随机变量的概率分布(2) 战略(strategy):参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排完全信息静态博弈中,一个参与人的战略是他采取的一个行动(action)参与人i 的战略:s i.参与人i 的战略空间: S i.战略的一个组合: s ={s1,s2, …, s n}.简化表示:s- i={ s1,…, s i -1,s i+1, …, s n }.(3) 收益(payoff):参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数参与人i 的收益:u i= u i(s1,s2, …, s n)(4)信息(information):指参与人在博弈中拥有的相关知识,特别是有关其他参与人的策略和收益的知识完全信息(complete information):每个参与人知道其他人的特征、战略空间和收益共同知识(common knowledge)指“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道…”。

完全信息静态博弈

完全信息静态博弈

B 开发,开发 开发,不开发 不开发,开发 不开发,不开发
A
开发
-3, -3
-3, -3
1, -5
1, -5
不开发
0, 1
0, -5
0, 1
0, -5
二、重复博弈
参与人在前一个阶段的选择将决定随后的子博弈的结构。这样的动态博弈称为序贯博弈(sequential games)。动态博弈中另外一类是所谓的重复博弈(repeated games)。顾名思义,重复博弈是指同样结构的博弈重复许多次,其中的每次博弈称为阶段博弈(stage game)。
*
假定寡头1先于寡头2进行产量决策,两个寡头各生产多少产量?各获得多少利润?寡头1是否获得了首先行动的优势?
1
假定两个寡头所进行的是十轮博弈,每一轮博弈都是两个寡头同时进行产量决策,每个寡头都试图使十轮博弈所获得的利润总额达到最大。在这种前提下,第一轮博弈每个寡头各生产多少产量?第十轮博弈各生产多少产量?第九轮、第八轮……每个寡头各生产多少产量?
*
贝叶斯法则是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。
习 题
1. 什么是占优策略均衡?什么是重复剔除的占优策略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为0。两寡头所进行的是产量竞争。对于寡头产品的市场需求曲线为P=30-Q,其中Q=Q1+Q2。Q1是寡头1的产量,Q2是寡头2的产量。 (1)假定两个寡头所进行的是一次性博弈。如果两寡头同时进行产量决策,两个寡头各生产多少产量?各获得多少利润?
*
第一节 完全信息静态博弈 第三节 完全信息动态博弈 第四节 不完全信息静态博弈 第五节 不完全信息动态博弈

完全信息静态博弈ppt课件演示文稿

完全信息静态博弈ppt课件演示文稿

招认
囚徒2 招认 沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒1
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game;(2)the strategies available to each player;(3)the payoff received by each player for each combination of strategies that could be chosen by the players.
Definition: The normal-form representation of an-n-player game specifies the players‘ strategy spaces S1 , … , Sn and their payoff functions u1 ,…, un. We denote this game by G={S1, … ,Sn;u1, … , un}. 教材 P22
≥ ui( s1*…, sn-1* , si , sn+1* ,…, sn* ) ……………………………………….(NE)
for every feasible strategy si in Si; That is , si*solves max ui( s1*…, sn-1* , si, sn+1* ,…, sn* ). si∈Si
参与人2 左 中 右 上 1, 0 1, 2 0, 1
参与人1 下 0, 3 0,1 2,0 第二

ch1 完全信息静态博弈

ch1 完全信息静态博弈

p是市场出清价格,是市场供应量Q的减函数: p=p(Q)=a-Q=a-(qi+ qj)
2、策略:产出水平qi ,策略集Si={qi :qi ≥0} 3、支付函数: ui(si,sj)= ui(qi,qj) = qip – cqi =qi[a-(qi+qj)] – cqi =- qi2+(a-c- qj) qi
这一方法对博弈结果的预测经常是不精确的。
参与人2 左 中 右 上 0,4 4, 0 5, 3 参与人1 中 4, 0 0, 4 5, 3 下 3, 5 3, 5 6, 6
每个参与人都不存在严格劣策略
纳什均衡(NE)的导出和定义
*市场类型不同,厂商之间行为特怔不同,A与C类型中,厂商的决策都是个体优化决 策,而B类型中寡头垄断竞争的本质就构成博弈,他们都是理性的决策者,他们的行 为既影响自身,又影响对方。尽管两寡头由于垄断能给他们带来一些共同的利益,但 是他们的根本利益并不是完全一致的。如果两寡头之间可以签定有约束力的协议,彼 此之间达成合作,形成完全垄断,此时的博弈是一种合作博弈。然而在大多数情况下, 彼此之间很难达成有约束力的协议,这样就是非合作博弈。
下面用图解来说明该模型的NE是: ((a-c)/3,(a-c)/3)
q2 a-c R1(q2) =(a-c- q2)/2 (a-c)/2 (a-c)/3
南极开发;WTO
做一个小结
博弈分析的目的:预测博弈的均衡结果,即给定
“每个参与人都是理性的”是共同知识,什么是 每个参与人的最优策略?什么是所有参与人的最 优策略组合?
二、应用举例— 无限策略博弈解和反应函数法
(一)古诺的双头垄断 模型
按竞争程度划分的市场类型(就卖方来说;对于买方而言,市场是竞争的, 且每一单个买者对市场价格影响程度较小): A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场 托拉斯 辛迪加 卡特尔

完全信息静态博弈名词解释

完全信息静态博弈名词解释

完全信息静态博弈名词解释
嘿,你知道啥是完全信息静态博弈不?咱就说啊,这就好像是一场
棋局!每个人都清楚地知道所有的规则和局面(就像你清楚棋盘上每
个棋子的位置和走法一样)。

在完全信息静态博弈里,大家都在同一时间做决定(可不是像接力
赛那样一个接一个哦),而且对彼此的情况都了解得透透的。

比如说,两个人下棋,谁都知道对方有啥子棋,该咋走。

想象一下,你和朋友玩猜硬币正反面的游戏,这就是个简单的完全
信息静态博弈例子呀!你知道硬币就只有正反两面,你朋友也知道,
而且你们同时猜(可不是你先猜完了他再猜)。

再比如商场上的竞争,两家公司都清楚市场的情况、对方的实力,
然后同时决定自己的策略,这也是完全信息静态博弈。

这可不是闹着
玩的,一个决策失误,可能就满盘皆输啦!
咱回过头来想想,生活中好多场景不都像是一场完全信息静态博弈嘛!像买东西讨价还价,你知道商品大概值多少钱,老板也知道,然
后你们就开始“博弈”啦,看谁能争取到更有利的价格。

完全信息静态博弈就是这么个有趣又重要的概念,它让我们能更好
地理解人与人、企业与企业之间的互动和竞争。

它就像一个神奇的钥匙,能打开我们理解复杂社会现象的大门。

所以啊,可别小瞧了它,
它的用处大着呢!
我的观点就是:完全信息静态博弈在我们生活中无处不在,了解它能让我们更从容地应对各种情况,做出更明智的选择。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 每一参与者的收益函数属于所有参与者的 共同知识。
一、博弈的标准式表述
• 博弈的标准式表述包括三个方面的内容:
• (1)博弈的参与者
• (2)每个参与者可供选择的策略集
• (3)针对所有参与者可能选择的策略组合, 每个参与者获得的收益(即收益函数)
• 对于一个 n 人博弈,设各参与者的策略集 依次为 S1,S2, …,Sn ,收益函数分别为u1,u2, …,un ,其中 ui (s1,s2, …,sn) 为各参与者选择 策略组合 (s1,s2, …,sn) 时参与者 i 的收益, 则可用标准式将该博弈表示如下:
例7


左右
左右
上 -1,3 2,1
上 1,3 4,1
甲 下 0,2 3,4 甲 下 0,2 3,4
• 2、理性共识
• 重复剔除的占优均衡不仅要求每个参与者 是理性的,而且要求“理性”是参与者的 共同知识,即参与者具有“理性共识” (Common Knowledge of Rationality,简记 为CKR)。
• 比赛一开始,由于“澳大利亚二号”抢在发令枪 之前起步,不得不退回到起点线后再次起步,这 使“自由号”获得了37秒的优势。澳大利亚队的 船长John Bertrand 打算转到赛道左边,满心希望 风向发生变化,可以帮助他们赶上去,Conner则 决定将“自由号”留在赛道右边。这一回, Bertrand押宝对了,因为风向果然按照他的心愿偏 转了5度,澳大利亚人以1分47秒的巨大优势赢得 了这轮比赛。
例3:帆船比赛
• 1983年美洲杯帆船决赛前4轮结束后,Dennis Conner率领的“自由号”在这项共有7轮的重要赛 事中暂时以3胜1负的成绩排在首位。
• 那天早上,第5轮比赛即将开始,整箱整箱的香槟 送到“自由号”的甲板上,而在他们的观礼船上, 船员们的妻子全都穿着红白蓝相间的 背心和短裤, 迫不及待地要在她们的丈夫夺取美国人失落132年 之久的奖杯后参加合影。
博弈论与公共政策
刘霖 北京大学政府管理学院
第一讲 完全信息静态博弈
主要内容
• 一、博弈的标准式表述 • 二、占优策略均衡 • 三、重复剔除的占优均衡 • 四、纳什均衡 • 五、多重纳什均衡的比较 • 六、混合策略 • 七、扩展及应用
• 何谓静态博弈? • 每个参与者只行动一次,且同时行动。
• 何谓完全信息博弈?
• 新华社济南2008年1月17日电 山东省教育厅副厅 长张志勇在17日召开的全省中小学素质教育工作 会议上说,要坚决制止中小学校假期加班补课行 为,把时间还给孩子。今年寒假,小学、初中和 高一高二年级正月十五之前一律不准上课,高三 年级正月初十之前不准上课。
三、重复剔除的占优均衡
• 1、重复剔除的占优均衡
• 理性共识可划分为不同的层次:
• 零阶理性共识:每个人都是理性的,但不 知道其他人是否理性。
• 一阶理性共识:每个人是理性的,并且知 道其他人也都是理性的,但不知道其他人 是否知道自己是理性的。
• 二阶理性共识:每个人是理性的,也知道 其他人都是理性的,而且知道其他人知道 自己是理性的,但不知道其他人是否知道 自己知道他们是理性的。
C:不提供 B
提供 不提供
提 供 150,150,150
50,200,50
提 供 50,50,200
-50,100,100
A不 提 供
200,50,50
A不
100,100,-50
提 100,-50,100

0,0,0
例5:中小学补课博弈
• 新华社北京2008年1月16日电 1月26日,北京市 中小学将正式放寒假。北京市教委16日发出通知, 首次强调严禁中学办选拔性培训班,同时严禁中 小学补课,并要求各区县公布补课举报电话。
• 再赛两轮之后, “澳大利亚二号”赢得了决赛桂 冠。“自由号”船员们的妻子伤心不已。
例4:公共产品的提供问题
• 某小区住有A、B、C三户,每户可以自主决定是 否为大家提供一件公共产品,假设每件公共产品 给每户带来的效用是100元,而其成本为150元。
• 各户会如何决策?
C:提供 B
提供 不提供
• 首先从某一参与者的策略集里剔除掉一个 劣策略,再重新考察各个参与者剩下的策 略中哪些是劣策略并剔除其中之一,不断 重复这一过程直到每个参与者都仅剩一个 策略为止,最后得到的策略组合就称为重 复剔除的占优均衡。
例6:俾斯麦海之战
肯尼
北线 南线
木村
北线
南线
2,-2
2,-2
1,-1
3,-3
• 在单人决策中,当所有情况下的收益都增 加(至少不减少)时,当事者的境况不会 变得更坏,但在博弈中则未必。比较下面 的两个博弈:
• 在前面的囚徒困境博弈中,“招认”就是 每个囚徒的占优策略。
• 2、占优策略均衡
• 如果每个参与者都存在占优策略,那么由 这些占优策略构成的组合就称为占优策略 均衡。
• 在前面的囚徒困境中,(招认,招认)就 构成一个占优策略均衡。
• 注意:
• 占优策略均衡只要求每个参与者是理性的, 而并不要求每个参与者知道其他参与者是 理性的,也就是说,不要求“理性”是共 同知识。
G = {S1,S2, …,Sn ; u1,u2, …,un }
• 在双人有限策略的情况下,可以用双变量 矩阵更直观地表述博弈。
囚徒1
例1:囚徒困境
抵赖 招认
囚徒2
抵赖
招认
-1,-1
-9,0
0,-9
-6,-6
• 但是,如果参与者超过2人,则用双变量矩 阵形式来表示博弈就不方便了,甚至根本 无法采用这种形式。
例2:三人有限策略博弈
丙:策略A



丙:策略B



上 0,0,10 -5,-5,0
上 -2,-2,0 -5,-5,0
பைடு நூலகம்


下 -5,-5,0 1,1,-5
下 -5,-5,0 -1,-1,5
二、占优策略均衡
• 1、占优策略
• 在博弈中,如果不管其他参与者选择什么 策略,某个参与者的特定策略都优于或至 少不劣于其它任何策略,那么,我们就说 这个特定策略是该参与者的占优策略。
• 依此类推。
例8


1,0


0,3
乙 中 1,2 0,1
右 0,1 2,0
• 选择越多(行动空间越大),对理性共识 的要求越高。
• 请看下例:
例9

C1
C2
C3
C4
R1 5,10 0,11 1,20 10,10
相关文档
最新文档