《微观经济学:原理与模型》第10章 第01部分完全信息静态博弈 第02章Nash 均衡 第01节 占优行为(讲)
微观经济学-第十章-博弈论初步PPT课件
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
《微观经济:原理与模型》第10章 第01部分 完全信息静态博弈 第02章 Nash均衡 第02节重复剔除劣战略
GET《微观经济学:原理与模型》第10章博弈论第一部分完全信息静态博弈第2小章 Nash 均衡2.2 重复剔除劣战略行为(已精细订正!)在“囚徒困境”中,“坦白”是小偷的占优战略,也就是说,相对于战略“抵赖”,“坦白”在任何情况下都是小偷的最优选择。
因此,小偷只会选择战略“坦白”。
反过来也可以这么理解:相对于战略“坦白”,小偷选择“抵赖”所得到的支付都要小于选择“坦白”所的得到的。
既然选择“抵赖”的所得总是小于选择“坦白”的所得,小偷当然就不会选择“抵赖”,这也就相当于小偷将战略“抵赖”从自己的选择中剔除掉了。
考察更一般的n 人博弈情形。
在n 人博弈中,如果存在参与人i 的占优战略*i s ,那么他在博弈中的战略选择问题就很简单:选择占优战略*i s 。
但在大多数博弈问题中,参与人的占优战略并不存在。
虽然不存在占优战略,但在某些博弈问题中,参与人i 在对自己的战略进行比较时,可能会发现这样的情形:存在两个战略i s '和i s ''(i s ',i s ''∈i S ),i s ''虽然不是占优战略,但与i s '相比,自己在任何情况下选择i s ''的所得都要大于选择i s '的所得。
在这种情况下,理性参与人i 的选择又有什么样的特点呢?虽然不能确定参与人i 最终会选择什么样的战略,但可以肯定的是,理性参与人i 绝对不会选择战略i s '。
因为参与人i 选择战略i s ',还不如直接选择战略i s ''(因为参与人i 在任何情况下选择i s ''的所得都要大于选择i s '的所得)。
定义2-3 在n 人博弈中,如对于参与人i ,存在战略i s ',i s ''∈i S ,对j nij j i S s ≠=-∏∈∀1,有),(),(i i i i i i s s u s s u --'>''则称战略i s '为参与人i 的劣战略,或者说战略i s ''相对于战略i s '占优。
[VIP专享]《微观经济学:原理与模型》第10章 第01部分完全信息静态博弈 第02章Nash 均衡 第01节 占优行
在“囚徒困境”博弈问题中,参与人是两个小偷,参与人的战 略都是:坦白和抵赖,支付就是在各种选择下所得到的刑期。
图 2-1 给出了“囚徒困境”博弈问题的战略式描述。
小偷 1
坦白 抵赖
坦白
-4,-4
-6,0
图 2-1 “囚徒困境”博弈
3
2006年经省农业厅,南平市政府19批41准年,毛南泽平东农在校《与改建造阳我农们业的工学程习学》校一合文署中办,学把,这强句强原联指合治,学实态行度一的套话班古子为,今两用个,校从区哲的学管的理高体度制做,了从新而的使分学析校,的深办化学了规对模实,事办求学是实的力理都解有,长并足为的其发提历展出史,了的逐一经步个验发经教展典训成的告为注诉有释我着,们广指:泛出什发:么展“时空‘候间实坚和事持良’实好就事发是求展客是前观,景存党的在和闽着国北的家唯一的一切事一事业所物就集,会文第‘顺理一是利、个’发农问就展工题是;商,客什实贸实观么事为事事时求一求物候是体是的背是,地内离一面看部实个向待联事老全我系求话国们,是题招的即,,生学规党实和校律和事就。性国求业职,家是的业‘的一,教求事一语办育’业、,学明就就实出规显是会事自模不我遭求东最同们遇是汉大于去挫地班、高研折看固师等究。待所资教”同学著力育。时校《量和毛,、汉最中泽只学书雄学东有生河厚教对坚和间、育中持学献办,国实校王学不社事当传质同会求前》量点、是工。和就中,作书办在国党以中学于革和及称声职命人存赞誉业的民在刘高教分的的德的育析事问“综所无业题修合有不才学性工贯能好国作穿顺古家和着利,级任实前实重何事进事点事求,求中情是一是专都的旦。和必精背”省须神离其级靠。实意文自因事思明己而求是学完他是根校成才就据。。能必实而找然事这到遭求些中到索成国挫真绩革折理的命甚。取的至得规倒是律退得,。益制实于定事学出求校适是党合是政中马领国克导国思的情主坚的义强路世领线界导方观,针的得政根益策本于,要全指求体导,党中是员国马干革克部命思和走主教向义职胜的工利精的,髓辛实。勤事工求作是和是共中同国努革力命的实结践果经,验但的最高主度要总的结一和条概是括得,益中于国学革校命始和终建坚设持的实经事验求表是明的,原实则事,求可是以是说胜,利坚之持本实,事只求要是坚原持则实是事我求们是学,校我各们项党事就业会健永康远、立稳于定不和败谐之发地展。的重要保证。
1 完全信息静态博弈
(Game Theory and Information Economics)
第2章:完全信息静态博弈
Chapter 2: Static Game of Complete Information
完全信息静态博弈
静态博弈(同时行动博弈)
所有参与人同时选择行动,而且只选择一次 如,罚点球时,守门员和对方射手必须同时决策 “同时”是一个信息概念,而不一定与日历上的时间一致 在博弈中,如果参与者在不知道对手如何选择的情况下行 动,该博弈就是静态的。
1 囚徒困境与占优战略均衡
现实生活中其他囚徒困境的例子
曾经威胁世界整个甚至人类的军备竞赛
公共资源过度开采/公共品供给短缺
大学扩招、研究生扩招、大学贷款基建 年年都有的评优评先活动 各种资格考试广泛盛行 备受批评却日益严重的应试教育
1 囚徒困境与占优战略均衡
如何走出囚徒困境?
基于收益矩阵的模型描述: 参与人
囚徒 B 坦白 抵赖囚徒B可 选策略囚徒 A坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒 A 的支付
囚徒 B 的支付
1 囚徒困境与占优战略均衡
博弈中参与人只拥有有限个离散型的纯战略供其选择。 如篮球比赛中的运球、过人和投篮 离散型策略 另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数。如厂商定价 连续策略
离散型策略静态博弈通常用支付表来表示 ——博弈的战略式表述
1 囚徒困境与占优战略均衡
从一方的角度看,选择“坦白”比选择“抵赖”好,无论他 关 于对方的选择持有何等信念。 我们就说,对于囚徒而言,“坦白”的策略是一个占优策略, 以不变应万变 或者说“抵赖”的策略是一个劣策略。
第2讲 完全信息静态博弈【博弈论经典】
第2讲 完全信息静态博弈
•
囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈
•
3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈
•
在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈
•
我们需要对“占优战略”和“劣战略”的概念进行重新定义。
都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
第二章 完全信息静态博弈的基本理论解析
1.占优策略与劣策略。
严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。
案例1:霍布斯博弈
假设鲁滨逊与星期五生活在一个自然状态之中。为了生存,他们各自有两个选择:自己生产财富或掠夺对方的财富。博弈情形如下:
乙
生产
掠夺
甲生产
8
8
10
-2
掠夺
-2
10
-1
-1
思考:面对囚徒困境、广告博弈、霍布斯博弈,请思考如何解决社会困境?(答案略;最低价格承诺实际上就是为解决寡头之间的串谋困境提供了有效的解决机制)
第二章完全信息静态博弈的基本理论
0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈
完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。
特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。
占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。
特别提ห้องสมุดไป่ตู้:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。类似地,可以定义局部劣策略与全局劣策略。
完全信息静态博弈论模型
完全信息静态博弈论模型引言:博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。
在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。
完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。
本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。
一、基本概念1.1 参与者完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。
参与者通过制定决策来追求自身的利益。
1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。
策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。
1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。
支付函数可以表示为参与者的收益、成本或效用。
1.4 纳什均衡纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。
换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。
二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。
支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。
2.2 最优响应最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。
通过计算每个参与者的最优响应,可以找到纳什均衡。
2.3 前瞻性在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。
前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。
三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。
3.1 经济学博弈论在经济学中有广泛应用,如市场竞争、定价策略、拍卖等。
完全信息静态博弈模型可以帮助分析参与者的决策行为,预测市场的走势和结果。
3.2 政治学在政治学中,博弈论可以用于分析选举、政策制定和国际关系等问题。
微观经济学第十章博弈论
博弈论的基本概念
策略
参与者为达到最优目标而采取的 行动方案。
信息
参与者对其他参与者的行动或策 略的了解程度。
01
02
参与者
参与博弈的决策主体,可以是个 人、组织或国家。
03
04
收益
参与者在博弈中获得的利益或损 失。
博弈论的应用场景
01
02
03
04
商业竞争
企业间竞争策略、市场份额争 夺等。
政治外交
05
博弈论的实际应用
商业竞争中的博弈策略
竞争策略
企业可以利用博弈论来制定竞争 策略,例如通过分析竞争对手的
可能行动来制定最优反应。
合作博弈
企业也可以通过合作博弈来寻求共 赢,例如通过建立战略联盟或进行 合作研发来共同开拓市场或降低成 本。
市场进入与退出
博弈论可以帮助企业分析市场进入 和退出的可能性,以及制定相应的 策略。
感谢您的观看
THANKS
政策制定中的博弈论应用
政策制定
政府可以利用博弈论来制定政策, 例如通过分析利益相关方的博弈
行为来制定最优政策。
政策执行
政府也可以利用博弈论来分析政 策的执行效果,例如通过分析利 益相关方的反应来评估政策的可
行性。
政策调整
博弈论可以帮助政府根据利益相 关方的反应来调整政策,以实现
更好的政策效果。
国际关系中的博弈策略
纳什均衡的应用实例
囚徒困境
两个囚犯选择坦白或沉默,在给定对 方选择的情况下,自己选择坦白是最 优策略,最终导致两个囚犯都坦白, 实现了纳什均衡。
寡头竞争
公共资源过度使用
在公共资源的使用中,每个个体都追 求自身利益最大化,最终导致公共资 源过度使用,这也是一种纳什均衡的 现象。
第10章 微观经济学博弈论初步
简化的情侣博弈(1)
第二步,再对简化博弈重复步骤一 ,直到最后,得到原博弈的一个最简博 弈。这个最简博弈,就是原博弈的解; 而在存在多重纳什均衡时,它就是对纳 什均衡的精炼。
简化的情侣博弈(2)
四、精炼的纳什均衡与效率
对参与人来说,由逆向归纳法“精 炼”出来的完全信息动态博弈的纳什均 衡也不一定是有效率的。
第二,用下划线来表示乙厂商的条 件策略。
第三,确定博弈的均衡。
寡头博弈:合作与不合作
乙厂商
合作 不合作
甲厂商
合作 不合作
5,6 7,1
1,5 2,3
利用下划线法得出,纳什均衡是(不
合作,不合作)。
五、纳什均衡的存在性、唯一性和 最优性
1.存在性 完全信息的静态博弈中,(纯策略 的)纳什均衡可能存在也可能不存在。
没有纳什均衡的完全信息静态博弈甲厂商上 下源自乙厂商左右
4,6
9,1
7,3
2,8
2.唯一性 在完全信息的静态博弈中,如果纳 什均衡存在,既可能是唯一的,也可能 是不唯一的。
甲厂商
上 下
乙厂商
左
右
5,6
1,4
4,1
2,3
3.稳定性 在完全信息的静态博弈中,如果纳 什均衡存在,既可能是稳定的,也可能 是不稳定的。
上 甲厂商 下
乙厂商
左
右
5,6
2,4
4,1
2,3
4.最优性
在完全信息的静态博弈中,如果纳
什均衡存在,既可能是最优的,也可能
不是最优的。
上 甲厂商 下
乙厂商
左
右
5,6
1,4
4,1
2,3
纳什均衡(下,右)不是最优的。
经济博弈论完全信息静态博弈
19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
第二章-完全信息静态信息博弈-纳什均衡(博弈论与信息经济学-中科院--张玲玲)教学教材
求爱者
不进入 0,0
0,0
对手特征、战略空间
一 、博弈的基本概念及战略表述
行动:参与人在某个时点的决策变量
Ai表示第i个参与人的一个特定行动
Ai ai 表示可 i选供 择的所有行动的集合
行动的顺序:行动的顺序对于博弈的结果是非常重要 的,事实上,不同的行动顺序意味着不同的博弈。
在博弈论中,一般假设参与人的行动空间和行动顺序 是所有参与人的共同知识。
需求大的情况
开发商B 开发 不开发
开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
一 、博弈的基本概念及战略表述
✓ 结果:博弈分析感兴趣的所有东西 ✓ 如均衡战略组合、均衡行动组合、均衡支付组合等。
一 、博弈的基本概念及战略表述
✓ 均衡:所有参与人的最优战略的组合 ✓ 一般记为:
✓ 完美信息:指一个参与人对其他参与人(包括“自然”)的 行动选择有准确了解的情况,即每一个信息集只包含一个值。
✓ 完全信息:指自然不首先行动或自然的行动的初始行动所有 参与人观察到的情况。
✓ 共同知识:指“所有参与人知道所有参与人知道所有参与人 知道….”的知识。
一 、博弈的基本概念及战略表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
需求大的情况
开发商B 开发 不开发
开发商A
开发 4000,4000 不开发 0,8000
微观经济学 第十章
17
寡头厂商的共谋及其特征
寡头市场上只有少数厂商,对市场的影响举足轻重。 每个厂商为了获得更大市场份额,往往降价竞争。但是,其他厂
4
博弈的划分(博弈论的理论体系)
行动顺序 信息
静态
完全信息
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信 息
不完全信息静态博弈 贝叶斯纳什均衡
海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精练纳什均衡
泽尔腾(1965)
不完全信息动态博弈 精练贝叶斯纳什均衡
泽尔腾(1965) Kreps 和Wilson(1982) Fudenberg 和Tirole(1991)
人的选择,就是同时行动 • 博弈分析的目的是预测均衡结果
8
(一)占优战略及其均衡
参与人选择的最佳战略不依赖于其他参与人的战略选 择,这样的最佳战略称为占优战略。
囚徒 B
坦白 抵赖
囚徒A
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
四种行动选择组合 中,(抵赖、抵赖) 是帕累托最优的
-8大于-10 0大于-1
15
通俗地说,纳什均衡的含义就是:给定你的策略,我 的策略是最好的策略;给定我的策略,你的策略也是 你的最好的策略。即双方在给定的策略下不愿意调整 自己的策略。
囚徒A
坦白
囚徒 B
抵赖
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
(坦白,坦白)是纳什均衡,而(不坦白,坦白)、 (坦白,不坦白)和(不坦白,不坦白)都不是纳什 均衡。
微观经济学
第十章 博弈论与信息不对称
经济博弈论02完全信息静态博弈(Park)
合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
第十章博弈论(微观经济学-南开大学刘骏民)
⒋寻求纳什平衡 首先思索A的战略,关于B的每一个给定战略,找出A
的最优战略,在其对应的支付下划一横线,再用相似的方 法找出B的最优战略。完成这个进程后,假设某个支付组 合的两个数字下都有线,这个支付组合所对应的战略组合 就是一个纳什平衡。
表10-7 寻求纳什均衡Βιβλιοθήκη 参与人BLC
R
参与人A
U
0,2 1,4
三、博弈的要素
博弈的要素包括参与人、举动、信息、战略、支付、 结果战争衡,其中,参与人、战略和支付是描画一个博 弈所需求的最基本的要素,参与人、举动和结果统称为 博弈规那么。
①参与人:指一个博弈中的决策主体在囚徒困境模 型中,有两个参与人,即〝囚徒A〞和〝囚徒B〞。
②举动:是参与人在博弈的某个时点的决策变量。 在囚徒困境模型中,囚徒A、B都只要两种举动可供选择, 即〝坦率〞和〝供认〞。
一切参与人占优战略的组合称为占优战略平衡。
⒉重复剔除的占优平衡
思索〝智猪博弈〞例子。猪圈里围着中间猪,一头大 猪,一头小猪。猪圈的一头有一个猪槽,另一头装置了一 个按钮,控制着猪食的供应。按下一按钮会有8个单位的 猪食进槽,但按下按钮的猪需求付出2个单位的本钱。假 定大猪先到,大猪吃到7个单位,小猪只能吃1个单位;假 定同时到,大猪吃5个单位,小猪吃3个单位;假定小猪先 到,大猪和小猪各吃4个单位。表10-5的Ⅰ表列出对应不同 战略组合的支付水平,如第一格表示中间猪同时按下按钮, 就会同时走到猪食槽,大猪吃5个单位,小猪吃3个,扣除 2个单位的本钱,支付水平区分为3和1。
20世纪70年代以后,经济学家末尾强调团体理性。
⒉博弈论与主流经济学 博弈论进入主流经济学,反映了经济学开展的以下几
个趋向:①经济学研讨的对象越来越转向集体,坚持了一 些没有微观基础的假定;②经济学越来越转向人与人之间 竞争与协作的研讨,特别是经济学留意到理性人的团体理 性行为能够招致的团体非理性;③经济学越来越注重对信 息的研讨。
第二章 完全信息静态博弈 谢识于经济博弈论课件
2.3 无限策略分析和反应函数
2.3.1 2.3.2 2.3.3 2.3.4 2.3.5
古诺的寡头模型 反应函数 伯特兰德寡头模型 公共资源问题 反应函数的问题和局限性
2.3.1 古诺的寡头模型
寡头产量竞争——以两厂商产量竞争为例
Q q1 q2 P P(Q) 8 Q
c1 c2 2
价格竞争寡头的博弈模型 产品有一定差别,消费者对价格不十分敏感
q1 q1 ( P , P ) a1 b1 P d1 P 1 2 1 2 q2 q2 ( P , P2 ) a2 b2 P2 d 2 P 1 1
u1 u1 ( P , P2 ) P q1 c1q1 ( P c1 )q1 ( P c1 )(a1 b1P d1P2 ) 1 1 1 1 1
第二章 完全信息静态博弈
完全信息静态博弈即各博弈方同时决策,且所有 博弈方对各方得益都了解的博弈。
囚徒困境、齐威王田忌赛马、猜硬币、石头剪子布、 古诺产量决策都属于这种博弈。
完全信息静态博弈属于非合作博弈最基本的类型。
本章分六节
2.1 2.2 2.3 2.4 2.5 2.6
基本分析思路和方法 纳什均衡 无限策略博弈分析和反应函数 混合策略和混合策略纳什均衡 纳什均衡的存在性 纳什均衡的选择和分析方法扩展
结果是:小猪肯定 会选择“搭便车” 策略,而大猪不得 不去踩踏板,为一 点残羹,不知疲倦 地奔波于踏板和食 槽之间。
我去踩,一 口都没有, 我才不去踩 呢!
小样,肯定不会去 踩,我踩,能吃一 半,不踩,铁定饿 肚子,唉,没办法 只能亲自动脚了!
决定大猪、小猪策略的核心指标:每次落下的食物 数量和踏板与投食口之间的距离。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GET《微观经济学:原理与模型》第10章博弈论
第一部分完全信息静态博弈
第2小章 Nash 均衡
本章将通过分析理性参与人在博弈中的选择行为,
探讨完全信息静态问题的求解,并给出完全信息静态博弈的解——Nash 均衡。
2.1 占优行为 (已精细订正!)
首先考察博弈论中最为经典的一个博弈模型—“囚徒困境”(prisoners ’ dilemma )博弈。
两个小偷作案后被警察抓住,分别关在不同的屋子里审讯。
在审讯之前,小头偷从律师那里得知:如果两个人都坦白,将被个判刑4年;如果两个人都抵赖,将会因为证据不足而各判1年;如果其个一人坦白另一人抵赖,坦白的讲将会得到宽大处理而被无罪释放,而抵赖的将被重刑,判刑6年。
试问两个小偷将会如何选择?
上述“囚徒困境”博弈问题是Tucker在20世纪50年代提出的,该问题不仅“可以作为实际生活中许多现象的一个抽象概括”,而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。
在“囚徒困境”博弈问题中,参与人是两个小偷,参与人的战略都是:坦白和抵赖,支付就是在各种选择下所得到的刑期。
图2-1给出了“囚徒困境”博弈问题的战略式描述。
图2-1 “囚徒困境”博弈
显然,在“囚徒困境博弈”中,小偷选择的结果不仅与自己的选择有关,而且与另一小偷的选择有关,那么小偷如何选择呢?
不妨这样考虑小偷的决策过程:假设对方坦白,自己该怎么做;假设对方抵赖,自己应该怎么做。
也就是,给定另一小偷的决策,寻找自己的最优决策。
对于每个小偷,当对方坦白时,自己坦白得4-,抵赖得6-,所以应该选择“坦白”;而当对方抵赖时,自己坦白得0,抵赖得1-,所以还是应该选择“坦白”。
也就是说,无论对方如何选择,每个小偷都会选择 “坦白”。
因此,博弈的结果就是两个小偷都选择“坦白”。
(讲)
两个小偷都选择“坦白”,这样的结果似乎与我们的直觉相矛盾。
因为在“囚徒困境”的4种结果(即)(坦白坦白,、)(抵赖坦白,、
),(坦白抵赖、),(抵赖抵赖)中,虽说不能肯定)(坦白坦白,这个结果是最
差的,但它显然不如),(抵赖抵赖。
这是因为)(坦白坦白,导致两个小偷都得4-,而),(抵赖抵赖却能使大家都得1-,也就是说,),(抵赖抵赖是Pareto 优于)(坦白坦白,的。
既然选择“抵赖”对双方都有好处,那
么两个小偷是否都会选择“抵赖”呢?只要小偷是前面所假设的完全理性的参与人,答案就是否定的。
不妨假设两个小偷都选择“抵赖”,现在分析小偷的这种选择是否是理性的。
对小偷1而言,小偷2选择“抵赖”的情况下,自己选择“抵赖”得1 ,选择“坦白”得0,显然“坦白”优于“抵赖”。
因此,理性的小偷1将会偏离“抵赖”而选择“坦白”。
基于同样的原因,理性的小偷2也会偏离“抵赖”而选择“坦白”。
除了)(坦白坦白,和),(抵赖抵赖以外,“囚徒困境”是否会出现其他结果呢?比如说一个人坦白,一个人抵赖?我们说这样的结果也是不会出现的,因为在对方选择“坦白”的情况下,自己选择“抵赖”显然是不理性的。
剩下的问题是:当两个小偷都选择“坦白”时,是否有人偏离“坦白”而选择“抵赖”。
基于同样的分析,两个小偷只要是理性的,这种情况就不会发生1。
因此,虽然结果(抵赖,抵赖)是结果(坦白,
1
也许有人会问:如果两个小偷在被抓之前就制定攻守同盟,决定双方选择“抵赖”,这是否可以是博弈的结果为),(抵赖抵赖呢?这要取决于“攻守同盟”对双方是否具有约束力,是否对双方的支付产生影响。
只要这种“攻守同盟”对双方的选择没有约束力,不能对违背协议(即“攻守同盟”)的参与人的支付产生影响,理性的参与人都会选择偏离“抵赖”而选择“坦白”。
坦白)的Pareto改进(即所有的人都得到好处),但只要两个小偷是理性的,这种对所有人都有好处的“改进”两人都无法得到。
这也反映出现实生活中经常出现的“个人理性与集体理性间的矛盾”。
事实上,“囚徒困境”在现实生活中有着许多应用。
也许“囚徒困境”博弈是人们虚构出来的一个博弈模型,但在现实生活中与“囚徒困境”相似的情形却很多。
例如,寡头垄断市场上厂商间的价格大战,就是典型的“囚徒困境“。
20世纪90年代末期我国出现的彩电企业间的价格大战就是这种情形,还有目前人们议论比较多的有关中小学生教育方式的选择。
家长明知道素质教育对孩子的长远发展更有益处,但为了应付各种各样的升学考试,也不得不让孩子参与各种名目的“模拟考试”或“考试培训”,这也是典型的“囚徒困境”。
诸如此类的例子,现实生活中还有很多。
进一步分析“囚徒困境”中小偷的战略,可以发现战略“坦白”具有这样的特点:无论对方怎样选择(选择“坦白”或者“抵赖”),“坦白”总是理性小偷的最优战略。
考察更一般的n 人博弈情形。
n 人博弈中,参与人),...2,1(n i i =的支付),(i i i i s s u u -=既与自己的选择i s 有关,也与其他参与人的选择i s -有关。
因此,在一般情况下, 使某参与人的支付),(i i i i s s u u -=最大化的最优战略*i s 与其他参与人的选择i s -有关。
但在某些特殊情况下,如“囚徒困境”博弈中,可能会出现这样的情况:参与人),...2,1(n i i =的最优战略*i s 与其他人参与人的i s -无关。
也就是说,无论其他参与人选择什么战略,参与人的最优战略总是唯一的。
这样的最优战略称为“占优战略”(dominant strategy ),如“囚徒困境”中参与人的“坦白”战略。
定义2-1 在n 人博弈中,如果对于所有的其他参与人的选择i s -,*
i s 都是参与人i 的最优选择,即j n
i
j j i i
i i i S s s s S s ≠=-*
∏∈∀≠∈∀1),(,有
),(),(i i i i i s s u s s u --*
>
则称*i s 为参与人i 的占优战略。
显然,在一个博弈问题中,如果某个参与人具有占优战略,那么只要这个参与人是理性的,他肯定就会选择他的占优战略,参与人的这种选择行为称为占优行为。
占优行为是理性参与人选择行为的最基本特征。
【例2-1】 考察图2-2所示的战略式博弈,其中参与人1有两个战略—1a 和2a ,参与若有四个战略—321,,b b b 和4b 。
在参与人2的四个战略中,战略3b 是参与人 2的占优战略。
图2-2 战略式博弈
更进一步,如果所有的参与人都具有占优战略,那么只要参与人是理性的,肯定都会选择自己的占优战略,在这种情况下,博弈的结果就由参与人的占优战略共同决定。
像这种由参与人的占优战略共同决定的博弈结果,称为占优战略均衡(dominant-strategy equilibrium )。
定义2-2 在n 人博弈中,如果对所有参与人),,2,1(n i i ,都存在占
优战略*
i s ,则占优战略组合),,,(21*
***=n s s s s 称为占优战略均衡。
显然,在一个博弈问题中,如果所有参与人都有占优战略存在,那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。
【例2-2】 考察图2-3中的战略式博弈,其中参与人1有占优战略2a ,参与人2有占优战略3b ,因此博弈的结果为占优战略均衡),(32b a 。
图2-3 战略式博弈。