博弈论的复习资料
(完整word版)经济博弈论期末复习资料(word文档良心出品)

经济博弈论复习资料一、名词解释1、零和博弈:是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作可能的博弈。
2、常和博弈:是指各博弈方的得益之和是一个非零常数的博弈。
常和博弈中各博弈方之间利益关系也是对立的,博弈方之间的基本关系也是竞争关系。
3、纳什均衡:在博弈G={}n n u u S S ,,;,,11 中,如果由各个博弈方的各一个策略组成的某个策略组合()**1,,n s s 中,任一博弈方i 的策略*i s ,都是对其余博弈方策略的组合()**1*1*1,,,,,ni i s s s s +- 的最佳对策,也即()()**1**1*1**1**1*1,,,,,,,,,,,,n i ij i i n i i i i s s s s s u s s s s s u +-+-≥ 对任意i ij S s ∈都成立,则称 ()**1,,n s s 为G 的一个纳什均衡。
4、混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。
5、纳什定理:在一个有n 个博弈方的博弈G={}n n u u S S ,,;,,11 中,如果n 是有限的,且i S 都是有限集(对i=1, ,n ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
(这个定理就是说,每一个有限博弈都至少有一个混合策略纳什均衡)6、帕累托上策均衡:是指帕累托效率意义上的优劣关系,因此用这种方法选择出来的纳什均衡,也称为“帕累托上策均衡”。
7、风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个风险上策均衡。
8、子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息和进行博弈所需要的全部信息。
9、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
(完整word版)博弈论期末复习题

一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BAU D解:由划线解得知有一个纯战略均衡(R D ,)再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件:γγγ-=-+⋅=2)1(21)(U V A γγγ26)1(64)(-=-+⋅=D V A γγ262-=-得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。
2、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
BAU D将博弈改成上述模型,则)1(64)1(25γγγγ-+=-+ γγ2632-=+得 54=γ同样,设A 的混合战略为)1,(θθ-,则)1(25)1(16θθθθ-+=-⋅+ θθ3251+=+21=θ于是混合战略均衡为⎭⎬⎫⎩⎨⎧⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛51,54,21,21.二、逆向归纳法1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P ,则1选L '的支付P P P 32)1(25+=-+=1选R '的支付P P P P 3233)1(36+>+=-+= 故1必选R '。
⇒ 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡为{}),(,,d a R L '四、两个厂商生产相同产品在市场上进行竞争性销售.第1个厂商的成本函数为11q c =,其中1q 为厂商1的产量。
第2个厂商的成本函数为22cq c =,其中2q 为厂商2的产量,c 为其常数边际成本.两个厂商的固定成本都为零.厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在⎥⎦⎤⎢⎣⎡23,21上呈均匀分布。
博弈论期末复习重点

1、博弈:一些个人、队组或其他组织;面对一定的环境条件;在一定的规则下;同时或先后;一次或多次;从各自允许选择的行为或策略中进行选择并加以实施;各自去得相应结果的过程..2、博弈论:就是系统研究各种博弈问题;寻求在各博弈方具有充分或者有限理性、能力的条件下;合理的策略选择和合理选择策略时博弈的结果;并分析这些结果的经济意义、效率意义的理论和方法..3、囚徒的困境:两决策者从各自最大的利益出发选择行为;结果是既没有实现两人总体的最大利益;也没有真正实现自身的个体的最大利益..4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈..5、动态博弈:各博弈方的选择和行动不仅有先后次序;而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动;甚至还包括自己的选择和行动;6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息..7、不完全信息不对称信息:是指经济行为主体掌握了某种经济环境状态的部分信息..8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解..9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程..10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策;那么这个策略组合肯定是所有博弈方都愿意选择的;必然是该博弈比较稳定的结果..11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略..在两人博弈的情况下;“给定你的策略;我的策略就是我最好的策略;给定我的策略;你的策略也是你的最好的策略”..12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决策方式..13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡..这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益..14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈..15、完全且完美信息动态博弈:动态博弈中既是完全信息又是完美信息的部分16、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中;各博弈方的策略均衡构成的一个策略组合满足;在整个动态博弈及它的所有子博弈中都构成纳什均衡;那么这个策略组合称为该动态博弈的一个~17、逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析;逐步倒推回前一个阶段相应博弈方的行为选择;一直到第一阶段的分析方法..18、颤抖手均衡:在博弈时也要考虑到合作者可能会发生轻微的失误而影响整个结果;即使在这种小概率事件发生时;所选策略依然是最优的.. 19、道德风险:从事经济活动的人在最大限度地增进自身效用时作出不利于他人的行动;损害委托人或是其他代理人的利益..交易后的信息不对称性;掌握较多信息的一方在交易后的利己倾向;如隐瞒欺骗、不负责任、不努力工作..20、逆向选择:指交易双方在交易前的信息不对称;导致市场上交易的劣质商品的比例越来越高;甚至导致优质品完全被驱出市场的一种现象..简答210%一、设定一个博弈模型必须确定的方面:1、博弈方:即博弈中进行决策并承担结果的参与者;2、各博弈方各自可选择的全部策略或行为的集合策略空间:即博弈方选择的内容;可以是方向、取舍选择、量值;3、进行博弈的次序:即博弈方行为、选择的优先次序或重复次数等..次序不同一般就是不同的博弈;即使博弈的其他方面都相同;4、博弈方的得益:即博弈方行为、策略选择的相应后果、结果必须是数量或者能够折算成数量;对应于各博弈方的每一组可能的决策选择都应有一个结果表示该策略组合下各博弈方的所得或所失..得益应该是客观存在;但不意味着各博弈方都了解各方的得益情况..5、信息结构;即博弈方相互对其他博弈方行为或最终利益的了解程度;6、行为逻辑和理性程度;即博弈方是依据个体理性还是集体理性行为以及理性的程度等..二、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子..1、烟草厂商新产品的开发、价格定位的效果;常常取决于其他厂商、竞争对手的相关竞争策略..例如某卷烟厂推出一种高价烟;该计划能否成功常取决于其他厂商是否采取同样的策略、如果其他厂商也推出高价烟而且档次宣传力度比前者还要高、大;那么前者的计划成功的难度就很大;但如果没有其他厂商推出同类产品;那前述某厂的计划成功的可能性就大;2、房地产开发企业在选址、开发规模、目标客户定位等方面也常常存在相互制约的问题..例如一个城市当时的住房需求约10000平方米;如果其他厂商已经开发了8000平方米;那么你再开发5000平方米就会导致供过于求;销售就会发生困难;但如果其他厂商只开发不到5000平方米;那么你的5000平方米就是合理的..3、麦当劳的新产品所带来的收益、价格产量、产品开发三、“囚徒困境”内在根源是举出现实生活中的具体例子..根源在于个体之间存在行为和利益相互制约的博弈结构中;以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益;并实现整体、个体利益共同的最优..简单第说;都是个体理性与集体理性的矛盾引起的..四、分析保险市场、资本市场道德风险的逆向选择..1、汽车保险:假设张三有财产¥100000;其冯诺依曼-摩根斯坦效用指数为对数函数;即UW=lnW;并有价值为¥ 20000的汽车一辆..如果该汽车没有向保险公司投保;将有25%的可能性被偷窃..因此;期望效用为:0.75U100000+0. 25U80000=0.751nl00000+0.25ln80000=11.457l;如果保险公司只索取成本而管理成本为0;那么;公平的保险费用为¥ 20000× 0.25=¥ 5000..如果张三将汽车完全保险;无论汽车是否被盗;其财富都是¥95000;预期效用U95000=ln95000=11. 4616因此;当张三购买公平保险后;其效用高于不购买保险..现在讨论张三是否安装防盗装置的问题;假设安装一个防盗装置的成本为¥1950;如果安装该装置、汽车被盗概率从0.25减小到0.15..如果没有投保;安装防盗装置的预期收益¥20000×0.10=¥ 2000超过成本;因而安装防盗装置有效率;其期望效用为:0.85ln100000-1950+0.15ln100000-2000-1950=11.4590超过不安装的期望效用11.457l;因此;如果张三没有投保;那么;购买防盗装置是理性的..但是;当张三投保后;情况发生了变化..假设张三购买汽车保险的价格是¥ 5200其中¥ 5000为预期损失;¥200为管理费..如果保险公司并不检查投保人是否安装防盗装置;那么;投保的预期效用为1n94800=11.4595;该预期效用超过安装防盗装置的预期效用..张三将会选择投保..但投保后将没有动力安装防盗保险装置;并且可能产生麻痹心而提高被盗的可能性..结果、发生火灾的概率从0.005上升到0.008;保险公司的实际预期损失为¥800..结果;每出售一张保险单平均都会损失S300..这种保险单对于保险公司来说不可行..由于代理人隐蔽行动难以观察;火灾保险市场经常出现投保人经营亏损后;有意纵火索取高额保险金的案例..2、火灾保险的道德风险:假设某厂商产品仓库价值为¥100000;厂商采取防火措施的成本为¥50..采取防火措施后小心谨慎;发生火灾概率为0.005;没有防火措施且疏于防范;发生火灾概率为0.008..又假设保险公司以预期火灾损失¥500;以此作为保险费用出售保险单..在这种环境下;如果厂商向保险公司投保后;就可能不会有动力继续执行防火措施;且可能疏于防范..3、健康保险市场:投保人一旦获得健康保险;相当于降低投保人的医疗护理费用..因此;理性的个人将增加他在这方面的消费量;相应地增加了医疗保险支付的数量;即增加社会成本的数额;因为个人保险费的增加意味着社会医疗支出费用的增加..在这种状态下;社会的风险服务和医疗服务都将低效率..4、资本市场:每个借贷者要求同样数目的贷款条件下;银行不能将借款者按照回报率的大小给予不同的利息率..银行能否收回贷款并获得利润;既取决于借款者的经济效益;也取决于银行所处环境状态的各种不确定性..当银行以借款者的经济收益为利息率标准时;借款者就会利用银行难以观察或不可能观察到的隐蔽行动采取相应行动;如虚报利润额、非法转移资金;人为地扩大成本等道德风险行为;由此使银行承担的风险比签定委托-代理合同前有所增加..5、证券市场的“逆向选择”:在信息不对称的情况下;投资者无法确定哪些上市公司是高质量的、有投资价值的公司;哪些是低质量的上市公司..因此;投资者在作出投资决策时;往往只能根据整个市场所有发行企业的平均质量来决定其愿意投资的价格..这种投资者的“折中”行为就会抑制那些高于平均质量水平的发行企业提高经济效率和管理水平的积极性;而鼓励投资者向低质量企业流动..因为高于平均质量水平的上市公司并不能在证券市场体现其应有的价值;因此就会造成高质量企业不情愿进入证券市场..造成低质量的上市公司横行于证券市场..信息不对称的结果造成股票价格与上市公司经营业绩的背离则使证券市场失去了评价上市公司业绩、约束上市公司经营行为的市场机制;这种市场选择的结果只会导致整个市场的上市公司质量的降低;并成为市场过度投机的主要根源;最终会导致市场的低效率甚至是市场的崩溃..判断一、博弈的分类方法:1、行为逻辑;是否允许存在有约束力协议:合作博弈、非合作博弈2、理性层次:完全理性博弈、有限理性博弈进化博弈;3、博弈过程:静态博弈、动态博弈、重复博弈4、信息结构:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈;5、得益特征:零和博弈、常和博弈、变和博弈6、博弈方数量:单人博弈、两人博弈、多人博弈;7、策略数量:有限博弈、无限博弈二、上策均衡、纳什均衡、严格下策反复消去法的关系区别:1、上策均衡是各博弈方绝对最优策略的组合;而纳什均衡则是各博弈方相对最优策略的组合..上策均衡一定是纳什均衡;但纳什均衡不一定就是上策均衡..对同一个博弈来说;上策均衡的集合就是纳什均衡集合的子集;但不一定是真子集;2、严格下策反复消去法与上策均衡分布对应两种有一定相对性的决策分析思路:严格~对应排除法即排除绝对最差策略的分析方法..上策~对应选择法;即选择绝对最优策略的均衡概念..二者并不矛盾;甚至可以相互补充..严格~不会消去任何上策均衡;可以简化博弈;3、严格~和纳什均衡也是相容和补充的;严格~不会消去任何上策均衡;可以简化博弈;使纳什均衡分析更加容易..。
《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料第一章导论1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。
它包括四个要素:参与者,策略,次序和得益。
2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。
即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。
即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。
各博弈方的策略选择范围称策略空间。
每个博弈方各选一个策略构成一个策略组合。
(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。
(4)得益。
各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。
3.合作博弈和非合作博弈的区别:合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。
主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。
假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。
如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。
合作博弈:团体理性(效率高,公正,公平)非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率)4.完全理性和有限理性:完全理性:有完美的分析判断能力和不会犯选择行为的错误。
有限理性:博弈方的判断选择能力有缺陷。
区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。
所以不能简单地假设各博弈方都完全理性。
5.个体理性和集体理性:个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。
第一章课后题:2、4、56.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。
博弈论的复习资料精品文档7页

名词解释:1,共同知识:是指所有当事人对该事件都知道,并且也所有当事人都知道其他当事人也知道这一事件,并且所有当事人都知道所有当事人都知道这一事件。
那么该事件就是共同知识。
2,先动优势:在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。
这种局中人先动得益大于后行得益的情况,叫做先动优势。
3,后动优势:后行动的得益比先行动的得益大的情况4,信息集:我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。
•单点集:我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。
•触发策略:即只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。
•冷酷策略:双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛。
即任何局中人的一次性不合作将触发永远不合作。
•礼尚往来策略:开始的时候和冷酷策略一样,即双方从合作开始,在以后的每个阶段,如果你的对手在最近的一次博弈中还是采取合作策略,则你继续跟他合作;如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略惩罚他,但是如果你的对手在下一次博弈中改邪归正,采用合作策略,则你在下次继续博弈中还是跟他合作。
触发策略是带有奖励和惩罚措施的一种博弈机制。
在这个机制中,惩罚措施是其中的关键。
注意:(1),一个信息集罩住的必须是同一个局中人的决策点。
•必须是同一个局中人在同一个时点的决策节点。
同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。
因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。
简答题:1,博弈的构成要素:•局中人决策主体,目的是通过选择行动(或策略)以最大化自己的支付(效用、得益)水平。
《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。
它主要关注对策略的选择与分析,以及对方可能的反应。
下面我们来对博弈论的知识点进行总结归纳。
1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。
普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。
2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。
博弈论的目标是通过合理的策略选择来实现最优的支付和效用。
3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。
纳什均衡是博弈的稳定状态。
4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。
合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。
5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。
非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。
6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。
解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。
7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。
策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。
8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。
在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。
9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。
重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。
博弈论复习..

1.1.7 博弈的主要方面〔要素〕
►博弈的挨次〔Orders〕:行为决策挨次,不同的博 弈挨次产生的博弈结果可能会不同。 ►博弈方的得益〔Payoffs〕:对应于各博弈方的每一 组的可能决策选择,都应当有一个结果表示该策略组 合下各博弈方的所得或所失。“这些”所得所失就是 博弈方的得益,也叫做“支付”。 通常来说,一个博弈,最困难的地方就是确定各博弈方 的得益。博弈的多样性也都是由得益的多样性产生的。
39
1.2.1 囚徒逆境
1.囚徒逆境的根本模型 〔1〕囚徒逆境的根本模型是 塔克 1950年提出的。 〔2〕主题:个人理性与集体理性冲突。 〔3〕囚徒逆境博弈的主要方面〔要素〕: ►局中人:两个共同作案的囚徒;囚徒1、囚徒2; ►策略集合:{坦白,不坦白}; ►博弈的挨次:双方同时选择策略; ►博弈方的得益:如下页得益〔支付〕矩阵中所示。
罗斯
沙普利 20
1.1.3 博弈论与诺贝尔经济学奖
2023年,来自法国图卢兹大学的法国教授让-梯假设尔 (Jean Tirole)因其对市场力气和管制的争论分析获得诺 贝尔经济学奖。
梯假设
21
1.1.4 纳什的故事
《 美 丽 心 灵 》
22
1.1.4 纳什的故事
1928年6月13日,约翰·福布斯·纳什〔John Forbes Nash〕诞生于美国西弗吉尼亚州〔美国较穷的州〕 的布鲁菲尔德市。20岁,1948年9月入普林斯顿 大学作争论生;22岁,1950年获数学博士学位, 并留校任讲师一年。23岁,1951年到麻省理工学 院任教,直到31岁,1959年因精神分裂症而离职。 66岁,1994年获诺贝尔经济学奖。
► 50年月,合作博弈论鼎盛时期,讨价还价模型 —纳什〔1950〕和夏普里〔1953〕,核的概念— 吉利斯和夏普里〔1953〕;
博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。
2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。
用策略性思维来分析问题,从中找出合理策略,实现目标最优。
3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。
4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。
5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。
每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。
博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。
2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。
3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。
4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。
博弈论复习

第2章扩展式博弈与标准式博弈标准式:博弈过程以数字矩阵表示,矩阵两侧为参与者的不同的战略选择扩展式:博弈过程以树形图表示,树形图的每一树枝节代表了一种战略选择不确定事件:可能发生也可能不发生的事件相机战略:仅在不确定事件发生时才会采取的战略。
在扩展式博弈中,只要博弈的一方在不知情的情况下决策,或者同时决策,我们就将其所有的选择都列在从一个节点出发的分支中,以此表示信息的不充分(标准式:博弈过程以数字矩阵表示,矩阵两侧为参与者的不同的战略选择,往往用于表达静态博弈表达动态博弈)第3章占优战略与社会两难占优战略:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
占优战略均衡:如果博弈中的每位参与者都有占优战略,并且也实施其占优战略,我们就可以获得一个占优战略均衡。
合作解:不管是通过协议还是其他形式的强制手段,只要博弈中的参与者能够保证自己履行协调后的战略,那么他们选择的战略及其收益就被称作合作解非合作解:占优战略均衡是一种非合作解,也就是说每位参与者都独立行动,而不是一起协商其战略。
在非合作解中,每位参与者都会根据对方的战略选择自己的最优战略假定所有人都这样做那么每一位参方的战略选择自己的最优战略,假定所有人都这样做,那么每位参与者所选的战略就都是针对他人最优战略的最优反应。
(参与者在行动选择时无法达成约束性的协议的解集。
)社会两难:社会两难是一种存在占优战略均衡的博弈,并且参与者采用这种均衡的战略收益比采用非均衡战略的收益要差。
(当一个博弈存在占优战略时,人们就会理所当然地选择该战略而不是另一个。
囚徒困境与垃圾处理博弈非常相似这些博弈都属于社会两难理博弈非常相似,这些博弈都属于社会两难。
)第4章纳什均衡纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
纳什均衡战略:如果有两个战略(或者更一般的,有多个战略,每个战略都对应着一个参与者),并且每个战略都是另一个战略(或者其他参与者的战略)的最优反应,我们就称这一战略组合为纳什均衡战略。
博弈论知识点总结完整版

博弈论一:基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈:a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足:uisi;s-i>uisi';s-is-i; si' sib、占优均衡:一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡:a、“严劣”和“弱劣”的含义:设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义:重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二:纳什均衡Nash Equilibrium2.1纳什均衡定义:对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即:u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义:纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合:当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择;没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理:Nash在1950年证明:任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立;定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三:混合策略Mixed Strategies 纳什均衡3.1定义:混合策略的定义:在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是: UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义:基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义:对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法:a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四:多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是:在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如:参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点:人们通常会协调彼此的行为..你弱他就强;先例产生的影响远大于逻辑或者法律效力;人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义:如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五:动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合:i=1; … ;N..用N表示虚拟参与人“自然”;自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动;参与人的行动空间actionset:在每次行动时;参与人可选择的行动集合;参与人的信息集information set:每次行动时参与人知道什么;参与人的收益函数:在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是:各阶段各参与人的行动数目有限;博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点;终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注:每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义:当A选择开发时;B选择大括号中前面的策略;当A选择不开发时;B选择大括号中后面的策略..B的纯策略为:{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为:SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法:a逆向归纳法求解策略:从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较:如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件:x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法:前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是:参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理:令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..(七)不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。
博弈论复习题及答案

博弈论复习题及答案1. 博弈论中,非合作博弈与合作博弈的主要区别是什么?答案:非合作博弈是指参与者之间没有约束性协议的博弈,每个参与者都独立地选择自己的策略以最大化自己的利益。
而合作博弈则允许参与者之间形成具有约束力的协议,共同合作以达到共同的目标。
2. 什么是纳什均衡?答案:纳什均衡是指在一个博弈中,每个参与者都选择了最优策略,并且考虑到其他参与者的策略后,没有参与者有动机单方面改变自己的策略。
3. 零和博弈与非零和博弈有何不同?答案:零和博弈是指博弈中所有参与者的收益总和为零,即一个参与者的收益必然导致另一个参与者的损失。
非零和博弈则是指参与者的收益总和不为零,参与者之间可能存在合作共赢的情况。
4. 如何判断一个博弈是否存在纯策略纳什均衡?答案:可以通过构建博弈的收益矩阵,然后寻找每个参与者在其他参与者策略给定的情况下的最佳响应策略。
如果存在一组策略,使得每个参与者在其他参与者策略不变的情况下,都没有动机改变自己的策略,那么这个策略组合就是一个纯策略纳什均衡。
5. 混合策略纳什均衡与纯策略纳什均衡有何不同?答案:纯策略纳什均衡是指参与者在均衡状态下选择的策略是确定的,而混合策略纳什均衡则是指参与者在均衡状态下选择的策略是随机的,每个策略都有一定的概率被选择。
6. 什么是支配策略?答案:支配策略是指在博弈中,无论其他参与者选择什么策略,某个参与者选择该策略都能获得比其他策略更好的结果。
7. 博弈论中的“囚徒困境”说明了什么?答案:“囚徒困境”说明了即使合作对所有参与者都有利,但由于缺乏信任和沟通,参与者可能会选择对自身最有利的策略,导致集体结果不是最优的。
8. 什么是博弈论中的“倒后归纳法”?答案:“倒后归纳法”是一种解决动态博弈的方法,通过从博弈的最后阶段开始,逆向分析每个阶段的最优策略,直到博弈的初始阶段。
9. 博弈论在经济学中的应用有哪些?答案:博弈论在经济学中的应用非常广泛,包括但不限于市场结构分析、拍卖理论、合同理论、产业组织、宏观经济政策分析等。
博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是研究决策者在互相影响的情况下做出最佳决策的数学模型和方法。
在博弈论中,决策者被称为玩家,他们的决策会受到其他玩家的影响。
以下是博弈论的一些重要知识点的总结:1.资料和约定-玩家:博弈论中的决策者。
-策略:玩家可以采取的行动。
-支付:玩家根据博弈结果获得的效用或价值。
-最优策略:在给定博弈条件下,可以使玩家获得最大效用的策略。
-纯策略和混合策略:纯策略是指玩家在每次博弈中都采取相同的行动;混合策略是指玩家以一定概率采取不同的行动。
2.标准形博弈-扩展形式:博弈者按照时间次序做出决策,每个决策节点有多个玩家可以选择的动作。
-纳什均衡:在标准形博弈中,如果所有玩家都不愿意单方面改变他们的策略,则该策略组合是纳什均衡。
-最优反应函数:针对每个玩家的策略组合,最优反应函数给出了该玩家的最佳策略。
-支配策略:一个策略在任何情况下都能够给出玩家更好的结果,那么我们可以说这个策略是支配的。
3.矩阵博弈-矩阵:博弈论中描述玩家策略和效用的表格。
-矩阵博弈的解:通过找到纳什均衡,我们可以得出矩阵博弈的解决方案。
-互动博弈:双方玩家的效用都取决于对方的策略选择。
4.博弈树-博弈树:根据博弈的时间顺序和玩家之间的相互影响,构建的树形结构。
-极小极大算法:用于确定博弈树上的最佳策略。
- alpha-beta剪枝:通过剪枝,减少博弈树的节点数量,从而提高效率。
5.进化博弈论-重复博弈:博弈过程被连续重复进行,玩家可以根据之前的结果来调整策略。
-演化稳定策略:一个策略集合中的策略,在当前环境下被所有玩家采纳并且难以被其他策略取代。
6.合作博弈论-合作博弈:玩家可以自由选择与其他玩家联合合作,并共享所获得的效用。
-特征函数:描述合作博弈的效用分配。
-核心:合作博弈中所有合法的效用分配的集合。
- Shafer值:一种用于将效用分配给个体的方法,使得每个个体的效用都能够得到公平分配。
博弈论是多学科交叉的研究领域,应用广泛,涉及经济、管理、政治等多个领域。
《经济博弈论》期末考试复习题及参考答案

《经济博弈论》期末考试复习题及参考答案一、单项选择题1、博弈论中,参与人的策略有()A 有限的B 无限的C 有限和无限两种情况D 以上都不对参考答案:C解释:在博弈论中,参与人的策略可以是有限的,也可以是无限的,具体取决于博弈的类型和设定。
2、下列属于完全信息静态博弈的是()A 囚徒困境B 斗鸡博弈C 市场进入博弈D 以上都是参考答案:D解释:囚徒困境、斗鸡博弈和市场进入博弈都属于完全信息静态博弈。
3、在一个两人博弈中,如果双方都知道对方的策略空间和收益函数,这被称为()A 完全信息博弈B 不完全信息博弈C 静态博弈D 动态博弈参考答案:A解释:完全信息博弈意味着博弈中的参与人对彼此的策略空间和收益函数都有清晰的了解。
4、占优策略均衡一定是纳什均衡,纳什均衡()是占优策略均衡。
A 一定B 不一定C 一定不D 以上都不对参考答案:B解释:占优策略均衡是一种更强的均衡概念,占优策略均衡一定是纳什均衡,但纳什均衡不一定是占优策略均衡。
5、对于“囚徒困境”博弈,()A 双方都独立依照自身利益行事,结果限于最不利的局面B 双方都独立依照自身利益行事,导致最好的选择C 双方进行合作,得到了最好的结果D 以上说法都不对参考答案:A解释:在“囚徒困境”中,每个囚徒都从自身利益出发选择坦白,最终导致双方都受到较重的惩罚,这是一种个体理性导致集体非理性的结果。
二、多项选择题1、以下属于博弈构成要素的有()A 参与人B 策略C 收益D 信息E 均衡参考答案:ABCDE解释:博弈的构成要素通常包括参与人、策略、收益、信息和均衡等。
参与人是进行博弈的主体;策略是参与人在博弈中可选择的行动方案;收益是参与人采取不同策略所得到的结果;信息是参与人对博弈局面的了解程度;均衡是博弈的稳定状态。
2、常见的博弈类型有()A 完全信息静态博弈B 完全信息动态博弈C 不完全信息静态博弈D 不完全信息动态博弈参考答案:ABCD解释:这四种博弈类型是根据信息是否完全和博弈的进行时态来划分的。
博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。
2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。
用策略性思维来分析问题,从中找出合理策略,实现目标最优。
3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。
4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。
5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。
每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。
博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。
2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。
3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。
4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。
《初级博弈论》复习资料-

《初级博弈论》课程期末复习资料一、客观部分:(单项选择、多项选择、不定项选择、判断)(一)、判断题★考核知识点:博弈方的策略和得益,★考核知识点:两人博弈★考核知识点:静态博弈与动态博弈概念★考核知识点:完全信息博弈的概念★考核知识点:上策均衡★考核知识点:严格下策反复消去法★考核知识点:纳什均衡的一致预测性质★考核知识点:混合策略和严格下策反复消去法★考核知识点:动态博弈的非对称性★考核知识点:纳什均衡的问题★考核知识点:子博弈的概念★考核知识点: 重复博弈的策略、子博弈和均衡路径★考核知识点:唯一纯策略纳什均衡博弈的有限次重复博弈★考核知识点:两人零和博弈的无限次重复博弈★考核知识点:子女对父母的赡养义务★考核知识点:ESS的概念★考核知识点:囚徒的困境★考核知识点:两人博弈★考核知识点:单人博弈★考核知识点:博弈方的能力和理性★考核知识点:上策均衡的概念★考核知识点:严格下策的概念★考核知识点:一致预测的概念★考核知识点:混合策略和严格下策反复消去法★考核知识点:动态博弈的策略和结果★考核知识点:子博弈的概念★考核知识点:子博弈完美纳什均衡的概念★考核知识点:重复博弈的概念★考核知识点:两人零和博弈的有限次重复博弈★考核知识点:无限次重复博弈★考核知识点:有限理性博弈分析框架★考核知识点:ESS的概念★考核知识点: 囚徒的困境★考核知识点: 赌胜博弈★考核知识点: 博弈过程★考核知识点: 非合作博弈的概念★考核知识点: 严格下策的概念★考核知识点: 纳什均衡的一致预测性质★考核知识点: 上策均衡和纳什均衡的关系★考核知识点: 上策均衡和帕累托最优的均衡,★考核知识点: 相机选择和策略中的可信性问题,★考核知识点: 逆推归纳法★考核知识点: 子博弈的概念★考核知识点: 重复博弈的得益★考核知识点: 有限次重复博弈★考核知识点: 触发策略★考核知识点: 有限理性博弈分析框架★考核知识点: ESS的概念,二、主观部分:(一)、简答★考核知识点:游戏与博弈附2.1.1(考核知识点解释)游戏和博弈的共同特征:①都有一定的规则,规定游戏的参加者可以做什么,不可以做什么,应当按怎样的顺序做,什么时候游戏结束或一旦参加者犯规怎样处罚。
博弈论复习题及答案

博弈论复习题及答案博弈论是研究决策者在相互影响的情况下如何做出决策的理论。
以下是一些博弈论的复习题及答案,供学习者参考:一、选择题1. 博弈论中最基本的博弈类型是什么?A. 零和博弈B. 非零和博弈C. 完全信息博弈D. 不完全信息博弈答案: A. 零和博弈2. 在博弈论中,纳什均衡指的是什么?A. 一种博弈的最终结果B. 一种博弈的初始状态C. 一种策略组合,其中没有任何一个参与者能够通过单方面改变策略而获得更好的结果D. 一种策略组合,其中所有参与者都希望改变策略以获得更好的结果答案: C. 一种策略组合,其中没有任何一个参与者能够通过单方面改变策略而获得更好的结果3. 囚徒困境中,两个囚犯的最优策略是什么?A. 相互合作B. 相互背叛C. 一个合作,一个背叛D. 一个背叛,一个合作答案: B. 相互背叛二、简答题1. 解释什么是“混合策略”并给出一个例子。
答案:混合策略是指参与者在博弈中选择不同策略的概率分布。
例如,在石头、剪刀、布的游戏中,一个玩家可能会以1/3的概率选择石头,1/3的概率选择剪刀,和1/3的概率选择布,这就是一个混合策略的例子。
2. 描述什么是“重复博弈”以及它与单次博弈的区别。
答案:重复博弈是指同样的博弈结构在一定时间内多次进行。
与单次博弈相比,重复博弈允许参与者根据对手过去的行动来调整自己的策略,这可能会导致合作行为的出现,因为参与者会考虑到未来博弈的潜在收益。
三、论述题1. 论述博弈论在经济学中的应用,并给出至少两个具体的例子。
答案:博弈论在经济学中有广泛的应用。
例如:- 拍卖理论:博弈论可以用来分析拍卖中的竞价行为,确定最优的拍卖机制。
- 竞争策略:企业在制定市场进入、定价和广告策略时,会使用博弈论来预测竞争对手的行为并做出相应的决策。
2. 讨论囚徒困境在现实世界中可能的应用场景,并解释为什么合作有时是困难的。
答案:囚徒困境在现实世界中的应用场景包括但不限于:- 国际关系:国家之间的军备竞赛可以看作是囚徒困境的一种形式,合作减少军备可以带来共同的利益,但由于缺乏信任,每个国家都倾向于增加自己的军备。
博弈论复习题及答案

博弈论2、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)如果双方都不涨价,各得利润10单位;(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;求纳什均衡。
博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡称为博弈的解。
3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。
按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。
谁去按按纽则谁后到;都去按则同时到。
若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。
各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):小猪按等待大猪按 5,1 4,4等待 9,-1 0,0求纳什均衡。
在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。
即不管大猪选择按还是不按,小猪的最佳策略都是等待。
也就是说,无论如何,小猪都只会选择等待。
这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。
所以纳什均衡是(大猪按,小猪等待)。
4、根据两人博弈的支付矩阵回答问题:a bAB(1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分)(2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。
(3)求出该博弈的混合策略纳什均衡。
(7分)(1)策略甲:AB乙:ab博弈树(草图如下:(2)Pure NE (A, a); (B, b)都是Pareto 有效,仅(B, b)是K-H有效。
博弈论总复习提纲

总复习内容一、静态博弈部分1、纯策略均衡的博弈模型---------“囚徒”困境博弈需要解决的问题:要求会画支付矩阵、分析博弈的结果(即均衡分析)、会通过博弈分析的方法,解决与这类博弈相同或相近的实际问题,就是由此博弈衍生出来的问题,就所谓制度、规则等对于结果的重要性分析。
2、混合策略博弈模型要求:懂得如何判断什么情况下博弈属于混合策略博弈------即博弈没有纯策略博弈存在的情况下,就转化成混合策略博弈。
要求:会计算混合策略的概率罪犯不盗 盗巡逻 警察休息要求:会用混合策略博弈的原理解释“监管者与被监管者”之间博弈过程中的制度安排,以避免管理中“激励悖论”问题。
二、动态博弈部分1、要求:熟悉动态博弈的概念、博弈方策略、支付的表达形式,即博弈树或扩展型。
2、要求:弄懂博弈树中信息节点处的数字含义。
如:3、通过博弈树的研究分析,能找到动态博弈的均衡路径或者叫策略均衡4、能解释一些其他由此衍生出的博弈问题。
三、合作博弈问题1、弄清楚合作博弈与非合作博弈的区别与联系以及它们之间的转化条件2、合作博弈的利益分配和成本分担问题3、合作博弈联盟的规模及稳定性问题分析。
博弈根据是否可以达成具有约束力的协议分为合作博弈和非合作博弈。
合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。
合作博弈采取的是一种合作的方式,或者说是一种妥协。
妥协其所以能够增进妥协双方的利益以及整个社会的利益,就是因为合作博弈能够产生一种合作剩余。
这种剩余就是从这种关系和方式中产生出来的,且以此为限。
至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和技巧运用。
因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。
在这里,合作剩余的分配既是妥协的结果,又是达成妥协的条件。
合作博弈是研究人们达成合作时如何分配合作得到的收益,即收益分配问题。
而非合作博弈是研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。
(完整版)博弈论知识点总结

博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P,l),其中P为市场价格,丨为消费者可支配收入。
2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
名词解释:1,共同知识:是指所有当事人对该事件都知道,并且也所有当事人都知道其他当事人也知道这一事件,并且所有当事人都知道所有当事人都知道这一事件。
那么该事件就是共同知识。
2,先动优势:在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。
这种局中人先动得益大于后行得益的情况,叫做先动优势。
3,后动优势:后行动的得益比先行动的得益大的情况4,信息集:我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。
•单点集:我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。
•触发策略:即只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。
•冷酷策略:双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛。
即任何局中人的一次性不合作将触发永远不合作。
•礼尚往来策略:开始的时候和冷酷策略一样,即双方从合作开始,在以后的每个阶段,如果你的对手在最近的一次博弈中还是采取合作策略,则你继续跟他合作;如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略惩罚他,但是如果你的对手在下一次博弈中改邪归正,采用合作策略,则你在下次继续博弈中还是跟他合作。
触发策略是带有奖励和惩罚措施的一种博弈机制。
在这个机制中,惩罚措施是其中的关键。
注意:(1),一个信息集罩住的必须是同一个局中人的决策点。
•必须是同一个局中人在同一个时点的决策节点。
同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。
因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。
简答题:1,博弈的构成要素:•局中人决策主体,目的是通过选择行动(或策略)以最大化自己的支付(效用、得益)水平。
2)行动参与人在博弈的某个时点的决策变量。
3)策略策略是参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。
4)信息•——参与人有关博弈的知识。
•完美信息是指所有参与人在博弈进行过程的每一时刻,对所有参与人曾经采取的决策或者行动完全清楚。
•完全信息是参与者对所有参与者的特征、策略空间及策略组合下的支付有“完全的了解”。
即参与人的特征,策略空间和支付函数均为博弈各方的“共同知识”。
•完全信息可以是完美的,也可是不完美的。
5)支付(收益)函数•收益(支付)函数:在特定的策略组合下参与人得到的确定效用水平,或是期望水平。
•支付通常用矩阵来表示(一般适用于静态博弈)。
•也可以用博弈树来表示(一般适用于动态博弈)2,策略与行动的区别•如果一个博弈仅仅只是局中人一次性的同时行动对局,那么每个局中人的策略就是他能采取的行动。
所以在同时决策博弈中,策略就是行动,行动就是策略。
•但是在序贯博弈中,当局中人按决策的先后次序进行时,后行动的局中人可以对其他局中人或他自己先前采取的行动作出回应。
因此,设想后行动人应该会盘算一个完整的行动计划:“如果对手采取行动A,我则采取行动X,但如果对手采取行动B,我将采取行动Y”,这个完整的计划就构成局中人在博弈中的一个策略。
行动顺序(——同时决策——序贯决策时决策——局中人在决策时不知道对手的决策或者行动是什么。
被称为静态博弈。
注意:“同时”不是物理概念。
后或序贯决策——行动有先后次序,后行动者能看到先行动者的决策。
被称为动态博弈或序贯博弈策略策略是参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。
•纯策略:如果一个策略规定参与人在一个给定的信息情况下只选择一种特定的行动。
•混合策略:如果一个策略规定参与人在给定的信息情况下,以某种概率分布随机地选择不同的行动。
行动与策略在同时决策博弈中,行动就是策略。
•但在序贯决策博弈中,行动是指每一个决策点上局中人的决策变量或行动的具体抉择。
策略就是一个完整的行动计划“垄断者”的有四个纯策略:•不管你怎样,我总是容忍——{容忍,容忍}•不管你怎样,我总是对抗——{对抗,对抗}•你进我对抗,你不进我忍——{对抗,容忍}•你进我忍,你不进我对抗——{容忍,对抗}该博弈有八种可能的策略组合:•( {进入},{(上)容忍,(下)容忍} )•( {进入},{(上)对抗,(下)对抗} )•( {进入},{(上)对抗,(下)容忍} )•( {进入},{(上)容忍,(下)对抗} )•( {不进},{(上)容忍,(下)容忍} )•( {不进},{(上)对抗,(下)对抗} )•( {不进},{(上)对抗,(下)容忍} )•( {不进},{(上)容忍,(下)对抗} )策略性行动可以分为:承诺、威胁和允诺。
承诺:假如轮到B要行动时,A说:“在接下来的博弈中,我将采取行动X”,这意味着无论B此时采取什么行动,A采取X行动是无条件的。
这种策略性行动被称为“承诺”。
威胁和允诺是一种条件依存性的策略性行动。
“如果你选择…,我会选择…”,即A所采取的行动取决于B的行为。
我们称这种行动选择为反映规则或反应函数。
威胁:“除非你把碗里的蔬菜吃完,否则不准吃糖果!”允诺:“如果你考试第一名,我带你去迪斯尼玩!”承诺与威胁与允诺的区别•承诺是无条件的策略性行动•而威胁和允诺则是条件依存的策略性行动,属于反应函数或者反应规则的范畴。
承诺从支付上判断有时是不可信的,•承诺可信要满足三个条件:•(1)可观察•(2)不可逆转•(3)承诺后的收益大于不承诺前的收益•威胁一这这如果对手采取与你利益相违背的行动,他们将遭受损失。
因此实施威胁的目的在于防止他人对你做出不利的事情。
•允诺意味着如果对手采取对你有利的行动,他们将得到好处。
因此实施允诺的目的在于引导他人做出一些对你有利的事情,具有诱导功能。
子博弈•1、子博弈不能从第一个阶段开始,因为原来的博弈(母博弈)本身不能称为子博弈,即子博弈集合是一个真子集合。
树形博弈的子博弈•2、子博弈不能分割原来博弈(母博弈)的信息集。
注:只有B,C,H是子博弈,因为F后面有一支在红圈以内,另外A不是。
子博弈精炼纳什均衡•定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
•子博弈完美纳什均衡能够排除均衡策略中不可信的威胁(允诺)和承诺,因此是真正稳定的。
•逆推归纳法(倒推法)是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
•子博弈精炼纳什均衡本身也是纳什均衡,但却比纳什均衡更强的均衡概念。
•子博弈精炼纳什均衡能够排除不是结果的纳什均衡。
例如:情侣博弈中,(足球,{足球,足球})和(芭蕾,{芭蕾,芭蕾})策略不是子博弈精炼纳什均衡,因此不是最终的结果。
图见P179。
•如果一个策略组合的某个策略成分有偏离的激励,我们可以说这个策略组合缺乏局部稳定性,不是子博弈精炼纳什均衡。
•子博弈完美纳什均衡一定是纳什均衡,但纳什均衡不一定是子博弈完美纳什均衡。
纳什均衡:•均衡:所有参与人的最优策略的组合。
在博弈达到均衡时,局中每一个博弈者都不可能因为单方面改变自己的策略而增加收益,于是各方为了自己利益的最大化而选择了某种最优策略,并与其他对手达成了某种暂时的平衡。
•纳什均衡:局中人单独改变策略不会得到好处的对局策略组合。
混合策略纳什均衡:(?)•在静态博弈里,纯策略等价于特定的行动,混合策略是不同行动之间的随机选择。
在矩阵中用下划线法,如果一个方框中有两个数字都有下划线,即为纯策略纳什均衡,有多个为混合策略纳什均衡纯策略纳什均衡假定如果前锋踢向球门的左方,当守门员扑向右方时,前锋将是得分的把握80% ,当守门员扑向左方时,前锋得分的把握50%。
•如果前锋踢向球门的右方,当守门员扑向左方时,前锋得分的把握90%,当守门员扑向右方时,前锋得分的把握是20%。
注:前锋的得分,就为守门员的失分。
•画出这个竞争博弈的支付矩阵,并求纳什均衡.•计算得前锋应该按概率0.7踢向左方,而守门员应该按概率0.6扑向左方。
•这些概率使得无论对方采取什么策略,双方都得到相等的收益。
即当前锋选择p=0.7时,守门员扑向左方和右方无差异,即不会影响前锋的收益,但他会乐意以0.6的概率扑向左方。
同样,当守门员选择q=0.6时,前锋踢向左方和右方无差异,但他会乐意以0.7的概率踢向左方。
•这就形成了纳什均衡。
给定对方的选择,每一个参与人的选择都是最优的。
•当p<0.7时,守门员将扑向左方;当p>0.7时,守门员将扑向右方。
类似的,当q<0.6时,前锋将踢向左方;当q>0.6时,前锋将踢向右方。
计算题:(1)古诺模型:寡占的斯塔克尔博格模型•先后选择产量的产量竞争博弈•把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。
•用倒推法,因此从分析厂商2的产量选择开始,再分析上一阶段的厂商1的产量选择。
•1、先分析厂商2•假设P(Q1+Q2)=a- (Q1+Q2), MC2=MC1=c,没有固定成本,厂商2的利润函数为:л2=[a- (Q1+Q2)]Q2-cQ2利润最大化的一阶条件为:a-Q1-2Q2-c=0即:Q2=(a-c-Q1)/2•2、再分析厂商1•由于完全信息,厂商1的利润函数为:л1=[a-(Q1+Q2)]Q1-cQ1•将Q2=(a-c-Q1)/2代入上式得:•利润最大化的一阶条件为:a/2-bQ1=0。
•Q1=(a-c)/2, Q2=(a-c)/4。
•结论:•1、该博弈领导者决定的产量(a-c)/2要大于追随者的产量(a-c)/4 。
领导者的所得的利润也要大于追随者的利润,即“谁先动谁占优”。
•2、斯塔克尔博格模型的产量(a-c)/2 + (a-c)/4 =3(a-c)/4要大于古诺模型的产量2(a-c)/3。
因此,市场有一个领导者比各厂商势均力敌时更好。
•两模型之间的区别:•斯塔克尔博格模型中两个寡头先后选择的产量之和要大于古诺模型中两个寡头同时选择的产量之和,而斯塔克尔博格模型中两个寡头利润之和则小于古诺模型的两个寡头利润之和。
因此,市场有一个领导者比各厂商势均力敌时对消费者而言更好,因为斯塔克尔博格模型与古诺模型相比产量大了,价格低了。
•斯塔克尔博格模型中博弈领导者决定的产量要大于追随者的产量,领导者的所得的利润也要大于追随者的利润,即斯塔克尔博格模型具有先动优势“谁先动谁占优。
(3)讨价还价博弈:局中人1、2对1万元进行分配,由局中人1先提出一个分配比例,使自己得S1,如果局中人2同意就成交,若局中人2不同意,他可以拒绝,他可以重新提出分配比例使局中人1得S2;若局中人1同意则成交,不同意,他也可以重新提出分配比例,使自己得S,这时局中人2必须同意。