博弈论(整理过名词解释和简答)
博弈论名词解释
博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。
在博弈论中,玩家通过制定决策来实现自己的利益,同时也要考虑其他玩家的决策对自己利益的影响。
博弈论的研究对象是在有限的资源和信息条件下,决策制定者之间的相互作用。
以下是一些常见的博弈论名词解释:1. 纳什均衡(Nash equilibrium):是指在博弈过程中,每个玩家依据其他玩家的行为选择自己的最佳策略,而没有动机单方面改变策略。
纳什均衡是一种稳定状态,即每个玩家的策略都是最优的。
2. 零和博弈(zero-sum game):是指一个玩家的收益与另一个玩家的损失完全相等,总收益为零。
在零和博弈中,一个玩家的利益的增加必然导致另一个玩家的利益的减少,双方利益存在完全的对立关系。
3. 非零和博弈(non-zero-sum game):是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。
在非零和博弈中,玩家之间的利益可以相互协调、互利互惠。
4. 博弈树(game tree):是博弈论中常用的一种图形表示方式,用于展示博弈过程中的决策步骤和可能的结果。
博弈树由顶点和边组成,顶点表示玩家的决策点,边表示不同的行动选择。
5. 最优策略(optimal strategy):在博弈论中,最优策略是指玩家的最佳选择,使得在对手的任何策略下,自身获得最大利益。
最优策略可能根据玩家的目标和信息不同而变化。
6. 合作与背叛(cooperation and defection):博弈论中常涉及到的两个关键概念。
合作指玩家之间通过协调行动来获得共同利益,背叛指玩家为了自身利益而选择对方不合作。
7. 博弈矩阵(game matrix):是一种表示博弈参与者和策略选择关系的表格。
博弈矩阵以参与者为行,以策略选择为列,用数字表示参与者在不同策略下的收益情况。
8. 支配策略(dominant strategy):在博弈论中,一种策略如果在所有可能的对手策略下都能带来最佳结果,则被称为支配策略。
博弈论期末复习重点
1、博弈:一些个人、队组或其他组织;面对一定的环境条件;在一定的规则下;同时或先后;一次或多次;从各自允许选择的行为或策略中进行选择并加以实施;各自去得相应结果的过程..2、博弈论:就是系统研究各种博弈问题;寻求在各博弈方具有充分或者有限理性、能力的条件下;合理的策略选择和合理选择策略时博弈的结果;并分析这些结果的经济意义、效率意义的理论和方法..3、囚徒的困境:两决策者从各自最大的利益出发选择行为;结果是既没有实现两人总体的最大利益;也没有真正实现自身的个体的最大利益..4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈..5、动态博弈:各博弈方的选择和行动不仅有先后次序;而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动;甚至还包括自己的选择和行动;6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息..7、不完全信息不对称信息:是指经济行为主体掌握了某种经济环境状态的部分信息..8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解..9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程..10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策;那么这个策略组合肯定是所有博弈方都愿意选择的;必然是该博弈比较稳定的结果..11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略..在两人博弈的情况下;“给定你的策略;我的策略就是我最好的策略;给定我的策略;你的策略也是你的最好的策略”..12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决策方式..13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡..这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益..14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈..15、完全且完美信息动态博弈:动态博弈中既是完全信息又是完美信息的部分16、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中;各博弈方的策略均衡构成的一个策略组合满足;在整个动态博弈及它的所有子博弈中都构成纳什均衡;那么这个策略组合称为该动态博弈的一个~17、逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析;逐步倒推回前一个阶段相应博弈方的行为选择;一直到第一阶段的分析方法..18、颤抖手均衡:在博弈时也要考虑到合作者可能会发生轻微的失误而影响整个结果;即使在这种小概率事件发生时;所选策略依然是最优的.. 19、道德风险:从事经济活动的人在最大限度地增进自身效用时作出不利于他人的行动;损害委托人或是其他代理人的利益..交易后的信息不对称性;掌握较多信息的一方在交易后的利己倾向;如隐瞒欺骗、不负责任、不努力工作..20、逆向选择:指交易双方在交易前的信息不对称;导致市场上交易的劣质商品的比例越来越高;甚至导致优质品完全被驱出市场的一种现象..简答210%一、设定一个博弈模型必须确定的方面:1、博弈方:即博弈中进行决策并承担结果的参与者;2、各博弈方各自可选择的全部策略或行为的集合策略空间:即博弈方选择的内容;可以是方向、取舍选择、量值;3、进行博弈的次序:即博弈方行为、选择的优先次序或重复次数等..次序不同一般就是不同的博弈;即使博弈的其他方面都相同;4、博弈方的得益:即博弈方行为、策略选择的相应后果、结果必须是数量或者能够折算成数量;对应于各博弈方的每一组可能的决策选择都应有一个结果表示该策略组合下各博弈方的所得或所失..得益应该是客观存在;但不意味着各博弈方都了解各方的得益情况..5、信息结构;即博弈方相互对其他博弈方行为或最终利益的了解程度;6、行为逻辑和理性程度;即博弈方是依据个体理性还是集体理性行为以及理性的程度等..二、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子..1、烟草厂商新产品的开发、价格定位的效果;常常取决于其他厂商、竞争对手的相关竞争策略..例如某卷烟厂推出一种高价烟;该计划能否成功常取决于其他厂商是否采取同样的策略、如果其他厂商也推出高价烟而且档次宣传力度比前者还要高、大;那么前者的计划成功的难度就很大;但如果没有其他厂商推出同类产品;那前述某厂的计划成功的可能性就大;2、房地产开发企业在选址、开发规模、目标客户定位等方面也常常存在相互制约的问题..例如一个城市当时的住房需求约10000平方米;如果其他厂商已经开发了8000平方米;那么你再开发5000平方米就会导致供过于求;销售就会发生困难;但如果其他厂商只开发不到5000平方米;那么你的5000平方米就是合理的..3、麦当劳的新产品所带来的收益、价格产量、产品开发三、“囚徒困境”内在根源是举出现实生活中的具体例子..根源在于个体之间存在行为和利益相互制约的博弈结构中;以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益;并实现整体、个体利益共同的最优..简单第说;都是个体理性与集体理性的矛盾引起的..四、分析保险市场、资本市场道德风险的逆向选择..1、汽车保险:假设张三有财产¥100000;其冯诺依曼-摩根斯坦效用指数为对数函数;即UW=lnW;并有价值为¥ 20000的汽车一辆..如果该汽车没有向保险公司投保;将有25%的可能性被偷窃..因此;期望效用为:0.75U100000+0. 25U80000=0.751nl00000+0.25ln80000=11.457l;如果保险公司只索取成本而管理成本为0;那么;公平的保险费用为¥ 20000× 0.25=¥ 5000..如果张三将汽车完全保险;无论汽车是否被盗;其财富都是¥95000;预期效用U95000=ln95000=11. 4616因此;当张三购买公平保险后;其效用高于不购买保险..现在讨论张三是否安装防盗装置的问题;假设安装一个防盗装置的成本为¥1950;如果安装该装置、汽车被盗概率从0.25减小到0.15..如果没有投保;安装防盗装置的预期收益¥20000×0.10=¥ 2000超过成本;因而安装防盗装置有效率;其期望效用为:0.85ln100000-1950+0.15ln100000-2000-1950=11.4590超过不安装的期望效用11.457l;因此;如果张三没有投保;那么;购买防盗装置是理性的..但是;当张三投保后;情况发生了变化..假设张三购买汽车保险的价格是¥ 5200其中¥ 5000为预期损失;¥200为管理费..如果保险公司并不检查投保人是否安装防盗装置;那么;投保的预期效用为1n94800=11.4595;该预期效用超过安装防盗装置的预期效用..张三将会选择投保..但投保后将没有动力安装防盗保险装置;并且可能产生麻痹心而提高被盗的可能性..结果、发生火灾的概率从0.005上升到0.008;保险公司的实际预期损失为¥800..结果;每出售一张保险单平均都会损失S300..这种保险单对于保险公司来说不可行..由于代理人隐蔽行动难以观察;火灾保险市场经常出现投保人经营亏损后;有意纵火索取高额保险金的案例..2、火灾保险的道德风险:假设某厂商产品仓库价值为¥100000;厂商采取防火措施的成本为¥50..采取防火措施后小心谨慎;发生火灾概率为0.005;没有防火措施且疏于防范;发生火灾概率为0.008..又假设保险公司以预期火灾损失¥500;以此作为保险费用出售保险单..在这种环境下;如果厂商向保险公司投保后;就可能不会有动力继续执行防火措施;且可能疏于防范..3、健康保险市场:投保人一旦获得健康保险;相当于降低投保人的医疗护理费用..因此;理性的个人将增加他在这方面的消费量;相应地增加了医疗保险支付的数量;即增加社会成本的数额;因为个人保险费的增加意味着社会医疗支出费用的增加..在这种状态下;社会的风险服务和医疗服务都将低效率..4、资本市场:每个借贷者要求同样数目的贷款条件下;银行不能将借款者按照回报率的大小给予不同的利息率..银行能否收回贷款并获得利润;既取决于借款者的经济效益;也取决于银行所处环境状态的各种不确定性..当银行以借款者的经济收益为利息率标准时;借款者就会利用银行难以观察或不可能观察到的隐蔽行动采取相应行动;如虚报利润额、非法转移资金;人为地扩大成本等道德风险行为;由此使银行承担的风险比签定委托-代理合同前有所增加..5、证券市场的“逆向选择”:在信息不对称的情况下;投资者无法确定哪些上市公司是高质量的、有投资价值的公司;哪些是低质量的上市公司..因此;投资者在作出投资决策时;往往只能根据整个市场所有发行企业的平均质量来决定其愿意投资的价格..这种投资者的“折中”行为就会抑制那些高于平均质量水平的发行企业提高经济效率和管理水平的积极性;而鼓励投资者向低质量企业流动..因为高于平均质量水平的上市公司并不能在证券市场体现其应有的价值;因此就会造成高质量企业不情愿进入证券市场..造成低质量的上市公司横行于证券市场..信息不对称的结果造成股票价格与上市公司经营业绩的背离则使证券市场失去了评价上市公司业绩、约束上市公司经营行为的市场机制;这种市场选择的结果只会导致整个市场的上市公司质量的降低;并成为市场过度投机的主要根源;最终会导致市场的低效率甚至是市场的崩溃..判断一、博弈的分类方法:1、行为逻辑;是否允许存在有约束力协议:合作博弈、非合作博弈2、理性层次:完全理性博弈、有限理性博弈进化博弈;3、博弈过程:静态博弈、动态博弈、重复博弈4、信息结构:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈;5、得益特征:零和博弈、常和博弈、变和博弈6、博弈方数量:单人博弈、两人博弈、多人博弈;7、策略数量:有限博弈、无限博弈二、上策均衡、纳什均衡、严格下策反复消去法的关系区别:1、上策均衡是各博弈方绝对最优策略的组合;而纳什均衡则是各博弈方相对最优策略的组合..上策均衡一定是纳什均衡;但纳什均衡不一定就是上策均衡..对同一个博弈来说;上策均衡的集合就是纳什均衡集合的子集;但不一定是真子集;2、严格下策反复消去法与上策均衡分布对应两种有一定相对性的决策分析思路:严格~对应排除法即排除绝对最差策略的分析方法..上策~对应选择法;即选择绝对最优策略的均衡概念..二者并不矛盾;甚至可以相互补充..严格~不会消去任何上策均衡;可以简化博弈;3、严格~和纳什均衡也是相容和补充的;严格~不会消去任何上策均衡;可以简化博弈;使纳什均衡分析更加容易..。
博弈名词解释
一、名词解释:1、零和游戏——游戏者有输有赢,但整个游戏的总成绩永远为零。
2、纳什均衡——只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。
这一点就是纳什均衡。
3、帕累托最优——指资源分配的一种状态,在不使任何人境况变坏的情况下,不可能再使某些人的处境变好。
说得更经济学点,群体所有的社会资源的配置已将整个群体的效用最大化了,没人能够在不减损别人的利益的同时改善自己的利益。
二、简答题1.博弈的四个要素是什么?1.博弈要有2个或2个以上的参与者(Player)。
2.博弈要有参与各方争夺的资源或收益(Resources或Payoff)。
3. 参与者有自己能够选择的策略(Strategy)。
4. 参与者拥有一定量的信息(Information)。
2.什么是触发策略?触发策略有何优点如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略(Trigger strategy),或称冷酷策略好的策略必须具有的一个特点是“清晰性”,针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。
如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。
因此,只要有人采取触发策略,那么双方均愿意采取合作策略。
3.请描述“囚徒困境”的案例。
两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年;如果都不坦白则各判1年。
从表面上看,他们应该互相合作,保持沉默。
但他们不得不仔细考虑对方可能采取什么选择。
甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。
甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。
博弈论名词解释
博弈论名词解释(总2页) -CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除博弈名词解释1.博弈论: 根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论。
2.参与人(局中人)(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
3.策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
4.信息(information):参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识。
5.支付(payoff)函数:,参与人从博弈中获得的效用水平,它是所有参与人取定的一组策略的函数。
6.结果(outcome):博弈者感兴趣的要素的集合。
7.静态博弈:在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。
8.动态博弈:在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
9.零和游戏(零和博弈):属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。
双方不存在合作的可能。
零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。
两个人下棋、或是打乒乓球。
10.常和博弈:又叫非零和博弈,是指各博弈方的得益之和是一个非零的常数。
自己的所得并不与他人的所失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而合作。
博弈论名词解释
博弈论名词解释博弈论名词解释1、博弈:是指代表不同利益主体的决策者,在⼀定的环境条件和规则下,同时或先后、⼀次或多次从各⾃允许选择的⾏动⽅案中加以选择并实施。
从⽽取得各⾃相应结果的活动。
2、参与⼈:也称局中⼈或博弈⽅。
是指博弈中能独⽴决策、独⽴⾏动并承担决策结果的利益主体。
3、⾏动:是参与⼈在博弈的某个时点的决策变量。
4、博弈信息:是参与⼈在博弈中的知识,包括博弈的环境条件、博弈的规则、⾃然的“安排”、其他参与⼈的特征及⾏为、博弈的结果、进程等等。
5、策略:是指各博弈⽅可选择的⾏动⽅案,亦称战略。
6、纯策略:指⼀个策略规定参与⼈在每⼀个给定的信息情况下只选择⼀种特定的⾏动。
7、混合策略:指⼀个策略规定参与⼈在给定信息情况下以某种概率分布随机地选择不同的⾏动。
8、⽀付函数:也称得益。
是指博弈⽅(参与⼈)策略实施后所获得的效⽤⽔平。
9、结果:是指博弈分析者所探寻的各种要素的集合,⽐如策略组合、⽀付向量等。
10、纳什均衡:是指在对⽅策略确定的情况下,每个参与⼈的策略都是最好的。
此时没有⼈愿意单独改变⾃⼰的策略。
11、两⼈博弈:就是参与⼈是两⽅的博弈。
12、多⼈博弈:是参与⼈有三个或三个以上的博弈。
13、零和博弈:每个⽀付向量的“总和”始终等于零的博弈称为零和博弈。
14、常和博弈:我们把每个⽀付向量的“总和”始终等于某个常数的博弈称为常和博弈。
15、变和博弈:我们把每个⽀付向量的“总和”并不相同的博弈称为变和博弈。
16、静态博弈:我们把所有参与⼈同时或可看作同时选择策略的博弈称为静态博弈。
17、动态博弈:我们把各参与⼈不是同时,⽽是先后、依次进⾏选择、⾏动。
⽽且后选择⾏为的参与⼈通常能观察到先进⾏选择、⾏为的参与⼈的选择、⾏为的博弈称为动态博弈。
18、重复博弈:就是同样结构的博弈重复进⾏多次。
19、完全信息博弈:如果所有策略组合下的⽀付向量都是共同知识,我们就说这⼀博弈是“完全信息”的,称为完全信息博弈。
博弈论考试重点
一、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
博弈论 研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中 博弈论是研究经济主体的二、博弈论基本要素博弈参与者、各博弈方各自可选择的全部策略或行为的集合、进行博弈的次序、博弈方的利益、博弈行为、博弈信息、结果、均衡三、名词解释静态博弈:同时决策或者同时行动的博弈属于静态博弈—田忌赛马、猜硬币、古诺模型动态博弈:先后或序贯决策或者行动的博弈属于动态博弈—弈棋、市场进入、领导完全信息博弈:所有博弈方都清楚其他博弈方的得益状况不完全信息博弈(贝叶斯博弈):至少有一个博弈方不完全清楚其他博弈方的得益或得益函数囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈纳什均衡:在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的冷酷战略:重复博弈中,任何博弈方的一次性不合作将引起其他博弈方的永远不合作,从而导致的所有博弈方的收益减少。
针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛重复博弈:静态或动态博弈的重复进行,即重复进行的博弈过程聚点均衡:在理论上一个博弈中可能有多个纳什均衡点,这时在现实生活中,行为人往往利用在理论上省略掉的那些信息,找到一个大家都感兴趣的点,这个点往往成为现实世界中博弈的最终解。
当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡卡尔多-希克斯标准:一种变革使得受益者的所得足以弥补受损者的所失,这种变革就是卡尔多-希克斯改进。
博弈论复习题
博弈论复习题一、名词解释1.博弈:即若干个人、队组或其他组织,面对一定的环境,在一定的规则下,同时或先后,一次或多次,从各自允许的行动或策略中进行选择并加以实施,各自取得相应结果或收益的过程。
2.囚徒困境:囚徒困境是两个嫌疑犯作案后被警察抓住,分别被关在不同房间审讯。
警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(因证据不足);如果其中一人坦白另—人抵赖,坦白者放出去,抵赖的判刑10年。
结果,两个嫌疑犯都选择坦白,各判刑八年。
事实上,如果两人都抵赖,各判一年,显然这个结果好,但帕累托改进办不到,因为它不能满足人类的理性要求。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性,聪明的人类会因为自己的聪明而作茧自缚。
它是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择,揭示了个人理性和集体理性的矛盾。
3.非合作博弈与合作博弈:非合作博弈与合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议。
如果有,就是合作博弈;如果没有,就是非合作博弈。
4.常和博弈与变和博弈:零和博弈是指在任意战略组合下“总支付”均为零的博弈,如通常的打赌博弈.常和博弈是指在任意战略组合下“总支付”均为一个常数的博弈,如若干个人分一笔固定奖金的博弈.变和博弈也称非常和博弈,意味着不同的策略组合或结果下各博弈方的得益之和一般是不相同的.5.博弈论:博弈论是研究决策主体的行动发生直接相互作用时候的决策以及这种决策的均衡问题的,也就是说,当一个主体,好比一个人或一个企业的选择受到其它人或其它企业选择的影响,而且反过来影响其它人、其它企业选择时的决策问题和均衡问题.6.战略:也称策略,是参与人在给定信息集的情况下的行动规则,它规定参与人在何时采用哪种行动;也是一种“相机行动方案”,指导参与人如何对其它参与人的行动做出反应.7.均衡:是指所有参与人的最优的战略组合,在均衡战略组合下,任何参与人没有改变自己战略的动机,即如果改变战略,自己的支付不会得到增加或效用得到改善.8.均衡路径:一个纳什均衡结果在博弈树中所形成的路径.9.占优均衡:在一个博弈中,如果每个参与人都有“占优战略”存在,那么每个参与人的占优战略的组合就称为“占优战略均衡”,并且是唯一的“占优战略均衡”.(一个战略称为某个参与人的“占优战略”是指不管其他参与人选择什么战略,这个战略都是该参与人的最好的战略.)10.重复剔除劣战略的占优均衡:对于一个理性的参与人,是不可能选择“劣策略”的,因此可以在战略式表述(支付矩阵)中将其剔除,再重新构造一个不含这个“劣策略”的新的博弈,然后在新的博弈中寻找某个参与人的劣策略,再将其从博弈中剔除,重复进行下去,直到剩下唯一一个战略组合,该组合称为“重复剔除劣战略的占优均衡”.11.纳什均衡:纳什均衡是指这样的一个战略组合:在这个战略组合之下,所有参与人都没有改变战略的动机,即改变战略不会给该参与人带来支付的增加或效用的改善.12.混合战略:混合战略指的是参与人以一定的概率选择某种战略。
博弈论复习题及答案完整版
博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。
2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。
用策略性思维来分析问题,从中找出合理策略,实现目标最优。
3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。
4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。
5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。
每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。
博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。
2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。
3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。
4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。
博弈论基础复习
《博弈论基础》主要知识点一、名词解释(5×2=10分)策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。
纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。
混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。
扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。
博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。
博弈树类似于状态图和问题求解搜索中使用的搜索树。
完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。
子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。
行为策略是指每一个参与人在每一个信息集上随机的选择行动。
逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。
在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。
冷酷策略又称触发策略。
指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。
类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。
信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。
分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。
混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。
特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。
联盟二、选择题(5×2=10分)三、简答题(28-30分)1.博弈的分类及相关概念。
博弈论知识点总结完整版
博弈论一:基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈:a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足:uisi;s-i>uisi';s-is-i; si' sib、占优均衡:一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡:a、“严劣”和“弱劣”的含义:设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义:重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二:纳什均衡Nash Equilibrium2.1纳什均衡定义:对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即:u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义:纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合:当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择;没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理:Nash在1950年证明:任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立;定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三:混合策略Mixed Strategies 纳什均衡3.1定义:混合策略的定义:在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是: UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义:基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义:对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法:a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四:多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是:在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如:参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点:人们通常会协调彼此的行为..你弱他就强;先例产生的影响远大于逻辑或者法律效力;人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义:如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五:动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合:i=1; … ;N..用N表示虚拟参与人“自然”;自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动;参与人的行动空间actionset:在每次行动时;参与人可选择的行动集合;参与人的信息集information set:每次行动时参与人知道什么;参与人的收益函数:在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是:各阶段各参与人的行动数目有限;博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点;终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注:每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义:当A选择开发时;B选择大括号中前面的策略;当A选择不开发时;B选择大括号中后面的策略..B的纯策略为:{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为:SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法:a逆向归纳法求解策略:从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较:如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件:x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法:前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是:参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理:令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..(七)不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
博弈论(名词解释和简答)
博弈论名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。
博弈论名词解释(修改)
博弈论名词解释(修改)1.有限博弈:一个博弈中每个博弈方的策略数都是有限的。
常见的是数种策略。
无限博弈:一个博弈中至少有某些博弈方的策略有无限多个。
零和博弈:一方的得益必定是另一方的损失,博弈方之间利益始终对立,偏好通常不同。
两人零和博弈也称为“严格竞争博弈”。
2.常和博弈:博弈方之间利益的总和为常数。
博弈方之间的利益是对立的且是竞争关系。
3.变和博弈:零和博弈和常和博弈以外的所有博弈。
合作利益存在,博弈效率问题的重要性。
可以站在社会利益的立场对其效率进行评价。
4.静态博弈:所有博弈方同时或可看作同时选择策略的博弈。
5.动态博弈:各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动。
6.重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能。
7.完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益8.不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称“不对称信息博弈”9.完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈10.不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈11.完全理性:有完美的分析判断能力和不会犯选择行为的错误12.有限理性:博弈方的判断选择能力有缺陷13.个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化14.上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果,上策均衡不是普遍存在的。
15.严格下策反复消去法:反复寻找策略之间两两比较意义上的“严格下策”,并将它们消去的方法。
16.反应函数:对于厂商2的每一个可能的产量,厂商1的最佳对策产量的计算公式,它是厂商2产量的一个连续函数,我们称这个连续函数为厂商1对厂商2产量的一个“反应函数”。
17.帕累托上策均衡:博弈中存在多个纳什均衡,如这些纳什均衡存在明显的优劣差异,所有博弈方都偏好其中同一个纳什均衡,该纳什均衡给所有博弈方带来的得益都大于其他纳什均衡。
博弈论考试题
名词解释( 每小题4 分,20 分)1. 参与人(player) 指的是博弈中选择行动以最大化自己效用( 收益) 的决策主体,参与人有时也称局中人,可以是个人,也可以是企业、国家等团体;2. 策略(strategy) 是参与人选择行动的规则,如“以牙还牙”是一种策略;3. 信息(information) 是指参与人在博弈中的知识,尤其是有关其他参与人的特征和行动的知识;4. 支付(payoff) 函数是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的函数,是每个参与人很关心的东西;5. 结果(outcome) 是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示;6. 均衡(equilibrium) 是所有参与人的最优策略或行动的组合。
7. 静态博弈指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动;8. 动态博弈指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
9. 博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
10. 零和博弈:也称“严格竞争博弈”。
博弈方之间利益始终对立,偏好通常不同(夫妻博弈) 一对新婚夫妻为晚上看什么电视节目争执不下,丈夫(记为I 方)要看足球比赛节目,而妻子(记为U方)要看戏曲节目•他们新婚燕尔,相亲相爱,所以若这方面的行动不一致,则是很伤感情的. 因此,这对夫妻间的争执是一次非零和对策。
11. 完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。
12. 上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略13. 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果纳什均衡14. 纳什均衡:纳什均衡是指这样一种策略组合,这种策略组合由所有参与人的最优策略组成,即给定别人策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何参与人有积极性打破这种均衡。
博弈论(整理过名词解释和简答)
一、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。
博弈论专业名词解释
博弈论战略分析1.博弈论的研究对象是理性的战略选择。
2.相机战略:仅在不确定事件发生时才会采取的战略。
3.占优战略:无论对方采取何种战略,其都是最优反应战略。
4.占优战略均衡:每个参与者都有占优战略。
5.劣战略:如果无论对手采取何种战略,一个战略的收益总是高于另一个战略,我们就说,第二个战略被第一个占优,第二个战略被称为劣战略。
6.均衡:稳定可预测的行为模式被称作均衡。
7.社会两难:社会两难是一种存在占优战略均衡的博弈,并且参与者采用这种均衡的战略收益比采用采用非均衡战略的收益要差。
8.合作解:不管是通过协议还是其他形式的强制手段,只要参与者们都能履行协调后的战略,他们所选战略及其收益就是一个博弈的合作解。
9.占优战略的存在以及它与合作解相悖的事实是导致社会两难问题的根本原因。
10.博弈论分析的目标之一就是找到参与者之间稳定的、可预测的互动行为模式。
11.占优战略均衡作为非合作解的优点与缺点。
{答案待定}12.纳什均衡:全部参与者所选战略的一个组合,在这个战略组合组合中,每个人的战略都是针对其他人战略的最优反应13.纳什均衡战略:如果有两个战略(或者更一般的,有多个战略,每个战略都对应着一个参与者),并且每个战略都是另一个战略(或者其他参与者的战略)的最优反应,我们就称这一战略组合为纳什均衡战略。
14.纳什均衡与占优战略均衡一样,都是非合作均衡。
15.社会两难问题是一种特殊的占优战略均衡,占优战略均衡是一种特殊的纳什均衡,而纳什均衡又是一种特殊的非合作均衡。
16.纳什均衡的启发寻找方法:1.确定最优战略的一个简单方法,就是将收益矩阵中,与每一战略的最优反应战略相对应的收益数字标注下划线。
2.如果在其他参与者保持原来的战略不变时,一个参与者能够通过改变战略获得更多的收益,那么这个参与者就会调整他的战略。
为了直观地表达这一点,我们可以画一个箭头,从初始的方向指向新的方向。
17.谢林点:人们把这种以线索为基础选择的均衡称为谢林点或焦点。
博弈论复习题及答案完整版
博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。
2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。
用策略性思维来分析问题,从中找出合理策略,实现目标最优。
3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。
4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。
5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。
每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。
博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。
2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。
3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。
4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。
博弈论名词简答论述
名词解释:01、参与人:指的是博弈中选择行动以最大化自己效用(收益)的决策主体,参与人有时也称局中人,可以是个人,也可以是企业、国家等团体。
02、策略:是参与人选择行动的规则,如“以牙还牙”是一种策略。
03、结果:是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示。
04、均衡:是所有参与人的最优策略或行动的组合。
05、博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或者先后,一次或者多次,从各自允许选择的行为或战略进行选择并加以实施,各自取得相应结果或收益的过程。
06、静态博弈:指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动。
07、动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
08、零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零。
09、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果,我们称这样的策略组合为该博弈的一个上策均衡。
10、重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
11、纳什均衡:纳什均衡是指这样一种策略组合,这种策略组合由所有参与人的最优策略组成,即给定别人策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何参与人有积极性打破这种均衡。
12、子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集合和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的部分,称为原动态博弈的一个子博弈。
13、有限理性博弈:存在有限理性博弈方的博弈可称为有限理性博弈。
14、完美信息的动态博弈:动态博弈中在轮到行为时对博弈的进程完全了解的博弈方,称为具有完美信息的博弈方,如果动态博弈的所有博弈方都有完没信息,则称为完美信息的动态博弈。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论(整理过名词解释和简答)一、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。
14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。
15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动;动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。
同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。
17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。
18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。
19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。
20、博弈的战略式表述:(1)参与人集合(2)每个参与人的战略集合(3)参与人的支付函数博弈的扩展式表述:(1)参与人集合(2)参与人的行动顺序(3)参与人的行动机构(4)参与人的信息集(5)参与人的支付函数(6)外生事件的概率分布21、信息集:每次行动时,参与人知道什么;参与人在决策结上所拥有的信息的集合,拥有同样信息的决策结属于同一个信息集,即信息集包含的决策结拥有同样的信息。
22、颤抖手均衡:在任何一个博弈中,每一个博弈方都有一定的概率出现错误,一个战略组合,只有当其在允许所有博弈方都可能犯错误时,仍然是每一个博弈方的最优策略时,才是一个颤抖手均衡。
23、序贯理性:在每一个信息集中,应该行动的参与人对于给定该参与人在此信息集上的推断,以及其他参与人随后的战略必须是最优反应,即在任何后续博弈中都是理性的。
24、推断理性:在处于均衡路径和非均衡路径的信息集上,推断由贝叶斯法则及参与人的均衡战略决定。
25、海萨尼转换:在处理不完全信息博弈问题中,引入一个虚拟的参与人“自然”,自然首先行动决定参与人的特征,参与人知道自己的特征,其他参与人不知道。
26、不完全信息博弈:在博弈中至少有一个博弈方不完全清楚其他博弈方的得益函数。
27、后续博弈:每一个信息开始的博弈的剩余部分。
28、贝叶斯纳什均衡:是一种类型依从战略组合,在给定自己类型和其他参与人的类型的概率分布情况下,每一个类型依存战略使得每个参与人的期望效用最大,也就是说,没有人有积极性选择其他战略。
29、逆向归纳法:从博弈树行动的相反顺序,从后往前依次求得各自博弈的纳什均衡。
30、信号传递博弈:31、机制设计激励相容约束:给定委托人不知道代理人类型的情况下代理人在所设计的机制下必须有积极性选择委托人希望他选择的行为,也就是说,只有当代理人选择委托人所希望的行为时得到的期望效用不小于他选择其他行为时得到的期望效用时,代理人才会有积极性选择委托人所希望的行动。
32、机制设计参与约束:如果要一个理性的代理人有任何兴趣接受委托人设计的机制(从而参与博弈)的话,代理人在该机制下得到的期望效用必须不小于他在不接受这个机制时得到的最大希望效用。
33、间接机制:参与人声明自己的类型依附战略,战略是除类型以外的信号,如拍卖中的声明报价。
34、直接机制:参与人直接声明自己的类型,而所声明的类型可能不同于真实类型,如拍卖中声明对拍卖品的估价。
二、简答题(1) 将博弈的信息特征和行为时间特征结合,博弈分为哪几类,并分析几种类型博弈的特点?答:将博弈的信息特征和行为时间特征结合,可以把博弈细分为下面四种类型的非合作博弈:静态博弈:是指所有博弈方同时或可看作同时选择策略、采取行动的博弈。
动态博弈:是指博弈方的选择、行动有先有后,而且后选择、后行动的博弈方在自己进行选择、行动之前可以看到在他之前选择、行动的博弈方的选择、行动的博弈。
完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。
不完全信息博弈:是指参与者只了解上述信息中的一部分的博弈。
(2)博弈论博弈论产生与发展过程?答:1、萌芽阶段(1944年以前):古诺(Cournot,1838,法国经济学家)模型(同时决策的产量博弈);斯坦克尔伯格(1934,Stackelberg,德国经济学家) (不同时决策的产量博弈)2、产生阶段(1944年-1959年):冯·诺依曼和摩根斯特恩合著《博弈论与经济行为》(1944年),博弈模型的解的概念和分析方法,理论基础,主要合作博弈,非合作零和博弈;纳什均衡(完全信息静态)(1950,1951),论文“N人博弈中的均衡”点(50年),“非合作博弈”(51年),提出了非合作博弈均衡解,并证明了均衡解的存在,纳什均衡基本思想:在解集中所有博弈者的策略都是对其他博弈者所用策赂的最佳对策3、发展阶段(1960年-1979年):精练纳什均衡(完全信息动态)(泽尔腾,1965),1965年论文《一个具有需求惯性的寡头博弈模型》,德国波恩大学教授,数学家、经济学家;贝叶斯纳什均衡(不完全信息静态,海萨尼,1967)与贝叶斯精练纳什均衡(不完全信息动态,海萨尼,1975),美国加州大学教授,经济学家4、繁荣阶段(1980年以后):纳什,泽尔腾和海萨尼共同获得诺贝尔经济学奖(1994);维克里和莫里斯获诺贝尔经济学奖(1996),2001,2005,2007年诺贝尔经济学奖,不对称信息下激励理论。
(3)博弈论成为经济学主要课程的成因是什么?答:1)博弈论在经济学中的应用越来越广泛. 博弈论许多成果也是借助于经济学的例子来发展的, 相比其他领域来说,在经济领域应用最为成功的,已经形成了一套完整的经济博弈理论,并且发挥了巨大经济效益。
2)经济学和博弈论的研究模式是一样的,这就是强调个人理性.也就是在给定的约束条件追求效用最大化。
在这一点上,博弈论与经济学是完全一样的,使得博弈论分析方法在经济分析中发挥着重要作用。
3)传统经济学研究个人行为时,总是假设其外部环境是给定的。
现代经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用,这与博弈论研究内容相一致,所以,随着现代经济学的发展,博弈论显得更加重要。
4) 经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。
而博弈论不完全信息博弈模型正是解决这类问题的有效工具。
5) 博弈论和信息经济学专家获得了诺贝尔经济学奖,凸现了“博弈论”在主流经济学中日益重要的地位。
(4)博弈有哪几大要素,并解释几大要素的内涵?答:规则:规定博弈各方的行动顺序、方式、以及最终的结果等。
局中人(Player, 选手,玩家):博弈参与人战略:一整套的行动方案,规定了各种情况下的行动。
如人不犯我,我不犯人;人若犯我,我必犯人。
行动:局中人行为。
信息:在行动时所掌握的信息。
报酬(payoffs, 支付):博弈结束时,各方得到的收益。
(5)混合策略和不完全信息博弈联系与区别答:共同点:博弈参与人不能够确切知道其他博弈参与人的选择行为,只知道选择行动的概率分布;不同点:前者的不确定性只是因为各博弈方为了不让其他博弈方占任何先机而必须故意随机选择行动,后者的不确定性源于其他博弈方的类型,即类型的不确定性,按照期望支付选择最优战略(纯战略)。
(6)战优均衡、重复剔除劣战略的战优均衡和纳什均衡相互之间的关系是什么?答:几个均衡之间的关系如图:在重复剔除的占优策略均衡中.最后剩下的惟一策略组合,一定是在重复剔除劣战略过程中无法被剔除的战略组合。
因此,重复剔除的占优战略均衡也一定是纳什均衡。
(7)简述子博弈精练纳什均衡的理性要求答:逆向归纳法理论要求的“所有参与人是理性的,并且要求参与人知道其后续参与人是理性的;参与人知道其后续参与人知道其后续参与人是理性的”,等等。
上述理性要求大大高于静态博弈中的理性要求。
在动态博弈中有时不能满足理性要求导致子博弈精炼纳什均衡不存在。
(8)信息经济学与博弈论不同点答:信息经济学是非对称信息博弈论在经济学上的应用,非对称信息指的是某些参与人拥有但是另一些参与人不用有的信息。
1)博弈论是方法论导向的,而信息经济学是问题导向的。
2)博弈论研究目的:结定信息结构,均衡结果是什么;信息经济学研究的目的:给定信息结构,契约安排是什么。
3)博弈论研究方法涉及经济、军事、政治、日常生活等,信息经济学只研究经济领域方面的问题。
4)博弈论包括完全信息和不完全信息模型,而信息经济学重点研究非完全信息博弈问题。