博弈论考试说明及重点
极大化极小经济学博弈论知识点
极大化极小经济学博弈论知识点一、知识概述《极大化极小在经济学博弈论中的知识点》①基本定义:在经济学博弈论里,极大化极小就是一种策略选择的思路。
简单说呢,每个参与者都担心自己得到最差的结果,所以会想办法让自己在可能出现的最差情况下,也能得到相对较好的结果,也就是使这个“极小”的值尽量“极大”。
比如说打扑克,你担心自己输得最惨,那你出牌的时候就会选择一些保守的打法,让即使没好牌的时候也不至于输得一塌糊涂,这有点像找个保底的玩法。
②重要程度:在经济学的博弈论中那可是相当重要的概念。
很多经济决策和竞争场景下,参与者都不是完全了解对手和各种环境因素的。
就像投资领域,极大化极小策略可以帮助投资者在充满风险和不确定性中找到立足的决策方式。
相当于给决策穿上了一件防弹衣,虽然不能保证总是大赚特赚,但能避免最糟糕的情况发生。
③前置知识:得先知道博弈论里的一些基本概念,比如参与者、策略、收益这些。
就像是学四则运算前得知道数字和加减乘除符号一样。
要是连博弈有哪些参与方,每个参与方能干些啥(策略),最后能得到啥(收益)都不晓得,那极大化极小就很难理解了。
④应用价值:在企业竞争决策里可以用到。
比如两个公司竞争市场份额,都不知道对方接下来会做啥特别厉害的市场策略。
那这时候用极大化极小策略,公司就会做一些比较保守稳定的市场计划,确保自己即使遇到对手超猛的策略时,也不至于被打得抬不起头,市场份额也不会大幅缩水。
二、知识体系①知识图谱:在博弈论这个大体系里,极大化极小策略是策略选择类型中的重要一种。
它和那些合作性的策略啊相对而立。
就像是在性格分类里,保守和激进是相对的一样。
②关联知识:和纳什均衡就有关系。
纳什均衡是指在给定其他人策略的情况下,每个参与者的策略都是最佳的。
极大化极小策略有时也可能是纳什均衡中的一种情况哦。
就像条条大路通罗马,但极大化极小可能是其中一条可以达到类似状态的路。
③重难点分析:- 掌握难度:中等偏上。
难点在于要在多轮复杂的决策情境下,准确找出所有可能的最差情况并且找到应对方式。
博弈论期末复习重点
1、博弈:一些个人、队组或其他组织;面对一定的环境条件;在一定的规则下;同时或先后;一次或多次;从各自允许选择的行为或策略中进行选择并加以实施;各自去得相应结果的过程..2、博弈论:就是系统研究各种博弈问题;寻求在各博弈方具有充分或者有限理性、能力的条件下;合理的策略选择和合理选择策略时博弈的结果;并分析这些结果的经济意义、效率意义的理论和方法..3、囚徒的困境:两决策者从各自最大的利益出发选择行为;结果是既没有实现两人总体的最大利益;也没有真正实现自身的个体的最大利益..4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈..5、动态博弈:各博弈方的选择和行动不仅有先后次序;而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动;甚至还包括自己的选择和行动;6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息..7、不完全信息不对称信息:是指经济行为主体掌握了某种经济环境状态的部分信息..8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解..9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程..10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策;那么这个策略组合肯定是所有博弈方都愿意选择的;必然是该博弈比较稳定的结果..11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略..在两人博弈的情况下;“给定你的策略;我的策略就是我最好的策略;给定我的策略;你的策略也是你的最好的策略”..12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决策方式..13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡..这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益..14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈..15、完全且完美信息动态博弈:动态博弈中既是完全信息又是完美信息的部分16、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中;各博弈方的策略均衡构成的一个策略组合满足;在整个动态博弈及它的所有子博弈中都构成纳什均衡;那么这个策略组合称为该动态博弈的一个~17、逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析;逐步倒推回前一个阶段相应博弈方的行为选择;一直到第一阶段的分析方法..18、颤抖手均衡:在博弈时也要考虑到合作者可能会发生轻微的失误而影响整个结果;即使在这种小概率事件发生时;所选策略依然是最优的.. 19、道德风险:从事经济活动的人在最大限度地增进自身效用时作出不利于他人的行动;损害委托人或是其他代理人的利益..交易后的信息不对称性;掌握较多信息的一方在交易后的利己倾向;如隐瞒欺骗、不负责任、不努力工作..20、逆向选择:指交易双方在交易前的信息不对称;导致市场上交易的劣质商品的比例越来越高;甚至导致优质品完全被驱出市场的一种现象..简答210%一、设定一个博弈模型必须确定的方面:1、博弈方:即博弈中进行决策并承担结果的参与者;2、各博弈方各自可选择的全部策略或行为的集合策略空间:即博弈方选择的内容;可以是方向、取舍选择、量值;3、进行博弈的次序:即博弈方行为、选择的优先次序或重复次数等..次序不同一般就是不同的博弈;即使博弈的其他方面都相同;4、博弈方的得益:即博弈方行为、策略选择的相应后果、结果必须是数量或者能够折算成数量;对应于各博弈方的每一组可能的决策选择都应有一个结果表示该策略组合下各博弈方的所得或所失..得益应该是客观存在;但不意味着各博弈方都了解各方的得益情况..5、信息结构;即博弈方相互对其他博弈方行为或最终利益的了解程度;6、行为逻辑和理性程度;即博弈方是依据个体理性还是集体理性行为以及理性的程度等..二、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子..1、烟草厂商新产品的开发、价格定位的效果;常常取决于其他厂商、竞争对手的相关竞争策略..例如某卷烟厂推出一种高价烟;该计划能否成功常取决于其他厂商是否采取同样的策略、如果其他厂商也推出高价烟而且档次宣传力度比前者还要高、大;那么前者的计划成功的难度就很大;但如果没有其他厂商推出同类产品;那前述某厂的计划成功的可能性就大;2、房地产开发企业在选址、开发规模、目标客户定位等方面也常常存在相互制约的问题..例如一个城市当时的住房需求约10000平方米;如果其他厂商已经开发了8000平方米;那么你再开发5000平方米就会导致供过于求;销售就会发生困难;但如果其他厂商只开发不到5000平方米;那么你的5000平方米就是合理的..3、麦当劳的新产品所带来的收益、价格产量、产品开发三、“囚徒困境”内在根源是举出现实生活中的具体例子..根源在于个体之间存在行为和利益相互制约的博弈结构中;以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益;并实现整体、个体利益共同的最优..简单第说;都是个体理性与集体理性的矛盾引起的..四、分析保险市场、资本市场道德风险的逆向选择..1、汽车保险:假设张三有财产¥100000;其冯诺依曼-摩根斯坦效用指数为对数函数;即UW=lnW;并有价值为¥ 20000的汽车一辆..如果该汽车没有向保险公司投保;将有25%的可能性被偷窃..因此;期望效用为:0.75U100000+0. 25U80000=0.751nl00000+0.25ln80000=11.457l;如果保险公司只索取成本而管理成本为0;那么;公平的保险费用为¥ 20000× 0.25=¥ 5000..如果张三将汽车完全保险;无论汽车是否被盗;其财富都是¥95000;预期效用U95000=ln95000=11. 4616因此;当张三购买公平保险后;其效用高于不购买保险..现在讨论张三是否安装防盗装置的问题;假设安装一个防盗装置的成本为¥1950;如果安装该装置、汽车被盗概率从0.25减小到0.15..如果没有投保;安装防盗装置的预期收益¥20000×0.10=¥ 2000超过成本;因而安装防盗装置有效率;其期望效用为:0.85ln100000-1950+0.15ln100000-2000-1950=11.4590超过不安装的期望效用11.457l;因此;如果张三没有投保;那么;购买防盗装置是理性的..但是;当张三投保后;情况发生了变化..假设张三购买汽车保险的价格是¥ 5200其中¥ 5000为预期损失;¥200为管理费..如果保险公司并不检查投保人是否安装防盗装置;那么;投保的预期效用为1n94800=11.4595;该预期效用超过安装防盗装置的预期效用..张三将会选择投保..但投保后将没有动力安装防盗保险装置;并且可能产生麻痹心而提高被盗的可能性..结果、发生火灾的概率从0.005上升到0.008;保险公司的实际预期损失为¥800..结果;每出售一张保险单平均都会损失S300..这种保险单对于保险公司来说不可行..由于代理人隐蔽行动难以观察;火灾保险市场经常出现投保人经营亏损后;有意纵火索取高额保险金的案例..2、火灾保险的道德风险:假设某厂商产品仓库价值为¥100000;厂商采取防火措施的成本为¥50..采取防火措施后小心谨慎;发生火灾概率为0.005;没有防火措施且疏于防范;发生火灾概率为0.008..又假设保险公司以预期火灾损失¥500;以此作为保险费用出售保险单..在这种环境下;如果厂商向保险公司投保后;就可能不会有动力继续执行防火措施;且可能疏于防范..3、健康保险市场:投保人一旦获得健康保险;相当于降低投保人的医疗护理费用..因此;理性的个人将增加他在这方面的消费量;相应地增加了医疗保险支付的数量;即增加社会成本的数额;因为个人保险费的增加意味着社会医疗支出费用的增加..在这种状态下;社会的风险服务和医疗服务都将低效率..4、资本市场:每个借贷者要求同样数目的贷款条件下;银行不能将借款者按照回报率的大小给予不同的利息率..银行能否收回贷款并获得利润;既取决于借款者的经济效益;也取决于银行所处环境状态的各种不确定性..当银行以借款者的经济收益为利息率标准时;借款者就会利用银行难以观察或不可能观察到的隐蔽行动采取相应行动;如虚报利润额、非法转移资金;人为地扩大成本等道德风险行为;由此使银行承担的风险比签定委托-代理合同前有所增加..5、证券市场的“逆向选择”:在信息不对称的情况下;投资者无法确定哪些上市公司是高质量的、有投资价值的公司;哪些是低质量的上市公司..因此;投资者在作出投资决策时;往往只能根据整个市场所有发行企业的平均质量来决定其愿意投资的价格..这种投资者的“折中”行为就会抑制那些高于平均质量水平的发行企业提高经济效率和管理水平的积极性;而鼓励投资者向低质量企业流动..因为高于平均质量水平的上市公司并不能在证券市场体现其应有的价值;因此就会造成高质量企业不情愿进入证券市场..造成低质量的上市公司横行于证券市场..信息不对称的结果造成股票价格与上市公司经营业绩的背离则使证券市场失去了评价上市公司业绩、约束上市公司经营行为的市场机制;这种市场选择的结果只会导致整个市场的上市公司质量的降低;并成为市场过度投机的主要根源;最终会导致市场的低效率甚至是市场的崩溃..判断一、博弈的分类方法:1、行为逻辑;是否允许存在有约束力协议:合作博弈、非合作博弈2、理性层次:完全理性博弈、有限理性博弈进化博弈;3、博弈过程:静态博弈、动态博弈、重复博弈4、信息结构:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈;5、得益特征:零和博弈、常和博弈、变和博弈6、博弈方数量:单人博弈、两人博弈、多人博弈;7、策略数量:有限博弈、无限博弈二、上策均衡、纳什均衡、严格下策反复消去法的关系区别:1、上策均衡是各博弈方绝对最优策略的组合;而纳什均衡则是各博弈方相对最优策略的组合..上策均衡一定是纳什均衡;但纳什均衡不一定就是上策均衡..对同一个博弈来说;上策均衡的集合就是纳什均衡集合的子集;但不一定是真子集;2、严格下策反复消去法与上策均衡分布对应两种有一定相对性的决策分析思路:严格~对应排除法即排除绝对最差策略的分析方法..上策~对应选择法;即选择绝对最优策略的均衡概念..二者并不矛盾;甚至可以相互补充..严格~不会消去任何上策均衡;可以简化博弈;3、严格~和纳什均衡也是相容和补充的;严格~不会消去任何上策均衡;可以简化博弈;使纳什均衡分析更加容易..。
博弈论重点精要
定義:納什均衡指一策略組合有以下特性:當參賽者採此策略組合後,任一參賽者均無誘因偏離此一均衡;s *=(s 1*,s 2*,…..s n *)=(s i *,s -i *)是一納什均衡若且唯若對所有參賽者i 而言,u i (s i *,s -i *)≧u i (s i ’,s -i *)對所有s i ’∈S i 均成立。
經濟理論也有兩大分析原則:(1) 極大化原則(Optimality):參與者追求效用或利潤之極大,由此導出最適策略。
(2) 均衡原則(Equilibrium):經由互動,參與者之間達到某種均衡狀態。
又依經濟環境的不同,而有兩類均衡觀念。
完全競爭市場結構下採用瓦拉斯均衡(Walrasian Equilibrium)或稱一般均衡(General Equilibrium)。
而在寡占或不完全競爭結構下採用賽局的均衡觀念,考慮的多屬不合作賽局(Noncooperative games)。
以上同時出招的賽局,稱為靜態賽局。
這些賽局也同時具有完全訊息,因為參賽者都知道自己與對手的策略及相應報酬。
參賽者同時出招,又知道所有參賽者的策略和報酬的賽局就是完全訊息靜態賽局賽局Γ=(N, (S i )N i ∈, (U i )N i ∈) 的策略式包含三要素:(1) 參賽者(players): i ∈N ={ 1, 2, 3,…….n }(2) 策略(strategies): s i ∈ S i =set of feasible (pure) strategies for player i, i ∈N策略組合(strategy profile) s =( s 1,……,s n )=(s i , s -i ), s -i =Xij ≠S j 對手的策略。
(3) 報酬(payoffs):U i =U i (s i , s -i ):X Nj ∈S j→ ℜ為報酬或效用函數。
策略式表示的完全訊息靜態賽局有幾點特性:˙ 同時出招,出招一次。
博弈论重点
博弈论期末复习要点纳什均衡(P52):指的是参与人的这样一种策略组合,在该策略组合中,每个人的策略都是最优的,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略。
完全信息(P34):各个博弈方都完全了解所有博弈方在各种情况下的得益状况。
上策均衡(P41):在某个博弈中,如果不管其他博弈方选择什么策略,一博弈方的某一个策略给他带来的收益始终高于其他策略,至少不低于其他策略。
帕累托上策均衡(P92):多个纳什均衡的某一个均衡策略给所有博弈方带来的得益都大于其他所有纳什均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕累托效率。
聚点均衡(P97):在多重纳什均衡博弈中,双方同时会选择一个聚点构成的纳什均衡。
合并均衡(P268):具有完美信息的博弈方在博弈中,不管自己情况如何,都采取相同的市场均衡。
(在合并均衡中,完美信息博弈方的情况不同,并不会导致他们的行为不同,因此他们的行为不会给不完美信息的博弈方透露任何有用的消息)分开均衡(P268):在不同情况下,完美信息博弈方所采取完全不同的市场策略。
(在分开均衡中,由于博弈方的情况不同,采取的不同的市场策略,因此完美信息博弈方的策略可以完全反映他的情况,因此能够给不完美信息博弈方的“判断”提供充分的信息和依据)海萨尼转换(P292):将得益不了解转化为类型不了解的基础上,进一步将不完全信息静态博弈转化为完全但不完美信息动态博弈进行分析的思路。
完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全了解的博弈。
不完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全不了解的博弈。
混合策略(P72):博弈方以一定的概率分布在可选策略中随机选择的决策方式。
一致性预测(P53):如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略。
博弈论期中复习大纲知识讲解
博弈论期中复习大纲博弈论第一讲——第五讲复习大纲第一讲博弈的基本规则1、博弈论的假定是:人是理性的。
2、博弈论关注的是:意识到其行动将相互影响的决策者们的行为。
3、一个博弈可以根据参与人行动的先后顺序划分为静态博弈(一次性博弈)和动态博弈(序贯博弈)。
4、博弈论可分为合作博弈和非合作博弈:若参与人之间能达成有约束力的协议,则该博弈称为合作博弈,否则为非合作博弈。
合作博弈强调的是团体理性和效率、公正、公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。
5、博弈论的基本概念包括(1)参与人:是指作决策的个体(可能是个人也可能是团体,如国家、企业)。
每个参与人的目标都是通过选择行动来最大化自身的效用。
(虚拟参与人:自然是一个虚拟参与人,它在博弈的特定时点上以特定的概率随机选择行动。
)(2)信息:参与人在特定的时点对不同变量取值的了解。
(3)信息集:参与人的信息集还包括对已发生的行动的了解,因此,信息集随着博弈进程的变化而变化。
(4)策略:策略是参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。
【注意:参与人想采取的行动取决于自然和其他参与人过去的行动,所以策略的概念不可或缺。
参与人的策略是一个关于其行动程序的完备集合,它告诉参与人在每种可预见的情况下选择什么行动,即使参与人并不预期那种情况真的会出现。
策略与行动的不同之处在于策略是不可观测的。
】(5)行动:行动是参与人的行动变量。
(6)支付函数:支付函数是参与人从博弈中获得的(期望)效用水平,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。
(7)结果:是指博弈论分析者感兴趣的要素的集合。
(8)均衡:是所有参与人与人的最有策略或行动的组合。
参与人、行动、结果统称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。
(9)均衡策略:(Equilibrium strategies )是指由博弈中的n 个参与人在最大化各自支付时所选取的策略。
博弈论考试重点
一、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
博弈论 研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中 博弈论是研究经济主体的二、博弈论基本要素博弈参与者、各博弈方各自可选择的全部策略或行为的集合、进行博弈的次序、博弈方的利益、博弈行为、博弈信息、结果、均衡三、名词解释静态博弈:同时决策或者同时行动的博弈属于静态博弈—田忌赛马、猜硬币、古诺模型动态博弈:先后或序贯决策或者行动的博弈属于动态博弈—弈棋、市场进入、领导完全信息博弈:所有博弈方都清楚其他博弈方的得益状况不完全信息博弈(贝叶斯博弈):至少有一个博弈方不完全清楚其他博弈方的得益或得益函数囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈纳什均衡:在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的冷酷战略:重复博弈中,任何博弈方的一次性不合作将引起其他博弈方的永远不合作,从而导致的所有博弈方的收益减少。
针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛重复博弈:静态或动态博弈的重复进行,即重复进行的博弈过程聚点均衡:在理论上一个博弈中可能有多个纳什均衡点,这时在现实生活中,行为人往往利用在理论上省略掉的那些信息,找到一个大家都感兴趣的点,这个点往往成为现实世界中博弈的最终解。
当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡卡尔多-希克斯标准:一种变革使得受益者的所得足以弥补受损者的所失,这种变革就是卡尔多-希克斯改进。
博弈论考试说明及重点
老师说明:(以下是原话)各位同学:感觉大家对考试题型和内容比较担心,在这里向大家说明一下:第一,共7道大题,形式都类似于平时的作业,但难度会低。
其中完全信信息静态,完全信息动态,不完全信息静态各2道,不完全信息动态1道(信息经济学不在考试范围内)。
这是大致分布,可能会有少量交叉。
第二,没有专门的概念题,少量概念会在大题中间设一些小问。
第三,关于求均衡时是求纯策略还是混合策略,题目中会明确告诉大家是求哪一种。
比如求所有均衡,就包括纯策略和混合策略。
如果说求纯策略,那就只有纯策略。
课堂所划重点:完全静态:(2道)严格占优策略、严格劣策略、绝不是最优反应要掌握。
求解纳什均衡时候,要先剔除严格劣策略和绝不是最优反应的行动,再在剩余的行动中筛选纳什均衡。
囚徒困境是这部分的典例。
完全动态:(2道)掌握什么是完全动态博弈的策略。
掌握讨价还价模型。
(PPT和作业中有相关习题)无限次重复博弈如何走出囚徒困境。
(用触发策略而不是以牙还牙策略,PPT和作业中有相关习题)【注意:有限次重复博弈走不出囚徒困境】不完全静态:(2道)掌握什么是不完全静态博弈的策略。
(此处好像有遗漏,大家相互对一下好了。
主要的还是下面两个博弈问题)最高价,次高价拍卖(包括N个人)博弈。
其中,PPT对于N个人的问题只是给出了答案,魏旭老师说N个人的情况,也要知道过程怎么算。
公共物品提供博弈。
(PPT和第二次作业上有相关习题)不完全动态:(1道)信号博弈。
(混同均衡,分离均衡,直观准则)声誉模型不要求掌握计算,但要了解这是什么意思。
要知道声誉模型为什么能让人走出囚徒困境。
如果有记得遗漏或错误的地方,欢迎指正,方便大家复习。
博弈论重点——精选推荐
博弈论重点⼀、名词解释1接相互作⽤时候的决策以及这种决策的均衡问题。
3占优均衡— 重复剔除占优均衡— 纯战略纳什均衡 —混合战略纳什均衡4⼀致性 : 均衡原则利益最⼤化原则不⼀致性 : 信息不完全个体理性与集体理性不完全⼀致5完全信息静态博弈-纳什均衡 (纯策略纳什均衡混合策略纳什均衡)完全信息动态博弈(序贯博弈重复博弈)⼦博弈精炼纳什均衡不完全信息静态博弈-贝叶斯纳什均衡不完全信息动态博弈-精练贝叶斯纳什均衡 6、⾮合作博弈的基本分类根据出招顺序分为:静态博弈和动态博弈。
根据局中⼈信息的掌握情况分为(不)完全信息博弈共同信息(不)完美信息博弈。
历史信息7、静态博弈:同时决策或者同时⾏动的博弈属于静态博弈 —⽥忌赛马、猜硬币、古诺模型8、动态博弈:先后或序贯决策或者⾏动的博弈属于动态博弈 —弈棋、市场进⼊、领导——追随型市场结构 9、共同知识:各种对局情况下每个⼈的得益是多少是所有局中⼈的共同知识10、完美信息博弈:如果在博弈进⾏过程中的每⼀时刻,⾯临决策或者⾏动的参与⼈,对于博弈进⾏到这个时刻为⽌所有参与⼈曾经采取的决策或者⾏动完全清楚,则称为完美信息博弈11、完全信息静态博弈即各局中⼈同时决策,且所有局中⼈对各⽅得益都了解的博弈。
完全信息静态博弈的⼏点特性同时出招,出招⼀次;知道博弈结构与游戏规则(共同知识);不管是否沟通过,⽆法做出有约束⼒的承诺(⾮合作)博弈分析的⽬的是预测均衡结果 12、⾮合作博弈的其他分类根据局中⼈数量分单⼈博弈、两⼈博弈、多⼈博弈等。
根据博弈中的策略分为:有限博弈、和⽆限博弈。
根据得益分为:零和博弈、常和博弈、变和博弈。
13、零和博弈:如果⼀个博弈在所有各种对局下全体参与⼈之得益总和总是保持为零,这个博弈就叫零和博弈;零和博弈是利益对抗程度最⾼的博弈14、⾮零和博弈:如果⼀个博弈在所有各种对局下全体参与⼈之得益总和不总是保持为零,这个博弈就叫⾮零和博弈。
15、常和博弈:如果⼀个博弈在所有各种对局下全体参与⼈之得益总和总是保持为⼀个常数,这个博弈就叫常和博弈;常和博弈也是利益对抗程度最⾼的博弈16、⾮常和博弈:如果⼀个博弈在所有各种对局下全体参与⼈之得益总和不总是保持为⼀个常数,这个博弈就叫⾮常和博弈17、有限博弈:每个博弈⽅的策略数都是有限的。
经济博弈论复习重点
博弈:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,也即 对任意 都成立,则称 为G 的一个纳什均衡混合策略纳什均衡在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。
:包含混合策略的策略组合,构成纳什均衡。
多个纳什均衡的某一个给所有博弈方带来的得益都大于其他所有那好似均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕雷托效率,称此纳什均衡为帕累托上策均衡。
如果所有博弈方在预计其他博弈方采用各种策略的概率相同时,某一策略给他带来的期望得益最大,各博弈方都偏爱这样的策略的策略组合,就称之为风险上策均衡。
“聚点”均衡(focal point equilibrium)。
在制度经济学中,信息就可以解释为参与一个社会必须存在的“道德传统”(D.诺斯称之为“文化意识型态”),从而可以决定在多个纳什均衡中会出现某一个特定的均衡。
此处的聚点(focal point )作用被解释为:当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡。
相关均衡:博弈方根据观察到的信号或者相关信号来确定自己的行为而形成的更广泛意义下的纳什均衡如果一个博弈的某个策略组合满足下列要求:(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。
博弈论考题与答案
一、假设市场上有三个垄断企业,企业无生产成本,问达到纳什均衡时的产量为多少?假设市场的价格和数量之 间 P=a — b*Q解:二、 什么是纳什均衡,你是如何理解纳什均衡的?答:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略 的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种 均衡。
当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。
如上述, 在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人 都不利的结局。
三、 构建一个博弈,说明如何杜绝学生考试作弊现象(参考高薪养廉博弈)答:四、 给出该博弈的纳什均衡,并用消除劣势战略法,找出(R1, C3)这个纳什均衡。
C1 C2 C3 R12,12 1,10 1,12 R20,12 0,10 0,11 R3 0,12 0,10 0,13五、两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子, 虫子降杠子,两人同时出令。
如果一个打败另一个,赢的效用为 1,输的效用为-1,否则效用为0,写出这个博弈 的支付矩阵,计算其混合战略纳什均衡。
答:设S 为棒子T 为老虎C 为鸡W 为虫子,则其支付矩阵为:设1、2出STCW 的概率分别为P1P2P3P4和Q1Q2Q3Q4,贝U 矩阵达到均衡时,2的期望收益必须满足:0*p1 — 1*p2+0*p3+1*p4=1*p1+0*p2 — 1*p3+0*p4=0*p1+1*p2+0*p3 — 1*p4= — 1*p1+0*p2+1*p3+0*p4整理为 一p2+p4=p1 — p3= — p1+p3由于上式为对称的,所以,p 仁p2=p3=p4,又 p1+p2+p3+p4=1,可得 p 仁p2=p3=p4=0.25.同理 q 仁q2=q3=q4=0.25 综上所述,混合战略的纳什均衡为: A1 (0.25,0.25,0.25,0.25 A2 (0.25,0.25,0.25,0.25六、5个海盗抢到了 100颗宝石,每一颗大小和价值都一样他们决定这么分:抽签决定自己的号码(1、2、3、4、5)。
第十章 博弈论资料重点
都有一定的规则 都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏
结果 策略和利益有相互依存性
博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
博弈的分类
首先,分为非合作博弈和合作博弈两大类。本书主要 介绍非合作博弈;
其次,在非合作博弈的范围内,可分为完全理性博弈 和有限理性博弈。本书介绍大多数基本博弈概念、原 理和分析方法时都以完全理性假设为基础;
第三个层次分为静态博弈和动态博弈,外加重复博弈 这种特殊的动态博弈;
第四个层次是根据信息是否完全和完美分类,共分为 完全信息静态博弈和不完全信息静态博弈、完全且完 美信息动态博弈、完全但不完美信息动态博弈、不完 全信息动态博弈。
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
只达到效率很差的个体理性解,没有实现团体 理性解。 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的,需要改变 条件。
非合作博弈
合作博弈
博弈论重点
1.纳什均衡:这种战略组合由所有参与人的最优战略组成,即当s i *(i= 1,2,…,n)对给定s -i *=(s 1*,s 2*,…,s i-1*,s i+1*,…,s n *) 满足:u i (s i *,s -i *)≥u i (s i ,s -i *),s i ∈Si 即s i *∈argmax u i (s 1* ,…,s i-1*, s i ,s i+1*,…,s n *),i=1,2,…,n 则称s *=(s 1* , s 2*,…,s i *,…,s n *)是一个纳什均衡(NE )。
2.占优战略均衡:不论对手选择什么战略,参与人i 的最优战略是唯一的,即它的最优战略与其他参与人的战略选择无关。
令s -i =(s 1,s 2,…,s i-1,s i+1,…,s n ),称s i *为参与人(严格)占优战略,若均成立。
并称s *=(s 1*,s 2*,…,s n *)为占优战略均衡(DSE )。
3.共同知识:信息是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
共同知识是与信息有关的一个重要概念。
共同知识指的是“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道……”的知识。
4.信息集:每次行动参与人知道什么(如A 知不知B 已选择了什么行动,或对自然了解如何)。
博弈树上的所有决策结分割成不同的信息集。
每一个信息集是决策集合的一个子集,该子集包括所有满足下列条件的决策结:(1)每一个人决策结都是同一参与人的决策结。
(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策界。
5.子博弈:一个扩展式表述博弈的子博弈G 由一个决策结x 和所有该决策结的后续结T (x )(包括终结点)组成,它满足下列条件:)(),(),()2(},{)()1(x T x x h x x T x x x x h ∈'''∈''∈'∀=则若是一个单结信息集;6.可置信威胁:精炼均衡必须是纳什均衡,但纳什均衡不一定是精炼均衡。
博弈论考试重点
博弈论复习重点
前言:考完公司理财,老师对我们不是很满意,因为很多人挂了,并且特别说明博弈论考场上一旦发现作弊直接重修,老师给了很详细的复习重点,希望大家认真看书,打消作弊的念想哈~
本人能力有限,作的笔记可能有不完善的地方,希望有人能指正并提出更改
一,填空(15)多看ppt
1,博弈论的基本要素
2,博弈论分析的目的
3,共同知识
4,战略,支付
5,囚徒困境的特点
6,占优战略均衡的特点
7,扩展式描述,扩展的部分是空间
8,引入子博弈精炼纳什均衡的目的是什么
9,不完全信息静态博弈和完全信息静态博弈的联系与区别
10,信号传送和信息甄别的区别
11,海萨尼转换
12,无限制重复博弈的囚徒困境涉及的两个特殊战略是
二,名词解释
1,4个均衡(都要看)
2,承诺行动
3,道德风险
4,激励相容因素
三,综合题
1,涉及纯战略纳什均衡和混合纳什均衡
要求:写出支付矩阵,然后双划线找出均衡,画出最优反应图
2,斯坦克尔博格竞争模型
要求,画出博弈树,求出子博弈,与古诺模型进行比较
四,论述(着重看逆向选择整节内容)
逆向选择
如何造成逆向选择的以及如何解决。
博弈论重点
博弈论重点第一章1.囚徒困境的均衡是:剔除严格劣势策略2.猜硬币的均衡是:纯策略纳什均衡3.博弈的基本要素(填空):博弈的标准式表达包括以下八个基本要素:1. 博弈的参与者(Players)2. 各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合3. 进行博弈的次序(Orders)4. 博弈方的得益(Payoffs)5.博弈行为(action)6.博弈信息(information)7.结果(outcome)*8.均衡(equilibrium) *-分析追求的结果理性假设:参与者聪明的,利己的;聪明人假设4.博弈的分类(填空)1.按照博弈者的先后顺序,博弈持续的时间和重复的次数进行分类,博弈可以划分为静态博弈(Static game)和动态博弈(Dynamic Game)。
动态博弈是指在博弈中,博弈者的行动有先后顺序(Sequential-Move),且后行动者能够观察到先行动者所选择的行动或策略,因此, 动态博弈又叫做序贯博弈。
动态博弈的一类特殊形式叫做重复博弈(Repeated Games),又分为有限次重复博弈和无限次重复博弈。
“有限次重复博弈”(Finitely Repeated Games)“无限次重复博弈”(Infinitely Repeated Games)。
5.策略表达方式:1)矩阵式(静态博弈)2)扩展式(动态博弈)第二章1.占优策略均衡(不需要理性人假设)2.求严格下策消去法(填空或计算)所谓“严格劣策略”(Strictly Dominated strategies)是指:在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略。
思路:1、先找出某个参与人的劣策略(假定存在),把它剔除,重新构造一个不包含已剔除策略的新博弈;2、然后再剔除新博弈中某个参与人的劣策略;……3、直至剩下一个唯一的策略组合。
该策略组合就是博弈的均衡解,称为“重复剔除的占优策略均衡”。
博弈论基础复习
《博弈论基础》复习大纲一、名词解释(5X 2= 10分)策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。
纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。
混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。
扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。
博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。
博弈树类似于状态图和问题求解搜索中使用的搜索树。
完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。
子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。
行为策略是指每一个参与人在每一个信息集上随机的选择行动。
逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。
在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。
冷酷策略又称触发策略。
指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。
类型一般地,将一个参与人所拥有的所有私人信息称为他的类型。
静态贝叶斯均衡是一种与类型有关的策略组合,其中每个局中人在给定自己类型和其它局中人策略的情况下最大化自己的期望效用函数。
信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。
分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1 选择不同的信号接收者完全可以通过信号来准确判断出发送者的类型。
混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。
联盟设{1,2, ,I} 为局中人集合,则其中任意一非空子集S 为一个联盟。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论考试说明及重点
老师说明:(以下是原话)
各位同学:
感觉大家对考试题型和内容比较担心,在这里向大家说明一下:
第一,共7道大题,形式都类似于平时的作业,但难度会低。
其中完全信信息静态,完全信息动态,不完全信息静态各2道,不完全信息动态1道(信息经济学不在考试范围内)。
这是大致分布,可能会有少量交叉。
第二,没有专门的概念题,少量概念会在大题中间设一些小问。
第三,关于求均衡时是求纯策略还是混合策略,题目中会明确告诉大家是求哪一种。
比如求所有均衡,就包括纯策略和混合策略。
如果说求纯策略,那就只有纯策略。
课堂所划重点:
完全静态:(2道)
严格占优策略、严格劣策略、绝不是最优反应要掌握。
求解纳什均衡时候,要先剔除严格劣策略和绝不是最优反应的行动,再在剩余的行动中筛选纳什均衡。
囚徒困境是这部分的典例。
完全动态:(2道)
掌握什么是完全动态博弈的策略。
掌握讨价还价模型。
(PPT和作业中有相关习题)
无限次重复博弈如何走出囚徒困境。
(用触发策略而不是以牙还牙策略,PPT和作业中
有相关习题)【注意:有限次重复博弈走不出囚徒困境】
不完全静态:(2道)
掌握什么是不完全静态博弈的策略。
(此处好像有遗漏,大家相互对一下好了。
主要的还是下面两个博弈问题)
最高价,次高价拍卖(包括N个人)博弈。
其中,PPT对于N个人的问题只是给出了
答案,魏旭老师说N个人的情况,也要知道过程怎么算。
公共物品提供博弈。
(PPT和第二次作业上有相关习题)
不完全动态:(1道)
信号博弈。
(混同均衡,分离均衡,直观准则)
声誉模型不要求掌握计算,但要了解这是什么意思。
要知道声誉模型为什么能让人走出
囚徒困境。
如果有记得遗漏或错误的地方,欢迎指正,方便大家复习。
感谢您的阅读,祝您生活愉快。