博弈期末考试总结

合集下载

(完整word版)经济博弈论期末复习资料(word文档良心出品)

(完整word版)经济博弈论期末复习资料(word文档良心出品)

经济博弈论复习资料一、名词解释1、零和博弈:是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作可能的博弈。

2、常和博弈:是指各博弈方的得益之和是一个非零常数的博弈。

常和博弈中各博弈方之间利益关系也是对立的,博弈方之间的基本关系也是竞争关系。

3、纳什均衡:在博弈G={}n n u u S S ,,;,,11 中,如果由各个博弈方的各一个策略组成的某个策略组合()**1,,n s s 中,任一博弈方i 的策略*i s ,都是对其余博弈方策略的组合()**1*1*1,,,,,ni i s s s s +- 的最佳对策,也即()()**1**1*1**1**1*1,,,,,,,,,,,,n i ij i i n i i i i s s s s s u s s s s s u +-+-≥ 对任意i ij S s ∈都成立,则称 ()**1,,n s s 为G 的一个纳什均衡。

4、混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。

5、纳什定理:在一个有n 个博弈方的博弈G={}n n u u S S ,,;,,11 中,如果n 是有限的,且i S 都是有限集(对i=1, ,n ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。

(这个定理就是说,每一个有限博弈都至少有一个混合策略纳什均衡)6、帕累托上策均衡:是指帕累托效率意义上的优劣关系,因此用这种方法选择出来的纳什均衡,也称为“帕累托上策均衡”。

7、风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个风险上策均衡。

8、子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息和进行博弈所需要的全部信息。

9、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

博弈论期末复习重点

博弈论期末复习重点

1、博弈:一些个人、队组或其他组织;面对一定的环境条件;在一定的规则下;同时或先后;一次或多次;从各自允许选择的行为或策略中进行选择并加以实施;各自去得相应结果的过程..2、博弈论:就是系统研究各种博弈问题;寻求在各博弈方具有充分或者有限理性、能力的条件下;合理的策略选择和合理选择策略时博弈的结果;并分析这些结果的经济意义、效率意义的理论和方法..3、囚徒的困境:两决策者从各自最大的利益出发选择行为;结果是既没有实现两人总体的最大利益;也没有真正实现自身的个体的最大利益..4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈..5、动态博弈:各博弈方的选择和行动不仅有先后次序;而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动;甚至还包括自己的选择和行动;6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息..7、不完全信息不对称信息:是指经济行为主体掌握了某种经济环境状态的部分信息..8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解..9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程..10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策;那么这个策略组合肯定是所有博弈方都愿意选择的;必然是该博弈比较稳定的结果..11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略..在两人博弈的情况下;“给定你的策略;我的策略就是我最好的策略;给定我的策略;你的策略也是你的最好的策略”..12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决策方式..13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡..这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益..14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈..15、完全且完美信息动态博弈:动态博弈中既是完全信息又是完美信息的部分16、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中;各博弈方的策略均衡构成的一个策略组合满足;在整个动态博弈及它的所有子博弈中都构成纳什均衡;那么这个策略组合称为该动态博弈的一个~17、逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析;逐步倒推回前一个阶段相应博弈方的行为选择;一直到第一阶段的分析方法..18、颤抖手均衡:在博弈时也要考虑到合作者可能会发生轻微的失误而影响整个结果;即使在这种小概率事件发生时;所选策略依然是最优的.. 19、道德风险:从事经济活动的人在最大限度地增进自身效用时作出不利于他人的行动;损害委托人或是其他代理人的利益..交易后的信息不对称性;掌握较多信息的一方在交易后的利己倾向;如隐瞒欺骗、不负责任、不努力工作..20、逆向选择:指交易双方在交易前的信息不对称;导致市场上交易的劣质商品的比例越来越高;甚至导致优质品完全被驱出市场的一种现象..简答210%一、设定一个博弈模型必须确定的方面:1、博弈方:即博弈中进行决策并承担结果的参与者;2、各博弈方各自可选择的全部策略或行为的集合策略空间:即博弈方选择的内容;可以是方向、取舍选择、量值;3、进行博弈的次序:即博弈方行为、选择的优先次序或重复次数等..次序不同一般就是不同的博弈;即使博弈的其他方面都相同;4、博弈方的得益:即博弈方行为、策略选择的相应后果、结果必须是数量或者能够折算成数量;对应于各博弈方的每一组可能的决策选择都应有一个结果表示该策略组合下各博弈方的所得或所失..得益应该是客观存在;但不意味着各博弈方都了解各方的得益情况..5、信息结构;即博弈方相互对其他博弈方行为或最终利益的了解程度;6、行为逻辑和理性程度;即博弈方是依据个体理性还是集体理性行为以及理性的程度等..二、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子..1、烟草厂商新产品的开发、价格定位的效果;常常取决于其他厂商、竞争对手的相关竞争策略..例如某卷烟厂推出一种高价烟;该计划能否成功常取决于其他厂商是否采取同样的策略、如果其他厂商也推出高价烟而且档次宣传力度比前者还要高、大;那么前者的计划成功的难度就很大;但如果没有其他厂商推出同类产品;那前述某厂的计划成功的可能性就大;2、房地产开发企业在选址、开发规模、目标客户定位等方面也常常存在相互制约的问题..例如一个城市当时的住房需求约10000平方米;如果其他厂商已经开发了8000平方米;那么你再开发5000平方米就会导致供过于求;销售就会发生困难;但如果其他厂商只开发不到5000平方米;那么你的5000平方米就是合理的..3、麦当劳的新产品所带来的收益、价格产量、产品开发三、“囚徒困境”内在根源是举出现实生活中的具体例子..根源在于个体之间存在行为和利益相互制约的博弈结构中;以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益;并实现整体、个体利益共同的最优..简单第说;都是个体理性与集体理性的矛盾引起的..四、分析保险市场、资本市场道德风险的逆向选择..1、汽车保险:假设张三有财产¥100000;其冯诺依曼-摩根斯坦效用指数为对数函数;即UW=lnW;并有价值为¥ 20000的汽车一辆..如果该汽车没有向保险公司投保;将有25%的可能性被偷窃..因此;期望效用为:0.75U100000+0. 25U80000=0.751nl00000+0.25ln80000=11.457l;如果保险公司只索取成本而管理成本为0;那么;公平的保险费用为¥ 20000× 0.25=¥ 5000..如果张三将汽车完全保险;无论汽车是否被盗;其财富都是¥95000;预期效用U95000=ln95000=11. 4616因此;当张三购买公平保险后;其效用高于不购买保险..现在讨论张三是否安装防盗装置的问题;假设安装一个防盗装置的成本为¥1950;如果安装该装置、汽车被盗概率从0.25减小到0.15..如果没有投保;安装防盗装置的预期收益¥20000×0.10=¥ 2000超过成本;因而安装防盗装置有效率;其期望效用为:0.85ln100000-1950+0.15ln100000-2000-1950=11.4590超过不安装的期望效用11.457l;因此;如果张三没有投保;那么;购买防盗装置是理性的..但是;当张三投保后;情况发生了变化..假设张三购买汽车保险的价格是¥ 5200其中¥ 5000为预期损失;¥200为管理费..如果保险公司并不检查投保人是否安装防盗装置;那么;投保的预期效用为1n94800=11.4595;该预期效用超过安装防盗装置的预期效用..张三将会选择投保..但投保后将没有动力安装防盗保险装置;并且可能产生麻痹心而提高被盗的可能性..结果、发生火灾的概率从0.005上升到0.008;保险公司的实际预期损失为¥800..结果;每出售一张保险单平均都会损失S300..这种保险单对于保险公司来说不可行..由于代理人隐蔽行动难以观察;火灾保险市场经常出现投保人经营亏损后;有意纵火索取高额保险金的案例..2、火灾保险的道德风险:假设某厂商产品仓库价值为¥100000;厂商采取防火措施的成本为¥50..采取防火措施后小心谨慎;发生火灾概率为0.005;没有防火措施且疏于防范;发生火灾概率为0.008..又假设保险公司以预期火灾损失¥500;以此作为保险费用出售保险单..在这种环境下;如果厂商向保险公司投保后;就可能不会有动力继续执行防火措施;且可能疏于防范..3、健康保险市场:投保人一旦获得健康保险;相当于降低投保人的医疗护理费用..因此;理性的个人将增加他在这方面的消费量;相应地增加了医疗保险支付的数量;即增加社会成本的数额;因为个人保险费的增加意味着社会医疗支出费用的增加..在这种状态下;社会的风险服务和医疗服务都将低效率..4、资本市场:每个借贷者要求同样数目的贷款条件下;银行不能将借款者按照回报率的大小给予不同的利息率..银行能否收回贷款并获得利润;既取决于借款者的经济效益;也取决于银行所处环境状态的各种不确定性..当银行以借款者的经济收益为利息率标准时;借款者就会利用银行难以观察或不可能观察到的隐蔽行动采取相应行动;如虚报利润额、非法转移资金;人为地扩大成本等道德风险行为;由此使银行承担的风险比签定委托-代理合同前有所增加..5、证券市场的“逆向选择”:在信息不对称的情况下;投资者无法确定哪些上市公司是高质量的、有投资价值的公司;哪些是低质量的上市公司..因此;投资者在作出投资决策时;往往只能根据整个市场所有发行企业的平均质量来决定其愿意投资的价格..这种投资者的“折中”行为就会抑制那些高于平均质量水平的发行企业提高经济效率和管理水平的积极性;而鼓励投资者向低质量企业流动..因为高于平均质量水平的上市公司并不能在证券市场体现其应有的价值;因此就会造成高质量企业不情愿进入证券市场..造成低质量的上市公司横行于证券市场..信息不对称的结果造成股票价格与上市公司经营业绩的背离则使证券市场失去了评价上市公司业绩、约束上市公司经营行为的市场机制;这种市场选择的结果只会导致整个市场的上市公司质量的降低;并成为市场过度投机的主要根源;最终会导致市场的低效率甚至是市场的崩溃..判断一、博弈的分类方法:1、行为逻辑;是否允许存在有约束力协议:合作博弈、非合作博弈2、理性层次:完全理性博弈、有限理性博弈进化博弈;3、博弈过程:静态博弈、动态博弈、重复博弈4、信息结构:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈;5、得益特征:零和博弈、常和博弈、变和博弈6、博弈方数量:单人博弈、两人博弈、多人博弈;7、策略数量:有限博弈、无限博弈二、上策均衡、纳什均衡、严格下策反复消去法的关系区别:1、上策均衡是各博弈方绝对最优策略的组合;而纳什均衡则是各博弈方相对最优策略的组合..上策均衡一定是纳什均衡;但纳什均衡不一定就是上策均衡..对同一个博弈来说;上策均衡的集合就是纳什均衡集合的子集;但不一定是真子集;2、严格下策反复消去法与上策均衡分布对应两种有一定相对性的决策分析思路:严格~对应排除法即排除绝对最差策略的分析方法..上策~对应选择法;即选择绝对最优策略的均衡概念..二者并不矛盾;甚至可以相互补充..严格~不会消去任何上策均衡;可以简化博弈;3、严格~和纳什均衡也是相容和补充的;严格~不会消去任何上策均衡;可以简化博弈;使纳什均衡分析更加容易..。

博弈论复习总结

博弈论复习总结
如果甲选择策略N,得益只有1,所以作为先行动者,他肯定 不会选择这个策略,对于乙来说,虽然不知道甲的选择,但 他自己肯定选择策略R,所以对这个动态博弈来说,博弈路径 必定是甲选择策略T,乙选择策略R。
追 B:女方
不接受
A:追求者 不追 均衡路径
B:女方
接受
不接受
(10,-10) (-50,-40)
(0,0)
(0,0)
第三个NE的均衡结果:(追,(接受,不接受))均衡路径上符合纳什
均衡,非均衡路径上女方不接受得益是0不小于接受的得益0,非均衡路
径是NE,则该均衡是SPNE。
接受
追 B:女方
不接受
囚徒的话: 1、集体理性和个人理性常常是冲突的:民主常常
不能代表“民意”;公司好不见得你就好;如果 我们都强大了,国家不见得就强大了…… 2、承认人是自私的,一切都好办了。
10
2.纳什均衡是唯一的吗?
美国会打朝鲜吗
同时有两个纳什 均衡
美国打了越南,打了阿富汗,打了 伊拉克,也已经打过朝鲜,它还会 再打朝鲜吗?如果美国智库计算出 如下简化的支付矩阵,那么结果会 怎样呢?
博弈论总复习总结
• 博弈类型
类型
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
其他博弈
• 博弈的类型关系
非合作博弈 博弈
合作博弈
是否同时 决策
对他人的 了解程度
静态博弈
动态博弈
完全信息 博弈
不完全信 息博弈
• 博弈的分类
博弈 分类
是否有协议 决策的顺序
是否连续 持续时间 得益情况 得益信息 过程信息
在案例博弈之中,如果局中人甲T、S、N三个策略,那么博

博弈论小结

博弈论小结

博弈论小结一般博弈论的题就是需要寻找必败态(又叫奇异局势),一般的博弈题认为谁不能进行操作谁就输了叫做Normal Play Rule,但还有一些变形是谁取走最后一个棋子谁就输了叫做Misere Play Rule,也称为Anti-SG游戏。

必败态:即无论如何移动都会到达必胜态,必胜态:至少有一种移动可以到达必败态。

外,对于游戏的双方,如果二者博弈的规则相同,那么称为这类游戏是对等(impartial games)的;否则称为不平等游戏(partizan games )。

比较常见的博弈类型:(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个,最后取光者得胜。

n = (m+1)r+s ,(r为任意自然数,s≤m),即n%(m+1) != 0,则先取者肯定获胜(二)威佐夫博奕(Wythoff Game)(poj1067):有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

(ak,bk)(ak ≤ bk ,k=0,1,2,...,n)表示奇异局势ak =[k(1+√5)/2], bk= ak + k (k=0,1,2,...,n方括号表示取整函数)(三)尼姆博奕(Nimm Game):有n堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

最常见的博弈类型,把个数去异或即可,也可用SG函数。

对于变形情况:取到最后一个石子的人输有SJ 定理:对于任意的一个 Anti-SG 游戏,如果我们规定当局面中所有单一游戏的 SG 值为 0 时游戏结束,则先手必胜当且仅当以下两个条件满足任意一个:(1)游戏的 SG 函数不为 0,且游戏中某个单一游戏的 SG 函数大于1。

(2)游戏的 SG 函数为 0,且游戏中没有单一游戏的 SG 函数大于 1。

博弈论总结报告范文(3篇)

博弈论总结报告范文(3篇)

第1篇一、引言博弈论是研究具有冲突和合作的个体或群体在有限信息和资源条件下,如何通过策略选择实现自身利益最大化的理论。

自20世纪初以来,博弈论在经济学、政治学、生物学、计算机科学等领域得到了广泛应用。

本文将对博弈论的基本概念、主要模型及其应用进行总结。

二、基本概念1. 博弈:指两个或多个参与者,在一定的规则下,根据对方的策略选择自己的策略,以实现自身利益最大化的过程。

2. 策略:指参与者在博弈中采取的行动方案。

3. 利益:指参与者追求的目标。

4. 博弈结果:指所有参与者采取策略后所达到的状态。

三、主要模型1. 零和博弈:指所有参与者的利益总和为零的博弈,即一方所得即另一方所失。

2. 非零和博弈:指所有参与者的利益总和不为零的博弈。

3. 完美信息博弈:指所有参与者对其他参与者的信息都完全了解的博弈。

4. 不完美信息博弈:指至少有一个参与者对其他参与者的信息不完全了解的博弈。

5. 静态博弈:指参与者同时或依次采取策略的博弈。

6. 动态博弈:指参与者采取策略的顺序是随机的博弈。

四、应用领域1. 经济学:博弈论在经济学中的应用主要体现在市场均衡、价格竞争、企业竞争等方面。

2. 政治学:博弈论在政治学中的应用主要体现在选举、政治决策、国际关系等方面。

3. 生物学:博弈论在生物学中的应用主要体现在物种进化、社会行为、性别选择等方面。

4. 计算机科学:博弈论在计算机科学中的应用主要体现在人工智能、网络安全、算法设计等方面。

五、结论博弈论作为一种研究个体或群体在冲突和合作中实现自身利益最大化的理论,具有广泛的应用前景。

通过对博弈论的基本概念、主要模型及其应用领域的总结,我们可以更好地理解现实生活中的竞争与合作现象,为解决实际问题提供理论指导。

然而,博弈论在应用过程中仍存在一些局限性,如信息不对称、策略复杂等问题,需要进一步研究和改进。

总之,博弈论作为一种重要的理论工具,在各个领域都发挥着重要作用。

随着博弈论研究的不断深入,其在实际应用中的价值将得到进一步体现。

博弈论总结(精选13篇)

博弈论总结(精选13篇)

博弈论总结第1篇最大化自己最坏情况下的收益。

着眼于自己的收益,保证自己收益,防止风险使得自己的收益变小。

以性别之战为例子:首先你得先得到一个关于妻子和丈夫的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育 xxx子期望收益(着眼于自己的期望收益): Uw(q,p)=2PQ + 0×P(1-Q) + 0×Q(1-P) +1×(1-P)(1-Q) = 3PQ - P -Q +1 前面的系数参考收益表(妻子收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,妻子的收益可能为0;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看体育,收益同样最小)这里只是在讨论妻子收益最小的可能性4.妻子的最坏收益为:minUw(p,q) = min(1-P,2P)5.最大化最坏收益: max(min(1-P,2P))解的:P=1/3则妻子的maxmin策略为:1/3概率选择韩剧,2/3概率选择体育。

同理得丈夫的maxmin策略为:1/3概率选择体育,2/3概率选择韩剧。

minmax策略 1.最小化对手最好情况下的收益。

是着眼于对手的收益。

还是这样的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育2.丈夫期望收益(着眼于对方的期望收益):(与maxmin不同要注意!!)Uw(q,p)=PQ + 0×P(1-Q) + 0×Q(1-P) +2×(1-P)(1-Q) = 3PQ - 2P -2Q +2前面的系数参考收益表(丈夫收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,如果这时妻子也想看体育,丈夫收益到2;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看韩剧,收益同最大1)这里只是在讨论妻子收益最小的可能性xxx夫的最大收益为:maxUw(p,q) = max(2-2P,P) 5.最小化最好收益: min(max(1-P,2P))妻子的minmax策略:2/3概率选择韩剧,1/3概率选择体育同里丈夫为的minmax为…在零和博弈中,maxmin策略和minmax策略是等价的。

《经济博弈论》期末考试复习解析

《经济博弈论》期末考试复习解析

《经济博弈论》期末考试复习资料第一章导论1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。

它包括四个要素:参与者,策略,次序和得益。

2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。

即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。

即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。

各博弈方的策略选择范围称策略空间。

每个博弈方各选一个策略构成一个策略组合。

(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。

(4)得益。

各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。

3.合作博弈和非合作博弈的区别:合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。

主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。

假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。

如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。

合作博弈:团体理性(效率高,公正,公平)非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率)4.完全理性和有限理性:完全理性:有完美的分析判断能力和不会犯选择行为的错误。

有限理性:博弈方的判断选择能力有缺陷。

区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。

所以不能简单地假设各博弈方都完全理性。

5.个体理性和集体理性:个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。

第一章课后题:2、4、52.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习《经济博弈论》期末考试复习一、导言在当今的经济学领域中,博弈论已经成为一个不可或缺的工具。

它不仅为我们提供了对策略行为深入理解的理论框架,而且还帮助我们更好地分析许多现实世界的经济现象。

在本次复习文章中,我们将逐步探讨博弈论的基本概念、主要理论,以及在经济学中的应用。

二、基本概念1、博弈:指的是一组决策者,他们根据各自的知识和信息,在给定的规则下,做出决策并采取行动。

2、策略:策略是决策者针对其他决策者可能采取的行动而制定的行动计划。

3、均衡:当所有参与者在其他人的策略中选择最优策略时,就达到了博弈的均衡状态。

三、理论与应用1、纳什均衡(Nash Equilibrium):纳什均衡是一种稳定的策略组合,其中每个参与者都采取了最优策略来应对其他参与者的策略。

2、零和博弈(Zero-Sum Game):零和博弈是一种博弈,其中一方的收益必然等于另一方的损失。

例如,棋类游戏就是零和博弈的典型例子。

3、非零和博弈(Non-Zero-Sum Game):在非零和博弈中,各方的收益或损失不是完全相等的。

例如,国际贸易就是一种非零和博弈。

四、案例分析让我们通过一个简单的例子来理解这些概念。

假设两个国家在进行贸易谈判。

每个国家都有两种策略:开放贸易(Open Trade)或关闭贸易(Closed Trade)。

如果两国都选择开放贸易,则双方都能从贸易中获益。

然而,如果一个国家选择开放贸易,而另一个国家选择关闭贸易,那么选择关闭贸易的国家将获得额外的收益,而选择开放贸易的国家则会遭受损失。

在这个例子中,开放贸易和关闭贸易就是策略,而每个国家都试图在考虑对方策略的情况下做出最优决策。

五、结论通过本次复习,我们深入理解了博弈论的基本概念和主要理论,并探讨了它们在经济学中的应用。

博弈论为我们提供了一个强大的工具来分析策略行为和竞争环境,并帮助我们更好地理解各种经济现象。

希望这些内容能帮助大家在即将到来的期末考试中取得好成绩。

博弈论总结

博弈论总结

博弈论总结1. 哎呀,说到博弈论,我脑子里就像炸开了锅!这玩意儿可真是让人又爱又恨啊。

记得上学那会儿,老师一提这个,我就头大如斗,恨不得钻到桌子底下去。

可是呢,这东西又偏偏跟咱们的生活息息相关,躲都躲不开!2. 博弈论啊,说白了就是研究人和人之间斗智斗勇的学问。

你想啊,从小到大,咱们不就是在不停地跟别人较劲儿吗?跟爸妈讨价还价要零花钱,跟同学争抢最后一块蛋糕,甚至跟自己较劲儿要不要再睡五分钟。

这些可都是博弈啊!3. 有人可能会说:"哎呀,这不就是算计来算计去吗?多俗啊!"可我觉得吧,这恰恰是博弈论的魅力所在。

它把人性中最本能的东西,用数学的方式剖析得明明白白,让咱们能更清楚地了解自己和他人的决策过程。

4. 说到决策,就不得不提到博弈论中的"囚徒困境"了。

这个经典案例可是让无数人抓耳挠腮、绞尽脑汁。

想象一下啊,两个犯罪嫌疑人被分开审讯,每个人都面临着一个艰难的选择:要么背叛同伙保自己,要么保持沉默。

这不就跟我们日常生活中遇到的很多情况一模一样吗?比如说,你和朋友一起逃课被抓,到底是互相推诿还是共同承担责任?5. 再来说说"纳什均衡"吧,这个概念可是让我头疼了好一阵子。

简单来说,就是当每个人都采取最优策略时,谁也不愿意单方面改变自己的选择。

听起来挺复杂,其实生活中随处可见。

就像是堵车时,每个人都想走最快的路,结果大家都堵在一起,谁也动不了。

这时候,即使你知道换条路可能会快点,但又担心一换路其他人也跟着换,最后还是堵着。

唉,真是进退两难啊!6. 博弈论还告诉我们,有时候看似不理智的行为,其实可能是最明智的选择。

比如说,在讨价还价的时候,故意表现得很强硬或者装傻充愣,反而可能会得到更好的结果。

这不就是咱们常说的"会哭的孩子有奶吃"吗?7. 说到这儿,我就想起了我和我妹妹小时候争抢玩具的情景。

那可真是一场没有硝烟的战争啊!我俩都想要那个最新的芭比娃娃,但妈妈说只能买一个。

博弈论期末复习题及答案

博弈论期末复习题及答案

博弈论期末复习题乩设古诺模型中有丹ST厂商。

6为厂商j的产■念=如+…+幺为市场总产为市场出清价格,且己知P = P[Q) = Q_ 0(当时.否ffl'J P= OJo假设厂商f生产缶产■的总成本他"也就是说没有定成本且各厂商的边际成本都相同,为常数c(c <a人假设各厂商同时选择产■,该模型的纳什均衡是什么?当n趙向于无穷大时博弈分析是否仍然有效?(】)报据问题的假设可知各厂底的利润函数为;略=阿,f 5 * (农—比—工一〔G其中1=1,…,叽将利润函数对$求导并令其为0得:帶=& _ _ F _如=0%==(“—另野一门/2根据可个厂商之闾的对称性,可知g;=嘖=…=q:必然成立o 代入上述反应函数可解得:打十i因趾该博弈的纳什均術是所有用个厂商都生产产重—H+1(2)当川趙于无穷時,所分折的市场不再是一个寡头市场而是完全竞争市场』匕肘上述博弈分桁方法其实杲不适用的.史两if获古诺模型屮(a)= “一o等与上题相同,但两个厂商的边际成本不同■分别为G和6心如果。

<心<血2,问纳什均衡产■各为笫少?如果豺<衍<6怛2心>。

+眄•则纳忡均衡产■又为赛少?泰考答案丁(1)两个厂海的利润函数为:九=Z —5一(饶—0 —①)q f—厂忌将利润函数对产皐求导并令开为0得:—=a —7, ~ C, —2q, —0解得两个厂商的反应函数为:。

@ —如—(\ )/2或貝体芻成】Qi ==(吃—G —)/2仗=仏一q、G)/2(2)0 <G <:a/2时*我们粮据上述两个厂商的反应函数、直接求出两个厂商的纳什均衡产量分别为£灯—2门十C:曲-------- 3—a +<1 —2。

毎-一§—■(3)当G V-但2c,>a+c}时,粮据反应函数求出来的厂商2产毘小<0.这倉味晋厂裔2不矣生产”这时厂商1虑了垄断厂裔*厂商1的戢优产量选择是利润最大化的垄断产量,_ ◎—G因此这种情况下前纳什均衡为[3 —门)/2. 0]&=(10°_ % 一仇_ g』)® _ 2® =廻号——5勳=(100 _ Qi ~ Qi — qj)g7—2q2 = —_萇 --- 业血分别对务和他求偏导数并令为0得:说98 —£八矿一^一的"联立两个方稈可解得$ = g =98/3e再代入厂商3的反应函数得缶—(98 —g〔一如)/2 = 98/6o把三个厂商的产量代入各口的利润函数,可得三个厂商的利润分别为4 802/9、4 802/9 和2 401/9°乩三專头垄断帝场有倒转的需求函数为P(Q)=a-e.其中Q =弘+% +如皿是厂商i的产■态一个厂商生产的边际成本为常数耳没有固定成本。

博弈论期末复习题及答案

博弈论期末复习题及答案

博弈论期末复习题8.设古诺模型中有刀家厂商。

©为厂商(的产■卫=如+…+孙为市场总产■/为市场出清价格,且己知P= P(Q) = a- Q(当Q<a时,否则P = 0)。

假设厂商i生产拓产■的总成本为G = C(%)=创门也就是说没有固定成本且各厂商的边际成本都相同,为常数c(e<o)0假设各厂商同时选择产量,该模型的纳什均衡是什么?当n超向于无穷大时博弈分析是否仍然有效?(1) 根据何题的假设可知各厂商的利润函数为:岳=內’ -q = (& -■仏-工_ c。

其中1=1, n.将利润函数对?求导并令其为0得:na w (a —工q,一f)/2根据??个厂商之闾的对称性,可知g; = q* =-••=§;必然成立。

代入上述反应函数可解得:Qi = q;=因此该博弈的纳什均衡是所有«个厂商都生产产壁7? + 1(2) 当穴趋于无穷时,所分析的市场不再是一个坯头市场而是完全竞争市场■此时上述博弈分析方法其实杲不适用的。

9・两摞头古诺模型,P(0)=G -Q 竿与上题相同,但两个厂商的 边际成本不同,分别为c,和s 如果0 Vc <a/2,问纳什均衡 产■各为多少?如果心<c 2<a-t 但2。

■则纳什均衡产 ■又为多少?(1)两个厂商的利润函数为:孤 = 冷―GQ. — (« — g ; — qj)q, — e©将利润函数对产量求导并令貝为0得:許=a -町 _ 匚-2q, = 0解得两个厂商的反应函数为:务=(d — q, — c t )/2或具体芻成:*?] — (a —空—门)/2(12 = (a — g c :)/2(2)与0 V G < "2时.我们根据上述两个厂商的反应函数. 直接求岀两个厂商的纳什均衡产屋分别为:(3) 当门< 但2门> a +G 时,根据反应函数求出来 的厂商2产试《<0-这倉味着厂商2不会生产,这时厂商1成了 主断厂商,厂商1的最优产宦选择是利润最大化的垄断产杲6=9・=— 2 ~因此这种情况下的纳什均衡为[& — G )/2, 0] 3 不=(100 一虫一車一 qdqi — 2% =托—芳.二座务7T? == (100 — q }—血—的)阪—加=—―芈 ----------- a 2分别对g,和如求偏导数并令为0得:Qiu — 2门+化 4鹉=牛-卄。

博弈问题总结(基础篇)

博弈问题总结(基础篇)

博弈问题总结(基础篇)博弈问题总结(基础篇)前⾔最近做的博弈问题的题⽐较多,所以我就汇总了⼀下博弈问题的⼏种题型,⽅便之后的做题博弈论定义博弈论就是指有若⼲个⼈进⾏⼀些对弈,并且默认每个⼈都是最聪明的,不会失误,都可以找到当前的最优解,然后来寻找有没有哪个⼈有必胜/必败的的策略。

A、尼姆博弈为什么叫尼姆博弈呢?因为这是尼姆(英⽂名:Nimm Game)发明的数学游戏。

博弈模型有n堆各若⼲个物品,两个⼈轮流从某⼀堆取任意多的物品,规定每次⾄少取⼀个,多者不限,最后取光者得胜。

分析我们先考虑简单的情况1、n=1这时先⼿必胜,因为他只需要把唯⼀的这⼀堆⽯⼦取⾛就可以了2、n=2若a[1]=a[2],先⼿必败,因为⽆论先⼿在哪⼀堆⽯⼦中取⾛⼏个,后⼿总能在另⼀堆⽯⼦中取⾛相同的个数若a[1]!=a[2],我们假设a[1]>a[2],此时先⼿必胜,因为先⼿可以在第⼀堆⽯⼦中取⾛a[1]-a[2]个,这时两堆⽯⼦的个数相同,下⼀次⽆论后⼿取⾛多少个,先⼿都可以在另⼀堆取⾛同样多个,因此先⼿必胜若a[1]<a[2],同上,先⼿必胜3、要是n=3或者更⼤呢?我们显然不能像上⾯⼀样去枚举每种情况,所以我们要得出⼀个更为⼀般的结论我们设总共有n堆⽯⼦,每⼀堆⽯⼦的个数分别为a[1]、a[2]、a[3]……a[n]若a[1] ^ a[2] ^ a[3] ^ …… ^ a[n] =0先⼿必败,反之先⼿必胜下⾯是证明如果异或和的最⾼位为i,那么必定有⼀堆⽯⼦的第 i 位为1我们设这⼀堆⽯⼦的个数为k,其它所有⽯⼦的异或和为m,总异或和为x则必定有k ^ m=x,我们把这⼀堆⽯⼦变成k^x(k ^ x) ^ m=0这时,所有⽯⼦的异或和都变成了0举个例⼦:11001 ^ 11100=00101,则有(11001 ^ 00101)^ 11100=0如果当前所有数字的异或和为0,那么下⼀次⽆论你怎么取⽯⼦,异或和⼀定不会为0这样我们可以得出结论:如果先⼿异或和不为0,可以⼀步让后⼿的情况为异或和为0;如果先⼿异或和为0,那么后⼿异或和就不为0这样,我们不断进⾏游戏,最终⼀定会达到所有的数都为0的情况,⽽最后⾯对这种情况的⼀定会输所以我们可以得出结论:若a[1] ^ a[2] ^ a[3] ^ …… ^ a[n] =0先⼿必败,反之先⼿必胜例题洛⾕P2197模板题(好裸的板⼦)题意甲,⼄两个⼈玩 Nim 取⽯⼦游戏。

博弈论考前总结

博弈论考前总结

完全信息静态博弈1.占优战略均衡(以不变应万变)1)不要求“理性”为共同知识2)定义: 不管其他人选择什么战略, 参与人的(严格)占优战略是唯一的。

所有人都有严格占优战略, 那么占优战略均衡就是可预测的唯一均衡。

2.例:囚徒困境, 坦白是每一个参与人的最优战略3.重复剔除的占优均衡1)要求: “理性”是参与人的共同知识2)方法: 重复剔除严格劣战略, 直到只剩下唯一的战略组合为止4.若剔除后战略组合不唯一, 那博弈就不是重复剔除占优可解的。

5.例:智猪博弈(不是占优均衡, 只有小猪有严格占优均衡, 大猪没有)6.纳什均衡1)含义: 给定你的战略, 我的战略是最优的, 给定我的战略, 你的战略也是最优的。

即双方在给定的策略下不愿意调整自己的策略。

分类:2)纯战略: 一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动, 该战略为纯战略3)混合战略:如果一个战略规定参与人在给定信息情况下以某种概率分布随机的选择不同的行动, 该战略为混合战略7.存在性定理: 每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略)8.混合战略纳什均衡1)方法: 支付最大化法、支付等值法9.例: 社会福利博弈无限策略博弈案例:古诺双寡头竞争模型(纳什均衡):二者成本函数相同, 完全了解, 同时决策对比: 垄断市场占优战略<重复剔除占优战略<纯战略纳什均衡<混合战略纳什均衡泽尔腾--完全信息动态博弈—子博弈精炼纳什均衡1.博弈的拓展式表达●信息集: 信息集是指对于特定的参与者, 建立基于其所观察到的所有博弈中可能发生的行动的集合。

具体来说, 在扩展形式的博弈中, 信息集就是一系列的决策节点, 例如:●每个节点只描述一个参与者。

●参与者无法区分信息集里的多个节点。

即是说: 如果信息集有多个节点, 信息集所属的参与者就不知道能往哪个节点移动。

2.如果博弈是完美信息的, 每个信息集只能有一个参与者, 并显示博弈所处的阶段。

博弈论之总结

博弈论之总结

博弈论之总结1,总起:在研究博弈论之前呢,我们首先发现博弈论有一个大前提条件,那就是人都是理性的,而且这种理性是一种共识。

在这种大前提之下,我们可以发现无论是静态博弈还是动态博弈。

无论是完全信息博弈还是非完全信息博弈。

所有的博弈者做出的决策都是使自己希望收益最大化的。

无论这个决策带来的收益是确定的,还是决策带来的收益是一个概率分布。

理性博弈者总会做出使自己收益最大化的决策(在考虑到对手决策之后)。

这里我们可能会说,在某一个博弈阶段博弈者的收益并不是最大化的。

但是在重复博弈中,博弈者肯定会使自己的总收益达到最大化。

我想这一点也是老师上课一直在强调的,虽然博弈种类有许多种,但是只要我们知道决策选择是使博弈者期望收益最大化的就会迎刃而解。

下面我们来对每种博弈来做一下具体分析:根据对信息的掌握程度,我们可以把博弈分成四大类:完全信息的静态和动态;不完全信息的静态和动态。

2,完全信息静态博弈首先我们先从非合作均衡中最简单的完全信息静态均衡开始分析,NASH均衡作为最简单的静态博弈,一个非常经典的例子就是囚徒困境。

虽然非常简单但是我们从中看到战略式博弈当中包含的三个基本要素:1,参与人 2,参与人战略级 3,战略所带来的收益(效用函数)从囚徒困境中,我们也可以发现,如果双方合作的话会出现帕累托改进的现象。

于是我们知道双方的策略,只是在给定对方的策略下使自己的支付最大化的策略,而并不一定是最有效率的策略。

就像是污染博弈,美苏冷战是一样的道理。

2,接下来呢,我们再来看一下混合战略,混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。

我们可以发现,在混合战略中,各种情况下参与人采取的战略决策并不是确定的,而是以一个概率的形式出现的,其实我们发现纯战略其实可以当做是混合战略的一种特例(即0-1分布情况下的情形),所以其实混合战略是一种更为广泛的博弈形式。

《经济博弈论》期末考试复习题及参考答案

《经济博弈论》期末考试复习题及参考答案

《经济博弈论》期末考试复习题及参考答案一、单项选择题1、博弈论中,参与人的策略有()A 有限的B 无限的C 有限和无限两种情况D 以上都不对参考答案:C解释:在博弈论中,参与人的策略可以是有限的,也可以是无限的,具体取决于博弈的类型和设定。

2、下列属于完全信息静态博弈的是()A 囚徒困境B 斗鸡博弈C 市场进入博弈D 以上都是参考答案:D解释:囚徒困境、斗鸡博弈和市场进入博弈都属于完全信息静态博弈。

3、在一个两人博弈中,如果双方都知道对方的策略空间和收益函数,这被称为()A 完全信息博弈B 不完全信息博弈C 静态博弈D 动态博弈参考答案:A解释:完全信息博弈意味着博弈中的参与人对彼此的策略空间和收益函数都有清晰的了解。

4、占优策略均衡一定是纳什均衡,纳什均衡()是占优策略均衡。

A 一定B 不一定C 一定不D 以上都不对参考答案:B解释:占优策略均衡是一种更强的均衡概念,占优策略均衡一定是纳什均衡,但纳什均衡不一定是占优策略均衡。

5、对于“囚徒困境”博弈,()A 双方都独立依照自身利益行事,结果限于最不利的局面B 双方都独立依照自身利益行事,导致最好的选择C 双方进行合作,得到了最好的结果D 以上说法都不对参考答案:A解释:在“囚徒困境”中,每个囚徒都从自身利益出发选择坦白,最终导致双方都受到较重的惩罚,这是一种个体理性导致集体非理性的结果。

二、多项选择题1、以下属于博弈构成要素的有()A 参与人B 策略C 收益D 信息E 均衡参考答案:ABCDE解释:博弈的构成要素通常包括参与人、策略、收益、信息和均衡等。

参与人是进行博弈的主体;策略是参与人在博弈中可选择的行动方案;收益是参与人采取不同策略所得到的结果;信息是参与人对博弈局面的了解程度;均衡是博弈的稳定状态。

2、常见的博弈类型有()A 完全信息静态博弈B 完全信息动态博弈C 不完全信息静态博弈D 不完全信息动态博弈参考答案:ABCD解释:这四种博弈类型是根据信息是否完全和博弈的进行时态来划分的。

博弈总结

博弈总结

以下是我从网上收集的关于组合博弈的资料汇总:有一种很有意思的游戏,就是有物体若干堆,可以是火柴棍或是围棋子等等均可。

两个人轮流从堆中取物体若干,规定最后取光物体者取胜。

这是我国民间很古老的一个游戏,别看这游戏极其简单,却蕴含着深刻的数学原理。

下面我们来分析一下要如何才能够取胜。

(一)巴什博奕(Bash Game):只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。

最后取光者得胜。

显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。

因此我们发现了如何取胜的法则:如果n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的取法,那么先取者肯定获胜。

总之,要保持给对手留下(m+1)的倍数,就能最后获胜。

这个游戏还可以有一种变相的玩法:两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜。

(二)威佐夫博奕(Wythoff Game):有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

这种情况下是颇为复杂的。

我们用(ak,bk)(ak ≤ bk ,k=0,1,2,…,n)表示两堆物品的数量并称其为局势,如果甲面对(0,0),那么甲已经输了,这种局势我们称为奇异局势。

前几个奇异局势是:(0,0)、(1,2)、(3,5)、(4,7)、(6,10)、(8,13)、(9,15)、(11,18)、(12,20)。

可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而 bk= ak + k,奇异局势有如下三条性质:1。

任何自然数都包含在一个且仅有一个奇异局势中。

由于ak是未在前面出现过的最小自然数,所以有ak > ak-1 ,而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。

《经济博弈论》期末考试复习资料

《经济博弈论》期末考试复习资料

《经济博弈论》期末考试复习资料第一章导论经典博弈模型囚徒困境、双寡头削价竞争(政府组织协调的必要性和重要性)赌胜博弈、田忌赛马、猜拳博弈斗鸡博弈、智猪博弈古诺模型1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。

2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。

即博弈中决策并承但结果的参与者.包括个人或组织等•博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变•博弈方数量对博弈结果和分析有影响•根据博弈方数量分单人博弈、两人博弈、多人博弈等。

最常见的是两人博弈,单人博弈是退化的博弈(2)策略。

即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。

各博弈方的策略选择范围称策略空间。

每个博弈方各选一个策略构成一个策略组合。

•策略有定性定量、简单复杂之分•不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同•有限博弈:每个博弈方的策略数都是有限的•无限博弈:至少有某些博弈方的策略有无限多个(3)博弈过程:各博弈方策略选择和行为的顺序及反复博弈的规则等。

关键是自己选择时能否观察到其他博弈方的选择。

静态博弈:所有博弈方同时或可看作同时选择策略的博弈。

•——田忌赛马、猜硬币、古诺模型动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动•—-弈棋、市场进入、领导——追随型市场结构重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能。

(特殊的动态博弈)•—-长期客户、长期合同、信誉问题• ---有限次重复博弈,无限次重复博弈(4)得益。

各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。

•得益对应博弈的结果,也就是各博弈方策略的组合•得益是各博弈方追求的根本目标及行为和判断的主要依据•根据得益的博弈分类:零和博弈(也称“严格竞争博弈”。

博弈论期末试题及答案

博弈论期末试题及答案

博弈论期末试题及答案一、选择题(每题2分,共40分)1. 博弈论的核心概念是:A. 均衡分析B. 策略分析C. 利润分析D. 收益分析2. Nash均衡是指:A. 所有玩家达到最优结果B. 没有玩家可以通过改变策略获得更好结果C. 所有玩家都选择相同的策略D. 所有玩家都选择不同的策略3. 在零和博弈中,一方的收益是另一方的:A. 收益的相反数B. 收益的平方C. 收益的负数D. 收益的倒数4. 最优响应策略是指:A. 在对手的策略给定时,玩家自己的最优策略B. 在对手的策略给定时,对手的最优策略C. 利用数学模型计算得到的最优策略D. 随机选择的策略5. 以下哪个是非合作博弈的扩展形式:A. 矩阵形式B. 博弈树形式C. 序列形式D. 重复博弈形式6. 当两位玩家在重复博弈中都选择合作策略时,他们的总收益是:A. 最大化的B. 最小化的C. 平均化的D. 不确定7. 最优子博弈在博弈树中的作用是:A. 寻找博弈的子集B. 确定博弈过程的时间C. 减少博弈的复杂性D. 避免剪枝8. 以下哪个是非合作博弈的解决概念:A. 纳什均衡B. 支配策略C. 策略剖析D. 相对策略9. 在纳什均衡中,每个玩家都是:A. 个体理性的B. 无知的C. 合作的D. 随机的10. 在博弈论中,支配策略指的是:A. 无论对手选择什么策略,都能带来最好结果的策略B. 无论自己选择什么策略,都能带来最好结果的策略C. 无论对手选择什么策略,都会带来最坏结果的策略D. 无论自己选择什么策略,都会带来最坏结果的策略二、简答题(每题10分,共20分)1. 请解释什么是零和博弈,并举例说明。

零和博弈是一种博弈模型,其中一个玩家的收益等于另一个玩家的损失,总收益为零,也就是说一方的利益必然导致另一方的损失。

举例来说,两个商家在一个市场上销售相同的商品,他们之间的竞争就可以看作是零和博弈。

一方的销售额的增加必然导致另一方的销售额减少。

博弈期末考试总结

博弈期末考试总结
每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的
选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己
相应的最佳策略.对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白:(5分)假设囚徒B选择的是坦白,则囚徒A不坦白得益为一8,坦白得益为-5,他还是该选择坦白.因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的,同样的道理,囚徒B的唯-的选择也是坦白.
纳什均衡.即重复剔除严格劣战略方法,无法确保将所有非纳什均衡战略剔除,没有被剔
的战略组合不一定是纳什均衡.
5)没有占优战略均衡的博弈,不能用重复剔除严格劣战略方法求解的博弈,可以有纳什均衡
2,博弈的构成要素有哪些?并对其进行说明。
2、博弈一般由以下几个要素组成,包括:参与人、行动、信息,策略、得益、结果、均衡等.
博弈期末考试总结
1)每一个占优战略均衡都是纳什均衡,而每一个纳什均衡却未必是占优战略均衡;
2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均衡,就是纳什均衡.
3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略剔除,可能会剔除纳什
衡Байду номын сангаас:
4)经重复剔除严格劣战略之后,有不唯一的多个哉略组合保留,其中有的战略组合不一定
(3)按照参与人之间是否合作进行分类,划分为合作博弈和非合作博弈。合作博弈是指参与人之间有着一个对各方具有约束力的协议,参与人在协议范围内进行博弈。反之就是非合作博弈。
7非合作博弈四种类型及对应的均衡是什么?并加以说明。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈与决策答案一、名词解释(每小题2分,共16分)1、博弈博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以施,并从中各自取得相应结果或收益的过程,2、占优战略均衡占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的优策略的基础上达到均衡.3、重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题,4、序列博弈序列博弈是指对局者选择策略有时问先后的顺序,某些对局者可能率先采取行动.序列博也是一种动态博弈.5、动态博弈动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动.6、占优战略均衡--占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的占优策略的基础上达到均衡.7、完全信息---完全信息是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息.8、得益得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西.9,博弈论:博弈论就是系统的研究各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,并对这些解进行讨论分析的理论。

10,纳什战略均衡:纳什战略均衡指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。

11,静态博弈:静态博弈是指在博弈中,参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。

二、、简答题(每小题6分,共24分)1、占优战略均衡和纳什均衡的联系与区别如下:1)每一个占优战略均衡都是纳什均衡,而每一个纳什均衡却未必是占优战略均衡;2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均衡,就是纳什均衡.3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略剔除,可能会剔除纳什衡):4)经重复剔除严格劣战略之后,有不唯一的多个哉略组合保留,其中有的战略组合不一定纳什均衡.即重复剔除严格劣战略方法,无法确保将所有非纳什均衡战略剔除,没有被剔的战略组合不一定是纳什均衡.5)没有占优战略均衡的博弈,不能用重复剔除严格劣战略方法求解的博弈,可以有纳什均衡2,博弈的构成要素有哪些?并对其进行说明。

2、博弈一般由以下几个要素组成,包括:参与人、行动、信息,策略、得益、结果、均衡等.(1)参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以团体):(2)行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策;(3)策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预安排:(4)得益是参与入在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西:(5)均衡是所有参与人的最优策略或行动的组合:均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合.上述要素中,参与人、行动,结果统称为博弈规则,博弈分析的目的就是使用博弈规则来决定均衡.3、博弈论发展过程大体上可以分为五个阶段:(1)萌芽阶段.我国古代的《孙子兵法》,19世纪30年代古诺对两寡头垄断竞争进行了较系统研究.艾奇沃德、斯坦克尔伯格等人对不完全竞争为博弈论的创立奠定了坚实的基础.(2)产生阶段.1944年诺依曼和摩根斯特恩合著的《博弈论与经济行为》,标志着博弈论科学体系的创立.那时1950年和1951年发表了2篇关于非合作博弈的重要文章,土克于1950 年定义了“囚徒困境”。

(3)发展阶段,赛尔顿于1965年将动态分析引入了纳什的均衡概念,提出了“精练纳什均衡”概念;海萨尼则把不完全信息引入博弈论的研究,提出了不完全信息博弈和贝叶斯均衡概念等.(4)繁荣阶段.以纳什、赛尔顿、海萨尼荣获1994年诺贝尔经济学奖为标志。

克瑞普斯,威尔逊.米格罗姆和罗伯茨建立了非常有名的四人帮模型.(5)成熟阶段.进入20世纪90年代+博弈论正走向它的成熟阶段.4、垄断者阻止潜在进入者进入市场的策略有:(1)扩大生产能力策略.现有企业为了防止出现因受生产限制而未能向顾客供应产品而采取的一种策略反应,就是进行投资扩大生产能力。

(2)保证最低价格策略.这个条款是一种承诺,由于法律的限制,商店在向消费者公布了这一条款之后是不能不实行的,因此它是绝对可信的.(3)限制进入定价策略.是指现有企业通过收取低于进入发生的价格的策略来防范进入.(4)掠夺性定价策略.是指价格设定为低于成本,而期望由此发生的损失在新进入企业或者竞争对手被逐出市场后,掠夺企业能够行使市场权利时可能得到补偿.5,什么是重复博弈中的“针锋相对”策略?重复博弈中的“针锋相对”策略博弈是指无限次重复的条件下,你的对手在上一局选取什么策略,你在这一局就选取什么策略。

比如在囚陡困境中,在第一局中,你采取合作——不坦白策略。

在以后的每一局中,背叛的策略,那么你也采取背叛的策略;如果你的对手在上一局中采取合作的策略,那么你也采取合作的策略;结果发现这是一种最好的策略。

针锋相对的策略的确令人满意,它能立即对背叛施以惩罚。

6,博弈论的不同分类有哪些?(1)按照参与人行动的先后顺序进行分类,分为静态博弈和动态博弈。

静态博弈是指在博弈中,参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。

动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。

(2)按照参与人对其他参与人的了解程度进行分类,划分为完全信息博弈和不完全信息博弈。

完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

不完全信息博弈是指博弈过程中对其他参与者的特征收益函数信息了解得不够准确或者不是对所有参与人的特征,收益函数都有准确的信息。

(3)按照参与人之间是否合作进行分类,划分为合作博弈和非合作博弈。

合作博弈是指参与人之间有着一个对各方具有约束力的协议,参与人在协议范围内进行博弈。

反之就是非合作博弈。

7非合作博弈四种类型及对应的均衡是什么?并加以说明。

(1)是完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。

与上述四种博弈相对应的均衡是:纳什均衡、子博弈精练纳什均衡、贝叶斯纳什均衡、精练贝叶斯均衡。

(2)纳什均衡是指在均衡中,每人博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。

(3)子博弈精练纳什均衡是指只有当某一策略组合在每一个子博弈上都构成一个纳什均衡的战略组合。

(4)贝叶斯纳什均衡是指在不完全信息静态博弈中,参与人的行动同时发生,没有先后顺序,因此,没有任何参与人能够有机会观察其他参与人的选择。

(5)精练贝叶斯均衡是指不完全信息动态博弈一开始,某一参与人就会根据其他参与人的不同类型及其所属类型的概率分布,建立自己的初步判断。

当博弈开始后,该参与人就可以根据他所观察到的其他参与人的实际行动,来修正自己的初步判断。

并根据这种不断变化的判断,选择自己的最优策略。

三,论述题(每小题10分,共40分)1,试阐述博弈论发展的几个阶段及该阶段代表人物和主要贡献。

?l,博弈论发展过程大体上可以分为五个阶段:(10分)(1)萌芽阶段,我国古代的《孙子兵法》,19世纪30年代古诺对两寡头垄断竞争进行了较系统研究.艾奇沃德、斯坦克尔伯格等人对不完全竞争为博弈论的创立奠定了坚实的基础.(2)产生阶段.1 944年诺依曼和摩根斯特思合著的《博弈论与经济行为》,标志着博弈论科学体系的创立.那时1950年和1951年发表了2篇关于非合作博弈的重要文章,土克于1950 年定义了“囚徒困境”.(3)发展阶段.赛尔顿于1965年将动态分析引入了纳什的均衡概念,提出了“精练纳什均衡”概念:海萨尼则把不完全信息引入博弈论的研究,提出了不完全信息博弈和贝叶斯均衡概念等.(4)繁荣阶段,以纳什、赛尔顿、海萨尼荣获1994年诺贝尔经济学奖为标志.克瑞普斯、威尔逊,米格罗姆和罗伯茨建立了非常有名的四人帮模型.(5)成熟阶段.进入20世纪90年代,博弈论正走向它的成熟阶段。

2,试阐述阐明经济管理中的保证最低价格条款的策略.2,举例说明博弈论在经济管理领域的应用或现象。

(至少一个详细案例,并加以具体的说明。

)2、管理学中的保证最低价格条款.(10分)该条款规定,顾客在本商店购买这种商品一个月内,如果发现其他任何商店比本店更低价格出售同样的商品,本店将退还差价,并补偿差额的10%.对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款无疑是企业之间竞争的一种手段.我们假定推行保证最低价格条款的商店为商店A,它的竞争者为商店B.当商店A把某产品定为5000元并推行保证最低价格条款的时候,商店B应如何定价最为有利呢?如果商店B高于5000元,显然对其竞争不利,因为除非顾客不了解情况,否则他们将到商店A去购买该产品:如果商店的定价低于5000元,它能否因此而争取到更多的顾客呢?不能,因为商店A已经有了保证最低价格的条款.这样,对商店B来说,它的最优的定价策略就是与商店^制定同样的价格.3、试应用博弈论知识阐述囚徒困境案例(10分)警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年.每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略.对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白:(5分)假设囚徒B选择的是坦白,则囚徒A不坦白得益为一8,坦白得益为-5,他还是该选择坦白.因此,在此博弈中,无论囚徒B采取何种策略囚徒^的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的,同样的道理,囚徒B的唯-的选择也是坦白.因此,该博弈的最终结果是两博弈方同选择坦白策略,同获得益-5,即都被判5年徒刑.4.从博弈论的角度分析价格竞争策略假设市场中仅有A,B两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下:.无论对企业^还是企业B来说,低价都是他们的占优战略.从表可见,企业A的占侥战略是10元,因为无论B采取什么战略,企业^都能获取比定价15元更多的利润,如果企业B定价10元,企业A定价10元能够获利100万元,而定价15元只能获得50万元;如果企业B定价15元,企业A定价1 0元可获利180万元,而定价1 5元却只能获利150万元。

相关文档
最新文档