完整版)博弈论知识点总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完整版)博弈论知识点总结
博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。
博弈中涉及到的变量包括:参与人、行动、战略和信息。完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。
博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。
与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。
战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。
博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。
根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。
Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。
相对应。
占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。换句话说,每个参与人都采取了自己的最优战略,而这些最优战略相互协调,没有参与人有动机去改变自己的战略。这样的战略组合称为占优均衡。
2、重复剔除劣战略均衡
重复剔除劣战略均衡是指在博弈中,参与人反复进行决策,并且在每一轮决策中,都能够剔除掉自己的劣战略,最终达到一种均衡状态。这种均衡状态称为重复剔除劣战略均衡。
3、一般纯战略纳什均衡
一般纯战略纳什均衡是指在博弈中,每个参与人都采取了自己的最优战略,而且这些最优战略相互协调,没有参与人有动机去改变自己的战略。这种均衡状态称为一般纯战略纳什均衡。
以上是新产品开发博弈中的一些基本概念和均衡概念。在实际应用中,可以根据不同的情况选择不同的博弈模型和均衡概念,以便更好地分析和解决问题。
在博弈论中,占优战略是指在任何情况下都能使参与者获得最大利益的战略。如果每个参与者都有占优战略,那么这些战略的组合就是占优战略均衡。这样的博弈结果是所有理性参与者都可以预测到的唯一结果。
如果一个参与者没有占优战略,但是有两个战略中一个比另一个的效用更高,那么这个参与者就不会选择后者。这种劣战略被称为严格劣战略或弱劣战略。通过重复剔除劣战略,可以得到占优均衡。在这个过程中,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。
Nash均衡是完全信息静态博弈的解的概念,它指的是不存在任何一个战略严格优于Nash均衡战略的情况。求解Nash 均衡的方法有划线法和箭头法。
混合战略是参与者在博弈中选择一定概率的各种纯策略的组合。如果每个参与者都选择混合战略,那么这些战略的组合就是混合战略纳什均衡。在混合战略纳什均衡中,每个参与者都不能通过改变自己的策略来获得更大的收益。
子博弈是一个独立的博弈,具有与原博弈相同的信息结构。同时,原博弈也可以作为自身的一个子博弈。为了解决Nash
均衡多重性问题,可以采用精炼的方法,即在Nash均衡的基
础上,定义更加合理的博弈解并剔除不合理的均衡。子博弈精炼纳什均衡是指将那些包含不可置胁战略的纳什均衡从均衡中剔除,从而给出动态博弈结果的一个合理预测。它要求均衡战略的行为规则在每个信息集上都是最优的。
一个战略组合是子博弈精炼Nash均衡当且仅当它对所有
的子博弈(包括原博弈)构成Nash均衡。逆推归纳法是求解
子博弈精炼Nash均衡最常用的方法。其步骤为:找出博弈的
所有子博弈,按照博弈进程的“反方向”逐一求解各个子博弈,直至原博弈。逆推归纳法所得到的解在各子博弈上构成Nash
均衡,即为子博弈精炼纳什均衡。
在完全信息动态博弈中,承诺行动是指在博弈开始之前参与人采取某种改变自己支付或战略空间的行动,使原本不可胁变得可信。但是参与人的承诺行动是有成本的,否则这种承诺就不可信。例如,要挟诉讼就是一种博弈,原告几乎不可能胜诉,但其目的是通过私了获得赔偿。博弈的结果为原告选择不指控,博弈结束。要使威胁变得可信,就必须采取承诺行动(沉没成本)。这样参与人的威胁就会变得可信,从而使其他博弈参与人改变策略。
2.6 重复博弈议题
重复博弈中,可胁或承诺会如何影响当前的行动,以及在一次无法实现的均衡中,是否可以在重复博弈中实现,是重要的议题。
有限次重复博弈指对于给定的阶段博弈G,重复进行T 次,并且在下一次博弈开始前,所有以前博弈的进程都可被观测到。有限次重复博弈均衡结论是,如果阶段博弈G有唯一的Nash均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡结果在每一个阶段重复进行。
同时,如果在单阶段博弈中均衡解不只有一个,则将来行动所作的可胁或承诺可以影响当前的行动。
无限次重复博弈指对于一阶段博弈G,重复进行无限次,并且每个参与人在G(∞,δ)中的收益都是该参与人在无限次的阶段博弈中所得收益的现值。无限次重复博弈的解是无名氏定理,即如果存在可行收益向量(x1,x2,…,xn)满足xi>ei,对于任意xi∈X,则存在贴现率δ,使得无限重复博弈G(∞,δ)存在一个子博弈精炼Nash均衡,其平均收益可达到(x1,x2,…,xn)。这意味着在无限次重复博弈中,只要参与人具有足够的耐心,任何满足个人理性的可行收益向量都可以通过一个特定的子博弈精炼Nash均衡得到。
影响重复博弈结果的因素是重复的次数和信息的完备性。
2.7 子博弈精炼Nash均衡与Nash均衡的区别
子博弈精炼Nash均衡不仅在均衡路径上给出参与人的最优选择,而且在非均衡路径上也能给出参与人的最优选择。这是因为子博弈精炼Nash均衡在任一决策结上都能给出最优决