博弈论中的相关概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
新古典经济学前提:
理性选择——减少不确定;
——经济系统效用最大化。
理性——新古典经济学与博弈论的纽带
博弈论决策前提:理性的战略选择。
博弈论决策基础:最优反应,即带来最大收益的战略。
但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。
新古典经济学决策的背景:
理性的个体面临特定的制度环境(产权、货币、高度竞争的市场),在此基础上以获取利益最大化为目的。
隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。
弊端:
——限制了理论的使用范围,现实中竞争并不完全;
——无法解决货币经济以外的决策难题。
博弈论的优势:
——不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。
游戏规则:
两个选手,轮流取币;
每次至少取一枚硬币;
只能从一行中取任意数量的硬币,不许从两行中选取;
取走最后一枚硬币的为胜者
囚徒困境的启示:
囚徒困境仅仅是二人博弈,多人博弈在现实中更多;
如果囚犯可以交流,结果显著不同;
如果多轮博弈,结果也有不同;
导致困境结论的分析过程令人注目,但最后结论并非理性。
通常假设参与者将采取最优反应战略而理性行事,最大化利润、力争在游戏中获胜、达到主观收益最大化,或者惩罚最小化,皆属于理性行为。
最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战略。
博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。
依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来的最大收益的战略。
标准式——数字矩阵;
扩展式——树形图
不确定事件(contingency):
相机战略(contingent strategy):仅在不确定事件发生时才会采取的战略
信息集(information set):节点2包含了决策者掌握的所有信息,因此也称为信息集。
扩展式的优势:
——展示了每一阶段掌握的信息;
——展示了参与者掌握信息的不完全
所有博弈问题均可用标准式描述,即绘制一个表格,边缘列出参与者的战略,里面列出参与者的收益;
有些博弈的部分战略是相机战略,只有当对方已经采取了特定的行动时,这些战略才会生效。相机战略和应急计划非常重要,尤其是当参与者能够通过其掌握的信息而获取优势时;
如果一个参与者不知道对手已经做出或将要做出的决策,我们就把他所有可能的选择标在同一节点上,在树形图中,该节点会包括多条分支,由于它说明了决策者掌握的信息,我们将其称为一个信息集。确切地说,信息集反映的是决策者不知道的信息,因为他不知道对手将如何决策;
博弈的两种描述方法——扩展式和标准式可以相互替代。
占优战略
占优战略均衡
合作解
非合作解
社会两难
博弈论的精髓:行为互动。
在经济学中,稳定、可预测的互动行为模式被称为均衡。
博弈论要做的就是探寻博弈回合的均衡模式。
占优战略(dominant strategy):无论对方采取何种战略,其都是最优反应的战略。
占优战略均衡:当每一位参与者都选择了各自的占优战略时,相应的博弈结果就是占优战略均衡。
劣战略(dominated strategy):如果无论对手选择哪种战略,一个战略的收益总高于另一个战略,第二个战略就被称为劣战略
社会两难(social dilemma):是一种存在占优战略均衡的博弈,并且参与者采用这种均衡战略的收益比采用非均衡战略的收益要差。
合作解:因合作而提高收益。
非合作解:在没有可能达成有约束力的协议,以协调不同参与者的战略时,参与者们所选的战略及其收益就是一个博弈的非合作解。例如占优战略。
占优战略的存在以及它与合作解相悖的事实是导致社会两难的根本原因。
占优战略均衡也是合作解。
这种合作的占优战略均衡并不是社会两难问题。
占优战略均衡与合作解之间不冲突。
但这是最好的结果吗?
博弈分析的目标之一就是找到参与者之间稳定的、可预测的互动行为模式。按照经济学家的说法,我们称之为均衡。
因为我们假设参与者都是理性的,所以,只有一个参与者选择的是针对对手战略的最优反应战略,其选择才是稳定的。
如果存在一个针对对手所有战略来说都是最有反应的战略,我们就称之为占优战略;
如果博弈中的每个参与者都有占优优势,并且也实施其占优优势,我们就可以获得一个占优战略均衡;
占优战略均衡是一个非合作均衡,每位参与者都独立行动,而不是一起协商战略选择,如果博弈中的参与者都能够保证自己履行协商后的战略,那么他们选择的战略就被称为合作均衡。
合作均衡和占优战略均衡有可能一样,也可能不一样;
社会两难问题是一类重要的占优战略均衡博弈,代表就是囚徒困境。社会两难问题都有一个共性:存在一个与合作均衡冲突的占优战略均衡;
并非所有的博弈都存在占优战略均衡。
纳什均衡;
协调博弈;
谢林点。
纳什均衡(Nash equilibrium):是全部参与者所选战略的一个组合,在这个战略组合中,每个人的战略都是针对其他人战略的最优反应。
任何一方都不可能单方面变换战略而改善自己的境况。
由于纳什均衡战略的选择者也是没有协商的,因此也是非合作均衡。
收益占优均衡(payoff dominant equilibrium):均衡获得最大收益。
风险占优均衡(risk dominant equilibrium):均衡规避最大损失。
协调博弈(coordination game):只有协调彼此的战略选择,两个参与者才能得到最优的收益。两点启示:
——在特定情况下,惯例和传统能够提供多纳什均衡博弈的解;
——协调博弈中的纳什均衡可以解释为什么习俗和惯例看似很随意,实际却很稳定,因为它们都是纳什均衡,能够自我强化。
没有谢林点。
二者收益并不均衡,一方必须接受收益低的现实。
如果双方都认为对方会选择追求其他女士,则又回到(0,0)的初始状态
在一个没有占优战略均衡的博弈中,如果每一个参与者都采用了针对其他参与者所选战略的最优反应战略,那么参与者的战略选择仍然是确定、可预测且理性的,我们把这种情况称之为纳什均衡。
占优均衡战略是一种纳什均衡,但有些纳什均衡不是占优均衡。
纳什均衡是一种非合作均衡,与博弈的合作均衡可能相同,也可能不同。
纳什均衡是求解博弈问题的一个普遍适用的方法。
但也有缺点:
——有些博弈的纳什均衡不是唯一解;如果有线索是决策者认为某个均衡更可能发生,则这个均衡被称为谢林点;
——并不是所有博弈都存在纳什均衡。
零和博弈(zero-sum game):参与者收益之和为零的博弈;
非常数和博弈(nonconstant-sum game):
常数和博弈:
最大最小收益(minimax payoff):最优战略是其最小收益中数值最大的收益所对应的战略。最大最小解并非适合于所有双人零和博弈
零和博弈尽管在博弈论发展史上具有重要的意义,但是过于简化,并不能完全适合于现实。因此又不要引入非常数和博弈
在非常数和博弈中,最大最小解与纳什均衡可能不完全一致。
两种博弈在博弈论发展中具有重要影响:
——零和博弈:依赖最大最小法则或最小最大法则确定纳什均衡;
——存在两个纳什均衡的2×2非常数和博弈。
联盟:
拆台者;