博弈论及应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全信息:每一个参与人对所有其他参与人(对
手)的特征、战略空间及支付函数有准确的知识。
不完全信息:每一个参与人对所有其他参与人 (对手)的特征、战略空间及支付函数没有准确的知 识。
完全信息静态博弈
博弈的标准式表述:
参与人集合 每一个参与人可供选择的战略集 针对所有参与人可能选择的战略组合,每一个
参与人获得的收益。
囚徒困境:个人理性与团体理性的冲突
囚徒 A
坦白
囚徒 B 坦白
-8,-8
抵赖 0,-10
抵赖 -10,0 -1,-1
占优战略均衡
在博弈中,如果所有的参与人都有占优战略存在,因 而博弈将在所有参与人的占优战略的基础上达到均衡, 这种均衡称为占优战略均衡。在上表中,“A坦白, B也坦白”就是占优战略均衡。
博弈论的基本概念
战略(strategies):参与人选择行动的规则 (在什么情况下选择什么行动)
信息:参与人在博弈中的知识,特别是有关其 他参与人(对手)的特征和行动的知识
得益(payoff):在一个特定的战略组合下参与 人得到的确定的效用水平或期望效用水平
均衡(equilibrium):所有参与人的最优战 略或行动的组合
博弈的主要类型
博弈中的博弈方
单人博弈 两人博弈 多人博弈
多人博弈的特征
博弈方之间并不总是相互对抗的,有时候也会 出现博弈方利益方向一致的情形。
掌握信息较多并不能保证利益也一定较多。
个人追求最大自身利益的行为,常常并不能导 致实现社会的最大利益,也常常不能真正实现 个人自身的最大利益。
这种博弈的结果可以从社会总得益的角度分为 “有效率的”或“无效率的”、“低效率的”, 即可以站在社会利益的立场上对它们作效率方 面的评价。
博弈方的理性
“理性经济人假设”,认为博弈方都是以个 体利益最大化为目标,且有准确的判断选择 能力,也不会“犯错误”
以个体利益最大为目标被称为“个体理 性”(individual Rationality),有完美的分析 判断能力和不会犯选择行为的错误称为“完 全理性”。
智猪博弈:多劳者不多得
大猪
小猪
按
等待
按
5,1
4,4
等待 9,-1 0,0百度文库
•与占优战略均衡相比,重复剔除劣势战略均衡不仅要求博弈的所有参与 人都是理性的,而且要求每个参与人都了解所有的其他参与人都是理性的。
•如果大猪不能排除小猪按按钮的可能性,按按钮就不一定是大猪的最优 选择。
由于重复剔除的占优战略均衡对局中人的理性程度要 求过高,不允许局中人犯丝毫错误,因而据此均衡对 实际结果进行预测有时欠合理
集体理性
现实中的决策者并不都是根据个体利益最大 化决策行为的,至少在局部问题上存在以集 体(团体)利益为目标,追求集体利益最大化 的情况。追求集体利益最大化称为“集体理 性”(Collective Rationality)。
如果允许博弈中存在“有约束力的协 议”(Binding Agreement),使得博弈方采取符 合集体利益最大化而不符合个体利益最大化的 行为时,能够得到有效的补偿,那么个体利益 和集体利益之间的矛盾就可以被克服,从而使 博弈方按照集体理性决策和行为成为可能。
可能存在所谓的“破坏者”:其策略选择对自 身的利益并没有影响,但却会对其他博弈方的 得益产生很大的,有时甚至是决定性的影响。
社会总得益
在两人或多人博弈中,每个博弈方在每种结果 (策略组合)下都有相应的得益,可将每个博弈 方在同一结果中的得益相加算出所有博弈方得 益的总和,并可将其看作这些博弈方的“社会 总得益”
严格劣战略(strictly dominated strategies)则是指:无论其 他博弈参与人采取什么战略,某一参与人可能采取的战略 中,对自己相对不利的战略。
首先找出某一博弈参与人的严格劣战略,将它剔除掉,重 新构造一个不包括已剔除战略的新的博弈;然后继续剔除 这个新的博弈中某一参与人的严格劣战略;重复进行这一 过程,直到剩下唯一的参与人战略组合为止。
占优战略均衡只要求所有的参与人是理性的,而并不 要求每个参与人知道其他参与人也是理性的。因为, 不论其他参与人是否理性,占优战略总是一个理性参 与人的最优选择。
重复剔除劣势战略均衡
劣战略(dominated strategies),是指在其他博弈参与人战 略为既定的条件下,某一参与人可能采取的战略中,对自 己相对不利的战略。
博弈的基本概念 博弈的主要类型 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
博弈论的基本概念
参与人(players):博弈中选择行动以最大 化自己效用的决策主体(可能是个人,也可能 是团体,如国家、企业)
行动(action):参与人在博弈的某个时点的 决策变量
行动的集合(action set)——连续的、离散的 行动组合(action profile) 行动的顺序(the order of play)
“零和博弈”与“变和博弈”
零和博弈:一方的得益必定是另一方的损失, 两人零和博弈也称为“严格竞争博弈”(Strictly Competitive Games)。
零和博弈以外的所有博弈都称为“变和博弈”。 变和博弈在不同策略组合(结果)下各博弈方的利 益之和往往是不相同的。
变和博弈的结果存在社会总得益大小方面的区 别。这也就意味着在博弈方之间存在相互配合, 争取较大社会总利益和个人利益的可能性。
一般地,将允许存在有约束力协议的博弈称为 “合作博弈"(Cooperative games)。与此相对, 不允许存在有约束力协议的博弈则称为”非合 作博弈”(Uncooperative Games)
集体理性是更高级和更复杂的理性,因此研究 合作博弈的难度更大,更难找到分析的一般概 念和系统方法。
顺序与信息
1、参与人行动的先后顺序:静态博弈和动态 博弈
静态博弈:在博弈中,参与人同时选择
行动,或虽非同时但后行动者并不知道前行动
者采取了什么具体行动;
动态博弈:参与人的行动有先后顺序,
且后行动者能观察到先行动者所选择的行动。
2、参与人对有关其他参与人(对手)的特征、战略 空间及收益函数的知识:完全信息博弈和不完全信息 博弈。