完全信息和不完全信息-博弈论相关

合集下载

博弈论“囚徒困境”的四种形式

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。

其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。

本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。

关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。

为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。

当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。

容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。

二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。

而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。

下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。

首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。

博弈论基础读书笔记三完全信息动态博弈和逆向归纳法

博弈论基础读书笔记三完全信息动态博弈和逆向归纳法

博弈论基础读书笔记三完全信息动态博弈和逆向归纳法第⼆章完全信息动态博弈先来说明两个概念:1、是指在博弈中,参与⼈同时选择或虽⾮同时选择但后⾏动者并不知道先⾏动者采取了什么具体⾏动。

2、是指在博弈中,参与⼈的⾏动有先后顺序,且后⾏动者能够观察到先⾏动者所选择的⾏动。

这⼀章,我们来讨论关于完全信息(即参与者的收益函数是共同知识的博弈)动态博弈的问题。

在这⾥我们还将博弈分为两种:完美信息博弈:即要选择⾏动的参与者完全知道这⼀步之前所有的博弈过程。

完全但不完美信息博弈:即要选择⾏动的参与者不知道这⼀步之前的博弈过程。

进⾏这章之前先简要的解释⼀些东西:所有的动态博弈的中⼼问题都是可信任性。

下⾯给⼀个经典的⼿雷博弈的例⼦:第⼀,参与者1可以选择⽀付1000美元给参与者2或者是⼀分不给。

第⼆,参与者2观察参与者1的选择,然后决定是否引爆⼀颗⼿雷将两个⼈同炸死。

如果参与者2威胁参与者1如果他不付1000美元就引爆⼿雷,如果参与者1相信这个威胁,则最优选择是⽀付1000美元。

但参与者1却不会对这⼀威胁信以为真,因为它不可置信(参与者2不会蠢到因为1000美元⽽同归于尽,⾄于参与者1考虑参与者2是不是疯⼦的情况在第三章讨论)。

这个例⼦就是典型的完全且完美信息博弈。

在2.1节我们将在后⾯使⽤逆向归纳解,来求解这个问题。

在2.2节我们会丰富前⼀节的博弈模型使之成为完全但不完美博弈,我们会定义这种博弈的⼦博弈精炼解,它是逆向归纳法的延申。

在2.3节研究重复博弈,即多次重复⼀个给定博弈。

这⾥分析问题的中⼼使(可信的)威胁和对以后做出的承诺对当前⾏为的影响。

在2.4节中我们介绍分析⼀般的完全信息动态博弈所需要的⼯具。

不再区别信息是否是完美的。

本节和本章的重点都在语⾔,⼀个完全信息动态博弈可能会有多个纳什均衡,但其中⼀些均衡或许包含了不可置信的威胁和承诺,⼦博弈精炼纳什均衡则是通过了可信检验的均衡。

看到这⾥你可能还是⼀头雾⽔,但是⽆所谓,让我们⼀节⼀节的来讲,看到最后你在回头看前⾯的总结可能会更有利于你对本章的理解。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。

2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。

3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。

4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。

5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。

-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

信息经济学与博弈论-明确重点教学文案

信息经济学与博弈论-明确重点教学文案

名词解释完全信息(博弈):指所有博弈方完全了解参加博弈的所有博弈方各种情况下的得益的博弈。

不完全信息(博弈):指至少部分博弈方不完全了解其他博弈方各种情况下的得益的博弈。

完美信息(博弈):动态博弈中所有博弈方对自己选择之前的博弈过程完全了解的博弈。

不完美信息(博弈):动态博弈中存在博弈方对自己之前的全部博弈进程不完全了解的博弈。

划线法:通过在每个博弈方对其他博弈方的每个对策或者对策组的最佳对策的得益下划线,来分析博弈的方法被称为划线法。

纳什均衡:在博弈G=(S1….Sn;u1……un)中,如果由各个博弈方的各一个策略组成策略组合(S1*……Sn*)中,任一个博弈方i的策略Si*都是其余博弈方策略组合(S1*…..Si-1*,Si+1*….Sn)的最佳对策,也即ui(S1*….SI-1*,Si*,Si+1*……Sn*)≥ui(S1….Si-1,Sij,Si+1*…..Sn),且Sij包含于Si*,则称(S1*……Sn*)为G的一个纳什均衡。

纳什定理:在一个有n个博弈方的博弈G=(S1….Sn;u1……un)中,如果n是有限的,且Si都是有限的集(对i=1….n),则该博弈至少存在一个纳什均衡,但可能包含混合策略,即每一个有限博弈至少有一个混合策略纳什均衡。

逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推到前一个阶段博弈方的行为选择,直到第一个阶段的分析方法。

子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原博弈的一个子博弈。

子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合被称为这个动态博弈的一个“子博弈完美纳什均衡”。

触发策略:重复博弈中的两个博弈方所采用的,首先尝试合作,一旦发现一方不合作则用不合作来相报复的策略,称为触发策略。

完全信息博弈和不完全信息博弈例子

完全信息博弈和不完全信息博弈例子

完全信息博弈和不完全信息博弈例子完全信息博弈和不完全信息博弈是博弈论中常见的两种博弈模型。

在完全信息博弈中,参与者对对手的策略和利益有完全了解,而在不完全信息博弈中,参与者对对手的策略和利益了解不完全。

下面将给出10个例子来说明这两种博弈模型。

1. 完全信息博弈:象棋对局象棋是一种典型的完全信息博弈。

在游戏开始之前,双方玩家对对手的棋子摆放和可能的走法有全面的了解。

每一个棋子的能力和走法都是公开的,玩家可以根据对手的走法进行推理和决策。

双方都可以清楚地看到棋盘上的所有信息,这使得象棋成为一个完全信息博弈的范例。

2. 完全信息博弈:扑克牌游戏扑克牌游戏是另一个典型的完全信息博弈。

在游戏开始之前,玩家可以看到自己的牌和公共牌,可以推断其他玩家手中可能的牌型。

玩家可以根据对手的表情、下注行为和牌型推断对手的策略,并做出相应的决策。

3. 完全信息博弈:国际象棋比赛国际象棋比赛是另一个典型的完全信息博弈。

在比赛开始之前,双方选手可以看到对手的棋子摆放和可能的走法,可以根据对手的走法进行推理和决策。

选手可以通过分析对手的行为和棋局的发展,制定出相应的策略。

4. 完全信息博弈:囚徒困境囚徒困境是博弈论中著名的例子。

在这个博弈中,两个囚犯被关押在不同的牢房中,检察官给每个囚犯提供了一个交代罪行的机会。

如果两个囚犯都选择交代,那么他们都会被判刑。

如果两个囚犯都选择保持沉默,那么他们都会被判轻刑。

如果一个囚犯交代而另一个保持沉默,那么前者将获得豁免,后者将被判重刑。

这个博弈的特点是,双方玩家知道对方的利益和策略,并可以根据对方的策略做出自己的决策。

5. 完全信息博弈:足球比赛足球比赛是一种典型的完全信息博弈。

在比赛开始之前,双方球队都可以看到对方的阵容和战术,可以根据对手的策略进行相应的调整。

球队可以根据比赛的进展和对手的表现,调整自己的战术和策略。

6. 不完全信息博弈:扑克牌对局尽管扑克牌游戏可以被看作是完全信息博弈的例子,但在某些情况下,扑克牌对局也可以被看作是不完全信息博弈。

博弈的规则名词解释

博弈的规则名词解释

博弈的规则名词解释引言:博弈,作为一个古老而普遍存在于人类社会中的活动,一直以来吸引着人们的关注和探索。

而博弈的规则则是决定博弈行为进行方式和结果的重要因素。

本文旨在对博弈规则中常见的名词进行解释,让读者更好地了解博弈的本质和玩法。

一、博弈博弈是指两个或多个参与者在一定的限制条件下,通过制定策略和做出选择,追求最优利益的一种竞争行为。

其包含了对抗、合作、交互等多种形式,常见的博弈包括赌博、棋类游戏和商业竞争等。

博弈的核心是参与者的利益冲突和对未来结果的不确定性。

二、零和博弈与非零和博弈零和博弈是指博弈参与者的利益总量为固定值,一方的利益增加必然要以其他方的利益减少为代价。

非零和博弈则是参与者的利益总量可以增加,并且在一定条件下可以实现共赢。

零和博弈常见于赌博和棋类游戏中,而非零和博弈则可以看作是商业竞争中的一种表现形式。

三、完全信息与不完全信息完全信息指博弈参与者对博弈中所涉及的所有信息都有全面的了解。

而不完全信息则意味着博弈参与者只知道一部分或者没有关于其他参与者的信息。

完全信息博弈更依赖于玩家的技巧和策略,而不完全信息博弈则更注重于信息的获取和利用。

四、策略与博弈论策略是指博弈参与者为达到个人或集体利益而制定的行动方案。

博弈论则是用以研究博弈行为的理论框架。

博弈论包括了博弈参与者的假设、策略选择、收益矩阵和均衡分析等内容。

通过博弈论的分析,可以帮助参与者制定最优策略与决策。

五、优势策略与劣势策略优势策略是指在博弈中可以带给参与者更大利益的策略选择。

劣势策略则是相对于优势策略而言,带给参与者较小利益的策略选择。

博弈参与者在制定策略时,应该尽量选择优势策略以增加取胜的概率。

六、博弈的均衡点博弈的均衡点是指在博弈过程中,各参与者通过制定不同的策略选择,形成一种相对稳定的局面。

常见的博弈均衡点包括纳什均衡、帕累托最优和霍夫丁不动点等。

在均衡点下,任何参与者都不愿意改变自己的策略选择,因为任何违背均衡点的行动都会导致个人利益的减少。

博弈论第六章不完全信息静态博弈题库

博弈论第六章不完全信息静态博弈题库

博弈论第六章不完全信息静态博弈题库【原创版】目录一、引言二、不完全信息静态博弈的概述1.不完全信息的定义2.静态博弈的定义三、不完全信息静态博弈的解题方法1.严格优势策略2.纳什讨价还价解3.轴向讨价还价解四、应用案例分析五、总结正文一、引言在博弈论中,不完全信息静态博弈是一个重要的研究领域。

由于参与者在博弈过程中所拥有的信息不完全,这使得博弈过程变得更加复杂和有趣。

本文将介绍不完全信息静态博弈的概述,以及探讨如何解决这类问题。

二、不完全信息静态博弈的概述1.不完全信息的定义不完全信息指的是参与者在博弈过程中,无法完全了解其他参与者的策略或支付函数。

这种情况下,参与者需要根据自己所掌握的信息,来猜测其他参与者可能采取的策略。

2.静态博弈的定义静态博弈是指参与者在一定时间内,一次性地选择策略并完成博弈的过程。

静态博弈中,参与者不需要考虑时间顺序,只需关注当前状态下的最优策略。

三、不完全信息静态博弈的解题方法1.严格优势策略在完全信息静态博弈中,如果一个策略对某个参与者来说是严格优势的,那么他会选择这个策略。

在不完全信息静态博弈中,同样可以利用严格优势策略来求解。

即通过分析其他参与者可能采取的策略,找到一个对某个参与者来说严格优势的策略。

2.纳什讨价还价解纳什讨价还价解是解决不完全信息静态博弈问题的一种方法。

通过设计一种讨价还价机制,使得参与者可以在不完全信息的情况下,达成一种合作解。

纳什讨价还价解的关键是让参与者在博弈过程中,有动力去揭示自己的真实支付函数。

3.轴向讨价还价解轴向讨价还价解是另一种解决不完全信息静态博弈问题的方法。

它通过让参与者在博弈过程中,根据其他参与者的策略选择,来调整自己的策略,从而实现一种合作解。

轴向讨价还价解的优势在于,它可以在不完全信息的情况下,使得参与者的收益达到最大。

四、应用案例分析以寡头垄断市场为例,市场中有两个寡头企业,它们需要决定是否进行价格战。

在这个过程中,每个企业都需要考虑对方的策略选择。

完全信息和不完全信息-博弈论相关

完全信息和不完全信息-博弈论相关

3、完全信息和不完全信息:完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数.在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数.温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。

显然不完全信息意味着不完美信息,但逆命题不成立。

12、完美和不完美信息:不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。

完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然")的行动选择有准确了解的情况,即每一个信息集只包含一个值。

2、贝叶斯均衡:是纳什均衡在不完全信息博弈中的自然扩展。

在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择.给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型.这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。

贝叶斯纳什均衡:P1474、有限次重复博弈:16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。

定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。

那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。

7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。

激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。

博弈论_不完全信息静态博弈

博弈论_不完全信息静态博弈

贝叶斯纳什均衡的存在性
贝叶斯纳什均衡的存在性定理 定理3.1.2,见书上第62页,不讲定理的证明 它与第24页的定理2.2.3的比较。定理3.1.2所
要用到的前提条件更强,其原因在于: 在贝叶斯博弈中,局中人i的收益是纯策略下
的期望收益。或,局中人i的收益函数ui(s-i, si, ti)可以随着类型的变化而变化;当ui是si的凹函 数时,其凸组合“∑pi(t-i|ti)×ui(s-i(t-i), si, ti), t-i∈T-I”也是si的凹函数;若拟凹则不成立
义3.1.2做比较 此定义是对纯策略下贝叶斯纳什均衡定义的一
个直接扩展,其中E(ui)是局中人i在混合策略 组合下,对其收益函数ui的数学期望 定理3.1.3:混合策略组合是贝叶斯纳什均衡 的充分必要条件 定理3.1.4:贝叶斯纳什均衡的存在性定理
求解行业博弈的贝叶斯纳什均衡
条件概率 标记混合策略的符号 标记期望收益的符号 计算不同类型下的期望收益 书上的方法:由混合策略下贝叶斯纳什均衡的
对局中人2的计算
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 , -4/3 , 0 建厂 , -4/3 , 0
不建厂 , 1 , 0 不建厂 , 1 , 0
合成后的支付矩阵
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 0, -4/3 2, 0 建厂 1.5, -4/3 3.5, 0
混合策略
在贝叶斯博弈G=[N, {Ti}, P, {Si(ti)}, {ui}]中,局中人i 在类型ti∈Ti下,为每一个纯策略以概率进行选择,则 xi(ti) =(x1(i)(ti), x2(i)(ti), ···, xm_i(i)(ti))称为局中人i在类型 ti下的一个混合策略。有时简写为xi。

完全信息和不完全信息-博弈论相关

完全信息和不完全信息-博弈论相关

3、完全信息与不完全信息:完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。

在不完全信息博弈里,至少有一个参与人不知道其她参与人的支付函数。

温泉信息就是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。

显然不完全信息意味着不完美信息,但逆命题不成立。

12、完美与不完美信息:不完美信息指的就是自然做出了它的选择,但就是其她选择人并不知道它的具体选择就是什么,金知道各种选择的概率分布。

完美信息:指一个参与人对其她参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。

2、贝叶斯均衡:就是纳什均衡在不完全信息博弈中的自然扩展。

在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。

给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其她参与人实际上会选择什么策略,但就是它能正确预测到其她参与人的选择如何以来与其各自的类型。

这样,她决策的目标就就是在给定自己的类型与别人的类型已从战略情况下最大化自己的期望效用14、PBNE贝叶斯纳什均衡就是这样一种类型依从战略组合:给定自己的类型与别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就就是说没有人有积极性选择其她战略。

贝叶斯纳什均衡:P1474、有限次重复博弈:16、重复博弈就是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。

定理:令G就是阶段博弈,G(T)就是G重复T次的重复博弈(T小于正无穷)。

那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果就是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都就是一次性博弈的均衡结果)。

7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。

激励相容约束也就是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望她选择的行动。

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。

完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。

⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。

在完全信息静态博弈中的均衡是纳什均衡。

最典型的例⼦是囚徒困境与智猪博弈。

下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。

【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。

⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。

离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。

对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。

【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。

所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。

但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。

个⼈的最优选择从社会⾓度看并不是最优的。

社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。

【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。

【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。

【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。

博弈论

博弈论

不完全信息博弈:对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。

不完美信息博弈:如果没有参与者能够获得其他参与者的行动信息,也就是说当参与者做选择的时候不知道其他参与者的选择,这被称为不完美信息博弈。

简单来说,如果把其他参与者的行动理解为一个参与者做决策时所面对的环境,信息不完美就是决策者不知道自己所处的决策环境。

纳什均衡:是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。

所有参与人的最优战略的组合:给定该战略中别人的选择,没有人有积极性改变自己的选择。

贝叶斯均衡:在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。

给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。

由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。

但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。

即不完全信息下的静态博弈均衡称为完美贝叶斯均衡。

子博弈精炼纳什均衡:1)在原博弈是一个纳什均衡;(2)在每一个子博弈上都是纳什均衡。

子博弈:由原博弈中某个决策点(信息集)开始的部分构成一个子博弈。

冷酷策略:是博弈论中的一个名词,它又称为“触发战略”。

它是指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。

囚徒困境:说明为什么甚至在合作对双方都有利时,保持合作也是困难的。

囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。

帕累托改进:,如果不存在另一种状态能使得没有任何人的处境变坏同时至少有一个人的处境变得更好,则这种状态(资源配置、社会制度等)被称为帕累托最优状态。

简单的说法是:对每个人来说,除非“损人”就不可能“利己”,社会就达到了帕累托最优状态。

《博弈论》精品讲义

《博弈论》精品讲义
指定n个局中人,以及他们各自的纯策略空间
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009

第04讲 博弈的基本框架 - 学生

第04讲 博弈的基本框架 - 学生
博弈的基本框架
1
·明确一个博弈的四大构成要素(完美信息、不完美信息)。 ·精确理解信息集与策略(纯策略、混合策略、浓缩策略)这 两个重要概念。
·能够用博弈的扩展式与规范式来描述一个博弈问题。
·了解划分博弈类型的基本方法:完全信息静态、完全信息动 态、不完全信息静态、不完全信息动态。
2
博弈论的基本框架
而象棋则是一个完美信息博弈。
17
信息集
定义 4.2.1 一个信息集 H 是以决策点为元素的集合。
信息集需满足以下两个条件:
(1) 同一个信息集中的所有决策点必须紧接着完全相同的 可选行动。 (2) 同一个信息集中的决策点不能出现一个先于另一个出 现的情况。
18
信息集判断
信息集判断
19
信息集
信息集设臵是正确的。 它表示甲无法判断自己处于信息集四个决策点中的哪一个。 一个博弈者如果总能记住她所经历过的所有博弈路径,我们称她 具有完美回忆(Perfect Recall)。 在图中,我们可以断定甲已经忘记了她自己以前采取的行动以及 其对手的反应,否则她不可能完全分不清四个决策点。 所以我们说在图中,甲没有完美回忆。
22
信息集判断
信息集判断
23
信息集
图中的信息集设臵也是错误的。 它不符合定义4.2.1中的条件(2)。
(2) 同一个信息集中的决策点不能出现一个先于另一个出现的情
况。 信息集只对应一个博弈者,甲乙两人的决策点在同一个信息集内 造成概念上的混乱。
24
信息集判断
信息集判断
25
信息集
在图中的信息集虽然都对应着乙,但它也违反了定义4.2.1中的 条件(2)。 (2) 同一个信息集中的决策点不能出现一个先于另一个出现的情 况。

博弈论四种类型

博弈论四种类型
贝叶斯纳什均衡
贝叶斯纳什均衡
混合战略(不完全信息情况下纯战略均衡的极限)
对原混合战略加入少许不确定性因素,求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性,同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
无限次重复博弈均衡(无名氏定理)
与贴现因子有关
囚徒困境(冷酷战略)
无限期轮流讨价还价模型
一般博弈
逆向归纳法求解
斯坦科尔伯格寡头竞争
雇主与公会之间的竞争
不完全信息静态博弈
在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性
精炼贝叶斯纳什均衡
信号传递博弈
分离均衡
根据所得信息修正判断概率,根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
混同均衡
准分离均衡
类型
信息和行动特点
均衡
均衡类型
特别均衡
求解方法
学过的例子
性质
完全信息静态博弈
每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。
纳什均衡
纯战略纳什均衡(PNE)

博弈论 信息的阶次

博弈论 信息的阶次

博弈论信息的阶次
在博弈论中,信息的阶次是指参与博弈的各方在进行决策时所拥有的信息量的级别。

在博弈论中,通常将信息的阶次分为完全信息、不完全信息和不对称信息三种。

1. 完全信息(Perfect Information):指参与博弈的各方在做出决策时都拥有完全的信息。

也就是说,每个玩家都知道其他玩家的策略和当前的状态。

这种情况下,玩家可以通过分析博弈的所有可能结果和对手的策略来做出最优决策。

2. 不完全信息(Imperfect Information):指参与博弈的各方在做出决策时并不拥有全部的信息。

也就是说,有些信息对于每个玩家来说是未知的或不可观测到的。

在这种情况下,玩家们需要通过观察对手的行为来进行推测和猜测,从而做出最优决策。

3. 不对称信息(Asymmetric Information):指参与博弈的各方在拥有信息时的分布不平等。

也就是说,有些玩家可能拥有更多的信息,而其他玩家则相对缺乏信息。

这种情况下,信息不对称的一方可能会利用其信息优势来获得更好的博弈结果,而信息相对不足的一方则可能处于不利的地位。

信息的阶次在决策过程中起到重要的作用,不同的信息阶次会导致不同的决策结果和博弈行为。

博弈论中的一些重要理论和模型,如博弈树、信息集和策略平衡等都是基于不同的信息阶次而建立的。

博弈论与信息经济学不完全信息静态博弈

博弈论与信息经济学不完全信息静态博弈
A11,..., An n ,和类型依存支付函数u1(a1,, an ;1),...,un (a1,, an ;n )
参加人i懂得自己旳类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 旳情况下,参加人i有关其他参加人类型 i i旳不拟定性。我们用 G {A1,, An ;1,,n ; p1,, pn ;u1,,un} 代表这个博弈。
j
bi
aj cj
bi
aj cj
ui (vi bi ) P bi b j v j
1 2 (vi
bi ) P
bi
bj
vj
(vi
bi )
bi
aj cj
求导得:bi vi
1 2
vi
1 2
aj
由于bi vi
ci vi
ai
ci
1 2 , ai
1 2 aj
0
综上所述,bi vi
贝叶斯均衡是一组战略组合源自(a1.,a
2
.)
,使得对于每一

i
和每一种可能旳 ci
,战略
a
i
(.)最大化参加人
i
旳期望
效用函数
Ec
j
ui
(ai
,
a
j
ci
,
ci
)
。令
z
j
Pa j c j 1为均衡状
态下参加人 j 提供旳概率。最大化行为意味着,只有当参加
人 i 预期参加人 j 不提供时,参加人 i 才会考虑自己是否提
懂得(成本ci 是参加人 i 旳类型)。 c1和 c2 具有相同旳、独立旳定义在[c, c]
上旳分布函数,且是共同知识。

完全信息动态博弈 经典例子

完全信息动态博弈 经典例子

完全信息动态博弈经典例子完全信息动态博弈是博弈论中的一个重要概念,指的是博弈参与者在做决策时拥有完全的信息。

下面是符合要求的10个完全信息动态博弈的经典例子:1. 拍卖场景:假设有两个竞拍者参与一场拍卖,他们都知道对方的出价和拍卖物品的价值,他们需要根据对方的出价和自己对拍卖物品价值的估计来决定自己的出价。

2. 囚徒困境:两名囚犯被关押在不同的牢房中,检察官给他们一个选择,如果他们都保持沉默,那么都只会被判轻罪;如果其中一个人供出另一个人,供出者会被判轻罪,而另一个人则会被判重罪;如果两人都供出对方,那么都会被判重罪。

囚犯在做出决策时,都知道对方的选择和可能的后果。

3. 企业竞争:两家竞争对手企业同时决定是否要进入一个新市场。

如果只有一家企业进入市场,它将获得垄断地位,赢得较高的利润;如果两家企业都进入市场,将会有激烈的竞争,利润都会下降。

两家企业在做出决策时,了解对方的行动和可能的后果。

4. 汽车悖论:假设有两辆车同时行驶在一条单行道上,它们需要决定是否要超车。

如果只有一辆车超车,它将获得更快的到达目的地的时间;如果两辆车同时超车,将会导致交通堵塞,两辆车的到达时间都会延长。

两辆车在做出决策时,了解对方的行动和可能的后果。

5. 资源分配:假设有两个人需要共同分配一笔资源,他们都知道对方对资源的需求和自己对资源的评估。

他们需要根据对方的需求和自己的评估来决定如何分配资源。

6. 股票交易:假设有两个投资者同时决定是否要买入或卖出某只股票。

他们都知道对方的交易意向和市场的情况,他们需要根据对方的交易意向和市场情况来决定自己的交易策略。

7. 网络安全攻防:假设有两个黑客分别掌握了对方的攻击技术和防御技术。

他们需要根据对方的技术和自己的技术来决定如何进行攻击或防御。

8. 购物决策:假设有两个消费者同时决定是否要购买某个商品。

他们都知道对方的购买意向和商品的价格,他们需要根据对方的购买意向和商品的价格来决定自己的购买策略。

不完全信息 博弈论

不完全信息 博弈论

不完全信息博弈论
不完全信息博弈论是博弈论的一个分支,研究的是博弈中一方或双方在做出决策时面临信息不完全或不对称的情境。

在博弈论中,通常假设参与者具有完备信息,即每个参与者都了解有关游戏的所有信息。

而在不完全信息博弈中,这一假设不成立,参与者的信息是不完整的或存在不对称。

在不完全信息博弈中,参与者可能不知道其他玩家的全部策略或支付函数,也可能不了解其他玩家的具体动作。

这导致参与者在做出决策时需要考虑对手可能的信息,并基于对手可能的信息和策略来做出最优的选择。

一些关键的概念和问题涉及到:
一、信息集(Information Set):在不完全信息博弈中,一个信息集包含一个或多个玩家可能的信息。

在信息集中,玩家无法区分对手在该信息集中的确切信息。

二、策略形成:玩家需要制定策略,考虑到他们可能缺乏关于对手的完整信息。

这涉及到在信息集中做出决策,并考虑对手可能的信息。

三、信念(Belief):玩家对于对手的信息的信念是一个关键因素。

这表示玩家对其他玩家可能的策略和信息的主观看法。

四、Bayesian博弈:Bayesian博弈是一种不完全信息博弈,其中玩家具有先验概率分布,表示对其他玩家的信息的不确定性。

在这类博弈中,贝叶斯博弈理论用于建模玩家对信息的不确定性的处理方式。

五、激励兼容性:在不完全信息博弈中,激励兼容性是指设计机制,使得玩家在报告他们的私有信息时没有动机撒谎或隐瞒信息。

不完全信息博弈论的研究涵盖了多种博弈情境,包括拍卖、合同设计、博弈机制设计等领域。

这些理论有助于更好地理解现实生活中存在的信息不对称情形,并提供了一些方法来处理这些情况。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3、完全信息和不完全信息:
完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。

在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数。

温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。

显然不完全信息意味着不完美信息,但逆命题不成立。

12、完美和不完美信息:
不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。

完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。

2、贝叶斯均衡:
是纳什均衡在不完全信息博弈中的自然扩展。

在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。

给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型。

这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用
14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。

贝叶斯纳什均衡:P147
4、有限次重复博弈:
16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。

定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。

那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。

7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。

激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。

显然,只有代理人选择委托人所希望的行动是得到的期望效用不小于他选择其他行动是得到的期望效用时,代理人才有积极性选择委托人所希望的行动。

满足激励相容约束的机制称为可实施机制。

8、似然率f l/f h:统计学上,似然率度量给定代理人选择a=L时PAI发生的概率与给定代理人选定a=H是PAI发生的概率的比率,它告诉观测者观测到的PAI在多
大程度上来自分布f l而不是来自于f h。

较高的似然率意味着PAI 有较大的可能性来自基于分布f L;当似然率等于1是,PAI来自于f L和f h可能性相同。

15/9、纯策略和混合策略
如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,我们成为纯策略。

如果一个战略规定参与人在给定信息下以某种概率分布随机得选择不同的行动,就成混合策略。

在博弈的战略式表述中,混合策略可以定义为在纯策略空间上的概率分布。

定义:在n个参与人博弈的战略式表述G=(S1,S2,….S n; U1…..U n)中,假定参与人I 有K个纯策略:S I=( 张维迎P59
PBNE: P183
20/13、分离均衡和混同均衡
分离均衡:不同类型的发送者以1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号。

在分离均衡中,信号准确的揭示其类型,例子如P191
混同均衡:不同类型的发送者选择相同的信号,没有任何类型选择与其他类型不同的信号,一次接受者不修正鲜艳概率。

1、逆向选择
是指由于交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品,进而出现市场交易产品平均质量下降的现象。

张维迎236 逆向选择模型:
自然选择代理人的类型,代理人知道自己的类型,委托人不知道(因为信息是不完全的);委托人和代理人签订合同。

简单例子:买者和卖者的关系:卖者(代理人)对产品的质量比买者(委托人)有更多的知识。

5、hazard rate 风险率
6、intuitive criterion 直观标准
张维迎203
克瑞普斯和克瑞普斯-曹的“直观标准”将劣战略扩展到相对于均衡战略的劣战略,从而通过提出更多劣战略的办法缩小均衡数量,进一步改进了精炼贝叶斯均衡概念。

10、moral hazard 道德风险
从事经济活动的人在最大限度地增进自身效用的同时做出不利于他人的行动。

或者说是:当签约一方不完全承担风险后果时所采取的自身效用最大化的自私行为。

张维迎236 道德风险模型:
隐藏行动的道德风险模型、隐藏信息的道德风险模型
11、MLPR(monotone likelihood ratio property)单调似然率特征
张维迎251 举例说明:似然率对产出是单调的
17、strictly dominated strategy 严格劣战略
张维迎34
一般地,Si*成为参与人i的(严格)占有战略,如果对应的所有的S-i,SI* 是i 的严格最优选择,即:ui(SI*,S-I)> ui(SI’,S-I)任意S-I,任意Si’不等于Si* 对应地,所有的Si’不等于Si*被称为劣战略
18、Strategy space 战略空间
策略空间(strategy space)是指博弈各方可供选择的策略或行为的集合。

比如,一个参与人的所有可选择的策略的集合就是这个参与人的策略空间。

19、SM condition/单交叉条件/分离条件
张维迎194
不等式见书194-195 此条件说明改变价格对不同类型企业的里软的影响是不同的,特别低,高成本企业比低成本企业更愿意选择高价格。

21、SPE 子博弈完美均衡
梯若尔84
扩展式子博弈中的行为策略组合是一个子博弈完美均衡,如果对每一个适当的
子博弈G,在G上的限制是G的一个纳什均衡。

22、weak dominated strategy 弱劣战略
张维迎37 41出现无准确定义。

相关文档
最新文档