不完全信息条件下的非合作博弈
博弈类型及其表述形式
1博弈的分类博弈模型一般分为合作博弈( cooperative game )和非合作博弈( non- cooperativegame),如图。
合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素( Martin and Ariel Rub in stein ,2000, P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。
合作博弈强调的是团体理性( collectiverati on ality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。
20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。
有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin and Ariel Rubinstein ,2000,P2)。
合作博弈,有时也叫做联盟博弈( coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈( coalitio nal game with tran sferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。
可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。
可转移支付合作博弈合作博弈不可转移支付合作博、非合作博弈非合作博弈的分类主要从两个角度进行划分。
博弈论类型[宝典]
博弈类型博弈的分类根据不同的基准也有不同的分类。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。
完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。
不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。
目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。
非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。
与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。
博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。
纳什均衡定义纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
不完全信息 动态 斯塔克尔伯格博弈模型
不完全信息动态斯塔克尔伯格博弈模型下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!不完全信息动态斯塔克尔伯格博弈模型1. 引言斯塔克尔伯格博弈模型是一种常见的非合作博弈模型,它描述了市场上的领导者和追随者之间的相互作用。
第三讲非合作博弈的解:(4)
例子:斯坦伯尔伯模型。两个厂商垄断某个市场,其中厂商 1处于支配地位,它先行动,然后从属企业2后行动。假定 市场需求函数为p=a-Q。厂商的单位产品的成本c。这些是 企业1和2的公共知识。问:厂商1和2是如解。
假定厂商1和2所决定的产量分别为q1,q2。 企业2后行动,对于企业1的任何行动,即任意给定的产量,
• 例子:假定甲在开采一个价值4万元的金矿时需要1万元 资金,乙有1万元资金。甲向乙借钱来开金矿。在这个 博弈的第一阶段,甲向乙承诺: 如果乙借钱给他的话, 那么他就会将采到的金子与乙对半分成,即(2,3)—— 乙得到2万元的金子,同时收回自己的1万元投资。对于 甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止, 双方收益为(0,1)。如果乙借钱给甲的话,那么博弈进 入第二个阶段。在第二阶段中,若甲遵守他的承诺,分 给乙一半的金子,这样两人的收益为(2,3),其中1万 元为投资成本。然而,若甲违背自己的承诺,博弈就会 进入到第三个阶段: 如果乙同甲打官司,那么由于打官 司费时费力, 两个人的收益为(0,1);若乙不打官司, 那么两个人的收益就为(5,0)。
安娜
2 1
鲍伯
1 4
安娜
4 3 蜈蚣博弈
鲍伯 2n+1
3 6
安娜 鲍伯
2n+2
2n 2n-1
2 n-1 2 n+2
• 这个博弈有两个参与人安娜和鲍伯。该博弈从安娜开始,她有两 个策略“合作”和“不合作”,若她选择“不合作”,博弈即刻 终止,安娜得到2,鲍伯得到1;若她选择“合作”,那么博弈继 续进行,由鲍伯开始选择。鲍伯同样有“合作”和“不合作”两 种策略。在这第二轮选择中,若鲍伯选择“不合作”,博弈终止, 选择“合作”,博弈继续进行……在这个博弈最后一轮,即第2n 轮,若鲍伯选择“不合作”,他所得2n+1,安娜得2n-1;若他选 择“合作”,鲍伯得2n+1安娜得2n+2。
博弈与决策题库
题库一、名词解释1.动态博弈动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。
2.逆向归纳法对于动态博弈,特别是在完全信息条件下,最简单的方法就是逆向归纳法。
就是从最后一个阶段或者最后一个子博弈开始逆推向上,逐步向前倒推以求解动态博弈均衡。
3.重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。
4. 第二价格密封拍卖是由1996年诺贝尔经济学奖获得者威廉•维克瑞设计的,因而又被称为是“维克瑞拍卖”,具体规则如下:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竞标者获得该物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。
5.完全信息是指所有参与者各自选择行动的不同组合所决定的收益对所有参与者来说是共同知识。
共同知识就是你知道,我知道,你知道我知道的信息。
6.子博弈直观的含义是原博弈的一个部分,它本身也可以作为一个博弈进行分析,博弈树的一个子树所代表的博弈就是子博弈,子博弈的起始点是某个选择的终点,包括这个终点及所有后续结及枝及终点结之后的收益,构成了一个子博弈树,这个博弈树所代表的博弈称为子博弈。
7.公共信息如果有些信息是博弈参与者都知道的,或者是所有有关的参与者都知道的,这些信息就叫“公共信息”或者“共同知识”。
8.贝叶斯纳什均衡不完全信息静态博弈的均衡称为贝叶斯纳什均衡。
是指在不完全信息静态博弈中在给定自己类型以及其他参与者的类型与策略选择之间关系的条件下,使得自己的期望效用最大。
9.博弈论博弈论是指研究多个个体或团队在特定条件制约下的对局中,利用相关方的策略而实施对应策略的科学。
10.纳什均衡对于每一个参与者来说是这样一种组合,即给定其他参与者的策略,每一个参与者的这个策略能使其效用最大化。
其含义为:当博弈的所有参与者在某一选定的策略组合下都没有动机(单方面)偏离自己选定的策略时,该组合策略就是纳什均衡。
博弈模型汇总
博弈模型汇总如下:
1.合作博弈与非合作博弈:这是根据参与者之间是否可以达成具
有约束力的协议来划分的。
合作博弈强调团队合作和协作,目标是达成共赢;而非合作博弈则强调个人利益最大化,不考虑其他参与者的利益。
2.静态博弈与动态博弈:这是根据参与者做出决策的时间顺序来
划分的。
静态博弈是指所有参与者同时做出决策,或者决策顺序没有影响;动态博弈是指参与者的决策有先后顺序,后行动者可以观察到先行动者的决策。
3.完全信息博弈与不完全信息博弈:这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。
完全信息博弈是指所有参与者都拥有完全的信息,能够准确判断其他参与者的策略和支付函数;不完全信息博弈则是指参与者只拥有部分信息,无法准确判断其他参与者的策略和支付函数。
4.零和博弈与非零和博弈:这是根据所有参与者的总收益是否为
零来划分的。
零和博弈是指所有参与者的总收益为零,一方的收益等于另一方的损失;非零和博弈则是指所有参与者的总收益不为零,各方的收益和损失不一定相关。
5.竞争博弈与合作博弈:这是根据参与者之间是否存在竞争或合
作关系来划分的。
竞争博弈是指参与者之间存在竞争关系,目标是追求个人利益最大化;合作博弈则是指参与者之间存在合作关系,目标是追求共同利益最大化。
6.微分博弈与离散博弈:这是根据决策变量的连续性来划分的。
微分博弈是指决策变量是连续变化的,需要考虑时间、速度等因素;离散博弈则是指决策变量只有有限个可能的取值,通常只考虑状态的变化而不考虑时间、速度等因素。
博弈论的基本结构
博弈论的基本结构
博弈论的基本结构包括以下几个要素:
1.参与者(Player):博弈中的决策主体,他们可以是个人或组织,各自追求自己的利益。
2.策略(Strategy):参与者在给定信息结构下的选择空间或行动方案,也被称为纯策略或混合策略。
3.效用(Utility):可以定义或量化的参与者的利益,也是所有参与者的真正关心的东西,又称偏好或支付函数。
效用决定了参与者对博弈结果的满意程度。
4.信息结构(Information Structure):描述了参与者所拥有的信息,包括完全信息或不完全信息。
5.博弈的结局:反映了在每个可能发生的结果下,所有参与者的利益状态。
同时,根据合作与否,博弈可以分为合作博弈和非合作博弈;根据是否知晓对手的类型,博弈可以分为静态博弈和动态博弈;根据是否知晓所有参与者的类型,博弈可以分为完全信息博弈和不完全信息博弈。
以上内容仅供参考,建议查阅关于博弈论的书籍文献获取更多专业内容。
博弈论“囚徒困境”的四种形式
博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。
其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。
本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。
关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。
它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。
为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。
当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。
用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。
容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。
二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。
而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。
下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。
首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。
不完全信息静态博弈的现实例子
不完全信息静态博弈在现实生活中有许多例子。
以下是其中几个:
房地产市场:在房地产市场中,买家和卖家可能对房屋的实际价值有不同的了解。
由于信息不完全,买家和卖家可能会在价格上产生分歧,导致交易的困难。
就业市场:在就业市场中,雇主和应聘者之间可能存在信息不完全的情况。
雇主可能不了解应聘者的全部技能和经验,而应聘者可能不了解雇主的具体需求和工作要求。
这可能导致雇主开出过高的薪资或对应聘者产生误判,影响双方的利益。
保险市场:在保险市场中,保险公司和投保人之间可能存在信息不完全的情况。
投保人可能不了解保险产品的全部条款和细节,而保险公司可能不了解投保人的真实风险状况。
这可能导致保险产品的定价不合理或投保人得不到足够的保障,影响双方的利益。
商业谈判:在商业谈判中,双方可能对对方的底牌和利益诉求不完全了解。
这可能导致谈判陷入僵局或达成不公平的协议,影响双方的利益。
1.3.2博弈的分类
博弈的分类博弈的形式各种各样,内容非常广泛。
我们按照博弈所具有的不同特征,采用分类研究的方法,将博弈问题分为如下类型:一、合作博弈与非合作博弈博弈论按照参与人之间有没有具有约束力的协议(binding agreement)分为合作博弈和非合作博弈。
合作博弈主要研究人们达成合作的条件及如何分配合作得到的收益,即收益分配问题;非合作博弈研究人们在利益相互影响的局势中如何决策使自己的收益最大,即策略选择问题。
合作博弈和非合作博弈的区别在于人们的行动为相互作用时,参与人能否达成一个具有约束力的协议。
若有,就是合作博弈;否则就是非合作博弈。
例如,两个寡头企业,如果他们之间达成一个协议,意向是联合起来最大化垄断利润,且各自按该协议生产,即是合作博弈,其面临的问题是如何分享合作带来的增益。
但若两个企业间的协议不具有约束力,即没有哪一方能强制另一方遵守该协议,每个企业都只选择自己的最优产量(或价格等),则是非合作博弈。
另外,合作博弈强调的是团体理性、效率、公正和公平。
非合作博弈强调的是个人理性、个人最优决策,其结果可能是“理想”的,也可能是“不理想”的。
现代的经济学家所谈的博弈论在不做特殊说明的前提下一般指非合作博弈,因为合作博弈论远比非合作博弈论复杂,在理论上的成熟度也远远落后于非合作博弈论,所以现在的博弈论在理论上多注重对后者的研究。
二、完全信息与不完全信息博弈按照参与人是否清楚各种博弈策略的选择,对成败利益的得失是否有充分了解,分为完全信息博弈和不完全信息博弈。
如果参与人清楚各种博弈策略的选择,对成败利益的得失有充分了解,则该博弈称为完全信息博弈;反之,则称为不完全信息博弈。
三、静态博弈与动态博弈静态博弈是指局中人同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略的博弈;动态博弈是指双方的行动有先后顺序并且后行动者可以知道先行动者的策略的博弈。
在四人进行的扑克牌游戏中,每个当事人所面临的是一场“完全无信息”的多人动态博弈;而在桥牌比赛中,每个当事人则面对的是一个“不完全无信息”博弈(有一定量信息,因为有一个人要摊牌)。
博弈的分类方法和主要类型
博弈的分类方法和主要类型以下是 7 条关于博弈的分类方法和主要类型的内容:1. 合作博弈和非合作博弈呀!合作博弈就好比一群小伙伴一起搭积木,大家商量着怎么搭才能最高最稳,每个人都为了共同的目标努力,例子就是公司同事们合作完成一个大项目。
而非合作博弈呢,就像两个人抢玩具,都想着自己怎么才能拿到手,比如在商业竞争中,各个企业为了自己的利益争夺市场份额。
2. 静态博弈和动态博弈哦!静态博弈就如同一场拔河比赛,双方站定了位置就开始较劲儿,谁也不能临时改变策略,下棋就是一个典型的例子。
而动态博弈呀,就好像是玩躲猫猫,一方行动了,另一方根据对方的行动再做出反应,然后情况不断变化,谈恋爱时双方的互动就有点像动态博弈呢!3. 完全信息博弈和不完全信息博弈呀。
完全信息博弈就像是玩明牌的扑克牌,你清楚地知道所有的情况,比如考试时知道所有的题目和答案。
不完全信息博弈呢,则像蒙着眼猜东西,你只能知道一部分,那可就刺激啦!像在商业谈判中,双方可能并不完全了解对方的底线。
4. 零和博弈和非零和博弈呢!零和博弈不就是那种“不是你死就是我活”的局面嘛,就像两个人分一个苹果,一个人多了另一个人就少了,赌博有时候就是这样。
而非零和博弈可有意思了,像一起做蛋糕,大家一起努力把蛋糕做大,每个人都能分到更多,合作伙伴共同开拓市场就是这样呀!5. 连续博弈和离散博弈哟!连续博弈就好像是跑马拉松,一直跑一直跑,过程很漫长,股市里的长期投资就像这样。
离散博弈呢,就像短跑比赛,一下子就结束了,比如一次抽奖活动。
6. 对称博弈和非对称博弈呀。
对称博弈好比大家起点都一样,条件都相同,就像两个人进行公平的掰手腕比赛。
但非对称博弈可就不一样啦,可能一方强一方弱,这不就像拳击比赛中重量级别不同的选手对决嘛!7. 策略博弈和随机博弈呢!策略博弈就是要精心谋划,想好每一步怎么走,下象棋就是这样的例子呀。
随机博弈呢,有时候运气成分很大,就像抽奖,全看运气咯!我觉得博弈真的很神奇,不同的分类展现出不同的特点和魅力,在生活中到处都能看到博弈的影子,难道不是吗?让我们多去观察、多去思考,感受博弈带来的乐趣和挑战吧!。
不完全信息同时行动博弈标准
不完全信息同时行动博弈标准
不完全信息同时行动博弈的标准是使用海萨尼转换(Harsanyi transformation)。
这种方法的核心是引入第三方“自然”首先行动,按照某一概率分布指定博弈中不完全的信息,且这一概率分布为公共知识。
在建模博弈中存在的不完全信息时,可以不妨设企业2估计企业1建厂成本高的概率为p1,建厂成本低的概率为1-p1。
但计算收益时还需要知道企业1的策略,为此企业1必须估计企业2认为企业1建厂成本高的概率为p2,企业2认为企业1建厂成本低的概率为1-p2。
依次类推,企业2还需考虑
企业1如何估计企业2对企业1建厂成本的高的概率,这样从某一初始推
断出发而形成了越来越高阶的关于推断的推断问题,被称海萨尼称为“递阶期望”,而海萨尼通过将某一先验分布设为公共知识来解决这一问题。
以上内容仅供参考,如需更全面准确的信息,建议查阅博弈论相关书籍或论文,或者咨询专业的经济学家。
博弈结果的名词解释
博弈结果的名词解释博弈,是指在决策环境中各主体根据自身的利益和目标进行策略选择的行为。
而博弈结果,则是指博弈过程中各主体根据各自采取的策略所达到的结果或者说是达成的状态。
博弈结果在博弈理论中具有重要的意义,下面将从不同角度进行解释和阐述。
1. 信息完全的博弈结果在一个信息完全的博弈中,各主体之间相互了解对方的策略和利益。
博弈结果则是在这样的情况下,各主体根据其最佳策略所达到的收益最大化的状态。
信息完全的博弈结果通常是在双方都能遵循最优策略的情况下达成的,这种结果称为纳什均衡。
2. 信息不完全的博弈结果与信息完全的博弈不同,信息不完全的博弈中各主体并不能完全了解对方的策略和利益。
博弈结果在这种情况下则更加复杂。
信息不完全的博弈结果常常涉及到不确定性和隐藏信息,各主体需要根据有限的信息作出决策。
这种情况下,博弈结果通常依赖于各主体对对方策略的猜测和预测,称为贝叶斯均衡。
3. 合作与非合作博弈结果在博弈理论中,博弈结果可以根据是否涉及合作来进行分类。
合作博弈结果指各主体能够通过合作达到互利的状态,这种结果通常需要各方能够达成合作的共识和协议,并且能够相互信任和遵守协议。
而非合作博弈结果则是各主体通过自身的利益最大化来决策的情况下达成的结果。
非合作博弈结果更加常见,也更加复杂,普遍存在于市场经济和竞争环境中。
4. 平衡与非平衡博弈结果博弈结果也可以根据是否存在均衡状态来进行分类。
平衡博弈结果指博弈过程中各方根据自身的利益选择策略,且不存在改变策略的动机。
这种情况下的博弈结果称为平衡状态,通常是博弈过程的稳定结果。
而非平衡博弈结果则是指博弈过程中各主体存在改变策略的动机,并且可能形成新的博弈结果。
非平衡博弈结果常常是博弈中的动态过程,不断变化和重塑。
综上所述,博弈结果是在博弈过程中各主体根据策略选择达到的状态或者收益。
它的特点和分类多样性,使得博弈理论能够分析和预测各种决策环境中可能出现的结果。
博弈结果的理解和解释,有助于我们更好地理解博弈行为和预测博弈过程中可能出现的情况,从而帮助我们做出更明智的决策。
几个博弈案例
几个博弈案例1.囚徒困境警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。
如果罪犯中至少有一人供认犯罪,就能确认罪名成立。
为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境与面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。
问:两个罪犯会如何选择(坦白还是抵赖)?2.智猪博弈(占优战略均衡)猪圈里有一头大猪,一头小猪。
猪圈的边缘有个踏板,每踩一下,远离踏板的投食口就会落下少量食物。
如果是小猪踩踏板,大猪会在小猪跑到食槽之前吃光所有食物;若是大猪踩踏板,则小猪还有机会吃到一点残羹冷炙,因为小猪食量小嘛。
那么,两头猪会采取什么策略呢?答案是:小猪将安安心心地等在食槽边,而大猪则不知疲倦地奔忙于踏板与食槽之间。
办公室里也会出现这样的场景:有人做“小猪”,舒舒服服地躲起来偷懒;有人做“大猪”,疲于奔命,吃力不讨好。
但不管怎么样,“小猪”笃定一件事:大家是一个团队,就是有责罚,也是落在团队身上,所以总会有“大猪”悲壮地跳出来完成任务。
想一想,你在办公室里扮演的角色,是“大猪”,还是“小猪”?(其实小猪的决策是明智的,想想同一个公司,小股东与大股东的行为。
)3.性别之争(多重纳什均衡)“有一对夫妻,丈夫喜欢看足球赛节目,妻子喜欢看肥皂剧节目,但是家里只有一台电视,于是就产生了争夺频道的矛盾。
假设双方都同意看足球赛,则丈夫可得到2单位效用,妻子得到一单位效用;如果都同意看肥皂剧,则丈夫可得到1单位效用,妻子得到2单位效用;如果双方意见不一致,结果只好大家都不看,各自只能得到0单位效用。
这个博弈的策略式表达如下:丈夫\妻子足球赛肥皂剧足球赛(2,1 ) (0,0)肥皂剧(0,0) (1,2)可以用画线法求解该博弈的纳什均衡,均衡结果是(足球赛,足球赛)与(肥皂剧,肥皂剧)。
信息经济学
信息经济学复习资料一、导言1、信息经济学作为正式的学科概念是在20世纪50年代末才提出来的。
雅各布·马尔萨克在其《信息经济学评论》一文中,提出了经济学研究特有的信息范畴,正式使用了“信息经济学”,标志着信息经济学的诞生。
2、乔治·阿克洛夫提出分析了二手汽车市场的“柠檬”理论(即次货市场理论),这是信息经济学进入拓展阶段的重要标志。
3、信息经济学是研究信息现象在经济活动过程中具体规律的经济学,它主要研究市场信息如何影响人们的具体经济行为及其结果。
4、信息经济学的研究内容:①市场信息的基本形式及对经济活动的影响②资源配置中的信息机制③信息资源配置④如何实现最优信息经济⑤微观信息市场5、信息经济学的研究方法:①市场分析:均衡理论②预期效用理论③不确定性条件的选择理论④市场竞争分析:博弈论6、博弈论是研究决策主体发生直接相互作用时的决策以及这种决策的均衡问题,也就是说,博弈论研究的是当一个主体的选择受到其他主体选择的影响,而且反过来影响其他主体选择时的决策问题和均衡问题,博弈论也称为对策论。
二、不确定性、风险与信息1、经济不确定性意味着在既定环境状态下个人的主观概率分布处于离散状态,而信息则是由趋向于改变这些概率分布的事件外生不确定性2、风险就是不能确定地知道,但能够预测到的状态;而不确定性是即不确定地知道,也不能预测到的状态3、风险偏好分为三类:风险厌恶、风险爱好和风险中性4、风险转移的主要两种方式是保险市场和股票市场,其他风险转移制度(成本保利合同、期货合同、破产法和有限责任法以及厂商垂直一体化管理模式等),风险是不可能完全转移的5、信息的涵义:从本体论层次上说,信息泛指一切事物(物质的和精神的)运动状态和运动方式;从认识层次上说,信息是关于事物运动状态和运动方式的反映6、在现实经济环境中,信息主要是以连续信息、计算信息和累积信息的形式存在的三、市场信息的基本形式1、市场信息一般就表现为公共信息与私人信息、同质信息与异质信息、完全信息与不完全信息以及对称信息与非对称信息等四种基本形式2、同质信息是指具有相同性质并将导致同样经济结果的信息;异质信息是指性质上有所差别并将导致不同经济结果的信息;对于市场参与者而言,共同的市场知识即公共信息,它是能被所有市场参与者获取的所有相关信息;私人信息是指市场知识的另外一种重要形式,它指的是个别市场参与者所拥有的具有独占性质的市场知识,也称个别知识;完全信息是指市场参与者拥有的对于某种经济环境状态的全部知识(新古典一般均衡理论还认为,具有完全信息的信息体系被每个市场参与者免费使用,每个市场参与者都具有有限的信息需求):不完全信息是指市场参与者不拥有对于某种经济环境状态的全部知识;对称信息指的是在相互对应的市场参与者之间作对称分布的有关事件的知识或概率分布;非对称信息就是在相互对应的市场参与者之间不作对称分布的有关某些事件的知识或概率分布四、博弈论基础1、博弈可以分为合作博弈和非合作博弈2、猜硬币游戏可能是博弈论最简单的例子,而“囚徒的困境”是博弈论中最经典的例子3、博弈论的基本概念包括参与者、行动、信息、策略、收益、均衡和结果等,参与者指的是独立决策、独立承担博弈结果的个人或组织,其目的是通过选择决策(或行动)以最大化自己的收益水平;策略是行动的规则而不是行动本身;4、收益的两方面涵义:一是指参与者在特定的策略组合下得到的确定效用水平,二是参与者得到的期望效用水平5、根据不同策略组合下各参与者的收益总和,可将博弈分为零和博弈、常和博弈与变和博弈三种类型6、博弈的标准式表述:①博弈的参与者集合:i∈I,I=(1,2…,n) ②每个参与者可供选择的策略空间:Si,Si={Si},i=1,2,…,n ③针对所有参与者可能选择的策略组合,每个参与者的收益函数:ui(S1,S2,…,Si,…Sn),i=1,2,…,n 一个n人博弈的标准式表述中,参与者的策略空间为S1,…,Sn,收益函数为u1,…,un,此博弈可表示为G={S1,…,Sn;u1,…,Sn}7、四种不同类型的博弈:完全信息静态博弈、完全信息动态博弈(包括完全且完美信息动态博弈和完全但不完美信息动态博弈)、不完全信息静态博弈和不完全信息动态博弈五、完全信息条件下的非合作博弈1、寡头企业的产量决策模型(简称古诺模型)和价格决策模型(简称伯川德模型)是其中最经典的例子;古诺模型是选择的是产量,而伯川德模型选择的是价格;现实经济中,与古诺模型或伯川德模型类似的情况也大量存在,石油输出国组织成员国私自突破限额增加原油产量、社会资源的掠夺性开采以及公共设施的过度使用等,都是古诺模型或伯川德模型在现实经济中的典型例子2、参与者的行动是有先后顺序的,所有动态博弈的一个中心问题就是“可信性”问题3、所谓子博弈,就是能够自成一个博弈的动态博弈的某一个阶段,本身可以作为一个独立的博弈来分析4、根据重复次数的不同,我们可以将重复博弈分为有限次重复博弈和无限次重复博弈六、不完全信息条件下的非合作博弈1、不完全信息博弈也称为贝叶斯博弈,即动态贝叶斯博弈。
博弈的分类名词解释
博弈的分类名词解释博弈论是一门研究决策制定者如何在相互竞争和合作的环境中进行决策的学科。
在博弈论中,博弈被定义为一种涉及多个参与者之间互相影响和干预的决策过程。
根据参与者之间的关系和决策策略的性质,博弈可以被分为不同的类型和分类。
1. 零和博弈零和博弈是一种基于完全对立的博弈形式。
它基于一个假设,即参与者之间的利益是互为相反的。
在零和博弈中,参与者的利益是固定的,一个参与者的收益等于另一个参与者的损失。
经典的零和博弈是“囚徒困境”,其中两个犯罪嫌疑人总是选择背叛对方。
2. 非零和博弈非零和博弈是一种关注参与者利益可以共同增长的博弈形式。
在非零和博弈中,参与者之间的利益可以是互补的,即一个参与者的收益不一定会导致另一个参与者的损失。
这种类型的博弈通常涉及合作和协调,以实现共同的利益。
例如,多家公司在一个市场上进行价格竞争,同时也可以通过合作和协商来提高整个市场的利益。
3. 合作博弈合作博弈是一种参与者通过合作和协商来共同获取利益的博弈形式。
在这种博弈中,参与者可以一起讨论并达成共识,以实现最优的决策结果。
合作博弈通常需要建立持久的关系和互信,并强调参与者之间的联合行动。
合作博弈最常见的应用是在商业合作和联盟中,例如公司合并和合作项目。
4. 非合作博弈非合作博弈是一种参与者在缺乏合作和协商的情况下进行决策的博弈形式。
在非合作博弈中,参与者之间的利益是独立和自私的,他们追求个人最优化的决策。
这种博弈通常涉及竞争和对抗,参与者之间缺乏互信和合作。
经典的非合作博弈是“囚徒困境”,其中两名囚犯在没有沟通的情况下做出决策。
5. 完全信息博弈完全信息博弈是一种参与者在决策过程中拥有全面信息的博弈形式。
在这种博弈中,每个参与者都了解其他参与者的策略和利益,并能够进行理性的决策。
完全信息博弈在理论上较容易分析和求解,因为所有决策因素都是已知的。
然而,在实际情况中,完全信息博弈很少存在。
6. 不完全信息博弈不完全信息博弈是一种参与者在决策过程中不拥有全面信息的博弈形式。
博弈的标准式表述
博弈的标准式表述博弈论是一门研究人类行为决策和策略选择及其结果的学科。
它试图理解不同决策者之间的互动,并对他们的行为进行建模和分析。
博弈论的标准式表述是其中一种常用的方法。
本文将对博弈的标准式表述进行介绍和探讨。
一、博弈的基本概念博弈可以简单地定义为一种互动的决策过程,在这个过程中,决策者根据不同的策略选择来获得最大的利益。
博弈的基本概念主要包括以下几个要素:参与者、策略、支付和信息。
1. 参与者:博弈中的参与者通常被称为玩家。
每个玩家都有自己的决策能力和利益追求,他们通过选择不同的策略来达到自己的目标。
2. 策略:策略是玩家在博弈中所采取的行动方式。
每个玩家可以根据自己的判断和利益选择不同的策略。
策略可以是纯粹的,也可以是混合的。
3. 支付:支付是博弈过程中对玩家行为结果的评估。
通常用支付矩阵或效用函数来表示玩家的支付。
支付可以是正数、负数或零,表示对玩家来说是利益、损失还是中立的结果。
4. 信息:信息在博弈中起着重要的作用。
完全信息博弈指玩家对其他玩家的策略和支付有完全的了解。
而不完全信息博弈则指玩家对其他玩家的策略和支付了解不完全或部分了解。
二、博弈的标准式表述博弈的标准式表述是一种用矩阵来表示博弈的方法。
它将玩家的所有策略和相应的支付归结到一个矩阵中,以便于分析和计算。
标准式博弈主要包括博弈矩阵和纳什均衡两个重要概念。
1. 博弈矩阵:博弈矩阵是用来描述博弈的一种形式。
它的形式通常为二维矩阵,其中行表示玩家A的策略,列表示玩家B的策略,矩阵中的每个元素表示对应策略组合下的支付。
每个玩家根据自己的支付矩阵来选择最优的策略。
以下是一个简单的标准式博弈矩阵示例:玩家B策略1 策略2玩家A策略1 2 1策略2 3 4在这个矩阵中,玩家A有两个策略,玩家B也有两个策略。
矩阵中的每个元素表示对应策略组合下的支付。
2. 纳什均衡:纳什均衡是博弈论中的一个重要概念,指的是在博弈中,每个玩家根据其他玩家的策略来选择自己的策略时,达到一种稳定状态。
第二讲博弈的分类
第二讲:博弈的分类博弈的分类•1、合作博弈与非合作博弈2、完全信息博弈与不完全信息博弈•2完全信息博弈•3、静态博弈与动态博弈•相互组合:完全信息静态博弈、完全信息动态博弈、完全信息静态博弈完全信息动态博弈不完全信息静态博弈、不完全信息动态博弈。
、•4、纯策略博弈与混合策略博弈1、合作博弈与非合作博弈合作博弈合作博弈亦称为和博弈,是指博弈双•合作博弈:合作博弈亦称为正和博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个集体的利益有所而另方的利益不受损害,因而整个集体的利益有所增加。
•研究人们达成合作时如何分配合作得到的收合作博弈益,即收益分配问题。
合作博弈采取的是一种合作的方式,或者说是一种妥协。
方式或者说是种妥协•至于收益在博弈各方之间如何分配,取决于博弈各方的力量对比和技巧运用。
因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。
1、合作博弈与非合作博弈1合作博弈•合作博弈存在的两个基本条件是:存在的两个基本条件是(1)对联盟来说,整体收益大于其每个成员单(1)对联盟来说整体收益大于其每个成员单独经营时的收益之和。
独经营时的收益之和(2)对联盟内部而言应存在具有(2)对联盟内部而言,应存在具有帕累托改进,即都性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。
1合作博弈1、合作博弈与非合作博弈合作博弈的例子:(国际石油输出国组织),合作限产来共同增z OPEC(国际石油输出国组织),合作限产来共同增加利润。
他们控制了绝大部分石油储量,谁不遵守组织内部协定,就予以一定制裁。
内部协定就予以定制裁假如个域有尔玛家旗家润多z假如一个区域里有沃尔玛、家乐福、红旗、家润多、人人乐几个大型超市。
由于太集中了,经常打促销战,造成销售净利率下降为此他们组成个价格联盟来限成销售净利率下降。
为此,他们组成一个价格联盟来限制各自竞争行为。
然后设置了一个惩罚机制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 不完全信息静态博弈
1.2 不完全信息静态博弈 不完全信息静态博弈也称为贝叶斯静态博弈. 在不完全信息静态博弈中,不仅至少有一个参与者 不知道其他参与者的收益函数,而且所有参与者进 行决策时并不知道其他参与者的策略或行动 . q1
Pi(t-I/ti)= P (t-I,ti )/p(ti)= P (t-I,ti )/ P (t-I,ti )
择自己的最优行动,先行动者则尽量传递对自己有利的信息,避 免传递对自己不利的信息.因此,博弈过程是参与者不断修正信 念的过程.
2不完全信息动态博弈 2.3 信号博弈
信号博弈就是两个参与者之间的不完全信息动 态博弈.
a1
m1 接收者 t1 a1 m2 a2 接收者 自然 接收者 a1 m1 a2 m2 a2 扩简 展单 式的 表信 述号 博 弈 :
与者自己知道自己的类型,但其它参与者到并不知道;在自然选
择之后,参与者开始行动,参与者的行动具有先后次序,后行动 者可以观测到先行动者的行动.但无法观察到先行动者的类型. 但是,因为参与者的行动的类型是依存的,每个参与者的行动都 传递着有关自己类型的某种信息,后行动者可以通过观察先行
动者选择的行动来推断类型或修正对类型的先验概率,然后选
2不完全信息动态博弈
接受者的四个纯策略:
1.如果发送者选择信号m1,选择行动a1;如果发送者选择 信号m2,选择行动a1 2.如果发送者选择信号m1,选择行动a1;如果发送者选择 信号m2,选择行动a2
3.如果发送者选择信号m1,选择行动a2;如果发送者选择 信号m2,选择行动a1
4.如果发送者选择信号m1,选择行动a2;如果发送者选择 信号m2,选择行动a2
2不完全信息动态博弈
2.1 不完全信息动态博弈
与不完全信息静态博弈相比较,不完全信息动态 博弈的每个参与者的行动是有先后次序的,不是同时 的。现实中的许多经济问题都属于动态贝叶斯博弈, 市场交易中普遍存在的讨价还价模型就是典型的例子.
2不完全信息动态博弈
2.2 求解动态贝叶斯博弈的基本思路 在不完全信息动态博弈中,自然首先选择参与者的类型,参
不完全信息条件下的非合作博弈
不完全信息博弈的含义 ? 讨价还价模型? 信号博弈?
1 不完全信息静态博弈 2 不完全信息动态博弈
• 不完全信息博弈的含义、讨价还价模型、 博弈 • 不完全信息静态博弈
• 不完全信息动.1 不完全信息博弈的定义 不完全信息动态博弈也称为贝叶斯博弈。在前面讨论 的完全信息博弈中,参与者的收益函数是共同知识,而在 不完全信息博弈中,至少有一个参与者不能确定其他参与 者的收益函数。例如:市场交易中的买者不知卖者能够接 受的最低价格是多少,卖者也不知道买者愿意出的最高价 格是多少.当某个企业进入某个市场时,他并不清楚市场上 已经存在的企业的成本函数等
a2 a1
t2 发送者
2不完全信息动态博弈
发送者具备的四个纯策略:
1.如果自然赋予类型t1,选择信号m1;如果自然赋予类型t2, 选择信号m1 2.如果自然赋予类型t1,选择信号m1;如果自然赋予类型t2, 选择信号m2 3.如果自然赋予类型t1,选择信号m2;如果自然赋予类型t2, 选择信号m1 4.如果自然赋予类型t1,选择信号m2;如果自然赋予类型t2, 选择信号m2
第九章 小
讨论题:
结
1、什么是不完全信息博弈?
2、什么是信号博弈?
3、信号博弈的内容?
4、讨价还价模型的描述?