完全信息和不完全信息-博弈论相关
第三章信息经济学的研究方法—博弈论
第一节 概述-人生处处皆博弈
人生是永不停歇的博弈过程,博弈意 略达到合意的结果。
作为博弈者,最佳策略是最大限度地 利用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社 会整体福利增加。
一、博弈论的定义
博弈论(game theory,又译为对策论,游戏论)
定义:研究决策主体的行为在直接相互作用时,人们如 何进行决策、以及这种决策如何达到均衡。
五、博弈论与信息经济学
博弈论是给定信息结构求均衡结果,它实际上是一种均衡理论, 我们最终要找的是一个均衡的结果,博弈论是方法论导向的, 它实际上是一种解决问题的方法。它是一个实证的方法。
信息经济学是给定信息结构求契约的安排。它实际上是一种契 约设计理论,它是问题导向的。它是一个规范的方法。
石匠的决策与拳击手的决策的区别
一、博弈论的定义
2、理性人假设 理性人是指一个很好定义的偏好,在面临给定的约束条件下
最大化自己的偏好。
博弈论说起来有些绕嘴,但理解起来很好理解,那就是 每个对弈者在决定采取哪种行动时,不但要根据自身的利益 和目的行事,而且要考虑到他的决策行为对其他人可能的影 响,通过选择最佳行动计划,来寻求收益或效用的最大化。
(一)囚徒困境
假定: (1)每个局中人都知道博弈规则和博弈结果的支付
矩阵; (2)每个局中人都是理性的(个人理性和个人最优
决策); (3)不能“串通”
(一)囚徒困境——纳什均衡
囚徒A
坦白
坦白 囚徒 B
-8,-8
抵赖 -10,0
抵赖 0,-10 -1,-1
-8大于-10 0大于-1
(坦白,坦白)是纳什均衡
第三章 信息经济学的研究方法 ——博弈论
博弈论知识点总结完整版
博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。
它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。
下面是博弈论中的一些重要知识点的总结。
1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。
-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。
-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。
2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。
-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。
3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。
-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。
-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。
4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。
-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。
-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。
5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。
-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。
-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。
6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。
-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。
-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。
7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。
-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。
信息经济学与博弈论-明确重点教学文案
名词解释完全信息(博弈):指所有博弈方完全了解参加博弈的所有博弈方各种情况下的得益的博弈。
不完全信息(博弈):指至少部分博弈方不完全了解其他博弈方各种情况下的得益的博弈。
完美信息(博弈):动态博弈中所有博弈方对自己选择之前的博弈过程完全了解的博弈。
不完美信息(博弈):动态博弈中存在博弈方对自己之前的全部博弈进程不完全了解的博弈。
划线法:通过在每个博弈方对其他博弈方的每个对策或者对策组的最佳对策的得益下划线,来分析博弈的方法被称为划线法。
纳什均衡:在博弈G=(S1….Sn;u1……un)中,如果由各个博弈方的各一个策略组成策略组合(S1*……Sn*)中,任一个博弈方i的策略Si*都是其余博弈方策略组合(S1*…..Si-1*,Si+1*….Sn)的最佳对策,也即ui(S1*….SI-1*,Si*,Si+1*……Sn*)≥ui(S1….Si-1,Sij,Si+1*…..Sn),且Sij包含于Si*,则称(S1*……Sn*)为G的一个纳什均衡。
纳什定理:在一个有n个博弈方的博弈G=(S1….Sn;u1……un)中,如果n是有限的,且Si都是有限的集(对i=1….n),则该博弈至少存在一个纳什均衡,但可能包含混合策略,即每一个有限博弈至少有一个混合策略纳什均衡。
逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推到前一个阶段博弈方的行为选择,直到第一个阶段的分析方法。
子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原博弈的一个子博弈。
子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合被称为这个动态博弈的一个“子博弈完美纳什均衡”。
触发策略:重复博弈中的两个博弈方所采用的,首先尝试合作,一旦发现一方不合作则用不合作来相报复的策略,称为触发策略。
完全信息博弈和不完全信息博弈例子
完全信息博弈和不完全信息博弈例子完全信息博弈和不完全信息博弈是博弈论中常见的两种博弈模型。
在完全信息博弈中,参与者对对手的策略和利益有完全了解,而在不完全信息博弈中,参与者对对手的策略和利益了解不完全。
下面将给出10个例子来说明这两种博弈模型。
1. 完全信息博弈:象棋对局象棋是一种典型的完全信息博弈。
在游戏开始之前,双方玩家对对手的棋子摆放和可能的走法有全面的了解。
每一个棋子的能力和走法都是公开的,玩家可以根据对手的走法进行推理和决策。
双方都可以清楚地看到棋盘上的所有信息,这使得象棋成为一个完全信息博弈的范例。
2. 完全信息博弈:扑克牌游戏扑克牌游戏是另一个典型的完全信息博弈。
在游戏开始之前,玩家可以看到自己的牌和公共牌,可以推断其他玩家手中可能的牌型。
玩家可以根据对手的表情、下注行为和牌型推断对手的策略,并做出相应的决策。
3. 完全信息博弈:国际象棋比赛国际象棋比赛是另一个典型的完全信息博弈。
在比赛开始之前,双方选手可以看到对手的棋子摆放和可能的走法,可以根据对手的走法进行推理和决策。
选手可以通过分析对手的行为和棋局的发展,制定出相应的策略。
4. 完全信息博弈:囚徒困境囚徒困境是博弈论中著名的例子。
在这个博弈中,两个囚犯被关押在不同的牢房中,检察官给每个囚犯提供了一个交代罪行的机会。
如果两个囚犯都选择交代,那么他们都会被判刑。
如果两个囚犯都选择保持沉默,那么他们都会被判轻刑。
如果一个囚犯交代而另一个保持沉默,那么前者将获得豁免,后者将被判重刑。
这个博弈的特点是,双方玩家知道对方的利益和策略,并可以根据对方的策略做出自己的决策。
5. 完全信息博弈:足球比赛足球比赛是一种典型的完全信息博弈。
在比赛开始之前,双方球队都可以看到对方的阵容和战术,可以根据对手的策略进行相应的调整。
球队可以根据比赛的进展和对手的表现,调整自己的战术和策略。
6. 不完全信息博弈:扑克牌对局尽管扑克牌游戏可以被看作是完全信息博弈的例子,但在某些情况下,扑克牌对局也可以被看作是不完全信息博弈。
博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)
二、博弈论的发展史 2.1中国传统文化中的博弈论
在我国,博弈论的思想源远流长,古代人民很早就认识了博弈问题,虽然没有形 成一套完整的理论体系和方法,但博弈论的思想和实践活动,则可以追溯到 2000 多年 前。著名的"齐王与田忌骞马"就是一经典事例。这里,田忌进行的是"在给定齐王策略 不变情况下如何取胜"这一策略选择,实际上就是现代博弈论中的完全信息条件下的两 人博弈问题。著名的《孙子兵法》一书对战争胜负的认识,以及胜负之间诸因素的相 互作用的深刻论述,和所提出的一系列军事对策等,都反映出其系统的博弈论思想。 而《三十六计》则可以称做是一部活生生的军事博弈论教科书。《孙子兵法》和《三
博弈论论文
摘要:在现实生活中,人们的利益冲突与一致具有普遍性。因此,几乎所有的决 策问题都可以认为是博弈。虽然博弈论是数学的一个分支,但其应用范围十分广泛, 在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈 论的案例。本文对博弈论发展简史、博弈论基本概念进行阐述,对囚徒困境、纳什均 衡、完全信息静态博弈、完全信息动态博弈、进行解析与案例分析。 关键词:博弈论、博弈论发展简史、博弈论基本概念、囚徒困境案例、纳什均衡 案例、完全信息静态博弈、完全信息动态博弈。
一、在生活中广泛应用的博弈论
在高飞老师的带领下,经过一段时间的学习,我对博弈论有了一些肤浅的理解。 诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈, 有人说没有,那是因为缺少发现博弈现象的眼睛。 人生就是在弈棋,学会博弈。虽说 博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学 语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所 以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策 性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。目前在生 物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛 的应用。人们每天都面临着无数个选择,而博弈能运用具体的案例模型和相对应的决 策方法,让人们在最短的时间内作出最有利于自己的选择。 早在 1994 年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教 授就共同分享了当年的诺贝尔经济学奖和 93 万美元的奖金。2005 年,瑞典皇家科学 院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托 马斯·谢林,以表彰他们在博弈论领域作出的贡献。纳什的贡献是在 1944 年与奥斯 卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步 形成。而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用 到了博弈学理论。奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践 来展示博弈论在社会各个领域的实际意义。他们两位利用博弈论对商业谈判、种族隔 离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括 核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理 等方面。
博弈的规则名词解释
博弈的规则名词解释引言:博弈,作为一个古老而普遍存在于人类社会中的活动,一直以来吸引着人们的关注和探索。
而博弈的规则则是决定博弈行为进行方式和结果的重要因素。
本文旨在对博弈规则中常见的名词进行解释,让读者更好地了解博弈的本质和玩法。
一、博弈博弈是指两个或多个参与者在一定的限制条件下,通过制定策略和做出选择,追求最优利益的一种竞争行为。
其包含了对抗、合作、交互等多种形式,常见的博弈包括赌博、棋类游戏和商业竞争等。
博弈的核心是参与者的利益冲突和对未来结果的不确定性。
二、零和博弈与非零和博弈零和博弈是指博弈参与者的利益总量为固定值,一方的利益增加必然要以其他方的利益减少为代价。
非零和博弈则是参与者的利益总量可以增加,并且在一定条件下可以实现共赢。
零和博弈常见于赌博和棋类游戏中,而非零和博弈则可以看作是商业竞争中的一种表现形式。
三、完全信息与不完全信息完全信息指博弈参与者对博弈中所涉及的所有信息都有全面的了解。
而不完全信息则意味着博弈参与者只知道一部分或者没有关于其他参与者的信息。
完全信息博弈更依赖于玩家的技巧和策略,而不完全信息博弈则更注重于信息的获取和利用。
四、策略与博弈论策略是指博弈参与者为达到个人或集体利益而制定的行动方案。
博弈论则是用以研究博弈行为的理论框架。
博弈论包括了博弈参与者的假设、策略选择、收益矩阵和均衡分析等内容。
通过博弈论的分析,可以帮助参与者制定最优策略与决策。
五、优势策略与劣势策略优势策略是指在博弈中可以带给参与者更大利益的策略选择。
劣势策略则是相对于优势策略而言,带给参与者较小利益的策略选择。
博弈参与者在制定策略时,应该尽量选择优势策略以增加取胜的概率。
六、博弈的均衡点博弈的均衡点是指在博弈过程中,各参与者通过制定不同的策略选择,形成一种相对稳定的局面。
常见的博弈均衡点包括纳什均衡、帕累托最优和霍夫丁不动点等。
在均衡点下,任何参与者都不愿意改变自己的策略选择,因为任何违背均衡点的行动都会导致个人利益的减少。
1博弈论概述2完全信息静态博弈3完全信息动态博弈4
②从局中人行动的先后顺序可划分为静 态博弈(Static game)和动态博弈 (dynamic game)。静态博弈是指在博弈中, 局中人同时选择行动或虽非同时行动但后行 动者并不知道先行动者采取了什么具体行动。 动态博弈是指局中人的行动有先后顺序,且 后行动者能够观察到先行动者所选择的行动。
③从局中人是否具有有关其他参与人 (对手)的特征、策略空间及支付函数方面 的知识的角度,可划分为完全信息博弈
合作博弈和非合作博弈的区别在于人们的行动为相互 作用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博弈;否则就是非合 作博弈。例如,两个寡头企业,如果他们之间达成一个协议, 联合最大化垄断利润,且各自按该协议生产,即是合作博弈。 其面临的问题是如何分享合作带来的剩余。但若两个企业间 的协议不具有约束力,即没有哪一方能强制另一方遵守该协 议,每个企业都只选择自己的最优产量(或价格),则是非 合作博弈。另外,合作博弈强调的是团体理性、效率、公正 和公平。非合作博弈强调的是个人理性、个人最优决策,其 结果可能是有效率的,也可能是无效率的。
一、占优策略均衡
通常情况下,每个局中人的支付是博弈中所有参与 人策略的函数,故每个局中人的最优策略选择依赖于所 有其他参与人的策略选择。但在一些特殊博弈中,一个 参与人的最优策略选择可能并不依赖于其他参与人的策 略选择,即无论其他参与人选择什么策略,他的最优策 略是唯一的,这种最优策略被称为“占优策略” (dominant strategy)。 例:“囚徒困境” 囚徒困境是博弈论中的经典案例。该故事讲的是,两 个嫌疑犯作案后被警察抓住,分别被关在不同的房间里 进行审讯。警察知道两人有罪,但缺乏有力的证据,除 非两人之中有一个坦白。警察告诉每个人,他们的可选 择的策略与支付如下表:
完全信息和不完全信息-博弈论相关
3、完全信息和不完全信息:完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数.在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数.温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。
显然不完全信息意味着不完美信息,但逆命题不成立。
12、完美和不完美信息:不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。
完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然")的行动选择有准确了解的情况,即每一个信息集只包含一个值。
2、贝叶斯均衡:是纳什均衡在不完全信息博弈中的自然扩展。
在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择.给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型.这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。
贝叶斯纳什均衡:P1474、有限次重复博弈:16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。
定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。
那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。
7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。
激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。
博弈论考试题及答案
博弈论考试题及答案一、选择题(每题2分,共20分)1. 博弈论中的“囚徒困境”是指什么?A. 两个囚犯相互合作B. 两个囚犯相互背叛C. 两个囚犯中一个合作一个背叛D. 两个囚犯相互猜疑答案:B2. 以下哪个不是博弈论中的基本概念?A. 策略B. 收益C. 公平D. 纳什均衡答案:C3. 在零和博弈中,一个玩家的损失等于另一个玩家的收益,这意味着:A. 总收益为零B. 总收益为正C. 总收益为负D. 总收益不确定答案:A4. 博弈论中的“混合策略”是指:A. 玩家随机选择策略B. 玩家固定选择一种策略C. 玩家根据对手的策略选择策略D. 玩家不使用策略答案:A5. 以下哪个是博弈论中的“完全信息”博弈?A. 拍卖博弈B. 石头剪刀布C. 桥牌D. 信息不对称博弈答案:C6. 博弈论中的“重复博弈”指的是:A. 博弈只进行一次B. 博弈进行多次C. 博弈进行无限次D. 博弈进行有限次但次数未知答案:B7. 以下哪个是博弈论中的“动态博弈”?A. 零和博弈B. 非零和博弈C. 同时博弈D. 顺序博弈答案:D8. 在博弈论中,如果一个策略组合是纳什均衡,那么:A. 每个玩家都有动机单方面改变策略B. 每个玩家都满足于当前策略C. 至少有一个玩家不满意当前策略D. 所有玩家都不满意当前策略答案:B9. 博弈论中的“合作博弈”是指:A. 玩家之间可以形成联盟B. 玩家之间不能形成联盟C. 玩家之间只能通过竞争来获得收益D. 玩家之间只能通过合作来获得收益答案:A10. 以下哪个是博弈论中的“公共知识”?A. 每个玩家的收益函数B. 每个玩家的策略选择C. 每个玩家的偏好D. 每个玩家的个人信息答案:A二、简答题(每题10分,共30分)1. 简述博弈论中的“纳什均衡”概念。
答案:纳什均衡是指在一个博弈中,每个玩家都选择了自己的最优策略,并且没有玩家能够通过单方面改变策略来提高自己的收益。
在纳什均衡状态下,每个玩家的策略是对其他玩家策略的最优反应。
完全信息和不完全信息-博弈论相关
3、完全信息与不完全信息:完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。
在不完全信息博弈里,至少有一个参与人不知道其她参与人的支付函数。
温泉信息就是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。
显然不完全信息意味着不完美信息,但逆命题不成立。
12、完美与不完美信息:不完美信息指的就是自然做出了它的选择,但就是其她选择人并不知道它的具体选择就是什么,金知道各种选择的概率分布。
完美信息:指一个参与人对其她参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。
2、贝叶斯均衡:就是纳什均衡在不完全信息博弈中的自然扩展。
在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。
给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其她参与人实际上会选择什么策略,但就是它能正确预测到其她参与人的选择如何以来与其各自的类型。
这样,她决策的目标就就是在给定自己的类型与别人的类型已从战略情况下最大化自己的期望效用14、PBNE贝叶斯纳什均衡就是这样一种类型依从战略组合:给定自己的类型与别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就就是说没有人有积极性选择其她战略。
贝叶斯纳什均衡:P1474、有限次重复博弈:16、重复博弈就是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。
定理:令G就是阶段博弈,G(T)就是G重复T次的重复博弈(T小于正无穷)。
那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果就是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都就是一次性博弈的均衡结果)。
7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。
激励相容约束也就是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望她选择的行动。
博弈论期末复习重点
1、博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自去得相应结果的过程。
2、博弈论:就是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。
3、囚徒的困境:两决策者从各自最大的利益出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体的最大利益。
4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈。
5、动态博弈:各博弈方的选择和行动不仅有先后次序,而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动,甚至还包括自己的选择和行动,6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息。
7、不完全信息(不对称信息):是指经济行为主体掌握了某种经济环境状态的部分信息。
8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解。
9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程。
10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果。
11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略。
在两人博弈的情况下,“给定你的策略,我的策略就是我最好的策略,给定我的策略,你的策略也是你的最好的策略”。
12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决策方式。
13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡。
这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益。
14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈。
博弈论四种类型之完全信息静态博弈
博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。
完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。
⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。
最典型的例⼦是囚徒困境与智猪博弈。
下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。
⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。
离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。
对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。
【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。
所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。
但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。
个⼈的最优选择从社会⾓度看并不是最优的。
社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。
【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。
【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。
【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。
《博弈论》精品讲义
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009
博弈论简介
双方都没有占优策略 存在两个稳定的状态(纳什均衡):(-1,1);(1,-1) 纳什均衡):( ,1);(1,):(- ;(1,
双方都避免两败俱伤,斗鸡博弈有两个纳什均衡, 双方都避免两败俱伤,斗鸡博弈有两个纳什均衡,一方 前进,另一方后退。由于有两个均衡点,结果无法预知。 前进,另一方后退。由于有两个均衡点,结果无法预知。 20世纪 年代苏美间的古巴导弹危机就是一个斗鸡博弈的 世纪60年代苏美间的古巴导弹危机就是一个斗鸡博弈的 世纪 很好例子 。 古巴导弹危机是冷战时期苏美之间最严重的一次危机, 古巴导弹危机是冷战时期苏美之间最严重的一次危机, 赫鲁晓夫1962年偷偷将导弹运到古巴对付美国,被美国 年偷偷将导弹运到古巴对付美国, 赫鲁晓夫 年偷偷将导弹运到古巴对付美国 U2飞机侦察到,美国派出携带核武器的战机、航母,威 飞机侦察到, 飞机侦察到 美国派出携带核武器的战机、航母, 胁苏联限期从古巴撤出导弹。苏美这两只大公鸡均在考虑 胁苏联限期从古巴撤出导弹。 进还是退? 进还是退? 战争的结果当然是两败俱伤, 战争的结果当然是两败俱伤,但任何一方退下来则是很 不光彩的事。博弈结果是苏联从古巴撤回了导弹, 不光彩的事。博弈结果是苏联从古巴撤回了导弹,做了丢 面子的“撤退的鸡” 而美国坚持了自己的策略, 面子的“撤退的鸡”,而美国坚持了自己的策略,做了 不退的鸡” 当然为了给苏联面子,同时也担心战争, “不退的鸡”。当然为了给苏联面子,同时也担心战争, 美国也从土耳其撤了一些导弹。 美国也从土耳其撤了一些导弹。
☺中国人研究博弈论是有优势的☺
三国演义》 孙子兵法》 三十六计》 《三国演义》、《孙子兵法》、《三十六计》、 厚黑学》都是博弈论教材, 《厚黑学》都是博弈论教材,如何在人与人的博 弈中取得成功。 弈中取得成功。
第04讲 博弈的基本框架 - 学生
1
·明确一个博弈的四大构成要素(完美信息、不完美信息)。 ·精确理解信息集与策略(纯策略、混合策略、浓缩策略)这 两个重要概念。
·能够用博弈的扩展式与规范式来描述一个博弈问题。
·了解划分博弈类型的基本方法:完全信息静态、完全信息动 态、不完全信息静态、不完全信息动态。
2
博弈论的基本框架
而象棋则是一个完美信息博弈。
17
信息集
定义 4.2.1 一个信息集 H 是以决策点为元素的集合。
信息集需满足以下两个条件:
(1) 同一个信息集中的所有决策点必须紧接着完全相同的 可选行动。 (2) 同一个信息集中的决策点不能出现一个先于另一个出 现的情况。
18
信息集判断
信息集判断
19
信息集
信息集设臵是正确的。 它表示甲无法判断自己处于信息集四个决策点中的哪一个。 一个博弈者如果总能记住她所经历过的所有博弈路径,我们称她 具有完美回忆(Perfect Recall)。 在图中,我们可以断定甲已经忘记了她自己以前采取的行动以及 其对手的反应,否则她不可能完全分不清四个决策点。 所以我们说在图中,甲没有完美回忆。
22
信息集判断
信息集判断
23
信息集
图中的信息集设臵也是错误的。 它不符合定义4.2.1中的条件(2)。
(2) 同一个信息集中的决策点不能出现一个先于另一个出现的情
况。 信息集只对应一个博弈者,甲乙两人的决策点在同一个信息集内 造成概念上的混乱。
24
信息集判断
信息集判断
25
信息集
在图中的信息集虽然都对应着乙,但它也违反了定义4.2.1中的 条件(2)。 (2) 同一个信息集中的决策点不能出现一个先于另一个出现的情 况。
博弈论四种类型
贝叶斯纳什均衡
混合战略(不完全信息情况下纯战略均衡的极限)
对原混合战略加入少许不确定性因素,求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性,同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
无限次重复博弈均衡(无名氏定理)
与贴现因子有关
囚徒困境(冷酷战略)
无限期轮流讨价还价模型
一般博弈
逆向归纳法求解
斯坦科尔伯格寡头竞争
雇主与公会之间的竞争
不完全信息静态博弈
在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性
精炼贝叶斯纳什均衡
信号传递博弈
分离均衡
根据所得信息修正判断概率,根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
混同均衡
准分离均衡
类型
信息和行动特点
均衡
均衡类型
特别均衡
求解方法
学过的例子
性质
完全信息静态博弈
每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。
纳什均衡
纯战略纳什均衡(PNE)
博弈论
• 4. 战略(strategy)
• 指参与人在给定信息集的情况下的行动规则, 它规定参与人在什么时候选择什么行动。 • (1)一般用si 表示第i个参与人的一个特定战 略,Si = {si}代表第i 个参与人的所有可选择 的战略集合。如果n个参与人每人选择一个战略, n维向量s=(s1,…,si,…,sn )称为一个战略组 合(strategy profile),其中si是第i个参与人 选择的战略。
•
囚徒困境引出重要结 论: 一种制度(体制)安 排,要发生效力,必须是 一种纳什均衡。否则,这 种制度安排便不能成立。 现实中囚徒困境问题: 军备竞赛、公共产品私 人提供、寡头竞争等。
领域
纳什均衡 (增产,增 产)
制度安排
寡头竞争 公共产品 私人 提供
• (2)战略与行动是两个不同的概念,战略是行动 的规则而不是行动本身。 • 例如:“人不犯我,我不犯人;人若犯我,我 必犯人”是一种战略,“犯”与“不犯”是两种 行动,战略规定了什么时候“犯”,什么时候 “不犯”。 • (3)作为一种行动规则,战略必须是完备的,它 要给出参与人在每一种可想象到的情况下的行动 选择,即使参与人并不预期这种情况会实际发生。
博 弈 论
西 北 大 学 经济管理学院
课程主体结构
一、博弈论概述 二、博弈论的基本概念 三、完全信息静态博弈 四、完全信息动态博弈
课程主体结构
五、不完全信息静态博弈
六、不完全信息动态博弈
一、博弈论概述
• 1.博弈论概念(game theory) • (1)博弈:又称为对策或游戏,是指一些人或组 织在“策略相互依存”情形下相互影响、互相作 用的状态。 • (2)博弈论:研究决策主体的行为发生直接相互 作用时的决策,以及这种决策的均衡问题,即当 一个主体的选择受到其他主体选择的影响,而且 反过来影响到其他主体选择时的决策问题和均衡 问题。
博弈论信息结构分类
博弈论信息结构分类博弈中的每一个参与人都是工具理性“每一个参与人都是工具理性”是每一个人的共识每一个参与人都充分了解博弈的规则理性人假设:理性人有一个明确的偏好(任意两件事物都可以进行比较,比较过程中偏好保持一致性);在约束条件下,理性人总是追求偏好最大化;理性人假设中,个体是具有完全理性的,即具有完美的认知和决策能力,不会犯错偏好具有连续性,物品所能带来的满足程度是连续的,不会跳跃的,所以可以用一个连续的效用函数进行衡量(Remark:价值理性与工具理性:价值理性指有正确的价值观,动机一定会纯正,同时也会采用正确的手段来实现自己想要的目标,无论结果如何;而工具理性指为达目的不择手段,参与者的行为从自身效用最大化的角度出发,漠视人的情感和精神价值)参与人:博弈中的决策主体,参与人记为,参与人的集合记为,若共有n个参与人,则,参与人参与决策是为了让自身效用最大化(另:虚拟参与人:“自然”、“上帝”——不以参与人的意志为转移的外生事件,虚拟参与人的选择体现为外生事件的各种可能现象,并用概率分布来描述“自然”的选择机理)为方便讨论,把参与人之外的其他参与人记为,虚拟参与人\自然记为。
单人博弈已经退化为了最优化问题进行处理,对单人博弈而言掌握的信息越多,所能获得的收益越大。
双人博弈并不总是对抗的,双人博弈也包括合作的情况,与单人博弈不同,双人及以上博弈中,参与者掌握的而信息越多并不能保证所得到去的收益越多;个人理性并不一定能导致集体条理性(囚徒困境);多人博弈(大于等于3)中可能出现破坏者——做损人不利己之事。
行动:行动是参与人在决策时可供选择的动作,一般用表示第个参与人的特定行动,表示可供参与者选择的行动集合,行动可以是连续的也可以是离散的。
个参与人的行动的有序集合称为行动组合。
行动是具有顺序的:同时行动或先后行动,行动的顺序对行动结果至关重要。
静态博弈指参与人同时选择行动的博弈动态博弈指参与人先后选择行动的博弈(Remark:"同时"指的是信息概念,如果参与者在决策过程中不知道对方的选择,那么不管是否是同一时间进行的决策都是静态决策)信息:信息是指在博弈当中,参与人有关该博弈的知识:自然的选择,其他参与人的策略集合、支付函数、行动时间等。
博弈论与信息经济学不完全信息静态博弈
参加人i懂得自己旳类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 旳情况下,参加人i有关其他参加人类型 i i旳不拟定性。我们用 G {A1,, An ;1,,n ; p1,, pn ;u1,,un} 代表这个博弈。
j
bi
aj cj
bi
aj cj
ui (vi bi ) P bi b j v j
1 2 (vi
bi ) P
bi
bj
vj
(vi
bi )
bi
aj cj
求导得:bi vi
1 2
vi
1 2
aj
由于bi vi
ci vi
ai
ci
1 2 , ai
1 2 aj
0
综上所述,bi vi
贝叶斯均衡是一组战略组合源自(a1.,a
2
.)
,使得对于每一
种
i
和每一种可能旳 ci
,战略
a
i
(.)最大化参加人
i
旳期望
效用函数
Ec
j
ui
(ai
,
a
j
ci
,
ci
)
。令
z
j
Pa j c j 1为均衡状
态下参加人 j 提供旳概率。最大化行为意味着,只有当参加
人 i 预期参加人 j 不提供时,参加人 i 才会考虑自己是否提
懂得(成本ci 是参加人 i 旳类型)。 c1和 c2 具有相同旳、独立旳定义在[c, c]
上旳分布函数,且是共同知识。
不完全信息 博弈论
不完全信息博弈论
不完全信息博弈论是博弈论的一个分支,研究的是博弈中一方或双方在做出决策时面临信息不完全或不对称的情境。
在博弈论中,通常假设参与者具有完备信息,即每个参与者都了解有关游戏的所有信息。
而在不完全信息博弈中,这一假设不成立,参与者的信息是不完整的或存在不对称。
在不完全信息博弈中,参与者可能不知道其他玩家的全部策略或支付函数,也可能不了解其他玩家的具体动作。
这导致参与者在做出决策时需要考虑对手可能的信息,并基于对手可能的信息和策略来做出最优的选择。
一些关键的概念和问题涉及到:
一、信息集(Information Set):在不完全信息博弈中,一个信息集包含一个或多个玩家可能的信息。
在信息集中,玩家无法区分对手在该信息集中的确切信息。
二、策略形成:玩家需要制定策略,考虑到他们可能缺乏关于对手的完整信息。
这涉及到在信息集中做出决策,并考虑对手可能的信息。
三、信念(Belief):玩家对于对手的信息的信念是一个关键因素。
这表示玩家对其他玩家可能的策略和信息的主观看法。
四、Bayesian博弈:Bayesian博弈是一种不完全信息博弈,其中玩家具有先验概率分布,表示对其他玩家的信息的不确定性。
在这类博弈中,贝叶斯博弈理论用于建模玩家对信息的不确定性的处理方式。
五、激励兼容性:在不完全信息博弈中,激励兼容性是指设计机制,使得玩家在报告他们的私有信息时没有动机撒谎或隐瞒信息。
不完全信息博弈论的研究涵盖了多种博弈情境,包括拍卖、合同设计、博弈机制设计等领域。
这些理论有助于更好地理解现实生活中存在的信息不对称情形,并提供了一些方法来处理这些情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、完全信息和不完全信息:
完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。
在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数。
温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。
显然不完全信息意味着不完美信息,但逆命题不成立。
12、完美和不完美信息:
不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。
完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。
2、贝叶斯均衡:
是纳什均衡在不完全信息博弈中的自然扩展。
在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。
给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型。
这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用
14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。
贝叶斯纳什均衡:P147
4、有限次重复博弈:
16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。
定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。
那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。
7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。
激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。
显然,只有代理人选择委托人所希望的行动是得到的期望效用不小于他选择其他行动是得到的期望效用时,代理人才有积极性选择委托人所希望的行动。
满足激励相容约束的机制称为可实施机制。
8、似然率f l/f h:统计学上,似然率度量给定代理人选择a=L时PAI发生的概率与给定代理人选定a=H是PAI发生的概率的比率,它告诉观测者观测到的PAI在多大程度上来自分布f l而不是来自于f h。
较高的似然率意味着PAI 有较大的可能性来自基于分布f L;当似然率等于1是,PAI来自于f L和f h可能性相同。
15/9、纯策略和混合策略
如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,我们成为纯策略。
如果一个战略规定参与人在给定信息下以某种概率分布随机得选择不同的行动,就成混合策略。
在博弈的战略式表述中,混合策略可以定义为在纯策略空间上的概率分布。
定义:在n个参与人博弈的战略式表述G=(S1,S2,….S n; U1…..U n)中,假定参与人I 有K个纯策略:S I=( 张维迎P59
PBNE: P183
20/13、分离均衡和混同均衡
分离均衡:不同类型的发送者以1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号。
在分离均衡中,信号准确的揭示其类型,例子如P191
混同均衡:不同类型的发送者选择相同的信号,没有任何类型选择与其他类型不同的信号,一次接受者不修正鲜艳概率。
1、逆向选择
是指由于交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品,进而出现市场交易产品平均质量下降的现象。
张维迎236 逆向选择模型:
自然选择代理人的类型,代理人知道自己的类型,委托人不知道(因为信息是不完全的);委托人和代理人签订合同。
简单例子:买者和卖者的关系:卖者(代理人)对产品的质量比买者(委托人)有更多的知识。
5、hazard rate 风险率
6、intuitive criterion 直观标准
张维迎203
克瑞普斯和克瑞普斯-曹的“直观标准”将劣战略扩展到相对于均衡战略的劣战略,从而通过提出更多劣战略的办法缩小均衡数量,进一步改进了精炼贝叶斯均衡概念。
10、moral hazard 道德风险
从事经济活动的人在最大限度地增进自身效用的同时做出不利于他人的行动。
或者说是:当签约一方不完全承担风险后果时所采取的自身效用最大化的自私行为。
张维迎236 道德风险模型:
隐藏行动的道德风险模型、隐藏信息的道德风险模型
11、MLPR(monotone likelihood ratio property)单调似然率特征
张维迎251 举例说明:似然率对产出是单调的
17、strictly dominated strategy 严格劣战略
张维迎34
一般地,Si*成为参与人i的(严格)占有战略,如果对应的所有的S-i,SI* 是i 的严格最优选择,即:ui(SI*,S-I)> ui(SI’,S-I)任意S-I,任意Si’不等于Si* 对应地,所有的Si’不等于Si*被称为劣战略
18、Strategy space 战略空间
策略空间(strategy space)是指博弈各方可供选择的策略或行为的集合。
比如,一个参与人的所有可选择的策略的集合就是这个参与人的策略空间。
19、SM condition/单交叉条件/分离条件
张维迎194
不等式见书194-195 此条件说明改变价格对不同类型企业的里软的影响是不同的,特别低,高成本企业比低成本企业更愿意选择高价格。
21、SPE 子博弈完美均衡
梯若尔84
扩展式子博弈中的行为策略组合是一个子博弈完美均衡,如果对每一个适当的子博弈G,在G上的限制是G的一个纳什均衡。
22、weak dominated strategy 弱劣战略
张维迎37 41出现无准确定义。