第12章 博弈论
博弈论讲义完整版
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境
囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的‚最优策略‛使整个‚系统‛处于不利 的状态。
思考:为什么会造成囚徒困境 是否由于‚通讯‛问题造成了囚徒困境? ‚要害‛是否在于‚利己主义‛即‚个人理 性‛?
第一章 导论-囚徒困境
通俗地讲:
纳什均衡的含义是:给定别人战略情况下,没有 任何单个参与人有积性选择其他战略,从而没有人 有积极性打破这种均衡。
第一章 导论-囚徒困境 一只河蚌正张开壳晒太阳,不料,飞来了 一只鸟,张嘴去啄他的肉,河蚌连忙合起两张 壳,紧紧钳住鸟的嘴巴,鸟说:‚今天不下雨, 明天不下雨,就会有死蚌肉。‛河蚌说:‚今 天不放你,明天不放你,就会有死鸟。‛谁也 不肯松口,有一个渔夫看见了,便过来把他们 一起捉走了。
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 、博弈的基本概念及战略表述
需求小时,售价7千万;
如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿
一 、博弈的基本概念及战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000
第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了‚星期五‛
石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
《管理运筹学》12-管理博弈
管理博弈的基本概念与分类
例12-5 产量竞争问题
一、博弈的基本要素
解 企业A和B分别为两个局中人,它们的策略为各自的产量qi ϵ[0,∞)(i=1,2),每一方都有无穷多个策略。在局势(q1 + q2)下,局中人i的赢得函数为
衬底1
管理博弈的基本概念与分类
按局中人的数量:二人博弈和多人博弈; 按各局中人赢得函数的代数和是否为零:零和博弈与非零和博弈; 按局中人之间是否合作:合作博弈和非合作博弈; 按策略集中策略数目的有限和无限:有限博弈和无限博弈; 按局中人选择策略的先后顺序:静态博弈和动态博弈; 按博弈过程中对信息掌握的情况:完全信息博弈和不完全信息博弈。
采购员
自然状态
行最小
较暖
正常
较冷
采购100吨
-5
-7.75
-11
-11
采购150吨
-7.5
-7.5.
-10.5.
-10.5
采购200吨
-10
-10
-10
-10*
列最大值
-5
衬底1
管理博弈的基本概念与分类
例12-3 囚徒困境
一、博弈的基本要素
解 A和B为两个局中人,每个局中人都有两个策略:坦白或不坦白。按照各局中人的策略组合,共有四个局势:{坦白,坦白},{坦白,不坦白},{不坦白,坦白},{不坦白,不坦白}。两个局中人的赢得函数可以用表12-2所示的一个双变量矩阵来表示。
β1
β2
β3
4
4
10
4
2
3
1
1
6
5
7
5*
6
5*
10
表12-4 具有鞍点的矩阵博弈的赢得矩阵
博弈论 蒋文华 浙江大学
第一讲、博弈论概述献给诸位知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。
第一章何为“博弈”博:博览全局弈:对弈棋局→谋定而动是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。
第一节从一个简单的故事说起博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。
特别提示:博弈既可以是竞争,也可以是合作!特别提示:博弈,必须学会换位思考!特别提示:博弈,只需领先一步,高人一筹!博弈就是你中有我,我中有你。
由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。
博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。
特别提示:站在别人的立场上想一想,就是为自己未来的遭遇着想。
——米兰·昆德拉特别提示:如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示:请不要在一个充分竞争的市场去追求成功!特别提示:选对市场(对手)比选对策略更重要!特别提示:在博弈之前,博弈就已经开始了!第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋,法于用兵,怯者无功,贪者先亡。
----汉代刘向,《围棋赋》二、西方的理解game(规则)费厄泼赖(fair play)第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则(制度)的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。
二、伯川德模型该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。
博弈论前四章笔记整理
博弈论前四章笔记整理第一章:博弈论基础概念。
- 博弈的定义与要素。
- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。
- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。
例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。
- 博弈的分类。
- 按参与者数量可分为两人博弈和多人博弈。
- 按策略空间是否有限分为有限博弈和无限博弈。
如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。
- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。
第二章:完全信息静态博弈。
- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。
以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。
- 占优策略均衡。
- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。
如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。
例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。
- 纳什均衡。
- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。
即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。
与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。
例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。
第三章:完全信息动态博弈。
- 扩展式表述。
- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。
博 弈 论
博
弈 论
第一章 导论
1.1什么是博弈论(Game Theory) 1.1.1 从游戏到博弈
Nash 均衡的哲学含义:设想n个参与人在 博弈前规定每一个参与人选择一个特定的策略。 s*=(si*,s-i*) 代表这个协议,要问在没有外力 强制的情况下,是否有任何参与人有积极性 不遵守该协议?如没有,则说明该协议是可以 自动实施的。能够自动实施的协议就可以看作 自动实施 能够自动实施的协议就可以看作 一个Nash 均衡。 均衡。 一个 例 求下列博弈的Nash 均衡:
一般用 G={S1,S2,…Sn;u1,u2,…un}表示策略式 博弈。 例 参 与 人B
L U 参 与 人A M 4,3 M 5,1 R 6,2
2,1 3,0
8,4
3,6 2,8
D
9,6
S1={U,M,D} , S2={L,M,R} 支付用矩阵表示,称为双矩阵博弈。
考虑三个参与人参加的一个策略型博弈,他们 例 考虑三个参与人参加的一个策略型博弈 他们 的策略空间为: 的策略空间为 S1=S2=S3=[0,1] 他们的支付函数分别为: 他们的支付函数分别为 u1=x+y+z u2=x-yz - u3=xy-z -
游戏都有一些共同的特点: 1.都具有一定的规则; 2.都有一个结果; 3.策略至关重要; 4.策略和利益有相互依存性
许多重要的人类活动,象经菅决策、市场竞争、 政治军事斗争、商业谈判、联合等都具有类似 的特性。 博弈论可以被定义为是对智能的理性 智能的理性决策者之 智能的理性 间冲突与合作的数学模型的研究,或“冲突分 析”、“相互影响的决策理论”或许是描述 博弈论更为准确的术语(Game一词太狭窄)。 (Game ) 近代博弈论始于Zermelo,Borel,Von Neumann的工作,特别是Von Neumann和 Morgenstern合著的伟大的奠基性的著作《博 弈和经济行为》
高级运筹学(博弈论书稿)-周晶
第章博弈论(对策论)第一节引言1.1博弈行为和博弈论在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为。
譬如,两个人下棋,任何一个人在走某一步之前,都需要考虑对方是怎么走的,以及对方在他走了一步之后会怎么走,以至无穷。
高手与俗手的区别往往就在于高手能够考虑10步甚至20步以后的变化,最终的输赢不仅取决于你的决策,而且取决于你对手的决策,这就是博弈。
博弈与决策的根本区别在于是否考虑对方的行为,具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。
比如战争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对方;还比如在政治方面,国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性质;在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的竞争等,举不胜举。
博弈论(game theory),就是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法,即研究博弈行为中竞争各方是否存在着最合理行动方案,以及如何找到最合理行动方案的数学理论和方法。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。
博弈论应是一种分析问题的方法,它被设计用来帮助我们理解所观察到的决策主体相互作用时的现象,其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选择等各个领域。
博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各方在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案,同时也依赖于其他参与方所实施的行为方案,是各参与方行为方案组合的函数。
所以,博弈论在我国也被称为“对策论”。
博弈论课后题答案
;第二章第三章PPT问题第四章第五章第六章一、用柠檬原理和逆向选择的思想解释老年人投保困难的原因。
答:“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中,劣质品赶走优质品,最后搞垮整个市场的机制。
“逆向选择”是在同样不完美信息和消费者缺乏识别能力的市场中,当价格可变时,价格和商品质量循环下降,市场不断向低端发展的机制.高龄人群的保险市场是一个典型的柠檬原理和逆向选择会起作用,从而会导致发展困难的市场。
老年人的健康情况差别很大,比年轻人之间的差别要大得多,而保险公司要了解老年人投保人的实际健康状况又很困难或成本很高,这就造成了保险公司对老年投保人健康状况的信息不完美。
则保险公司就无法根据每个老年投保人的实际健康情况确定不同的保费率,只能根据平均健康情况确定保费率。
这种平均保费率对健康情况很差的老年人是合算的,但对健康状况较好的老年人则不合算。
因此前者倾向于投保,后者则不愿意投保,这就会导致投保的老年人的平均健康情况会很差。
这使得保险公司的赔付风险大大提高,不仅不能赢利而且要亏损,从而失去经营老年保险的积极性,最终导致老年人的投保难问题。
这就是柠檬原理作用的结果。
如果允许调整保费率,那么保险公司为了避免亏损会上调保费率。
而这又会使得原来投保或者准备投保者中相对较健康的老人退出,从而投保老人的平均健康状况会变得更差。
如此循环,最终保费会升得很高而投保老人的平均健康情况则会越来越差,对市场的发展当然是很不利。
这就是逆向选择作用的结果。
二、为什么消费者偏好去大商店买东西而不太信赖走街穿巷的小商贩?消费者去大商店更接近无限次重复博弈,商场提供高质量产品的概率更大,虽然个别消费者不一定能对商店以往售出商品的质量作出反应,但消费者群体肯定可以作出反应,因此大商店保持高质量符合自己的长期利益,一股会自觉保证质量,从而消费者也比较可以信任大商店的商品。
对于走街穿巷的流动性强的小商贩,无论是个别消费者还是消费者群体,与他们的博弈可能都是一次性而非重复的,且不易起诉,因此消费者无法对他们售出商品的质量作出反应,从而也就缺乏保证小商贩商品质量的机制,消费者当然不太可能信任走街穿巷小商贩的商品质量,除非是常年在同一地方推销的小商贩。
博弈论基础
博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
博弈论最全完整-讲解
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的
逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信 的方法。
拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声
誉
导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个 局中人的得益。
“各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。
据“共同知识”的掌握分为完全信 息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
博弈论的总结-博弈论总结
博弈论的总结|博弈论总结博弈论学习的个人总结刘艳丽第一局部:根本情况视频耶鲁公开课《博弈论》1----5讲,人人影视参考资料:耶鲁校园网《博弈论--战略分析^p 入门》,美,罗杰A麦凯恩,原毅军译,机械工业出版社,2022,42元《策略博弈》,阿维纳什迪克西特,蒲勇健译,中国人民大学出版社,第二版,2022,65元班级:工商,人力08级学生课时:8节我的时间投入:视频26个小时;书籍,25小时;上网时间,无法统计。
第二局部:知识层面一、The five lessons:五个根本的结论1、Don"t play a strictly dominated strategy2、Rational choices can lead to bad outes3、You can"t get what you want4、Put yourself in other people"s shoes5、Yale students are evil二、Game 2: "pick a number."数字游戏Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class.三、The Prisoners" Dilemma:some exles囚徒困境A joint projectPrice petitionA mon resourceGlobal warming and carbon emissionsmunication,contracts,treaties betweencountries,regulation,education cannot work Solutions OF The Prisoners" Dilemma: changing payoffs.改变收益构造四、The ingredients of a game:博弈的根本构造Players:i 、jStrategies:"si" to be a particular strategy of Player iSi" to be the set of alternatives."s" to mean a particular play of the gamePayoffs:"U" for utile, to be Player i"s payoff.the way up to Player N"s choices.profileS-i" to mean a strategy choice for everybody except person "i."Assume that everybody knows the possible strategies everyone else could choose and everyone knows everyone else"s payoffs五、如何寻找博弈平衡解1、成绩案例-----求解方法,如存在最优策略,那么选择最优。
博弈论-完全且完美信息动态博弈.
颤抖手均衡
博弈方2 LR U 10, 0 6, 2 D 10, 1 2, 0
9, 0 6, 2 10, 1 2, 0
1
L
R
2
(2, 1) M
N
1
(1, 2)
S
T
2
(1, 1) U
V
(0, 0)
(2, 3)
结论:颤抖手均衡首先必须是一个纳什 均衡,其次是不能包含任何”弱劣策略”, 也就是偏离对偏离者没有损失的策略.
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
能否找到子博弈?
好1差
1 不卖
1
卖
卖
不卖
2
(0,0) (0,0)
买 不买
买 不买
(2,1)
(0,0)
(1,-1)
(-1,0)
二手车交易扩展形
结论:
(1)子博弈不能包括原博弈的第一阶段, 即动态博弈本身不会是它自己的子博弈;
(2)子博弈必须有一个明确的初始信息集, 以及必须包含初始阶段之后的所有博弈 阶段,即子博弈不能分割任何信息集或在 有多节点信息集的不完美信息博弈中可 能不存在子博弈。
(a
c 9
2t
* j
)
2
ti
(a
c 3
ti )
ti*
a
3
c
, hi*
4(a 9
c)
, ei*
a
9
c
,i
1,2
3.5 动态博弈分析的问题和扩展讨论
3.5.1 逆推归纳法的问题 3.5.2 颤抖手均衡和顺推归纳法 3.5.3 蜈蚣博弈问题
博弈论最全完整-讲解
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
存在双赢的博弈吗?实用文档
6
例2:焦点博弈 “We Can’t Take the Exam,
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
实用文档
17
约翰·纳什 1928年生于美国
莱因哈 德·泽 尔腾, 1930 年生于 德国
实用文档
约翰· 海萨尼 1920年 生于美 国
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
实用文档
19
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英 国
实用文档
20
2001年诺贝尔经济学奖获得者
实用文档
35
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述 纳什均衡
纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
实用文档
36
第一节 博弈论的基本概念
与战略式表述
Байду номын сангаас
实用文档
37
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行 为发生直接相互作用时候的决策以及这种 决策的均衡问题。
博弈论——精选推荐
博弈论第1章博弈论基本模型1、在⼀个博弈中,所有的局中⼈都选择合作⾏为,该博弈是否为合作博弈?答:如果在⼀项活动中,参与⼈具有合作的意向,⽽合作的⾏为⼜能得到有⼒的保障,则称这种博弈活动为合作博弈。
存在有⼒的保障,实际上说明了合作博弈问题的博弈⽅之间既存在共同利益,但利益⼜不完全⼀致。
⽽事实上合作博弈协议的内容除了约定⾏为以外就是利益分配,达成协议的前提是通过讨价还价就利益分割达成⼀致。
因此,并不是所有局中⼈选择合作⾏为,就是合作博弈。
2、完全信息静态博弈问题必须⽤策略型博弈模型刻画,完全信息动态博弈模型必须⽤扩展型博弈模型刻画,是否正确?答:不正确。
博弈论模型从形式可分为策略型模型与扩展型模型。
扩展型模型完整地刻画了⼀项博弈活动。
策略型博弈模型的结构简单,但它忽略了博弈的时序与信息,其侧重点在于分析参与⼈的策略选择。
只不过是相对⽽⾔,对于信息完全静态博弈⽤策略型博弈刻画更为合适;对信息完全的动态博弈,⽤扩展型博弈模型描述更为合适。
3、⼀个博弈问题既可⽤策略型博弈模型刻画,也可⽤扩展型博弈模型刻画,是否正确?答:博弈论从形式可分为策略型和扩展型模型。
扩展型完全地刻画了⼀项博弈活动,⽽策略型则结构简单,忽略了博弈的时序与信息,重点在于分析参与⼈的策略选择。
因此,对于⼀个博弈问题,要视乎所要解决的问题是完整的还是只分析参与⼈的策略选择。
4、策略就是⾏动吗?答:○1称参与⼈i∈N在博弈中所有可能选择的⾏动构成的集合A i为局中⼈i的⾏动集合。
A i中的元素a i称为局中⼈i的⾏为。
○2局中⼈i=1,2,…,n的策略集合⽤Si表⽰,S i中的元素si称为局中⼈i的策略。
它定义为局中⼈i的信息集类I i到⾏动集Ai的映射:S i:I i→A i,S i(I ik)=a i∈A i,i=1,2,…,r i○3从以上的定义,清楚地表明了策略是信息集的映射,⾏动是映射值,两者是不同的。
5、策略与⾏动何时是⼀致的?答:在静态博弈模型中,局中⼈的策略与⾏动等同。
《博弈论的诡计》
《博弈论的诡计》博弈论就在你身边阿普顿是普林斯大学的高材生,毕业后被安排在爱迪生身边工作,他对依靠自学而没有文凭的爱迪生很不以为然。
一次,爱迪生要阿普顿算出梨形玻璃泡的容积,阿普顿点点头,想:这么简单的事一会儿就行了。
只见他拿来梨形玻璃泡,用尺上下量了几遍,再按照式样在纸上画好草图,列出了一道算式,算来算去,算得满头大汗仍没算出来。
一连换了几十个公式,还是没结果,阿普顿急得满脸通红,狼狈不堪。
爱迪生在实验室等了很久,觉得奇怪,便走到阿普顿的工作间,看到几张白纸上密密麻麻的算式,便笑笑说:“您这样计算太浪费时间了。
”只见爱迪生将一杯水倒进玻璃泡内,交给阿普顿说:“再找个量筒来就知道答案了。
”阿普顿茅塞顿开,终于对爱迪生敬服,最后成为爱迪生事业上的好助手。
有时候,科学并不一定意味着繁琐的计算与测量,而是一种有浓厚艺术气息的思维方式。
前者固然可以得出正确的结论,但是后者同样可以用一种出人意表的方式曲径通幽。
这种方式,与我们在生活中运用博弈科学有异曲同工之妙。
大量的数学模型吓不倒我们,因为我们可以对它们置之不理。
有一个脑筋急转弯问题是这样的:在什么情况下零大于二,二大于五,五又大于零?答案是:在玩石头剪刀布游戏的时候。
博弈,就是用这种游戏思维来突破看似无法改变的局面,解决现实的严肃问题的策略。
在博弈中,每个参与者都在特定条件下争取其最大利益,强者未必胜券在握,弱者也未必永无出头之日,因为在博弈中,特别是多个参与者的博弈中,结果不仅取决于参与者的实力与策略,而且还取决于其它参与者的制约和策略。
事实上,博弈过程本来就不过是一种日常现象。
我们在日常生活中经常需要先分析他人的意图从而做出合理的行为选择,而所谓博弈就是行为者在一定环境条件和规则下,选择一定的行为或策略加以实施并取得相应结果的过程。
博弈论用途很广。
但正如上文所讲,博弈论原是数学运筹中的一个支系,其研究运用了种种的数学工具,一般读者如何能掌握呢这里在在着一个矛盾。
第12章决策分析
转折概率的求法是:
设p为某一自然状态的概率,则另一自然状态出现的概率
为1 p ,计算两个方案的期望收益值,并使之相等,此时解
得的概率值即为转折概率。
在上例中,不妨假设状态1 出现的概率为p,两个方
案的期望收益值分别为 E(S1) 1000 p (400 ) (1 p) E(S2) (300) p 2000 (1 p)
按照决策环境分类:
确定型:对未来情况可以获得精确、可靠的 数据
随机型:未来有几种可能的状态和相应后果, 其出现的概率可以预测
非确定型:未来可出现的状态和后果难以估 计
决策分析是为解决随机型和非确定型问题提供一 套推理方法和逻辑步骤。
根据决策问题的基本模式,可划分决策问题的 类型。其中依照不同标准所得到类型也不同,下面 四种类型是最基本和最常见的划分。
conflict analysis(冲突分析)。
决策分析框架
确定结构
评定后果
评定不确定因素
评价方案 灵敏度分析 选择方案
收集信息
决策分析框架
确定决策模型结构:确定决策过程的阶段、相应 的环境信息、各阶段的状态和备选方案以及他们 间的层次结构关系
评定后果:估计备选方案在不同环境状态下所付 出的代价和取得的收益后果值。衡量效益往往采 用效用值指标作为准则。
决策树法
描述多级决策(序列决策)的工具 “• ”表示决策节点,从它引出的分枝为方案枝,
分枝数量与方案数量相同,分枝上要注明方案名 称。 “Ο”表示状态节点,从它引出的分枝为状态分 枝或概率分枝,分枝数量与可能出现的自然状态 数量相同,分枝上要注明状态出现的概率。 决策节点反映决策者的谋略,状态节点反映其机 遇。 “△”表示结果节点,不同方案在各种状态下所 取得的结果(益损值),标注在结果节点的右端。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
特· 奥曼和美国人托马斯· 谢林,以表彰他们在博弈论 领域作出的贡献。
(三)博弈的分类
根据参与人的多少,可将博弈分为两人博弈或多人博 弈; 根据参与人是否合作ຫໍສະໝຸດ 可将博弈分为合作博弈或非合 作博弈;
根据博弈结果的不同,又可分为零和博弈、常和博弈 与变和博弈。
1、从行动的先后次序来分,博弈可以
a x v
ij i
( j 1,..., n)
线性规划求混合策略的纳什均衡
同理,当乙使用组合策略对付甲的纯 策略时,不论甲采取何种纯策略,乙的 损失都不大于双方都采取组合策略 的期望值v,即:
目标函数是期望损失最小,即 : min v y y2 ... yn 1 或写成: max max 1 v v yj 令 : yj , 则目标函数变为: v 1 y2 ... yn max y1 v
S1 {1 , 2 , 3} {剪刀, 石头, 布} S2 {1 , 2 , 3} {剪刀, 石头, 布}
赢得矩阵:
剪刀 石头 布 剪刀 0 1 1 A 石头 1 0 1 布 0 1 1
赢得矩阵
G={S1,S2,A} 局中人
–得益 对于任一策略组合(s1,…,sn),其总得益为 各博弈方得益之和 u(s1,..., sn ) ui (s1,..., sn ) 那么对于具有多个纳什均衡点的博弈,则对应的应有 最优纳什均衡的概念,而对应于最优纳什均衡的点为 全局最优点。此处最优的含义为稳定性而不是得益之 和最大。
线性规划求混合策略的纳什均衡
博弈模型的表达形式 基本式 扩展式 例1 囚徒悖论
例2
2.1 纳什均衡
定义 在博弈 G S1,..., Sn ; u1,..., un 中,如果策略组合
* * (s1 ,...sn ) 中任一博弈方i的策略 si* 都是对其余博 * * 弈方的策略组合 (s1 ,..., si*1, si* , si*1,..., sn ) 的最佳对策,也即
* * ui (s1* ,..., si*1, sij , si*1,..., sn ) ui (s1*,..., si*1, sij , si*1,..., sn )
* * 为G的一个纳什均 对任意 sij Si 都成立,则称 (s1 ,...sn ) 衡。
2.1.1博弈的解和纳什均衡
如果你们都选β,你们都得B+。
定义:如果你选α得到的结果严格优于β,那么α相对于 β是 个严格优势策略。 结论1.不要选择严格劣势策略。 原因:如果我选择优势策略,在每次博弈都得到更好的收益。 结论2.理性人的理性选择造成次优的结果。 囚徒困境
α β α (0,0) (3,-1) β (-1,3) (1, 1)
S1 {1 , 2 , 3} S2 {1 , 2 , 3}
A (aij )mn
策略集
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、 泽尔腾和海萨尼。
1996年诺奖授予两位博弈论与信息经济学研究专家莫 里斯、维克瑞; 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表 彰他们在柠檬市场、信号传递和信号甄别等非对称信 息理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯
行动次序
信息
静态
纳什均衡 纳什 贝叶斯均衡 海萨尼
动态
子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均衡 泽尔腾等
完全信息
不完全信息
第二节
完全信息静态博弈
所谓完全信息静态博弈即各博弈方同时决策,且 所有博弈方对博弈中的各种情况下的得益都完全了解 的博弈问题. 静态:指博弈方同时采取行动,或虽不同时但后行动 者对前者采取的策略并不了解。 • 纳什均衡 • 无限策略博弈的解和反应函数 • 混合策略 • 纳什均衡的存在性
第12章 博弈论
(Game Theory)
对策论又称博弈论:主要研究策略形势
自由竞争的企业:企业是价格的接受者,不用关心对手的情况. 垄断企业:没有竞争对手,不是价格的接受者,但面对需求曲线. 介于两者之间的就是策略形势,即不完全竞争的情况:如汽车产业 少数几家公司的决策会互相影响. 策略形势书面定义:行为影响结果,然而结果不仅取决于你的行为, 还取决于其它人的行为. 适用领域:经济学、政治学、法学、生物学等
约束条件变为 : ... a1n yn 1 a11 y1 a12 y2 a y a y ... a y 1 2n n 21 1 22 2 s.t. ... ... ... ... ... ... a y a y ... a y 1 mn n m1 1 m 2 2 yj 0 ( j 1,..., n)
约束条件变为 : a21 x2 ... a1m xm 1 a11 x1 a x a x ... a x 1 12 1 22 2 2m n s.t. ... ... ... ... ... ... a x a x ... a x 1 nm n 1m 1 2 m 2 xi 0 (i 1,..., m)
E( X ,Y ) v
a x y
ij i i j
j
E( X ,Y ) v
当甲使用混合策略对付乙的纯策略时,不 论乙采取何种纯策略,甲的收入都不小于 双方都采取混合策略的期望值v,即:
目标函数是期望收入最大,即 : max v x x ... xm 1 或写成: min min 1 2 v v x 令 : xi i , 则目标函数变为: v 1 x2 ... xm min x1 v
a y
ij
j
v (i 1,..., m)
或写成:
a11 x1 a12 x2 ... a1n xn v a x a x ... a x v 2n n 21 1 22 2 ... ... ... ... ... ... am1 x1 am 2 x2 ... amn xn v x1 x2 ... xn 1 xi 0 (i 1,..., m)
1.矩阵对策线性规划模型
y1 yn x1
甲赢得
或写成:
a11 a1n a1 j y j A xm am1 amn amj y j 乙损失 ai1xi ain xi
a x y
ij i i j
j
a11 x1 a12 x2 ... am1 xm v a12 x1 a22 x2 ... am 2 xm v ... ... ... ... ... ... a1m x1 a2 m x2 ... anm xm v x1 x2 ... xm 1 xi 0 (i 1,..., m)
2.1.1博弈的解和纳什均衡
• 划线法
囚徒2 不坦白 囚 徒 1 不坦白 坦白
-1,-1 0,-8
坦白
- 8, 0 -3,-3
• 箭头法
囚徒2 不坦白 坦白 囚 徒 1 不坦白 坦白
-1,-1 0,-8 - 8, 0 -3,-3
练习
2.1.2严格下策反复消去法与纳什均衡
纳什均衡 总结
–纳什均衡点是一种局部均衡点,可以有很多个,也可 以不存在。 –来源于策略组合的策略可能有n!个(离散),也可 能无穷多个(连续),那么求解将会十分烦琐。
坏形势下最好的策略是减少损失。 有劣势策略吗? 改变了收益,我们改变了目的,即改变了博弈,改变了结 果,因此收益很重要。 结论3. 汝欲得之,必先知之
α β α (0,0) (-1,-3) β (-3,-1) (1, 1)
合作型博弈
α 是优势策略,β 是劣势策略
α β α (0,0) (3,-3) β (-1,-1) (1, 1)
可见局中人甲与乙的线性规划 模型为一对对偶问题.
[例 ] 利用线性规划方法 求解赢得矩阵的最 优策略
[解]该问题可以化为两个线性规划问题:
局中人A : min
局中人B :
7 2 9 A 2 9 0 9 0 11
1 1 x2 x3 x1 y2 y3 max y1 v v 2 x2 9 x3 1 2 y2 9 y3 1 7 x1 7 y1 2 x 9 x 2 y 9 y 1 1 1 2 3 2 3 1 s.t. s.t. 1 1 11x3 11 y3 9 x1 9 y1 0 x1~3 0 y1~3
2.4
几个应用例子
划线法:先找出自己针对其他博弈方每种策略或策略组合(对多 方博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略 或策略组合配合,给自己带来最大得益的策略(这种相对最佳对 策总是存在的,不过不一定唯一),然后在此基础上,通过对其 他博弈方策略选择的判断,包括其他博弈方对自己策略判断的分 析等,预测博弈的可能结果和确定自己的最有策略。 箭头法:对博弈中的每个策略组合进行分析,考察在每个策略组合 处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则 从所分析的策略组合对应的得益数组引出一个箭头,到改变策略后 策略组合对应的得益数组。最后综合对每个策略组合的分析情况, 形成对策略结果的判断。
分为静态博弈和动态博弈。
静态博弈指在博弈中,参与人同时选择行动,或虽非
同时但后行动者并不知道前行动者采取了什么具体行 动;
动态博弈指的是参与人的行动有先后顺序,且后行动
者能够观察到先行动者所选择的行动的博弈。
2、从参与人对其他参与人的各种特征信息的获得差异来 分,博弈可分为完全信息博弈和不完全信息博弈。 • 完全信息指的是每一个参与人对所有其他参与人的特征, 如策略集合及得益函数都有准确完备的知识;否则就是不 完全信息。