第六讲博弈论课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖ 对于矩阵博弈,其主要的任务就是求出矩阵 博弈的Nash均衡解-----双方尽可能满意的结 果。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪

踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
三. 分类和主要思想
❖ 博弈论根据其所采用的假设不同而分为合作 博弈理论和非合作博弈理论。两者的区别在 于参与人在博弈过程中是否能够达成一个具 有约束力的协议。倘若不能,则称非合作博 弈Non-Cooperative game.

Cooperative Rationality,是效率、公平、公 正;
Selten and Harsanyi
❖ 泽尔腾(1965)将纳什均 衡的概念引入了动态分 析,提出了“精炼纳什 均衡”概念;以及进一 步刻画不完全信息动态 博弈的“完备贝叶斯纳 什均衡”
❖ 而海萨尼则发展了刻画 不完全信息静态博弈的 “贝叶斯纳什均 衡”(1967-1968)。总 之,他俩进一步将纳什 均衡动态化,加入了接 近实际的不完全信息条 件。他们的工作为后人 继续发展博弈论,提供 了基本思路和模型
对社会的稳定作用); ❖ 大股东对管理者的监督; ❖ 天塌下来有高个子顶着。
对于矩阵博弈 (A, B, P,Q)
2人零和矩阵博弈 即A B 0 非零和2人矩阵博弈(也称为双矩阵博弈)
例12.2军备竞赛博弈
❖ 美国和前苏联进行军备竞赛,双方都参与, 各投资3000亿美金,一方参与(收益3000亿 美金),一方不参与(损失10000亿美金)
2人零和矩阵博弈的求解 定理 每一个2人零和矩阵博弈模型均有Nash 均衡解
2人零和矩阵博弈模型Nash 均衡解的求解步骤
2阶双矩阵博弈Nash均衡解的求解 一.双矩阵博弈 即非零和的2人矩阵博弈 二. 2阶双矩阵博弈Nash均衡解的求解步骤
海萨尼(1967-1968)
不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982),
Fudenberg,Tirole(199 1)
主要思想
❖ 博弈论并不是经济学的一个分支,它只是一种方法, 这也是为什么许多人将其看成数学的一个分支的缘 故。博弈论已经在政治、经济、外交和社会学领域
一、介绍博弈论
(一)概念,什么是博弈论 1.概念:博弈论Game Theory,又称
对策论,是使用严谨的数学模型研究冲突 对抗条件下最优决策问题的理论;
是研究竞争的逻辑和规律的数学分支。 简单地说,博弈论是研究决策主体在 给定信息结构下如何决策以最大化自己的 效用,以及不同决策主体之间决策的均衡。
张维迎教授给出的定义
博弈论的要素
❖ 博弈论的提法可能太过于学术化,容易让人们退避 三舍。其实它有一个非常通俗的名字-----游戏理论 (博弈论的英文名字叫做“Game Theory”,如果直 译就是“游戏理论”)。博弈论在我国还有一个名 字,叫对策论。
❖ 这些名字都很好理解,博弈字面意思就是赌博、下 棋,赌博和下棋当然是游戏了,赌博和下棋的时候 常常要千方百计地应付对手,自然是要讲究对策了。
囚徒B
坦白
抵赖
囚徒A
坦白 -8,-8 抵赖 -10,0
0,-10 -1,-1
囚徒困境说明了什么?
❖ 在(坦白、坦白)这个组合中,A和B都不 能通过单方面的改变自己的行动增加自己的 收益,于是谁也没有动力游离这个组合,因 此这个组合是纳什均衡,也叫非合作均衡。
❖ 囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择抵赖,各判刑1年,显然 比都选择坦白各判刑8年好得多。当然,A 和B可以在被警察抓到之前订立一个“攻守 同盟”,但是这可能不会有用,因为它不构 成纳什均衡,没有人有积极性遵守这个协定, 显然最好的策略是双方都抵赖。
有了广泛的应用,它为解决不同实体的冲突和合作 提供了一个宝贵的方法。
❖ 在对参与者行为研究这一点上,博弈论和经济学家 的研究模式是完全一样的。经济学越来越转向人与 人关系的研究,特别是人与人之间行为的相互影响 和相互作用,人与人之间利益和冲突、竞争与合作, 而这正是博弈论的研究对象。
我们从博弈中学习什么
❖ 博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。
❖ 商业关系被认为是一种相互作用。但博弈论并不是 疗法,并不是处方,它并不告诉你该付多少钱买东 西,这是计算机或者字典的任务.
❖ 博弈论只是提供一些关系的例证,一些有用的解决 问题的方法。这种思维方法也许是企业家应该学习 的。对于经济学家,也许需要学习它的理论模型, 它的实验方式 .
1.参与人或者局中(players)
❖ 一个博弈中的决策主体,他的目的是通过选 择行动(或战略)以最大化自己的支付(效 用水平)。参与人可能是自然人,也可能是 团体,如企业,国家等。
❖ 重要的是:每个参与人必须有可供选择的行 动和一个很好定义的偏好函数。不做决策的 被动主体只能被当作环境参数。
虚拟参与人pseudo-player
❖ 为了分析方便,自然nature被当作虚拟参与 人。
❖ 自然代表决定外生随机变量的概率分布的机 制。比如房地产开发中市场需求的大小。
2.行动 Actions or moves或策略 (strategies )
❖ 参与人在博弈的某个时点的决策变量。 (坦白) ❖ N个参与人的行动的有序集称为行动组合 (坦白,抵赖)。
❖ 把两个角度结合就得到了4种博弈:完全信 息静态博弈,完全信息动态博弈,不完全信 息静态博弈,不完全信息动态博弈
博弈的分类及对应的均衡
静态
动态
完全 信息
完全信息静态博弈; 纳什均衡; Nash(1950)
完全信息动态博弈;
子博弈精炼纳什均衡; 泽尔腾(1965)
不完 全信 息
不完全信息静态博弈; 贝叶斯纳什均衡;
1 0
大猪的收入矩阵
B
4, 2,
5 0
矩阵博弈——Nash均衡
收入矩阵 可选策略集合 期望收入
甲方 A
P
xAy’
乙方 B
Q
xBy’
如果存在x* P和y* Q,使得对于任意的x P和y Q, 都有
xA( y*)T x* A( y*)T x* AyT xB( y*)T x*B( y*)T x*ByT
❖ “博弈论是研究决策主体的行为发生直接相 互作用时候的决策以及这种决策的均衡问题”
❖ 也就是说,当一个主体,好比说一个人或 一个企业的选择受到其他人、其他企业选择 的影响,而且反过来影响到其他人、其他企 业选择时的决策问题和均衡问题。所以在这 个意义上说,博弃论又称为“对策论”.
囚徒困境的例子
❖ A. W. Tucker的囚犯困境(Prisoner‘s Dilemma):
NASH均衡条件下的行为规则
❖ 合作是有利的“利己策略”。但它必须符合 以下黄金律:按照你愿意别人对你的方式来 对别人,但只有他们也按同样方式行事才行。 所谓“己所不欲勿施于人”。但前提是人冯·诺依曼(Von Neumann)和摩根斯坦恩(Morgenstern) 合作的《博弈论和经济行为》(The Theory of Games and Economic Behaviour)一书的 出版。
以上大致的给出了博弈论的一些概念。下面 就具体的来介绍 矩阵博弈及模型计算。
博弈论模型问题的三个特征
❖ 有参加的竞争对手 ❖ 每个竞争对手都有自己可供选择的竞争策略; ❖ 对于每个竞争对手选定的策略,大家都对应
有一个收入。
矩阵博弈
❖ 对于竞争对手选择的策略,大家都有一个收 入,如果可以将各自的收入写成一个矩阵, 那么这样的博弈论模型就称之为矩阵博弈。
对经典经济学的冲击
❖ “纳什均衡”首先对亚当·斯密的“看不见的 手”的原理提出挑战。按照斯密的理论,在 市场经济中,每一个人都从利己的目的出发, 而最终全社会达到利他的效果。
❖ 《国富论》:“通过追求(个人的)自身利益, 他常常会比其实际上想做的那样更有效地促 进社会利益。”
❖ 从“纳什均衡”我们引出了“看不见的手” 的原理的一个悖论:从利己目的出发,结果 损人不利己,既不利己也不利他。两个囚徒 的命运就是如此。从这个意义上说,“纳什 均衡”提出的悖论实际上动摇了西方经济学
则称(x*, y*)是矩阵博弈 ( A, B, P,Q)的Nash均衡解。
智猪博弈的Nash均衡解共有三对:
1.
x* = y*
(0,1) (1, 0)
2.
x* y*
=
( (
2,1) 33 1, 2)
3 3
3.
x* = y*
(1,0) (0,1)
实际生活中的智猪博弈
❖ “搭便车”现象; ❖ 公共物品,穷人和富人修路博弈(中产阶级
前苏联
军备竞赛
不竞赛
美国 军备竞赛 -3000,-3000 不竞赛 -10000,3000
3000,-10000 0,0
这是一个非零和的2人矩阵博弈
其Nash均衡解为
x* = (1,0)
y*
(1,
0)
也即双方都参与军备竞赛才不吃亏
例12.3孙膑对策 齐威王和田忌赛马问题
齐威王的收入矩阵
这是一个零和的两人矩阵博弈
3.支付payoff(效用utility)
❖ 所有可能的对局的结果,用局中人在相应对 局下的博弈所得来表示,这个博弈所得,叫 做赢利、赢得、得益或支付(payoffs)。
❖ 在一个特定的战略组合下参与人得到的确定 效用水平,或是指参与人得到的期望效用水 平。
均衡equilibrium
❖ 指所有参与人的最优战略的组合。
非合作博弈
❖ 而非合作博弈则主要研究人们在利益相互影 响的局势中如何选择策略使得自己的收益最 大,强调个人理性、个人最优决策,其结果 是有时有效率,有时则不然。
❖ 目前经济学家谈到博弈论主要指的是非合作 博弈,也就是各方在给定的约束条件下如何 追求各自利益最大化,最后达到力量均衡。
例子
❖ 比如两家企业A、B合作建设一条VCD的生产线, 协议由A方提供生产VCD的技术,B方则提供厂 房和设备。在对技术和设备进行资产评估时就形成 非合作博弈,因为每一方都试图最大化己方的评估 值,这时B方如果能够获得A方关于技术的真实估 价或参考报价这类竞争情报,则可以使自己在评估 中获得优势;同理,A方也是一样。至于自己的资 产评估是否会影响合作企业的总体运行效率这样的" 集体利益",则不会非常重视。这就是非合作博弈, 参与人在选择自己的行动时,优先考虑的是如何维 护自己的利益。
相关文档
最新文档